Milyen kihívást jelent a stabilitási mesterséges intelligencia az OpenAI számára a saját ChatGPT-szerű nyelvi modelljével

Az AI chatbot tér egyre zsúfoltabbá válik, ahogy új kihívók jelennek meg ChatGPT versenytársaikkal. A Google Bardnak és számos kínai cégnek megvolt a lehetősége, hogy kihívja a királyt, és most a Stability AI-n van a sor, amely a Stable Diffusion generatív AI művészeti eszköz mögött álló startup.

A Stabilitási mesterséges intelligencia ma a nyílt forráskódú szöveggeneráló mesterséges intelligencia modellek készletét hozta létre, amelyek célja az volt, hogy fej-fej mellett haladjanak az olyan rendszerekkel, mint az OpenAI ChatGPT-4. A StableLM-nek nevezett modellek már elérhetőek a GitHubon, hogy a fejlesztők felhasználhassák és adaptálhassák szövegek és kódok generálására, mivel a Stabilitás igyekszik elérhetővé tenni az AI-t.

A StableLM ugyanazon a transzformátor architektúrán alapul, mint a ChatGPT, de néhány módosítással és fejlesztéssel. A Stability AI szerint a StableLM koherensebb és változatosabb szövegeket tud generálni, mint a ChatGPT, valamint több nyelvet és tartományt is kezelhet. A modellek robusztusabbak és skálázhatóbbak is, köszönhetően egy új képzési módszernek, amely diffúziót használ az autoregresszív vagy maszkolt nyelvi modellezés helyett.

A diffúzió egy olyan folyamat, amely az egyik eloszlást egy másikká alakítja át zaj hozzáadásával. A StableLM-ben a modell úgy tanul meg szöveget generálni, hogy egy véletlenszerű tokenek sorozatból indul ki, és fokozatosan távolítja el a zajt, amíg el nem éri a kívánt kimenetet. Így a modell a lehetséges szövegek nagyobb terét tudja feltárni, elkerülve az ismétlődést és a degenerációt.

A Stabilitási mesterséges intelligencia azt mondja, hogy a diffúzió gyorsabb és olcsóbb képzést, valamint könnyebb párhuzamosítást és adaptációt tesz lehetővé. A vállalat azt állítja, hogy a StableLM néhány nap alatt betanítható egyetlen GPU-n, míg a ChatGPT esetében hetek vagy hónapok. Ezenkívül a modell finomhangolható új tartományokon vagy nyelveken minimális adat- és számítási erőforrásokkal.

A StableLM képességeinek bemutatására a Stability AI számos demót és alkalmazást tett közzé a honlapján. Ezek közé tartozik a több nyelven és témában beszélgetni képes chatbot, a természetes nyelvű leírásokból Python-szkripteket kiíró kódgenerátor, a hosszú szövegeket felsoroláspontokba sűrítő összefoglaló, valamint a rövid kifejezéseket kidolgozó szövegbővítő.

A StableLM azonban nem mentes a hibáitól. Egyes felhasználók arról számoltak be, hogy a modell néha értelmetlen vagy nem megfelelő kimeneteket produkál, különösen, ha homályos vagy összetett bemeneteket adnak meg. A modell a tények pontosságával és konzisztenciájával is küszködik, mivel nem külső forrásokra, hanem belső tudására és információira támaszkodik. Ezen túlmenően a modell etikai és társadalmi kockázatokat, például plágiumot, félretájékoztatást, elfogultságot és visszaélést jelenthet.

A Stabilitás Az AI elismeri ezeket a korlátokat és kihívásokat, és azt állítja, hogy dolgozik modelljei minőségének és biztonságának javításán. A vállalat arra is ösztönzi a felhasználókat, hogy jelentsék a StableLM használata során felmerülő problémákat vagy visszajelzéseket. Ezenkívül a vállalat azt állítja, hogy követi a felelős mesterséges intelligencia elveit és gyakorlatait, amelyeket olyan szervezetek körvonalaztak, mint a Partnership on AI és az OpenAI.

A Stabilitási mesterséges intelligencia azt reméli, hogy a nyílt forráskódú StableLM révén elősegítheti a fejlesztők és kutatók együttműködő és befogadó közösségét, amely hozzájárulhat a természetes nyelvek létrehozásához és megértéséhez. A vállalat célja továbbá, hogy demokratizálja az AI-eszközökhöz való hozzáférést, és lehetővé tegye a felhasználók számára, hogy saját alkalmazásokat és megoldásokat hozzanak létre.

Stabilitás A mesterséges intelligencia nem egyedül próbálja megkérdőjelezni az OpenAI dominanciáját a nyelvi modellek terén. Számos más cég és szervezet is kifejlesztette a ChatGPT-szerű modellek saját verzióját, mint például a Facebook BlenderBot, a Microsoft Turing-NLG, a Huawei PanGu-Alpha, az Alibaba ERNIE 3.0, a Baidu ERNIE-GEN 2.0, a Tencent Wudao–Dance's 2.0 M6, By , Ping An's Plato-4Billion+, Meituan's MT6-1T+, Xiaomi's CPM-2T+, Kuaishou's Zhiyuan-800B+, JD.com's JueWu-1T+, Sogou's Sogou-1T+, iFlytek's Vente-1T Netese, Nete-1T+Site, Netese-1T. újítás-1T+ , a Tsinghua Egyetem THU-1T+, a Pekingi Egyetem PKU-1T+, a Zhejiang Egyetem ZJU-1T+, a Shanghai Jiao Tong Egyetem SJTU-1T+, a Harbin Institute of Technology HIT-1T+, a Kínai Tudományos Akadémia CAS-1T+ stb.

Ezek a modellek méretükben, hatókörükben és teljesítményükben eltérőek, de mindegyiknek közös a célja: olyan általános célú nyelvi modell létrehozása, amely képes megérteni és létrehozni a természetes nyelvet a tartományok és feladatok széles körében.

A ChatGPT-4 a jelenlegi vezető ebben a versenyben, hatalmas, 175 milliárd paraméterrel és lenyűgöző képességekkel büszkélkedhet, mint például koherens hosszú szövegek generálása, összetett kérdések megválaszolása, kódírás és még zeneszerzés is. A ChatGPT-4 egyben az első olyan nyelvi modell, amely emberi szintű teljesítményt ért el a SuperGLUE benchmarkon, amely a természetes nyelv megértését jelentő feladatok sorozata.

Azonban a ChatGPT-4 sem tökéletes. A modell továbbra is ugyanazokkal a problémákkal küzd, mint elődei, például ténybeli hibák, logikai következetlenségek, káros torzítások és rosszindulatú felhasználások. Ezenkívül a ChatGPT-4 nem érhető el széles körben a nyilvánosság számára, mivel az OpenAI hozzáférését egy privát API-n keresztül korlátozza, amely jóváhagyást és fizetést igényel.

A Stability AI azt reméli, hogy kihívást jelent a ChatGPT-4 számára a StableLM modelljeivel, amelyek más megközelítést kínálnak a természetes nyelv létrehozásához és megértéséhez. Az autoregresszió vagy maszkolás helyett diffúziót használva a Stability AI azt állítja, hogy modelljei változatosabb és koherensebb szövegeket tudnak generálni, mint a ChatGPT-4, valamint több nyelvet és tartományt is könnyebben kezelnek. A Stabilitási mesterséges intelligencia emellett arra is törekszik, hogy modelljeit elérhetőbbé és megfizethetőbbé tegye nyílt forráskódú beszerzésükkel, valamint ingyenes demók és alkalmazások biztosításával.

A Stabilitási AI azonban bizonyos kihívásokkal is szembesül. A vállalat viszonylag új, és kevesebb erőforrással és hírnévvel rendelkezik, mint az OpenAI. A vállalatnak meg kell küzdenie a nagy nyelvi modellek létrehozásának és bevezetésének technikai és etikai kihívásaival is, mint például a minőség, a biztonság és a felelősségvállalás biztosítása. Ráadásul a cégnek nem csak az OpenAI-val kell felvennie a versenyt, hanem a terület más szereplőivel is, akik saját ChatGPT-szerű modelleket fejlesztenek.

A nagy nyelvi modellek közötti verseny egyre hevül, ahogy egyre több vállalat és szervezet csatlakozik a küzdelemhez. Minden modellnek megvannak a maga erősségei és gyengeségei, előnyei és hátrányai, lehetőségei és kockázatai. A végső cél egy olyan nyelvi modell létrehozása, amely képes megérteni és létrehozni a természetes nyelvet bármely területen és feladatban, miközben biztonságos és előnyös az emberiség számára.

Ha tetszett a cikk, és többet szeretne megtudni a Stability AI-ről és termékeiről, látogassa meg a "webhelyüket", vagy kövessen engem a Mediumon az Octobreak címen. Megtekintheti blogomat is az Octobreak címen, ahol további cikkeket olvashat az AI-ról és a technológiáról.

«Források: A stabilitási AI kihívást jelent az OpenAI számára a saját ChatGPT-szerű nyelvi modelljével – Telegraph

hasonló anyagok:

Új anyagok

A rádiógomb ellenőrzött eseményének használata a jQueryben

Ebben a cikkben látni fogjuk, hogyan kell dolgozni a jquery választógombbal ellenőrzött eseményeivel. A választógombok HTML gombok, amelyek segítenek kiválasztani egyetlen értéket egy csoportból...

Körkörös függőségek megoldása terraformban adatforrásokkal – lépésről lépésre

Mi az a körkörös függőségek Dolgozzunk egy egyszerű eseten, amikor az SQS-sor és az S3-vödör közötti körkörös függőség problémája van egy egymástól függő címkeérték miatt. provider..

Miért érdemes elkezdeni a kódolást 2023-ban?

01100011 01101111 01100100 01100101 — beep boop beep boop Világunk folyamatosan fejlődik a technológia körül, és naponta fejlesztenek új technológiákat a valós problémák megoldására. Amint..

🎙 Random Noise #2 – Örökbefogadás és hit

az analitika íratlan világának gondozása Szeretné, hogy ezek a frissítések a postaládájába kerüljenek? Iratkozzon fel itt . "Ha önvezető autókat gyártanak, akkor mi miért ne..

A legrosszabb politika és prediktív modellek májátültetésre jelöltek számára az Egyesült Államokban

A máj (vagy óangolul lifer) az emberi test legnehezebb belső szervére utal, amely csendesen működik a nap 24 órájában. Mit csinál a máj? 500 feladatot hajt végre a szervezet egészségének..

5 webhely, amely 2022-ben fejleszti front-end fejlesztői készségeit

Frontendmentor.io A tényleges projektek létrehozásával a Frontendmentor.io segítséget nyújt a front-end kódolási képességeinek fejlesztésében. A kódolást azután kezdheti meg, hogy..

Mikor kell használni a Type-t az interfészhez képest a TypeScriptben?

A TypeScript a JavaScript gépelt szuperkészlete, amely statikus gépelést ad a nyelvhez. Ez megkönnyíti a robusztus és karbantartható kód írását azáltal, hogy a hibákat a fordítási időben..

Címkék

Machine Learning JavaScript Artificial Intelligence Data Science Python Software Development Web Development Coding Deep Learning AI React Nodejs Front End Development Software Engineering Javascript Tips NLP Computer Science HTML Neural Networks Algorithms Tech Development Typescript Python Programming CSS ChatGPT Javascript Development Statistics Data Java Science Golang Code Data Structures Open Source Software DevOps Programming Languages