Az AI chatbot tér egyre zsúfoltabbá válik, ahogy új kihívók jelennek meg ChatGPT versenytársaikkal. A Google Bardnak és számos kínai cégnek megvolt a lehetősége, hogy kihívja a királyt, és most a Stability AI-n van a sor, amely a Stable Diffusion generatív AI művészeti eszköz mögött álló startup.

A Stabilitási mesterséges intelligencia ma a nyílt forráskódú szöveggeneráló mesterséges intelligencia modellek készletét hozta létre, amelyek célja az volt, hogy fej-fej mellett haladjanak az olyan rendszerekkel, mint az OpenAI ChatGPT-4. A StableLM-nek nevezett modellek már elérhetőek a GitHubon, hogy a fejlesztők felhasználhassák és adaptálhassák szövegek és kódok generálására, mivel a Stabilitás igyekszik elérhetővé tenni az AI-t.

A StableLM ugyanazon a transzformátor architektúrán alapul, mint a ChatGPT, de néhány módosítással és fejlesztéssel. A Stability AI szerint a StableLM koherensebb és változatosabb szövegeket tud generálni, mint a ChatGPT, valamint több nyelvet és tartományt is kezelhet. A modellek robusztusabbak és skálázhatóbbak is, köszönhetően egy új képzési módszernek, amely diffúziót használ az autoregresszív vagy maszkolt nyelvi modellezés helyett.

A diffúzió egy olyan folyamat, amely az egyik eloszlást egy másikká alakítja át zaj hozzáadásával. A StableLM-ben a modell úgy tanul meg szöveget generálni, hogy egy véletlenszerű tokenek sorozatból indul ki, és fokozatosan távolítja el a zajt, amíg el nem éri a kívánt kimenetet. Így a modell a lehetséges szövegek nagyobb terét tudja feltárni, elkerülve az ismétlődést és a degenerációt.

A Stabilitási mesterséges intelligencia azt mondja, hogy a diffúzió gyorsabb és olcsóbb képzést, valamint könnyebb párhuzamosítást és adaptációt tesz lehetővé. A vállalat azt állítja, hogy a StableLM néhány nap alatt betanítható egyetlen GPU-n, míg a ChatGPT esetében hetek vagy hónapok. Ezenkívül a modell finomhangolható új tartományokon vagy nyelveken minimális adat- és számítási erőforrásokkal.

A StableLM képességeinek bemutatására a Stability AI számos demót és alkalmazást tett közzé a honlapján. Ezek közé tartozik a több nyelven és témában beszélgetni képes chatbot, a természetes nyelvű leírásokból Python-szkripteket kiíró kódgenerátor, a hosszú szövegeket felsoroláspontokba sűrítő összefoglaló, valamint a rövid kifejezéseket kidolgozó szövegbővítő.

A StableLM azonban nem mentes a hibáitól. Egyes felhasználók arról számoltak be, hogy a modell néha értelmetlen vagy nem megfelelő kimeneteket produkál, különösen, ha homályos vagy összetett bemeneteket adnak meg. A modell a tények pontosságával és konzisztenciájával is küszködik, mivel nem külső forrásokra, hanem belső tudására és információira támaszkodik. Ezen túlmenően a modell etikai és társadalmi kockázatokat, például plágiumot, félretájékoztatást, elfogultságot és visszaélést jelenthet.

A Stabilitás Az AI elismeri ezeket a korlátokat és kihívásokat, és azt állítja, hogy dolgozik modelljei minőségének és biztonságának javításán. A vállalat arra is ösztönzi a felhasználókat, hogy jelentsék a StableLM használata során felmerülő problémákat vagy visszajelzéseket. Ezenkívül a vállalat azt állítja, hogy követi a felelős mesterséges intelligencia elveit és gyakorlatait, amelyeket olyan szervezetek körvonalaztak, mint a Partnership on AI és az OpenAI.

A Stabilitási mesterséges intelligencia azt reméli, hogy a nyílt forráskódú StableLM révén elősegítheti a fejlesztők és kutatók együttműködő és befogadó közösségét, amely hozzájárulhat a természetes nyelvek létrehozásához és megértéséhez. A vállalat célja továbbá, hogy demokratizálja az AI-eszközökhöz való hozzáférést, és lehetővé tegye a felhasználók számára, hogy saját alkalmazásokat és megoldásokat hozzanak létre.

Stabilitás A mesterséges intelligencia nem egyedül próbálja megkérdőjelezni az OpenAI dominanciáját a nyelvi modellek terén. Számos más cég és szervezet is kifejlesztette a ChatGPT-szerű modellek saját verzióját, mint például a Facebook BlenderBot, a Microsoft Turing-NLG, a Huawei PanGu-Alpha, az Alibaba ERNIE 3.0, a Baidu ERNIE-GEN 2.0, a Tencent Wudao–Dance's 2.0 M6, By , Ping An's Plato-4Billion+, Meituan's MT6-1T+, Xiaomi's CPM-2T+, Kuaishou's Zhiyuan-800B+, JD.com's JueWu-1T+, Sogou's Sogou-1T+, iFlytek's Vente-1T Netese, Nete-1T+Site, Netese-1T. újítás-1T+ , a Tsinghua Egyetem THU-1T+, a Pekingi Egyetem PKU-1T+, a Zhejiang Egyetem ZJU-1T+, a Shanghai Jiao Tong Egyetem SJTU-1T+, a Harbin Institute of Technology HIT-1T+, a Kínai Tudományos Akadémia CAS-1T+ stb.

Ezek a modellek méretükben, hatókörükben és teljesítményükben eltérőek, de mindegyiknek közös a célja: olyan általános célú nyelvi modell létrehozása, amely képes megérteni és létrehozni a természetes nyelvet a tartományok és feladatok széles körében.

A ChatGPT-4 a jelenlegi vezető ebben a versenyben, hatalmas, 175 milliárd paraméterrel és lenyűgöző képességekkel büszkélkedhet, mint például koherens hosszú szövegek generálása, összetett kérdések megválaszolása, kódírás és még zeneszerzés is. A ChatGPT-4 egyben az első olyan nyelvi modell, amely emberi szintű teljesítményt ért el a SuperGLUE benchmarkon, amely a természetes nyelv megértését jelentő feladatok sorozata.

Azonban a ChatGPT-4 sem tökéletes. A modell továbbra is ugyanazokkal a problémákkal küzd, mint elődei, például ténybeli hibák, logikai következetlenségek, káros torzítások és rosszindulatú felhasználások. Ezenkívül a ChatGPT-4 nem érhető el széles körben a nyilvánosság számára, mivel az OpenAI hozzáférését egy privát API-n keresztül korlátozza, amely jóváhagyást és fizetést igényel.

A Stability AI azt reméli, hogy kihívást jelent a ChatGPT-4 számára a StableLM modelljeivel, amelyek más megközelítést kínálnak a természetes nyelv létrehozásához és megértéséhez. Az autoregresszió vagy maszkolás helyett diffúziót használva a Stability AI azt állítja, hogy modelljei változatosabb és koherensebb szövegeket tudnak generálni, mint a ChatGPT-4, valamint több nyelvet és tartományt is könnyebben kezelnek. A Stabilitási mesterséges intelligencia emellett arra is törekszik, hogy modelljeit elérhetőbbé és megfizethetőbbé tegye nyílt forráskódú beszerzésükkel, valamint ingyenes demók és alkalmazások biztosításával.

A Stabilitási AI azonban bizonyos kihívásokkal is szembesül. A vállalat viszonylag új, és kevesebb erőforrással és hírnévvel rendelkezik, mint az OpenAI. A vállalatnak meg kell küzdenie a nagy nyelvi modellek létrehozásának és bevezetésének technikai és etikai kihívásaival is, mint például a minőség, a biztonság és a felelősségvállalás biztosítása. Ráadásul a cégnek nem csak az OpenAI-val kell felvennie a versenyt, hanem a terület más szereplőivel is, akik saját ChatGPT-szerű modelleket fejlesztenek.

A nagy nyelvi modellek közötti verseny egyre hevül, ahogy egyre több vállalat és szervezet csatlakozik a küzdelemhez. Minden modellnek megvannak a maga erősségei és gyengeségei, előnyei és hátrányai, lehetőségei és kockázatai. A végső cél egy olyan nyelvi modell létrehozása, amely képes megérteni és létrehozni a természetes nyelvet bármely területen és feladatban, miközben biztonságos és előnyös az emberiség számára.

Ha tetszett a cikk, és többet szeretne megtudni a Stability AI-ről és termékeiről, látogassa meg a "webhelyüket", vagy kövessen engem a Mediumon az Octobreak címen. Megtekintheti blogomat is az Octobreak címen, ahol további cikkeket olvashat az AI-ról és a technológiáról.

«Források: A stabilitási AI kihívást jelent az OpenAI számára a saját ChatGPT-szerű nyelvi modelljével – Telegraph