Jön a GPT-4?
Íme az NLPlanet által az Ön számára kiválasztott NLP-ről és AI-ról szóló heti cikkei, útmutatói és hírei!
😎 Hírek az internetről
- «A Microsoft megemlítette a GPT-4 közelgő kiadását. A Microsoft Németország a közelmúltban bemutatta nagy nyelvi modelljeit (LLM), például a GPT-sorozatot, mint a vállalatokat és az Azure-OpenAI-kínálatukat megzavaró erőt.
- A Stabilitási mesterséges intelligencia 4 milliárd dolláros értékben kíván forrásokat szerezni, mivel a mesterséges intelligencia leköti a befektetőket.
- «A Google univerzális beszédmodellje (USM): A legmodernebb beszéd AI több mint 100 nyelvre. Az USM a legkorszerűbb beszédmodellek családja, 2B paraméterrel, 12 millió óra beszédre és 28 milliárd mondatnyi szövegre, több mint 300 nyelven.
- MuAVIC: Az első audio-video beszédfordítási benchmark. Vizuális információk használata az angol beszédfelismerési feladatok teljesítményének javítására.
- Az ember legyőzi a gépet a Go-nál. Az amatőr olyan rendszerek gyengeségét használta ki, amelyek egyébként uralták a nagymestereket.
- Azt hitték, szeretteik segítséget kérnek. Ez egy mesterséges intelligencia-átverés volt.
📚 Útmutatók az internetről
- A versenyképes gépi tanulás állapota. A 2022-es 200+ ML versenyek győztes modelljeinek elemzése.
- Nagy nyelvi modellek feltörekvő képességei. A felbukkanás az újszerű viselkedés hirtelen megjelenéseként definiálható. A nagy nyelvi modellek nyilvánvalóan úgy jelennek meg, hogy növekedésük során hirtelen új képességekre tesznek szert.
- A 100 legtöbbet idézett AI-dokumentum 2022-ben.
- «20B LLM-ek finomhangolása RLHF-vel 24 GB-os fogyasztói GPU-n.
🔬 Érdekes papírok és adattárak
- PaLM-E: Megtestesült multimodális nyelvi modell. A megtestesült nyelvi modell bemenetei multimodális mondatok, amelyek átlapolják a vizuális, a folyamatos állapotbecslést és a szöveges bemeneti kódolásokat.
- A Visual ChatGPT összekapcsolja a ChatGPT-t és egy sor Visual Foundation modellt, hogy lehetővé tegye képek küldését és fogadását csevegés közben.
- Nagy nyelvi modellek kódolják a klinikai ismereteket. Bemutatjuk a MultiMedQA-t, egy benchmarkot, amely hat létező, nyitott kérdésekre válaszoló adatkészletet egyesít a szakmai orvosi vizsgálatokon, kutatásokon és fogyasztói kérdéseken. A Flan-PaLM a SOTA.
- Prismer: Egy jövőkép-nyelvi modell szakértők együttesével. A Prismer csak kisszámú alkatrész betanítását igényli, a hálózati súlyok többségét könnyen elérhető, előre képzett tartományi szakértőktől örökölték, és a képzés során lefagyva tartják.
- Kérdés, generálás, majd gyorsítótár: Az alapmodellek kaszkádja erős kevés tanulót tesz lehetővé.
- «A nagyobb nyelvi modellek másképpen valósítják meg a kontextusban történő tanulást.
- MathPrompter: Matematikai érvelés nagy nyelvi modellekkel. A Zero-shot láncszemléletű felszólító technikát használja, hogy több algebrai kifejezést vagy Python-függvényt generáljon, hogy ugyanazt a matematikai problémát különböző módon oldja meg, és ezáltal növelje a kimeneti eredmények megbízhatósági szintjét.
Köszönöm hogy elolvastad! Ha többet szeretne megtudni az NLP-ről, ne felejtse el követni az "NLPlanet" oldalt. Megtalálhat minket a LinkedIn, a Twitter, a Medium és a Discord-szerverünk oldalán. !