Ismerje meg az LLM-AUGMENTER-t: a Microsoft Research architektúrája az LLM-ek memória, tudás és…

Az új keretrendszer referenciaként szolgálhat a termelésre kész LLM megoldásokhoz.

Nemrég elindítottam egy AI-központú oktatási hírlevelet, amelynek már több mint 160 000 feliratkozója van. A TheSequence egy no-BS (azaz nincs hírverés, nincs hír, stb.) ML-orientált hírlevél, amelynek elolvasása 5 percet vesz igénybe. A cél az, hogy naprakészen tartsa a gépi tanulási projekteket, kutatási dokumentumokat és koncepciókat. Kérjük, próbálja ki az alábbi feliratkozással:

TheSequence | Jézus Rodriguez | Substack
A legjobb forrás, hogy naprakész maradjon a gépi tanulás, a mesterséges intelligencia és az adatok fejlődésével kapcsolatban…thesequence.substack.com

A nagy nyelvi modellek (LLM), például a ChatGPT lenyűgöző képességeit széles körben elismerték. Ezek a modellek kiválóak a természetes nyelvű szövegek létrehozásában, amelyek gördülékenyek, koherensek és informatívak. Kivételes teljesítményük a kódolt világismeret gazdagságának és az abból való általánosítás képességének tudható be. Az LLM-ekben található tudáskódolás azonban hajlamos az elvesztésre, és az általánosítási folyamat „memória torzulásához” vezethet. Következésképpen ezek a modellek gyakran hallucinációkat mutatnak, ami problémás lehet, ha kritikus feladatokra alkalmazzák őket. Ezenkívül a modellméretek exponenciális növekedése ellenére az LLM-ek nem képesek minden alkalmazáshoz szükséges információt kódolni. Például a valós beállítások dinamikus természete miatt az LLM-ek gyorsan elavulnak az olyan időérzékeny feladatokhoz, mint a hírkérdések megválaszolása. Ezenkívül számos védett adatkészlet nem érhető el az LLM-képzés számára adatvédelmi aggályok miatt. A Microsoft Research a közelmúltban „közzétett egy tanulmányt az LLM-AUGMENTER-ről”, egy olyan keretrendszerről, amely az LLM-eket külső tudással és automatikus visszajelzéssel bővíti.

Funkcionálisan az LLM-AUGMENTER a tudásbővítést és a memóriát egy összefüggő architektúrában ötvözi. A következő ábra az LLM-AUGMENTER-t egy futballforgatókönyv összefüggésében mutatja be. Amikor egy felhasználói kérdés elé állítják, például a 2013-as Los Angeles Galaxy-t érintő játékosátigazolással kapcsolatos kérdést, az LLM-AUGMENTER bizonyítékokat kér le…

hasonló anyagok:

Új anyagok

A rádiógomb ellenőrzött eseményének használata a jQueryben

Ebben a cikkben látni fogjuk, hogyan kell dolgozni a jquery választógombbal ellenőrzött eseményeivel. A választógombok HTML gombok, amelyek segítenek kiválasztani egyetlen értéket egy csoportból...

Körkörös függőségek megoldása terraformban adatforrásokkal – lépésről lépésre

Mi az a körkörös függőségek Dolgozzunk egy egyszerű eseten, amikor az SQS-sor és az S3-vödör közötti körkörös függőség problémája van egy egymástól függő címkeérték miatt. provider..

Miért érdemes elkezdeni a kódolást 2023-ban?

01100011 01101111 01100100 01100101 — beep boop beep boop Világunk folyamatosan fejlődik a technológia körül, és naponta fejlesztenek új technológiákat a valós problémák megoldására. Amint..

🎙 Random Noise #2 – Örökbefogadás és hit

az analitika íratlan világának gondozása Szeretné, hogy ezek a frissítések a postaládájába kerüljenek? Iratkozzon fel itt . "Ha önvezető autókat gyártanak, akkor mi miért ne..

A legrosszabb politika és prediktív modellek májátültetésre jelöltek számára az Egyesült Államokban

A máj (vagy óangolul lifer) az emberi test legnehezebb belső szervére utal, amely csendesen működik a nap 24 órájában. Mit csinál a máj? 500 feladatot hajt végre a szervezet egészségének..

5 webhely, amely 2022-ben fejleszti front-end fejlesztői készségeit

Frontendmentor.io A tényleges projektek létrehozásával a Frontendmentor.io segítséget nyújt a front-end kódolási képességeinek fejlesztésében. A kódolást azután kezdheti meg, hogy..

Mikor kell használni a Type-t az interfészhez képest a TypeScriptben?

A TypeScript a JavaScript gépelt szuperkészlete, amely statikus gépelést ad a nyelvhez. Ez megkönnyíti a robusztus és karbantartható kód írását azáltal, hogy a hibákat a fordítási időben..

Címkék

Machine Learning JavaScript Artificial Intelligence Data Science Python Software Development Web Development Coding Deep Learning AI React Nodejs Front End Development Software Engineering Javascript Tips NLP Computer Science HTML Neural Networks Algorithms Tech Development Typescript Python Programming CSS ChatGPT Javascript Development Statistics Data Golang Code Java Science Open Source Software DevOps Programming Languages Data Structures