IBM Watson Factoid Assistant: Egyedi keresősáv a Wikipédiához

A crowdsourcing korszakában semmi sem tűnik ki olyan méretekben, mint a Wikipédia; 2001 óta csaknem 5,8 millió cikket halmozott fel, és a történelemmel, földrajzzal, politikával és szinte bármi mással kapcsolatos kérdések és kíváncsiság forrása.

Mi lenne, ha rendelkezhetne egy keresősávval, amellyel közvetlenül beírhatja kérdéseit a Wikipédiába, ahelyett, hogy oldalról oldalra ugrálna egy konkrét tényt keresve (ami igaz, hogy hihetetlenül kielégítő, ugyanakkor időpazarló lehet)?

Még jobb, ha ezt a „Wikipédia keresősávot” meg lehetne tanítani arra, hogy néhány tucat példával megértsen bizonyos típusú kérdéseket, és azonnal megjelenjen a releváns entitások, fogalmak és a válasz a Wikipédiából?

Lépjen be a „Factoid Assistant”-ba, egy mintaalkalmazásba, amely az IBM Watson „Natural Language Classifier” és „Natural Language Understanding” programjával készült, amely a „DBpedia”-ból, a Wikipédia-tartalom adatbázisából jelenít meg információkat. A teljes "Github repo" tartalmazza az összes szükséges kódot az alkalmazás replikálásához.

Tehát hogyan történik a felhasználó kérdéseinek kategorizálása és megválaszolása? Ez a folyamat egy egyéni, természetes nyelvű osztályozó modellre támaszkodik a lekérdezés szándékának meghatározásához. Ne féljen, ez a mesterséges intelligencia testreszabása mindössze néhány percet vesz igénybe, és néhány tucat gyakorlati példát vesz igénybe (amelyeket biztosítunk Önnek)!

Az nlc_factoid_training.csv használatával kövesse a dokumentáció vagy API hivatkozás egyszerű lépéseit a modell betanításához. Ez a képzési adatkészlet a következő osztályokat tartalmazza: egészség-állapot_ok, személy születési dátum, személy-születési hely, személy-gyermekek, személyi nettó_érték, személy iskoláztatása, személy-házastárs, hely-körzetkód, hely-főváros, hely-befejezés dátuma, hely-kormányzó_polgármester, hely-magasság, hely-lakosság. Minden alkalommal, amikor a felhasználó lekérdezi a Factoid Assistant-t, a kérdést a betanított NLC-modell kategorizálja.

Szívesen szabhatja testre a Factoid Assistant-t új osztályok hozzáadásával a modellhez, például személy-foglalkozás vagy hely-állapot. Ne felejtse el hozzáadni az edzési adatokat, és tartsa szem előtt ezeket a „legjobb gyakorlatokat” is. Az általunk szolgáltatott adatkészlet 78 képzési példát tartalmaz a fenti 12 osztályból. A Watson Natural Language Classifier ebben a tekintetben vezető szerepet tölt be a területen; osztályonként mindössze 5 adatpontra van szüksége (10 ajánlott); a versenytársak gyakran 10-et vagy többet igényelnek, és még magasabb küszöbértékeket javasolnak a jobb teljesítmény érdekében.

Szeretné elosztani a kódot, és saját maga elkészíteni az alkalmazást? Tekintse meg "Github repo"-nkat!

A Watson Natural Language Classifier „10+ mintaalkalmazást” is kínál online, amely elérhető élő demókhoz, kódelosztáshoz és videobemutatókhoz.

Élvezi az IBM Watson termékeit? Írjon nekünk véleményt a https://www.g2crowd.com címen!

Minden beérkezett vélemény után 10 dollárt adományozunk a Girls Who Code-nak!

hasonló anyagok:

Új anyagok

A rádiógomb ellenőrzött eseményének használata a jQueryben

Ebben a cikkben látni fogjuk, hogyan kell dolgozni a jquery választógombbal ellenőrzött eseményeivel. A választógombok HTML gombok, amelyek segítenek kiválasztani egyetlen értéket egy csoportból...

Körkörös függőségek megoldása terraformban adatforrásokkal – lépésről lépésre

Mi az a körkörös függőségek Dolgozzunk egy egyszerű eseten, amikor az SQS-sor és az S3-vödör közötti körkörös függőség problémája van egy egymástól függő címkeérték miatt. provider..

Miért érdemes elkezdeni a kódolást 2023-ban?

01100011 01101111 01100100 01100101 — beep boop beep boop Világunk folyamatosan fejlődik a technológia körül, és naponta fejlesztenek új technológiákat a valós problémák megoldására. Amint..

🎙 Random Noise #2 – Örökbefogadás és hit

az analitika íratlan világának gondozása Szeretné, hogy ezek a frissítések a postaládájába kerüljenek? Iratkozzon fel itt . "Ha önvezető autókat gyártanak, akkor mi miért ne..

A legrosszabb politika és prediktív modellek májátültetésre jelöltek számára az Egyesült Államokban

A máj (vagy óangolul lifer) az emberi test legnehezebb belső szervére utal, amely csendesen működik a nap 24 órájában. Mit csinál a máj? 500 feladatot hajt végre a szervezet egészségének..

5 webhely, amely 2022-ben fejleszti front-end fejlesztői készségeit

Frontendmentor.io A tényleges projektek létrehozásával a Frontendmentor.io segítséget nyújt a front-end kódolási képességeinek fejlesztésében. A kódolást azután kezdheti meg, hogy..

Mikor kell használni a Type-t az interfészhez képest a TypeScriptben?

A TypeScript a JavaScript gépelt szuperkészlete, amely statikus gépelést ad a nyelvhez. Ez megkönnyíti a robusztus és karbantartható kód írását azáltal, hogy a hibákat a fordítási időben..

Címkék

Machine Learning JavaScript Artificial Intelligence Data Science Python Software Development Web Development Coding Deep Learning AI React Nodejs Front End Development Software Engineering Javascript Tips NLP Computer Science HTML Neural Networks Algorithms Tech Development Typescript CSS Python Programming Data ChatGPT Javascript Development Statistics Java Science Golang Code DevOps Programming Languages Data Structures Open Source Software