A crowdsourcing korszakában semmi sem tűnik ki olyan méretekben, mint a Wikipédia; 2001 óta csaknem 5,8 millió cikket halmozott fel, és a történelemmel, földrajzzal, politikával és szinte bármi mással kapcsolatos kérdések és kíváncsiság forrása.

Mi lenne, ha rendelkezhetne egy keresősávval, amellyel közvetlenül beírhatja kérdéseit a Wikipédiába, ahelyett, hogy oldalról oldalra ugrálna egy konkrét tényt keresve (ami igaz, hogy hihetetlenül kielégítő, ugyanakkor időpazarló lehet)?

Még jobb, ha ezt a „Wikipédia keresősávot” meg lehetne tanítani arra, hogy néhány tucat példával megértsen bizonyos típusú kérdéseket, és azonnal megjelenjen a releváns entitások, fogalmak és a válasz a Wikipédiából?

Lépjen be a „Factoid Assistant”-ba, egy mintaalkalmazásba, amely az IBM Watson „Natural Language Classifier” és „Natural Language Understanding” programjával készült, amely a „DBpedia”-ból, a Wikipédia-tartalom adatbázisából jelenít meg információkat. A teljes "Github repo" tartalmazza az összes szükséges kódot az alkalmazás replikálásához.

Tehát hogyan történik a felhasználó kérdéseinek kategorizálása és megválaszolása? Ez a folyamat egy egyéni, természetes nyelvű osztályozó modellre támaszkodik a lekérdezés szándékának meghatározásához. Ne féljen, ez a mesterséges intelligencia testreszabása mindössze néhány percet vesz igénybe, és néhány tucat gyakorlati példát vesz igénybe (amelyeket biztosítunk Önnek)!

Az nlc_factoid_training.csv használatával kövesse a dokumentáció vagy API hivatkozás egyszerű lépéseit a modell betanításához. Ez a képzési adatkészlet a következő osztályokat tartalmazza: egészség-állapot_ok, személy születési dátum, személy-születési hely, személy-gyermekek, személyi nettó_érték, személy iskoláztatása, személy-házastárs, hely-körzetkód, hely-főváros, hely-befejezés dátuma, hely-kormányzó_polgármester, hely-magasság, hely-lakosság. Minden alkalommal, amikor a felhasználó lekérdezi a Factoid Assistant-t, a kérdést a betanított NLC-modell kategorizálja.

Szívesen szabhatja testre a Factoid Assistant-t új osztályok hozzáadásával a modellhez, például személy-foglalkozás vagy hely-állapot. Ne felejtse el hozzáadni az edzési adatokat, és tartsa szem előtt ezeket a „legjobb gyakorlatokat” is. Az általunk szolgáltatott adatkészlet 78 képzési példát tartalmaz a fenti 12 osztályból. A Watson Natural Language Classifier ebben a tekintetben vezető szerepet tölt be a területen; osztályonként mindössze 5 adatpontra van szüksége (10 ajánlott); a versenytársak gyakran 10-et vagy többet igényelnek, és még magasabb küszöbértékeket javasolnak a jobb teljesítmény érdekében.

Szeretné elosztani a kódot, és saját maga elkészíteni az alkalmazást? Tekintse meg "Github repo"-nkat!

A Watson Natural Language Classifier „10+ mintaalkalmazást” is kínál online, amely elérhető élő demókhoz, kódelosztáshoz és videobemutatókhoz.

Élvezi az IBM Watson termékeit? Írjon nekünk véleményt a https://www.g2crowd.com címen!

Minden beérkezett vélemény után 10 dollárt adományozunk a Girls Who Code-nak!