Információ-visszakeresés – Hatalmas számú dokumentumból és adathalmazból talál bizonyos sorokat vagy kielégítő visszajelzéseket vagy vásárlói véleményeket – Az információkeresés a lényeg. A Google kereső / Gmail a legjobb példa az információkeresésre.

Az üzleti világban az IR az NLP alterületének számít. Ennek az az oka, hogy az IR a szöveges adatok lekérésével foglalkozik. Ráadásul a felhasználó kulcsszólekérdezésének megértéséhez NLP-re van szükség.

A vállalkozások általában a webes keresőmotorokra támaszkodnak. De a valóság az, hogy a webes keresőmotorok csak látogatókat vonzanak a webhelyére. Innentől kezdve a webhelyén található jó keresőmotor, valamint egy tartalomajánló motor hosszabb ideig és jobban elkötelezi a látogatókat a webhelyen.

Óriási lehetőség kínálkozik a keresőrendszerek fejlesztésére gépi tanulással és a közönségre és a tartalomra szabott NLP-technikákkal.

Információkinyerés – az a folyamat, amelynek során meghatározott tartalmat vonnak ki a szövegből. Az információ kinyerése rendkívül hatékony, ha precíz tartalmat szeretne nagy szöveg- és képtömbökbe rejteni.

Például az e-mailek találkozóira vonatkozó információk kinyerésével automatizálhatja a találkozók naptárába való felvételének folyamatát. A Google ezt úgy teszi meg, hogy elolvassa a repülési visszaigazolásokról vagy koncertekről szóló e-maileket, és felajánlja, hogy felveheti ezeket az eseményeket a naptárába. Egy másik példa az, hogy egy hitelkártya-társaság információt von ki az utazási útvonalából. Hagyományosan fel kell hívnia őket, hogy tájékoztassa őket közelgő utazásáról. A kinyert információk birtokában most már tudni fogják, hogy Ön hol tart, és automatikusan engedélyezi a tranzakciókat azon a helyen.

Néhány információ-kinyerési technika és folyamat:

A szempontbányászat a szöveg különböző aspektusait azonosítja. A hangulatelemzéssel együtt használva teljes információt von ki a szövegből. A szempontbányászat egyik legegyszerűbb módja a beszédrész-címkézés.

Ha szempontbányászatot és hangulatelemzést használnak a minta szövegén, a kimenet a szöveg teljes szándékát közvetíti:

Szempontok és érzelmek:

  • Ügyfélszolgálat – negatív
  • Call center – negatív
  • Ügynök – negatív
  • Árképzés/prémium – pozitív

Témamodellezés

A témamodellezés az egyik bonyolultabb módszer a természetes témák azonosítására a szövegben. A témamodellezés legfőbb előnye, hogy nem felügyelt technika. A modell betanítása és a címkézett képzési adatkészlet nem szükséges.

A mintaszöveg felhasználásával és két inherens témát feltételezve a témamodellezés kimenete azonosítja a közös szavakat mindkét témakörben. Példánkban az 1. témakör fő témája olyan szavakat tartalmaz, mint a call, center és service. A 2. téma fő témája az olyan szavak, mint a prémium, az elfogadható és az ár. Ez azt jelenti, hogy az 1. témakör az ügyfélszolgálatnak, a második téma pedig az árképzésnek felel meg. Az alábbi diagram részletesen mutatja az eredményeket.

Ha az Ön üzleti modellje rögtönzött IR és IE alkalmazására törekszik a mesterséges intelligencia modelljeire, és szükség van az adatok megjegyzésére, az Annoberry segít a pontos megjegyzésekben.

További szolgáltatásokért kérjük, látogasson el a Annotation Services | Annoberry, és kövessen minket a frissítésekért és egyebekért, csatlakozzon a https://www.linkedin.com/company/annoberry oldalon.