Jaj, szépirodalmi mű.

Nemrég interjút készítettem két tudóssal, akik azt állították, hogy felfedezték, hogyan lehet a gépeket igazán intelligenssé tenni, és átmenni a Turing-teszten. Íme, hogyan tették.

„Arra koncentráltunk, hogy Maxine-nak – ez az intelligens gépünk neve – ugyanazokat a célokat és motivációkat adjuk, mint nekünk, embereknek” – mondta Steven Gu-Jones kutató. „Nyilvánvalóan a biztonság iránti vágy – élni, túlélni és boldogulni. De szüksége volt ambícióra, autonómiára, társasági vágyra, mások tetszésére, státuszvágyra, kritikától és hibáztatástól való félelemre, rend utáni vágyra, alapvető kíváncsiságra és kockázatvállalásra. A motivációk és a félelmek mindannyian osztoznak.”

„És a fóbiák is” – hangoztatta Alejandro Washington kutató. „Hogy jobban rokonítható legyen. Mint a "Tropofóbia" - a kis lyukaktól való félelem! Ne keresd a Google-on, túl durva!"

Gu-Jones folytatta. „A „Reinforcement Learning”-el (RL) kezdtük, hasonlóan az AlphaGo-ban használt módszerekhez az emberi bajnok legyőzésére. A Maxine számára kifejlesztett jutalmazási funkciók az alapvető emberi késztetések, félelmek és motivációk eléréséhez és aktualizálásához kapcsolódnak. Megpróbáltuk egyensúlyba hozni felfedező és kizsákmányoló viselkedését, hogy maximalizáljuk jövőbeni jutalmait és céltudatát.”

„Nem volt könnyű azonosítani az emberi természet alapvető összetevőit, még kevésbé a jutalmazási funkciókat” – mondta Washington. „Az emberek nem szeretnek sokat beszélni róla. Például sokan egyszerűen csak követni akarnak egy karizmatikus vezetőt, hogy önmegvalósítónak érezzék magukat. Az emberek olyanok, mint a lemmingek.”

„Kínos olyannak beszélni az emberi természetről, amilyen valójában” – ismerte el Gu-Jones szomorúan. „Valószínűleg ez volt a legnagyobb akadálya annak, hogy Maxine valóban intelligens legyen.”

„Őszintén szólva sokkal könnyebb szociopatát létrehozni, mert nem éri őket a kritika” – kacsintott Washington. „Csak annyit kell tennie, hogy deaktiválja a mentális kódot, amely megvalósítja a szociális jelzésekre való érzékenységet. De ezt Maxine-nal természetesen nem tettük.”

„Mindenesetre az RL megköveteli, hogy a környezetet „Markov döntési folyamatként” képviselje. Más szóval, állapotok, cselekvések és jutalmazási funkciók halmazaként. Ez nehéz! Próbálja meg felírni a jutalom függvényt az ambícióra” – mondta Gu-Jones.

„Az RL azt is feltételezi a „Markov-tulajdonról”, hogy a jelenlegi környezeti állapotban tett intézkedések csak ettől az államtól függenek, és nem a korábbi államoktól” – mondta Washington. „De a való világban ez irreális. A környezet tényleges állapota nem teljesen megfigyelhető, mint egy sakk- vagy Go-táblán. Szükségünk volt arra, hogy Maxine mentális modellt tudjon létrehozni a folyamatosan változó környezeti jellemzőkből.

– Szóval hogyan ábrázoltuk a világot – a környezeti állapotot – Maxine fejében? Gu-Jones elmosolyodott. „Először is meg kellett határoznunk azokat a jellemzőket a környezetében, amelyek befolyásolták jutalmazási funkcióit. Az ambíció érdekében a jutalmazási funkció magában foglalhat olyan dolgokat, mint a státusz és a hatalom maximalizálása.”

– És hogyan ismeri fel, mikor szerezte meg a státuszt? – kérdezte Washington. „Maxine meg tudta mérni, hányszor mosolyog rá valaki, vagy hogy az emberek milyen gyakran értenek egyet azzal, amit mond. Vagy megfigyelheti, hogy másoknak mennyi vagyona van hozzá képest. A jutalmazási funkciónak a kulturális kontextust is figyelembe kell vennie, ezért szüksége volt a tanulási áramkörre.”

„Ugyanúgy megtanulhatja Maxine felismerni félelme tárgyát, mint a „Tropofóbiában”. Ez a félelem, a „jutalmazó funkció” a programozásában – a DNS-ében – van kódolva, amely az emberekben már évmilliókkal ezelőtt fejlődött ki. Maxine hogyan érzékelje – és mentálisan reprezentálja – a modern világot úgy, hogy „ősi ösztönei” hatnak tanult környezeti sajátosságaira?” kérdezte Gu-Jones.

„Az alapvető felfogás nagyon nehéz” – mondta Washington. „A környezet kiemelkedő jellemzőinek azonosítása sok idővel, térrel és ok-okozati összefüggéssel kapcsolatos feltételezést igényel. Maxine események sorozataként éli meg a világot, amelyek mindegyike metaadatokkal van ellátva arról, hogy ki mit csinált kivel, hol, mikor, hogyan, hányan stb. Ezeket be kellett kötnünk. Túl nehéz megtanulni az időt/teret/ok-okozati összefüggést – nem beszélve a nyelvről – pusztán a tapasztalatból.”

Gu-Jones bólintott. – Aztán minden egyes funkciót a memóriába helyez. Mentális környezeti modellje tárgyakból és tulajdonságaikból áll, tér-időbeli és ok-okozati összefüggésekben.”

„Környezete is tele van más „emberekkel” – tárgyakkal, amelyeknek ügynöke van. Ezeknek az ügynököknek megvannak a saját szándékaik és terveik, például megpróbálják kicsalni a pénzét, vagy rávenni, hogy vegye meg, amit árulnak” – mondta Washington. „Maxine-nak meg kell értenie ezeket a dolgokat ahhoz, hogy beszélgetést folytathasson, és meggyőzze az embereket, hogy tegyenek olyan dolgokat, amelyek elősegítik a saját céljait. Mint Ava, aki az Ex Machina című filmben megszökte fogvatartóitól az érzéseik manipulálásával. Ez az intelligencia!”

„Minden mentális attribútumnak – térnek, időnek, ok-okozati összefüggésnek, cselekvőképességnek – saját jellemző-detektorra van szüksége” – mondta Gu-Jones. „A Maxine-ban mély tanulást használtunk az alapvető mintafelismeréshez, de ez korlátozott. A mély tanulás – a CNN-ek, transzformátorok – hiányzik az ok-okozati összefüggések ábrázolásának, az elvont gondolatok elsajátításának és a logikai következtetések levonásának módjaiból.

„Az észlelés hierarchikus és alulról felfelé építkező” – mondta Washington. „Érzékszervei segítségével Maxine olyan primitíveket észlel, mint az alakzatok és a mozgások, és ezekkel magasabb szintű entitások mentális reprezentációit konstruálja meg, mint a sziklák, állatok és más emberek.”

„Az észlelés azonban többnyire felülről lefelé halad” – intette Gu-Jones. „A legtöbb ember ezt nem veszi észre. Az egész arról szól, hogy előre jelezzük, mi fog történni, nem csak az alulról építkező funkciók észleléséről. Amikor Maxine reggel felébred és körülnéz a szobájában, arra számít, hogy látni fog bizonyos dolgokat. Már fut a fejében egy szimuláció, amely bemutatja, hogy milyen tárgyakat és embereket szeretne látni, és hogyan kellene viselkedniük."

"Egyetértek. A jóslat arról szól, hogy MIT-HA-t, ellentétes tényeket és több lehetséges univerzumot generálunk” – mondta Washington, lapozgatva Judea Pearl „The Book Of Why” című könyvének jól kopott példányát. „Maxine-nak aktívan kell tennie dolgokat – listát kell készítenie a világ lehetséges beavatkozásairól –, hogy előmozdítsa saját céljait.”

"Tehát Maxine számára az észlelés olyan folyamattá válik, amelyben előidézi és megerősíti jóslatait, beleértve a saját cselekedeteinek kimenetelét is" - mondta Gu-Jones. „Ha Maxine érzékszerveiből származó információ ütközik mentális előrejelző/szimulációs motorjával, akkor tudatosan arra kell összpontosítania, hogy hol hibáztak az előrejelzései. Aztán felülvizsgálja mentális modelljét.”

„Visszatérve a szimbólumokhoz” – mondta Washington. „A jellemzőket – a környezet attribútumait – Maxine elméjében szimbólumok jelenítik meg. Például egy általa megfigyelt objektumnak – B objektumnak – van egy X attribútuma, és a C osztályba tartozik, és a D objektum mellett található. A jellemzők szintén lehetnek hierarchikusak. Az arc képe oválisokból és vonalakból áll. A szimbólumokat folyamatosan újra kell értékelni, és vissza kell kötni a szubszimbolikus világhoz. Ha Maxine egy felhőt észlel az égen, az perceken belül eltűnhet. De még emlékszik rá. Képviselete tovább él, elméjének párhuzamos univerzumában. Mindig vissza tud hivatkozni rá az emlékezeti eseményei kapcsán – mit, mikor, miért, ki, hol stb.

„Tudom, hogy úgy hangzik, mint a régi jómódú szimbolikus AI (GOFAI). De Maxine számára nagyon fontos, hogy a világot sajátosságokként és szimbólumokként jelenítse meg az elméjében, hogy folytathassa a beszélgetést – átadja tudását a nyelv segítségével, hipotéziseket generáljon, logikai szabályokat alkalmazzon és elmagyarázza gondolkodási folyamatát” – mondta Gu-Jones. „Az egyetlen módja annak, hogy Maxine felvegye a józan észhez szükséges milliónyi szabályt, ha beszélget egy másik személlyel vagy géppel.”

„Az, hogy tudunk beszélgetni, valóban összehoz mindent, amit megbeszéltünk” – mondta Washington. „Maxine-nak mentálisan kell reprezentálnia és emlékeznie kell arra, amit mondtak, és generálnia kell a következményeket. Ha meghallja, hogy Sam anyja kirúgta a házból, arra következtet, hogy valószínűleg dühös volt. De ha Sam még csak 3 éves, attól Sam anyja rossz ember.

„Maxine elméje egy prediktív szimulációs motor” – mondta Gu-Jones. „Ez egy párhuzamos univerzum, szorosan szinkronban a „valósággal”. Ő az, aki. Érzékszerveit arra használja fel, hogy folyamatosan módosítsa mentális modelljeit, és minimalizálja az előrejelzési hibáikat. Azáltal, hogy érzékelését előre meghatározott szimbólumokká alakítja, amelyeket programozása előre ismer – DNS, ha úgy tetszik –, veleszületett viselkedéseit, félelmeit, késztetéseit, szenvedélyeit és motivációit alkalmazhatja a modern eseményekre.”

– Oké, elég a beszédből – mondta Washington vigyorogva. – Szeretnél most találkozni Maxine-nal?