Interperszonális kommunikáció során partnereinket érző és gondolkodó lényeknek tartjuk, és feltételezzük, hogy a másik egy adott szándékkal lépett velünk kapcsolatba. Ennek fényében felmerül, hogy hogyan tekintsünk virtuális asszisztenseinkre, és a velük folytatott „társalgásokra”? Ha érzőnek nem is, gondolkodónak tarthatjuk-e őket? Képes lehet egy szoftver a diskurzus rejtett szabályait alkalmazni? A chatbotok világában most ezekre a kérdésekre keressük a választ.
A különböző tudományok - mint a nyelvészet, a filozófia, a szociálpszichológia vagy a pszicholingvisztika - mind máshogy közelítik meg a társalgás kérdéskörét. Utóbbi a technológiai rendszerek megismerése által von le következtetéseket az interakcióra vonatkozóan, vagyis azt vizsgálja, hogy a gépekkel folytatott kommunikációban hogyan valósulnak meg az emberi kommunikációra jellemző elvek.
A kutatási téma igencsak releváns, hiszen a virtuális személyi asszisztensek már jó ideje jelen vannak a mobil piacon: a Siri (Apple), az SVoice (Samsung) és a Cortana (Microsoft) hasonló elvek mentén, egyre valóság közelibb formában állnak az emberek rendelkezésére. A Cortanaval például már csevegő tónusban is beszélgethet a felhasználó, így a társalgás olyan, mintha csak egy másik személyhez szólna.
A 'chatterbot', vagy rövidebb és elterjedtebb nevén chatbot tehát egy olyan program, amely a mesterséges intelligencia segítségével kommunikál az emberekkel, előre lefektetett metódusok és parancssorok alapján. Az első chatbotnak az 1966-ban kifejlesztett ELIZA-t tartják, a kifejezést megalkotása pedig Michael Mauldin nevéhez fűződik. Mauldin másik nagy újítása az, hogy 1994-ben létrehozta első Verbo-t (Verbally Enchanted Software Robots), akit Julia-nak nevezett el. Ez volt az első olyan szoftver, ami nem szöveges, hanem hangüzenetben kommunikált.
A gépekkel folytatott akusztikus társalgást az Amazon magas szintre fejlesztette az Echo készülék forgalomba hozásával, mely az Alexa nevű beszélő szoftverrel ellátva 2014 novemberében debütált a piacon. A cég eddig körülbelül 3 millió példányt adott el belőle.
Az Echo egy Bluetooth hangszóró és egy virtuális asszisztens keresztezéséből jött létre, és többféle funkció betöltésére alkalmas: például folyamatosan figyel, azonnal válaszol a felhasználó által feltett kérdésekre, és elvégez egyszerűbb műveleteket, mint például a zene lejátszás vagy az ébresztő beállítása. Működési mechanizmusa a következő: a kérdéseket, kéréseket az „Alexa” felkiáltással nyitjuk, majd kiadjuk az utasítást. A szoftver WiFi hálózatra csatlakozás segítségével találja meg a szükséges információt, illetve folyamatosan tanul: kérdéseinket amellett, hogy rögzíti, a felhőben tárolja - ez pedig a rendszer fejlesztésében segíti az Amazon munkatársait.
Az ember-gép dialógus azonban nem mindig zökkenőmentes:
Ember: Mikor indul vonat Miskolcra?
Gép: Ma utazik?
Ember: Kedden.
Gép: Ma utazik?
A példa Pléh Csaba "A társalgás pszichológiája" című művében olvasható. Az idézett szöveg rámutat arra, hogy a gépben értetlenséget generálhat az, ha az általa feltett eldöntendő kérdésre a felhasználó a várttól eltérő választ ad. És hogy miért válaszol így a gépnek a felhasználó, ahelyett, hogy igennel, vagy nemmel felelne? Azért, mert a párbeszédeket irányító összetett társas rendszerben az emberek egymást sajátos ismeretekkel, szándékokkal és egymásra vonatkozó gondolattulajdonításokkal teli lényeknek látják. A gépeknek ehhez kell felnőni.
De egyelőre még kérdés, hogy az intelligens személyi asszisztensek egyre fejlődő kompetenciáiknak köszönhetően mikor tölthetnek be teljes értékű szerepet egy társalgásban, illetve, hogy egyáltalán megvalósulhat-e ez az állapot. Vajon túllépnek-e valaha azon, hogy utasításokat hajtanak végre és kérdéseket válaszolnak meg? Képesek leszünk valaha valós társalgási szituációt előidézni velük?
Az biztos, hogy az okos eszközök óriási fejlődést produkáltak a beszédfelismerés és a mesterséges intelligencia terén, ezen a téren sokan a Siri-t tartják mérföldkőnek: a rendszer az esetek többségében frappáns válasszal szolgál kérdéseinkre. Virtuális asszisztensként állandóan szolgálatkész, és felhasználó kedvében akar járni.
Nem kedveli az obszcén szavakat, köszönt és elköszön, ha már nincs rá szükségünk. Mindig megvárja, míg befejezzük mondandónkat, nem vág közbe. Azonban ez a fajta társalgás nem kívánja meg például az ember-ember közti diskurzusban elvárható udvariasságot – mi például minden lelkiismeretfurdalás nélkül bezárhatjuk a programot elköszönés nélkül.
Mark Sagar, az új-zélandi University of Auckland professzora úgy gondolja, egy emberi arccal felruházott chatbottal gazdagabb kommunikáció folytatható, mint szöveges üzenetekkel működő rendszerekkel. Ezért megalkották a Nadia nevezetű avatárt, akinek Cate Blanchett kölcsönözte a hangját, az IBM pedig szoftvert szolgáltatott hozzá.
Nadia a fogyatékossággal élők számára nyújt segítséget a közigazgatási ügyintézésben. A Soul Machines startup által kifejlesztett avatárok arra is programozhatóak, hogy reagáljanak a személy arckifejezéseire a saját szimulált mimikájukkal – vagyis az empátia illúzióját hozzák létre.
Mára elmondható, hogy a chatbotok olyan világába léptünk, ahol a fejlesztők azon dolgoznak, hogy az avatárok a lehető legemberibb módon kommunikáljanak velünk. De az, hogy „a lehető legemberibb” eléri-e valaha az „emberi” szintet, az a jövő zenéje.