A BME Kommunikáció és médiatudomány szak blogja

#Konzervtelefon


Emberi kommunikáció lehet-e valaha a gépekkel folytatott csevegés?

2017. június 02. - Király Olívia

Interperszonális kommunikáció során partnereinket érző és gondolkodó lényeknek tartjuk, és feltételezzük, hogy a másik egy adott szándékkal lépett velünk kapcsolatba. Ennek fényében felmerül, hogy hogyan tekintsünk virtuális asszisztenseinkre, és a velük folytatott „társalgásokra”? Ha érzőnek nem is, gondolkodónak tarthatjuk-e őket? Képes lehet egy szoftver a diskurzus rejtett szabályait alkalmazni? A chatbotok világában most ezekre a kérdésekre keressük a választ.

A különböző tudományok - mint a nyelvészet, a filozófia, a szociálpszichológia vagy a pszicholingvisztika - mind máshogy közelítik meg a társalgás kérdéskörét. Utóbbi a technológiai rendszerek megismerése által von le következtetéseket az interakcióra vonatkozóan, vagyis azt vizsgálja, hogy a gépekkel folytatott kommunikációban hogyan valósulnak meg az emberi kommunikációra jellemző elvek.

ke_p1.png

A kutatási téma igencsak releváns, hiszen a virtuális személyi asszisztensek már jó ideje jelen vannak a mobil piacon: a Siri (Apple), az SVoice (Samsung) és a Cortana (Microsoft) hasonló elvek mentén, egyre valóság közelibb formában állnak az emberek rendelkezésére. A Cortanaval például már csevegő tónusban is beszélgethet a felhasználó, így a társalgás olyan, mintha csak egy másik személyhez szólna.

A 'chatterbot', vagy rövidebb és elterjedtebb nevén chatbot tehát egy olyan program, amely a mesterséges intelligencia segítségével kommunikál az emberekkel, előre lefektetett metódusok és parancssorok alapján. Az első chatbotnak az 1966-ban kifejlesztett ELIZA-t tartják, a kifejezést megalkotása pedig Michael Mauldin nevéhez fűződik. Mauldin másik nagy újítása az, hogy 1994-ben létrehozta első Verbo-t (Verbally Enchanted Software Robots), akit Julia-nak nevezett el. Ez volt az első olyan szoftver, ami nem szöveges, hanem hangüzenetben kommunikált.

ke_p2.png

A gépekkel folytatott akusztikus társalgást az Amazon magas szintre fejlesztette az Echo készülék forgalomba hozásával, mely az Alexa nevű beszélő szoftverrel ellátva 2014 novemberében debütált a piacon. A cég eddig körülbelül 3 millió példányt adott el belőle.  

Az Echo egy Bluetooth hangszóró és egy virtuális asszisztens keresztezéséből jött létre, és többféle funkció betöltésére alkalmas: például folyamatosan figyel, azonnal válaszol a felhasználó által feltett kérdésekre, és elvégez egyszerűbb műveleteket, mint például a zene lejátszás vagy az ébresztő beállítása. Működési mechanizmusa a következő: a kérdéseket, kéréseket az „Alexa” felkiáltással nyitjuk, majd kiadjuk az utasítást. A szoftver WiFi hálózatra csatlakozás segítségével találja meg a szükséges információt, illetve folyamatosan tanul: kérdéseinket amellett, hogy rögzíti, a felhőben tárolja - ez pedig a rendszer fejlesztésében segíti az Amazon munkatársait. 

Az ember-gép dialógus azonban nem mindig zökkenőmentes:

Ember: Mikor indul vonat Miskolcra?

Gép: Ma utazik?

Ember: Kedden.

Gép: Ma utazik?

A példa Pléh Csaba "A társalgás pszichológiája" című művében olvasható. Az idézett szöveg rámutat arra, hogy a gépben értetlenséget generálhat az, ha az általa feltett eldöntendő kérdésre a felhasználó a várttól eltérő választ ad. És hogy miért válaszol így a gépnek a felhasználó, ahelyett, hogy igennel, vagy nemmel felelne? Azért, mert a párbeszédeket irányító összetett társas rendszerben az emberek egymást sajátos ismeretekkel, szándékokkal és egymásra vonatkozó gondolattulajdonításokkal teli lényeknek látják. A gépeknek ehhez kell felnőni. 

ke_p3.png

De egyelőre még kérdés, hogy az intelligens személyi asszisztensek egyre fejlődő kompetenciáiknak köszönhetően mikor tölthetnek be teljes értékű szerepet egy társalgásban, illetve, hogy egyáltalán megvalósulhat-e ez az állapot. Vajon túllépnek-e valaha azon, hogy utasításokat hajtanak végre és kérdéseket válaszolnak meg? Képesek leszünk valaha valós társalgási szituációt előidézni velük?

Az biztos, hogy az okos eszközök óriási fejlődést produkáltak a beszédfelismerés és a mesterséges intelligencia terén, ezen a téren sokan  a Siri-t tartják mérföldkőnek: a rendszer az esetek többségében frappáns válasszal szolgál kérdéseinkre. Virtuális asszisztensként állandóan szolgálatkész, és felhasználó kedvében akar járni.

ke_p4.png

Nem kedveli az obszcén szavakat, köszönt és elköszön, ha már nincs rá szükségünk. Mindig megvárja, míg befejezzük mondandónkat, nem vág közbe. Azonban ez a fajta társalgás nem kívánja meg például az ember-ember közti diskurzusban elvárható udvariasságot – mi például minden lelkiismeretfurdalás nélkül bezárhatjuk a programot elköszönés nélkül.

Mark Sagar, az új-zélandi University of Auckland professzora úgy gondolja, egy emberi arccal felruházott chatbottal gazdagabb kommunikáció folytatható, mint szöveges üzenetekkel működő rendszerekkel. Ezért megalkották a Nadia nevezetű avatárt, akinek Cate Blanchett kölcsönözte a hangját, az IBM pedig szoftvert szolgáltatott hozzá.

Nadia a fogyatékossággal élők számára nyújt segítséget a közigazgatási ügyintézésben. A Soul Machines startup által kifejlesztett avatárok arra is programozhatóak, hogy reagáljanak a személy arckifejezéseire a saját szimulált mimikájukkal – vagyis az empátia illúzióját hozzák létre.

ke_p5.png

Mára elmondható, hogy a chatbotok olyan világába léptünk, ahol a fejlesztők azon dolgoznak, hogy az avatárok a lehető legemberibb módon kommunikáljanak velünk. De az, hogy „a lehető legemberibb” eléri-e valaha az „emberi” szintet, az a jövő zenéje. 

képek: innen, innen, innen, innen, innen, és innen