A BME Kommunikáció és médiatudomány szak blogja

#Konzervtelefon


A digitális identitás útvesztőjében, avagy hogyan befolyásolja a mesterséges intelligencia a személyes ízlésünket?

2021. május 07. - KomMédia BME

A következőkban azt a kérdést járjuk körül, hogy a mesterséges intelligencia (MI) hogyan hat az ízlésünkre: a poszt középpontjában a külföldi és magyar piac jelenleg legnépszerűbb streaming szolgáltatója, a Netflix áll. Rendkívül érdekes, hogy hogyan tematizálja és alakítja át a streaming a televíziózást, és az, hogy a legnagyobb szolgáltató milyen eszközökhöz nyúl annak érdekében, hogy a nézők egyre jobb eszközökön, egyre inkább a nekik tetsző műsorokat nézhessenek. Ez a jelenség több tudományterületet is érint, ezért szociológiai, gazdasági és technológiai szemüvegen keresztül is vizsgáljuk majd Netflixet és a felhasználókra gyakorolt hatását. Célunk, hogy láthatóvá váljon az emberi döntéshozás „meghekkelése”, médiafogyasztásunk átalakulása, illetve az esztétikai érzetünk befolyásolásának képessége és lehetősége.

A „modern kor hatalma” maga az algoritmus. A biotechnológia és információs technológia összeolvadásából olyan algoritmusok születnek, amelyek szinte jobban megértik az érzéseinket, mint mi saját magunkat. A hatalmunk, vagyis a választásunk szabadsága pedig innentől kezdve már nem feltétlenül a mi kezünkben lesz. A MI-val kéz a kézben járó biometrikus szenzorok és a big data algoritmusok meghekkelhetik érzéseinket, vágyainkat, és pontosan tudni fogják mindazt, amit mi sem tudunk saját magunkról: hogy kik is vagyunk valójában, és hogy mit is akarunk. Egy algoritmus mindezek mellett abban is segíthet, hogy érdeklődési körünk alapján melyik filmet nézzük meg, de a szem és arcizmok mozgását követve képes lehet az emberek érzelmeit is felismerni, pont úgy, ahogy azt Kínában élő emberek tapasztalják a digitális diktatúrában. 

Egy kezdetben DVD árusításával foglalkozó amerikai cég az MI által használt technikákat gyűjtötte össze, és integrálta egy közös rendszerbe. Ez, a már-már tökélyre fejlesztett rendszer az, amit ma Netflix-ként ismerünk – és ami befolyásolja az esztétikai érzékünket, ha úgy tetszik, az ízlésünket.

Mert éhezzük az élményt

Az élmények és azok megélése életünk részei, alapvető igényünk van ezekre a kezdetektől fogva, és lesz a jövőben is. A szórakoztatás iparággá alakult, a nagy cégek pedig rájöttek, hogy óriási és kiaknázatlan lehetőség van abban, ha az élményvágy kielégítése mellett létrehozzák és táplálják is mindazt. Egyebek mellett a Netflix leghatalmasabb potenciálja pont ebben áll. Kapcsolatba lép velünk, kihasználja a kényelem iránti igényünket, majd tűélesen analizált preferenciáink alapján táplálja a vágyainkat: az algoritmusa segít, hogy azt a tartalmat nézzük, úgy, és leginkább akkor, ahogyan azt mi nézőként szeretnénk.

A következő ábra azt mutatja be, hogy az élmények sokkal fontosabbak a fogyasztóknak, mint egy adott termék, vagy szolgáltatás. Ha a termék, vagy szolgáltatás használata nem okoz élményt, akkor ezek legtöbbször feleslegessé válnak a felhsználók számára: 

kep1.png

A fogyasztók már nem csak árukat és szolgáltatásokat keresnek, hanem főként élményeket (via)

Az amerikai cég több területen is alkalmazza a mesterséges intelligenciát. Ilyen a streaming minőség meghatározása, a filmszerkesztési utómunkálatok, a filmgyártás helymeghatározása, a saját gyártású filmek létrehozása, vagy a tartalom ajánlások személyreszabása - itt mind MI által átszőtt megoldásokat találhatunk. Az utóbbi években ez az ajánlási- és személyre szabási rendszer lett a vállalat egyik legnagyobb értékesítési erőssége, ezért a következőkben ezt a megoldást vizsgáljuk. 

Személyre szabás: a Netflix fő versenyelőnye

Felmerült már benned, hogy miért ajánl minden egyes filmnézés előtt különböző filmeket a Netflix? Vagy az, hogy éppen hogyan profilozza a több mint 100 millió előfizetőjét? Az adat kardinális tényező, és a kérdés megválaszolásának kulcsa is az adatainkban keresendő. A Netlixnél ugyanis sosem tagadták, rengeteg információt gyűjtenek rólunk:

Tudjuk, hogy a nap melyik órájában nézed a tartalmat, hogy mennyi ideig nézted, tudjuk, hogy mit néztél előtte, mit néztél utána, hogy a számítógépeden, az okostelefononodon vagy tableten nézted-e, illetve az is, hogy melyik profilból nézted. Nagyon sok információnk van.”– mondta Todd Yellin, a Netflix termékmenedzsment igazgatója.

Minden ilyen megoldás tulajdonképpen egy üzleti problémára vezethető vissza. A „probléma” az, hogy a Netflix hatalmas tartalomkönyvtárral rendelkezik, amely dinamikusan változik, és a felhasználó számára mindez túl bőséges kínálatot jelenthet. A felhasználó nem akar csalódni, előfizetéséért cserébe az érdeklődésének megfelelő tartalmat akarja megtalálni, azaz azt a személyes élményt keresi, amit a lineáris televíziózás során nem feltétlenül kaphat meg. A Netflix ajánlási rendszere pont erre a problémára ad megoldást, és ezt aknázza ki.

A Netflix már évekkel ezelőtt arra törekedett, hogy minden filmet adatokra lehessen bontani, a filmproducereknek pedig fizettek is, hogy minél pontosabban tudják az adott filmet bekategorizálni. Alexis Madrigal technológiai újságíró is alátámasztja azt, hogy a Netflix könyvtárában lévő összes terméket hatalmas címkék sorozatára bontják, amelyek nemcsak helyekre vagy a szereplőkre vonatkoznak, hanem sokkal szélesebb kategóriákra is, mint például "erkölcs" vagy "érzelmi hatás". A fő algoritmusuk tehát nagyon finoman meghatározott, több mint 27 000 (!) mikro-műfaj alapján működik. Ez a megoldás lehetővé teszi a cég számára, hogy nagy pontossággal testre szabhassák a javasolt filmeket vagy sorozatokat, és így nekünk tetsző ajánlásokat kaphassunk. A folyamatos fejlesztésre való igényt bizonyítja, hogy 2016-ig „csak” földrajzi, életkori és nemi adatok szerint szegmentáltak, mára pedig globálisan körülbelül 2000 preferencia- és ízlésközösséget, úgynevezett klasztert generáltak. Attól függően pedig, hogy milyen az ízlésünk, egyfajta virtuális közösséghez tartozunk, amelyben a tartalom is dinamikusan változik interakcióink hatására. A személyre szabhatóság alapja tehát a tartalom címkézése és a virtuális „közösségek” kialakítása.

 kep2_2.jpg Vajon milyen hatással vannak az algoritmusok a választásunk szabadságára? (via)

Valójában a Netflix fő algoritmusa sokkal több, mint egy elektronikus „műszer”, amely korábbi döntések alapján minden előfizető számára külön címeket ajánl. Ez egy felfoghatatlanul komplex rendszer, ami a datascience és a gépi tanulás eszközeivel folyamatosan átalakítja a látszólag kaotikus viselkedésünket ismétlődő és ezért kiszámítható mintákká. A Netflix korántsem csak streaming filmeket és TV-műsorokat szolgáltat, hanem megpróbálja kielégíteni azokat a vágyainkat, amelyekről esetleg mi magunk sem tudunk.

A rendszer négy különféle módszerre épül:

  1. a felhasználók személyes profiljára: tehát korábbi választásainkra, az ötcsillagos visszacsatolási és besorolási rendszerre, ahol értékelni tudjuk a filmeket, a görgetési tevékenységünkre és a megtekintési szokásainkra, azaz az interakcióinkra; 
  2. az együttműködési szűrésre a „ügyfélklaszterek” révén: ez egy ajánlási technika, amely a felhasználói visszajelzéseken alapul
  3. a címkéző rendszerre, amely szorosan összekapcsolódó filmek (pl. ugyanazon rendező által készített vagy ugyanazon műfajú filmek) csoportosítását célozza
  4. a Netflix saját kereskedelmi prioritásaira.

Az algoritmus gyakorlati működése úgy elemezhető, hogy amikor például egy Netflix felhasználó a „Stranger Things” című sorozatot nézi, akkor az interakció során elemzett adatnyomok betáplálódnak a PRS-be (Personalization and Recommendation System röviden: PRS), amely meghatározza a felhasználó valószínű viselkedési és megfigyelési mintáját. Ez azt eredményezi, hogy a felhasználó a következő bejelentkezésekor ajánlásokat kap. Ez a folyamat mindig folytatódik, és a rendszer aszerint módosítja az ajánlásokat, ahogyan a felhasználó viselkedett a platformon. Minden egyes alkalommal, amikor a felhasználó bejelentkezik, ezen minták alapján talál egy újból generált és meghatározott tartalomkatalógust. A PRS rendkívül adaptív, folyamatosan alkalmazkodik az új interakciókhoz, éppen ezért a felhasználó számára mutatott tartalom egyre inkább egy olyan felhasználói profilt állít elő, amely sokkal inkább a PRS saját logikájára támaszkodik, mint a felhasználó valódi és autonóm nyílt interakcióira. Tehát az, amit mérnek, nem a felhasználó spontán és szándékos elkötelezettsége. Ez az algoritmikus determinizmus hozza létre azt, amit Cheney-Lippold algoritmikus identitásnak nevez.

„Ezt az identitást olyan cégek generálják, amelyek feltérképezik, összehasonlítják, majd algoritmikusan értelmezik a felhasználók adatait annak érdekében, hogy megértsék a felhasználók identitását, de nem a tényleges személyiségét, hanem digitális identitás vagy profil formájában.”

 kep3_1.pngA profilunk alapján mutatják be nekünk a filmeket reklámozó képeket (via)

Betekintő: a kép, amely többet mond minden szónál

Hiába egy mesterien kidolgozott ajánlási rendszer, ha végsősoron a felhasználó nem kattint. A Netflix erre is kidolgozott egy megoldást, mégpedig a filmeket bemutató miniatűrök (angolul: „thumbnail”-ek) generálása és személyre szabása révén.

kep4_1.png

 Egy sorozat megannyi thumbnail-je, ízlésünktől függően (via)

Minden egyes filmet vagy sorozatot ugyanis a tartalomkönyvtáron belül úgynevezett indexképekkel reklámoznak. A cél, hogy minden műsorhoz olyan képek társuljanak, amelyek kiemelik az egyes tagok szempontjából releváns vizuális tartalmat, és így biztosan elköteleződést, tehát kattintást vált ki. Minden esetben több száz fajta képet rendelnek a film bemutatására, amelyből az előfizetőknek mindig a legrelevánsabbat használják fel. Mindegyik képpel tehát másfajta személyiség típusokat, különböző ízléscsoportokat próbálnak megszólítani, vagy ahhoz hangolják a képet, hogy milyen más filmeket és sorozatokat néztünk meg korábban. 

Elég egyértelműnek látszik, hogy a Netflix adatainak kombinációja, algoritmikus személyre szabása és kormányzása, illetve hatalmas tartalomkönyvtára mind-mind olyan tényezők, amelyek a felhasználókat még inkább a képernyő elé fogják vonzani. Az igény adott a közönség részéről – és láthatóan a Netflix erre tökéletesen reagál.

Fontos azonban látnunk, hogy bármilyen kifinomult is a Netflix címkézési folyamata, az előzetes preferenciáinkból és interakcióinkból kiszűrt metaadatok és együttműködési szűrők nem képesek teljes mértékben utánozni az egyedi ízlést. Ehelyett tűélesen analizált és megalapozott döntéseket hoznak, amelyek az esetek többségében valóban személyre szabott ajánlást jelent. Ez persze a legtöbb esetben hűen tükrözi valódi igényünket, de mivel matematikai képleten működő rendszerekről beszélünk, a folyamaton belül mindig érdemes a végső emberi döntéshozással, mint elemmel számolni. Valódi és teljes személyre szabottságról akkor beszélhetnénk, ha MI a gondolatunkat is olvasná, és azokat a váratlan emberi döntéshozásból adódó fordulatokat is meg tudná fejteni, ami bennünk megy végbe. Ugyanis a gép sosem fogja tudni, hogy két hét teljes horror „filmmaraton” után mikor vágyunk egy kis romantikára, vagy netalántán vígjátékra. Az algoritmusok – jelenlegi fejlettségi szintükön – sosem lesznek képesek fontos döntéseket hozni helyettünk, mivel a számítógépes algoritmusoknak nincsennek érzelmeik, sem ösztöneik.

További olvasmány: Kevin McDonald & Daniel Smith-Rowsey (2016): The Netflix Effect: Technology and Entertainment in the 21st Century.

A bejegyzés szerzője Gyenes Donát, a BME KomMédia mesterszakos hallgatója. 

konzerv_1.png

Mesterséges intelligencia a zenészek szolgálatban, avagy fenyeget-e a mentális elhízás?

Manapság a mesterséges intelligenciát egészen könnyen integrálhatjuk mindennapi tevékenységeinkbe. Gondoljunk csak az Amazon által fejlesztett Alexára, a különböző online platformok ajánlórendszereire vagy az okostelefonokra letölthető számtalan applikációra. A csaknem tíz évvel ezelőtt megjelent Wall-E című animációs film egyik jelenete bizalmatlanul reflektált erre a tendenciára: az emberiség a haldokló Föld bolygóról menekülve egy MI által irányított űrhajón kezd új életet. Hétköznapjaik minden mozzanata automatizálttá válik, mely végül odáig fajul, hogy rettentően elhíznak és képtelenek lesznek lábra állni. Bár a filmben felbukkanó önhajtó fotelek és a mozgásmentes életmód érája még nem köszöntött be, az automatizáltság absztraktabb kérdéskörére talán mégis érdemes figyelmet fordítani. 

Vajon mi történik akkor, ha nem testünket, hanem kreativitásunkat bízzuk mesterséges intelligenciára?  Fenyeget-e a mentális elhízás?

(via)

A mesterséges intelligencia, mint komponista

Ha alkotásról és mesterséges intelligencia kapcsolatáról beszélünk, nem tekinthetünk el az MI zeneszerzésben betöltött szerepétől. Számtalan kísérletről tudunk, mely az emberi kreativitás algoritmikus leképezése mentén igyekszik a programokat egyedi darabok megírására serkenteni.

1957-ben bemutatták az első alkotást, Illiac Suite for String Quartet címen, melyet teljes mértékben a Lejaren Hiller és Leonard Issacson által megtervezett MI alapú program kreált. 1980-ban David Cope megalkotta az EMI-t (Experimence in Musical Intelligence), mely korábbi darabok analizálása mentén képes volt új, egyedi kompozíciók létrehozására. Ma már egyre több és több alkalmazás áll az alkotók rendelkezésére, amelyek igény szerint más-más területeken segíthetik munkájukat, legyen szó szövegírásról, mintázatok elemzéséről vagy új melódiák kreálásáról.

(via)

 

Örökös, utópisztikus vita, hogy vajon egy szoftver képes lehet-e autonóm, művészi értékekkel rendelkező darabokat komponálni, el tudja-e érni az emberi kreativitás fokát. A diskurzusok végére azonban lehetetlen pontot tenni, hiszen a művészet és kreativitás fogalmai önmagukban is definiálásra szorulnak, nem létezik olyan zárt szabályrendszer, amely alapján ítéletet mondhatnánk. Azt azonban, hogy egy MI alapú program használatakor az ember és gép kooperációjából hogyan születhet gyümölcsöző kapcsolat, milyen mértékben marad terepe az emberi kreativitásnak és feltalálásnak, már annál tanulságosabb lehet megvizsgálni.

Mentor vagy diktátor – Flow Machine, Amper és IBM Watson

A mesterséges intelligencia alapú zeneszerző szoftverek szinte mind hasonló logikával működnek. Az alkotó kiválaszthatja, milyen stílusú zenét szeretne létrehozni, majd a szoftver a különböző műfajú számokból álló adatbázisából táplálkozva felállít egy egyfajta statisztikát arra vonatkozóan, hogy a megadott műfajon belül milyen ritmust, harmóniát, szekvenciát mi követ. Ezután algoritmusok alapján új zenei mintázatokat hoz létre, majd felajánlja azokat a felhasználónak: ezeket később megvághatja, változtathat a tempón és szöveget írhat rá. Az egyes applikációk ugyanakkor mutathatnak némi eltérést.

A Sony Computer Science Laboratories által 2012 óta fejlesztett Flow Machine nevű szoftveren belül például lehetőség van konkrét számok kiválasztására is, melyeket az alkotó szeretné, hogy a mintázatok megírásakor az felhasználjon. 2016-ban debütált az első szám, melyet a Flow Machine használatával írtak, a Beatles ihlette Daddy’s car. 2018-ban egy egész album jelent meg Hello World címmel, melyet több zenész bevonásával hoztak létre.

A 2014-től fejlesztett Amper Music a kiválasztott műfaj mellett felajánlja különböző „mood”-ok kiválasztását is (ilyen lehet például a boldogság, a szomorúság, vagy akár a vezetés is). Taryn Southern az elsők között hozott létre egy egész albumot ennek az alkalmazásnak a használatával, I AM AI címmel.

Az IBM Watson pedig talán még az előző két alkalmazásnál is tovább megy, különböző blogokat, cikkeket és közösségi média bejegyzéseket analizál, annak érdekében, hogy körvonalazza napjaink legjelentősebb témáit, és összegezze azok érzelmi karakterét. Így jöhetett létre Alex Da Kid Not Easy című száma, mely az első helyet foglalhatta el a Billboard Top 40-es listáján.

A különböző szoftverek felsorolását még lehetne folytatni (Dadabots, Jukedeck, Melodrive...) azonban egy lényeges közös pont ez a három példa alapján is élesen kirajzolódik. A mesterséges intelligencia alapú zeneszerző szoftverek az alkotásnak egy alapvető mozzanatára épülnek: az új mű létrehozása előtt a szerző felállítja magában a korábban megismert zeneszámokból álló preferenciarendszerét. Teljesen új, „minden mentes” művek megalkotása talán nem is lehetséges. A fent említett programok az alkotó helyett építenek rendszereket és  összefüggéseket - lehet, hogy nem teljes egészében alkotják meg a végleges művet, de fontos kiindulópontot adnak hozzá. 

Legyünk technofóbok?

A teljes egészében mesterséges intelligencia által írt zeneművek talán megrémíthetik a hallgatókat, hiszen rámutatnak arra, hogy egy gép is képes lehet hangzásában olyan darabot összeállítani, amely nem különböztethető meg egy ember által írottól. Bár mindez felvillantja annak lehetőségét, hogy az emberi tényező talán a művészet terén is helyettesíthetővé válhat, a közönség egy része bizonyára még jó ideig (vagy talán soha) nem lesz hajlandó elfogadni, hogy amit hall vagy lát, emberi beavatkozás nélkül készült. Talán épp ezért érdemelhet több figyelmet az a metódus, ahogy az automatizáltság átveszi az irányítást az alkotás bizonyos fázisai felett. Olyan alkotási folyamatokba lép be, amelyek minőségében változtathatják meg a zene és a zeneszerző közötti kapcsolatot. Mindezt pedig olyan szlogenek mögött teszi, mint ami akár a Flow Machine oldalán olvasható: eszerint az alkalmazás célja „a művészek zenei kreativitásának kiterjesztése”.

A bejegyzés célja nem az, hogy technofób irányba terelje az olvasót. Az innovációk, a digitalizáció, az intelligens, akár emberi munkát helyettesítő rendszerek számos pozitív eredményét ismerhetjük. Elkerülhetetlennek tűnik, hogy szerepet vállaljanak az alkotói folyamatokban is, hiszen ha ez nem történne meg, akkor a művészet – legyen szó bármelyik ágáról – egy idő után eltávolodna a mindennapi élettől, elfelejtene szólni arról, ami körbevesz minket. Lesznek alkotók, akik képesek megfelelő tudatossággal nyúlni ezekhez az eszközökhöz.

David Bowie és az általa alkotott Verbatiser jó példa lehet erre, mely által Bowie korábban manuálisan végzett „cut-up” technikáját ültette át automatizált környezetbe. A  technika lényege, hogy különböző forrásokból származó szövegek (például újságcikkek, saját írások) alapján készített szómontázst: a leírt alapanyagot felvágta, kalapba szórta, majd a véletlenre hagyatkozva kihúzta és egymás mellé tette a szavakat. Az így kapott mondatokból később eltávolította az oda nem illő elemeket. Később a folyamat automatizálásával, a gép által generált véletleneken keresztül nyertek új értelmet az énekes szövegei. 

A mesterséges intelligencia használatával kapcsolatban érdemes tehát szem előtt tartani és kritikával kezelni a hogyan és milyen mértékben kérdéseket. 

A bejegyzés szerzője Koller Ágnes Hajnalka, a BME KomMédia képzés mesterszakos hallgatója. 

konzerv.png

 

Mesterséges intelligencia: filmek és valóság

A mesterséges intelligencia (MI) fejlesztésére hatalmas összegeket fordítanak világszerte: az innovációs versenyben nagyhatalmak, egyetemek és tech óriások is részt vesznek, de a startup szférában is születnek igazi áttörések. A technikai lehetőségek bővülése azonban számtalan új etikai kérdést is felvet – ezek egy része Hollywoodot és a streaming szolgáltatókat sem hagyja hidegen. Mik a fő fejlesztési irányok, milyen dilemmák kapcsolódnak ezekhez, és hogyan reflektál minderre a popkultúra?

„Mérnöki szempontból a mesterséges intelligencia fejlesztésében két fő irányvonal van. Az egy-egy feladat megoldására kalibrált rendszerekhez (narrow artificial intelligence) tartoznak a keresőmotorok, ajánló algoritmusok, hangfelismerő alkalmazások, de akár az önvezető autók is. A másik csoportot az általános mesterséges intelligenciák (artificial general intelligence= AGI) alkotják, például a Turing teszten induló chatrobotok vagy több funkció ellátására alkalmas MI asszisztensek” – magyarázza Dr. Héder Mihály, a BME Filozófia és Tudománytörténet tanszékének docense, aki az MI körüli kérdésekkel fejlesztő mérnökként és technikafilozófusként is foglalkozik.

dreamstime_s_19139701.jpg

Robot woman sitting in futuristic hammock.
© Sarah Holmlund | Dreamstime.com

 

A technikai környezet folyamatos bővülése és a jövő technológiái bőven adnak gondolkodnivalót a tudósoknak: gyakran felmerül, hogy a robotok elveszik-e majd az emberek munkáját, vagy, hogy az önvezető autók mit fognak tenni egy-egy élet-halál kérdést jelentő közlekedési helyzetben. „Az MI-k egyre fontosabb döntéseket képesek meghozni helyettünk, de nem lehet őket úgy felelősségre vonni, mint az embereket. Előfordulhat, hogy olyan bonyolulttá válnak, hogy a megalkotóik sem fogják már átlátni a működésüket, ami váratlan, vagy akár veszélyes helyzeteket is eredményezhet. Egyes tudósok – például Stephen Hawking, Ray Kurzweil, Nick Bostrom – azt is el tudják képzelni, hogy ezek a gépek öntudatra ébrednek. Felmerül, hogy az MI-k egyre több területen lesznek az emberek társai, nem csak a munkában, hanem a magánéletben is. Milyen státuszt adunk majd nekik? Továbbra is gépekként kezeljük majd őket? Végül nem szabad megfeledkezni a sötét oldalról sem: egy elszabadult autonóm fegyver óriási pusztítást végezhet.” – mondja a szakértő.

Pusztítók és szeretők

A filmek és a sorozatok jól lekövetik a fejlesztések széles spektrumát, sőt, a jövőben játszódó történetek jól ráéreznek arra, hogy milyen technológiák lesznek elérhetőek a jövőben. Hangsúlyok azonban vannak, Dr. Héder Mihály három kategóriát különít el:

  1. Az MI mint ellenség: az öntudatra ébredt robotok kipusztítják az emberiséget – erre a narratívára példa a Terminátor sorozat, melynek első epizódja 1984-ben debütált.
  2. Az MI mint társ: a robotok az élet egyre több területén jelennek meg partnerként. Az Csillagok között (Interstellar, 2014) című filmben azt látjuk, hogy extrém körülmények között a gépek milyen jól ki tudják egészíteni az emberek képességeit. A nőben (Her, 2013) egy álombarátnőt személyesít meg egy beszélő chatrobot, a Robot&Frank (2012) pedig arra világít rá, hogy az idősek ellátásában milyen előnyei lehetnek egy robotnak.
  3. Az MI mint technológiai környezet: a film cselekményének hátteret adó ultramodern környezetben az önálló személyiséggel nem rendelkező, egy-egy feladatot ellátó MI rendszerek is hangsúlyosan megjelennek. Önállóan ritkábban szerepelnek filmekben, viszont az összetettebb, negatív vagy pozitív személyiséggel rendelkező MI-ket bemutató filmekben stabil a helyük.

interstellar.jpg

(via)

Vannak azonban nehezebben megfogható témák, amelyek a képernyőn is kevésbé vannak jelen: ilyen például az, hogy a mesterséges intelligenciával rendelkező rendszerek nem mindenki számára lesznek egyformán elérhetőek. „A technikai fejlődés és az MI használatának standarddá válása még szélesebbre nyithatja a társadalmi ollót. Azok a csoportok, akik nem férnek hozzá a technológiához, kiszolgáltatottabbá válhatnak és még jobban leszakadhatnak. Akik viszont értik és birtokolják ezeket a rendszereket, azok élvezhetik az előnyeit, még nagyobb hatalomra tehetnek szert. Ez már egy nehezebben dramaturgizálható téma, csakúgy, mint a munkahelyek sorsa.”


A ‘20-as évektől a Black Mirror-ig

Az MI fejlődése az elmúlt évtizedekben gyorsult fel, a téma azonban már sokkal régebb óta foglalkoztatja a filmkészítőket: a szélesvászonra már a húszas években betörtek a robotok. „1927-ben mutatták be a Metropolis című fekete-fehér, német némafilmet, mely 2026-ban játszódik: ez az első olyan film, amiben robot – egész pontosan egy robotnő szerepel.

metropolis.jpg

(via)

Klasszikussá vált ez a film is, csakúgy, mint a 2001: Űrodüsszeia rideg, beszélő mesterséges intelligenciája – az 1968-ban bemutatott mű kora MI vízióit tükrözi. Az 1977-es A komputer gyermeke (Demon Seed) története meglehetősen bizarr: egy Proteus IV nevű robot testet épít magának, domináns és erőszakos személyiségként uralkodik alkotója felesége felett, akit meg is termékenyít.

demonseed.jpg

(via)

A nyolcvanas években egy családi vígjáték, a Rövidzárlat (1986) különbséget tesz jó és rossz robotok között: a meghibásodás miatt öntudatra ébredő 5-ös robot szeretnivaló és jó szándékú. A vele egy szériában készült prototípusok viszont igazi gyilkoló automaták, akik mérlegelés nélkül teljesítik a parancsokat. A Rövidzárlat arra is rámutat, hogy az MI nem csak a sci-fi műfajban jelenik meg, hanem a vígjátékokban, családi filmekben, drámákban és animációs filmekben is. Az utóbbi kategóriába tartozik a Wall-E (2008) is, mely a robotok érzelmei és egymás közötti kapcsolata mellett jól reprezentálja azt is, hogy hova juthat az ellustulásban a társadalom, ha mindent a robotok végeznek az emberek helyett.

5osrobot.jpg

(via)

A filmek abban is változatosak, hogy fizikailag hogyan ábrázolják a mesterséges intelligenciát. „Ebben a kérdésben is három alapkategória van. Az első csoportot a test nélküli MI-k alkotják: például Samantha A nőben, akinek csak a hangját halljuk. A második csoportba az ember számára valamiért szimpatikus MI-k tartoznak. Közülük többen a szexuális vonzerejükkel tesznek jó benyomást: ilyen az Ex Machina Ava-ja, vagy az újabb Battlestar Galactica feldolgozások robotnői – vonzóak, ám életveszélyesek. Mások amiatt tetszenek az embereknek, mert aranyosak: ilyen az előbb említett Wall-E, vagy a 2001-es A.I. Mesterséges Értelem című film kisfiúja, aki igazi álomgyerek. A harmadik kategóriába tartozó MI-k viszont félelmetesek, gyakran gépszerűek, vizuálisan is egyértelmű, hogy veszélyt jelentenek az emberre: a Terminátor robotjait nézve efelől nincs kétségünk.”

exmachina.jpg

(via)

Az utóbbi években nem csak a filmipar alkotott nagyot MI témában, hanem a televíziós és a streaming szolgáltatók is. A Black Mirror (Netflix) például 2011 óta látja el elgondolkodtató és gyakran hátborzongató történetekkel a nézőket: Dr. Héder Mihály azt az epizódot emeli ki, amelyben egy özvegy nővel egy chatrobot beszélget az egykori férj nevében. A Westworld (HBO, 2016) szintén figyelemre méltó alkotás – bár a szakértő szerint kissé leegyszerűsített megközelítés az, hogy a robotok ugyanúgy gyűlölködnek benne, mint az emberek.

Az MI atyjai

A mesterséges intelligenciáról szóló filmek a tudósábrázolásuk miatt is érdekesek: Dr. Héder Mihály szerint ebben egyrészt a régi sztereotípiák jellemzőek, miszerint a tudósok férfiak, szemüvegesek, fehér köpenyesek és gyakran őrültek is. Ugyanakkor az újabb filmekben megjelentek az Elon Muskra emlékeztető gazdag tech vállalkozók is.

A megszokás hatalma

Fontos kérdés, hogy ezek a széles skálán mozgó reprezentációk hogyan alakítják a mesterséges intelligencia megítélését – ezzel például egy 2011-es és egy 2016-os kutatás is foglalkozott. Eredményeiket a technikafilozófus is megerősíti. „Az, hogy a képernyőn rendszeresen találkozhatunk ezekkel a rendszerekkel, megszokottabbá teheti a létezésüket, ezen keresztül pedig nőhet az elfogadottságuk.  A pusztító robotok ijesztők ugyan és félelmeket generálhatnak, de ezek a hatások inkább rövid távon működnek. Az MI rendszerek gyorsan terjednek, rengetegen használják ezeket már most is, annak ellenére, hogy sok rémisztő film készült már eddig is a témában. A technikatörténet azt mutatja, hogy ha egy-egy fejlesztés segítséget és kényelmet jelent, akkor az emberek használni fogják, nem beszélve arról, hogy az MI birtoklása divat és státuszszimbólum is lehet.”

Még több MI dilemma

Ha érdekelnek a mesterséges intelligencia műszaki, filozófiai-etikai, reprezentációs kérdései, gyere el Magyarország eddigi legnagyobb technikafilozófiai konferenciájára, ahol számos más izgalmas témával is találkozhatsz! Önvezető autókról, autonóm fegyverekről, agyi implantátumokról, gépi tanulásról éppúgy szó lesz majd, mint az atomenergiáról, a Big Data-ról és a közösségi média algoritmusairól.

A bejegyzés szerzője Nádasi Eszter, a BME KomMédia képzés oktatója. konzerv.png

Adatvédelem: Amikor a kávéfőződ többet tud rólad, mint a párod

Amikor mesterséges intelligenciáról beszélünk, sokan a gyilkos robotokra asszociálunk, akik át akarják venni az uralmat az emberiség fölött. De mi van, ha azt mondom, hogy okos kávégépek, okos hangszórók,  vagy okos fogkefék? Ártatlannak tűnő eszközök, amelyek akár kémkedhetnek is utánunk, a saját otthonunkban. 

Elfogadjuk! De mégis mit? 

Nemrég jött ki a telefonomhoz a legújabb frissítés, és már majdnem automatikusan elfogadtam hozzá az adatvédelmi feltételeket, amikor belém hasított a gondolat, hogy ezeket a szerződéseket vajon elolvassa-e egyáltalán valaki? Tudjuk egyáltalán, hogy mire mondunk igent? Alig ismertem magamra, hiszen arra tanítottak, hogy mielőtt bármit elfogadok/aláírok, azt alaposan olvassam át. A legtöbb esetben ez nálam a protokoll, kivéve ilyenkor. Lehet, hogy most sokan magatokra ismertetek, éppen ezért tanulságként olyan eseteket mutatunk be, amelyekben a felhasználóknak bizony jobb lett volna előbb olvasni.

Jössz velem játszani ?

Kezdjük egy ijesztő esettel, amikor egy cég csúnyán visszaélt a vásárlók személyes adataival. Le kell szögeznünk, hogy ezt csak úgy tudták megtenni, hogy a fogyasztók nem néztek utána annak, hogy milyen szerződést fogadtak el - így elméletileg a cég nem követett el vétséget, amikor egy harmadik félnek kiszivárogtatta az adataikat. Finn Lützow-Holm Myrstad egy TED Talk előadásban beszélt egy bizonyos Cayla nevű játékbabáról, aki akárcsak egy beépült titkos ügynök, kémkedett a gazdái otthonában. Myrstad közelről ismeri a történet, hiszen egy fogyasztói jogokért harcoló szervezetnél dolgozik (Norvég Fogyasztóvédelmi Tanács), ahol különböző, aggályos eseteket vizsgálnak, és ha kell, megteszik a szükséges jogi intézkedéseket. Így történt ez Cayla esetében is.

my-friend-cayla-doll.jpg

(via)

A játékbaba használata rendkívül egyszerű, csak le kell tölteni hozzá egy ártatlannak tűnő applikációt, így válik elérhetővé a babához tartozó összes funkció. Cayla az interneten és a hangfelismerő technológián keresztül könnyedén tud releváns válaszokat adni a gyerekek által feltett kérdésekre. Igen ám, de amikor a vásárlók letöltötték az alkalmazást és elfogadták a hozzátartozó felhasználási feltételeket, egyúttal hozzájárultak ahhoz is, hogy a baba által megszerzett adatokat a gyártó kiszolgáltathatja egy ismeretlen harmadik félnek. Egy marketinges cégnek aranyat érhetnek ilyen bizalmas és őszinte adatok a fogyasztókról az eladás növelése érdekében. 

A problémát az is fokozta, hogy Cayla-ra bárki gond nélkül rá tud kapcsolódni 18 méterről egy okostelefonnal bluetooth-on keresztül. Amikor Myrstad csapata ezt jelezte a babát gyártó cég felé, azt a választ kapták, hogy erre csak egy magasan képzett IT szakember lehet képes. Cáfolásképpen a TED előadás közben csatlakoztak rá a játékra, és a baba hangszóróin keresztül beszéltek. Mondani sem kell, hogy  mennyire veszélyes lehet, amikor egy kisgyerek egyedül játszik és egy idegen ember a játék nyelvén szól hozzá, beszélgetni kezd vele, a bizalmába férkőzik, majd elhívja magával játszani. Kezdetben ez a baba több országban is az év játékának lett megszavazva, de azóta többek között Németországban betiltották és már nem lehet megrendelni az Amazon-ról sem. Jelenleg Cayla egy berlini kém múzeumban pihen, kiállítási darabként. 

A szerelem ára

Hazákban is nagyon népszerűek a randi app-ok, hiszen mennyivel egyszerűbb valakit csak egy suhintással jobbra húzni a Tinderen, mint például egy szórakozóhelyen megszólítani a kiszemeltet egy meghívással vagy menőnek hitt táncmozdulatokkal. Ugyan már! Ez fáradtságos és az ital is drága, a randi oldalakkal viszont otthonról lehet ismerkedni, ráadásul ingyen. Ha nem is pénzért vesszük ezeket a lehetőségeket, de valamivel azért fizetünk értük,  ha nem vigyázunk - például rengeteg személyes adattal.

image.jpg

(via)

Finn Lützow-Holm Myrstad és csapata alaposan elolvasta az egyik legnépszerűbb randi app adatkezelési nyilatkozatát - ha mindenki ezt tenné, akkor valószínűleg nem lenne a vezető randialkalmazások között, mert sokan inkább nem regisztrálnának. A fő menünél például egy már előre kipipált nyilatkozat van arról, hogy az app a felhasználó összes Facebook képéhez hozzáférhet. Ez még csak a jéghegy csúcsa, hiszen a szerződés szövege lényegében azt mondja ki, hogy a regisztrálók teljes randi dokumentációját (beleértve az adatokat, beszélgetéseket, fotókat) szabadon használhatja a cég. Ez azt jelenti, hogy bármilyen platformon megjelenítheti azokat, sőt, el is adhatja az összegyűjtött információt, hiszen korlátlan jogokat gyakorol felettük.  

Kémkedő fogkefék

Az NPR és az Edison Research kutatása szerint minden 6. amerikainak van már okoshangszórója, mely tulajdonképpen egy otthoni asszisztens, aki csatlakozik a netre, így például hangutasításra zenét tud lejátszani, beszámol az időjárásról, de beszélgetni is lehet vele - derül ki Kashmir Hill és Surya Mattu TED előadásából. A tech óriások mind fejlesztettek saját okoshangszórókat, hogy az asszisztenseik már ne csak az okostelefonokon keresztül legyenek elérhetőek. A Siri beköltözött a HomePod-ba, a Google-Assistant a Google Home-ba és Alexa pedig az Echo nevű okoshangfalba. Magyarországon ez az őrület  még csak gyerekcipőben jár, de könnyen lehet, hogy hamarosan reggelente mi is Alexához szólunk majd elsőként, hiszen az okos otthon fogalma itthon is egyre népszerűbb, és valljuk be, eléggé jól hangzik. De fontos megnéznünk az érme mindkét oldalát. Jópofa és kényelmes tud lenni, ha csak az ágyból kikiabálunk Alexának, hogy főzze meg a kávénkat, de ha mindez a személyes adatainkba kerül, akkor már nem is tűnik annyira vonzónak, hogy egy mesterséges intelligencia csináljon helyettünk reggelit.

51p7mapzz3l_ac_sl1000.jpg

(via)

Kashmir Hill és Surya Mattu kíváncsi volt arra, hogy ezek az eszközök milyen adatokat tárolnak és küldenek tovább a felhasználókról. Ezért egy két hónapos kísérlet során Kashmir lakásában, amit csak lehetett kicseréltek okosra - ilyen volt az ágy, a fogkefe, a hangfal, az izzók, az óra, a vécé és még sorolhatnánk, hiszen összesen 18 készüléket telepítettek. Egy speciális router segítségével nyomon követték az összes eszköz hálózati tevékenységét. Kiderült, hogy ezek mindent rögzítettek, ami a házban történt: tudták Kashmirról az alvási szokásait, hogy naponta hányszor és mennyi ideig mos fogat, mikor van otthon, de tisztában voltak azzal is, hogy hány percig nézi a tv-t. Az Echo volt a legsunyibb, mivel minden 3. percben kapcsolatba lépett a szerverekkel, függetlenül attól, hogy használták-e vagy sem. Ezért felmerül a kérdés, kinek éri meg jobban az okoseszköz? Nekünk, vagy a gyártónak, aki rengeteg személyes adathoz fér hozzá, amiket később eladhat reklámügynökségeknek vagy kutatócégeknek? Valószínűleg vannak, akiket nem zavar, hogy a cégek nem tisztelik a magánéletünket, de sokan nem szeretnének a tudtunk nélkül piackutatásokban részt venni.

1_5.jpg

(via)

A falnak is füle van: segít ezen a szabályozás?

Többek között az adatvédelmi fenyegetések ellen lépett hatályba 2018. május 25-én a GDPR (General Data Protection Regulation) törvény, amivel az EU egységesíteni szeretné az Unión belüli személyes adatok tárolására és felhasználására vonatkozó szabályokat. A szabályozás minden olyan EU-s vállalkozóra vonatkozik, aki valamilyen formában személyes adatokkal dolgozik, sőt azoknak is figyelniük kell a GDPR betartására, akik EU-s állampolgároknak biztosítanak szolgáltatásokat vagy termékeket, még akkor is, ha a cég nem az Európai Unión belül működik. Személyes adatnak tekinthető minden olyan információ a felhasználóról, amely alapján bárhogyan is, de beazonosítható a személy, például:

  • név
  • lakcím
  • telefonszám
  • e-mail cím
  • IP cím és cookie adatok - bár ezek alapján nem egyértelműen azonosítható be egy természetes személy, de mégis bekerültek a személyes adatok csoportjába.

A GDPR megosztó, sokan túlzásnak tartják, ugyanakkor egy technológiailag fejlett világban élünk, ahol ezek a virtuális veszélyek kezdenek elhatalmasodni, így nem ártanak az óvintézkedések. 

Végül, gondoljunk bele abba, hogy egyre több ember takarja le a laptopján a kamerát, mivel elterjedt hiedelem, hogy valakik, valahonnan rácsatlakozhatnak a számítógépeinkre és figyelhetnek minket. A kérdés az, hogy ha ennyire szeretnénk megóvni az adatainkat és személyazonosságunkat, akkor miért nem olvassuk el az adatvédelmi szerződéseket? Pedig, ha vakon elfogadjuk ezeket, az talán nagyobb veszéllyel járhat, mintha nem fedjük le a webkameránkat.

A bejegyzés szerzője Sőregi Kitti, a BME KomMédia képzés alapszakos hallgatója. 

Kapcsolódó:

konzerv.png

Deepfake: A dezinformációs háború atomfegyvere

Olyan időket élünk, melyben az Egyesült Államok elnöke laza csuklóval bélyegzi meg a "fake news" híres szópárosával a legkülönfélébb médiumokat. Persze lehet azon vitatkozni, hogy mi számít ma hiteles, illetve hiteltelen hírforrásnak, de az egészen biztos, hogy a történelem folyamán korábban nem tapasztalt formában zúdul az álhír az emberekre. Még az egészséges gyanakvás képessége mellett sem könnyű megkülönböztetni a valóságot teljesen, részben, vagy egyáltalán nem fedő híreket egymástól. Aki jelen van a közösségi médiában, vagy napi szinten olvas híreket, az tudja, hogy egy dezinformációs háború kellős közepén vagyunk, aminek az elsődleges színtere az internet. Ezt az állapotot millió plusz egy dologgal lehet magyarázni, de minden kétséget kizáróan az egyre profibb audiovizuális hamisítási technikák is szerepet játszanak a mostanában tapasztalt epikus "fake news" dömpingben. Az egyik ilyen eljárás az úgynevezett deepfake nevű technológia, aminek a tájékoztatásra gyakorolt hatását egyelőre még megjósolni is nehéz. 

deepfake1.jpg(via)

A deepfake nevű eljárás etimológiai értelemben a deep learning (mély tanulás) és a fake (ál-, hamis) szavakból ered. A név alapján valószínűleg egy összetett eljárásra gondolhatnak először a laikusok, de a technológia megértéséhez közel sincs szükség felsőfokú számítástechnikai képzettséghez. A deepfake szoftverek ugyanis nem csinálnak mást, mint mesterséges intelligencia (AI) segítségével audiovizuálisan meghamisítanak videókat. Az ilyen típusú programok eleve létező videókban szereplő emberek arcát és hangját lecserélik olyan személyekére, akiknek semmi közük sincs az originál képsorokhoz. A mesterséges intelligencia az interneten fellelhető kép és videó fájlok rengetegéből képes megtanulni – általában híres – emberek mimikáját, hangját, gesztikulációját és finommozgásait, amit aztán rekonstruál és beilleszt egy másik videóban lévő szereplő arcára. A meghamisított karakterbe pedig bárki belebújhat, és azt mondhat, vagy tehet, amit csak akar.

Képességeit elnézve a deepfake a technológia akár egy rendszeresített eljárása is lehetne az orwelli világban, csakhogy az audiovizuális képsorok meghamisítására kifejlesztett módszer nem egy disztópikus fiktív regény eleme, hanem nagyon is "kézzel tapintható" valóság. Sajnos nincsenek arra vonatkozóan pontos információk, hogy a mióta létezik a deepfake, mivel a technológia evolúciója rendkívül gyors állapotváltozások sorozata, ezért nehéz megmondani, hogy a jelenleg ismert stádiuma konkrétan mikor született meg. Ezzel együtt viszont nyugodtan kijelenthető, hogy 2-3 éve biztosan egzisztál a deepfake, és a legkülönbözőbb formái ismertek. Az ingyenesen hozzáférhető programoktól kezdve egészen a fizetős alkalmazásokig, rengeteg deepfake szoftver közül válogathatnak a civil felhasználók. Egyszóval ma már széles körben elérhető ez az eljárás, de az első jól regisztrálható felbukkanása egészen konkrétan 2017 második felében, a Reddit nevű közösségi weboldalon történt, ahol a felhasználók a szexuális fantáziáik megélésére használták a technológiát.

A deepfake felhasználási területei 

A deepfake körülbelül 3 évvel ezelőtt azzal robbant be a köztudatba, hogy a Redditen és az internet ’pöcegödreként’ számon tartott 4chan nevű képtábla weboldalon számolatlan olyan felnőtt filmes videó jelent meg, melyekben a női főszereplők testére hírességek arcát rakta a mesterséges intelligencia. Egyszóval ál-celebpornó gyártására fogták be először deepfake technológiát, ami azonnal meghozta az eljárás számára a széleskörű hírnevet.

Az első ilyen videók nagyon kezdetlegesek voltak és pár internetes szubkultúrát leszámítva nem igazán kaptak széleskörű figyelmet. Aztán technológia – a képességeit tekintve – rohamos fejlődésnek indult, és nagyon rövid időn belül teljesen élethű kamu A-listás celeb-pornóvideók kezdtek cirkulálni a világhálón. gal_gadot.jpg

Balra Gal Gadot hollywoodi színésznő, jobb oldalon pedig Gal Gadot arca deepfake segítségével egy pornószínésznő testére montírozva (via)

A kamu celeb-pornó népszerűsége meredeken ívelt felfele, a visszás műfajjal aztán a tartalommegosztó honlapok is komolyan foglalkozni kezdtek. Először a Redditnél kapcsoltak, hogy a hamisítás ezen formája komoly etikai és jogi kérdéseket vet fel. A híres közösségi oldalon először törölni kezdték az ilyen típusú tartalmakat, majd végül teljes körűen kitiltották azokat a felületről. Ezt a példát szinte minden felnőttfilmes videómegosztó portál is követte, és ma már ott tartunk, hogy kizárólag az internet legsötétebb bugyraiban találunk kamu celebpornót, ott viszont szép számmal. 

Fontos megjegyezni, hogy jelenleg úgy áll a helyzet, hogy bárkiről készülhet kamupornó. Ehhez mindösszesen kellő mennyiségű fényképre illetve videóra van szükség a célszemélyről. Ilyen értelemben a deepfake a bosszúpornó műfaját egy teljesen új dimenzióba helyezheti, ami durva visszaéléseket nyithat ajtót. Elég egy vérig sértett exbarát/barátnő, aki elégtételt akar venni vélt, vagy valós sérelmei miatt és kész a baj. 

Az emberi szexuális fantáziákat kiszolgáló felhasználáson túl, a deepfake-et a közhangulat és a politikai folyamatok befolyásolására is fel lehet használni. Vagyis csak lehetne, ugyanis egyelőre nem tudni olyan jelentős esetről, ahol a széleskörű közvélemény formálása miatt, illetve valamilyen politikai, vagy gazdasági haszonszerzés céljából született volna deepfake videó. Persze, ami késik, az nem múlik. A technológiai guruk szerint már nem kell sokat várni, hogy komoly társadalmi botrányt okozzon egy deepfake technológiával meghamisított felvétel. Konzervatív előrejelzések szerint a következő évek sorsfordító országgyűlési, vagy elnökválasztások kampányhajráinak valamelyike alatt bevethetnek manipulatív célból deepfake videókat. Például a 2020 novemberében esedékes amerikai elnökválasztást megelőzően sokak szerint számítani kell olyan videókra, melyek kommunikációs krízist, vagy belpolitikai válságot okozhatnak az Államokban. deepfake2.jpg

(via)

Így védekezz: A deepfake videók felismerése 

Több technológiával foglalkozó internetes portál is feldolgozta már, hogy miként lehet felismerni a deepfake videókat. E szaklapok általában többlépcsős védekezést ajánlanak az olvasóiknak. Ezek értelmében az első védekezési szint technikai jellegű, ami a deepfake korántsem tökéletes képességeire épít. Ezek a szoftverek – pláne az ingyenesen hozzáférhető gagyi cuccok – ugyanis gyakran olyan készterméket állítanak elő, amely hemzseg a szemet szúró hibáktól, így könnyen felismerhető a hamisítás ténye. Az arc illesztése, a hang és a szájmozgás lehetetlen együttállásai, a gazdatest és az "álarc" színárnyalatának és tónusbeli különbségei is olyan figyelmeztető faktorok, melyek egyértelmű jelei lehetnek a deepfake-nek. Több lap is hangsúlyozza, hogy a kevés pislogás egy karakteres árulkodó jel lehet - még a profi szoftverek esetén is. A deepfake algoritmusai ugyanis gyakran megfeledkeznek erről feltétel nélküli emberi reflexről és képesek pislogás nélküli emberarcokat legyártani.

A deepfake felismerés második foka már összetettebb, az ugyanis tartalomfogyasztásbeli szokásváltoztatást követel az emberektől. Aki nem akarja, hogy a deepfake videók megvezessék, annak a jövőben ki kell alakítania magában az egészséges kételkedés képességét, valamint nem árt, ha a realitásérzéke is kellőképp földhözragadt. Mindenkinek a mostaninál alaposabban kell ismernie a közszereplők és a politikai véleményformálók vérmérsékletét, állásfoglalását, illetve attitűdjeit, hogy az audiovizuális hamisítás lehetőségére kezdjenek gyanakodni, ha egy felvételen túl nagyot állít egy társadalmilag meghatározó személy. Például ha egy élethű videóban Nancy Pelosi demokrata alsóházi képviselő hosszan értekezik a Donald Trump amerikai elnök által kilátásba helyezett határfal fontosságáról és pozitív hatásairól, akkor az minimum kételyt kell, hogy ébresszen mindenkiben.

Ha az előző két szint csődöt mond, és egyik segítségével sem lehet hitelt érdemlően bizonyítani a deepfake tényét egy gyanús videóról, akkor ellenőrzőszoftverek segítségével is lehet ellenőrizni egy videó valódiságát. Több szoftverfejlesztő cég is azon dolgozik a nagyvilágban, hogy olyan számítógépes programokat hozzanak létre, melyek közel 100 százalékos biztonsággal megmondják egy videóról, hogy deepfake által hamisított-e. Ezek a programok – deepfakehez hasonlóan – mesterséges intelligenciát használnak a felismerés folyamata alatt. A videó hangszintjétől kezdve, az arc színtónusain át egészen a mimikáig sok mindent megvizsgálnak ezek a programok.

deepfake2.jpeg

(via)

A mesterséges intelligencia, azaz mély tanulása azonban egy végeláthatatlan csiki-csuki harc folyik a deepfake szoftverek és az ilyen típusú videókat felismerő programok között, ugyanis mindkettő a másik hibáiból tanul. A deepfake szoftverfejlesztők egyszerűen megvizsgálják, hogy az felismerő programok milyen hibák kiszűrésével detektálja a hamis tartalmat, majd ezekre a hibákra ráeresztik a mesterséges intelligenciát, hogy korrigálni tudja azokat. Ilyen értelemben pedig az újabb típusú deepfake szoftver a régi hibákat kiküszöbölve már olyan minőségben készít videót, amiről nem tudja megmondani egy régi felismerő program teljes bizonyossággal a hamisítás tényét. Az ördögi kör így bezárul és mindkét oldal folyamatos önfejlesztő paradigmába kerül.

Valós fenyegetés-e a deepfake? 

Kinyílt Pandóra szelencéje, már semminek sem hihetünk! – valószínűleg valami nagyon hasonló járhat az örök pesszimisták fejében, amikor a deepfake társadalomra gyakorolt hatását próbálják megfejteni. Természetesen ezek az aggodalmak teljesen jogosak, de ha a múlt hasonló típusú technológiai fejlesztéseit vesszük figyelembe, akkor nem jelenthet reális fenyegetést a deepfake. Példának okáért a Photoshop segítségével se sikerült soha senkinek háborúkat kirobbantania, vagy választásokat megnyernie. Legalábbis közvetlenül biztosan nem. Nagy valószínűséggel ugyan lesznek visszaélések a technológiával, de a szakértők szerint egyáltalán nem kell világégésre számítani. A nagy közösségi médiumok, és a széleskörű közvélemény befolyásolására alkalmas internetes felületek ugyanis komolyan foglalkoznak a deepfake jelenséggel, és hatalmas erőforrásokat mozgósítottak az utóbbi időben arra, hogy kiszűrjék és letiltsák az ilyen tartalmakat, hogy megakadályozzák a terjedésüket.

Szépen lassan pedig jogi keretek közé is szorítják a deepfake videókat - legalábbis erre utalnak a jelek. Természetesen elsőként az Egyesült Államok kongresszusa, kibervédelmi és nemzetbiztonsági szervezeti vették föl a kesztyűt az ilyen tartalmak ellen. Ugyan még nem látni pontosan azt a jogi struktúrát, amivel egészséges mederben lehet tartani a deepfake jelenséget, de szerencsére már a törvényhozók elkezdték kongatni a vészharangot, hogy a technológiával kapcsolatos visszaélésekre lehet számítani, amivel egészen egyszerűen kezdenie kell valamit a döntéshozóknak.

kep.png

Etikus reklámozás: a mesterséges intelligencia dilemmái a marketingben

Egyelőre nem egy disztópikus, robotok által irányított világban élünk, viszont egy olyan jövő felé haladunk, melyben az emberek egyre fejlettebb technológiákat alkotnak. Ez alól a marketing sem kivétel: a mesterséges intelligencia ezt a tudományterületet is egyre inkább meghódítja. A cél a vásárló felé történő kommunikáció egyénivé tétele, a kérdés pedig az, hogy mégis meddig mehet el ebben egy reklám. 

Az etika a mesterséges intelligenciával ellentétben nemcsak nullákból és egyesekből áll. A mesterséges intelligencia kutatása területén viszont nem ismeretlenek az etikai dilemmák. Nézzünk egy példát! A júniusban megrendezett Cannes Lions kreatív fesztiválon Tenzin Priyadarshi, az MIT-n (Massachusetts Institue of Technology) a The Dalai Lama Center for Ethics and Transformative Values alapítója és vezetője, egyben a Sanofi gyógyszervállalat beszerzési munkatársa, egy olyan érdekes dilemmát vázolt fel a mesterséges intelligencia kutatásban, mely a kulturális különbségekre világít rá. A kitalált forgatókönyv szerint egy autós balesetet szenved, de előtte eldöntheti, hogy jobbra, vagy balra rántja el a kormányt. Tőle jobbra egy olyan motoros halad, aki a törvénynek megfelelően bukósisakot visel, balra pedig hasonlóképpen egy motoros, csak bukósisak nélkül. A kérdés, hogy autósként merre kormányoznánk.

4_3.jpg

Tenzin Priyadarshi kutatásai szerint az amerikaiak többsége inkább jobb oldali irányba rántaná a kormányt, hiszen a bukósisakot viselő motorosnak nagyobb az esélye a túlélésre. Ezzel szemben az ázsiai kliensek a bal oldali motoros kárára döntöttek, ugyanis ő nem tartotta be a közlekedési szabályokat. Ezek szerint az önműködő autókat másképpen kellene programozni a világ különböző részein?

De mit is adhat a mesterséges intelligencia kutatása a marketingnek? Rengeteg reklámot fogyasztunk nap mint nap, így a marketing célja a személyre szóló tartalom létrehozása, és a vásárlási élmény egyénivé tétele lett, azért, hogy a vásárló úgy érezze, az adott reklám valóban neki és csak neki szól. Az MI abban segít, hogy az üzenet a legmegfelelőbb pillanatban, a legjobb felületen és nyelvezettel érje el a potenciális vásárlót. Gondoljunk csak arra, amikor egy internetes vásárlásnál a honlap megmutatja, miket vettek még azok, akik a kinézett terméket megvették. Egy másik példa a dinamikus árazás: ha egy cég akciósan kínál egy terméket, akkor valóban több vásárlója lesz, de kevesebb bevételt szerez, mintha mindannyian az eredeti áron vásároltak volna. Na már most, ha a vállalat a mesterséges intelligencia segítségével csak azoknak ajánlaná akciósan a terméket, akik különben nem feltétlenül vásárolnák meg, a biztos vevőknek pedig eredeti áron kínálná, akkor végeredményben többet kaszálna. Kezdjük érezni a problémát, ugye?

Képzeljük el, hogy egy luxusautókat forgalmazó vállalat marketingesei vagyunk. Etikusnak tartjuk-e a munkánkat, ha böngészési előzmények, érdeklődési körök, életkörülmények alapján választjuk ki, hogy kiknek szeretnénk a legújabb modellt reklámozni? Ezzel még rendben is lehetnénk, de menjünk tovább! Etikusnak tartjuk-e akkor a munkánkat, ha olyanok számára szeretnénk megjelentetni a legújabb modell hirdetését, akiknek szenvedélyük a vezetés, hajlamosak felelőtlenül költekezni és elbüszkélkedni szerzeményeikkel, de annyira nem állnak jól anyagilag? Ennél az etikai fejtörőnél talán már rezeg a léc.

1_2.jpg

Nézzünk azonban egy veszélyesebb példát: alkohol. Az alkoholról azt mondják, iszunk, ha boldogok vagyunk, és akkor is, ha éppen szomorúak. Reklámozhatunk-e alkoholt annak, akinek születésnapja lesz, évfordulója? Esetleg gimnáziumi ballagása? Vagy azoknak, akiről a mesterséges intelligencia segítségével nagy valószínűséggel megállapíthatjuk, hogy depresszióra hajlamosak? Ezek már nem fekete-fehér kérdések, és ötvennél sokkal több árnyalatuk van.

2_2.jpg

3_2.jpg

A mesterséges intelligencia alkalmazása a marketingben felveti továbbá a vásárlói viselkedés irányításának problémáját is. Ha megjósolható a jövő, akkor alakítható is? El tudjuk érni marketingesként, hogy mire vágyjanak az emberek: mit fogyasszanak, mibe öltözködjenek, hogy nézzenek ki? Persze ez nem egy újkeletű kérdés a reklámok területén, de az MI térhódításával sokkal hangsúlyosabbá válhat.

A két kulcsszó: átláthatóság és beleegyezés. A vásárlóknak tisztában kell lenniük az őket megszólító technológiák működési elveivel, és biztosítani kell számukra az opciót, hogy részesei szeretnének-e lenni az újfajta marketingkommunikációnak. Persze a reklámozók már biztos tudják, milyen döntést hoznánk a kérdésben, hiszen talán már jobban is ismernek minket, mint mi saját magunkat.

 Képek: innen, innen, innen.

Tetszett a bejegyzés, és nem akarsz lemaradni a következőről? Akkor kövesd a Konzervtelefon Blogot, és a BME Kommunikáció és Médiatudomány Facebook oldalt!

Emberi kommunikáció lehet-e valaha a gépekkel folytatott csevegés?

Interperszonális kommunikáció során partnereinket érző és gondolkodó lényeknek tartjuk, és feltételezzük, hogy a másik egy adott szándékkal lépett velünk kapcsolatba. Ennek fényében felmerül, hogy hogyan tekintsünk virtuális asszisztenseinkre, és a velük folytatott „társalgásokra”? Ha érzőnek nem is, gondolkodónak tarthatjuk-e őket? Képes lehet egy szoftver a diskurzus rejtett szabályait alkalmazni? A chatbotok világában most ezekre a kérdésekre keressük a választ.

A különböző tudományok - mint a nyelvészet, a filozófia, a szociálpszichológia vagy a pszicholingvisztika - mind máshogy közelítik meg a társalgás kérdéskörét. Utóbbi a technológiai rendszerek megismerése által von le következtetéseket az interakcióra vonatkozóan, vagyis azt vizsgálja, hogy a gépekkel folytatott kommunikációban hogyan valósulnak meg az emberi kommunikációra jellemző elvek.

ke_p1.png

A kutatási téma igencsak releváns, hiszen a virtuális személyi asszisztensek már jó ideje jelen vannak a mobil piacon: a Siri (Apple), az SVoice (Samsung) és a Cortana (Microsoft) hasonló elvek mentén, egyre valóság közelibb formában állnak az emberek rendelkezésére. A Cortanaval például már csevegő tónusban is beszélgethet a felhasználó, így a társalgás olyan, mintha csak egy másik személyhez szólna.

A 'chatterbot', vagy rövidebb és elterjedtebb nevén chatbot tehát egy olyan program, amely a mesterséges intelligencia segítségével kommunikál az emberekkel, előre lefektetett metódusok és parancssorok alapján. Az első chatbotnak az 1966-ban kifejlesztett ELIZA-t tartják, a kifejezést megalkotása pedig Michael Mauldin nevéhez fűződik. Mauldin másik nagy újítása az, hogy 1994-ben létrehozta első Verbo-t (Verbally Enchanted Software Robots), akit Julia-nak nevezett el. Ez volt az első olyan szoftver, ami nem szöveges, hanem hangüzenetben kommunikált.

ke_p2.png

A gépekkel folytatott akusztikus társalgást az Amazon magas szintre fejlesztette az Echo készülék forgalomba hozásával, mely az Alexa nevű beszélő szoftverrel ellátva 2014 novemberében debütált a piacon. A cég eddig körülbelül 3 millió példányt adott el belőle.  

Az Echo egy Bluetooth hangszóró és egy virtuális asszisztens keresztezéséből jött létre, és többféle funkció betöltésére alkalmas: például folyamatosan figyel, azonnal válaszol a felhasználó által feltett kérdésekre, és elvégez egyszerűbb műveleteket, mint például a zene lejátszás vagy az ébresztő beállítása. Működési mechanizmusa a következő: a kérdéseket, kéréseket az „Alexa” felkiáltással nyitjuk, majd kiadjuk az utasítást. A szoftver WiFi hálózatra csatlakozás segítségével találja meg a szükséges információt, illetve folyamatosan tanul: kérdéseinket amellett, hogy rögzíti, a felhőben tárolja - ez pedig a rendszer fejlesztésében segíti az Amazon munkatársait. 

Az ember-gép dialógus azonban nem mindig zökkenőmentes:

Ember: Mikor indul vonat Miskolcra?

Gép: Ma utazik?

Ember: Kedden.

Gép: Ma utazik?

A példa Pléh Csaba "A társalgás pszichológiája" című művében olvasható. Az idézett szöveg rámutat arra, hogy a gépben értetlenséget generálhat az, ha az általa feltett eldöntendő kérdésre a felhasználó a várttól eltérő választ ad. És hogy miért válaszol így a gépnek a felhasználó, ahelyett, hogy igennel, vagy nemmel felelne? Azért, mert a párbeszédeket irányító összetett társas rendszerben az emberek egymást sajátos ismeretekkel, szándékokkal és egymásra vonatkozó gondolattulajdonításokkal teli lényeknek látják. A gépeknek ehhez kell felnőni. 

ke_p3.png

De egyelőre még kérdés, hogy az intelligens személyi asszisztensek egyre fejlődő kompetenciáiknak köszönhetően mikor tölthetnek be teljes értékű szerepet egy társalgásban, illetve, hogy egyáltalán megvalósulhat-e ez az állapot. Vajon túllépnek-e valaha azon, hogy utasításokat hajtanak végre és kérdéseket válaszolnak meg? Képesek leszünk valaha valós társalgási szituációt előidézni velük?

Az biztos, hogy az okos eszközök óriási fejlődést produkáltak a beszédfelismerés és a mesterséges intelligencia terén, ezen a téren sokan  a Siri-t tartják mérföldkőnek: a rendszer az esetek többségében frappáns válasszal szolgál kérdéseinkre. Virtuális asszisztensként állandóan szolgálatkész, és felhasználó kedvében akar járni.

ke_p4.png

Nem kedveli az obszcén szavakat, köszönt és elköszön, ha már nincs rá szükségünk. Mindig megvárja, míg befejezzük mondandónkat, nem vág közbe. Azonban ez a fajta társalgás nem kívánja meg például az ember-ember közti diskurzusban elvárható udvariasságot – mi például minden lelkiismeretfurdalás nélkül bezárhatjuk a programot elköszönés nélkül.

Mark Sagar, az új-zélandi University of Auckland professzora úgy gondolja, egy emberi arccal felruházott chatbottal gazdagabb kommunikáció folytatható, mint szöveges üzenetekkel működő rendszerekkel. Ezért megalkották a Nadia nevezetű avatárt, akinek Cate Blanchett kölcsönözte a hangját, az IBM pedig szoftvert szolgáltatott hozzá.

Nadia a fogyatékossággal élők számára nyújt segítséget a közigazgatási ügyintézésben. A Soul Machines startup által kifejlesztett avatárok arra is programozhatóak, hogy reagáljanak a személy arckifejezéseire a saját szimulált mimikájukkal – vagyis az empátia illúzióját hozzák létre.

ke_p5.png

Mára elmondható, hogy a chatbotok olyan világába léptünk, ahol a fejlesztők azon dolgoznak, hogy az avatárok a lehető legemberibb módon kommunikáljanak velünk. De az, hogy „a lehető legemberibb” eléri-e valaha az „emberi” szintet, az a jövő zenéje. 

képek: innen, innen, innen, innen, innen, és innen

süti beállítások módosítása