A BME Kommunikáció és médiatudomány szak blogja

#Konzervtelefon


A digitális identitás útvesztőjében, avagy hogyan befolyásolja a mesterséges intelligencia a személyes ízlésünket?

2021. május 07. - KomMédia BME

A következőkban azt a kérdést járjuk körül, hogy a mesterséges intelligencia (MI) hogyan hat az ízlésünkre: a poszt középpontjában a külföldi és magyar piac jelenleg legnépszerűbb streaming szolgáltatója, a Netflix áll. Rendkívül érdekes, hogy hogyan tematizálja és alakítja át a streaming a televíziózást, és az, hogy a legnagyobb szolgáltató milyen eszközökhöz nyúl annak érdekében, hogy a nézők egyre jobb eszközökön, egyre inkább a nekik tetsző műsorokat nézhessenek. Ez a jelenség több tudományterületet is érint, ezért szociológiai, gazdasági és technológiai szemüvegen keresztül is vizsgáljuk majd Netflixet és a felhasználókra gyakorolt hatását. Célunk, hogy láthatóvá váljon az emberi döntéshozás „meghekkelése”, médiafogyasztásunk átalakulása, illetve az esztétikai érzetünk befolyásolásának képessége és lehetősége.

A „modern kor hatalma” maga az algoritmus. A biotechnológia és információs technológia összeolvadásából olyan algoritmusok születnek, amelyek szinte jobban megértik az érzéseinket, mint mi saját magunkat. A hatalmunk, vagyis a választásunk szabadsága pedig innentől kezdve már nem feltétlenül a mi kezünkben lesz. A MI-val kéz a kézben járó biometrikus szenzorok és a big data algoritmusok meghekkelhetik érzéseinket, vágyainkat, és pontosan tudni fogják mindazt, amit mi sem tudunk saját magunkról: hogy kik is vagyunk valójában, és hogy mit is akarunk. Egy algoritmus mindezek mellett abban is segíthet, hogy érdeklődési körünk alapján melyik filmet nézzük meg, de a szem és arcizmok mozgását követve képes lehet az emberek érzelmeit is felismerni, pont úgy, ahogy azt Kínában élő emberek tapasztalják a digitális diktatúrában. 

Egy kezdetben DVD árusításával foglalkozó amerikai cég az MI által használt technikákat gyűjtötte össze, és integrálta egy közös rendszerbe. Ez, a már-már tökélyre fejlesztett rendszer az, amit ma Netflix-ként ismerünk – és ami befolyásolja az esztétikai érzékünket, ha úgy tetszik, az ízlésünket.

Mert éhezzük az élményt

Az élmények és azok megélése életünk részei, alapvető igényünk van ezekre a kezdetektől fogva, és lesz a jövőben is. A szórakoztatás iparággá alakult, a nagy cégek pedig rájöttek, hogy óriási és kiaknázatlan lehetőség van abban, ha az élményvágy kielégítése mellett létrehozzák és táplálják is mindazt. Egyebek mellett a Netflix leghatalmasabb potenciálja pont ebben áll. Kapcsolatba lép velünk, kihasználja a kényelem iránti igényünket, majd tűélesen analizált preferenciáink alapján táplálja a vágyainkat: az algoritmusa segít, hogy azt a tartalmat nézzük, úgy, és leginkább akkor, ahogyan azt mi nézőként szeretnénk.

A következő ábra azt mutatja be, hogy az élmények sokkal fontosabbak a fogyasztóknak, mint egy adott termék, vagy szolgáltatás. Ha a termék, vagy szolgáltatás használata nem okoz élményt, akkor ezek legtöbbször feleslegessé válnak a felhsználók számára: 

kep1.png

A fogyasztók már nem csak árukat és szolgáltatásokat keresnek, hanem főként élményeket (via)

Az amerikai cég több területen is alkalmazza a mesterséges intelligenciát. Ilyen a streaming minőség meghatározása, a filmszerkesztési utómunkálatok, a filmgyártás helymeghatározása, a saját gyártású filmek létrehozása, vagy a tartalom ajánlások személyreszabása - itt mind MI által átszőtt megoldásokat találhatunk. Az utóbbi években ez az ajánlási- és személyre szabási rendszer lett a vállalat egyik legnagyobb értékesítési erőssége, ezért a következőkben ezt a megoldást vizsgáljuk. 

Személyre szabás: a Netflix fő versenyelőnye

Felmerült már benned, hogy miért ajánl minden egyes filmnézés előtt különböző filmeket a Netflix? Vagy az, hogy éppen hogyan profilozza a több mint 100 millió előfizetőjét? Az adat kardinális tényező, és a kérdés megválaszolásának kulcsa is az adatainkban keresendő. A Netlixnél ugyanis sosem tagadták, rengeteg információt gyűjtenek rólunk:

Tudjuk, hogy a nap melyik órájában nézed a tartalmat, hogy mennyi ideig nézted, tudjuk, hogy mit néztél előtte, mit néztél utána, hogy a számítógépeden, az okostelefononodon vagy tableten nézted-e, illetve az is, hogy melyik profilból nézted. Nagyon sok információnk van.”– mondta Todd Yellin, a Netflix termékmenedzsment igazgatója.

Minden ilyen megoldás tulajdonképpen egy üzleti problémára vezethető vissza. A „probléma” az, hogy a Netflix hatalmas tartalomkönyvtárral rendelkezik, amely dinamikusan változik, és a felhasználó számára mindez túl bőséges kínálatot jelenthet. A felhasználó nem akar csalódni, előfizetéséért cserébe az érdeklődésének megfelelő tartalmat akarja megtalálni, azaz azt a személyes élményt keresi, amit a lineáris televíziózás során nem feltétlenül kaphat meg. A Netflix ajánlási rendszere pont erre a problémára ad megoldást, és ezt aknázza ki.

A Netflix már évekkel ezelőtt arra törekedett, hogy minden filmet adatokra lehessen bontani, a filmproducereknek pedig fizettek is, hogy minél pontosabban tudják az adott filmet bekategorizálni. Alexis Madrigal technológiai újságíró is alátámasztja azt, hogy a Netflix könyvtárában lévő összes terméket hatalmas címkék sorozatára bontják, amelyek nemcsak helyekre vagy a szereplőkre vonatkoznak, hanem sokkal szélesebb kategóriákra is, mint például "erkölcs" vagy "érzelmi hatás". A fő algoritmusuk tehát nagyon finoman meghatározott, több mint 27 000 (!) mikro-műfaj alapján működik. Ez a megoldás lehetővé teszi a cég számára, hogy nagy pontossággal testre szabhassák a javasolt filmeket vagy sorozatokat, és így nekünk tetsző ajánlásokat kaphassunk. A folyamatos fejlesztésre való igényt bizonyítja, hogy 2016-ig „csak” földrajzi, életkori és nemi adatok szerint szegmentáltak, mára pedig globálisan körülbelül 2000 preferencia- és ízlésközösséget, úgynevezett klasztert generáltak. Attól függően pedig, hogy milyen az ízlésünk, egyfajta virtuális közösséghez tartozunk, amelyben a tartalom is dinamikusan változik interakcióink hatására. A személyre szabhatóság alapja tehát a tartalom címkézése és a virtuális „közösségek” kialakítása.

 kep2_2.jpg Vajon milyen hatással vannak az algoritmusok a választásunk szabadságára? (via)

Valójában a Netflix fő algoritmusa sokkal több, mint egy elektronikus „műszer”, amely korábbi döntések alapján minden előfizető számára külön címeket ajánl. Ez egy felfoghatatlanul komplex rendszer, ami a datascience és a gépi tanulás eszközeivel folyamatosan átalakítja a látszólag kaotikus viselkedésünket ismétlődő és ezért kiszámítható mintákká. A Netflix korántsem csak streaming filmeket és TV-műsorokat szolgáltat, hanem megpróbálja kielégíteni azokat a vágyainkat, amelyekről esetleg mi magunk sem tudunk.

A rendszer négy különféle módszerre épül:

  1. a felhasználók személyes profiljára: tehát korábbi választásainkra, az ötcsillagos visszacsatolási és besorolási rendszerre, ahol értékelni tudjuk a filmeket, a görgetési tevékenységünkre és a megtekintési szokásainkra, azaz az interakcióinkra; 
  2. az együttműködési szűrésre a „ügyfélklaszterek” révén: ez egy ajánlási technika, amely a felhasználói visszajelzéseken alapul
  3. a címkéző rendszerre, amely szorosan összekapcsolódó filmek (pl. ugyanazon rendező által készített vagy ugyanazon műfajú filmek) csoportosítását célozza
  4. a Netflix saját kereskedelmi prioritásaira.

Az algoritmus gyakorlati működése úgy elemezhető, hogy amikor például egy Netflix felhasználó a „Stranger Things” című sorozatot nézi, akkor az interakció során elemzett adatnyomok betáplálódnak a PRS-be (Personalization and Recommendation System röviden: PRS), amely meghatározza a felhasználó valószínű viselkedési és megfigyelési mintáját. Ez azt eredményezi, hogy a felhasználó a következő bejelentkezésekor ajánlásokat kap. Ez a folyamat mindig folytatódik, és a rendszer aszerint módosítja az ajánlásokat, ahogyan a felhasználó viselkedett a platformon. Minden egyes alkalommal, amikor a felhasználó bejelentkezik, ezen minták alapján talál egy újból generált és meghatározott tartalomkatalógust. A PRS rendkívül adaptív, folyamatosan alkalmazkodik az új interakciókhoz, éppen ezért a felhasználó számára mutatott tartalom egyre inkább egy olyan felhasználói profilt állít elő, amely sokkal inkább a PRS saját logikájára támaszkodik, mint a felhasználó valódi és autonóm nyílt interakcióira. Tehát az, amit mérnek, nem a felhasználó spontán és szándékos elkötelezettsége. Ez az algoritmikus determinizmus hozza létre azt, amit Cheney-Lippold algoritmikus identitásnak nevez.

„Ezt az identitást olyan cégek generálják, amelyek feltérképezik, összehasonlítják, majd algoritmikusan értelmezik a felhasználók adatait annak érdekében, hogy megértsék a felhasználók identitását, de nem a tényleges személyiségét, hanem digitális identitás vagy profil formájában.”

 kep3_1.pngA profilunk alapján mutatják be nekünk a filmeket reklámozó képeket (via)

Betekintő: a kép, amely többet mond minden szónál

Hiába egy mesterien kidolgozott ajánlási rendszer, ha végsősoron a felhasználó nem kattint. A Netflix erre is kidolgozott egy megoldást, mégpedig a filmeket bemutató miniatűrök (angolul: „thumbnail”-ek) generálása és személyre szabása révén.

kep4_1.png

 Egy sorozat megannyi thumbnail-je, ízlésünktől függően (via)

Minden egyes filmet vagy sorozatot ugyanis a tartalomkönyvtáron belül úgynevezett indexképekkel reklámoznak. A cél, hogy minden műsorhoz olyan képek társuljanak, amelyek kiemelik az egyes tagok szempontjából releváns vizuális tartalmat, és így biztosan elköteleződést, tehát kattintást vált ki. Minden esetben több száz fajta képet rendelnek a film bemutatására, amelyből az előfizetőknek mindig a legrelevánsabbat használják fel. Mindegyik képpel tehát másfajta személyiség típusokat, különböző ízléscsoportokat próbálnak megszólítani, vagy ahhoz hangolják a képet, hogy milyen más filmeket és sorozatokat néztünk meg korábban. 

Elég egyértelműnek látszik, hogy a Netflix adatainak kombinációja, algoritmikus személyre szabása és kormányzása, illetve hatalmas tartalomkönyvtára mind-mind olyan tényezők, amelyek a felhasználókat még inkább a képernyő elé fogják vonzani. Az igény adott a közönség részéről – és láthatóan a Netflix erre tökéletesen reagál.

Fontos azonban látnunk, hogy bármilyen kifinomult is a Netflix címkézési folyamata, az előzetes preferenciáinkból és interakcióinkból kiszűrt metaadatok és együttműködési szűrők nem képesek teljes mértékben utánozni az egyedi ízlést. Ehelyett tűélesen analizált és megalapozott döntéseket hoznak, amelyek az esetek többségében valóban személyre szabott ajánlást jelent. Ez persze a legtöbb esetben hűen tükrözi valódi igényünket, de mivel matematikai képleten működő rendszerekről beszélünk, a folyamaton belül mindig érdemes a végső emberi döntéshozással, mint elemmel számolni. Valódi és teljes személyre szabottságról akkor beszélhetnénk, ha MI a gondolatunkat is olvasná, és azokat a váratlan emberi döntéshozásból adódó fordulatokat is meg tudná fejteni, ami bennünk megy végbe. Ugyanis a gép sosem fogja tudni, hogy két hét teljes horror „filmmaraton” után mikor vágyunk egy kis romantikára, vagy netalántán vígjátékra. Az algoritmusok – jelenlegi fejlettségi szintükön – sosem lesznek képesek fontos döntéseket hozni helyettünk, mivel a számítógépes algoritmusoknak nincsennek érzelmeik, sem ösztöneik.

További olvasmány: Kevin McDonald & Daniel Smith-Rowsey (2016): The Netflix Effect: Technology and Entertainment in the 21st Century.

A bejegyzés szerzője Gyenes Donát, a BME KomMédia mesterszakos hallgatója. 

konzerv_1.png

Techóriások vállán állva

Az utóbbi években parázs vita van arról az Egyesült Államokban, hogy az olyan nagy techcégek, mint a Microsoft, Google, Apple, Amazon és Facebook túl nagyra nőttek és így túl nagy hatalommal bírnak. A két fő kritika a demokráciára és a versenyre gyakorolt negatív hatásait szokta kiemelni.

A Facebook és a Google által üzemeltetett honlapok és szolgáltatások 2017-ben az internetes forgalom több mint 70%-át tették ki, ez 2014-ben még 50% környékén mozgott. “A Google többé már nem egy internetes cég, hanem a tudás internetes cégje. A Facebook nem egy internetes cég, hanem a közösségi internetes cég” - írta André Staltz programozó az “Így kezdett el a web 2014-ben haldokolni” című blogposztjában. A 2017-ben kirobbant Cambridge Analytica-botrány rámutatott a Facebook hanyag adatkezelésére, aminek következtében 87 millió ember adatát szerezhették meg, és tudták befolyásolni az amerikai elnökválasztást és a Brexit referendumot. Elizabeth Warren demokrata párti korábbi elnökjelölt-aspiráns a 2019-es kampányában ismertette tervét, hogyan darabolná fel az előbb említett tehchóriásokat, amely nagy port kavart, azonban nagyszámú támogatókra is talált. Ez egyértelműen rámutat arra az igényre, hogy ezzel a helyzettel kezdeni kell valamit.

k14.jpg

(via)

Idén júliusban a legnagyobb amerikai techcégek vezetőinek kongresszusi meghallgatáson volt jelenésük. Itt a cégek potenciálisan versenyellenes gyakorlatainak felderítésére létrejött albizottság képviselői kérdezték ki őket. Olyan kérdésekre kellett válaszolniuk, amelyek azt próbálták kideríteni, hogy folytatnak-e versenyellenes tevékenységet és működésük nem lehetetleníti el a riválisokat. David Cicilline Rhode Island-i képviselő és az albizottság demokrata elnöke a meghallgatást azzal zárta, hogy fel kell darabolni ezeket a cégeket. Az Axiosnak kifejtette, hogy Mark Zuckerberg elismerte, hogy a WhatsApp és az Instagram felvásárlása annak a tervnek a része volt, hogy egyrészt megvegyék a versenytársukat, másrészt, hogy fenntartsák a nyereségüket, hatalmukat és a dominanciájukat, ez pedig klasszikus monopolisztikus magatartás.

k15.jpg

(via)

Egy monopolhelyzetben lévő cég feldarabolása egyáltalán nem példa nélküli az amerikai történelemben (lásd Standard Oil vagy az AT&T feltörése), azonban mégis radikális ötletnek tűnik a neoliberális kapitalizmusban. A politikai spektrum mindkét végében élénk vita folyik arról, hogy fel kellene-e darabolni ezeket a cégeket vagy sem, úgy, hogy a cégek monopolhelyzetbe kerülését már szinte mindenki elismeri, ideológiai elkötelezettségtől függetlenül.

Monopol-helyzet és a megfigyelési kapitalizmus

Tim Wu antitröszt szakértő, a Columbia Egyetem jogi professzora nem lát nagy különbséget a nagy techcégek és a Standard Oil között. Szerinte olyan mély változások történtek a tech iparban, amely az USA gazdaságára nagy veszélyt jelentenek. Hozzátette, hogy az innováció hiányát tapasztalhatjuk jelenleg. Erről a szektorról úgy gondolkodtunk, hogy az intenzív verseny fogja hajtani új startupok felbukkanásával, amelyek meg tudják előzni, hogy egy cég túl dominánssá váljon.

Robert Reich azzal érvel Warrennel egyetértő cikkében a The Guardianben, hogy ha feldaraboljuk ezeket a cégeket, több különböző csatornán keresztül lenne képes áramlani az információ ahelyett, hogy egy centralizált platform a legitimitás látszatát és rendkívüli elérhetőséget biztosítana, illetve több startup felvirágozhatna.

k16.png

(via)

Rizwan Virk a Venture Beat oldalán írta le, hogy miért kellene ennek a folyamatnak lezajlania. Virk kifejti, hogy azok, akik a Szilícium-völgyben szorosan együtt dolgoztak ezekkel a cégekkel, nem lepődtek meg azon, hogy de facto monopóliumokká váltak, de monopolhatalmukat felhasználják arra, hogy a versenyt ellehetetlenítsék, és monopóliumellenes törvényeket sértsenek meg. Szerinte az olyan nagy cégek feldarabolása, mint a Facebook vagy a Google nem csak demokratikusabb játékteret eredményezne a kisebb versenytársak számára, de lelassulhatna a “megfigyelési kapitalizmus”.

Hogy mi a megfigyelési kapitalizmus? Shoshana Zuboff fogalma azt a folyamatot jelenti, amikor a felhasználói viselkedésből kiszűrt adatok felhasználásával csinálnak pénzt. Merker Iván Zuboff jelenségét a Mércén úgy vette végig, hogy az a jelenség, ahogy ezek a (jellemzően) techvállalatok pénzt csinálnak a viselkedési többletünkből (behavioral surplus), vagyis abból az adatmennyiségből, amely a cégek rendelkezésére áll, és amelyre nincs szükségük a szolgáltatásaik javításához. Ezeket előrejelző termékekké (prediction products) alakítják, amelyeknek a lényege, hogy pontosan előre tudják jelezni a jövőbeli viselkedésünket, amelyeket a jövőbeli viselkedések piacán (behavioral future markets) árusítanak.

k17.png

(via)

Akik szerint a feldarabolás nem megoldás

Raghuram Rajan a Barron’s oldalán írt arról, hogy a nagy techcégek modern monopóliumok, de mégse daraboljuk fel őket. Szerinte hagyni kell, hogy nagy maradjon a Google és a Facebook, de úgy, hogy az embereknek legyen irányítása a személyes adataik fölött. Leírja, hogy ezeket az adatmonopóliumokat megszabályozni több okból is nehezebb, mint a hagyományosokat, és számos oka van, hogy az adatközpontú vállalatok méretükben gyarapodnak. Először is, a hatalmas mennyiségű adathoz való hozzáférés lehetővé teszi a platformok számára, hogy hatékonyabbá váljanak a termékeik. Másrészt, az olyan online platformokat, mint a Facebook, segítik a hálózati hatások, azaz a platform annál értékesebb lesz, minél többen használják. Ez a két dinamika szerinte is nehézzé teszi ezeknek a platformoknak a kihívását; de lehetővé teszik a platformok számára, hogy jobb terméket kínáljon. Rajan szerint a monopolhelyzetben lévő cégek feldarabolása ronthatják az ügyfélélmény minőségét, így más megoldásra van szükség. Felteszi azt a kérdést, hogy mi lenne, ha a felhasználóé lenne az általuk generált adat. Ha mi birtokoljuk az adatainkat, amelyeket egy semleges adatkezelő eszköz tárol, akkor a Facebook vagy a Google továbbra is hozzáférhetne az adatokhoz - saját egyéni adatvédelmi beállítások alapján -, de nem birtokolnák azokat.

Zachary Campbell a Wired-ben fejtette ki véleményét arról, hogy miért nem megoldás a feldarabolás. Az erre irányuló attitűdöt jogosnak gondolja, és korábban ő maga érvelt a Wired-ben, hogy a techvállalatok nagyon is valós aggályokat tagadnak, azonban akkor sem gondolja jó ötletnek azok szétszakítását. Campbell azt írja, hogy az AT&T 1984-es feldarabolása 8 cégre egy ideig felszabadította a versenyt, csökkentve az árakat és javítva a szolgáltatásokat. Azonban, amikor a vezetékes hálózatok helyére beléptek a vezeték nélküli hálózatok, az ipar újra konszolidálódott, a szabályozók pedig fellazultak.

k18.jpg

(via)

Korábban azt írta, hogy a technológiai helyzet még akkor is kevés adatvédelmet biztosít a fogyasztóknak, hogy adataikat hatalmas vállalati profittá alakítják. Az online szolgáltatások piacán nincs értelmes verseny, és potenciálisan sértheti a demokráciát. Szerinte egy mai kérdéseken alapuló új szabályozási keretre lenne szükség, amibe beleérti a magánélet védelmét; azt, hogy ki birtokolja és profitál az adatokból; illetve a versenyt és az innovációt. Kifejti, hogy olyan kérdéseket kell megvizsgálni, mint hogy milyen szabályok védenék a fogyasztókat, biztosítanák a folyamatos innovációt, és lehetővé tennék a versenyt anélkül, hogy további, nem szándékos problémákat okoznának. Úgy gondolja, hogy a válaszok nem úgy néznek ki, mint amelyeket 100 évvel ezelőtt fejlesztettek ki.

A kapitalizmus teremti meg a problémát

Az ügyet más szemszögből is lehet meg lehet vizsgálni, így tesz Ezra Klein, a Vox főszerkesztője, aki szerint a közösségi média szabályozása sokkal fontosabb, mint a Facebook feldarabolása.

A Facebook társalapítója, Chris Hughes a The New York Times-ban megjelent esszéjében a legnagyobb közösségi média platform feldarabolása mellett érvel. Egy olyan versenyképes piacot vizionál, ahol több hálózat közül válaszhatunk. Ezek között találhatnánk olyat, amely magas adatvédelmi normákat kínál; egy másikat, amelyhez csatlakozni pénzbe kerül, de cserébe kevés hirdetése van; és egy másikat, amely lehetővé teszi a felhasználók számára, hogy testre szabhassák és módosítsák hírcsatornáikat úgy, ahogy jónak látják.

Klein nem olyan optimista, mint Hughes, ugyanis erre az esszére reagálva kifejti, hogy a Facebook-probléma igazából kapitalizmus-probléma. A Facebook-problémát a kapitalizmus teremtette, így az nem is fogja megoldani.

Szerinte a vita kapcsán elhangzó kritikák más megoldások felé mutatnak. Ha a probléma az, hogy a Facebook blokkolja a versenyt a szektorában, akkor a feldarabolása a megoldás. Azonban, ha az a probléma, hogy a Facebookot (és a többi nagy techcéget) formáló versenyösztönzők veszélyes termékekhez vezetnek, akkor a még nagyobb verseny felszabadítása súlyosbíthatja a problémát. Szerinte Hughes beszámolója a Facebook felemelkedéséről alátámasztja azt az elképzelést, hogy a verseny a Facebook nem megfelelő viselkedésének fő mozgatórugója. Klein meglátása szerint Hughes írásának alapvető ellentmondása, hogy amikor megnevezi azokat a döntéseket, amelyek meghozatalára a verseny vezette rá Zuckerbergéket, akkor leírja a platform erkölcsi hanyatlását. Viszont amikor elképzeli azokat az alternatívákat, amelyeket a nagyobb verseny hozhat létre, kedvesebb és szelídebb platformokat képzel el kevesebb hirdetésekkel és több adatvédelemmel. Klein eljátszadozik azzal a gondolattal, hogy a közösségi média terében a nagyobb verseny jobb alternatívákhoz vezetne, de lehet az történne, ami most is: még hevesebb háborúkhoz vezetne a figyelmünkért és az adatainkért.

k19.jpg

(via)

Így jut Klein arra a következtetésre, hogy nem Mark Zuckerberg teremtette a Facebook-problémát, hanem maga a kapitalizmus, és ha nem ő, akkor egy másik ember vezetné, aki még nála is rosszabb lehetne. Szerinte nem az a kérdés, hogy hogyan szabadítsuk fel a versenyt a közösségi médiában, hanem az, hogy hogyan irányítsuk a versenyt a közösségi médiában.

“Mint társadalom, el kell döntenünk, hogy milyen versenyt támogatunk és milyen versenyt nem támogatunk. Lehet, hogy korlátokat szeretnénk azzal kapcsolatban, hogy a gyermekek mennyi időt tölthetnek el ezeken a honlapokon. Lehet, hogy azt akarjuk, hogy minden egyes olyan webhelynek, amelynek 100 milliónál több felhasználója van, azok nyissák meg algoritmusaikat a nyilvános ellenőrzés céljából. Lehet, hogy azt akarjuk, hogy minden egyes olyan webhelynek, amelynek egy milliárdnál több felhasználója van, vállaljon szerkesztői felelősséget a platformon lévő beszédért.

Klein persze nem állítja, hogy lenne egzakt válasza, mint ahogy másnak sincs. Azonban fontos, hogy a megfelelő kérdéssel kezdjünk a témában. Szerinte a közösségi média oldalak közötti verseny kapcsán meg kell győződnünk arról, hogy nem csak a piac érdekeit szolgálja, hanem a társadalomét is.

További kérdőjelek

Elmondható, hogy ez egy komplex téma, amit mindenki más motivációkkal közelít meg. Az óriásra nőtt techcégek monopol helyzetét és az abból származó problémákat azok sem vitatják, akik ellenzik azok feltörését. Az ezzel kapcsolatos igazi kérdések, hogy rövid és hosszú távon milyen hatással lenne az adatvédelemre, az innovációra, és a versenyhelyzetre, ha feldaraboljuk ezeket a techcégeket? Ha felszabadítjuk a versenyt, mi a garancia, hogy nem alakul ki idővel újabb monopolisztikus cég? Hogyan tudnánk irányítani a versenyt a közösségi médiában úgy, hogy a társadalom (és az emberiség) érdekeit szolgálja elsősorban? A politika már reagált erre a témára, ez pedig elővetíti, hogy előbb-utóbb vagy megvalósul egy szabályozás, vagy fel lesznek törve ezek a vállaltok, esetleg mindkettő meg fog történni.

A bejegyzés szerzője Horváth Zsolt, a BME KomMédia mesterszakos hallgatója. 

konzerv_1.png

Deepfake: A dezinformációs háború atomfegyvere

Olyan időket élünk, melyben az Egyesült Államok elnöke laza csuklóval bélyegzi meg a "fake news" híres szópárosával a legkülönfélébb médiumokat. Persze lehet azon vitatkozni, hogy mi számít ma hiteles, illetve hiteltelen hírforrásnak, de az egészen biztos, hogy a történelem folyamán korábban nem tapasztalt formában zúdul az álhír az emberekre. Még az egészséges gyanakvás képessége mellett sem könnyű megkülönböztetni a valóságot teljesen, részben, vagy egyáltalán nem fedő híreket egymástól. Aki jelen van a közösségi médiában, vagy napi szinten olvas híreket, az tudja, hogy egy dezinformációs háború kellős közepén vagyunk, aminek az elsődleges színtere az internet. Ezt az állapotot millió plusz egy dologgal lehet magyarázni, de minden kétséget kizáróan az egyre profibb audiovizuális hamisítási technikák is szerepet játszanak a mostanában tapasztalt epikus "fake news" dömpingben. Az egyik ilyen eljárás az úgynevezett deepfake nevű technológia, aminek a tájékoztatásra gyakorolt hatását egyelőre még megjósolni is nehéz. 

deepfake1.jpg(via)

A deepfake nevű eljárás etimológiai értelemben a deep learning (mély tanulás) és a fake (ál-, hamis) szavakból ered. A név alapján valószínűleg egy összetett eljárásra gondolhatnak először a laikusok, de a technológia megértéséhez közel sincs szükség felsőfokú számítástechnikai képzettséghez. A deepfake szoftverek ugyanis nem csinálnak mást, mint mesterséges intelligencia (AI) segítségével audiovizuálisan meghamisítanak videókat. Az ilyen típusú programok eleve létező videókban szereplő emberek arcát és hangját lecserélik olyan személyekére, akiknek semmi közük sincs az originál képsorokhoz. A mesterséges intelligencia az interneten fellelhető kép és videó fájlok rengetegéből képes megtanulni – általában híres – emberek mimikáját, hangját, gesztikulációját és finommozgásait, amit aztán rekonstruál és beilleszt egy másik videóban lévő szereplő arcára. A meghamisított karakterbe pedig bárki belebújhat, és azt mondhat, vagy tehet, amit csak akar.

Képességeit elnézve a deepfake a technológia akár egy rendszeresített eljárása is lehetne az orwelli világban, csakhogy az audiovizuális képsorok meghamisítására kifejlesztett módszer nem egy disztópikus fiktív regény eleme, hanem nagyon is "kézzel tapintható" valóság. Sajnos nincsenek arra vonatkozóan pontos információk, hogy a mióta létezik a deepfake, mivel a technológia evolúciója rendkívül gyors állapotváltozások sorozata, ezért nehéz megmondani, hogy a jelenleg ismert stádiuma konkrétan mikor született meg. Ezzel együtt viszont nyugodtan kijelenthető, hogy 2-3 éve biztosan egzisztál a deepfake, és a legkülönbözőbb formái ismertek. Az ingyenesen hozzáférhető programoktól kezdve egészen a fizetős alkalmazásokig, rengeteg deepfake szoftver közül válogathatnak a civil felhasználók. Egyszóval ma már széles körben elérhető ez az eljárás, de az első jól regisztrálható felbukkanása egészen konkrétan 2017 második felében, a Reddit nevű közösségi weboldalon történt, ahol a felhasználók a szexuális fantáziáik megélésére használták a technológiát.

A deepfake felhasználási területei 

A deepfake körülbelül 3 évvel ezelőtt azzal robbant be a köztudatba, hogy a Redditen és az internet ’pöcegödreként’ számon tartott 4chan nevű képtábla weboldalon számolatlan olyan felnőtt filmes videó jelent meg, melyekben a női főszereplők testére hírességek arcát rakta a mesterséges intelligencia. Egyszóval ál-celebpornó gyártására fogták be először deepfake technológiát, ami azonnal meghozta az eljárás számára a széleskörű hírnevet.

Az első ilyen videók nagyon kezdetlegesek voltak és pár internetes szubkultúrát leszámítva nem igazán kaptak széleskörű figyelmet. Aztán technológia – a képességeit tekintve – rohamos fejlődésnek indult, és nagyon rövid időn belül teljesen élethű kamu A-listás celeb-pornóvideók kezdtek cirkulálni a világhálón. gal_gadot.jpg

Balra Gal Gadot hollywoodi színésznő, jobb oldalon pedig Gal Gadot arca deepfake segítségével egy pornószínésznő testére montírozva (via)

A kamu celeb-pornó népszerűsége meredeken ívelt felfele, a visszás műfajjal aztán a tartalommegosztó honlapok is komolyan foglalkozni kezdtek. Először a Redditnél kapcsoltak, hogy a hamisítás ezen formája komoly etikai és jogi kérdéseket vet fel. A híres közösségi oldalon először törölni kezdték az ilyen típusú tartalmakat, majd végül teljes körűen kitiltották azokat a felületről. Ezt a példát szinte minden felnőttfilmes videómegosztó portál is követte, és ma már ott tartunk, hogy kizárólag az internet legsötétebb bugyraiban találunk kamu celebpornót, ott viszont szép számmal. 

Fontos megjegyezni, hogy jelenleg úgy áll a helyzet, hogy bárkiről készülhet kamupornó. Ehhez mindösszesen kellő mennyiségű fényképre illetve videóra van szükség a célszemélyről. Ilyen értelemben a deepfake a bosszúpornó műfaját egy teljesen új dimenzióba helyezheti, ami durva visszaéléseket nyithat ajtót. Elég egy vérig sértett exbarát/barátnő, aki elégtételt akar venni vélt, vagy valós sérelmei miatt és kész a baj. 

Az emberi szexuális fantáziákat kiszolgáló felhasználáson túl, a deepfake-et a közhangulat és a politikai folyamatok befolyásolására is fel lehet használni. Vagyis csak lehetne, ugyanis egyelőre nem tudni olyan jelentős esetről, ahol a széleskörű közvélemény formálása miatt, illetve valamilyen politikai, vagy gazdasági haszonszerzés céljából született volna deepfake videó. Persze, ami késik, az nem múlik. A technológiai guruk szerint már nem kell sokat várni, hogy komoly társadalmi botrányt okozzon egy deepfake technológiával meghamisított felvétel. Konzervatív előrejelzések szerint a következő évek sorsfordító országgyűlési, vagy elnökválasztások kampányhajráinak valamelyike alatt bevethetnek manipulatív célból deepfake videókat. Például a 2020 novemberében esedékes amerikai elnökválasztást megelőzően sokak szerint számítani kell olyan videókra, melyek kommunikációs krízist, vagy belpolitikai válságot okozhatnak az Államokban. deepfake2.jpg

(via)

Így védekezz: A deepfake videók felismerése 

Több technológiával foglalkozó internetes portál is feldolgozta már, hogy miként lehet felismerni a deepfake videókat. E szaklapok általában többlépcsős védekezést ajánlanak az olvasóiknak. Ezek értelmében az első védekezési szint technikai jellegű, ami a deepfake korántsem tökéletes képességeire épít. Ezek a szoftverek – pláne az ingyenesen hozzáférhető gagyi cuccok – ugyanis gyakran olyan készterméket állítanak elő, amely hemzseg a szemet szúró hibáktól, így könnyen felismerhető a hamisítás ténye. Az arc illesztése, a hang és a szájmozgás lehetetlen együttállásai, a gazdatest és az "álarc" színárnyalatának és tónusbeli különbségei is olyan figyelmeztető faktorok, melyek egyértelmű jelei lehetnek a deepfake-nek. Több lap is hangsúlyozza, hogy a kevés pislogás egy karakteres árulkodó jel lehet - még a profi szoftverek esetén is. A deepfake algoritmusai ugyanis gyakran megfeledkeznek erről feltétel nélküli emberi reflexről és képesek pislogás nélküli emberarcokat legyártani.

A deepfake felismerés második foka már összetettebb, az ugyanis tartalomfogyasztásbeli szokásváltoztatást követel az emberektől. Aki nem akarja, hogy a deepfake videók megvezessék, annak a jövőben ki kell alakítania magában az egészséges kételkedés képességét, valamint nem árt, ha a realitásérzéke is kellőképp földhözragadt. Mindenkinek a mostaninál alaposabban kell ismernie a közszereplők és a politikai véleményformálók vérmérsékletét, állásfoglalását, illetve attitűdjeit, hogy az audiovizuális hamisítás lehetőségére kezdjenek gyanakodni, ha egy felvételen túl nagyot állít egy társadalmilag meghatározó személy. Például ha egy élethű videóban Nancy Pelosi demokrata alsóházi képviselő hosszan értekezik a Donald Trump amerikai elnök által kilátásba helyezett határfal fontosságáról és pozitív hatásairól, akkor az minimum kételyt kell, hogy ébresszen mindenkiben.

Ha az előző két szint csődöt mond, és egyik segítségével sem lehet hitelt érdemlően bizonyítani a deepfake tényét egy gyanús videóról, akkor ellenőrzőszoftverek segítségével is lehet ellenőrizni egy videó valódiságát. Több szoftverfejlesztő cég is azon dolgozik a nagyvilágban, hogy olyan számítógépes programokat hozzanak létre, melyek közel 100 százalékos biztonsággal megmondják egy videóról, hogy deepfake által hamisított-e. Ezek a programok – deepfakehez hasonlóan – mesterséges intelligenciát használnak a felismerés folyamata alatt. A videó hangszintjétől kezdve, az arc színtónusain át egészen a mimikáig sok mindent megvizsgálnak ezek a programok.

deepfake2.jpeg

(via)

A mesterséges intelligencia, azaz mély tanulása azonban egy végeláthatatlan csiki-csuki harc folyik a deepfake szoftverek és az ilyen típusú videókat felismerő programok között, ugyanis mindkettő a másik hibáiból tanul. A deepfake szoftverfejlesztők egyszerűen megvizsgálják, hogy az felismerő programok milyen hibák kiszűrésével detektálja a hamis tartalmat, majd ezekre a hibákra ráeresztik a mesterséges intelligenciát, hogy korrigálni tudja azokat. Ilyen értelemben pedig az újabb típusú deepfake szoftver a régi hibákat kiküszöbölve már olyan minőségben készít videót, amiről nem tudja megmondani egy régi felismerő program teljes bizonyossággal a hamisítás tényét. Az ördögi kör így bezárul és mindkét oldal folyamatos önfejlesztő paradigmába kerül.

Valós fenyegetés-e a deepfake? 

Kinyílt Pandóra szelencéje, már semminek sem hihetünk! – valószínűleg valami nagyon hasonló járhat az örök pesszimisták fejében, amikor a deepfake társadalomra gyakorolt hatását próbálják megfejteni. Természetesen ezek az aggodalmak teljesen jogosak, de ha a múlt hasonló típusú technológiai fejlesztéseit vesszük figyelembe, akkor nem jelenthet reális fenyegetést a deepfake. Példának okáért a Photoshop segítségével se sikerült soha senkinek háborúkat kirobbantania, vagy választásokat megnyernie. Legalábbis közvetlenül biztosan nem. Nagy valószínűséggel ugyan lesznek visszaélések a technológiával, de a szakértők szerint egyáltalán nem kell világégésre számítani. A nagy közösségi médiumok, és a széleskörű közvélemény befolyásolására alkalmas internetes felületek ugyanis komolyan foglalkoznak a deepfake jelenséggel, és hatalmas erőforrásokat mozgósítottak az utóbbi időben arra, hogy kiszűrjék és letiltsák az ilyen tartalmakat, hogy megakadályozzák a terjedésüket.

Szépen lassan pedig jogi keretek közé is szorítják a deepfake videókat - legalábbis erre utalnak a jelek. Természetesen elsőként az Egyesült Államok kongresszusa, kibervédelmi és nemzetbiztonsági szervezeti vették föl a kesztyűt az ilyen tartalmak ellen. Ugyan még nem látni pontosan azt a jogi struktúrát, amivel egészséges mederben lehet tartani a deepfake jelenséget, de szerencsére már a törvényhozók elkezdték kongatni a vészharangot, hogy a technológiával kapcsolatos visszaélésekre lehet számítani, amivel egészen egyszerűen kezdenie kell valamit a döntéshozóknak.

kep.png

süti beállítások módosítása