A virtuális emberek készen állnak a világ meghódítására

Főoldal/GÉP/A virtuális emberek készen állnak a világ meghódítására

Újabb területen érkeztünk el egy olyan technológiához, amely régebben csak sci-fi filmekben és könyvekben gondolkoztatta el az embereket egy olyan világról, amely egyszerre bámulatos és ijesztő. A cím és a bevezető úgy hangozhat, mint valami olcsó, gyíkemberes-laposföldes konteó, pedig ezúttal erről szó sincs: a „majdnem igazi” metaemberek már közöttünk járnak!

Nem olyan régen, február végén az Unreal grafikai rendszerért felelős fejlesztők bemutattak egy új videót, amelyben különböző korú, nemű, bőrszínű, nemzetiségű nők és férfiak mesélnek arról, hogy ők bizony nem átlagosak, ugyanis mindenféle látszat ellenére ők úgynevezett metaemberek. A videót nézve azonban sokan röpke pillanatokra kényelmetlenül érezhetik magukat és kereshetik ennek az érzésnek az okát. Pedig ez nem valamiféle ismeretlen állapot, már neve is van, mégpedig az „uncanny valley”, amelyet magyarul talán „rejtélyes völgynek” fordíthatnánk.

Ezt a jelenséget a pszichológia úgy határozza meg, miszerint az érzékszerveink becsapásával egy általunk megfigyelt eseményt (például egy személyt) teljesen valóságosnak érzünk – pedig valahol a tudatunk mélyén mégis ott motoszkál, hogy bizony valami nagyon nincs rendben. Kis túlzással többek között emiatt nincs szüksége öt ujjra az animációs filmekben Mickey egérnek (meg persze azért is, mert így lehetett spórolni a rajzolók idejével), és ezért tudjuk az első pillanattól kezdve még a legprofibb, leginkább életszagú lövöldözős játékban is, hogy nem a valóságban vagyunk.

Ja, és ha már a játékoknál tartunk… A bevezetőben említettük az Unreal Engine-t: ha valaki, akár csak egy icipicit is foglalkozott számítógépes játékokkal az elmúlt húsz évben, akkor biztosan találkozott ezzel a névvel, hiszen a világ egyik legismertebb játékmotorjáról beszélünk. Ez ráadásul jó ideje kilépett a gamer világból és ma már építészek, lakberendezők, filmesek, de akár az autóipar is használja az Epic Games cég valós idejű, 3D megjelenítésre alkalmas fejlesztői környezetét.

Ám a metahumán projekt még egy lépéssel tovább visz minket, és ez a bizonyos uncanny valley érzés, amiről az előbbiekben beszéltünk, minden eddiginél zavaróbbá válhat. A hihetetlenül kidolgozott, és végletekig valószerű kinézet miatt ugyanis nem érezzük minden pillanatban ezt a „majdnem, de mégsem” állapotot, az agyunk nem jelez folyamatosan, hogy nem valós személyeket nézünk, különösen, ha nem figyelünk a videóban a szereplők szemére, ami még a legprofibb animációk során is árulkodó jel szokott lenni. Vegyük például a Majmok bolygója előzményfilmeket, ahol egy szemsebész segített meghatározni az animátoroknak, hogy mennyire kell nedvesnek tűnnie a majmok szemének, ahhoz, hogy a létezésük hihető legyen. De ilyen magas szintű emberi animációt, ennyire valósághű arcokat, mimikákat eddig sosem láthattunk – érdemes például megnézni a bőr és a ráncok tökéletességét a szájközeli felvételeken. Amikor pedig elkezdik az idősödő férfit átalakítani fiatal nővé, ott picit elengedte az ékszíjat az agyunk.

Ha pedig bárki azt gondolja, hogy ezen karakterek létrehozásához a paksi atomerőművet vezérelni képes, amerikai mozifilmekre specializálódott számítógéppark szükséges, akkor a kedves olvasó nagyon téved. Egy középkategóriás notebookon két óra alatt megalkothatjuk a saját meta-hasonmásunkat, ha épp ehhez van kedvünk, és mindezt akár olyan szintig is elkormányozhatjuk, hogy a megfelelő mobilapplikációval párosítva még szóra is bírhatjuk az új avatarunkat.

Már egy ideje nem hihetünk a szemünknek

Az NVIDIA fejlesztői csapata pár évvel ezelőtt egy olyan gépi tanuláson alapuló rendszert dolgozott ki, amely lehetővé teszi, hogy az interneten fellelhető (és remélhetőleg a fotón szereplők hozzájárulásával is bíró) képek vizuális feldolgozása alapján virtuális portré fotókat kreál, akik (vagy amik?) a valóságban nem léteznek. Ráadásul mindezt egészen döbbenetes pontossággal és részletességgel teszi, olyannyira, hogy ma már arra is a gépi tanulást és a mesterséges intelligenciát kell használnunk, hogy valahogy megkülönböztessük a valódi arcokról készült fotókat az így generáltaktól – az átlagos emberi szem ugyanis a legtöbbször nem képes erre.

Mivel az NVIDIA hozzáférhetővé tette a technológiát, így természetesen kikövezte az utat a virtuális macskák portréit generáló vicces weboldaltól a valóságban soha le nem gyártott autók és hálószobák fotóin keresztül a nem létező félmeztelen nők fotóit áruló webshopig. Amíg a site működött, nagyjából egy és három dollár közötti összegért bárki vásárolhatott magának vagy egy félmeztelen hölgyről készült fotót vagy egy másik oldalon jobb esetben pár tucat soha nem létezett vásárló profilképét az épp csak elindult céges weboldalra. Az NVIDIA GAN (Generative Adversarial Network) megoldása alapvetően három fő fázisra osztja az arcokat, melyeken belül azért rengeteg apró módosítást is végez, de a “végtermék” a cég állítása szerint minden esetben olyasvalakit fog ábrázolni, aki nem létezik.

Fake Cruise

Ha pedig esetleg még mindig nem szaladt fel a szemöldöke a kedves olvasónak, akkor egy rövid sorozat erejéig hadd borzoljuk tovább a kedélyeket Tom Cruise TikTok-videóival, ahol a színészlegenda golf tudásával és bűvésztrükkökkel varázsolja el a közönséget, tizenmilliós nézettséget produkálva. Az egyetlen probléma a videókkal, hogy egyiken sem szerepel a valódi színész. Szemben az előző két megoldással, ahol a technológia bárki rendelkezésére áll és igazából nem kell komoly technika és tudás hozzá, a DeepTomCruise videókban rengeteg munka van.

A deepfake videókban használt arccserét végző szoftver hiába egyre profibb, még mindig rengeteg vágást, utómunkát, effektezést és egy kiváló színészt kíván egy ennyire profi és megtévesztő videó – mint ahogy a Tom Cruise-t mímelő sorozat esetében is történt. Ennek ellenére, ahogy az eszközeink egyre erősebbek és ahogy ez a technológia fejlődik nem kell sokat várnunk, hogy idővel még a fentinél ennél is tökéletesebb deepfake videókat, vagy még élethűbb avatarokat készíthessünk a saját mobilunkkal. Ez egyrészt nagyszerű, mert rengeteg vicces megoldásra, vagy akár frappáns és hasznos felhasználási módra ad lehetőséget, de közben bizony tényleg ott motoszkál bennünk a kisördög, hogy a technológia készen áll mindenki tökéletes átverésére is. Mostantól tehát még jobban kell figyelnünk a manipulált fotók, álhírek, konteó-elméletek mellett a videókra is, hiszen ezeknél sem lehetünk száz százalékig biztosak abban, hogy az azokon látható események valóban megtörténtek-e, és a bennük szereplő személyek tényleg azok-e, akiknek hisszük őket. Szép új világ? Talán néha túl szép is…

által|2021-03-19T11:13:33+01:002021.03.19|GÉP|

A Pont Most tartalmai a Magyar Telekom támogatásával készültek