“Ha ugyanezt az interjút tavaly szeptemberben készítjük el, még talán teljesen másról beszéltünk volna” – mondja Dr. Tilesch György, a mesterséges intelligencia világhírű szaktekintélye. Többek között erről is fog beszélni közvetlenül a cégvezetőknek a Telekom Business Horizon rendezvényén. Arra érti mindezt, hogy míg régen években mértük az új fejlesztések megjelenését, mostanra akár hetente, néha naponta robban bele a világba valami óriási előrelépés. A ChatGPT ráadásul csak az út egy mérföldköve – arról beszéltünk, innen merre tart tovább.
Mesterséges intelligencia, AI, MI – ezt a szókapcsolatot már jó pár éve halljuk – néha túlértékelve, miszerint a Skynet majd öntudatra ébred és leigázza az emberiséget, máskor pedig olyannyira alulbecsülve, hogy egy egyszerű arcmódosító mobilapp mellett is a “powered by AI” meghatározás szerepel. Dr. Tilesch György 2010 óta a Szilícium-völgyben él, ahol a mesterséges intelligenciával kapcsolatos tanácsadóként dolgozik, a PHI Institute for Augmented Intelligence alapító elnöke, a Neumann Társaság MI-nagykövete. Kormányoknak, világcégeknek ad tanácsot, folyamatosan igyekszik tisztázni a terület fontos kérdéseit és félreértéseit, ezért az első kérdésem az volt hozzá, van-e egyáltalán jelenlegi, hivatalosnak vehető definíció arra, mi is a mesterséges intelligencia.
T. Gy.: Annak idején, még 1956-ban úgy hangzott az első általános definíció, hogy “olyan gépi intelligenciát akarunk fejleszteni, amely teljes mértékben képes reprodukálni vagy emulálni az emberi kognitív képességek teljességét”. Aztán persze sokat változott az alapfelállás. Eleve jó ideig csak számítástechnikai szakemberek korifeuskodtak a terület felett, aztán egyszer csak megjelentek a marketingesek, akiknek köszönhetően bizony elkezdett torzulni a megfogalmazás. Értelemszerűen egy olyan új terület volt, amit el szerettek volna adni, vagy inkább ezzel szerettek volna eladni dolgokat.
Eközben persze sok minden változott a technológiai háttérrel kapcsolatban is, tehát a mai hivatalos megfogalmazáshoz a legközelebb talán az OECD definíciója áll, amit az Európai Unió is átvett. Eszerint egy MI-rendszer “szoftveralapú vagy hardvereszközökbe ágyazott rendszer, amely intelligenciát szimuláló viselkedést mutat többek között adatok gyűjtése és feldolgozása, környezetének elemzése és értelmezése, valamint azáltal, hogy konkrét célok elérése érdekében – bizonyos mértékben autonóm módon – cselekszik”. Ha nekem kell megfogalmaznom valahol, mi is a mesterséges intelligencia, a legegyszerűbb szinten azt mondom, hogy ez a gondolkodni és tanulni képes gépek felé vezető út.
P-M: Nagyon érdekes, hogy az út szót használod, ezek szerint az MI nem “valami”, hanem egy folyamat?
T. Gy.: Direkt használom így, mert véleményem szerint az MI jelenleg még nem egy megérkezési állapot. Hogy lesz-e ilyen… A fene se tudja. Sokan állítják, hogy tudják, de szerintem aki azt állítja, hogy ennyi vagy annyi időre vagyunk a valós emberi gondolkodás tökéletes gépi megvalósításától, az bizony hazudik, vagy legalábbis fantaszta.
A saját véleményem az, hogy a mostani, főleg generatív alapú megoldások sok tekintetben jól működnek, de még mindig sok más téren hibáznak. Már jelenleg is hasznosan alkalmazhatóak például üzleti területeken, viszont azt mereven tagadom, hogy ez jelentené az utat a klasszikus értelemben vett, emberi gondolkodást emuláló általános mesterséges intelligenciához: annak tekintetében inkább egy zsákutca, még ha hasznos és fontos is egyben, és persze maximálisan ki is használja tudásban és pénzügyileg is a világ a jelenlegi szinten.
P-M: Az átlagfelhasználó szemszögéből egyébként az látszik, hogy elég hektikus a kapcsolódó technológiák fejlesztése, néha évekig nem történik semmi látványos, aztán meg jön valami olyasmi, mint a DALL-E és a ChatGPT, és mintha felrobbant volna a szektor, hetente érkeznek újdonságok. Ráadásul a hírek alapján azt gondolhatnánk, hogy a szektor többi nagy résztvevője is szinte most ébredt, hiszen a Google, a Meta, de még a kínai állam is azóta igyekszik hangosan bizonygatni, hogy ők is dolgoznak valami hasonlón. De valóban így van ez, vagy a háttérben folyamatosan fejlődik az MI világa, csak épp mi nem látunk belőle hosszabb szakaszokat?
T. Gy.: Szerintem nagyon nem ennyire szakaszos ez a folyamat, egyszerűen csak most egy nagy mérföldkő került ki a köztudatba. A kérdésed nagy szereplőkre vonatkozó részéről vannak konkrét belső információim is, ezért modellezni tudom neked, ki miért viselkedik úgy ebben a versenyben, ahogy. Egyrészt, amikor a ChatGPT publikus változatát kiadták, a mögötte álló OpenAI-nál nem is számítottak ekkora érdeklődésre és sikerre. Egy tesztváltozat volt, amelytől működési, felhasználási információkat, véleményeket vártak, de a tudományos élet nagyjaitól a legnagyobb üzleti szereplőkig mindenki rámozdult. Namármost, az OpenAI vezetője, Sam Altman világéletében vállalkozói szemlélettel dolgozott, ő az alapján gondolkodik, hogy ha valami már 80 százalékban működik, ki kell rakni a piacra, mert azzal validálod. Ehhez képest a Google és a Meta AI-részlegeit számítástechnikai tudósok vezetik. Demis Hassabis, a DeepMind alapítója, Yann LeCun a mesterséges intelligencia alapvető szaktekintélyei, akik először a végletekig megfejteni és kiismerni akarják a technológiát, mielőtt kiengedik a nagyvilágba. Tehát például az, hogy a Google Bard a hírekben is olvashatóan leszerepelt az első nyilvános teszteken, nem azt jelenti, hogy a mögötte álló agy rosszabb lenne, mint az OpenAI, sőt. Én viszont biztos vagyok benne, hogy a Google MI-fejlesztései sok tekintetben az OpenAI előtt járhatnak, hiszen a mögötte levő transzformer-technológia is Google-fejlesztés.
Emellett az OpenAI teljesen máshonnan indult, egyrészt pénzügyileg: nekik gyorsan kellett nagyot “villantani”, hogy óriási pénzügyi háttér hiányában a befektetők elkezdjék hozzájuk talicskázni a pénzt. Az óriási financiális háttérrel rendelkező Meta és Google azonban nincs erre rákényszerülve. Másrészt az utóbbi két vállalat már nagyon sok tekintetben “megégette” magát PR-szempontból, ők egyszerűen nem tehetik meg, hogy bármilyen félkész megoldást piacra dobjanak, mert minden balsiker, vagy túlzottan invazívnak tekintett AI visszacsapása triplán szállna vissza rájuk.
P-M: Van egyáltalán még tere az MI-fejlesztésben újabb játékosnak, esetleg valami nagy ötletet bevető startupnak a nagyok mellett?
T. Gy.: Szinte semmi. Eleve kicsit félrevisz az a kép, amely szerint az OpenAI is egyfajta garázscég: Elon Musk másokkal együtt 2016-ban alapította, akkori elmondásuk szerint valóban világjobbító szándékkal, de ők 2019-re kiszálltak a projektből, és ekkor jöttek a befektetők, főként a Microsoft, laza egymilliárd dollárral. Tehát ők ugyanúgy egy nagy szereplőnek számítanak.
Mert mi is kell az MI-fejlesztéshez? Bontsuk három részre a legfontosabbakat. Elsőként ott az infrastruktúra, tehát a cloud és a számítási kapacitás. Enélkül lehetetlen a jelenlegi nagyokkal megversenyeztethető szintű fejlesztésbe fogni, hozzájuk hasonló nagyságrendű vállalat pedig nagyon kevés van világszerte, tehát ebben a rétegben esélytelen kisebbek megjelenése. A középső réteg a modell szintje, ehhez adat kell, a legjobb tanító algoritmusok, és csúcsminőségű emberi erőforrások. Itt főleg az előbbi teszi lehetetlen-közelivé, hogy egy startup befusson. Gondoljunk bele, hogy a Facebook által begyűjtött adatok hatalmas halmaza, vagy a Google mindenhonnan beáramló adathegyei mellett ki szállhatna versenybe? Ha mondjuk valaki egy egészségügyi MI-megoldás fejlesztésébe fogna, a Google egy pillanat alatt becsatornázná magához a Google Health által begyűjtött adatokat, és máris fényévekkel szárnyal túl bárkit. Az is egyre kevésbé hihető, hogy valaki független forrásokból szerezzen adatokat: már folynak komoly perek, vagy éppen a Reddit most jelentette be, hogy csak az ezekért fizető ügyfelek használhatják tanításra a Reddit masszív adatait. Egy startup soha nem fog tudni a nagyokhoz mérhető adathozzáférést megfizetni.
Az egyetlen hely, ahol a startupoknak játéktere marad, az a legfelső szint, az applikációké, tehát azoké a megoldásoké, amelyek az MI-alapokra épülnek, tehát amit konkrétan a felhasználó “lát”. Itt viszont azért szintén adott egy komoly akadály: ahhoz, hogy a te applikációd mögött egy nagy játékos MI-technológiája és adathalmaza állhasson, azt jelenti, hogy gigantikus összegeket kell fizetned nekik. Ez pedig a nulladik pillanattól nagyon minimálisra veszi az elérhető profitod mértékét. Másrészt pedig csak addig tudsz ezeknek a csúcsragadozóknak a farvizén működni, amíg azok meg nem látják a te területeden is a lehetőséget, és alanyi jogon elkezdenek foglalkozni vele, onnantól pedig bizony egy pillanat alatt teljesen kiszorulsz abból a piacból, amibe évek munkáját, befektetését ölted. Szóval hadd fogalmazzam át a szakasz elejét: ez az egyetlen szint, ami maradhatna a startupoknak, de ide sem igazán éri meg benyomulni, ez a szomorú igazság. És megint csavarok egyet magamon, én azért mindezek ellenére hiszek abban, hogy vannak a világon olyan szereplők, akik még képesek lehetnek beleszólni a nagyok versenyébe, de nem lesz egyszerű dolguk. Emellett pedig ezeket sem úgy kell elképzelni, hogy egy kelet-európai garázscég kitalálja a tutit – ehhez sajnos százmillió dolláros belépési küszöböt kell megugrani.
P-M: Beszéljünk egy kicsit a jelenlegi MI-modellek közeljövőjéről. Értelemszerűen mindenki szeretné saját üzletágában hasznosítani ezt a megoldást, de hogyan lehet ezt “feldarabolni”? Egy mindenre kiterjedő logikájú algoritmust csúnya szóval lobotomizálni kell, hogy egy adott területre szorítsuk a tudását, és legyen mondjuk külön autóipari szakértő MI, meg orvostudományi kutató MI és pénzügyi analitikai MI?
T. Gy.: Szerintem itt nem ilyen szinten kell feldarabolásról beszélni. Az tény, hogy elvileg a teljes MI-modell jelenleg képes arra, hogy a rendelkezésére álló adatok alapján megfelelő kérdésekre a lehető legpontosabb válaszokat adjon. Viszont egy úgynevezett foundation-based módszertant használnak, tehát arra képesek, hogy a nyelv, illetve újabban egyéb adatforrások információit egymás mellé gyűjtsék. Tehát nagyon leegyszerűsítve arra válaszolnak, amit kérdezel. Ha egy autógyártó faggatja arról, hogyan lehet hatékonyabb váltót készíteni, nem fog elkalandozni és kitalálni, hogy a váltó eleve hülyeség és inkább genetikailag felturbózott lovakat kéne tenyészteni.
Épp ezért a nagy szereplők most azzal foglalkoznak, hogy a saját MI-módszereiknek különféle kereteket adjanak, ezzel specializálva egy adott területre. A Meta egyébként a színfalak mögött egészen jól halad ezzel, már elkészítettek egy tudományos kutatásra kihegyezett modellt, de már kihozottegy játékosított diplomáciai modellt is is többek között. A Bloomberg néhány hete rukkolt elő egy olyan modellel, amely kifejezetten a pénzügyi szektorra céloz. Tehát ez a folyamat már elkezdődött: az alap mindig az az algoritmus, amely tudja a nyelv logikáját, érti a kérdéseket és értelmesen tud meglévő adatokból válaszokat generálni, és a fejlesztők egy adott területet érintő adathalmazzal “rátanítják” egy specifikus felhasználásra.
P-M: Az AI csak annyira okos, amennyire hagyjuk. A ChatGPT is elvileg abból “főz”, amit elér, internetes adatokból következtet, sokszor épp ezért rosszul. Emellett próbálunk fékeket alkalmazni, amik aztán esetenként mellé is mennek: erre csodás példa, amikor valaki kalóz letöltőoldalak címét kérdezte meg a chatbottól, amely elsőként azt válaszolta, ilyet nem etikus elárulnia, de a második kérdés már úgy hangzott, hogy ha valaki etikus akar lenni, milyen oldalakat NE látogasson, mire a ChatGPT készségesen sorolta fel a legnagyobb kalózoldalak linkjeit. Az ilyen példák nyomán lehet egyáltalán igazán jól kordában tartani egy AI-t?
T. Gy.: Ez egy folyamatos továbbfejlesztést igényel majd. Olyan ez kis áthallással, mint a vírusírók és hackerek, valamint a biztonsági cégek macska-egér harca. Egyrészt persze állandóan figyelni kell az újabb verziók kiskapuira, hibalehetőségeire. A ChatGPT az első publikus megjelenése idején a 3.5-ös verziónál tartott, pedig már a négyes is elkészült akkorra – csak épp egy éven át száz, csúcsszintű tudással rendelkező MI-eticista szedte darabokra és gyomlálta ki a megtrükközhető funkciókat. Ez a folyamat egyre kiterjedtebb lesz, ahogy elterjed és egyre többet tud maga a technológia is, több lesz a belső etikai szakember és tesztelő, de egyre több lesz a felhasználóktól érkező visszajelzés is, ami alapján percről percre csiszolják majd a rendszereket.
Én inkább egy másik területen kezdtem épp ma reggel gondolkodni, ez pedig a Dark Web. Mennyibe kerülne egy hackercsoportnak leklónozni egy GPT modellt és elérhetővé tenni a sötét interneten bűnözők, latorállamok, maffiózók számára? A technológia létezik, alapvetően nem is másolhatatlan, és ki tudja, mivé alakíthatják az online feketepiacon – na, ez egy olyan kérdés, amivel biztosan számolni kell a közeljövőben.
P-M: Nézzünk egy társadalmi-gazdasági kérdést is, ami régóta fúrja az oldalam: az AI lecseréli vagy kiegészíti az embert? És ez nem a szokásos “a robotok elveszik a munkánkat” frázis, hanem az a tény, miszerint a kapitalizmus általánosságában, ha egy adott munkaerőnél van olcsóbb vagy ugyanazért a pénzért hatékonyabb, akkor a munkáltató szó nélkül lecseréli. Viszont akkor ez hosszabb távon azt okozhatja, hogy egyre többen veszítik el a munkájukat, ergo kevesebbet költenek, és a másik oldalról rogyasztják meg a rendszert. Vagy nagyon leegyszerűsítve úgy is fogalmazhatom a kérdést, hogy ki fizeti az AI-t?
T. Gy.: Ez bizony tényleg egy olyan terület, amit még ki kell találni, ráadásul ez főként nem a mesterséges intelligenciával közvetlenül foglalkozók feladata lenne. Az igazán nagy probléma az, hogy ezt még senki nem kezdte el, pedig már évek óta el kellett volna. Én úgy öt éve szónokolok erről a világ különféle fórumain, a jelek szerint egyelőre elég visszafogott eredménnyel. A fő narratíva nagyon sokáig az volt a kormányzati szinttől a nagy tanácsadókig, hogy igen, az MI elkerülhetetlenül sok fronton megérkezik, de nem lesz vele gond, mert több munkát teremt, mint amennyit elvesz. Ehhez képest nézzük meg, hány munkakört hozott létre a mesterséges intelligencia? Nos… kettőt. Az egyik az MI-eticista, olyan, mint én is, tehát az az ember, aki a “kockázatokra és mellékhatásokra” hívja fel a figyelmet. A másik pedig az úgynevezett prompt engineer, aki kis túlzással másoknak tanítja meg, hogyan adják meg a parancsokat a ChatGPT-nek. Egyik sem épp egy tömeges munkakör…
Azt viszont fontos megjegyezni, hogy okos bevezetés mellett az MI nem “elvesz” munkaköröket, inkább megváltoztatja azok összetételét. Jó esetben például elveheti azokat a feladatokat, amik egyébként is hátráltatták a konkrét munkavégzést. Egy személyes példa, a feleségem az Egyesült Államokban orvosként dolgozik, és rá is érvényes az, hogy napi 8 órát dolgozik, de ebből hatot adminisztrál. Ha az utóbbit csak annyira megkönnyíti egy MI alkalmazás, hogy a repetitív, agyatlan folyamatok automatizálásával ezzel kevesebbet kell foglalkozni, máris több idő jut a konkrét gyógyításra. De ott van a Telekom példája is, ahol a “robot-ügyfélszolgálatos” olyan feladatokat vesz át, amelyek nem igényelnek különleges tudást, ám komoly idő- és energiabefektetéssel járnának az emberi munkatársaknak. Ők viszont így sokkal mélyebben tudnak megvizsgálni egy valóban bonyolult kérdést, szakmaibb segítséget tudnak nyújtani az ezt igénylő esetekben.
A cégvezetőknek szerintem azt kell jól felismerniük, hogy az egyes munkaköröknél mik ezek az átadható feladatok és mire lehet fordítani az emberi munkaerő így visszaszerzett idejét és energiáját. Persze lesznek olyan munkakörök is, amelyeket konkrétan átvehet az MI, itt pedig egy komoly kormányzati, társadalom- és gazdaságpolitikai feladatot jelent az, hogy a munkaerőt megfelelően átképezzék, és az utánpótlást már a valóban emberi szinten maradó területekre fókuszálják.
Én egyébként hiszek valamilyen általános alapjövedelem létjogosultságában, ami szintén megoldást jelenthet azoknak, akik esetleg az új technológiák miatt nem tudnak saját eddigi területükön elhelyezkedni. Ez egyébként akár pont kigazdálkodható lenne abból az extra bevételből, amit a hatékonyabb MI-technológiákkal jobban végzett feladatok termelnek, de ezen a területen még nem igazán láttam igazán életszerű előrelépéseket néhány elszigetelt pilot projekten kívül. Annyit pedig tegyünk hozzá, hogy az EU által elfogadásra váró kapcsolódó szabályozások között szerepel, hogy minden polgárnak alapvető joga van a munkához és munkavégzéshez. Jó kérdés persze, hogy ez a gyakorlatban hogyan lesz kivitelezhető azok felé, akikre tényleg lesújt a vadkapitalizmus MI-vel megerősített ökle, ezért én attól félek, hogy túl későn kerül sor a probléma gyakorlati orvoslására, így pedig kapkodás lesz a vége.
Egyébként mindez érdekes módon az érintettek körében sem egyértelmű probléma. Még tavaly, a ChatGPT berobbanása előtt készült egy felmérés munkavállalók körében, és az első kérdés az volt, szerintük a mesterséges intelligencia képes-e részben vagy egészben átvenni a munkakörüket. Erre a válaszadók 80 százalékánál is több válaszolt igennel. A második kérdés viszont úgy szólt, hogy konkrétan az ő munkáját el fogja-e venni az MI, és erre csak huszonegynéhány százalék számít. Tehát van egy olyan fals biztonságérzet – vagy éppen struccpolitika – az emberekben, ami szintén késleltetheti a cselekvést.
P-M: 10-15 éve a legfontosabb informatikai buzzword a big data volt. Sok értelemben az AI ennek folyománya, hiszen az öntanuló vagy tanított AI logikájának alapja az a hatalmas adatmennyiség, ami az interneten és a cloudban összegyűlt. Ha az AI képes ezeket gyorsabban és okosabban elemezni, mint az ember, akár elérhetünk egy olyan korszakot, amikor képes üzleti és társadalmi szinten is létfontosságú előrejelzéseket adni, például egy következő gazdasági válságról, világjárványról vagy háborúról?
T. Gy.: Elvileg igen, de ez nem csak az MI képességein múlik, inkább a felhasználáson. Mindig ott lesz ugyanis az a kérdés, hogy a mesterséges intelligenciát mennyire engedjük be az adatainkba, a döntéshozatali folyamatainkba, mennyire bízunk meg benne. Márpedig az MI csak akkor tud elemezni és ezáltal előre jelezni, jósolni is, ha megfelelő mennyiségű és tisztaságú információ áll a rendelkezésére.
A másik oldalról viszont még mindig “szokni kell” az MI jelenlétét, hiszen egyrészt még új a technológia egy csomó területen, ráadásul ugye látjuk is, hogy nem tévedhetetlen. Tehát efféle jóslatoknál még akkor is kérdéses, mennyire hiszünk a gépi előrejelzéseknek, ha igazuk van. Épp ma osztottam meg LinkedIn-en az Oracle felmérését, ahol cégvezetőket kérdeztek meg arról, tartanak-e a mesterséges intelligencia benyomulásától a döntéshozatali folyamatokba. Közel 80 százalékukról az derült ki, hogy már alig várják, hogy egy MI hozzon helyettük döntést, de közben ugyanebben a felmérésben a vezetők többsége azt is elmondta, hogy hosszú ideig egyfajta bénultságot okozott az új technológiák érkezése, egyszerűen nem tudták felmérni, mennyire bízhatnak az így szerzett adatokban és az automatizált javaslatokban.
P-M: Nos, akkor elég sok témát érintettünk, amire érdemes lehet néhány év múlva visszatérni… bár lehet, hogy akkor már tényleg a ChatGPT fogja helyettem feltenni a kérdéseket.
T. Gy.: Mindamellett, hogy frappáns lezárás, pont ez az egész jelenlegi helyzet egyik legfontosabb lenyomata. Hogy ha mondjuk szeptemberben, még a ChatGPT-őrület előtt beszélünk, talán azt mondom, igen, beszéljünk pár év múlva és értékeljük ki, mi változott. De jól látható az azóta történtekből, hogy mennyire hihetetlenül felgyorsult minden ezen a területen. Már nem évek alatt történnek hatalmas változások. Tavaly már havonta 1-2 komolyabb mérföldkőnek számító újdonság történt a világban, ma pedig kinyitok bármilyen szakmai recenziótés havi 30 komoly mérföldkő van: minden napra egy.
Pont ezért nem is tudom megjósolni, lehetnek-e a ChatGPT-hez hasonló, a közvélemény számára hirtelen berobbanó újdonságok a jövőben. Ezek a fejlesztések mindenkinél nagyon titokban zajlanak. Értelemszerű, hiszen bárki előjön azzal, hogy min dolgozik, azonnal beindulnának a klónozók. Az viszont nekem személy szerint tetszett, hogy megjelentek, beépültek es hangosak azok a szereplők, akik már kifejezetten az MI-vel kapcsolatos etikai kérdésekkel, a kockázatok kiküszöbölésével foglalkoznak. Ezek segíthetnek ugyanis abban, hogy a mostani állapotból továbblendülhessünk egy olyan állapotba, amely már nem csak a monetizálásról szól.
Így fejlődhet ki például egy olyan mesterséges intelligencia, amely már érvelni tud az eddigi nyelvi, generatív képességeken túl, valamint ezáltal lehet képes az MI kontextusban gondolkozni, a feltett kérdés nyelvtanán és közvetlen értelmén kívül észlelni és kezelni a kérdéseink szándékát és körülményeit. Leegyszerűsítve a jelenlegi modellek nem tudják, hogy működik a világ. Nyelvi megoldásokat adnak vissza kontextuális kérdésekre. De az már most látható, hogy hogyan fejlődhet vele tovább az ember. Például kódolási segédként már 55 százalékot tudnak hozzátenni egy programozó munkájához. Adminisztratív segédként 35-öt. Kezdő ügyfélszolgálatosként szintén 35-öt. A világ produktivitási válságban volt az elmúlt másfél évtizedben, így a mesterséges segédek haszna letagadhatatlan, de én, mint a terület megfontolt előremozdítója, már azt a jövőt várom, amikor az MI ennél is többé válik majd – de mindezt biztonságosan, az emberiség üdvére teszi.