Interjú

„200 milliárd szómennyiség fölött tartunk”

Prószéky Gábor nyelvész, programtervező matematikus a mesterséges intelligenciáról, a ChatGPT-ről és a régi szótárakról

Tudomány

Hogyan működnek a nagy számítógépes nyelvi modellek, a GPT-k, és mit jelent az, hogy immár párbeszédbe is lehet egy ilyennel kerülni? Mire jók ezek a modellek, illetve mire nem, és milyen messze vagyunk a valódi mesterséges intelligenciától (MI)? Kell-e félnünk tőle, és hogyan kerülhetjük el a csapdáit? A magyar fejlesztésű modell, a PULI GPTrio kutatócsoportjának vezetőjét faggattuk.

Magyar Narancs: Pár hete egy, a mesterséges intelligencia (MI) oktatásban betöltött szerepéről szóló pódiumbeszélgetésen azt mondta, „lehet, hogy mi vagyunk az utolsó generáció, amelyik a valósat és a virtuálisat még meg tudja különböztetni”. Laikusként ennek hallatán disztópikus filmekre, a Szárnyas fejvadászra, a Mátrixra, A szigetre és hasonlókra asszociálok – mire gondolt pontosabban?

Prószéky Gábor: Kezdjük kicsit messzebbről. Az MI fogalma az ötvenes–hatvanas években, vagy­is akkor született meg, amikor még azt hitték, hogy tényleg lesz mesterséges intelligencia – de most azt mondanám, hogy nincs. Mert az MI mindig csak egy metszetet mutat a világból, legutóbb például, a ChatGPT-vel a nyelvit mutatta meg. És mivel nyelvileg olyan dolgokat produkál, amilyeneket eddig az emberen kívül más nem, a közvélemény felruházza olyan tulajdonságokkal is, amelyek nincsenek benne. Sokan azt feltételezik, hogy „ő” okos, és tudja, hogy milyen a világ. Persze ez nincs így. Egyes robotok összeraknak egy Mercedest a gyárban, mások nyelveket fordítanak, a humanoid robotok pedig lenyűgöznek minket azzal, hogy hasonlítanak ránk. De minden, ember által jelenleg fejlesztett készülékre elmondható, hogy noha az intelligenciának egy szeletében erős utánzási képességgel bírnak, nem komplexek. Az igazi MI az intelligencia totális modellezése lenne. Nem mondom, hogy nem lesz egyszer ilyen, de nagyon távol vagyunk még tőle.

MN: Ha elfogadjuk, hogy 2022. november 30. történelmi pillanat volt, ön hogyan írná le az utókor számára?

PG: A nagy nyelvi modellen (GPT3) ekkor egy olyan betanítást végzett el az OpenAI cég, amelynek eredményeként mi emberek dialógushelyzetbe kerültünk egy masinával. Az alapmodell még bármit tudott mondani, de mint a vízfolyás: nem lehetett megállítani. A ChatGPT-t viszont arra tanították be, hogy kérdésre ne hasonló kérdést mondjon, hanem konkrétan válaszolja meg, és aztán hagyja is abba.

MN: Közönséges halandóként mit érdemes tudnunk az alapmodellről?

PG: Kétféle alapmodellről szokás beszélni: az enkóderről és a dekóderről, amilyen a GPT3 is. Az enkóder lényege, hogy ha kitakarok egy szót a szövegből, megmondja, mi volt ott. A dekóder pedig képes megmondani, hogy egy szövegrész után legnagyobb valószínűséggel mi lesz a következő szó, aztán mi lesz az azt követő, és így rakja ki a teljes szöveget. Ez a valószínűség olyan sok százezernyi, sőt milliónyi korábbi szónak az együtteséből áll elő, hogy végül koherens szöveget kapok. Ennyit tud az alapmodell. Ezután rengeteg ember bevonásával elkezdték tovább „tanítgatni” a szoftvert. Ám ez a munka már messze nem automatikus: a gép az embertől tanul, konkrétan az pofozgatja jobbra, balra, hogy ez jó, ez nem jó… Ennek a munkának köszönhető, hogy a ChatGPT olyan eszköz lett, amellyel lehet beszélgetni.

A rendszer a szöveget annak a mintának a segítségével állítja össze, amelyet indulásként megadok neki: ezzel már beszorítom egy szűkebb világba. Ezt a kezdő szöveget promptnak nevezzük. A nyelvi-logikai lépéseket levezetve a rendszer kiad egy szöveget – de neki fogalma sincs róla, miről van szó. Az emberi agy nem attól tud egy nyelvet, mert sok leírt szöveget olvasott, hanem mert látunk, hallunk, érzünk, milliárd inger ér minket, amelyeket mind beépítünk, és amelyekről így nyelvi úton is számot tudunk adni. A ChatGPT-nek viszont csak nyelvi inputja van, méghozzá betűk formájában, így csak nyelvi választ tud adni, nem pedig világismeretit.

MN: Pedig említette a konferencián, hogy ha kellő mennyiségű adatot táplálunk a rendszerbe, akkor már kulturálisan is „elég okos” tud lenni.

PG: Két dologról van szó, amikor nyelvi adatokat táplálunk egy gépbe. Az egyik az a készség, hogy egyáltalán azon a nyelven képes legyen reagálni, tehát legyen elég mintája a rákövetkezés nyelvi formáira, magyarán a ragozásra, szórendre és a többi. A másik, hogy azok a szövegek, amelyeket megtanítunk a gépnek, valamilyen módon aztán tartalmilag is leképeződnek. Amikor tehát leírunk szituációkat, amelyek egy adott kultúrában megjelennek, például a teljes magyar webet feldolgozzuk, akkor rengeteg olyan elem lesz benne, amelyek a mi világunkban lényegesek, függetlenül attól, hogy mivel értünk egyet és mivel nem. Ha viszont Amerikában felépítenek egy rendszert, amihez hozzáadnak valamennyi magyar szót, akkor az a rendszer lehet, hogy „tud” magyarul, de magyar vonatkozású témákról nem lehet vele beszélgetni, hiszen a háttere nincs meg hozzá. Nyelvileg úgy viselkedik, mintha tudna válaszolni, de sokszor zöldségeket beszél, szép szóval élve: hallucinál. Például, ha megkérdezném tőle, hogy miről beszélgetett Dusza Erika és Prószéky Gábor 2023 júliusában, annyit látna, hogy ezek bizonyára nevek, és kitalálna hozzá dolgokat valami egészen furcsa asszociáció mentén. Míg ha elolvassa a maga által írt interjút, akkor már kezdi sejteni, miről van szó. A ChatGPT nem kárhoztatható azért, mert rosszul tud valamit, mivel valójában nem „tud” semmit sehogy: egyszerűen csak ezek a valószínűségek jöttek ki a megtanult szövegeiből. Ráadásul nem is determinisztikusan: valahányszor újra kérdezem ugyanazt, mindig valami más választ kapok, még ha sokszor hasonlót is. Az ember dolga az, hogy ezek közül kiválassza a neki leginkább tetszőt. Nagyon szeretném azt gondolni, hogy semmi értelme arról beszélni, tud-e műfordítást a ChatGPT, mert szerintem sosem fog tudni. Utánozni, azt tud.

A cikk további része csak előfizetőink számára elérhető.
Soha nem volt nagyobb szükség önre! A sajtó az olvasókért szabad, és fennmaradásunk előfizetőink nélkül nem lehetséges. Legyen előfizetőnk, tegyen egy próbát velünk és támogassa a demokratikus és liberális Magyarország ügyét!

Neked ajánljuk

Vörösben

Bohumil Hrabal novelláit Balassa Eszter, a társulattal sokat dolgozó dramaturg az Európa Kiadónál nemrégiben újra megjelent Véres történetek és legendák című gyűjteményes kötet alapján dolgozta át. Vörös a zokni, a nyakkendő, de még a hajszalag is – véres drámára jöttünk –, mégsem sorolható a horror műfajába Soós Attila rendezése. Fekete humorban gazdag sztorik elevenednek meg, groteszk stílusban feltárva a kisemberek mindennapos küzdelmeit.

Magánügyek, közügyek

A félhomályos színpadon egy női alak ül az íróasztalnál, mögötte vörös fényben füst gomolyog. Létezik egy színházi mondás: ahol egy előadásban füstgép vagy stroboszkóp jelenik meg, ott véget ér a minőség. Ám ez az előadás egy holokauszthoz kapcsolódó történetet mond el, a felszálló füstnek így óhatatlanul pluszjelentése is van. Teátrálisnak teátrális, végül is színházban vagyunk.

Szintén zenész

  • - turcsányi -

Nyilván nincs új a nap alatt, mindenesetre a síkhülye gyerekrabló történetét láttuk már kétszer, s éppenséggel olvashattuk is volna, ha Evan Hunter (a számos álnéven alkotó Salvatore Albert Lombinót Ed McBainként ismerjük jobban) 1959-ben publikált regénye megjelenik magyarul, de nem jelent meg, noha a szerző távolról sem alulreprezentált alakja a magyar könyvkiadásnak, beleértve a komcsit is).

Patchwork művészportrékból

A Fuga leghátsó, ámde igen nagy méretű termében látható a művész 2012 óta futó sorozatának (Ember Embernek Embere) majdnem teljes összegzése. A magángyűjtőktől is visszakölcsönzött alkotásokkal együtt a kiállításon 34 mű szerepel – sajátos, „bogis” művészportrék a nemzetközi művészszcéna volt és jelenlegi nagyjairól. S bár G. Horváth mindenekelőtt festő, a művészi Pantheonjában szerepet kapnak szobrászok, fotósok, konceptuális alkotók és performerek is.

Delejező monstrum

Egy magyar regény, amelyben alig van valami magyar. Bartók Imre legújabb – nem is könnyű összeszámolni, hányadik – könyvének főszereplője a harmincas évei elején járó francia Damien Lazard, aki két év alatt szinte a semmiből robban be a nemzetközi profi sakkvilág szűk elitjébe, üstökösszerű felemelkedése már a világbajnok kihívóját sejteti.

Hatvanpuszta két hintája

Hatvanpuszta két hintáját nem Hatvanpusztán, hanem Budajenőn lengeti a szél egy takaros portán, vagyis egy takaros porta előtt, ez még nem eldöntött száz százalékig.

Két akol

Magyar Péter azt mondta a 444 élő műsorában, hogy egy válságban lévő országban a választási törvény módosítása nem fér bele az 50 legfontosabb kérdésbe. Amennyiben jövőre ők győznek, az éppen annak a bizonyítéka lesz, hogy még ebben az egyfordulós rendszerben, ilyen „gusztustalan állami propaganda” mellett is lehetséges felülmúlni az uralkodó pártot.

„Saját félelmeink rossz utakra visznek”

Kevés helye van kritikának Izraellel szemben a zsidó közösségben. De vajon mi történik a porba rombolt Gázában, és miben különbözik az arab kultúra az európaitól? A Hunyadi téri Ábrahám sátra zsinagóga vezetője egyenesen beszél ezekről a kérdésekről.

Szenes Zoltán volt vezérkari főnök: A NATO-nak át kell vennie a drónvédelemmel kapcsolatos ukrán tapasztalatokat

A NATO alapvetően jól reagált az orosz csali drónok lengyelországi berepülésére, de az eset rávilágít arra, hogy a szövetség még nem készült fel a dróntámadásokra. A NATO-t politikai széttagoltsága is hátrányba hozza az orosz hibrid hadviselés elleni védekezésben – erről is beszélt nekünk a védelmi szövetség déli parancsnokság volt logisztikai főnöke.

„Előbb lövetem le magam, mint hogy letérdeljek”

Az elmúlt fél évben háromszor is országos hír lett Szolnok ellenzéki – MSZP-s – polgármesterének fellépéséből, egy tömegverekedés után például Pintér Sándor belügyminisztertől kért rendőröket a közbiztonság javításáért. Fideszes elődje örökségéről, Szolnok helyzetéről és a nagypolitikáról kérdeztük a 43 éves városvezetőt.