Interjú

„200 milliárd szómennyiség fölött tartunk”

Prószéky Gábor nyelvész, programtervező matematikus a mesterséges intelligenciáról, a ChatGPT-ről és a régi szótárakról

Dusza Erika
2023. augusztus 2.

Tudomány

Hogyan működnek a nagy számítógépes nyelvi modellek, a GPT-k, és mit jelent az, hogy immár párbeszédbe is lehet egy ilyennel kerülni? Mire jók ezek a modellek, illetve mire nem, és milyen messze vagyunk a valódi mesterséges intelligenciától (MI)? Kell-e félnünk tőle, és hogyan kerülhetjük el a csapdáit? A magyar fejlesztésű modell, a PULI GPTrio kutatócsoportjának vezetőjét faggattuk.

Magyar Narancs: Pár hete egy, a mesterséges intelligencia (MI) oktatásban betöltött szerepéről szóló pódiumbeszélgetésen azt mondta, „lehet, hogy mi vagyunk az utolsó generáció, amelyik a valósat és a virtuálisat még meg tudja különböztetni”. Laikusként ennek hallatán disztópikus filmekre, a Szárnyas fejvadászra, a Mátrixra, A szigetre és hasonlókra asszociálok – mire gondolt pontosabban?

Prószéky Gábor: Kezdjük kicsit messzebbről. Az MI fogalma az ötvenes–hatvanas években, vagyis akkor született meg, amikor még azt hitték, hogy tényleg lesz mesterséges intelligencia – de most azt mondanám, hogy nincs. Mert az MI mindig csak egy metszetet mutat a világból, legutóbb például, a ChatGPT-vel a nyelvit mutatta meg. És mivel nyelvileg olyan dolgokat produkál, amilyeneket eddig az emberen kívül más nem, a közvélemény felruházza olyan tulajdonságokkal is, amelyek nincsenek benne. Sokan azt feltételezik, hogy „ő” okos, és tudja, hogy milyen a világ. Persze ez nincs így. Egyes robotok összeraknak egy Mercedest a gyárban, mások nyelveket fordítanak, a humanoid robotok pedig lenyűgöznek minket azzal, hogy hasonlítanak ránk. De minden, ember által jelenleg fejlesztett készülékre elmondható, hogy noha az intelligenciának egy szeletében erős utánzási képességgel bírnak, nem komplexek. Az igazi MI az intelligencia totális modellezése lenne. Nem mondom, hogy nem lesz egyszer ilyen, de nagyon távol vagyunk még tőle.

MN: Ha elfogadjuk, hogy 2022. november 30. történelmi pillanat volt, ön hogyan írná le az utókor számára?

PG: A nagy nyelvi modellen (GPT3) ekkor egy olyan betanítást végzett el az OpenAI cég, amelynek eredményeként mi emberek dialógushelyzetbe kerültünk egy masinával. Az alapmodell még bármit tudott mondani, de mint a vízfolyás: nem lehetett megállítani. A ChatGPT-t viszont arra tanították be, hogy kérdésre ne hasonló kérdést mondjon, hanem konkrétan válaszolja meg, és aztán hagyja is abba.

MN: Közönséges halandóként mit érdemes tudnunk az alapmodellről?

PG: Kétféle alapmodellről szokás beszélni: az enkóderről és a dekóderről, amilyen a GPT3 is. Az enkóder lényege, hogy ha kitakarok egy szót a szövegből, megmondja, mi volt ott. A dekóder pedig képes megmondani, hogy egy szövegrész után legnagyobb valószínűséggel mi lesz a következő szó, aztán mi lesz az azt követő, és így rakja ki a teljes szöveget. Ez a valószínűség olyan sok százezernyi, sőt milliónyi korábbi szónak az együtteséből áll elő, hogy végül koherens szöveget kapok. Ennyit tud az alapmodell. Ezután rengeteg ember bevonásával elkezdték tovább „tanítgatni” a szoftvert. Ám ez a munka már messze nem automatikus: a gép az embertől tanul, konkrétan az pofozgatja jobbra, balra, hogy ez jó, ez nem jó… Ennek a munkának köszönhető, hogy a ChatGPT olyan eszköz lett, amellyel lehet beszélgetni.

A rendszer a szöveget annak a mintának a segítségével állítja össze, amelyet indulásként megadok neki: ezzel már beszorítom egy szűkebb világba. Ezt a kezdő szöveget promptnak nevezzük. A nyelvi-logikai lépéseket levezetve a rendszer kiad egy szöveget – de neki fogalma sincs róla, miről van szó. Az emberi agy nem attól tud egy nyelvet, mert sok leírt szöveget olvasott, hanem mert látunk, hallunk, érzünk, milliárd inger ér minket, amelyeket mind beépítünk, és amelyekről így nyelvi úton is számot tudunk adni. A ChatGPT-nek viszont csak nyelvi inputja van, méghozzá betűk formájában, így csak nyelvi választ tud adni, nem pedig világismeretit.

MN: Pedig említette a konferencián, hogy ha kellő mennyiségű adatot táplálunk a rendszerbe, akkor már kulturálisan is „elég okos” tud lenni.

PG: Két dologról van szó, amikor nyelvi adatokat táplálunk egy gépbe. Az egyik az a készség, hogy egyáltalán azon a nyelven képes legyen reagálni, tehát legyen elég mintája a rákövetkezés nyelvi formáira, magyarán a ragozásra, szórendre és a többi. A másik, hogy azok a szövegek, amelyeket megtanítunk a gépnek, valamilyen módon aztán tartalmilag is leképeződnek. Amikor tehát leírunk szituációkat, amelyek egy adott kultúrában megjelennek, például a teljes magyar webet feldolgozzuk, akkor rengeteg olyan elem lesz benne, amelyek a mi világunkban lényegesek, függetlenül attól, hogy mivel értünk egyet és mivel nem. Ha viszont Amerikában felépítenek egy rendszert, amihez hozzáadnak valamennyi magyar szót, akkor az a rendszer lehet, hogy „tud” magyarul, de magyar vonatkozású témákról nem lehet vele beszélgetni, hiszen a háttere nincs meg hozzá. Nyelvileg úgy viselkedik, mintha tudna válaszolni, de sokszor zöldségeket beszél, szép szóval élve: hallucinál. Például, ha megkérdezném tőle, hogy miről beszélgetett Dusza Erika és Prószéky Gábor 2023 júliusában, annyit látna, hogy ezek bizonyára nevek, és kitalálna hozzá dolgokat valami egészen furcsa asszociáció mentén. Míg ha elolvassa a maga által írt interjút, akkor már kezdi sejteni, miről van szó. A ChatGPT nem kárhoztatható azért, mert rosszul tud valamit, mivel valójában nem „tud” semmit sehogy: egyszerűen csak ezek a valószínűségek jöttek ki a megtanult szövegeiből. Ráadásul nem is determinisztikusan: valahányszor újra kérdezem ugyanazt, mindig valami más választ kapok, még ha sokszor hasonlót is. Az ember dolga az, hogy ezek közül kiválassza a neki leginkább tetszőt. Nagyon szeretném azt gondolni, hogy semmi értelme arról beszélni, tud-e műfordítást a ChatGPT, mert szerintem sosem fog tudni. Utánozni, azt tud.

A cikk további része csak előfizetőink számára elérhető.
Soha nem volt nagyobb szükség önre! A sajtó az olvasókért szabad, és fennmaradásunk előfizetőink nélkül nem lehetséges. Legyen előfizetőnk, tegyen egy próbát velünk és támogassa a demokratikus és liberális Magyarország ügyét!

Előfizetek Előfizető vagyok, bejelentkezem

Előző cikk a rovatban

20 milliárd kilométerre a Földtől elveszítettük a Voyager 2 űrszondát

Következő cikk a rovatban Három évtizedes növekedés után tavaly csökkentek a K+F ráfordítások

Narancsblog

Már sokadszorra ígéri Lázár és a kormány a HÉV-felújítást, mégsem történik semmi

narancs.hu
2025. november 19.

Az elmúlt húsz év tapasztalatai alapján az tűnik a legvalószínűbb forgatókönyvnek, hogy hamarosan egy újabb Lázár János-fellépést élvezhetünk, amelyen a miniszter már száznál is több új HÉV-szerelvény beszerzéséről delirál majd

Mikrofilm

Jövőre is megrendezik az állami támogatás nélküli Magyar Filmszemlét

narancs.hu
2025. november 18.

Tizenhárom év után idén februárban éledt újra a nagy múltú rendezvény, 2026-ban ismét megtartják, immár 45. alkalommal, versenyfilmekkel most lehet nevezni.

Kis-Magyarország

Minden jelölt független a decemberi tabi választáson

Bozai Ágota
2025. november 18.

Schmidt Jenő huszonkét évig volt Tab polgármestere a Fidesz-KDNP színeiben, mígnem 2024-ben a kormányhivatalnál ügyintézőként dolgozó Nagy Gyula legyőzte. Mandátuma azonban megszűnt, mert a testület szeptemberben feloszlatta magát. Az új választást december 14-re írták ki, három polgármesterjelölt indul.

Belpol

70-30 a férfiak javára, sok vállalkozó és sok Kovács – elemeztük a Tisza Párt jelöltlistáját

Fekő Ádám
2025. november 18.

Két választókerületet leszámítva mindenhol van Magyar Péternek három megbízhatónak tűnő embere. Sikerült a bravúr, egyiküknek sincs pártközeli múltja.

Magyar Narancs

Sport

A futball ronda igazsága: a rossz rendszer előbb-utóbb rossz eredményeket szül

Fekő Ádám
2025. november 17.

A vasárnapi menetrendszerű sportkatasztrófa a Puskás Arénában az agyonközpénzelt magyar akadémiai rendszer bukására mutatott rá, az pedig a teljes közeg kritikája, hogy ennek ellenére sem akarná senki Marco Rossi szövetségi kapitány lemondását. Hiszen nincs más, és ezt ő is tudja.

Kis-Magyarország

Amiről Orbán nem akar beszélni: lesújtó a gyermekszegénység Magyarországon

Béres Máté
2025. november 17.

Zavarban volt a miniszterelnök, amikor a gyermekszegénységi adatokról kérdezték az ATV-ben a múlt héten. Megmutatjuk, miért: ilyen megrázó a nélkülözés és a kirekesztettség Nógrádtól Hajdú-Bihar megyéig.

Publicisztika

Bernard Guetta: Meglepődünk, hogy előretör a szélsőjobboldal?

Bernard Guetta
2025. november 16.

A politikai kiábrándultság és kétségbeesés nem csak a magyarokat gyötri, Európa-szerte ötlettelenek a régi demokratikus erők, Franciaországban a hatalom küszöbén áll a szélsőjobb. Mi lehet a megoldás? A francia európai parlamenti képviselő szerint a múltbéli csaták helyett a mostaniakat kell megvívni.

Kis-Magyarország

Siófokon még számolják, mennyi szemétdíjat fizet a város a Plázs után

Bozai Ágota
2025. november 16.

Gáláns „ajándék” az önkormányzattól egy milliárdos árbevételű cégnek.

Mikrofilm

Leonardo DiCaprio akciókrimijének áll a zászló a jövő évi Oscaron

Gábor Áron

Négy hónap van hátra a 2026-os Oscar-gáláig. Bemutatjuk, hogy áll jelenleg a díjért folyó verseny, és mely filmekre érdemes odafigyelni a következő időszakban.

Kis-Magyarország

„Nem vagyok inkvizítor, de a büntetőfeljelentéseket megtettük” – mondja Orosháza polgármestere a költségvetési biztos kinevezése után

Bod Tamás

A kincstár döntése azért született, mert a város pénzkészlete 2020-hoz képest 89 százalékkal csökkent, miközben a kiadások megkétszereződtek.

Mikrofilm

A Sráckor rendezője készített filmet a zeneszerzőről, aki snassznak találta Molnár Ferencet

Gábor Áron

A Blue Moonban az év talán legjobb alakítását láthatjuk Ethan Hawke-tól, aki a tragikus sorsú zeneszerző, Lorenz Hart bőrébe bújt.

Belpol

Közfoglalkoztatottak gyűjtötték az aláírást a Fidesznek Csörögön

Béres Máté

Két közfoglalkoztatott – egyikük a helyi roma önkormányzat tagja – is gyűjtötte az aláírást a Fidesznek a Pest megyei községben. Szorcsik József polgármester szerint lenézik a közfoglalkoztatottakat azok, akik szerint önszántukból ne tudnának beállni aktivistának.

Tudomány

„Az a fajta hamis technológiai fejlődés, amit az OpenAI hajszol, csak a profitot célozza”

Csabai Máté

Karen Hao amerikai újságíró könyve a ChatGPT-t fejlesztő OpenAI belső ügyeiről rántja le a leplet, de a mesterséges intelligenciával kapcsolatban is gyanakvó. Úgy véli, a Szilícium-völgyben már nem a tudomány, hanem a vakhit mozgatja a fejlesztőket és a tőkét.

Belpol

Elhunyt politikusa után nem delegál parlamenti szószólót a hazai románság a törvényhozásba

Bod Tamás

Kreszta Traján román nemzetiségi szószóló októberi halála után az országos román önkormányzatnak harminc napja volt, hogy új szószólót delegáljon a parlamentbe.

Kritika

Jön a bolond!

- turcsányi -

William McKinley-vel jól elbánt Hollywood. Az Egyesült Államok 25. elnöke mind ez idáig az egyetlen, aki merénylet áldozataként négy elhunyt potus közül nem kapott játékfilmet, de még csak egy részletet, epizódot sem.

Kritika

Út a féktelenbe

Már a Lumière testvérek egyik első filmfelvételén, 1895-ben is egy érkező vonat látványa rémisztette halálra a párizsi közönséget.

Kritika

Cica az istállóban

Bacsadi Zsófia

„Attól, hogy egy kóbor macska a Spanyol Lovasiskola istállójában szüli meg a kiscicáit, még nem lesznek lipicaiak” – imigyen szólt egy névtelen kommentelő a film rendezőjének honosítási ügyét olvasva.

Kritika

A hegyek hangja

Bacsadi Zsófia

„Ez a zene nem arra való, hogy hallgassuk, hanem arra, hogy táncoljunk rá” – magyarázza a film – eredeti címén, a Sirāt – egyik szereplője a sivatagi rave-partyban eltűnt lánya után kutató Luisnak (Sergi López) a film magját alkotó technozene értelmét. Az apa fiával, Estebannal (Bruno Núñez Arjona) és kutyájukkal, Pipával érkezik a marokkói sivatag közepén rendezett illegális rave-fesztiválra, hogy elszántan, de teljesen felkészületlenül előkerítse Mart.

Kritika

A jóság hímpora

Görföl Balázs

Krasznahorkai László első poszt-Nobel-regénye játékos, bonyolult, színpompás mű. Főszereplője egy múzeumi lepketudós, entomológus (azaz a rovartan szakértője), akit váratlanul egy bonyolult elméleti problémával keres meg a munkájában elakadt író, bizonyos Krasznahorkai László, aki kísértetiesen emlékeztet a nyilvános fellépésekből és megnyilatkozásokból ismert Krasznahorkai Lászlóra.

A szerk.

Krétaforradalom Szlovákiában, avagy minden autokrata gyáva és alattomos

A szerk.

A gyerekekre is ráküldik a rendőrségüket, csakhogy a gyerekeket nem lehet átverni. De mi is történt egy a poprádi iskolánál, ami megfutamította Robert Ficót?

Interjú

„200 milliárd szómennyiség fölött tartunk”

Prószéky Gábor nyelvész, programtervező matematikus a mesterséges intelligenciáról, a ChatGPT-ről és a régi szótárakról

Neked ajánljuk