Interjú

„A ChatGPT csak úgy csinál, mintha”

Prószéky Gábor nyelvész, programtervező matematikus a mesterséges intelligencia korlátairól és veszélyeiről

Tudomány

A magyar fejlesztésű nyelvi modellt, a PULI-t gondozó HUN-REN Nyelv­tudományi Kutatóközpont vezetőjével a kínai DeepSeek új modelljéről, a szöveg-előállító modellek „intelligenciájáról” és érzelmeiről, hasznukról és haszontalanságukról beszélgettünk. Ne bizalmaskodjanak a géppel, és ne hagyják, hogy átverje önöket! És semmiképpen ne szeressenek bele!

Magyar Narancs: A napokban a kínai DeepSeek kiadott egy új, nyílt forráskódú modellt, az R1-et, amely bizonyos összevetésekben vetekszik az OpenAI-féle 01 modellel, sőt van, amiben jobb is annál. Ráadásul a cég állítja: a modell betanítása csupán 5,6 millió dollárba került. Azt is hírként tálalták, hogy az R1 tud érvelni. Ez valóban új funkció lenne?

Prószéky Gábor: Ezzel a „képességgel” más modellek is rendelkeznek, legfeljebb kevésbé jól érvelnek. Az érvelést ez esetben úgy értsük, hogy a gép az állításokból logikai láncokat tud képezni. Tehát nem direkt válasza van, hanem érvrendszert épít föl, és logikai lépéseken át jut el a válaszig. Nyilván csak a nagyobb rendszerek, például az OpenAI-é tud ilyet; ez nehéz feladat.

MN: Mégis milyen újdonságot mondhatnak magukénak a kínaiak?

PG: Nem új, amit csináltak, csak amit eddig is próbálgattak, azt ők hatékonyabban, jobban, illetve állításaik szerint olcsóbban megoldották. A nagy nyelvi modellek építése olyan tudományággá vált, amelyben „vak tyúk is talál szemet”. Ezek a modellek iszonyatosan nagyok, és a fejlesztők sokszor maguk is meglepődnek, hogy milyen jó lett egy-egy új változat. Sokszor csak később derül ki, hogy valamelyik modellnek egy másikénál jobb képességei vannak – mert nagyobb szövegen, másmilyen szövegen, más gépen, máshogy tanították.

MN: Hogyan állapítható meg, hogy mennyire egy ilyen nyelvi modell?

PG: A modell reakcióit különböző rendszerekkel és különböző szempontok szerint értékelik. Például a kérdés-válasz rendszer kiértékelője azt vizsgálja, mennyire adekvát és mennyire pontos az adott válasz, vagy hogy olyan-e a válasznak a nyelvi komplexitása, amilyen a kérdésé volt. Például nem lehet egy tudományosan megalapozott kérdésre bulvár választ adni, de egy iskolai kérdésre sem lehet akadémiai szinten felelni. Vagy hogy mennyire toxikus az adott válasz, hogy mennyire van benne veszélyes tartalom. Nemcsak arra gondolok, hogy egy válasz alapján ténylegesen bombát épít valaki, hanem egyszerűen félreérthető lehet, és ebből rossz következtetések születhetnek. Ilyen kiértékelő rendszert építünk egyébként most mi is a Nyelvtudományi Kutatóközpontban, magyar nyelvre. (A PULI-modellről lásd keretes írásunkat – a szerk.) A Deep­Seek modelljének kiértékelésénél meglepően jó számokról hallunk, olyanokról, amilyeneket eddig csak az OpenAI legújabb GPT-modellje tudott, viszont az rengeteg pénzbe került. A hírek szerint a kínai modell sokkal kisebb, mégis a nagyokkal vetekedő minőséget produkál. A gépek működtetéséhez szükséges háttér esetében pedig már az ökológiai lábnyom is számít. Minek az árán csinálunk ilyen óriási modelleket? Úgyhogy egy kisebb, olcsóbb eszköz, mint a kínai, sokat ér a piacon.

MN: Trump tanácsadója szerint komoly bizonyítékok vannak az adatlopásra, vagyis arra, hogy a DeepSeek az OpenAI nagy nyelvi modelljeinek válaszait használta fel saját modelljének a fejlesztésére, amit az OpenAI felhasználási feltételei kifejezetten tiltanak. Tényleg lenyúltak valamit a kínaiak?

PG: Hogy történt-e olyan szabálytalanság, amit Amerika szeretne büntetni, azt nem tudom. De elképzelhető, hogy sérültek jogszabályok. Arról lehet szó, hogy egy relatíve olcsón felépített gépi eszköz egy másik, drágábban megvalósított modell tudását szoftveres technikák segítségével felhasználja. Ez előbb-utóbb ki fog derülni. De ma már a távol-keleti eszközök, és itt elsősorban Kínára gondolok, nem feltétlen kópiák. Már nem azzal büszkélkednek, hogy „mi az eredetinél is jobb másolatot tudunk készíteni”, mint évtizedekig, hanem valóban tudhatnak olyat, ami önmagában jobb. Ez újdonság.

Ezekhez a nyelvmodellekhez iszonyú méretű hardver kell, és az bárkinek lehet, ha van rá elég pénze. Rengeteg nyelvi adat is kell, de ennek egyelőre még nem látszik úgy az ára, mint a hardveré. A hardvert sok millió dollárért veszik – de attól még nem működnének a rendszerek. A világban fellelhető nagy mennyiségű nyelvi adat nagy része sokak számára publikusan és az internetről nagyrészt ingyenesen elérhető. Még ha ez önmagában nem is elég, mert például a magas tudomány nem minden része van fönt, vagy legalábbis nem nyíltan hozzáférhető a weben. Ha egy atomfizikában járatos nyelvi eszközt építek, az atomfizika publikációi nem feltétlenül elérhetők. De valójában a szakemberek képességeire van igazán nagy szükség, akik ezt az egészet összerakják: hogy milyen eszközt és hogyan építenek föl, milyen minőség-ellenőrző rendszereknek az eredményeit veszik figyelembe.

A cikk további része csak előfizetőink számára elérhető.
Soha nem volt nagyobb szükség önre! A sajtó az olvasókért szabad, és fennmaradásunk előfizetőink nélkül nem lehetséges. Legyen előfizetőnk, tegyen egy próbát velünk és támogassa a demokratikus és liberális Magyarország ügyét!

Neked ajánljuk

A fejünkre nőttek

Két csodabogár elrabol egy cégvezért, mert meggyőződésük, hogy földönkívüli. Jórgosz Lánthimosz egy 2003-as koreai filmet remake-elt, az ő hősei azonban különc bolondok helyett tőrőlmetszett incelek, akiket azért megérteni is megpróbál.

Visszatér

  • - turcsányi -

Johnny Cashnek van egy ilyen című száma, az 1994-es American Recordings című albumán. Nem is az övé, egy Nick Lowe nevű zenészé, aki egy ideig Cash rokona volt – az ő eredeti változatát használta például a pilot vége főcíméhez a Maffiózók (The Sopranos).

Tökéletes egyenlőség

Egy viking törzsfőnökről szóló animált tanmesével indul a film, aki népe minden tagjának (beleértve önmagát is) levágatta a bal kezét (szolidaritásból, mivel a fia bal keze odalett az ellenségtől menekülve), így akarván megőrizni az egységet.

A rossz dolog

Kínálta magát a trauma jelenkori uralmáról szóló kritikai panaszáradat Eva Victor debütfilmje kapcsán. A film több elemzője kiemelte, hogy a Bocs, kicsim erőssége éppen abban rejlik, hogy ellenáll e narratív toposznak.

Perkusszív vérvonal

A cimbalom története valódi sikersztori: az 1870-es években a cseh származású, Budapesten letelepedett hangszergyáros, Schunda Vencel József megalkotta kora népszerű kocsmai hangszerének tökéletesített változatát, a pedálcimbalmot, 1906-ban pedig már a tízezredik (!) példányt szállították ki a Magyar utcai manufaktúrából.

Suttogó szó-képek

  • Dékei Krisztina

A 2016-tól Berlinben élő, de idén hazaköltöző művész viszonylag korán, 2012-ben megtalálta egyéni kézjegyének alapelemét, a pixelt (talán a legismertebb ilyen műve a 2014-es Akadémiai pénisz), majd az ezen alapuló színezést: interaktív alkotásai csak akkor váltak láthatóvá, ha a közönség kiszínezte a tényleges pixeleket.

Fejszék és haszonnövények

  • Molnár T. Eszter

A táncos székekből összetolt emelvényen lépked. A székek mozognak, csúsznak, dőlnek, billennek, a táncos óvatos, de hiába, végül így is legördül.

Újabb menekülő kelet-európai politikus keres búvóhelyet Orbánnál

  • Domány András
Budapestről üzent Donald Tusk lengyel miniszterelnöknek a Kaczyński-kormányok volt igazságügyi minisztere: nem kaptok el! Zbigniew Ziobrót 180 millió złoty, vagyis 17 milliárd forintnyi költségvetési pénz szabálytalan elköltése miatt keresik a lengyel hatóságok. Ki ez az ember, és hogyan taszította káoszba hazája igazságszolgáltatását?