Interjú

„A ChatGPT csak úgy csinál, mintha”

Prószéky Gábor nyelvész, programtervező matematikus a mesterséges intelligencia korlátairól és veszélyeiről

Tudomány

A magyar fejlesztésű nyelvi modellt, a PULI-t gondozó HUN-REN Nyelv­tudományi Kutatóközpont vezetőjével a kínai DeepSeek új modelljéről, a szöveg-előállító modellek „intelligenciájáról” és érzelmeiről, hasznukról és haszontalanságukról beszélgettünk. Ne bizalmaskodjanak a géppel, és ne hagyják, hogy átverje önöket! És semmiképpen ne szeressenek bele!

Magyar Narancs: A napokban a kínai DeepSeek kiadott egy új, nyílt forráskódú modellt, az R1-et, amely bizonyos összevetésekben vetekszik az OpenAI-féle 01 modellel, sőt van, amiben jobb is annál. Ráadásul a cég állítja: a modell betanítása csupán 5,6 millió dollárba került. Azt is hírként tálalták, hogy az R1 tud érvelni. Ez valóban új funkció lenne?

Prószéky Gábor: Ezzel a „képességgel” más modellek is rendelkeznek, legfeljebb kevésbé jól érvelnek. Az érvelést ez esetben úgy értsük, hogy a gép az állításokból logikai láncokat tud képezni. Tehát nem direkt válasza van, hanem érvrendszert épít föl, és logikai lépéseken át jut el a válaszig. Nyilván csak a nagyobb rendszerek, például az OpenAI-é tud ilyet; ez nehéz feladat.

MN: Mégis milyen újdonságot mondhatnak magukénak a kínaiak?

PG: Nem új, amit csináltak, csak amit eddig is próbálgattak, azt ők hatékonyabban, jobban, illetve állításaik szerint olcsóbban megoldották. A nagy nyelvi modellek építése olyan tudományággá vált, amelyben „vak tyúk is talál szemet”. Ezek a modellek iszonyatosan nagyok, és a fejlesztők sokszor maguk is meglepődnek, hogy milyen jó lett egy-egy új változat. Sokszor csak később derül ki, hogy valamelyik modellnek egy másikénál jobb képességei vannak – mert nagyobb szövegen, másmilyen szövegen, más gépen, máshogy tanították.

MN: Hogyan állapítható meg, hogy mennyire egy ilyen nyelvi modell?

PG: A modell reakcióit különböző rendszerekkel és különböző szempontok szerint értékelik. Például a kérdés-válasz rendszer kiértékelője azt vizsgálja, mennyire adekvát és mennyire pontos az adott válasz, vagy hogy olyan-e a válasznak a nyelvi komplexitása, amilyen a kérdésé volt. Például nem lehet egy tudományosan megalapozott kérdésre bulvár választ adni, de egy iskolai kérdésre sem lehet akadémiai szinten felelni. Vagy hogy mennyire toxikus az adott válasz, hogy mennyire van benne veszélyes tartalom. Nemcsak arra gondolok, hogy egy válasz alapján ténylegesen bombát épít valaki, hanem egyszerűen félreérthető lehet, és ebből rossz következtetések születhetnek. Ilyen kiértékelő rendszert építünk egyébként most mi is a Nyelvtudományi Kutatóközpontban, magyar nyelvre. (A PULI-modellről lásd keretes írásunkat – a szerk.) A Deep­Seek modelljének kiértékelésénél meglepően jó számokról hallunk, olyanokról, amilyeneket eddig csak az OpenAI legújabb GPT-modellje tudott, viszont az rengeteg pénzbe került. A hírek szerint a kínai modell sokkal kisebb, mégis a nagyokkal vetekedő minőséget produkál. A gépek működtetéséhez szükséges háttér esetében pedig már az ökológiai lábnyom is számít. Minek az árán csinálunk ilyen óriási modelleket? Úgyhogy egy kisebb, olcsóbb eszköz, mint a kínai, sokat ér a piacon.

MN: Trump tanácsadója szerint komoly bizonyítékok vannak az adatlopásra, vagyis arra, hogy a DeepSeek az OpenAI nagy nyelvi modelljeinek válaszait használta fel saját modelljének a fejlesztésére, amit az OpenAI felhasználási feltételei kifejezetten tiltanak. Tényleg lenyúltak valamit a kínaiak?

PG: Hogy történt-e olyan szabálytalanság, amit Amerika szeretne büntetni, azt nem tudom. De elképzelhető, hogy sérültek jogszabályok. Arról lehet szó, hogy egy relatíve olcsón felépített gépi eszköz egy másik, drágábban megvalósított modell tudását szoftveres technikák segítségével felhasználja. Ez előbb-utóbb ki fog derülni. De ma már a távol-keleti eszközök, és itt elsősorban Kínára gondolok, nem feltétlen kópiák. Már nem azzal büszkélkednek, hogy „mi az eredetinél is jobb másolatot tudunk készíteni”, mint évtizedekig, hanem valóban tudhatnak olyat, ami önmagában jobb. Ez újdonság.

Ezekhez a nyelvmodellekhez iszonyú méretű hardver kell, és az bárkinek lehet, ha van rá elég pénze. Rengeteg nyelvi adat is kell, de ennek egyelőre még nem látszik úgy az ára, mint a hardveré. A hardvert sok millió dollárért veszik – de attól még nem működnének a rendszerek. A világban fellelhető nagy mennyiségű nyelvi adat nagy része sokak számára publikusan és az internetről nagyrészt ingyenesen elérhető. Még ha ez önmagában nem is elég, mert például a magas tudomány nem minden része van fönt, vagy legalábbis nem nyíltan hozzáférhető a weben. Ha egy atomfizikában járatos nyelvi eszközt építek, az atomfizika publikációi nem feltétlenül elérhetők. De valójában a szakemberek képességeire van igazán nagy szükség, akik ezt az egészet összerakják: hogy milyen eszközt és hogyan építenek föl, milyen minőség-ellenőrző rendszereknek az eredményeit veszik figyelembe.

Ez egy remek cikk a nyomtatott Magyar Narancsból, amely online is elérhető.
Ha szeretné elolvasni, kérjük, fizessen elő lapunk digitális kiadására, vagy ha már előfizető, lépjen be!
Támogassa a független sajtót! Olvassa a Magyar Narancsot!

Neked ajánljuk

Vesszen Triatlon!

A magyar irodalom egyik örök Nobel-várományosa, Krasznahorkai László a minap interjút adott a Skandinávia-szerte méltán népszerű Svenska Dagbladet című svéd napilapnak.

Budapest győzött

Miután Karácsony Gergely bejelentette, hogy a Rákosrendező ügyében a főváros élni fog elővásárlási jogával, össztűz zúdult rá.

Kiteljesedés

Külföldi választás még nem okozott akkora változást a Fideszben, mint az amerikai. Az eddig is alkalmazott fenyegetőzések Donald Trump hivatalba lépése óta még vadabbak, ráadásul Orbánék már meg sem próbálnak úgy politizálni, mintha a nyugati szövetségi rendszer részei lennénk.

Partnerként kezelve

A román határhoz közeli 300 lelkes Toldon is segíti a mélyszegénységben élőket az Igazgyöngy Alapítvány. A rendszerkritikus álláspontjáról ismert alapítót sok támadás érte az elmúlt években, ennek ellenére sikerült elfogadtatnia magukat az állami intézményrendszerrel.

„Anya, hogyan nem szabad hozzám érni?”

Meg sem hallgatva a lehetséges gyanúsítottat, be sem várva a személyes találkozáson alapuló pszichiátriai szakvéleményt, két nap alatt zárta le a rendőrség annak az iskolai feljelentésnek a vizsgálatát, amely szerint egy osztályfőnök bűncselekményt követhetett el egy 12 éves kislánnyal szemben. Az érintett család inkább elköltözött a városból.