Interjú

„A ChatGPT csak úgy csinál, mintha”

Prószéky Gábor nyelvész, programtervező matematikus a mesterséges intelligencia korlátairól és veszélyeiről

Tudomány

A magyar fejlesztésű nyelvi modellt, a PULI-t gondozó HUN-REN Nyelv­tudományi Kutatóközpont vezetőjével a kínai DeepSeek új modelljéről, a szöveg-előállító modellek „intelligenciájáról” és érzelmeiről, hasznukról és haszontalanságukról beszélgettünk. Ne bizalmaskodjanak a géppel, és ne hagyják, hogy átverje önöket! És semmiképpen ne szeressenek bele!

Magyar Narancs: A napokban a kínai DeepSeek kiadott egy új, nyílt forráskódú modellt, az R1-et, amely bizonyos összevetésekben vetekszik az OpenAI-féle 01 modellel, sőt van, amiben jobb is annál. Ráadásul a cég állítja: a modell betanítása csupán 5,6 millió dollárba került. Azt is hírként tálalták, hogy az R1 tud érvelni. Ez valóban új funkció lenne?

Prószéky Gábor: Ezzel a „képességgel” más modellek is rendelkeznek, legfeljebb kevésbé jól érvelnek. Az érvelést ez esetben úgy értsük, hogy a gép az állításokból logikai láncokat tud képezni. Tehát nem direkt válasza van, hanem érvrendszert épít föl, és logikai lépéseken át jut el a válaszig. Nyilván csak a nagyobb rendszerek, például az OpenAI-é tud ilyet; ez nehéz feladat.

MN: Mégis milyen újdonságot mondhatnak magukénak a kínaiak?

PG: Nem új, amit csináltak, csak amit eddig is próbálgattak, azt ők hatékonyabban, jobban, illetve állításaik szerint olcsóbban megoldották. A nagy nyelvi modellek építése olyan tudományággá vált, amelyben „vak tyúk is talál szemet”. Ezek a modellek iszonyatosan nagyok, és a fejlesztők sokszor maguk is meglepődnek, hogy milyen jó lett egy-egy új változat. Sokszor csak később derül ki, hogy valamelyik modellnek egy másikénál jobb képességei vannak – mert nagyobb szövegen, másmilyen szövegen, más gépen, máshogy tanították.

MN: Hogyan állapítható meg, hogy mennyire egy ilyen nyelvi modell?

PG: A modell reakcióit különböző rendszerekkel és különböző szempontok szerint értékelik. Például a kérdés-válasz rendszer kiértékelője azt vizsgálja, mennyire adekvát és mennyire pontos az adott válasz, vagy hogy olyan-e a válasznak a nyelvi komplexitása, amilyen a kérdésé volt. Például nem lehet egy tudományosan megalapozott kérdésre bulvár választ adni, de egy iskolai kérdésre sem lehet akadémiai szinten felelni. Vagy hogy mennyire toxikus az adott válasz, hogy mennyire van benne veszélyes tartalom. Nemcsak arra gondolok, hogy egy válasz alapján ténylegesen bombát épít valaki, hanem egyszerűen félreérthető lehet, és ebből rossz következtetések születhetnek. Ilyen kiértékelő rendszert építünk egyébként most mi is a Nyelvtudományi Kutatóközpontban, magyar nyelvre. (A PULI-modellről lásd keretes írásunkat – a szerk.) A Deep­Seek modelljének kiértékelésénél meglepően jó számokról hallunk, olyanokról, amilyeneket eddig csak az OpenAI legújabb GPT-modellje tudott, viszont az rengeteg pénzbe került. A hírek szerint a kínai modell sokkal kisebb, mégis a nagyokkal vetekedő minőséget produkál. A gépek működtetéséhez szükséges háttér esetében pedig már az ökológiai lábnyom is számít. Minek az árán csinálunk ilyen óriási modelleket? Úgyhogy egy kisebb, olcsóbb eszköz, mint a kínai, sokat ér a piacon.

MN: Trump tanácsadója szerint komoly bizonyítékok vannak az adatlopásra, vagyis arra, hogy a DeepSeek az OpenAI nagy nyelvi modelljeinek válaszait használta fel saját modelljének a fejlesztésére, amit az OpenAI felhasználási feltételei kifejezetten tiltanak. Tényleg lenyúltak valamit a kínaiak?

PG: Hogy történt-e olyan szabálytalanság, amit Amerika szeretne büntetni, azt nem tudom. De elképzelhető, hogy sérültek jogszabályok. Arról lehet szó, hogy egy relatíve olcsón felépített gépi eszköz egy másik, drágábban megvalósított modell tudását szoftveres technikák segítségével felhasználja. Ez előbb-utóbb ki fog derülni. De ma már a távol-keleti eszközök, és itt elsősorban Kínára gondolok, nem feltétlen kópiák. Már nem azzal büszkélkednek, hogy „mi az eredetinél is jobb másolatot tudunk készíteni”, mint évtizedekig, hanem valóban tudhatnak olyat, ami önmagában jobb. Ez újdonság.

Ezekhez a nyelvmodellekhez iszonyú méretű hardver kell, és az bárkinek lehet, ha van rá elég pénze. Rengeteg nyelvi adat is kell, de ennek egyelőre még nem látszik úgy az ára, mint a hardveré. A hardvert sok millió dollárért veszik – de attól még nem működnének a rendszerek. A világban fellelhető nagy mennyiségű nyelvi adat nagy része sokak számára publikusan és az internetről nagyrészt ingyenesen elérhető. Még ha ez önmagában nem is elég, mert például a magas tudomány nem minden része van fönt, vagy legalábbis nem nyíltan hozzáférhető a weben. Ha egy atomfizikában járatos nyelvi eszközt építek, az atomfizika publikációi nem feltétlenül elérhetők. De valójában a szakemberek képességeire van igazán nagy szükség, akik ezt az egészet összerakják: hogy milyen eszközt és hogyan építenek föl, milyen minőség-ellenőrző rendszereknek az eredményeit veszik figyelembe.

A cikk további része csak előfizetőink számára elérhető.
Soha nem volt nagyobb szükség önre! A sajtó az olvasókért szabad, és fennmaradásunk előfizetőink nélkül nem lehetséges. Legyen előfizetőnk, tegyen egy próbát velünk és támogassa a demokratikus és liberális Magyarország ügyét!

Neked ajánljuk

Pizsamapartizánok

Régen a film az életet utánozta (a vonat érkezett, a munkások a gyárból meg távoztak, csak hogy a klasszikusoknál maradjunk), ma már fordítva van: úgy akarunk viselkedni, mint kedvenc filmjeink szereplői, rájuk akarunk hasonlítani, azt akarjuk átélni, amit ők.

Amerikai legenda

Ez a film annyira áhítatos tisztelgés az Ed Sullivan nevű legenda előtt, hogy szinte észre sem vesszük, mennyire hiányzik belőle az Ed Sullivan nevű ember, aki egykor, a tévézés hőskorában a róla elnevezett, minden idők leghosszabb ideig létező és legnagyobb nézettséget elérő show-ját vezette – tulajdonképpen megteremtve a tv-show műfaját, mint olyat.

AI kontra Al Bano

A kisebb-nagyobb kihagyásokkal és különböző neveken, de 1987 óta létező Vasvári Színjátszó Fesztivál az alkalmi falusi színjátszóktól a független színházi szféra elismert társu­la­tai­ig terjedően reprezentálja a hazai nem hivatásos színjátszás különböző szintjeit.

Családban marad

A kiállításon apa és fia műveit látjuk generációs párba állítva, nemzetközi kontextusba helyezve és némileg rávilágítva a hazai üvegművészet status quójára.