Interjú

„A ChatGPT csak úgy csinál, mintha”

Prószéky Gábor nyelvész, programtervező matematikus a mesterséges intelligencia korlátairól és veszélyeiről

Tudomány

A magyar fejlesztésű nyelvi modellt, a PULI-t gondozó HUN-REN Nyelv­tudományi Kutatóközpont vezetőjével a kínai DeepSeek új modelljéről, a szöveg-előállító modellek „intelligenciájáról” és érzelmeiről, hasznukról és haszontalanságukról beszélgettünk. Ne bizalmaskodjanak a géppel, és ne hagyják, hogy átverje önöket! És semmiképpen ne szeressenek bele!

Magyar Narancs: A napokban a kínai DeepSeek kiadott egy új, nyílt forráskódú modellt, az R1-et, amely bizonyos összevetésekben vetekszik az OpenAI-féle 01 modellel, sőt van, amiben jobb is annál. Ráadásul a cég állítja: a modell betanítása csupán 5,6 millió dollárba került. Azt is hírként tálalták, hogy az R1 tud érvelni. Ez valóban új funkció lenne?

Prószéky Gábor: Ezzel a „képességgel” más modellek is rendelkeznek, legfeljebb kevésbé jól érvelnek. Az érvelést ez esetben úgy értsük, hogy a gép az állításokból logikai láncokat tud képezni. Tehát nem direkt válasza van, hanem érvrendszert épít föl, és logikai lépéseken át jut el a válaszig. Nyilván csak a nagyobb rendszerek, például az OpenAI-é tud ilyet; ez nehéz feladat.

MN: Mégis milyen újdonságot mondhatnak magukénak a kínaiak?

PG: Nem új, amit csináltak, csak amit eddig is próbálgattak, azt ők hatékonyabban, jobban, illetve állításaik szerint olcsóbban megoldották. A nagy nyelvi modellek építése olyan tudományággá vált, amelyben „vak tyúk is talál szemet”. Ezek a modellek iszonyatosan nagyok, és a fejlesztők sokszor maguk is meglepődnek, hogy milyen jó lett egy-egy új változat. Sokszor csak később derül ki, hogy valamelyik modellnek egy másikénál jobb képességei vannak – mert nagyobb szövegen, másmilyen szövegen, más gépen, máshogy tanították.

MN: Hogyan állapítható meg, hogy mennyire egy ilyen nyelvi modell?

PG: A modell reakcióit különböző rendszerekkel és különböző szempontok szerint értékelik. Például a kérdés-válasz rendszer kiértékelője azt vizsgálja, mennyire adekvát és mennyire pontos az adott válasz, vagy hogy olyan-e a válasznak a nyelvi komplexitása, amilyen a kérdésé volt. Például nem lehet egy tudományosan megalapozott kérdésre bulvár választ adni, de egy iskolai kérdésre sem lehet akadémiai szinten felelni. Vagy hogy mennyire toxikus az adott válasz, hogy mennyire van benne veszélyes tartalom. Nemcsak arra gondolok, hogy egy válasz alapján ténylegesen bombát épít valaki, hanem egyszerűen félreérthető lehet, és ebből rossz következtetések születhetnek. Ilyen kiértékelő rendszert építünk egyébként most mi is a Nyelvtudományi Kutatóközpontban, magyar nyelvre. (A PULI-modellről lásd keretes írásunkat – a szerk.) A Deep­Seek modelljének kiértékelésénél meglepően jó számokról hallunk, olyanokról, amilyeneket eddig csak az OpenAI legújabb GPT-modellje tudott, viszont az rengeteg pénzbe került. A hírek szerint a kínai modell sokkal kisebb, mégis a nagyokkal vetekedő minőséget produkál. A gépek működtetéséhez szükséges háttér esetében pedig már az ökológiai lábnyom is számít. Minek az árán csinálunk ilyen óriási modelleket? Úgyhogy egy kisebb, olcsóbb eszköz, mint a kínai, sokat ér a piacon.

MN: Trump tanácsadója szerint komoly bizonyítékok vannak az adatlopásra, vagyis arra, hogy a DeepSeek az OpenAI nagy nyelvi modelljeinek válaszait használta fel saját modelljének a fejlesztésére, amit az OpenAI felhasználási feltételei kifejezetten tiltanak. Tényleg lenyúltak valamit a kínaiak?

PG: Hogy történt-e olyan szabálytalanság, amit Amerika szeretne büntetni, azt nem tudom. De elképzelhető, hogy sérültek jogszabályok. Arról lehet szó, hogy egy relatíve olcsón felépített gépi eszköz egy másik, drágábban megvalósított modell tudását szoftveres technikák segítségével felhasználja. Ez előbb-utóbb ki fog derülni. De ma már a távol-keleti eszközök, és itt elsősorban Kínára gondolok, nem feltétlen kópiák. Már nem azzal büszkélkednek, hogy „mi az eredetinél is jobb másolatot tudunk készíteni”, mint évtizedekig, hanem valóban tudhatnak olyat, ami önmagában jobb. Ez újdonság.

Ezekhez a nyelvmodellekhez iszonyú méretű hardver kell, és az bárkinek lehet, ha van rá elég pénze. Rengeteg nyelvi adat is kell, de ennek egyelőre még nem látszik úgy az ára, mint a hardveré. A hardvert sok millió dollárért veszik – de attól még nem működnének a rendszerek. A világban fellelhető nagy mennyiségű nyelvi adat nagy része sokak számára publikusan és az internetről nagyrészt ingyenesen elérhető. Még ha ez önmagában nem is elég, mert például a magas tudomány nem minden része van fönt, vagy legalábbis nem nyíltan hozzáférhető a weben. Ha egy atomfizikában járatos nyelvi eszközt építek, az atomfizika publikációi nem feltétlenül elérhetők. De valójában a szakemberek képességeire van igazán nagy szükség, akik ezt az egészet összerakják: hogy milyen eszközt és hogyan építenek föl, milyen minőség-ellenőrző rendszereknek az eredményeit veszik figyelembe.

A cikk további része csak előfizetőink számára elérhető.
Soha nem volt nagyobb szükség önre! A sajtó az olvasókért szabad, és fennmaradásunk előfizetőink nélkül nem lehetséges. Legyen előfizetőnk, tegyen egy próbát velünk és támogassa a demokratikus és liberális Magyarország ügyét!

Neked ajánljuk

Vörösben

Bohumil Hrabal novelláit Balassa Eszter, a társulattal sokat dolgozó dramaturg az Európa Kiadónál nemrégiben újra megjelent Véres történetek és legendák című gyűjteményes kötet alapján dolgozta át. Vörös a zokni, a nyakkendő, de még a hajszalag is – véres drámára jöttünk –, mégsem sorolható a horror műfajába Soós Attila rendezése. Fekete humorban gazdag sztorik elevenednek meg, groteszk stílusban feltárva a kisemberek mindennapos küzdelmeit.

Magánügyek, közügyek

A félhomályos színpadon egy női alak ül az íróasztalnál, mögötte vörös fényben füst gomolyog. Létezik egy színházi mondás: ahol egy előadásban füstgép vagy stroboszkóp jelenik meg, ott véget ér a minőség. Ám ez az előadás egy holokauszthoz kapcsolódó történetet mond el, a felszálló füstnek így óhatatlanul pluszjelentése is van.

Szintén zenész

  • - turcsányi -

Nyilván nincs új a nap alatt, mindenesetre a síkhülye gyerekrabló történetét láttuk már kétszer, s éppenséggel olvashattuk is volna, ha Evan Hunter (a számos álnéven alkotó Salvatore Albert Lombinót Ed McBainként ismerjük jobban) 1959-ben publikált regénye megjelenik magyarul, de nem jelent meg, noha a szerző távolról sem alulreprezentált alakja a magyar könyvkiadásnak, beleértve a komcsit is).

Patchwork művészportrékból

A Fuga leghátsó, ámde igen nagy méretű termében látható a művész 2012 óta futó sorozatának (Ember Embernek Embere) majdnem teljes összegzése. A magángyűjtőktől is visszakölcsönzött alkotásokkal együtt a kiállításon 34 mű szerepel – sajátos, „bogis” művészportrék a nemzetközi művészszcéna volt és jelenlegi nagyjairól. S bár G. Horváth mindenekelőtt festő, a művészi Pantheonjában szerepet kapnak szobrászok, fotósok, konceptuális alkotók és performerek is.

Szenes Zoltán volt vezérkari főnök: A NATO-nak át kell vennie a drónvédelemmel kapcsolatos ukrán tapasztalatokat

A NATO alapvetően jól reagált az orosz csali drónok lengyelországi berepülésére, de az eset rávilágít arra, hogy a szövetség még nem készült fel a dróntámadásokra. A NATO-t politikai széttagoltsága is hátrányba hozza az orosz hibrid hadviselés elleni védekezésben – erről is beszélt nekünk a védelmi szövetség déli parancsnokság volt logisztikai főnöke.