Muraközy Balázs-Nagy Viktor

Adják az adatbankot

A KSH adatainak nyilvánosságáról

  • Muraközy Balázs
  • Nagy Viktor
  • 2005. március 17.

Publicisztika

Biztos az olvasóval is előfordult már, hogy egy kis faluban vásárolt, és meglepetten tapasztalta, hogy az árak magasabbak, mint amire számított. Pedig a kistelepüléseken élő emberek jövedelme alacsonyabb, sőt az összetartásra is hajlamosabbak, mint a városiak.

Érdekes kérdés, hogy mekkora pontosan ez az árkülönbség, magyarázható-e a magasabb költségekkel, vagy ezek a boltok (esetleg törvényellenesen) visszaélnek monopolerejükkel. Ennek a problémának a vizsgálatához ideális kiindulópontnak tűnt a Központi Statisztikai Hivatal inflációs adatbázisa. Amikor azonban egyikünk megpróbálta elkérni ezt az adat-bázist a KSH-tól, csak annyit tudattak vele, hogy az nem nyilvános. Az adatbázis nélkül le kellett mondani a probléma elemzéséről. Nem csak mi járunk így. Sok kutató munkáját akadályozta vagy tette lehetetlenné a KSH hozzáállása. Ebben a cikkben a mellett érvelünk, hogy a KSH-nak az adatok visszatartására nincsen sem legitim indoka, sem joga.

*

A modern társadalomtudományok fejlődésének fontos feltétele, hogy egyre jobb minőségű és egyre részletesebb adatok álljanak a kutatók rendelkezésére. E nélkül nem tudnánk érdemben vizsgálni például a társadalmi egyenlőtlenségeket, a gazdasági növekedést vagy a munkanélküliséget meghatározó tényezőket. A társadalommal kapcsolatos adatok hasonlóan fontos szerepet játszhatnának abban is, hogy előre lehessen jelezni a társadalom- vagy gazdaságpolitikai intézkedések hatásait.

Hazánk statisztikai rendszere megfelel azoknak a követelményeknek, amelyek egy ilyen fejlettségű országgal szemben támaszthatók. Számos olyan adatbázis létezik, amely segítséget nyújthat akár a kutatók, akár a társadalom- vagy gazdaságpolitikai intézkedések elemzői számára. Egy ilyen adatbázis előállítása nem olcsó: a 2001-es népszámlálás például 9 milliárd forintba került. Éppen ezért fontos lenne, hogy az adatok gazdái (például a KSH) ezeket az adatokat valamilyen jól szabályozott eljárás keretében a kutatók rendelkezésére bocsássák. A valóságban a helyzet elkeserítő. Bizonyos adatok megszerzéséért évekig kell küzdeni, és az, hogy ki kapja meg őket, gyakran attól függ, hogy az illető személy vagy intézmény éppen milyen viszonyban van a KSH döntéshozóival. Ráadásul aki megszerzi az adatokat, annak általában elég sokat kell fizetnie. Véleményünk szerint ez a gyakorlat súlyos károkat okoz a magyar társadalomkutatás és közvetve az egész társadalom számára.

Mielőtt a KSH tevékenységének elemzésébe kezdenénk, lássuk, milyen típusú adatokra van szüksége egy társadalomkutatónak.

Mondjuk szeretnénk megvizsgálni azt, hogy milyen hatással van az oktatás az emberek jövedelmére. Ez a kérdés fontos a tudománynak, de társadalompolitikai szempontból is hasznos lenne, ha például a felsőoktatási expanzióról igényes elemzések alapján dönthetnénk. Mire van ehhez szükség? A kérdéshez nyilván nem elegendő az olyan adatok ismerete, amelyeket a KSH az évkönyveiben nyilvánosságra szokott hozni, vagyis hogy az emberek átlagosan mennyit keresnek. Még az sem elegendő, ha azt tudjuk, hogy a különböző végzettségű emberek átlagosan mennyit keresnek, mert a kereseti különbségek adódhatnak abból is, hogy a különböző végzettségű emberek összetétele más: a magasabb végzettségű emberek inkább nagyobb városokban laknak, inkább külföldi tulajdonban lévő vállalatoknál dolgoznak stb. Ahhoz, hogy kiszűrhessük az összetételhatásokat, és kimutathassuk az oksági összefüggéseket, személyszintű adatokra van szükségünk. A társadalomtudományi kutatásoknak nem kell azonosítaniuk az egyes embereket: nincs szükség a válaszadó nevére vagy címére; arra azonban igen, hogy tudjuk, a válaszadó melyik városban lakik, milyen vállalatnál dolgozik, mi a legmagasabb végzettsége, és mennyit keres. A kutatáshoz tehát személyszintű, de anonim adatok kellenek.

*

Tegyük fel, hogy két kutatót ugyanaz a kérdés érdekel: például, hogy az emberek szerint mennyire jó a közbiztonság Magyarországon. Ehhez adatra vágynak, s így mindketten több száz kilométert utaznak, hogy ugyanannak az embernek feltegyék e kérdést. Ekkor az egyikük útja fölösleges volt, hiszen elmondhatnák egymásnak az illető válaszát. Ha tanulmányukhoz több száz vagy több ezer válaszra van szükségük, akkor könnyen lehet, hogy egyiküknek sem lesz elég pénze a kutatásra. Elképzelhető viszont, hogy a két kutatónak együtt már megéri elkészíteni a felmérést, hiszen így mindkettőjüknek csak a költségek felét kell állnia. A fenti példa az információnak azt a tulajdonságát szemlélteti, hogy függetlenül attól, milyen sokan használják fel, mindig megmarad. Ezt a közgazdászok úgy mondják, hogy az információ közjószág jellegű. Vagyis elég egyszer megfizetni az előállítás költségeit - ami viszont gyakran igen magasra rúg.

Ilyen esetekben szükség van valamilyen intézményre, amely összegzi az egyes kutatók vagy gazdasági szereplők információigényét, és felveszi a szükséges adatokat. Ezek az intézmények gyakran nem piaci alapon szerveződnek, a piac mint intézmény korlátai miatt. Ezért indokolt az állami beavatkozás. És minő szerencse: hazánkban az állam létre is hozott egy intézményt erre a célra. A KSH már csak azért is érdekes intézmény, mert az általa elkészített felmérések annyira nagy költséggel járnak, hogy senki más se szeretné őket megismételni. Pedig az adatait sokan örömmel használnák, és még fizetnének is érte valamilyen tisztességes összeget.

Ha ez valóban így van, akkor miért olyan nehéz hozzáférni a KSH adataihoz? Ha egyszer az állam kifizette az adatfelvételt, mi érdeke fűződne hozzá, hogy ne kapja meg őket bárki, akinek szüksége van rájuk? A személyiségi jogok védelme miatt - gondolhatnánk. De, mint láttuk, a társadalomkutatáshoz anonim adatokra van szükség, ezért az ilyen kutatás nem sérti a személyiségi jogokat. Mind Nyugaton, mind egyes hazai kutatóintézetekben (ilyen például a Tárki) lehetőség van az adatok megszerzésére. Csak előtte törlik belőlük azokat az információkat, amelyek alapján azonosíthatóak lennének az egyes válaszadók. Néha nem elegendő csak a válaszadó nevét és címét eltüntetni: elképzelhető, hogy egy kis faluban egyetlen kocsma működik, és ha az adatok tartalmazzák az emberek foglalkozását, akkor a kocsmáros jövedelmét is megtudhatja az, aki megkapja az adatokat. Ezek a problémák ke-zelhetők: egyes megfigyeléseket ki lehet hagyni, egyes kategóriákat össze lehet vonni. A világban számos módszert alakítottak ki erre.

A kérdés törvényi szabályozása - legalábbis a mi értelmezésünkben - nem sok kétséget hagy. A statisztikáról szóló, 1993. évi XLVI. törvény kimondja, hogy a statisztikai szolgálathoz tartozó szervek által végzett adatgyűjtések eredményei nyilvánosak; kivételt képez az államtitok, a szolgálati titok és az úgynevezett egyedi adat. Utóbbi az olyan adat, amelyet valamilyen adatszolgáltatóval - például emberrel vagy vállalattal - kapcsolatba lehet hozni; vagyis az adat szolgáltatóját azonosítani lehet, mert kiderül a neve vagy a címe. A törvény a továbbiakban előírja, hogy feldolgozás után a KSH is köteles anonimizálni az adatokat. Ezért az ilyen formában tárolt adatok - definíció szerint - már nem tekinthetők egyedinek. Vagyis a főszabály szerint nyilvánosak, és - értelmezésünk szerint - a KSH törvénysértést követ el, ha nem adja ki őket. Ezt a véleményünket megerősíti a statisztikai törvény indoklása is, mely szerint: "Egyébként az adatok az egyedi azonosítóktól történő megfosztás után elemi soronként átadhatók." Azok a személyszintű adatok, amelyekre a társadalomkutatóknak szükségük van, nyilvánosak, és ezért a KSH köteles kiadni őket.

A kérdés mármost az, hogy ezek után a KSH miért nem teszi ezt meg? A KSH bürokratikus intézmény, dolgozóinak saját céljai vannak. Ezek közül az egyik az, hogy a hivatal vezetői, alkalmazottai szeretik érezni (és éreztetni), hogy döntéseik fontosak. Ezért körüludvaroltatják magukat a kutatókkal, majd diszkrecionális módon döntenek arról, hogy kinek a kérését teljesítik. Másrészt a KSH mint intézmény fontosságát (és létjogosultságát) alátámasztja, ha minél több feladatról be lehet mutatni, hogy csak ők képesek ellátni. Amennyiben a személyiszintű adatok könnyen hozzáférhetőek lennének, akkor mások is (esetleg olcsóbban és jobb minőségben) képesek lennének olyan mutatók kiszámítására és olyan elemzések elvégzésére, amelyeket jelenleg csak a KSH tud letenni az asztalra. Minden bürokratikus intézmény ilyen módon viselkedik - ám ha megfelelő törvényeket hoznak, s be is tartatják őket, akkor javítani lehet a helyzeten.

Eddig amellett érveltünk, hogy az adatokhoz minél több embernek kell hozzáférnie, hiszen minél többen használják őket, annál több társadalmi haszon keletkezik. Fontos kérdés viszont az, hogy mekkora legyen az adatok ára. Netán ingyenesek legyenek-e?

*

E kérdés megválaszolására létezik egy fogalom: a "nélkülözhetetlen eszköz". Ezek olyan eszközök, amelyek optimális száma a társadalom egésze számára egy darab: mint például az M3-as autópálya, az inflációs adatfelvétel vagy a népszámlálás. Az ilyen eszköz előállítása egyrészt nagyon magas egyszeri költséggel jár, másrészt közjószág jellegű. A vele való bánásmódra az egyenlő hozzáférés biztosítását és a tevékenységek vállalaton belüli szétválasztását szokás javasolni. Így az első lépésben arra köteleznék a KSH-t, hogy mindenki számára jól kiszámítható körülmények mellett tegye elérhetővé a rendelkezésre álló adatokat. A második lépésben a hivatal adatfelvételi és egyéb tevékenységét elválasztanák egymástól, ami biztosítaná, hogy a kiszámítható körülmények kívülről is megfigyelhetők, és így elemezhetők, számon kérhetők legyenek. Így kerülhetjük el, hogy a nélkülözhetetlen eszközt tulajdonló vállalat (egyén) indokolatlanul magas áron, azaz monopóliumként biztosítsa a hozzáférést.

A feladatok szétválasztásával az egyik problémát, a hozzáférést megoldottuk. Marad az a kérdés, hogy ki mennyit fizessen a nélkülözhetetlen eszközért - hiszen amíg csak egy vállalat biztosít egy adott szolgáltatást, addig fennáll a monopolárazás veszélye. Ez a dilemma, habár a KSH vonatkozásában is élő, sokkal szemléletesebb a Meteorológiai Intézet esetében, amelytől az állami pénzen előálló adatbázisokat - néhány hónapja - borsos áron, de magánszemélyek is megvehetik. (Korábban ugyanezek az adatok ingyenesek voltak.) A monopolárazás az állami monopoljogokkal bíró vállalatok esetében több okból is aggályos. Nem- csak arról van szó ugyanis, hogy a monopólium miatt magasabb árakat szab a vállalat, és így az optimálisnál kevesebben veszik meg termékét, de arról is, hogy valójában az állam állja a termék költségeinek nagy részét. A társadalmi jólét szempontjából az lenne az optimális ár, ha csak az adatok átadásának közvetlen költségét kellene kifizetni; az e feletti ár káros és egyfajta bújtatott adónak is tekinthető. A KSH viszont nem fog magától társadalmilag optimális árat elkérni. Célszerű lenne tehát valamilyen árszabályozást kialakítani.

Az is izgalmas kérdés, hogy jogos-e a többi állami intézettől is a piaci árat elkérni, vagy számukra esetleg máshogyan kellene árazni. Nos, az állami pénzekből, közjószágként előállított szolgáltatások éppen azért álltak elő, hogy valamilyen közösségi igényt kielégítsenek. Hasonló okból tartanának igényt a kutatók is az adatfelvételekre, hiszen ők is valamilyen közjószágot állítanak elő (a tudást). Vagyis akkor, amikor a költségvetésben a KSH-nak megszavaznak egy összeget, hogy adatbázist építsen, akkor ennek éppen az a célja, hogy (többek közt) a másik állami intézet keresletét is kielégítsék (további költségek nélkül). Ha ez nem történik meg, akkor pedig a Magyar Tudományos Akadémia büdzséjében kellene erre keretet biztosítani. Mivel a kutatóintézetek alulfinanszírozottak, ezért rájuk bízni a pénzek adott célra való felhasználását meggondolatlanság, mert ők más feladatokat fontosabbnak éreznek. Ezért a helyes megoldás az lenne, ha az adatbázist építőknél jelenne meg a pénz legnagyobb része, az adatokat felhasználó további állami intézetek pedig az adatokhoz különösen olcsón juthatnának hozzá. (Az ingyenességet elkerülendő jobb lenne, ha valamilyen, a forrásaikkal arányban álló árat nekik is fizetniük kellene.)

Az adatokhoz való hozzáférés rendezése után tehát fontos annak körülményeit, az adatok árát is szabályozni. Miután a piac erre megfelelő módon nem képes, ezt valamilyen szabályozó hatóságra kellene bízni. Ez ugyan szintén nem tudná garantálni, hogy majd eltalálná a megfelelő árazást, de legalább megközelítené. A kérdéssel foglalkozó kutatók pedig különböző becslésekkel segíthetnék a munkáját. Különösen, ha megkapnák a becsléshez szükséges adatokat is.

A szerzők közgazdászok.

Figyelmébe ajánljuk