A rejtélyes Benford-törvény

A számok nem hazudnak  

Tudomány

Egyes, látszólag véletlenszerűen keletkezett adathalmazok nem is azok, aminek látszanak. A hamisítások leleplezésében segíthet Frank Benford találmánya.

Sokan a tavalyi amerikai elnökválasztás eredményei körüli vita kapcsán ismerték meg, mások nap mint nap találkoznak vele – például mert olyan Covid-statisztikákat használnak, ahol az adatok hitelességét a Benford-törvény segítségével próbálják lemérni. De vajon miről is szól e rejtélyes összefüggés, amely szerint bizonyos számadathalmazokban lényegesen gyakoribbak az 1-gyel (és még a 2-vel) kezdődő számok, mint a 6-tal vagy a 7-tel indulók? Mikor tehet csodát az ökölszabály, és hol vannak az alkalmazásának korlátai?

Isten nem kockázik?

A tudományos felfedezések néha egészen banális megfigyeléseknek köszönhetik születésüket. Például Simon Newcomb, a 19. században élt kanadai-amerikai matematikus-csillagász fejébe egyszer csak szöget ütött, hogy a könyvtárban található, akkoriban sűrűn forgatott logaritmustáblázatok első oldalai (ahol a számok 1-gyel, legfeljebb 2-vel kezdődtek) sokkalta megviseltebbek az utolsó oldalaknál – vagyis ezeket sűrűbben lapozzák fel. Newcomb felfedezését 1881-ben publikálta az American Journal of Mathematicsben: az ominózus oldalak amortizációjáról szóló megfigyelése önmagában még kevésnek bizonyult volna a publikációhoz, de erre alapozva egy frappáns és egyszerű, a tízes alapú logaritmuson alapuló képletet gyártott, amely megadta annak a valószínűségét, hogy egy bizonyos adathalmaz számai éppen egy bizonyos egész számmal kezdődjenek. Ebből pedig az következett, hogy míg mondjuk az 1-nek több mint 30 százalékos esélye van arra, hogy vele kezdődjön egy szám, addig a 2-nél ez már csak 17,6 százalék és így tovább – a 9-es már csak 4,58 százalékkal kerül az első helyi értékre.

Hogy Newcomb valamire ráhibázott, azt paradox módon felfedezésének sanyarú sorsa bizonyította: publikációja ugyan nem keltett feltűnést, sőt, eredménye feledésbe merült, ám ez lehetőséget kínált utódainak ahhoz, hogy újra és újra felfedezzék, hiszen a nagy adathalmazok tekintetében ez a tendencia mit sem változott a következő évszázadban. Frank Benford amerikai fizikus és elektromérnök 1938-ban újra publikálta az összefüggést, természetesen saját neve alatt – az sem világos, hogy akkor már ismerte-e vagy sem Newcomb dolgozatát.

Benford ugyanúgy a logaritmustáblázat megfigyelésével kezdte a maga cikkét, utána viszont hétköznapi területekről vett adathalmazokon is tesztelte megfigyelését. Összesen 20 229 adatot vizsgált meg tüzetesen: többek között 3259 település lakosságszámát, 335 folyó felszínét, kémiai elemek móltömegeit (azaz ugyanannyi számú részecskéből álló anyagmennyiségek tömegét), természetes számok hatványait, halálozási arányokat, költségadatokat, atomtömegeket és így tovább. Newcombhoz hasonlóan levezette az elődje által egyszer már publikált képletet, de annak meglátásait tovább is gondolta: Benford úgy vélte, hogy megmarad ez a „furcsaság” akkor is, ha az adatok reciprokát (1/x) vesszük, vagy éppen más számrendszerben írjuk fel azokat (a logaritmusban ilyenkor a 10-es alap helyett a számrendszer alapját kell használni a képletben). Mivel az ő cikke lényegesen nagyobb figyelmet kapott, mint elődjéé, a jelenséget 1938 óta Benford-törvénynek nevezik (vagy a históriai korrektségre ügyelve Newcomb–Benford-törvénynek).

Érdemes megemlíteni, hogy a törvény nem működik univerzálisan, bármilyen eloszlásra; vehetjük példának az emberek centiméterben kifejezett testmagasságát, s lám, az adatok túlnyomó többsége 1-gyel kezdődik, és csak kevés 2-es akad. Hasonlóképpen a mesterségesen szűkre szabott skála akadályozza, hogy az emberek intelligenciahányadosának első számjegye kövesse ezt az eloszlást. Ha pedig a kihúzott lottószámokat figyeljük, idővel észre fogjuk venni, hogy azok az egyenletes eloszlást követik.

A cikk további része csak előfizetőink számára elérhető.
Soha nem volt nagyobb szükség önre! A sajtó az olvasókért szabad, és fennmaradásunk előfizetőink nélkül nem lehetséges. Legyen előfizetőnk, tegyen egy próbát velünk és támogassa a demokratikus és liberális Magyarország ügyét!

Figyelmébe ajánljuk

A saját határain túl

Justin Vernon egyszemélyes vállalkozásaként indult a Bon Iver, miután a zenész 2006-ban három hónapot töltött teljesen egyedül egy faházban, a világtól elzárva, egy nyugat-wisconsini faluban.

Az űr az úr

Az 1969-ben indult Hawkwind mindig a mainstream csatornák radarja alatt maradt, pedig hatása évtizedek óta megkérdőjelezhetetlen.

Pincebogarak lázadása

  • - turcsányi -

Jussi Adler-Olsen immár tíz kötetnél járó Q-ügyosztályi ciklusa a skandináv krimik népmesei vonulatába tartozik. Nem a skandináv krimik feltétlen sajátja az ilyesmi, minden szak­ágnak, műfajnak és alműfajnak van népmesei tagozata, amelyben az alsó kutyák egy csoportozata tengernyi szívás után a végére csak odasóz egy nagyot a hatalomnak, az efeletti boldogságtól remélvén boldogtalansága jobbra fordulását – hiába.

Luxusszivacsok

A Molnár Ani Galéria 2024-ben megnyitott új kiállítótere elsősorban hazai, fiatal, női alkotókra fókuszál, Benczúr viszont már a kilencvenes évek közepétől jelen van a művészeti szcénában, sőt már 1997-ben szerepelt a 2. Manifestán, illetve 1999-ben (más művészekkel) együtt a Velencei Biennálé magyar pavilonjában.

Égen, földön, vízen

Mesék a mesében: mitikus hősök, mágikus világ, megszemélyesített természet, a szó szoros értelmében varázslatos nyelv. A világ végén, tajtékos vizeken és ég alatt, regei időben mozognak a hősök, egy falu lakói.

Visszaszámlálás

A Ne csak nézd! című pályázatot a Free­szfe, az Örkény Színház, a Trafó és a Jurányi közösen hirdették meg abból a célból, hogy független alkotóknak adjanak lehetőséget új előadások létrehozására, a Freeszfére járó hallgatóknak pedig a megmutatkozásra. Tematikus megkötés nem volt, csak annyiban, hogy a társulatoknak társadalmilag fontos témákat kellett feldolgozniuk. A nyertesek közül a KV Társulat pályamunkáját az Örkény Színház fogadta be.

Mészáros Lőrinc egy történet

A Mészáros Lőrinc című történetnek az lenne a funkciója, hogy bizonyítsa, létezik frissen, ön­erejéből felemelkedett nemzeti tőkésosztály vagy legalább réteg, de ha még az sem, pár markáns nemzeti nagytőkés. Valamint bizonyítani, hogy Orbán Viktor nem foglalkozik pénzügyekkel.

„Mint a pókháló”

Diplomáját – az SZFE szétverése miatt – az Emergency Exit program keretein belül Ludwigsburgban kapta meg. Legutóbbi rendezése, a Katona József Színházban nemrég bemutatott 2031 a kultúra helyzetével és a hatalmi visszaélések természetével foglalkozik. Ehhez kapcsolódva toxikus maszkulinitásról, a #metoo hatásairól és az empátiadeficites helyzetekről beszélgettünk vele.

Nem a pénz számít

Mérföldkőhöz érkezett az Európai Unió az orosz energiahordozókhoz fűződő viszonya tekintetében: május elején az Európai Bizottság bejelentette, hogy legkésőbb 2027 végéig minden uniós tagállamnak le kell válnia az orosz olajról, földgázról és nukleáris fűtőanyagról. Ha ez megvalósul, az energiaellátás megszűnik politikai fegyverként működni az oroszok kezében. A kérdés az, hogy Magyar­ország és Szlovákia hajlandó lesz-e ebben együttműködni – az elmúlt években tanúsított magatartásuk ugyanis ennek éppen az ellenkezőjét sugallja.