A rejtélyes Benford-törvény

A számok nem hazudnak  

Tudomány

Egyes, látszólag véletlenszerűen keletkezett adathalmazok nem is azok, aminek látszanak. A hamisítások leleplezésében segíthet Frank Benford találmánya.

Sokan a tavalyi amerikai elnökválasztás eredményei körüli vita kapcsán ismerték meg, mások nap mint nap találkoznak vele – például mert olyan Covid-statisztikákat használnak, ahol az adatok hitelességét a Benford-törvény segítségével próbálják lemérni. De vajon miről is szól e rejtélyes összefüggés, amely szerint bizonyos számadathalmazokban lényegesen gyakoribbak az 1-gyel (és még a 2-vel) kezdődő számok, mint a 6-tal vagy a 7-tel indulók? Mikor tehet csodát az ökölszabály, és hol vannak az alkalmazásának korlátai?

Isten nem kockázik?

A tudományos felfedezések néha egészen banális megfigyeléseknek köszönhetik születésüket. Például Simon Newcomb, a 19. században élt kanadai-amerikai matematikus-csillagász fejébe egyszer csak szöget ütött, hogy a könyvtárban található, akkoriban sűrűn forgatott logaritmustáblázatok első oldalai (ahol a számok 1-gyel, legfeljebb 2-vel kezdődtek) sokkalta megviseltebbek az utolsó oldalaknál – vagyis ezeket sűrűbben lapozzák fel. Newcomb felfedezését 1881-ben publikálta az American Journal of Mathematicsben: az ominózus oldalak amortizációjáról szóló megfigyelése önmagában még kevésnek bizonyult volna a publikációhoz, de erre alapozva egy frappáns és egyszerű, a tízes alapú logaritmuson alapuló képletet gyártott, amely megadta annak a valószínűségét, hogy egy bizonyos adathalmaz számai éppen egy bizonyos egész számmal kezdődjenek. Ebből pedig az következett, hogy míg mondjuk az 1-nek több mint 30 százalékos esélye van arra, hogy vele kezdődjön egy szám, addig a 2-nél ez már csak 17,6 százalék és így tovább – a 9-es már csak 4,58 százalékkal kerül az első helyi értékre.

Hogy Newcomb valamire ráhibázott, azt paradox módon felfedezésének sanyarú sorsa bizonyította: publikációja ugyan nem keltett feltűnést, sőt, eredménye feledésbe merült, ám ez lehetőséget kínált utódainak ahhoz, hogy újra és újra felfedezzék, hiszen a nagy adathalmazok tekintetében ez a tendencia mit sem változott a következő évszázadban. Frank Benford amerikai fizikus és elektromérnök 1938-ban újra publikálta az összefüggést, természetesen saját neve alatt – az sem világos, hogy akkor már ismerte-e vagy sem Newcomb dolgozatát.

Benford ugyanúgy a logaritmustáblázat megfigyelésével kezdte a maga cikkét, utána viszont hétköznapi területekről vett adathalmazokon is tesztelte megfigyelését. Összesen 20 229 adatot vizsgált meg tüzetesen: többek között 3259 település lakosságszámát, 335 folyó felszínét, kémiai elemek móltömegeit (azaz ugyanannyi számú részecskéből álló anyagmennyiségek tömegét), természetes számok hatványait, halálozási arányokat, költségadatokat, atomtömegeket és így tovább. Newcombhoz hasonlóan levezette az elődje által egyszer már publikált képletet, de annak meglátásait tovább is gondolta: Benford úgy vélte, hogy megmarad ez a „furcsaság” akkor is, ha az adatok reciprokát (1/x) vesszük, vagy éppen más számrendszerben írjuk fel azokat (a logaritmusban ilyenkor a 10-es alap helyett a számrendszer alapját kell használni a képletben). Mivel az ő cikke lényegesen nagyobb figyelmet kapott, mint elődjéé, a jelenséget 1938 óta Benford-törvénynek nevezik (vagy a históriai korrektségre ügyelve Newcomb–Benford-törvénynek).

Érdemes megemlíteni, hogy a törvény nem működik univerzálisan, bármilyen eloszlásra; vehetjük példának az emberek centiméterben kifejezett testmagasságát, s lám, az adatok túlnyomó többsége 1-gyel kezdődik, és csak kevés 2-es akad. Hasonlóképpen a mesterségesen szűkre szabott skála akadályozza, hogy az emberek intelligenciahányadosának első számjegye kövesse ezt az eloszlást. Ha pedig a kihúzott lottószámokat figyeljük, idővel észre fogjuk venni, hogy azok az egyenletes eloszlást követik.

A cikk további része csak előfizetőink számára elérhető.
Soha nem volt nagyobb szükség önre! A sajtó az olvasókért szabad, és fennmaradásunk előfizetőink nélkül nem lehetséges. Legyen előfizetőnk, tegyen egy próbát velünk és támogassa a demokratikus és liberális Magyarország ügyét!

Figyelmébe ajánljuk

Klasszissal jobban

  • - minek -

Az utóbbi évtizedek egyik legnagyszerűbb poptörténeti fejleménye volt a Saint Etienne 1990-es létrejötte, no meg három és fél évtizedes, nagyjából töretlen, egyenletesen magas színvonalú pályafutása – mindez azonban most lezárulni tűnik.

Közös térben, külön utakon

A gesztusfestészetet helyezi fókuszba a hajdani Corvin Áruház épületében működő Apollo Gallery legújabb kiállítása, amely három figyelemre méltó kortárs absztrakt művész világát hozza össze.

Anyu vigyázó tekintete

Kamasz lánynak lenni sosem könnyű, de talán még nehezebb egy Himalájában fekvő bentlakásos iskolában a 90-es években. Mira (Preeti Panigrahi) eminens tanuló: egyenszoknyája mindig megfelelő hosszúságú (szigo­rúan térd alá ér), jegyei példásak, gondolatait tanulmányai és sikeresnek ígérkező jövője töltik ki.

Éden délen

  • - turcsányi -

Egy évvel a The Highwaymen együttes megalakítása után, 1986-ban kijött egy tévéfilm – nyilván népszerűsítendő az úgynevezett outlaw country muzsika valaha élt négy legnépszerűbb alakjával összerántott truppot.

Hol nem volt

Tökéletesen passzol a két éve Szemle Plusz néven újragondolt Városmajori Színházi Szemle programjához a nagyváradiak Csárdáskirálynője. Már csak azért is, mert tavaly a Színházi Kritikusok Céhének tagjaitól ez a produkció kapta meg a legjobb szórakoztató előadásnak járó szakmai elismerést. Novák Eszter rendezése mégsem működött ezen a vihar utáni, esős nyárestén.

Ilyen tényleg nincs Európában

„És jelentem, hogy szeptember elsején be lehet menni a bankba és föl lehet venni a 3 százalékos otthonteremtési hitelt, családi állapottól, lakhelytől függetlenül, és a legfiatalabbak is tulajdonosok lesznek a saját otthonukban. Én nem tudom, hogy ez lelkesítő cél-e bárkinek, de azt biztosan mondhatom, hogy sehol Európában olyan nincs, hogy te barátom, eléred a 18 éves kort, és ha úgy döntesz, hogy saját otthonban akarsz lakni, akkor az lehetséges.”