Dziś pokażę, jak za pomocą prawa Benforda można łapać oszustów podatkowych.
Yyy, prawo Benforda?
Jest to całkiem interesująca (i nieintuicyjna) właściwość liczbowa mówiąca, że częstość występowania danej cyfry na początku wyniku pomiaru jest nierównomierna i zależy od wartości danej cyfry: czym mniejsza cyfra, tym większe prawdopodobieństwo, że pojawi się ona na początku wyniku pomiaru, przy czym warunkiem koniecznym jest, aby dany pomiar rozciągał się na więcej niż jeden rząd wielkości (wyjątkiem jest oczywiście cyfra zero, od której nie zaczyna się żadna liczba - w ułamkach typu 0.981247613 początkowe zero pomijamy, jako że jest ono jedynie informacją o tym, że mamy do czynienia z ułamkiem - najbardziej znaczącą cyfrą jest tu dziewiątka).
Teraz spróbujemy przełożyć to na ludzki:
Najwięcej wyników pomiarów zaczyna się od jedynki, w następnej kolejności mamy wyniki zaczynające się od dwójki, trójki i tak dalej. Najrzadziej wyniki pomiarów zaczynają się od dziewiątki. Zasada ta dotyczy wyłącznie pomiarów rozciągających się na kilka rzędów wielkości - czym więcej różnych rzędów wielkości, tym lepiej.
I tak na przykład pomiary temperatury ludzkiego ciała (żywego!) nie podlegają tej regule, ponieważ wynik (w stopniach Celsjusza) waha się w niewielkim zakresie, jest zawsze dwucyfrowy. Ale już na przykład liczebność populacji w miastach świata podlega prawu Benforda, ponieważ miasto może mieć zarówno 10,000 jak i 10,000,000 mieszkańców.
Inne przykłady pomiarów, których wyniki podlegają prawu Benforda, to: kwoty rachunków (rozmaitych: za prąd, gaz, ze spożywczaka, z knajpy itd), numery domów w adresach, ceny akcji giełdowych, długości rzek, wartości stałych matematycznych i fizycznych, wysokości budynków, metraże mieszkań, kwoty wypłat z polis ubezpieczeniowych i wiele, wiele innych.
Żeby było zabawniej, nie ma najmniejszego znaczenia jakich jednostek użyjemy do wykonania pomiarów. A więc możemy sporządzić listę tysiąca najwyższych budynków świata z wysokościami podanymi w metrach, calach lub sążniach i w każdym przypadku częstotliwość pojawiania się jedynki na początku pomiaru będzie podobna (i największa spośród wszystkich dziewięciu cyfr).
Chociaż na pierwszy rzut oka (i ucha) brzmi to nieco podejrzanie, faktycznie tak właśnie jest. Nieco ponad 30% wszystkich pomiarów zaczyna się od jedynki (która - po wyeliminowaniu zera - stanowi przecież tylko 11.1% cyfr). A więc jedynka pojawia się na początku prawie trzykrotnie częściej niż wynikałoby to z prostej intuicji. Dwójka pojawia się na początku w około 17.6% przypadków, trójka - w 12.5% przypadków i tak dalej aż do dziewiątki, od której zaczyna się zaledwie 4.6% wszystkich wyników pomiarów.
Szansa na to, że jakaś wielkość będzie podlegać prawu Benforda zależy od tego, czy jej losowość jest multiplikatywna czy addytywna. Innymi słowy, jeżeli jakaś wielkość zmienia się losowo za pomocą mnożenia, wówczas najpewniej będzie podlegać prawu Benforda. Przykład: ceny akcji na giełdzie. Zakładając, że dzisiejsza cena jest wynikiem przemnożenia ceny wczorajszej przez losową wartość między 0.95 a 1.05, po wielu dniach dostaniemy listę cen akcji podlegającą prawu Benforda. Ale już na przykład ilość uderzeń serca w ciągu doby, którą można wyliczyć jako ilość uderzeń serca w ciągu każdej minuty, następnie zsumowanych, już prawu Benforda nie podlega.
Jeżeli ktoś jeszcze nie wierzy, niech spróbuje wygenerować sobie listę całkowitych potęg liczby 2, a następnie spojrzy na pierwszą cyfrę: 1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 7, 1, 2, 5, 1, 2, 4, 9, 1, 3, 7, 1, 2, 5, 1, 2, 4, 9, 1, 3, 7, 1, 2, 5, 1, 2, 4, 9, 1, 3, 7, 1, 3, 6, 1, 2, 4, 9, 1, 3, 7, 1, 3, 6, 1, 2, 4, 9, 1, 3, ...
Wśród pierwszego miliona potęg dwójki jedynka pojawia się na początku dokładnie 301030 razy, a więc stanowi 30.1% przypadków. Od dziewiątki zaczyna się zaledwie 45757 liczb spośród owego miliona, czyli niecałe 4.6%. Wszystko się zgadza.
Przejdźmy teraz do drugiej części dzisiejszego wpisu.
Wykrywanie oszustów.
Jednym z najpopularniejszych sposobów na oszukanie fiskusa jest wrzucanie w koszty firmowe nieistniejących pozycji. Wystawiamy lewą fakturkę, wrzucamy ją w system i gotowe. Płacimy mniejszy podatek, wszyscy są zadowoleni (oprócz fiskusa, ale on przecież o niczym nie wie).
Dowcip polega na tym, że kwoty na fakturach również podlegają prawu Benforda. A oszust odruchowo będzie starał się rozłożyć te kwoty "równomiernie", a więc z częstotliwością pierwszej cyfry w okolicach 11%. Po pewnym czasie (miesiące? lata?) da się te faktury przepuścić przez prościutki analizator i sprawdzić, czy tych zaczynających się od jedynki jest mniej więcej 30% czy nie. Jeżeli jest ich dużo mniej (na przykład 10-15%) to prawie na pewno warto takiego delikwenta poddać kontroli fiskalnej i zgarnąć do miecha zaległe podatki wraz z odsetkami i karniakiem.
Od razu zaznaczam, że nie warto oszukiwać fiskusa i nie polecam generowania fałszywych faktur w taki sposób, żeby wyżej opisana analiza niczego nie wykazała.
Jeżeli chcesz do komentarza wstawić kod, użyj składni:
[code]
tutaj wstaw swój kod
[/code]
Jeżeli zrobisz literówkę lub zmienisz zdanie, możesz edytować komentarz po jego zatwierdzeniu.