Закон Бенфорда

Понимание мира через данные Статистика и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов Чат: @rationalchat https://rationalnumbers.ru По рекламе: @kgreenmedia В реестре: vk.cc/cKf8WS Автор: @kirillgreen

закон бенфордафорензикафальсификации

Этот закон описывает то, как часто цифры будут первыми в числах из большого массива значений в реальной жизни. Например, единица в 6 раз чаще восьмёрки будет встречаться в начале чисел, что показано на первой диаграмме. По горизонтали — первые значащие цифры, по вертикали — вероятность их появления

Контринтуитивность закона позволяет выявлять мошенничества с финансами, фальсификации на выборах или подтасовки статистики. Если распределение цифр в массиве данных значительно отличается от распределения Бенфорда — числа с большой вероятностью имели искусственную природу. Например, при помощи этого закона пользователь с Reddit указал на подтасовки в данных о заболеваемости короной в России. На третьем изображении — его визуализация распределения цифр в количестве новых заболеваний коронавирусом в Германии, Великобритании, США и России

Необходимо понимать, что закон верен не для всех распределений. Он не работает, если заданы минимальные и максимальные значения или у величин только один или два порядка значений. Например, распределение цифр в списке компаний с доходом от 50 тыс до 100 тыс $ или показатели IQ у взрослых не будут под него подходить

В последнем вложении — распределение цифр в числе голосов, поданных за кандидатов на президентских выборах в США, по округам

Столбчатая диаграмма распределения первых значащих цифр по закону Бенфорда: частота появления цифр 1–9, заметно высокая доля единиц по сравнению с другими цифрами.
Стандартная диаграмма распределения Бенфорда: доля первых значащих цифр от 1 до 9.
Четыре мелкие диаграммы распределения первых значащих цифр в новых случаях COVID по странам: Германия, Великобритания, США и Россия, с наложенной теоретической кривой Бенфорда.
Сравнение распределений первых цифр новых случаев COVID в нескольких странах и теоретической кривой.
Коллаж с графиками распределения первых цифр голосов по округам США для Трампа и Байдена, с визуализацией и наложением теоретической линии Бенфорда для выявления аномалий.
Визуализация распределения первых цифр голосов на выборах в США для выявления отклонений от закона Бенфорда.

Дискуссия

L A
и всё
L A
всё - всё. читайте пока не поймете, я же написал. мне что, вам курс алгебры прочитать?
L A
я все сформулировал. вы просто понять, о чем речь не в состоянии.
L A
там все написано, читайте снова и снова пока не поймете. если не поймете - тогда ой.
L A
ну нет так нет. вы же первый начали.
L A
я все написал. вы не поняли. это ваша проблема. я не виноват, что вы не поняли.
Том Стерлинг
Второй раз уже срач после поста этого закона. Я, как гуманитарий, не верю в эти ваши циферьки, сила за буквами! 💪
цифровой самурай
Том Стерлинг
Второй раз уже срач после поста этого закона. Я, как гуманитарий, не верю в эти ваши циферьки, сила за буквами! 💪
эффект Даннинга-Крюгера ничто не переплюнет
цифровой самурай
Том Стерлинг
сила за буквами
вы имеете в виду буквы m и a?
Maria Ts
L A
можно даже не проверять. Даже базовые знания математики на уровне школьной программы позволяют не верить в эту ерунду.
Умный человек не будет отрицать непонятное, а сначала почитает научные статьи. Я 15 лет изучаю применение этого закона. Начала с физики - Malcolm Sambridge и его коллеги из лаборатории проверили выполнение Закона Бенфорда для более чем 750 тыс. чисел. Примеры таких явлений: глубина землетрясений (обработано почти 250 тыс. событий, случившихся в период с 1989 по 2009 гг.), яркость достигающих Земли гамма-излучений (1451 наблюдение, 2008-2009), частота вращения пульсаров (1861 наблюдение), количество случаев инфекционных заболеваний (987, данные ВОЗ, 2007) (M. Sambridge. Benford’s Law in the Natural Sciences, Geophysical research letters, vol. 37, 2010). Есть несколько книжек Марка Нигрини, статистика, который применял закон для проверки ошибок в госстатистике, потом в налоговых декларациях и уже потом для выявления фальсификаций финансовой отчетности. Работала с представителями большой четверки, которые применяют закон при проверке отчетности компаний. Сейчас очень много информации, гораздо больше, чем раньше. Нетрудно найти
Присоединиться к обсуждению →

Читайте так же