![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Одна из удобных интегральных метрик количества подтасовок. Когда большие количества малограмотных людей начинают неумело выдумывать цифры из головы, у них постепенно начинают накапливаться излишки красивых цифр (обычно, нулей и пятерок). В результате, частоты последних цифр начинают значительно отклоняться от теоретически ожидаемой (0.1). Эти отклонения можно затем оценить при помощи метода хи-квадрат (он работает с квадратами отклонений от теоретически ожидаемых абсолютных частот). Можно сравнить по этому показателю президентские кампании разных лет. Сделал таблицу (число степеней свободы везде 9, писать не стал) и нарисовал картинку. Общий вывод печален. Несмотря на значительные успехи по ряду направлений, мы не приблизились даже к далеко не безупречным результатам 2000 г., что уж там говорить о каком-то идеальном мире, в котором царствуют стохастические процессы, и люди не ходят голосовать строем.

NB! Нет, это был не ggplot2.

NB! Нет, это был не ggplot2.
Год | N | X2 | p-value |
2000 | 91306 | 17.962 | p = 0.03562 |
2004 | 95777 | 47.292 | p = 3.463 x 10-7 |
2008 | 96612 | 96.036 | p < 2.2 x 10-16 |
2012 | 95414 | 42.484 | p = 2.68 x 10-6 |
2018 | 97694 | 35.029 | p = 5.89 x 10-5 |