![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
По следам записей о МК-симуляции распределения явки (см. [1] и [2]) по предложению [Андрея Мятлева] попробовал, основываясь на тех же принципах, провести симуляцию более сложного распределения -- численности голосующих по бинам явки, что позволило бы получить минимальные оценки фальсификаций на выборах. Результаты таковы.
Если сложить пики, выступающие за три стандартных отклонения от среднего по МК-симуляции, то на них приходится 780142.7 (780143) голоса, или ~ 1% поданных голосов. Это в несколько раз больше, чем могло бы, все же, находиться в этой области (приблизительно 0.135%). Т.о., по грубым прикидкам, заведомо нарисованными можно считать 674823 голоса из 780143.
За пределами двух стандартных отклонений от среднего находится 1089752, за полутора межквартильными интервалами от медианного значения -- 1098447 голосов, все это -- порядка 1.5% голосовавших.
Следует учесть, что этот метод -- крайне «щадящий» по отношению к фальсификаторам и дает нам абсолютный минимум общих приписок численности проголосовавших, так как исходит из предположения о том, что все наблюдавшиеся на участках значения явки -- «настоящие». С другой стороны, к нему, конечно, не подкопаешься, потому что, даже приняв это допущение, мы все равно получаем крайне маловероятные выбросы на целых и круглых процентных значениях в правом плече распределения.
На графике сплошная черная линия -- исходные данные, толстая красная линия -- среднее арифметическое по 100 итерациям Монте-Карло симуляции (на 1000 итераций ушло бы часов восемь, но результат отличался бы не сильно), серая затененная область между двумя тонкими красными линиями -- среднее плюс-минус три стандартных отклонения.

Если сложить пики, выступающие за три стандартных отклонения от среднего по МК-симуляции, то на них приходится 780142.7 (780143) голоса, или ~ 1% поданных голосов. Это в несколько раз больше, чем могло бы, все же, находиться в этой области (приблизительно 0.135%). Т.о., по грубым прикидкам, заведомо нарисованными можно считать 674823 голоса из 780143.
За пределами двух стандартных отклонений от среднего находится 1089752, за полутора межквартильными интервалами от медианного значения -- 1098447 голосов, все это -- порядка 1.5% голосовавших.
Следует учесть, что этот метод -- крайне «щадящий» по отношению к фальсификаторам и дает нам абсолютный минимум общих приписок численности проголосовавших, так как исходит из предположения о том, что все наблюдавшиеся на участках значения явки -- «настоящие». С другой стороны, к нему, конечно, не подкопаешься, потому что, даже приняв это допущение, мы все равно получаем крайне маловероятные выбросы на целых и круглых процентных значениях в правом плече распределения.
На графике сплошная черная линия -- исходные данные, толстая красная линия -- среднее арифметическое по 100 итерациям Монте-Карло симуляции (на 1000 итераций ушло бы часов восемь, но результат отличался бы не сильно), серая затененная область между двумя тонкими красными линиями -- среднее плюс-минус три стандартных отклонения.
