kouprianov: (Default)

Правильно ли я понимаю, что получить, рассчитывая частоты последних цифр для России в целом, такую таблицу:

   Var1  Freq   Freq.rel
1     0 10685 0.11030361
2     1  9819 0.10136370
3     2  9672 0.09984618
4     3  9483 0.09789510
5     4  9439 0.09744087
6     5  9784 0.10100238
7     6  9598 0.09908227
8     7  9495 0.09801897
9     8  9619 0.09929905
10    9  9275 0.09574787

Это примерно все равно, что, играя в орлянку, получить 261 решку и 707 орлов на 968 бросках?

kouprianov: (Default)

По совету мудрого corbulon попробовал посмотреть, что будет, если записать количество бюллетеней в семиричной системе счисления. Гипотеза состоит в том, что отклонения в этом случае не будут отличаться от случайных, поскольку никто не ориентируется на семиричную систему счисления, когда рисует результаты (подробно все изложено тут: http://trv-science.ru/2012/03/13/pro-arifmetiku-i-nemnozhko-pro-vybory/ ). Как и ожидалось, хихиквадрат получился незначимым:

Для России в целом: X-squared = 2.4186, df = 6, p-value = 0.8775
Для регионов группы 0: X-squared = 7.3672, df = 6, p-value = 0.2882
Для регионов группы 3: X-squared = 6.2678, df = 6, p-value = 0.3939
Для Петербурга: X-squared = 3.4536, df = 6, p-value = 0.7501

А картинка в сравнении с предыдущей получилась неописуемой красоты. Специально перерисовал в одном масштабе, чтобы было видно, насколько в одном случае разброс даже визуально больше, чем в другом. Слева теоретически ожидаемая частота, естественно, 1/10, справа -- 1/7.

last_digits.base_07_vs_base_10
kouprianov: (Default)

Рисовал не к развернувшейся дискуссии, а к лекции одной, но, вижу, пришло время повесить. Частоты последних цифр числа, выражающего количество проголосовавших на участке (сумма действительных и недействительных бюллетеней) в результатах выборов в Государственную Думу Российской Федерации (2016-09-18). Ожидаемая частота 0.1. Смотрим на Хи-квадрат:
для России в целом (серые точки): X-squared = 138.88, df = 9, p-value < 2.2*10^-16,
для регионов группы 3 (красные): X-squared = 162.24, df = 9, p-value < 2.2*10^-16,
для регионов группы 0 (зеленые): X-squared = 40.635, df = 9, p-value = 5.829*10^-6,
для С. Петербурга (голубой): X-squared = 20.211, df = 9, p-value = 0.01665.

Замечу, что по пути от наиболее подозрительных регионов к наименее подозрительным частотные отклонения падают, хотя и остаются довольно значительными (но вот Петербург, к слову, уже не переваливает за уровень значимости 0.01, только за жалкий 0.05).

О группах регионов см. одну из моих предыдущих записей. В общем, мне кажется, что имитационная модель, построенная при помощи толпы студентов М. Соколовым, не отражает свойств моделируемого объекта (совокупность участковых, окружных и территориальных избирательных комиссий). Возможно, потому что в избиркомах мало студентов (да и вообще там с образованием, боюсь, не очень, если в массе смотреть). Или потому что они пока не ставят себе задачи придумать самые необычные числа. (Кстати, из дискуссии вынесло замечательное чтение про попытку взлома системы Спорт-лото).

UPD: некоторые тчки не видны, поскольку немного или много налезают друг на друга.


last_digits
kouprianov: (Default)

В дополнение к предыдущей записи. Крупно и наглядно показываю «хороший» ТИК No. 21 (почти все точки в одном облаке, смещения незначительны, распределение смещений унимодально и относительно симметрично) и странные ТИКи No. 9 и 29 (точки распадаются на несколько облаков, смещения некоторых очень значительны, гистограмма смещений бимодальна или асимметрична). Сначала -- диаграммы Собянина-Суховольского, потом -- гистограммы евклидовых расстояний. На диаграммах Собянина-Суховольского оранжевые точки -- позиция участка на выборах а ЗакС, зеленые точки -- позиция участка на выборах в Думу. Стрелка -- смещение точки.

В чем тут проблема? В том, что для объяснения феномена согласованного смещения необходимо предположить наличие нетривиальной стратегии голосования (за ЕР на ЗакСовских выборах голосует в разы больше людей, чем на Думских [или наоборот, как на территории ТИК No. 29], происходящих одновременно) на четко очерченной группе участков.

ТИК No. 21, совмещение диаграмм Собянина-Суховольского для выборов ЗакС и Думу:


zaks-duma.tik.21.ER.share~Turnout

ТИК No. 9, совмещение диаграмм Собянина-Суховольского для выборов ЗакС и Думу:


zaks-duma.tik.9.ER.share~Turnout
далее все под cut'ом )
kouprianov: (Default)

Пришло в голову сравнить то, как люди голосовали за Единую Россию в Петербурге на Думских выборах с тем, как те же самые люди голосовали в тот же день и час за нее же, Единую, на выборах в Законодательное собрание. Для этого (1) сначала отобрал участки, на которых проходили и те, и другие выборы), (2) совместил диаграммы Собянина-Суховольского для выборов в Думу и ЗакС по каждой из 30 территорий (соответственно, по 30 ТИК), (3) обнаружив, что местами избиратели ведут себя странно (например, на выборах в Думу голосуют за ЕР примерно вдвое менее воодушевленно, чем на выборах в ЗакС), построил распределения эвклидовых расстояний по диаграмме Собянина-Суховольского для участков каждой из ТИК.

Оранжевые точки -- позиция участка на выборах а ЗакС, зеленые точки -- позиция участка на выборах в Думу. Стрелка -- смещение точки. Вообще, все должны выглядеть как No. 21, но почему-то не выглядят. Особенно дико смотрятся No.No. 3, 9, 17, 18, 29.


zaks-duma.tik.all.ER.share~Turnout

Гистограммы эвклидовых расстояний для разных ТИК. Здесь снова образец для подражания -- ТИК No. 21, в удивительных -- знакомые все лица.


вторую картинку -- под cut... )
kouprianov: (Default)

Диаграммы Собянина-Суховольского для лидеров по одномандатным округам. Цвет точек показывает вклад участков, относящихся к разным Территориальным избирательным комиссиям в пределах одного округа. Если все участки подчинены одной ТИК, все точки черные. Чем больше ТИК, тем больше цветов. Размер точки: общее количество участников голосования на участке.

В целом, все не так гладко, как на Думских выборах по единому округу. Обратите внимание на вытянутость облаков по вертикали и диагонали, намечающуюся «двуядерность» облаков в ряде округов. Везде, кроме тодного округа, лидеры -- члены Единой России, в округе №5 лидер -- член Справедливой России.


zaks.tikc.oik.all
kouprianov: (Default)

Коллеги говорят, что в Тюменской области все аккуратно нарисовано. Ничего себе, аккуратно... Ну, то есть, по линейке практически. Мне кажется, что и тут результаты выборов надо аннулировать без малейших колебаний.

Для начала, Собянин-Суховольский:


plot.ER~TURN.regions.75
остальное -- под cut... )
kouprianov: (Default)

К сегодняшней дискуссии о «Двугорбой России». Вот -- один из многих примеров полнейшего безобразия, которое продолжает твориться. Гистограмма явки в Татарстане (она, в общем, «читалась» отлично и на двумерных диаграммах, которые я вывешивал ранее, но так, конечно, нагляднее), по моему скромному разумению, выглядит так, что ни малейших сомнений в грубых массовых фальсификациях быть не может. Результаты выборов по республике должны быть признаны недействительными. Хотел бы посмотреть на человека, который, глядя на этот график будет способен хладнокровно рассуждать про какие-то там «особые электоральные культуры», пространственную гетерогенность населения, фантастическим образом совпадающую с границами избирательных участков и т. п. бредовые идеи.

Вот она с высоты птичьего полета (черным -- участки с 201 и более избирателями, оранжевым -- вклад участков с 200 и менее избирателями):


hist.TURNOUT.201_on.newbin.20160923.region.60.m
Продолжение под cut'ом... )
kouprianov: (Default)

В дополнение к серии видео, опубликованной недавно в FB -- диаграмма Собянина-Суховольского по Татарстану (мне кажется, что подвиг сорока разбойников памфиловцев был почти бессмысленным -- диаграмма выглядит так, что, кажется, там вообще в большинстве случаев никаких голосов не считали):


plot.ER~TURN.regions60

UPD: Серые точки -- все участки России, оранжевые кружки (их размеры пропорциональны количеству проголосовавших на участке) -- участки Татарстана на фоне общего облака для России. Данные взяты podmoskovnik с сайта ЦИК.

kouprianov: (Default)

Как и в случае с явкой, вклад невелик. Вклад участков, на которых зарегистрировано менее 200 избирателей, показан оранжевой каймой над основной массой участков (черной). Обратите особое внимание на отличия «красивых дробей» от рукотворных чудес (соотношение длин оранжевого и черного столбиков намекает, хотя, конечно, доказательно можно утверждать только по результатам расчетов [они, к слову, уже проведены не мной и в других местах, это только к ним отдельно валяющаяся иллюстрация]).


hist.ER.vote.ru_ru.201_on.enlarged.newbin.20160923
kouprianov: (Default)

По результатам беседы с dims12 и lesnoy-volk нарисовал пару анимаций на тему «накопление сигнала вокруг простых кратных значений явки на малых участках». В первой анимации все УИК показаны одинаковыми маленькими точками:


plot.TURN~electorate.ru.20160923.animated

Во второй (компьютер чуть не умер, ее рисуя) -- то же самое, но размер точки, репрезентирующей участок, пропорционален количеству бюллетеней:


plot.bubbles.TURN~electorate.ru.20160923.animated
kouprianov: (Default)

Небольшой. Все и без них замечательно. Вклад участков, на которых зарегистрировано менее 200 избирателей, показан оранжевой каймой над основной массой участков (черной).


hist.TURNOUT.ru_ru.201_on.enlarged.newbin.20160923
kouprianov: (Default)

Продолжение истории с диаграммой «размер участка / явка» (данные взяты у podmoskovnik). По просьбе Ivan Nizgoraev, сделал несколько анимаций. Чтобы просмотреть их как видео, надо кликнуть по ссылке и перейти на flickr (как встроенное оно, кажется, не проигрывается, по крайней мере, у меня). Если кто углядит несправедливость в распределении регионов по группам -- пишите, переставим / выделим со временем, поглядим, что можно сделать. Размер точки пропорционален количеству голосов, поданных на участке. Сначала все несортированные на фоне общей картины по России:

russia.plots.turnout~electorate.by_region.unsorted
Разложение по группам регионов -- под cut'ом... )
kouprianov: (Default)

Диаграммы в осях размер участка / явка представляются мне довольно важными, поскольку они отражают две самые «физические» характеристики электората (данные взяты у podmoskovnik). Сначала -- исходная картинка (уже вывешивал ранее, но надо освежить воспоминания), потом ее разложение по группам регионов [NB! на диаграммах по группам регионов размер точки пропорционален количеству голосов, поданных на участке] (исходные по всем регионам тоже выложу, но и 85 и это -- отдельно). Итак, вот общая картина:

plot.TURNOUT~ELECTORATE.ru.enlarged.20160923
Разложение по группам регионов -- под cut'ом... )
kouprianov: (Default)

Продолжая тему электоральной порнографии, выкладываю новую порцию картинок (данные взяты у podmoskovnik). В этом выпуске: раскладка общероссийского графика по партиям, а также обновленная версия с увеличением и сеткой (по просьбе corbulon) для Петербургского графика и для него же раскладка по партиям.

Картинки под cut'ом... )
kouprianov: (Default)

В качестве алаверды corbulon, предложившему новый изящный способ визуализации фальсификаций на выборах, -- две картинки на ту же тему по неагрегированным данным (данные взяты у podmoskovnik). По-моему, красота неописуемая. Нижняя (для России в целом) выглядит совершенно порнографически. В общем, выигрыш от замены Чурова на Панфилову в плане махинаций с подсчетом голосов и рисованием результатов невелик. Каждая точка, как водится, -- участок, размер точки пропорционален количеству проголосовавших на участке.


corbulon-2.spb.20160923
corbulon-2.ru.20160923
kouprianov: (Default)

На просторах FB продолжают интересоваться, а что будет, если не про явку, а про долю голосов за ЕР? Отвечаем: спите спокойно, дорогие товарищи, все и тут тоже остается на своих местах.

За данные спасибо podmoskovnik.


hist.ER.share.ru.20160923
kouprianov: (Default)

На просторах FB задают каверзный вопрос. А что, если на гарфиках, опубликованных в статье С. Шпилькина «Двугорбая Россия», по оси Y отложить не количество избирателй в бине явки, а количество УИК в бине явки? Не исчезнут ли тогда пички на подозрительно круглых значениях? Не исчезнет ли приподнятое правое плечо гистограммы? Разумеется, нет:


hist.TURNOUT.ru.20160923

То же, крупным планом:


hist.TURNOUT.ru.enlarged.20160923

На случай, если кому-то кажется, что круглые значения долей голосв за ЕР обусловлены выщеплением популярных кратных отношений (1/4, 1/3, 1/2, 2/3, 3/4 и т. д.) на участках малого размера, даю крупным планом (на участках до 4000 избирателей) ту же картину, что давал несколько лет назад [спойлер: лучше не стало] (UPD: я тут забыл подпись на оси Y поменять, исправляюсь, на всякий случай, даю ниже то же для явки / размера УИК, потому что они и правда как близнецы-братья):


plot.ER.share~ELECTORATE.ru.enlarged.20160923


plot.TURNOUT~ELECTORATE.ru.enlarged.20160923

За данные спасибо podmoskovnik.

kouprianov: (Default)

Disclaimer: Я не утверждаю, что на всех этих участках происходили фальсификации результатов голосования. Однако все они в той или иной степени выбиваются по явке или доле голосов за лидера из своего ТИК или выделяются на фоне остальных ТИК округа. Хорошо бы независимые наблюдатели могли прокомментировать свое видение ситуации «изнутри» (призываю писать на alexei.kouprianov-на-gmail.com). Ниже приводится список УИК, сгруппированых по ТИК и ОИК (одномандатные в Думу) и формальные основания для включения (подробнее см. на диаграммы в одной из предыдущих записей, на каждой я искал разрыв и отсекал подозрительные точки, которые и составили, в итоге, этот список).

ОИК 215 ТИК 13 в целом выглядел странно, для него даны более узкая и более широкая подозрительные зоны.



Список под cut... )
kouprianov: (Default)

То же, что в предыдущей записи, но разложено по ОИК. Те же проблемы и вопросы, но сейчас чуть яснее картина в разрезе ОИК.

Данные podmoskovnik, извлечены из JSON в CSV Глебом Чипигой. Пользуюсь случаем выразить им свою признательность.


maj.by_tik.WINNER.vote~TURNOUT.spb.m.211-218.sorted_by_oik.20160923

July 2017

S M T W T F S
      1
2345678
9101112131415
1617 1819202122
23242526272829
3031     

Syndicate

RSS Atom

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 25th, 2017 04:36 pm
Powered by Dreamwidth Studios