Предварительные итоги Турецкой кампании
Feb. 6th, 2012 05:38 pmНа прошлой неделе войска союзников подошли к границам Турции.
q_uadrat обнаружил расположение основных сил противника, но разведка показала, что моя армия неспособна решать боевые задачи такой степени сложности.
podmoskovnik нашел создателя настоящих боевых роботов в лице Александра Шпилькина, который создал боевую машину, повергнувшую к нашим стопам 1055 файлов с таблицами по ТИКам. Несколько дней ушло на выравнивание таблицы, понимание того, что семь ТИКов не вывешены на сайт, и данные по ним потеряны для нас, но, к счастью, составляют доли процента. Вчера вечером закончил ровнять таблицу для скармливания в R. Независимых кандидатов, которые образуют отдельную партию, считать не стал (они перечислены в таблицах поименно, и их надо было бы выравнивать еще несколько дней).
Когда я нарисовал первые картинки (их можно видеть во втором ряду рис. 1 -- особенно впечатлила красующаяся там посередине первая версия диаграммы рассеяния явка~размер участка), то пришел в полный ужас. Турция настолько не походила на все, что мы видели, что было совершенно не ясно, чем она вообще может быть полезна. Сделав пару вдохов и выдохов, однако успокоился. Да, участки маленькие (видимо, есть законодательное ограничение около 300 человек). Да, на ряде участков наблюдается явка выше 100% (что неудивительно при участках такого размера -- достаточно приехать нескольким чужакам с какими-нибудь турецкими открепительными и явка, и без того высокая, порядка 80+%, зашкалит). Но явка и доля голосов за партию должны варьировать в каких-то разумных пределах, да и корреляции между ними никуда не денутся. Так и оказалось. Итак -- две серии картинок по Турции.
Рис. 1. Размеры избирательных участков и явка. Внизу -- в том виде, в котором я их изначально увидел и мне стало плохо. Вверху -- при тех же масштабах осей, что и на графике для России, Болгарии, Чехии и Польши. Обратите внимание на то, что, несмотря на аномальный характер явки (зашкаливающей за 100%, в основном на малых участках), форма распределения такая же, как и во всех остальных странах, кроме России (одногорбая, довольно симметричная, с низким правым плечом).
Рис. 2. Партии, прошедшие в Меджлис. Их всего три. Порог высокий -- 10%. Тут -- никаких сюрпризов. Незатейливые распределения долей проголосовавших за партию, практически никакой зависимости доли проголосовавших от явки. Посчитал для всех пятнадцати партий параметры линейной регрессии, R^2 не превышает 0.008.
no subject
Date: 2012-02-06 02:25 pm (UTC)И удивляет обилие участков с нулевой поддержкой Cumhuriyet и особенно с нулевой поддержкой MHP. Неужели это такой сильный раскол между городом и селом?
Эхх, нужен специалист по турецкой электоральной географии
no subject
Date: 2012-02-06 02:37 pm (UTC)Или мне кажется?
no subject
Date: 2012-02-06 02:41 pm (UTC)no subject
Date: 2012-02-06 06:00 pm (UTC)Стыд и позор. Даже турки (простите меня, турки, за это "даже") умеют проводить выборы честнее, чем мы.
no subject
Date: 2012-02-06 06:08 pm (UTC)no subject
Date: 2012-02-06 07:55 pm (UTC)И у каждого из этих вариантов свои статистические проявления
no subject
Date: 2012-02-06 07:57 pm (UTC)no subject
Date: 2012-02-06 08:00 pm (UTC)Дальше правда возникает любопытство - а почему-то у правящей партии почти нет участков с нулями? Мало участков с чисто курдским населением (а турецкое меньшинство в условиях этнической поляризации в курдских районах голосует только за одну партию)? Или даже в самых глухих деревнях находится некоторое количество курдов-"коллаборционистов", голосующих за турецкую партию?
(понятно, что это уже спекуляции и предположения, и касаются они деталей, а не главной "идеи" представленных графиков)
no subject
Date: 2012-02-06 08:08 pm (UTC)no subject
Date: 2012-02-06 08:08 pm (UTC)no subject
Date: 2012-02-06 08:21 pm (UTC)Другие страны хороши как раз тем, что про них может быть точно установлено, честные они были или нет.
no subject
Date: 2012-02-06 08:31 pm (UTC)прикольные распределения голосов за партии и прикольные выбросы в район 100на100 у действующей и у давно и долго бывшей правящих партий
no subject
Date: 2012-02-06 08:51 pm (UTC)no subject
Date: 2012-02-06 08:55 pm (UTC)Было бы странно требовать от фальсифицированных выборов в других странах, чтобы там соблюдалась "гребенка Чурова", если она и в России соблюдается не во всех регионах
Аналогично и с явкой. Например, для Питера ассиметрия распределения по явке относительно небольшая - и анализ статистики только по явке дал бы существенное занижение объема фальсификаций
no subject
Date: 2012-02-06 09:01 pm (UTC)А что касается критериев отбора, то да, естественно, они берутся из электоральной статистики. Иначе и быть не может, если мы предполагаем, что исходный массив "наблюдений" был искажен произвольными вмешательствами в условно-случайно выбранных точках
Но особенность в том, что я беру не первичные показатели (явка, процент голосов за ЕР), а максимально деполитизированные показатели. Например, разброс поддержки ЕР по отдельным участкам города. Или наличие или отсутствие корреляции между результатами ЕР и ЛДПР
И эти параметры выбраны не только потому, что их использование дает показательные результаты, но и потому, что за их выбором стоит определенная логика и определенные теоретические предположения и знания про прошлые выборы
no subject
Date: 2012-02-06 09:10 pm (UTC)Гипотеза в том, что аномалии указывают на нарушения. Самый простой способ доказать ее — найти страну с доказанными фальсификациями нужного типа и найти там те же аномалии, что и в России (положительный контроль) + найти страны, для которых известно, что выборы честные и не найдены аномалии (отрицательный контроль, который уже получен).
no subject
Date: 2012-02-06 09:17 pm (UTC)Это неправда. Есть страны, где сами фальсификаторы признали фальсификации, есть решения судов, по которым принимались решения об отмене выборов. Честность выборов тоже устанавливается независимо, опираясь на, скажем отчеты международных организаций или отсутствие протестов против результатов выборов.
>естественно, они берутся из электоральной статистики
Вы не знаете, является ли аномалия признаком нарушений и для того, чтобы это проверить, используете эту же аномалию. Это неправильно, критерий отбора честных территорий должен не зависеть от объекта изучения.
no subject
Date: 2012-02-06 09:18 pm (UTC)no subject
Date: 2012-02-06 09:35 pm (UTC)Но если все же считать, что в случае с Турцией мы имеем дело не с фальсификациями, а с поляризацией предпочтений, то тогда удивление - почему так мало нулевых участков у правящей партии - уместно. Но и ответ, что в курдских районах это воспринималось как единственная альтернатива голосованию за курдских кандидатов, звучит вполне разумно
no subject
Date: 2012-02-06 09:44 pm (UTC)no subject
Date: 2012-02-06 09:45 pm (UTC)Возвращаясь к критериям отбора - я не вижу, какие иные критерии отбора, не связанные с самими выборами, можно было бы использовать. География фальсификаций не имеет четких корреляций с типами ТИКов и участком, с регионами, с экономическими и социальными характеристиками регионов.
Так что приходится анализировать объект через его же собственные данные
Но там несколько сложнее, чем просто берем аномалию и диагностировать по ней. На входе есть гипотеза, что у неискаженных фальсификациями результатов выборов должны наблюдаться ряд признаков (как то - умеренные различия между участками одного города по % за ЕР, а также по другим параметрам результатов выборов; положительная корреляция между ЕР и ЛДПР, как партиями со сходной электоральной базой и т.д.)
А дальше смотрим - и видим, что есть многочисленная группа городов, в которых данные предположения соблюдаются, и есть группа городов, в которых эти предположения не соблюдаются, притом как правило они не соблюдаются все сразу - и отклонения от "ожиданий" очень большие
no subject
Date: 2012-02-06 09:46 pm (UTC)no subject
Date: 2012-02-06 10:08 pm (UTC)>География фальсификаций не имеет четких корреляций с типами ТИКов и участком, с регионами, с экономическими и социальными характеристиками регионов.
Ну, это не так :) Где-то да, а где-то нет. В любом случае я могу вам сказать, что вы чего-то не знаете (почему в Калужской у ЕР меньше, чем в Тульской? Может просто потому что Калужская процветающая область, а Тульская — депрессивная?)
Я доверяю экспериментам, где заведомо легко обосновать независимость объекта изучения от методов его изучения. Скажем берем выборку УИКов без недействительных биллютеней и видим там гребенку Чурова, как сделал уважаемый oude_rus. Или взять выборку участков с КОИБами и показать, что там за ЕР голосования ниже. Это корректный эксперимент, потому что можно обосновать ожидаемую независимость выборки.
В вашем эксперименте доказать независимость выборки будет сложно, если не привлекать дополнительные соображения (вы это и делаете, спекулируя о предпочтениях электората). Я не против гипотез ad hoc, у меня в журнале висит картинка как раз про то, о чем вы говорите (там про Москву, Питер и Ебург). Но они заведомо слабее.
no subject
Date: 2012-02-06 10:45 pm (UTC)Неоднородность поддержки ЕР от средней по городу картины политических предпочтений не зависит (ну или, правильнее сказать, не должна зависеть)
no subject
Date: 2012-02-06 10:56 pm (UTC)---
А какая неоднородность будет нормальной? У меня нет ответа на этот вопрос. Интуитивно понятно, что не может в двух соседних спальных районах результат за ЕР отличаться в три раза, но это и так ясно, вычисления тут не нужны. Хотя где-то я видел, что такая работа сделана и даже применяется для отбора подозрительных УИКов для наблюдателей Навального.