![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Удалось развести в Петербурге участки с КОИБ/КЭГ и без. КОИБ и КЭГ -- электронные устройства для автоматического учета заполненных избирателями бюллетеней. Данные -- один из массивов по России с сайта ЦИК, архивированный Сергеем Шпилькиным и любезно предоставленный им в общее пользование (данные есть по 2037 из 2052 участков). Результаты экспресс-анализа показывают следующее:
(1) Распределение КОИБ/КЭГ по городу крайне неравномерно. Охвачены Кронштадт, пригороды Юго-Запада, Юго-Запад, Васильевский остров, Охта, Колпино.
(2) При сопоставлении данных по явке видно, что аномальный пик на 70% явки сформирован участками без КОИБ/КЭГ.
(3) При сопоставлении данных по доле голосов за лидера видно, что мода на участках с КОИБ/КЭГ смещена на пару процентов в сторону более высокой поддержки (77-78% против 75-76% на участках без КОИБ/КЭГ).
(4) Если рассматривать долю голосов за лидера не от проголосовавших, а от полной численности избирателей, то на участках с КОИБ/КЭГ и без них моды находятся приблизительно в одном и том же месте, на 46-47%.
Материал «с полей» по вопросу о появлении пика на 70%: http://www.fontanka.ru/2018/03/27/059/
Несколько пояснений:
Высота столбиков приведенных ниже графиков, называемых «гистограммами», показывает, сколько участков попадает в диапазон, границы которого соответствуют границам столбиков. На наших гистограммах ширина диапазона составляет 1%, а границы проведены так, чтобы целое значение процента попадало на середину столбика.
Например, первый диапазон явки -- от 43.5 до 44.5%, середина столбика -- на 44% ровно. В этом диапазоне находится только один участок (без КОИБа) с явкой 43.65%, поэтому столбик такой маленький. Самый высокий голубой столбик, (если не считать столбика в районе 100% явки, где расположены одни только корабли и иные специальные участки) приходится на диапазон 61.5--62.5% (середина столбика на 62% ровно), в него попало 104 участка без КОИБ/КЭГ. Пик в диапазоне 69.5--70.5% (середина на 70% ровно) -- 72 участка без КОИБ/КЭГ. У распределения явки на участках с КОИБ/КЭГ (красные столбики) максимум находится в другом месте, в диапазоне 59.5--60.5% (середина на 60%) -- 45 участков. А вот в диапазонах 61.5--62.5% и 69.5--70.5% их меньше -- 34 и 18 соответственно. Точно так же все устроено на графике, показывающем проценты поддержки лидера.
«Мода» распределения, о которой говорится выше -- это группа самых высоких столбиков (самый «популярный» диапазон значений). В относительно симметричных распределениях другие меры центральности -- хорошо знакомое всем среднее арифметическое и менее широко известная медиана (середина упорядоченного от наименьшего к наибольшему ряда значений исследуемого параметра) -- обычно находятся в пределах модального диапазона значений, в асимметричных -- более или менее смещены влево или вправо. В нашем случае, например, средняя явка по участкам без КОИБ/КЭГ составила 67.36%, а медианная -- 63.80%. По участкам с КОИБ/КЭГ, соответственно, 63.16% и 62.09%. Мы видим, что в обоих случаях среднее арифметическое и медиана находятся довольно близко к модальному диапазону, но чем менее симметрично распределение (а распределение явки на участках без КОИБ/КЭГ менее симметрично из-за аномального пика на 70% и закономерного пика на 100%), тем дальше отстоит среднее арифметическое (медиана более устойчива к выбросам и она ближе к моде, хотя и не всегда совпадает с ней).
Явка = (Действительные бюлл. + Недействительные бюлл.)/(Кол-во избирателей в списке).
Доля голосов за кандидата = (Кол-во бюллетений, поданых за кандидата)/(Действительные бюлл. + Недействительные бюлл.).
Иллюстрации:
(1) Гистограммы явки:

(2) Гистограммы долей голосов за лидера:

(3) Гистограмма долей голосов за лидера от общей списочной численности избирателей на участке:

(4) Карта распространения КОИБ/КЭГ (контуры территорий, подведомственных ТИК, любезно предоставлены А.С.Карповым):

(1) Распределение КОИБ/КЭГ по городу крайне неравномерно. Охвачены Кронштадт, пригороды Юго-Запада, Юго-Запад, Васильевский остров, Охта, Колпино.
(2) При сопоставлении данных по явке видно, что аномальный пик на 70% явки сформирован участками без КОИБ/КЭГ.
(3) При сопоставлении данных по доле голосов за лидера видно, что мода на участках с КОИБ/КЭГ смещена на пару процентов в сторону более высокой поддержки (77-78% против 75-76% на участках без КОИБ/КЭГ).
(4) Если рассматривать долю голосов за лидера не от проголосовавших, а от полной численности избирателей, то на участках с КОИБ/КЭГ и без них моды находятся приблизительно в одном и том же месте, на 46-47%.
Материал «с полей» по вопросу о появлении пика на 70%: http://www.fontanka.ru/2018/03/27/059/
Несколько пояснений:
Высота столбиков приведенных ниже графиков, называемых «гистограммами», показывает, сколько участков попадает в диапазон, границы которого соответствуют границам столбиков. На наших гистограммах ширина диапазона составляет 1%, а границы проведены так, чтобы целое значение процента попадало на середину столбика.
Например, первый диапазон явки -- от 43.5 до 44.5%, середина столбика -- на 44% ровно. В этом диапазоне находится только один участок (без КОИБа) с явкой 43.65%, поэтому столбик такой маленький. Самый высокий голубой столбик, (если не считать столбика в районе 100% явки, где расположены одни только корабли и иные специальные участки) приходится на диапазон 61.5--62.5% (середина столбика на 62% ровно), в него попало 104 участка без КОИБ/КЭГ. Пик в диапазоне 69.5--70.5% (середина на 70% ровно) -- 72 участка без КОИБ/КЭГ. У распределения явки на участках с КОИБ/КЭГ (красные столбики) максимум находится в другом месте, в диапазоне 59.5--60.5% (середина на 60%) -- 45 участков. А вот в диапазонах 61.5--62.5% и 69.5--70.5% их меньше -- 34 и 18 соответственно. Точно так же все устроено на графике, показывающем проценты поддержки лидера.
«Мода» распределения, о которой говорится выше -- это группа самых высоких столбиков (самый «популярный» диапазон значений). В относительно симметричных распределениях другие меры центральности -- хорошо знакомое всем среднее арифметическое и менее широко известная медиана (середина упорядоченного от наименьшего к наибольшему ряда значений исследуемого параметра) -- обычно находятся в пределах модального диапазона значений, в асимметричных -- более или менее смещены влево или вправо. В нашем случае, например, средняя явка по участкам без КОИБ/КЭГ составила 67.36%, а медианная -- 63.80%. По участкам с КОИБ/КЭГ, соответственно, 63.16% и 62.09%. Мы видим, что в обоих случаях среднее арифметическое и медиана находятся довольно близко к модальному диапазону, но чем менее симметрично распределение (а распределение явки на участках без КОИБ/КЭГ менее симметрично из-за аномального пика на 70% и закономерного пика на 100%), тем дальше отстоит среднее арифметическое (медиана более устойчива к выбросам и она ближе к моде, хотя и не всегда совпадает с ней).
Явка = (Действительные бюлл. + Недействительные бюлл.)/(Кол-во избирателей в списке).
Доля голосов за кандидата = (Кол-во бюллетений, поданых за кандидата)/(Действительные бюлл. + Недействительные бюлл.).
Иллюстрации:
(1) Гистограммы явки:

(2) Гистограммы долей голосов за лидера:

(3) Гистограмма долей голосов за лидера от общей списочной численности избирателей на участке:

(4) Карта распространения КОИБ/КЭГ (контуры территорий, подведомственных ТИК, любезно предоставлены А.С.Карповым):

no subject
Date: 2018-03-28 01:14 pm (UTC)только по кол-ву участков сложно понять %%, поскольку их размер разный.
видос с полей совершенно улетный, я его уже скопировал.
no subject
Date: 2018-03-28 06:59 pm (UTC)