December 5th, 2011

Статистика выборов по Москве: двуголовая гидра

Любезный podmoskovnik прислал цифирки голосования по Москве. Ну, я их покрутил немножко. Вот милый графичег:


Здесь показано количество избирательных участков (УИКов), на которых такая-то партия получила столько-то голосов. Например, КПРФ получила 20% голосов на 226 участках.

Разумно ожидать, что количество участков распределяется поровну вправо и влево от середины. Это т.н. "нормальное" (или гауссово) распределение. Если приглядеться к графикам голосования за Яблоко, ЛДПР, СР и КПРФ, то так оно и получается. Для облегчения задачи я изобразил для вас "идеальные" распределения, которые лучше всего подходят под реальные данные. Видите тоненькие линии? вот это они и есть. Отсюда можно надыбать всякую интересную информацию. Например, избиратель ЛДПР решителен как штык (распределение узенькое), а избиратель Яблока так и не понял, надо ли ему голосовать за эту партию.

Тут внимательный читатель воскликнет: "а где же ваше нормальное, или, по науке, гауссово распределение за ЕР?". А нет его, поскольку распределение голосов за ЕР по участкам иначе как порнографией странным не назовешь. Ну ладно, есть какой-то пик на 25% голосов. Пик слегка спадает до ровного участка между 30 и 50%, а там... ну да, снова взвивается, как кострами синие ночи. И доходит до второго, еще более высокого пика аккурат на... 51%. Ну, и дальше этот пик не торопясь спадает до нуля (уффф! все же не Кавказ) на 98%.

Вот какой затейливый избиратель у ЕР: часть его дает ЕР 25%, а вторая часть - аж 50% плюс! Интересно, как так может быть?

UPD эти  чистые  глаза,  этот  уверенный взгляд  он  видел  в  Таганской тюрьме в 1922 году, когда и сам сидел там по пустяковому делу.
 Неунывающий podmoskovnik освежил мою память:
 
Это его картинка с московских выборов в 2008 году. Синенький график - с КОИБами (такой фотосчитыватель, который сам бюллютени считат), красный - без. Надо ли упоминать, что все КОИБы неожиданно сломались.

(no subject)

Этот график посложнее будет, но вполне продираем. Следите, значит, за пальцами.
На графике разными цветами показано количество УИКий, где явка была такая-то (горизонтальная ось) и за ЕР проголосовало столько процентов (вертикальная ось). Где цвет красный - такий УИКий много, где синий - вообще нет. Например, при явке в 51% за ЕР с результатом в 25% проголосовало 10 УИКий.


Сразу видно, что данные кластеризуются вокруг двух "фокальных точек": явка 50%, голование за ЕР 25% и явка 65%, голование за ЕР 51%. Поскольку данные достаточно "шумные", я наложил сверху результаты подгонки по двум гауссовым функциям. Откуда взялся пик на 65% явки с двукратным голосованием от пика на 50% -- кто ж знает...

UPD Товарищи попросили сделать то же самое для Яблока. Сделал. Теперь объясните мне, кому и зачем это нужно.

UPD2 Товарищи попросили сделать фит для Яблока двумя гауссами, а то нечестно получется. Сделал, наслаждайтесь. Две "фокальные точки" получаются просто из того факта, что интеграл по вертикальной оси дает распределение по явке, которое одинаковое для всех партий. Разница с Едром тут в том, что на 65% явки дает для Яблока минус 7.5%, а для ЕР - плюс 26%. То есть если пришло голосовать 50%, то у ЕР будет 25%, а у Яблока 12.5%, но уж если явились 65%, то ЕР получает 51%, а Яблоко - только 5%. Вот такой закон московской природы.