September 9th, 2013

Красивые картинки

3c

Обратите внимание, что у Собянина корреляция по Пирсону положительная и довольно приличная R=0.4.
А у Навального наоборот отрицательная R=-0.09.
Хотя наклоны линий в основном пятне подсказывают нам, что должно быть ровно наоборот.
Так что у кого мобилизация электората лучше, это еще бабушка надвое сказала.

Надомники

хоме

Показана зависимость результата на данном участке от доли надомников, голосовавших на участке.
Тренд явно в пользу Собянина.

(no subject)

4
Навальный увеличил результат почти на процент (27%), а Собянин столько же потерял (51.5). Обратите так же внимание, что Пирсон у Собянина сильно подсел за счет хвоста. Еще обратите внимание на созвездие у Собянина на 40% явки и 75% результата -- я бы эти УИК отдельно проверил, как-то они резко из тренда выбились.  

Доброе утро

5 5а

Если смотреть по Гауссу, то у Собянина 51.65% (sd 6.9), у Навального 28.1 (sd 5.8).
Наклон в основном пятне 0.55 и -0.55, соответственно.
Похоже, что это уже окончательные данные.

В чем следовало бы объясниться ЦИК

Пока единственное, что действительно подозрительно -- это что данные выбрасывались на официальный сайт большими кусками и с огромной задержкой по времени. А последние данные выложили так и вообще в 11 утра по Москве. И это все при страшном количестве коибов. При том заметьте, что смс-результаты по 2/3 участков были собраны уже к полночи.

Было бы неплохо услышать официальную версию, почему такое произошло.

из-под камода

В 2012 году в Москве за Прохорова проголосовало больше избирателей, чем за Навального в 2013 (868736 vs 632697).

ВременнЫе диаграммы

Я вообще люблю всякие динамические процессы, а тут anderson_mike предложил посмотреть на динамики процентов кандидатов -- т.е. как они менялись по времени обнародования данных на официальном сайте ЦИК. shipilev сделал отличную бродилку, которая собирала данные с сайта ЦИК и представляла их в форме удобоваримых таблиц (за что ему огромное спасибо). Вот тут представлены результаты эксперимента  anderson_mike в качестве таблицы; я же их просто визуализую. Сразу предупрежу, что пунктирные линии - это не более чем для обозначения соответствия точек; никаких изменений вдоль линий не происходило.
dynamics
По горизонтальной оси - время от закрытия участков. Как видно, первое обновление с 3.5% голосов прошло уже через 2.5 часа, и именно из этих данных появилась явка в 35%, собянинский результат в 56%, и навальновский в 23%. Еще через 2.5 часа последовало следующее обновление, где учитывались 32% голосов и явка уже стала 32.4%, Собянин набрал 52.7%, а Навальный - 26.2%. Это вполне объяснимо, поскольку первыми отрапортовались всякие полузакрытые учреждения, которые традиционно голосуют за власть. Следующее обновление следует через 2 часа, учитывает 70% голосов и изменяет результаты кандидатов на 1% в те же стороны.

А потом следует пауза на 8 часов, после которой публикуются официальные данные, которые меняют результаты на какие-то вшивые две десятых процента.

Интересно, зачем была нужна эта пауза, и что в ее течении происходило.

Понятно, что вы мне сейчас скажете, что по мере увеличения выборки среднее стремится в его истинному значению, и, понятно, что я соглашусь, что именно так и должно быть. Вот только стремится-то оно не случайным, а вполне закономерным образом. Мой опыт работы с молекулярными системами говорит мне, что должен быть систематический процесс, который изменяет среднее по мере накопления статистики. Что будет аналогом подобного процесса в этом случае? Начальное сильно-нерепрезентативное отклонение?

Collapse )
UPD Прозорливый barouh предложил, а любезный
shipilev посчитал разницу между результатами дампов данных, т.е. какой именно результат получен в выборке с, например, 5:00 до 6:30. Таким образом, удалось избавится от эффекта памяти, т.е. когда предыдущая (особенно первая) точка влияет на последующие результаты. Новые точки показаны открытыми кружочками, и таки да, я готов, наверное, согласиться, что разброс точек вокруг среднего значения более-менее случаен (точнее, я не возьмусь доказать, что отклонения выпадают из случайного тренда за исключением первой точки, которую уже обсудили).

Но тут возникает вот какой забавный сценарий. Посмотрите на Собянинские результаты с точки зрения избиркома: за четыре первых же часа каждые 10% посчитанных данных понижают результат Собянина на 1%! И таким жизнерадостным образом тренд доезжает до 50.3%, а впереди еще 35% необработанных данных, т.е. верных минус 3%. На горизонте уже маячат 47% за Собянина... вот чтоб бы сделали в такой ситуации? правильно, приостановили бы разглашение новых данных, пока сами не убедитесь в переломе тренда. Даже наплевав на все обещания сообщить результаты уже в день выборов. Страшно же!

Не, anderson_mike - это голова. Не догнали, так хоть согрелись!

UPD2 По просьбе afrikanbo (который "диссеррубка") добавил остальных кандидатов. Ну, у них первая же выборка попала в цель, что говорит о том, что они никому неинтересны ... а о чем это говорит?

Про надомников

home
Показан результат как функция доли "надомников" на участке; взешивание происходило по количеству проголосовавших на участке. Белая линия, как всегда, показывает среднюю величину.
Высоко начальное значение у Собянина (и низкое у Навального) объясняется просто: если надомников ноль, то с участком что-то не то: это или тюрьма, или школа кгб. Потом у Собянина идет падение до 49.9% -- это "нормальные" участки с вкладом надомников порядка 4%; их больше всего. А потом результат Собянина начинает подниматься, что интерпретируется как более значительный вклад надомников, которые понятно как голосуют. Они и перетягивают голосование на себя: при 10% надомников Собянин набирает уже 56%. Дальше тренд сохраняется, и при 20% надомников Собянин имеет уже около 70% -- правда, и участков таких очень немного.

У Навального тренд гораздо проще: вниз с ветерком, с 28% вначале до 23% при 10% надомников, далее везде. Ну, не любят его старики и старушки.

Понятно, что без админресурса тут не обошлось: и прислать урну надомники часто не просили, и соцработники каким-то образом оказались вовлеченными в эти визиты (я не думаю, что им платили из избирательного фонда Собянина), и письма счастья получали от самовыдвиженца (откуда он адреса пенсионеров-то знал?). Однако можно ли из этого сделать "кейс", я не знаю. И, во всяком случае, это голосование учесть уже нельзя.