Начнем с простого: с распределений участков по явке в разное время дня:
Первая диаграмма (красный цвет) снята в 12 часов дня (т.е. сняты данные с 540 участков, диаграмму я сам по ним строил), вторая (синий) в 15 и т.д. Во-первых, видно, что распределения довольно аккуратненькие и прекрасно описываются - не побоюсь этого слова - гауссовой функцией. Со временем распределения становится шире и шире, посколько случйным событиям дается больше времени на "растаскивание" распределения. Так как сумма всех точек в распределении должна давать общее количество УИК, т.е. постоянную величину, расширение функции сопровождается уменьшением ее амплитуды. Можно довольно аккуратно определить центр распределения (т.е. наиболее вероятную явку в данное время), и отложить ее как функцию времени (график наверху). Опять-таки хорошо видно, что с утра явка меняется медленно (народ спит), к трем дня изменение явки раскочегаривается до максимальной скорости, а потом опять идет на убыль.
...пока не наступает 20 нуль-нуль, оно же время закрытия участка. Тут важно отметить, что динамическая явка, предоставляемая сайтом избиркома, ограничена 18:00, но явку на 20:00 легко вытащить из итоговых результатов -- ведь с момента закрытия участка в 20:00 протоколы не менялись, верно? Итак, в 20:00 наша красивая теория терпит крах: в распределении вдруг появляются два максимума, разнесенные процентов эдак на 28, то есть их не спутаешь. Максимум с меньшей явкой прекрасно вписывается в предыдущую теорию (см кривую наверху), а новый явно вываливается из тренда. Такое распределение, кстати, называется бимодальным, и теория говорит нам, что к нему приводят два различных фактора. Один фактор мы знаем - это обычный избиратель, а вот со вторым пока непонятно. Давайте назовем его "гиперактивным избирателем".
Чтобы понять, какова роль гиперактивного избирателя, можно использовать традиционный корреляционный анализ. Для этого я нарисовал положение каждого участка на плоскости "приращение явки за последние 2 часа" (а мы уже знаем, что есть приращение обычное, где-то на 6%, а есть - гиперактивное, аж на 33%) - процент голосов за партию (например, ЕР):
Собственно корреляция показана на средней картинке, а на двух сопроводительных - сумма всех участков с таким-то изменением явки (внизу) и суммой всех участков, которые проголосовали за партию (слева). То есть левую диаграмму мы уже видели (как вспомню, где, дам ссылку), и знаем, что она бимодальна (т.е. с двумя максимумами), но откуда они берутся, было неясно. Теперь же на корреляционной диаграмме ясно видно, что второй максимум происходит от участков с гиперактивным избирателем. Который, к слову, весьма щедр к ЕР, поскольку дает ей аж 48% заместо 31% на остальных участках.
Теперь можно сделать последний шаг. Из графика хорошо видно, что граница между нормальными и гиперактивными участками проходит по изменению явки где-то около 13% (это называется "параметр контраста"). То есть мы можем поделить все участки на обычные и гиперактивные, и изобразить их на стандарной корреляционной диаграмме %ЕР-явка:
Довольно наглядно видно, что второй кластер участков, который так щедро голосует за ЕР -- это и есть кластер гиперактивных участков. И такох участков немало - 153 из 540. Также интересно, что в гиперактивном кластере нет ни одного участка с электронным считывателем бюллетеней - КОИБ (зеленые крестики)
Разумеется, возникает вопрос: что это за гиперактивные участки такие, так благоволящие к ЕР? У меня есть теория, но я сначала хочу послушать вас. Давайте, предлагайте версии.