?

Log in

No account? Create an account
Все суета сует и всяческая суета - Maxim Pshenichnikov
January 11th, 2012
11:46 am

[Link]

Previous Entry Share Next Entry
Все суета сует и всяческая суета
Но даже суета бывает та или не та. Вот давайте о ней и поговорим протрезвевшим от праздников сознанием.

podmoskovnik выдал блестящую идею, обратив внимание на полезность т.н. "динамической явки", т.е. на изменение явки на каждом участке во время дня голосования. Оказывается, это явка считается несколько раз в день и официально выложена на сайте избиркома. podmoskovnik мне любезно прислал файл данных по Нижнему Новгороду (безусловный хит нонешних выборов), который я немного покрутил с целью визуализации.

Начнем с простого: с распределений участков по явке в разное время дня:

Первая диаграмма (красный цвет) снята в 12 часов дня (т.е. сняты данные с 540 участков, диаграмму я сам по ним строил), вторая (синий) в 15 и т.д. Во-первых, видно, что распределения довольно аккуратненькие и прекрасно описываются - не побоюсь этого слова - гауссовой функцией. Со временем распределения становится шире и шире, посколько случйным событиям дается больше времени на "растаскивание" распределения. Так как сумма всех точек в распределении должна давать общее количество УИК, т.е. постоянную величину, расширение функции сопровождается уменьшением ее амплитуды. Можно довольно аккуратно определить центр распределения (т.е. наиболее вероятную явку в данное время), и отложить ее как функцию времени (график наверху). Опять-таки хорошо видно, что с утра явка меняется медленно (народ спит), к трем дня изменение явки раскочегаривается до максимальной скорости, а потом опять идет на убыль.


...пока не наступает 20 нуль-нуль, оно же время закрытия участка. Тут важно отметить, что динамическая явка, предоставляемая сайтом избиркома, ограничена 18:00, но явку на 20:00 легко вытащить из итоговых результатов -- ведь с момента закрытия участка в 20:00 протоколы не менялись, верно? Итак, в 20:00 наша красивая теория терпит крах: в распределении вдруг появляются два максимума, разнесенные процентов эдак на 28, то есть их не спутаешь. Максимум с меньшей явкой прекрасно вписывается в предыдущую теорию (см кривую наверху), а новый явно вываливается из тренда. Такое распределение, кстати, называется бимодальным, и теория говорит нам, что к нему приводят два различных фактора. Один фактор  мы знаем - это обычный избиратель, а вот со вторым пока непонятно. Давайте назовем его "гиперактивным избирателем".

Чтобы понять, какова роль гиперактивного избирателя, можно использовать традиционный корреляционный анализ. Для этого я нарисовал положение каждого участка на плоскости "приращение явки за последние 2 часа" (а мы уже знаем, что есть приращение обычное, где-то на 6%, а есть - гиперактивное, аж на 33%) - процент голосов за партию (например, ЕР):

Собственно корреляция показана на средней картинке, а на двух сопроводительных - сумма всех участков с таким-то изменением явки (внизу) и суммой всех участков, которые проголосовали за партию (слева). То есть левую диаграмму мы уже видели (как вспомню, где, дам ссылку), и знаем, что она бимодальна (т.е. с двумя максимумами), но откуда они берутся, было неясно. Теперь же на корреляционной диаграмме ясно видно, что второй максимум происходит от участков с гиперактивным избирателем. Который, к слову, весьма щедр к ЕР, поскольку дает ей аж 48% заместо 31% на остальных участках.

Теперь можно сделать последний шаг. Из графика хорошо видно, что граница между нормальными и гиперактивными участками проходит по изменению явки где-то около 13% (это называется "параметр контраста"). То есть мы можем поделить все участки на обычные и гиперактивные, и изобразить их на стандарной корреляционной диаграмме %ЕР-явка:


Довольно наглядно видно, что второй кластер участков, который так щедро голосует за ЕР -- это и есть кластер гиперактивных участков. И такох участков немало - 153 из 540. Также интересно, что в гиперактивном кластере нет ни одного участка с электронным считывателем бюллетеней - КОИБ (зеленые крестики)

Разумеется, возникает вопрос: что это за гиперактивные участки такие, так благоволящие к ЕР? У меня есть теория, но я сначала хочу послушать вас. Давайте, предлагайте версии.

(97 comments | Leave a comment)

Comments
 
[User Picture]
From:kuzmax
Date:January 11th, 2012 11:10 am (UTC)
(Link)
Ну как же! Вы будто интернетов не читали перед выборами!
Там же ясно давали рекомендацию: приходить за пол-часа до закрытия, обнаруживать себя уже проголосовавшим, начинать шабаш с понятыми и заламыванием рук.
Вот гиперактивный избиратель и попёр, как лосось на нерест, перед самым закрытием ловить за руку нечистоплотную оппаЗицию.
По графикам явно видно, что участки, которых избежала участь посещения гиперактивными гражданами, вполне укладываются в нАрмальное рОспределение. А вот гиперактивный избиратель - он такой... его в шинель функции не засунешь, в дугу не загнёшь!
[User Picture]
From:kuzmax
Date:January 11th, 2012 11:17 am (UTC)
(Link)
Ах да, и про КОИБы. ну какой же гиперактивный гражданин доверит свой бюлетень адской машине? Там же ЦРУ сразу его голос украдут и другим отдадут!
From:saccovanzetti
Date:January 11th, 2012 11:38 am (UTC)
(Link)
эта явка в данных - те, кто лично пришел, или в 20:00 приплюсовываются всякие самоходные ящики для немощных и т.п. ?
[User Picture]
From:oude_rus
Date:January 11th, 2012 12:25 pm (UTC)
(Link)
не знаю, но можно посмотреть на данные без ящиков.
[User Picture]
From:in_kant
Date:January 11th, 2012 11:40 am (UTC)
(Link)
Работающие в воскресенье, которые пришли голосовать после работы (т.е. между 18 и 20 часами). Они типа голосуют за ЕР, в отличие от всяких голосующих за КПРФ пенсионеров и офисных бездельников, которые пришли днем.
[User Picture]
From:oude_rus
Date:January 11th, 2012 12:29 pm (UTC)
(Link)
принимается.
From:a_shen
Date:January 11th, 2012 12:07 pm (UTC)

правильно ли я понял, что

(Link)
критерий выделения гиперактивных кружочков на последнем рисунке? превышение порога 13% для явки в последний момент (разности между явками в 20 и перед этим)?
[User Picture]
From:oude_rus
Date:January 11th, 2012 12:26 pm (UTC)

Re: правильно ли я понял, что

(Link)
именно.
[User Picture]
From:jemmybutton
Date:January 11th, 2012 12:17 pm (UTC)
(Link)
А наблюдателям видно какую явку отправляют в «центр»?
[User Picture]
From:oude_rus
Date:January 11th, 2012 12:27 pm (UTC)
(Link)
не знаю.
[User Picture]
From:rb_petr
Date:January 11th, 2012 12:23 pm (UTC)
(Link)
Эти участки расположены в спальных районах в местах проживания суровых работяг, которые вкалывали все воскресение и потом, очевидно, в едином порыве и с чувством благодарности проголосовали за ЕР.

[User Picture]
From:oude_rus
Date:January 11th, 2012 12:29 pm (UTC)
(Link)
приниматся.
[User Picture]
From:seligenstadt
Date:January 11th, 2012 12:33 pm (UTC)
(Link)
Гениально. Снимаю кепку. Это обязательно должно куда-нибудь войти -- в дело или учебники, а может и туда, и сюда одновременно.
[User Picture]
From:barouh
Date:January 11th, 2012 12:44 pm (UTC)
(Link)
А что за 2 участка с КОИБами, результатом ЕР около 60% и нормальной явкой? Известно, что это за участки и чем они так выдаются?
[User Picture]
From:in_kant
Date:January 11th, 2012 12:58 pm (UTC)
(Link)
Нормальность распределения подразумевает, что есть конечная вероятность для любого результата. Грубо говоря, безо всяких фальсификаций чисто по теории вероятности должно быть определенное число участков, где случайно оказалось очень много избирателей ЕР, даже если в среднем по выборке за ЕР 30%.
[User Picture]
From:meindampf
Date:January 11th, 2012 01:14 pm (UTC)
(Link)
просьбу об интерпретации можно и нужно направлять в органы дознания нижегородской области. статистика, конечно, ничего не доказывает, но можно и нужно попросить проинтерпретировать
[User Picture]
From:total_offence
Date:January 11th, 2012 01:30 pm (UTC)
(Link)
Я был наблюдателем на уик2650 (мск). Считал "по головам", время от времени сверяясь с данными, передаваемыми секретарем уика в тик. Долгое время все совпадало +/- 10-20 человек. После примерно 16.30 данные мне больше не давали. По офиц данным избиркома на 18.00 явка была 41%. По моим данным итоговая явка 50% (как раз за 2 часа оставшихся добило). Итоговая официальная явка 64%. )) Как вам больше трети избирателей, пришедших на участок в последние 2 часа? Риторический вопрос, конечно - это как раз то, о чем вы пишите. Был вброс на прим 350-400 бюллетеней.

Мне разумеется отказали (официально - решением комиссии) в просмотре списков/книг избирателей, чтобы удостовериться, что кол-во подписей в этих книгах = офиц явке. Я бы там нашел на 350-400 подписей меньше.

И таких участков было много. Могу сказать, что в мск вы тоже увидите такие закономерности во многих районах. Вбрасывали плотно.
[User Picture]
From:podmoskovnik
Date:January 11th, 2012 01:49 pm (UTC)
(Link)
Да, на 2650 серьезные цифры: 1.5%, 9%, 21.7%, 41.8%, итоговая 64.1% - т.е. за последние два часа должно было прийти 22% от 2800 = больше 600 человек, 300 человек в час, 5 человек в минуту. Кстати, ТИК Раменки - в числе рекордных по стране по приросту явки в последние два часа (21.76%).

А кстати - как данные по явке передаются в ТИК? По телефону? И с какой частотой? Так, как в таблицах на izbirkom.ru (10, 12, 15 и 18 часов) или чаще?
[User Picture]
From:satear
Date:January 11th, 2012 01:55 pm (UTC)
(Link)
Да-да-да! Я когда наблюдателем был - каждые полчаса, а в пики - в 20 минут, отмечал у себя количество брошенных бюллетеней, что я насчитал. Я для себя планировал на всякий случай так засечь нездоровую активность (я почему-то предполагал что распределение явки людей должно быть близко к нормальному), что могло свидетельствовать о карусели или еще о какой подозрительной вещи.

Наблюдатель от ЕР, впрочем, убеждала меня что под конец голосования набежит народ, так сказать, локальный максимум, из тех, кто весь день работал, но поспешил исполнить гражданский долг. А девушка от КПРФ убеждала меня, что к вечеру подтянутся троллеры-интернет молодежь, которые за полчаса до конца придут проверить не проголосовал ли кто-то за них.

Но на самом деле ничего не случилось. После 18-00 можно было впадать в спячку.
По моим записям, в период 18:00 - 20:00 участок посетило 5.2% от общей явки.

По вашей записи еще хочу добавить - что очень красиво все сделано, лаконично и эстетично до дрожи сердечных струн. Можно сказать, я для себя взял несколько уроков оформления и подхода к статистическим исследованиям (я не профи).

Edited at 2012-01-11 02:05 pm (UTC)
[User Picture]
From:kobak
Date:January 11th, 2012 02:11 pm (UTC)
(Link)
А Вы где были наблюдателем?
From:vasja_iz_aa
Date:January 11th, 2012 06:22 pm (UTC)
(Link)
Интересно, что вполне заметное число гиперактивных участков дало низкий процент голосов за ЕР.
[User Picture]
From:oude_rus
Date:January 11th, 2012 06:50 pm (UTC)
(Link)
гы. про это будет в следующем номере нашей программы.
[User Picture]
From:jemmybutton
Date:January 11th, 2012 07:01 pm (UTC)
(Link)
А еще интересно (может не только я не знал?) что один КОИБ=1 участок (по крайней мере в НН) и 123 «участка с КОИБами» физически расположены всего по 74 адресам (http://nnov.izbirkom.ru/etc/011_179__5_ob_uik_s_koib_2_version.doc).
[User Picture]
From:oude_rus
Date:January 11th, 2012 07:10 pm (UTC)
(Link)
по одному адресу могут распологаться несколько участков.
[User Picture]
From:lovim_vorov
Date:January 11th, 2012 09:41 pm (UTC)

неприличный вопрос

(Link)
а Вы проверяли нормальность этого распределения? по хи-квадрат или ещё как?
Потому что у нас тут получается другое: http://lovim-vorov.livejournal.com/9473.html и непонятно - это такая питерская специфика или... глюк подсчётов... или?
... доли вообще не могут быть распределены по гауссу, строго говоря...
[User Picture]
From:oude_rus
Date:January 11th, 2012 10:05 pm (UTC)

Re: неприличный вопрос

(Link)
мне вобщем-то пофигу, хи там или не хи. На мой глаз описывает, да и бог с ним (правда, глаз у меня довольно тренированный).

Если вы обратили внимание, я отнюдь не везде даю гаусс.

И уж совсем в мои намеренья не входит гауссосрач.
Powered by LiveJournal.com