?

Log in

No account? Create an account
Дива -- не прочесть тайну - Maxim Pshenichnikov — LiveJournal
January 19th, 2012
06:08 pm

[Link]

Previous Entry Share Next Entry
Дива -- не прочесть тайну
Про бимодальную динамику явки в Москве. После Н.Новгорода и Самары мы уже как-то поверили, что бимодальное распределение явки - это трололо и вообще очень интересно.
А в Москве, как известно, явка как раз бимодальная. Ну я и посмотрел, что у нас будет в течение дня:

Зеленые точки - это как раз обещанная бимодальная официальная явка на 20:00. Бимодальность, конечно, не очень выражена, но любой спектроскопист вам скажет, что тут две линии. Но вот какая незадача: на 18:00 явка... опять бимодальная. И на 15:00.  И на 12:00. И даже на 10:00 видно небольшое крылушко.

Но - еще раз - конраста, чтобы ясно разделить два распределения, не хватает, поэтому придется немного помоделировать. Первая идея - а давайте сфитим линии двумя гауссами - не проходит, поскольку параметры одного гаусса могут компенсироваться параметрами другого. Фит нестабилен; нужны дополнительные условия. Я взял такие:
а). Есть два суб-ансамбля участков, которые голосуют с разной скоростью
б). Между суб-ансамблями нет перемешивания, т.е. полное количество участков внутри одного суб-ансамбля не меняется со временем
в). Фитуются все кривые одновременно (глобальный фит)
Результаты показаны на рисунке сплошными линиями. Получилось неожиданно (для меня) неплохо, посколько обычно подобные фиты норовят-таки разъехаться (а я их очень много переделал).

Теперь мы можем взять положение каждого гаусса во времени (что дает наиболее вероятную явку) и отложить ее как функцию времени, вместе со стандартным отклонением (рисунок наверху в углу). И - страшное дело - два суб-ансамбля выборщиков прекрасно прослеживаются с самого утра. Обычные избиратели имеют явку где-то 5% в час (примерно как в Н.Новгороде), активные - около 6.5%. Зависимости -- если не считать наклона -- примерно одинаковые, с разницей между ними, которая растет примерно линейно со временем. И да, мы уже знаем, что активные избиратели в основном голосуют за любимую партию, но в Москве они это делают не в последние 2 часа, а в течение всего дня.

Я, кстати, проверил гипотезу "выбросов" -- т.е. когда, например, с 10 до 12 на участке идет большой скачок явки, а потом явка замедляется до обычных 5% в час. Если таких скачков много и они происходят в разные времена, то они размажутся, и получится плавная кривая с увеличенным наклоном. Так вот, ничего, голимый ноль: скачки есть, но они ни с чем не коррелированы.

UPD Добавил распределения по участкам с КОИБами (тоненькие линии). В общем, мало что прояснилось. Они, конечно, тяготеют к низкой явке, но не совсем. Если посмотреть на средние (тут я просто считал первый момент, без фита), то на 15:00 явка аккурат посередке (звездочки), и понятно, из-за чего -- из-за длинного хвоста. А вот на 20:00 явка нормализуется, и почти совпадает с "медленными" уиками.


Как внутри огромной Москвы могли оказаться два четко выраженных типа избирателя, я не понимаю. Было бы одномодальное распределение, пусть и широкое, и не гауссовое, -- было бы понятно, а так -- нет. Что же это за два типа избирателя? Прямо тайна какая-то. Есть идеи?

(184 comments | Leave a comment)

Comments
 
Page 1 of 2
<<[1] [2] >>
[User Picture]
From:corbulon
Date:January 19th, 2012 05:28 pm (UTC)
(Link)
Надо все же где-то сказать, в какую популяцию входят закоибленные участки.
И в какую - те участки, на которых младшие волшебники тренировались писать свои протоколы.
[User Picture]
From:oude_rus
Date:January 19th, 2012 05:34 pm (UTC)
(Link)
я все это довольно давно сделал, просто руки вывесить не доходили.
тогда сделать то, что ты просишь -- это была целая песня.
со свежим файлом будет, наверное, проще с коибами.
попозже сделаю, спасибо за предложение.
а младших волшебников искать, если честно, лень.
[User Picture]
From:asund
Date:January 19th, 2012 06:02 pm (UTC)
(Link)
Как вариант, если говорить о популяциях - посмотреть то же самое хотя бы по округам (если не в отдельно взятом Свиблово). Мы знаем, что в СЗАО и СВАО любимую партию любят не так сильно, как в остальных.
[User Picture]
From:oude_rus
Date:January 19th, 2012 07:55 pm (UTC)
(Link)
я смотрел разумеется. с первого взгляда там ничего не видно -- ну, распределения, ну широкие. А такого, что здесь широкие, а здесь узкие, я не нашел.
статистики не хватает.
[User Picture]
From:sergey_cheban
Date:January 19th, 2012 06:16 pm (UTC)
(Link)
У меня две гипотезы:
1. Волшебство Чурова в принципе позволяет рисовать кривые любой формы. Если бы он был волшебником, то нарисовал бы гаусса. Но он только учится, и пока научился лишь размазывать вбросы по времени.
2. В некоторые УИКи были внедрены люди, но не вбрасывающие бюллетени после вскрытия урн, а выдающие бюллетени "активным избирателям". Т.е. вброс фактически происходил не одномоментно, а был размазан во времени. Что и видно в статистике.
From:saccovanzetti
Date:January 19th, 2012 07:06 pm (UTC)
(Link)
2. по моим прикидкам, таких УИКов где-то 25%, а на графиках площадь под соседними гауссами примерно одинаковая - то-есть в каждом втором УИКе жулики? маловероятно.
From:vasja_iz_aa
Date:January 19th, 2012 06:29 pm (UTC)

два четко выраженных типа избирателя

(Link)
это у Вас дырка в логике. четко выраженые два типа [избирателя] -- это мужчины и женщины; или например математики и гуманитарии. Каждый [избиратель] может быть легко отнесен к своему типу, промежуточные варианты хоть встречаются, но пренебрежимо редки и экзотичны. А у Вас на графике промежуточночного типа [избирателя] сравнимое количество с любым из "чистых" вариантов
[User Picture]
From:oude_rus
Date:January 19th, 2012 07:54 pm (UTC)

Re: два четко выраженных типа избирателя

(Link)
если я могу различить спектральные линии -- их две.
ну да, будут смешанные состояния, и что?
[User Picture]
From:neiztvoegorebra
Date:January 19th, 2012 07:03 pm (UTC)
(Link)
"Ведомости" сегодня написали про Гаусса: http://www.vedomosti.ru/opinion/news/1479180/normalnoe_raspredelenie_ne_dogma
[User Picture]
From:oude_rus
Date:January 19th, 2012 07:53 pm (UTC)
(Link)
с одной стороны, мужик стучится в давно открытую дверь.
с другой, приводя в пример мажоритарную Великобританию, он показывает, что слегка не в теме.
[User Picture]
From:in_kant
Date:January 19th, 2012 08:44 pm (UTC)
(Link)
Подожди, а ты уверен, что корректно говорить о двух типах избирателей? Может быть, было бы правильно сказать о двух четко выраженных типах УИКов (причем в пропорции почти 1:1)?
[User Picture]
From:oude_rus
Date:January 19th, 2012 08:51 pm (UTC)
(Link)
ну на уиках-то голосует избиратель, верно?
или мы говорим об уиках, которые голосуют сами по себе?
[User Picture]
From:asund
Date:January 19th, 2012 08:50 pm (UTC)
(Link)
Тогда черт его знает, что это такое.
Еще вариант. Есть два типа председателей УИК. Первый ведет точный учет и дает точные данные по явке. Второй задолбался (что, кстати, немудрено) и дает примерную явку с некоторым округлением "вверх". Почему - понятия не имею, психология какая-то работает. Я бы тоже округлял вверх.
[User Picture]
From:oude_rus
Date:January 19th, 2012 08:53 pm (UTC)
(Link)
тогда последний сегмент был бы с отрицательной производной: никакая "явка" на 20:00 не существует, это итоговая явка официального протокола.
[User Picture]
From:jemmybutton
Date:January 19th, 2012 08:53 pm (UTC)
(Link)
Два типа участков, между которыми распределены неслучайно избиратели, точнее. и при этом известно что вроде есть корреляция между явкой и голосами за ЕР без переписывания протоколов. Если эта корреляция есть весь день, то это может быть северо-запад и юго-восток, грубо говоря http://russian-election.appspot.com/?
[User Picture]
From:oude_rus
Date:January 19th, 2012 08:56 pm (UTC)
(Link)
запросто.
только непонятно, откуда подобное распределение берется именно на уровне участков.
по округам я смотрел, ничего не нашел.
может, и недосмотрел, конечно.
[User Picture]
From:corbulon
Date:January 19th, 2012 09:16 pm (UTC)
(Link)
ты помнишь, что эти два кластера, две популяции и два оркестра ансамбля ведут себя по-разному, если смотреть на число недействительных и даже совсем на невинные вещи: на число проголосовавших по открепительным.
[User Picture]
From:oude_rus
Date:January 19th, 2012 09:29 pm (UTC)
(Link)
и что?
я могу сказать больше: активный кластер преимущественно голосует за любимую партию.
собственно, это 5го декабря уже было установлено.
но голосуте-то в течение всего дня.
что, тут есть криминал?
[User Picture]
From:andirect
Date:January 19th, 2012 09:52 pm (UTC)

Двугорбая Москва

(Link)
Выскажу свои соображения по поводу двугорбости.

Предположим, что исходное распределение явки соответствовало нормальному закону распределения. Среднее значение примем равным 47%. Этот процент получен Шпилькиным по одноимённому методу. СКО примем 3,5% (из консультаций с ним же, по итогам предыдущих выборов). Будем рассматривать не распределение участков по явке, а распределение голосов на этих участках (что правильнее).
Теперь предположим, что на некоторых участках производился вброс, скажем 5% бюллетеней. При этом имеющиеся голоса переместятся на 5% вправо по оси явки, и к их количеству прибавятся эти 5%. Гауссиана при этом растянется вправо по оси явки.
Зная исходное (предположительно) и конечное распределение голосов, можно подобрать параметры распределения этого вброса таким образом, чтобы эти распределения максимально соответствовали друг другу.

Выглядит это всё так, для Москвы:

Распределение вброса (процентное значение количества участков, на которых был применён вброс определённого % бюллетеней) показан светло-коричневой кривой с маркерами-крестиками. Сглаженная кривая получилась (подобрана) для уменьшения СКО отклонения от показанной явки.
Хотя распределение вброса идёт от 0%, удобно строить его от максимума гаусианы (что и сделано), тогда пики распределения соответствуют пикам показанной явки, поскольку максимальное воздействие оказывают на максимум гаусианы. Левая горизонтальная часть кривой соответствует 12,2% участков, на которых вбросы не привели к переходу в другой разряд гистограммы.

Видно, что результирующая двугорбая кривая не была результатом какого-то одного процента вброса, вполне себе распределённый вброс, что-то вроде спектрограммы с пиками через 4-5%. (100 вброшенных бюллетеней при размере участка 2100 человек увеличивают явку на 4,8%)

Это построено для окончательной явки, но, при наличии данных промежуточной явки с раскладкой по участкам, можно было бы провести аналогичный анализ и для этих случаев.

Идея вышеизложенного в том, что не обязательно искать несколько разных голосующих групп избирателей, всё неплохо объясняется разбросом вброса на разных участках.
[User Picture]
From:oude_rus
Date:January 20th, 2012 07:04 am (UTC)

Re: Двугорбая Москва

(Link)
1. что отложено по вертикальной оси?
2. откуда взялась коричневая кривая?
[User Picture]
From:vladislav_01
Date:January 19th, 2012 10:09 pm (UTC)
(Link)
Может, всё проще? В Москве решили заранее (или уже после подведения итогов) "размазать" высокую явку, чтобы всякие критиканы не стебались потом на тему, как 1000 избирателей пришли на участок с 18 до 20 часов (и голосовали со скоростью 8 человек в минуту)?
[User Picture]
From:oude_rus
Date:January 19th, 2012 10:25 pm (UTC)
(Link)
слишком сложно, хотя и не невозможно.
[User Picture]
From:sergey_cheban
Date:January 19th, 2012 10:45 pm (UTC)
(Link)
Кстати. А участки, на которых наблюдатели жаловались на нарисованные протоколы - они из какого ансамбля? Если из "активного" то активность, вероятно, нарисовал Чуров, по линеечке увеличив все данные на какой-то коэффициент (свой для каждого участка).
Кстати, при таком подходе, наверное, могут появиться какие-то "запрещённые" значения опубликованной явки, которые нельзя получить умножением целочисленной явки на частное от деления "нарисованной" окончательной явки и фактической окончательной явки. Ну, например, если фактически на участок к 20:00 явились 10 человек, Чуров нарисовал 40, а все значения промежуточных явок домножил на 40/10, то явка 1, 2, 3, 5, 6, 7 на 10:00 у него в принципе не могла получиться, а вот 0, 4 или 8 - пожалуйста.
Нельзя ли из этого что-нибудь выжать, по аналогии с пятипроцентными пиками? Ну, например, можно было бы для каждого участка найти множество тех количеств приписанных бюллетеней, при которых одновременно возможны все опубликованные значения промежуточных явок. А потом посмотреть, укладываются ли в эти множества данные из протоколов наблюдателей.
Ну и нужно учесть разные варианты округления.
[User Picture]
From:barouh
Date:January 20th, 2012 05:15 am (UTC)
(Link)
засада в том, что промежуточная явка считается в процентах от предполагаемом на момент начала голосования количества избирателей (которое притом нигде не публикуется!), а финальная явка - от итогового количества избирателей, которое может отличаться как в большую, так и в меньшую сторону
[User Picture]
From:kobak
Date:January 19th, 2012 10:59 pm (UTC)
(Link)
Остался неподнятым вопрос о том, почему второй пик не расплывается в ширину после 15 часов, в отличие от первого.
[User Picture]
From:oude_rus
Date:January 20th, 2012 06:39 am (UTC)
(Link)
не расплывается, только двигается.
но тут, может, уже точности не хватает.
[User Picture]
From:poulsam
Date:January 20th, 2012 03:10 am (UTC)
(Link)
Хм, это было самое главное распределение 5-го декабря, именно бимодальность избирателя Москвы кричала громче всех
[User Picture]
From:oude_rus
Date:January 20th, 2012 06:42 am (UTC)
(Link)
нет, речь шла про другое распределение - конечного голосования за любимую партию. Там пики гораздо более выражены, и второй пик имеет резкий подъем после 50%, а потом экспоненциальный (типа) спад.

ну и на гистограмме процент за - явка тоже отлично видны 2 кластера.
[User Picture]
From:barouh
Date:January 20th, 2012 05:22 am (UTC)
(Link)
4 возможных объяснения:

1) данные по промежуточной явке корректировались постфактум, чтобы давать естественное распределение голосов по часам. Я 4-го снял только данные по ТИКам, не по отдельным участкам. На уровне ТИКов особых расхождений не видно, но стоит посмотреть внимательнее

2) количество избирателей в итоговом протоколе подгонялось под вторую модальную явку (под сумму фактически проголосовавших и планируемых приписок, деленную на вторую модальную явку). Математически и организационно сложно, но стоит вспомнить, что многие наблюдатели отмечали, что в УИКах старательно избегали контроля за списками избирателей при подсчете количества избирателей и проголосовавших

3) масштабная карусель, охватившая примерно половину города. Мне верится с трудом

4) реальные различия в активности избирателей. Тоже верится с трудом. Непонятно, с чего эти различия могли бы привести к подобной бимодальности
Powered by LiveJournal.com