?

Log in

No account? Create an account
Ща я вам еще одну штуку расскажу - Maxim Pshenichnikov — LiveJournal
December 7th, 2011
06:54 pm

[Link]

Previous Entry Share Next Entry
Ща я вам еще одну штуку расскажу
Пацаны в подворотне научили.

Вертел я вертел двуразмерные гисторгаммы (это где явка на выборы и голоса за партию изображены совместно) так и эдак -- ну ничего нового. Тем не менее, кой-чего удалось надыбать.
Есть простой метод корреляционного анализа (не пугайтесь, ничего сложного), который можно использовать на двуразмерных гистограммах (опять не пугайтесь, щас объясню). Пусть есть распределение, как на картинке внизу, где цветом показана зависимость количества УИК, где при такой-то явке отдали столько-то голосов за партию имярек. Синий цвет - это ноль УИК, т.е. нет таких. Красный - наоборот, довольно много, а сколько именно, нарисовано на диаграммке слева.
Теперь перейдем к практике. Вот вам два распределения; расскажите, что вы видите.
 

А видите вы вот что: при явках до 50% (это максимум явки, кстати) голосование за ЕР коррелировано с явкой отрицательно, а за КПРФ - положительно. Иными словами, больше народу голосует - хуже результате ЕР и лучше - КПРФ (я это прямыми линиями подчеркнул, для наглядности). А вот на явках больше 50% тренд сменяется на противоположный: больше явка - больше перепадает ЕР и меньше КПРФ. Вторая часть хорошо известна, и обсуждалась много раз. А вот данные при первой половине явки еще вроде никто не рассматривал -- уж очень трудно разглядеть тренд невооруженным глазом, тут наука нужна.

Еще раз: при явках до 50% чем больше народу приходит голосовать, тем меньше перепадает ЕР и тем больше - КПРФ и, кстати, СР и Яблоку.

Вот картинка для остальных партий:


Что я тут вижу:
1а. Невероятно крутое, буквально изломное изменение тренда за ЕР при 50%.
1б. Второй излом тренда у ЕР на 85% - скачек голосов на 15-16 процентов при увеличении явки всего на 2-3%.
2. Изменение тренда у КПРФ на 50% тоже довольно резкое.
3. СР ведут себя плавненько.
4. У ЛДРП тренд при явке <50% тоже отрицательный.
5. Яблоко... да его и не видно, Яблока-то. Но если его наддуть, то тренд будет положительным только до 30%, да и то...
Давайте, кидайте ваши идеи, пока ЖЖ окончательно не сдох!

(96 comments | Leave a comment)

Comments
 
Page 1 of 2
<<[1] [2] >>
[User Picture]
From:corbulon
Date:December 7th, 2011 06:01 pm (UTC)
(Link)
1) Есть два типа голосования: естественное и неестественное.
2) Можно посчитать к-ты корреляции по Спирмену, чтобы не обсуждать гипотезу линейности.
[User Picture]
From:oude_rus
Date:December 7th, 2011 06:15 pm (UTC)
(Link)
2). Зачем?
[User Picture]
From:q_uadrat
Date:December 7th, 2011 06:07 pm (UTC)
(Link)
Ну, объяснение напрашивается - снижение доли Едра до 50% явки - это протестный электорат, который раньше на выборы не ходил. Который характерен именно для этих выборов, сделал их и сейчас не удовольтворен результатом.

Логичное объяснение поведения остальных партий до 50% явки - это особенности голосования протестного электората. Эти люди предпочитали голосовать за комми и СР (у вас тренд скорее положительный), но не за ЛДПР. Собственно, объясняет сравнительный успех этих партий по сравнению с ЛДПР. Этот же протестный сегмент не поверил в Яблоко, поэтому там нет эффекта.

Ох, ну а все, что происходит при увеличении явки с 50% - это все вброс, принудиловка и Кавказ.
[User Picture]
From:woooody
Date:December 8th, 2011 04:59 pm (UTC)

Полностью согласен

(Link)
А у ЛДПР поведение схоже с ЕР. Т.е. за них голосовали те, кто привык ходить на выборы и голосовать за ЛДПР.
[User Picture]
From:1satana
Date:December 7th, 2011 06:13 pm (UTC)
(Link)
Реализация, выходит, априорной девичьей мечты (слева)...
А до пенсии ещё пахать и пахать ;)
Поклон
Ю. (теорфиз.)
[User Picture]
From:samolet73
Date:December 7th, 2011 06:19 pm (UTC)
(Link)
Один вопрос - судя по графикам, КПРФ нигде выше 16% не набрала. Хотя по информации были участки где было и больше 20%. Они ушли в стат погрешность?
[User Picture]
From:tommi_anya
Date:December 7th, 2011 06:30 pm (UTC)
(Link)
как это? на графиках у КПРФ около 25%, иногда доходит до 30%
[User Picture]
From:Артём Пятков
Date:December 7th, 2011 06:31 pm (UTC)
(Link)
Особенно мне нравится красный остров при явке 100% и голосах 100% у ЕР и 0% у КПРФ. Я вижу это так:
если гипотеза о вбросах в пользу ЕР при явке >50% верна, то там где явка нереально большая, были самые сильные фальсификации в пользу ЕР и следовательно:
- ЕР там получит нереально большие результаты
- а КПРФ, напротив, наименьшие.
Эти острова - признак того, что было много участков в которых нарушения были просто... слово подобрать не могу... такими, что к стенке председателей ставить надо.
From:(Anonymous)
Date:December 7th, 2011 06:53 pm (UTC)
(Link)
100% у ЕР при 100% явки - это Кавказ и участки полностью состоящие из воинских частей. Про воински части отдельный разговор там участковые комиссии можно смело закрывать в 9 утра - все уже проголосовали и так как надо.
[User Picture]
From:muh2
Date:December 7th, 2011 06:36 pm (UTC)
(Link)
А почему яиц-то не видно? Как-то они меня удивляют. Хотя одно объяснение было выдвинуто (при полноя явке тяжело вбрасывать), но интересно бы проверить.
[User Picture]
From:oude_rus
Date:December 7th, 2011 06:56 pm (UTC)
(Link)
чего-чего не видно?
[User Picture]
From:Артём Пятков
Date:December 7th, 2011 06:49 pm (UTC)
(Link)
Еще навеяно соседним постом на эту тему (рекомендую кстати)
http://yggaz.dreamwidth.org/143103.html
На первом графике поддержки ЕР обратите внимание на белую линию выше 50% явки. Это усреднение по голосам видимо. В идеале на ней не должно быть ярких периодических повторений, неоднородностей, закономерностей, кроме тенденции к росту или падению. Однако посмотрите на горки, посередине между резкими провалами:
65% явки
70% явки
75% явки - сильный острый пик
85% явки - очень сильный острый пик
90% явки - вообще конкретно выползает за линию регрессии вверх - самая популярная явка :3
И эти уровни явки близки к таким же круглым значениям поддержки ЕР:
90% явки - 95% ЕР
75% явки - 75% ЕР
Такие круглые значения маловероятны в условиях случайных честных выборов. Любовью к круглым числам славятся именно люди, т.е. те, кто считают голоса. По ссылке графики в других разрезах, там это намного лучше видно. Практически очевидно.
[User Picture]
From:oude_rus
Date:December 7th, 2011 06:58 pm (UTC)
(Link)
простите, вы мои предыдущие посты читали? там про это было.
[User Picture]
From:iime
Date:December 7th, 2011 06:50 pm (UTC)
(Link)
ЖЖ, кстати, не сдыхал. Послеlние несколько дней он все время прекрасно работал через прокси с нерусскими IP.
Почему при этом писали про DDos - непонятно, но это неправда.
[User Picture]
From:oude_rus
Date:December 7th, 2011 06:59 pm (UTC)
(Link)
у меня IP уж настолько нерусский, что дальше некуда.
[User Picture]
From:bydd
Date:December 7th, 2011 07:04 pm (UTC)
(Link)
левый тренд (условно реальный, без вбросов и подтасовок) скорее всего и является неким "нормальным" трендом выборов
1) там где избиратель пассивен (участки с низкой явкой, города и т.п.) доля ЕР высока за счет того, что приходит активная ЕР часть (пенсионеры и "обязанные" приходить госслужащие), а пассивная протестная не приходит
2) там где избиратель проявил активность (участки с высокой явкой) за счет большего количества пришедших на выборы "протестно" настроенных избирателей повышается доля КПРФ (скажем в традиционном "красном поясе" и т.п., соответственно снижается доля ЕР
3) тренд "Яблока" очень хорошо вписывается во все это с уточнением - подавляющее большинство голосующих это крупные города, где явка традиционно низка (реальная порядка 30%, что как раз и соответствует излому - то есть тренд Яблока такой же как для КПРФ, но он просто для УИК с традиционно низким голосующих.
(Deleted comment)
[User Picture]
From:kobak
Date:December 7th, 2011 07:49 pm (UTC)
(Link)
О! Отлично.
(Deleted comment)
(Deleted comment)
(Deleted comment)
[User Picture]
From:zametilprosto
Date:December 7th, 2011 07:10 pm (UTC)
(Link)
Идеи? Да без проблем!

Россия разделилась на две группы популяций - либеральную и консервативную

В либеральных популяциях популярность ЕР не очень высока, а сторонники ЕР склонны прийти на голосование немного меньше, чем сторонники других партий, но вообще народ не очень склонен голосовать.

В консервативных популяциях популярность ЕР высока, народ активно идет на глосование, и сторонники ЕР идут на голосование гораздо активнее сторонников других партий.

Вроде тогда что-то похожее получится без, кхм... художественного рисования

Но вот объяснить пики на процентах кратных пяти - это очень крутой мозг нужен...
[User Picture]
From:oude_rus
Date:December 7th, 2011 07:13 pm (UTC)
(Link)
по моим наблюдениям, основная популяция России - это пофигисты.
[User Picture]
From:bydd
Date:December 7th, 2011 07:19 pm (UTC)

идея как вычислить приближенные к реальным итоги голо

(Link)
наверное, адова работа, но скорее всего стоит того:
- по всем регионам, областям, районам и городам попытаться выделить некие УИКи с реальной, свойственной именно этому району явкой и отбросить УИКи "аномально" высокой конкретно для каждого региона.
- для итоговой выборки взять оставшиеся участки с реальной явкой. заменить УИКи с аномальными явками на средние значения по "нормальным" УИКам. То есть: имеем для какого то ТИКа (численностью скажем 10 000 избирателей) 10 УИК с численностями скажем 1000, 1000, 1000, 1000, 1000, 800, 1200, 1000, 500, 1500 избирателей. по анализу процента проголосовавших имеем 3 участка с нормальной и 7 с аномальной - убираем из анализа участки с аномальной явкой и для общей цифры ТИКа экспонируем относительно числа избирателей в нормальных результаты трех УИК "нормальной" явкой.
- сделать расчет по этой выборке
- профит: получить некие приближенные к реальным итоги голосования по все стране на основании выборки участков с "нормальной" явкой
[User Picture]
From:corbulon
Date:December 7th, 2011 07:22 pm (UTC)

Re: идея как вычислить приближенные к реальным итоги го

(Link)
посмотрите у podmoskobnik'а.
Он делает это изящнее.
[User Picture]
From:jktue
Date:December 7th, 2011 07:41 pm (UTC)
(Link)
1а. коэффициенты регрессии до 50% статистически значимы?

если идеи накидывать - разделить вероятносную смесь. видны три ~нормальных кластера на явках 50,55 и 100% + один неведомой природы :). последний представляет интерес.
[User Picture]
From:oude_rus
Date:December 7th, 2011 07:51 pm (UTC)
(Link)
думаю, что да. но тут немного хитрее, поскольку точки регрессии получены опосредовано.
[User Picture]
From:klayklayklay
Date:December 7th, 2011 08:17 pm (UTC)
(Link)
Думал, как подступиться с тем голосам, которые отнимают у всех остальных партий и меняют на голоса ЕР. Вероятно, по флуктуациям.

Смотри. В нормальном случае если на участке "просела" какая-то одна партия, то эта "недостача" должна равновероятно распределиться по остальным партиям. Кроме того, флуктуации должны быть сиимметричными, вроде бы. А у нас же отнимают голоса очень тупо - сравните протоколы наблюдателей и официальные данные - зачастую просто затирают первую цифру, например, превращая 159 голосов в 59. Такие тупые флуктуации можно отделить от нормальных квазигауссовских.

Можно как-то использовать зависимость флуктуаций от третьего параметра - явки, например.

Смотри, на вот этой картинке совершенно чётко видно, что облако "КПРФ" флуктуирует вниз гораздо сильнее, чем вверх. Объяснение напрашивается простое: на всех участках пытались "откромсать" кусок от истинных голосов КПРФ - пытались откромсать побольше, но получалось везде это с разной степенью успеха.



Наверняка можно действовать так:
1) Сначала аппроксимировать (функциями второго порядка) облака на графике "Явка за партии" - "Общая явка".
2) Вычесть эти функции из соответствующих облаков, оставив только флуктуации.
3) Построить матрицу корреляций.
4) Офигеть.
5) Сравнить эту матрицу с нормальной. Как корректно посчитать нормальную аналитически, пока не соображу. Но можно это в два счёта сделать численно по Монте-Карло - 100 миллионов избирателей поделить на 1000 тысяч избирательных участков, и назначить каждому участку "вероятности проголосовать за разные партии", которым подчиняются жители. Вероятности распределить нормально вокруг среднероссийского значения.
[User Picture]
From:ungamed
Date:December 8th, 2011 06:06 am (UTC)
(Link)
ее! имитационное моделирование фальсификации!
(no subject) - (Anonymous) - Expand
[User Picture]
From:corbulon
Date:December 7th, 2011 09:04 pm (UTC)
(Link)
можно попробовать посмотреть корреляции от числа проголосовавших по открепительным
(явка, результат выбора).
Вдруг что-то вылезет?
Powered by LiveJournal.com