?

Log in

Этот график посложнее будет, но вполне продираем. Следите, значит, за… - Maxim Pshenichnikov
December 5th, 2011
07:21 pm

[Link]

Previous Entry Share Next Entry
Этот график посложнее будет, но вполне продираем. Следите, значит, за пальцами.
На графике разными цветами показано количество УИКий, где явка была такая-то (горизонтальная ось) и за ЕР проголосовало столько процентов (вертикальная ось). Где цвет красный - такий УИКий много, где синий - вообще нет. Например, при явке в 51% за ЕР с результатом в 25% проголосовало 10 УИКий.


Сразу видно, что данные кластеризуются вокруг двух "фокальных точек": явка 50%, голование за ЕР 25% и явка 65%, голование за ЕР 51%. Поскольку данные достаточно "шумные", я наложил сверху результаты подгонки по двум гауссовым функциям. Откуда взялся пик на 65% явки с двукратным голосованием от пика на 50% -- кто ж знает...

UPD Товарищи попросили сделать то же самое для Яблока. Сделал. Теперь объясните мне, кому и зачем это нужно.

UPD2 Товарищи попросили сделать фит для Яблока двумя гауссами, а то нечестно получется. Сделал, наслаждайтесь. Две "фокальные точки" получаются просто из того факта, что интеграл по вертикальной оси дает распределение по явке, которое одинаковое для всех партий. Разница с Едром тут в том, что на 65% явки дает для Яблока минус 7.5%, а для ЕР - плюс 26%. То есть если пришло голосовать 50%, то у ЕР будет 25%, а у Яблока 12.5%, но уж если явились 65%, то ЕР получает 51%, а Яблоко - только 5%. Вот такой закон московской природы.

(99 comments | Leave a comment)

Comments
 
Page 1 of 2
<<[1] [2] >>
[User Picture]
From:corbulon
Date:December 5th, 2011 06:30 pm (UTC)
(Link)
класс! )))
Надо бы для партии №2 такое же сделать, для сравнения.
(Deleted comment)
[User Picture]
From:corbulon
Date:December 5th, 2011 06:59 pm (UTC)
(Link)
Справа в углу еще один зародыш кластера просматривается, (по 80%) с зеленой точкой в серединке. Кто бы это мог быть?
(Deleted comment)
[User Picture]
From:_nekto
Date:December 5th, 2011 07:02 pm (UTC)
(Link)
А сделайте для Яблока, по Москве.
Потом тогда раскидаем по интернетам.
(Deleted comment)
[User Picture]
From:merera
Date:December 5th, 2011 07:04 pm (UTC)
(Link)
Это по Москве, насколько понимаю. А как вы выгружали данные ЦИК? Они есть в табличном виде?
(Deleted comment)
(Deleted comment)
From:vasja_iz_aa
Date:December 5th, 2011 07:05 pm (UTC)

Откуда взялся пик на 65%

(Link)
первой, конечно, приходит мысль о местах разнообразного совместного человеческого содержания: больницы, тюрьмы, военные части.. там явка должна бы бы выше быть

их бы неплохо на карту города положить, может быть есче что то интересное увидится

[User Picture]
From:merera
Date:December 5th, 2011 07:15 pm (UTC)

Re: Откуда взялся пик на 65%

(Link)
на 65% пик простой и понятный - скорее всего вбрасывали пропорционально численности избирателей, заранее считали по участкам. Порядка 15% от списочного состава избирателей, вброшенных за едро как раз и дают ту прибавку, которая видна на графике. Значит, все было организовано очень централизованно.
[User Picture]
From:tiy
Date:December 5th, 2011 07:41 pm (UTC)
(Link)
Спасибо, это прекрасно!
Перепостить можно?
From:a_shen
Date:December 5th, 2011 07:54 pm (UTC)

решающий эксперимент

(Link)
на самом деле сейчас всё готово для "решающего эксперимента": есть методика восстановления неискажённого распределения, разработанная по опыту прошлых выборов, и есть данные проекта "Гражданин наблюдатель", довольно много участков, где посланные наблюдатели остались довольны подсчётом. Если результаты по Москве, полученные восстановлением зашумлённых данных, окажутся близкими к результатам выборочных точных измерений, это будет сильным подтверждением методики (а если нет - тем более интересно)
(Deleted comment)
[User Picture]
From:_nekto
Date:December 5th, 2011 08:43 pm (UTC)
(Link)
>объясните мне, кому и зачем это нужно.

Было интересно, нет ли "биифокальности" у Яблока - это вторая партия из двух, наряду с ЕР, у которой было "двугорбоевторой негауссов горб у нее был на распределение числа ТИК от доли голосов в Москве.

Только у нее второй горб был не на 50%, а на нуле. Вот и хотелось узнать, нет ли там зависимости доли голосов от явки.


Я так и не пойму, кстати, есть или нет. Вроде, на графике - два красных пятна, а вроде кластер и один.
[User Picture]
From:_nekto
Date:December 5th, 2011 08:45 pm (UTC)
(Link)
Хотя, видимо это "вторая область плотности" есть у всех партий кроме ЕР - она просто "отпечаток" второго фокуса ЕР - который 65%.
(Deleted comment)
(Deleted comment)
[User Picture]
From:_shadow__
Date:December 5th, 2011 08:47 pm (UTC)
(Link)
так для яблока же тоже явно два кластера, тоже 50 65, и 15% vs 5-7; и тоже совершенно предсказуемо и описано практиками - перебос голосов.
[User Picture]
From:vryadli
Date:December 5th, 2011 09:06 pm (UTC)
(Link)
Угу, вот так целенаправленно перебравывали не от конкурента, а от самого безобидного , но самого скандального участника, с которого и к тому же взять-то нечего.

... или особенности менталитета по районам.
(Deleted comment)
(Deleted comment)
(Deleted comment)
[User Picture]
From:vryadli
Date:December 5th, 2011 09:17 pm (UTC)
(Link)
А вертикальная ось - это % от всех или от явившихся? Если от явившихся, то виден практически чистый вброс.
[User Picture]
From:object
Date:December 5th, 2011 09:40 pm (UTC)
(Link)
Раз уж у тебя под руками все данные - по-моему, интересные получатся графики зависимости процента Едра (и для сравнения - Ябла) от числа выданных бюллетеней. По Москве явно связанные вещи.
(Deleted comment)
(Deleted comment)
[User Picture]
From:lpauzner
Date:December 5th, 2011 11:29 pm (UTC)
(Link)
Т.е. получается второй полюс в районе ЕР=55% голосов

А как это соотносится с сообщениями типа
http://hapchik.livejournal.com/106850.html?thread=1131874#t1131874
http://endryu.livejournal.com/52825.html

о том что в некоторых районах переписали протоколы назначив долю ЕР 70-80% за счет других, но практически не меняя явку. Вроде бы пятно должно быть другой формы? Казалось бы, проведя разделение на две группы ЕР<60% и ЕР>60% можно было бы получить регулярную и "сингулярную" составляющие?

У Вас данные уникальных УИК или какие-то агрегированные по укрупненным районам?
[User Picture]
From:kondybas
Date:December 6th, 2011 01:18 am (UTC)
(Link)
65% - это 2/3. Простой и понятный критерий, который удобно доводить до ведома председателей УИКов, которым ставится задача. Например:
- Показывать явку около 2/3, добивать голосами за ЕР, при возможности отнимать у прочих, у Яблока в первую очередь.

Такая директива даст именно то, что на картинке. Некоторая доля УИКов либо не захочет, либо не сможет фальсифицировать результаты, их пик - 25/50. Те, кто выполнит директиву - пик 50/65.

Собственно говоря - это прямое доказательство массовости и системности нарушений на выборах. Как минимум, доказательство единственности стратегии фальсификации.
[User Picture]
From:hairy_diver
Date:December 6th, 2011 06:51 am (UTC)
(Link)
зачем так сложно? )) про разнарядку получить 65 процентов уже забыли? - http://www.newsland.ru/news/detail/id/801633/
[User Picture]
From:poulsam
Date:December 6th, 2011 02:20 am (UTC)
(Link)
Искреннее спасибо за очевидность. Непонятно, как другие математики, в том числе мы, не сделали столь очевидных вещей. Это же железобетонное доказательство искусственности
[User Picture]
From:immortaz
Date:December 6th, 2011 03:05 am (UTC)

Вот тут теория вопроса

(Link)
[User Picture]
From:domitori
Date:December 6th, 2011 03:40 am (UTC)
(Link)
"Теперь объясните мне, кому и зачем это нужно."
Я могу ответить на ваш вопрос так: есть свидетельства террористической деятельности едросов. Было бы странно, если бы организация мошенников и убийц стала проводить честные выборы.

Идею вашего метода я понял.
Пожалуйста, выложите хотя бы ту часть вашей программы, которая стаскивает из сети официальные данные о результатах выборов. (А то мне кажется, что в сети спекуляций больше, чем оригинальных исследований.)
Я правильно понимаю, что на промежуточном этапе можно получить таблицу из нескольких тысяч строчек (по количеству избирательных участков)?
[User Picture]
From:tzirechnoy
Date:December 6th, 2011 06:04 am (UTC)
(Link)
А почему Вы результаты за ЕР подгоняли по двум гауссовым функцыям, а за Яблоко по одной? Тем более, что за Яблоко тожэ различимы две фокальные точки.
(Deleted comment)
From:Stulov Dmitry
Date:December 6th, 2011 07:56 am (UTC)

Все просто

(Link)
Один из кластеров искусственного происхождения. Вы вы тупо изобразили вброс за ЕР.(тот самый кластер с высокой явкой). Волнуй это кого-либо, за вами уже пришли бы.
[User Picture]
From:sdfgj
Date:December 6th, 2011 09:01 am (UTC)
(Link)
Вообще-то, такие графики должен строить ЦИК во главе с Чуровым
[User Picture]
From:lord_rone
Date:December 7th, 2011 03:07 am (UTC)
(Link)
уверен, что Чуров для себя такие графики строит. Просто показывает только своим. А как иначе регулировать централизованный вброс?
From:butch_q3
Date:December 6th, 2011 10:40 am (UTC)
(Link)
Замечательно. Действительно очень наглядно в трехмере. Особенно нагляден "провал" между двумя гауссовыми функциями, эдакая перемычка. Действительно кластеризация. Изолинии очень удачный выбор для отображения, хотя возможно трехмерная гистограмма(Количество УИК не только цветом, но и высотой) смотрелась бы еще лучше.
Ну и, конечно, я считаю, надо бы попробовать понакладывать на граффики данные эксит-поллов(только не ВЦИОМ - они смешны). Собрать большую статистику предоставленную наблюдателями, или сделать выборку только из тех УИКов, на которых учавствовали наблюдали и подтверждают результат. Ожидаю совпадение официальных данных в области малых явок и малых голосов за ЕР и расхождение в области больших явок.
[User Picture]
From:anderson_mike
Date:December 6th, 2011 12:48 pm (UTC)
(Link)
http://anderson-mike.livejournal.com/21380.html

Сравнение по одному району 2007 и 2011 годов, так сказать, как это выглядит на микроуровне.
(Deleted comment)
[User Picture]
From:nahrihra
Date:December 6th, 2011 08:50 pm (UTC)
(Link)
Не соглашусь. Все-таки в социальных науках ведь сплошь и рядом используют параметрические методы, то есть подразумевают нормальное распределение. И, собственно, оно должно быть нуль-гипотезой: чтобы обосновать то, что распределение негауссовское, для этого должнытбыть эмпирические или теоретические основания.
[User Picture]
From:av_rybin
Date:December 6th, 2011 07:38 pm (UTC)
(Link)
Если не "очищали" исходные данные от т.н. закрытых участков, то надо было это сделать.
Закрытые участки имеют четырехзначные номера - это больницы, дома престарелых и т.п. заведения. Это очень маленькие участки, как правило. И, как правило, на них честная и очень высокая явка (часто 100%).
Если их анализировать наравне с "простыми" УИКами, то получается искаженная картинка (напрмер, при 100% явке в маленькой больничке с числом избирателей 15 человек, они все проголосовали за, к примеру, КПРФ; отсюда у Вас на графике может появиться "искажение" с подозрением на то, что при 100% явке на этом участке был вброс за КПРФ; хотя это не так, просто это реальная и честная особенность таких малолюдных участков с очень специфическим электоратом; кстати, на таких участках редко подтасовывают или вбрасывают, т.к. там пенсионеры (обычные "клиенты" таких учреждений) итак послушно голосуют за путинскую шайку; но даже если и не голосуют, то на такие участки власти обычно просто плюют).
В общем, если не очищали данные от 4-значных УИКов, то попробуйте без них анализ провести.
[User Picture]
From:sharmelka
Date:December 7th, 2011 09:13 pm (UTC)
(Link)
Почему закрытые участки 4-хзначные? Американские УИКи тоже четырехзначные, там никаких 100% явок или что все голосовали за Яблоко (только 35%).
[User Picture]
From:floydes
Date:December 6th, 2011 09:43 pm (UTC)
(Link)
Если скажем эти пики скоррелировать ну там с месторасположением, типом УИК и т.д. ?

Может просто в отдельных местах пинком загоняли али пряником.
[User Picture]
From:localghost
Date:December 7th, 2011 06:55 am (UTC)
(Link)
Например, в двух школах через дорогу - в одной загоняли, а в другой - нет.
Или на двух участках в одном здании, на одном наблюдатель был, и там не загоняли, а на другом не было - и там загоняли.
[User Picture]
From:dima_i
Date:December 7th, 2011 06:28 am (UTC)
(Link)
Здорово, спасибо. Вот еще есть какие предложения:
1. По-честному, стоило бы еще отдельно привести (возможно не в посте, а просто ссылкой на картинки) исходные графики, без наложенного фита -- чтобы читатель мог сам оценить, насколько два пика "прорисовываются".
2. Также на отдельной картинке можно было бы отметить набор точек,
соответствующих участкам где были наблюдатели, доложившие об отсутствии нарушений (хотя такой набор, наверное, географически нерепрезентативен?).
[User Picture]
From:oude_rus
Date:December 8th, 2011 11:26 am (UTC)
(Link)
1. -- уже многие сделали.
2. -- вы представляете, какая это работа?
Powered by LiveJournal.com