?

Log in

No account? Create an account
Этот график посложнее будет, но вполне продираем. Следите, значит, за… - Этот график посложнее будет, но вполне продираем. Следите, значит, за… - Maxim Pshenichnikov Page 2 — LiveJournal
December 5th, 2011
07:21 pm

[Link]

Previous Entry Share Next Entry
Этот график посложнее будет, но вполне продираем. Следите, значит, за пальцами.
На графике разными цветами показано количество УИКий, где явка была такая-то (горизонтальная ось) и за ЕР проголосовало столько процентов (вертикальная ось). Где цвет красный - такий УИКий много, где синий - вообще нет. Например, при явке в 51% за ЕР с результатом в 25% проголосовало 10 УИКий.


Сразу видно, что данные кластеризуются вокруг двух "фокальных точек": явка 50%, голование за ЕР 25% и явка 65%, голование за ЕР 51%. Поскольку данные достаточно "шумные", я наложил сверху результаты подгонки по двум гауссовым функциям. Откуда взялся пик на 65% явки с двукратным голосованием от пика на 50% -- кто ж знает...

UPD Товарищи попросили сделать то же самое для Яблока. Сделал. Теперь объясните мне, кому и зачем это нужно.

UPD2 Товарищи попросили сделать фит для Яблока двумя гауссами, а то нечестно получется. Сделал, наслаждайтесь. Две "фокальные точки" получаются просто из того факта, что интеграл по вертикальной оси дает распределение по явке, которое одинаковое для всех партий. Разница с Едром тут в том, что на 65% явки дает для Яблока минус 7.5%, а для ЕР - плюс 26%. То есть если пришло голосовать 50%, то у ЕР будет 25%, а у Яблока 12.5%, но уж если явились 65%, то ЕР получает 51%, а Яблоко - только 5%. Вот такой закон московской природы.

(99 comments | Leave a comment)

Comments
 
Page 2 of 3
<<[1] [2] [3] >>
[User Picture]
From:domitori
Date:December 6th, 2011 03:40 am (UTC)
(Link)
"Теперь объясните мне, кому и зачем это нужно."
Я могу ответить на ваш вопрос так: есть свидетельства террористической деятельности едросов. Было бы странно, если бы организация мошенников и убийц стала проводить честные выборы.

Идею вашего метода я понял.
Пожалуйста, выложите хотя бы ту часть вашей программы, которая стаскивает из сети официальные данные о результатах выборов. (А то мне кажется, что в сети спекуляций больше, чем оригинальных исследований.)
Я правильно понимаю, что на промежуточном этапе можно получить таблицу из нескольких тысяч строчек (по количеству избирательных участков)?
[User Picture]
From:tzirechnoy
Date:December 6th, 2011 06:04 am (UTC)
(Link)
А почему Вы результаты за ЕР подгоняли по двум гауссовым функцыям, а за Яблоко по одной? Тем более, что за Яблоко тожэ различимы две фокальные точки.
(Deleted comment)
From:Stulov Dmitry
Date:December 6th, 2011 07:56 am (UTC)

Все просто

(Link)
Один из кластеров искусственного происхождения. Вы вы тупо изобразили вброс за ЕР.(тот самый кластер с высокой явкой). Волнуй это кого-либо, за вами уже пришли бы.
[User Picture]
From:sdfgj
Date:December 6th, 2011 09:01 am (UTC)
(Link)
Вообще-то, такие графики должен строить ЦИК во главе с Чуровым
[User Picture]
From:lord_rone
Date:December 7th, 2011 03:07 am (UTC)
(Link)
уверен, что Чуров для себя такие графики строит. Просто показывает только своим. А как иначе регулировать централизованный вброс?
From:butch_q3
Date:December 6th, 2011 10:40 am (UTC)
(Link)
Замечательно. Действительно очень наглядно в трехмере. Особенно нагляден "провал" между двумя гауссовыми функциями, эдакая перемычка. Действительно кластеризация. Изолинии очень удачный выбор для отображения, хотя возможно трехмерная гистограмма(Количество УИК не только цветом, но и высотой) смотрелась бы еще лучше.
Ну и, конечно, я считаю, надо бы попробовать понакладывать на граффики данные эксит-поллов(только не ВЦИОМ - они смешны). Собрать большую статистику предоставленную наблюдателями, или сделать выборку только из тех УИКов, на которых учавствовали наблюдали и подтверждают результат. Ожидаю совпадение официальных данных в области малых явок и малых голосов за ЕР и расхождение в области больших явок.
[User Picture]
From:anderson_mike
Date:December 6th, 2011 12:48 pm (UTC)
(Link)
http://anderson-mike.livejournal.com/21380.html

Сравнение по одному району 2007 и 2011 годов, так сказать, как это выглядит на микроуровне.
(Deleted comment)
[User Picture]
From:nahrihra
Date:December 6th, 2011 08:50 pm (UTC)
(Link)
Не соглашусь. Все-таки в социальных науках ведь сплошь и рядом используют параметрические методы, то есть подразумевают нормальное распределение. И, собственно, оно должно быть нуль-гипотезой: чтобы обосновать то, что распределение негауссовское, для этого должнытбыть эмпирические или теоретические основания.
[User Picture]
From:av_rybin
Date:December 6th, 2011 07:38 pm (UTC)
(Link)
Если не "очищали" исходные данные от т.н. закрытых участков, то надо было это сделать.
Закрытые участки имеют четырехзначные номера - это больницы, дома престарелых и т.п. заведения. Это очень маленькие участки, как правило. И, как правило, на них честная и очень высокая явка (часто 100%).
Если их анализировать наравне с "простыми" УИКами, то получается искаженная картинка (напрмер, при 100% явке в маленькой больничке с числом избирателей 15 человек, они все проголосовали за, к примеру, КПРФ; отсюда у Вас на графике может появиться "искажение" с подозрением на то, что при 100% явке на этом участке был вброс за КПРФ; хотя это не так, просто это реальная и честная особенность таких малолюдных участков с очень специфическим электоратом; кстати, на таких участках редко подтасовывают или вбрасывают, т.к. там пенсионеры (обычные "клиенты" таких учреждений) итак послушно голосуют за путинскую шайку; но даже если и не голосуют, то на такие участки власти обычно просто плюют).
В общем, если не очищали данные от 4-значных УИКов, то попробуйте без них анализ провести.
[User Picture]
From:sharmelka
Date:December 7th, 2011 09:13 pm (UTC)
(Link)
Почему закрытые участки 4-хзначные? Американские УИКи тоже четырехзначные, там никаких 100% явок или что все голосовали за Яблоко (только 35%).
[User Picture]
From:floydes
Date:December 6th, 2011 09:43 pm (UTC)
(Link)
Если скажем эти пики скоррелировать ну там с месторасположением, типом УИК и т.д. ?

Может просто в отдельных местах пинком загоняли али пряником.
[User Picture]
From:localghost
Date:December 7th, 2011 06:55 am (UTC)
(Link)
Например, в двух школах через дорогу - в одной загоняли, а в другой - нет.
Или на двух участках в одном здании, на одном наблюдатель был, и там не загоняли, а на другом не было - и там загоняли.
[User Picture]
From:dima_i
Date:December 7th, 2011 06:28 am (UTC)
(Link)
Здорово, спасибо. Вот еще есть какие предложения:
1. По-честному, стоило бы еще отдельно привести (возможно не в посте, а просто ссылкой на картинки) исходные графики, без наложенного фита -- чтобы читатель мог сам оценить, насколько два пика "прорисовываются".
2. Также на отдельной картинке можно было бы отметить набор точек,
соответствующих участкам где были наблюдатели, доложившие об отсутствии нарушений (хотя такой набор, наверное, географически нерепрезентативен?).
[User Picture]
From:oude_rus
Date:December 8th, 2011 11:26 am (UTC)
(Link)
1. -- уже многие сделали.
2. -- вы представляете, какая это работа?
[User Picture]
From:skyrzn
Date:December 7th, 2011 09:50 am (UTC)
(Link)
Сделал похожий анализ для Рязанской области. Не удивлен.
https://plus.google.com/105008541012261661733/posts/HGcnrmoQPLC
[User Picture]
From:oude_rus
Date:December 8th, 2011 11:27 am (UTC)
(Link)
здорово.
[User Picture]
From:mm_v
Date:December 7th, 2011 03:15 pm (UTC)
(Link)
Не подскажете где можно взть файл с первичной информацией, чтобы самому его покрутить ?
From:(Anonymous)
Date:December 7th, 2011 05:57 pm (UTC)

восстановление истинного результата

(Link)
если предположить, что часть участков верно отражают результат голосования, то можно попробовать восстановить истинные результаты - вероятно, они будут находится в центре кружков гауссового распределения - за едро 25%, за яблоко 12%
[User Picture]
From:oude_rus
Date:December 8th, 2011 11:29 am (UTC)

восстановление истинного результата

(Link)
невозможно в принципе.
From:(Anonymous)
Date:December 7th, 2011 07:59 pm (UTC)

второй горб

(Link)
В блогах описывалось два способа урезания голос за яблоко, первый отнять 100 или 200 голосов, нарисовать например 5 или 15 голосов.
То есть с моей точке зрения второй горб надо изучать отдельно и уже не статистически.
[User Picture]
From:domitori
Date:December 8th, 2011 04:02 am (UTC)

Опечатка

(Link)
"такий УИКий" - Лучше бы было
"таких УИКий"

"кому и зачем" - Пожалуйста, оформите ваше сообщение в виде научной статьи. Такая статья может представлять интерес для сайта ТОРИ http://tori.ils.uec.ac.jp/ ; редактор декларирует:".. the scientific contribution from colleagues should be appreciated.")
Пример статьи из ТОРИ, имеющий отношение к вашей теме: http://tori.ils.uec.ac.jp/TORI/index.php/2011.12.04.Выборы
Было бы желательно, чтобы каждый читатель мог легко воспроизвести любой ваш график, не повторяя все ваши промежуточные действия, и построить всяческие прибамбаски, улучшения и упграйды самостоятельно, не беспокоя автора (вас) по пустякам.
[User Picture]
From:oude_rus
Date:December 8th, 2011 11:18 am (UTC)

"в виде научной статьи"

(Link)
здесь нет науки.
Powered by LiveJournal.com