?

Log in

No account? Create an account
Хелп, пардон, нидед - Maxim Pshenichnikov
December 20th, 2012
11:12 pm

[Link]

Previous Entry Share Next Entry
Хелп, пардон, нидед
Для тех, кто интересуется статистикой.
На картинке внизу попытка восстановления голосов на целочисленных пиках явки (2008 здесь как наиболее показательный, для отработки методики). Алгоритм восстановления стандартный: берутся по два значения справа и слева от пика, усредняются и вычитаются из величины пика. В итоге получается средний график с выбросами на целочисленных значениях. Третий грфик - интеграл от пиков, т.е. аккумулированные в пиках голоса при данной явке -- очень удобный для сравнения.

votes
(обратите внимание на разную шкалу по оси Y: 1.75 - это такое магическое число, при котором правые левые стороны распределений голосов vs явка становятся одинаковыми)

 Голоса за лидера накопливаются скачками (коричневая кривая), но это мы и так знаем. Проблема же вот в чем: суммарные голоса за не-лидера тоже накапливаются скачками (фиолетовая кривая). Причем где-то до 75% явки эти голоса вполне скалируются с лидером, с магическим коэффициентом 1.75. Я проверил также вклады Зюга и Жирика, они вполне скалируются с фиолетовой кривой, и дают ее в сумме (про Богдана можно забыть).

Как такое может быть в парадигме, что пики явки соответствуют желанию выдать на-гора красивое число?

1. Члены избиркома, добросив (это предположение такое) столько-то бюллетеней до красивого процента, мусоля карандаш, перераспределяют доброшенные голоса пропорционально между кандидатами -- иначе пик голосов был бы только на одном кандидате. Как-то в этот карандаш тяжело поверить.
2. Добрасываемые голоса засчтываются за определенную партию согласно желания избиркома. То есть, иными словами, где-то добрасывают за ер, а где-то - за комми. В итоге получается среднее по палате. Ну а после 75% явки крышу конкретно срывает, и там добросы идут за одного кандидата.
3. Есть какая-то неучтенная систематическая фигня. Какая?

Вопрос: что вы думаете по этому поводу? и как вообще можно проверить разные сценарии? у меня есть пара идей, но я хотел бы прежде выслушать общественость.

Давайте, не стесняйтесь. 

(43 comments | Leave a comment)

Comments
 
[User Picture]
From:kobak
Date:December 20th, 2012 10:31 pm (UTC)
(Link)
"магическое число, при котором правые стороны распределений голосов vs явка становятся одинаковыми" -- левые стороны, наверное?
[User Picture]
From:oude_rus
Date:December 20th, 2012 10:33 pm (UTC)
(Link)
разумеется; это называется "топологический кретинизм".
[User Picture]
From:corbulon
Date:December 20th, 2012 10:35 pm (UTC)
(Link)
А ты можешь посмотреть графичек:
по одной оси высота пичка лидера, по другой оси - всех остальных.
Точек будет столько же, сколько и пиков, но можно посмотреть кривую и прикинуть корреляцию величин.
[User Picture]
From:oude_rus
Date:December 20th, 2012 10:42 pm (UTC)
(Link)
не очень понятно, как это сделать практически.
[User Picture]
From:kobak
Date:December 20th, 2012 10:39 pm (UTC)
(Link)
По существу -- я не очень понимаю твое недоумение. Предположим, что на самом деле на всех участках у лидера одинаковый процент (скажем, 50%), но явка бывает сильно разная. На некоторых участках происходят вбросы до круглой явки (скажем, 75%), причем вбрасываются только бюллетени за лидера. В итоге некоторые участки с низкой явкой переезжают на явку 75%. Количество бюллетеней за лидера на явке 75% сильно возрастает (мы наблюдаем пик). Но количество бюллетеней за конкурентов на явке 75% тоже возрастает, т.к. там появляются дополнительные участки, -- т.е. мы тоже наблюдаем пик, но поменьше.

Разве не так?
[User Picture]
From:oude_rus
Date:December 20th, 2012 10:41 pm (UTC)
(Link)
//Но количество бюллетеней за конкурентов на явке 75% тоже возрастает//

откуда, если по оси Y откладываются голоса, и вброс голосов идет только за лидера?
[User Picture]
From:corbulon
Date:December 20th, 2012 10:59 pm (UTC)
(Link)
Посмотри еще число действительных бюллетеней, а не только голоса
Там тоже пички
[User Picture]
From:oude_rus
Date:December 21st, 2012 06:58 am (UTC)
(Link)
да ты вроде уже смотрел.
[User Picture]
From:c70we7
Date:December 21st, 2012 02:15 am (UTC)
(Link)
В общем, понятно, что пики на правом графике могут являться побочным эффектом от "перенесения" УИКов из низкоявочных бинов в высокоявочные, от приписки в том числе и в пользу левого графика с целью доведения явки до нужного процента.

Проведённая работа показывает куда они были приписаны и даже позволяет их оценить.
Но есть один нюанс.
В высокоявочные бины были приписаны УИКи из относительно низкоявочных бинов.
Поскольку последние выбирались случайно (точнее - они были распределены по низкоявочным бинам случайно), то и провалов мы не наблюдаем. По сути проседание это размазано.
В результате методика восстановления более менее откинула из высокоявочных бинов приписные голоса - но в большинстве своём вместе с настоящими, которые должны были бы находиться в относительно низкоявочных бинах. Одновременно она не смогла вычислить "пропажу" голосов (вместе у УИКами) из низкоявочных бинов. Что тут можно поделать чтобы компенсировать этот эффект, связанный со "случайным" изыманием и неслучайной припиской - пока слабо соображаю, но напрашивается что-то довольно трудоёмкое, с отсылкой на относительные голоса за кандидатов, вычисление количества (абсолютного и/или относительного) УИКов с приписками, и пропорционального перемещения части голосов из высокоявочных бинов в низкоявочные.

Если же попытаться оценить как-нибудь по-простому, то например, можно предположить что средняя нижнего левого графика должна быть около нуля. Если предположить, что "остальные" остались при своих голосах, им не приписывали и у них не отписывали, либо результат обоих процессов более-менее компенсировал друг-друга.
Тогда можно оценить на сколько следует прибавить к низкоявочным бинам и на сколько и с какой явки приписывали. На глаз - где-то около 0.2 млн.
Ну а дальше в голову опять приходят какие-то мудрёные методы восстановления формы распределения. Не могу отделаться от ощущения, что тут не хватает многомерных графиков. :)


UPD. Ерунду спорол. :) Нижний-же интегральная оценка. И кстати, провалы небольшие всё-таки видны.
Так вот если среднее среднего правого графика привести к нулю и (чтобы итог последнего графика пришёл к нулю), то получившееся отклонение можно бы и наложить на первый график.


PS. После того как исполнители вместо приписки до определённых процентов станут просто накидывать какое-то количество бюллетеней, "зубы" рассосутся и вычистить что-либо будет горааздо сложнее.


Edited at 2012-12-21 02:29 am (UTC)
[User Picture]
From:nonenoun
Date:December 21st, 2012 03:49 am (UTC)
(Link)
> "зубы" рассосутся и вычистить что-либо будет горааздо сложнее
А их и не надо вычищать. Зубы - это лишь статистически значимый признак фальсификаций, очистка ведётся другими методами. Например, анализируя СКО и корреляцию по методу barouh:
http://trv-science.ru/2012/02/28/sto-vosemdesyat-chestnykh-gorodov

Или можно сравнить результат на КОИБ и соседних участках. Понятно ведь, что круглый процент рисуют на небольшой доле участков - чаще просто перебрасывают сотню-другую бюллетеней от одной партии к другой.

Кстати, стоит сказать спасибо "рисовальщикам" круглых чисел - именно благодаря им мы имеем надёжные доказательства массовых фальсификаций :)
[User Picture]
From:zametilprosto
Date:December 21st, 2012 05:10 am (UTC)
(Link)
Я думаю, что никто ничего не добрасывает.

Человек мусолит не карандаш, а клавиатуру, вводя в систему красивые данные. Отсюда и круглые числы у претендентов. Нарисовав 75 лидеру остальные проще расписать как 15 и 10 (к примеру). Думать не надо. А вот если напишешь за одного 23.71, то о втором крен посчитаешь.

Кстати, давно хочу спросить. А у количество голосов на участке есть пики на круглых значениях? То есть участков где проголосовало тысячу человек больше, чем тех, на котором проголосовало 817?
[User Picture]
From:nonenoun
Date:December 21st, 2012 06:51 am (UTC)
(Link)
> А у количество голосов на участке есть пики на круглых значениях?
Разумеется. corbulon эту тему вдоль и поперёк исследовал:
http://trv-science.ru/2012/03/13/pro-arifmetiku-i-nemnozhko-pro-vybory
[User Picture]
From:tsirel
Date:December 21st, 2012 10:56 am (UTC)
(Link)
М.б. два сценария вбрасывания до круглого числа.
1. Из УИКа звонят: "У нас получается явка 73,4%", "Ну вы хотя бы до 75% дотяните". Они вбрасывают еще 1,6 п.п., но это немного и на общее распределение голосов мало влияет.
2. Заранее требуют (или сами принимают повышенные обязательства) набрать 80 (85, 90 и т.д.) % явки. А реально явка процентов 50, тогда вбрасывается 30 п.п. и все (почти все?) за Медведева.
При этом:
- высокая "некруглая" явка тоже в основном липовая, но сделанная не такими идиотами, и, возможно, образованная меньшими приписками, т.е. 85,0% делалось, к примеру, из 45% в среднем, а 83,6% - из 55%.
- эти якобы "честные" 73,4% или 50% тоже включают в себя фальсификации, но те, кто меньше приписывал явку,
меньше приписывал и голоса Медведеву.
[User Picture]
From:vit_r
Date:December 21st, 2012 11:46 am (UTC)
(Link)
Красивые пики там, где смухлевали. А в этом случае красивый заданный процент выпишут не только кандидату, но и "правильной" оппозиции.

В частности, по сообщениям с мест, голоса за "неугодных" перебрасывали на победителя и коммунистов. С высокой точностью попадания в круглое число. (Что бы там не говорили защитники образования, посмотреть, что голоса распределились правильно, председатели могут только на достаточно правильном распределении. С количеством бюллетеней даже они понимают, а вот на красивость процентов внимания не обращают)

Я бы вообще выкинул пики и построил графики отдельно без них, а отдельно построил бы график только для пиков.
[User Picture]
From:jemmybutton
Date:December 21st, 2012 01:35 pm (UTC)
(Link)
А насколько слева и справа от предполагаемого пика берутся значения? Навроде (-0,75%;-0,25%) и (+0,25%;+0,75%)? И насколько сам пик широким считается?

Edited at 2012-12-21 01:36 pm (UTC)
[User Picture]
From:oude_rus
Date:December 21st, 2012 02:52 pm (UTC)
(Link)
на картинке показывается центр бина, т.е. для 90% и 0.2% бина это будет участок 89.9..90.1%.
Две точки справа -- это значения функции в точках -0.4% и -0.2%, т.е. если в интервалах - то -0.5..-0.1%.
Пик считается шириной в 1 бин. Для 1%-пиков это нормальное приближение (на Фурье видно, что они прекрасно вычищаются). Для 5%-пиков - так себе (по Фурье опять-таки). По графику видно, что острые пики вычищаются, но остаются, как я их называю, "релаксационные осцилляции" (это из лазеров): на 5% идет подъем, а потом постепенная релаксация шириной где-то около процента.

Я пробовал подавлять также пики на 5% плюс бин -- разница есть, но небольшая.
[User Picture]
From:barouh
Date:December 21st, 2012 03:47 pm (UTC)
(Link)
Выше в комментариях я не согласился с тем, что это нормальный эффект. Но как объяснить - не знаю

Как гипотеза: а что если единственное реальное число - это количество проголосовавших, а списочную численность и явку подгоняли под эту цифру? Типа, у нас есть 350 бюллетеней, а с нас требуют явку 70% - так напишем, что всего избирателей 500...

Предположение безумное, но мало ли

А можно попросить график - доля голосов за "других" по бинам?
И конечно не терпится увидеть аналогичные картинки по другим выборам
[User Picture]
From:oude_rus
Date:December 21st, 2012 06:20 pm (UTC)
(Link)
я не понял, какой именно график нужен. Распределение "за других" нарисовано фиолетовым цветом.

по другим выборам все будет, но требует времени. Я же не скрипты пишу, а ручками все делаю.
Powered by LiveJournal.com