?

Log in

No account? Create an account
Некорректная методика расчета итоговых результатов выборов по СМС-ЦИК - Maxim Pshenichnikov
September 11th, 2013
09:21 pm

[Link]

Previous Entry Share Next Entry
Некорректная методика расчета итоговых результатов выборов по СМС-ЦИК

(166 comments | Leave a comment)

Comments
 
[User Picture]
From:nonenoun
Date:September 11th, 2013 09:28 pm (UTC)
(Link)
№2902 - это №2768 в 2012
№2904 - это №2770 в 2012

У Путина там было 45.1 и 48.8% (т.е. типичные результаты).

Короче, очень похоже на фальсификацию. Вот, легко сравнить 2012 год с 2013.

Edited at 2013-09-11 09:40 pm (UTC)
[User Picture]
From:oude_rus
Date:September 12th, 2013 07:09 am (UTC)
(Link)
может, глянуть повнимательнее на них? и на остальных до кучи?

поскольку диагональ я, конечно, ловко нарисовал, но bias там есть, факт. И направление этого bias настораживает.
From:(Anonymous)
Date:September 12th, 2013 07:41 am (UTC)
(Link)
Вот именно. Визуально кажется, что диагональ там слегка наклонённая по точкам выходит.

Но вообще конечно это всё уже блохи по сравнению с другими причинами нечестного вытягивания Собянина в ходе этих выборов.
[User Picture]
From:oude_rus
Date:September 12th, 2013 07:55 am (UTC)
(Link)
так это и интересно, когда методы становятся все более тонкими!

"другие причины", боюсь, не будут приняты к рассмотрению. А вот сделать пересчет и найти подделку -- это было бы круто.
[User Picture]
From:nonenoun
Date:September 12th, 2013 07:46 am (UTC)
(Link)
Смещение может быть связано с неоднородностью внутри самого района (на более оппозиционных участках было больше наблюдателей). То, о чём barouh пишет. Но проверить надо бы - сравнивая с 2012 годом.
[User Picture]
From:oude_rus
Date:September 12th, 2013 07:56 am (UTC)
(Link)
дык?
я могу вечером написать номера участков, из-за которых произошло выпадание точек.
[User Picture]
From:nonenoun
Date:September 12th, 2013 07:58 am (UTC)
(Link)
Ок, я могу покопаться в этом (если вдруг не будет срочных дел).
[User Picture]
From:tov_y
Date:September 12th, 2013 01:19 pm (UTC)
(Link)
Я сделал сам то же самое (правда, у меня 123 точки). Там - сильно не диагональ. В зависимости от выбора весов (каковой в данном случае не тривиален) угловой коэффициент получается где-то 0,8-0,9 (с погрешностью во втором знаке).
[User Picture]
From:oude_rus
Date:September 12th, 2013 02:05 pm (UTC)
(Link)
ответ зажевался.
надо делать 3 вещи:
1. выбросить все с номерами за 3600
2. выбросить все ТИК с недостаточной статистикой (меньше трех)
3. добавить доверительные интервалы (ошибку среднего)
у меня фит дает 0.87 плюс-мин 0.03. Ну да, на грани.

Это может быть более тонким эффектом неравномерного распределения наблюдателей внутри ТИК (механизм точно такой же), влиянием психбольниц и таки да, махинациями. Последние могут быть видны как возросшая ошибка среднего.

Вечером я сяду за люстрационный список УИК. Вы можете сделать то же самое, потом сверим результаты!
[User Picture]
From:tov_y
Date:September 12th, 2013 02:37 pm (UTC)
(Link)
1) Ни на что толком не влияет.
2) Странный подход. Мелкие выкинем, а крупные и средние будем считать равноценными? Разумнее брать веса. Я использовал среднее гармоническое числа зарегистрированных избирателей (но не настаиваю на корректности именно такого выбора).
3) Я бы несильно полагался на оценки погрешностей метода наименьших квадратов. Это - вещи в себе.

Я если и сяду всерьёз за что-то, то не вечером, а в понедельник. Сейчас получается только урывками - гранты пишем.
[User Picture]
From:oude_rus
Date:September 12th, 2013 02:44 pm (UTC)
(Link)
1. Вы не поняли: если среднее считается по одной точке (участку), то это не среднее. Если среднее считается по двум участкам, то это тоже не среднее.
2. а на что тогда полагаться?
[User Picture]
From:tov_y
Date:September 12th, 2013 06:06 pm (UTC)
(Link)
1) Среднее считается по избирателям, а не по участкам. Оно и для одного участка - среднее.
2), которое на самом деле 3) Погрешность параметров регрессионной зависимости о чём-то говорит только в том случае, если в реальности есть именно такая зависимость, но только зашумлённая. А если зависимость немного не такая, то случайные ошибки начинают конвертироваться в систематические, что сказывается и на оценках погрешностей. Кроме того, вся теоретическая обвязка метода наименьших квадратов вообще работает только тогда, когда абсцисса - точная. А в нашем случае она - с теми же погрешностями, как и ордината. Поменяйте оси местами и посмотрите, что получится при проведении прямой. Нам бы надо брать прямую, минимизирующую невязку не по ординате, а по перпендикуляру к прямой. Но я не умею для неё считать погрешности. В общем, надо сесть подумать, а времени пока нету.
[User Picture]
From:oude_rus
Date:September 12th, 2013 06:30 pm (UTC)
(Link)
1. это понятно. Но единица наблюдения здесь - это участок. По цифрам с одного участка нельзя делать вообще никакого вывода о ТИК. Надо по крайней мере два, а лучше - три.
2. вы мне можете все это не объяснять, я полностью согласен.

А ваша задача решается просто: надо смотреть на распределение разности, это даст поворот на 45%. Но ни к чему хорошему это не приведет: зависимость без_смс vs с_смс имеет наклон ровно 1!

Edited at 2013-09-12 07:03 pm (UTC)
[User Picture]
From:tov_y
Date:September 12th, 2013 07:46 pm (UTC)
(Link)
1) Единица наблюдения - территория. В ней есть избиратели, за чьими голосами присматривают избиратели, а есть те, чьи голоса отданы в доверительное управление комиссиям. Получаем два числа для ТИК с разными погрешностями, зависящими как обратный корень от числа избирателей. Значит, вес точки можно грубо оценить как корень (его-то я в прошлый раз потерял) из среднего гармонического числа избирателей в двух подтерриториях. Проводим прямую, с наименьшим отклонением в перпендикулярном направлении, беря точки с указанными весами. Получаем угловой коэффициент 0,90 (извините, погрешность не скажу - не умею посчитать). А поворот графика работает только в том случае, если мы знаем правильный угол. Но мы его не знаем.
[User Picture]
From:prahvessor
Date:September 13th, 2013 07:45 am (UTC)
(Link)
вот-вот, регрессия-то не по диагонали пойдет, даже без outliers
Powered by LiveJournal.com