?

Log in

No account? Create an account
Некорректная методика расчета итоговых результатов выборов по СМС-ЦИК - Maxim Pshenichnikov
September 11th, 2013
09:21 pm

[Link]

Previous Entry Share Next Entry
Некорректная методика расчета итоговых результатов выборов по СМС-ЦИК

(166 comments | Leave a comment)

Comments
 
[User Picture]
From:oude_rus
Date:September 12th, 2013 02:05 pm (UTC)
(Link)
ответ зажевался.
надо делать 3 вещи:
1. выбросить все с номерами за 3600
2. выбросить все ТИК с недостаточной статистикой (меньше трех)
3. добавить доверительные интервалы (ошибку среднего)
у меня фит дает 0.87 плюс-мин 0.03. Ну да, на грани.

Это может быть более тонким эффектом неравномерного распределения наблюдателей внутри ТИК (механизм точно такой же), влиянием психбольниц и таки да, махинациями. Последние могут быть видны как возросшая ошибка среднего.

Вечером я сяду за люстрационный список УИК. Вы можете сделать то же самое, потом сверим результаты!
[User Picture]
From:tov_y
Date:September 12th, 2013 02:37 pm (UTC)
(Link)
1) Ни на что толком не влияет.
2) Странный подход. Мелкие выкинем, а крупные и средние будем считать равноценными? Разумнее брать веса. Я использовал среднее гармоническое числа зарегистрированных избирателей (но не настаиваю на корректности именно такого выбора).
3) Я бы несильно полагался на оценки погрешностей метода наименьших квадратов. Это - вещи в себе.

Я если и сяду всерьёз за что-то, то не вечером, а в понедельник. Сейчас получается только урывками - гранты пишем.
[User Picture]
From:oude_rus
Date:September 12th, 2013 02:44 pm (UTC)
(Link)
1. Вы не поняли: если среднее считается по одной точке (участку), то это не среднее. Если среднее считается по двум участкам, то это тоже не среднее.
2. а на что тогда полагаться?
[User Picture]
From:tov_y
Date:September 12th, 2013 06:06 pm (UTC)
(Link)
1) Среднее считается по избирателям, а не по участкам. Оно и для одного участка - среднее.
2), которое на самом деле 3) Погрешность параметров регрессионной зависимости о чём-то говорит только в том случае, если в реальности есть именно такая зависимость, но только зашумлённая. А если зависимость немного не такая, то случайные ошибки начинают конвертироваться в систематические, что сказывается и на оценках погрешностей. Кроме того, вся теоретическая обвязка метода наименьших квадратов вообще работает только тогда, когда абсцисса - точная. А в нашем случае она - с теми же погрешностями, как и ордината. Поменяйте оси местами и посмотрите, что получится при проведении прямой. Нам бы надо брать прямую, минимизирующую невязку не по ординате, а по перпендикуляру к прямой. Но я не умею для неё считать погрешности. В общем, надо сесть подумать, а времени пока нету.
[User Picture]
From:oude_rus
Date:September 12th, 2013 06:30 pm (UTC)
(Link)
1. это понятно. Но единица наблюдения здесь - это участок. По цифрам с одного участка нельзя делать вообще никакого вывода о ТИК. Надо по крайней мере два, а лучше - три.
2. вы мне можете все это не объяснять, я полностью согласен.

А ваша задача решается просто: надо смотреть на распределение разности, это даст поворот на 45%. Но ни к чему хорошему это не приведет: зависимость без_смс vs с_смс имеет наклон ровно 1!

Edited at 2013-09-12 07:03 pm (UTC)
[User Picture]
From:tov_y
Date:September 12th, 2013 07:46 pm (UTC)
(Link)
1) Единица наблюдения - территория. В ней есть избиратели, за чьими голосами присматривают избиратели, а есть те, чьи голоса отданы в доверительное управление комиссиям. Получаем два числа для ТИК с разными погрешностями, зависящими как обратный корень от числа избирателей. Значит, вес точки можно грубо оценить как корень (его-то я в прошлый раз потерял) из среднего гармонического числа избирателей в двух подтерриториях. Проводим прямую, с наименьшим отклонением в перпендикулярном направлении, беря точки с указанными весами. Получаем угловой коэффициент 0,90 (извините, погрешность не скажу - не умею посчитать). А поворот графика работает только в том случае, если мы знаем правильный угол. Но мы его не знаем.
[User Picture]
From:oude_rus
Date:September 12th, 2013 08:00 pm (UTC)
(Link)
//Получаем два числа для ТИК с разными погрешностями// и с разным числом наблюдателей. При этом один наблюдатель может оказаться сильно нерепрезентативным для этого конкретного ТИК.

Если проблема в минимизации антидиагонального расстояния, то поворот на 45 град сделает почти идеальную оптимизацию.

А вы какую зависимость анализируете -- как у меня или обратную?
[User Picture]
From:tov_y
Date:September 13th, 2013 04:55 am (UTC)
(Link)
Про нерепрезентативных наблюдателей я не понял. Это - хто такие?

Если мы хотим идти путём доворота перпендикуляра к прямой до вертикали, то тогда надо итерировать. В первый раз можно довернуть и на 45 (чем не нулевое приближение?), а потом - на то что будет оставаться. Но только достоверных оценок погрешности мы всё равно не получим, т.к. погрешность исходных данных будет залита и в угол поворота.

Зависимость "без-с". Но при минимизации перпендикулярного расстояния при перемене мест абсциссы и ординаты угловой коэффициент просто меняется на обратный (для обычного м.н.к. коэффициенты в произведении дают R^2).
Powered by LiveJournal.com