?

Log in

No account? Create an account
Maxim Pshenichnikov
December 15th, 2011
08:43 am

[Link]

Previous Entry Share Flag Next Entry
Про выборы

(77 comments | Leave a comment)

Comments
 
From:sassa_nf
Date:December 15th, 2011 05:21 pm (UTC)
(Link)
"Я не вижу, как можно разделить наше незнание системы и возможные неточности измерителя, исключительно глядя на поток сигнала на выходе"

+1

это можно переписать так:

есть система со случайным процессом внутри и есть модель. Из расхождений между observations (замер) и estimate (модель) можно сделать лишь вывод о несоответствии модели и системы.

Т.е. из ненормального распределения чего-то там ещё ничего не вытекает.
From:sassa_nf
Date:December 15th, 2011 05:27 pm (UTC)
(Link)
отсюда мой давишний тезис: где критерий goodness of fit модели?
[User Picture]
From:oude_rus
Date:December 15th, 2011 09:07 pm (UTC)
(Link)
вам сначала надо объяснить модель.
From:sassa_nf
Date:December 15th, 2011 10:09 pm (UTC)
(Link)
нутк, не мне, а тем, кто меряет что-то гауссом :) вот пусть объяснят, с какой стати модель - нормальное распределение чего-то там.

я думаю, будет не нормальное, а что-то лог-нормальное или степеннОе. Но не потому, что я понимаю природу, а потому, что прочитал одну статью о моделировании выборов в стране с выборами по спискам партий (voting for list). Мне кажется, авторы статьи тоже не знают, что именно там поверх лог-нормального, но присутствие "лог-" говорит о том, что а. необходимо посмотреть распределение голосов на логарифмической шкале; б. goodness of fit должен соответствовать лог-нормальному, а не нормальному.

я могу _предположить_, что будет модифицированное бинарное распределение - т.е. распределение, где в основе лежит независимый выбор с какой-то вероятностью, но к нему приложен некоторый bias в результате взаимодействий избирателей в соц сети. Моделировать соц сеть у меня кишка тонка, но "формирование мнения в соц сети" - достаточно хорошо исследованный топик, чтобы можно было не париться поисками нормального распределения и не уповать на независимые испытания.

Плюс в этой стране с её географической неоднородностью и стратификацией будет ещё и суперпозиция таких вот распределений.


Боюсь повторяться, но: чисто случайно я напоролся на наличие чистого лог-нормального распределения голосов ЕдРо, ни у одной другой партии такого не обнаружил. Я не понимаю ни что это значит, ни почему распределение голосов не зависит от размера ИКа. Достоверность совпадения, имхо, 0.25 - это ж дофига!.. Ну, есть ещё огромная возможность, что я напортачил чего-то, но пока не с кем сверить метод, которым я выполнил fit.

Вот лично мне зудит проверить, но все заняты объяснением пиков и озадачены несоответствием гауссу. Дык... эти несоотвествия - семечки же!..
[User Picture]
From:barouh
Date:December 15th, 2011 10:36 pm (UTC)
(Link)
Может я чего-то не понимаю, но мне кажется, что модель лог-нормального распределения неприменима в принципе, поскольку у нас сумма по всем партиям равна 100%, и не может быть, чтобы у них у всех был хвост в одну сторону

Можно даже упростить. На этих выборах по сути было 2 варианта голосования - за Единую Россию и против ПЖиВ. Оба они не могут иметь лог-нормальное распределение. Оно или вообще будет "ненормальным", или должно быть два одинаковых по высоте и ширине симметричных колокола
From:sassa_nf
Date:December 16th, 2011 10:14 am (UTC)
(Link)
лог-нормальное меня тоже удивляет, но вместо "неприменима в принципе" можно проверить выкладки? даже если его там не должно быть, может, в этом и дело?

о лог-нормальном не я придумал: http przyrbwn.icm.edu.pl/APP/PDF/114/a114z312.pdf
[User Picture]
From:in_kant
Date:December 16th, 2011 06:58 pm (UTC)
(Link)
А вот кстати интересная идея (про два варианта голосования).

Они могут иметь логнормальное распределение по участкам. Если конкретный УИК попадет на пик обоих распределений - то там просто будет высокая явка (придут много голосовать и ЗА и ПРОТИВ). Если участок, например, попадет на конец хвоста ЗА и на пик ПРОТИВ - то там будет средняя явка и низкий процент у ЕР.
Если УИК попадет на конец хвостов обоих распределений - то там будет низкая явка. Интересно сравнить, как будут выглядеть результаты при разных сигмах и мю для двух распределений (но при постоянном соотношении голосов ЗА и ПРОТИВ - т.е. интегралы будут постоянными).

И еще монту-карлу запустить, чтобы получить лучший фит по всем графикам (проценты ЗА vs явка, число УИКов vs проценты за партию и т.д.)
[User Picture]
From:oude_rus
Date:December 16th, 2011 07:07 pm (UTC)
(Link)
запускай монту, и карлу тоже запускай!
From:sassa_nf
Date:December 15th, 2011 10:21 pm (UTC)
(Link)
далее, из конструктивных предложений - можно посмотреть на вид распределения голосов разных партий. Для сравнения распределений по некоторым методам даже знать тип распределения не нужно. Глядя на CDF, у меня складывается впечатление, что СР, ЛДПР и КПРФ имеют один вид распределения, а ЕдРо - другое. С аутсайдерами сложнее, т.к. они слабенькие и не интересненькие, но вот Яблоко хотелось бы потерзать.

(В опщем-та из результата, что только ЕдРо дало лог-нормал следует)


В частности, на логарифмической шкале у Яблока есть необычное колено - а у других? Не видно из-за масштаба или они не подвержены этой аномалии? Куча интересных вопросов, вот бы сообща за _них_ взяться...а на пиках доли или единицы процентов объясните.
Powered by LiveJournal.com