?

Log in

No account? Create an account
Мастеръ Гамбсъ этимъ полукресломъ заканчиваетъ новую партiю мебели - Maxim Pshenichnikov — LiveJournal
February 8th, 2012
09:28 am

[Link]

Previous Entry Share Next Entry
Мастеръ Гамбсъ этимъ полукресломъ заканчиваетъ новую партiю мебели

(92 comments | Leave a comment)

Comments
 
[User Picture]
From:oude_rus
Date:February 13th, 2012 11:27 pm (UTC)
(Link)
я только не понял, зачем брать Пуассона, если можно взять биномиал безо всяких приближений. Впрочем, не суть.

Я сегодня посчитал ожидаемую (из Пуассона) и фактическую дисперсию -- так они совершенно не сходятся. Ну то есть вообще никак, даже если выкинуть все участки с нулевым количеством недействительных. Если для среднего надо брать р=0.017, то для дисперсии - аж p=0.1. Совершенно не понимаю, откуда берется такая разница.

Не могли бы вы на это дело тоже глянуть, а то я боюсь, что где-то проврался.
From:a_kruglov
Date:February 16th, 2012 08:59 pm (UTC)
(Link)
Пуассона по привычке взял, не задумываясь. Для пуассона проще аналитические оценки параметров считать.

Я построил 2-мерную цветовую карту с эмпирическими функциями распределения по k для каждого бина по N. Долго тормозил, потому что времени не хватает. Вот картинки:


Слева экпериментальная картинка, фактически это число участков с данным k (по вертикали) и в данном бине по N (по горизонтали), отнормированное по столбцам. На картинке нарисован корень из этой величины, чтобы лучше было видно -- надо это учитывать, если смотреть на шкалу справа. (По-нормальному изменением палитры это сделать не получилось из-за глюков gnuplot.) Всё, что вылезает за пределы k=100 или N=3500 ограничивалось этими значениями. Справа теоретическое распределение для p=1,65%.

Третий график -- это просто двумерное распределение -- как на первом графике, но не отнормированное по столбцам, тут тоже нарисован корень из количества участков в бине, чтобы было лучше видно.

Видно, что есть: 1. компонента, которая сильно выше основной части распределения -- это, наверно, там голоса за какую-нибудь партию в недействительные записали или это действительно протестное голосование. 2. большая компонента на k=0 на всех явках, ещё заметно на k=2 немного, k=1 не любят. Ещё в области N=2000...2500 какие-то подозрительные горизонтальные полоски, если это не кажется. 3. Само основное распределение несколько шире, чем теоретическое,-- это объяснимо без фальсификаций, просто из-за разброса p между участками.

Кажое из этих отклонений увеличивает дисперсию по сравнению с идеальной. Какой из эффектов основной не оценивал и на глаз сказать не могу, они кажутся сравнимыми.
Powered by LiveJournal.com