?

Log in

No account? Create an account
Maxim Pshenichnikov
December 5th, 2011
04:18 pm

[Link]

Previous Entry Share Flag Next Entry
Статистика выборов по Москве: двуголовая гидра

(123 comments | Leave a comment)

Comments
 
[User Picture]
From:oude_rus
Date:December 6th, 2011 09:42 am (UTC)
(Link)
хорошо.

Гауссово распределение - это ровно то, что природа создала для распределения большого количества независимых событий. Разумеется, есть и другие распределения, навроде Пуассона и Больцмана (а так же Ферми-Дирака и Бозе-Эйнштейна), но вроде есть консенсус, где какие использовать. Как вы полагаете, какое из распределений разумней всего применять для распределения независимых голосов при выборах?

Причем уже показано стотыщ раз на разном выборном материале, что распределения при голосовании таки гауссовы, и закон больших чисел вполне себе работает. Собственно, вы это можете видеть на графике наверху для, например, КПСС. Или вот мне пишут, что распределение за ЕР по Ярославской области вполне себе нормально. Поэтому в качестве первого приближения разумно полагать распределение Гауссовым, и если оно не таково (плюс-минус, разумеется), то задаваться вопросом, "а почему нет" в качестве второго приближения.

Тут дальше можно строить разные предположения, например, о правомерности использования предположения о независимости отдельных событий, на которых строится теорема больших чисел. Или - например опять же - можно предположить, что избиратели ЕР (и исключительно ЕР) бимодальны: часть поменьше голосует за Медведа, а побольше - за Путина. В КПСС же все голосуют за Зюганова (который един), поэтому распределение гауссово.

Проблема же тут в том, что все эти предположения требуют независимой верификации, что сильно выходит за круг моих интересов. Поэтому я их и не строю. Но есть и другие люди, которые этим занимаются. Может, вам имеет смысл поговорить с ними.

Я достаточно подробно ответил?
[User Picture]
From:green_fr
Date:December 6th, 2011 10:03 am (UTC)
(Link)
Да, спасибо, гораздо интереснее предыдущего комментария :-Р

А второй мой вопрос был - почему вам кажется, что распределение ЕР - не гауссово? Мне оно "на глазок" вполне нормальным кажется. С кучей пиков, которые, на мой взгляд, вполне объяснимы случайными флуктуациями. То есть, как мне кажется, если посчитать погрешность (я чуть выше предложил квадратный корень из числа наблюдений в каждой точке, то есть если точка представлена 200-ми участками, то погрешность +-14), то "коридор доверия" (я не помню точного русского термина, я во Франции) вполне покроет возможную гауссову кривую вокруг наших наблюдений. Нет разве?

То есть, самое простое объяснение этих пиков на 25% и на 51% - не двуглавие партии (одни голосуют за жуликов, другие - за воров :-)), а тупо нехватка данных, малое количество наблюдений.
[User Picture]
From:fedor_s
Date:December 9th, 2011 11:43 pm (UTC)
(Link)
Там выше было обсуждение Ярославской области. Если на 26 ТИКах уже наблюдений достаточно, что по Москве тем более, и с многократным запасом.
[User Picture]
From:green_fr
Date:December 12th, 2011 08:38 am (UTC)
(Link)
Там не было обсуждения теории, там был один график, который на глазок кажется похожим на другой.
[User Picture]
From:alex_celly
Date:December 12th, 2011 08:59 am (UTC)
(Link)
Потому что "двух колоколов" в гауссиане в природе не бывает.

И единый процесс двумя РАЗНЫМИ распределениями описывается только со значительной разницей по времени взятия данных. Грубо говоря, если строить графики по разным годам - тогда может быть столько гауссиан, сколько раз взяли данные.

У нас же данные по одному процессу за один день одного года. Тут то, что получается из данных, никак не объясняется нормальными распределениями. Никак!
Powered by LiveJournal.com