?

Log in

No account? Create an account
Статистика выборов по Москве: двуголовая гидра - Maxim Pshenichnikov — LiveJournal
December 5th, 2011
04:18 pm

[Link]

Previous Entry Share Next Entry
Статистика выборов по Москве: двуголовая гидра

(125 comments | Leave a comment)

Comments
 
From:vasja_iz_aa
Date:December 5th, 2011 05:53 pm (UTC)
(Link)
>Разумно ожидать, что количество участков распределяется поровну вправо и влево от середины.

По-моему совершенно неразумно такого ожидать. Это же не сигнал от Избирателя, померенный с со случайной несмещеной ошибкой.

Едро принципиально отличается от остальных участников процедуры. Те более или менее политические движения, пусть и даже и карикатурные; а едро это партия власти, просто чиновники без идеалогии и мыслей. Совсем не странно и что распределение голосовавших к ним другое.
[User Picture]
From:oude_rus
Date:December 5th, 2011 06:50 pm (UTC)
(Link)
вы можете выдвинуть свою гипотезу.
From:vasja_iz_aa
Date:December 5th, 2011 06:51 pm (UTC)
(Link)
??
О чем гипотезу?

[User Picture]
From:oude_rus
Date:December 5th, 2011 06:52 pm (UTC)
(Link)
о том, как должны распределяться голоса.
From:vasja_iz_aa
Date:December 5th, 2011 07:40 pm (UTC)
(Link)
Это очень сложная задача, надо очень много знать социологической информации по московскому региону. Вряд ли она у кого угодно есть, а у меня и сотой доли нет тех данных, что бы самые общие гипотезы про это строить.

Но широким его ожидать наверное всяко следовало, потому что географическая вариабельность довольства текущей жизнью очень большая. В свежезастроеном элитном районе вряд ли многие проголосуют за коммунистов и наоборот.
From:vasja_iz_aa
Date:December 5th, 2011 08:59 pm (UTC)

Но широким его

(Link)
его -- распределение процента голосовавших за нынешнюю власть
From:ixodus
Date:December 9th, 2011 09:46 pm (UTC)

Re: vasja-iz-aa

(Link)
Вы ЛИЧНО на сайт мосизбиркома заглядывали? Отслеживали данные по соседним участкам одних и тех же микрорайонов с одной и той же застройкой? Сравнивали это с тем, какова была разница голосования НА ЭТИХ ЖЕ участках раньше?
Когда проделаете это, тогда ваши предположения насчёт влияния географической вариабельности довольства текущей жизнью как на что-то повлиявшей на данных выборах, сразу отпадёт.
[User Picture]
From:green_fr
Date:December 6th, 2011 08:46 am (UTC)
(Link)
Это как раз несерьёзно — вы выдвинули гипотезу нормальности распределения, из неё вывели факт подтасовки. Человек сомневается в разумности гипотезы, из чего следует, по-хорошему, отмена вашего вывода — а вы его просите провести собственный анализ. Он (я, мы все) может постараться, но речь идёт о ваших выводах, правда?

Модели можно разные строить, в принципе нормальное распределение хорошо тем, что оно есть, и что оно хоть как-то притягивается за уши (центральная теорема, закон больших числе и всё такое). Но, во-первых, у неё возможны значения как отрицательные, так и выше 100% (то есть уже надо как-то сдвигать кривую вправо, skewness добавлять). А во-вторых, мне кажется, что у нас крайне мало точек, чтобы надеяться увидеть красивую кривую. То есть, если посчитать погрешность наблюдения (хотя бы пропорционально корню наблюдений в каждой точке), то она вполне покроет зону гаусса даже для ЕР.

P.S. Ни в коей мере не пытаясь усомниться в факте фальсификации, просто ваш пост перепостили мои друзья с указанием «физик, в статистике разбирается» — я не смог не заинтересоваться :-)
[User Picture]
From:oude_rus
Date:December 6th, 2011 08:52 am (UTC)
(Link)
//из неё вывели факт подтасовки//

для альтернативщиков вроде вас (которые видят то, чего нет) я специально написал разъяснение; прочитайте его, пожалуйста.
[User Picture]
From:green_fr
Date:December 6th, 2011 09:19 am (UTC)
(Link)
Извините, если невольно приписал вам то, чего вы не писали. Не важно. Вернёмся к теме? Если можно, не повышая тона, я не ругаться сюда пришёл. Если вам неинтересно со мной разговаривать — просто не отвечайте, да и всё :-)
[User Picture]
From:oude_rus
Date:December 6th, 2011 09:42 am (UTC)
(Link)
хорошо.

Гауссово распределение - это ровно то, что природа создала для распределения большого количества независимых событий. Разумеется, есть и другие распределения, навроде Пуассона и Больцмана (а так же Ферми-Дирака и Бозе-Эйнштейна), но вроде есть консенсус, где какие использовать. Как вы полагаете, какое из распределений разумней всего применять для распределения независимых голосов при выборах?

Причем уже показано стотыщ раз на разном выборном материале, что распределения при голосовании таки гауссовы, и закон больших чисел вполне себе работает. Собственно, вы это можете видеть на графике наверху для, например, КПСС. Или вот мне пишут, что распределение за ЕР по Ярославской области вполне себе нормально. Поэтому в качестве первого приближения разумно полагать распределение Гауссовым, и если оно не таково (плюс-минус, разумеется), то задаваться вопросом, "а почему нет" в качестве второго приближения.

Тут дальше можно строить разные предположения, например, о правомерности использования предположения о независимости отдельных событий, на которых строится теорема больших чисел. Или - например опять же - можно предположить, что избиратели ЕР (и исключительно ЕР) бимодальны: часть поменьше голосует за Медведа, а побольше - за Путина. В КПСС же все голосуют за Зюганова (который един), поэтому распределение гауссово.

Проблема же тут в том, что все эти предположения требуют независимой верификации, что сильно выходит за круг моих интересов. Поэтому я их и не строю. Но есть и другие люди, которые этим занимаются. Может, вам имеет смысл поговорить с ними.

Я достаточно подробно ответил?
[User Picture]
From:green_fr
Date:December 6th, 2011 10:03 am (UTC)
(Link)
Да, спасибо, гораздо интереснее предыдущего комментария :-Р

А второй мой вопрос был - почему вам кажется, что распределение ЕР - не гауссово? Мне оно "на глазок" вполне нормальным кажется. С кучей пиков, которые, на мой взгляд, вполне объяснимы случайными флуктуациями. То есть, как мне кажется, если посчитать погрешность (я чуть выше предложил квадратный корень из числа наблюдений в каждой точке, то есть если точка представлена 200-ми участками, то погрешность +-14), то "коридор доверия" (я не помню точного русского термина, я во Франции) вполне покроет возможную гауссову кривую вокруг наших наблюдений. Нет разве?

То есть, самое простое объяснение этих пиков на 25% и на 51% - не двуглавие партии (одни голосуют за жуликов, другие - за воров :-)), а тупо нехватка данных, малое количество наблюдений.
[User Picture]
From:fedor_s
Date:December 9th, 2011 11:43 pm (UTC)
(Link)
Там выше было обсуждение Ярославской области. Если на 26 ТИКах уже наблюдений достаточно, что по Москве тем более, и с многократным запасом.
[User Picture]
From:green_fr
Date:December 12th, 2011 08:38 am (UTC)
(Link)
Там не было обсуждения теории, там был один график, который на глазок кажется похожим на другой.
[User Picture]
From:alex_celly
Date:December 12th, 2011 08:59 am (UTC)
(Link)
Потому что "двух колоколов" в гауссиане в природе не бывает.

И единый процесс двумя РАЗНЫМИ распределениями описывается только со значительной разницей по времени взятия данных. Грубо говоря, если строить графики по разным годам - тогда может быть столько гауссиан, сколько раз взяли данные.

У нас же данные по одному процессу за один день одного года. Тут то, что получается из данных, никак не объясняется нормальными распределениями. Никак!
Powered by LiveJournal.com