?

Log in

No account? Create an account
Мастеръ Гамбсъ этимъ полукресломъ заканчиваетъ новую партiю мебели - Maxim Pshenichnikov — LiveJournal
February 8th, 2012
09:28 am

[Link]

Previous Entry Share Next Entry
Мастеръ Гамбсъ этимъ полукресломъ заканчиваетъ новую партiю мебели

(92 comments | Leave a comment)

Comments
 
[User Picture]
From:kirenenko
Date:February 15th, 2012 10:23 pm (UTC)
(Link)
> Еще раз: количество зарегистрированных избирателей здесь вообще нигде не рассматривается.

Ну да, в этом я и вижу проблему: не рассматривается переменная, которая, возможно, все объясняет.
[User Picture]
From:oude_rus
Date:February 15th, 2012 10:29 pm (UTC)
(Link)
жду ваших объяснений.
[User Picture]
From:kirenenko
Date:February 16th, 2012 01:51 am (UTC)
(Link)
Я выше уже все написал, но повторю медленно.

1. При увеличении размера участка до примерно 1000 зарегистрированных, явка сильно падает, приближаясь к 50%. Энтропия выбора растет. При увеличении размера участка от примерно 1000 зарегистрированных, явка слегка растет, удаляясь от 50%. Энтропия немножко падает.
У меня нет разумного объяснения этому факту, есть только предположения типа город-деревня такие разные, или фальсификации на малых участках были другого характера и другого порядка наглости.
2. Когда вы выбираете участки с числом _проголосовавших_ более 1000, они автоматически являются участками с более 1000 _зарегистрированных_. С ростом числа _проголосовавших_ энтропия немножко падает.
3. Когда вы выбираете участки с числом проголосовавших _менее_ 1000, мы смотрим на смешанную выборку из больших и малых участков. Но больших в ней не много. Так как очень низкие явки встречаются редко. Впридачу, корреляция явки и размера у больших участков значительно слабее. Вот и выходит, что энтропия растет с увеличением числа _проголосовавших_.
4. Испорченные бюллетени - не случайность, а выбор избирателей. Еще одна оппозиционная партия. Ее поддержка выше там, где выше энтропия выбора партии. То есть там же, где выше энтропия выбора голосовать или нет. То есть там, где явка около 50%. То есть там, где около 1000 проголосовавших.

[User Picture]
From:kirenenko
Date:February 16th, 2012 03:26 am (UTC)
(Link)
Я еще такую мелочь упустил из виду.
Поскольку размер участка (число зарегистрированных) ограничен сверху, процент явки при данном числе проголосовавших ограничен снизу. Фактически, он ограничен числом примерно 3000/ЧислоПроголосовавших.
И при числе проголосовавших менее 1000 эта нижняя граница не достигается почти никогда (поскольку малые участки показывают высокую явку). А при числе проголосовавших более 1000, эта граница достигается повсеместно.
В связи с чем средняя явка на участках с числом проголосовавших более 1000, с увеличением числа проголосовавших растет вовсе _не слегка_.

[User Picture]
From:kirenenko
Date:February 16th, 2012 12:35 pm (UTC)
(Link)
> 3000/ЧислоПроголосовавших
ЧислоПроголосовавших/3000
[User Picture]
From:oude_rus
Date:February 16th, 2012 06:16 pm (UTC)
(Link)
я довольно прохладно отношусь к построениям Колмана, но не суть: если из ваших объяснений его опустить, то почти ничего не изменится.

Аргумент тут такой: если рассмотреть зависимость количества недействительных от количества проголосовавших, то рост где-то до 1000 практически линеен. Можно по-разному прореживать УИКи (на коибатые и нет, на сторонников любимой партии и нет), наклон меняется очень мало и составляет где-то 1.7% плюс-минус. Поэтому я не думаю, что этот наклон определяется не случайностью, а "выбором избирателя", т.е. может рассматриваться как отдельная партия. По-моему, гораздо более простое объяснение - это технический брак, который не зависит от политических предпочтений избирателей. Поэтому, с моей точки зрения, размер протестного голосования сильно преувеличен.

С другой стороны, если посмотреть на распределение доли недействительных как функцию явки (как вы предлагаете), то на ней тоже нет никаких удивительных вещей: доля падает с 2% на 35% явке до 1.8% на 75%, а потом даже немного возрастает. (Изолированные 0% я исключил, поскольку они ни в какие ворота не лезут).
[User Picture]
From:kirenenko
Date:February 16th, 2012 08:40 pm (UTC)
(Link)
Чему соответствуют точки на диаграмме? Это все УИКи, кроме 0% недействительных???
Когда я смотрел на зависимость доли недействительных от явки, я видел несколько другую картину.
Картину, которая ничем не отличалась от обычной кометы доли голосов за партию, с изломом на 1/2, как Колман и предсказывает.
Кто-то из нас двоих ошибся либо с данными, либо с интерпретацией.
Я, конечно, это проверю, и часов через 8 сообщу результат.

Колман действительно не при чем, поскольку то, что доля недействительных от явки зависит практически линейно при явке > 50% было для меня фактом.

А вот что ваш график зависимости доли недействительных от числа проголосовавших очень похож на перевернутый график зависимости явки от числа проголосовавших - я почти уверен, так как смотрел на этот график вчера, когда писал вам ответ.
Не сочтите за труд, проверьте.

А я проверю зависимость доли недействительных от явки.
[User Picture]
From:oude_rus
Date:February 16th, 2012 09:06 pm (UTC)
(Link)
Разумеется, это не все участки -- для этого точек слишком мало. Это среднее доли недействительных (с бином 0.1%) при данной явке, в бине 0.5%. С вычетом бина 0.0% по недействительным. Если интересно, могу показать двуразмерную гистограмму.

Что нужно проверить - это врезка? проверить можно. Только учтите, что я сначала считал долю, и только потом усреднял -- что не совсем то же самое, что взять производную от основного графика.

Конечно, давайте проверять.
[User Picture]
From:kirenenko
Date:February 17th, 2012 04:48 am (UTC)
(Link)
Нарисовал кучу картинок, извините.
Исключены участки с 0 недействительных и со 100% явкой.

Для начала колманский фит, без всякой задней мысли:



Вот просто % недействительных от явки, медиана по бинам в 1%


Уже очевидно, что максимальный % недействительных на 50% явки.

Теперь посмотрим по вашей странной переменной - по числу проголосовавших.
Зависимость явки от числа проголосовавших. Синим - средняя явка по бинам в 20 человек. На график нагло добавлены средний процент недействительных (растянутый в 40 раз) и число недействительных (сжатое в 50 раз). Усреднено всё в конце, извините.



То же самое с медианами вместо средних:



В общем, у меня не рисуется то, что у вас. А то, что рисуется - объясняется вроде явкой.

Сейчас буду перечитывать ваш пост внимательно и разбираться, что именно вы рисуете, и как именно усредняете.
[User Picture]
From:oude_rus
Date:February 17th, 2012 02:05 pm (UTC)
(Link)
Спасибо за вашу работу. Завтра я напишу подробнее; пока сообщу лишь, что мой график неверен. В смысле, на нем показано не то, что написано. К вашему графику #2 тоже есть прeтензии, но не суть.

Я, конечно, всячески приветствую перечитывание моего поста, но, может, не стОит это делать в большой спешке.
[User Picture]
From:oude_rus
Date:February 18th, 2012 02:29 pm (UTC)
(Link)
Вот 2 новые картинки; давайте сначала их обсудим на предмет консенсуса.

Слева - 2Д гистограмма; линиями показано положение среднего (первого момента) для данной явки. Белая линия - с учетом 0% недействительных, красная - без учета. Видно, что "0%" сильно искажает зависимость, поскольку на нем творятся всякие тяжелообъяснимые вещи. Поэтому я полагаю, что правильнее не включать его в рассмотренее.

Правуй график - то же самое (красная линия) и доля ЕР (коричневая). Корреляция недействительных с долей ЕР есть, факт. Теперь как это интерпретировать: до 50% явки сильно "протестное" голосование, что дает где-то 1.9% недействительных (черные линии, нарисованы на глаз). После 50% начинает превалировать голосование за ЕР, в итоге чего доля протестных уменьшается (наклонная линия).  Резнкое падение доли недействительных  после 90% я бы не рассматривал слишком серьезно. Интерполяция тренда дает где-то 1%, что интерпретируется (мною) как технических брак.

Да, и Колман показан синей линией.
[User Picture]
From:kirenenko
Date:February 18th, 2012 07:52 pm (UTC)
(Link)
Спасибо.
По поводу усреднения, вам конечно виднее, но чисто визуально мне кажется, что первый момент - неустойчивая мера для этих данных. Вам самому не кажется, что большинство точек в правой чати облака лежат ниже кривой?

Но по крайней мере по Спирману у нас представление о корреляциях теперь совпадает.


> Да, и Колман показан синей линией


Не совсем понял, зачем. У вас же по вертикальной оси процент, а не энтропия.

[User Picture]
From:kirenenko
Date:February 17th, 2012 05:28 am (UTC)
(Link)
Я предыдущий коммент с картинками писал, засыпая, извините.
Не знаю, зачем я обрезал две последние картинки. Наверно, хотел лучше показать район минимальной явки.
Там дальше недействтельные выглядят, как у вас здесь
http://oude-rus.livejournal.com/573310.html?thread=4797054#t4797054
(могу перепостить картинки)

Но мне кажется, я показал, что процент недействительных коррелирует с явкой.
[User Picture]
From:oude_rus
Date:February 17th, 2012 02:08 pm (UTC)
(Link)
да конечно коррелирует (как-то), кто ж спорит. и все вместе они коррелируют с результатом ЕР.

Вопрос-то был в другом: почему принцессы не какают откуда такая корреляция берется. То есть что есть причина, а что - следствие.
[User Picture]
From:kirenenko
Date:February 17th, 2012 04:09 pm (UTC)
(Link)
Принцессы не какают, поскольку когда они какают, их разжалуют в кухарки.

Явка коррелирует не только с результатом ЕР, а со всеми результатами вообше.
Нельзя отвергнуть ни гипотезу, что недействительные - это выбор против ЕР, ни гипотезу, что недействительные переписывались в пользу ЕР. Что справедливо для любой партии.
Если посмотреть на данные ruelect.com, видно, что корреляции есть как в непереписанных данных, так и частично объясняются переписыванием.
Конечно, манипуляции ДО переписывания тоже вносили вклад в эту корреляцию, но скорее всего небольшой. К тому же, мы знаем, что в честных выборах эти корреляции есть повсеместно.
Хочу повторить, что я думаю, что число проголосовавших - очень плохая переменная. Размер участка и явка - физичные (социологичные) переменные, зачем сбивать всех с толку, смешивая их?
Вот почему на больших и малых участках так сильно все различается - действительно интересный для меня вопрос.
Powered by LiveJournal.com