?

Log in

No account? Create an account
Maxim Pshenichnikov
February 8th, 2012
09:28 am

[Link]

Previous Entry Share Next Entry
Мастеръ Гамбсъ этимъ полукресломъ заканчиваетъ новую партiю мебели

(92 comments | Leave a comment)

Comments
 
[User Picture]
From:kirenenko
Date:February 16th, 2012 08:40 pm (UTC)
(Link)
Чему соответствуют точки на диаграмме? Это все УИКи, кроме 0% недействительных???
Когда я смотрел на зависимость доли недействительных от явки, я видел несколько другую картину.
Картину, которая ничем не отличалась от обычной кометы доли голосов за партию, с изломом на 1/2, как Колман и предсказывает.
Кто-то из нас двоих ошибся либо с данными, либо с интерпретацией.
Я, конечно, это проверю, и часов через 8 сообщу результат.

Колман действительно не при чем, поскольку то, что доля недействительных от явки зависит практически линейно при явке > 50% было для меня фактом.

А вот что ваш график зависимости доли недействительных от числа проголосовавших очень похож на перевернутый график зависимости явки от числа проголосовавших - я почти уверен, так как смотрел на этот график вчера, когда писал вам ответ.
Не сочтите за труд, проверьте.

А я проверю зависимость доли недействительных от явки.
[User Picture]
From:oude_rus
Date:February 16th, 2012 09:06 pm (UTC)
(Link)
Разумеется, это не все участки -- для этого точек слишком мало. Это среднее доли недействительных (с бином 0.1%) при данной явке, в бине 0.5%. С вычетом бина 0.0% по недействительным. Если интересно, могу показать двуразмерную гистограмму.

Что нужно проверить - это врезка? проверить можно. Только учтите, что я сначала считал долю, и только потом усреднял -- что не совсем то же самое, что взять производную от основного графика.

Конечно, давайте проверять.
[User Picture]
From:kirenenko
Date:February 17th, 2012 04:48 am (UTC)
(Link)
Нарисовал кучу картинок, извините.
Исключены участки с 0 недействительных и со 100% явкой.

Для начала колманский фит, без всякой задней мысли:



Вот просто % недействительных от явки, медиана по бинам в 1%


Уже очевидно, что максимальный % недействительных на 50% явки.

Теперь посмотрим по вашей странной переменной - по числу проголосовавших.
Зависимость явки от числа проголосовавших. Синим - средняя явка по бинам в 20 человек. На график нагло добавлены средний процент недействительных (растянутый в 40 раз) и число недействительных (сжатое в 50 раз). Усреднено всё в конце, извините.



То же самое с медианами вместо средних:



В общем, у меня не рисуется то, что у вас. А то, что рисуется - объясняется вроде явкой.

Сейчас буду перечитывать ваш пост внимательно и разбираться, что именно вы рисуете, и как именно усредняете.
[User Picture]
From:oude_rus
Date:February 17th, 2012 02:05 pm (UTC)
(Link)
Спасибо за вашу работу. Завтра я напишу подробнее; пока сообщу лишь, что мой график неверен. В смысле, на нем показано не то, что написано. К вашему графику #2 тоже есть прeтензии, но не суть.

Я, конечно, всячески приветствую перечитывание моего поста, но, может, не стОит это делать в большой спешке.
[User Picture]
From:oude_rus
Date:February 18th, 2012 02:29 pm (UTC)
(Link)
Вот 2 новые картинки; давайте сначала их обсудим на предмет консенсуса.

Слева - 2Д гистограмма; линиями показано положение среднего (первого момента) для данной явки. Белая линия - с учетом 0% недействительных, красная - без учета. Видно, что "0%" сильно искажает зависимость, поскольку на нем творятся всякие тяжелообъяснимые вещи. Поэтому я полагаю, что правильнее не включать его в рассмотренее.

Правуй график - то же самое (красная линия) и доля ЕР (коричневая). Корреляция недействительных с долей ЕР есть, факт. Теперь как это интерпретировать: до 50% явки сильно "протестное" голосование, что дает где-то 1.9% недействительных (черные линии, нарисованы на глаз). После 50% начинает превалировать голосование за ЕР, в итоге чего доля протестных уменьшается (наклонная линия).  Резнкое падение доли недействительных  после 90% я бы не рассматривал слишком серьезно. Интерполяция тренда дает где-то 1%, что интерпретируется (мною) как технических брак.

Да, и Колман показан синей линией.
[User Picture]
From:kirenenko
Date:February 18th, 2012 07:52 pm (UTC)
(Link)
Спасибо.
По поводу усреднения, вам конечно виднее, но чисто визуально мне кажется, что первый момент - неустойчивая мера для этих данных. Вам самому не кажется, что большинство точек в правой чати облака лежат ниже кривой?

Но по крайней мере по Спирману у нас представление о корреляциях теперь совпадает.


> Да, и Колман показан синей линией


Не совсем понял, зачем. У вас же по вертикальной оси процент, а не энтропия.

[User Picture]
From:oude_rus
Date:February 24th, 2012 05:28 pm (UTC)
(Link)
Я согласен с критикой и исправляюсь. Вот новые картинки; теперь вместо первого момента нарисована медиана.

Изменилось немного и несущественно. Доля "технических" недействительных упала где-то до 0.5%. Максимума %недейств так и не появилось, да и Колман сильно промахивается. Что, впрочем, неудивительно -- удивительно, когда он не промахивается.

Наверное, здесь мы конвергировали (если не считать шпильки Колману -- что-то мне подсказывает, что вы с ней не согласитесь). Я остальную дискуссию сдвину в нижнюю ветку, хорошо?
[User Picture]
From:kirenenko
Date:February 24th, 2012 08:31 pm (UTC)
(Link)
Конвергировали, даже и со шпилькой Колману. Мне самому интересно, почему максимум недействительных ближе к 40% явки, чем к 50%.
правда, количественно у нас с вами энтропии не сходятся, но оставим, это неважно.
[User Picture]
From:kirenenko
Date:February 17th, 2012 05:28 am (UTC)
(Link)
Я предыдущий коммент с картинками писал, засыпая, извините.
Не знаю, зачем я обрезал две последние картинки. Наверно, хотел лучше показать район минимальной явки.
Там дальше недействтельные выглядят, как у вас здесь
http://oude-rus.livejournal.com/573310.html?thread=4797054#t4797054
(могу перепостить картинки)

Но мне кажется, я показал, что процент недействительных коррелирует с явкой.
[User Picture]
From:oude_rus
Date:February 17th, 2012 02:08 pm (UTC)
(Link)
да конечно коррелирует (как-то), кто ж спорит. и все вместе они коррелируют с результатом ЕР.

Вопрос-то был в другом: почему принцессы не какают откуда такая корреляция берется. То есть что есть причина, а что - следствие.
[User Picture]
From:kirenenko
Date:February 17th, 2012 04:09 pm (UTC)
(Link)
Принцессы не какают, поскольку когда они какают, их разжалуют в кухарки.

Явка коррелирует не только с результатом ЕР, а со всеми результатами вообше.
Нельзя отвергнуть ни гипотезу, что недействительные - это выбор против ЕР, ни гипотезу, что недействительные переписывались в пользу ЕР. Что справедливо для любой партии.
Если посмотреть на данные ruelect.com, видно, что корреляции есть как в непереписанных данных, так и частично объясняются переписыванием.
Конечно, манипуляции ДО переписывания тоже вносили вклад в эту корреляцию, но скорее всего небольшой. К тому же, мы знаем, что в честных выборах эти корреляции есть повсеместно.
Хочу повторить, что я думаю, что число проголосовавших - очень плохая переменная. Размер участка и явка - физичные (социологичные) переменные, зачем сбивать всех с толку, смешивая их?
Вот почему на больших и малых участках так сильно все различается - действительно интересный для меня вопрос.
[User Picture]
From:oude_rus
Date:February 17th, 2012 05:15 pm (UTC)
(Link)
//число проголосовавших - очень плохая переменная. //

Не согласен. Это - очень хорошая переменная, поскольку в самой простой физической модели число недействительных должно быть пропорционально числу проголосовавших. То есть это прекрасное нулевое приближение (что и видно на графиках), с которого можно начинать рассуждать про отличия, в частности, на больших участках.

И на всякий случай: я не сторонник легких путей объяснения всего-на-свете манипуляциями или фальсификациями. Мне гораздо инереснее понять внутреннюю логику, если таковая имеется. Именно поэтому я трачу столько времени на эти недействительные, хотя к фальсификациям имеют (если имеют) отношение только нулевые недействительные. Остальное так, мелкие кукишки -- но кукишки непонятные.
[User Picture]
From:kirenenko
Date:February 17th, 2012 06:28 pm (UTC)
(Link)
Ну, я конечно понимаю про простую модель, и думаю, что вам виднее, т.к. я собственно наукой почти не занимаюсь. Но ведь уже давно видно, что простая модель не описывает данные, и что отклонения от простых моделей коррелируют с социологическими параметрами.
У меня есть дурацкая грубая аналогия. Это как пытаться понять внутреннюю логику того, что ускорение спутника не равно жэ, после того, как мы наблюдали за Луной и планетами и видели корреляцию с эр-квадрат.
[User Picture]
From:kirenenko
Date:February 17th, 2012 06:46 pm (UTC)
(Link)
Или если без дурацких аналогий, гипотеза линейной зависимости недействительных от числа бюллетеней - это просто предположение, что процент недействительных везде одинаковый. То есть это тоже самое "верим Гауссу", только в отношении процента недействительных.

Когда вы смотрите на участки с небольшим количеством проголосовавших - это выборка из всего диапазона явок и размеров, и вы усредняете сильно различные проценты недействительных. Конечно, в результате получается константа с точностю до какого-нибудь гаусса.
Когда вы смотрите на участки с количеством проголосовавших > 1500 (повторяюсь) - это большие участки с явкой более 45%.


Edited at 2012-02-17 07:07 pm (UTC)
[User Picture]
From:oude_rus
Date:February 18th, 2012 02:48 pm (UTC)
(Link)
"предположение, что процент недействительных везде одинаковый"

это не так: процент недействительных может быть разным, но зависимость от N останется линейной, со средним процентом в качестве коэффициента. Это, вроде, свойство пуассона, хотя я точно не помню. Другое дело, что функция распределения процентов не должна меняться с изменением N -- ну она и не меняется в довольно широких пределах. А когда она начинает меняться -- как вы правильно заметили, около 1500 -- изменений никто объяснить не в состоянии.

Кстати, у переменной "количество проголосовавших" есть вот какое серьезное преимущество: она не завязана на корреляции. А остальные переменные сильно завязаны между собой, поэтому непонятно, что из чего следует.
Powered by LiveJournal.com