?

Log in

No account? Create an account
Maxim Pshenichnikov
December 11th, 2007
10:57 pm

[Link]

Previous Entry Share Next Entry
Любителям статистики
После долгого внутреннего сопротивления я тоже пал жертвой всеобщей шизофренииго увлечения статистическим анализом выборов. С моей точки зрения, проблема известной диаграммы глубокоуважаемого podmoskovnik    , показывающую несомненную  корреляцию между явкой и голосами за ЕР, заключается в (неявном) предположении о равновесности каждой ТИК. То есть одна ТИК - одна точка на графике. На самом деле, распределение количества ТИКов по приписанным избирателям широкое и сильно асимметричное. Поэтому я воспользовался данными  глубокоуважаемого kireev   , и ввел в график третье измерение: теперь размер площадь круга пропорциональна количеству избирателей в ТИКе. 



PS. Нет, этот график никоим образом не доказывает фальсификации в пользу ЕР. Он вообще ничего не доказывает. 

UPD. Как было разумно замечено в комментариях , более правильно показывать площади круга (а не линейный размер, как было раньше). Переделал. 

NB. Еще раз подчеркну, что мопед не мой авторство идеи графика принадлежит podmoskovnik, а данные - kireev, которые и должны быть credited должным образом.

(22 comments | Leave a comment)

Comments
 
From:ex_pamerast
Date:December 12th, 2007 12:27 am (UTC)
(Link)
Браво! Если на следующий день после выборов началась бы "берёзовая революция", то её организаторам следовало бы распечатать Ваш график несколькомиллионным тиражём и раздавать людям :-)
[User Picture]
From:oude_rus
Date:December 12th, 2007 07:56 am (UTC)
(Link)
С моей точки зрения, "березовая революция" не могла начаться именно потому, что - все честно.
From:ex_pamerast
Date:December 12th, 2007 05:26 pm (UTC)
(Link)
Ну, я иронизировал, конечно, революционные события могли бы начаться если бы, реально, Яблоко и СПС набрали бы на порядок больше каждый, а ЕдРо, соответственно, на 23% меньше, но дорисовало бы себе процентов пять фальсификациями.

Вместе с тем, мне трудно поверить в явку свыше 85% и это - главная причина, почему, я считаю, фальсификация в пользу ЕдРа составила около 3%.
[User Picture]
From:oude_rus
Date:December 12th, 2007 08:57 pm (UTC)
(Link)
При коммунистах явка была за 95% - и никто не жужжал безо всяких фальсификаций. Полна чудес могучая природа!
(Deleted comment)
[User Picture]
From:oude_rus
Date:December 12th, 2007 07:54 am (UTC)

Re: ну вы прям как в советское время график сделали

(Link)
Спасибо, переделал (см. апдейт).
[User Picture]
From:smyslov
Date:December 12th, 2007 07:23 am (UTC)
(Link)
Методы "коррективки" результатов выборов, в общем-то, известны. И простыми математическими выкладками эти методы "не ловятся". Единственным реальным способом выявления "коррективки" являются наблюдатели. И то - при условии, что они будут НА КАЖДОМ УЧАСТИКЕ. Все прочие рассуждения - и тут Вы абсолютно правы! - "от лукавого".
Здесь проблема в одном: рано или поздно те, кто корректировал, начнут "болтать". Если корректируются до 5% голосов, то "корректировщиков" немного, если больше, то обеспечить сохранность деликатной информации будет очень сложно. И это в ближайшие годы будет серьезной проблемой действующей власти.
[User Picture]
From:oude_rus
Date:December 12th, 2007 08:02 am (UTC)
(Link)
простыми математическими выкладками

Есть гораздо более изощренные методы и гораздо более грамотные люди для их применения (я что - я погулять вышел). А методы, конечно, не ловятся, поскольку математика только описывает реальность, но не воссоздает ее. Тем не менее, изощренный статистический анализ может четко показать, где и что искать. А это уже немало.
[User Picture]
From:podmoskovnik
Date:December 12th, 2007 09:44 am (UTC)

+2

(Link)
Именно.
Разглядывание графиков может наводить на грустные размышления и подсказывать, где копать, но если копать нечем - ничего не сделаешь. В рамках существующей системы бюллетени, пачкой вброшенные в урну председателем, принципиально неотличимы от бюллетеней, положенных избирателями, а голос, поданный под угрозой уволить, отключить газ, закрыть автобусный маршрут - от голоса, поданного из искренних политических убеждений. И пока не найдется хотя бы по два сознательных наблюдателя на каждый участок - надежда только на доброго царя.

И второе тоже правда. "Что знают двое - знает и свинья" (пардон). Встречу знакомую учительницу, которая сидела на нашем участке в комиссии - обязательно спрошу. Другой вопрос - что с этим знанием потом делать - повесить на стенку? свернуть в трубочку и засунуть? Намалевать на знамени и пойти на баррикады? В брежневские врремена все тоже прекрасно знали, что то, что говорится на политинформациях и то, что происходит в реальной жизни, ничего общего между собой не имеет. И ничего, страна существовала, на выборы ходили, балет опять же, ракеты. Правда, микросхемы были большие.
[User Picture]
From:podmoskovnik
Date:December 12th, 2007 11:11 am (UTC)
(Link)
можно было бы еще линейную регрессию сделать с весовыми коэффициентами, учитывающими численность избирателей - только что-то не соображу, веса должны быть пропорциональны числу избирателей или квадрату?
[User Picture]
From:oude_rus
Date:December 12th, 2007 12:20 pm (UTC)
(Link)
Я тоже размышлял по этому поводу и решил, что и так плохо, и так. Тем не менее, вечером я опубликую гистограммы голосов "за" по участкам с распределением количества голосов.

На самом деле, надо скорее уходить до анализа по низовым участкам, которые, вроде бы, имеют одинаковое число приписанных избирателей. Тогда никакие коэффициенты не понадобятся.

Второй момент - данные киреева УЖЕ сильно сглажены. Например, по московским участкам средняя цифра получается довольно приличная, хотя известно, что гисторгамма по низовым участкам бимодальна (по крайней мере, по некоторым округам). Для корреляции это означает, что точки в районе 60% явки (где сейчас красно-зелено) разъедутся влево и вправо.

Надо скрипт писать одним словом, который все эти данные выудит с сайта избиркома в один файл (кто сделает?). Можно даже и не в экселовский воркшит (я вообще пользуюсь Ориджином), а просто текстовой файл. Обработка-то фигня, на раз пишется.
[User Picture]
From:podmoskovnik
Date:December 12th, 2007 12:29 pm (UTC)
(Link)
Согласен. Хотя к картине мира уже вряд ли что-либо серьезное добавится. Скрипт действительно было бы хорошо сделать, но я тут не мастер. Мастера, отзовитесь! Хотя бы отдельными файлами в csv скачать.
[User Picture]
From:oude_rus
Date:December 12th, 2007 12:49 pm (UTC)
(Link)
Ну да, как скачать, без разницы, главное - скачать в едином формате. Потом можно дописать локальную программульку, которая все стащит в один файл да пусть хоть гигобайтного размера.

Но я не программист, так что - увы.
[User Picture]
From:ksonin
Date:December 12th, 2007 04:09 pm (UTC)
(Link)
Не совсем понял, почему этот график "ничего не доказывает". Всё-таки предположительно явка должна быть отрицательно коррелирована или некоррелирована с голосами за "Единую Россию". Я, упаси Боже, не считаю этот график "доказательством фальсификаций", но он, скорее, подсказывает, что, возможно, такие доказательства существуют.

То, что в правом верхнем углу маленькие кружочки - возможно, как раз дополнительный аргумент в пользу гипотезы о фальсификации. Вы не могли бы этот же график раскрасить по регионам или, хотя бы, выделить цветом точки московских округов?
[User Picture]
From:oude_rus
Date:December 12th, 2007 05:22 pm (UTC)
(Link)
Ну, он по крайней мере доказывает наличие корреляции +0.9. Предположение некоррелированности голосов от явки проистекает, с моей точки зрения, из допущения существования нескольких равнозначных партий со сравнимым маркетингом. Если же это не так, то явка и голоса за какую-то партию коррелированы через мотивацию избирателя "спасти страну от врагов". Иными словами, маркетинг сильно разный.

Доказательства фальсификаций если и существуют, то не через статанализ. Математика может только подсказать, где глядеть и что искать.

Точечки в правом верхнем углу - это те ТИКи, которые обеспечили явку, близкую к 100%. Я думаю, парочку Вы сами навскидку назовете. Прикол же заключается в том, что там окажутся и московские точки -- просто сейчас они собраны в пулы офигительных размеров, где все особенности усреднены.

Любые не-цифровые манипуляции с графиком для меня затруднены, поскольку я использую профессиональный Origin, a не Exel. То есть всю маркировку приходится выполнять на ручной тяге. Но московские округа попробую глянуть вечером.
(Deleted comment)
[User Picture]
From:oude_rus
Date:December 26th, 2007 01:53 pm (UTC)
(Link)
Я думаю, что, если отрезать уж совсем маразматичный хвост, то в остальном будет вполне логичная картина, где фактором, индуцирующим корреляцию, является долбоящик.
[User Picture]
From:alexab
Date:December 25th, 2007 09:10 pm (UTC)
(Link)
для тех кто в танке объясните, почему зеленая и красная полоса не повторяют друг друга зеркально симметрично? ведь пункта "против всех" не было.

(мысли вслух: каждой точке за "едро" с долей голосов х должна соответствовать точка за "все остальные партии" с долей 100% - х)
(Deleted comment)
[User Picture]
From:oude_rus
Date:December 26th, 2007 01:55 pm (UTC)
(Link)
Совершенно верно; см. комментарии вот здесь:
http://oude-rus.livejournal.com/42254.html

Вообще, я склоняюсь к мысли, что показывать процент от полного числа избирателей неверно: даже если начальной корреляции нет, она наведется подобным представлением.
(Deleted comment)
[User Picture]
From:oude_rus
Date:December 26th, 2007 10:33 pm (UTC)
(Link)
А, Вы тоже сторонник product placement гипотезы? тогда у нас особых разногласий не будет.

Я имел ввиду ось вертикальную. По-моему, более правильно показывать процент от проголосовавших (а не от списочного состава). Завтра постараюсь обосновать и посчитать.
[User Picture]
From:alexab
Date:December 28th, 2007 06:18 pm (UTC)
(Link)
спасибо, теперь мне ясно.
--
а в ЕдРо Вам бы сказали, что их сторонники едины и более организованы, поэтому и явка у них выше)))
--
помоему как перестраивать один и тот же график не имеет смысла - так уже все видно. одно меня смутило - информация зачем-то продублирована в двух цветах.
[User Picture]
From:oude_rus
Date:December 28th, 2007 07:58 pm (UTC)
(Link)
Я не согласен: показ ТИКов точками фундаментально неверен, надо строить правильную 2D гистограмму. И все же по вертикале надо откладывать процент от проголосовавщих. Но теперь по старым данным это делать бессмысленно, поскольку скоро будут новые данные с разбивкой по низовым избирательным комиссиям. Я надеюсь, что гистограмма количества избирателей будет более правильной.

Информация не совсем продублирована: разница в недействительных бюллютенях.
[User Picture]
From:alexab
Date:January 2nd, 2008 10:29 pm (UTC)
(Link)
что ж вы раньше молчали про недействительные, когда симметрию обсуждали...)

тогда я бы процент недействительных строил второй линией, ибо иначе его заведомо не разглядеть.

интересно увидеть что получится.
[User Picture]
From:oude_rus
Date:January 2nd, 2008 11:07 pm (UTC)
(Link)
Да ничего особо интересного (если честно): количество недействительных голосов исчезающе мало.

По сути-то Вы совершенно правы. Но и меня строго не судите: я ж только погулять вышел. Вот сейчас перемолочиваю данные по низовым избирательным участкам по Москве. Может, завтра-послезавтра опубликую.
Powered by LiveJournal.com