?

Log in

No account? Create an account
Понеслись проценты по трубам - Maxim Pshenichnikov
December 22nd, 2012
10:23 pm

[Link]

Previous Entry Share Next Entry
Понеслись проценты по трубам
Ну в общем ничего нового. 2000 и 2003 разумны, а дальше понеслось. И 2008 - это, конечно, песня, его в учебниках будут изучать.
На правой картинке показывается центр бина, а группировка идет внутри половины значения бина в каждую сторону, т.е. для 90% и 0.2% бина это будет участок 89.9..90.1%. Фурье спектр доказывает, что есть периодические пики с частотой 1% и 5%. Для вычисления количества голосов под пиками использовался стандартный алгоритм: берутся по два значения справа и слева от целочисленного пика (т.е. -0.4%, -0.2%, +0.2%, +0.4%), усредняются и вычитаются из величины пика. В итоге получается график с выбросами на целочисленных значениях (не показан), который потом интегрируется. Суммарные голоса довольно наглядны для демонстрации, на каком именно проценте начался набор голосов (т.е. появились целочисленные пики) и с какой скоростью происходил этот набор.

leader

years
UPD Добавил аналогичный анализ для участков с менее 1000 зарегистрированных избирателей. Эффект минимален, т.е. целочисленные пики не являются артефактами целочисленного деления.

(23 comments | Leave a comment)

Comments
 
From:razbudili
Date:December 22nd, 2012 09:42 pm (UTC)
(Link)
Подскажите неспециалисту, как группировались голоса? Т.е. 50,1% так и остается 50,1% или капает в столбик 50%? А 50,15% попадает в столбик 50,2%?
[User Picture]
From:oude_rus
Date:December 22nd, 2012 09:51 pm (UTC)
(Link)
правильное замечание, спасибо.
для 50% суммирование идет от 49.9% до 50.1%.
значения 50.1% быть не может: или 50.0%, или 50.2%.
From:razbudili
Date:December 22nd, 2012 11:42 pm (UTC)
(Link)
Спасибо, и еще один вопрос.

Я в самых общих чертах представляю что такое Фурье-спектр. Понимаю соответствие 5% цифре 0.2 на шкале. Но не могу понять что означает скачок в районе 2.0 на шкале? По идее это означает высокую частоту использования шага в 0,5%. Но Вы используете шаг 0,2%! А 0,5% из 0,2% целочисленными операциями никак не получить... Прошу объяснить.
[User Picture]
From:oude_rus
Date:December 23rd, 2012 08:31 am (UTC)
(Link)
это вторая гармоника от 1%. Поскольку пики острые, они содержат основную частоту плюс кратные частоты (обертоны). Этот пик я показал специально, поскольку он показывает, что начальная функция имеет период в именно 1%.
[User Picture]
From:vit_r
Date:December 22nd, 2012 10:11 pm (UTC)
(Link)
Прекрасно! Правый график самый говорящий.
[User Picture]
From:corbulon
Date:December 22nd, 2012 10:14 pm (UTC)
(Link)
Хе-хе...
Хотелось бы знать, как бы выглядел 2012-ый год, не подними вы с Подмосковником хороший скандальчик. Куда там 2008-му...
"Эх, испортил песню, дурак"
[User Picture]
From:nibope
Date:December 22nd, 2012 10:21 pm (UTC)
(Link)
Получается, что размах был набран еще при Вешнякове
[User Picture]
From:corbulon
Date:December 22nd, 2012 11:09 pm (UTC)
(Link)
Дело Чурова, как и Вишнякова, - не замечать.
А волшебничают на местах и без ихнего руководства.
[User Picture]
From:kobak
Date:December 22nd, 2012 11:10 pm (UTC)
(Link)
(i) Странно, что в 2012 получается больше, чем в 2011.

(ii) "Чеченские" пики 2011/12 на 99.5% не включаются в твой подсчет, верно? Потому что они не целочисленные?

(iii) Пятипроцентные пики-то пошире, чем 1%. Твой "четырехточечный" фильтр поэтому недооценивает их амплитуду. Надо будет потом попробовать разные фильтры.

Edited at 2012-12-22 11:10 pm (UTC)
[User Picture]
From:oude_rus
Date:December 22nd, 2012 11:35 pm (UTC)
(Link)
(и) почему странно, там же 1% пики включены теперь.
(ии) нет, не включаются. Я про это дело думал, но их включение разрушало бы цельность алгоритма.
(иии) пошире, факт. И недооценивает, тоже факт -- по Фурье это хорошо видно. Но больше точек-то нет.
я пытался делать "скользящую гребенку": на первом этапе удаляем все 1%-пики, сдвигаем центр фильтра на 0.2%, удалям эти пики и т.п. -- но все это приводит к крохам в кол-ве голосов, а описание сильно усложняет.
From:leo_bonart_
Date:December 23rd, 2012 08:25 am (UTC)
(Link)
Сдается мне, что круглым пикам очень помогло введение традиции снятия губеров за плохой процент.
[User Picture]
From:tov_y
Date:December 23rd, 2012 11:16 am (UTC)
(Link)
Всё это шикарно, но аппетит, как известно, приходит во время еды и всегда хочется большего. Нет ли желания сделать всё то же самое, но для круглого (кратного 100, 50 или даже 10) числа голосов за лидера? Плюс к тому, и то, и это - для явки?
[User Picture]
From:oude_rus
Date:December 24th, 2012 10:53 am (UTC)
(Link)
это все уже сделал corbulon.
[User Picture]
From:shipilev
Date:December 24th, 2012 09:28 am (UTC)
(Link)
Я тупой и не могу понять, почему в "Суммарные голоса на целочисленных процентах голосов" у функции... кхм... производная иногда меньше нуля? Это разве не побратим CDF, у которой f(x1) >= f(x2) iff (x1 >= x2)?
[User Picture]
From:oude_rus
Date:December 24th, 2012 10:38 am (UTC)
(Link)
Потому что статистически иногда выбросы бывают и вниз.

Это раз. Во-вторых, если речь идет про систематическое отклонение (сначала вниз, потом -- вверх), то это следствие линейного алгоритма аппроксимации: значение точки = среднему четырех соседей. По хорошему, надо было бы использовать квадратичную аппроксимацию, или, прости господи, сплайн. Возможно, так и надо делать, если все это переделывать -- меня же сейчас больше интересовала принципиальная возможность выделения 1%-пиков.
[User Picture]
From:shipilev
Date:December 24th, 2012 10:56 am (UTC)
(Link)
А, всё, понял. Я думал, что это бегущая сумма слева по всем голосам, а это бегущая сумма отклонений от локальной обстановки в каждой из точек.
[User Picture]
From:shipilev
Date:December 24th, 2012 09:34 am (UTC)
(Link)
Подумалось: было бы ещё элитнее рядом пририсовать фурье-спектр актуальной явки по участкам, чтобы показать, что это не эффекты квантования. Это вроде и так очевидно, судя по началу беспредела в 2004, но эта очевидность основывается на предположении о том же размере участков и том же jitter'е же посещаемости.
[User Picture]
From:oude_rus
Date:December 24th, 2012 10:45 am (UTC)
(Link)
1. рассчеты с явкой выложу сегодня.
2. я добавил часть годов отдельно для участков меньше 1000 зарегистрированных избирателей; изменения там минимальны.
[User Picture]
From:shipilev
Date:December 24th, 2012 10:57 am (UTC)
(Link)
Посмотрел, выглядит убедительно. Вот теперь бы ещё взять отдельный пик и на него аккуратно посмотреть, выделить там кластеры УИКов, которые ответственны за конкретный пик, и узнать, чем же они, чёрт возьми, так похожи. UPD: Помню, что кто-то что-то такое уже делал, но теперь-то можно из межгодовых данных вывалить кластера куда больше.

Edited at 2012-12-24 10:58 am (UTC)
[User Picture]
From:oude_rus
Date:December 24th, 2012 11:05 am (UTC)
(Link)
дык я и делал.
только теперь ужасно лень все делать вручную.
напиши скрипт!
[User Picture]
From:shipilev
Date:December 24th, 2012 11:09 am (UTC)
(Link)
Сорри, я тут вообще выпал из контекста. Дай данные, я попробую до НГ найти слот, чтоб поковыряться. (Я вообще-то обещал Подмосковнику выдрать все данные за десять лет напрямую из ЦИКа, но ручки-то вот они).
[User Picture]
From:shipilev
Date:December 24th, 2012 03:43 pm (UTC)
(Link)
Я пока в фоне фикшу робота (он скачал без проблем 2008, 2007, 2004 и дальше запнулся на формате)... Смотри, что нашёл:
http://cikrf.ru/banners/vib_arhiv/
http://cikrf.ru/banners/vib_arhiv/gosduma/index.html
http://cikrf.ru/banners/vib_arhiv/president/index.html
Powered by LiveJournal.com