?

Log in

No account? Create an account
Коротенький апдейт про результат Собянина по данным СМС-ЦИК - Maxim Pshenichnikov
September 20th, 2013
11:15 pm

[Link]

Previous Entry Share Next Entry
Коротенький апдейт про результат Собянина по данным СМС-ЦИК
Пока суд да дело, вывод о нерепрезентативности выборки смс-цик наблюдателей был подтвержден разными методами несколькими независимыми исследователями (1 ,2, 3, 4) и  стал уже общим местом. С учетом этого эффекта результат Собянина, экстраполированный по участкам с смс-цик на непокрытые участки, возрастает с 49.7% до 50.9-51.0%, т.е. на 1.2-1.3 процентных пункта, что приближает его к официальному результату в 51.37%. Мне не совсем понятно, почему romanik не признает этот факт (вместо развлечения читателей cherry picking) -- с моей колокольни, подобный подход не идет ни на пользу делу в широком смысле, ни ассоциации "Голос" в частности. Но, как я уже сказал, это не мой выбор.

Так вот, ложечки нашлись, но осадок в виде разницы между экстраполированным и официальным результатом в 0.4-0.5% остался. Правда, здесь некоторые комментаторы уже утратили всякий интерес, заявив "понятно, что Собянин победил, а уж сделал он это с перевесом в 1% или 1.37%, не так уж и важно". Кроме того, оценки точности экстарополяции показывают, что официальный результат вполне укладывается в доверительный интервал ±0.8%. Тем не менее, я хотел бы немного поспекулировать на тему этого отклонения в 0.4-0.5%.

Гипотезы тут могут быть три: фальсификации, неоднородность покрытия наблюдателей внутри ТИК и неоднородность посылки смс. Во втором случае механизм такой же, как и для всего города: наблюдатели в среднем идут на те участки внутри ТИК, которые более про-оппозиционны. В третьем случае работает обратная связь: наблюдатель, узнав высокий результат Собянина на участке, менее мотивирован отправить смс; этот случай я объединю с неоднородностью. podmoskovnik посчитал отличие между участками-близнецами (т.е. расположенные в одном здании, но один с смс-цик наблюдателем, другой - без) и получил отличие на уровне 0.2%. Интерпретировать это число можно по-разному: как манипуляции с голосами на участке без смс-наблюдателя, как упомянутая неоднородность на уровне микрорайона (и поэтому меньшая, чем по ТИК) или как  social conformity (один активный наблюдатель агитирует троих друзей придти и проголосовать на за Собянина). Я прикинул результат только по выборке участков, оснащенных КОИБ (которым мы доверяем), и получил отличие между экстраполяцией и официальным результатом в 0.4% (с учетом ограниченности выборки), и указывает на неравномерность выборки наблюдателей внутри ТИК. Кроме того, остальные статистические метрики (например, СКО по ТИК) не показывают ничего из ряда вон выходящего -- хотя с учетом того, что 0.5% произрастают из 1/3 участков (на самом деле даже меньше, поскольку не все наблюдатели участвовали в смс-цик), чуствительности должно было бы хватать.

В общем, я склоняюсь к версии "второй неоднородности" наблюдателей, хотя доказать ее прямо пока не могу.

Еще из размышлений: когда мы с kobak и podmoskovnik работали в январе 2012 над первой версией статьи по думским выборам-2011, речь шла о десятках фальсифицированных процентов. В марте 2012го, когда мы добавили анализ президентских выборов, счет уже был на проценты (хотя и близкие к десяти). А сейчас мы рассуждаем о десятых процента. Два десятичных порядка за два года -- это совсем неплохо, не так ли? (правда, моей заслуги тут нет)

UPD. alien_muzzy проделал независимый рассчет по участкам с КОИБ и без, и заключил полученное выше отклонение для участков без наблюдателей - это не результат систематических фальсификаций, а, например, того, что наблюдатели, расстроенные результатом, не отправляли СМС. Иначе картинка была бы другой: в каждой группе первые три столбика были бы примерно на одном уровне, а столбик "Nothing" был выше.

(62 comments | Leave a comment)

Comments
 
[User Picture]
From:serg_61
Date:September 20th, 2013 09:24 pm (UTC)
(Link)
В поддержку гипотезы про СМС. Сам послал данные со своего УИКа только после напоминания по почте, что нет данных по участку. Высокий результат Собянина отбил у меня желание об этом сообщать. Вот так личные эмоции подавили общественный интерес.
[User Picture]
From:barouh
Date:September 20th, 2013 09:48 pm (UTC)
(Link)
Собственно говоря, неоднородность распределения наблюдателей внутри одного района можно легко посчитать - по той выборке участков, которые удалось сопоставить с УИКами 2012 года
Всего удалось сопоставить участки (по всему району или по его части) для 76 ТИКов, но только в 61 ТИКе среди сопоставленных есть как минимум по 2 участка с наблюдателями и без наблюдателей (на этих выборах; про расстановку наблюдателей в 2012 мы ничего не знаем)
Для каждого из 61 районов считаем разницу между средними процентами Собянина на участках с наблюдателями и на участках без наблюдателей. И аналогично по тем же 2 подгруппам участков - средние результаты Путина в марте 2012 г.
Получается, что в марте 12 г. Путин в среднем на участках, не охваченных наблюдателями на нынешних мэрских выборах, получал на 0,55% больше голосов, чем на участках того же района, где сейчас были наблюдатели (если считать не среднее арифметическое по районам, а медиану, то разница 0,45%). На мэрских выборах средняя разница для Собянина по той же выборке из участков 61 района составила 0,68%, медиана 0,58%
Таким образом, очевидно, что и внутри района есть тот же эффект неравномерности расстановки наблюдателей (или их готовности слать смски), и что его масштаб как раз примерно совпадает с искомыми 0,5%
Под вопросом остается 0,13% - на которые средняя дельта Собянина больше средней дельты Путина. Что это - следы реальных фальсификаций, случайное отклонение или следствие "мультипликативного" роста Собянина в районах с наибольшими результатами Путина - вопрос (вопросик) открытый
[User Picture]
From:beer_evangelist
Date:September 20th, 2013 10:16 pm (UTC)
(Link)
>про расстановку наблюдателей в 2012 мы ничего не знаем

1. На президентских наблюдателей ставили в первую очередь на самые подозрительные участки и на участки заканчивающиеся на семерку (по крайней мере ГН от которого шел я делал так)
2. Номера участков с 2012 г изменились..
(no subject) - (Anonymous) - Expand
[User Picture]
From:barouh
Date:September 20th, 2013 10:08 pm (UTC)
(Link)
" речь шла о десятках фальсифицированных процентов. В марте 2012го, когда мы добавили анализ президентских выборов, счет уже был на проценты (хотя и близкие к десяти). А сейчас мы рассуждаем о десятых процента"
С другой стороны МКАД кажется и сейчас речь идет о десятках или как минимум десятке процентов

Edited at 2013-09-20 10:09 pm (UTC)
[User Picture]
From:oude_rus
Date:September 21st, 2013 07:57 am (UTC)
(Link)
так точно, речь идет о трети голосов по методики Шпилькина.
надо бы мне данные выложить.
[User Picture]
From:anseltis
Date:September 20th, 2013 10:44 pm (UTC)
(Link)
Мне кажется, нужно отталкиваться, не от 50.9%, а от 51.0%, потому что 0.1% объясняются просто слабым покрытием Зеленограда, которое устранаяется его укрупнением.
А вот устранить 0.1% в Новой Москве и Троицке уже никак нельзя, причем там расхождения идут как по Троицку, так и по сельской местности, и это даже при том, что один наблюдатель прислал протокол из санатория с чеченскими процентами.
Еще 0.1% также не устранятся со спеучастков.
Про остальные 0.2% можно точно сказать, что это хорошо покрытые ТИК, явка меньше 50%, результат Собянина меньше 70%.
[User Picture]
From:oude_rus
Date:September 21st, 2013 07:57 am (UTC)
(Link)
посмотрите на Московскую область -- там такой же жЫр, как и в Москве-2011. Почему НМ должна быть другой?

Спецучастки дают 0.1% - это запросто. Там, конечно, полный бардак.
From:(Anonymous)
Date:September 20th, 2013 10:53 pm (UTC)
(Link)
Для пробы ткнул в 3-ю ссылку, где "есть все доказательства". Нихуя не нашёл, кроме утверждения "в больницах всё равно мал кто голосовал".

Охуительное исследование.
[User Picture]
From:reader59
Date:September 20th, 2013 11:49 pm (UTC)
(Link)
факт: число наблюдателей, т.е. число активно желающих демократии, сильно меньше даже числа УИКов.
да и они демократы весьма сомнительные: ничего себе мотив для человека, убежденного в обязательности демократических процедур, - "не отправлю СМС, потому что мой кандидат проиграл".
а такой мотив, я так понял, сработал в значимом числе случаев.
убей меня бог лаптем, не понимаю, зачем тут еще и количественный анализ.
неужто уже на качественном уровне неясно, что все эти выборы здесь и сейчас - чистой воды культ карго, никакого реального значения не имеющий, а ситуация будет, при необходимости, разрешаться при помощи куда как более традиционных для автохтонного социума механизмов?
[User Picture]
From:nonenoun
Date:September 21st, 2013 12:22 am (UTC)
(Link)
> число наблюдателей сильно меньше даже числа УИКов
На многих УИКах было несколько наблюдателей. То есть проблема не в количестве, а в неоднородности.

> не отправлю СМС, потому что мой кандидат проиграл
Это лишь один из мотивов. Далеко не все участвовали в СМС-ЦИК, т.к. это достаточно новая технология.

> чистой воды культ карго, никакого реального значения не имеющий
Власть очень бы хотела, чтобы было именно так :) По крайней мере, выборы в первую неделю сентября - это явное издевательство над здравым смыслом. Даже третья неделя выглядит куда разумнее.
[User Picture]
From:tov_y
Date:September 21st, 2013 05:24 am (UTC)
(Link)
По моим подсчётам экстраполяция результатов участков с наблюдателями на весь город отнимает у Собянина 0,4% пункта.
Доля надомников на участках, покрытых наблюдателями 4,2%, а на непокрытых – 4,5%. Разница – 0,3% пункта.
Одна цифра хорошо бьётся с другой.
P.S. Участки 3600+ из рассмотрения исключены.
[User Picture]
From:oude_rus
Date:September 21st, 2013 07:54 am (UTC)
(Link)
//Одна цифра хорошо бьётся с другой. //

это если все надомники голосовали за Собянина.
и еще интересно, какое объяснение подобного феномена.
[User Picture]
From:barouh
Date:September 21st, 2013 10:46 am (UTC)
(Link)
За Собянина больше голосовали в неблагополучных районах - где видимо повышенная доля пожилых и инвалидов (и меньше доля пенсионеров, у которых есть возможность до поздней осени сидеть на даче). Так что повышенное надомное голосование в этих районах может быть вполне естественным явлением

Тем более что что в процентах от списочной численности надомное голосование и там, и там оказывается примерно одинаковым - просто на участках без наблюдателей явка на участки в среднем была ниже, вот надомное голосование и получило повышенный вес
[User Picture]
From:anseltis
Date:September 21st, 2013 04:48 pm (UTC)
(Link)
С количеством надомников никаких проблем нет, после группировки по ТИК (и исключением Новой Москвы) получается 4.34%, а по МГИК 4.38%.
[User Picture]
From:poulsam
Date:September 21st, 2013 05:19 pm (UTC)
(Link)
Вы недооцениваете, ваша роль очень немаленькая
Powered by LiveJournal.com