September 20th, 2013

Коротенький апдейт про результат Собянина по данным СМС-ЦИК

Пока суд да дело, вывод о нерепрезентативности выборки смс-цик наблюдателей был подтвержден разными методами несколькими независимыми исследователями (1 ,2, 3, 4) и  стал уже общим местом. С учетом этого эффекта результат Собянина, экстраполированный по участкам с смс-цик на непокрытые участки, возрастает с 49.7% до 50.9-51.0%, т.е. на 1.2-1.3 процентных пункта, что приближает его к официальному результату в 51.37%. Мне не совсем понятно, почему romanik не признает этот факт (вместо развлечения читателей cherry picking) -- с моей колокольни, подобный подход не идет ни на пользу делу в широком смысле, ни ассоциации "Голос" в частности. Но, как я уже сказал, это не мой выбор.

Так вот, ложечки нашлись, но осадок в виде разницы между экстраполированным и официальным результатом в 0.4-0.5% остался. Правда, здесь некоторые комментаторы уже утратили всякий интерес, заявив "понятно, что Собянин победил, а уж сделал он это с перевесом в 1% или 1.37%, не так уж и важно". Кроме того, оценки точности экстарополяции показывают, что официальный результат вполне укладывается в доверительный интервал ±0.8%. Тем не менее, я хотел бы немного поспекулировать на тему этого отклонения в 0.4-0.5%.

Гипотезы тут могут быть три: фальсификации, неоднородность покрытия наблюдателей внутри ТИК и неоднородность посылки смс. Во втором случае механизм такой же, как и для всего города: наблюдатели в среднем идут на те участки внутри ТИК, которые более про-оппозиционны. В третьем случае работает обратная связь: наблюдатель, узнав высокий результат Собянина на участке, менее мотивирован отправить смс; этот случай я объединю с неоднородностью. podmoskovnik посчитал отличие между участками-близнецами (т.е. расположенные в одном здании, но один с смс-цик наблюдателем, другой - без) и получил отличие на уровне 0.2%. Интерпретировать это число можно по-разному: как манипуляции с голосами на участке без смс-наблюдателя, как упомянутая неоднородность на уровне микрорайона (и поэтому меньшая, чем по ТИК) или как  social conformity (один активный наблюдатель агитирует троих друзей придти и проголосовать на за Собянина). Я прикинул результат только по выборке участков, оснащенных КОИБ (которым мы доверяем), и получил отличие между экстраполяцией и официальным результатом в 0.4% (с учетом ограниченности выборки), и указывает на неравномерность выборки наблюдателей внутри ТИК. Кроме того, остальные статистические метрики (например, СКО по ТИК) не показывают ничего из ряда вон выходящего -- хотя с учетом того, что 0.5% произрастают из 1/3 участков (на самом деле даже меньше, поскольку не все наблюдатели участвовали в смс-цик), чуствительности должно было бы хватать.

В общем, я склоняюсь к версии "второй неоднородности" наблюдателей, хотя доказать ее прямо пока не могу.

Еще из размышлений: когда мы с kobak и podmoskovnik работали в январе 2012 над первой версией статьи по думским выборам-2011, речь шла о десятках фальсифицированных процентов. В марте 2012го, когда мы добавили анализ президентских выборов, счет уже был на проценты (хотя и близкие к десяти). А сейчас мы рассуждаем о десятых процента. Два десятичных порядка за два года -- это совсем неплохо, не так ли? (правда, моей заслуги тут нет)

UPD. alien_muzzy проделал независимый рассчет по участкам с КОИБ и без, и заключил полученное выше отклонение для участков без наблюдателей - это не результат систематических фальсификаций, а, например, того, что наблюдатели, расстроенные результатом, не отправляли СМС. Иначе картинка была бы другой: в каждой группе первые три столбика были бы примерно на одном уровне, а столбик "Nothing" был выше.