Maxim Pshenichnikov (oude_rus) wrote,
Maxim Pshenichnikov
oude_rus

Коротенький апдейт про результат Собянина по данным СМС-ЦИК

Пока суд да дело, вывод о нерепрезентативности выборки смс-цик наблюдателей был подтвержден разными методами несколькими независимыми исследователями (1 ,2, 3, 4) и  стал уже общим местом. С учетом этого эффекта результат Собянина, экстраполированный по участкам с смс-цик на непокрытые участки, возрастает с 49.7% до 50.9-51.0%, т.е. на 1.2-1.3 процентных пункта, что приближает его к официальному результату в 51.37%. Мне не совсем понятно, почему romanik не признает этот факт (вместо развлечения читателей cherry picking) -- с моей колокольни, подобный подход не идет ни на пользу делу в широком смысле, ни ассоциации "Голос" в частности. Но, как я уже сказал, это не мой выбор.

Так вот, ложечки нашлись, но осадок в виде разницы между экстраполированным и официальным результатом в 0.4-0.5% остался. Правда, здесь некоторые комментаторы уже утратили всякий интерес, заявив "понятно, что Собянин победил, а уж сделал он это с перевесом в 1% или 1.37%, не так уж и важно". Кроме того, оценки точности экстарополяции показывают, что официальный результат вполне укладывается в доверительный интервал ±0.8%. Тем не менее, я хотел бы немного поспекулировать на тему этого отклонения в 0.4-0.5%.

Гипотезы тут могут быть три: фальсификации, неоднородность покрытия наблюдателей внутри ТИК и неоднородность посылки смс. Во втором случае механизм такой же, как и для всего города: наблюдатели в среднем идут на те участки внутри ТИК, которые более про-оппозиционны. В третьем случае работает обратная связь: наблюдатель, узнав высокий результат Собянина на участке, менее мотивирован отправить смс; этот случай я объединю с неоднородностью. podmoskovnik посчитал отличие между участками-близнецами (т.е. расположенные в одном здании, но один с смс-цик наблюдателем, другой - без) и получил отличие на уровне 0.2%. Интерпретировать это число можно по-разному: как манипуляции с голосами на участке без смс-наблюдателя, как упомянутая неоднородность на уровне микрорайона (и поэтому меньшая, чем по ТИК) или как  social conformity (один активный наблюдатель агитирует троих друзей придти и проголосовать на за Собянина). Я прикинул результат только по выборке участков, оснащенных КОИБ (которым мы доверяем), и получил отличие между экстраполяцией и официальным результатом в 0.4% (с учетом ограниченности выборки), и указывает на неравномерность выборки наблюдателей внутри ТИК. Кроме того, остальные статистические метрики (например, СКО по ТИК) не показывают ничего из ряда вон выходящего -- хотя с учетом того, что 0.5% произрастают из 1/3 участков (на самом деле даже меньше, поскольку не все наблюдатели участвовали в смс-цик), чуствительности должно было бы хватать.

В общем, я склоняюсь к версии "второй неоднородности" наблюдателей, хотя доказать ее прямо пока не могу.

Еще из размышлений: когда мы с kobak и podmoskovnik работали в январе 2012 над первой версией статьи по думским выборам-2011, речь шла о десятках фальсифицированных процентов. В марте 2012го, когда мы добавили анализ президентских выборов, счет уже был на проценты (хотя и близкие к десяти). А сейчас мы рассуждаем о десятых процента. Два десятичных порядка за два года -- это совсем неплохо, не так ли? (правда, моей заслуги тут нет)

UPD. alien_muzzy проделал независимый рассчет по участкам с КОИБ и без, и заключил полученное выше отклонение для участков без наблюдателей - это не результат систематических фальсификаций, а, например, того, что наблюдатели, расстроенные результатом, не отправляли СМС. Иначе картинка была бы другой: в каждой группе первые три столбика были бы примерно на одном уровне, а столбик "Nothing" был выше.
Subscribe
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 62 comments