Maxim Pshenichnikov (oude_rus) wrote,
Maxim Pshenichnikov
oude_rus

Categories:

Небольшой разбор доклада Сулакшина

Поскольку уважаемый barouh подкатил ссылку на т.н. доклад Сулакшина, можно разобрать сенсационную методику -- которая дала 22% за ЕР и 28% за КПРФ -- по существу.

Если коротко, то я в совершеннешем восхищении. В восхищении от того, что можно написать 160 страниц со 138 (!!) рисунками там, где разговору-то на 12 страниц и 5 рисунков -- и это с подробными описаниями всех методик. Сколько заняло времени озвучить весь этот доклад, мне даже страшно и подумать -- часов 6, наверное, а я говорю очень быстро. Поэтому не будем углубляться во всем известные детали (такое впечатление, что автор не совсем в курсе, что вообще происходило на ниве электоральной статистики за последний год), а сразу перейдем к оригинальной методике.

Она суммирована на рис.116, стр.94 (тут сразу же вспоминается я классицизму отдал честь, хоть поздно, но введенье есть).Для лучшего понимания можно сделать шаг назад, на рис. 114:
113
(линии, судя по всему, нарисованы сплайном, что как бы намекает нам...)

На рисунке показано распределение количества УИК как функции доли проголосовавших за ЕР для УИК разных размеров (если вы поняли, что именно изображено по оси ыгрэк, расскажите мне поскорее). Вы небось не знали, что при увеличении размера участка доля голосующих за ЕР уменьшается? Вот теперь знаете. Автору, видимо, неведомо, что еще Чуров и соавторы в своей знаменитой статье писали о необходимости разделять большие городские участки и маленькие сельские, поскольку в сельских голосование более консервативное. Но не суть.

Теперь делается вот какая штука: для каждого размера берется максимум распределения (что распределения сильно асимметричные, т.е. максимум не совпадает со свредним, автора не смущает) и строится как функция размера участка для всех партий:
116

Давайте посмотрим на синюю линию, которая нарисована для ЕР. Доля ЕР падает от 50% на маленьких участках (правда, на рис.114 показано где-то 52%, но не будем придираться) до где-то 27-29% на участках больших (напомню, что хвост распределения проигнорирован). А для КПРФ ситуация ровно обратная: от 10% до 20-26%. Замечательно, но где же озвученные проценты?

И вот тут авторы применяют такой трюк: поскольку уже установлено, что фальсифицируют все участки, и маленькие, и большие -- но маленькие очень много, а большие поменьше, то надо просто экстраполировать эту тенденцию на бесконечно большой участок. После чего рисуется сплошная линия подгонки - иногда степенной функции, иногда полиномиальной (автор не замарачивается объяснением не только выбора функции, но даже не дает параметров фита) - и в асимптотике получаем искомый результат. Кремль негодует, коммики аплодируют.

Претензий (методических, а не по сути) тут две:
1. Максимум распределения на рис.114 сильно отличается от среднего. Если взять среднее (или медиану), то результаты сильно изменятся. Ну и о такой мелочи, как интервалы доверия я даже и не заикаюсь.
2. Функции фита никак не обоснованы и с очевидностью неправильно описывают данные. Во всяком случаее, для ЕР вместо гиперболы надо было брать функцию ошибки или что-то подобное с двумя горизонтальными асимптотами. Обсуждение устойчивости фита тоже не помешало бы.

Ну а по сути: отбрасывание всех маленьких участков как полностью сфальсифицированных и экстраполяция на сферического коня в вакуме - это, простите, очевидный бред никак не обосновано.

Отдельно доставляет обсуждение доклада докторами и академиками с такими, например, высказываниями:

Идея предложенного подхода проста до гениальности: по закону больших чисел распределение предпочтений выстраивается в гауссову кривую, в идеале имеющую единственный пик. Наличие огромного количества точек (известны результаты выборов по 95 тыс. избирательных участков) позволяет корректно оперировать технологиями реализации закона больших чисел... Остается удивляться не только наглядности этих результатов, но и тому, почему ранее столь убедительная интерпретация официально зафиксированных данных никому не приходила в голову.

Эти люди вчера упали с Луны?

UPD Посмотрел на выходные данные: оказывается, pdf был создан 22 января 2013, а доклад был сдан в набор (какой набор? он еще существует?) 27 ноября 2012 года, Т.е. сам доклад имел место быть еще раньше. Интересно, почему он выплыл именно сейчас.

UPD2 В начале Сулашкин говорит, что доклад корреспондирует еще и с совершенно актуальными событиями сегодняшнего
дня — подписанием Закона о митингах
. То есть это начало июля 2012, 9 месяцев назад.
Subscribe
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 33 comments