Maxim Pshenichnikov (oude_rus) wrote,
Maxim Pshenichnikov
oude_rus

ВременнЫе диаграммы

Я вообще люблю всякие динамические процессы, а тут anderson_mike предложил посмотреть на динамики процентов кандидатов -- т.е. как они менялись по времени обнародования данных на официальном сайте ЦИК. shipilev сделал отличную бродилку, которая собирала данные с сайта ЦИК и представляла их в форме удобоваримых таблиц (за что ему огромное спасибо). Вот тут представлены результаты эксперимента  anderson_mike в качестве таблицы; я же их просто визуализую. Сразу предупрежу, что пунктирные линии - это не более чем для обозначения соответствия точек; никаких изменений вдоль линий не происходило.
dynamics
По горизонтальной оси - время от закрытия участков. Как видно, первое обновление с 3.5% голосов прошло уже через 2.5 часа, и именно из этих данных появилась явка в 35%, собянинский результат в 56%, и навальновский в 23%. Еще через 2.5 часа последовало следующее обновление, где учитывались 32% голосов и явка уже стала 32.4%, Собянин набрал 52.7%, а Навальный - 26.2%. Это вполне объяснимо, поскольку первыми отрапортовались всякие полузакрытые учреждения, которые традиционно голосуют за власть. Следующее обновление следует через 2 часа, учитывает 70% голосов и изменяет результаты кандидатов на 1% в те же стороны.

А потом следует пауза на 8 часов, после которой публикуются официальные данные, которые меняют результаты на какие-то вшивые две десятых процента.

Интересно, зачем была нужна эта пауза, и что в ее течении происходило.

Понятно, что вы мне сейчас скажете, что по мере увеличения выборки среднее стремится в его истинному значению, и, понятно, что я соглашусь, что именно так и должно быть. Вот только стремится-то оно не случайным, а вполне закономерным образом. Мой опыт работы с молекулярными системами говорит мне, что должен быть систематический процесс, который изменяет среднее по мере накопления статистики. Что будет аналогом подобного процесса в этом случае? Начальное сильно-нерепрезентативное отклонение?

Ну и в качестве бонуса -- те же данные, только вид сбоку: результат кандидатов как функция от доли посчитанных голосов:
dynamics1

UPD Прозорливый barouh предложил, а любезный
shipilev посчитал разницу между результатами дампов данных, т.е. какой именно результат получен в выборке с, например, 5:00 до 6:30. Таким образом, удалось избавится от эффекта памяти, т.е. когда предыдущая (особенно первая) точка влияет на последующие результаты. Новые точки показаны открытыми кружочками, и таки да, я готов, наверное, согласиться, что разброс точек вокруг среднего значения более-менее случаен (точнее, я не возьмусь доказать, что отклонения выпадают из случайного тренда за исключением первой точки, которую уже обсудили).

Но тут возникает вот какой забавный сценарий. Посмотрите на Собянинские результаты с точки зрения избиркома: за четыре первых же часа каждые 10% посчитанных данных понижают результат Собянина на 1%! И таким жизнерадостным образом тренд доезжает до 50.3%, а впереди еще 35% необработанных данных, т.е. верных минус 3%. На горизонте уже маячат 47% за Собянина... вот чтоб бы сделали в такой ситуации? правильно, приостановили бы разглашение новых данных, пока сами не убедитесь в переломе тренда. Даже наплевав на все обещания сообщить результаты уже в день выборов. Страшно же!

Не, anderson_mike - это голова. Не догнали, так хоть согрелись!

UPD2 По просьбе afrikanbo (который "диссеррубка") добавил остальных кандидатов. Ну, у них первая же выборка попала в цель, что говорит о том, что они никому неинтересны ... а о чем это говорит?
Subscribe
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 86 comments