Maxim Pshenichnikov (oude_rus) wrote,
Maxim Pshenichnikov
oude_rus

Category:

Любителям статистики 4

Глубокоуважаемый [info]podmoskovnik опубликовал забавный график, из которого следует, что бог любит троицу цифру пять. Я его, во-первых, пересчитал с более мелким шагом, а, во-вторых, применил к нему методы спектроскопического анализа. Вот что получилось.

(кликабельно)


Верхний график - гистограмма распределения явки по количеству УИКий. (Вертикальная ось сильно подрезана: максимум 4788 приходится на 100%). На всякий случай, я сделал гауссовый фит на левую половину до максимума и дорисовал его справа (зеленый пунктир). На спадающей стороне явно виден какие-то флуктуации. Однако, поскольку флуктуации происходят на довольно приличном фоне, они не слишком заметны. Тут нам на помощь приходит спектроскопия, которая постоянно сталкивается с обнаружением слабых линий на фоне засветки. Рецепт известен: надо взять производную. Тогда фон, который меняется медленно, даст некий более-менее постоянный уровень, а узкие линии дадут резкие всплески. 

Именно это и проделано на графике нумер 2 (красная кривая). Теперь видите всплески? вот это и есть наши флуктуации, выделенные из фона. И чё это они происходят на 60-70-80-90% явки, не знаете? 

Но теперь мы можем пойти дальше и вычесть медленно меняющийся фон. Как это конкретно сделать, неважо; я, например, сделал честный фит всего-всего восемью гауссами, а потом оставил фоновый (синяя кривая). Теперь из красного вычитаем синий и избавляемся от фона. А теперь интегрируем, т.е. проделываем операцию, противоположную первому шагу - дифференцированию. То есть, не произведи мы вычитание фона, мы должны были бы получить ровно то, с чего начали -- т.е. верхний график (и мы его получили бы, я проверял), но мы хитрые: мы предварительно убили фон. Я начал обратное интегрирование с 55%, поскольку до этого особенностей не было -- именно поэтому до 55% сплошной ноль.

Результат показан на нижнем графике: шаги теперь видны совершенно явно. Интересно, что к уже полученным 10%-шагам явно добавились промежуточные 5%. Амплитуда у них, конечно, поменьше, но за вычетом фона они стали совершенно явными.

UPD: В комментариях меня поправили, что распределение НЕ должно быть гауссовым, как показано зеленым пунктиром на верхнем графике. Полностью согласен: не должно.

Все это мне напоминает движение кинезина по микротубуле  альпиниста: сделал шаг - четыре вдоха - а на пять следующий шаг... Г-н Ч. случайно не альпинист?

Subscribe
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 89 comments