January 18th, 2008

Любителям статистики 4

Глубокоуважаемый [info]podmoskovnik опубликовал забавный график, из которого следует, что бог любит троицу цифру пять. Я его, во-первых, пересчитал с более мелким шагом, а, во-вторых, применил к нему методы спектроскопического анализа. Вот что получилось.

Collapse )

Все это мне напоминает движение кинезина по микротубуле  альпиниста: сделал шаг - четыре вдоха - а на пять следующий шаг... Г-н Ч. случайно не альпинист?

Любителям статистики 5

По данным глубокоуважаемого podmoskovnikя построрил двуразмерные (2D, если по-простому) гистограммы распределения количества зарегистрированных избирателей в УИКи и явки на выборы:



Бины - 50 человек по оси икс и 2% по оси Ыгрэк.

Диграмма слева показывает... да я сам не понимаю, что она показывает. Если количество зарегистрированных избирателей в УИКи больше 1000, то антикорреляция с явкой есть, хотя и слабая (средняя явка около 55%). А вот в меньших УИКях средняя явка прыгает до 85%, плюс еще вполне видимый максимум на 100%.

Дополнительные диаграммы - это проекции (интегралы, marginals) 2D распределения на соответствующие оси. Они публиковались и раньше (см., например, podmoskovnik), но взаимная корреляция в них, разумеется, отсутствует.

Диаграмма справа - то же самое, только вид сбоку для количества УИКий. Поскольку их распределение по количеству зарегистрированных избирателей довольно нетривиально, то имеем то, что имеем. Точка 100% рулит!

Теперь возникает вопрос: а какой уклон какое представление лучше? Оба плохи. Зависит от того, что хочется подчеркнуть. Например, я убежден, что закон больших чисел надо демонстрировать на количестве УИКий. А вот для глобальных выводов количество избирателей все же предпочтительнее.