Maxim Pshenichnikov - Любителям статистики 3
[Recent Entries][Archive][Friends][User Info]
07:22 pm
[Link] |
Любителям статистики 3 Глубокоуважемый podmoskovnik посчитал всех-всех-всех. Вот гистограмма распределения участков по количеству зарегистрирванных избирателей:

Как видно, распределение довольно причудливое. Полезность диаграммы заключается в том, что она показывает пик на 150 человеках. Общее количество УИКий с народонаселением меньше 300 человек - примерно четверть от общего числа. Такие маленькие участки дают, например, высокую явку. Поэтому интерпретация любых распределений, в которых участвует количество УИКий, должна быть очень осторожной.
UPD (24.01.2008): В комментариях меня попросили сфитить гистограмму нормальными распределениями. Результат показан желтыми кривыми (сумма - синей кривой). Поскольку правое крыло явно не получилось, гауссов надо было брать 5 -- тогда бы произошло расщепление правого гаусса на два. Что все это означает - я не знаю. Но я честно об этом предупреждал!
|
|
| |
Очень странное распределение.
Рапределение имеет право быть любым!
Да, но при таком объеме данных логично, чтобы вылез какой-то предельный закон. Нормальный, логнормальный, степенной... А тут не пойми что. Даже смесью нормальных, думаю, плохо приблизится.
Как было - так и ляпали: страна-то большая. Вон, даже в Москве есть новые УИКии с заполняемостью в 100-200 человек.
А еще есть УИКи с нулевым количеством избирателей!
По хоже на сумму трёх (или более) независимых распределений. Не пробовали поискать кластеры?
Да можно. А смысл? все равно понадобятся нуль-гипотезы, которых я активно хочу избежать.
Я незнаю что вы подразумеваете под нуль гипотезой, но подозреваю, это угадывание вида распределения. Сомневаюсь, что оно отлично от нормального.
Нуль-гипотеза - это сколько всего кластеров. Ну, опишу я все это дело четырмя гауссами - дальше что? Почему именно четыре? что означают их позиции? их ширины?
Сделал и обновил картингу. |
|