December 12th, 2011

"Ничё, Михалыч, и так посрёшь!"

Для отставки Волшебника совсем необязательны аргументы уголовно-статистической природы. Как и любая бизнес-контора, ведомство Волшебника должно не только производить товар, но и доходчиво объяснять потребителю, что товар этот хорош и весьма. Иногда это сделать легко -- качество товара говорит само за себя, иногда - сложнее, и тогда аргументы с голыми девками под названием "реклама" могут сильно помочь (впрочем, ненадолго). Тем не менее, если реакция потребителая на выставление товара лицом -- "нас всех тошнит", то верховный менеджер в любой конторе отправляется директоратом в отставку независимо от объективного качества товара. Ничего личного, только бизнес.

Другой вопрос, что, судя по текущим событиям, реакция потребителя не очень принимается во внимание директоратом. По этому поводу я вспомнил такую историю. Когда в 80е мои родители строили дачу в Балабаново, местная бригада халтурщиков соорудила в том числе сортир. На замечание моего отца по приемке товара, что, дескать, как же так -- в сортире сплошные щели и вообще он весь светится насквозь, бригадир неунывающе ответил: "Ничё, Михалыч, и так посрёшь!"

И еще раз о пятипроцентных пиках

Erratum в Physical Review Letters: "В оценках, проведенных в статье, вместо скорости света c=3x10^10 см/с была  использована постоянная Планка h=6.6x10^-34 Дж/с. Несмотря на эту досадную оплошность, основные выводы остаются без изменений"
-- Из физического фольклера
__________________________________________

Многие пики неизвестной природы на кратных пяти процентах, появляющиеся на известной гистограмме, уже были отслежены взад к источникам: здесь, здесь, здесь, здесь,
http://img805.imageshack.us/img805/7730/bashsverdtyum.gif,
http://z-city.ru/forum/viewtopic.php?f=106&t=9063 (это форум, там картинки искать надо),
и наверное еще где-то, я уже и не уследил. Тем не менее, их проявление на общем распределении (т.е. без отслежиавания источника) в принципе может объяснятся эффектом деления целых чисел, поскольку на голосования ходят целые люди, а не два землекопа и две трети. На что мне было многократно указано, да я и сам это знал.


Collapse )

Выводы:
0. Бди!
1. "Есть пики, которые можно объяснить квантизацией (наиболее яркий - при 50%), они однобиновые, видны во всех распределениях, хорошо моделируются и исчезают при отбрасывании УИК с малым числом проголосовавших." (СХ)
2. "Есть пики, которые моделью не описываются и с увеличением статистики не сглаживаются. Они локализуются на большИх nvot/ntot, и наиболее заметный из них - на 75%". Кстати, пик на 50% тоже остается, только выглядит он по-другому: как довольно резкое увеличение и затем плавная релаксация.
3. Размер бина должен выбираться очень аккуратно: на маленьких бинах наверняка полезет описанный эффект, на больших - сгладятся пики.

Дополнение:
1. Пока мы с Сашей пили шампанское и ели зернистую икру неторопясь отлаживали модель,  в интернетах появилось довольно много подобных расчетов с подобными же выводами.
http://jemmybutton.livejournal.com/1359.html
http://singpost.livejournal.com/11326.html
http://users.livejournal.com/_winnie/327776.html
Так что, с моей точки зрения, консенсус достигнут. Если кого забыл, бросайте ссылку, обязательно включу.

2. Более того, хитрый jemmybutton (всячески рекомендую) предложил метод, которым можно легко проверить, насколько пики имеют квантовую природу. Я только потом вспомнил, что подобный метод используется в цифровых обработках сигнала. Но не суть. А не менее хитрый kobak (всячески рекомендую) этот метод проверил. Выводы точно такие же, что радует.

2а. dabino решил проблему квантанизации еще более остроумно: он стал откладывать не количество УИК, а количество избирателей. Сходите, посмотрите, очень занятно.

3. Обязательно подпишитесь вот на эту запись  у kobak. Она постоянно апдейтится и уже служит центром сбора информации по статистике.

4. Вот здесь  gegmopo4 независимо переделал наши с Сашей симуляции, но пошел дальше: оценили вероятность подобных выбросов для некоррелированного голосования:
Для нормально распределённой (да, да, Гаусс) величины вероятность выбиться в ту или другую сторону от среднего за пределы сигмы — около 1/3, за пределы двух сигм — менее 5%, за три сигмы выходит только каждый 400-й, за четыре — 16000-й, за пять — менее, чем один из 1.7 миллиона, за шесть — из полмиллиарда. ... Пик на 75% достигает девятки сигм, на 85% и 95% выходят за шесть.