?

Log in

No account? Create an account
Мастеръ Гамбсъ этимъ полукресломъ заканчиваетъ новую партiю мебели - Maxim Pshenichnikov — LiveJournal
February 8th, 2012
09:28 am

[Link]

Previous Entry Share Next Entry
Мастеръ Гамбсъ этимъ полукресломъ заканчиваетъ новую партiю мебели

(92 comments | Leave a comment)

Comments
 
[User Picture]
From:oude_rus
Date:February 12th, 2012 09:30 pm (UTC)
(Link)
так вопрос теперь вот какой: как так получается, что зависимость почти линейная до 1000, достигает максимума про 1500, а потом убывает?

Неужели есть такой фундаментальный закон, который говорит, что больше 24 недействительных на участок в приподе не бывает? как это все объяснить-то?
From:a_kruglov
Date:February 13th, 2012 12:09 am (UTC)
(Link)
Нет такого закона. Если у всех вероятность ошибиться одинаковая, должна быть (с точностью до статистического шума) прямая Np, которая там и нарисавана для p=1,65%. Для ожного человека матожидание испорченных бюллетеней p, значит для N человек матожидание Np. Что кривая заваливается вниз означает, что на больших участках на человека в среднем приходится меньше ошибок по какой-то причине. Некоторые возможные объяснения я привёл.

При совсем высоких явках там просто участков в некоторых бинах нет, это отображается как 0, хотя на самом деле там просто нет данных. Ну и шум возрастает, если участков в бине мало.
[User Picture]
From:oude_rus
Date:February 13th, 2012 11:34 pm (UTC)
(Link)
кстати, идея восстанавливать реальную явку из кол-ва недействительных -- это очень неплохая идея.

еще было бы интересно посмотреть аналогичные распределения при < и >40% за любимую партию.
[User Picture]
From:oude_rus
Date:February 15th, 2012 07:47 pm (UTC)
(Link)
А я, кстати, посмотрел. Результат вполне предсказуем.
From:a_kruglov
Date:February 16th, 2012 10:33 pm (UTC)
(Link)
Я тоже посмотрел. Вот картинка, если интересно сравнить:



Бины по 25. Первая и вторая кривая -- среднее число недействительных по участкам в бине с ЕР>=40% и ЕР<40%. Третья -- p=1,65% для сравнения. Четвёртая -- ЕР<40% с бином 200, чтобы уменьшить шум. Видно, что она соответствует p~=1,80% до N=2000. На самом деле дальше она идёт до N=2600 с отклонением около 3σ, что тоже большое, но не прямо вот гигантское отклонение (если взять для одного участка σ~=6,4Np). Коэффициент 6,4 -- во столько раз реальная σ превышает Np в среднем в данных. Участков с N>2200 и ЕР<40% всего 14, а с 2000<=N<2200 и ЕР<40% -- 25. Т.е., их очень мало, и, возможно, это какой-то особый класс участков. Так что сделать из сравнения кривых в области N>2000 какие-то выводы сложно.

PS: Забыл ещё написать. Все кривые -- это среднее превышение над числом недействительных 1. Участки с 0 недействительных вообще нигде тут не учитывались.

Edited at 2012-02-16 10:36 pm (UTC)
[User Picture]
From:oude_rus
Date:February 24th, 2012 01:51 pm (UTC)
(Link)
был уверен, что ответил, но то ли показалось, то ли ответ сожрался.

да, именно так и у меня получилось.
Powered by LiveJournal.com