?

Log in

No account? Create an account
Любителям статистики 4 - Maxim Pshenichnikov
January 18th, 2008
09:22 pm

[Link]

Previous Entry Share Next Entry
Любителям статистики 4

Глубокоуважаемый [info]podmoskovnik опубликовал забавный график, из которого следует, что бог любит троицу цифру пять. Я его, во-первых, пересчитал с более мелким шагом, а, во-вторых, применил к нему методы спектроскопического анализа. Вот что получилось.

(кликабельно)


Верхний график - гистограмма распределения явки по количеству УИКий. (Вертикальная ось сильно подрезана: максимум 4788 приходится на 100%). На всякий случай, я сделал гауссовый фит на левую половину до максимума и дорисовал его справа (зеленый пунктир). На спадающей стороне явно виден какие-то флуктуации. Однако, поскольку флуктуации происходят на довольно приличном фоне, они не слишком заметны. Тут нам на помощь приходит спектроскопия, которая постоянно сталкивается с обнаружением слабых линий на фоне засветки. Рецепт известен: надо взять производную. Тогда фон, который меняется медленно, даст некий более-менее постоянный уровень, а узкие линии дадут резкие всплески. 

Именно это и проделано на графике нумер 2 (красная кривая). Теперь видите всплески? вот это и есть наши флуктуации, выделенные из фона. И чё это они происходят на 60-70-80-90% явки, не знаете? 

Но теперь мы можем пойти дальше и вычесть медленно меняющийся фон. Как это конкретно сделать, неважо; я, например, сделал честный фит всего-всего восемью гауссами, а потом оставил фоновый (синяя кривая). Теперь из красного вычитаем синий и избавляемся от фона. А теперь интегрируем, т.е. проделываем операцию, противоположную первому шагу - дифференцированию. То есть, не произведи мы вычитание фона, мы должны были бы получить ровно то, с чего начали -- т.е. верхний график (и мы его получили бы, я проверял), но мы хитрые: мы предварительно убили фон. Я начал обратное интегрирование с 55%, поскольку до этого особенностей не было -- именно поэтому до 55% сплошной ноль.

Результат показан на нижнем графике: шаги теперь видны совершенно явно. Интересно, что к уже полученным 10%-шагам явно добавились промежуточные 5%. Амплитуда у них, конечно, поменьше, но за вычетом фона они стали совершенно явными.

UPD: В комментариях меня поправили, что распределение НЕ должно быть гауссовым, как показано зеленым пунктиром на верхнем графике. Полностью согласен: не должно.

Все это мне напоминает движение кинезина по микротубуле  альпиниста: сделал шаг - четыре вдоха - а на пять следующий шаг... Г-н Ч. случайно не альпинист?

(90 comments | Leave a comment)

Comments
 
Page 1 of 3
<<[1] [2] [3] >>
[User Picture]
From:vba_
Date:January 18th, 2008 09:26 pm (UTC)
(Link)
Вот такие умники не дают жить нашему народу. Скажу одно:

Ну-ка, враг, ты нас лучше не трогай,
Не волнуйся у наших ворот!
А не то станет грозный и строгий
Наш хозяин -Советский народ!

Мы сами у себя разберемся с дифиринцированием.
[User Picture]
From:oude_rus
Date:January 18th, 2008 09:32 pm (UTC)
(Link)
Нашему народу мое диффиринцирование глубоко пофигу!
(Deleted comment)
[User Picture]
From:oude_rus
Date:January 19th, 2008 01:40 pm (UTC)
(Link)
Вы знали, вы знали!
[User Picture]
From:ammosov
Date:January 19th, 2008 04:30 pm (UTC)
(Link)
Максима, а почему до 30% - НОЛЬ ?
[User Picture]
From:oude_rus
Date:January 19th, 2008 05:28 pm (UTC)
(Link)
Вопрос правильный, мне следовало бы указать. Я начал обратное интегрирование с 55%, поскольку до этого особенностей не было.
[User Picture]
From:andrewjazz
Date:January 19th, 2008 07:27 pm (UTC)
(Link)
оч занятно!
математическое доказательство бытия Путена
[User Picture]
From:thelof
Date:January 19th, 2008 08:59 pm (UTC)
(Link)
Очень убедительно!

Вот у меня, у конченного троечника, возник только один вариант объяснения. Что в стране есть масса микроучастков, в которых число зарегистрированных избирателей каким-то хитрым образом доведено строго до 10 или 20. Вероятность этого кажется минимальной.
From:ex_lzhl
Date:January 20th, 2008 01:56 am (UTC)
(Link)
http://www.vybory.izbirkom.ru/region... — в конце списка много участков с числов зарегистрированных избирателей 10—11 человек. Это около трети всех участков ТИКа.
[User Picture]
From:sergey_shulgin
Date:January 19th, 2008 10:33 pm (UTC)
(Link)
прикольный график! пики на числах кратных 10% это просто улёт :)

Вы правы в своих комментариях, что "серой массе людей" ("толпе") нет никакого дела до подобных картинок

а думающим людям довольно прозрачна природа таких пиков и их происхождение.

From:topbot31
Date:January 19th, 2008 10:50 pm (UTC)
(Link)
Вы попали в top30 на яндексе самых обсуждаемых тем в блогосфере. Поэтому копия вашего поста доступна в ленте по ссылке
Почитать текст со всеми комментариями можно тут
Это Ваш 2-й ТОПовый пост за последний год. Посмотреть статистику автора можно тут.
Этот "бот не имеет отношения к Яндексу" © НадежныйИсточник
[User Picture]
From:podmoskovnik
Date:January 19th, 2008 11:54 pm (UTC)
(Link)
Отлично! А г-н Чуров - как и некоторые другие :) - физик, и это говорит о многом. Суровая школа физпрактикума даром не проходит.
[User Picture]
From:oude_rus
Date:January 20th, 2008 08:51 am (UTC)

Все кредиты отходят к Вам

(Link)
Я стою на плечах титанов!
From:(Anonymous)
Date:January 20th, 2008 01:05 am (UTC)
(Link)
Тут нам на помощь приходит спектроскопия, которая постоянно сталкивается с обнаружением слабых линий на фоне засветки. Рецепт известен: надо взять производную. Тогда фон, который меняется медленно, даст некий более-менее постоянный уровень, а узкие линии дадут резкие всплески.

Именно это и проделано на графике нумер 2 (красная кривая). Теперь видите всплески? вот это и есть наши флуктуации, выделенные из фона. И чё это они происходят на 60-70-80-90% явки, не знаете?

Но теперь мы можем пойти дальше и вычесть медленно меняющийся фон. Как это конкретно сделать, неважо; я, например, сделал честный фит всего-всего восемью гауссами, а потом оставил фоновый (синяя кривая





Что можно почитать человек с мехматовоской подготовкой чтоы в этом разбираться
[User Picture]
From:oude_rus
Date:January 20th, 2008 08:53 am (UTC)
(Link)
Я даже не знаю... по-моему, это все совершенно очевидно и даже сильно тривиально.

Или разговор идет про фиты? тигда, видимо, "Численные методы и программирование на С" (по-моему, так называется). И вообще полезная книжка.
[User Picture]
From:katsumizer
Date:January 20th, 2008 04:18 am (UTC)
(Link)
Просто и изящно. Единственный закон, на который нам остается уповать - закон больших чисел.
[User Picture]
From:vlkamov
Date:January 20th, 2008 06:23 am (UTC)
(Link)
> Г-н Ч. случайно не альпинист?

Борода мешает, четырех вдоха - на пятый отплевывается и опять. Обещал сбрить если что...

(Deleted comment)
[User Picture]
From:oude_rus
Date:January 20th, 2008 08:54 am (UTC)
(Link)
Прошу прощения, но я ничего не проверяю. Скорее, я играюсь с числами.
(Deleted comment)
(Deleted comment)
[User Picture]
From:k_s_b
Date:January 20th, 2008 10:06 am (UTC)
(Link)
красивые картинки :)
Самое смешное, что примерно 50%, проголосовавших по-честному "ЗА" ЕР - это ничего не скажет.
А подгонка результатов... Вы лабораторные работы в институте делали? ;)
Вот именно. Тупые студенты всегда подгоняют график "под то, как должно быть", а умные - "под примерно так могло получиться на этих приборах"...
Расстраивает не столько вброс "ЗА" кого-то, а то, что пики "как должно быть" очень выражены...
From:supdelicious
Date:January 20th, 2008 10:46 am (UTC)
(Link)
From:(Anonymous)
Date:January 20th, 2008 11:17 am (UTC)

Вопрос от человека с улицы.

(Link)
А можно какими-либо именно статистическими методами сделать следующий анализ. Какими были бы результаты выборов, если бы этих факторов, обусловивших пики, не существовало?
[User Picture]
From:oude_rus
Date:January 20th, 2008 11:45 am (UTC)

Re: Вопрос от человека с улицы.

(Link)
Дык это же на графике показано: 1200 УИКий из чуть менее 100000, т.е. около 1%.

Сразу подчеркну, что пик на 100% я анализировать отказываюсь.
Powered by LiveJournal.com