?

Log in

No account? Create an account
Сделал двумерные картинки по лидеру и совокупному не-лидеру (т.е.… - Maxim Pshenichnikov — LiveJournal
December 28th, 2012
05:14 pm

[Link]

Previous Entry Share Next Entry
Сделал двумерные картинки по лидеру и совокупному не-лидеру(т.е. суммируются голоса за всех кандидатов, кроме лидера).
2D
Посчитал корреляцию (по Пирсону) по годам:

pearson
Слегка неожиданно то, что корееляция практически не менялась с 2003го (среднее 0.71, sd 0.007); корреляция не-лидера уменьшалась более постепенно.

Поскольку Пирсон дает среднее по палате, а тренд явно бимодальный, то посчитал средний процент для каждой явки, и сфитил получившиеся кривые функцией, состоящей из двух прямых, точка пересечения которых находится из наилучшего фита. Фит местами так себе, но дает четкую разбивку на два видных на картинке тренда: при малых и больших явках. Далее построил коэффициенты (т.е. наклон) прямых для обеих явок:
coef1
coef2
Коэффициент лидера для больших явок болтается около единицы независимо от года, создавая карайне выгодную ситуацию для лидера: больше явка - больше голосов. Для не-лидера этот коэффициент всегда отрицателен. Коэффициент же для малых явок меняет знак: так, например, небольшая положительная корреляция с явкой сменяется на отрицательную в 2012. Для не-лидера ситуация, понятно, ровно обратная -- но потом, напомню, все равно происходит перелом в пользу лидера.

Если смотреть по годам, то подобный анализ не дает никаких пороговых эффектов, хотя зрительно на двумерных картинках они вроде как видны по кометному хвосту. Непонятно только, как это дело охарактеризовать. Я пробовал смотреть по доле голосов после точки перегиба, но ничего интересного не нашел:
share

(38 comments | Leave a comment)

Comments
 
[User Picture]
From:nonenoun
Date:December 28th, 2012 05:30 pm (UTC)
(Link)
Любопытно было бы измерить, какая часть голосов приходится на плоскую часть тренда (для которой не прослеживается существенная корреляция). Поскольку приведённые столбчатые диаграммы не различают совершенно разные случаи 2000 и 2011 гг.
[User Picture]
From:barouh
Date:December 28th, 2012 06:03 pm (UTC)
(Link)
Слова хозяина дневника - "Я пробовал смотреть по доле голосов после точки перегиба" - кажется говоря о том же самом
[User Picture]
From:nonenoun
Date:December 28th, 2012 06:16 pm (UTC)
(Link)
Ну да, но на числа глянуть было бы интересно. Всё-таки интуитивно там должна быть зарыта достаточно важная информация.
[User Picture]
From:barouh
Date:December 28th, 2012 06:06 pm (UTC)
(Link)
Я не очень понимаю, как сравнение по доле голосов после точки перегиба может быть неинтересным - если так сильно плавает точка перегиба (с каждыми выборами она все раньше, и только в 2012-м небольшой откат), то и "вес" второй линии должен сильно варьироваться
Впрочем, миграция самой точки перегиба ИМХО даже интереснее

А еще один любопытный параметр, который хочется понимать - это r-квадрат для каждой из двух половинок фита. 2001-ый как раз поражает почти идеальной корреляцией после точки перегиба
[User Picture]
From:oude_rus
Date:December 29th, 2012 07:53 pm (UTC)
(Link)
добавил.

ре-квадрат считать там, по-моему, бессмысленно, поскольку модель весьма груба.
[User Picture]
From:barouh
Date:December 28th, 2012 06:09 pm (UTC)
(Link)
Ой, а как это получается, что у Путина в 2000 - четких 2 кластера, а у суммарной оппозиции - одно единое облако? Там нет ошибок в массиве данных, везде сумма по кандидатам (+против всех) равна 100%?
[User Picture]
From:oude_rus
Date:December 29th, 2012 10:56 am (UTC)
(Link)
аппазиция выела среднюю часть!
[User Picture]
From:barouh
Date:December 30th, 2012 04:39 pm (UTC)
(Link)
А если серьезно? Ведь сумма Пу и не-Пу близка к единице, и если у Пу 2 кластера, то и у не-Пу должно быть 2 зеркальных кластера - или же у голосований против всех и недействительных должно быть два очень далеко отстоящих друг от друга кластера
[User Picture]
From:nonenoun
Date:December 30th, 2012 05:32 pm (UTC)
(Link)
Возможно, сказывается особая шкала heatmap, используемая oude_rus - центральная (зелёная) часть очень широкая и поэтому второй кластер не проявляется. Можно заметить, что второй кластер Путина очень маленький - и у оппозиции он исчезает.
[User Picture]
From:kobak
Date:December 28th, 2012 08:10 pm (UTC)
(Link)
Надо бы еще коэф корреляции для каждого года посчитать (это гораздо проще, чем то, что ты тут начал делать), для порядку.
[User Picture]
From:oude_rus
Date:December 29th, 2012 10:56 am (UTC)
(Link)
сделал.
[User Picture]
From:kobak
Date:December 29th, 2012 07:27 pm (UTC)
(Link)
Я тоже сделал. По Спирману получаются более "ожидаемые" результаты (фиг знает почему) + я еще придумал посчитать ту же корреляцию без 9 республик, и показываю таким образом на диаграмме "добавочный вклад" 9 республик в корреляцию.

corrEvolution
[User Picture]
From:oude_rus
Date:December 29th, 2012 07:48 pm (UTC)
(Link)
вообще странно, что такое большое отличие в 2000 и 2003.
[User Picture]
From:kobak
Date:December 29th, 2012 07:41 pm (UTC)
(Link)
Вот можно даже так:

corrEvolution

Насколько это полезное представление, не знаю (но я хотел единообразность придать). Может, посчитать еще долю голосов в правом верхнем углу? Типа за 90, 90.
[User Picture]
From:oude_rus
Date:December 29th, 2012 07:44 pm (UTC)
(Link)
тут получается немного неясно, поскольку то ли синий с зеленым аддитивен, то ли нет.
я эту проблему решил путем варьирования ширины столбца: если одинаков, то аддитивен, если нет -- то нет (получается один столбец внутри другого).

посчитать 90х90 - это отличная идея, я тебя как раз хотел попросить. Так же как и раньше, ладно, с разбиением на 9 и остальных.

Edited at 2012-12-29 07:45 pm (UTC)
Powered by LiveJournal.com