?

Log in

No account? Create an account
Maxim Pshenichnikov
March 17th, 2013
02:38 pm

[Link]

Previous Entry Share Next Entry
Про метод Сулакшина
Я решил повторить выкладки Сулашкина, только откладывая по оси Y количество голосов за ЕР.Получился вот такой мегаграфик:
size

Потом я тупо сфитил левые крылья гауссами и отложил среднее и дисперсию:

size1
Точки произвольно сфитил еще одним гауссом с максимумом в нуле. Как и следовало ожидать, на маленьких участках за ЕР голосуют более, на больших - менее.

Но вот сами распределения довольно интересные. Вроде бы, если брать большие участки с количеством избирателей в пределах плюс-минус 100, то они расположены в основном в городах с относительно ровными пристрастиями, то есть ожидаемо иметь квази-гаусс, но никак не плато, а то и второй максимум. Тем не менее, имеем что имеем, с пиками на красивых процентах (как же без них).

Для сравнения нарисовал пару распределений для 2003 (точечки). На маленьких участках распределение попрежнему широкое, хотя его максимум сдвинулся с 57% на 41%, и почти пропало возрастание на высоких процентах. А вот на больших участках распределение стало гораздо более вменяемо. Нет, не Гаусс, но довольно близко -- и горизонтальная часть пропала. Это распределение-2003 я поделил на 2, а то оно не влезало: если пропадает горизонтальная часть, то гауссовая должна усилиться.

Ну и вопрос: каким же образом разброс максимума распределения результатов голосования по участкам разного размера изменился с 2003 по 2011 год с 10% до 32%, т.е. втрое?
Так что может в подходе Сулакшина что-то и есть. Что никакими 22% за ЕР здесь и не пахнет, это и так было понятно, и обсуждать тут нечего.


This entry was originally posted at http://oude-rus.dreamwidth.org/666394.html. Please comment there using OpenID or your current LJ account.

(23 comments | Leave a comment)

Comments
 
From:a_kruglov
Date:March 17th, 2013 05:27 pm (UTC)
(Link)
(Чёртов Firefox умер и утащил с собой первую инкарнацию комментария.)

Я понял метод Слукашина так. Он неявно, в том числе и для себя, предполагает, что наброс явки и за ЕР в виде числа голосов статичтически независим от рамера участка. Т.е. что на всех участках наброс в виде числа голосов был одинаковый. И ещё предполагает, что проценты партий не зависят от размера участка. Из этого получается, что данные надо фитить именно гиперболами, и честные проценты партий будут асимптотами гипербол.

Его модель, конечно, неправильная, потому что нет оснований считать, что на больших участках наброс в виде числа голосов такой же, как на мелких. Зато есть основания считать, что они будут разные. Я уж не говорю о том, что он фитит не матожидания, а наиболее вероятные (частые) значения, которые не аддитивны при сложении случайных величин. Ещё непонятно зачем он дублирует борьбу в набросами, сначала беря максимум распределения вместо среднего (т.е. отбрасывая правое крыло), а потом ещё своими гиперболами. Если действовать последовательно, надо было выбрать что-то одно.
[User Picture]
From:oude_rus
Date:March 17th, 2013 07:18 pm (UTC)
(Link)
его модель, как он объясняет, это
1. голосование независимо от размера участка
2. на больших участках голосование честнее, поскольку закон больших чисел.

фитит он не гиперболами, а "степенными" функциями, причем параметры - чтобы определить, гипербола ли это - он не приводит. А когда гипербола не нравится, фитится полиномом.
From:a_kruglov
Date:March 17th, 2013 05:32 pm (UTC)
(Link)
> Потом я тупо сфитил левые крылья гауссами и отложил среднее и дисперсию:

А как определяли левые крылья? На 1200-1399 совсем не выглядит как фит левого крыла, если понимать под этим левее максимума, например.
[User Picture]
From:oude_rus
Date:March 17th, 2013 07:19 pm (UTC)
(Link)
на глаз, если честно.
более формализованно - брал правый предел около верхушки, плюс сажал оффсет на ноль (это естественно).
[User Picture]
From:tsirel
Date:March 17th, 2013 07:56 pm (UTC)
(Link)
1. У меня ощущение, что более адекватным было бы какое-то асимметричное распределение, например, логнормальное.
2. Для малых сельских участков трудно разделить усиление административного нажима и прямых фальсификаций. самый надежный источник данных - КОИБы, но хватит таких участков для оценки распределений по всей стране?
[User Picture]
From:oude_rus
Date:March 17th, 2013 08:16 pm (UTC)
(Link)
1. по-моему, это уже крохоборство: никакой логнорм не даст полочку.
2. сходу не скажу.
[User Picture]
From:tsirel
Date:March 17th, 2013 08:38 pm (UTC)
(Link)
1. речь не о полочке (ее происхождение, скорее всего, неестественное), а правом крыле - что-то такое в нем проглядывает
[User Picture]
From:oude_rus
Date:March 17th, 2013 08:57 pm (UTC)
(Link)
в правом крыле, кроме полочки, ничего не проглядывает!

но я понимаю, о чем вы: левый распределений немного круче, чем гаусс.

upd сделал некоторые фиты логнормом -- так, конечно, гораздо круче.

Edited at 2013-03-17 09:26 pm (UTC)
[User Picture]
From:seyachaspomru
Date:March 18th, 2013 06:55 am (UTC)
(Link)
Ничего не понял.
[User Picture]
From:barouh
Date:March 18th, 2013 07:31 am (UTC)
(Link)
Не понял фразу про рост разброса максимума с 10% до 32%. Можете пояснить для непонятливых?
[User Picture]
From:oude_rus
Date:March 18th, 2013 08:04 am (UTC)
(Link)
на нижнем графике разброс между маленькими и большими участками получается в 10% в 2003 и 32% в 2011.
[User Picture]
From:barouh
Date:March 18th, 2013 08:29 am (UTC)
(Link)
А, ну это на мой взгляд неудивительно. Влияние разной скорости или разных фаз изменений электоральных настроений. В городах: относительно высокая поддержка Ельцина -> вакуум в настроениях в конце 90-х -> быстрое принятие Путина -> нарастающее разочарование Путиным. На селе: поддержка коммунистов -> постепенное принятие Путина под воздействием зомбоящика и естественного вымирания старших поколений, и следующий этап еще практически не начался

Иными словами, для Ельцина этот график шел бы по нарастающей. Для раннего Путина и ранней ЕР он был почти плоским. Теперь он сильно просел в правой части
[User Picture]
From:oude_rus
Date:March 18th, 2013 08:39 am (UTC)
(Link)
все бы ничего, но график НЕ просел в правой части (он изменился, согласно вашему объяснению, только на 2-3%), а возвысился в левой на 20%.
[User Picture]
From:barouh
Date:March 18th, 2013 09:19 am (UTC)
(Link)
В правой части график тоже менялся - в том смысле, что в 2007-м он вырос, а потом обратно просел и по совпадению оказался на том же уровне, что и в 2003-м (на самом деле ниже, чем в 2003-м - но фальсификации "подправили" картинку)

А в левой части и в 2007-м рост мог быть больше, и в 2011-м не было спада. Если помнить, что правая часть графика у нас гуляет вверх-вниз, то рост левой части и рост наклона уже не так удивляют
[User Picture]
From:jemmybutton
Date:March 18th, 2013 01:07 pm (UTC)
(Link)
С одной стороны, если тут количество голосов, то опять распределение будет всегда перекошено (на нуле процентов за ЕР по определению всегда ноль, а на 100 — нет) и это считать чем-то неестественным, наверное, неправильно.
С другой стороны, если предполагается, что правое плечо имеет какое-то неестественное происхождение, то это должно было отразиться на левом (оно должно было просесть и/или сдвинуться вправо, наверное)? Тогда надо оценку «истинного результата» ЕР еще занизить?
[User Picture]
From:oude_rus
Date:March 18th, 2013 01:23 pm (UTC)
(Link)
Какие люди!

"Результат ЕР достиг дна и продолжил движение вниз"
[User Picture]
From:jemmybutton
Date:March 18th, 2013 01:58 pm (UTC)
(Link)
Но правда, и то и то должно, по идее, влиять на положение максимума распределения.
А вообще вся эта история с докладом какая-то совсем неизящная.
Немного оффтопик: а Вы не знаете, где-нибудь существуют данные по переписанным протоколам с руэлект последние или канули?
From:a_kruglov
Date:March 18th, 2013 08:24 pm (UTC)
(Link)
> если предполагается, что правое плечо имеет какое-то неестественное происхождение, то это должно было отразиться на левом (оно должно было просесть и/или сдвинуться вправо, наверное)?

Если не предполагать заранее, что на участках с низким честным результатом ЕР больше фальсифицируют, такой вывод сделать нельзя. Потому что в противоположном случае (когда на участках с разными честными результатами ЕР фальсифицируют одинаково часто) левое плечо просядет везде одинаково, его форма при этом не изменится. Это если не учитывать те участки, которые после фальсификации опять попали на левое плечо -- для достаточно крупных фальсификаций этот эффект не должен быть сильным.

Т.е. я хочу сказать, что из того, что появилось правое плечо не следует, что левое должно исказить форму. Независимо от протяжённости правого плеча. Искажение формы левого плеча может возникнуть из-за того, что на участках с низким % за ЕР чаще фальсифицируют. Так ли это в реальности я не знаю, но пока склоняюсь, что скорее нет. Если бы это было так, я бы ожидал ступеней на круглых процентах на левом плече, а их не видно.

Или если на это посмотреть со стороны организации фальсификаций, то сложно представить, что желание УИК фальсифицировать может зависеть от результата ЕР в области левого плеча. Если уж решили фальсифицировать, натягивали бы независимо от того, 20% или 30% у ЕР.
[User Picture]
From:jemmybutton
Date:March 19th, 2013 06:47 am (UTC)
(Link)
Согласен, вероятность вмешательства в результат по идее может и не быть связана с результатом, но просядет-то плечо уж наверняка (пусть и равномерно). Но неизменность формы левого плеча, тем не менее, может быть обеспечена только если участки, куда что-то приписали всегда оказываются справа от максимума распределения, что совсем не обязательно так (вот, скажем, распределение объемов приписок за ЕР по протоколам с почившего руэлект http://jemmybutton.livejournal.com/pics/catalog/497/26642 , там видно что приписывают иногда даже совсем чуть-чуть). Ну и плюс, это в любом случае оказывает влияние на максимум распределения.
From:a_kruglov
Date:March 19th, 2013 07:57 am (UTC)
(Link)
С этим со всем я согласен. Я хотел привести аргументы, что изменение формы левого плеча, если оно есть, должно возникать не от выедания, а наоборот от добавления.

Для сдвига максимума от добавления широкого гаусса к исходному узкому я недавно получал выражение и оценивал: podmoskovnik.livejournal.com/163459.html?thread=1572739#t1572739 . Выражение работает, когда сдвиг оказывается меньше, чем ~0.7w -- потому что основано за замене x*exp(-x^2/2) на x, где x -- сдвиг в единицах w.

Про поводу распределения приписок за ЕР -- подозреваю, они должны неплохо коррелировать с результатом ЕР до приписок. Т.е. для низких сырых результатов ЕР эта гистограмма может оказаться сдвинутой дальше вправо.
[User Picture]
From:jemmybutton
Date:March 19th, 2013 08:14 am (UTC)
(Link)
Да, правда. При условии что выедают равномерно.
Я не очень понял откуда заранее известна доля участков, где какие-то чудеса происходили? Ну и вообще получается многовато допущений для точной оценки в любом случае.
Действительно, где меньше был исходный результат приписывали в среднем, кажется, больше (сейчас данные не под рукой, а готовой картинки нет, к сожалению). Но при этом все равно были участки где приписывали мало даже при маленьком результате (особенно с учетом того, что все регионы скопом взяты).
[User Picture]
From:barouh
Date:March 19th, 2013 08:45 am (UTC)
(Link)
При обсуждении зависимости уровня фальсификаций от реального уровня поддержки партии власти надо учитывать, что уровень фальсификаций выражается двумя отдельными параметрами: долей фальсифицированных участков и масштабом фальсификаций

Для масштаба фальсификаций в пределах одного города или одного ТИКа действительно скорее всего можно ожидать обратной зависимости от исходного результата: если партия вытягивается на определенный результат или просто результаты пишутся "с потолка", разница с реальными результатами окажется больше там, где партия власти менее популярна

Что же касается доли фальсифицируемых участков, то я не вижу оснований ожидать здесь обратную зависимость (и вообще какую-то явную зависимость) от электоральных предпочтений
[User Picture]
From:jemmybutton
Date:March 19th, 2013 09:12 am (UTC)
(Link)
Врать не буду, точно не помню, но, кажется, зависимость объема приписки в «подправленном» протоколе от результата в «сыром» была обратная. Хотя там выборка очень неравномерная и что-то определенное по ней трудно сказать. Если получится — проверю.
Доля фальсифицируемых участков в этом контексте нужна на входе для оценки смещения максимума распределения. А зависимость доли от электроальных предпочтений — это вообще непонятно как оценивать. По ТИКам? Или по регионам? Наверное, вообще особого смысла нет.
Powered by LiveJournal.com