: построил график зависимости количества участков с нулевыми недействительными от количества проголосовавших на этом участке. Осторожно: вертикальный масштаб логарифмический.
Смотрим на коричневые точки. Сначала вроде все логично: количество участков возрастает, пока наконец вероятность получить ноль недействительных не максимизируется. Далее, когда количество проголосовавших становится слишком большим, вероятность идеального голосования резко уменьшается. Тоже логично. Нелогичность начинается чуть позже, когда при размере участка где-то в 700 человек скорость убывания резко падает. То есть численность голосующих увеличивается, а количество недействительных - практически нет. Дальше оно, конечно, снова падает, но это уже на совсем огромных участках, по полторы тысячи человек.
Теперь можно поразвлечься, опустит из рассмотрения т.н. "9 республик". И чудо -- зависимость резко меняется (черные точки). Во-первых, резко-убывающая часть становится значительно более линейной (т.е. экспоненциальной на линейной шкале). Во-вторых, хвостик по амплитуде уменьшается где-то раза в три. Но никуда не девается, нет. В-третьих, видно, что быстрый спад коричневого распределения тоже не совсем идеален, и отклонения начинаются где-то при 250 проголосовавших.
Дальше можно пририсовать распределение участков с одним недействительным бюллетенем. 9 республик лучше выкинуть, а то начальная часть тоже поедет. Зато в итоге образуется красивая кривуля (синяя), почти даже без хвостовых особенностей, хотя и не совсем без них. Ее максимум, кстати, достигается при бОльших значениях проголосовавших, что логично: для одного недействительного количество голосующих должно быть выше, чем для нуля недействительных.
Всю эту радость я описал биномиальным распределением (кто-нибудь мне объяснит, почему именно им?), точнее, даже суммой двух (сплошные линии). Откуда сразу же получается вероятность нуля недействительных как 1.4% (одного - 1.8%), что, видимо, представляет собой усредненный "технический" брак. {тут, конечно, надо было бы посмотреть на плотность состояний, но я поленился... пока} Зато вероятность брака на хвосте (если это вообще можно назвать браком) где-то на порядок меньше.
Мораль отсюда такова: при большом числе голосующих вероятность появления недейсвительных бюллетеней резко снижается, хотя интуитивно должно быть ровно наоборот. Более того, это аномальное снижение имеет определенную прописку - 9 республик, Москва, Саратовская область и еще кое-кто по мелочи.
Давайте теперь посмотрим на бенефициара такой аккуратности.
Для этого нужен правый график, на котором показана зависимость количества голосов за ЕР как функция процентов за ЕР на участках, где не было ни одного недействительного. Я так же разделил маленькие участки (с количеством проголосовавших меньше 250 избирателей) и большие (>250); цифра 250 была выбрана из левого графика. Можно взять и 500, результат не сильно изменится. Начнем с коричневой кривой (большие участки). При 50+% количество сторонников ЕР взвивается орлом, достигая своего максимума на 100%. Ну и все прочие известные аттрибуты, навроде пиков на красивых числах, тоже на месте -- как мы и обсуждали раньше.
А вот на маленьких участках (красная кривая) ситуация другая: виден какой-то максимум на 65%, но к 100%, правда, кривая опять идет на взлет. Там не менее, масштаб явления совершенно иной -- посмотрите на врезку.
Далее, можно продолжить построения и опустить 9 республик. Зависимость для больших участков (зеленая кривая), хотя и имеет меньший размах, тоже слабо вменяемая, и не лишена загадочности в виде пиков на красивый процентах.
Далее можно посчитать количество голосов под коричневой кривой от 50% до 100%; можно отскалировать зелененькую кривую на <50% и сделать вычитание - не суть. Эффект настолько велик, что вариации результата будут процентов на 10 от силы.
Ну и можно (и нужно) продолжать развлекуху, опуская различные регионы, покуда не исчезнут красивые пики, и вообще пока зеленая кривая не станет такой же, как желтая.
Какой вывод всех этих построений? На участках с нулевым количеством недействительных бюллетений, все распредления голосов примерно одинаковы до 50% за ЕР, а после 50% начинаются чудеса: количество голосов на больших участках резко возрастает, что идет в разнос с математикой и интуицией. Ведь казалось бы, что чем большее число избирателей голосует, тем выше вероятность ошибки, и должно быть больше недействительных. Впрочем, маленькие участки (т.е. где голосовали менее 250 человек) тоже не отстают. Все эти особенности отсутствия недействительных бюллетеней имеют четкую географическую привязку, и эти во всех отношениях интересные участки в сумме приносят ЕР около 2 млн голосов.
Небольшое добавление: график был пересчитан, поскольку один из файлов оказался битым