Проект компании «Ваш репетитор»Eruditor group»)
ERUDITOR . RU

15.  Математические распределения и выборы в ГосДуму 2011 (ОПРОВЕРЖЕНИЕ популярного заблуждения) (а также, ЧАСТИЧНОЕ ОПРОВЕРЖЕНИЕ ОПРОВЕРЖЕНИЯ)


Автор не является поклонником Единой России, не голосовал за неё, и не утверждает полной достоверности результатов голосования. Автор является сторонником только одной партии — Партии Здравого Смысла и Честного Отношения к Фактам.

Сеть заполонили спекуляции на тему аномального распределения процента голосов за ЕдРо по участкам.
Например, http://lleo.me/dnevnik/2011/12/07_gauss.html, http://www.gazeta.ru/science/2011/12/10_a_3922390.shtml и т.д.

При этом, «эксперты»-математики, пытающиеся объяснить народу весь ужас того, как нагло его обманывают власти, на самом деле в лучшем случае никакие не эксперты, т.к. допускают грубые математические ошибки, а в худшем — сами нагло врут и подтасовывают факты.

Во-первых, приводимый везде «колокол», он же «гаусс», он же «нормальное распределение», не имеет прямого отношения к распределению процента голосов по участкам. Чтобы получить ровный гладкий «гаусс», нужно, чтобы все «бросания монетки» происходили в идентичных условиях. В реальности же условия более чем неидентичны. Представим себе, что страна разделена на двe республики, в одной народ строго любит Партию, в другой — строго ненавидит её. Каждая республика в отдельности даст на графике свой «гаусс», первая — ближе к 100% за Партию, вторая — ближе 0%. И результирующий график будет суммой этих двух гауссов — кривой с двумя горбами. А теперь представьте, что будет, если республик не две, а несколько десятков, и в каждой — своё отношение к Партии? Получите многогорбую размытую кривую. Поэтому широкая несимметричная горбатая кривая означает лишь то, что в обществе нет единодушного отношения к Партии, и не более того.

Люди голосуют НЕ случайно, заполняя бюллетень никто монетку не бросает. Поэтому попытки описать результаты голосования законом, который действует для абсолютно случайных, ни от чего не зависящих величин — заведомо некорректны.

Во-вторых. «Аномальные пики» на круглых значениях процентов. Ага, говорит активная оппозиция, вы только гляньте на то, что происходит на графике около 50%! Это же явный вброс бюллетеней с целью догнать процент голосов до 50%! Но все уважаемые «математики», загипнотизированные картинкой гауссовского «колокола», почему-то не удосужились взять и честно всё посчитать.

Для начала давайте построим модель, очень простую и не соответствующую действительности в деталях (например, реальные распределения, разумеется, не равномерные), но суть вещей отражающую правильно. Пусть общее количество бюллетеней (Y) на участках равномерно распределено на промежутке [1,N]. И пусть количество голосов за ЕР (X) равномерно распределено на промежутке [0,Y]. Построим распределение числа участков с заданным процентом проголосовавших за ЕР (X/Y). Вот график для N=69 (число 69 взято с потолка, от него ничего принципиально не зависит):



В районе 50% обязан быть скачок, обусловленный тем, что дробь 1/2 среди других дробей n/m встречается чаще остальных. Но этот скачок легко сгладить, взяв слишком широкий шаг диаграммы.

То же самое относится и к другим «красивым» дробям — 1/3, 2/3, 3/4, 4/5 и т.д. Чем «красивее» дробь, тем более резким в её окрестности будет пик.

Ну а теперь давайте посмотрим на настоящий график распределения числа участков по проценту голосов, без сглаживания и просчитанный с высокой детализацией.

Шаг гистограммы = 1/2000.
Масштаб по оси абсцисс [0%,100%].
Расцветка:
1. СР
2. ЛДПР
3. ПР
4. КПРФ
5. Яблоко
6. ЕР
7. ПД


Более внимательное рассмотрение показало, что данный целочисленный эффект полностью объясняет якобы аномальный, а на самом деле совершенно естественный пик на значении 50% = 1/2, полностью или частично объясняет пики на 20%, 25% и 75%, но НЕ объясняет некоторые другие пики на круглых значениях процентов (65%, 70%, 85%, 90%, 95%) в правой части графика. См. далее по тексту.


UPDATE 13.12.2011

В-третьих. Теперь обратимся к более сложному вопросу — корреляции между явкой на избирательных участках и процентом голосов за ЕР. Оппозиция утверждает, что этой корреляции быть не должно, и распределение обязано быть горизонтальным, в то время как у ЕР видна явная зависимость: чем выше явка, тем больше процент голосов за ЕР. А у других партий наоборот, чем выше явка, тем меньше их процент. Якобы, это из-за того, что ЕР искусственно «переписала» на себя часть голосов других партий, а другую часть просто себе добавила за счёт не проголосовавших людей.

Зависимость % ЕР от явки:
Зависимость % ЛДПР от явки:


Не будем долго строить модели и доказывать разные теории. Специалисту и так ясно, что корреляция возможна, а неспециалисту всё равно в этих дебрях не разобраться. Давайте просто посмотрим на то, как выглядят эти графики в других, заведомо демократических странах с честными выборами. Для примера возьмём общие выборы в Парламент Великобритании в 2010 году. Надеюсь, демократичность Великобритании ни у кого не вызывает сомнений? Итак,

Результаты выборов в Парламент Великобритании 2010:

Зависимость от явки % Консервативной партии:
Зависимость от явки % Лейбористской партии:


Налицо явная (и даже ещё более сильная, чем в РФ) корреляция между явкой и процентом голосов.


Ну и на десерт, раз уж пришлось выкачивать базу данных результатов голосований Великобритании, грех не посмотреть и на график распределения участков по проценту голосов, который якобы должен быть гауссом. Вот:
Представлены результаты выборов в Парламент Великобритании 2010 по трём лидирующим партиям — Консервативной, Лейбористской и Либерал-демократической.

График отрисован с крупным шагом сетки, чтобы виднее была общая форма кривых.

Приятного аппетита ;-)


UPDATE 14.12.2011

В-четвёртых. Немало вопросов поступает про аномальный «хвост» в распределении общей явки. Сама природа этого хвоста мне не известна, это вопрос не из области математики. Но хотя бы его размер правильно вычислить не мешало бы. Дело в том, что многие авторы строят гистограммы распределения количества избирательных участков, совершенно не учитывая при этом их размер. А ведь в базе данных есть участки, где (удивительно!) всего 2 человека, а есть такие, где 20 тысяч. Разумно в расчётах учитывать вклад каждого участка пропорционально его размеру (т.е. полному числу избирателей).

Явка без учёта размера участков:
Явка с учётом размера участков:

Посчитанное таким, более правильным образом, распределение полной явки избирателей вызывает куда меньше вопросов об «аномальных хвостах».


В-пятых.
Распределение участков по процентам голосов за партии с учётом веса каждого участка:

Шаг гистограммы = 1/1500.
Масштаб по оси абсцисс [0%,100%].
Расцветка:
1. СР
2. ЛДПР
3. ПР
4. КПРФ
5. Яблоко
6. ЕР
7. ПД

(Обратите внимание на ясно видные ДВА гауссовых пика на графике КПРФ.)

Единственная очевидная «странность» на этом графике — это длинный хвост у распределения ЕР. Сам по себе этот хвост НЕ означает обязательного наличия фальсификации выборов. Но объяснить его — интересная задачка.

Я склоняюсь ко мнению (в отличие от всего, написанного выше, это моё личное МНЕНИЕ, а не достоверный факт), что «хвост» обусловлен инертностью широких слоёв населения в отношении к самой идее демократических выборов. Это наследие советской эпохи. Раз сказали, что надо прийти голосовать — построимся шеренгами и строевым шагом потопаем на участок. А за кого там голосовать — даже мысли такой не возникает, КПСС у многих отшибла напрочь саму возможность задавать себе такие вопросы. Вот и голосует народ «на автомате» за правящую партию. Ну и отдельные голосования по приказу начальника тоже наверняка были. В воинской части майор объявит, что если на его участке будет низкий процент за ЕдРо, то всю казарму на табуретки поставят — что, не проголосуют солдаты? Проголосуют. И явку обеспечат. Зачем тупыми вбросами и приписками заниматься, когда есть такие шикарные возможности обойтись без шуму и пыли? Я бы на месте ЕР не стал.


UPDATE 15.12.2011

В-шестых. Теперь давайте повернём шахматную доску и сыграем за белых.

Гистограмма распределения участков по проценту голосов за ЕР:

Шаг гистограммы = 1/400.
Вклад каждого участка пропорционален списку избирателей.
Масштаб по оси абсцисс [0%,100%].

Видно, что начиная с 60% гистограмма представляет из себя почти периодическую структуру, каждый участок очередных пяти процентов имеет одну и ту же форму — резкий скачок на кратном 5% значении, а затем плавный спад.

Никакого объяснения такому эффекту я пока не нашёл. «Никакого» означает «вообще никакого», т.к. даже вбросы бюллетеней и приписки непонятно как могут объяснить такую странную форму.

Исследование продолжается. С риском превратиться в расследование ;-)


В-седьмых.

Распределение участков по проценту голосов (без коррекций).
Шаг гистограммы = 1/400.
Вклад каждого участка пропорционален списку избирателей.
Масштаб по оси абсцисс [0%,100%].
Расцветка:
0. Явка
1. СР
2. ЛДПР
3. ПР
4. КПРФ
5. Яблоко
6. ЕР
7. ПД

...

Резюме после 8 часов вычислений:

Мне так и не удалось выделить регионы, ответственные за поведение «хвоста». Это опровергает гипотезу о том, что за аномалии ответственны несколько отдельных регионов.

Аномалии равномерно рассеяны и по регионам, и по частям хвоста. Объяснить их естественными причинами не получается. Искусственные причины объясняют всё только в предположении, что фальсификация проводилась:
а) тщательно спланированно, при централизованном управлении по всем регионам
б) удивительно глупо
Эти две причины противоречат друг другу. Если «на местах» устраивали накрутку голосов по своей собственной инициативе, то это объясняет глупость, но не объясняет равномерной раскиданности аномалий по всем регионам и по всем частям хвоста. Если же акция управлялась из Центра, который раздавал директивы, где, на каком проценте и сколько накинуть, то непонятно, почему тогда нельзя было спланировать гладкое красивое распределение.

Поэтому единственный выход — было и то, и другое. Равномерную толщину хвоста обеспечивала централизованная акция, а аномальные пики частично возникают из-за естественных причин (целочисленных), а частично — из-за нескоординированных фальсификаций по инициативе «на местах». Вот тому подтверждение:

На этом графике из выборки исключены 1/3 регионов, больше всего ответственных за пики в хвосте.
Шаг гистограммы = 1/400.
Вклад каждого участка пропорционален списку избирателей.
Масштаб по оси абсцисс [0%,100%].
Расцветка:
0. Явка
1. СР
2. ЛДПР
3. ПР
4. КПРФ
5. Яблоко
6. ЕР
7. ПД

В красной области (ЕР) даже ещё лучше, чем на предыдущем графике, виден «вырез», идущий с примерно 36% до 50% — с гладкого склона поверхности кривой как будто вырезали большой равномерный кусок, который потом размазали по хвосту. Это легко объяснить тем, что была дана команда из Центра некоторой части «своих» УИК, что если у них получается процент за ЕР от 36% до 50% — увеличивать процент, чтобы стал больше 50%.

Продолжая убирать регионы, ответственные за пики в хвосте, и доводя их количество до 2/3, видим, что «вырез» исчез!
Шаг гистограммы = 1/400.
Вклад каждого участка пропорционален списку избирателей.
Масштаб по оси абсцисс [0%,100%].
Расцветка:
0. Явка
1. СР
2. ЛДПР
3. ПР
4. КПРФ
5. Яблоко
6. ЕР
7. ПД

Итого, если принимать гипотезу о фальсификации, то примерно в трети регионов проводилась централизованная накрутка, ещё в одной трети — нескоординированная накрутка по собственной местной инициативе, а оставшейся трети — всё чисто.

Но это, повторю, при условии принятия гипотезы о массовой фальсификации. Само наличие «хвоста» (но не его форму) вполне объясняет и эффект голосования военных, которые в большинстве своём и без явных приказов наверняка и обеспечили высокую явку, и проголосовали за правящую партию.

Списки регионов (очень приблизительно):

«Хвостатые»
Кабардино-Балкарская Республика
Карачаево-Черкесская Республика
Республика Дагестан
Республика Ингушетия
Республика Мордовия
Республика Северная Осетия - Алания
Чукотский автономный округ

Еврейская автономная область
Республика Башкортостан
Республика Татарстан (Татарстан)
Тамбовская область
Тульская область
Чеченская Республика

Астраханская область
Воронежская область
Зарубежная территория
Кемеровская область
Краснодарский край
Республика Адыгея (Адыгея)
Республика Алтай
Республика Коми
Республика Тыва
Ростовская область
Саратовская область
Тюменская область
Ямало-Ненецкий автономный округ

«Порезанные»
Амурская область
Белгородская область
Брянская область
Город Москва
Город Санкт-Петербург
Ивановская область
Калининградская область
Курганская область
Курская область
Московская область
Нижегородская область
Пензенская область
Псковская область
Республика Бурятия
Республика Калмыкия
Республика Марий Эл
Республика Саха (Якутия)
Республика Хакасия
Самарская область
Сахалинская область
Ставропольский край
Удмуртская Республика
Челябинская область
Чувашская Республика - Чувашия

Чистые
Алтайский край
Архангельская область
Владимирская область
Волгоградская область
Вологодская область
Забайкальский край
Иркутская область
Калужская область
Камчатский край
Кировская область
Костромская область
Красноярский край
Ленинградская область
Липецкая область
Магаданская область
Мурманская область
Ненецкий автономный округ
Новгородская область
Новосибирская область
Омская область
Оренбургская область
Орловская область
Пермский край
Приморский край
Республика Карелия
Рязанская область
Свердловская область
Смоленская область
Тверская область
Томская область
Ульяновская область
Хабаровский край
Ханты-Мансийский автономный округ - Югра
Ярославская область


Продолжение темы — Методы статистического анализа результатов выборов (корреляции, Гаусс, Бенфорд и все-все-все).



Тема на форуме по этой заметке

Главная » Skeptik » Математические распределения и выборы в ГосДуму 2011