Выборы по Гауссу и не только

Что означает (не)нормальное распределение в сложных графиках

18 марта в России проходят выборы президента. Во время нескольких предыдущих кампаний математики, работавшие с данными ЦИК, утверждали: были вбросы. И показывали графики нормального распределения, которое, вроде бы, должно действовать и для выборов.

На деле это не совсем так. Но для того, чтобы понимать, о чем идет речь, посмотрите этот небольшой ролик, объясняющий, что представляет собой один из базовых законов математики.

Распределение Гаусса

Итак, еще раз повторим суть: у вас есть много случайных величин, каждая из которых слабо зависит от других. Все они вносят некий вклад в общий результат. Чем больше таких слагаемых, тем лучше. В конечном счете, похожие результаты сформируют нечто вроде колокола. Это и будет нормальное распределение.

К выборам закон вполне применим: число участков со средним значением конечного результата должно быть максимальным. То же самое касается явки и хода голосования. Любое отклонение от формы колокола является аномалией. Обычно оно проявляется на стадии подсчета голосов, когда избирательные комиссии вводят свои данные в информационную систему ГАС «Выборы». И вот тут начинаются чудеса: поначалу «колокол» Гаусса отлично просматривается, а затем у одного кандидата график начинает скакать. И это выглядит очень странно, особенно, если пики отмечают круглые цифры: 55, 60, 65 процентов…

Функция Гаусса с различными коэффициентами
Функция Гаусса с различными коэффициентами. Для расчета могут применяться разные параметры: например, время и общее число проголосовавших, пики голосов, поданных за разных кандидатов  в разное время и так далее.

Кажется, что в этой логике нет изъяна. И все же есть несколько факторов, помимо махинаций с результатами, которые «портят» форму колокола.

Россия – очень большая страна. Регионы отличаются по уровню развития, проникновению технологий, структуре экономики, ожиданиям граждан. А значит, и голосуют люди по-разному. Где-то выше уровень поддержки одного кандидата, где-то – другого.

В России разный уклад жизни в разных регионах. Допустим, в сельской местности люди обычно встают раньше и стараются делать все дела в первой половине дня. В больших городах распорядок дня может быть другим. Поэтому не стоит ждать, что пик голосования по всей стране придется на одно и то же время.

В России много специфических групп избирателей. Благополучие военных, сотрудников закрытых предприятий, жителей моногородов напрямую зависит от государства. В большинстве случаев, те, кто связан с такими особыми регионами, видят жизнь не так, как другие. А значит, и голосуют иначе.

Даже в соседних, но похожих областях может быть разный результат. Одно из подозрений, связанных с вбросами, касалось Кемеровской области, где результат оказался совершенно иным, чем в соседней Новосибирской. Граница региона для многих – это граница мира. И отданный за какого-то кандидата голос – это еще и вотум доверия к действующей региональной элите.

Результат может быть разным и в соседних районах одного большого города. Например, в Москве есть старые районы с давними традициями и привычками, а есть новые кварталы, где жизнь устроена иначе. В старых районах меньше молодежи, в новых – реже встречаются люди пожилые. Конечно, в демографическом плане разница не очень велика, но она может оказаться достаточной, чтобы начать сомневаться в результатах голосования.

Эти пять факторов не могут не повлиять на изящный колокол Вильгельма Гаусса, в котором неизбежно появвятся необоснованные с точки зрения математики пики. Эти пики будут видны и в распределении голосов между кандидатами, и в том, в какое время избиратели приходили на участки, и в том, как менялось соотношение голосов, поданных за того или иного кандидата.

Но все это не означает, что формулу нормального распределения нельзя применить к выборам.

Гаусс работает

Чтобы математические расчеты показали реальную, а не искаженную картину, нужно всего лишь логичным способом сгруппировать избирательные участки.

Для начала – исключить из расчета те из них, где результат искажается под влиянием внешних факторов. В первую очередь, это закрытые территориальные образования и военные части. Во-вторых, выделить места компактного проживания отдельных народов (голосование на таких участках нужно анализировать отдельно).

Наконец, самое важное – создать однородные группы участков. Например, по уровню жизни, уровню поддержки власти или уровню протестных настроений, региону, по городам и сельским поселениям и так далее. В таких группах отклонения будут намного более заметными. Например, если в целом по региону люди пришли на голосование в первой половине дня, то вечерний всплеск на отдельных участках будет заметнее.

Есть, наконец, критерий времени передачи данных с участка в территориальную избирательную комиссию. Затянувшийся подсчет косвенно может свидетельствовать о манипуляциях с данными.

Математикам обязательно стоит отдельно проверить участки с «ровными» или одинаковыми цифрами. Насколько их много и как именно они распределены по стране. Например, совпадение данных с большого количества участков в одном регионе – тоже признак манипуляций. А еще таким признаком могут быть участки с сильно отличающимся от среднего количеством тех, кто голосует не дома.

Получив готовые результаты, имеет смысл сравнить те участки, где картина существенно отличается от общей. Это поможет установить процент возможного вброса и его влияние на конечный результат.

Все это — большая и сложная работа, но в таком виде доверие к ней будет больше, чем построение одного графика, на котором почему-то, вместо кривой Гаусса, виден бессмысленный «забор». Хотя такой же забор нередко показывают выборы и в других странах, где сомнений в точности подсчета ни у кого не возникает.

Соцсети
Сайт сделан в Бреле 2017