Самое свежее

Конец Публициста Раскрыт взрыв вулкана Кракатау. Политические анекдоты Как загибается Европа Эль Мюрид. Замеры благосостояния в России После теракта. Неудобные вопросы. Александр Росляков. Все для победы этой диктатуры, остальное – тьфу!

Как пытаются доказать вбросы на выборах статистически

  •  

    Теоретическая основа для выявления вбросов бюллетеней изложена, например, в статье 2016-го года, которая цитируется ниже.

    "Статистические отпечатки пальцев фальсификаций на выборах?"

    Дмитрий Кобак, Сергей Шпилькин, Максим С. Пшеничников,

    Когда россияне отправятся на избирательные участки в сентябре этого года, чтобы проголосовать на выборах в Государственную Думу, нижнюю палату Федерального Собрания России, найдутся те, кто будет задаваться вопросом, можно ли доверять результатам голосования. На последних выборах, 4 декабря 2011 года, вспыхнули протесты из-за заявлений о том, что выборы были сфальсифицированы.

    Партия "Единая Россия", возглавляемая тогдашним премьер–министром, а ныне президентом Владимиром Путиным, набрала 49% всех голосов, поданных по всей стране. В столице Москве доля голосов "Единой России" составила 47%. Однако поступали многочисленные сообщения о фальсификациях на выборах – в частности, в Москве с ее большим количеством независимых наблюдателей.

    Протесты в ответ на эти заявления достигли кульминации через неделю после выборов, 10 декабря, в демонстрации, собравшей, по оценкам, 50 000 человек – крупнейшей в стране с начала 1990-х годов. Перед лицом таких протестов российские официальные лица отрицали какие-либо манипуляции с выборами, в то время как многочисленные попытки оспорить результаты, используя отчеты наблюдателей и видеозаписи, снятые на смартфонах, в качестве доказательств мошенничества, были отклонены судами по различным основаниям. Например, в феврале 2012 года Следственный комитет Российской Федерации заявил, что видеозаписи, показывающие предполагаемые акты фальсификации голосов на избирательных участках, “имели признаки видеомонтажа”, то есть они сами были сфальсифицированы.

    С закрытием юридических путей протесты прекратились, и жизнь пошла своим чередом. Но подозрения все еще остаются – подозрения, которые были дополнительно подкреплены статистическим анализом.

    Открыто и честно?

    Все результаты выборов в России находятся в свободном доступе в Интернете, вплоть до уровня одного избирательного участка: на каждом из примерно 95 000 избирательных участков исследователи могут видеть, сколько людей было зарегистрировано для голосования, сколько пришло голосовать и сколько проголосовало за каждую партию. Это делает Россию редким и любопытным случаем: страной, где такая информация открыта для всех, и все же часто утверждается, что выборами манипулируют. Однако, имея в наличии все эти данные, можем ли мы оценить справедливость выборов, изучив исходные данные о выборах?

    Различные исследователи в России пытались сделать это с начала 1990-х годов. Один из подходов, предложенных Собяниным и Суховольским, основан на следующей идее. Давайте рассмотрим, что происходит с практикой вброса бюллетеней – когда в урну для голосования добавляется большое количество поддельных бюллетеней для какой-либо партии (А). В этом сценарии результаты партии А, определяемые как отношение числа бюллетеней в ее пользу к числу всех собранных бюллетеней, увеличатся. Но так же будет и явка – определяемая как отношение числа участвующих избирателей к числу зарегистрированных избирателей.

    Теперь, предполагая, что вброс бюллетеней такого рода происходит только на подмножестве избирательных участков, мы должны увидеть ярко выраженную положительную корреляцию между результатом партии А и явкой на всех избирательных участках в стране. Собянин и Суховольский предположили, что наличие такой корреляции может свидетельствовать о фальсификации выборов в пользу партии A. Аналогичные идеи недавно были прослежены в модельных исследованиях.

    На рисунке 1 А показано распределение результатов явки по всем семи крупным российским выборам (четыре президентских и три парламентских) после 2000 года, когда подробные данные стали общедоступными.  Явка на горизонтальной оси на каждом участке, а результат лидера - на вертикальной оси; “лидером” является либо Владимир Путин, либо партия или кандидат, связанный с ним и поддерживаемый им. Каждая ось разделена на ячейки, представляющие один процентный пункт, и 2D-распределение избирательных участков на этой сетке 100 × 100 имеет цветовую маркировку. Сильная корреляция между явкой и результатом лидера прослеживается начиная с 2004 года, каждый случай дополнительно усиливается тем, что выглядит как отдельный кластер избирательных участков с явкой около 100% и результатами почти 100% в пользу Путина или его соратников (создание бимодального распределения).

     

     

    Рисунок 1

    Явка–распределение результатов. (А) Президентские (2000, 2004, 2008, 2012) и парламентские (2003, 2007, 2011) выборы в России. Горизонтальная ось на каждом участке соответствует явке, вертикальная ось - результату лидера. Каждая ось была разделена на ячейки по 1% с центром в целых процентах (0-0.5%, 0.5–1.5%, ..., 99.5–100%). Цветом показано количество избирательных участков в соответствующей ячейке 1×1%, нормализованное по общему количеству, так что все числа вместе равны 1. Избирательные участки со 100-процентной явкой были исключены из анализа, поскольку они включают участки, для которых число зарегистрированных избирателей не было доступно заранее (им официально была присвоена 100-процентная явка). (B) То же самое касается трех европейских выборов: президентских выборов 2010 года в Польше (первый тур), федеральных выборов 2009 года в Германии (Цвайтштиммен, т.е. партийные голоса) и выборов в Конгресс 2011 года в Испании. (C) То же самое для города Москвы на федеральных выборах 2011 и 2012 годов в России

    Однако наличие корреляции само по себе не является доказательством фальсификации, как и бимодальность двумерного распределения. Действительно, на рисунке 1B показаны три примера европейских выборов, которые никогда не обвинялись в фальсификациях: в Польше, Испании и Германии (эти страны были выбраны потому, что количество и размер избирательных участков сопоставимы с Россией, и данные доступны с тем же разрешением). Заметная корреляция присутствует во всех из них, и Испания демонстрирует четкуюбимодальность 2D-гистограммы. Эти эффекты, вероятно, обусловлены географическими и социокультурными неоднородностями: может случиться так, что в одной части страны политические взгляды существенно отличаются от остальных, что приводит к корреляциям и/или бимодальности. Например, нижний кластер в Испании происходит из Каталонии и Страны Басков, а бимодальность голосов в Польше связана с хорошо известным разделением страны на восточную и западную части с их различным историческим прошлым.

    Тем не менее, в некоторых случаях географическая неоднородность не представляется правдоподобным объяснением. Например, очень сильная корреляция и бимодальность в городе Москве, наблюдавшиеся на российских выборах 2011 года (рисунок 1C), полностью исчезли на следующих выборах 2012 года (состоявшихся всего 4 месяца спустя). Поскольку социально-географическая ситуация в Москве вряд ли могла измениться за время между этими двумя выборами, манипуляции с бюллетенями можно считать разумным объяснением того, что привело к распределению в 2011 году, и “истинный” результат "Единой России" можно оценить примерно в 30% (положение нижнего левого кластера на 2D-диаграмме), что хорошо согласуется с другим анализом, основанным на отчетах независимых наблюдателей.

    Корреляция и бимодальность не являются окончательными доказательствами мошенничества, но в данных есть и другие любопытные моменты, которые стоит изучить.

    Тем не менее, каким бы убедительным этот аргумент ни казался некоторым, он не является окончательным доказательством. Скептики могут справедливо утверждать, что результаты голосования на парламентских выборах 2011 года не обязательно сопоставимы с результатами президентских выборов 2012 года. Действительно, город, который был разделен по парламентскому выбору, мог бы гораздо более единодушно проголосовать за президента.

    Более четкая картина?

    Если мы согласимся с тем, что корреляция и бимодальность не являются окончательными доказательствами мошенничества, в данных остаются другие любопытные моменты, которые стоит изучить. При внимательном рассмотрении двумерных распределений на рисунке 1A можно заметить другую, более тонкую особенность: кажущиеся периодическими вертикальные и горизонтальные линии в верхних правых хвостах распределений, наиболее заметные в 2008 году. Это более четко видно на средней гистограмме по всем выборам с 2004 по 2012 год (рисунок 2). Чтобы более внимательно изучить эту закономерность, мы рассмотрим одномерные распределения явки и результатов лидера (рис. 3) - горизонтальные и вертикальные проекции двумерных гистограмм. Здесь явление становится очевидным: на всех выборах, начиная с 2004 года, оба распределения демонстрируют ярко выраженные пики при процентах, кратных пяти, таких как 65%, 70%, 75%, а также меньшие пики при всех достаточно высоких целых процентах, таких как 91%, 92%, 93%. 

     

    Рисунок 2

    Среднее распределение по пяти выборам с 2004 по 2012 год, рассчитанное с более мелким размером ячейки 0,25% по сравнению с изображением на рисунке 1

     

    Рисунок 3

    Результаты лидера и распределение явки на всех семи российских выборах после 2000 года. Гистограммы были рассчитаны с ячейками 0,25% (центрированы таким образом, чтобы значение, например, 50% соответствовало 50 ± 0,125%) и нормализованы для получения единичной площади. Чтобы избежать каких-либо артефактов из-за целочисленного деления, мы добавили случайное число, выбранное из равномерного распределения U (-0,5, 0,5), в числитель каждой доли явки или результата лидера. Как и прежде, избирательные участки со 100% явкой были исключены из этого анализа.

    Эти пики наблюдаются при одних и тех же процентных значениях на нескольких выборах и явно носят периодический характер; это говорит о том, что они вряд ли являются результатом случайных колебаний. Мы провели тест на значимость, основанный на моделировании честных выборов методом Монте-Карло, и показали, что пики значимы при p < 0,0001. Другими словами, существуют конкретные процентные значения явки и результата лидера, которые гораздо более распространены, чем другие, и эти значения оказываются “круглыми”: целыми, а не дробными, и кратными 5 или 10.

    Существует большое количество экспериментальных и наблюдательных данных, свидетельствующих о том, что людей привлекают круглые числа, и при выборе чисел они, как правило, выбирают именно их. Вот почему, например, сумма денег, указанная в подсказках, и числовые ответы на вопросники, как правило, группируются рядом с круглыми числами. Аналогичным образом, преобладание округлых процентов в результатах выборов предполагает, что значительная часть этих результатов, возможно, была выбрана сознательно, а не возникла в результате случайного процесса голосования.

    Представьте себе избирательный участок с 1755 зарегистрированными избирателями (типичное значение для российского города). Представьте далее, что должностные лица избирательных комиссий решили подделать результаты на этом конкретном избирательном участке и сообщить о явке в 85%. Они выбрали число 85%, потому что оно круглое и, следовательно, по своей сути привлекательное, и поэтому другие нечестные избирательные участки, скорее всего, будут использовать то же число. Чтобы достичь 85%, этот избирательный участок должен сообщить о 1755 × 0,85 = 1492 поданных бюллетенях (поскольку в протоколах выборов записано количество поданных бюллетеней, а не итоговый процент). Обратите внимание, что число 1492 само по себе не примечательно; округлым является только результирующее процентное значение (т.е. соотношение 1492/1755).

    Ранее утверждалось, что распределение отдельных цифр в номерах бюллетеней по избирательным участкам может выявить отпечатки пальцев фальсификации. Однако, хотя большое количество подсчетов голосов, заканчивающихся нулем, может указывать на то, что что-то не так, это не обязательно подразумевает целенаправленную фальсификацию, поскольку подсчеты бюллетеней могут быть округлены из-за человеческой ошибки. Напротив, достижение круглых процентных значений требует тщательной корректировки сообщаемых цифр. Таким образом, статистически значимое преобладание явки и/или результатов лидера при “привлекательных” (целых или круглых) значениях может служить убедительным статистическим доказательством фальсификации.

    Преобладание круглых процентных значений в результатах выборов 2011 года было замечено вскоре после выборов; впоследствии большая часть анализа, представленного в этой статье, была проведена до выборов 2012 года. Это означает, что данные выборов 2012 года можно рассматривать как прямую проверку нашей априорной гипотезы. Неизменное присутствие круглых и целых процентных пиков в данных о выборах 2012 года, таким образом, придает дополнительную поддержку теории.

    Иногда влечение к “красивым” номерам достигает гротескных масштабов. Например, оглядываясь назад на рисунок 1А, можно заметить яркую точку (локальный пик плотности) при явке 75% и результате лидера 75% на выборах 2011 года (рисунок 4). Оказывается, эта точка поставлена одним городом – Стерлитамаком в Республике Башкортостан, где 42 избирательных участка из 107 сообщили о явке 75±0,5% и результате лидера. Это наблюдение наводит на мысль, что избирательные участки, участвующие в круглых процентных максимумах, могут быть географически локализованы, а не распределены по всей стране. Действительно, мы обнаруживаем, что преобладание круглых процентов возникает в основном из-за вклада примерно 15 из 83 российских регионов (Республика Башкортостан является одним из них), что убедительно свидетельствует о том, что эти аномалии носят организованный характер. 

     

    Рисунок 4

    Увеличенное изображение региона с явкой около 75% и результатом лидера 75% гистограммы 2011 года на рисунке 1A

    Еще более нелепый пример дает город Владикавказ на тех же выборах 2011 года. Город разделен на два избирательных округа. Если мы посмотрим только на один из этих округов (рис. 5), то увидим, что подавляющее большинство избирательных участков сообщили о 74% голосов за партию "Единая Россия", в то время как Коммунистическая партия получила 20%. Любопытно, что на пяти избирательных участках эта картина была обратной: Коммунистическая партия получила 74%, а "Единая Россия" - только 20%. Эта модель кажется в высшей степени искусственной.

     

    Рисунок 5

    Результаты выборов 2011 года в одном из двух избирательных округов, образующих город Владикавказ

    Выводы.

    Подводя итог, мы показали, что статистический анализ данных о выборах может выявить различные нарушения, которые могут указывать на крупномасштабные манипуляции с выборами. Большинство этих нарушений могут иметь альтернативные объяснения, которые могут быть отброшены только на основе исторических данных, географии и другой информации, не относящейся к статистическому анализу. Однако мы утверждаем, что высокая распространенность круглых процентных значений в результатах выборов дает статистический признак мошенничества, которое нелегко объяснить. Доказательства, на наш взгляд, не вызывают разумных сомнений.»

    Подходы, изложенные в статье, понятны.

    А что пишут о выборах 2021?

    Есть и информация по выборам 2021-го года. Она показана на приведенных ниже рисунках.

     

    На этом рисунке показаны зависимости количества избирательных участков от процента явки и процента голосов за ЕР. Видныпички при 65%, 70%, 75%, 80% и 85% голосов за ЕР.Для явки пички менее заметны.

     

    На этом рисунке показано распределение процентов явки по участкам и процентов голосов за ЕР.     

     

    А на этом рисунке показаны явка и процент голосов за победителя на всех российских выборах с 2000-го года.

    А что можно ответить на приведенные рассуждения по существу?

    По поводу пичков при значении процента голосов за ЕР кратном пяти возразить трудно. Но можно отметить, что фальсификаторов, выбирающих такие проценты, становится меньше, и эти пички не сильно добавляют проценты ЕР. Это отражено на нижеприведенном рисунке.

     

    Вопрос о росте процента за ЕР при росте явке, рассмотрен в статье Пришпилим Шпилькина?

    Суть вопроса видна из приведенной ниже цитаты.

    «Главный недостаток метода Шпилькина состоит в том, что он все аномалии считает вбросами. На самом же деле, во многих случаях используются другие методы применения админресурса, включая «подкуп» руководителей национально-культурных общностей.»

    Для примера рассмотрим некий градообразующий военный завод. Допустим, его руководитель отправил своих работников на выборы голосовать за ЕР, аргументируя это тем, что коммунисты и либералы завод закроют, и город начнёт вымирать. В результате получилось 80% явки и 80% голосов за ЕР. Результат голосования выглядит как вброс голосов. На самом же деле, не факт, что это даже можно назвать применением административного ресурса в пользу ЕР, так как руководитель сказал правду, и голосование за ЕР, действительно, в интересах горожан.

    Поэтому, оценки Шпилькиным количества вбросов, по-видимому, многократно завышены. Если же говорить о поддержке ЕР, то надо учитывать и таких, как автор этой статьи, который считает ЕР лучшей партией из имеющихся, но уже вторые выборы голосует за другие партии, чтобы «намекнуть» ЕР на её недостатки (ибо с одномандатными округами у ЕР в любом случае будет большинство голосов в Думе). В последний раз намёк был на пенсионную реформу и добровольно-принудительные прививки детям и людям детородного возраста.

-3

Комментарии

8 комментариев
  • Михаил Русаков
    Михаил Русаков27 сентября 2021 г.+2
    Голосуй, не голосуй всё равно получишь... вы сами знаете что Базовый итог – что "Единая Россия" сохранила по факту конституционное большинство в ГД. Более того – она даже увеличила свое представительство до 324 депутатов.
  • Михаил Русаков
    Михаил Русаков27 сентября 2021 г.
    Интересно, кто автор этой статьи?
    • Si Snow
      Si Snow27 сентября 2021 г.
      догадайся с трех раз
    • Si Snow
      Si Snow27 сентября 2021 г.
      Ты наверное.
      • Михаил Русаков
        Михаил Русаков27 сентября 2021 г.
        И чем тебя купили?
      • Михаил Русаков
        Михаил Русаков27 сентября 2021 г.+2
        До этой статьи, я считал тебя честным человеком
        • Si Snow
          Si Snow27 сентября 2021 г.
          А я тебя умным. Не поверишь с утра до ночи ломятся эмиссары в дверь с пачками денег. Ты скажи кто купит я может подумаю и продамся