Американские выборы тоже негауссовы

Смотрите так же: Тест: Россия или демократическая страна?


Результаты Единой России в выборах столь невероятны, что противоречат основопологающей работе Гаусса по статистике
The Washington Post


График, что под этим абзацем, показывает распределение процента голосов за партии по избирательным участкам. За последние две недели он обошёл сотни блогов. Блоггеры сопровождали его комментариями, что распределение для Единой России нарушает фундаментальный закон природы, так как оно не гауссово. В предыдущей статье я, исходя из общих математических принципов, показал, что нет причины этому распределению быть гауссовым. Однако, комментатор предложил мне найти негауссовы распределения на выборах в США. Я принял вызов.


Рисунок 1. Выборы в Госдуму в 2011 году. Распределение процента голосов за партии по избирательным участкам.

Я исследовал предварительные выборы Республиканской партии США 2008 года. Предварительные выборы отличаются от национальных выборов, тем что разные штаты проводят голосование в разные дни. Некоторые кандидаты выбывают из гонки, и это усложняет анализ. Однако, 21 штат проводит выборы в один день, названный Супер-вторником. Так как почти половина страны голосует в тот же самый день, это похоже на национальные выборы. Самая полная база данных, которую я смог найти, - Атлас американских Президентских выборов Дэйва Леипа. Для интересующих меня выборов там нет результатов на уровне избирательных участков. Однако, там есть результаты по округам (county) для 19-ти из 21-ого Супер-вторниковского штата (кроме Аляски и Северной Дакоты). Я вычислил распределения процентов голосов за четырех ведущих кандидатов по 1162 округам. См. таблицу 1 и рисунок 2.

Таблица 1. Предварительные выборы Республиканской партии США 2008 года. Результаты в 19 штатах, где голосование прошло в один день, Супер-вторник. Таблица показывает распределения голосов за кандидатов по 1162 округам (counties). В ячейку « 5%» входят все округа, где кандидат получил 5 или меньше процентов голосов. В ячейку «10%» входячт округа, где кандидат набрал больше 5-ти но не больше 10-ти процентов. И так далее.

Процент голосов

Число округов

Huckabee

McCain

Romney

Paul

5%

56

11

47

723

10%

95

26

77

305

15%

138

34

122

51

20%

115

91

181

34

25%

72

99

203

21

30%

96

152

174

9

35%

140

175

142

6

40%

137

173

85

2

45%

113

147

22

4

50%

65

115

31

2

55%

39

60

18

0

60%

29

21

14

0

65%

20

1

7

2

70%

28

1

8

1

75%

14

13

1

0

80%

5

37

4

0

85%

0

6

4

0

90%

0

0

14

2

95%

0

0

8

0

100%

0

0

0

0

Как видите, у Хакаби вышло двугорбое распределение с одним пиком на 15-ти а другим на 35-ти процентах. Междугорбие в два раза ниже горбов. У распределения Маккэйна один пик на 35%, а другой на 80%.Между пиками распределение спадает почти до нуля. У Рамни один пик на 25%, а другой на 90%. Рон Пол получил экспоненциальное распределение, напоминающее распределения «Яблока» на российских выборах. Эти распределения не более гауссовы, чем распределение Единой России. Очевидно, результаты американских выборов тоже «противоречат основопологающей работе Гаусса по статистике».


Рисунок 2. Предварительные выборы Республиканской партии США 2008 года. Результаты в 19 штатах, где голосование прошло в один день, Супер-вторник. Рисунок показывает распределения голосов за четырёх ведущих кандидатов по 1162 округам (counties).

Второй вопрос, который подняли блоггеры, - странные пики на 50% и других 5-кратных числах (см. рисунок 1). Однако, если посмотреть на результаты на уровне избирательных участков, то видно, что во многих из них голосовало очень мало людей, в некоторых всего один человек. Отдуда берутся все стопроцентные и нулевые результаты. Когда голосуют 2, 4, 6, 8, или 10 человек, то можно получить 50%-ый результат, но никак не 49% или 51%. В упомянутой базе данных есть статистика на уровне избирательных участков (precincts) для президентских выборов в США 2000 года в штате Калифорния. Результаты – на рисунке 3. Ясно видны пики на 50% как у Буша, так и у Гора. Есть менее выраженые пики на 20, 25, 60, 75 процентах. Однако, есть и другие явные пики – 34% (1/3) и 67% (2/3). Эти, очевидно происходят от участков где проголосовало три избирателя или малое кратное трём число. Этих пиков не видно на результатах российских выборов. Вопрос требует дополнительного исследования.


Рисунок 3. Президентские выборы США 2000 года. Результаты в штате Калифорния. Рисунок показывает распределения голосов за кандидатов по 21970 избирательным участкам (precincts). В ячейку « 1%» входят все участки, где кандидат получил 1 или меньше процентов голосов. В ячейку «2%» входят участки, где кандидат набрал больше 1-ого, но не больше 2-ух процентов. И так далее.

Заметьте, что и распределения на рисунке 3 далеко не гауссовы.Если в них и есть что-то похожее на колокообразную кривую, то это комбинированная кривая из распределение Гора до 50% и распределения буша после 50%. Если применить те же методы доказательств, какие использовали блоггеры, комментирующие выборы в Госдуму, то можно доказать, что Гор украл голоса у Буша.

Михаил Симкин
20 декабря 2011 г.

Эта заметка опубликована в Significance, журнале Королевского статистического общества.