February 25th, 2018

Статистика медалей зимних Олимпиад (пусть здесь полежит)

Я нарисовал пару графиков по поводу т.н. "сочинской аномалии"-- конечно, результат Сочи на уровне или даже превосходит лучшие годы СССР (за исключением провальных 68 и 72).
С другой стороны, результат Турина в пределах статпогрешности от результата Сочи (см УПД2), и одного порядка с результатами 94/98.
В общем, чиста-статистически результат Сочи не является особо выдающимся (upd: Пожалуй, является таки). Но надо бы еще 4 года подождать для ясности.
А так, выборы намного прикольнее.

results1

УПД1. В комментариях предлагают нормировать на количество разыгрываемых медалей, которое увеличилось в 4.6 раза (спасибо thrasymedes за данные). Мне подобная нормировка неочевидна.
Предположим, добавляют могол, кобол и фортран заодно. Да СССР и в традиционных горных лыжах была не на первых ролях; что ей с этого добавления? а вот добавили бы к хоккею с клюшкой хоккей с плюшкой, балалайкой и водкой, тут россиянам и поперло бы. А вот если бы фигурное катание сократили б, это был бы серьезных удар.
Одним словом, нормировка предполагает равномерные распределения, а они нет.

УПД2. Более важный комментарий (от hryu): надо показывать количество медалей ДО дисквалифиционной коррекции. Разницы в 4 медали отодвигает результат Сочи в сторону аномалии (разумеется). Насколько в этой аномалии задействован фактор дома, надо устанавливать отдельно -- например, смотря аналогичные зависимости для других лидеров. akor168 в комментариях сделал оценку для Японии, но там статистика слишком куцая для выводов. Может, кто еще сделает другие страны, а?