Фрагмент книги
Handbook of Ratings. Approaches to Ratings in the Economy, Sports, and Society/A. Karminsky, A.Polozov/ International Publishing house “Springer”, 2016., 366c

ГЛАВА 8. УНИВЕРСАЛЬНОЕ РЕШЕНИЕ ПРОБЛЕМЫ РЕЙТИНГОВ В СПОРТЕ

8.1. ОПРЕДЕЛЕНИЕ РЕЙТИНГА В СПОРТЕ И ПРИНЦИПЫ ФОРМИРОВАНИЯ РЕЙТИНГОВОЙ ШКАЛЫ
Далее под рейтингом будем понимать смещенный в область целых положительных чисел результат участника всеобщего гипотетического кругового годичного макротурнира.
При этом мы полагаем применимость следующих принципов.
Принцип 1. Приоритет гола над очком. Информационной основой рейтинга являются названные в официальных правилах соревнований первичные параметры игровой деятельности в виде забитых (З) и пропущенных (П) мячей, голов, количества реализованных действий и т.п.. Если боксеры А и В провели бой с итоговым счетом 12:8, то можно считать рейтинг и как 12:8 и как 1:0 – то есть победа боксера А. Однако не логично, когда такая возможность есть, ею не пользоваться. Ведь победа может быть со счетом 1:0 или 11:0. В одном случае равные соперники, в другом – просто избиение одним боксером другого. А очки одинаковы. Потом выясниться, что из-за такого огрубления оценки сразу большие группы боксеров имеют одинаковые рейтинги. Чтобы точнее их дифференцировать друг относительно друга надо будет стимсулировать боксеров принимать участие в большем количестве турниров. И только потому, что из-за огрубления оценок не удается тонко оценить соотношение сил. Надо исходить из того, что в макротурнире могут участвовать десятки миллионов человек и всем надо дать оценку.
Принцип 2. Выбор вида функциональной зависимости. Функция должна:
2.1. Обладать свойством антикоммутативности: F (З,П) = — F (П,З).
2.2. Работать в избранном числовом интервале, а не по всей шкале.
Следует отбрасывать результаты игр между соперниками с разницей в рейтингах более 1000 пунктов.
2.3. Не выходить за пределы четырех действий арифметики и обеспечить минимальное число арифметических действий при пересчете рейтинга.
2.4. Свести к минимуму суммарную разницу между результатами участников в личной встрече и их общими результатами.
Первые три пункта являются фильтром для функций, последний пункт – условием.
Предлагается отбрасывать результаты игр между соперниками со слишком большой разницей в рейтингах (далее используется уровень более 1000 пунктов). В таких играх не бывает борьбы за результат и более слабые участники получают незаслуженно завышенную оценку, которая искажает соотношение сил. Причем эти искажения обычно велики из-за высокой результативности таких встреч. Если мы хотим узнать реальное соотношение сил между такими участниками, то это необходимо делать через участников с промежуточным уровнем игры, когда борьба за результат более реальна. Если в исходных данных найдены результаты встреч соперников с разницей в полученных рейтингах более 1000 пунктов, то их следует исключить.
Если первые три принципа являются фильтром для функций, то последний – условием устойчивости поведению рейтинга. Нам нужна такая модель рейтинга, при которой разница в номинальных рейтингах двух соперников и фактическая разница на личную встречу были бы максимально близки. Если такой показатель окажется одинаков для нескольких функций сразу, то в этом случае отдадим предпочтение той из них, в которой число арифметических действий минимально. Это необходимо для минимизации работы по пересчету рейтинга.
В качестве основы модели, возьмем таблицу какого-либо кругового турнира. Используем таблицу кругового микротурнира в качестве модели макротурнира. Сопоставим результаты в личных встречах и показатели общей результативности в трех видах спорта с различной результативностью. Нас интересует степень сходимости частного результата встречи участников А и В с их общетурнирными достижениями. Если, скажем, А выиграл у В со счетом 3:1, то и общий баланс забитых и пропущенных за сезон мячей у А и В должен иметь сходное соотношение. Если нам удастся найти такую функцию, при которой будет иметь место равенство частного и общего баланса З и П мячей, то задача будет выполнена.
Подбор функций осуществлялся на основе справочника (Рыбасенко и др., 1986); перебором ранее предложенных функций; перебором возможных вариантов наиболее простых конструкций функций забитых (З) и пропущенных (П) мячей (результативных действий). Сравнения уровня определенности результата встречи для мини-футбола, хоккея и футбола проведены А.А. Полозовым (2007) по различным зависимостям, выбранным в соответствии с принципами 1-2. Показано, что в качестве функциональной зависимости Δ может быть выбрана зависимость
, (8.1)
где коэффициент 1000 задает масштаб шкалы рейтинга.
Принцип 3. Принцип транзитивности предполагает, что если участник А предпочтительнее участника Б по совокупности результатов, а Б аналогично предпочтительнее С также по всей совокупности зафиксированных в течение года результатов, то уровень А выше, чем уровень С.
Этот принцип позволяет провести макротурнир без обязательной встречи каждого с каждым. Тем самым создается возможность превратить круговой макротурнир в гипотетический, когда для сравнения участников не обязательно играть все игры. Уровень игры, определенный на основе полученной части результатов, экстраполируют на всю сумму игр. Отсутствие этого принципа означает требование встречи каждого участника макротурнира со всеми остальными, что не имеет перспективы.
Принцип 4. Принцип трансляции в глубину призван обеспечить неизменность, преемственность способа пересчета рейтинга при переходе с макроуровня на последующие нижележащие уровни, от уровня команд на уровень составляющих игроков, от уровня игроков — на уровень их базовых компонентов игры, и наоборот. Он предполагает возможность замены нескольких соперников одним, им эквивалентным
З — П = З1-П1 + … + Зn-Пn ;
При этом . Величина i = (Зi+Пi)(З+П) – доля участия данного результата в общей оценке. Так как по нашему определению рейтинг — число положительное, необходимо смещение вверх по числовой шкале на такую величину, при которой рейтинг самого слабого из участников будет величиной положительной:
Аналогично рейтинг команды раскладывается на рейтинги ее игроков. Так, при переходе на каждый следующий слой форма пересчета сохраняется. Отказ от этого принципа приводит к потере взаимодействия между различными уровнями.
Принцип 5. Принцип асимптотической устойчивости результатов означает возможность получения единственного решения в распределении рейтингов, исходя из полученных результатов независимо от их исходных значений.
Любая классификация дает формулу расчета рейтинга i-го участника. Выписав последовательно эту формулу для всех n участников мы получаем систему линейных уравнений (СЛУ). Она может иметь или не иметь решений. Чаще всего, при продолжительных соревнованиях и ограниченном составе участников она имеет свое решение. Это решение СЛУ при таком ее неявном использовании фактически и обеспечивает определенную сходимость большинства предложений по рейтингу.
Наиболее удобным способом реализации этого принципа является составление и последующее решение соответствующей системы линейных уравнений (далее СЛУ). При неравном нулю определителе СЛУ всегда имеет единственное решение. Отсутствие этого принципа приводит к существованию множества решений при одних и тех же результатах макротурнира, что равносильно отсутствию решения как такового.
Рассмотрим полностью заполненную таблицу любого произвольного микротурнира. Зачеркнем любую строку, будем считать ее неизвестной. Потерянную информацию можно восстановить по соответствующему столбцу. Это означает, что СЛУ, соответствующая всей таблице, имеет множество решений. Чтобы СЛУ имела единственное решение, необходимо либо заменить в ней любое уравнение некоторым другим, либо просто добавить это уравнение к уже имеющимся.
На практике предпочтительнее использовать (n+1) уравнение, определяющее средний рейтинг данного турнира через рейтинги всех (или части) его участников: . Есть только одно решение СЛУ, полученной после добавления данного (n+1) уравнения к существующим n
(8.3)

Для пояснения используемого подхода рассмотрим практический пример кругового турнира, результаты которого содержатся в табл. 8/3
Таблица 8.1. Таблица кругового турнира
Команда 1 2 3 З:П Rt
А 6:4 7:3 13:7 2200
Б 4:6 6:4 10:10 2000
С 3:7 4:6 7:13 1800
Полученные рейтинги участников составляют Rt(A)=2200; Rt(B)=2000: Rt(C)=1800. Решение можно проверить по разностям рейтингов. Так как А выиграл у Б 6:4, то это соответствует разности в 200 пунктов. Выигрыш А у С с соотношением 7:3 соответствует разности в 400 пунктов. Соответствующая система уравнений будет иметь вид

В принципе можно рассчитать рейтинг по более простой формуле. Разобьем макротурнир на два произвольных микротурнира. Найдем из соответствующих им СЛУ рейтинги участников и объединим результаты на основе принципа трансляции в глубину:
Rt i =  i1Rti1 +  i2Rti2 . (8.5)
Математически доказано, что решения, полученные через решение СЛУ по микротурнирам и объединенные на основе принципа трансляции в глубину, эквивалентны общему решению СЛУ по всему макротурниру. Это позволяет считать рейтинги методом последовательных приближений. Пусть есть j микротурниров с решением соответствующей СЛУ по i-му игроку в виде Rtij и есть новый j+1 микротурнир с решением Rti(j+1) .
Rt i=( ijRtij +  i(j+1)Rti(j+1) )/( i(j+1) + ij)=
= Rtij +( i(j+1) /( i(j+1)+ ij))(Rti(j+1) -Rtij) (8.6)

Значение ( i(j+1) + ij) должно соответствовать среднему числу официальных матчей за сезон. Решая тот же самый практический пример с игроками А, В и С с исходными данными согласно табл. 11.1, получим тот же самый результат: Rt(A)=2200; Rt(B)=2000: Rt(C)=1800.
Однако в повседневной жизни такой молниеносной сходимости ожидать не следует. Тем не менее, по итогам сезона результаты последовательного «ручного» пересчета не должны существенно отличаться от решения СЛУ. Таким образом, мы пришли к формуле, аналогичной формуле А. Эло, но уже без магических чисел, так как эта формула задает систему линейных уравнений в неявном виде.
Возможен и третий путь – не «ручной» пересчет, и не чистое решение СЛУ. Если участников очень много, турниры носят неритмичный характер, то на некоторых отрезках возможны трудности с решением СЛУ. В этом случае для расчета рейтинга на уровне федерации возможно промежуточное решение. В нем СЛУ решается по итогам отдельных микротурниров, получаются рейтинги всех участников. Далее, на уровне макротурнира, федерации вида спорта в уравнение данного i-го игрока подставляются рейтинги его оппонентов. СЛУ макротурнира решается методом последовательных приближений, что оправдано при очень большом числе участников.

Принцип 6. Средний рейтинг макротурнира задается таким, чтобы рейтинг самого слабого из участников был величиной положительной. Прогресс множества различных участников не бывает синхронным. Средний рейтинг макротурнира корректируется по изменению средней плотности расположения участников на шкале рейтинга, которая возрастает по логистической зависимости для каждого вида спорта. Новому участнику присваивается рейтинг, равный среднему рейтингу макротурнира.

Принцип 7. Факторная компенсация. Существуют факторы, влияющие на итоговый результат и создающие неравные условия для участников. Выявление значения любого фактора предполагает сравнение результатов участника до и после его воздействия при нивелировании всех остальных. Компенсация суммы таких независимых, невзаимодействующих факторов должна быть равна сумме их компенсаций.
Тогда официальным итогом соревнований будет рейтинг участника, скомпенсированный по всем выделенным факторам. Примерами факторов, создающих неравенство являются фактор своего поля в играх, фактор белого цвета в шахматах, фактор подачи в теннисе, форы в го, пол, возраст.
Д. Сонас оценивает преимущество белого цвета в шахматах в 35 пунктов рейтинга. В лыжных гонках преимущество имеет тот, кто стартует позже. Есть очевидное несовершенство формулы проведения финальных соревнований в футболе. Завершающий этап проводится по олимпийской системе. Следовательно, более слабая команда может, играя в глухой обороне, оказывать психологическое давление на соперника послематчевыми пенальти, где, как известно, шансы почти равны у всех. Более сильной команде необходимо идти вперед, раскрываться для того, чтобы избежать послематчевой лотереи. Компенсация симметрична – сколько добавили за игру на чужом поле, столько же отняли у оппонентов.
В качестве условий корректности результатов макротурнира укажем следующие:
1. Отсутствие изолированных микротурниров.
2. Исключение из рассмотрения результатов с разницей Rti – Rtj ≥ 1000.
3. Макротурнир продолжается до момента стабилизации средней плотности результатов
4. Погрешность определения рейтинга участника 2000 ⁄ (З+П) < ρ должна быть меньше среднего интервала их расположения
5. Результаты округляются до значений, соответствующих плотности.
В заключение суммируем варианты расчета рейтинга.
1. Прямое решение системы линейных уравнений. При очень большом числе участников и определенной игровой конъюнктуре могут быть проблемы с получением такого решения.
2. Итерационное решение системы линейных уравнений. Последовательный, «ручной» пересчет последующего рейтинга из предыдущего. Представляет собой процедуру усреднения последнего результата со всеми предшествующими в данном сезоне.
Rt i=( ijRtij +  i(j+1)Rti(j+1) )/( i(j+1) + ij)=
= Rtij +( i(j+1) /( i(j+1) + ij))(Rti(j+1) -Rtij)
3. Решение системы линейных уравнений в рамках локальных микротурниров и объединение полученных решений по макротурниру в целом на основе принципа трансляции в глубину:
Rt i =  i1Rti1 +  i2Rti2 . (8.7)
4. Еще один вариант итерационного решения. Решение системы линейных уравнений простой подстановкой в каждое текущих рейтингов оппонентов. Такая последовательная подстановка в изменившееся после очередного официального соревнования уравнение участника текущих рейтингов его соперников дает практически те же результаты, что и чистое решение СЛУ, но уже без тех издержек, которые всегда бывают при решении СЛУ для очень большого числа участников.
8.2. ПРАКТИЧЕСКИЙ ПРИМЕР ИСПОЛЬЗОВАНИЯ УНИВЕРСАЛЬНОЙ СИСТЕМЫ
Спорт – это борьба за результат. Если понимание результата – это разность забитых (З) и пропущенных (П) мячей (реализованных действий), то смысл игры – создать положительную разность. Участников можно расположить в порядке убывания создаваемой ими разности в поединке с виртуальным среднестатистическим соперником. Разница в их рейтингах соответствовать фактическим итогам личной встречи. Модель рейтинга должна обеспечивать эту сходимость. Для этого следует представлять рейтинг участника как его результат в годичном макротурнире, который в реальной жизни состоит из совокупности микротурниров.
Все кто занимается данным видом спорта в Голландии, Франции, России, Грузии, США и других стран сыграли каждый с каждым. Турнир в масштабах одной страны, разбиение на весовые категории – это все примеры прообраза макротурнира. Макротурнир — понятие гипотетическое. Реально по круговой системе реализовать его невозможно. Используем принцип транзитивности – если А весь сезон играл лучше Б, а Б – лучше С, то А в итоговом списке рейтинга будет стоять выше и Б, и С. В этом случае зачем А играть с С?
Из текущих результатов его участника определяют уровень игры, по которому несложно предсказать оставшиеся несыгранными результаты макротурнира. Хотя всегда есть Фома Неверующий, который захочет сыграть и проверить сходимость фактических и прогнозируемых результатов.
Определяющую роль в сходимости модели играет вид рейтинговой функциональной зависимости. Именно поиск функции с наибольшей сходимостью в разных видах спорта является наиболее трудоемким. В результате удалось, хоть и не намного, обойти в этом знаменитую таблицу коэффициентов Эло.
Сходимость также зависит от формы пересчета. Если мы пишем формулу на одного участника, потом другого, третьего, то мы последовательно выписываем систему линейных уравнений, которая имеет или не имеет решения. Многие схемы расчета (Эло, теннисные классификации) обеспечивают себе относительную спонтанную сходимость за счет подстраховки со стороны фактически получаемой системы уравнений. Для наглядности рассмотрим несколько примеров.
Рассмотрим пример из шашек. Предположим, что Вы провели в турнире 10 встреч. Если у кого-то из оппонентов нет рейтинга, то ему присваивают среднее значение – 2200. Средний рейтинг Ваших оппонентов, пусть 2500. Вы выиграли 7:3. Ваш рейтинг за этот турнир будет:
.
Но это рейтинг в этом конкретном турнире. А вообще за сезон Вы уже сыграли 30 матчей. И получили, скажем, 2700. Тогда Ваш сезонный рейтинг:
.
Пусть Ваша команда сыграла в хоккей несколько матчей. Сумма забитых и пропущенных шайб в предыдущих встречах сезона – 30, сезонный рейтинг – 2700. Вы выиграли очередную встречу 7:3 у соперника с рейтингом 2500. После этой встречи сезонный рейтинг Вашей команды изменился совершенно аналогично.
Предположим, что Вы занимаетесь боксом, не считали сезонный рейтинг, но теперь вдруг захотели это сделать. Вы провели три боя с боксером, чей рейтинг на сегодня 2500, два боя с боксером, имеющим рейтинг 2420 и только один бой против боксера с рейтингом 2300. Общий по всем шести встречам счет, определенный судьями, равен 30:20. Вам противостоял некий виртуальный боксер, на 3/6 состоящий из рейтинга 2500, на 2/6 боксирующий на 2420 и на 1/6 – 2300. Сила этого обобщенного виртуального оппонента равна
.
Вы сильнее этого виртуального соперника на 200 пунктов

Так будут считать рейтинг участники соревнований. Организаторам лучше создать программу, которая будет решать СЛУ с типичным уравнением наподобие последнего примера и ежедневно публиковать результаты в Интернете. Система прозрачна. Любой участник в любой момент может легко проверить организаторов, создав наподобие последнего примера свое уравнение и сверив свой вычисленный рейтинг с официальными данными. Нет необходимости в придумывании произвольно корректируемых коэффициентов, что повышает качество модели.
В боксе можно различать бой на дальней, средней и ближней дистанции. Это уже частные компоненты. Если боксер имеет общее соотношение 30:20, распределенное соответственно по дистанции боя – 10:2, 10:10, 10:8, то уже из этого видно, что бой на дальней дистанции явно предпочтительнее. Сходимость общей и частных сумм обеспечивает преемственность общего и частных рейтингов. Они считаются аналогично. С той лишь разницей, что накопление информации спортсмену или его тренеру придется делать самостоятельно.
Математически доказано, что нет разницы в результатах, если решать СЛУ в целом по макротурниру или же рассчитывать СЛУ на каждом турнире (компоненте), объединяя полученные результаты пропорционально их удельному весу. Считая частные рейтинги своих соперников, можно рассчитать в них соотношение ударов еще не состоявшейся встречи и сделать корректировки. В борьбе аналогично раскладываются захват, бросок и удержание. Так же можно узнать — кто чемпион, напрмер, в шахматной сицилианской защите.
В игровых видах спорта рейтинг команды аналогично раскладывается сначала по игрокам, а потом еще и по компонентам. Разница в рейтингах игроков А и Б соответствует разнице в счете команд, состоящих только из игроков А и только игроков Б.
Результативность большинства видов спорта имеет тенденцию к сокращению. Первый финальный матч чемпионата мира по футболу закончился со счетом 8:3. В наше время нулевые счета матчей в футболе стали нормой. Аналогична ситуация в боксе. С начала столетия на Олимпийских играх число ударов, фиксируемых судьями в боксе, сократилось вдвое. Как отреагирует на такое изменение рейтинг? Одним из способов можно рассматривать анализ количества активных действий – ударов. Если соотношение ударов не меняется, то на рейтинг никакого влияния это изменение не будет. Другое дело, что цена одного удара возрастает.