АA Polozov Computer model of the Russian team matches at the FIFA world cup Russia 2018 «International Journal of Physical Education, Sports and Health»2019, Vol. 6 Issue 2, Part A. Pages 35-40
Аннотация. В современном футболе существует множество разобщенных исследований различных фрагментов игры, не объединенных одной моделью. Это дает экспертной оценке тренера преимущество. Основой модели PIRS является создаваемая игроком разница в счете, которая складывается в итоговый счет команды. Поскольку играть приходится как с вышестоящими соперниками (отрицательная разность), так и нижестоящими (положительная разность), то формируется шкала рейтинга для отображения этой разности. Устойчивость рейтинговых оценок позволяет моделировать предстоящий матч. Разница в рейтингах в одно действие преобразуется в разность забитых и пропущенных мячей в личной встрече и может быть проверена на соответствие фактически полученным результатам. Игра состоит из последовательности разноплановых единоборств (> 50 компонентов), которые завершаются ударом по воротам. Баланс выигранных и проигранных единоборств в каждом компоненте в каждой паре игроков преобразуется в рейтинг игрока по этому компоненту. В расчете используются не сам факт выигрыша единоборства, а его стоимость – ожидаемое изменение счета в случае выигрыша единоборства. Рейтинг игрока по компоненту игры экспоненциально падает от числа единоборств в этом компоненте по ходу игры. Это позволяет заблаговременно распределить число единоборств в каждом компоненте так, чтобы выиграть их наибольшее число. Благодаря устойчивости рейтинговой оценки рейтинги игрока по всем компонентам могут быть получены из предыдущего матча. Исходя из распределения активности соперника по позициям игроков и компонентам игры, расстановки в ходе матча можно просчитать наиболее выгодную для своей команды расстановку, в которой будет выиграно наибольшее число единоборств. Алгоритм формирует из БД наиболее проходные комбинации в атаке и наиболее опасные атаки соперника в обороне. Итогом работы является ожидаемый предельно возможный счет игры, который должен быть на табло при выполнении игроками всех условий. Существующие Instat, Basket-stats, ICEBERG, LONGO Match PRO, FUTSALSTAT и т.д формируют головную боль тренера от статистики прошлых игр. Технология PIRS предоставляет уже просчитанные решения для наилучшего результата предстоящего матча. Тренер не сможет составить конкуренцию PIRS, поскольку информационный массив под названием футбол слишком велик для одного человека. Поэтому ресурс игры в матчах самого разного уровня использован только на две трети. При условии выполнения 50% рекомендаций команда будет получать 20 — 30% набранных очков дополнительно. Пример работы приведен на матче ЧМ 2018 сборных России и Уругвая. Результаты исследования были предоставлены в РФС.
Ключевые слова: футбол, игроки, рейтинг, единоборства, тактика
Введение. Существует ли потолочное значение результата, с которым одна команда может обыграть другую? Ответ объективно положителен. Можно не знать где он находится, но интуитивно мы понимаем то, что он есть. Если он есть, то насколько далеко расположен от обычного уровня игры? Насколько к нему близки современные тренеры?
Человек может жить до 120 лет. Есть примеры людей, доживших до 116-117 лет. То есть планка достижима. Мы это видим на отдельных примерах. Однако в России мужчины живут до 60-65 лет. Мы все привыкли к тому, что 50% рубеж – это норма. В среднем, каждые 10 лет продолжительность жизни растет на 3 года. Мы медленно двигаемся к потолку своих возможностей. Осталось еще лет 200. Однако, когда автор показывает потолок результата тренеру команды, то обычно это вызывает недоверие.
Существует ли возможность вычислить ожидаемый счет матча при различных расстановках и сценариях игры? Каким станет счет предстоящего матча, если перейти на игру в три центральных защитника?
Проблема исследования.
Работа [9] рассматривает тактику игры как предложение партнеру, владеющему мячом, наибольшее число вариантов продолжения игры.
Авторы исследовали [10] успехи сборной Индии до 17 лет на турнире ФИФА и пришли к выводу о том, что необходимо иметь как можно больше наступательных стратегий и тактик.
Авторы часто обожествляют ИТ-возможности [11], полагая, что они сами по себе решат все проблемы. «Previously, performance analysis relied mainly on frequency distributions of certain game events. In contrast, the novel approaches allow calculating more complex metrics. This helps tomeasureandidentify the performance of teamsandindividual players and especially how teams interact”. Большие возможности ИТ фактически не работают. Авторы предложили всего три критерия игры: объем контролируемого игроком пространства, число отсеченных от ворот обороняющихся соперников и скорость перемещения игрока.
“We develop a dynamic model based on the Poisson difference (Skellam) distribution which simultaneously models the two different point scoring mechanisms in Australian Rules Football, the motivation for which comes from work on predicting outcomes in soccer matches. Our model is developed in a Bayesian framework and is fitted using the Stan modelling language. Model validation is performed on the 2015 Australian Football league (AFL) home and away season” [12].
“The application of continuous attacks is dominant, beginning by cutting a pass and winning «the second ball» on the opponent’s half, while the final pass is in most cases the centre and back lateral passing”. Однако авторы [13] высказывают надежду в дальнейшем найти более серьезные критерии игры.
Авторы [14] пытаются анализировать геометрические аспекты игры: центр тяжести игры и эффективная площадь игры.
В связи с бедной в содержательном плане научной базой в футболе будет уместна аналогия из баскетбола. Существует ряд конкурирующих показателей полезности игрока в баскетболе и соответствующий ему коэффициент корреляции с результатами игр:. коэффициент полезности ПБЛ (0,89), КПИ (0,37), EuroКПИ (0,37), КРП (0,9), NBA+\- (056), ЛКПИ (-0,17). Технология PIRS определяет стоимость единоборства из статистики игры и поэтому корреляция с результатом игры будет практически единица. Чтобы сравнение с другими технологиями было корректно, использовали эти показатели из предыдущих матчей участников. В этом случае PIRS дала 0,93 корреляцию с результатами игр. [4] Такие низкие коэффициенты корреляции объясняют нам — почему до сих пор экспертная тренерская оценка имеет приоритет над оценкой аналитиков.
В уже далеком 1997 году Полозов А.А. опубликовал статью [2], в которой была показана принципиальная возможность для существования компьютерной версии предстоящего матча. В 2003 году ИФКСиМП УрФУ закончил С.Л. Скорович, нынешний тренер сборной России по мини-футболу. Тогда мы сотрудничали в работе над его дипломным проектом. С 1998 по 2014 голы сборная России ни разу не выиграла у сборной Испании. Наше сотрудничество продолжилось. Тема моделирования игры сборной оказалась востребованной. Сегодня в активе сборной России уже есть две победы над сборной Испании. И еще лидерство в мировом рейтинге сборных по футзалу. Далее опыт работы со сборной был инвестирован в другие игровые виды спорта.
Почему тренеру сложно управлять игрой? Информационный массив под названием игра слишком велик, чтобы им мог управлять один тренер.
Если спросить Вас:
«кто лучший и кто худший игрок Вашей команды?», то ответ будет однозначный.
«кто Вас 6-й по уровню игры?», то ответа уже, скорее всего, не будет.
«кто 5-й в координационном обыгрывании» — тем более
«кто 5-й в координационном обыгрывании после 10 минут игры?» — вряд ли. И т.д.
Мы все априори приписываем себе способность к тонко дифференцированному ранжированию игроков по уровню игры, однако такой способностью реально не располагаем. Поэтому большая часть игры остается на усмотрение самих игроков. Трудно поверить, что тренер может, например, назвать изменение результата матча от перевода игрока с одной позиции на другую, выразить одной цифрой тактический эффект команды в прошедшем матче. Это за пределами возможностей обычного человека. В этой ситуации на помощь тренеру приходят тренеры-аналитики (Instat, Basket-stats, ICEBERG, LONGO Match PRO, FUTSALSTAT и т.д.) Они считают технико-тактические действия (ТТД), которые для близких по силам команд не имеют корреляции с результатами игр. Instat, Basket-stats не способен ответить на конкретные вопросы. Какой счет будет при данном сценарии игры? Насколько меньше обыгрываний игрок А выиграет у С в начале игры и в конце? Сколько забьет игрок с данной точки поля из неудобного положения? Наш разговор с оппонентами всегда заканчивается на этом месте.
Целью настоящего исследования было определение потолочного значения результата матчей по футболу высшего уровня на основе созданной технологии моделирования результата. В дальнейшем мы будем ее сокращенно называть PIRS (Polozov Information Rating System). Так ее сокращенно между собой называют мои магистранты.
Методика работы. Рассмотрим некоторые проблемы игровой аналитики.
1. Игра состоит из последовательности единоборств, позволяющих приблизится к воротам и реализации созданного момента. Для определения фактического значения стоимости нам следует понимать — как оценивать реализацию голевого момента.
Рис. 1. Распределение индекса по футбольному полю [1]
Представим себе, что мы находимся в некоторой точке поля и хотим попасть в щит. Назовем индексом φ=(α*β)/r точки поля произведение вертикального угла α и вертикального угла β обзора щита, деленного на r – расстояние до кольца.
Между вероятностью забить с данной точки поля в данном матче есть связь: р =1-(exp(-φo/А)), где А=70-200 (для России), Любое действие на поле теперь мы можем оценить по приросту такой вероятности. Далее этот прирост мы называем стоимостью единоборства. Другая сторона дела – как оценивать игрока по реализации бросков. Значение А – среднее для игроков данного турнира. На каждый бросок игрока в матче можно посчитать среднее значение вероятности забить. Так к концу игры мы получим ожидаемое число набранных очков по средней оценке и фактически набранное игроком. Вот разница этих двух цифр и есть оценка.
2. Другой проблемой аналитики гандбола следует считать смешивание технико-тактических действий (ТТД) и технико-тактических единоборств (ТТЕ). ТТД можно набирать даже тогда, когда соперника на поле нет вовсе. Поэтому они больше создают информационный шум, чем помогают оценке. Корреляция с результатами игр, обычно ниже 0,5. Нужно перейти от оценок ТТД в ТТЕ. Их не менее 30. Это передача за спину, обыгрывание (скоростное, координационное, силовое), контроль мяча в ситуации когда его пытаются выбить, верховые единоборства, перехват передачи, заслоны и т.д. Существует силовое, координационное и скоростное обыгрывание. Помимо этих общеизвестных компонентов есть менее активно используемые – блокирование броска, восстановление позиции после проигранного единоборства, заслон. ТТЕ учитываются только в качестве потерь мяча и заносятся в качестве самостоятельного компонента.
3 Необходимость отображения полученных результатов на абстрактную шкалу рейтинга. Если игрок А выиграл у игрока В 5 единоборств из 10 в одном из компонентов игры в матче с одной командой, то каким будет это соотношение в матче с игроком С, который играет в следующей по календарю команде соперников? Без этого не создать модель. Здесь ключевое соображение в том, что разность, создаваемая командой, состоит из разностей, создаваемых ее игроками. Поэтому нам надо расположить команды по шкале рейтинга на расстоянии, соответствующему их счету на личную встречу. Тогда игроков можно расположить на ней же. Был создан сайт www.ra-first.com, [8] на котором был раздел по баскетболу. Текущие результаты всех клубных и сборных команд получали с соответствующих сайтов и затем трансформировали в рейтинг в режиме онлайн. Чтобы доказать состоятельность концепции формировали прогноз на ближайший матч. Рейтинги команд задавали средние значения рейтингов ее игроков.
4. Уровень игрока переводится в рейтинг и строится по каждому компоненту. Рейтинг игрока падает в ходе игры от числа единоборств. Только делает это с разной скоростью. Есть «легкие» единоборства, не связанные со значительными затратами сил. Есть «тяжелые». Выяснение динамики убывания для каждого компонента игры каждого игрока не представляет собой трудности. Полученные результаты позволяют переделить матчевую нагрузку среди игроков. Нагрузка дается сильным игрокам до тех пор, пока их уровень не сравняется с уровнем остальных партнёров. Этот режим нами называется эквипараметрическим. Это такое распределение числа единоборств по игрокам, при котором будет выиграно наибольшее число единоборств в матче. Игроку необходимо дать такое распределение в сравнении с его обычным числом единоборств.
Рис. 2. Рейтинги игроков и тактика
5. Тактический эффект. Часто бывает так, что игроку следует набрать некоторое число единоборств в обороне, но на его позиции их недостаточно. Алгоритм переставляет игрока на другую позицию, где он доберет необходимое число единоборств в данном компоненте. В итоге алгоритм переставляет игроков на протяжении всей игры, что дает существенно больше выигранных единоборств. Соответственно, игроку надо написать — когда он выходит, против кого играет в атаке и обороне. Для этого надо использовать режим замен и расстановку команды соперника в предыдущем матче. Тогда в итоге формируется таблица на каждую минуту матча с расстановкой соперника и своей команды в атаке и обороне.
6. Комбинации своей команды. Существует порядка 400 комбинаций, на долю которых приходится свыше 90% всей результативности игры. Комбинация состоит из последовательности единоборств и реализации созданного голевого момента. Вероятность забить мяч равна произведению вероятностей выиграть всю последовательность единоборств, забить с данной точки поля. Вероятность формируется из рейтинга, который убывает от числа единоборств. Под выгодным разменом здесь и далее понимаем единоборство игроков с наибольшим преимуществом в соответствующем рейтинге (наибольшими шансами выиграть это единоборство). Алгоритм подбирает наиболее выгодные размены и объединяет их в комбинации. Эффект комбинаций состоит в том, что Вы играете не с самыми слабыми соперниками из числа соперников самыми сильными своими. Это дает дополнительный рост результата. [5]. Более подробно аспекты обсуждаются в [5,12].
Экспериментальная часть.
Исследование было проведено на примере участия сборной России по футболу на ЧМ-2018. Это исследование было сделано дважды: в сезоне 2016/17 и 2017/18, когда уже стали известны соперники по группе. За 3 месяца до начала ЧМ 2018 мы опубликовали предварительные данные исследования [6]. Однако в той ситуации мы не могли публиковать ряд оценок.
6-1-27-940
Рис. 3 Состав сборной России на ЧМ-2018 по исследованию 2016/17
В сезоне 2017/18 посмотрели игры:
Локомотив — ЦСКА Дата: 5 ноября 2017 Счет: 2 – 2
Краснодар – Зенит Дата: 24 сентября 2017 Счет: 0 – 2
Ростов – Спартак Дата: 28 октября 2017 Счет: 2 – 2
Урал – Тосно Дата: 24 сентября 2017 Счет: 3 – 1
Уфа – Рубин Дата: 30 октября 2017 Счет 2 – 1
Ахмат – Арсенал Дата: 21 августа 2017 Счет 1 – 2
Амкар –Динамо Дата: 24 ноября 2017 Счет 2 — 1
Получены данные по игре 202 футболистов, половина из которых только 104
имеет паспорт РФ. По итогам сформировали состав сборной России
Алгоритм перераспределяет нагрузку (число единоборств) в пользу сильного игрока до тех пор, пока он не сравняется со всеми остальными. В этом случае общее по всем компонентам число единоборств игрока становится критерием силы игрока. Это позволяет сравнивать рассчитанное число матчевых единоборств игрока одной из команд в атаке с числом рекомендованных матчевых единоборств в обороне у игроков соперника. Можно наметить выгодные размены и сформировать из них комбинации. Это упрощенное представление о работе алгоритма.
Таблица 5. Рекомендуемое число единоборств в атаке и в обороне каждому из отобранных игроков в сравнении с их обычной матчевой нагрузкой за клуб.
Игрок Рекомендуемое в атаке Фактически Рекомендуемое в оборона Фактически
Игнатьев 30,9 27 45 34
Комбаров 22,3 28 22 25
Ан. Миранчук 26,0 22 46 31
Дзюба 26,7 9 36 34
Ал. Миранчук 32,4 34 38 33
Денисов 31,0 33 28 15
Фернандес 45,6 41 20 27
Жирков 24,7 16 41 29
Кутепов 29,3 30 18 12
Гранат 16,1 21 6 6
Таблица 6. Рекомендуемый состав России и ожидаемый состав Уругвая. Выгодные размены. Приведены номера игроков и рекомендуемое им число единоборств (ed).
19 ed 42 ed
№2 №3
№81 №60 19 ed
24,7 26,0 №22
26 ed №2
№20 №13 45,6
30,9 еd 13 ed 42 ed
№4 31 ed №15
№23 №6 26 ed
22,3 №22 №9
№23 26,7ed №59
10ed 32,4
14 ed
№21
№18 №3 №27
29,3 ed 16,1ed 31,0ed
Рис. 4. Рекомендуемая комбинация для сборной России с итоговой вероятностью забить гол 8% при средней эффективности ее атак 1%.
Рис. 5 Состав сборной России на ЧМ-2018 по исследованию 2017/18
Из рис.5. можно видеть среднюю для суперлиги РФПЛ стоимость единоборств игроков разного амплуа. Если вы на позиции центрального защитника выиграли атакующее единоборство, то он даст Вам 0,006 гола, а вот если проиграли в обороне – то сразу 0,016 гола.
Рис. 6 Стоимость выигранного и проигранного единоборства в РФПЛ 2016-18 для 1 – центральных защитников, 2 – крайних защитников, 3 – опорных полузащитников, 4 – полунападающих, 5 – нападающих.
Таблица 5 Сравнение состава сборной по исследованию.
Сборная «PIRS» Рейтинг Сборная С. Л. Черчесова Рейтинг
Дзагоев 3784 Дзагоев 3784
Гранат 3685 Гранат 3684
Комбаров 3656 Газинский 2526
Васин 3588 Ерохин 3064
Игнатьев 3575 Ал. Миранчук 2948
Джикия 3533 Фернандес 3317
Денисов 3409 Семенов 3362
Полоз 3232 Кудряшов 2987
Дзюба 3209 Смолов 3059
Ан. Миранчук 3209 Ан. Миранчук 3209
Средний рейтинг 3488 Средний рейтинг 3194
Разница в рейтинге составляет 294. Отсюда ожидаемый результат игры
Сборная PIRS : Сборная РФС
1.94 : 1,06 = +0,8
Сборная РФС благодаря выбору С.С. Черчесова слабее сборной «PIRS» на 0,8 гола на их личную встречу.
Удалось экспериментально установить тактический эффект при переходе с 4 защитника на 5 на примере матча Россия – Уругвай. Моделирование игры Россия – Уругвай в 4 и 5 защитников дала очень существенную разницу в балансе забитых и пропущенных мячей.
Россия PIRS (4 защитника) – Уругвай 1.38 : 1.56
Россия PIRS (5 защитников) – Уругвай 1.50 : 0.80
В ходе исследования выявили, что для игры сборной в пять защитников прирост результата равен 0.9 гола.
Таблица 3. Ожидаемый счет матча Россия – Уругвай на ЧМ-2018 при различных сценариях
Ожидаемый счет матча Россия — Уругвай Налагаемые условия
1,50 : 0,80 Технология PIRS при игре сборной в 5 защитников
1,77 : 1,49 Состав РФС по технологии PIRS 5 защитников
1,38 :1,56 Состав РФ PIRS при игре команды в 4 защитника
1,28 :1,98 Состав РФС без PIRS при игре команды в 5 защитников
0,30 : 2,20 Сборная РФС по всем играм за последний год
Таблица 4. Предполагаемый прирост разности З и П голов на игру РФ – Уругвай на ЧМ-2018 от воздействия разных факторов
Прирост ПРИЧИНЫ
0,80 Потери в результате от выбора состава сборной РФ
0.88 Прирост результат при переходе от 4 защитника в 5 защитников. Ресурс тренера С.С. Черчесова
0.98 Прирост результата при использовании технологии PIRS
2,66 Общие потери в результате матча.
Прирост в 726 пунктов по рейтингу дает сборной возможность для перехода с 60 место на 12, выходу в ¼ ЧМ 2018
Почему тогда это предельный уровень практически недостижим?
— Игроки могут не воспроизвести свой уровень игры
— Игроки могут не запомнить слишком много информации
— Соперник может поменять свою игру
— Динамичность игры и невозможность ее полной детерминированности.
— Игроки привыкли к определенному шаблону своей игры в команде и т.д.
Для преодоления всех этих сложностей необходимо создавать под каждого очередного соперника свой шаблон игры и осваивать его на тренировке. Возможно, через некоторое время гандболисты станут также как звезды сериалов одевать наушник на игру, через который тренер будет им
ВЫВОДЫ:
1. Компьютеры лучше человека играют в шахматы, го и другие игры. Игровые виды спорта – на очереди. Информационный массив под названием футбол слишком велик для того чтобы его мог эффективно контролировать один тренер. Ресурс этой игры использован только на две трети. Это невостребованный тактический ресурс игры — предел возможности тренеров. Теперь время состязания информационных алгоритмов. Соревнование тренеров превращается в соревнование аналитических групп.
2. Предложенная автором информационная рейтинговая технология (PIRS)
основана на приоритетной для игровой деятельности разности забитых и пропущенных голов
представляет собой простое универсальное линейное решение сложной задачи
позволяет определить потолочное значение результата игры с данным соперником исходя из его расстановки и распределения единоборств по позициям игроков.
Формирует ответы в понятном формате преимущества в счете
Существует ряд других конкурирующих показателей полезности игрока, однако их показатели корреляции с результатами игр ниже уровня экспертной тренерской оценки и такой способностью к созданию компьютерной версии предстоящего матча как PIRS они не располагают. Технология лучше себя проявляет на уровне сборной, где тренеру сложнее работать из-за большого числа игроков.
3. Предельный результат практически недостижим из-за информационной сложности в использовании сразу большой группы людей. Необходимо создавать под каждого очередного соперника свой шаблон игры и осваивать его на тренировке, а не использовать один универсальный вариант игры.
Литература:
Полозов А.А. «Система рейтинга в игровых видах спорта…»./ УГТУ-УПИ, Екатеринбург , 1995 г., 206 c.
Полозов А.А.. Предстоящий матч. Компьютерная версия / Теория и практика… 1997 — №3.
Полозов А.А. Рейтинг в спорте: вчера, сегодня, завтра /. – М.: Советский спорт, 2007 – 316с.
Буров И. В, Полозов А. А., Альтернативное статистическое сопровождение матчей по баскетболу/ Журнал «Научные проблемы гуманитарных исследований» №11 2011. с. 90. ISSN 2071-9175
Handbook of Ratings. Approaches to Ratings in the Economy, Sports, and Society / A. Karminsky. A. Polozov/ International Publishing house “Springer”, 2016., 360c.
Информационная модель футбола на примере участия сборной России на ЧМ 2018 А.А. Полозов, З.Ф. Газимова, М.В. Краев Уральский федеральный университет имени первого Президента России Б.Н. Ельцина, г. Екатеринбург, Россия Human. Sport. Medicine 2018, vol. 18, no. 1, pp. 138–148
YouTube «CSKA Tottenham 0: 1. UEFA Cup. But CSKA can win this match». 2016
www.ra-first.com
Functional analysis of marker loss in football / LOSQUIÑO, TONI DÍAZ; SANTESMASES, JOSEP SOLÀ /Apunts: Educació Física i Esports. abr-jun2018, Issue 132, p 60-71. 12р.
Analysis of the effectiveness of the Indian soccer team at the FIFA U-17 World Championships / Jamshad K. K. Muhammad , Dr. Pravene A. / Asian Journal of Multidimensional Research (AJMR) d2018, Volume: 7, Issue: 2 p. 667-67. ISSN: 2278-4853.
Match analysis, Big Data and tactics: current trends in elite soccer. / Memmert D, Rein R. Dtsch / Z Sportmed. 2018; 69: 65-72.
Dynamic Bayesian prediction of the results of the AFL mapping using the Skellam distribution / А. А. Мандерсон К. Мюррей BA Turlach / Australian and New Zealand Journal of statistics, №6 2018, t 60(2), pp. 174-187
Tactics of attack of football teams in the champions league knockout phase in seasons of 2015/2016 and 2016/2017. /Leontijević, Bojan; Janković, Aleksandar; Tomić, Lazar/ Physical Culture / Fizicka Kultura . Dec2017, Vol. 71 Issue 2, p137-144. 8p.
Measuring Tactical Behavior Using Technological Metrics: Case Study of a Football Game /Filipe M. Clemente, Micael S. Couceiro, Fernando M. L. Martins/
International Journal of Sports Science & CoachingVol 8, Issue 4, 2013