Спросить
Войти

ВЕРОЯТНОСТНО-СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ В КОМАНДНЫХ ВИДАХ СПОРТА

Автор: Т.М. Панеш

На примере анализа динамики показателя Херста, описанном ранее, удалось предсказать поведение изменения стоимости ценных бумаг. Следующим шагом в подтверждении актуальности и достоверности гипотезы фрактальных рынков будет построение числового прогноза с использованием модели ЛЯИМЛ.

Библиографический список

1. Калуш Ю.А, Логинов В.М., Показатель Хёрста и его скрытые свойства. Сибирский журнал индустриальной математики, 2002 г., том 5, номер 4, 29-37 с.
2. Александровская Ю.П., ИСПОЛЬЗОВАНИЕ ФРАКТАЛЬНЫХ МЕТОДОВ ДЛЯ АНАЛИЗА ФИНАНСОВЫХ РЯДОВ. Вестник Казанского технологического университета, 2014 г. 257-261 с.
3. Лонг Д., Титор П., К Книга рецептов. 2020г.

ВЕРОЯТНОСТНО-СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ В КОМАНДНЫХ ВИДАХ СПОРТА

Т.М. Панеш

Кубанский государственный университет ул. Ставропольская 149, 350040, г. Краснодар, Россия

Аннотация

Игровые командные виды спорта - это огромная индустрия, сравнимая с традиционными экономическими отраслями. В числовом выражении это десятки и десятки миллиардов долларов. Естественно, такая отрасль для эффективного принятия решений требует научного, в том числе и математического подхода. В рамках данной работы было проведено аналитическое исследование результатов игр команд по футболу «Российской Премьер-Лиги» (РПЛ) сезона 18-19. Во время исследования были применены методы многомерного статистического анализа в среде пакета БТАИБИСЛ.

Рейтинг эффективности команд в чемпионате был

построен с помощью кластерного анализа, который также позволил выделить группы однородности команд по итогам проведенного чемпионата. В качестве ключевых показателей, характеризующих эффективность команд в чемпионате, были выбраны: G (голы); GA (пропущенные голы); xPTS (ожидаемые очки); xG (ожидаемые голы); xGA (xG соперника); PPDA (интенсивность прессинга); OPPDA (PPDA соперника); DC (передачи в радиус 18 метров от ворот); ODC (DC соперника); Total (среднее количество забитых мячей во всех матчах, с участием этой команды); T(1t) (Total по первому тайму); Т(2т) (Total по второму тайму); IT (индивидуальный тотал); IT(1t) (IT по первому тайму); IT(2t) (IT по второму тайму); Corners (среднее количество угловых); FK (среднее количество штрафных ударов); Sh (среднее количество ударов по воротам); ShT (среднее количество ударов в створ ворот); Pos (среднее количество процентов владения мячом). Данные были взяты с англоязычных сайтов Understat.com и nb-bet.com [2, 3]. Команду, которая аккумулирует наилучшие значения ключевых показателей по всем командам чемпионата назовем условным лидером (У Л): G = 57; GA = 23; xG = 51,34; xGA = 24,68; xPTS = 56,47; PPDA = 6,92; OPPDA = 15,44; DC = 331; ODC = 143; T = 2,9; T(1t) = 1,2; T(2t) = 1,9; IT = 1,9; IT(1t) = 0,8; IT(2t) = 1,3; Corners = 6; FK = 19; Sh = 17,6; ShT = 5,8; Pos = 58.

На дендрограмме (рис.1), построенной методом иерархической классификации, выделены кластеры - группы однородности команд.

Кластер под номером 1 состоит из команд фаворитов турнира: Краснодар, ЦСКА, Зенит, Локомотив и УЛ. Именно эти команды наиболее близки к лучшим значениям используемых показателей. Наибольшее сходство в этом кластере у Краснодара и УЛ - они объединяются в кластер при расстоянии менее 1,5. Далее при расстоянии чуть более 1,5 к ним примыкает ЦСКА и только затем Зенит. Кластер под номером 2 можно назвать кластером команд среднего уровня, так как он состоит из команд, которые сражались за места в середине турнирной таблицы -Спартак, Арсенал, ФК Оренбург, Урал, ФК Ахмат, Рубин, ФК Уфа, ФК Енисей, Крылья Советов, ФК Ростов, Динамо. Из команд данного кластера выделяется Спартак, который находится

ближе всех к кластеру команд фаворитов. Кластер под номером 3 единолично образует наиболее слабая по итогам чемпионата команда Анжи.

Зенит ФК Краснодар -é УЛ ЦСКА Локомотив

Спартак Арсенал

ФК Оренбург Урал ФК Ахмат Рубин

Рисунок 1. Кластерная структура.

Метрический подход [2] - каждая команда представляется точкой многомерного пространства в системе координат показателей, характеризующих эффективность команды на чемпионате, позволяет ранжировать их по степени сходства с УЛ. Чем меньше расстояние от команды до УЛ, тем выше место в рейтинге. В табл.1 отображены расстояния, рейтинг команд и места команд, занятые на чемпионате.

В целом, рейтинг команд и фактически занятые в турнире места непротиворечивы. Обоснованием такого утверждения является высокое значение коэффициента корреляции Спирмена, равное 0,897.

Регрессионная модель предсказания количества забитых мячей была построена по 8 показателям - PPDA, OPPDA, DC, Corners, FK, Sh, ShT, Pos. Выбор обоснован тем, что именно, эти показатели влияют на количество забитых мячей. Уравнение, составленное модулем Множественная регрессия, имеет вид: Предск. Голы = - 1,9-Sh + 0,7-Corners + 0,09-DC + 15,7-ShT -0,7-Pos + 0,85-FK + 1,1-OPPDA + 2,16-PPDA - 40,7

Таблица 1 — Расстояние между командами и УЛ

Команда Расстояние до УЛ Рейтинг команд Фактическое место

ФК Краснодар 1,4 1 2

ЦСКА 2 2 4

Команда Расстояние до УЛ Рейтинг команд Фактическое место

Зенит 2,4 3 1

Локомотив 2,8 4 3

Спартак 3,9 5 5

Динамо 5 6 12

Арсенал 5,6 7 6

ФК Оренбург 5,6 8 7

ФК Ростов 5,9 9 9

Урал 6,3 10 10

ФК Ахмат 6,5 11 8

Крылья Советов 6,5 12 13

ФК Уфа 7,2 13 14

Рубин 7,3 14 11

ФК Енисей 7,3 15 16

Анжи 10,3 16 15

Коэффициент детерминации, равный 0,82 говорит об адекватности моедли. Наибольший вклад в предсказание вносит такой показатель, как ShT (удары в створ), так как он имеет наибольший стандартизованный регрессионный коэффициент (1,23). Это довольно логично, ведь чем больше команда нанесет ударов в створ ворот, тем выше шанс забить гол. Из таблицы 2 мы можем увидеть, что у Зенита и Арсенала разница примерно равна 8, а у ФК Оренбург - 9. Такая разница может объясняться тем, что в данных командах играют очень хорошие исполнители, которые смогли реализовать большинство своих моментов.

Факторным анализом было выделено 2 фактора, определяющих эффективность команд в чемпионате. Из табл. 3 видно, что Фактор 1 имеет высокие факторные нагрузки (корреляции между показателями и выделенными факторами) по показателям, которые отвечают за созидательную и атакующую часть игры (GA, xG, xGA, xPTS, PPDA, DC, ODC, Corners, Sh, ShT). Фактор 2 имеет высокие факторные нагрузки по показателям (T, T(2t)), которые несут в себе информацию о результативности матча в целом.

Таблица 2 - Предсказанные значения и остатки

Команда Голы Предск. Голы Остатки

ФК Краснодар 55 56,5 -1,5

Команда Голы Предск. Голы Остатки

Зенит 57 49,6 7,4

ЦСКА 46 46,3 -0,3

Локомотив 45 42,0 3,0

Спартак 36 41,4 -5,4

Динамо 28 36,4 -8,4

Урал 33 36,2 -3,2

ФК Ахмат 28 33,5 -5,5

Арсенал Тула 40 31,8 8,2

ФК Оренбург 39 30,0 9,0

ФК Ростов 25 29,6 -4,6

Крылья Советов 25 25,2 -0,2

ФК Енисей 24 24,6 -0,6

ФК Уфа 24 21,9 2,1

Рубин 24 20,8 3,2

Анжи 13 16,2 -3,2

Таблица 3 - Факторные нагрузки

Показатель Фактор 1 Фактор 2

G 0,67 0,64

GA -0,92 0,14

xG 0,72 0,63

xGA -0,93 0,21

xPTS 0,91 0,30

PPDA -0,75 -0,43

OPPDA 0,48 0,38

DC 0,72 0,40

ODC -0,86 0,04

T 0,01 0,96

T(1t) 0,43 0,62

T(2t) -0,19 0,85

IT 0,65 0,67

IT(1t) 0,65 0,59

IT(2t) 0,55 0,70

Corners 0,87 0,22

Sh 0,77 0,43

ShT 0,74 0,52

FK 0,00 0,42

Pos 0,70 0,54

Таким образом, в данной работе с помощью кластерного анализа построен рейтинг эффективности команд РПЛ сезона 1819. Полученный рейтинг можно использовать для создания альтернативной турнирной таблицы. Построена регрессионная модель ожидаемых забитых мячей. По данной модели можно судить, насколько команда реализовала в чемпионате свой потенциал. Факторный анализ, позволил выявить факторы созидательной, атакующую часть игры и результативности матча в целом.

Библиографический список

1. Understat URL: https://understat.com (дата обращения 11.11.2019)
2. Халафян А.А., Кошкаров А.А., Пелипенко Е.Ю. Сравнительная оценка эффективности вузов методами классификационного анализа // Фундаментальные исследования. 2016. № 5. С. 58-64.

РАСПРЕДЕЛЕННАЯ СИСТЕМА СБОРА ЗНАНИЙ В ЗАДАЧАХ ОБУЧЕНИЯ ИСКУССТВЕННОГО

ИНТЕЛЛЕКТА

А.С. Сысоев, Н.Ю. Добровольская

Кубанский государственный университет ул. Ставропольская 149, 350040, г. Краснодар, Россия

Аннотация

В рамках данной работы разработана распределённая система сбора знаний для обучения технологии искусственного интеллекта. Пользователи, работая в клиентском приложении, пополняют знаниями интеллектуальную систему для того, чтобы эти данные были проверены с помощью статистических методов и загружены в «мозг» технологии искусственного интеллекта для оживления персонажа.

С появлением кибернетики, компьютеров и компьютерных систем, которые стали называть интеллектуальными системами (ИС), с развитием такого направления, как искусственный интеллект (ИИ), мышление, интеллект, а затем и знания стали предметом интереса математических и инженерно-технических дисциплин.

командные виды спорта футбол кластерный анализ факторный анализ прогнозирование при помощи множественных регрессионных моделей.
Другие работы в данной теме:
Контакты
Обратная связь
support@uchimsya.com
Учимся
Общая информация
Разделы
Тесты