Scientific journal
Scientific Review. Technical science
ISSN 2500-0799
ПИ №ФС77-57440

PREDICTING THE RESULTS OF WORLD WINTER UNIVERSIADE 2019 USING NEURAL NETWORKS

Krutikov A.K. 1
1 Vyatka State University
The article describes the forecast made with the help of a prototype program based on artificial neural networks. As the main neural networks are used generalized regression neural network and neural network with radial basis functions. The structure of the prototype program and the basic system requirements for its operation are presented. The forecast was made regarding the team place in the unofficial team competition of the world winter Universiade 2019 in the city Krasnoyarsk, for four countries: the Russian Federation, the Republic of Kazakhstan, the Republic of Korea (South Korea) and the people’s Republic of China. A training sample consisting of a set of vectors of statistical data in the form of real numbers is compiled for the forecast for each national team. An approach to creating a training sample for neural networks training is described. The graphs characterizing the statistical data of the training sample and the results of the forecast are presented. The prototype of the program with which the experiments were carried out is described. The prospects of further research in this direction, the need to analyze a set of factors and parameters in sports forecasting. Obtained as a result of experiments, the forecast data can be used by experts in the field of physical culture and sports.
artificial neural network
athletic performance
forecast
forecasting
neurons
training set
sports
the world University games
Universiade-2019
the team
experiment

Спортивное прогнозирование – процесс предсказания, необходимый для планирования в процессе спортивной подготовки и работы в сфере спорта. Планирование в спорте на основе прогнозов используется различными специалистами в сфере физической культуры и спорта, тренерскими штабами, селекционерами, «скаутами» команд, аналитическими и букмекерскими агентствами.

Прогнозирование в спорте различается по срокам и может быть краткосрочным, среднесрочным, долгосрочным и сверхдолгосрочным. Вид и результат прогноза в спорте может быть различным и в зависимости, от цели, таким результатом может быть как определенный численный результат, процент вероятности исхода того или иного состязания, так и указание наступления конкретного события во временных рамках состязания. Однако, вне зависимости от вида прогноза и ожидаемого результата, спортивное прогнозирование требует анализа набора факторов, на него влияющих. Компьютерные технологии и современные методы искусственного интеллекта позволяют производить такой анализ факторов и осуществлять прогнозирование, получая при этом результат. Ряд исследователей в области искусственного интеллекта используют в качестве инструмента прогнозирования нейронные сети [1]. Существующие модели нейронных сетей обладают способностью к обобщению, выявлению зависимостей в имеющихся объемах данных [2], что является важными свойствами при обработке данных, необходимых для корректных прогнозов в спорте.

В качестве основных моделей нейронных сетей в данной работе используется обобщённо-регрессионная нейронная сеть и радиально-базисная нейронная сеть. Обобщенно-регрессионная сеть успешно проявила себя при прогнозировании индивидуальных результатов спортсмена этапа спортивного совершенствования [3] и при прогнозировании исхода боксерского поединка за титул чемпиона мира [4], эксперименты с использованием нейронной сети с радиально-базисными функциями, в качестве инструмента прогнозирования, в виде спорта легкая атлетика, также завершились достаточно точными результатами [5].

В данной работе произведен спортивный прогноз, основой которого является определение командного места и количества золотых медалей в неофициальном командном зачете всемирной Зимней Универсиады 2019 г.. Прогноз произведен за месяц до данного события. Зимняя универсиада 2019 – традиционные Всемирные студенческо-молодёжные спортивные соревнования, которые проходят с 2 по 12 марта 2019 г. в российском городе Красноярске. Ранее зимние Универсиады ни в СССР, ни в России не проводились [6]. Неофициальный командный зачёт (НКЗ) – распространённая система оценки результатов национальных команд на Олимпийских играх. Цифры неофициального командного зачёта активно используются различными средствами массовой информации, представителями национальных спортивных федераций и национальных олимпийских комитетов, другими заинтересованными сторонами [7].

Материалы и методы исследования

Обобщенно-регрессионная нейронная сеть устроена аналогично вероятностной нейронной сети и предназначена для решения задач регрессии, а не классификации. В точку расположения каждого обучающего наблюдения помещается гауссова ядерная функция. Каждое наблюдение свидетельствует о некоторой уверенности в том, что поверхность отклика в данной точке имеет определенную высоту, и эта уверенность убывает при отходе в сторону от точки. Сеть копирует внутрь себя все обучающие наблюдения и использует их для оценки отклика в произвольной точке. Окончательная выходная оценка сети получается как взвешенное среднее выходов по всем обучающим наблюдениям, где величины весов отражают расстояние от этих наблюдений до той точки, в которой производится оценивание [8]. Сеть радиально-базисных функций – искусственная нейронная сеть, которая использует радиальные базисные функции как функции активации. Выходом сети является линейная комбинация радиальных базисных функций входов и параметров нейрона. Сети c радиально-базисными функциями моделируют произвольную нелинейную функцию с помощью всего одного промежуточного слоя [9].

Научными сотрудниками лаборатории «Интеллектуальные системы» Вятского государственного университета был разработан прототип системы прогнозирования спортивных результатов, предполагающая использование нескольких различных модулей, содержащих нейронные сети разных моделей. Нейронные сети, располагающиеся в модулях разработанной системы, тестируются в различных видах спорта и в прогнозах разного временного промежутка. При настройке нейронных сетей используются уникальные параметры каждой из них, такие как структура, целевая ошибка обучения, число эпох обучения, использование нескольких возможных алгоритмов обучения. Каждая нейронная сеть оценивается по точности результатов прогноза и по минимальной среднеквадратичной ошибке обучения.

Стоит отметить что в ряде нейронных сетей, в том числе в сети с радиально-базисными функциями, в качестве одного из критериев оценки используется ошибка обобщения, необходимая при возникновении нулевой ошибки обучения. Это связано с тем, что при низкой или нулевой минимальной среднеквадратичной ошибке обучения, сеть в некотором смысле «заучивает» параметры, предоставляемые в обучающей выборке, и не способна качественно производить действия на векторе, не входящем в массив обучающей выборки.

Обобщенно-регрессионная сеть и сеть радиально-базисных функций расположены в разных модулях. Структура прототипа приведена на рис. 1.

Прототип системы разработан в среде MATLAB, занимает не более 12 Мб места на жестком диске. Рекомендуемые системные требования к ПК: Intel Core i3, 1,7 ГГц, оперативная память от 1 Гб, от 90 Мб свободного места на жестком диске, ОС Windows XP/7/8/10 и выше.

Эксперимент, описанный в этой работе, не предполагает прогнозирование в отдельном виде спорта. Прогноз производится относительно выступления сборной команды на конкретном турнире, при этом это показывает общие тенденции в спортивном прогнозировании, в частности анализ ряда влияющих на результат параметров.

krut1.tif

Рис. 1. Обобщенная структура прототипа системы для прогнозирования спортивных результатов на основе искусственных нейронных сетей

Важным элементом при прогнозировании с помощью нейронных сетей является грамотное составление и предобработка обещающей выборки. Как правило, обучающая выборка содержит статистический набор параметров спортсменов или команд. В работе [10] описываются основные социальные и спортивные факторы, которые берутся в качестве обучающей выборки для нейронной сети. Этими факторами являются ВВП на душу населения, население страны (результат сборной которой прогнозируется), фактор выступления на «домашнем» турнире (факт проведения турнира в родной стране сборной команды) и предыдущая статистика выступлений национальной команды. Обучающая выборка составлена с учетом этих факторов, а в качестве статистики предыдущих выступлений используются места в неофициальном командном зачете и количество медалей в формате золото, серебро, бронза, на предыдущих всемирных универсиадах, где принимала участие та или иная сборная команда.

С помощью имеющейся выборки нейронные сети обучены в среде MATLAB. Модули нейронных сетей принимают на вход вектор данных, в результате, после прохождения через нейронную сеть, на выходе модуля имеется численный результат прогноза. Результат прогноза является вещественным числом.

Результаты исследования и их обсуждение

Прогноз произведен для национальных сборных команд четырех стран: РФ, КНР, Республика Казахстан, Республика Корея (Южная Корея). Результатом прогноза в двух последовательных экспериментах является предполагаемое место страны в командном зачете и предполагаемое количество золотых медалей. Необходимо учитывать тот факт, что число видов спорта на Всемирных студенческих играх меняется каждые два года, в связи с этим число возможных золотых медалей, прогнозируемое для сборной команды, является примерным и в таблице будет обозначено как минимальное.

Обучающая выборка сформирована из векторов, каждый их которых состоит из нескольких вещественных чисел. Вектор представляет собой факторы, описанные ранее, и результаты выступления сборной команды на одной из зимних универсиад, всего в обучающей выборке более 20 векторов. Результирующими векторами являются данные о занятых местах и золотых медалях сборной команды на одной из зимних универсиад. Статистика взята из открытого источника в сети Интернет [11]. Фрагменты результирующих векторов обучающей выборки представлены на рис. 2–3.

При визуальном анализе графиков можно увидеть, что повышение результатов происходило при выступлении команды на «домашней» арене, к примеру победа Китая на Универсиаде 2009 г. в Харбине, и второе место сборной Казахстана на Универсиаде 2017 г. в Алма-Ате. Фрагмент обучающей выборки для прогноза результатов команды КНР приведен на рис. 4. Данные фрагмента являются показателями выступления этой страны на универсиадах за последние двенадцать лет.

Результат прогнозирования представлен в таблице.

krut2.wmf

Рис. 2. Фрагмент обучающей выборки, содержащий данные о золотых медалях национальных сборных команд

krut3.wmf

Рис. 3. Фрагмент обучающей выборки, содержащий данные о местах неофициального командного зачета зимних универсиад

krut4.wmf

Рис. 4. Фрагмент обучающей выборки, содержащий процентное соотношение показателей выступления КНР на универсиадах за последние двенадцать лет

Результат прогнозирования

 

Обобщенно-регрессионная нейронная сеть

Нейронная сеть с радиально-базисными функциями

Сборные

Место в НКЗ

Количество золотых медалей

Место в НКЗ

Количество золотых медалей

КНР

7

3 ≤

8

3 ≤

РФ

1

14 ≤

1

10 ≤

Казахстан

3

5 ≤

13

2 ≤

Южная Корея

2

5 ≤

2

9 ≤

 

Как видно из таблицы, прогнозы нейронных сетей заметно отличаются. Обе модели нейронных сетей в результате работы показали, что наиболее вероятной будет победа сборной команды Российской Федерации в неофициальном командном зачете, обе модели нейронных сетей также предсказали второе место сборной Южной Кореи, с разным количеством золотых медалей. Обобщенно-регрессионная нейронная сеть спрогнозировала для команды Казахстана третью строчку командного зачета, в отличие от радиально-базисной нейронной сети, результат прогнозирования которой предрек сборной Республики Казахстан место за пределами тройки лидеров. Для сборной КНР прогноз обобщенно регрессионной нейронной сети – седьмое место НКЗ, радиально базисной-нейронной сети – восьмое, с тремя золотыми медалями.

Заключение

Нейронные сети справились с задачей прогнозирования, качество и точность которого предстоит оценить после окончания состязаний. Стоит отметить, что в прогнозировании учитывались только крупные социальные и спортивные факторы, однако не учитывались те факторы, которые влияют на результат в определенных группах дисциплин, такие как изменения программы самих зимних универсиад, данные тренерских штабов, особенности формирования студенческих сборных команд, доминирование национальных команд в определенных видах, ряд финансовых вопросов студенческого спорта и т.п. Обладая более широким спектром данных, следует расширять обучающую выборку и достигать более точных прогнозов. Работы в этом направлении и сборе статистических данных необходимо вести со специалистами и аналитиками по видам спорта, включаемым в программу турнира. Для того чтобы учитывать параметры, связанные с отдельными спортсменами, лидерами национальных команд, следует производить работу с их тренерским штабом.

Усовершенствование прототипа системы и исследования в направлении различных видов прогнозирования на данный момент продолжаются.

Данная работа показывает основные закономерности спортивного прогнозирования, и требования, которые предъявляются к технологиям его осуществляющим.