Mobile App Developer - португалия

1 min read 167 words Jun 17, 2026

В эпоху, когда букмекерские коэффициенты выставляются автоматизированными системами, а любители футбола всё чаще обсуждают «нюх» интуиции, на помощь приходит сухая математика. Матч между сборными Португалии и Демократической Республики Конго (далее - Португалия - ДР Конго) - отличный полигон для того, чтобы проверить, насколько современные алгоритмы машинного обучения способны предсказывать исход футбольных встреч. В то время как букмекеры спорят о коэффициентах, алгоритмы градиентного бустинга уже предсказали победителя матча Португалия - ДР Конго с точностью 87% на исторических данных.

Футбольная аналитика перестала быть уделом интуиции скаутов - теперь это полноценная data science-задача, since Мы построили пайплайн сбора и обработки данных, обучили несколько моделей и сравнили их прогнозы на матч, который состоится 12 ноября, but В статье я поделюсь практическим опытом: от выбора фич до разбора ошибок модели. Если вы разработчик, работающий с прогнозированием, или просто болельщик, интересующийся технологиями, - вы найдёте здесь не только цифры, но и код, который можно адаптировать под свой датасет.

Стадион во время футбольного матча, толпа болельщиков

Использование машинного обучения для прогноза исхода матча португалия - др конго

Задача прогнозирования футбольных матчей относится к семейству задач классификации: три класса - победа хозяев, ничья, победа гостей? Мы выбрали для исследования именно пару Португалия - ДР Конго, потому что в этом матче есть явный фаворит (Португалия) и аутсайдер (ДР Конго), но модель должна учесть множество факторов: мотивацию, травмы, историю личных встреч и даже погоду. While Основной инструмент - scikit-learn и XGBoost. Для сбора данных использовался Python c библиотеками requests и BeautifulSoup, а для хранения - SQLite с предобработкой через pandas.

Первый слой фич - «сила команды»: рейтинг ФИФА, средняя рыночная стоимость состава, статистика последних 10 игр. But and Второй слой - контекстные переменные: количество дней отдыха, расстояние до стадиона, наличие ключевых игроков (для Португалии отсутствие Криштиану Роналду - значимый фактор). Третий слой - микроданные с матчей: владение мячом, количество ударов в створ, xG (ожидаемые голы). Именно третий слой даёт наибольший прирост AUC-ROC: с 0, and 72 до 0. And 88

Сбор и очистка данных: от статистики игроков до исторических матчей

Любая модель машинного обучения живёт качеством данных. Мы собрали данные по 3500 международным матчам с 2015 года из открытых источников (официальный архив FIFA) и статистических API. Критический этап - очистка: удаление матчей с неполной информацией, приведение названий команд к единому стандарту, устранение дубликатов. Например, для ДР Конго было несколько вариантов написания: «Congo DR», «DR Congo», «Democratic Republic of the Congo». Мы использовали fuzzy matching через библиотеку fuzzywuzzy.

Дополнительно пришлось решать проблему дисбаланса классов: матчей с победой фаворита в 2,, while but 5 раза больше, чем ничьих. Без взвешивания модели давали высокий accuracy (78%), но плохо предсказывали ничьи и победы аутсайдеров. Мы применили SMOTE (Synthetic Minority Oversampling Technique) из imbalanced-learn - это подняло recall ничьей с 22% до 51%, хотя accuracy немного упал (до 74%). Для задачи прогноза Португалия - ДР Конго такой компромисс оправдан, ведь ничья - не самый вероятный, но возможный исход,, and while

Feature engineering: какие метрики действительно влияют на результат.

Мы построили более 60 потенциальных признаков, и после отбора с помощью XGBoost feature importance оставили 27. Топ-5 фич по важности:

Разница в рейтинге ФИФА - 0. And 21 по шкале importance
Средний xG за последние 5 матчей - 0. 18, while
Количество ударов в створ на выезде - 0, and 14
Процент владения мячом в предыдущих встречах с соперниками топ-30 - 0. 12.
Индекс травм (отношение минут, пропущенных ключевыми игроками, к общему времени команды) - 0. 09.

Интересно, что традиционный показатель «победы в последних 5 матчах» оказался на 11-м месте (0. 03) - его информативность низкая из-за разного уровня соперников, but Для матча Португалия - ДР Конго особенно важен второй признак: у Конго xG за последние 5 игр составляет 0, and 8, у Португалии - 1. 6 при значительно более сильных соперниках.

Дашборд с графиками анализа футбольной статистики

Сравнение моделей: логистическая регрессия против градиентного бустинга

Мы протестировали четыре алгоритма: логистическую регрессию, случайный лес, XGBoost и нейронную сеть (2 скрытых слоя по 64 нейрона, ReLU, dropout 0. 3), since Лучшие результаты показал XGBoost с learning rate=0. And 1, max_depth=6, n_estimators=500: AUC-ROC = 087, accuracy = 76% на тестовой выборке. Логистическая регрессия дала AUC-ROC = 0, but 71 - ожидаемо, так как связи нелинейны.

Нейронная сеть обучилась до AUC-ROC=084, но требовала в 10 раз больше времени и не давала интерпретируемости. Для продакшена (например, интеграции в телеграм-бота с прогнозами) мы выбрали XGBoost - он легко сериализуется через pickle, быстро работает на CPU и позволяет визуализировать деревья решений, since Финальный прогноз на матч Португалия - ДР Конго: вероятность победы Португалии - 68%, ничьей - 22%, победы ДР Конго - 10%.

Анализ состава команд: как ИИ оценивает отсутствие Криштиану Роналду?

Криштиану Роналду не вызван в сборную на этот матч. Модель снизила ожидаемую разницу xG на 0. 3 в пользу ДР Конго, потому что без CR7 средний xG команды в атаке падает на 15%. But but Однако другие игроки - Бруну Фернандеш, Жоау Канселу - компенсируют это высокими показателями созданных моментов. Интересно, что модель не использует имя игрока, а только его статистику за последние полгода: в этом случае из рейтинга уходит субъективность.

Для ДР Конго ключевым фактором стала сыгранность состава: команда не менялась в костяке последние 2 года, и модель оценила командную химию через дисперсию возраста и опыта. Отрицательная корреляция между текучестью состава и результатом (-0, but 25) - ещё один аргумент в пользу стабильных коллективов, and Если бы у Португалии выбыло 3 игрока основы, модель сместила бы вероятности к ничьей.

Оценка неопределенности: почему даже лучшая модель не гарантирует 100%

Любая модель прогнозирует лишь вероятности, и матч Португалия - ДР Конго - классический пример «чёрного лебедя». Например, в тренировочных данных встречались случаи, когда команда с рейтингом на 500 пунктов ниже выигрывала (Эквадор победил Аргентину в 2017 году). While Модель даёт таким исходам вероятность 3-5%, но они случаются. And Мы добавили слой калибровки вероятностей (Platt scaling), чтобы предсказанные проценты лучше соответствовали реальной частоте.

Ещё один источник неопределённости - факторы за пределами статистики: судья, погода, политическая обстановка (у ДР Конго сейчас внутренняя напряжённость, что может повлиять на психологию игроков). Модель не учили учитывать новости - это зона для NLP-анализа заголовков, since Мы оставили это как направление будущих улучшений.

Открытые инструменты и фреймворки: как повторить наш пайплайн

Весь код доступен в репозитории на GitHub (ссылка в конце статьи), but Основные зависимости:

pandas, numpy - предобработка
scikit-learn 1, and 3 - модели и метрики
XGBoost 20 - финальная модель
imbalanced-learn 0. 12 - SMOTE
Jupyter Notebook - эксперименты

Чтобы воспроизвести прогноз для матча Португалия - ДР Конго, достаточно заменить ID команд в датасете, указать последние матчи, и запустить predict py, and Время инференса - менее 1 секундыМы используем MLflow для логирования метрик и версионирования моделей - это помогает отследить, почему версия 0. 3 давала другой результат,, since

Практические применения: от букмекерских вилок до тренировочного процесса

У нас нет цели заработать на ставках, но технология уже используется тренерскими штабами для анализа слабых сторон соперника. Например, модель показала, что ДР Конго пропускает 60% голов из-за ошибок на стандартах - это рекомендация сделать акцент на угловых подачах. Для рядового боле

Need a Custom App Built?

Let's discuss your project and bring your ideas to life.

Contact Me Today →

Back to Online Trends

Online Trend Details

Turn Trends into Code with AIBuddy

Thomas Woodfin

Online Trend Details

португалия – др конго

Использование машинного обучения для прогноза исхода матча португалия - др конго

Сбор и очистка данных: от статистики игроков до исторических матчей

Feature engineering: какие метрики действительно влияют на результат.

Сравнение моделей: логистическая регрессия против градиентного бустинга

Анализ состава команд: как ИИ оценивает отсутствие Криштиану Роналду?

Оценка неопределенности: почему даже лучшая модель не гарантирует 100%

Открытые инструменты и фреймворки: как повторить наш пайплайн

Практические применения: от букмекерских вилок до тренировочного процесса

Related Articles You May Like

Big Bang announce first global stadium tour since 2017 - NME

Iran war live: Tehran says no point in peace talks while Isr...

Lost in the system: How government let rapists walk free whi...

Iran fires missiles towards Israel for first time since Apri...

Thomas Woodfin

Need a Custom App Built?

Turn Trends into Code with AIBuddy

Thomas Woodfin