Сайт не проводит азартные игры на деньги и носит исключительно информационный характер. [email protected]

Что такое xG

CasinoUpdate

Активный
Наткнулся на крутую статью от Дэвида Самптера, которая называется "Нужно ли писать о реальных или ожидаемых голах? Руководство для журналистов". Показатель xG (ожидаемых голов) сейчас крайне важен в современном футболе. Кратко о том, что такое и как это нужно описывать журналистам, а то порой у меня кровь из глаз течет от "АНАЛитики" некоторых коллег.

С точки зрения статистики, шум в результате футбольного матча почти всегда равносилен сигналу. Этот факт очень трудно вычислить в подробных сводках газет и аналитических субботних телепередачах. Но это, тем не менее, факт. Результат одного матча Премьер Лиги дает лишь скромное представление о том, насколько хороши те две команды, которые играли.

Математическое объяснение этому может быть напрямую взято из распределения Пуассона. Голы в футболе распределены по Пуассону, а счет команд равен приблизительно 1.4 гола в целом. Разница и среднее равны в распределении Пуассона. Таким образом стандартное отклонение равно квадратному корню числа 1.4, то есть 1.18. Следовательно, шум (1.18) лишь немногим меньше сигнала (1.4). Что и требовалось доказать.

Если вы не верите математике, тогда просто подумайте о победах Манчестер Сити и Арсенала в Воскресенье, победные голы которых пришлись на 84-ю и 98-ю минуту соответственно. Малое количество голов означает, что исход матча решает незначительный перевес. Сигнал (сильнейшая команда) лишь немногим сильнее шума (того факта, что произойти может что угодно). Что и требовалось доказать.

Из-за этого очень трудно вразумительно писать о футболе. Людей интересуют самые последние результаты, и было бы в самом деле очень скучно, если бы журналисты писали «ну, в основном был шум».

Вот где от ожидаемых голов исходит лучик надежды. Ожидаемые голы оценивают созданные шансы, и таким образом дают лучшую оценку качеству работы игры команды в одном матче, чем голы.

Сейчас я собираюсь дать правило использования ожидаемых голов при написании работ на тему футбола. График ниже показывает, как падает величина шума в плане измерения по мере роста числа матчей в сезоне, он также дает некоторые рекомендации по тому, что нужно писать.

1.png


1 или 2 матча: В самом начале шум велик как для ожидаемых голов, так и для голов. Я предлагаю при обсуждении одного или двух матчей «только докладывать», писать о произошедшем, примененной тактике, движениях игроков и так далее, при этом меньше спекулировать о том, что это значит для команды в долгосрочной перспективе. Здесь нет никакого тренда, даже при ожидаемых голах. Когда эксперты говорят «они выиграли матч по ожидаемым голам», это имеет значения не больше, чем сам финальный счет.

3-6 матчей: Я уже писал о том, как 3-6 матчей начинают давать нам хорошее представление о команде, только если она постоянно проигрывает или выигрывает. Именно здесь «рапорт xG» может хорошо сработать. Если xG и голы не сходятся, тогда стоит проинформировать читателя о том, что, возможно, команда не так плоха (или хороша) как казалось.

7-16 матчей: Это самый волнующий период для xG-журналистики. Вот теперь голы становятся более достоверным показателем уровня команды. Трудно сохранять удачную полосу в 10 побед подряд, и никто также не ожидает 10 плохих матчей подряд, если только команда не плохая. Так что, если xG и голы противоречат друг другу, есть возможность получить правдивую картину: «противопоставить два подхода». Пример этого сезона — Бернли. У них очень низкий уровень xG, но довольно неплохие результаты.

17 матчей: Однажды я сказал клубному аналитику, команда которого весь сезон имела xG сверх нормы, что это потому что его команда в самом деле хороша. Не знаю, убедило ли это его, но должно было. После 16 матчей разница между шумом в xG и шумах в голах составляет всего 0.1 гола в матч. Это небольшая разница, и, что важнее всего, при разнице такого размера нельзя исключать того, что модель xG неверна для команды. Ожидаемые голы представляют собой математическую модель. Модели — не реальность. Голы — реальность. Так что, если у команды есть игрок, менеджер или менталитет, дающий преимущество размером в 0.1 за игру, то это лучше проявит себя в реальных голах, чем в ожидаемых. Поэтому таблицы ожидаемых голов теряют релевантность и интерес по мере продвижения сезона. Так что «сосредоточьтесь на реальных голах».

Таковы правила. Они ни коем образом не безотказны, но должны пригодиться.

Не все согласятся со мной. В конце сезона 2015-16 у меня была дискуссия в Твиттере с кое-кем, кто считал xG лучше реальных голов во всех случаях. Я не думаю, что это так, особенно если вспомнить, что модели ожидаемых голов представляют собой средние показатели всех команд в недавних сезонах. Отклонение от модели на 0.1 гол за игру у команды — не такое уж большое. Поэтому на протяжении сезона итоговая таблица — лучший показатель результативности команды из всех возможных.

Редактор Statbomb Джеймс Йорк полагает, что статьи, добавленные на сайт извне отображают лишь долгосрочные тренды. Никак не рапорты за матч или одинарные статистики, в связи с чем их приятно читать. Но я заметил, что в Твиттере Джеймс обычно более консервативен в своих взглядах на окно в 7-16 матчей, чем я. Похоже, что при определении «истинного тренда» его доверие к xG и прочим статистикам ударов растет по мере продвижения сезона. Недавний твит о том, что «Бернли везет» побудил меня взяться за эту статью. Я бы сказал, что Бернли скорее всего играют немногим лучше нормы, но после 13 сыгранных матчей они находятся в таком интересном положении, когда они заслуживают пояснений.

Пара дополнительных слов. Во-первых, если меняется менеджер, ключевой игрок получает травму или в клубе происходит любое другое значимое событие, способное повлиять на него, тогда те же самые правила применяются с момент события. Три игры после события, и стоит проверить статистику xG. Спустя год информацию дают реальные голы. Во-вторых, оценивать отдельных игроков на протяжении сезона ожидаемых голов также может быть полезно, так как стандартная девиация игрока касательно xG может быть еще больше. В данном случае и реальные, и ожидаемые голы полезны.

Удачи в писательской деятельности.

Откуда берутся эти кривые?

Красная кривая, указывающая на погрешности в вычислениях (шум) голов основывается на команде, которая забивает 1.4 гола за матч. Я полагаю, что погрешность пропорциональна квадратному корню из 1.4/n, где n – это количество матчей. Именно эта кривая указывает на шум в вычислениях. Существует, по меньшей мере, 19 способов вычисления доверительного интервала для распределения Пуассона, и выбранный мной здесь довольно прост. По мере своего роста n становится все более надежной.

Синяя кривая, указывающая на погрешности в вычислениях (шум) ожидаемых голов основывается на среднестатистическом примере разницы ожидаемых голов для команд Премьер Лиги в данном сезоне. Для использованной мною модели я вычислил ее, и она оказалась 0.61. Что касается голов, я полагаю, что погрешность пропорциональна квадратному корню из 0.61/n, где n – это количество матчей. Именно эта кривая построена. Оценка в 0.61 никак не является идеальной, и читатель может попытаться сделать собственные вычисления, если ему угодно, и посмотреть на то, как меняются результаты.
 
Верх Низ