Вопросы по статистике

  • Какие есть отчёты? Обычно я создаю отчёты для всех турниров и лиг DPC и высокого уровня (а также квалификации к ним). Я также стараюсь делать отчёты для тир 1/2 турниров и лиг (основываясь на категориях liquipedia). И ещё есть отчёты по статистике рейтинговых матчей на ранге Титан (начиная с 5900 MMR) для каждого патча, а также отчёты по мете.
  • Что такое отчёты по мете? Отчёты по мете собираются на основе данных других отчётов. Есть три их типа: рейтинговая мета (последняя и предыдущая недели), соревновательная мета (последние две недели и предыдущие две), а также соревновательный сезон (DPC турниры или данные по всем крупным турнирам/лигам за соревновательный год.
  • Какие данные есть в отчётах по мете? Рейтинговые отчёты по мете содержат все те же данные, что и рейтинговые отчёты по патчу - они собираются на основе матчей на ранге Титан. Отчёты по соревновательному сезону и соревновательной мете используют данные по всем DPC турнирам, а также соревнованиям высокого уровня/тир 1/тир 2 (основываясь на категориях liquipedia). Квалификации не включены в отчёты по мете (по крайней мере на данный момент)
  • Как часто обновляются отчёты? Отчёты по турнирам и лигам обновляются сразу после завершения нового матча. Рейтинговые отчёты, а также отчёты по мете и соревновательному сезону, обновляются раз в сутки.
  • Что такое “mp” и “mb”? Сокращения от "Медиана пиков" и "Медиана банов". Это своего рода метрика, чтобы показать, насколько герой популярнее относительно среднего героя в отчёте. Это полезно при сравнении двух разных отчётов, а также в целом проще для понимания восприятия и понимания контекста.
  • Почему ты не добавишь данные по X? На самом деле у меня есть несколько больше данных в распоряжении, чем есть в отчётах (например, по предметам, вардам или подробности по игрокам в рейтинговых матчах), но я не хочу на данный момент заниматься реализацией публичного доступа к ним. На данный момент я работаю над полностью новой версией хаба статистики / платформы, в рамках которой будет улучшена навигация по отчётам и будут доступны все эти данные. Часть данных также не включена в отчёты по причинам приватности игроков.

Технические штуки

  • Я нашёл баг / словил fatal error! Что мне делать? Сообщить мне об этом. Со мной можно связаться в Discord, Twitter, Telegram и VK (все ссылки есть на боковой панели). Большинство мелких проблем проходят сами после перезагрузки страницы (и я в курсе этих проблем, причины я упоминал на странице о поддержке).
  • Есть ли API? Да, есть, но я не рекомендую им пользоваться. Он сделан в основном для меня, его документация практически отсутствует, и у меня особо нет времени заниматься его поддержкой. Впрочем, через него можно получить все те же данные, что можно найти в отчёте.
  • Где ты берёшь данные? Я использую OpenDota и официальный Dota 2 WebAPI для официальных (турнирных) матчей и Stratz для рейтинговых матчей.

Базовые вопросы

  • Что означают “побед запрещён”? Это доля побед команды, забанившей героя.
  • Что такое “медиана”? Зачем мне медианы ОВМ/ЗВМ и т.д.? Проще говоря, медиана — значение в середине. Средние значения (они же — средние арифметические) обычно довольно близки к медианам, но они отражают усреднённый показатель и искажаются выделяющимися значениями (к примеру, если у вас есть набор из 10 значений, из которых все равны 20, но одно равно 100, среднее значение будет выше 20), медиана же отражает значение в середине упорядоченного набора. На практике медианные значения показывают, какое значение вы будете встречать чаще всего (или будете близки к нему). Медианы ОВМ, ЗВМ, пиков и банов важны, чтобы дать контекст всем остальным показателям — к примеру, если рассматривать вместе медианное значение пиков и количество пиков героя, можно понять, насколько герой популярнее других.
  • Что такое “ранг” героев и как он рассчитан? Это ранг от 0 до 100 (выше = лучше), который назначен на основе рассчёта оценки рейтинга с использованием алгоритма Вилсона, учитывая общее число матчей, востребованность героя, процент побед героя. По сути это “умный винрейт”, который учитывает и число побед, и общее число матчей героя относительно общего числа матчей.
  • Что такое “ранг” для позиций героев и как он рассчитан? Ранг по позициям работает примерно также, как и общий ранг героев, но учитывает только статистику на конкретной позиции (и имеет некоторые небольшие изменения формулы), но суть при этом та же.
  • Что такое Отклонение пары героев? Это разница между ожидаемым чисом матчей и реальным числом матчей пары. Обычно чем выше отклонение, тем лучше комбинация.
  • Где я могу найти данные X? Зависит от того, что ищете. В первую очередь стоит помнить, что у каждой команды (в командных отчётах) есть свой профайл и данные в каждом профайле отражают структуру в отчёте в целом. Таке что если что-то есть в отчёте, значит это должно быть где-то и в профиле команды. ТАкже стоит обратить внимание, что все ссылки с иконкой-бургером имеют вложенные модули, так что стоит им уделить внимание.
  • Поясни мне Героя против Героя. Тут не используется формула ранкинга, так что данные могут быть сильно искажены с более низким количеством матчей. В целом это записи о том, как герои себя показывали против выбранного героя. Например, вы выбрали Sven и нашли в списке героев против него Meepo, с его числом побед, поражений и прибавкой к проценту побед против Sven (преимущество). Чем выше преимущество, тем лучше, чем ниже — тем хуже.
  • Что такое граф меты? Это визуальное отображение наиболее популярных пар героев и героев в целом в рамках отчёта.
  • Объясни мне комбинации героев. Что значат все эти странные колонки? Каждый компонент комбинаций героев (пары, тройки, комбо на линии) работает одинаково. Изменение винрейта рассчитано на основе среднего ожидаемого процента побед героев вместе. Ожидание матчей — это рассчитанное на основе частоты пиков героев количество матчей, в котором они обычно должны выбираться вместе. Отклонение — разница рассчитанного значения и реального количества матчей (больше — лучше, чем выше значение, тем чаще героев выбирают вместе намеренно, отрицательные значения означают обратное). Процент показывает какую долю общего количества матчей занимает отклонение. Многие пары оценены как незначительные и были отфильтрованы лимитирующим значением.
  • Что за лимитирующее значение? Лимитирующее значение (или ограничитель) — рассчётная величина, определяющая, сколько матчей необходимо паре или герою, чтобы считаться значимыми. Это необходимый параметр, чтобы избежать переполнения отчёта бесполезными данными, оставляя только самое важное.

Вопросы по Трендам Титанов

  • Почему у региона X так мало матчей? Игроки на высоких рангах часто запускают поиск на ближайшем популярном регионе. Например, для России это Западная Европа, а для Восточной Америки — Западная Америка.
  • Откуда взяты данные? ID матчей были собраны при обходе истории матчей каждого из игроков в таблице лидеров, используя Stratz API. После этого для сбора данных использовался OpenDota API.
  • Почему в Китае играют только Random Draft? Китайские игроки просто любят играть в Random Draft!
  • Китайские игроки просто любят играть в Random Draft! Почти. Я не проверяю все матчи вручную (это слишком затратно по времени — проверять средний ранг в каждом матче). Я использую фильтры Stratz API, минимальный ранг установлен на 80 (Immortal). Иногда игроки без ранга или отдельные 1-2 игрока с рангом Divine не влияют на средний ранг достаточно сильно.