Вопросы по статистике

Базовые вопросы

  • Что означают “побед запрещён”? Это доля побед команды, забанившей героя.
  • Что такое “ранг” героев и как он рассчитан? Это ранг от 0 до 100 (выше = лучше), который назначен на основе рассчёта оценки рейтинга с использованием алгоритма Вилсона, учитывая общее число матчей, востребованность героя, процент побед героя. По сути это “умный винрейт”, который учитывает и число побед, и общее число матчей героя относительно общего числа матчей.
  • Что такое “ранг” для позиций героев и как он рассчитан? Ранг по позициям работает примерно также, как и общий ранг героев, но учитывает только статистику на конкретной позиции (и имеет некоторые небольшие изменения формулы), но суть при этом та же.
  • Что такое Отклонение пары героев? Это разница между ожидаемым чисом матчей и реальным числом матчей пары. Обычно чем выше отклонение, тем лучше комбинация.
  • Где я могу найти данные X? Зависит от того, что ищете. В первую очередь стоит помнить, что у каждой команды (в командных отчётах) есть свой профайл и данные в каждом профайле отражают структуру в отчёте в целом. Таке что если что-то есть в отчёте, значит это должно быть где-то и в профиле команды. ТАкже стоит обратить внимание, что все ссылки с иконкой-бургером имеют вложенные модули, так что стоит им уделить внимание.
  • Поясни мне Героя против Героя. Тут не используется формула ранкинга, так что данные могут быть сильно искажены с более низким количеством матчей. В целом это записи о том, как герои себя показывали против выбранного героя. Например, вы выбрали Sven и нашли в списке героев против него Meepo, с его числом побед, поражений и прибавкой к проценту побед против Sven (преимущество). Чем выше преимущество, тем лучше, чем ниже — тем хуже.
  • Что такое граф меты? Это визуальное отображение наиболее популярных пар героев и героев в целом в рамках отчёта.
  • Объясни мне комбинации героев. Что значат все эти странные колонки? Каждый компонент комбинаций героев (пары, тройки, комбо на линии) работает одинаково. Изменение винрейта рассчитано на основе среднего ожидаемого процента побед героев вместе. Ожидание матчей — это рассчитанное на основе частоты пиков героев количество матчей, в котором они обычно должны выбираться вместе. Отклонение — разница рассчитанного значения и реального количества матчей (больше — лучше, чем выше значение, тем чаще героев выбирают вместе намеренно, отрицательные значения означают обратное). Процент показывает какую долю общего количества матчей занимает отклонение. Многие пары оценены как незначительные и были отфильтрованы лимитирующим значением.
  • Что за лимитирующее значение? Лимитирующее значение (или ограничитель) — рассчётная величина, определяющая, сколько матчей необходимо паре или герою, чтобы считаться значимыми. Это необходимый параметр, чтобы избежать переполнения отчёта бесполезными данными, оставляя только самое важное.

Вопросы по Трендам Титанов

  • Почему у региона X так мало матчей? Игроки на высоких рангах часто запускают поиск на ближайшем популярном регионе. Например, для России это Западная Европа, а для Восточной Америки — Западная Америка.
  • Откуда взяты данные? ID матчей были собраны при обходе истории матчей каждого из игроков в таблице лидеров, используя Stratz API. После этого для сбора данных использовался OpenDota API.
  • Почему в Китае играют только Random Draft? Китайские игроки просто любят играть в Random Draft!
  • Китайские игроки просто любят играть в Random Draft! Почти. Я не проверяю все матчи вручную (это слишком затратно по времени — проверять средний ранг в каждом матче). Я использую фильтры Stratz API, минимальный ранг установлен на 80 (Immortal). Иногда игроки без ранга или отдельные 1-2 игрока с рангом Divine не влияют на средний ранг достаточно сильно.