Квантовое Равновесие Реакции — следующая ступень эволюции GTO-солверов

В конце апреля GTO Wizard представили новую функция солвера — Квантовое Равновесие Реакции (Quantal Response Equilibrium, QRE). Это не изобретение разработчиков GTO Wizard, а концепция из теории игр, появившаяся еще в 1995 году.

Традиционные солверы, производящие расчеты на основе равновесия Нэша, предполагают идеальную игру нашего соперника и игнорируют не-GTO линии. Для последних недавно появился новый термин — «призрачные линии» (ghost lines). Когда реальные противники делают неожиданные ходы, процесс решения обычных серверов прерывается. GTO Wizard AI — это первый солвер, который внедрил функцию QRE. Функция позволяет вывести точную стратегию против играющих неоптимально оппонентов, не прибегая к Node-lock.

Эксперт по покерной теории Том Бошофф в 30-минутном видео сравнивает QRE и Нэша и показывает преимущества первого на примере покерных раздач. Кратко пересказываем основные тезисы.

Первые коммерческие GTO-солверы появились в 2015 году, и вот уже десять лет равновесие Нэша является стандартом для вычисления оптимальной покерной стратегии. При этом Нэш плохо справляется с «неправильными» ходами, что в определенных сценариях приводит к неэффективным стратегиям.

Квантовое Равновесие Реакции предлагает новый подход к поиску оптимальных покерных сценариев. QRE адаптируется к не-GTO линиям оппонентов, обеспечивая более устойчивые стратегии:

Определяет диапазоны оппонентов без необходимости использовать функцию Node-lock (где фиксируется неоптимальная стратегия оппонента)
Умеет определять диапазоны противника на основе динамики
Генерирует сходящиеся решения даже в нестандартных сценариях

Решения QRE похожи на решения Нэша в стандартных ситуациях. В нестандартных сценариях, где обычные солверы тупят, QRE предоставляет четкие, легко применимые стратегии.

Кастомные решения в GTO Wizard используют QRE с 2025 года по подписке Elite. Предварительно рассчитанные решения пока остаются основанными на равновесии Нэша.

Преимущества QRE

В чем преимущества QRE для игроков:

Эффективно обрабатывает «призрачные линии» и предлагает ветки с большим EV против реальных ошибок оппонентов.
Превосходит по качеству решенийрРавновесие Нэша против неидеальных оппонентов, которые часто отклоняются от GTO-стратегий.
Позволяет игрокам идентифицировать и учиться на «рациональных», то есть частых и ожидаемых, ошибках соперников.
Делает обучение более эффиктивным, помогая лучше понимать нестандартные линии.
Идеально для пользователей, предпочитающих множество размеров ставок.
Сохраняет равновесие и выдает корректные решения даже в сложных мультивей-сценариях.
Улучшает игру против слабо эксплуатируемых стратегий оппонентов
Снижает эксплуатируемость примерно на 25%.

Разбор раздачи

Пример расчета солвера только по Нэшу и с использованием QRE на одной раздаче.

Хедз-ап кэш, стеки по 100 ББ. Мы на большом блайнде с . Оппонент закомплитил с SB, мы отрейзили x4 и получили колл.

Флоп . Соперник лидит 75% банка, мы коллируем.

На терне выходит и в нас летит овербет-олл-ин 450% банка.

Старые солверы в такой ситуации не способны построить реалистичную стратегию из-за «призрачной линии» оппонента. QRE теперь может построить корректное дерево решений для таких ранее нерешаемых проблем. Вот что предлагает GTO Wizard в двух различных вариантах.

1. По равновесию Нэша:

Стратегия ошибочна, поэтому в диапазоне оппонента солвер не покажет никаких рук (ведь их там не должно быть)
Мы должны фолдить младшие флеши и недостаточно часто коллировать с топ-парами
Анализ эквити покажет, что у нас 50%, что явно некорректно
Решение не сходящееся — то есть далеко от оптимального.

2. По QRE:

Пуш оппонента все еще ошибочен, но есть возможность увидеть предполагаемый диапазон
Никакие флеши не фолдятся. Две пары, особенно с блокерами, и топ-пары коллируют чаще.
Получено сходящееся решение с четким EV, даже при неверном действии оппонента.

Вот какие руки оппоненту в данном случае положит солвер:

Нижний сет,
Мелкие карманные пары вроде превращаются в блеф.
Также блефы включают руки вроде Q9s (комбо-дро).
Флеши (30%) и сеты (16%) составляют значительную часть велью-диапазона

Как работает QRE — технические аспекты

Автоматически вводится коэффициент рациональности Lambda — λ. Че он выше, тем чаще ошибки оппонента. Вероятность ошибки рассчитывается через softmax-функцию. У Нэша λ = 0 — полная рациональность.

Процесс решения:

Начинается с более высокого λ (допускает ошибки).
λ постепенно уменьшается почти до нуля.
Солвер запоминает, как отвечать на ошибки.

В будущем появится возможность самому определять коэффициент рациональности.

Более подробный анализ доступен на канале GTO Wizard, а также в англоязычном блоге солвера. А приобрести GTO Wizard всегда можно в магазине GipsyTeam: у нас поддерживаются банковские карты и предусмотрен хороший кэшбек.