What is GTO in Poker?

元数据

作者: Tombos21 | 日期: 2022-05-17
原始文件: GTOWizard-What-Is-GTO.md

摘要

GTO 入门定义：GTO = Game Theory Optimal = 纳什均衡策略 = 不可被剥削的固定策略。Solver 通过双方轮流剥削迭代至均衡。GTO 和剥削不是对立——GTO 是基线，理解基线才能识别对手的偏离。

关键要点

GTO = 纳什均衡策略，不可被剥削
Solver 工作原理：输入范围/牌面/下注结构 → 轮流剥削迭代 → 收敛至均衡
GTO 与剥削 = 硬币两面：不知基线就不知对手偏离在哪
典型 GTO 策略特征：混合策略、多尺寸、平衡范围

影响的概念

完整笔记

GTO 的数学本质：纳什均衡

Tombos21 将 GTO 明确定义为纳什均衡策略——在非合作博弈中，没有任何玩家可以通过单方面改变策略来提高自己的期望收益。关键限定词是”单方面”（unilaterally）：在多人池中，如果两个或更多对手同时改变策略联合对抗你，纳什均衡（以及任何其他策略）都可能被剥削。这是多人底池 GTO 研究的核心困难。

文章使用了”公开你的策略”作为思维实验：假设对手完全知道你在任何牌面、面对任何下注尺寸时会如何游戏你的范围，你仍然无法被剥削——这就是 GTO 的强度来源。它不依赖隐藏信息来获利。

Solver 的工作原理：迭代剥削至均衡

Solver 的核心算法可以简化为一个交替剥削过程：

两个玩家从随机策略开始
固定 A 的策略，让 B 找到对 A 的最大剥削策略
固定 B 的新策略，让 A 找到对 B 的最大剥削策略
重复直到双方都无法进一步剥削对方——即达到纳什均衡

这个过程中，初始策略会剧烈摇摆（动画显示约 120 倍加速后策略变化才趋缓），最终收敛到一个稳定的混合策略分布。Solver 的输入包括：翻前范围、公共牌、目标精度、起始筹码和底池大小、翻后下注结构。由于无限注德州扑克的下注尺寸是近乎无限的，必须预设一个下注结构来约束搜索空间。

GTO 策略的可见特征

文章总结了 GTO 策略的三个标志性特征：

混合策略（mixed strategies）：同一手牌在不同频率下采取不同行动。这不是 Solver”犹豫不决”，而是在纳什均衡中让对手无法通过锁定你的行动来剥削你
多种下注尺寸：GTO 不使用单一尺寸，而是根据范围需要选择不同的极化程度
平衡的范围：每个行动线中都包含足够多的价值牌和诈唬牌，比例由下注尺寸决定

GTO 与剥削：硬币的两面

文章的核心论点：GTO 和剥削不是对立阵营，而是互补工具。论证链条：

如果不了解基准策略（GTO），你如何知道对手在偏离？
“太激进""太被动""太价值导向”都是相对于某个基准而言的
没有 GTO 基准，“剥削”就变成了凭感觉的猜测，而非有依据的调整

GTO 给出客观参照系，将主观描述（“他打得太凶”）转化为客观偏离（“他在这个节点的诈唬频率超出均衡频率15%”）。这个转化是剥削策略从艺术走向科学的关键。

GTO 的被动盈利机制

文章指出一个被忽视的要点：GTO 通过被动方式盈利——对手只要采取任何在 GTO 策略中不存在的行动（如过度弃牌、过度跟注、下注尺寸偏离），GTO 策略就自动获利，无需主动调整。而剥削策略虽然有潜力获得比 GTO 更高的收益，但也承担了被反剥削的风险。这是一个”高上限低风险”（GTO）与”高上限高风险”（剥削）之间的权衡。

GTO 应用实例：范围不对称的极端行动

文章列举了即使在使用 GTO 策略时也会自然出现的极端行动场景：

攻击封顶范围：当对手的范围被限制（如过牌后范围缺少坚果），即使你的范围整体较弱，仍可使用超池下注施压
清空空气手牌：当对手的行动线表示放弃，你可以用所有无摊牌价值的手牌诈唬
折叠所有抓诈唬牌：当对手的范围中诈唬牌比例不足其下注尺寸所需的平衡值时，你可以放弃所有抓诈唬牌

这些”看起来极端”的行动实际上完全符合 GTO 逻辑——它们源于范围不对称性，而非对对手读牌的依赖。

学习建议

文章给出了清晰的学习路径：

使用 GTO Wizard 等工具研究 Solver 的输出和汇合报告来训练 GTO 直觉
在实战中不必做复杂数学——扑克在实践中更偏向直觉
通过 GTO Wizard PokerArena 在无风险环境中测试策略，将 GTO 概念内化为第二天性

与相关概念的连接

本文是概念-博弈论最优和概念-纳什平衡的核心源文档
Solver 的迭代过程直接解释了概念-纳什距离的物理意义——dEV 就是当前解到均衡解的”距离”
GTO 与剥削的关系是笔记-GTOWizard-无差异三定律的逻辑前提——无差异原则正是 GTO 构建脆弱剥削平衡的数学表述
范围不对称（攻击封顶范围等）详见笔记-GTOWizard-GTO原理和笔记-GTOWizard-范围影响策略

JoyPoker

笔记-GTOWizard-什么是GTO