What is GTO in Poker?
元数据
- 作者: Tombos21 | 日期: 2022-05-17
- 原始文件: GTOWizard-What-Is-GTO.md
摘要
GTO 入门定义:GTO = Game Theory Optimal = 纳什均衡策略 = 不可被剥削的固定策略。Solver 通过双方轮流剥削迭代至均衡。GTO 和剥削不是对立——GTO 是基线,理解基线才能识别对手的偏离。
关键要点
- GTO = 纳什均衡策略,不可被剥削
- Solver 工作原理:输入范围/牌面/下注结构 → 轮流剥削迭代 → 收敛至均衡
- GTO 与剥削 = 硬币两面:不知基线就不知对手偏离在哪
- 典型 GTO 策略特征:混合策略、多尺寸、平衡范围
影响的概念
完整笔记
GTO 的数学本质:纳什均衡
Tombos21 将 GTO 明确定义为纳什均衡策略——在非合作博弈中,没有任何玩家可以通过单方面改变策略来提高自己的期望收益。关键限定词是”单方面”(unilaterally):在多人池中,如果两个或更多对手同时改变策略联合对抗你,纳什均衡(以及任何其他策略)都可能被剥削。这是多人底池 GTO 研究的核心困难。
文章使用了”公开你的策略”作为思维实验:假设对手完全知道你在任何牌面、面对任何下注尺寸时会如何游戏你的范围,你仍然无法被剥削——这就是 GTO 的强度来源。它不依赖隐藏信息来获利。
Solver 的工作原理:迭代剥削至均衡
Solver 的核心算法可以简化为一个交替剥削过程:
- 两个玩家从随机策略开始
- 固定 A 的策略,让 B 找到对 A 的最大剥削策略
- 固定 B 的新策略,让 A 找到对 B 的最大剥削策略
- 重复直到双方都无法进一步剥削对方——即达到纳什均衡
这个过程中,初始策略会剧烈摇摆(动画显示约 120 倍加速后策略变化才趋缓),最终收敛到一个稳定的混合策略分布。Solver 的输入包括:翻前范围、公共牌、目标精度、起始筹码和底池大小、翻后下注结构。由于无限注德州扑克的下注尺寸是近乎无限的,必须预设一个下注结构来约束搜索空间。
GTO 策略的可见特征
文章总结了 GTO 策略的三个标志性特征:
- 混合策略(mixed strategies):同一手牌在不同频率下采取不同行动。这不是 Solver”犹豫不决”,而是在纳什均衡中让对手无法通过锁定你的行动来剥削你
- 多种下注尺寸:GTO 不使用单一尺寸,而是根据范围需要选择不同的极化程度
- 平衡的范围:每个行动线中都包含足够多的价值牌和诈唬牌,比例由下注尺寸决定
GTO 与剥削:硬币的两面
文章的核心论点:GTO 和剥削不是对立阵营,而是互补工具。论证链条:
- 如果不了解基准策略(GTO),你如何知道对手在偏离?
- “太激进""太被动""太价值导向”都是相对于某个基准而言的
- 没有 GTO 基准,“剥削”就变成了凭感觉的猜测,而非有依据的调整
GTO 给出客观参照系,将主观描述(“他打得太凶”)转化为客观偏离(“他在这个节点的诈唬频率超出均衡频率15%”)。这个转化是剥削策略从艺术走向科学的关键。
GTO 的被动盈利机制
文章指出一个被忽视的要点:GTO 通过被动方式盈利——对手只要采取任何在 GTO 策略中不存在的行动(如过度弃牌、过度跟注、下注尺寸偏离),GTO 策略就自动获利,无需主动调整。而剥削策略虽然有潜力获得比 GTO 更高的收益,但也承担了被反剥削的风险。这是一个”高上限低风险”(GTO)与”高上限高风险”(剥削)之间的权衡。
GTO 应用实例:范围不对称的极端行动
文章列举了即使在使用 GTO 策略时也会自然出现的极端行动场景:
- 攻击封顶范围:当对手的范围被限制(如过牌后范围缺少坚果),即使你的范围整体较弱,仍可使用超池下注施压
- 清空空气手牌:当对手的行动线表示放弃,你可以用所有无摊牌价值的手牌诈唬
- 折叠所有抓诈唬牌:当对手的范围中诈唬牌比例不足其下注尺寸所需的平衡值时,你可以放弃所有抓诈唬牌
这些”看起来极端”的行动实际上完全符合 GTO 逻辑——它们源于范围不对称性,而非对对手读牌的依赖。
学习建议
文章给出了清晰的学习路径:
- 使用 GTO Wizard 等工具研究 Solver 的输出和汇合报告来训练 GTO 直觉
- 在实战中不必做复杂数学——扑克在实践中更偏向直觉
- 通过 GTO Wizard PokerArena 在无风险环境中测试策略,将 GTO 概念内化为第二天性
与相关概念的连接
- 本文是 概念-博弈论最优 和 概念-纳什平衡 的核心源文档
- Solver 的迭代过程直接解释了 概念-纳什距离 的物理意义——dEV 就是当前解到均衡解的”距离”
- GTO 与剥削的关系是 笔记-GTOWizard-无差异三定律 的逻辑前提——无差异原则正是 GTO 构建脆弱剥削平衡的数学表述
- 范围不对称(攻击封顶范围等)详见 笔记-GTOWizard-GTO原理 和 笔记-GTOWizard-范围影响策略



