Dynamic Sizing: A GTO Breakthrough

元数据

作者: Tombos21 (GTO Wizard)
日期: 2023-08-21
类型: 文章
原始文件: Dynamic Sizing A GTO Breakthrough.md

摘要

介绍GTO Wizard的Dynamic Sizing算法：AI自动在每个决策点选择最优的下注尺度（从预定义列表中），并在不同牌面纹理上选择不同大小。 算法通过机器学习评估每个size的EV，逐步淘汰价值最低的size直至只剩预设数量。

关键要点

核心创新：传统Solver需要人工预定义下注尺寸且固定不变。Dynamic Sizing自动为每个决策点选择最优size
Dynamic vs Automatic：Dynamic=用户控制考虑哪些size和用几个；Automatic=AI全自动决定
算法原理：扫描所有可用size→ML估计每个size的移除遗憾→移除最不值钱的size→重新求解→重复
实战优势：简化策略不仅易学易用，反而在实际对局中表现优于复杂策略（vs Slumbot胜率提高50%、方差更小）
精度：河牌平均EV损失仅0.05%底池（vs最优单size）；0.30%（vs复杂8size策略）

影响的概念

完整笔记

详细策略分析

Dynamic Sizing算法的核心创新：传统Solver需要人工预定义下注尺寸（如33%/66%/100%/150%），且一旦设定就在整个博弈树中保持不变。Dynamic Sizing突破了这一限制——AI自主在每个决策点评估所有预定义尺寸的EV，然后逐步淘汰贡献最小的尺寸，最终为每个点保留最优尺寸。这个创新在方法层面上解决了”如何选择尺寸数量”的效率问题：无需人为主观决定用几个尺寸，AI通过遗憾值最小化来自动找出最优的尺寸数量。

算法原理的逐步推演：文章揭示的算法流程——①扫描所有可用size（如25%、50%、75%、100%、125%、150%等）→②使用Machine Learning估计每个size的”移除遗憾”（如果去掉这个size，策略EV会损失多少）→③移除遗憾最小的size→④重新求解博弈（仅用剩余size）→⑤重复步骤②-④，直到剩余size数量达到用户预设的目标。这个迭代淘汰过程确保了最终保留的尺寸是”最不可替代的”几个——每个被保留的尺寸都服务于某个独特的策略目的（如小注用于薄价值、大注用于极化攻击）。
Dynamic vs Automatic的区别与适用场景：这是用户最容易混淆的概念。Dynamic模式：用户控制”考虑哪些尺寸”和”最终用几个”，AI在这些约束下选择最优组合——适合有特定策略偏好或想测试特定尺寸组合的玩家。Automatic模式：AI完全自主决定一切（包括考虑哪些候选尺寸和用几个）——适合想快速获得”AI认为最优”的策略、不想预设任何偏好的场景。实际使用中，Dynamic模式更适合学习（可以控制变量进行对比分析），Automatic模式更适合快速求解。
简化策略的实战数据——反直觉的优越性：这是本文最具爆炸性的发现。1-size简化策略在与Slumbot（一个知名的扑克AI）的实际对战中，胜率高达19.4bb/100，而复杂的8-size策略仅13.1bb/100——简化策略反而高出50%的胜率且方差更小。这个结果看似反直觉（更复杂的策略应该更优），但解释了为什么——简化策略更容易无差错地执行，在长时间对局中累积的”执行优势”超过了复杂策略在纸面上的”理论优势”。
精度数据的解读：从理论精度看，河牌使用1个最优尺寸仅损失0.05%底池的EV（vs最优单size），使用simplified策略损失0.30%底池的EV（vs复杂8-size策略）。这些数字的含义是：即使你在河牌上犯错地使用了非理论最优的下注尺寸，损失的EV极小。这使得”选错尺寸”不再是值得担心的问题——相比之下，选错行动（下注vs check）的EV损失通常高出1-2个数量级。

实战启发式

简化到1-2个尺寸的”足够好”策略：绝大多数玩家应该将翻牌策略简化到1-2个下注尺寸（如33%小注+75%中大注），转牌简化到2个（如50%+125%），河牌简化到1-2个（如75%+全押）。文章的数据证明这种简化在EV损失极小的前提下可以大幅提升执行质量。
优先投入精力到正确的决策维度：既然选错尺寸的EV损失极小（0.05-0.30%底池），而选错行动（该bet却check或该check却bet）的损失通常高很多（往往几个%的底池），那么学习精力的优先分配应该是：先确保行动选择正确→再精细化频率→最后才微调尺寸。不要在尺寸微调上花80%的时间而忽略了行动选择的正确性。
利用Dynamic Sizing训练”尺寸直觉”：用Dynamic Sizing求解一些你熟悉的手牌场景，观察AI选择了哪些尺寸以及为什么。通过反复观察AI在”什么牌面选择大注、什么牌面选择小注”的偏好，你可以内化一种”尺寸直觉”——无需每次精确计算，就能凭感觉选出接近最优的尺寸。
尺寸选择与对手类型的关联：文章的数据也暗示了一个剥削性应用——既然简化策略在面对AI时表现更好，那么面对人类对手（他们同样有执行误差），简化策略的优势只会更大。尤其面对低级别玩家时，使用简化的1-2尺寸策略可以让你集中注意力在更重要的读牌和范围判断上。

与知识库的整合

本文是知识库中”策略简化”主题的核心文献，与笔记-GTOWizard-动态下注基准是配套文章——本文讲算法原理和概念，基准篇讲具体数据和测试结果。与概念-简化策略概念页面形成互补——概念页面讨论了简化策略的理论基础（Overbank的简化哲学），本文提供了GTO Wizard工具层面的具体实现。与笔记-GTOWizard-求解器抽象有深层关联——求解器抽象揭示了Solver通过抽象简化博弈的本质，Dynamic Sizing则是在这个抽象框架内的进一步优化（自动选择最优尺寸子集）。建议与笔记-GTOWizard-翻牌CBet启发式和笔记-GTOWizard-翻牌超池下注配合阅读——这些文章展示了在特定翻牌面上最优尺寸的实际选择模式，可以和Dynamic Sizing的自动选择进行对比验证。

JoyPoker

笔记-GTOWizard-动态下注