Dynamic Sizing Benchmarks
元数据
- 作者: Tombos21 (GTO Wizard)
- 日期: 2023-08-21
- 类型: 文章
- 原始文件: Dynamic Sizing Benchmarks.md
摘要
Dynamic Sizing算法的完整基准测试报告。通过500个河牌场景的自我博弈测试,量化了简化策略的EV损失。核心结论:简化到1个下注尺寸仅损失极少EV,在实践中甚至优于复杂策略。
关键要点
- 精度数据:
- vs最优单size:99.95% EV捕获(0.05%底池损失)
- vs复杂8size策略:99.7% EV捕获(0.30%底池损失)
- 78%选中最优size,95%情况损失<0.25% EV
- 最优固定河牌下注尺度:有利位置75-100%底池,不利位置约50%底池
- OOP小注的原因:OOP不重开行动→可用更薄的价值注→小注尺寸更优
- vs Slumbot实战:1-size Dynamic策略胜率19.4bb/100 vs 复杂策略13.1bb/100(50%更高胜率、更低方差)
- 关键启示:早期街的EV损失比河牌更小(河牌是最坏情况)
影响的概念
完整笔记
详细策略分析
-
500个河牌场景的全面基准测试设计:文章的测试方法论值得深入理解。通过500个河牌场景的自我博弈(self-play),比较了简化策略与复杂策略的理论EV差异。这个大规模测试确保了结论的统计显著性——不是个别场景的轶事证据,而是系统性的实证数据。测试覆盖了各种牌面纹理、位置、行动序列和SPR条件,使得结论具有广泛的可推广性。
-
精度数据的全维度解读:文章提供的精度数据构成了完整的证据链——①vs最优单size:99.95% EV捕获(0.05%底池损失)。这意味着如果你只能在河牌用一个尺寸,选对了损失几乎可以忽略。②vs复杂8-size策略:99.7% EV捕获(0.30%底池损失)。即使与理论上最优的复杂策略相比,简化策略的损失也仅0.30%底池——这个数字在实战中完全淹没在对手的错误和随机波动中。③78%的情况下选中最优size:这说明AI在大多数场景下的size选择与你做深入研究后手工挑选的结果一致。④95%情况下损失<0.25% EV:极少数情况下损失超过0.25%底池,绝大多数决策中的尺寸选择都是”足够好”的。
-
最优固定河牌下注尺度的位置依赖规律:文章通过数据揭示了一个清晰的模式——有利位置(IP)最优固定尺寸约为75-100%底池,不利位置(OOP)约为50%底池。这个差异的根源是:OOP的下注不仅获取价值,还关闭了行动权(避免被对手bet后陷入信息劣势和抓诈困境)。因为小注在这个”关闭行动权”的目标上同样有效(甚至更好——因为对手更可能跟注小注,从而你确实关闭了行动权而不需要冒大注被加注的风险),所以OOP偏好更小的固定尺寸。
-
vs Slumbot实战结果的深层含义:1-size简化策略19.4bb/100 vs 复杂策略13.1bb/100——这个50%的胜率提升和方差降低的组合效应极其重要。解释机制:①简化策略消除了”选择错误尺寸”的可能性——每个决策点只有一个尺寸,不可能选错。②简化策略降低了认知负荷——执行者可以分配更多注意力到读牌和范围判断上。③简化策略使得策略更加一致——对手更难从你的尺寸变化中读信息(因为没有变化)。④更低的方差意味着更平滑的收益曲线——这在资金管理和心理层面都有巨大价值。
-
早期街EV损失更小的机制解释:文章指出河牌是”最坏情况”——早期街(翻牌、转牌)的尺寸简化EV损失比河牌更小。这是因为在早期街上,后续街的行动可以部分补偿尺寸选择的不完美——翻牌选择了一个非最优尺寸,但转牌和河牌上的策略可以适应性地调整以弥补。而在河牌上,没有后续街可以进行补偿,尺寸选择的不完美直接转化为最终的EV损失。这个”补偿机制”进一步强化了”简化早期街策略”的合理性。
实战启发式
-
“极限简化”的信心来源:本文的数据为”极限简化”提供了实证信心。你可以只用1-2个下注尺寸玩整个扑克生涯,EV损失在实际对局中可忽略不计。这解放了大量的精力——与其纠结”应该用65%还是75%“,不如选择75%然后集中精力判断”是否应该bet”。
-
IP河牌默认尺寸:75-100%底池:基于基准数据,有利位置在河牌的最优单一尺寸是75-100%底池。这提供了一个可靠的默认值:除非有特定理由选择其他尺寸(如对手范围非常无弹性),否则IP河牌下注75-100%底池几乎永远不会是严重错误。
-
OOP河牌默认尺寸:50%底池:不利位置在河牌的最优单一尺寸约为50%底池。这个尺寸可以服务于多个目的——薄价值下注(降低被加注的风险)、阻断注(低价摊牌)、以及适度的弃牌权益。OOP时默认50%底池是最稳健的选择。
-
实战中”精度成本”的意识:文章的数据揭示了一个重要的效率原则——将策略精度从95%提升到99%所需要的努力(学习多种尺寸的精确边界)远大于从70%提升到95%(学习基本的尺寸选择原则)。在有限的学习时间内,应优先投资在”从70%到95%“的大幅提升上,而非在”从95%到99%“的边际精进上。
与知识库的整合
本文是源摘要-GTOWizard-动态下注的配套数据文章,两篇必须合读才能获得完整理解——动态下注篇讲”是什么”和”为什么”,本文提供”有多好”的量化证据。与概念-简化策略构成理论-数据闭环:概念页面阐述了策略简化的理论价值和哲学基础,本文用大规模测试数据证明了简化的实战优势。与源摘要-GTOWizard-求解器抽象的关联体现在——Dynamic Sizing本身就是求解器抽象的进阶应用,它通过自动选择最优尺寸子集来进一步优化抽象效率。建议在知识库的”策略简化”专题中,将本文作为”简化不损失EV”的核心证据引用。
