Dynamic Sizing Benchmarks

元数据

作者: Tombos21 (GTO Wizard)
日期: 2023-08-21
类型: 文章
原始文件: Dynamic Sizing Benchmarks.md

摘要

Dynamic Sizing算法的完整基准测试报告。通过500个河牌场景的自我博弈测试，量化了简化策略的EV损失。核心结论：简化到1个下注尺寸仅损失极少EV，在实践中甚至优于复杂策略。

关键要点

精度数据：
- vs最优单size：99.95% EV捕获（0.05%底池损失）
- vs复杂8size策略：99.7% EV捕获（0.30%底池损失）
- 78%选中最优size，95%情况损失<0.25% EV
最优固定河牌下注尺度：有利位置75-100%底池，不利位置约50%底池
OOP小注的原因：OOP不重开行动→可用更薄的价值注→小注尺寸更优
vs Slumbot实战：1-size Dynamic策略胜率19.4bb/100 vs 复杂策略13.1bb/100（50%更高胜率、更低方差）
关键启示：早期街的EV损失比河牌更小（河牌是最坏情况）

影响的概念

完整笔记

详细策略分析

500个河牌场景的全面基准测试设计：文章的测试方法论值得深入理解。通过500个河牌场景的自我博弈（self-play），比较了简化策略与复杂策略的理论EV差异。这个大规模测试确保了结论的统计显著性——不是个别场景的轶事证据，而是系统性的实证数据。测试覆盖了各种牌面纹理、位置、行动序列和SPR条件，使得结论具有广泛的可推广性。

精度数据的全维度解读：文章提供的精度数据构成了完整的证据链——①vs最优单size：99.95% EV捕获（0.05%底池损失）。这意味着如果你只能在河牌用一个尺寸，选对了损失几乎可以忽略。②vs复杂8-size策略：99.7% EV捕获（0.30%底池损失）。即使与理论上最优的复杂策略相比，简化策略的损失也仅0.30%底池——这个数字在实战中完全淹没在对手的错误和随机波动中。③78%的情况下选中最优size：这说明AI在大多数场景下的size选择与你做深入研究后手工挑选的结果一致。④95%情况下损失<0.25% EV：极少数情况下损失超过0.25%底池，绝大多数决策中的尺寸选择都是”足够好”的。
最优固定河牌下注尺度的位置依赖规律：文章通过数据揭示了一个清晰的模式——有利位置（IP）最优固定尺寸约为75-100%底池，不利位置（OOP）约为50%底池。这个差异的根源是：OOP的下注不仅获取价值，还关闭了行动权（避免被对手bet后陷入信息劣势和抓诈困境）。因为小注在这个”关闭行动权”的目标上同样有效（甚至更好——因为对手更可能跟注小注，从而你确实关闭了行动权而不需要冒大注被加注的风险），所以OOP偏好更小的固定尺寸。
vs Slumbot实战结果的深层含义：1-size简化策略19.4bb/100 vs 复杂策略13.1bb/100——这个50%的胜率提升和方差降低的组合效应极其重要。解释机制：①简化策略消除了”选择错误尺寸”的可能性——每个决策点只有一个尺寸，不可能选错。②简化策略降低了认知负荷——执行者可以分配更多注意力到读牌和范围判断上。③简化策略使得策略更加一致——对手更难从你的尺寸变化中读信息（因为没有变化）。④更低的方差意味着更平滑的收益曲线——这在资金管理和心理层面都有巨大价值。
早期街EV损失更小的机制解释：文章指出河牌是”最坏情况”——早期街（翻牌、转牌）的尺寸简化EV损失比河牌更小。这是因为在早期街上，后续街的行动可以部分补偿尺寸选择的不完美——翻牌选择了一个非最优尺寸，但转牌和河牌上的策略可以适应性地调整以弥补。而在河牌上，没有后续街可以进行补偿，尺寸选择的不完美直接转化为最终的EV损失。这个”补偿机制”进一步强化了”简化早期街策略”的合理性。

实战启发式

“极限简化”的信心来源：本文的数据为”极限简化”提供了实证信心。你可以只用1-2个下注尺寸玩整个扑克生涯，EV损失在实际对局中可忽略不计。这解放了大量的精力——与其纠结”应该用65%还是75%“，不如选择75%然后集中精力判断”是否应该bet”。
IP河牌默认尺寸：75-100%底池：基于基准数据，有利位置在河牌的最优单一尺寸是75-100%底池。这提供了一个可靠的默认值：除非有特定理由选择其他尺寸（如对手范围非常无弹性），否则IP河牌下注75-100%底池几乎永远不会是严重错误。
OOP河牌默认尺寸：50%底池：不利位置在河牌的最优单一尺寸约为50%底池。这个尺寸可以服务于多个目的——薄价值下注（降低被加注的风险）、阻断注（低价摊牌）、以及适度的弃牌权益。OOP时默认50%底池是最稳健的选择。
实战中”精度成本”的意识：文章的数据揭示了一个重要的效率原则——将策略精度从95%提升到99%所需要的努力（学习多种尺寸的精确边界）远大于从70%提升到95%（学习基本的尺寸选择原则）。在有限的学习时间内，应优先投资在”从70%到95%“的大幅提升上，而非在”从95%到99%“的边际精进上。

与知识库的整合

本文是笔记-GTOWizard-动态下注的配套数据文章，两篇必须合读才能获得完整理解——动态下注篇讲”是什么”和”为什么”，本文提供”有多好”的量化证据。与概念-简化策略构成理论-数据闭环：概念页面阐述了策略简化的理论价值和哲学基础，本文用大规模测试数据证明了简化的实战优势。与笔记-GTOWizard-求解器抽象的关联体现在——Dynamic Sizing本身就是求解器抽象的进阶应用，它通过自动选择最优尺寸子集来进一步优化抽象效率。建议在知识库的”策略简化”专题中，将本文作为”简化不损失EV”的核心证据引用。

JoyPoker

笔记-GTOWizard-动态下注基准