推弃牌均衡计算问题集
概述
本问题集基于《现代扑克理论》第2章中的推弃牌(Push/Fold)迭代示例,通过10bb HU场景的多次策略迭代,测试对最大化剥削策略(MES)、反剥削调整和纳什均衡收敛过程的理解。
使用建议:
场景设定
10bb HU Sit N’ Go,盲注5/10,BN=100,BB=100。双方只能选择全押或弃牌。
问题
第一部分:基础计算(2题)
问题1:底池赔率计算
问题:BN全押10bb(90筹码),BB需要跟注90筹码赢取总底池200筹码(90+90+10+10)。BB跟注所需的最低权益是多少?
- A) 40%
- B) 45%
- C) 50%
- D) 55%
答案与解析
答案:B
解析: 底池赔率 = 风险 / (风险 + 回报) = 90 / (90 + 110) = 90 / 200 = 0.45 = 45%
BB需要至少45%的权益才能盈亏平衡地跟注BN的任意两张牌全押。
公式:Pot Odds = Risk / (Risk + Reward)
问题2:MES跟注范围
问题:假设BN全押100%手牌(任意两张牌),BB需要跟注哪些手牌以实现最大化剥削策略(MES)?已知以下手牌对阵随机牌的权益:
-
72o vs 随机牌 ≈ 35%
-
J6o vs 随机牌 ≈ 43%
-
Q2o vs 随机牌 ≈ 44%
-
K2o vs 随机牌 ≈ 45%
-
22 vs 随机牌 ≈ 50%
-
A) 仅权益 > 50%的手牌
-
B) 所有权益 ≥ 45%的手牌
-
C) 所有权益 ≥ 40%的手牌
-
D) 所有对子和Ax
答案与解析
答案:B
解析:MES的核心原则是每手牌独立决策——只要一手牌的跟注EV为正,就应该跟注。BN全押100%时,BB需要45%权益才能盈亏平衡,所以所有权益≥45%的手牌都应跟注。
根据数据,K2o(45%)是临界点,22(50%)当然可以,但Q2o(44%)和J6o(43%)略低于门槛应该弃牌。
MES跟注范围约为全部手牌的66.21%,即所有权益≥45%的手牌组合。
第二部分:迭代过程(3题)
问题3:反剥削调整
问题:如果BN知道BB的MES跟注范围是66.21%(即会用所有权益≥45%的手牌跟注),BN可以调整全押范围来反剥削。以下哪项描述最准确?
- A) BN应该扩大全押范围,因为BB跟注太松
- B) BN应该收紧全押范围,弃掉那些被BB跟注范围主导的手牌
- C) BN应该保持100%全押不变
- D) BN应该只全押AA
答案与解析
答案:B
解析:当BB跟注66.21%时,BN很多弱牌的弃牌权益降低了(BB不再弃牌),同时被跟注时EV为负。BN需要计算每手牌vs BB跟注范围的EV:
EV(全押) = 弃牌率 × 底池 + 跟注率 × EV(被跟注时)
BN通过收紧范围(从100%降到46.61%),弃掉那些被BB范围主导的弱牌,可以提升整体EV。这就是反剥削——针对对手的已知策略做出最优调整。
迭代1→2数据:BN的EV从1.22提升到6.25,BB的EV从13.77降到8.48。
相关概念:概念-剥削性调整
问题4:多轮迭代的收敛
问题:经过多轮迭代后,双方的EV变化如下:
| 玩家 | 迭代1 EV | 迭代2 EV | 迭代3 EV | 纳什均衡EV |
|---|---|---|---|---|
| BN | 1.22 | 6.25 | 4.23 | 4.55 |
| BB | 13.77 | 8.48 | 10.75 | 10.45 |
以下哪项分析最准确?
- A) BN和BB的EV在每轮迭代后都单调递增
- B) 纳什均衡EV是双方EV的算术平均值
- C) 纳什均衡为双方提供了”保底EV”——无论对手策略如何,至少获得该数值
- D) BB在迭代1的EV最高,所以迭代1的策略是BB的最优策略
答案与解析
答案:C
解析:
- A错误:BN在迭代2→3的EV从6.25降至4.23,不是单调递增
- B错误:纳什均衡EV不是简单的算术平均,而是双方互相最大化剥削的稳定点
- C正确:GTO/纳什均衡的核心优势——保证最低EV。即使对手知道你的策略并完美反制,你的EV也不会低于均衡值
- D错误:迭代1的13.77建立在BN犯错(全押100%)的基础上,如果BN调整策略,BB的EV会大幅下降
纳什均衡的保底特性使其在对抗未知或高水平对手时特别有价值。
相关概念:概念-纳什平衡
问题5:GTO vs 剥削性策略的选择
问题:在10bb HU推弃牌游戏中,GTO(纳什均衡)策略为BN全押58.3%、BB跟注37.4%。以下哪种情况最适合偏离GTO、采用剥削性策略?
- A) 对手是未知玩家,第一次交手
- B) 观察到对手在BB位跟注过宽(超过50%)
- C) 比赛中筹码极短(5bb以下)
- D) 自己技术明显优于对手
答案与解析
答案:B
解析:
- A不适合:对未知玩家使用GTO是合理选择,保底EV
- B最适合:如果发现BB跟注50%+(远超GTO的37.4%),BN应收紧全押范围,只用强牌全押(因为弱牌的弃牌权益降低),这属于基于实际观察的剥削性调整。BN的迭代1→2就是从BB过度跟注中获利(弃掉弱牌、提升EV)
- C不正确:5bb以下GTO策略本身就会调整,不等于偏离GTO
- D过于模糊:技术优势不等于应该偏离GTO,需要具体的对手漏洞信息
关键原则:偏离GTO需要具体的对手漏洞信息。没有信息时GTO是最安全的选择。
第三部分:综合应用(2题)
问题6:纳什均衡的收敛条件
问题:在推弃牌迭代过程中,如果双方的策略在迭代过程中来回振荡、无法收敛到纳什均衡,以下哪种方法可能帮助收敛?
- A) 增加迭代速度,每次直接切换到最佳响应
- B) 每次迭代时只向最佳响应方向调整一小步,而非完全切换
- C) 随机选择策略
- D) 放弃迭代,直接使用直觉判断
答案与解析
答案:B
解析:当策略在迭代中振荡时,说明完全切换(从A直接跳到B)的幅度过大。解决方案是”软调整”——每次根据最佳响应方向移动一小步,而不是完全切换到新策略。这类似于梯度下降中的学习率控制。
这在实际扑克学习中也有启示:大幅度调整策略(从极紧到极松)往往不稳定,渐进式调整更可靠。
相关概念:概念-纳什平衡
问题7:MES与混合策略的关系
问题:以下关于MES(最大化剥削策略)的描述,哪一项最准确?
- A) MES中每手牌只能有一种玩法(要么全押要么弃牌,不能混合)
- B) MES中一手牌可以有混合策略,但仅当两种玩法的EV完全相等时
- C) MES中混合策略总是优于纯策略
- D) MES不考虑底池赔率
答案与解析
答案:B
解析:MES的核心是每手牌独立追求最大EV。如果一手牌的全押EV和弃牌EV不同,MES会选择EV更高的那个(纯策略)。但若两种选项的EV完全相等,则可以以任意比例混合——这就是无差别原则(The Indifference Principle)。
这也是为什么纳什均衡中可能出现混合策略:均衡是双方相互MES的结果,当两种行动EV相同时,混合策略自然出现。
第四部分:扩展思考(1题)
问题8:真实扑克中的推弃牌
问题:在实际扑克锦标赛中,10bb时的推弃牌决策比上述简化模型更复杂。以下哪项因素在简化模型中被完全忽略但在实战中至关重要?
- A) 手牌权益计算
- B) 位置
- C) ICM压力
- D) 底池赔率
答案与解析
答案:C
解析:
- A和D中,手牌权益和底池赔率都被模型包含
- B中,位置在HU中天然对等,但多人桌中UTG vs BTN的推弃牌差异巨大,模型未覆盖
- C最准确:模型假设筹码的现金价值是线性的(1筹码=1单位价值),但锦标赛中有ICM(独立筹码模型)——筹码的实际价值非线性,接近钱圈时每多赢1筹码的价值低于已拥有的筹码
实战中10bb时需要考虑:钱圈压力、 payout结构、对手 ICM 意识等。推弃牌模型是基础,但需要结合锦标赛动态调整。
迭代数据汇总
| 迭代 | BN全押范围 | BB跟注范围 | BN EV | BB EV |
|---|---|---|---|---|
| 迭代1 | 100% | 66.21% | 1.22 | 13.77 |
| 迭代2 | 46.61% | 30.3% | 6.25 | 8.48 |
| 迭代3 | — | — | 4.23 | 10.75 |
| 纳什均衡 | 58.3% | 37.4% | 4.55 | 10.45 |
关键洞察:
- BB的GTO保底EV为10.45,但若错误假设BN全押100%而跟注66.21%,面对BN反剥削时EV降至8.48
- GTO不要求最大EV,只保证最低EV——这是对抗强敌时的安全网
- 迭代过程展示了剥削→反剥削→均衡收敛的完整逻辑链
