推弃牌均衡计算问题集

概述

本问题集基于《现代扑克理论》第2章中的推弃牌(Push/Fold)迭代示例，通过10bb HU场景的多次策略迭代，测试对最大化剥削策略(MES)、反剥削调整和纳什均衡收敛过程的理解。

使用建议：

先阅读相关概念页面（概念-博弈论最优、概念-纳什平衡），再尝试回答问题
使用计算器辅助计算底池赔率和最低权益需求
对于错误的问题，复习相关数学公式

场景设定

10bb HU Sit N’ Go，盲注5/10，BN=100，BB=100。双方只能选择全押或弃牌。

问题

第一部分：基础计算（2题）

问题1：底池赔率计算

问题：BN全押10bb(90筹码)，BB需要跟注90筹码赢取总底池200筹码(90+90+10+10)。BB跟注所需的最低权益是多少？

A) 40%
B) 45%
C) 50%
D) 55%

答案与解析

答案：B

解析：底池赔率 = 风险 / (风险 + 回报) = 90 / (90 + 110) = 90 / 200 = 0.45 = 45%

BB需要至少45%的权益才能盈亏平衡地跟注BN的任意两张牌全押。

公式：Pot Odds = Risk / (Risk + Reward)

问题2：MES跟注范围

问题：假设BN全押100%手牌（任意两张牌），BB需要跟注哪些手牌以实现最大化剥削策略(MES)？已知以下手牌对阵随机牌的权益：

72o vs 随机牌 ≈ 35%
J6o vs 随机牌 ≈ 43%
Q2o vs 随机牌 ≈ 44%
K2o vs 随机牌 ≈ 45%
22 vs 随机牌 ≈ 50%
A) 仅权益 > 50%的手牌
B) 所有权益 ≥ 45%的手牌
C) 所有权益 ≥ 40%的手牌
D) 所有对子和Ax

答案与解析

答案：B

解析：MES的核心原则是每手牌独立决策——只要一手牌的跟注EV为正，就应该跟注。BN全押100%时，BB需要45%权益才能盈亏平衡，所以所有权益≥45%的手牌都应跟注。

根据数据，K2o(45%)是临界点，22(50%)当然可以，但Q2o(44%)和J6o(43%)略低于门槛应该弃牌。

MES跟注范围约为全部手牌的66.21%，即所有权益≥45%的手牌组合。

相关概念：概念-博弈论最优、概念-混合策略

第二部分：迭代过程（3题）

问题3：反剥削调整

问题：如果BN知道BB的MES跟注范围是66.21%（即会用所有权益≥45%的手牌跟注），BN可以调整全押范围来反剥削。以下哪项描述最准确？

A) BN应该扩大全押范围，因为BB跟注太松
B) BN应该收紧全押范围，弃掉那些被BB跟注范围主导的手牌
C) BN应该保持100%全押不变
D) BN应该只全押AA

答案与解析

答案：B

解析：当BB跟注66.21%时，BN很多弱牌的弃牌权益降低了（BB不再弃牌），同时被跟注时EV为负。BN需要计算每手牌vs BB跟注范围的EV：

EV(全押) = 弃牌率 × 底池 + 跟注率 × EV(被跟注时)

BN通过收紧范围（从100%降到46.61%），弃掉那些被BB范围主导的弱牌，可以提升整体EV。这就是反剥削——针对对手的已知策略做出最优调整。

迭代1→2数据：BN的EV从1.22提升到6.25，BB的EV从13.77降到8.48。

相关概念：概念-剥削性调整

问题4：多轮迭代的收敛

问题：经过多轮迭代后，双方的EV变化如下：

玩家	迭代1 EV	迭代2 EV	迭代3 EV	纳什均衡EV
BN	1.22	6.25	4.23	4.55
BB	13.77	8.48	10.75	10.45

以下哪项分析最准确？

A) BN和BB的EV在每轮迭代后都单调递增
B) 纳什均衡EV是双方EV的算术平均值
C) 纳什均衡为双方提供了”保底EV”——无论对手策略如何，至少获得该数值
D) BB在迭代1的EV最高，所以迭代1的策略是BB的最优策略

答案与解析

答案：C

解析：

A错误：BN在迭代2→3的EV从6.25降至4.23，不是单调递增
B错误：纳什均衡EV不是简单的算术平均，而是双方互相最大化剥削的稳定点
C正确：GTO/纳什均衡的核心优势——保证最低EV。即使对手知道你的策略并完美反制，你的EV也不会低于均衡值
D错误：迭代1的13.77建立在BN犯错（全押100%）的基础上，如果BN调整策略，BB的EV会大幅下降

纳什均衡的保底特性使其在对抗未知或高水平对手时特别有价值。

相关概念：概念-纳什平衡

问题5：GTO vs 剥削性策略的选择

问题：在10bb HU推弃牌游戏中，GTO（纳什均衡）策略为BN全押58.3%、BB跟注37.4%。以下哪种情况最适合偏离GTO、采用剥削性策略？

A) 对手是未知玩家，第一次交手
B) 观察到对手在BB位跟注过宽（超过50%）
C) 比赛中筹码极短（5bb以下）
D) 自己技术明显优于对手

答案与解析

答案：B

解析：

A不适合：对未知玩家使用GTO是合理选择，保底EV
B最适合：如果发现BB跟注50%+（远超GTO的37.4%），BN应收紧全押范围，只用强牌全押（因为弱牌的弃牌权益降低），这属于基于实际观察的剥削性调整。BN的迭代1→2就是从BB过度跟注中获利（弃掉弱牌、提升EV）
C不正确：5bb以下GTO策略本身就会调整，不等于偏离GTO
D过于模糊：技术优势不等于应该偏离GTO，需要具体的对手漏洞信息

关键原则：偏离GTO需要具体的对手漏洞信息。没有信息时GTO是最安全的选择。

相关概念：概念-博弈论最优、概念-剥削性调整

第三部分：综合应用（2题）

问题6：纳什均衡的收敛条件

问题：在推弃牌迭代过程中，如果双方的策略在迭代过程中来回振荡、无法收敛到纳什均衡，以下哪种方法可能帮助收敛？

A) 增加迭代速度，每次直接切换到最佳响应
B) 每次迭代时只向最佳响应方向调整一小步，而非完全切换
C) 随机选择策略
D) 放弃迭代，直接使用直觉判断

答案与解析

答案：B

解析：当策略在迭代中振荡时，说明完全切换（从A直接跳到B）的幅度过大。解决方案是”软调整”——每次根据最佳响应方向移动一小步，而不是完全切换到新策略。这类似于梯度下降中的学习率控制。

这在实际扑克学习中也有启示：大幅度调整策略（从极紧到极松）往往不稳定，渐进式调整更可靠。

相关概念：概念-纳什平衡

问题7：MES与混合策略的关系

问题：以下关于MES（最大化剥削策略）的描述，哪一项最准确？

A) MES中每手牌只能有一种玩法（要么全押要么弃牌，不能混合）
B) MES中一手牌可以有混合策略，但仅当两种玩法的EV完全相等时
C) MES中混合策略总是优于纯策略
D) MES不考虑底池赔率

答案与解析

答案：B

解析：MES的核心是每手牌独立追求最大EV。如果一手牌的全押EV和弃牌EV不同，MES会选择EV更高的那个（纯策略）。但若两种选项的EV完全相等，则可以以任意比例混合——这就是无差别原则(The Indifference Principle)。

这也是为什么纳什均衡中可能出现混合策略：均衡是双方相互MES的结果，当两种行动EV相同时，混合策略自然出现。

相关概念：概念-混合策略、概念-博弈论最优

第四部分：扩展思考（1题）

问题8：真实扑克中的推弃牌

问题：在实际扑克锦标赛中，10bb时的推弃牌决策比上述简化模型更复杂。以下哪项因素在简化模型中被完全忽略但在实战中至关重要？

A) 手牌权益计算
B) 位置
C) ICM压力
D) 底池赔率

答案与解析

答案：C

解析：

A和D中，手牌权益和底池赔率都被模型包含
B中，位置在HU中天然对等，但多人桌中UTG vs BTN的推弃牌差异巨大，模型未覆盖
C最准确：模型假设筹码的现金价值是线性的（1筹码=1单位价值），但锦标赛中有ICM（独立筹码模型）——筹码的实际价值非线性，接近钱圈时每多赢1筹码的价值低于已拥有的筹码

实战中10bb时需要考虑：钱圈压力、 payout结构、对手 ICM 意识等。推弃牌模型是基础，但需要结合锦标赛动态调整。

相关概念：概念-ICM、概念-博弈论最优

迭代数据汇总

迭代	BN全押范围	BB跟注范围	BN EV	BB EV
迭代1	100%	66.21%	1.22	13.77
迭代2	46.61%	30.3%	6.25	8.48
迭代3	—	—	4.23	10.75
纳什均衡	58.3%	37.4%	4.55	10.45

关键洞察：

BB的GTO保底EV为10.45，但若错误假设BN全押100%而跟注66.21%，面对BN反剥削时EV降至8.48
GTO不要求最大EV，只保证最低EV——这是对抗强敌时的安全网
迭代过程展示了剥削→反剥削→均衡收敛的完整逻辑链

JoyPoker

问题集-推弃牌均衡计算

推弃牌均衡计算问题集

概述

场景设定

问题

第一部分：基础计算（2题）

问题1：底池赔率计算

问题2：MES跟注范围

第二部分：迭代过程（3题）

问题3：反剥削调整

问题4：多轮迭代的收敛

问题5：GTO vs 剥削性策略的选择

第三部分：综合应用（2题）

问题6：纳什均衡的收敛条件

问题7：MES与混合策略的关系

第四部分：扩展思考（1题）

问题8：真实扑克中的推弃牌

迭代数据汇总

相关概念

目录