博弈论与决策行为 - Be Happy Every Day

概述#

本章研究多个理性主体在相互影响下如何作出决策。

在前面完全竞争或单个厂商决策中，决策者通常只需要考虑自己的约束条件和目标函数；但在寡头垄断市场中，厂商的利润取决于自己的选择，也取决于竞争对手的选择。因此，本章的核心作用是为“不完全竞争市场”尤其是“寡头垄断”提供分析工具。

重点有三条：

理解博弈的基本语言：局中人、策略、支付、信息、行动顺序；
掌握三类均衡：上策均衡、纳什均衡、子博弈精炼纳什均衡；
会用博弈论解释寡头厂商的勾结、背叛、广告竞争、价格战、产量竞争。

博弈论的核心问题：当每个人都在考虑别人会怎么做时，最终会形成什么稳定结果。

博弈论的基本思想#

为什么微观经济学要引入博弈论#

在单人决策问题中，决策者通常可以直接求解最优选择。

例如：

消费者在预算约束下最大化效用；
厂商在成本与需求条件下最大化利润。

但在寡头垄断市场中，厂商之间高度相互依存：

甲厂商降价，会影响乙厂商销量；
乙厂商扩产，会影响市场价格；
某一厂商违背卡特尔协议，会改变其他厂商的收益；
潜在进入者是否进入，会取决于在位厂商是否会发动价格战。

因此，寡头厂商决策时必须考虑：

我的最优选择，取决于对手会如何选择。

这正是博弈论进入微观经济学的原因。

博弈论的产生与发展#

博弈论，又称对策论或游戏论，研究理性决策主体之间发生冲突或合作时的决策与均衡问题。严格说，它更像一种分析方法，用来把现实中复杂的互动关系抽象成清晰的决策结构。

教材中的发展线索可以整理为：

早期博弈论以合作博弈为重要内容；
冯·诺依曼和摩根斯坦的著作推动博弈论系统形成；
纳什提出纳什均衡，现代非合作博弈论由此发展；
塔克提出或明确化囚徒困境；
泽尔腾把纳什均衡引入动态分析，提出精炼思想；
海萨尼把不完全信息引入博弈论。

对本课程来说，最重要的不是人物和历史细节，而是这条逻辑：

从单人最优化，转向多人互动决策；从一般均衡概念，转向策略均衡概念。

博弈的基本要素#

一个完整的博弈至少要说明：谁在参与、可以怎么做、结果如何评价、知道什么信息、谁先行动。

局中人#

局中人，是参加博弈的决策主体。

局中人可以是：

个人，例如囚徒、买者、卖者；
企业，例如寡头厂商；
团体，例如政党、国家、联盟。

在经济学分析中，局中人通常被假定为理性的，即在给定约束条件下追求自身利益最大化。

注意：

至少有两个局中人才构成博弈；
一个团体内部也可能存在不同利益，从而构成博弈；
若某主体没有可选择策略，实际上不能算真正参加博弈。

支付#

支付，是博弈结束时局中人得到的利益。

支付可以用不同方式表示：

货币收益，例如利润、损失；
效用水平，例如满意程度；
刑期年数，例如囚徒困境中被判刑的年数。

考试中要注意支付的方向：

如果支付表示利润，数字越大越好；
如果支付表示刑期或成本，数字越小越好。

策略#

策略，是局中人为实现目标而采取的一系列行动或行动计划。

策略和行动有区别：

行动是某个具体时点上的选择；
策略是对整个博弈过程的完整计划。

在静态博弈中，策略通常比较直观，例如：坦白或抵赖、守约或违约、治理或不治理。

在动态博弈中，策略要说明在每一个可能节点上如何行动。例如进入博弈中，潜在进入者不仅要决定是否进入，还可能要说明面对价格战时是否迎战。

信息与行动顺序#

信息指局中人在决策时知道什么。

常见信息包括：

其他局中人的特征；
可选策略；
各种策略组合下的支付；
之前已经发生的行动。

行动顺序指局中人是同时行动还是先后行动。

同时行动：通常用支付矩阵表示；
先后行动：通常用博弈树表示。

行动顺序非常重要。先行动者可能拥有先动优势，后行动者也可能根据先行动者的行为调整策略。

互动决策与策略均衡#

博弈论研究的是互动决策。

在互动决策中，每个局中人的结果都取决于：

\text{自己的策略} + \text{其他局中人的策略}

因此，均衡不再只是“某个主体单独最优”的状态，而是一个策略组合稳定状态：

给定其他人的策略，每个局中人都没有动机单方面改变自己的策略。

这就是本章后面所有均衡概念的共同基础。

博弈的分类方式#

静态博弈、动态博弈与重复博弈#

按行动顺序，可以分为静态博弈和动态博弈。

静态博弈：局中人同时选择策略，或虽然不是同时行动，但后行动者并不知道先行动者已经选择了什么。

典型例子：

囚徒困境；
广告博弈；
卡特尔成员是否违约。

动态博弈：局中人按先后顺序行动，后行动者通常可以观察到前面的行动。

典型例子：

进入博弈；
斯坦克贝模型；
厂商先降价、竞争对手再反应。

重复博弈：同一个博弈反复进行。每一次博弈称为原博弈或阶段博弈。

重复博弈的含义：

现实中的厂商经常长期竞争；
本期背叛可能影响下一期合作；
因此不能把每次博弈完全割裂开来看。

完全信息博弈与不完全信息博弈#

按局中人掌握的信息，可以分为完全信息博弈和不完全信息博弈。

完全信息博弈：每个局中人都知道其他局中人的特征、策略和支付。

例如：

棋类博弈；
教材中的许多支付矩阵例子。

不完全信息博弈：局中人只知道部分信息。

例如：

拍卖中竞拍者不知道别人对标的物的真实估价；
旧车市场上买者不知道旧车真实质量；
保险公司不知道投保人的真实风险水平。

教材把信息和行动顺序结合，得到四类博弈：

行动顺序 / 信息	完全信息	不完全信息
静态博弈	完全信息静态博弈：纳什均衡	不完全信息静态博弈：贝叶斯纳什均衡
动态博弈	完全信息动态博弈：子博弈精炼纳什均衡	不完全信息动态博弈：精炼贝叶斯纳什均衡

本课程期末复习重点主要在前两类均衡：纳什均衡和子博弈精炼纳什均衡。

零和博弈、常和博弈与变和博弈#

按支付结果，可以分为零和博弈、常和博弈和变和博弈。

零和博弈：双方支付之和为零。

含义：

一方所得就是另一方所失；
利益冲突非常强；
田忌赛马可以看成零和博弈。

常和博弈：双方支付之和为一个固定常数。

可分为：

正和博弈：可能出现双赢；
负和博弈：总体收益为负，现实中常表现为损人不利己。

变和博弈：不同策略组合下，双方支付之和不同。

最典型的是囚徒困境。双方都合作与双方都背叛时，总支付并不相同。

考试中要记住层次关系：

变和博弈最一般；常和博弈是特殊情形；零和博弈又是常和博弈的特殊情形。

合作博弈与非合作博弈#

按参与主体和协议约束，可以分为合作博弈与非合作博弈。

合作博弈：局中人可以通过有约束力的协议形成联盟，重点分析联盟能获得什么收益、如何分配收益。

例如：寡头之间达成有约束力协议，共同确定利润最大化的产量和价格。

非合作博弈：局中人通常无法达成有约束力的协议，重点分析每个个体在规则和信息约束下如何行动。

例如：

价格战；
卡特尔解体；
囚徒困境；
厂商间广告竞争。

本章主要分析非合作博弈，因为它更适合解释现实中寡头厂商之间“想合作但容易背叛”的问题。

博弈的表达方式#

策略式与支付矩阵#

策略式，也称标准式，用支付矩阵表示博弈。

支付矩阵适合表示：

局中人较少；
策略较少；
行动顺序不重要或可以抽象掉的博弈。

支付矩阵一般写成：

行表示一个局中人的策略；
列表示另一个局中人的策略；
每个格子里的有序数对表示双方支付。

例如教材的广告博弈：A、B 两个寡头厂商都可以选择花 100 万元或 20 万元做广告。

B \ A	A：100万元	A：20万元
B：100万元	$(0,0)$	$(120,-40)$
B：20万元	$(-40,120)$	$(80,80)$

基本设定

两个厂商生产相近产品。双方都花 100 万元广告费时，只是维持原市场份额；若双方都把广告费降到 20 万元，则各自能节省 80 万元；但若一方降广告费、另一方不降，降费者会损失客户，不降费者会获得更多收益。

推理逻辑

对 A 来说：

若 B 花 100 万元，A 花 100 万元比花 20 万元更好；
若 B 花 20 万元，A 花 100 万元也比花 20 万元更好。

因此，A 的上策是花 100 万元。B 的逻辑相同。

结论

均衡是双方都花 100 万元做广告。虽然双方都花 20 万元会使双方都节省费用，但由于担心对手不降广告费，最终双方都会选择高广告支出。

易错点

不要只看双方共同最优的 $(80,80)$ ；
要逐个分析每个局中人在对方不同选择下的最优反应；
这个例子体现了寡头竞争中的“防御性支出”。

扩展式与博弈树#

扩展式用博弈树表示博弈，适合分析动态博弈。

博弈树能表示：

谁先行动；
谁后行动；
每一步有哪些可选行动；
到达终点后各方支付是多少；
后行动者在行动时知道哪些历史信息。

教材的进入博弈结构如下：

潜在进入厂商 $E$ 先决定是否进入；
若进入，在位厂商 $I$ 决定是否发动价格战；
若发动，进入厂商 $E$ 再决定是否迎战。

博弈树中的基本元素：

初始结：博弈开始的节点；
枝权：从节点出发的可选行动；
终点结：博弈结束的位置；
支付向量：终点结后的各方收益；
子博弈：从某个决策节点开始直到结束的一部分博弈。

上策与上策均衡#

上策#

上策，是无论对方选择什么策略，都能使自己支付优于其他策略的策略。

用符号表示：对局中人 $i$ ，如果策略 $s_i^*$ 对任意对手策略 $s_{-i}$ 都满足

u_i(s_i^*,s_{-i}) \geq u_i(s_i,s_{-i})

那么 $s_i^*$ 就是局中人 $i$ 的上策。

上策均衡，是所有局中人都选择自己上策所构成的策略组合。

直觉：

不管别人怎么做，我这样做都最好。

囚徒困境#

囚徒困境是理解本章最重要的模型之一。

教材中的支付用“刑期年数”表示，刑期越少越好。

李四 \ 张三	张三：坦白	张三：抵赖
李四：坦白	$(5,5)$	$(1,10)$
李四：抵赖	$(10,1)$	$(2,2)$

基本设定

张三和李四被隔离审讯，各自有两种策略：坦白或抵赖。两人不能沟通，只能根据自己的利益判断。

推理逻辑

对张三来说：

如果李四坦白，张三坦白判 5 年，抵赖判 10 年，坦白更好；
如果李四抵赖，张三坦白判 1 年，抵赖判 2 年，坦白更好。

所以张三的上策是坦白。

对李四来说逻辑相同，所以李四的上策也是坦白。

结论

均衡结果是：

(\text{坦白},\text{坦白})

这是上策均衡，也是纳什均衡。

但双方都坦白时各判 5 年；双方都抵赖时各判 2 年。后者对两人整体更好。

囚徒困境说明：个体理性选择可能导致集体非最优。

易错点

“双方都抵赖”是集体最优，不是均衡；
“双方都坦白”是均衡，但不是整体最优；
刑期支付要反向理解，数字小才好；
囚徒困境的关键不在“是否坏人”，而在“个人激励和集体利益冲突”。

重复剔除下策与智猪博弈#

有些博弈不存在所有局中人都有上策的情况，但仍可通过剔除下策来寻找均衡。

教材用智猪博弈说明这一点。

小猪 \ 大猪	大猪：按	大猪：等待
小猪：按	$(5,1)$	$(9,-1)$
小猪：等待	$(4,4)$	$(0,0)$

这里括号中通常按“大猪，小猪”理解。

基本设定

猪圈一端有按钮，另一端有食槽。按按钮有成本，猪食进入食槽后大猪和小猪分配不同。

推理逻辑

对小猪来说：

若大猪按，小猪等待得到 4，按得到 1，等待更好；
若大猪等待，小猪等待得到 0，按得到 -1，等待更好。

因此，小猪的上策是等待。

大猪知道小猪会等待后，只能在“按”和“等待”中选择。若大猪按，可得到 4；若等待，得到 0。因此大猪选择按。

结论

均衡结果是：

(\text{大猪按},\text{小猪等待})

这被称为重复剔除下策得到的均衡。

易错点

小猪有上策，大猪没有上策；
不能直接说这是普通上策均衡；
关键步骤是先剔除小猪的下策“按”，再看大猪的最优选择。

纳什均衡#

纳什均衡的含义#

纳什均衡是这样一种策略组合：给定其他局中人的策略，每个局中人当前选择都是自己的最佳反应。

用符号表示：策略组合 $s^*=(s_1^*,s_2^*,\dots,s_n^*)$ 是纳什均衡，当且仅当对每个局中人 $i$ ，都有：

u_i(s_i^*,s_{-i}^*) \geq u_i(s_i,s_{-i}^*)

直觉：

别人都不变时，我单方面改变策略不会变得更好。

纳什均衡的两个要点：

每个局中人的策略都是给定他人策略时的最佳反应；
均衡具有自我实施功能，没有人愿意单方面偏离。

上策均衡与纳什均衡的区别#

这是期末非常容易考的比较题。

比较点	上策均衡	纳什均衡
判断标准	不管对方怎么选，自己的策略都最好	给定对方已经这样选，自己的策略最好
对策略要求	更强	更弱
是否一定存在	不一定	在很多博弈中存在，但可能不唯一
与对方选择的关系	与对方选择无关	依赖对方策略
关系	上策均衡一定是纳什均衡	纳什均衡不一定是上策均衡

关键结论：

上策均衡是纳什均衡的特殊情形。

理由：

如果一个策略无论对方怎么做都最好，那么在给定对方某个具体策略时当然也最好；
但如果一个策略只是在对方某个具体策略下最好，它未必在对方所有策略下都最好。

性别战与多个纳什均衡#

教材用“性别战”说明：一个博弈可能没有上策均衡，却有多个纳什均衡。

【图片占位符：插入教材第240页图7-5“性别战”，用于说明纳什均衡可能不唯一】

女方 \ 男方	男方：球赛	男方：电影
女方：球赛	$(2,1)$	$(0,0)$
女方：电影	$(0,0)$	$(1,2)$

基本设定

双方都希望一起活动，但男方更偏好看球赛，女方更偏好看电影。

推理逻辑

给定男方看球赛，女方也看球赛是最佳反应；
给定女方看球赛，男方看球赛是最佳反应；
给定男方看电影，女方也看电影是最佳反应；
给定女方看电影，男方看电影是最佳反应。

结论

存在两个纳什均衡：

(\text{球赛},\text{球赛}), \qquad (\text{电影},\text{电影})

易错点

不存在上策，不代表不存在纳什均衡；
纳什均衡可能不唯一；
协调类博弈的重点是“大家行动一致”，但不同人偏好的均衡不同。

古尔诺模型与纳什均衡#

教材指出，上一章的古尔诺解可以理解为一个纳什均衡。

在古尔诺模型中：

两个寡头没有勾结；
每个厂商在给定对方产量的条件下选择自己的最优产量；
均衡时，双方的产量互为最佳反应。

因此：

古尔诺均衡本质上是“产量选择”的纳什均衡。

这对考试很重要：

价格竞争可以用博弈论解释；
产量竞争也可以用博弈论解释；
寡头厂商的核心特征是策略相互依赖。

子博弈与子博弈精炼纳什均衡#

纳什均衡的问题#

纳什均衡很重要，但在动态博弈中会出现问题。

教材总结的核心问题可以理解为：

一个博弈可能有多个纳什均衡；
有些纳什均衡依赖不可置信威胁；
纳什均衡只要求整体策略组合稳定，不一定要求每个子过程都合理。

因此，动态博弈需要更强的均衡概念：子博弈精炼纳什均衡。

子博弈#

子博弈，是从某个决策节点开始，直到博弈结束的一部分博弈。

在扩展式博弈中，一个大博弈内部可能包含多个子博弈。

教材提醒：整个博弈本身也可看作一个子博弈。

理解方式：

从某个节点开始；
包含此后所有可能行动；
包含对应终点和支付；
可以作为一个完整的小博弈分析。

子博弈精炼纳什均衡#

子博弈精炼纳什均衡：一个纳什均衡若在每一个子博弈中诱导出的策略组合也构成该子博弈的纳什均衡，则它是子博弈精炼纳什均衡。

核心含义：

不仅整个博弈要稳定，每个局部子博弈也要稳定。

更直观地说：

子博弈精炼纳什均衡要剔除不可置信威胁。

关系：

子博弈精炼纳什均衡一定是纳什均衡；
纳什均衡不一定是子博弈精炼纳什均衡。

进入博弈与不可置信威胁#

进入博弈是本章理解子博弈精炼纳什均衡的重点模型。

基本设定

潜在进入者 $E$ 先决定是否进入市场；
若进入，在位厂商 $I$ 选择是否发动价格战；
若在位厂商发动价格战，进入者 $E$ 再决定迎战或不迎战。

推理逻辑

在策略式意义上，可能出现一些纳什均衡，例如依赖“如果你进入，我就迎战”之类威胁的均衡。

但在实际子博弈中，如果进入者已经面临迎战或不迎战的选择，而不迎战的支付高于迎战，那么“迎战”就是不可置信威胁。

承诺行动可以使威胁变得可置信。教材用“破釜沉舟”说明：如果当事人通过行动使自己不执行威胁会遭受更大损失，威胁就可能变得可信。

结论

进入博弈中，经过子博弈精炼后，教材得到的均衡是：

\text{进入} \rightarrow \text{发动价格战} \rightarrow \text{不迎战}

对应结果是：进入厂商进入，在位厂商发动价格战，进入厂商不迎战。

易错点

不能只找纳什均衡，还要看威胁是否可信；
子博弈精炼纳什均衡必须先是纳什均衡；
动态博弈要注意行动先后顺序；
不可置信威胁在现实中经常表现为“说得很狠，但到那个节点真做不划算”。

逆向归纳法#

逆向归纳法，是求解完全信息动态博弈中子博弈精炼纳什均衡的常用方法。

步骤：

从最后一个决策节点开始；
找出最后行动者的最优选择；
把该结果当成前一个节点面对的结果；
继续向前推；
一直推回初始节点。

进入博弈中的逆向归纳：

最后看进入者 $E$ ：面对迎战与不迎战，选择不迎战；
再看在位厂商 $I$ ：知道 $E$ 会不迎战，于是选择发动；
最后看 $E$ 是否进入：比较进入后的结果和不进入的结果，选择进入。

逆向归纳法的前提是：

局中人理性是共同知识。

也就是说，每个局中人不仅理性，而且知道别人理性，也知道别人知道自己理性，如此递推。

教材还指出，前一章的斯坦克贝模型也可用逆向归纳理解：先确定后行动厂商的最优反应，再确定先行动厂商的最优选择。

厂商之间的博弈#

这一部分是本章和“不完全竞争市场”“寡头垄断”联系最紧密的内容。

寡头垄断市场中，厂商数量少，相互依存强。厂商通常面临两类选择：

合作：共同追求垄断利润；
不合作：各自追求自身利润最大化。

合作可能带来更高总利润，但如果缺乏有效监督和强制执行，每个厂商都有背叛动机。

卡特尔的解体#

教材设定两个同等规模厂商甲、乙，它们通过协议结成卡特尔，各自有两种策略：守约或违约。

乙 \ 甲	甲：守约	甲：违约
乙：守约	$(1000,1000)$	$(1200,400)$
乙：违约	$(400,1200)$	$(500,500)$

基本设定

双方都守约：共同维持卡特尔，各得 1000 万元；
一方违约、一方守约：违约方扩大产量，利润增至 1200 万元；守约方受损，只得 400 万元；
双方都违约：卡特尔实质失效，各得 500 万元。

推理逻辑

对每个厂商来说：

若对方守约，自己违约利润更高；
若对方违约，自己违约仍比守约更好。

所以违约是双方的上策。

结论

均衡是：

(\text{违约},\text{违约})

卡特尔因此不稳定，容易解体。

易错点

“双方守约”利润最高，但没有强制执行时不稳定；
卡特尔的难点在于监督和惩罚机制；
现实中卡特尔可能反复解体、重组，因此“不稳定”和“长期存在”可以同时出现。

价格战#

教材设定两个厂商 A、B，产品几乎同质，每家厂商有两种价格策略：正常价格或超低价格。

B \ A	A：正常价格	A：超低价格
B：正常价格	$(100,100)$	$(0,-100)$
B：超低价格	$(-100,0)$	$(0,0)$

基本设定

双方都正常价格：各得 100 万元利润；
一方超低价、一方正常价：超低价方利润为 0，正常价方因卖不出去亏损 100 万元；
双方都超低价：都只能获得 0 利润。

推理逻辑

价格战中存在两个纳什均衡：

(\text{正常价格},\text{正常价格}), \qquad (\text{超低价格},\text{超低价格})

如果双方能形成默契，维持正常价格对双方更好；但若一方担心对方率先降价，就可能被迫跟进，最终进入超低价格竞争。

结论

价格战对消费者短期有利，但对厂商可能是灾难性的：利润下降，甚至影响资金积累和技术进步。

易错点

价格战不一定只有一个均衡；
不能把“消费者得利”直接等同于“厂商理性结果”；
超低价竞争可能是防御性选择，因为不降价的一方可能损失更大。

污染博弈#

两个企业 X、Y 面对污染问题，可以选择治理或不治理。

Y \ X	X：治理	X：不治理
Y：治理	$(20,20)$	$(40,10)$
Y：不治理	$(10,40)$	$(30,30)$

基本设定

双方都治理：各得 20 万元利润；
一方治理、一方不治理：不治理方成本低、利润高，治理方成本高、竞争力下降；
双方都不治理：各得 30 万元利润，但社会环境受损。

推理逻辑

对单个企业来说，不治理可以避免治理成本，提高短期利润。因此，各企业从自身利润最大化出发，会选择不治理。

结论

均衡是：

(\text{不治理},\text{不治理})

这是低效率均衡，体现了市场机制在外部性问题上的失败。

易错点

企业个体理性会导向环境恶化；
这类问题需要政府管制、排污收费或产权制度来改变支付结构；
污染博弈本质上也是囚徒困境的一种经济应用。

寡头厂商行为的考试理解#

博弈论解释寡头行为时，重点抓住这几条：

1. 勾结为什么有吸引力

寡头厂商数量少，若联合限制产量或维持高价格，就可能获得接近垄断的利润。

2. 勾结为什么不稳定

一旦协议缺乏强制执行，每个厂商都有偷偷降价、扩大产量或违约的动机。

3. 背叛为什么会发生

背叛通常能在短期提高自身利润，例如扩大产量、抢占市场、降低价格。

4. 价格竞争为什么可能恶化

同质产品中，一方降价可能迫使另一方跟进，最终双方利润都下降。

5. 产量竞争为什么是纳什均衡问题

在古尔诺模型中，每个厂商都在给定对方产量下选择最优产量，因此均衡是双方产量互为最佳反应。

6. 斯坦克贝模型为什么要用逆向归纳

斯坦克贝模型有行动先后顺序：领导厂商先选产量，追随厂商后选产量。求解时要先分析追随厂商反应，再反推领导厂商选择。

买者与卖者之间的博弈#

信息不完全与信息不对称#

买者与卖者之间的博弈主要来自信息不完全和信息不对称。

信息不完全：市场主体并不掌握所有相关信息。

信息不对称：交易双方掌握的信息不一样，一方知道得更多。

常见情形：

药品出售者比购买者更了解药品真实功能；
旧车卖者比买者更了解旧车质量；
医疗保险购买者比保险公司更了解自己的身体状况。

信息不对称会影响预期和决策，进而导致市场失灵，表现为：

逆向选择；
道德风险；
委托—代理问题。

旧车市场#

【图片占位符：插入教材第252页关于“旧车市场”的分析文字或相关表述，用于说明卖者信息优势如何导致买者压低出价和高质量旧车退出市场】

基本设定

旧车市场上，卖者知道车辆质量，买者不知道。外表相似的车，质量可能差别很大。

推理逻辑

卖者可能利用信息优势，把质量差的旧车包装成质量好的旧车出售。买者知道存在这种风险，因此不愿出高价，只愿按平均质量或较低质量出价。

由于买者出价偏低，高质量旧车卖者不愿进入市场，市场上留下更多低质量旧车。

结论

旧车市场可能出现“劣车驱逐好车”的结果，高质量商品退出，市场交易效率下降。

易错点

旧车问题的关键是买卖双方信息不对称；
买者低出价是理性防范，不是单纯“吝啬”；
高质量旧车退出后，市场平均质量进一步下降。

保险市场#

基本设定

保险公司无法完全观察投保人的风险水平和投保后的行为。投保人知道更多自身风险信息，也能改变自己的谨慎程度。

推理逻辑

保险市场中存在两类问题：

逆向选择：高风险者更愿意投保，低风险者可能退出；
道德风险：投保后，投保人可能降低防范程度。

例如：

买了医疗保险后更多看医生，要求更多贵重药品；
买了盗窃险后不愿加固门锁；
买了汽车偷盗险后不愿安装更好的防盗装置；
买了火灾险后不再认真检查消防设备。

【图片占位符：插入教材第253页关于保险市场道德风险的文字或例子，用于说明投保后行为变化如何提高损失概率】

结论

道德风险会提高事故发生概率，迫使保险公司提高保费。严重时，某些保险服务难以通过私人市场有效提供。

易错点

道德风险通常发生在合约签订之后；
逆向选择通常发生在合约签订之前；
道德风险不等同于犯罪行为，它更多表现为防范努力下降。

信贷配给#

基本设定

银行贷款收益取决于利率和企业还款概率。企业比银行更了解自身经营状况、项目前景和偿债能力。

推理逻辑

银行若按平均风险定价：

低风险企业觉得利率过高，可能退出借贷市场；
高风险企业因为可能获得高收益，更愿意借款；
借款者平均风险上升，银行坏账风险增加。

若银行继续提高利率，可能进一步吸引高风险借款者，挤出低风险借款者。

结论

信贷市场中可能出现信贷配给，即银行不单纯通过提高利率出清市场，而是限制贷款数量。

易错点

利率提高不一定降低银行风险；
高利率可能改变借款人构成；
信息不对称会导致市场不能按普通供求逻辑顺利出清。

概述#

目录#

博弈论的基本思想#

为什么微观经济学要引入博弈论#

博弈论的产生与发展#

博弈的基本要素#

局中人#

支付#

策略#

信息与行动顺序#

互动决策与策略均衡#

博弈的分类方式#

静态博弈、动态博弈与重复博弈#

完全信息博弈与不完全信息博弈#

零和博弈、常和博弈与变和博弈#

合作博弈与非合作博弈#

博弈的表达方式#

策略式与支付矩阵#

扩展式与博弈树#

上策与上策均衡#

上策#

囚徒困境#

重复剔除下策与智猪博弈#

纳什均衡#

纳什均衡的含义#

上策均衡与纳什均衡的区别#

性别战与多个纳什均衡#

古尔诺模型与纳什均衡#

子博弈与子博弈精炼纳什均衡#

纳什均衡的问题#

子博弈#

子博弈精炼纳什均衡#

进入博弈与不可置信威胁#

逆向归纳法#

厂商之间的博弈#

卡特尔的解体#

价格战#

污染博弈#

寡头厂商行为的考试理解#

买者与卖者之间的博弈#

信息不完全与信息不对称#

旧车市场#

保险市场#

信贷配给#

评论