来一把剪刀石头布吧!

这学期选修的别的专业的课程。一开始看课程的名称叫做 “game theory”,我还以为是游戏理论,但是真正上课才知道,翻译成中文是 博弈论。不过,实际上我认为博弈本身即是游戏的重要要素之一,所以,课程还是相当吸引我的。只不过就是,有点难……话不多说,让我们进入博弈论的世界吧。

剪刀,石头,布!

什么是game theory?

游戏理论 (Game Theory) 是研究决策者(称为玩家)在特定规则和情境下如何做出最佳决策的理论和方法。它广泛应用于经济学、政治学、社会学、生物学、计算机科学等领域,以分析和理解竞争与合作行为。以下是游戏理论的一些基本概念和类型:

基本概念

玩家 (Players):参与决策过程的个体或团体。
策略 (Strategies):玩家可以选择的行动方案。
收益 (Payoffs):玩家在特定策略组合下获得的结果,通常用数值表示。
博弈 (Game):由玩家、策略集合和收益函数构成的模型。

在这里,我尤其想提一下Payoffs的概念。可以说,所有博弈的过程都是围绕Payoffs,玩家的最终目标,就是为了让自己的收益最大化,因此,所有的决策,都是根据Payoffs来决定的。之后所有的决策方案,也都是根据Payoffs来执行的。

博弈类型

静态博弈 (Static Games):玩家同时做出决策,不知道其他玩家的选择。通常用矩阵形式表示(例如,囚徒困境)。
动态博弈 (Dynamic Games):玩家依次做出决策,每个玩家可以观察到前面的决策。通常用扩展形式表示(例如,国际象棋)。
完全信息博弈 (Games of Perfect Information):所有玩家对博弈的结构和其他玩家的选择完全了解。
不完全信息博弈 (Games of Imperfect Information):至少有一个玩家对其他玩家的选择或博弈的某些方面不了解。
零和博弈 (Zero-Sum Games):一个玩家的收益完全等于其他玩家的损失,总和为零。
非零和博弈 (Non-Zero-Sum Games):玩家的收益总和不一定为零,可以有合作和双赢的可能。

关键概念和解

纳什均衡 (Nash Equilibrium):在给定其他玩家策略的情况下,没有玩家可以通过改变自己的策略而获得更高的收益。即每个玩家的策略都是对其他玩家策略的最佳回应。
占优策略 (Dominant Strategy):无论其他玩家选择什么策略,某个玩家选择该策略总能获得更高的收益。
混合策略 (Mixed Strategy):玩家以一定的概率选择不同的纯策略。
子博弈完美均衡 (Subgame Perfect Equilibrium):在每个子博弈中,策略组合都是纳什均衡。

在这里,最重要的概念就是 纳什均衡,在后面的内容中,会更加详细的介绍。

经典博弈示例

囚徒困境

囚徒困境是一个相当有名的博弈论例子。

  • 两个罪犯被分别审问,如果双方都招供,各判 5 年;如果一方招供另一方不招供,招供者免罪,不招供者判 10 年;如果双方都不招供,各判 1 年。纳什均衡是双方都招供。

博弈论的知识系统概览

根据老师的PPT,博弈论整体的知识系统概览如下:

在这一节课中,我们主要讨论 **“不合作博弈”**的情况。

偏好关系(preference relation)

基本定义

给定一个选择集合𝑋,其中的元素表示可供选择的不同选项或物品。偏好关系通常用符号⪰表示,它具有以下几种形式:

    1. 弱偏好⪰
      xyx\succeq y 表示x至少和y一样好。
    1. 严格偏好\succ
      xyx\succ y 表示x比y好。
    1. 无差异\sim
      xyx\sim y 表示x和y大致相等。

效用函数(Utility Function)

效用函数 (Utility Function) 是一种将选项(或物品)映射到实数值的数学工具,用于量化个体对不同选项的偏好程度。效用函数的核心思想是用一个数值表示每个选项的“满意度”或“效用”,从而使得比较不同选项变得更加直观和简单。

定义

效用函数 $ u:X\rightarrow R$ 是一个从选项集合𝑋到实数集合R的映射。对于两个选项𝑥和𝑦,如果u(x)>u(y),则表示个体更偏好𝑥而非y。

苹果例子

假设我们有三个苹果:红苹果 (Red Apple, R)、绿苹果 (Green Apple, G) 和黄苹果 (Yellow Apple, Y),个体的偏好关系如下:
红苹果 R≻G 绿苹果
绿苹果 G≻Y 黄苹果

我们可以通过效用函数为每个苹果赋予一个效用值𝑢以反映这种偏好关系。设定如下的效用值:

u(R)=3u(G)=2u(Y)=1u(R)=3 \\ u(G)=2 \\ u(Y)=1

在这个例子中,效用函数𝑢满足偏好关系:

  • 因为R≻G,所以u®>u(G) (即3>2)
  • 因为G≻Y,所以u(G)>u(Y) (即2>1)

期望效用(Expected Utility)

有时候我们对于一个事物的偏好可能会由于其不确定性而无法确定,一个很直观的例子就是彩票。
例如:
彩票A,50%的几率获得100元,50%的几率“谢谢惠顾”
彩票B,100%的几率获得50元。

我们大部分人对于两者的偏好应该是,偏向彩票B,可以表示为:

u(100)=18u(50)=10u(0)=0u(100元)=18 \\ u(50元)=10 \\ u(0元)=0

因此

E(U(A))=180.5+00.5=9<E(U(B))=10E(U(A))=18*0.5+0*0.5=9<E(U(B))=10