フォーク定理とは

/ゲーム理論

フォーク定理とは、無限回の繰り返しゲームにおいて、協力解が均衡として成立するという定理です。この均衡は、互いがトリガー戦略を取った場合に現れます。

繰り返しゲーム

繰り返しゲームとは、同じ戦略形ゲームを何回も繰り返して行うゲームです。但し、各回の後に各プレイヤが取った行動(戦略)は全てのプレイヤに知らされるものとします。

$T$ 回繰り返されれた場合の平均利得の現在価値は、$t$ 期の利得を $R_t$、割引因子($1-$利率)を $\delta$ とすると以下で求められます。

$$R=\frac{1}{T}(R_1+\delta R_2+\delta^2R_3+\cdots+\delta^{T-1}R_T)=\frac{1}{T}\sum_{t=1}^T\delta^{t-1}R_t$$

無限回繰り返しゲーム

次に、これを無限回繰り返される場合に拡張しますが、毎回同じ利得(平均利得)を得た場合の合計利得は、以下で求められるため、

$$R_\infty=\sum_{t=1}^\infty\delta^{t-1}R=\frac{R}{1-\delta}$$

無限回繰り返される場合の平均利得の現在価値を以下で定義します。

$$R=(1-\delta)\sum_{t=1}^\infty\delta^{t-1}R_t$$

トリガー戦略

トリガー戦略とは、相手が「協力」的ならば「協力」するが、一度相手が「非協力」に転じた場合は、それ以降自分も「非協力」(相手に不利な行動)を取り続ける戦略です。

尚、一度「非協力」になった後でも、相手が「協力」になった場合は、自分も「協力」に戻す戦略は「Tit-for-tat 戦略」(応報戦略)と呼ばれています。

フォーク定理の例

1回のみのゲームの場合

プレイヤ $A$ が行動 $X$、プレイヤ $B$ 行動 $Y$ を取る場合の行動の組を $(X,Y)$、その場合のプレイヤ $A$ の利得を $A(X,Y)$、プレイヤ $B$ の利得を $B(X,Y)$ で表すとします。このときの利得表を以下で表します。

$A\backslash B$ $B:X$ $B:Y$
$A:X$ $A(X,X)=4$、$B(X,X)=4$ $A(X,Y)=1$、$B(X,Y)=5$
$A:Y$ $A(Y,X)=5$、$B(Y,X)=1$ $A(Y,Y)=2$、$B(Y,Y)=2$

この例は、「$X$:価格維持」、「$Y$:値下げ」と置くと、2つの企業間の価格競争を表し、いわゆる「囚人のジレンマ」のパターンです。

両社が価格維持の行動を取ると両社の利得は共に「4」になります。しかし、互いの最適反応戦略は値下げであるため、ナッシュ均衡での両社の利得は共に「2」になってしまいます。1回のみの戦略型ゲームの場合は、このナッシュ均衡が現れます。

無限回繰り返しの場合

しかし、無限回繰り返しゲームの場合は状況が変わり、両社のトリガー戦略がナッシュ均衡として現れます。

次の例は、最初は協力(価格維持)で、$t$ 回目で $A$ が非協力(値下げ)に転じた場合です。$t$ 回目には $A$ の利得は「5」になり一時的に増えますが、$t+1$ 回目で $B$ も非協力(値下げ)に転じると、$A$ の利得は「2」に減ってしまいます。

回数 ・・・ $t-1$ $t$ $t+1$ $t+2$ ・・・
$A$
$B$

以上より、価格維持を続けるという戦略が合理的な判断として選択されることになります。

この均衡は、特に割引因子が1に近い(利率が低い)場合に現れ易くなります。利率が低い場合は将来の利得の現在価値は大きくなり、繰り返しゲームの影響が出てくるためです。

有限回繰り返しの場合

尚、有限回($T$ 回)繰り返しゲームの場合は、最後で相手の値下げを怖れて自分も値下げをしてしまうため、1回のみの戦略型ゲームと同じナッシュ均衡が現れてしまいます。

回数 ・・・ $T-1$ $T$
$A$
$B$

 

情報・応用数学
リターン&リスク、ポートフォリオ理論、効率的フロンティア、資本資産価格モデル、先物取引、スワップ取引、ゲーム理論、ナッシュ均衡
数理の散策路
力学、電磁気・相対論、熱・統計力学、量子力学、物性物理、機械学習、情報処理、金融、物理数学

Wikipedia

 

タイトルとURLをコピーしました