マックスミニ&ミニマックスとは

/金融・ゲーム理論

本記事では、ゲーム理論におけるマックスミニ戦略とミニマックス戦略について解説します。

マックスミニ戦略

マックスミニ戦略とは、あるプレイヤが取りうる各選択肢における最小の利得(ミニ)の中で、最大の利得(マックス)を選択する戦略です。これにより、そのプレイヤの最悪の場合の利得を、より大きくすることができ、この利得をマックスミニ値と呼びます。

純粋戦略の場合

マックスミニ戦略を、定和ゲームでの純粋戦略の場合で説明します。定和ゲームとは、プレイヤの利得の合計が一定値になるゲームで、純粋戦略とは、各プレイヤが1つの戦略のみ選択できる場合を言います。

プレイヤが2人(プレイヤAとプレイヤB)、戦略が2つ(戦略X,戦略Y)の場合で考えます。以下の利得表では、各プレイヤの戦略と利得の関係を表しています。

$A\backslash B$ $B:X$ $B:Y$
$A:X$ $A=6,B=4$ $A=5,B=5$
$A:Y$ $A=4,B=6$ $A=7,B=3$

プレイヤAが戦略Xをとった場合の最低の利得は5(Bは戦略Y)になり、戦略Yをとった場合の最低の利得は4(Bは戦略X)になります。両者を比べるとより大きい利得は5になります。これより、プレイヤAのマックスミニ戦略は戦略Xで、マックスミニ値は5となります。

一方、プレイヤBも同様に考えると、プレイヤBが戦略Xをとった場合の最低の利得は4(Aは戦略X)になり、戦略Yをとった場合の最低の利得は3(Bは戦略Y)になります。これより、プレイヤBのマックスミニ戦略は戦略Xで、マックスミニ値は4となります。

従って、両プレイヤのマックスミニ戦略の組は(戦略X、戦略X)となります。しかし、この場合のマックスミニ戦略の組は、ナッシュ均衡となっていません。なぜなら、Aが戦略Xをとった場合のBの利得は、戦略Xより戦略Yの方が大きいからです。

ナッシュ均衡とは
他のプレイヤが戦略を変えない限り自分の戦略を変える動機を持たない状態、純粋戦略、混合戦略、支配戦略、最適反応戦略
混合戦略の場合

混合戦略とは、各プレイヤが複数の戦略の組合せを選択できる場合を言います。混合戦略まで含めると、マックスミニ戦略の組はナッシュ均衡となることが証明されています。

定和ゲームでは、相手の利得を下げることが自分の利得を上げることになることが、マックスミニ戦略によりナッシュ均衡が導かれる理由です。

ミニマックス戦略

ミニマックス戦略とは、あるプレイヤが取りうる各選択肢における、相手のプレイヤの利得の最大(マックス)の中で、最小の利得(ミニ)を選択する戦略です。このときの自分の利得をミニマックス値と呼びます。これは、相手の利得の最小が、自分の利得の最大となる定和ゲームで成り立つ戦略です。

双方の利得の和が0になるゼロゲームの場合は、あるプレイヤが取りうる各選択肢における最大の損失(マックス)の中で、最小の損失(ミニ)を選択する戦略と表現されます。つまり、そのプレイヤの最悪の場合の損失を、より小さくすることができます。

純粋戦略の場合

ミニマックス戦略を、定和ゲームでの純粋戦略の場合で説明します。

$A\backslash B$ $B:X$ $B:Y$
$A:X$ $A=6,B=4$ $A=5,B=5$
$A:Y$ $A=4,B=6$ $A=7,B=3$

この利得表では、プレイヤAが戦略Xをとった場合のBの最大の利得は5になり、戦略Yをとった場合のBの最大の利得は6になります。両者を比べるとより小さいBの利得は5になります。これより、プレイヤAのミニマックス戦略は戦略Xで、ミニマックス値は5であると言うことができます。

 

数学
解析学、代数学、幾何学、統計学、論理・基礎論、情報・暗号、機械学習、金融・ゲーム理論、高校数学
散策路TOP
数学、応用数学、古典物理、量子力学、物性論、電子工学、IT、力学、電磁気学、熱・統計力学、連続体力学、解析学、代数学、幾何学、統計学、論理・基礎論、プラズマ物理、量子コンピュータ、情報・暗号、機械学習、金融・ゲーム理論

 

タイトルとURLをコピーしました