ベイジアンゲームとは

/金融・ゲーム理論

ベイジアンゲーム

ベイジアンゲーム(Bayesian Game)は、相手について完全には分からない状況(情報不完備ゲーム)を扱うゲーム理論です。

通常のゲーム理論では、相手の戦略、利得(利益や損失)、ゲームのルールは全員が知っていると仮定します。しかし現実には、相手の情報は分からないということがよくあります。そのため、不完全情報を確率的に扱うのがベイジアンゲームです。

タイプ

ベイジアンゲームでは各プレイヤーにタイプ(type)という概念を導入します。各プレイヤーは自分のタイプを知っていますが、相手のタイプは知りません。
例えば、企業同士の価格競争なら、高コスト企業と低コスト企業というタイプがあるかもしれません。後で述べる中古車売買の例では、良い車(Good)と悪い車(Bad)のタイプを設定しています。

自然と信念

ハーサニ(John Harsanyi)は、不完全情報ゲームに自然(Nature)と信念(Belief)という概念を導入しました。「自然」とは、タイプを実際に決定する客観的な仕組み(現実)で、「信念」とは、プレイヤーが相手のタイプについて持っている主観的な予想(認識)です。
「自然」が決定するタイプと「信念」が予想するタイプは一致はしていませんが、整合はしています。ここで言う「整合」とは、「自然」が決定するタイプの確率分布が「信念」が予想するタイプの確率分布に矛盾がないということです。
ベイジアンゲームでは、実際の世界(自然)がどうなっているかは分からない前提で、プレイヤーは「信念」に基づいて合理的に行動します。

期待利得

普通のゲームでは以下の利得関数を比較します。ここで、$s$ は各プレイヤーの戦略の組です。
$$f_n(s)$$
一方、ベイジアンゲームでは以下の期待利得を比較します。ここで、$c$ は各プレイヤーのタイプの組です。このように、分からないことを確率(信念)として表し、期待利得を最大化するゲームです。
$$E\big[f_n(s,c)\big]$$
例えば、良い車(Good)と悪い車(Bad)の二択があり、それぞれの確率を $P$ 、利得を $f$ とすると、期待利得は以下で得られます。
$$E[f]=P(\mathrm{Good})f(\mathrm{Good})+P(\mathrm{Bad})f(\mathrm{Bad})$$

ベイジアン均衡

ベイジアン均衡(ベイジアンナッシュ均衡)とは、相手のタイプ(性格・能力・評価額など)が分からない状況で、各プレイヤーが自分の信念(Belief)に基づく期待利得を最大にする戦略を選び、誰も一方的に戦略を変えたくない状態です。
これに対し、ナッシュ均衡は、相手の利得や情報が分かっている状況で、誰も一方的に戦略を変えたくない状態です。ナッシュ均衡は相手が分かっている世界の均衡、ベイジアンナッシュ均衡は相手がよく分からない世界の均衡と考えることができます。
項目 ベイジアン均衡 ナッシュ均衡
情報 不完全情報 完全情報
判断基準 期待利得 利得
戦略 タイプごとの行動規則を選ぶ 行動を選ぶ

具体例

中古車売買

中古車売買のベイジアンゲームを考えます。プレイヤーは売り手と買い手、売り手のタイプは良い車(Good)と悪い車(Bad)、買い手の行動は「買う」と「買わない」のようにモデルを単純化します。

車の売価を100万円とし、良い車の場合の買い手にとっての価値を 120万円、売り手の評価額を 80万円とすると、買い手の利得は 20万円(=120-100)、売り手の利得は 20万円(=100-80)となります。

一方、悪い車の場合の買い手にとっての価値を 60万円、売り手の評価額を 40万円とすると、買い手の利得は -40万円(=60-100)、売り手の利得は 60万円(=100-40)となります。これらの利得表(右側が買い手の利得)は以下になります。

買い手の行動 売り手のタイプ
良い車 悪い車
買う (20 , 20) (-40 , 60)
買わない (0 , 0) (0 , 0)

このとき、良い車と悪い車の確率分布(信念)を 70%と 30%とすると、期待利得は以下になります。この例では、買い手は「買う」を選びます。

買い手の行動 売り手のタイプ
良い車(70%) 悪い車(30%)
買う 20×0.7 + (−40)×0.3 = 2
買わない 0×0.7 + 0×0.3 = 0

オークション理論

オークション理論では、入札者ごとに、その品物をどれだけ欲しいか(評価額)が異なり、それが他人には分からない、という点がベイジアンゲームになります。最も簡単な例として、1回だけ入札する封印入札方式(First-Price Sealed-Bid Auction)を考えます。

自分の評価額(タイプ)について、高評価額を100、低評価額を50とし、それぞれの確率分布を50%とします。そして入札額は、強気入札の場合は80、弱気入札の場合は40とし、競争相手の入札額を常に60と仮定します。このときの利得表(利得=評価額-入札額)は以下になります。

自分の行動 自分の評価(タイプ)
高評価 低評価
強気入札(勝ち) 100 - 80 = 20 50 - 80 = 10
弱気入札(負け) 0 0

この事例の特徴は、入札者は自分の評価額(タイプ)を知っているということです。したがって、戦略は高評価額なら強気、低評価額なら弱気のような タイプ → 行動 の対応(ベイジアン均衡)になります。

このように、オークションのベイジアンゲームでは、相手がどれくらい品物を評価しているか分からないという不完全情報の下で、自分の評価額(タイプ)に応じてどの金額を入札するかを決める事例です。

 

数学
解析学、代数学、幾何学、統計学、論理学、基礎論、特殊関数、物理数学、情報理論、暗号理論、機械学習、金融理論、ゲーム理論、数値計算
散策路TOP
物理学、数学、力学、電磁気学、連続体力学、相対論、熱・統計力学、量子力学、解析学、代数学、幾何学、統計学、論理学、物性論、プラズマ物理、電子工学、情報・暗号、機械学習、金融・ゲーム理論、IT、FP、宗教・思想

 

タイトルとURLをコピーしました