いまさら聞けないゲーム理論

ヒトは駆け引きをする。

ゲーム理論(Game Theory)は、複数の主体が関わる意思決定の相互依存関係を分析し、数理モデルで表現する学問で、数学者ジョン・フォン・ノイマンと経済学者オスカー・モルゲンシュテルンの共著書「ゲームの理論と経済行動」により1944年に誕生しました。相互依存関係がある状態では、自分の行動が相手の利害に影響を及ぼし、また逆に相手の行動も自分の利害に影響を及ぼすため、互いに相手の出方を読んで行動するなどの駆け引きが行われます。したがってゲーム理論は、駆け引きを考える学問ともいえます。

ゲーム理論が生まれた背景は、当時の経済学が、一般均衡理論(General Equilibrium Theory)といわれる需要と供給からなる市場原理のメカニズムの分析が中心であったものの、経済活動には市場原理では説明できないものが多くあり、その根底には駆け引きが存在すると考えられたことにあります。「いまさら聞けないナッジ理論」で、行動経済学が従来の経済学では前提としないヒトの非合理性に着目したことに触れましたが、状況としては似ているでしょう。

また、数学者ジョン・ナッシュの存在も、ゲーム理論を語る上で欠かすことができません。ナッシュは1950年の論文で、ナッシュ均衡と呼ばれる概念を提示しました。それは、ゲーム理論の代表例としておなじみの囚人のジレンマをわかりやすく説明してくれます。

ナッシュ均衡 ≠ パレート最適。

囚人のジレンマ(Prisoners’ Dilemma)は、ある犯罪の容疑で捕まった二人の容疑者が、意思疎通の出来ない別々の部屋で尋問を受けている状況で発生する非協力ゲーム(Noncooperative Game)です。非協力ゲームとは、プレイヤーが互いに提携しないゲームを指します。

出典:Paylessimages

二人は拳銃の不法所持で現行犯逮捕されたわけですが、さらに強盗の容疑があります。二人が取りうる選択肢は「自白する」「自白しない」のいずれかですが、自白の状況によって受ける刑罰の重さが、以下のように異なるとします。

  • 一人のみ自白した場合、自白した方は無罪、自白しなかった方は懲役10年となる。
  • 二人とも自白しなかった場合、二人とも懲役2年となる。
  • 二人とも自白した場合、二人とも懲役5年となる。

この場合、二人はどのような選択をするでしょうか。それぞれにとって最良の選択は、自分のみが自白して無罪になることです。また、二人の懲役の合計年数が最小となることを全体最適とするなら、二人とも自白しない場合が4年となり、全体最適となります。これを経済学ではパレート最適(Paretian Optimum)といいます。

なおこの状況では、自分が自白せずに相手が裏切って自白した場合、懲役10年という最悪の結果となるため、そのリスクを回避するためには自白するほかありません。すなわち、二人とも「自白する」という選択しかできず、その選択を変える誘因がないことになります。このように、相手の状態に関わらず自分にとって最良である選択を支配戦略(Dominant Strategy)といい、互いに自分の選択を変える誘因がなく安定した状態をナッシュ均衡(Nash Equilibrium)といいます。

そして囚人のジレンマでは、それぞれが合理的かつ功利的な選択をしているナッシュ均衡と、全体最適であるパレート最適が不一致となります。これがジレンマと呼ばれる所以です。

協力ゲームをデザインする。

ゲーム理論では、与えられたゲームでヒトがどう行動するかを考えますが、逆にヒトを意図的に行動させるためのゲームのルールを考えることもできます。囚人のジレンマでは「自白の状況によって受ける刑罰の重さが異なる」というゲームのルールを検事が設定したことにより、二人は自白せざるを得なくなったわけです。これは司法取引と言われます。

仮に検事がこの司法取引を提示しなければどうなるでしょうか。二人とも黙秘を決め込めば懲役2年で済むわけですから、二人の支配戦略は当然ながら「自白しない」となり、それがナッシュ均衡となります。すなわちナッシュ均衡とパレート最適が一致するわけです。この状態は、囚人の二人にとっては望ましいですが、検事にとっては望ましくありません。そこで検事は司法取引という形でルールの変更を行い、二人が自白せざるを得ない状況を意図的に作り出したわけです。これをゲームチェンジ(Game Change)といいます。

ヒトに望ましい行動をとらせるためにゲームのルールを設定するというゲーム理論の戦略は、さまざまな領域で応用されています。アメリカでは、自白を誘導するための司法取引が頻繁に行われています。日本には、独占禁止法による課徴金減免制度(リニエンシー制度)があります。これは、談合やカルテルを自主申告した企業は課徴金が減免されるというもので、隠したあとで摘発されて高額の課徴金を支払うリスクよりも、事前に申告することで減免される利益を選択させるルールを設定しています。

行動デザインって?」でも触れたとおり、なんらかの問題解決のためにヒトの行動や習慣を変えるよう意図的に仕向ける企てのことを行動デザイン(Behavior Design)1)行動デザインって?といいます。ヒトの非合理性に着目した考え方や手法に行動経済学やナッジ理論がありますが、ヒトの駆け引きに着目した考え方や手法がゲーム理論です。意思決定には、多くの場合に駆け引きが関与します。それをうまく理解し、ゲームのルールを設定することで、さまざまな社会問題を解決することができるかもしれません。

非協力ゲームという言葉を紹介しましたが、それに対して協力ゲーム(Cooperative Game)という言葉もあります。協力ゲームとは、プレイヤーが互いに提携するゲームを指します。囚人のジレンマでは、意思疎通ができず、かつ互いに裏切る可能性があるために非協力ゲームとなり、ナッシュ均衡とパレート最適が不一致となりました。しかしながら、設定されるルールや、互いの信頼関係によっては協力ゲームとなり、ナッシュ均衡とパレート最適が一致する可能性があります。

世界では、限られた土地や資源の奪い合い、環境問題に対する非協力的な態度など、社会全体のパレート最適にならないこと、すなわち社会的ジレンマを多く抱えています。レン・フィッシャー著「日常生活に潜むゲーム理論」ではそれを「共有地の悲劇」という言葉で表現しています。このような社会的ジレンマを回避する協力ゲームをデザインすることこそが、ゲーム理論の本質的な意味なのかもしれません。

脚注   [ + ]