第五回:人工社会と統計

※既習が望ましい内容
散布図
相関係数


(A,B) B:タカ戦略 B:ハト戦略
A:タカ戦略 (0,0) (2,0)
A:ハト戦略 (0,2) (1,1)

上表は同時手番ゲーム(ゲーム理論)の利得表で、タカハトゲームである。攻撃的なタカ戦略と穏健なハト戦略でモノを分け合うゲーム的状況。互いに穏健なら公平に分けるが、攻撃的だと奪われ、双方攻撃的なら何も手に入らないとするものである。



図1:100人のタカハトゲーム

実験はエージェント・シミュレーションである。プレイヤー数は100人。総当たり戦100試合を1ラウンドとする。1ラウンドの得点は最大198点。以後1ラウンドを1期と呼ぶ。プレイヤーiがプレイヤーjに対して個別に戦略を決定する。プレイヤーiのプレイヤーjへの戦略(個別戦略)は、毎期終了時に確率pで見直される。毎期終了時にプレイヤーiは全てのプレイヤーが1回ずつ選ばれる。プレイヤーjは、プレイヤーiに対してランダムに1名が選ばれる。プレイヤーiのプレイヤーjに対する戦略は確率p(後述)で変更される。戦略がタカ戦略であればハト戦略に、ハト戦略であればタカ戦略に変更される。確率pは(198-得点)÷198である。第1期は全ての個別戦略がランダムに割り当てられる。


図2:タカ戦略が多いと自分の得点が高い

1000ラウンドシミュレーションした結果の散布図で、縦軸が累計100000戦略(100試合×1000ラウンド)の中のタカ戦略の割合で、横軸が累計100000試合(100試合×1000ラウンド)の総得点(198000点満点中の獲得点数の割合)である。タカ戦略の割合が高いプレイヤーほど得点が高かったことがわかる。


図3:タカ戦略が多いと社会の得点が低い

上図は、同じシミュレーションで、100人のプレイヤーの得点和を各期で求めた。縦軸が各ラウンド100試合の中のタカ戦略の割合で、横軸が各期の合計得点(100人×198点満点=19800点中の得点(割合))である。タカ戦略の割合が高いラウンドほど100人のプレイヤーの得点和が低かったことがわかる。


図4:社会の動態

上図左は、図3のデータセットを(図3では各期であったが)100期ごとに集計した。縦軸が10000試合(100試合×100ラウンド)のタカ戦略の割合で、横軸が100人のプレイヤーの得点和である(100試合×100ラウンド×100人の得点和(割合))。100ラウンド目、200ラウンド目、…、700ラウンド目で集計した散布図。上図右は矢印で時間の流れを可視化したもの。概ねタカ戦略50%の±1%で推移していて、振り子のように揺らいでいる。


(A,B) B:タカ戦略 B:ハト戦略
A:タカ戦略 (0,0) (2,0)
A:ハト戦略 (0,2) (1,1)

このゲームのナッシュ均衡は(タカ戦略、タカ戦略)のセットであり、支配戦略均衡でもある。シミュレーションでは、あるペアが(タカ戦略、タカ戦略)の支配戦略均衡にあったとしても、一定の確率でプレイヤー自ら変更してしまう。つまりこのシミュレーションでプレイヤーは、利得最大化という個人合理性(個人合理的行動をとろうとする傾向)を持っていない。そのためゲーム理論が示す均衡へ社会が向かわなかったと思われる。残存するハト戦略に対して2点獲得するタカ戦略の割合が高いほど高い得点を得られた、そのような結果である(図2参照)。しかしハト戦略が減ると、タカ戦略ないしはハト戦略で得点(タカ戦略は2点、ハト戦略は1点)を得られる機会も減る。そのため社会全体の得点(プレイヤーの得点和)は減っていく。そのような結果を得たのである(図3参照)。


※既習が望ましい内容
散布図
相関係数

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA