ゲームの問題

id:nuc:20050813:p2 さんより

1,2,3と書かれたカードがある。一枚ずつとって自分のカードは見ていい。交互に相手のカードを当てるときの先手の最適戦略とそのときの先手の勝率は。

結果だけ書くと先手の勝率2/3。嘘だと思う人はアイデアポイント賭けて勝負を希望。標準的なミニマックス計算で出せるけど、いくつかの事実を使うと計算を縮訳可能。以下先手をA,後手をB、1手目をT1 などと表記。

  • T1 でAが自分の数字以外を言って外れた場合、T3 でもう一つの数字を言って勝ち
  • T3 でAが勝たなかった場合はT1 でAが自分の数字を言ったことが分かりそれをT4でBが言ってBの勝ち
  • T1 でのAの戦略は
    • M1:自分の数字を言う
    • M2: 自分の数字以外のどちらかを言う。
  • T2 でのB の戦略は
    • M3: 自分の数字を言う
    • M4:相手が言った数字を言う
    • M5:そのどちらでもない数字を言う。
  • AがT1でM1を取る場合 T3 でのAの戦略は
    • M6:T2 でBが言った数字を言う
    • M7:T2 でBが言った数字でない方を言う の2つ。
  • 全ての混合戦略を考えた時、Aの勝率にはBの戦略の確率は一次式でしか入らないので極値は純粋戦略のところにある。したがってT2は純粋戦略のみ考える。

T1 でM1 を確率1-P1, M2 を確率 P1/2 ずつで取る。T3 でM6を確率P2, M7を確率1-P2 で取る。
Mini-Max はP1, P2 を固定し M3,M4,M5 の場合それぞれでA の勝率を計算し3つのうち最小のものを、 P1, P2 を動かして最大にするものとなる。
Aの数字が1、Bの数字が2だとした場合。"T1:P1/2 M2(3)" はT1で確率P1/2 で手M2 を取って 3と言う、などの意味

  • T2:M3
    • T1: P1/2 M2(2) →A Win
    • T1: P1/2 M2(3) T2:M3(2) T3: (2) →A Win
    • T1: 1-P1 M1(1) T2:M3(2)
      • T3: P2 M6(2) →A Win
      • T3: 1-P2 M7(3) T4:(1) →B Win
  • Aの勝率 P1/2+P1/2 +(1-P1)P2 …(式1)
  • T2:M4
    • T1: P1/2 M2(2) →A Win
    • T1: P1/2 M2(3) T2:M4(3) T3: (2) →A Win
    • T1: 1-P1 M1(1) T2:M4(1) →B Win
  • Aの勝率 P1/2+P1/2 …(式2)
  • T2:M5
    • T1: P1/2 M2(2) →A Win
    • T1: P1/2 M2(3) T2:M5(1) → B Win
    • T1: 1-P1 M1(1) T2:M5(3)
      • T3: P2 M6(3) T4: (1)→ B Win
      • T3: 1-P2 M7(2) → A Win
  • Aの勝率 P1/2 + (1-P1)(1-P2) …(式3)

常に (式1)>(式2) なので(式1)は除外。\max_{P1,P2} [\min \{P1 , P1/2+(1-P1)(1-P2)\}]が求める答え。
追記:あ、Bの最適戦略はまだ計算してない。混合戦略になるな。勝負待って(w