じゃんけんグリコの必勝戦略 – 1992年東大 数学 第6問

1992年東大 数学 第6問 は、いわゆる「じゃんけんグリコ」に関する問題です。問題文は以下の通りです。
A,B の2人がじゃんけんをして、グーで勝てば3歩、チョキで勝てば5歩、パーで勝てば6歩進む遊びをしている。1回のじゃんけんで A の進む歩数から B の進む歩数を引いた値の期待値を E とする。
(1) B がグー、チョキ、パーを出す確率がすべて等しいとする。 A がどのような確率で、グー、チョキ、パーを出すとき、 E の値は最大となるか。
(2) B がグー、チョキ、パーを出す確率の比が a:b:c であるとする。 A がどのような確率でグー、チョキ、パーを出すならば、任意の a,b,c に対し、 E ≧ 0 となるか。
ぱっと見は、普通の期待値の問題のようです。早速取り組んでみます。
小問1の解法
A の出す手の確率を、以下のように定義します。
\begin{aligned} g & = A \text{がグーを出す確率} \\ t & = A \text{がチョキを出す確率} \\ p & = A \text{がパーを出す確率} \\ \end {aligned}
このとき、 g + t + p = 1 です。
また、ある手を A が出す確率を pA(手) 、 B が出す確率を pB(手) と表記することにします。すると、手ごとの確率は以下のとおりです。
\begin{aligned} & p_A( \text{グー}) = g,p_A( \text{チョキ}) = t,p_A( \text{パー}) = p \\ & p_B( \text{グー}) = p_B( \text{チョキ}) = p_B( \text{パー}) = \frac{1}3\\ \end{aligned}
A がどの手を出すのかと、 B がどの手を出すのかは独立事象です。よって、 A が 手A を出し、かつ B が 手B を出す確率は pA(手A)pB(手B) です。そこでそれぞれの場合の A の利得を整理すると、以下の表のようになります。
Aの手 | Bの手 | 確率 | Aの利得 |
---|---|---|---|
チョキ | グー | \displaystyle\frac{t}3 | -3 |
パー | グー | \displaystyle\frac{p}3 | 6 |
グー | チョキ | \displaystyle\frac{g}3 | 3 |
パー | チョキ | \displaystyle\frac{p}3 | -5 |
グー | パー | \displaystyle\frac{g}3 | -6 |
チョキ | パー | \displaystyle\frac{t}3 | 5 |
あいこのときは A,B 双方が動かないので、考慮する必要はありません。
したがって、E は以下のように表すことが出来ます。
\begin{aligned} E = & (-3) \cdot \frac{t}3 + 6 \cdot \frac{p}3 \\ & +3 \cdot \frac{g}3 + (-5) \cdot \frac{p}3 \\ & +(-6) \cdot \frac{g}3 + 5 \cdot \frac{t}3 \\ = &\frac{1}{3}(-3g + 2t + p) \end{aligned}
g + t + p = 1 の関係式を使って p を消去します。
\begin{aligned} E &= \frac{1}{3} \{-3g + 2t +(1- g- t) \} \\ & = \frac{1}{3} (-4g + t +1 ) \\ \end{aligned}
g, t の取りえる値の範囲は
\begin{aligned} 0 & \leqq g \leqq 1 \\ 0 & \leqq t \leqq 1 \\ 0 &\leqq g+t \leqq 1 \\ \end{aligned}
なので、 g を固定したとき、 E は t = 1 -g のとき最大値
E_g = \frac{1}{3} (-5g + 2 )
を取ります。
0 \leqq g \leqq 1 なので、 E_g の最大値、すなわち E の最大値は g = 0 のとき
\frac{2}{3}
です。
g =0 のとき、 t = 1-0 = 1 ,p =0 です。 A はチョキ一択で押し通すとき、期待値が最も大きくなります。
小問2の解法
B がグー、チョキ、パーを出す確率の比が a:b:c なので、
\begin{aligned} p_A( \text{グー}) & = g,p_A( \text{チョキ}) = t,p_A( \text{パー}) = p \\ p_B( \text{グー}) &= \frac{a}{a+b+c}\\ p_B( \text{チョキ}) &= \frac{b}{a+b+c}\\ p_B( \text{パー})& = \frac{c}{a+b+c}\\ \end{aligned}
であり、 A の利得は
Aの手 | Bの手 | 確率 | Aの利得 |
---|---|---|---|
チョキ | グー | \displaystyle\frac{at}{a+b+c} | -3 |
パー | グー | \displaystyle\frac{ap} {a+b+c} | 6 |
グー | チョキ | \displaystyle\frac{bg}{a+b+c} | 3 |
パー | チョキ | \displaystyle\frac{bp}{a+b+c} | -5 |
グー | パー | \displaystyle\frac{cg}{a+b+c} | -6 |
チョキ | パー | \displaystyle\frac{ct}{a+b+c} | 5 |
なので、 E は
\begin{aligned} E = & \frac{-3at+6ap+3bg-5bp -6cg+5ct}{a+b+c} \\ = & \frac{1}{a+b+c} \\ & \times \left \{ \begin{aligned} & a(-3t+6p) \\ &+b(3g-5p) \\ &+c(-6g+5t)\end{aligned} \right \} \end{aligned}
です。 a,b,c \geqq 0 なので、 E ≧ 0 である十分条件は、連立不等式
\left \{ \begin{aligned} -3t + 6p & \geqq 0 \\ 3g-5p & \geqq 0 \\ -6g +5t & \geqq 0 \end{aligned} \right . \cdots (1)
を満たす g,t,p が存在することです。
もしかしたら条件が厳しすぎて、(1)の解はないかもしれませんが、その時はその時です。まずは思いつく条件であたりをつけてみましょう。
ところが、(1) は解
\frac{g}{5} = \frac{t}{6} = \frac{p}{3}
を持ちます。 g + t + p = 1 であることから、 g,t,p の値は一意に決まって、その値は
g = \frac{5}{14},t = \frac{3}{7},p=\frac{3}{14} \cdots (2)
で、このとき E = 0 です。
問題文が求めているのは E ≧ 0 となる十分条件なので、これで終わりにしてよいはずですが、念のため、任意の a,b,c に対し、 E > 0 となる g,t,p は存在しないことを示します。
すべての g,t,p が連立不等式(1)を満たさない時、(1)の3つの不等式のうち、少なくとも1つは不等号の向きが逆になります。仮に
-3t + 6p < 0
であるとします。すると、 (a,b,c) = (1,0,0) のとき、 E < 0 です。
この対偶を取ると、任意の a,b,c に対し、 E ≧ 0 である必要条件は、連立不等式(1)を満たす g,t,p が存在することです。
よって、任意の a,b,c に対し E ≧ 0 である必要十分条件は、連立不等式(1)を満たす g,t,p が存在することです。
次に、(1)の唯一の解が(2)であることを示します。
(1) を変形すると
\left \{ \begin{aligned} \frac{p}3 & \geqq \frac{t }6\\ \frac{g} 5 & \geqq \frac{p}3 \\ \frac{t}6 & \geqq \frac{g}5 \end{aligned} \right .
です。すなわち、
\frac{t}{6} \geqq \frac{g}{5} \geqq \frac{p}{3} \geqq \frac{t}{6} \cdots(3)
ですが、これは(1)と
\frac{g}{5} = \frac{t}{6} = \frac{p}{3}
が同値であることを意味しています。したがって、(1)の唯一の解が(2)です。
ゆえに任意の a,b,c に対し E ≧ 0 となる必要十分条件は(2)が成り立つことであり、このとき E = 0 なので、E > 0 となる g,t,p は存在しません。
つまり、じゃんけんグリコの必勝戦略は存在せず、 A,B がそれぞれ(2)の戦略を取った時に、互いに中立的である E = 0 に均衡します。
小問2の別解
よく考えてみると、ゲーム内容に関する A,B 間の対称性から、 E = 0 なのは明らかです。
すなわち、もし A が適当な出し手確率を選んだときに B がどのような比率で手を出しても E > 0 が成り立つとすると、 B もその確率に従って手を出せばBの期待値はやはり正の値になるはずであり、本問のゲームがゼロサムゲームであることを考えるとこれは矛盾です。
ということに気がつけば、もう少し楽に小問2を解くことができます。以下、この気付きを数学っぽく表現します。
A の期待値を EA 、 B の期待値を EB と表記します。すると明らかに、 a,b,c,g,p,t がどんな値でも
E_A + E_B = 0
が成り立ちます。
次に、B が出す手の比率 a,b,c が何であっても E = 0 となるのは、 (2) が成り立つときだけであることを確認しておきます。
連立方程式
\left \{ \begin{aligned} -3t + 6p & = 0 \\ 3g-5p & = 0 \\ -6g +5t & = 0 \end{aligned} \right . \cdots(3)
の唯一の解が (2) なので、もし (2) 以外に a,b,c が何であっても E = 0 となる g,t,p があったとすると、 (3) の3つの式のうち、少なくとも1つは成り立ちません。
仮に -3t+6p ≠ 0 であるとします。すると (a,b,c) = (1,0,0) のとき E ≠ 0 であり、これは矛盾です。よって、 a,b,c が何であっても E = 0 となるのは、 (2) が成り立つときだけであることが証明できました。
したがって、 a,b,c が何であっても EA ≧ 0 となる g,p,t が (2) 以外に存在したとすると、 g,p,t がその値のとき EA > 0 です。それらを g0,t0,p0 と表記します。
EA + EB = 0 であったので、 (g,t,p) = (g0,t0,p0) ならばすべての a,b,c に対し EB < 0 です。ところが、 (a,b,c) = (g_0,t_0,p_0) ならすべての (g,t,p) に対し EB > 0 が成り立つはずですから (g,t,p) = (g0,t0,p0) のときも EB > 0 のはずで、これは矛盾です。
ゆえにB が出す手の比率 a,b,c が何であっても E > 0 となる g,t,p は存在せず、E = 0 となる g,t,p は (2) の1種類です。すなわち、任意の a,b,c に対し E ≧ 0 となる必要十分条件は(2)が成り立つことです。
解法のポイント

本問はキャッチーな文面とは裏腹に、オーソドックスな期待値計算の問題です。あわてずに定義に従って式を立てていけば、無理なく答えにたどり着けます。
連立不等式(1)の解が gtp 空間内の直線になるのは意外でしたが、これはじゃんけんが3すくみになっていることに依存しています。3すくみのおかげで、不等式がぐるりと循環する(3)が発生します。
その点では、じゃんけんグリコに必勝戦略がないというのはある意味当然と言えますが、よく考えてみると、 ゲーム内容に関する A,B 間の対称性から、 E = 0 なのは明らかです。これに気がつければ、小問2はもう少し楽に解くことができます。
なお、実際のゲームは彼我のゴールまでの距離や、直前の勝負手などに応じて戦略を変えるはずなので、3目並べ的な単純さからは一線を画していると言えるでしょう。