5%のガチャガチャ。
1 ガチャとガチャガチャ
おもしろいツイートが流れてきた。オンラインゲームのガチャと、店舗等にあるカプセルトイのガチャガチャでは、確率がそもそも計算方法から違うという解説である。
確率・統計を高校数学まできちんと学習していれば、当たり前の話だと思えるのだけれど、大人でもみんな案外忘れてしまっているかもしれない。
外れくじを元に戻すくじ引きと、戻さなくてもよいくじ引きの違いである。
・5%のガチャ。:https://tanakah17191928.blogspot.com/2020/06/blog-post_20.html
前回はガチャの話だったので、今回はガチャガチャの話。
前回よりも簡単で、直感的に理解しやすいかもしれない。
2 何回目に当たるか
話を簡単にするために、5%のガチャガチャなので、当たりが1個で外れが19個の状態から考えてみる。20回やって当たる確率は100%である。
外れを元に戻すケースでは約64%だったので、ガチャの確率計算がガチャガチャのそれと同じだと勘違いしてしまっていると、ここで結構衝撃を受けるのかもしれない。
これで話が終わってしまうとおもしろくないので、もう少し掘り下げてみたい。
ガチャガチャが当たるまで試行するとどうなるかと考えて計算してみる。
1回目に当たる確率は$\dfrac{1}{20}$、
2回目に当たる確率は$\dfrac{19}{20} \times \dfrac{1}{19} = \dfrac{1}{20}$、3回目に当たる確率は$\dfrac{19}{20} \times \dfrac{18}{19} \times \dfrac{1}{18} = \dfrac{1}{20}$、
4回目に当たる確率は$\dfrac{19}{20} \times \dfrac{18}{19} \times \dfrac{17}{18} \times \dfrac{1}{17} = \dfrac{1}{20}$、
$\vdots$
19回目に当たる確率も同様に計算して$\dfrac{1}{20}$、
20回目に当たる確率も$\dfrac{1}{20}$。
$400(1 + 2 + \cdots + 19 + 20) \times \dfrac{1}{20}$
$= 400 \times 210 \times \dfrac{1}{20}$
$= 4200$
ガチャだと8000円だったけれど、ガチャガチャだと4200円。
なるほど、確かに子どもたちがこの違いに直感を狂わされるのも無理はないだろう。
ガチャガチャだとやり続ければ10回前後で当たりそうである。
3 期待値
例えば、ガチャガチャ1回で400円として、$n$回目に当たった場合は$400 \times n$円かかる。
そして、これに$n$回目に当たる確率($\dfrac{1}{20}$)をかける。
$400(1 + 2 + \cdots + 19 + 20) \times \dfrac{1}{20}$
$= 400 \times 210 \times \dfrac{1}{20}$
$= 4200$
ガチャだと8000円だったけれど、ガチャガチャだと4200円。
なるほど、確かに子どもたちがこの違いに直感を狂わされるのも無理はないだろう。
ガチャガチャだとやり続ければ10回前後で当たりそうである。
Excelで確率や期待値を計算して集計してみると納得できると思う。
当たりが1個の場合だと計算が簡単なのだけれど、当たりが2個以上だと計算が複雑になる。
同じ20%でも当たりの個数が、20個中1個の場合、40個中2個の場合、60個中3個の場合、80個中4個の場合、100個中5個の場合、1000個中50個の場合・・・
例えば、100個中5個の場合を考えてみる。
$K$個中当たりが$A$個のガチャガチャを考える。
1回目に当たる確率$a_1 = \dfrac{A}{K}$、
2回目以降は$a_n = a_{n-1} \times \dfrac{K - A - n + 2}{K - n + 1}$
$A$が1の場合、$a_n = a_{n-1} \times \dfrac{K - n + 1}{K - n + 1} = a_{n-1}$となり、計算が楽になる訳である。
ここで一般項$a_n$を求めたいところではあるけれど、ここまで分かればExcelを使って力技で計算させられるので試してみたい。
40個中2個の場合、20回目までに当たりが出る確率は約76%、期待値(回数)は約14回。
80個中4個の場合、20回目までに当たりが出る確率は約69%、期待値(回数)は約16回。
100個中5個の場合、20回目までに当たりが出る確率は約68%、期待値(回数)は約17回。
1000個中50個の場合、20回目までに当たりが出る確率は約65%、期待値(回数)は約20回。
4 【追記1】めちゃくちゃ大きいガチャガチャマシン
店頭のガチャガチャを実際にやる場合はここまで思考すれば十分なのだけれど、ここで思考を止めると数学的に不正確なことに気付いたので追記したい。当たりが1個の場合だと計算が簡単なのだけれど、当たりが2個以上だと計算が複雑になる。
同じ20%でも当たりの個数が、20個中1個の場合、40個中2個の場合、60個中3個の場合、80個中4個の場合、100個中5個の場合、1000個中50個の場合・・・
例えば、100個中5個の場合を考えてみる。
1回目に当たる確率は$\dfrac{1}{20}$、
2回目に当たる確率は$\dfrac{95}{100} \times \dfrac{5}{99}$、
3回目に当たる確率は$\dfrac{95}{100} \times \dfrac{94}{99} \times \dfrac{5}{98}$、
4回目に当たる確率は$\dfrac{95}{100} \times \dfrac{94}{99} \times \dfrac{93}{98} \times \dfrac{5}{97}$、
$\vdots$
5 一般化
Excelを使って力技で計算させるにしても一般化させないと入力できない。$K$個中当たりが$A$個のガチャガチャを考える。
1回目に当たる確率$a_1 = \dfrac{A}{K}$、
2回目以降は$a_n = a_{n-1} \times \dfrac{K - A - n + 2}{K - n + 1}$
$A$が1の場合、$a_n = a_{n-1} \times \dfrac{K - n + 1}{K - n + 1} = a_{n-1}$となり、計算が楽になる訳である。
ここで一般項$a_n$を求めたいところではあるけれど、ここまで分かればExcelを使って力技で計算させられるので試してみたい。
6 見せてあげよう、Excelの雷を!
20個中1個の場合、20回目までに当たりが出る確率は100%、期待値(回数)は約11回だった。40個中2個の場合、20回目までに当たりが出る確率は約76%、期待値(回数)は約14回。
80個中4個の場合、20回目までに当たりが出る確率は約69%、期待値(回数)は約16回。
100個中5個の場合、20回目までに当たりが出る確率は約68%、期待値(回数)は約17回。
1000個中50個の場合、20回目までに当たりが出る確率は約65%、期待値(回数)は約20回。
1000までやれば十分だろう。
くじの総数が十分に大きければ、5%のくじが20回目に当たる確率は約64%、期待値(回数)は約20回になりそうである。
これは前回、5%のガチャで計算したときの値と等しい。
換言すると、総数が十分に大きければ、5%のくじは外れくじを元に戻そうと戻すまいと、20回目に当たる確率は約64%、期待値(回数)は約20回になるということで、ちょっと直感に反する計算結果となってしまった。
でもまぁ、考えてみれば当たり前なのか・・・総数が1000個以上あれば1個や2個外れを抜くことができたって、計算上の確率に与える影響は小さいというロジックで理解していいのかな?
$a_n = a_{n-1} \times \dfrac{K - A - n + 2}{K - n + 1}$
$= a_{n-1} \times \dfrac{H - n + 2}{K - n + 1}$
$\dfrac{H - n + 2}{K - n + 1} = f(n)$とおくと、
$a_n = f(n) a_{n-1}$
$= f(n)f(n-1) \cdots f(3)f(2)a_1$
$f(2) = \dfrac{H}{K - 1}$, $f(3) = \dfrac{H - 1}{K - 2}$, $f(4) = \dfrac{H - 2}{K - 3}$, $\cdots$
$\cdots$, $f(n-1) = \dfrac{H - n + 3}{K - n + 2}$, $f(n) = \dfrac{H - n + 2}{K - n + 1}$
よって
$a_n = \dfrac{H!}{(H - n + 1)!} \cdot \dfrac{(K - n)!}{(K - 1)!} \cdot \dfrac{A}{K}$
$= \dfrac{(K - A)!}{(K - A - n + 1)!} \cdot \dfrac{(K - n)!}{K!} \cdot A$
$= \dfrac{(K - n)!}{\{ K - n - (A - 1) \}!} \cdot \dfrac{(K - A)!}{K!} \cdot A$
$= \dfrac{(K - n)!}{\{ K - n - (A - 1) \}!} \cdot \dfrac{A}{{}_{K}\text{P}_A}$
$= {}_{K - n}\text{P}_{A - 1} \cdot \dfrac{A}{{}_{K}\text{P}_A}$
ここから$S_n = \sum\limits_{k = 1}^{n} a_k$をどうやって計算しよう?
くじの総数が十分に大きければ、5%のくじが20回目に当たる確率は約64%、期待値(回数)は約20回になりそうである。
これは前回、5%のガチャで計算したときの値と等しい。
換言すると、総数が十分に大きければ、5%のくじは外れくじを元に戻そうと戻すまいと、20回目に当たる確率は約64%、期待値(回数)は約20回になるということで、ちょっと直感に反する計算結果となってしまった。
でもまぁ、考えてみれば当たり前なのか・・・総数が1000個以上あれば1個や2個外れを抜くことができたって、計算上の確率に与える影響は小さいというロジックで理解していいのかな?
7 【追記2】されど未完(´・ω・`)
$K$個中当たりが$A$個なので、外れは$H = K - A$個とおくと、$a_n = a_{n-1} \times \dfrac{K - A - n + 2}{K - n + 1}$
$= a_{n-1} \times \dfrac{H - n + 2}{K - n + 1}$
$\dfrac{H - n + 2}{K - n + 1} = f(n)$とおくと、
$a_n = f(n) a_{n-1}$
$= f(n)f(n-1) \cdots f(3)f(2)a_1$
$f(2) = \dfrac{H}{K - 1}$, $f(3) = \dfrac{H - 1}{K - 2}$, $f(4) = \dfrac{H - 2}{K - 3}$, $\cdots$
$\cdots$, $f(n-1) = \dfrac{H - n + 3}{K - n + 2}$, $f(n) = \dfrac{H - n + 2}{K - n + 1}$
よって
$a_n = \dfrac{H!}{(H - n + 1)!} \cdot \dfrac{(K - n)!}{(K - 1)!} \cdot \dfrac{A}{K}$
$= \dfrac{(K - A)!}{(K - A - n + 1)!} \cdot \dfrac{(K - n)!}{K!} \cdot A$
$= \dfrac{(K - n)!}{\{ K - n - (A - 1) \}!} \cdot \dfrac{(K - A)!}{K!} \cdot A$
$= \dfrac{(K - n)!}{\{ K - n - (A - 1) \}!} \cdot \dfrac{A}{{}_{K}\text{P}_A}$
$= {}_{K - n}\text{P}_{A - 1} \cdot \dfrac{A}{{}_{K}\text{P}_A}$
ここから$S_n = \sum\limits_{k = 1}^{n} a_k$をどうやって計算しよう?
今日はここまでにしよう・・・何だかよく分からなくなってきた。
Wolfram Alpha先生に聞いてみたら、素敵でよく分からない式(へんてこりんな係数の高次式)を教えてくれました・・・それを見ても今の僕にはその解き方がひらめかない(´・ω・`)
とりあえず、ここまでとしたい。
引いたくじを元に戻さないという縛りのせいで、くじの総数と当たりの個数(当たる確率)を適当に決めて計算せざるを得ないので、これ以上この考察を深掘りできるのか疑問・・・正直よく分かんない。
例えば、5%のガチャガチャが20回目までに当たる確率なら、Excel等で第20項まで計算して集計すればよいのだから。
ただ、期待値の計算をするときには、項が1000以上あるとセルを引っ張ってコピーするのさえ少々手間なので、式を使わないとめんどくさいかも。
あのへんてこりんな係数の高次式を自分で導出できたら完璧だったのになぁ・・・残念!!(最後の「残念!!」は波田陽区風に読もう!)
多項式回帰に過ぎないのであれば、式の意味を考えてもあまり意味がないことになる。
そう考えるといろいろ納得できるのだけれど・・・?
・ガチャとガチャガチャと大地震(まとめ記事)に戻る。
8 【追記3】結論(暫定)
$K = 100, A = 5$とか$K = 80, A = 4$みたいに適当に決めて、$\sum\limits_{k = 1}^{n} \dfrac{(100 - n)!}{(96 - n)!}$とか、$\sum\limits_{k = 1}^{n} \dfrac{(80 - n)!}{(77 - n)!}$とかは計算できるみたい。Wolfram Alpha先生に聞いてみたら、素敵でよく分からない式(へんてこりんな係数の高次式)を教えてくれました・・・それを見ても今の僕にはその解き方がひらめかない(´・ω・`)
とりあえず、ここまでとしたい。
引いたくじを元に戻さないという縛りのせいで、くじの総数と当たりの個数(当たる確率)を適当に決めて計算せざるを得ないので、これ以上この考察を深掘りできるのか疑問・・・正直よく分かんない。
例えば、5%のガチャガチャが20回目までに当たる確率なら、Excel等で第20項まで計算して集計すればよいのだから。
ただ、期待値の計算をするときには、項が1000以上あるとセルを引っ張ってコピーするのさえ少々手間なので、式を使わないとめんどくさいかも。
あのへんてこりんな係数の高次式を自分で導出できたら完璧だったのになぁ・・・残念!!(最後の「残念!!」は波田陽区風に読もう!)
9 【追記4】多分追記はこれで最後?
あのへんてこりんな係数の高次式は、もしかして単なる回帰曲線ではあるまいか?多項式回帰に過ぎないのであれば、式の意味を考えてもあまり意味がないことになる。
そう考えるといろいろ納得できるのだけれど・・・?
・ガチャとガチャガチャと大地震(まとめ記事)に戻る。