昨日、コンピュータの乱数を使って、二項分布を求めたのだけれど、試行回数をトンデモなく大きくとらないと数学的確率の値に近づかないことに気がついて、コンピュータを使って、コインを10回投げて何回表が出るかシミュレーションしてみた。


 


コインを10回投げて表が出る回数をrとすると、その確率は


 


になる。


これは数学的な確率だにゃ。


 


コンピュータを使って、コインを10回投げて表が何回出るかという試行をn=10100100010000100000回行うと、これは次のような分布になる。


 



 


このグラフを見ると、コインを10回投げることを100回、1000回くらい行っても、(1)式で与えられる二項分布B(10,1/2)は得られないことがわかる。


1000回位じゃ、誤差が大きすぎて、信用できない。


コインを10回投げることを1万回、できたら10万回回くらいやらないと、使い物にならない。


そして、この結果に正直強い衝撃を受けている。


だって、1000回も繰り返せば、かなり良く近似できると思っていたんだもん。


それと同時に、「数学的確率っていったい何なんだ」という、確率に対する不信感を募らせた。


 


では、ここで問題を一つ。


 


問題1 1枚のコインを1000回投げたところ、表が493回出た。信頼度95%で、このコインの表が出る確率を推定せよ。


【解答例】


表が出る確率をpとすると、


 


(解答終)


 


この実験からわかるのは、


「信頼度95%で、このコインの表の出る確率は0.462以上かつ0.524以下である」ということ。


これ以上のことは言えない。


 


不思議なもので、コンピュータの乱数を使って、コインを10000回投げると、表が4913回という結果が出てしまった。コインを10000回投げて測定された表のが出る確率が0.4913なのに対し、コインを1000回投げたときに測定された表が出る確率0.493より悪化してしまったケロ。


ではあるが、95%の信頼度でこのコインの表が出る確率を推定すると、


 


となるので、「このコインの表の出る確率は、信頼度95%で、0.4913以上で0.5011以下である」となり、10000回投げた確率の推定値のほうが信頼できる。