ベイズの定理と疾病検査の信頼性についてのよもやま話 [高校の統計]
ベイズの定理と疾病検査の信頼性についてのよもやま話
日本でも新型コロナウイルスが流行しているので、「疾病検査の信頼性」に関する問題を一つ。
問題
ある感染症に感染しているかどうか調べる検査法がある。この検査法では、感染者に対して95%が陽性の結果を受け、また、、非感染者の5%に陽性の結果が出る。国民の人口の0.5%が感染症に感染しているとするとき、この検査によって陽性判定を受けたヒトが真の感染者である確率を求めよ。
ベイズの定理を用いて解くこともできるけれど、条件付き確率などの説明をしないといけないので、ベイズの定理を用いない、泥臭い方法でこの問題を解くことにする。
【解答例】
1000人検査するとすると、1000人のうちの0.5%、つまり、
1000×0.005=5人
がこの感染症に罹っていて、残りの
1000−5=995人
が非感染者の人数。
感染者5人のうち、この検査で陽性判定の受ける人数は
5×0.95=4.75人
非感染者995人のうち、この検査で陽性判定を受けるヒトの数は
995×0.05=49.75人
したがって、この検査で陽性の結果になるヒトの数は
4.75+49.75=54.5人
陽性判定を受けた54.5人のうちで実際に感染症に罹っているヒトの数は4.75人だから、答えは
4.75÷54.5≒0.087=8.7%
(解答終)
【ベイズの定理を用いた解答】
感染者である事象をA、非感染者である事象をB、検査で陽性が出る事象をEとする。
問題の条件より、
よって、ベイズの定理より求めるべき確率は
(解答終)
この結果は衝撃的だろう。
なんたって、
検査で陽性判定を受けたヒトの中で本当に感染症に感染しているヒトの割合はたったの9%で、残りの91%は感染していないのに陽性判定を受けた偽陽性のヒトなんだから。
このパラドクス的な結果が起きた理由は、全人口に占める感染者の割合、確率が0,5%と低いからなんですがね。
テレビのワイドショーのコメンテータが「国民の不安を払拭するために、希望するヒトは誰でも新型コロナウイルスの検査を受けれるようにするべきだ」と声高に主張しているけれど、そんなことをしたら、新型コロナウイルスに感染していないのに陽性判定を受ける偽陽性のヒトが山のように出て、結果、医療崩壊してしまうにゃ。
新型コロナウイルスのPCR検査の感度(新型コロナウイルスに感染しているヒトが検査を受けて陽性の結果が出る確率)は70%程度って話があるようだにゃ。
チョット小耳に挟んだ話なのでこの話の真偽はわからないけれど、
この話が本当だとしたら、
希望するヒトは誰でもPCR検査を受けれるようにしたら、もっととんでもない結果が出るケロよ。
仮に、
この検査の特異度(感染していないヒトが検査で陰性になる確率)も同じように70%――非感染者の30%が検査によって陽性判定を受ける!!――とし、日本人の0.1%(日本人の12万人以上)が新型コロナウイルスに感染しているとすると、この検査で陽性判定を受けたヒトの中に占める感染者の割合は
感度、特異度がともに90%だとしても、
日本人の0.01%である約1万2千人のヒトが新型コロナウイルスに感染しているとし、感度、特異度がともに99%であったとしても、
となり、検査によって陽性判定を受けたヒトの中でウイルスに感染しているヒトの割合は1%に満たず、陽性判定を受ける約99%が新型コロナウイルスに感染していない偽陽性のヒトってことになる。そして、この条件だと、日本人すべてを検査したら、感染していないのに陽性判定を受ける偽陽性のヒトが間違いなく100万人を突破する!!のであった。
つ・ま・り、
この手の検査は、たとえその検査がどんなに優れたものであったとしても、感染が(強く)疑われるヒトを対象に行わないと、検査自体が無意味なものになってしまうってことを示している。
参考までに、感度、特異度が70%(0.7)のとき、検査対象となる集団の感染率を横軸に、この検査で陽性判定を受けたヒトの中に占める感染者の割合を縦軸にとり、この関係を示すにゃ。
この図を見ると、検査対象となる集団の感染率が10%(0.1)のとき、検査によって陽性判定を受けるヒトの中に占める感染者の割合は約20%(0.2)、感染率が20%(0.2)のとき37%(0.37)程度であることがわかる。
感度、特異度が90%(0.9)のときは次のようになる。
調査対象の10%(0.1)が感染しているときに、ようやく、陽性判定を受けたヒトの中に占める感染者の割合が50%(0.5)に到達する。そして、クルーズ船ダイアモンド・プリンセス号のように感染率が20%近くでも、陽性判定者に占める感染者の割合は70%程度。裏を返せば、陽性判定を受けたヒトの中で感染していない偽陽性の人の割合が30%(0.3)もあったてこと。
ひょっとしたら、ネムネコが小耳に挟んだ「新型コロナウイルス検査の精度は70%」という話はこのことを言っているのかもしれない。
さらに、感度、特異度が99%(0.99)の場合も示すにゃ。
テレビなどのマスメディア、特にワイドショー受けしないからかもしれないけれど、感染率と偽陽性の人の関係について言及する(感染症の)専門家って、ほとんど、テレビのワイドショーなんかに登場しないよね。
この手の話は、医師国家試験の問題として出題されるらしいから、感染症の専門家ならば誰しも知っている基礎的な知識のはずなのに、マスコミに忖度し、この手の話をしないのだろうか。
YouTubeで、この問題について触れているお医者さんの動画があったので、紹介するにゃ。
高校の数学だと、
条件付き確率は
で定義し、したがって、
そして、
であるとき、事象AとEは独立と習ったかもしれない。
という見慣れない記号が出てきているけれど、これは、高校数学で習った条件付き確率のことでにゃ。見慣れない記号に幻惑されてはいけない。
参議院選挙の投票率の予想式 [高校の統計]
参議院選挙の投票率の予想式
というn個のデータがあり、この重回帰式を
とする。
さらに、この(1)とからの予想値と実際のとの差を
とし、
とする。
そして、最小2乗法を用いて、Rが最小になるように、重回帰式(1)の係数a、b、cを定めることにすると、
これから、a、b、cに関する次の連立方程式が得られる。
行列を用いると、次のようになる。
この連立方程式を解けば、重回帰式(1)の係数a、b、cを求めることできる。
(3)は、各式の両辺をnで割り
ここで、
こちらの方が、連立方程式の意味がわかりやすくていいのかもしれない。
「非常に関心がある」をx、「必ず行く+期日前投票をした」をy、(参議院)選挙の投票率をzとし、NHKが公表しているデータを使い、連立方程式(3’)を求めると、
この連立方程式を解くと、
となり、
という参議院選挙の得票率の重回帰式が得られる。
NHK、朝日新聞などが発表している今回の参議院選挙の投票率の推定値48.8%と過去4回との投票率と、(5)式を用いた予想値を比較すると、次のようになる。
今回の参議院選挙の実際の投票率と予想値は2.4ポイントほど異なっているが、比較的よく投票率を再現していることがわかる。
さらに、第25回の投票率を加え、新たに計算すると、連立方程式(3’)は
となり、これを解くと
となり、次の重回帰式が得られる。
実際の投票率と(6)式を用いて予想した計算結果は次の通り。
(6)式は、誤差±0.9ポイントで参議院選挙の投票率を表すことができる。
今回提出した、参議院選挙の投票率の予想式(5)、(6)に、何か深遠な数学的な意味などがあるかといえば、おそらく、そんなものはない。
「非常に関心がある」をx、「必ず行く+期日前投票をした」をy、(参議院)選挙の投票率をzとすると、
しかも、NHKの選挙直前の世論調査の結果を用いると、
何故かわからないけれど、(6)式で参議院選挙の投票率を±1.0ポイントの範囲で表すことができるという、ただ、それだけの話。
ネムネコが考えるに、衆議院選挙の投票率の予想に(6)は使えないと思う。この式はあくまでも参議院選挙の投票率限定のものだ。
ではあるが、ここで用いた重回帰分析の手法は、おそらく、衆議院選挙の得票率の予想にも使うことができて、NHKが行った単回帰分析によりは良好な結果が得られると思う。
ここで使用したNHKのデータは、NHKの次の記事のものを使用した。
投票率、ズバリ当てます!
https://is.gd/RgZqQJ
ネムネコは表計算ソフトを使えない!! Help me!!! [高校の統計]
ネムネコは表計算ソフトを使えない!!
NHKの「投票率、ズバリ当てます!」という記事を読んでいて、単回帰分析じゃなく重回帰分析を使えばいいじゃないかと思い、数式を作ってみた。
というn個のデータがあり、この重回帰直線を
とするにゃ。
この回帰直線(1)とから推測される値と実際のとの差を
とし、
とする。
そして、
最小2乗法では、Rが最小になるように、重回帰直線(1)の係数a、b、cを定める。
だから、
これから、a、b、cに関する次の連立方程式が得られる。
行列を使うべきだと、ddt³さんに怒られるかもしれないので、行列で書くと
この連立方程式を解けば、2重回帰直線(1)の係数a、b、cを求めることできる。
(3)は、各式の両辺をnで割り
ここで、
こちらの方が、連立方程式の意味がわかりやすくて、いいのかもしれない。
それっぽい感じになっているので、計算は間違えていないと思うが、ここまではすぐに出来た。
C言語かFortranなどで、2重回帰直線(1)を求めるプログラムを作ってとこうかと一瞬考えたのだが、「なんか面倒くさい。それに、表計算ソフトに重回帰分析をのツールがあるはずだ」と考え、2重回帰直線(1)の係数を求めてみようとしたのだけれど、ddt³さんと違って表計算ソフトを使い慣れていないネムネコは、どうやったらいいのかわからず沈没。
というわけで、表計算ソフトを用いた統計計算に詳しい奴は、ネムネコの代わりに、NHKのデータを元に2重回帰直線を求め、今回の参議院選挙の得票率を予想するにゃ。
NHKのデータを元に、重回帰直線の方程式を求めると
ここで、xは「非常に関心がある」、yは「必ず行く+期日前投票」、zは「投票率」。
したがって、
NHKの解析結果よりもネムネコがあらたに提示する予想式のほうが過去の投票率をよく再現出来ているにゃ。
そして、この予想式によると、今回の参議院選挙の投票率は46.4%だ。
ただ、この予想式の誤差は±1%くらいあるから、45.4〜47.4%くらいですかね〜。だから、今回の参院選の投票率は50%を割り込むのではないか。
やってみたかっただにゃ [高校の統計]
やってみたかっただにゃ
問題 サイコロをn回振る間に、1の目が出る回数をrとするとき、
となる確率を、n=50の場合について求めよ。
【解
n=50、p=1/6、q=5/6とおくと、
nが50と大きい(?)ので、これは正規分布に近似できて、正規分布表から、この確率は
である。
(解答終)
まぁ、こんなふうに解くことができる。
さてさて、二項分布(50,1/6)を正規分布
で近似していいものかどうかが気にかかって、コンピュータで乱数を発生させて、調べてみた。
サイコロを50回投げて1の何回出るか調べるという試行を100万回ほど繰り返して、確率分布、確率密度関数を求めてみた。
下の図がその結果で、赤い点と曲線がコンピュータを使ったシミュレーションの結果で、緑の曲線が正規分布。
近似できていると言えば近似できているし、できていないと言えば、できていない。なんとも微妙な結果だね。
乱数を飛ばすなんてまどろっこしいことせずとも、
を使えばいいじゃないか。
(表計算ソフトを使って計算した奴)
正論だけれど、乱数を使ってシミュレーションしたかったんだにゃ。だから、しょうがないにゃ。
確率・統計と極限の融合問題 [高校の統計]
確率・統計と極限の融合問題
問題1 外観では区別できない2つの袋U₁、U₂があり、
U₁には4n個の赤い玉とn個の白い玉
U₂には2n個の赤い玉と3n個の白い玉
がそれぞれ入っている。このどちらかが観測者に手渡され、袋U₁が手渡される確率は2/3、袋U₂が手渡される確率は1/3である。
観測者は手渡された袋から3個玉を取り出し、赤い玉の数が白い玉の数より多いときはU₁であり、そうでないときはU₂であると判断する。観測者が誤った判断を下す確率を求めよ。
【解】
観測者が誤った判断を下すのは次の2つの場合である。
袋U₁が手渡され、赤い玉が1、白い玉が2個、または、白い玉が3個
袋U₂が手渡され、赤い玉が3個、または、赤い玉が2個、白い玉が1個
したがって、
よって、
(解答終)
問題2 さいころをn回投げ、出た目の最大数がxとなる確率をで表す。を求め、つぎにを求めよ。
【解】
出た目の最大数がxになる確率は、さいころをn回投げたとき、すべて1からxの目が出る確率から、すべて1からx−1が出た確率を引いたものになるので、
したがって、
(解答終)
問題3 箱の中に1,2,・・・,9の数字を1つずつ書かれたカードが9枚入っている。これを無作為に1枚取り出し、その数字を調べてから元の箱に戻す。これを3回繰り返して、取り出したカードの最大数をXとする。kを1≦k≦9である整数とするとき、次の問に答えよ。
(1) X≦kである確率を求めよ。
(2) X=kである確率を求めよ。
(3) Xの期待値を求めよ。
【解】
(1) これはk以下の数が3回続けて取り出す場合なので、
(2)
(3)
(解答終)
類題 2つの箱に1からnまでの通し番号を書いたn枚のカードが入っている。各箱から同時に1枚ずつカードを取り出し、番号を比較して、小さくない方をXとするとき、次の問に答えよ。
(1) X=kである確率をnとkで表わせ。(kは整数で1≦k≦n)
(2) Xの期待値をnの式で表わせ。
【答】
問題4 次のようなゲームを考える。サイコロを投げて偶数の目が出れば続けて投げ、奇数の目が出ればそこでゲームを止める。k回続けて偶数の目が、(k+1)回目に奇数が出た場合にk点が与えられるものとする。
(1) 偶数の目が続くことがn回以下としたときの得点の期待値を求めよ。
(2) を求めよ。
【解】
(1) 得点がk点であるのは、k回引き続き偶数が出て、k+1回目に奇数が出る場合なので、この確率
したがって、求めるべき期待値は
①に1/2を掛けて、①との差をとると、
(2) n≧2のとき
したがって、
よって、ハサミウチの定理より、
したがって、
(解答終)
比率の推定 確率・統計 [高校の統計]
比率の推定 確率・統計
母集団から標本をn個抽出し、賛成・反対や良品・不良品などの比率の推定について、工場製品に占める良品の比率を例に考える。
母集団から無作為に取り出した標本の数がnで良品x個、良品の比率をpとすると、n個の中に良品がx個含まれている確率は
であり、この確率分布は二項分布B(n,p)になる。
nが大きいとき、これは
の正規分布と考えてよい。
したがって、
の分布は正規分布N(0,1)だから、
信頼度95%で、
この両辺をnで割ると、
同様に、信頼度99%で
問題1 全製品中から400個を任意に抽出したところ、280個が良品であることがわかった。全製品に占める良品の割合を信頼度95%で推定せよ。
【解答】
全製品の良品の割合をpとすると、各標本について良品の占める割合はpだから、n個の標本中x個が良品である確率は
となり、平均np、標準偏差の2項分布になる。
n=400と大きいので、これは正規分布とみなすことができて、(1)より、信頼度95%で
n=400、x=280だから、これを上式に代入すると
pは0.7に近いと考えられるので、p=0.7として右辺に代入すると、
よって、信頼度95%で
(解答終)
もちろん、①式の右辺にp=0.7を代入せず、不等式①の両辺を2乗して、不等式
を解き、pの解を求めても好い。
すると、
くらいになる。
次に世論調査などで必要になるサンプル数の個数について考える。
標本の数をn、賛成者の数をx、母集団の賛成者の割合をpとする。
信頼度95%で誤差0.03とすると、(1)より
となるように標本数nを定めればよい。
したがって、
この場合、pは0≦p≦1の値を取りうるので、
の最大値を求めると、
となるので、(3)の左辺にp=1/2を代入すると、
となる。
したがって、約1000人調査すれば、信頼度95%で誤差0.03、すなわち、誤差3%で賛成者の割合を求めることができる。
問題2 ある意見に対する賛成者の比率は30%前後であると予想される。賛成者の真の比率を3%以下の誤差で推定するには、何人≧について調べればよいか。信頼度を95%以上と信頼度99%以上の場合について求めよ。
【解答】
回答者の数をn、その内の賛成者の数をxとする。
95%のとき、
99%のとき、
したがって、信頼度95%のときは
となるようにnをとればよい。
p=0.3とすると
信頼度99%のときは
p=0.3として代入すると
したがって、
信頼度95%のときは約900人
信頼度99%のときは約1600人
(解答終)
確率・統計の追加問題2 [高校の統計]
確率・統計の追加問題
問題1 つぼの中に4個の白球と3個の赤球が入っている。このつぼの中から無作為に1球ずつ取り出し、赤球が出たら止めるものとする。ただし、取り出した球はつぼに戻さない。このとき、次の問に答えよ。
(1) 取り出される白球の数xの確率分布を求めよ。
(2) xの平均(期待値)を求めよ。
(3) xの標準偏差を求めよ。
【解答】
(1) xの取りうる値は0、1、2、3、4のいずれかで、x=rとなるのは、r回続けて白球が出て、r+1回目に赤球が出る場合である。その確率をとすると、
したがって、確率分布は
x |
0 |
1 |
2 |
3 |
4 |
p |
3/7 |
2/7 |
6/35 |
3/35 |
1/35 |
(2) xの平均をmとすると
(3) xの標準偏差をσとすると、
(解答終)
問題2 つぼの中に4個の白球と3個の赤球が入っている。このつぼの中から同時に3個を取り出すとき、それに含まれる白球の個数をxとする。このとき、次の問に答えよ。
(1) xの確率分布を求めよ。
(2) xの平均mと標準偏差σを求めよ。
【解答】
(1) 白球がx=r個とり出される確率をで表すと
となるので、
したがって、確率分布は
x |
0 |
1 |
2 |
3 |
p |
1/35 |
12/35 |
18/35 |
4/35 |
(2)
(解答終)
問題3 表裏の出る確率が同様に確からしい硬貨を3枚同時に投げる試行を繰り返す。各回において表の出る回数をxとする。このとき、次の問に答えよ。
(1) xの確率分布を求めよ。
(2) xの平均と標準偏差を求めよ。
【解答】
(1) 表がx=r枚出る確率をで表すと、独立試行の確率より
したがって、確率分布は次のようになる。
x |
0 |
1 |
2 |
3 |
P |
1/8 |
3/8 |
3/8 |
1/8 |
(2) xの平均をm、標準偏差をσとすると、
(解答終)
1回の試行で事象Aの怒る確率がpのとき、n回の独立試行中Aがr回起こる確率は
n回の独立試行で、Aの起こる回数をxとすると、xは0,1,2,・・・,nというn+1個の値をとる確率変数で、その確率分布は次のようになる。
また、平均(期待値)m、標準偏差は
1枚の硬貨を3回投げる試行で表が出た回数をxとして考え、この公式を用いると、(2)の平均、標準偏差は次のように求めることができる。
確率・統計の問題と解答例 [高校の統計]
問題
箱の中には、1〜N(Nは2以上)までの相異なる数字が書かれた玉がN個入っている。その箱の中から1つ取り出した玉に書かれている数字をXとし、取り出した玉を戻さず、さらにもう1つ取り出した玉に書かれている数字をYとする。
このとき、次の問に答えよ。
(1) Xの期待値(平均値)はいくらか。
(2) X+Yの期待値(平均値)はいくらか。
(3) 1回目に取り出した玉を箱に戻したあとに、さらに、2回目の玉を取り出すように変更したとする。1回目に取り出した球に書かれている数をX、2回目に取り出した書かれている数をYとしたとき、X+Yの期待値(平均値)はいくつになるか。
N=3の場合、
(1)
(2) 1回目にX、2回目にYが出た事象を(X,Y)で表すと、同様に確からしい根源事象は、つぎの4つになる。
(1,2)、(1,3)、(2,1)、(2,3)、(3,1)、(3,2)
したがって、期待値は
(3) 同様に確からしい根源事象は、次の6つになる。
(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)
したがって、期待値は
Z=X+Yとおき、確率分布を作って解くならば、次のようになるだろう。
(2) Z=X+Yとすると、確率分布は
Z |
3 |
4 |
5 |
確率p(Z) |
1/3 |
1/3 |
1/3 |
したがって、X+Yの期待値は
(3) Z=X+Yとすると、その確率分布は
Z |
2 |
3 |
4 |
5 |
6 |
確率p(Z) |
1/9 |
2/9 |
3/9 |
2/9 |
1/9 |
したがって、X+Yの期待値は
どうやら取り出した球を戻そうが(復元抽出)、戻すまいが(非復元抽出)であろうが、取り出した2つの玉に書かれた数の和の期待値は同じになりそうだ。
N個の場合
したがって答は
追加問題1
箱に1、2、・・・、N(N≧2)の数字が書かれたカードがそれぞれ1、2、・・・N枚入っているとする。このとき、次の問に答えよ。
(1) 箱に入っているカードは合計何枚か。
(2) 箱から1枚取り出したカードに書かれている数字がk(1≦k≦N)である確率を求めよ。
(3) 箱から1枚取り出したカードに書かれている数字の期待値(平均値)を求めよ。
【解答例】
(1)
(2) kが書かれているカードはk枚あるので、確率は
(3) 期待値は
(解答例終)
追加問題2
2つの箱には1からnまでの通し番号を書いたカードが入っている。各箱から同時に1枚ずつカードを取り出し、番号を比較して小さくない方をXとするとき、次の問に答えよ。
(1) X=kである確率をnとkで表わせ。ただし、kは整数で1≦k≦nとする。
(2) Xの期待値をnの式で表わせ。
【解答例】
(1) だから、
(2)
(解答例終)
(1)は、X=kになるのは、
(k,1),(k,2),・・・,(k,k),(k−1,k),(k−2,k),・・・,(1,k)
の2k−1通りだから、
としてもいいのでしょう。
標本の推定と検定の補充問題 [高校の統計]
標本の推定と検定の補充問題
問題1 A君のいるクラスのものの英語と国語の成績を調べたところ、右表のとおりであった。この試験でA君の成績は英語82点、国語91点であった。クラスの中の成績の順位からいえば、A君は英語と国語のどちらが順位が上と考えられるか。
【解】
の大小で判断すれば良い。ここで、xは得点、mは平均点、σは標準偏差である。
英語の場合、
国語の場合、
したがって、国語の順位が上である。
(解答終)
正規分布を仮定すると、
したがって、A君の英語の順位は100人中13番目、国語の順位は5番目くらいと考えられる。
問題2 ある学年の生徒数は700人で、先日行われた数学の学力テストの平均点は46点、標準偏差は5点であった。次の問に答えよ。
(1) 41点から51点までのものは、最低何人いると考えられるか。
(2) 26点から66点までのものは、何人より多いと考えてよいか。
【解】
チェビショフの定理(不等式)より、なる区間にいるものの数lは
(1) これはk=1の場合なので、
よって、0人以上
(2) これはk=3の場合なので、
よって、652人以上
(解答終)
(1)は、ほとんど意味のない情報(笑)。
なお、正規分布を仮定すれば、
(1)はz=1の場合なので、
から約477人。
(2)はz=4の場合なので、
よって、700人。
66点は偏差値90,26点は偏差値10だから、700人全員がこの範囲に収まってしまう。
ネムネコが考えるに、この数学のテストの大問が5題であったとすれば、大問2題は誰でも解けてしまう簡単な問題で、残りの3つの問題はあまりに難しくて、ほとんど全ての生徒は手も足も出せないダルマさん状態になってしまっていたと考えられ(笑)。
問題3 事象Aが起こる確率が0.05以下のとき、Aが起こることは「めずらしい」ということにする。男子の出生率が0.5のとき、6人のうち5人以上の男子が生まれることは珍しいといえるか。
【解】
6人のうち5人以上の男子が生まれる確率は、
なので、「めずらしい」とは言えない。
(解答終)
類題 ある風邪薬の新薬のきく確率は0.8だといわれている。これを8人の患者に飲ませたとき7人以上の患者に聞くことは「めずらしい」といえるか。
【略解】
よって、「めずらしい」と言えない。
(略解終)
母平均の推定
1つの標本の分布から母平均の平均を推定するには、
n個の標本を任意抽出し、その平均、標準偏差σ、母集団の平均をmとすれば、
(1) と推定する信頼度は95%
(2) と推定する信頼度は99%
問題4 ある高校3年生の男子250人の平均身長は165.4cm、標準偏差は5.6cmであった。この男子生徒の身長を95%の信頼度で推定せよ。
【解】
よって、
よって、95%の信頼度で165.4±0.70cm。
問題5 1つの貨幣を10回投げて表が出る実験を8回行った。その結果は次のとおりであった。
4, 5, 3, 5, 6, 4, 6, 5
(1) 表が出た回数の平均値と標準偏差を求めよ。
(2) (1)をもとに、信頼度95%で表の出る真の確率を推定せよ。
【解】
(1) 表が出る平均回数をm、標準偏差をσとすると、
(2) 標本の表の出る平均確率は0.475、標本の数n=8、標準偏差σ=0.0968だから、信頼度95%の信頼度では
よって、
(解答終)
問題5
(1) ある円板の直径を10回測ったら、次の値(単位mm)を得た。真の直径を95%の信頼度で推定せよ。
10.3, 10.1, 9.9, 10.2, 9.9, 10.2, 10.1, 9.9, 10.1, 10.2
(2) この円板の直径を95%の信頼度で、しかも0.01mmの精度で求めるには、何回測定しなければならないか。
【解】
(1) 標本の平均を、真の直径をmとする。
標準偏差σは
したがって、
よって、
(2) 信頼度95%なので
となるようにnを定めれば良い。
よって、
したがって、830回。
(解答終)
(1)の答は、10.1±0.1としたほうがいいのかもしれない。という数字に意味があるかどうか微妙だから。
であるとすれば、
なので、標準偏差σ=0.14がいいのかもしれない。
だとすれば、(2)の答えは、
となり、784回となる。
どこで小数点何位で四捨五入をするかによって計算結果がこうも劇的に異なるのかと驚くネムネコであった。
問題6 の値が2以下ならば優位水準5%としての事象の成立は正しいとし、2より大きければその事象の成立は棄却される。
いま25人1組に新しい教育方法で数学を教えたら、1年間の平均成績が84点であった。いままでの教育方法では平均82点で標準偏差は4である。新しい教育方法は効果があったといえるか。
【解】
「新しい教育方法は効果がない」と仮定する。
新しい教育方法での平均点、m=82、σ=4とすると、
となり、この仮説は棄却される。
よって、新しい教育法は効果があった。
(解答終)
問題7 ある大学では1年生に対して毎年同じテストを行っている。昨年度の1年生の成績は平均点64.5、分散20の正規分布に従っていた。今年度の1年生にも同じテストを行い、無作為に8人を抽出しところ点数は次のとおりであった。
66, 73, 55, 69, 70, 67, 62, 71
今年度の1年生の平均点は昨年度よりも高いか有意95%で検定せよ。ただし、今年度の分散は昨年度と同一であるとする。
【解】
昨年と変わらないと仮定する。
なので、
よって、この仮説は棄却されない。
したがって、平均点は昨年度より高くないと考えられる。
(解答終)
問題8 ある工場の経験によると7mmボルトの規格の製品の寸法はほぼ正規分布をしており、標準偏差は0.20mmであるという。ある日の製品から16個のボルトを無作為抽出したところ、その寸法の平均が7.09mmであった。この日の寸法の平均は規格から外れているか。優位水準0.05で検定せよ。また、この日の寸法の寸法の平均μを95%信頼区間を求めよ。
【解】
この日の標本平均をとすると、
よって、この日の寸法の平均は規格から外れていない。
また、95%の信頼区間は、
(解答終)
独立試行の確率の補充問題 [高校の統計]
独立試行の確率の補充問題
独立試行の確率
1回の施行で、事象Aの起こる確率をpとする。この施行をn回繰り返すとき、事象Aがk回起こる確率は
独立試行で最大確率の場合の回数
1回の施行で事象Aの起きる確率をpとするとき、n回の施行のうちで事象Aがr回起きる確率が最も大きいとすれば、次の不等式が成り立つ。
問題1 1つのさいころを5回投げるとき、
(1) 4の目が3回出る確率求めよ。
(2) 4の目が3回以上出る確率を求めよ。
【略解】
4の目がk回出る確率をと表すことにする。
(解答終)
類題 1つのさいころを3回投げるとき、次の確率を求めよ。
(1) 1の目がまったく出ない確率
(2) 1の目が1回出る確率
(3) 1の目が2回以上出る確率。
【略解】
1の目がk回出る確率をで表すことにする。
(略解終)
1の目が2回以上でる事象の余事象は、1の目がまったく出ない、または、1の目が1回出る事象なので、余事象の確率を使い次のように求めることもできる。
問題2 AとBが互いに1つのさいころを投げて、最初に2の目を出したものを勝ちとする。Aから始めるとき、
(1) Aが勝つ確率を求めよ。
(2) Bの勝つ確率はAと同じと言えるか。
【解答】
(1) nを正の整数とするとき、Aから交互にコインを振ってAが2n−1回目に勝つのは、2n−2回目まで2以外の目が出て、2n−1回目に2のさいころの目が出るとき。
このときの確率は
よって、Aが勝つ確率は
(2) Bの勝つ確率は
なので、Aの勝つ確率と同じではない。
(解答終)
類題 袋の中から1から10までの番号を書いた札が1つずつ入れてある。いまA、B2人がAからはじめて交互に1枚ずつ札を取り出し、先に1の番号の札を出したものを勝ちとする。取った札は必ず元に戻すことにすれば、A、Bが勝つ確率はいくつか。
【略解】
Aが勝つ確率は
Bが勝つ確率は
(略解終)
問題3 さいころを振って、偶数の目が出たらそのたびにもう1回振り、奇数の目が出たらそこで止めるものとし、k回でやめとなればk円もらえるものとする。最大回nまで振るものとし、その期待金額をとするとき、を求めよ。
【解】
k回でやめになる確率をとすると、これはk−1回連続で偶数が出て、k回目に奇数が出る事象の確率になるので、
よって、期待金額は
両辺を1/2倍すると
①と②の差をとると、
よって、
(解答終)
問題4 さいころを50回投げるとき、5の目が何回出る確率が最も大きいか。
【解】
n=50、p=1/6、5の目が出る確率が最大となる回数をrとすると、(2)より
よって、8回
(解答終)
類題 硬貨を100回投げるとき、表が何回出る確率が最も大きいか。
【解】
p=1/2、n=100、表の出る確率が最大である回数rとすると、
よって。50回
(解答終)
問題5 さいころをn回振るとき、少なくとも1回6の目が出る確率が0.9より大きくなるか。ただし、log₁₀2=0.3010、log₁₀3=0.4771とする。
【解】
題意より、
両辺の常用対数をとると、
ここで、
よって、
したがって、
よって、n=13回。
(解答終)