第12回 標本調査 [高校の統計]
第12回 標本調査
標本調査(一部調査)
統計調査によって、調査の対象となる全体の集合を母集団といい、選び出す、抽出する資料を標本、標本の個数を標本の大きさという。
標本平均の分布
平均m、標準偏差σの度数分布をしている母集団からn個の標本を抽出する。
これらの標本の平均値
を標本平均といい、標本の標準偏差s
を標本標準偏差という。
復元抽出の場合の標本平均、標本標準偏差を考える。
母集団から大きさnの標本を抽出し、抽出されたn個の確率変数をとすると、標本平均は
したがって、標本平均の平均は
は互いに独立な確率変数で、Xと同じ確率分布にしたがうから
同様にして、標本平均の分散は、
以上のことから、次のことが言える。
定理 標本分布とその平均、標準偏差
平均値m、標準偏差σの母集団から、復元抽出により無作為に大きさnの標本を取り出すとき、標本平均の平均と標準偏差は、それぞれ
である。
また、nが十分大きいならば、標本平均の分布は正規平均に近い。
非復元抽出の場合、母集団の大きさをNとすると
であるが、Nが十分に大きければ、
だから、非復元抽出であっても、
と考えてよい。
問1 平均値20、標準偏差5の母集団から、大きさ9の標本を無作為に復元抽出するとき、その標本平均と標準偏差を求めよ。
【解】母集団の平均m=20、標準偏差σ=5、標本の大きさn=9だから、
(解答終了)
問2 確率変数Xが右の表に従う母集団があるとする。
この母集団から大きさ4の標本を復元抽出するとき、その標本平均の平均と標準偏差を求めよ。母集団の平均m、標準偏差σは
標本の大きさn=4だから
(解答終了)
問3 ある工場で製造された同じ種類の品物2000個の平均値で150gで、標準偏差が4gである。これから25個の標本を何回もとって重さを調べるとき、25個の標本平均の平均と標準偏差を求めよ。
【解】非復元抽出だが、母集団が大きいので、復元抽出とみなすことができる。
m=150g、σ=4g、n=25だから(解答終了)
非復元抽出として計算すると、
第11回 正規分布3 [高校の統計]
第11回 正規分布3
にしたがう二項分布B(n,p)の平均m、標準偏差σは
である。
したがって、nが大きいとき、二項分布B(n,p)は、平均np、標準偏差の正規分布と近似することができる(右図参照)。
問1 1個のさいころを480回振るとき、1の目が出る回数が75回以上、90回以下である確率を求めよ。
【解】1の目が出る回数をXとすると、Xは二項分布にしたがう。
よって、平均値m、標準偏差σは
n=480とnは大きいので、二項分布は正規分布とみなすことができる。
とおくと、Zは標準正規分布N(0,1)にしたがう。
したがって、求める確率は
(解答終了)
問2 次の問いに答えよ。
(1) 中学1年生のツベルクリン反応陰性者の比率は13%であるという。中学1年生から無作為に300人を抽出して調べたとき、その中に30人以上50人以下の陰性者のいる確率を求めよ。(2) ある伝染病の死亡率は20%であるという。100人の患者のうちに30人以上の死亡者の出る確率を求めよ。
【解】(1) 陰性患者の数をXとし、Xは二項分布B(300,0.13)にしたがうものと考えると、
nが大きいとき、B(300,0.13)は正規分布N(39,5.8²)とみなすことができる。
とおくと、これは標準正規分布N(0,1)にしたがう。
よって、
したがって、約91%
(2) 伝染病の死亡者数をXとし、Xは二項分布B(100,0.2)にしたがうものと考えると、
nが大きいとき、二項分布B(100,0.2)は正規分布N(20,4²)とみなせる。
そこで、
とすると、Zは標準正規分布B(0,1)にしたがう。
よって
(解答終了)
ちなみに、二項分布B(100,0.2)と正規分布N(20,4²)は以下の通り。
両者がよく一致していることがわかると思う。
第10回 正規分布2 [高校の統計]
第10回 正規分布2
標準正規分布
平均m、分散σ²の正規分布をであらわす。
確率密度関数f(x)はだから、
とおけば、
だから、確率変数zは
に従う。
これは、(1)のm=0、σ²=1とした形になっているから、平均0、分散1の正規分布である。これを標準正規分布という。
(2)で定義される変換を標準化変換という。また、
である。
問1 確率変数Xが正規分布N(30,4²)に従うとき、
次の確率を求めよ。【解】
とおくと、zはN(0,1)にしたがう。
(1) x=30のときz=0、x=34のときz=1。
よって、
(2) x=24のときz=−1.5、x=36のときz=1.5。
よって、
(3) x=34のときz=1、x=38のときz=2。
よって、
(4) x=24のとき、z=-1.5。よって、
(註) 標準正規分布曲線はy軸に関して対称だからP(Z≦−1.5)=P(Z≧1.5)。したがって、
P(0≦Z≦1.5)はハッチングを施した部分。
(解答終了)
問2 ある高等学校3年生男子300人の身長を測定したら、平均値165cm、標準偏差5cmで、正規分布に近い分布をしていた。
(1) 身長が160cm、170cm未満である生徒はおよそ何人か。(2) 身長が173cm以上の生徒はおよそ何人か。
【解】身長をXcmとすると、確率変数
は正規分布N(0,1)にしたがう。
(1)
正規分布表より
よって、求めるべき人数は
300×0.6826=204.78≒205(人)
(2)
だから、
ゆえに、求める人数は
300×0.0548=16.44≒16(人)
(解答終了)問3 500人の生徒にテスト(100点満点)を行ったところ、その成績は、平均65点、標準偏差10点で、正規分布に近い分布をしていた。
(1) 成績が55点以上、75点以下の生徒はおよそ何人か。(2) 成績が50点以下の生徒はおよそ何人か。
(3) 上から100番以内に入るためには、およそ何点以上とればいいか。【解】
テストの得点をXとすると、は正規分布N(0,1)にしたがう。
(1)
したがって、
500×0.6826=341.3≒341(人)(2)
したがって、
500×0.1668=83.4≒83(人)(3) 100番は、全体の上から100÷500=0.2にあたる。
N(z)=0.5−0.2=0.3になるz≒0.84。z=0.84に該当する得点をxとすると
したがって、74点とればよい。
(解答終了)
ちなみに、55点、75点の偏差値は40、60。
50点の偏差値は35、74の偏差値は59です。
第9回 正規分布1 [高校の統計]
第9回 正規分布1
§1 正規分布
1個のサイコロをn回振って、1の目が出る回数をXとすると、Xは2項分布に従う。
nをn=10,20,30,40,50と変化させ、1の目のr回出る確率を計算した結果を下図に示す。
nが大きくなるにつれて、折れ線グラフが次第に平均を中心とする左右対称な正規分布曲線
に近づいてゆく(ラプラスの定理、中心極限定理)。
を確率密度関数とする確率分布を正規分布という。
ここで、mは平均値、σは標準偏差、σ²は分散で、この分布をであらわす。
特に、m=0、σ=1のとき、N(0,1)を標準正規分布という。
標準正規分布の確率密度関数は
とおくと、
であり、このI(λ)を確率積分という。
λの種々の値に対するI(λ)の値の表(正規分布表)の概略表を右に示す。
この表によると
したがって変量Xの値が
m−σとm+σの値にある確率は約0.6826
m−2σとm+2σの値にある確率は約0.9544m−3σとm+3σの値にある確率は約0.9974
である。§2 正規分布の性質
確率変数Xが正規分布に従うとき、正規分布には次の性質がある。
また、
である。
問 N(10,4)においてを求めよ。
【考え方】この計算をするためには、正規分布N(10,4)を標準正規分布に変換して計算をしなければならない。
そこで、とおく。
このようにおくと
たとえば、Xが区間[a,b]に入る確率を求める場合、x=aは、x=bはに対応するので、
となり、正規分布表を利用することができる。
【解】
とおくと、は
(解答終了)
求めるのは、下図の斜線部であることに注意!!
表計算ソフトを使って答えを求めるならば、たとえば、次のようにすればよい。
関数NORMDISTの書式は、たとえば、
NORMDIST(数値、平均、標準偏差)
である。NORMDIST(13、10、2)
となる。
便利な時代になったものである。正規分布表の使い方、見方がどうしてもわからない人は、表計算ソフトのNORMDIST関数を使ってもよい。
余談になるが、お馴染みの偏差値は
だから、X=13の偏差値は
となり、正規分布に従っているならば、上位約7%に入っていることになる。
偏差値70は約上位5%で、偏差値80は約0.1%である。
第8回 チェビシェフの不等式と大数の法則 [高校の統計]
第8回 チェビシェフの不等式と大数の法則
チェビシェフの定理(チェビシェフの不等式)
確率変数Xの平均、標準偏差をそれぞれm、σであるとすると、次の不等式が成り立つ。
ただし、kは任意の正の数とする。
これをチェビシェフの不等式という。【証明】
確率変数Xの値がであるときの確率をそれぞれとすると、
そこで、に属するグループと、にわけると
そして、
(証明終了)
ベルヌーイの大数の法則
1回の試行において事象Aの起こる確率をpとし、n回の試行において事象Aの起こった回数をrとすると、任意の正数εに対してである。
【証明】
Aの起こる確率分布は2項分布だから、平均、標準偏差はチェビシェフの不等式
に代入すると、
それで、
よって、
εは任意の正数だから
とおくことができ、
したがって、
p.q、εは正の定数だから
したがって、
である。
(証明終了)
問
「n個の値の算術平均(相加平均)をmとし、標準偏差をsとするとき、これらのn個の内の不等式
は
よりも多い」
という定理を用い、ある学級の生徒数は280人で、その平均点は62点、標準偏差は4点であるという情報だけから54点と70点の何人より多く、また、50点と74点の間にあるものは何人より多いか判断せよ。
【解】54≦x≦70のとき、m=62、s=4だからk=2。
したがって、
よって、210人より多い。
50≦x≦74のとき、k=3だから
したがって、248人より多い。
(解答終了)
得点を確率変数Xとする。Xの分布が正規分布に従っているとすると、
とおくと、Zは標準正規分布N(0,1)に従う。
だから、
したがって、54≦x≦74の区間にいる生徒数は
となり、約267人になる。
同様の計算をすると、50点と74点の区間にいる生徒数は279人となり、ほぼ全員、この区間に収まることになる。
ちなみに、70点は偏差値70、74点は偏差値80である。第7回 平均値と分散の公式 [高校の統計]
第7回 平均値と分散の公式
確率変数が2つの場合を考える。
確率変数Xが値をとり、Yが値をとるとする。
これらがそれぞれの値をとる確率を
とする。
このとき、
をXの周辺の確率といい、
をYの周辺の確率という。
§1 期待値の公式
期待値の公式(定理)
【略証】
(1)
(2)
(3)
(4) XとYは独立だから、乗法定理から
したがって、
(証明終了)
問1 硬貨とさいころを同時に投げる試行で、硬貨に表が出たら2、裏が出たら1を対応させる確率変数をXとし、さいころに出た目の数を確率変数Yとする。確率変数X+Yの値を求めよ。
【解】(解答終了)
問2 大・小2個のさいころを同時にふる試行で、大きいさいころの目の数を10の位、小さいさいころの目の数を1の位として、2桁の数字を作るとき、その期待値を求めよ。
【解】大きなさいころの目の数をX、小さいさいころの目の数をYとすると、
また、こうして作られた二桁の数は10X+Yだから、この平均値は
(解答終了)
§2 分散の公式
2乗平均と分散
【略証】
(証明終了)
分散の公式
【証明】
(1)
(2)
(3)
XとYは互いに独立な変数なので、
したがって、
(証明終わり)
第6回 独立試行の確率と2項分布の問題 [高校の統計]
第6回 独立試行の確率と2項分布の問題
問題1 ❍、☓で答える6つの問題が与えられている。いまこの解答にするのに何も考えずにでたらめに❍、×をつけるとき、そのうちの正解数をXとする。
(1) X≧3になる確率を求めよ。(2) Xの平均値(期待値)と標準偏差を求めよ。
【解】正解数の分布は2項分布。
(1)
(2) 平均値mと標準偏差σは
(解答終了)
問題2 日本人の血液型の10人に3人の割合がO型である。5人の日本人を選んだとき、そのうちのO型の人数をXとする。
(1) Xはどのような分布に従うか。(2) Xの期待値と標準偏差を求めよ。
(3) 南方系のある人種から5人を選んだとき、そのうちの4人が O型であった。この人種が日本人よりもOがたが多いと判定したときの危険率を求めよ。【解】
(1) 2項分布B(5,0.3)に従う。(2) 平均値をm、標準偏差をσとすると、
(3) 日本人とO型の割合が等しいと仮定する。
つまり、p=0.3として、P(X≧4)の確率を計算するとよって、危険率は3%である。
(解答終了)
危険率については検定であらためて説明することにするが、
「南方系のある人種の人たちに占めるO型のヒトの割合が日本人のそれと等しい」という仮説を立てると、5人中4人がO型である確率は0.03で非常にまれなことが起きているということになる。
問題3 さいころを50回投げるとき、1の目が出る回数をXとする。
(1) Xがいくらのとき確率は最大になるか。(2) Xの平均値を求め、(1)で求めた値と比較せよ。
【解】1の目が出る回数は2項分布に従う。
(1) X=kのとき確率が最大とすると、
よって、8回のとき最大。
(2) 平均値(期待値)は
8は平均50/6に最も近い整数である。
(解答終了)
第5回 独立試行と二項分布 [高校の統計]
第5回 独立試行と二項分布
§1 独立試行の確率
1回の試行で事象Aの起こる確率をpとすると、この試行をn回繰り返した場合、事象Aがr回起こる確率は
である。
問1 袋の中に赤球1個、白球4個が入っている。この中から1個取り出して、もとに戻すことを3回繰り返す。この場合、赤の出る回数をXとして、Xの確率分布を求めよ。
【解】取り出した球を戻すので、赤球の出る確率p=1/5、白球の出る確率q=4/5。
この問題の場合n=3。Xの取りうる値は0、1、2、3。
X=rの時の確率をP(X=r)と書くことにすると、したがって、確率分布は次のようになる。
(解答終了)
この問題には出ていないけれど、赤球の出る回数rの期待値mは
である。
§2 2項分布
変量Xが0、1、・・・・・・、nの値をとり、それらの値をとる確率が
で与えられる確率分布を2項分布という。
その平均・期待値m、標準偏差σは
である。
(2)、(3)を使えば、問1の平均値、標準偏差は
と、複雑な計算をすることなく、すぐに求めることができる。
【(2)の証明】
2項定理より
xで微分すると、
x=1を代入すると、
p+q=1だから
(証明終わり)
【(3)の証明】
また、
よって、
ここで、①の両辺をxで微分すると、
x=1を上式に代入すると、
これを②に代入すると、
(証明終わり)
問2 10%の不合格品を含む同じ製品の一山がある。この中から任意に4個を取り出すとき、その中に含まれる不良品の数Xで確率分布の表で示し、Xの平均値、標準偏差を求めよ。
【解】X=rである確率は
したがって、平均値=0.4、標準偏差=0.6
(解答終了)
問題 1回の試行で事象Aの起こる確率がpであるとき、n回の試行の内、事象Aが最も起こりやすい回数を求めよ。
【解】r=kのとき、確率が最大になるとすると、
したがって、
そこで、①より
②に対しては、③のkをk+1と置き換えて、不等号の向きを入れ替えると、
③と④より、
を満たす整数kのとき、事象Aは最も起こりやすい。
(解答終了)
問3 1個のさいころを40回投げるとき、1つの目が何回出る確率が最も高いか。
【解】n=40、p=1/6。
(4)よりよって、6回のとき確率は最大になる。
(解答終了)第4回 確率分布2 [高校の統計]
第4回 確率分布2
分布関数と確率密度関数
変数Xが連続な値をとるとき、Xを連続型の確率変数といい、X<xである確率P(X<x)が
で与えられるとき、F(x)を分布関数といい、その導関数
をxの確率密度関数という。
だから
で、xがある範囲にに存在する確率は、y=f(x)のグラフのその範囲の面積と等しい。
変数Xの変域をa≦x≦bとし、確率密度関数をf(x)、平均をm、分散をσ²とすると、
である。
となり、
と書くと、分散V(x)は
になる。
問題1 確率変数Xの従う確率分布の密度関数f(x)が
であるとき、次の問いに答えよ。
(1) P(3≦X≦5)の値を求めよ。(2) P(7≦X)の値を求めよ。
(3) Xの平均E(X)を求めよ。(4) Xの標準偏差D(X)を求めよ。
【解】
(解答終了)
問題2 あるバスの停留所の発車時刻は毎時0分、15分、35分の3回である。この発車時刻をまったく知らない人が、停留場へ来て待たされる時間の期待値を求めよ。
【解】この人が停留所に来る時刻をx分とすると、待ち時間tは
確率密度f(x)は一様分布と考えられるので、
とすると、
したがって待ち時間の平均・期待値E(t)は
(解答終了)
問題3 連続的な値をとる確率変数xがあって、その確率密度がAを定数として、
とするとき、となるようなaの値を求めよ。
【解】したがって、
a=0.2とすると、
よって、a=0.2
(解答終了)
なのですが、a=0.2であることに気づく人はどれだけいるのだろう。
試験会場で、これはチョット気づかないだろう。
条件より0<a<0.5で、
だから、a=0.2と気づけということか。
とおくと、
だから、ニュートン法
を用い、x₀=0として計算すると、次のようになる。
計算の初期値としてx₀=0.232を選べば、1、2回計算すれば、a=0.2であることに気づくのではないか。
問題4 半径aの円Oの周上の1点Aから任意の方向に弦を引くとき、それらの弦の長さの平均を求めよ。
また、弦の長さが半径より大となる確率を求めよ。【解】
円の中心Oを原点、Aを(−a,0)、Bを(a,0)とし、周上の点をPとする。弦APとx軸のなす角をθ(−π/2≦θ≦θ/2)とすると、弦APの長さlは
θを確率変数とし、一様分布
と仮定すると、
したがって、弦の長さの平均は
AP>aになるのは、
したがって、弦の長さが半径より大きい確率は
(解答終了)
第3回 確率変数と確率分布 [高校の統計]
第3回 確率変数と確率分布
§1 確率変数と確率分布
1〜6の目をもつサイコロを振り、出た目をXとすると、Xの目が出る確率は、次のようになる。
たとえば、X=1と、Xの値が決まれば、その確率
と定められる。
より一般的に書くと、次のようになる。
の値をとる変数Xに対して、の確率が与えられているとき、Xを確率変数という。また、確率変数Xとそれに対応する確率との対応関係を確率分布という。
確率変数のとる値がであるとし、それに対応する確率をとするとき、
である。
問1 1枚の硬貨を2回投げるとき、表の出る回数を確率変数Xとして、Xの確率分布を求めよ。
【解】(1回目の結果、2回目の結果)と書くことにすると、全事象は、(裏,裏)、(裏,表)、(表,裏)、(表,表)の4通り。
表が0回出るのは、(裏,裏)の1通り。したがって、表が0回出る確率は
表が1回出るのは、(裏,表)、(表,裏)の2通り。
したがって、表が1回出る確率は
表が2回出るのは(表,表)の1通り。
したがって、表が2回出る確率は
よって、確率分布は次の通り。
(解答終了)
問2 10本のくじがあって、そのうち、2本が当たりくじとする。3本引いてあたった回数をXとするとき、X本当たる確率を求めよ。
【解】したがって、
(解答終了)
§2 期待値(平均値)と分散、標準偏差
確率変数Xがの値をとり、それに対応する確率がであるとき、
をE(x)や、mなどであらわし、確率変数の平均値、期待値という。
また、
をやV(x)、σ²で表し、確率変数の分散という。
また、分散の正の平方根を標準偏差という。
問3 白球4個と赤球3個が入っている袋から2個の珠を同時に取り出すとき、その中に含まれる白球の個数の確率分布を求めよ。また、期待値を求めよ。
【解】取りざされる白球の個数をk(=0,1,2)に対応する確率をとする。
したがって、平均値mは
(解答終了)
ちなみに、分散Vと標準偏差σは
(解答終了)
問題 1と書いたカードが1枚、2と書いたカードが2枚、・・・・・・、nと書いたカードがn枚ある。この中から1枚取り出すとき、カードの示す数Xを確率変数とする。
(1) X=kである確率を求めよ。(2) Xの平均値を求めよ。
【解】(1) カードの数は全部で
したがって、は
(2) Xの平均値mは
(解答終了)