SSブログ

第12回 標本調査 [高校の統計]

第12回 標本調査


標本調査(一部調査)


統計調査によって、調査の対象となる全体の集合を母集団といい、選び出す、抽出する資料を標本、標本の個数を標本の大きさという。

標本平均の分布

平均m、標準偏差σの度数分布をしている母集団からn個の標本

  

を抽出する。

これらの標本の平均値

  

標本平均といい、標本の標準偏差s

  

標本標準偏差という。

復元抽出の場合の標本平均、標本標準偏差を考える。

母集団から大きさnの標本を抽出し、抽出されたn個の確率変数を

  

とすると、標本平均は

  

したがって、標本平均の平均は

  

は互いに独立な確率変数で、Xと同じ確率分布にしたがうから

  

同様にして、標本平均の分散は、

  

以上のことから、次のことが言える。

定理 標本分布とその平均、標準偏差

平均値m、標準偏差σの母集団から、復元抽出により無作為に大きさnの標本を取り出すとき、

標本平均の平均と標準偏差は、それぞれ

  

である。

また、nが十分大きいならば、標本平均の分布は正規平均に近い。


非復元抽出の場合、母集団の大きさをNとすると

  

であるが、Nが十分に大きければ、

  

だから、非復元抽出であっても、

  

と考えてよい。

問1 平均値20、標準偏差5の母集団から、大きさ9の標本を無作為に復元抽出するとき、その標本平均と標準偏差を求めよ。

【解】

母集団の平均m=20、標準偏差σ=5、標本の大きさn=9だから、

  

(解答終了)

 


問2 確率変数Xが右の表に従う母集団があるとする。

この母集団から大きさ4の標本を復元抽出するとき、その標本平均の平均と標準偏差を求めよ。


statics-graph-12-01.png

【解】

母集団の平均m、標準偏差σ

  

標本の大きさn=4だから

  

(解答終了)


問3 ある工場で製造された同じ種類の品物2000個の平均値で150gで、標準偏差が4gである。これから25個の標本を何回もとって重さを調べるとき、25個の標本平均の平均と標準偏差を求めよ。

【解】

非復元抽出だが、母集団が大きいので、復元抽出とみなすことができる。

m=150gσ=4gn=25だから

  

(解答終了)

非復元抽出として計算すると、

  



第11回 正規分布3 [高校の統計]

第11回 正規分布3


seiki-02.png独立試行の確率

  

にしたがう二項分布B(n,p)の平均m、標準偏差σ

  

である。

したがって、nが大きいとき、二項分布B(n,p)は、平均np、標準偏差の正規分布statics-11-siki-01.pngと近似することができる(右図参照)。



問1 1個のさいころを480回振るとき、1の目が出る回数が75回以上、90回以下である確率を求めよ。

【解】

1の目が出る回数をXとすると、Xは二項分布にしたがう。

よって、平均値m、標準偏差σ

  

n=480nは大きいので、二項分布は正規分布とみなすことができる。

  

とおくと、Zは標準正規分布N(0,1)にしたがう。

  

したがって、求める確率は

  

(解答終了)


問2 次の問いに答えよ。

(1) 中学1年生のツベルクリン反応陰性者の比率は13%であるという。中学1年生から無作為に300人を抽出して調べたとき、その中に30人以上50人以下の陰性者のいる確率を求めよ。

(2) ある伝染病の死亡率は20%であるという。100人の患者のうちに30人以上の死亡者の出る確率を求めよ。

【解】

(1) 陰性患者の数をXとし、Xは二項分布B(300,0.13)にしたがうものと考えると、

  

nが大きいとき、B(300,0.13)は正規分布N(39,5.8²)とみなすことができる。

  

とおくと、これは標準正規分布N(0,1)にしたがう。

  

よって、

  

したがって、約91%

(2) 伝染病の死亡者数をXとし、Xは二項分布B(100,0.2)にしたがうものと考えると、

  

nが大きいとき、二項分布B(100,0.2)は正規分布N(20,4²)とみなせる。

そこで、

  

とすると、Zは標準正規分布B(0,1)にしたがう。

  

よって

  

(解答終了)

ちなみに、二項分布B(100,0.2)と正規分布N(20,4²)は以下の通り。


statics-graph-11-01.png

両者がよく一致していることがわかると思う。



第10回 正規分布2 [高校の統計]

第10回 正規分布2


標準正規分布

平均m、分散σ²の正規分布をであらわす。

確率密度関数f(x)
  statics-10-01.png

だから、

  

とおけば、
  statics-10-02.png

だから、確率変数z

  

に従う。

これは、(1)のm=0σ²=1とした形になっているから、平均0、分散1の正規分布である。これを標準正規分布という。

(2)で定義される変換を標準化変換という。

また、

   

である。


seiki-06.png

seiki-hyou.png


問1 確率変数Xが正規分布N(30,4²)に従うとき、

次の確率を求めよ。

  

【解】

とおくと、zN(0,1)にしたがう。


(1) x=30のときz=0x=34のときz=1

よって、

  


statics-graph-10-02.png

(2) x=24のときz=−1.5x=36のときz=1.5

よって、

  


statics-graph-10-03.png

(3) x=34のときz=1x=38のときz=2

よって、

  


statics-graph-10-04.png

(4) x=24のとき、z=-1.5。よって、

   


statics-graph-10-05.png

(註) 標準正規分布曲線はy軸に関して対称だからP(Z≦−1.5)=P(Z≧1.5)。したがって、

  

P(0≦Z≦1.5)はハッチングを施した部分。

(解答終了)


問2 ある高等学校3年生男子300人の身長を測定したら、平均値165cm、標準偏差5cmで、正規分布に近い分布をしていた。

(1) 身長が160cm、170cm未満である生徒はおよそ何人か。

(2) 身長が173cm以上の生徒はおよそ何人か。

【解】

身長をXcmとすると、確率変数

  

は正規分布N(0,1)にしたがう。

(1)

  

正規分布表より

  

よって、求めるべき人数は

300×0.6826=204.78≒205(人)


(2)

  

だから、

  

ゆえに、求める人数は

300×0.0548=16.44≒16(人)

(解答終了)

問3 500人の生徒にテスト(100点満点)を行ったところ、その成績は、平均65点、標準偏差10点で、正規分布に近い分布をしていた。

(1) 成績が55点以上、75点以下の生徒はおよそ何人か。

(2) 成績が50点以下の生徒はおよそ何人か。

(3) 上から100番以内に入るためには、およそ何点以上とればいいか。

【解】

テストの得点をXとすると、

  

は正規分布N(0,1)にしたがう。

(1)

  

したがって、

500×0.6826=341.3≒341(人)

(2)

   

したがって、

500×0.1668=83.4≒83(人)

(3) 100番は、全体の上から100÷500=0.2にあたる。

N(z)=0.5−0.2=0.3になるz≒0.84

z=0.84に該当する得点をxとすると

  

したがって、74点とればよい。

(解答終了)



ちなみに、55点、75点の偏差値は40、60。

50点の偏差値は35、74の偏差値は59です。

  



第9回 正規分布1 [高校の統計]

第9回 正規分布1


§1 正規分布

1個のサイコロをn回振って、1の目が出る回数をXとすると、Xは2項分布に従う。

nn=10,20,30,40,50と変化させ、1の目のr回出る確率

  

を計算した結果を下図に示す。

seiki-01.png

nが大きくなるにつれて、折れ線グラフが次第に平均を中心とする左右対称な正規分布曲線

  

に近づいてゆく(ラプラスの定理、中心極限定理)。

seiki-02.png


seiki-06.png正規分布

  

を確率密度関数とする確率分布を正規分布という。

ここで、mは平均値、σは標準偏差、σ²は分散で、この分布をであらわす。

特に、m=0σ=1のとき、N(0,1)標準正規分布という。


標準正規分布の確率密度関数は
  

である。

  

とおくと、

  

であり、このI(λ)確率積分という。


statics-tab-09-01.pngλの種々の値に対するI(λ)の値の表(正規分布表)の概略表を右に示す。


この表によると

  statics-09-01.png

したがって変量Xの値が

  m−σm+σの値にある確率は約0.6826

  m−2σm+2σの値にある確率は約0.9544

  m−3σm+3σの値にある確率は約0.9974

である。

§2 正規分布の性質


確率変数Xが正規分布に従うとき、正規分布には次の性質がある。

  statics-09-02.png  


また、

(4) Xが区間[a,b]に入る確率は

  

である。

問 N(10,4)においてを求めよ。

【考え方】

この計算をするためには、正規分布N(10,4)を標準正規分布に変換して計算をしなければならない。

そこで、

  

とおく。

このようにおくと

  

たとえば、Xが区間[a,b]に入る確率を求める場合、x=ax=bに対応するので、

  

となり、正規分布表を利用することができる。


【解】

正規分布N(10,4)だから、平均値m=10、分散σ²=4だから、標準偏差σ=2

  

とおくと、

  statics-09-03.png

(解答終了)


求めるのは、下図の斜線部であることに注意!!


seiki-03.png

seiki-04.png表計算ソフトを使って答えを求めるならば、たとえば、次のようにすればよい。


関数NORMDISTの書式は、たとえば、

  NORMDIST(数値、平均、標準偏差)

である。


seiki-05.pngこの問題の場合、

  NORMDIST13102)

となる。

便利な時代になったものである。

正規分布表の使い方、見方がどうしてもわからない人は、表計算ソフトのNORMDIST関数を使ってもよい。


余談になるが、お馴染みの偏差値は

  

だから、X=13の偏差値は

  

となり、正規分布に従っているならば、上位約7%に入っていることになる。

偏差値70は約上位5%で、偏差値80は約0.1%である。


第8回 チェビシェフの不等式と大数の法則 [高校の統計]

第8回 チェビシェフの不等式と大数の法則


チェビシェフの定理(チェビシェフの不等式)

確率変数Xの平均、標準偏差をそれぞれmσであるとすると、次の不等式が成り立つ。

  statics-08-01.png

ただし、kは任意の正の数とする。

これをチェビシェフの不等式という。

【証明】

確率変数Xの値がであるときの確率をそれぞれとすると、

  

そこで、に属するグループと、にわけると
  

そして、

  

(証明終了)

ベルヌーイの大数の法則

1回の試行において事象Aの起こる確率をpとし、n回の試行において事象Aの起こった回数をrとすると、任意の正数εに対して

  

である。

【証明】

Aの起こる確率分布は2項分布だから、平均、標準偏差は

  

チェビシェフの不等式

  

に代入すると、

  

それで、

  

よって、

  

εは任意の正数だから

  

とおくことができ、

  

したがって、

  

p.qεは正の定数だから

  

したがって、

  

である。

(証明終了)

 

n個の値の算術平均(相加平均)をmとし、標準偏差をsとするとき、これらのn個の内の不等式

  


  

よりも多い」

という定理を用い、ある学級の生徒数は280人で、その平均点は62点、標準偏差は4点であるという情報だけから54点と70点の何人より多く、また、50点と74点の間にあるものは何人より多いか判断せよ。

【解】

54≦x≦70のとき、m=62s=4だからk=2

したがって、

  

よって、210人より多い。

50≦x≦74のとき、k=3だから

  

したがって、248人より多い。

(解答終了)

 

得点を確率変数Xとする。Xの分布が正規分布に従っているとすると、

  

とおくと、Zは標準正規分布N(0,1)に従う。

  

だから、

  

したがって、54≦x≦74の区間にいる生徒数は

  

となり、約267人になる。

同様の計算をすると、50点と74点の区間にいる生徒数は279人となり、ほぼ全員、この区間に収まることになる。

ちなみに、70点は偏差値70、74点は偏差値80である。

statics-graph-08-01.png

第7回 平均値と分散の公式 [高校の統計]

第7回 平均値と分散の公式



確率変数が2つの場合を考える。

確率変数Xが値をとり、Yが値をとるとする。

これらがそれぞれの値をとる確率を

  

とする。

このとき、

  

Xの周辺の確率といい、

  

Yの周辺の確率という。

 


§1 期待値の公式


期待値の公式(定理)

【略証】

(1)

  


(2)

  


(3)

  

(4) XYは独立だから、乗法定理から

  

したがって、
  

(証明終了)


問1 硬貨とさいころを同時に投げる試行で、硬貨に表が出たら2、裏が出たら1を対応させる確率変数をXとし、さいころに出た目の数を確率変数Yとする。確率変数XYの値を求めよ。

【解】
  statics-07-05.png

(解答終了)



問2 大・小2個のさいころを同時にふる試行で、大きいさいころの目の数を10の位、小さいさいころの目の数を1の位として、2桁の数字を作るとき、その期待値を求めよ。

【解】

大きなさいころの目の数をX、小さいさいころの目の数をYとすると、

  
また、こうして作られた二桁の数は10X+Yだから、この平均値は

  

(解答終了)

 


§2 分散の公式


2乗平均と分散

【略証】

  

(証明終了)

分散の公式

  

【証明】

(1)

  


(2) 

   

(3)

  

XYは互いに独立な変数なので、

  

したがって、

  

(証明終わり)

第6回 独立試行の確率と2項分布の問題 [高校の統計]

第6回 独立試行の確率と2項分布の問題


問題1 ❍、☓で答える6つの問題が与えられている。いまこの解答にするのに何も考えずにでたらめに❍、×をつけるとき、そのうちの正解数をXとする。

(1) X≧3になる確率を求めよ。

(2) Xの平均値(期待値)と標準偏差を求めよ。

【解】

正解数の分布は2項分布


(1)

  


(2) 平均値mと標準偏差σ

  

(解答終了)

 


問題2 日本人の血液型の10人に3人の割合がO型である。5人の日本人を選んだとき、そのうちのO型の人数をXとする。

(1) Xはどのような分布に従うか。

(2) Xの期待値と標準偏差を求めよ。

(3) 南方系のある人種から5人を選んだとき、そのうちの4人が O型であった。この人種が日本人よりもOがたが多いと判定したときの危険率を求めよ。

【解】

(1) 2項分布B(5,0.3)に従う。

(2) 平均値をm、標準偏差をσとすると、

  


(3) 日本人とO型の割合が等しいと仮定する。

つまり、p=0.3として、P(X≧4)の確率を計算すると

  

よって、危険率は3%である。

(解答終了)


危険率については検定であらためて説明することにするが、

「南方系のある人種の人たちに占めるO型のヒトの割合が日本人のそれと等しい」という仮説を立てると、5人中4人がO型である確率は0.03で非常にまれなことが起きているということになる。



問題3 さいころを50回投げるとき、1の目が出る回数をXとする。

(1) Xがいくらのとき確率は最大になるか。

(2) Xの平均値を求め、(1)で求めた値と比較せよ。

【解】

1の目が出る回数は2項分布に従う。


(1) X=kのとき確率が最大とすると、

  

よって、8回のとき最大。

(2) 平均値(期待値)は

  

8は平均50/6に最も近い整数である。

(解答終了)


第5回 独立試行と二項分布 [高校の統計]

第5回 独立試行と二項分布


§1 独立試行の確率

1回の試行で事象Aの起こる確率をpとすると、この試行をn回繰り返した場合、事象Ar回起こる確率

  

である。

 


問1 袋の中に赤球1個、白球4個が入っている。この中から1個取り出して、もとに戻すことを3回繰り返す。この場合、赤の出る回数をXとして、Xの確率分布を求めよ。

【解】

取り出した球を戻すので、赤球の出る確率p=1/5、白球の出る確率q=4/5

この問題の場合n=3

Xの取りうる値は0123

X=rの時の確率をP(X=r)と書くことにすると、
  statics-05-01.png

したがって、確率分布は次のようになる。

  statics-tab-05-01.png

 (解答終了)


この問題には出ていないけれど、赤球の出る回数rの期待値m

  

である。


§2 2項分布


変量X01、・・・・・・、nの値をとり、それらの値をとる確率が

  

で与えられる確率分布を2項分布という。

その平均・期待値m、標準偏差σ

  

である。

(2)、(3)を使えば、問1の平均値、標準偏差は

  

と、複雑な計算をすることなく、すぐに求めることができる。

 


【(2)の証明】

  

2項定理より

  statics-05-02.png

xで微分すると、
  statics-05-03.png

x=1を代入すると、

  

p+q=1だから

  

(証明終わり)

【(3)の証明】

  

また、

  

よって、
  

ここで、①の両辺をxで微分すると、

  statics-05-06.png

x=1を上式に代入すると、

  statics-05-07.png

これを②に代入すると、

  

(証明終わり)


問2 10%の不合格品を含む同じ製品の一山がある。この中から任意に4個を取り出すとき、その中に含まれる不良品の数Xで確率分布の表で示し、Xの平均値、標準偏差を求めよ。

【解】

X=rである確率

  statics-05-08.png

したがって、確率分布表は

statics-tab-05-02.png

  

したがって、平均値=0.4、標準偏差=0.6

(解答終了)



問題 1回の試行で事象Aの起こる確率がpであるとき、n回の試行の内、事象Aが最も起こりやすい回数を求めよ。

【解】

r=kのとき、確率が最大になるとすると、

  

したがって、

  

そこで、①より
  statics-05-09.png

②に対しては、③のkk+1と置き換えて、不等号の向きを入れ替えると、

  

③と④より、

  

を満たす整数kのとき、事象Aは最も起こりやすい。

(解答終了)



問3 1個のさいころを40回投げるとき、1つの目が何回出る確率が最も高いか。

【解】

n=40p=1/6

(4)より
  statics-05-10.png

よって、6回のとき確率は最大になる。

(解答終了)


第4回 確率分布2 [高校の統計]

第4回 確率分布2


分布関数と確率密度関数


変数Xが連続な値をとるとき、X連続型の確率変数といい、X<xである確率P(X<x)

  

で与えられるとき、F(x)分布関数といい、その導関数

  

x確率密度関数という。

  

だから

  

で、xがある範囲にに存在する確率は、y=f(x)のグラフのその範囲の面積と等しい。

変数Xの変域をa≦x≦bとし、確率密度関数をf(x)、平均をm、分散をσ²とすると、

  s-siki-04-01.png

である。

  

となり、

  

と書くと、分散V(x)

  

になる。

 


問題1 確率変数Xの従う確率分布の密度関数f(x)

  s-siki-04-08.png

であるとき、次の問いに答えよ。

(1) P(3≦X≦5)の値を求めよ。

(2) P(7≦X)の値を求めよ。

(3) Xの平均E(X)を求めよ。

(4) Xの標準偏差D(X)を求めよ。

【解】


(解答終了)


問題2 あるバスの停留所の発車時刻は毎時0分、15分、35分の3回である。この発車時刻をまったく知らない人が、停留場へ来て待たされる時間の期待値を求めよ。

【解】

この人が停留所に来る時刻をx分とすると、待ち時間t

  

確率密度f(x)は一様分布と考えられるので、

  

とすると、

  

したがって待ち時間の平均・期待値E(t)
  

(解答終了)



問題3 連続的な値をとる確率変数xがあって、その確率密度がAを定数として、

  s-siki-04-05.png

とするとき、となるようなaの値を求めよ。

【解】
  s-siki-04-06.png

したがって、

  s-siki-04-09.png

a=0.2とすると、

  

よって、a=0.2

(解答終了)


なのですが、a=0.2であることに気づく人はどれだけいるのだろう。

  

試験会場で、これはチョット気づかないだろう。

条件より0<a<0.5で、

  

だから、a=0.2と気づけということか。

とおくと、

  

s-tab-04-01.pngだから、ニュートン法

  

を用い、x₀=0として計算すると、次のようになる。

計算の初期値としてx₀=0.232を選べば、1、2回計算すれば、a=0.2であることに気づくのではないか。



問題4 半径aの円Oの周上の1点Aから任意の方向に弦を引くとき、それらの弦の長さの平均を求めよ。

また、弦の長さが半径より大となる確率を求めよ。

【解】

statics-fig-01.png円の中心Oを原点、A(−a,0)B(a,0)とし、周上の点をPとする。

APx軸のなす角をθ(−π/2≦θ≦θ/2)とすると、弦APの長さl

  

θを確率変数とし、一様分布

  

と仮定すると、

  

したがって、弦の長さの平均は
  s-siki-04-07.png

AP>aになるのは、

  

したがって、弦の長さが半径より大きい確率は

  

(解答終了)


第3回 確率変数と確率分布 [高校の統計]

第3回 確率変数と確率分布


§1 確率変数と確率分布


1〜6の目をもつサイコロを振り、出た目をXとすると、Xの目が出る確率は、次のようになる。

  s-tab-03-01.png

たとえば、X=1と、Xの値が決まれば、その確率

  

と定められる。

より一般的に書くと、次のようになる。

  s-tab-03-02.png

の値をとる変数Xに対して、の確率が与えられているとき、Xを確率変数という。また、確率変数Xとそれに対応する確率との対応関係を確率分布という。


確率変数のとる値がであるとし、それに対応する確率をとするとき、

  

である。

 


問1 1枚の硬貨を2回投げるとき、表の出る回数を確率変数Xとして、Xの確率分布を求めよ。

【解】

(1回目の結果、2回目の結果)と書くことにすると、全事象は、(裏,裏)、(裏,表)、(表,裏)、(表,表)の4通り。

表が0回出るのは、(裏,裏)の1通り。

したがって、表が0回出る確率は

  

表が1回出るのは、(裏,表)、(表,裏)の2通り。

したがって、表が1回出る確率は

  

表が2回出るのは(表,表)の1通り。

したがって、表が2回出る確率は

  

よって、確率分布は次の通り。

   s-tab-03-03.png

(解答終了)


問2 10本のくじがあって、そのうち、2本が当たりくじとする。3本引いてあたった回数をXとするとき、X本当たる確率を求めよ。

【解】

  

したがって、

  s-tab-03-04.png


(解答終了)


§2 期待値(平均値)と分散、標準偏差


確率変数Xの値をとり、それに対応する確率がであるとき、

  

E(x)mなどであらわし、確率変数の平均値、期待値という。

また、

  

V(x)σ²で表し、確率変数の分散という。

また、分散の正の平方根

  

を標準偏差という。

問3 白球4個と赤球3個が入っている袋から2個の珠を同時に取り出すとき、その中に含まれる白球の個数の確率分布を求めよ。また、期待値を求めよ。

【解】
s-tab-03-05.png取りざされる白球の個数をk=0,1,2)に対応する確率をとする。

  

したがって、平均値m

  

(解答終了)

ちなみに、分散Vと標準偏差σ

  

(解答終了)


問題 1と書いたカードが1枚、2と書いたカードが2枚、・・・・・・、nと書いたカードがn枚ある。この中から1枚取り出すとき、カードの示す数Xを確率変数とする。

(1) X=kである確率を求めよ。

(2) Xの平均値を求めよ。

【解】

(1) カードの数は全部で

  

したがって、

  


(2) Xの平均値m

  

(解答終了)


追加問題


この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。