「完全独習 統計学入門」 小島寛之4

  • 無限母集団には、各データが無限個づつ存在していて、その「観測されやすさ」はそれぞれ異なっている。
  • ランダム・サンプリングの仮定とは「十分な回数の観測を行ってヒストグラムを作成すると、母集団の分布が再現される」という仮定である。
  • 母集団の平均値μを母平均といい、次の方法で計算される。μ=データの数値×相対度数の和

母集団のデータの散らばり具合を表す統計量が、母標準偏差である。母標準偏差は次のプロセスで求められる。

偏差=(データの数値)-(母平均μ)
母分散σ^2=|(偏差の2乗) * (池の広さ)|の合計
標準偏差σ=sqrt(母分散σ^2)

チェビシェフの不等式
一般にμからσ×k以上離れるデータは全体の1/k^2しかない:
大数の法則
1つの母集団からn個のデータを観測しその標本平均\bar{x}を作る。このとき、nが大きければ大きいほど、標本平均は母平均μに近い数値をとる。:

正規母集団の母平均をμ、母標準偏差をσとするとき、そこから観測されるデータxのn個に対する標本平均\bar{x}の(それらを集めたものを別の母集団ととらえたときの)分布は、やはり正規分布である。\bar{x}の分布の平均値はμのままだが、標準偏差\frac{\sigma}{\sqrt{n}}となる。(母集団に比べて√n分の1に縮む)

母平均がμで母標準偏差がσの正規分布からのデータn個の標本平均\bar{x}に対する95パーセント予言的中区間は、(μ-1.96\frac{\sigma}{\sqrt{n}})以上(μ+1.96\frac{\sigma}{\sqrt{n}})以下。