「完全独習 統計学入門」 小島寛之4
- 無限母集団には、各データが無限個づつ存在していて、その「観測されやすさ」はそれぞれ異なっている。
- ランダム・サンプリングの仮定とは「十分な回数の観測を行ってヒストグラムを作成すると、母集団の分布が再現される」という仮定である。
- 母集団の平均値μを母平均といい、次の方法で計算される。μ=データの数値×相対度数の和
母集団のデータの散らばり具合を表す統計量が、母標準偏差である。母標準偏差は次のプロセスで求められる。
偏差=(データの数値)-(母平均μ)
母分散σ^2=|(偏差の2乗) * (池の広さ)|の合計
母標準偏差σ=sqrt(母分散σ^2)
- チェビシェフの不等式
- 一般にμからσ×k以上離れるデータは全体の1/k^2しかない:
- 大数の法則
- 1つの母集団からn個のデータを観測しその標本平均を作る。このとき、nが大きければ大きいほど、標本平均は母平均μに近い数値をとる。:
正規母集団の母平均をμ、母標準偏差をσとするとき、そこから観測されるデータxのn個に対する標本平均の(それらを集めたものを別の母集団ととらえたときの)分布は、やはり正規分布である。の分布の平均値はμのままだが、標準偏差はとなる。(母集団に比べて√n分の1に縮む)
母平均がμで母標準偏差がσの正規分布からのデータn個の標本平均に対する95パーセント予言的中区間は、(μ-1.96)以上(μ+1.96)以下。