「完全独習統計学入門」小島寛之4

無限母集団には、各データが無限個づつ存在していて、その「観測されやすさ」はそれぞれ異なっている。
ランダム・サンプリングの仮定とは「十分な回数の観測を行ってヒストグラムを作成すると、母集団の分布が再現される」という仮定である。
母集団の平均値μを母平均といい、次の方法で計算される。μ=データの数値×相対度数の和

母集団のデータの散らばり具合を表す統計量が、母標準偏差である。母標準偏差は次のプロセスで求められる。

偏差=(データの数値)-(母平均μ)
母分散σ^2=|(偏差の2乗) * (池の広さ)|の合計
母標準偏差σ=sqrt(母分散σ^2)

チェビシェフの不等式: 一般にμからσ×k以上離れるデータは全体の1/k^2しかない:

大数の法則: 1つの母集団からn個のデータを観測しその標本平均 $\bar{x}$ を作る。このとき、nが大きければ大きいほど、標本平均は母平均μに近い数値をとる。:

正規母集団の母平均をμ、母標準偏差をσとするとき、そこから観測されるデータxのn個に対する標本平均 $\bar{x}$ の(それらを集めたものを別の母集団ととらえたときの)分布は、やはり正規分布である。 $\bar{x}$ の分布の平均値はμのままだが、標準偏差は $\frac{\sigma}{\sqrt{n}}$ となる。(母集団に比べて√n分の1に縮む)

母平均がμで母標準偏差がσの正規分布からのデータn個の標本平均 $\bar{x}$ に対する95パーセント予言的中区間は、(μ-1.96 $\frac{\sigma}{\sqrt{n}}$ )以上(μ+1.96 $\frac{\sigma}{\sqrt{n}}$ )以下。