「わかりやすい統計学」 松原望;6,平均値

平均の統計的性質

モード(最頻値)
最も頻繁に出現する値:
メディアン(中央値)
中心の値:
平均値
加えてデータの個数で割った数(相加平均):

母集団から標本を得らび、標本について平均を取ったものを標本平均と言う。標本平均は母平均(母集団の平均)を示す傾向がある。これを中心的傾向という。全体の一部分が全体の傾向を反映している、ちうこの事実は統計学で重要な発想である。

非対称分布

しかし分布が非対称だとそう単純ではない。
平成3年の貯蓄の平均貯蓄額は1128万円だった。しかし、中央値は740万円であり、最頻値は350(300-400)万円である。

いろいろな分布

正規分布は広くいろいろな現象に見られる。しかも数学的に扱いやすい。

  1. 二つのサイコロの目の和の分布は完全な三角形となる
  2. 宝くじの賞金額の分布は左右対象でない。負の値もでない。
  3. 交通事故・火災・救急入院など一般に偶然かつ希少現象の分布

平均的(確率論的期待値)にいってλ件程度起こるとすると、実際にk件起きる確率は\frac{1}{e^\lambda}\cdot\frac{\lambda^k}{k!}となる。これをポアソン分布と言う。

  1. ある市町村では人口の20%が高齢者である。そこで、5人をランダムに選んだとき、高齢者がk人となる確率は、_5 C _k (0.2)^k (0.8)^{5-k}となる。これを二項分布と言う。

確率分布どおりに値が出たら、どのくらいの値に平均的になるか、というのを確率論的期待値と言ってE(X)とあらわす。