「完全独習 統計学入門」 小島寛之 1

  1. 生のデータは現実そのままだが、それだけを眺めていても何もわからない
  2. データを縮約する方法にはグラフを作ることと、統計量を求めることの2種類がある
  3. 度数分布表はデータを5〜8程度のグループにわけること。度数分布表によってデータの集中箇所や対称性などのデータの特性が見抜ける。。
  4. ヒストグラムとは度数分布表を棒グラフに直したものである。よりビジュアル的にデータの特徴をつかめる。
度数分布表からの平均値の計算
平均値=階級値 * 相対度数の合計:
ヒストグラムにおける平均値の意味
ヒストグラムをやじろべえとみなしたときの、つりあいの支点:

平均値の性質

  • データは平均値の周辺に分布している
  • 多く表れるデータの平均値への影響力は大きい
  • ヒストグラムが左右対称である場合、その対称軸の通る・が平均値となる
標準偏差(S.D.)
データたちの平均値からの離れ方を二乗平均したもの:

データの特殊性はS.D.を基準とする。平均からS.D.1個前後しか離れていないデータは月並みなデータといえる。平均からS.D.2個を上回って離れるデータは特殊なデータと言える。

データの加工

セットXの全データに一定数aを加えたセットYを作ったとする。

  • セットYの平均はセットXの平均にaを加えたものとなる。
  • セットYの分散と標準偏差はセットXと同じである。

セットXの全データに一定数kをかけたセットYを作ったとする。

  • セットYの平均はセットXの平均にkをかけたものとなる。
  • セットYの分散はセットXの分散にk^2をかけたものとなる
  • セットYの標準偏差はセットXの標準偏差にkをかけたものとなる。

セットXの全データに一定数(-セットXの平均値)を加えて、Xの標準偏差の逆数をかけたセットYを作ったとする。

  1. (-セットXの平均値)を加ると、平均値は0,分散、標準偏差はそのままになる
  2. それにXの標準偏差の逆数をかけると、平均値は0,分散は1、標準偏差も1となる。