分散・標準偏差を使いこなす
前回のレッスンでは、ヒストグラムの階級幅を動かし、シーソーで平均と中央値の違いを体感しました。 今回は同じ道具を「読む」から「計算して使う」に進めます。統計検定2級の頻出地帯です。
分散の計算、2つの顔
定義通りの計算は「偏差→2乗→平均」でした:
実務と試験で多用するのは、展開して得られるもう1つの顔です:
「2乗の平均」と「平均の2乗」の差——この形はこの先、確率変数の分散 として何度も再登場します。ここが初出です。
データを一様に変換すると何が起きるか
全員の点数を 倍して 点足す()と:
- 平均: (両方の影響を受ける)
- 標準偏差: ( は散らばりに無関係)
偏差値はこの変換の応用です。平均50・標準偏差10になるように
とデータを引き伸ばしたものさしの規格化でした。中身の は「平均から標準偏差何個分離れているか」——第5章でz値という名前で主役になります。
箱ひげ図と四分位範囲
散らばりの指標は標準偏差だけではありません。データを4等分する四分位数を使うと:
- 四分位範囲 IQR = 第3四分位数 − 第1四分位数(真ん中50%の幅)
- 箱ひげ図 = 中央値・四分位数・外れ値を1つの図に圧縮した表現
外れ値に引きずられにくいのが強みで、平均・標準偏差ペアと使い分けます(歪んだ分布では中央値・IQRが安全)。
操作チャレンジ — 図で解く3問
計算式を、手の感覚と一致させましょう。
問1 / 3
赤い点をドラッグして、5個のデータの平均をちょうど60にしてください。
データ = [45, 55, 60, 70, 50.00] / 平均 = 56.00