スポンサーリンク

34-06.分散/標準偏差/偏差値

スポンサーリンク
分散、標準偏差、偏差値 ITパスポート
●このページで解説する内容
・分散:平均値からのデータのばらつきを表す値
・標準偏差:平均値からのデータのばらつきを表す値、分散の平方根で計算
・偏差値:テストの成績が、受験者全体のどの程度かを表す値
スポンサーリンク

分散/標準偏差/偏差値とは?

データのばらつきを表現する値として、「分散」「標準偏差」「偏差値」について解説します。

分散

分散とは、平均値からのデータのばらつきを表す値です。

データのばらつき

分散が小さいほど、平均値にデータが集まっていることを表します。一方、分散が大きいほど、平均値からデータがばらついていることになります。

分散は、次の計算式で求めることができます。

分散の計算式

この計算式の意味を確認していきます。

分散の計算式の意味
①:平均値と各データの差を計算し、2乗する
②:①の値の合計を計算
③:②の値をデータ数(n)で割る

つまり、分散は「平均値と各データの差分を2乗した値の平均値」の計算に等しくなります。

次のテストの点数を例に、分散を計算してみます。

氏名点数\((x^i)\)①:\((x^i-\bar x)^2\)
Aさん6036
Bさん90576
Cさん1001156
Dさん7016
Eさん6036
Fさん6036
Gさん40676
Hさん80196
Iさん7016
Jさん301296
合計660②:4040
平均66③:404
分散\((V)\)-404

したがって、分散は「404」となることが分かります。

標準偏差

標準偏差データのばらつきを表す値です。

分散と同様、標準偏差が小さいほど、データが平均値に集まっていることになります。逆に標準偏差が大きいほど、平均値からデータがばらついていることを表します。

標準偏差は、分散の平方根(ルート)を計算した値になります。

標準偏差の計算式

標準偏差の計算式の意味を確認していきましょう。

標準偏差の計算式の意味
①:平均値と各データの差を計算し、2乗する
②:①の値の合計を計算
③:②の値をデータ数(n)で割る
④:③の平方根をとる

テストの点数を例に、標準偏差を計算してみます。

氏名点数\((x^i)\)①:\((x^i-\bar x)^2\)
Aさん6036
Bさん90576
Cさん1001156
Dさん7016
Eさん6036
Fさん6036
Gさん40676
Hさん80196
Iさん7016
Jさん301296
合計660②:4040
平均66③:404
分散\((V)\)-404
標準偏差\((σ)\)
(平方根)
-④:20.1

したがって、標準偏差は「20.1」と計算することができました。

[補足]分散と標準偏差の単位

分散も標準偏差もデータのばらつきを表す指標ですが、分散と標準偏差では、単位の次元が異なります。

具体的には、分散データの単位の2乗標準偏差の単位は、元データと同じ(1乗)になります。この理由は、分散がデータの差分を2乗して計算することに対し、標準偏差は分散の平方根をとるためです。

標準偏差は、元データとの単位の次元が等しいため、ばらつきを表現する指標として多く利用されます。

偏差値

偏差値とは、自分のテストの点数が、受験者全体のどの程度かを表す値です。

偏差値「50」を閾値に、平均点よりも高い、低いが決定します。

偏差値>50:平均点より高い
偏差値=50:平均点と同じ
偏差値<50:平均点より低い

偏差値は次の計算で求めることができます。

偏差値の計算式

偏差値の計算式を確認していきます。

偏差値の計算式の意味
①:点数と平均点の差分を計算
②:①を標準偏差で割る
③:②に10を掛け、50を足す

実際に、偏差値を計算してみましょう。

氏名点数\((x^i)\)①:\((x^i-\bar x)\)②:\(①/σ\)偏差値
③:\(②×10+50\)
Aさん60-6-0.347
Bさん90241.1961.9
Cさん100341.6966.9
Dさん7040.252
Eさん60-6-0.347
Fさん60-6-0.347
Gさん40-26-1.2937.1
Hさん80140.757
Iさん7040.252
Jさん30-36-1.7932.1
合計660---
平均66---
分散\((V)\)404---
標準偏差\((σ)\)20.1---

テストの平均点は「66点」なので、「点数が66点より高いの人は偏差値が50より高く」、「66点より低い人は、偏差値が50より低く」なると分かります。

スポンサーリンク

【まとめ】分散/偏差/標準偏差

それでは最後におさらいをしておきましょう!

用語説明
分散平均値からのデータのばらつきを表す値
\(V={1 \above 1pt n}\sum{_{i=1}^n}(x^i-\bar x)\)
標準偏差平均値からのデータのばらつきを表す値
分散の平方根で計算
\(σ= \sqrt {{1 \above 1pt n}\sum{_{i=1}^n}(x^i-\bar x)}\)
偏差値テストの成績が、受験者全体のどの程度かを表す値
偏差値>50:平均点より高い
偏差値=50:平均点と同じ
偏差値<50:平均点より低い
\(偏差値={x^i-\bar x \above 1pt σ}×10+50\)

コメント

タイトルとURLをコピーしました