34-04.代表値(平均値/中央値/最頻値)

スポンサーリンク
●このページで解説する内容
代表値:データの分布の中心を表現する数値
平均値:データの合計値をデータの個数で割った値
中央値(メジアン):データを順番に並べたとき、真ん中にあるデータの値
最頻値(モード):データの中で、最も出現頻度が高いデータの値
スポンサーリンク

代表値(平均値/中央値/最頻値)

代表値とは、データの分布の中心を表現する数値のことです。

例えば、「平均値」代表値のひとつです。その他、一般的な代表値には「中央値(メジアン)」や「最頻値(モード)」があります。

平均値

平均値とは、データの合計値をデータの個数で割った値です。

平均値の公式

例えば、「Aさん」から「Jさん」までの合計10名のテストの点数が、次の表であった場合を考えます。

氏名点数\((x_i)\)
Aさん60
Bさん90
Cさん100
Dさん70
Eさん60
Fさん60
Gさん40
Hさん80
Iさん70
Jさん30
合計660


このとき、データの合計値は、点数の合計「660点」になります。さらに、データの個数は、テストを受けた人数「10名」と等しくなります。

したがって、点数の平均値は次の計算で、「66」点と求めることができます。

平均値の計算

中央値(メジアン)

中央値(メジアン)とは、データを順番に並べたとき、真ん中にあるデータの値です。

データの個数が「奇数」の場合は、真ん中のデータの値が中央値になります。一方、データの個数が「偶数」である場合は、真ん中の2つのデータの平均値が中央値になります。

[データの個数が奇数の場合]
 中央値=真ん中のデータの値
[データの個数が偶数の場合]
 中央値=真ん中の2つのデータの平均値
 

先ほどと同様にテストの点数で考えます。点数を降順(大きい点数→小さい点数)に並べ替えると次のようになります。

氏名点数\((x_i)\)
Cさん100
Bさん90
Hさん80
Iさん70
Dさん70
Fさん60
Eさん60
Aさん60
Gさん40
Jさん30

今回は、データの個数が偶数(10名)なので、真ん中の値である、Dさんの「70点」とFさんの「60点」の平均値である「65点」が中央値となります。

中央値の計算

最頻値(モード)

最頻値(モード)とは、データの内で最も出現頻度が高いデータの値のことです。

先ほどのテストの例で、点数毎の人数を整理してみます。

点数人数氏名
1001Cさん
901Bさん
801Hさん
702Dさん
Iさん
603Aさん
Eさん
Fさん
500
401Gさん
301Jさん
200
100
00

このとき、最も出現頻度の高い点数は、「60点」の3名です。つまり、最頻値は「60点」になります。

スポンサーリンク

【まとめ】代表値(平均値/中央値/最頻値)

それでは最後におさらいをしておきましょう!

用語説明
代表値データの分布の中心を表現する数値
平均値データの合計値をデータの個数で割った値
中央値
(メジアン)
データを順番に並べたとき、真ん中にあるデータの値
・データの個数が奇数:真ん中のデータ値
・データの個数が偶数:真ん中の2つのデータの平均値
最頻値
(モード)
データの中で、最も出現頻度が高いデータの値
スポンサーリンク
ぽんぱす をシェア
スポンサーリンク
ぽんぱす
タイトルとURLをコピーしました