●このページで解説する内容
代表値:データの分布の中心を表現する数値
平均値:データの合計値をデータの個数で割った値
中央値(メジアン):データを順番に並べたとき、真ん中にあるデータの値
最頻値(モード):データの中で、最も出現頻度が高いデータの値
代表値:データの分布の中心を表現する数値
平均値:データの合計値をデータの個数で割った値
中央値(メジアン):データを順番に並べたとき、真ん中にあるデータの値
最頻値(モード):データの中で、最も出現頻度が高いデータの値
代表値(平均値/中央値/最頻値)
代表値とは、データの分布の中心を表現する数値のことです。
例えば、「平均値」も代表値のひとつです。その他、一般的な代表値には「中央値(メジアン)」や「最頻値(モード)」があります。
平均値
平均値とは、データの合計値をデータの個数で割った値です。
例えば、「Aさん」から「Jさん」までの合計10名のテストの点数が、次の表であった場合を考えます。
氏名 | 点数\((x_i)\) |
---|---|
Aさん | 60 |
Bさん | 90 |
Cさん | 100 |
Dさん | 70 |
Eさん | 60 |
Fさん | 60 |
Gさん | 40 |
Hさん | 80 |
Iさん | 70 |
Jさん | 30 |
合計 | 660 |
このとき、データの合計値は、点数の合計「660点」になります。さらに、データの個数は、テストを受けた人数「10名」と等しくなります。
したがって、点数の平均値は次の計算で、「66」点と求めることができます。
中央値(メジアン)
中央値(メジアン)とは、データを順番に並べたとき、真ん中にあるデータの値です。
データの個数が「奇数」の場合は、真ん中のデータの値が中央値になります。一方、データの個数が「偶数」である場合は、真ん中の2つのデータの平均値が中央値になります。
[データの個数が奇数の場合]
中央値=真ん中のデータの値
[データの個数が偶数の場合]
中央値=真ん中の2つのデータの平均値
中央値=真ん中のデータの値
[データの個数が偶数の場合]
中央値=真ん中の2つのデータの平均値
先ほどと同様にテストの点数で考えます。点数を降順(大きい点数→小さい点数)に並べ替えると次のようになります。
氏名 | 点数\((x_i)\) |
---|---|
Cさん | 100 |
Bさん | 90 |
Hさん | 80 |
Iさん | 70 |
Dさん | 70 |
Fさん | 60 |
Eさん | 60 |
Aさん | 60 |
Gさん | 40 |
Jさん | 30 |
今回は、データの個数が偶数(10名)なので、真ん中の値である、Dさんの「70点」とFさんの「60点」の平均値である「65点」が中央値となります。
最頻値(モード)
最頻値(モード)とは、データの内で最も出現頻度が高いデータの値のことです。
先ほどのテストの例で、点数毎の人数を整理してみます。
点数 | 人数 | 氏名 |
---|---|---|
100 | 1 | Cさん |
90 | 1 | Bさん |
80 | 1 | Hさん |
70 | 2 | Dさん Iさん |
60 | 3 | Aさん Eさん Fさん |
50 | 0 | ー |
40 | 1 | Gさん |
30 | 1 | Jさん |
20 | 0 | ー |
10 | 0 | ー |
0 | 0 | ー |
このとき、最も出現頻度の高い点数は、「60点」の3名です。つまり、最頻値は「60点」になります。
【まとめ】代表値(平均値/中央値/最頻値)
それでは最後におさらいをしておきましょう!
用語 | 説明 |
---|---|
代表値 | データの分布の中心を表現する数値 |
平均値 | データの合計値をデータの個数で割った値 |
中央値 (メジアン) | データを順番に並べたとき、真ん中にあるデータの値 ・データの個数が奇数:真ん中のデータ値 ・データの個数が偶数:真ん中の2つのデータの平均値 |
最頻値 (モード) | データの中で、最も出現頻度が高いデータの値 |