●このページで解説する内容
代表値:データの分布の中心を表現する数値
平均値:データの合計値をデータの個数で割った値
中央値(メジアン):データを順番に並べたとき、真ん中にあるデータの値
最頻値(モード):データの中で、最も出現頻度が高いデータの値
代表値:データの分布の中心を表現する数値
平均値:データの合計値をデータの個数で割った値
中央値(メジアン):データを順番に並べたとき、真ん中にあるデータの値
最頻値(モード):データの中で、最も出現頻度が高いデータの値
代表値(平均値/中央値/最頻値)
代表値とは、データの分布の中心を表現する数値のことです。
例えば、「平均値」も代表値のひとつです。その他、一般的な代表値には「中央値(メジアン)」や「最頻値(モード)」があります。
平均値
平均値とは、データの合計値をデータの個数で割った値です。

例えば、「Aさん」から「Jさん」までの合計10名のテストの点数が、次の表であった場合を考えます。
| 氏名 | 点数\((x_i)\) |
|---|---|
| Aさん | 60 |
| Bさん | 90 |
| Cさん | 100 |
| Dさん | 70 |
| Eさん | 60 |
| Fさん | 60 |
| Gさん | 40 |
| Hさん | 80 |
| Iさん | 70 |
| Jさん | 30 |
| 合計 | 660 |
このとき、データの合計値は、点数の合計「660点」になります。さらに、データの個数は、テストを受けた人数「10名」と等しくなります。
したがって、点数の平均値は次の計算で、「66」点と求めることができます。

中央値(メジアン)
中央値(メジアン)とは、データを順番に並べたとき、真ん中にあるデータの値です。
データの個数が「奇数」の場合は、真ん中のデータの値が中央値になります。一方、データの個数が「偶数」である場合は、真ん中の2つのデータの平均値が中央値になります。
[データの個数が奇数の場合]
中央値=真ん中のデータの値
[データの個数が偶数の場合]
中央値=真ん中の2つのデータの平均値
中央値=真ん中のデータの値
[データの個数が偶数の場合]
中央値=真ん中の2つのデータの平均値
先ほどと同様にテストの点数で考えます。点数を降順(大きい点数→小さい点数)に並べ替えると次のようになります。
| 氏名 | 点数\((x_i)\) |
|---|---|
| Cさん | 100 |
| Bさん | 90 |
| Hさん | 80 |
| Iさん | 70 |
| Dさん | 70 |
| Fさん | 60 |
| Eさん | 60 |
| Aさん | 60 |
| Gさん | 40 |
| Jさん | 30 |
今回は、データの個数が偶数(10名)なので、真ん中の値である、Dさんの「70点」とFさんの「60点」の平均値である「65点」が中央値となります。

最頻値(モード)
最頻値(モード)とは、データの内で最も出現頻度が高いデータの値のことです。
先ほどのテストの例で、点数毎の人数を整理してみます。
| 点数 | 人数 | 氏名 |
|---|---|---|
| 100 | 1 | Cさん |
| 90 | 1 | Bさん |
| 80 | 1 | Hさん |
| 70 | 2 | Dさん Iさん |
| 60 | 3 | Aさん Eさん Fさん |
| 50 | 0 | ー |
| 40 | 1 | Gさん |
| 30 | 1 | Jさん |
| 20 | 0 | ー |
| 10 | 0 | ー |
| 0 | 0 | ー |
このとき、最も出現頻度の高い点数は、「60点」の3名です。つまり、最頻値は「60点」になります。
【まとめ】代表値(平均値/中央値/最頻値)
それでは最後におさらいをしておきましょう!
| 用語 | 説明 |
|---|---|
| 代表値 | データの分布の中心を表現する数値 |
| 平均値 | データの合計値をデータの個数で割った値 |
| 中央値 (メジアン) | データを順番に並べたとき、真ん中にあるデータの値 ・データの個数が奇数:真ん中のデータ値 ・データの個数が偶数:真ん中の2つのデータの平均値 |
| 最頻値 (モード) | データの中で、最も出現頻度が高いデータの値 |


