資料の散らばり

ある集団の資料について,その集団の特徴を中心的なある値で表そうとする考え方があります。この値を代表値といい,次のようなものがあります。

1.平均(平均値)ふつうは,平均といいます。
平均には,相加(算術)平均,相乗平均,調和平均があります。代表値としては相加(算術)平均が最もよく使われます。
2.中央値(メジアン)中位数ともいいます。
データを小さい方から大きい方に順に並べたとき,その真ん中の値のことです。
3.最頻値(モード)並数ともいいます。
データの中で最も多く現れる値のことです。

集団の傾向を表すには,代表値(主に平均値)に加えて,その資料の散らばりを見る必要があります。

例えば,次の2つの班の記録を比べてみます。

ソフトボール投げの記録(単位m)
A班26 28 28 30 30
B班16 24 30 34 38

2つの班の平均値はともに28.4mですが,記録の散らばり方は違っています。このような事実から,資料の散らばり方に着目しなければ集団の傾向を知ることはできないことがわかります。
資料の散らばりのとらえ方の最も素朴な方法は,資料を1つの数直線の上に並べてみることです。

このようにすると,散らばりのようすや集団の中における個々の位置がとらえやすくなります。
ただ,資料が多くなるにしたがって,記録するのが大変になります。そこで,次の方法として,度数分布表や柱状グラフが必要になってきます。