統計・解析 | データ解析の代表値 〜実は怖い平均値〜

POST:2018.07.12

値について

データを見る時に使う値として代表的なものが3つあります。

・平均値
・中央値
・最頻値

です。

3つとも知ってる!
何となくならわかる・・・・
全然わからない!

色々だろうと思います。

実は管理人、代表値についてそこまで気にしたこともなかったのです。
平均値ならわかるし!!
くらいなものでした。

平均値とは

なにせ、平均値というのは概念としてとてもわかりやすい。

辞書で調べると、平均値とは・・・
「データの合計値をデータの個数で割った値のこと」

何ともわかりやすい!

わかりやすい上に汎用性も高いので、様々な場面で使われます。
平均所得、平均体重、平均回数、平均年齢・・・・

挙げていけばキリがないくらいあります。

「平均」の落とし穴

でもでも、簡単に使える分落とし穴もあります。

極端な例を出してみます。

とある学校でテストが行われました。

Aくんの点数は100点
Bくんの点数は  0点

別の教科のテスト結果は

Aくんの点数  50点
Bくんの点数  50点

どちらの教科も「平均点」は50点。
でも、全く意味が違いますよね?

このようにサンプルが少ない場合や、「外れ値」といって極端なデータが混ざっていたりすると、なかなか平均だけでは把握することはできません。

という訳で、他の代表値である中央値や最頻値にも活躍してもらわねばなりません!

便利なようで、実は難しいのが平均値。
「平均的」というと、何とも「普通」っぽい印象を持ちますが、それも本当に「普通」なのかというと実は違うってことですね!

詳しくは次回以降にも続きますので、今回はそんなもんなんだ〜くらいで思っていただければ!

また、平均に外れ値がどのような影響を及ぼすか詳しく知りたいという方は
「校長 平均」
で検索してみてください!

▼今回の記事と併せて読みたい書籍はこちら▼

この記事のタグ

ブログランキング・にほんブログ村へ

コメントを残す

メールアドレスが公開されることはありません。

New|最新記事

Ranking|人気記事

Category

Tag

ページトップへ戻る