統計・解析 | データ解析の代表値 〜実は怖い平均値〜
POST:2018.07.12
データを見る時に使う値として代表的なものが3つあります。 ・平均値 です。 3つとも知ってる! 色々だろうと思います。 実は管理人、代表値についてそこまで気にしたこともなかったのです。 なにせ、平均値というのは概念としてとてもわかりやすい。 辞書で調べると、平均値とは・・・ 何ともわかりやすい! わかりやすい上に汎用性も高いので、様々な場面で使われます。 挙げていけばキリがないくらいあります。 でもでも、簡単に使える分落とし穴もあります。 極端な例を出してみます。 とある学校でテストが行われました。 Aくんの点数は100点 別の教科のテスト結果は Aくんの点数 50点 どちらの教科も「平均点」は50点。 このようにサンプルが少ない場合や、「外れ値」といって極端なデータが混ざっていたりすると、なかなか平均だけでは把握することはできません。 という訳で、他の代表値である中央値や最頻値にも活躍してもらわねばなりません! 便利なようで、実は難しいのが平均値。 詳しくは次回以降にも続きますので、今回はそんなもんなんだ〜くらいで思っていただければ! また、平均に外れ値がどのような影響を及ぼすか詳しく知りたいという方は値について
・中央値
・最頻値
何となくならわかる・・・・
全然わからない!
平均値ならわかるし!!
くらいなものでした。平均値とは
「データの合計値をデータの個数で割った値のこと」
平均所得、平均体重、平均回数、平均年齢・・・・「平均」の落とし穴
Bくんの点数は 0点
Bくんの点数 50点
でも、全く意味が違いますよね?
「平均的」というと、何とも「普通」っぽい印象を持ちますが、それも本当に「普通」なのかというと実は違うってことですね!
「校長 平均」
で検索してみてください!