データ分析 超入門「平均の罠」
データを代表する値として、よく使われる
「平均」
。
平均はテストの平均点や平均身長など日常生活に溶け込んでいます。「小学生の頃に覚えた」という方も多いのではないでしょうか。
しかし、これがなかなかの曲者です。2つの例を見てみましょう。
例1:お小遣い
Aさん、Bさん、Cさん 3人の小学生がいます。それぞれのお小遣いは、次の通りです。
(1)
Aさん:500円
Bさん:600円
Cさん:700円
(2)
Aさん:200円
Bさん:300円
Cさん:1300円
(1) (2)ともに、平均お小遣いは600円ですが、かなり印象が異なってきます。
例2:テストの平均点
では、問題です。
「Dさんは、100点満点のテストを受け、得点は75点でした。クラスの平均は74.1点だったので、自分は平均より高いので人並みの点が取れたと安心しました。正しいでしょうか?」
今回のケースでは、必ずしも平均より高い=人並み以上とは言い切れません。
例えばクラスの得点の分布が以下のような場合、平均値は極端に低い値(0点)に引っ張られた値になり、クラスを代表する値とは言えなくなります。
外れ値の影響
上記2つの例のように、平均には
「外れ値(極端に高いor低い値)」の影響を受けやすい
という弱点があります。したがって代表値を考える際には、平均の調整(外れ値の除外)や、その他の代表値の検討などが必要になります。
例えば例2「テスト」のケースでしたら、平均だけではなく、外れ値の影響を受けにくい「中央値(データの中央に位置する値)」や「最頻値(最も頻繁に出現する値)」も確認するとよいでしょう。
- 平均点:74.125点
- 最頻値:80点
-
中央値:80点
おすすめコース
【PDU対象】ビジネスプロフェッショナルの情報分析~データを分析し効果的に意思決定するスキルを学ぶ~
今日、データをビジネスに活かすことが求められています。そのため、データを活用するためのスキルが今まで以上に重要になってきています。
本コースでは、課題に基づいて情報やデータを収集整理し、適切に分析するためのプロセスや手法を学んでいただきます。ビジネスプロフェッショナルが備えておくべき基本的なスキルであり、提案力を高めるためにも役立ちます。