【Excel】データの平均値と中央値を求める関数 両者の違いと使い分けまとめ


先日、データの平均値と中央値、それぞれを計算する機会があったので、ちょっとまとめておきます。

複数の数値データの平均値や中央値を求める関数についてです。

平均値と中央値の両者の違いについても、軽くまとめました。

スポンサードリンク

関連記事

平均値を求める関数

平均値を求める関数は以下の通りです。

=AVERAGE(セル範囲)

英語で「平均」の意味のAverage(アベレージ)そのままで覚えればOKです。

中央値を求める関数

続いて、中央値を求める関数はこちら。

=MEDIAN(セル範囲)

英語で「中央点」の意味のMedian(メディアン)と覚えておきましょう。 こちらも、英単語そのままなので合わせて覚えやすい感じです。

平均値と中央値の計算例

具体的に、平均値と中央値の計算してみます。

まずは、こんなデータを用意しました。

データの平均値を求める関数式

平均値を求める関数は、データの範囲を指定するので、C3〜C15セルを指定するだけ。 簡単ですね。

=AVERAGE(C3:C15)

データの中央値を求める関数式

同じく中央値も、データ範囲を指定するだけです。

=MEDIAN(C3:C15)

 

計算結果はこんな感じ。

同じデータからですが、少々違う結果が返ってきてますね。

平均値と中央値の違いってそもそも何なの?

そもそも平均値と中央値の違いってなんなんだっけ?

計算の定義としては、下記の通りです。

  • 平均値: 合計数からデータの個数で割ったもの
  • 中央値: データ全体の真ん中の数値を出したもの

平均値のデメリット

平均値の場合、極端な数値がデータにあった場合、数値が飛び抜けてしまう場合があるというデメリットがあります。

データの一般的な数値の中にひとつでも、極端な数値が紛れ込むと、実態とかけ離れて数値が大きく変化してしまうことになります。

よくある例としては平均年収など。 年収3000万円以上の人が入り込んだ場合、一般的な数値とはかけ離れて平均値が出されてしまう…という具合ですね。

 

その点中央値の場合、極端な数値のデータがひとつ増えた場合でも、その全体の真ん中の値を出すだけなので、その極端なデータが反映されることはほとんどありません。

実際に極端な数値を入れてみるとわかりやすい!

例えば先ほどのデータ例で、1つの項目の数値を900と、極端な数値にしてみた場合の平均値と中央値の結果がこちら。

 

この900という数値に引っ張られて、平均値が16.77→85.31に大きく変化しています。 (実際のデータは10〜30ぐらいがほとんどであるにもかかわらず。)

 

その反面で中央値は18→19と、極端な数値のデータが入り込んでも大きく差が発生することは特にありませんでした。

スポンサードリンク

 

一般的に多く使われるのは平均値ですが、データの分布が大きい場合(極端に少ない数値や大きい数値のデータが混ざる場合)は、中央値を選ぶという使い分けで良いかなと思います!

☑ 極端な数値が入り込まないなら平均値で計算する
☑ 実態に合わせたデータを出したい場合は、中央値で計算する

 

 

この記事が参考になったら、TipstourのFacebookページに『いいね!』をお願いします!

 

よろしければFeedlyもご登録ください!
follow us in feedly