分散の求め方/VAR、VARP

https___qiita-image-store-s3-ap-northeast-1-amazonaws-com_0_184885_fc0d87ff-4002-0413-c68e-0e5ec870957b-2 基礎コース

分散とは何か

分散とは、データの平均値から見た「ばらつき具合」を数値で表したもので、数学などでは統計学や確率論にて用いられる手法の1つとなります。

その数値の求め方は、

①各データの平均値との差を求める
②その差をそれぞれ2乗する
③全ての求めた数値を足す
④最後にデータの数で割る

以上となりますが・・・

「分散」という言葉自体を聞いたことのない方にとっては、何を言っているのか、非常に難しい説明と感じることでしょう。

 

わかりづらいと感じた方は、次のように覚えてください。

「計算された数値が、小さいほどデータのばらつきが少ない」

という意味で、つまり、出てきた数値が「0」に近いほどばらつきの無いデータということが分かる手法になります。

 

分散の求め方/VAR

実際に、その分散(ばらつき具合)を示す数値を求めるには、VAR関数を使用します。

 

=VAR(数値1, [数値2]・・・)

[数値1] = 分散を求める1つ目の数値、又は範囲を指定します。
[数値2] = 省略可。[数値1]の他に対象となる数値、又は範囲がある場合に指定します。

関数の説明 指定された数値の分散を求める関数
EXCELバージョン Excel2003 ・ Excel2007 ・ Excel2010 ・ Excel2013・ Excel2016

 

使い方例)VAR関数

下の表は、ある学校の学期末テスト結果を、クラス別に比べたものです。
それぞれ、平均点を求めた上で、点数のばらつき具合を求めることにしました。

50058013101

① 「1-A」クラスの分散を求める。

(1)[数値] :セル範囲[C6:C11]を指定します。
=VAR(C6:C11)

② 「1-B」クラスの分散を求める。

(1)[数値] :セル範囲[F6:F11]を指定します。
=VAR(F6:F11)

以上で、分散の数値が求められます。

 

POINT!

求めた数値の『読み方』(考え方)について・・・

分散の意味については、前述のとおりですが、今回の場合の「データの読み方」について見てみましょう。

image20

データの読み方①

まず、今回のデータでは、「1-B」クラスの方が平均点が高いのが分かります。
ですので、パッと見では当然『1-Bクラスの方が優秀である』と考えることが出来ます。

データの読み方②

では次に、分散値を見てみると、「1-A」クラスの方が小さい数値となっています。
この意味は、『1-Aクラスの方が平均した点数が取れている』という意味になります。

つまり、①と②から分かるのは、

[1-B]クラスは、高い点数が取れる優秀な生徒がいる一方で、点数のばらつきがあり、生徒間での学力の差が大きい。

[1-A]クラスは、飛びぬけて優秀な生徒がいるわけではないが、点数のばらつきが少なく、生徒間での学力の差は小さい。

という結果です。

教える側の先生としては、生徒の学力差を小さくするのも力量の見せ所となりますね。

 

分散の求め方/VARP

分散を求める関数として、VARP関数を使用しても問題ありません。

 

=VARP(数値1, [数値2]・・・)

[数値1] = 分散を求める1つ目の数値、又は範囲を指定します。
[数値2] = 省略可。[数値1]の他に対象となる数値、又は範囲がある場合に指定します。

関数の説明 指定された数値の分散を求める関数
EXCELバージョン Excel2003 ・ Excel2007 ・ Excel2010 ・ Excel2013・ Excel2016

 

使い方例)VARP関数

使い方は、VAR関数と全く同じですが、結果として表示される数値が若干違います。

unnamed-9

① 「1-A」クラスの分散を求める。

(1)[数値] :セル範囲[C6:C11]を指定します。
=VARP(C6:C11)

② 「1-B」クラスの分散を求める。

(1)[数値] :セル範囲[F6:F11]を指定します。
=VARP(F6:F11)

 

VAR、VARPの違い

VAR関数も、VARP関数も使い方は同じなのに得られる結果が違うのは、それぞれ使用する時の条件が違っている為に起こるものです。

最初に、分散の計算方法として

①各データの平均値との差を求める
②その差をそれぞれ2乗する
③全ての求めた数値を足す
④最後にデータの数で割る

と説明しましたが、この④の部分に実は違いがあり、数値が違ってきます。

 

以下が、VAR関数とVARP関数の違いとなります。

VAR関数は・・・

指定したデータが、全体の内の「標本」(抜き出した一部分)として考え計算する関数。
全体のデータ数が不明の為、④の割り算は、「指定されたデータ数-1」で割るものし、得られる結果の偏りをなくします。

VARP関数は・・・

指定したデータが、「全て」の場合に使用する関数。
全体のデータ数=指定したデータとなる。

となります。

 

また、一般的に分散値を求める際には、「期待値」(=実際のばらつき具合に対する精度)が重要となり、例として以下のように考えられています。

  • AクラスとBクラスでクラスの人数が違っていた場合、「指定されたデータ数-1」で割る分散値は、どちらのクラスにおいても期待値が等しくなるが、「指定されたデータ数のみ」で割る分散値は、人数が少ない組のほうが小さくなる傾向となる。
  • Aクラスのうち、何人かが欠席して点数が未定の場合、「指定されたデータ数-1」で割る分散値は欠席にかかわらず期待値が等しくなるが、「指定されたデータ数のみ」で割る分散値は、欠席したほうが小さくなる傾向となる。

このため、数学の場では通常「分散」を求める際には、期待値のより正確な、VAR関数を使用されることが多いと言えます。

 

ここまで長く説明しましたが・・・・・・

やはり分かりづらいですね。つまりこう覚えておきましょう。

↓通常はこちらの関数を使用
「データが無限や非常に多い時、又はデータ数が一定でない場合はVAR関数」

「データが全て確定していて一定の場合はVARP関数」

 

図示例)VAR関数

https___qiita-image-store-s3-ap-northeast-1-amazonaws-com_0_184885_fc0d87ff-4002-0413-c68e-0e5ec870957b

 

VARとVARPの違いについては、人によってとても難解と感じる為、迷ったらVAR関数で一部分のデータを取り出して計算しましょう。

 

 

Rate article