Ch3-2 Standard Deviation 標準偏差

Deviation 偏差

Deviation 偏差とは一つのデータがどれくらいデータ全体のMean(平均値)から離れているかです。
例えば、男性成人の平均身長Meanが170cmとします。あなたの身長は180cmなので、Meanから10cm偏差ている言えます。

Standard Deviation 標準偏差

Standard Deviation 標準偏差はそのばらつきが全体としてはどのくらいかを表したものです。
さっき例であなたの身長のばらつきは10cmでした。では、他のみんなはどのくらい平均から離れているのでしょうか。平均身長から170より高い人もいれば低い人もいるはずです。その離れ具合をすべて計算しさらに平均化したものを標準偏差といいます。平均化といっても高い人、低い人もいるのでプラスマイナスゼロと打ち消し合ってしまうので絶対値として平均化します。
例えば、平均身長Meanが170cmでStandard Deviation 標準偏差が5cmであったとします。これはみんなの身長を足し合わせて平均を出すと170cmだけれども、一人ひとりは5cmくらい低かったり高かったりするということです。
もしこれが平均身長Meanが170cmでStandard Deviation 標準偏差が20cmであったとします。平均身長は170cmだけれども、先程と比べると一人ひとりがものすごく高かったりものすごく低かったりして20cmくらい平均身長170cmから差があることになります。みなの身長がとてもばらついていると言えます。
このStandard DeviationもMeanのときと同じく2つの種類に分けて考えます。

Population Standard Deviation

Population Standard Deviationは名前のとおりPopulation(母集団)のStandard Deviation(標準偏差)です。
Population Standard Deviation は σ シグマという記号で表されます。
Excel Function: Population Standard Deviation
=STDEV.P(データの範囲)
Excel の関数ではSTDEV.Pを使い、Populationのデータの範囲を指定します。STDEVはStandard Deviationの略でPはPopulationの事を意味します。
数式では下記のようになります。

Sample Standard Deviation

Sample Standard Deviationは名前の通りSample(標本)のStandard Deviation(標準偏差)です。
Sample Standard Deviationは s 小文字のエスという記号で表されます。
Excel Function: Sample Standard Deviation
=STDEV.S(データの範囲)
Excel の関数ではSTDEV.Sを使い、Sampleのデータの範囲を指定します。STDEVはStandard Deviationの略でSはSampleの事を意味します。
数式では下記のようになります。

平均が同じでもデータのばらつきが違う場合

以下の例ではグループAもグループBも平均身長であるMeanが同じく170cmです。
しかし、Standard DeviationははるかにAの方が大きく、Aのグループは背の高い人もいれば大きい人もいるばらつきが大きいと言えるでしょう。

Variance 分散

Variance(分散)もStandard Deviation(標準偏差)と同じようにデータにどのくらいのばらつきがあるのかを表した ものです。数が大きいほどばらつきがあると判断します。もともとはVarianceを平方根したものがStandard Deviationです。VarianceもPopulation VarianceとSample Varianceの2種類に区別します。

Population Variance

Population Varianceは名前の通りPopulationのVarianceです。
Population Varianceはσの二乗の記号で表します。
Excel Function: Population Variance
=VAR.P(データ範囲)
Excelの関数ではVAR.Pを使い、Populationのデータの範囲を指定します。VARはVarianceの略でPはPopulationの事を意味します。

Sample Variance

Sample Varianceは名前の通りSampleのVarianceです。
Sample Varianceはsの二乗の記号で表します。
Excel Function: Sample Variance
=VAR.S(データ範囲)
Excelの関数ではVAR.Sを使い、Sampleのデータの範囲を指定します。VARはVarianceの略でSはSampleの事を意味します。

Coefficient of Variation

Coefficient of Variance は2つの単位が違うデータのばらつきを比べる時に役に立ちます。
Coefficient of Variation は下記のように計算します。例えば、
平均身長Meanが170cmで Standard Deviation が10cmのデータ
平均年収Meanが700万円でStandard Deviationが50万円のデータ
比べるにもどちらもMeanの大きさもデータの単位が違います。けれど、Coefficient of Variationを使えばどちらのデータがよりばらついてるかを比べることができます。

例を計算してみると、年収のCoefficient of Variationの方が大きく身長よりも年収の方がばらつきがあると言えます。

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top