Ch6-1 Normal Probability Distribution

Normal Probability Distribution

Normal Distribution またはBell Shape Distributionは図表にした時に釣鐘のような形になるDistributionです。

このようなBell Shape Distributionのような形になるような統計は例えば、
身長・体重
テストのスコア
大卒の初任給
などなどです。
ほとんどのデータが平均値に近い所にあるけれども、少し誤差があるようなデータの対象はBell Shape Distributionになります。その頻度の100分率の確率で表したものがNormal Probability Distributionです。

Normal Probability Distributionの特徴

Normal Probability Distributionには以下のような特徴があります。

1いろいろな形のBell Shapeがある。

一口にBell Shapeといっても、山の形が高く細かったり、平べったい形であったりします。
Meanが山の中心の場所を決め、Standard Deviationが小さければ細く尖った山、大きければ、平べったい山のような形になります。

2山の最も高い位置がMeanとなる。

Normal Distribution では山の最も高い位置がMeanでありMedianでありModeとなります。

3 Meanの位置は様々

測るデータによってMeanはマイナス・0・プラスの値、どのような値にでもなります。

4Meanを中心に左右対称である。

Skewnessが0であり、左右の広がりはMeanから遠いほど限りなく0%に近くはなるけれども永遠に0%に接することはない漸近線です。

5全体の面積は1(100%)である。

全体の合計面積は100%です。左右が対象であるためちょうど真ん中で半分にすると左右とも50%になります。

6 Empirical Rule が使える。

Ch3で紹介したEmpirical Ruleが使えます。
+/- 1 σの中に 68.3%の値が含まれる。
+/- 2 σの中に 95.4%の値が含まれる。
+/- 3 σの中に 99.7%の値が含まれる。

7 ちょうど〇〇という確率は求められない。

Continuous Random Variableは無段階に繋がったデータなので、ちょうど◯◯である確率は?というのは求められません。例えば身長が170cmである確率は?という問は応えることができません。なぜなら一見170cmと思っても170.0000001cmとか169.999999997cmである可能性が無限につながっているからです。
図表上で170cmを線で表すことはできても、線は面積を持たないからです。
なので169cmから171cmの間の確率は?というような問にしか答えられません。

ExcelをつかったNormal Probability Distribution

Normal Probability DistributionにつかえるExcelの関数はいくつかあります。

X valueにより確率を求める関数。=NORM.DIST

Excel Function: Normal Distribution
=NORM.DIST(x,Mean, Standard-dev,Cumulative)
Excelの関数では=NORM.DISTを使い下記の項目を指定します。
xは特定のxの値。
Mean
Standard-devにはStandard Deviation
Cumulativeの項目では少し注意が必要です。
0とすると指定したところのxvalueでの山(カーブ)の高さを表しますが、確率を表すものではありません。なぜなら、Continuous Random Variableで線に面積はないからです。
0とするのは主にグラフを描くときに使います。
1とすると指定したところのx value 以下の面積(確率)を求められます。
例:
平均給料Mean:20万円 (¥200,000)
Standard Deviation:7,000円(¥70,000)
Normal Standard Deviationで分布しているとします。
給料が19万円から21万円の間の確率はどのくらいでしょうか?
まず、大きい方の値の確率を出してみます。
=NORM.DIST(210000,200000,7000,1)=約92.34%
21万円以下の確率は約92.34%であることがわかります。
次に小さい方の値の確率を出してみます。
=NORM.DIST(190000,200000,7000,1)=約7.66%
19万円以下のの確率は約7.66%であることがわかります。
求めたいのは19万円~21万円の間なので
大きい方の確率から小さい方の確率を引きます
92.34%-7.66%=約84.7%
答えは約84.7%です。
Excelで一つの式にすると以下のようになります。
=NORM.DIST(210000,200000,7000,1)-NORM.DIST(190000,200000,7000,1)=約84.7%
図であらわすと以下のようになります。

Zスコアを指定して確率を求める関数=NORM.S.DIST

Excel Function: Normal Standard Distribution
=NORM.S.DIST(z,Cumulative)
Excelの関数では=NORM.S.DISTを使いZ-Scoreを指定します。
Z-ScoreはいくつStandard Deviation分Meanから離れているかを表したものです。
Normal Standard DistributionはNormal Distributionを標準化したものです
Meanが0 Standard Deviationが1という数字で標準化したものです。
実際の数値に関わらず例えば100分率で表示するような方法と似ていて、相対的に比べるのに適しています。
例えば、Z-Scoreが1.5以下の確率はどのくらいでしょうか?1.5 Standard Deviation以下の確率。
P(x=<1.5)=NORM.S.DIST(1.5,1)=約93.3%

確率を指定してx value を求める関数 = NORM.INV

Excel Function: Normal Distribution
=NORM.INV(Probability,Mean, Standard_dev)
=NORM.DISTとは逆に確率を指定して特定のx Valueを知る関数です。
Probabilityに確率を入力します。
先程の例で上位20%以上の給料はいくらになるでしょうか?
給与平均20万
STD 7000円
ただしExcelでは上位20%と指定することはできません。
Excelでは〇〇%以下の確率のときのXvalueは?という具合に指定できるのでそれを利用します。
逆に下位80%でなければ上位20%ということなので、
80%以下の確率となるXvalueは、
=NORM(80%,200000,7000,1)=¥205,891
つまり約¥205,900であれば、上位20%であることがわかります。

確率を指定してz-scoreを求める関数=NORM.S.INV

Excel Function: Normal Standard Distribution
=NORM.S.INV(Probability)
Probabilityを指定するとZ-Scoreがわかります。
この場合指定する確率はz-Scoreが左から累積した部分です。

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top