知り合いが7人兄妹なのですが、なんと女の子は一人だけで、他は男6人という兄妹構成だそうです。
さて、これはどれくらい珍しいことなのでしょうか?(7人子どもがいるというだけですでに珍しいことかもですが)
7人子どもができて、そのうちたった一人だけが女の子の確率は一体どれくらいなのでしょうか。
Binomial Probability・Excel Function が分かれば簡単に求められます
BINOMIAL DISTRIBUTION 二項分布 とは
N 回の試行回数のうち X 回が成功するというような Binomial Experiment の確率を求めるときに使われます。
Excel Function: Binomial Probability Distribution
=BINOM.DIST (number_s, Trials, Probability_S, Cumulate)
Excel の関数では=BINOM.DIST()を使います。それぞれ入力する数値の意味は、
- number_s,は Discrete Random Variable:成功の回数を
- Trials は試行回数 N 回を
- Probability_S, は成功する確率を
- Cumulate は成功回数がちょうど X 回か、X 回以下の成功回数 かを指定します。
7人子どもがいて一人だけが女の子の確率は?
先の例を Excel の関数を使ってもとめてみましょう。
女の子が生まれることを成功:Success と定義します。
- number_s は 1
- Trials は子どもの数なので 7 回です。
- Probability_s は Success の確率なので 50%です。(女の子が生まれてくる確率は 50%とみなします。)
- Cumulate はちょうど女の子が一人だけの時の確率がほしいので 0 (1 と入力すると一人かそれ以下のときの累積した確率になります。)
と入力します。
=BINOM.DIST(1,7,50%,0) = 0.0546875
とたった約5%の確率であることがわかります。
BINOMIAL EXPERIMENT である条件条件
先のような Binomial の計算を使うにはいくつかの条件をチェックする必要があります。
1試行回数が決まった回数であること。
これは勝手に7回8回とか増やしてはいけませんということです。 先の例では”7人の子どものうち”という条件がありました。
2試行の結果が成功か Success か失敗 Failure の二択であること。(yes or no)
結果が3つ以上のものではなく必ず二択であることです。
先の例だと女の子か”女の子でない”かを見ました。
Binomial の Bi-は2つという意味です。
3成功の確率が一定で変わらないこと。
毎回毎回の試行回数が同じ成功確率で変わらないことです。
先の例だと、1人目の子どもであろうが2人目の子どもであろうが女の子である確率は一定です。ずっと50%。
もし、初産の子どもは特別女の子が生まれやすいとかであれば条件を満たさず、Binomial Distribution は使えません。
4すべての試行は互いに独立していること。
試行が互いの成功率に影響し合うことがないことが条件です。
先の例だと、例えば一人目が女の子であれば次は男の子が生まれやすいとか影響があれば Binomial Distribution は使えません。
BINOMIAL DISTRIBUTION の EXPECTED VALUE 期待値
Binomial Distribution の期待値は Mean と同じ値になり下記のような数式で求めます。
n は試行回数で p は成功確率です。
BINOMIAL DISTRIBUTION の STANDARD DEVIATION 標準偏差
Binomial Distribution の Standard Deviation は下記のような数式で求めます。
n は試行回数で p は成功確率です。
BINOMIAL DISTRIBUTION 使い方例
もう一つ別の例をみてみましょう。 あなたはとある全20問の ◯ か ☓ で応えるクイズを受けたとします。 もし、答えを考えることなく無作為につけて行って15問以上正解する確率はいくつでしょうか?
Binomial Experiment かどうかをチェック
- 試行回数が決まった数か?Yes. 全部で20問
- 結果が 2 択であるか?Yes, ◯ か ☓ かの二択
- 成功の確率が一定か?Yes, (このテストでは ◯ の正解が多いとか偏りがないものとする。)
- 試行は互いに独立しているか?Yes. (このテストの問題はそれぞれ独立しているものとする。
Excel の関数を使って計算
Excel の関数を使って 15 問以上正解する確率を求めたいのですが、実は”15 問以上”というのは直接 Excel の関数では求められません。15 問ちょうど正解や 15 問以下の正解は求められるのですが。。
15 問ちょうどのときは=BINOM.DIST(15,20,50%,0)
15 問以下のときは=BINOM.DIST(15,20,50%,1)
いろいろと方法はありますが、Excel で表を作るとわかりやすいです。
まず成功回数の列を作ります。その横に成功確率の列をつくり
=BINOM.DIST(A の列,20,50%,0)と入力し残りの欄にもコピーします。
求めたいのは 15 問以上なので 15 問より上の回数を全部足したらよいわけです。
正解は、 15 問以上成功する確率は約 2.07%であることがわかりました。 図表で表すとこのような感じになります。
このように一度表にすると他の確率を知りたい時にも便利です。
7 問から 10 問成功する確率は?
全 20 問中 7 問から 10 問正解する確率はいくつでしょうか?
成功回数が 7 回から 10 回の成功率を足します。
正解は約 53%です。