Ch5-3 Hypergeometric Distribution

Hypergeometric Distribution 超幾何分布(ちょうきかぶんぷ)とは?

Hypergeometric DistributionはBinomial Distributionと良く似ています。
しかし以下の点が違います。
1Trial(試行)が独立していない。
2確率が試行ごとに違う。

トランプカードの例

トランプカードの例を使って考えてみます。

試行が独立している場合

トランプのデッキから1枚カードを引いて絵札を引く確率は、
トランプカードの総数:52枚
含まれる絵札の総数:12枚(Jack,Queen, King)
で確率は12/51で約23%です。
次にその引いたカードをデッキに戻して、また絵札を引く確率は同じく12/52です。
なぜなら引いたカードをデッキに戻してリセットされた状態だからです。
試行が独立していて、確率が試行ごとに違うということはありません。
では、もし引いたカードをデッキに戻さずにもう一度引いた場合はどうなるでしょうか?

試行が独立せず、確率が変わる場合

トランプからカードを5枚引いて、2枚の絵札を引く確率は?(カードをデッキ戻すことなく)
この場合カードを引き戻さないのでカードの総数は二枚目か減ります。
さらに、もし絵札を引いたらデッキに含まれる絵札も12枚から11枚にかわります。
カードを引くごとに確率はかわり、試行が独立していません。

ExcelでHypergeometric Distribution

上記のトランプの例のような確率計算は大変複雑です。けれどExcelを使えば簡単に答えを求められます。
Excel Function: Hypergeometric Distribution
=HYPGEOM(x,n,population_s,number_pop,cumulative)
Excelの関数=HYPGEOMを使い下記の必要な情報を指定します。
x: Sampleの成功の数: Discrete Random Variable x
n:Trials 試行の回数:Sample Size
Population_s: Success成功がPopulationにどれだけ含まれているか
Number_pop: Populationの数:総数
Cumulative:
0=False :成功の数がちょうどx個の時
1=True :成功の数がx以下の時

=HYPGEOM.DISTを使ったトランプカード例

ではもう一度例題の
トランプからカードを5枚引いて、2枚の絵札を引く確率は?(カードをデッキ戻すことなく)
x: 2:2枚の絵札を引く
n: 5:全部で5枚のカードを引く
Population_s: 12 絵札は全部で12枚ある
Number_pop: 52
Cumulative: 0: ちょうど2枚の絵札を引く確率
=HYPGEOM(2,5,12,52,0)=0.2509
となり答えは約25.1%の確率ということがわかりました。

Hypergeometric Distribution 例2

トランプばかりの例でもおもしろくないので別の例を紹介します。
ドラマ『半沢直樹』の3話目でこんなシーンがありました。
主人公半沢直樹の邪魔をするために、大阪西支店で仕組まれた裁量臨店が行われました。
裁量臨店とは、銀行本部から人を送り融資を行っている会社に業績不振などがないかをチェックし銀行支店が適切な融資を行っているかチェックを行う監査のようなものです。支店が融資している会社すべてをチェックすることは大変労力が必要です。通常はいくつかの会社を無作為に選んでチェックします。
もし、裁量臨店の結果が好ましくなければ半沢直樹は都合の悪い立場に追い込まれます。
しかし、ドラマの中での裁量臨店は悪意に寄って仕組まれたものでした。
選ばれた会社はすべて業績不振で赤字の会社だったのです。
本部からの追求に、西大阪支店では融資先の7割が成績優良であるのに、選ばれた会社は残り3割の業績不振の会社ばかりでした。本当に無作為に選ばれたものか?もしくは悪意があって故意に選ばれたものでないかと半沢直樹は疑問します。しかし、仕組んだ側の人間たちはこれは公平に選ばれたものだと主張します。
この場合、本当に無作為で選ばれた会社すべてが業績不振である確率とはいったいどれくらいだったのでしょうか?

Hypergeometric Distribution

Hypergeometric Distributionを使って見てみましょう。
例:融資している会社100社のうち30社が業績不振 (7割は成績優良)だとします。
裁量臨店ではそのうち10の会社を無作為に選びます。
その10社すべてが業績不振である確率は?
x=10: Successの回数 10社が業績不振
n=10: 10社選ぶ
Number_s:30 30社が業績不振
Population_s:100:融資している会社の総数
=HYPGEOM.DIST(10,10,30,100,0)=約0.0001736%
答えは約0.0001736%です。
文字通り万に一つもない奇跡のような確率ですね。無作為でなく悪意をもって故意に選ばれたのは確実でしょう。

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top