PR

二項分布の定義と性質まとめ

確率論
記事内に広告が含まれています。

二項分布は, n 回コイン投げを行ったときに, k 回表が出る確率を一般化したもので, P(X=k) = {}_n \mathrm{C}_k p^{k}(1-p)^{n-k} となります。そんな二項分布について,その定義と性質を,図解を交えて分かりやすくまとめます。

二項分布の定義

まずは,二項分布の定義と,具体例を確認していきましょう。

二項分布の定義と具体例

定義(二項分布)

0<p<1 ,\,\, n は正の整数とする。 k = 0,1,2,\dots, n に対して,

\color{red} P(X=k) = {}_n \mathrm{C}_k\, p^{k}(1-p)^{n-k}


となるとき,確率変数 X はパラメータ (n,p) に関する二項分布 (binomial distribution) に従うといい, \color{red} X\sim B(n,p) とかく。

二項分布は,確率 p で表が出るコインを n 回投げたときの,表が出る回数をモデル化したものと言えます。

コインの絵

いくつか具体的な値を入れて,そのときの確率がどうなるか考えてみましょう。

まず,\color{red} n=10 と固定し,\color{red} p=0.1,0.3, 0.5, 0.7, 0.9 と変えたとき,横軸に k \,\,(0\le k \le 10),縦軸に P(X=k) をプロットしたグラフは,以下のようになります。

n=10, p=0.1,0.3,0.5,0.7,0.9 としたときの二項分布のグラフ

次に, p を固定し, n を変化させてみましょう。 \color{red} p=0.4 とし, \color{red} n=10,20,30,40 と変化させた場合の確率は,以下のようになります。

p=0.4, n=10,20,30,40 としたときの二項分布のグラフ

ベルヌーイ分布との関係

B(n,p) において, n=1 のとき,これは「コインを1回投げただけ」に相当し, \color{red} P(X=1)=p,\, P(X=0) = 1-p となります。これはベルヌーイ分布 (Bernoulli distribution) といいます。これについては,別途以下の記事を参照してください。

また逆に,二項分布は「コインを1回投げる」ということを n 回繰り返すと考えることもできます。よって, X\sim B(n,p) としたとき, P(X_k=1) = p,\, P(X_k=0)=1-p となる互いに独立な n 個のベルヌーイ分布 X_1,X_2,\dots, X_n を用いて,

\color{red} X \stackrel{\mathrm{d}}{=} X_1 + X_2 + \dots + X_n


とかくことができます。 ただし, \stackrel{\mathrm{d}}{=} は「分布の意味で等しい」ことを表します。

ベルヌーイ分布の独立な和が二項分布と言えるわけですね。

二項分布の性質

二項分布の主な性質を列挙します。

二項分布 B(n,p)
確率 P(X=k)\, (k=0,1,\dots,n){}_n\mathrm{C}_k\, p^k (1-p)^{n-k}
分布の型離散型
累積分布関数 F(x) = P(X\le x) \displaystyle \begin{cases} 0 & x<0 ,\\ \sum_{k=0}^{\lfloor x \rfloor} {}_n\mathrm{C}_k \, p^k (1-p)^{n-k}& 0\le x \le n, \\ 1& n<x.\end{cases}
期待値 \mu=E[X] np
分散 \sigma^2=V(X) np(1-p)
標準偏差 \sigma=\sqrt{V(X)} \sqrt{np(1-p) }
歪度 \frac{E[(X-\mu)^3]}{\sigma^3} \frac{1-2p}{\sqrt{np(1-p)}}
尖度 \frac{E[(X-\mu)^4]}{\sigma^4} -3 \frac{1-6p(1-p) }{np(1-p)}
積率母関数 E[e^{tX}] (1-p+pe^t)^n
特性関数 E[e^{itX}] (1-p+pe^{it})^n
正規分布による近似(中心極限定理) p を一定にして n\to\infty とする
ポアソン分布による近似(ポアソンの少数の法則) \lambda =\lim_{n\to\infty} np_n として n\to\infty とする

累積分布関数以降について,順番に考えていきましょう。

二項分布の累積分布関数(分布関数)

定理(二項分布の累積分布関数)

X\sim B(n,p) であるとき, X累積分布関数(分布関数)

\small \color{red}F(x)=\begin{cases} 0 & x<0 ,\\ \sum_{k=0}^{\lfloor x \rfloor} {}_n\mathrm{C}_k \, p^k (1-p)^{n-k}& 0\le x \le n, \\ 1& n<x.\end{cases}


となる。ただし, \lfloor x\rfloor床関数(ガウス記号)を表す。

これは, F(x) = P(X\le x ) = \sum_{k=0}^{\lfloor x \rfloor} P(X=k) なので,明らかですね。

確率(質量)関数と,そのときの累積分布関数を左右に描画すると,以下のようになります。※以下は模式的なものであり,実際の累積分布関数は,床関数(ガウス記号)のグラフのような,不連続なものです。

二項分布の期待値・分散・標準偏差

定理(二項分布の期待値・分散・標準偏差)

X\sim B(n,p) であるとき, X の期待値・分散・標準偏差はそれぞれ

\color{red}\begin{aligned} E[X]&= np, \\ V(X)&= np(1-p), \\ \sqrt{V(X)} &= \sqrt{np(1-p) } \end{aligned}


となる。

これの証明については,以下の記事で行っています。

二項分布の歪度・尖度

定理(二項分布の歪度・尖度)

X\sim B(n,p) であるとき, X の歪度・尖度はそれぞれ

\color{red}\begin{aligned} \frac{E[(X-\mu)^3]}{\sigma^3}&= \frac{1-2p}{\sqrt{np(1-p)}},\\ \frac{E[(X-\mu)^4]}{\sigma^4}-3&= \frac{1-6p(1-p) }{np(1-p)} \end{aligned}


となる。ただし, \mu=E[X],\, \sigma=\sqrt{V(X)} である。

「歪度(わいど)」とは,分布がどれだけ非対称で歪んで(ゆがんで)いるかを表す指標で,「尖度(せんど)」とは,正規分布と比べて分布がどれだけ尖って(とがって)いるかを表す指標です。

これについては,以下の記事で解説しています。

二項分布の積率母関数(モーメント母関数)

定理(二項分布の積率母関数)

X\sim B(n,p) であるとき, X の積率母関数は

\color{red}E[e^{tX}] = (1-p+pe^t)^n


である。

これを証明してみましょう。

証明

\begin{aligned} E[e^{tx} ] &= \sum_{k=0}^n e^{tk} P(X=k) \\ &= \sum_{k=0}^n e^{tk} {}_n\mathrm{C}_k\, p^k (1-p)^{n-k} \\ &= \sum_{k=0}^n {}_n\mathrm{C}_k (pe^{t})^k (1-p)^{n-k} \\ \end{aligned}


であり,二項定理より,

\sum_{k=0}^n {}_n\mathrm{C}_k (pe^{t})^k (1-p)^{n-k} =(1-p+pe^t)^n


がわかる。

証明終

また,確率変数 X, Y が独立であるとき, \color{red} E[e^{t(X+Y)}] = E[e^{tX}]E[e^{tY}] であることを用いると,以下のような証明も可能です。

別証

X\sim B(n,p) のとき,パラメータ p に従う互いに独立なベルヌーイ分布 X_k \, (1\le k \le n) を用いて,

X\stackrel{\mathrm{d}}{=} X_1 + X_2 + \dots + X_n


とかける( \stackrel{\mathrm{d}}{=} は分布が等しいという意味)。

従って,

\begin{aligned}E[e^{tX}] &= E[e^{t(X_1+\dots+X_n)}] = E[e^{tX_1}]^n \end{aligned}


であり,ベルヌーイ分布の積率母関数は, E[e^{tX_1}]= 1-p+pe^t である(→ベルヌーイ分布とは~定義と性質の導出~)から,

E[e^{tX}] = (1-p+pe^t)^n


がわかる。

別証終

二項分布の特性関数

定理(二項分布の特性関数)

X\sim B(n,p) であるとき, X の特性関数は

\color{red}E[e^{itX}] = (1-p+pe^{it})^n


である。

これの証明は,積率母関数のときとほぼ同じですが,一応確認してみましょう。

証明

\begin{aligned} E[e^{itx} ] &= \sum_{k=0}^n e^{itk} P(X=k) \\ &= \sum_{k=0}^n e^{itk} {}_n\mathrm{C}_k\, p^k (1-p)^{n-k} \\ &= \sum_{k=0}^n {}_n\mathrm{C}_k (pe^{it})^k (1-p)^{n-k} \\ \end{aligned}


であり,二項定理より,

\sum_{k=0}^n {}_n\mathrm{C}_k (pe^{it})^k (1-p)^{n-k} =(1-p+pe^{it})^n


がわかる。

証明終

また,確率変数 X, Y が独立であるとき, \color{red} E[e^{it(X+Y)}] = E[e^{itX}]E[e^{itY}] であることを用いると,積率母関数のときと同様に,以下のような証明も可能です。

別証

X\sim B(n,p) のとき,パラメータ p に従う互いに独立なベルヌーイ分布 X_k \, (1\le k \le n) を用いて,

X\stackrel{\mathrm{d}}{=} X_1 + X_2 + \dots + X_n


とかける( \stackrel{\mathrm{d}}{=} は分布が等しいという意味)。

従って,

\begin{aligned}E[e^{itX}] &= E[e^{it(X_1+\dots+X_n)}] = E[e^{itX_1}]^n \end{aligned}


であり,ベルヌーイ分布の特性関数は, E[e^{itX_1}]= 1-p+pe^{it} である(→ベルヌーイ分布とは~定義と性質の導出~)から,

E[e^{itX}] = (1-p+pe^{it})^n


がわかる。

別証終

二項分布の正規分布による近似

np, np(1-p) が十分大きいとき,二項分布 B(n,p) は,正規分布 N(np, np(1-p)) で近似できます。

以下は, p=0.4, \,n=50 のときに二項分布のグラフ(青)と該当する正規分布のグラフ(赤)を重ねたものです。

二項分布の正規分布による近似の具体例

良好に近似できていることが分かりますね。

厳密には,中心極限定理の話になります。

二項分布のポアソン分布による近似

以下の定理が知られています。

定理(ポアソンの少数の法則)

\lambda>0 とし, X_n \sim B(n, p_n ) とする。ただし, \{p_n\} \lim_{n\to\infty}np_n = \lambda をみたす (0, 1 ) 値の数列である。

このとき, X_n はパラメータ \lambda をもつポアソン分布に分布収束する。すなわち, l=0,1,2,\dots に対し,

\color{red} \lim_{n\to\infty}P(X_n =l) = e^{-\lambda} \frac{\lambda^l}{l!}.

ラフに言うと, n が十分大きく, p_n が十分小さいとき,ポアソン分布で近似できるということですね。

関連する記事