PR

二項分布の定義と性質まとめ

確率論
記事内に広告が含まれています。

二項分布は,n n 回コイン投げを行ったときに,k k 回表が出る確率を一般化したもので,P(X=k)=nCkpk(1p)nk P(X=k) = {}_n \mathrm{C}_k p^{k}(1-p)^{n-k} となります。そんな二項分布について,その定義と性質を,図解を交えて分かりやすくまとめます。

二項分布の定義

まずは,二項分布の定義と,具体例を確認していきましょう。

二項分布の定義と具体例

定義(二項分布)

0<p<1,  n 0<p<1 ,\,\, n は正の整数とする。k=0,1,2,,n k = 0,1,2,\dots, n に対して,

P(X=k)=nCkpk(1p)nk \color{red} P(X=k) = {}_n \mathrm{C}_k\, p^{k}(1-p)^{n-k}


となるとき,確率変数 X X はパラメータ (n,p) (n,p) に関する二項分布 (binomial distribution) に従うといい,XB(n,p) \color{red} X\sim B(n,p) とかく。

二項分布は,確率 p p で表が出るコインを n n 回投げたときの,表が出る回数をモデル化したものと言えます。

コインの絵

いくつか具体的な値を入れて,そのときの確率がどうなるか考えてみましょう。

まず,n=10\color{red} n=10 と固定し,p=0.1,0.3,0.5,0.7,0.9\color{red} p=0.1,0.3, 0.5, 0.7, 0.9 と変えたとき,横軸に k  (0k10) k \,\,(0\le k \le 10),縦軸に P(X=k) P(X=k) をプロットしたグラフは,以下のようになります。

n=10, p=0.1,0.3,0.5,0.7,0.9 としたときの二項分布のグラフ

次に,p p を固定し,n n を変化させてみましょう。p=0.4 \color{red} p=0.4 とし,n=10,20,30,40 \color{red} n=10,20,30,40 と変化させた場合の確率は,以下のようになります。

p=0.4, n=10,20,30,40 としたときの二項分布のグラフ

ベルヌーイ分布との関係

B(n,p) B(n,p) において,n=1 n=1 のとき,これは「コインを1回投げただけ」に相当し, P(X=1)=p,P(X=0)=1p \color{red} P(X=1)=p,\, P(X=0) = 1-p となります。これはベルヌーイ分布 (Bernoulli distribution) といいます。これについては,別途以下の記事を参照してください。

また逆に,二項分布は「コインを1回投げる」ということを n n 回繰り返すと考えることもできます。よって,XB(n,p) X\sim B(n,p) としたとき,P(Xk=1)=p,P(Xk=0)=1p P(X_k=1) = p,\, P(X_k=0)=1-p となる互いに独立な n n 個のベルヌーイ分布 X1,X2,,Xn X_1,X_2,\dots, X_n を用いて,

X=dX1+X2++Xn\color{red} X \stackrel{\mathrm{d}}{=} X_1 + X_2 + \dots + X_n


とかくことができます。 ただし,=d \stackrel{\mathrm{d}}{=} は「分布の意味で等しい」ことを表します。

ベルヌーイ分布の独立な和が二項分布と言えるわけですね。

二項分布の性質

二項分布の主な性質を列挙します。

二項分布 B(n,p) B(n,p)
確率 P(X=k)(k=0,1,,n) P(X=k)\, (k=0,1,\dots,n) nCkpk(1p)nk{}_n\mathrm{C}_k\, p^k (1-p)^{n-k}
分布の型離散型
累積分布関数 F(x)=P(Xx) F(x) = P(X\le x){0x<0,k=0xnCkpk(1p)nk0xn,1n<x. \displaystyle \begin{cases} 0 & x<0 ,\\ \sum_{k=0}^{\lfloor x \rfloor} {}_n\mathrm{C}_k \, p^k (1-p)^{n-k}& 0\le x \le n, \\ 1& n<x.\end{cases}
期待値 μ=E[X] \mu=E[X]np np
分散 σ2=V(X) \sigma^2=V(X) np(1p) np(1-p)
標準偏差 σ=V(X) \sigma=\sqrt{V(X)} np(1p) \sqrt{np(1-p) }
歪度 E[(Xμ)3]σ3 \frac{E[(X-\mu)^3]}{\sigma^3} 12pnp(1p) \frac{1-2p}{\sqrt{np(1-p)}}
尖度 E[(Xμ)4]σ43 \frac{E[(X-\mu)^4]}{\sigma^4} -316p(1p)np(1p) \frac{1-6p(1-p) }{np(1-p)}
積率母関数 E[etX] E[e^{tX}] (1p+pet)n (1-p+pe^t)^n
特性関数 E[eitX] E[e^{itX}] (1p+peit)n (1-p+pe^{it})^n
正規分布による近似(中心極限定理)p p を一定にして n n\to\infty とする
ポアソン分布による近似(ポアソンの少数の法則)λ=limnnpn \lambda =\lim_{n\to\infty} np_n として n n\to\infty とする

累積分布関数以降について,順番に考えていきましょう。

二項分布の累積分布関数(分布関数)

定理(二項分布の累積分布関数)

XB(n,p) X\sim B(n,p) であるとき,X X 累積分布関数(分布関数)

F(x)={0x<0,k=0xnCkpk(1p)nk0xn,1n<x. \small \color{red}F(x)=\begin{cases} 0 & x<0 ,\\ \sum_{k=0}^{\lfloor x \rfloor} {}_n\mathrm{C}_k \, p^k (1-p)^{n-k}& 0\le x \le n, \\ 1& n<x.\end{cases}


となる。ただし,x \lfloor x\rfloor 床関数(ガウス記号)を表す。

これは,F(x)=P(Xx)=k=0xP(X=k) F(x) = P(X\le x ) = \sum_{k=0}^{\lfloor x \rfloor} P(X=k) なので,明らかですね。

確率(質量)関数と,そのときの累積分布関数を左右に描画すると,以下のようになります。※以下は模式的なものであり,実際の累積分布関数は,床関数(ガウス記号)のグラフのような,不連続なものです。

二項分布の期待値・分散・標準偏差

定理(二項分布の期待値・分散・標準偏差)

XB(n,p) X\sim B(n,p) であるとき,X X の期待値・分散・標準偏差はそれぞれ

E[X]=np,V(X)=np(1p),V(X)=np(1p) \color{red}\begin{aligned} E[X]&= np, \\ V(X)&= np(1-p), \\ \sqrt{V(X)} &= \sqrt{np(1-p) } \end{aligned}


となる。

これの証明については,以下の記事で行っています。

二項分布の歪度・尖度

定理(二項分布の歪度・尖度)

XB(n,p) X\sim B(n,p) であるとき,X X の歪度・尖度はそれぞれ

E[(Xμ)3]σ3=12pnp(1p),E[(Xμ)4]σ43=16p(1p)np(1p) \color{red}\begin{aligned} \frac{E[(X-\mu)^3]}{\sigma^3}&= \frac{1-2p}{\sqrt{np(1-p)}},\\ \frac{E[(X-\mu)^4]}{\sigma^4}-3&= \frac{1-6p(1-p) }{np(1-p)} \end{aligned}


となる。ただし,μ=E[X],σ=V(X) \mu=E[X],\, \sigma=\sqrt{V(X)} である。

「歪度(わいど)」とは,分布がどれだけ非対称で歪んで(ゆがんで)いるかを表す指標で,「尖度(せんど)」とは,正規分布と比べて分布がどれだけ尖って(とがって)いるかを表す指標です。

これについては,以下の記事で解説しています。

二項分布の積率母関数(モーメント母関数)

定理(二項分布の積率母関数)

XB(n,p) X\sim B(n,p) であるとき,X X の積率母関数は

E[etX]=(1p+pet)n \color{red}E[e^{tX}] = (1-p+pe^t)^n


である。

これを証明してみましょう。

証明

E[etx]=k=0netkP(X=k)=k=0netknCkpk(1p)nk=k=0nnCk(pet)k(1p)nk\begin{aligned} E[e^{tx} ] &= \sum_{k=0}^n e^{tk} P(X=k) \\ &= \sum_{k=0}^n e^{tk} {}_n\mathrm{C}_k\, p^k (1-p)^{n-k} \\ &= \sum_{k=0}^n {}_n\mathrm{C}_k (pe^{t})^k (1-p)^{n-k} \\ \end{aligned}


であり,二項定理より,

k=0nnCk(pet)k(1p)nk=(1p+pet)n \sum_{k=0}^n {}_n\mathrm{C}_k (pe^{t})^k (1-p)^{n-k} =(1-p+pe^t)^n


がわかる。

証明終

また,確率変数 X,Y X, Y が独立であるとき, E[et(X+Y)]=E[etX]E[etY] \color{red} E[e^{t(X+Y)}] = E[e^{tX}]E[e^{tY}] であることを用いると,以下のような証明も可能です。

別証

XB(n,p) X\sim B(n,p) のとき,パラメータ p p に従う互いに独立なベルヌーイ分布 Xk(1kn) X_k \, (1\le k \le n) を用いて,

X=dX1+X2++Xn X\stackrel{\mathrm{d}}{=} X_1 + X_2 + \dots + X_n


とかける(=d \stackrel{\mathrm{d}}{=} は分布が等しいという意味)。

従って,

E[etX]=E[et(X1++Xn)]=E[etX1]n \begin{aligned}E[e^{tX}] &= E[e^{t(X_1+\dots+X_n)}] = E[e^{tX_1}]^n \end{aligned}


であり,ベルヌーイ分布の積率母関数は,E[etX1]=1p+pet E[e^{tX_1}]= 1-p+pe^t である(→ベルヌーイ分布とは~定義と性質の導出~)から,

E[etX]=(1p+pet)nE[e^{tX}] = (1-p+pe^t)^n


がわかる。

別証終

二項分布の特性関数

定理(二項分布の特性関数)

XB(n,p) X\sim B(n,p) であるとき,X X の特性関数は

E[eitX]=(1p+peit)n \color{red}E[e^{itX}] = (1-p+pe^{it})^n


である。

これの証明は,積率母関数のときとほぼ同じですが,一応確認してみましょう。

証明

E[eitx]=k=0neitkP(X=k)=k=0neitknCkpk(1p)nk=k=0nnCk(peit)k(1p)nk\begin{aligned} E[e^{itx} ] &= \sum_{k=0}^n e^{itk} P(X=k) \\ &= \sum_{k=0}^n e^{itk} {}_n\mathrm{C}_k\, p^k (1-p)^{n-k} \\ &= \sum_{k=0}^n {}_n\mathrm{C}_k (pe^{it})^k (1-p)^{n-k} \\ \end{aligned}


であり,二項定理より,

k=0nnCk(peit)k(1p)nk=(1p+peit)n \sum_{k=0}^n {}_n\mathrm{C}_k (pe^{it})^k (1-p)^{n-k} =(1-p+pe^{it})^n


がわかる。

証明終

また,確率変数 X,Y X, Y が独立であるとき, E[eit(X+Y)]=E[eitX]E[eitY] \color{red} E[e^{it(X+Y)}] = E[e^{itX}]E[e^{itY}] であることを用いると,積率母関数のときと同様に,以下のような証明も可能です。

別証

XB(n,p) X\sim B(n,p) のとき,パラメータ p p に従う互いに独立なベルヌーイ分布 Xk(1kn) X_k \, (1\le k \le n) を用いて,

X=dX1+X2++Xn X\stackrel{\mathrm{d}}{=} X_1 + X_2 + \dots + X_n


とかける(=d \stackrel{\mathrm{d}}{=} は分布が等しいという意味)。

従って,

E[eitX]=E[eit(X1++Xn)]=E[eitX1]n \begin{aligned}E[e^{itX}] &= E[e^{it(X_1+\dots+X_n)}] = E[e^{itX_1}]^n \end{aligned}


であり,ベルヌーイ分布の特性関数は,E[eitX1]=1p+peit E[e^{itX_1}]= 1-p+pe^{it} である(→ベルヌーイ分布とは~定義と性質の導出~)から,

E[eitX]=(1p+peit)nE[e^{itX}] = (1-p+pe^{it})^n


がわかる。

別証終

二項分布の正規分布による近似

np,np(1p) np, np(1-p) が十分大きいとき,二項分布 B(n,p) B(n,p) は,正規分布 N(np,np(1p)) N(np, np(1-p)) で近似できます。

以下は,p=0.4,n=50 p=0.4, \,n=50 のときに二項分布のグラフ(青)と該当する正規分布のグラフ(赤)を重ねたものです。

二項分布の正規分布による近似の具体例

良好に近似できていることが分かりますね。

厳密には,中心極限定理の話になります。

二項分布のポアソン分布による近似

以下の定理が知られています。

定理(ポアソンの少数の法則)

λ>0 \lambda>0 とし,XnB(n,pn) X_n \sim B(n, p_n ) とする。ただし,{pn} \{p_n\} limnnpn=λ \lim_{n\to\infty}np_n = \lambda をみたす (0,1)(0, 1 ) 値の数列である。

このとき,Xn X_n はパラメータ λ \lambda をもつポアソン分布に分布収束する。すなわち,l=0,1,2, l=0,1,2,\dots に対し,

limnP(Xn=l)=eλλll!. \color{red} \lim_{n\to\infty}P(X_n =l) = e^{-\lambda} \frac{\lambda^l}{l!}.

ラフに言うと,n n が十分大きく,pn p_n が十分小さいとき,ポアソン分布で近似できるということですね。

関連する記事