二項分布の定義と性質まとめ

二項分布は， $n$ 回コイン投げを行ったときに， $k$ 回表が出る確率を一般化したもので， $P(X=k) = {}_n \mathrm{C}_k p^{k}(1-p)^{n-k}$ となります。そんな二項分布について，その定義と性質を，図解を交えて分かりやすくまとめます。

二項分布の定義
1. 二項分布の定義と具体例
2. ベルヌーイ分布との関係
二項分布の性質
関連する記事

二項分布の定義

まずは，二項分布の定義と，具体例を確認していきましょう。

二項分布の定義と具体例

定義（二項分布）

$0<p<1 ,\,\, n$ は正の整数とする。 $k = 0,1,2,\dots, n$ に対して，

\color{red} P(X=k) = {}_n \mathrm{C}_k\, p^{k}(1-p)^{n-k}

となるとき，確率変数 $X$ はパラメータ $(n,p)$ に関する二項分布 (binomial distribution) に従うといい， $\color{red} X\sim B(n,p)$ とかく。

二項分布は，確率 $p$ で表が出るコインを $n$ 回投げたときの，表が出る回数をモデル化したものと言えます。

いくつか具体的な値を入れて，そのときの確率がどうなるか考えてみましょう。

まず， $\color{red} n=10$ と固定し， $\color{red} p=0.1,0.3, 0.5, 0.7, 0.9$ と変えたとき，横軸に $k \,\,(0\le k \le 10)$ ，縦軸に $P(X=k)$ をプロットしたグラフは，以下のようになります。

n=10, p=0.1,0.3,0.5,0.7,0.9 としたときの二項分布のグラフ

次に， $p$ を固定し， $n$ を変化させてみましょう。 $\color{red} p=0.4$ とし， $\color{red} n=10,20,30,40$ と変化させた場合の確率は，以下のようになります。

ベルヌーイ分布との関係

$B(n,p)$ において， $n=1$ のとき，これは「コインを1回投げただけ」に相当し， $\color{red} P(X=1)=p,\, P(X=0) = 1-p$ となります。これはベルヌーイ分布 (Bernoulli distribution) といいます。これについては，別途以下の記事を参照してください。

また逆に，二項分布は「コインを1回投げる」ということを $n$ 回繰り返すと考えることもできます。よって， $X\sim B(n,p)$ としたとき， $P(X_k=1) = p,\, P(X_k=0)=1-p$ となる互いに独立な $n$ 個のベルヌーイ分布 $X_1,X_2,\dots, X_n$ を用いて，

\color{red} X \stackrel{\mathrm{d}}{=} X_1 + X_2 + \dots + X_n

とかくことができます。ただし， $\stackrel{\mathrm{d}}{=}$ は「分布の意味で等しい」ことを表します。

ベルヌーイ分布の独立な和が二項分布と言えるわけですね。

二項分布の性質

二項分布の主な性質を列挙します。

	二項分布 $B(n,p)$
確率 $P(X=k)\, (k=0,1,\dots,n)$	${}_n\mathrm{C}_k\, p^k (1-p)^{n-k}$
分布の型	離散型
累積分布関数 $F(x) = P(X\le x)$	$\displaystyle \begin{cases} 0 & x<0 ,\\ \sum_{k=0}^{\lfloor x \rfloor} {}_n\mathrm{C}_k \, p^k (1-p)^{n-k}& 0\le x \le n, \\ 1& n<x.\end{cases}$
期待値 $\mu=E[X]$	$np$
分散 $\sigma^2=V(X)$	$np(1-p)$
標準偏差 $\sigma=\sqrt{V(X)}$	$\sqrt{np(1-p) }$
歪度 $\frac{E[(X-\mu)^3]}{\sigma^3}$	$\frac{1-2p}{\sqrt{np(1-p)}}$
尖度 $\frac{E[(X-\mu)^4]}{\sigma^4} -3$	$\frac{1-6p(1-p) }{np(1-p)}$
積率母関数 $E[e^{tX}]$	$(1-p+pe^t)^n$
特性関数 $E[e^{itX}]$	$(1-p+pe^{it})^n$
正規分布による近似(中心極限定理)	$p$ を一定にして $n\to\infty$ とする
ポアソン分布による近似(ポアソンの少数の法則)	$\lambda =\lim_{n\to\infty} np_n$ として $n\to\infty$ とする

累積分布関数以降について，順番に考えていきましょう。

二項分布の累積分布関数(分布関数)

定理（二項分布の累積分布関数）

$X\sim B(n,p)$ であるとき， $X$ の累積分布関数(分布関数)は

\small \color{red}F(x)=\begin{cases} 0 & x<0 ,\\ \sum_{k=0}^{\lfloor x \rfloor} {}_n\mathrm{C}_k \, p^k (1-p)^{n-k}& 0\le x \le n, \\ 1& n<x.\end{cases}

となる。ただし， $\lfloor x\rfloor$ は床関数(ガウス記号)を表す。

これは， $F(x) = P(X\le x ) = \sum_{k=0}^{\lfloor x \rfloor} P(X=k)$ なので，明らかですね。

確率(質量)関数と，そのときの累積分布関数を左右に描画すると，以下のようになります。※以下は模式的なものであり，実際の累積分布関数は，床関数(ガウス記号)のグラフのような，不連続なものです。

二項分布の期待値・分散・標準偏差

定理（二項分布の期待値・分散・標準偏差）

$X\sim B(n,p)$ であるとき， $X$ の期待値・分散・標準偏差はそれぞれ

\color{red}\begin{aligned} E[X]&= np, \\ V(X)&= np(1-p), \\ \sqrt{V(X)} &= \sqrt{np(1-p) } \end{aligned}

となる。

これの証明については，以下の記事で行っています。

二項分布の歪度・尖度

定理（二項分布の歪度・尖度）

$X\sim B(n,p)$ であるとき， $X$ の歪度・尖度はそれぞれ

\color{red}\begin{aligned} \frac{E[(X-\mu)^3]}{\sigma^3}&= \frac{1-2p}{\sqrt{np(1-p)}},\\ \frac{E[(X-\mu)^4]}{\sigma^4}-3&= \frac{1-6p(1-p) }{np(1-p)} \end{aligned}

となる。ただし， $\mu=E[X],\, \sigma=\sqrt{V(X)}$ である。

「歪度（わいど）」とは，分布がどれだけ非対称で歪んで（ゆがんで）いるかを表す指標で，「尖度（せんど）」とは，正規分布と比べて分布がどれだけ尖って（とがって）いるかを表す指標です。

これについては，以下の記事で解説しています。

二項分布の積率母関数(モーメント母関数)

定理（二項分布の積率母関数）

$X\sim B(n,p)$ であるとき， $X$ の積率母関数は

\color{red}E[e^{tX}] = (1-p+pe^t)^n

である。

これを証明してみましょう。

証明

\begin{aligned} E[e^{tx} ] &= \sum_{k=0}^n e^{tk} P(X=k) \\ &= \sum_{k=0}^n e^{tk} {}_n\mathrm{C}_k\, p^k (1-p)^{n-k} \\ &= \sum_{k=0}^n {}_n\mathrm{C}_k (pe^{t})^k (1-p)^{n-k} \\ \end{aligned}

であり，二項定理より，

\sum_{k=0}^n {}_n\mathrm{C}_k (pe^{t})^k (1-p)^{n-k} =(1-p+pe^t)^n

がわかる。

証明終

また，確率変数 $X, Y$ が独立であるとき， $\color{red} E[e^{t(X+Y)}] = E[e^{tX}]E[e^{tY}]$ であることを用いると，以下のような証明も可能です。

別証

$X\sim B(n,p)$ のとき，パラメータ $p$ に従う互いに独立なベルヌーイ分布 $X_k \, (1\le k \le n)$ を用いて，

X\stackrel{\mathrm{d}}{=} X_1 + X_2 + \dots + X_n

とかける（ $\stackrel{\mathrm{d}}{=}$ は分布が等しいという意味）。

従って，

\begin{aligned}E[e^{tX}] &= E[e^{t(X_1+\dots+X_n)}] = E[e^{tX_1}]^n \end{aligned}

であり，ベルヌーイ分布の積率母関数は， $E[e^{tX_1}]= 1-p+pe^t$ である(→ベルヌーイ分布とは～定義と性質の導出～)から，

E[e^{tX}] = (1-p+pe^t)^n

がわかる。

別証終

二項分布の特性関数

定理（二項分布の特性関数）

$X\sim B(n,p)$ であるとき， $X$ の特性関数は

\color{red}E[e^{itX}] = (1-p+pe^{it})^n

である。

これの証明は，積率母関数のときとほぼ同じですが，一応確認してみましょう。

証明

\begin{aligned} E[e^{itx} ] &= \sum_{k=0}^n e^{itk} P(X=k) \\ &= \sum_{k=0}^n e^{itk} {}_n\mathrm{C}_k\, p^k (1-p)^{n-k} \\ &= \sum_{k=0}^n {}_n\mathrm{C}_k (pe^{it})^k (1-p)^{n-k} \\ \end{aligned}

であり，二項定理より，

\sum_{k=0}^n {}_n\mathrm{C}_k (pe^{it})^k (1-p)^{n-k} =(1-p+pe^{it})^n

がわかる。

証明終

また，確率変数 $X, Y$ が独立であるとき， $\color{red} E[e^{it(X+Y)}] = E[e^{itX}]E[e^{itY}]$ であることを用いると，積率母関数のときと同様に，以下のような証明も可能です。

別証

$X\sim B(n,p)$ のとき，パラメータ $p$ に従う互いに独立なベルヌーイ分布 $X_k \, (1\le k \le n)$ を用いて，

X\stackrel{\mathrm{d}}{=} X_1 + X_2 + \dots + X_n

とかける（ $\stackrel{\mathrm{d}}{=}$ は分布が等しいという意味）。

従って，

\begin{aligned}E[e^{itX}] &= E[e^{it(X_1+\dots+X_n)}] = E[e^{itX_1}]^n \end{aligned}

であり，ベルヌーイ分布の特性関数は， $E[e^{itX_1}]= 1-p+pe^{it}$ である(→ベルヌーイ分布とは～定義と性質の導出～)から，

E[e^{itX}] = (1-p+pe^{it})^n

がわかる。

別証終

二項分布の正規分布による近似

$np, np(1-p)$ が十分大きいとき，二項分布 $B(n,p)$ は，正規分布 $N(np, np(1-p))$ で近似できます。

以下は， $p=0.4, \,n=50$ のときに二項分布のグラフ（青）と該当する正規分布のグラフ（赤）を重ねたものです。

良好に近似できていることが分かりますね。

厳密には，中心極限定理の話になります。

二項分布のポアソン分布による近似

以下の定理が知られています。

定理（ポアソンの少数の法則）

$\lambda>0$ とし， $X_n \sim B(n, p_n )$ とする。ただし， $\{p_n\}$ は $\lim_{n\to\infty}np_n = \lambda$ をみたす $(0, 1 )$ 値の数列である。

このとき， $X_n$ はパラメータ $\lambda$ をもつポアソン分布に分布収束する。すなわち， $l=0,1,2,\dots$ に対し，

\color{red} \lim_{n\to\infty}P(X_n =l) = e^{-\lambda} \frac{\lambda^l}{l!}.

ラフに言うと， $n$ が十分大きく， $p_n$ が十分小さいとき，ポアソン分布で近似できるということですね。

二項分布の定義

二項分布の定義と具体例

ベルヌーイ分布との関係

二項分布の性質

二項分布の累積分布関数(分布関数)

二項分布の期待値・分散・標準偏差

二項分布の歪度・尖度

二項分布の積率母関数(モーメント母関数)

二項分布の特性関数

二項分布の正規分布による近似

二項分布のポアソン分布による近似

関連する記事