二項分布は,n 回コイン投げを行ったときに,k 回表が出る確率を一般化したもので,P(X=k)=nCkpk(1−p)n−k となります。そんな二項分布について,その定義と性質を,図解を交えて分かりやすくまとめます。
二項分布の定義
まずは,二項分布の定義と,具体例を確認していきましょう。
二項分布の定義と具体例
定義(二項分布)
0<p<1,n は正の整数とする。k=0,1,2,…,n に対して,
P(X=k)=nCkpk(1−p)n−k
となるとき,確率変数 X はパラメータ (n,p) に関する二項分布 (binomial distribution) に従うといい,X∼B(n,p) とかく。
二項分布は,確率 p で表が出るコインを n 回投げたときの,表が出る回数をモデル化したものと言えます。
いくつか具体的な値を入れて,そのときの確率がどうなるか考えてみましょう。
まず,n=10 と固定し,p=0.1,0.3,0.5,0.7,0.9 と変えたとき,横軸に k(0≤k≤10),縦軸に P(X=k) をプロットしたグラフは,以下のようになります。
次に,p を固定し,n を変化させてみましょう。p=0.4 とし,n=10,20,30,40 と変化させた場合の確率は,以下のようになります。
ベルヌーイ分布との関係
B(n,p) において,n=1 のとき,これは「コインを1回投げただけ」に相当し, P(X=1)=p,P(X=0)=1−p となります。これはベルヌーイ分布 (Bernoulli distribution) といいます。これについては,別途以下の記事を参照してください。
また逆に,二項分布は「コインを1回投げる」ということを n 回繰り返すと考えることもできます。よって,X∼B(n,p) としたとき,P(Xk=1)=p,P(Xk=0)=1−p となる互いに独立な n 個のベルヌーイ分布 X1,X2,…,Xn を用いて,
X=dX1+X2+⋯+Xn
とかくことができます。 ただし,=d は「分布の意味で等しい」ことを表します。
ベルヌーイ分布の独立な和が二項分布と言えるわけですね。
二項分布の性質
二項分布の主な性質を列挙します。
| 二項分布 B(n,p) |
---|
確率 P(X=k)(k=0,1,…,n) | nCkpk(1−p)n−k |
分布の型 | 離散型 |
累積分布関数 F(x)=P(X≤x) | ⎩⎨⎧0∑k=0⌊x⌋nCkpk(1−p)n−k1x<0,0≤x≤n,n<x. |
期待値 μ=E[X] | np |
分散 σ2=V(X) | np(1−p) |
標準偏差 σ=V(X) | np(1−p) |
歪度 σ3E[(X−μ)3] | np(1−p)1−2p |
尖度 σ4E[(X−μ)4]−3 | np(1−p)1−6p(1−p) |
積率母関数 E[etX] | (1−p+pet)n |
特性関数 E[eitX] | (1−p+peit)n |
正規分布による近似(中心極限定理) | p を一定にして n→∞ とする |
ポアソン分布による近似(ポアソンの少数の法則) | λ=limn→∞npn として n→∞ とする |
累積分布関数以降について,順番に考えていきましょう。
二項分布の累積分布関数(分布関数)
定理(二項分布の累積分布関数)
X∼B(n,p) であるとき,X の累積分布関数(分布関数)は
F(x)=⎩⎨⎧0∑k=0⌊x⌋nCkpk(1−p)n−k1x<0,0≤x≤n,n<x.
となる。ただし,⌊x⌋ は床関数(ガウス記号)を表す。
これは,F(x)=P(X≤x)=∑k=0⌊x⌋P(X=k) なので,明らかですね。
確率(質量)関数と,そのときの累積分布関数を左右に描画すると,以下のようになります。※以下は模式的なものであり,実際の累積分布関数は,床関数(ガウス記号)のグラフのような,不連続なものです。
二項分布の期待値・分散・標準偏差
定理(二項分布の期待値・分散・標準偏差)
X∼B(n,p) であるとき,X の期待値・分散・標準偏差はそれぞれ
E[X]V(X)V(X)=np,=np(1−p),=np(1−p)
となる。
これの証明については,以下の記事で行っています。
二項分布の歪度・尖度
定理(二項分布の歪度・尖度)
X∼B(n,p) であるとき,X の歪度・尖度はそれぞれ
σ3E[(X−μ)3]σ4E[(X−μ)4]−3=np(1−p)1−2p,=np(1−p)1−6p(1−p)
となる。ただし,μ=E[X],σ=V(X) である。
「歪度(わいど)」とは,分布がどれだけ非対称で歪んで(ゆがんで)いるかを表す指標で,「尖度(せんど)」とは,正規分布と比べて分布がどれだけ尖って(とがって)いるかを表す指標です。
これについては,以下の記事で解説しています。
二項分布の積率母関数(モーメント母関数)
定理(二項分布の積率母関数)
X∼B(n,p) であるとき,X の積率母関数は
E[etX]=(1−p+pet)n
である。
これを証明してみましょう。
証明
E[etx]=k=0∑netkP(X=k)=k=0∑netknCkpk(1−p)n−k=k=0∑nnCk(pet)k(1−p)n−k
であり,二項定理より,
k=0∑nnCk(pet)k(1−p)n−k=(1−p+pet)n
がわかる。
証明終
また,確率変数 X,Y が独立であるとき, E[et(X+Y)]=E[etX]E[etY] であることを用いると,以下のような証明も可能です。
別証
X∼B(n,p) のとき,パラメータ p に従う互いに独立なベルヌーイ分布 Xk(1≤k≤n) を用いて,
X=dX1+X2+⋯+Xn
とかける(=d は分布が等しいという意味)。
従って,
E[etX]=E[et(X1+⋯+Xn)]=E[etX1]n
であり,ベルヌーイ分布の積率母関数は,E[etX1]=1−p+pet である(→ベルヌーイ分布とは~定義と性質の導出~)から,
E[etX]=(1−p+pet)n
がわかる。
別証終
二項分布の特性関数
定理(二項分布の特性関数)
X∼B(n,p) であるとき,X の特性関数は
E[eitX]=(1−p+peit)n
である。
これの証明は,積率母関数のときとほぼ同じですが,一応確認してみましょう。
証明
E[eitx]=k=0∑neitkP(X=k)=k=0∑neitknCkpk(1−p)n−k=k=0∑nnCk(peit)k(1−p)n−k
であり,二項定理より,
k=0∑nnCk(peit)k(1−p)n−k=(1−p+peit)n
がわかる。
証明終
また,確率変数 X,Y が独立であるとき, E[eit(X+Y)]=E[eitX]E[eitY] であることを用いると,積率母関数のときと同様に,以下のような証明も可能です。
別証
X∼B(n,p) のとき,パラメータ p に従う互いに独立なベルヌーイ分布 Xk(1≤k≤n) を用いて,
X=dX1+X2+⋯+Xn
とかける(=d は分布が等しいという意味)。
従って,
E[eitX]=E[eit(X1+⋯+Xn)]=E[eitX1]n
であり,ベルヌーイ分布の特性関数は,E[eitX1]=1−p+peit である(→ベルヌーイ分布とは~定義と性質の導出~)から,
E[eitX]=(1−p+peit)n
がわかる。
別証終
二項分布の正規分布による近似
np,np(1−p) が十分大きいとき,二項分布 B(n,p) は,正規分布 N(np,np(1−p)) で近似できます。
以下は,p=0.4,n=50 のときに二項分布のグラフ(青)と該当する正規分布のグラフ(赤)を重ねたものです。
良好に近似できていることが分かりますね。
厳密には,中心極限定理の話になります。
二項分布のポアソン分布による近似
以下の定理が知られています。
定理(ポアソンの少数の法則)
λ>0 とし,Xn∼B(n,pn) とする。ただし,{pn} は limn→∞npn=λ をみたす (0,1) 値の数列である。
このとき,Xn はパラメータ λ をもつポアソン分布に分布収束する。すなわち,l=0,1,2,… に対し,
n→∞limP(Xn=l)=e−λl!λl.
ラフに言うと,n が十分大きく,pn が十分小さいとき,ポアソン分布で近似できるということですね。
関連する記事