PR

幾何分布の定義と性質まとめ

確率論
記事内に広告が含まれています。

幾何分布とは,確率 p で表が出るコインを何回も投げたときに,初めて表が出るのは何回目になるかの分布を表す,離散型確率変数です。これについて,その定義と性質を掘り下げていきましょう。

幾何分布の定義

定義(幾何分布)

X を確率変数, 0<p<1 とする。 k=1,2,3,\ldots に対し,

\color{red} P(X=k) = (1-p)^{k-1} p


が成立するとき, X はパラメータ p幾何分布 (geometric distribution) に従うという。本記事では,これを \color{red} X\sim \operatorname{Geo}(p) とかくことにする。

幾何分布は,確率 p で表が出るコインを投げたときに,初めて表が出るのは何回目かを表す分布といえます。

幾何分布におけるコイン投げの図

実際,k 回目に初めて表が出る確率は,最初の k-1 回は 1-p の確率で起こる「裏」が出続けて,最後の 1 回に,確率 p の確率で起こる「表」が出るため,確率は (1-p)^{k-1} p になりますね。

たとえば,サイコロを複数回振ったとき, X 回目に初めて1の目が出るとすると, X \sim \operatorname{Geo}(1/6) となります。

p=0.3 のときの P(X=k) を図示すると,以下のようになります。

p=0.3のときの幾何分布の確率(質量)関数

また, \color{red} p=0.1, 0.3, 0.5, 0.7 と変えたときの,確率の P(X=k) の違いは,以下のようになります。

p=0.1,0.3,0.5,0.7と変えたときの,幾何分布の確率(質量)関数の違い

幾何分布の性質まとめ

幾何分布の性質を列挙しましょう。

性質幾何分布 \operatorname{ Geo}(p)
確率 P(X=k) = (1-p)^{k-1} p \,\;(k=1,2,3,\ldots)
確率の型離散型
累積分布関数 F(x) = P(X\le x) \begin{cases} 0 & x<1 , \\ 1-(1-p)^{\lfloor x \rfloor} & x\ge 1 \end{cases}
ベルヌーイ分布との関係 \inf\{ n\mid X_n = 1\}
期待値(平均) E[X] \dfrac{1}{p}
分散 V(X) \dfrac{1-p}{p^2 }
標準偏差 \sqrt{V(X)} \dfrac{\sqrt{1-p}}{p}
積率母関数(モーメント母関数) E[e^{tX}] \dfrac{pe^{t}}{1-(1-p)e^t}, \;\; t< -\log(1-p)
特性関数 E[e^{itX}]\dfrac{pe^{it}}{1-(1-p)e^{it}}
無記憶性 P(X>m+n\,|\, X>m ) =P(X>n)

以上について,累積分布関数以降を,順番に紹介していきましょう。

幾何分布の累積分布関数(分布関数)

幾何分布の累積分布関数(分布関数)は,

\begin{aligned}P(X\le x) &= \sum_{k\le x} P(X=k) \\ &= \begin{cases} 0 & x < 1, \\ \sum_{k=1}^{\lfloor x \rfloor} (1-p)^{k-1} p & x \ge 1\end{cases} \\ &= \begin{cases} 0 & x< 1, \\ \frac{1-(1-p)^{\lfloor x \rfloor}}{1-(1-p)}p & x\ge 1 \end{cases} \\ &= \begin{cases} 0 & x<1 , \\ 1-(1-p)^{\lfloor x \rfloor} & x\ge 1 \end{cases} \end{aligned}


となります。 p=0.3 のときの累積分布関数をグラフで描くと,以下のようになります。(※ 以下は模式的なもので,実際のグラフは床関数(ガウス記号)のグラフのように,不連続な関数になります)

幾何分布の累積分布関数

また, \color{red} p=0.1, 0.3, 0.5, 0.7 と変えたときの,累積分布関数の違いは,以下のようになります。

p が大きいほど,グラフが「上」になりますね。

幾何分布のベルヌーイ分布との関係

幾何分布は「確率 p で表が出るコインにおいて,初めて表が出る試行回数」と思えるのでした。

一方,ベルヌーイ分布は「確率 p で表が出るコインを一回投げたときに,表が出るかどうか」をモデル化したものであり, Y をパラメータ p のベルヌーイ分布に従う確率変数とすると, P(Y=1)=p, \,\, P(Y=0) = 1-p でした。

よって,幾何分布は,独立な,パラメータ p のベルヌーイ分布に従う確率変数 X_1, X_2, \ldots において, X_1=X_2=\dots = X_{n-1}=0,\, X_n=1 となるときの n の値だということができますね。したがって,

\color{red} X \stackrel{\mathrm{d}}{=}\inf\{ n\mid X_n = 1\}


が成り立つわけです。(ただし, \stackrel{\mathrm{d}}{=} は分布の意味で等しいことを意味します。)

幾何分布の期待値(平均)・分散・標準偏差

定理(幾何分布の期待値(平均)・分散・標準偏差)

X \sim \operatorname{Geo}(p) とする。このとき, X の期待値・分散・標準偏差はそれぞれ

\color{red} \begin{aligned}E[X] &= \dfrac{1}{p}, \\ V(X)&= \dfrac{1-p}{p^2 }, \\ \sqrt{V(X)} &= \dfrac{\sqrt{1-p}}{p} \end{aligned}


である。

これの証明は,以下の記事で与えています。

幾何分布の積率母関数・特性関数

定理(幾何分布の積率母関数・特性関数)

X \sim \operatorname{Geo}(p) とする。このとき,幾何分布の積率母関数(モーメント母関数)・特性関数はそれぞれ

\color{red}\begin{aligned} E[e^{tX}] &=\dfrac{pe^{t}}{1-(1-p)e^t}, \quad t< -\log(1-p), \\ E[e^{itX}]&= \dfrac{pe^{it}}{1-(1-p)e^{it}}, \quad t\in\mathbb{R} \end{aligned}


である。

積率母関数・特性関数は,それぞれラプラス変換・フーリエ変換に対応しています。証明は,以下の記事で行っています。

幾何分布の無記憶性

幾何分布には「無記憶性」と呼ばれる,以下の性質があります。

定理(幾何分布の無記憶性)

X \sim \operatorname{Geo}(p) とし, n,m \ge 1 を正の整数とする。このとき,

\color{red}P(X>m+n\,|\, X>m ) =P(X>n)


である。これを無記憶性 (lack of memory property, memorylessness) という。

逆に,無記憶性をもつ離散型の確率分布は幾何分布に限る。

「無記憶性」とは,以前までの結果が後の結果に影響を与えないことを指します。幾何分布は,「コインで初めて表が出るまでにコインを投げる回数」をモデル化したものでしたが,たとえば, k 回目「裏」だったからと言って, k+1 回目に「表」になる確率が上がるわけではありませんね。それまでの試行は,以降の試行に関係ないわけです。

また逆に,無記憶性をもつ離散型確率分布は幾何分布に限るわけですから,離散型の確率分布で,無記憶性をもつものをモデル化したいときは,幾何分布が最適だということにもなります。

これについて詳しくは,以下の記事を参照してください。

なお,連続型確率変数においては,指数分布のみが無記憶性をもつことが知られています。これについては,指数分布の無記憶性とその証明を参照してください。

その他の確率分布