幾何分布の定義と性質まとめ

幾何分布とは，確率 $p$ で表が出るコインを何回も投げたときに，初めて表が出るのは何回目になるかの分布を表す，離散型確率変数です。これについて，その定義と性質を掘り下げていきましょう。

幾何分布の定義
幾何分布の性質まとめ
その他の確率分布

幾何分布の定義

定義（幾何分布）

$X$ を確率変数， $0<p<1$ とする。 $k=1,2,3,\ldots$ に対し，

$\color{red} P(X=k) = (1-p)^{k-1} p$

が成立するとき， $X$ はパラメータ $p$ の幾何分布 (geometric distribution) に従うという。本記事では，これを $\color{red} X\sim \operatorname{Geo}(p)$ とかくことにする。

幾何分布は，確率 $p$ で表が出るコインを投げたときに，初めて表が出るのは何回目かを表す分布といえます。

実際， $k$ 回目に初めて表が出る確率は，最初の $k-1$ 回は $1-p$ の確率で起こる「裏」が出続けて，最後の $1$ 回に，確率 $p$ の確率で起こる「表」が出るため，確率は $(1-p)^{k-1} p$ になりますね。

たとえば，サイコロを複数回振ったとき， $X$ 回目に初めて1の目が出るとすると， $X \sim \operatorname{Geo}(1/6)$ となります。

$p=0.3$ のときの $P(X=k)$ を図示すると，以下のようになります。

また， $\color{red} p=0.1, 0.3, 0.5, 0.7$ と変えたときの，確率の $P(X=k)$ の違いは，以下のようになります。

p=0.1,0.3,0.5,0.7と変えたときの，幾何分布の確率(質量)関数の違い

幾何分布の性質まとめ

幾何分布の性質を列挙しましょう。

性質	幾何分布 $\operatorname{ Geo}(p)$
確率	$P(X=k) = (1-p)^{k-1} p \,\;(k=1,2,3,\ldots)$
確率の型	離散型
累積分布関数 $F(x) = P(X\le x)$	$\begin{cases} 0 & x<1 , \\ 1-(1-p)^{\lfloor x \rfloor} & x\ge 1 \end{cases}$
ベルヌーイ分布との関係	$\inf\{ n\mid X_n = 1\}$
期待値(平均) $E[X]$	$\dfrac{1}{p}$
分散 $V(X)$	$\dfrac{1-p}{p^2 }$
標準偏差 $\sqrt{V(X)}$	$\dfrac{\sqrt{1-p}}{p}$
積率母関数(モーメント母関数) $E[e^{tX}]$	$\dfrac{pe^{t}}{1-(1-p)e^t}, \;\; t< -\log(1-p)$
特性関数 $E[e^{itX}]$	$\dfrac{pe^{it}}{1-(1-p)e^{it}}$
無記憶性	$P(X>m+n\,\|\, X>m ) =P(X>n)$

以上について，累積分布関数以降を，順番に紹介していきましょう。

幾何分布の累積分布関数(分布関数)

幾何分布の累積分布関数(分布関数)は，

$\begin{aligned}P(X\le x) &= \sum_{k\le x} P(X=k) \\ &= \begin{cases} 0 & x < 1, \\ \sum_{k=1}^{\lfloor x \rfloor} (1-p)^{k-1} p & x \ge 1\end{cases} \\ &= \begin{cases} 0 & x< 1, \\ \frac{1-(1-p)^{\lfloor x \rfloor}}{1-(1-p)}p & x\ge 1 \end{cases} \\ &= \begin{cases} 0 & x<1 , \\ 1-(1-p)^{\lfloor x \rfloor} & x\ge 1 \end{cases} \end{aligned}$

となります。 $p=0.3$ のときの累積分布関数をグラフで描くと，以下のようになります。（※ 以下は模式的なもので，実際のグラフは床関数(ガウス記号)のグラフのように，不連続な関数になります）

また， $\color{red} p=0.1, 0.3, 0.5, 0.7$ と変えたときの，累積分布関数の違いは，以下のようになります。

$p$ が大きいほど，グラフが「上」になりますね。

幾何分布のベルヌーイ分布との関係

幾何分布は「確率 $p$ で表が出るコインにおいて，初めて表が出る試行回数」と思えるのでした。

一方，ベルヌーイ分布は「確率 $p$ で表が出るコインを一回投げたときに，表が出るかどうか」をモデル化したものであり， $Y$ をパラメータ $p$ のベルヌーイ分布に従う確率変数とすると， $P(Y=1)=p, \,\, P(Y=0) = 1-p$ でした。

よって，幾何分布は，独立な，パラメータ $p$ のベルヌーイ分布に従う確率変数 $X_1, X_2, \ldots$ において， $X_1=X_2=\dots = X_{n-1}=0,\, X_n=1$ となるときの $n$ の値だということができますね。したがって，

$\color{red} X \stackrel{\mathrm{d}}{=}\inf\{ n\mid X_n = 1\}$

が成り立つわけです。（ただし， $\stackrel{\mathrm{d}}{=}$ は分布の意味で等しいことを意味します。）

幾何分布の期待値(平均)・分散・標準偏差

定理（幾何分布の期待値(平均)・分散・標準偏差）

$X \sim \operatorname{Geo}(p)$ とする。このとき， $X$ の期待値・分散・標準偏差はそれぞれ

$\color{red} \begin{aligned}E[X] &= \dfrac{1}{p}, \\ V(X)&= \dfrac{1-p}{p^2 }, \\ \sqrt{V(X)} &= \dfrac{\sqrt{1-p}}{p} \end{aligned}$

である。

これの証明は，以下の記事で与えています。

幾何分布の積率母関数・特性関数

定理（幾何分布の積率母関数・特性関数）

$X \sim \operatorname{Geo}(p)$ とする。このとき，幾何分布の積率母関数(モーメント母関数)・特性関数はそれぞれ

$\color{red}\begin{aligned} E[e^{tX}] &=\dfrac{pe^{t}}{1-(1-p)e^t}, \quad t< -\log(1-p), \\ E[e^{itX}]&= \dfrac{pe^{it}}{1-(1-p)e^{it}}, \quad t\in\mathbb{R} \end{aligned}$

である。

積率母関数・特性関数は，それぞれラプラス変換・フーリエ変換に対応しています。証明は，以下の記事で行っています。

幾何分布の無記憶性

幾何分布には「無記憶性」と呼ばれる，以下の性質があります。

定理（幾何分布の無記憶性）

$X \sim \operatorname{Geo}(p)$ とし， $n,m \ge 1$ を正の整数とする。このとき，

$\color{red}P(X>m+n\,|\, X>m ) =P(X>n)$

である。これを無記憶性 (lack of memory property, memorylessness) という。

逆に，無記憶性をもつ離散型の確率分布は幾何分布に限る。

「無記憶性」とは，以前までの結果が後の結果に影響を与えないことを指します。幾何分布は，「コインで初めて表が出るまでにコインを投げる回数」をモデル化したものでしたが，たとえば， $k$ 回目「裏」だったからと言って， $k+1$ 回目に「表」になる確率が上がるわけではありませんね。それまでの試行は，以降の試行に関係ないわけです。

また逆に，無記憶性をもつ離散型確率分布は幾何分布に限るわけですから，離散型の確率分布で，無記憶性をもつものをモデル化したいときは，幾何分布が最適だということにもなります。

これについて詳しくは，以下の記事を参照してください。