確率論における,累積分布関数(もしくは単に分布関数ともいう)は,F(x)=P(X≤x) と定義されます。これについて,その例と性質7つを紹介します。
累積分布関数(分布関数)の定義
まずはもう一度,定義をちゃんと述べておきましょう。
定義(累積分布関数;分布関数)
X を実数値確率変数とする。このとき,
F(x)=P(X≤x)=P(X∈(−∞,x])
を累積分布関数 (cumulative distribution function; CDF) または単に分布関数 (distribution function) という。
測度論的確率論では,単に「分布関数」ということの方が多いです。
もし X が連続型確率分布であり,その確率密度関数を p(x) とすると,
F(x)=P(X∈(−∞,x])=∫−∞xp(x)dx
すなわち,確率密度関数の不定積分になるわけですね。
累積分布関数(分布関数)の例
例を3つ挙げましょう。
離散一様分布の累積分布関数
P(X=k)=n1(k=1,2,…,n)
となる離散一様分布を考えましょう。これについて,累積分布関数は,
F(x)=P(X≤x)=k≤x∑P(X=k)=n⌊x⌋
とかけます。ただし,⌊x⌋は床関数(ガウス記号)を表します。図で描くと,以下の通りです。
離散型の確率変数の場合は,累積分布関数は不連続な関数になります。
離散一様分布の詳細については,一様分布の定義と性質のわかりやすいまとめ~離散型・連続型~を参照してください。
連続一様分布の累積分布関数
確率密度関数が p(x)=⎩⎨⎧b−a10a≤x≤b,otherwise となる連続一様分布を考えましょう。これについて,累積分布関数は,
F(x)=∫−∞xp(x)dx=⎩⎨⎧0b−ax−a1x≤a,a≤x≤b,b≤x
となります。図で描くと,下のようになります。
連続一様分布の詳細については,一様分布の定義と性質のわかりやすいまとめ~離散型・連続型~を確認してください。
指数分布の累積分布関数
確率密度関数が p(x)={λe−λx0x≥0,x<0 となる指数分布を考えましょう。これについて,累積分布関数は,
F(x)=∫−∞xp(x)dx={01−e−λxx<0,x≥0
となります。グラフで描くと,以下のようになります。
指数分布については,指数分布の定義と例と性質まとめで解説しています。
累積分布関数(分布関数)の性質7つ
さて,今回考える累積分布関数の性質7つを紹介しましょう。
定理(累積分布関数の性質)
F を累積分布関数とするとき,
- F は広義単調増加である。
- F(−∞)=limx→−∞F(x)=0,F(∞)=limx→∞F(x)=1.
- F は右連続である。
- F の不連続点は高々可算個である。
- 確率密度関数 p(x) が存在するとき,F は連続である。
- P(a<X≤b)=F(b)−F(a),P(a≤X≤b)=F(b)−F(a−). ただし,F(a−)=limx→a−F(x) と定義する。
- P(X≥0)=1 (すなわち F(0−)=0 )のとき,E[X]=∫0∞(1−F(x))dx∈[0,∞].
順番に考えていきましょう。
1. 累積分布関数が広義単調増加であること
これは,x<y とすると,
F(x)=P(X≤x)≤P(X≤y)=F(y)
なので,明らかでしょう。
2. F(-∞)=0, F(∞)=1 であること
2. F(−∞)=limx→−∞F(x)=0,F(∞)=limx→∞F(x)=1.
証明
X は実数値確率変数なので,
x→−∞limF(x)=x→−∞limP(X≤x)=P(X≤−∞)=0
であり,
x→∞limF(x)=x→∞limP(X≤x)=P(X≤∞)=1
である。
証明終
3. 累積分布関数は右連続であること
3. F は右連続である。
証明
a<x としよう。このとき,
x→a+limF(x)=x→a+limP(X≤x)=P(X≤a)=F(a)
であるから,F は右連続である。
証明終
4. 累積分布関数の不連続点が高々可算個であること
4. F の不連続点は高々可算個である。
これについては,F の単調性(性質1)から,「単調な関数の不連続点は高々可算個である」というFrodaの定理が適用できるため,従います。Frodaの定理については,以下の記事を参照してください。
5. 確率密度関数が存在するとき,累積分布関数が連続であること
5. 確率密度関数 p(x) が存在するとき,F は連続である。
これは,
F(x)=P(X≤x)=∫−∞xp(y)dy
と積分表示できることから,明らかですね。
6. P(a<X≤b) = F(b)-F(a), P(a≤X≤b) = F(b)-F(a-)
6. P(a<X≤b)=F(b)−F(a),P(a≤X≤b)=F(b)−F(a−). ただし,F(a−)=limx→a−F(x) と定義する。
証明
前半は
F(b)−F(a)=P(X≤b)−P(X≤a)=P(a<X≤b)
より。後半について,x<a とすると,
F(a−)=x→a−limP(X≤x)=P(X<a)
であることから,
F(b)−F(a−)=P(X≤b)−P(X<a)=P(a≤X≤b)
となって従う。
証明終
なお,F(x−)=P(X<x) となることから,この関数は左連続になります。
7. 期待値の累積分布関数による表現
7. P(X≥0)=1 (すなわち F(0−)=0 )のとき,E[X]=∫0∞(1−F(x))dx∈[0,∞].
これは,いわゆる部分積分公式と言えます。証明には,少し高度な知識が必要です。
なお,1−F が積分可能なことは,F の単調性と,「単調な関数は積分可能」であることから,大丈夫です(→ リーマン和による定積分の定義とリーマン積分可能・不可能な例)。
証明
確率 1 で X≥0 であることと,F が広義単調増加であること(性質1)から,
∫0∞(1−F(x))dx=∫0∞∫x∞dF(y)dx=∫0∞∫0ydxdF(y)=∫0∞ydF(y)=E[X].
ただし,dF(y) はリーマン-スティルチェス積分である。
証明終
全ての性質が証明できましたね。