PR

正規分布の標準化とその証明

確率論
記事内に広告が含まれています。

X\sim N(\mu, \sigma^2) のとき, Z = \dfrac{X-\mu}{\sigma} とスケール変換すると, Z\sim N(0,1) になります。これを,正規分布の標準化といいます。これについて詳しく述べ,証明しましょう。

正規分布の標準化

定理(正規分布の標準化)

X\sim N(\mu, \sigma^2) とするとき,

\large\color{red} Z = \frac{X-\mu}{\sigma}


とすると, Z\sim N(0,1) になる。

正規分布の標準化 (standardization) とは, N(\mu,\sigma^2) (平均 \mu,分散 \sigma^2の正規分布)に従う確率変数を,変換によって N(0,1) (平均 0,分散 1の標準正規分布)に従うようにすることです。

正規分布を標準化すれば,標準正規分布表を利用することができますから,統計学においては,何かと便利です。

なお一般に, E[aX+b] = aE[X]+b, \; V(aX+b) = a^2 V(X) ですから,

\begin{aligned}& E[X] =\mu, \quad V(X) = \sigma^2 \\ &\implies E[Z] = 0,\quad V(Z) = 1\end{aligned}


となることは明らかです。ここで大切なのは,単に Z の期待値・分散が 0, 1 になることではなく, Z がちゃんと再び正規分布に従うことです。

これについて,証明してみましょう.

正規分布の標準化の証明

正規分布 N(\mu, \sigma^2 ) の確率密度関数 p(x)

p(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}


となることを思い出しましょう。

証明

a<b に対し, P(a\le Z\le b) を考える。 X\sim N(\mu,\sigma^2) であるから,

\begin{aligned} P(a\le Z\le b) &= P(a\le \frac{X-\mu}{\sigma}\le b) \\ &= P(\mu+\sigma a \le X \le \mu+\sigma b) \\ &= \frac{1}{\sqrt{2\pi\sigma^2}}\int_{\mu+\sigma a}^{\mu+\sigma b} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \, dx. \end{aligned}


ここで, z = \dfrac{x-\mu}{\sigma} とおいて置換積分すると,

\begin{aligned} &\frac{1}{\sqrt{2\pi\sigma^2}}\int_{\mu+\sigma a}^{\mu+\sigma b} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \, dx \\ &= \frac{1}{\sqrt{2\pi\sigma^2}}\int_{a}^{b} e^{-\frac{z^2}{2}} \, \sigma dz \\ &= \frac{1}{\sqrt{2\pi}}\int_{a}^{b} e^{-\frac{z^2}{2}} \, dz \end{aligned}


であるから, Z の確率密度関数は \frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}} となる。これは, Z\sim N(0,1) を意味する。

証明終

正規分布に関する記事