X\sim N(\mu, \sigma^2) のとき, Z = \dfrac{X-\mu}{\sigma} とスケール変換すると, Z\sim N(0,1) になります。これを,正規分布の標準化といいます。これについて詳しく述べ,証明しましょう。
正規分布の標準化
定理(正規分布の標準化)
X\sim N(\mu, \sigma^2) とするとき,
\large\color{red} Z = \frac{X-\mu}{\sigma}
とすると, Z\sim N(0,1) になる。
正規分布の標準化 (standardization) とは, N(\mu,\sigma^2) (平均 \mu ,分散 \sigma^2 の正規分布)に従う確率変数を,変換によって N(0,1) (平均 0 ,分散 1の標準正規分布)に従うようにすることです。
正規分布を標準化すれば,標準正規分布表を利用することができますから,統計学においては,何かと便利です。
なお一般に, E[aX+b] = aE[X]+b, \; V(aX+b) = a^2 V(X) ですから,
\begin{aligned}& E[X] =\mu, \quad V(X) = \sigma^2 \\ &\implies E[Z] = 0,\quad V(Z) = 1\end{aligned}
となることは明らかです。ここで大切なのは,単に Z の期待値・分散が 0, 1 になることではなく, Z がちゃんと再び正規分布に従うことです。
これについて,証明してみましょう.
正規分布の標準化の証明
正規分布 N(\mu, \sigma^2 ) の確率密度関数 p(x) は
p(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}
となることを思い出しましょう。
証明
a<b に対し, P(a\le Z\le b) を考える。 X\sim N(\mu,\sigma^2) であるから,
\begin{aligned} P(a\le Z\le b) &= P(a\le \frac{X-\mu}{\sigma}\le b) \\ &= P(\mu+\sigma a \le X \le \mu+\sigma b) \\ &= \frac{1}{\sqrt{2\pi\sigma^2}}\int_{\mu+\sigma a}^{\mu+\sigma b} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \, dx. \end{aligned}
ここで, z = \dfrac{x-\mu}{\sigma} とおいて置換積分すると,
であるから, Z の確率密度関数は \frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}} となる。これは, Z\sim N(0,1) を意味する。
証明終