正規分布を導く

数学

正規分布とは

正規分布とは、平均値を中心としたデータの「バラつき」を表す分布です。ガウス分布、または、誤差分布とも呼ばれます。何かを測定するときのデータのバラつき(誤差)の他、動物の身長や降ってくる雨粒の大きさの分布など、経験的に正規分布に従うことが知られています。

正規分布は、平均値を μ、標準偏差を σ とした場合、以下の式で定義されます。

$$f(x)=\frac{1}{\sqrt{2\pi}\sigma}exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\equiv N(\mu,\sigma^2)$$

正規分布の標準化

特に、平均値を μ=0、標準偏差を σ=1と置いた場合、以下のように正規分布を標準化できます。

$$f(u)=\frac{1}{\sqrt{2\pi}}exp\left(-\frac{u^2}{2}\right)=N(0,1^2)$$

$$u\equiv\frac{x-\mu}{\sigma}$$

正規分布の特徴

正規分布は、グラフの中央は平均値となり、最も高い値(最頻値)を示します。また、グラフは左右対称で、偏りがない形となります。

また、標準偏差が大きいほど、データのバラつきは大きく、グラフは平坦になります。標準偏差が同じであれば、それらのグラフは相似形になります。

さらに正規分布の式より、xの値が ±nσ(nは整数)に含まれる割合(fの面積)を求めることができます。例えば、±σ の中に存在するxの割合は約68%となります。

$-\sigma\le x\le+\sigma$ 68.2%
$-2\sigma\le x\le+2\sigma$ 95.4%
$-3\sigma\le x\le+3\sigma$ 99.7%

正規分布を導く

関数の形

+δ または ーδ の2つの値をランダムにとるn個のデータがあり、その合計値をxとします。そして、各xの分布をf(x) とします。以下、このf(x) を求めます。

次の $f(x)$ と $f(x+2\delta)$ の差分の式を定義します。

$$F\equiv\frac{f(x+2\delta)-f(x)}{f(x+2\delta)+f(x)}  -①$$

n個のうち、p個がプラスの値の場合、$x=(2p-n)\delta$ で、その組み合わせの数Cは以下になります。

$$C=\frac{n!}{(n-p)!p!}$$

同様に、n個のうち、p+1 個がプラスの値の場合、$x’=(2p-n+2)\delta=x+2\delta$ で、その組み合わせの数は以下になります。

$$C’=\frac{n!}{(n-p-1)!(p+1)!}$$

このときxの確率分布 $f(x)$ と、xから2δ 離れた確率分布 $f(x+2\delta)$ の比は、両方の組合せの数の比で表すことができます。最後は p>>1 としています。

$$\frac{f(x+2\delta)}{f(x)}=\frac{C’}{C}=\frac{n-p}{p+1}\simeq\frac{n-p}{p}$$

この式を①に代入し、$x=(2p-n)\delta$ を使ってpを消去すると、

$$F=\frac{n-2p}{n}=-\frac{x}{n\delta}    -②$$

また、マクロリン展開

$$f(x+2\delta)\simeq f(x)+2\delta\frac{df}{dx}$$

を使うと、①は以下のように変形できます。ここで、分母は $f(x)\simeq f(x+2\delta)$ としています。

$$F=\frac{\delta}{f}\frac{df}{dx}    -③$$

②と③より以下の微分方程式が得らます。

$$\frac{1}{f}\frac{df}{dx}=-\frac{x}{n\delta^2}$$

この微分方程式を解くと正規分布の形が求められます。ここでAは比例定数です。

$$f(x)=A\exp\left(-\frac{x^2}{2n\delta^2}\right)$$

関数のバラつき

次に、f(x) の変曲点のxを求めます。変曲点とは、曲線の凸から凹、または、凹から凸に変化する点 “x” です。これはf(x) の2階微分がゼロになる点として以下のように求められます。

$$\frac{d^2f(\sigma)}{dx^2}=0$$

このxを改めて σ と置きます。このσ は標準偏差となります。

$$\sigma=\delta\sqrt{n}$$

規格化条件

最後は、定数Aの求めるため、規格化を行います。以下のようにf(x) のxの全領域での積分を1と置きます。

$$\int_{-\infty}^\infty f(x)dx=1$$

ここで以下の積分公式を使います。

$$\int_{-\infty}^\infty e^{-ax^2}dx=\frac{\sqrt{\pi}}{\sqrt{a}}$$

$a=1/2\sigma^2$ と置くと、$A=1/\sqrt{2\pi}\sigma$ が得られます。これで、正規分布の形が完成しました。

$$f(x)=\frac{1}{\sqrt{2\pi}\sigma}\exp\left(-\frac{x^2}{2\sigma^2}\right)$$

 

情報処理
情報量、公開鍵暗号、ディフィ・ヘルマン鍵交換、量子コンピュータ、量子ビット、量子テレポーテーション
数理の散策路
力学、電磁気・相対論、熱・統計力学、量子力学、物性物理、機械学習、情報処理、金融、物理数学

Wikipedia

 

タイトルとURLをコピーしました