推定とは(統計学)

/統計学

推定とは

統計学における推定とは、母集団を特徴づける母数を統計学的に統計学的に推測することです。推定の基本的な用語について説明します。

  • 点推定
    未知の母数(母集団の平均や分散など)の値をデータより推測する作業です。
  • 推定量(推定値)
    データより求められた値です。
  • 不偏推定量
    期待値が母数と一致する推定量です。確率変数 $x$ が正規分布 $N(\mu,\sigma^2)$ に従う場合は以下になります。

    $E(\bar{x})=\mu$ $\bar{x}$ は $\mu$ の不偏推定量である
    $E(V)=\sigma^2$ $V$ は $\sigma^2$ の不偏推定量である
  • 帰無仮説(きむかせつ)
    検定の対象になる母平均(母集団の平均)や母分(母集団の分散)散などの仮説です。
  • 有意水準
    帰無仮説が成立しているかどうかの判定基準で、帰無仮説が成立していない割合を表します。通常は、$5\%$ または $1\%$ が使われます。
  • 区間推定
    データから未知の母数の値の存在範囲を推定する作業です。
  • 信頼区間
    区間推定での未知の母数の値の存在範囲です。
    標準化された正規分布 $N(0,1^2)$ の場合、例えば有意水準が $5\%$ であれば、全体の $95\%$ がバラつき $\pm1.960$ の範囲内に存在することを表します。この範囲が信頼区間に相当します。

母平均の推定

母平均に対する推定の手順は以下になります。尚、母分散は未知と仮定します。

点推定

$x_1\sim x_n$ とすると、$\mu$ の点推定 $\hat{\mu}$ は以下を用います。

$$\hat{\mu}=\bar{x}=\frac{1}{n}\sum_{i=1}^nx_i$$

区間推定

$x_1\sim x_n$ が $N(\mu,\sigma^2)$ に従うとき、$\bar{x}$ は $N(\mu,\sigma^2/n)$ に従い、$\bar{x}$ を標準化して得られる以下の $u$ は $N(0,1^2)$ に従います。

$$u=\frac{\bar{x}-\mu}{\sqrt{\sigma^2/n}}$$

ここでは母分散 $\sigma^2$ は未知としているので、代わりに点推定量 $V$ に置き換えると、以下の $t$ は自由度 $\phi=n-1$ の $t$ 分布 $t(\phi,\alpha)$ に従うことが知られています。

$$t=\frac{\bar{x}-\mu}{\sqrt{V/n}}$$

このとき棄却域は以下で $|t|\gt t(\phi,\alpha)$ であるから、信頼率 $100(1-\alpha)\%$ の $\mu$ の信頼区間は、

$$\mathrm{Pr}\left(-t(\phi,\alpha)\le\frac{\bar{x}-\mu}{\sqrt{V/n}}\le t(\phi,\alpha)\right)=1-\alpha$$

より、以下で表されます。

$$\bar{x}-t(\phi,\alpha)\sqrt{\frac{V}{n}}\le\hat{\mu}\le\bar{x}+t(\phi,\alpha)\sqrt{\frac{V}{n}}$$

母分散の推定

母分散に対する推定の手順は以下になります。

点推定

$x_1\sim x_n$ とすると、$\sigma^2$ の点推定 $\hat{\sigma}^2$ は以下を用います。

$$\hat{\sigma}^2=V=\frac{S}{n-1}$$$$S=\sum_{i=1}^n(x_i-\bar{x})^2=\sum_{i=1}^nx_i^2-\frac{1}{n}\Big(\sum_{i=1}^nx_i\Big)^2$$

区間推定

$x_1\sim x_n$ が $N(\mu,\sigma^2)$ に従うとき、以下の $\chi^2$ は自由度 $\phi=n-1$ の $\chi^2$(カイ2乗)分布に従うことが知られています。

$$\chi^2=\frac{S}{\sigma^2}$$

このとき棄却域は $\chi^2\le \chi^2(\phi,1-\alpha/2)$ 、$\chi^2\ge \chi^2(\phi,\alpha/2)$ であるから、信頼率 $100(1-\alpha)\%$ の $\sigma^2$ の信頼区間は、

$$\mathrm{Pr}\left(\chi^2(\phi,1-\alpha/2)\le\frac{S}{\sigma^2}\le \chi^2(\phi,\alpha/2)\right)=1-\alpha$$

より、以下で表されます。

$$\frac{S}{\chi^2(\phi,\alpha/2)}\le\hat{\sigma}^2\le\frac{S}{\chi^2(\phi,1-\alpha/2)}$$

2つの母平均の推定

2つの母平均 $\mu_1,\mu_2$ の比較(差)についての推定の手順は以下になります。尚、母分散 $\sigma_1,\sigma_2$ は未知と仮定します。

点推定

$x_{11}\sim x_{1n}$ 、$x_{21}\sim x_{2n}$ とすると、$\mu_1-\mu_2$ の点推定 $\hat{\mu}_1-\hat{\mu}_2$ は以下を用います。

$$\hat{\mu}_1-\hat{\mu}_2=\bar{x}_1-\bar{x}_2$$

$$\bar{x}_1=\frac{1}{n}\sum_{i=1}^nx_{1i} , \bar{x}_2=\frac{1}{n}\sum_{i=1}^nx_{2i}$$

区間推定

$x_{11}\sim x_{1n}$ が $N(\mu_1,\sigma_1^2)$ に従い、$x_{21}\sim x_{2n}$ が $N(\mu_2,\sigma_2^2)$ に従うとき、$\bar{x}_1-\bar{x}_2$ は $N\Big(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}\Big)$ に従い、$\bar{x}_1-\bar{x}_2$ を標準化して得られる以下の $u$ は $N(0,1^2)$ に従います。

$$u=\frac{\bar{x}_1-\bar{x}_2-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}$$

ここでは母分散 $\sigma_1^2,\sigma_2^2$ は未知としているので、代わりに点推定量 $V_1,V_2$ に置き換えると、以下の $t$ は自由度 $\phi^*$ の $t$ 分布に近似的に従うことが知られています。

$$t=\frac{\bar{x}_1-\bar{x}_2-(\mu_1-\mu_2)}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}$$

$$\phi^*=\frac{\Big(\frac{V_1}{n_1}+\frac{V_2}{n_2}\Big)^2}{\frac{1}{\phi_1}\Big(\frac{V_1}{n_1}\Big)^2+\frac{1}{\phi_2}\Big(\frac{V_2}{\phi_2}\Big)^2}$$$$\phi_1=n_1-1 , \phi_2=n_2-1$$

このとき棄却域は $|t|\gt t(\phi^*,\alpha)$ であるから、信頼率 $100(1-\alpha)\%$ の $\mu$ の信頼区間は、

$$\mathrm{Pr}\left(-t(\phi^*,\alpha)\le\frac{\bar{x}_1-\bar{x}_2-(\mu_1-\mu_2)}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}\le t(\phi^*,\alpha)\right)=1-\alpha$$

より、以下で表されます。

$$\bar{x}_1-\bar{x}_2-t(\phi^*,\alpha)\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}\le\hat{\mu}_1-\hat{\mu}_2\le\bar{x}_1-\bar{x}_2+t(\phi^*,\alpha)\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}$$

2つの母分散の推定

2つの母分散 $\sigma_1,\sigma_2$ の比較(比)についての推定の手順は以下になります。

点推定

$x_{11}\sim x_{1n}$ 、$x_{21}\sim x_{2n}$ とすると、$\sigma_1^2/\sigma_2^2$ の点推定 $\hat{\sigma}_1^2/\hat{\sigma}_2^2$ は以下を用います。

$$\frac{\hat{\sigma}_1^2}{\hat{\sigma}_2^2}=\frac{V_1}{V_2}$$

区間推定

$x_{11}\sim x_{1n}$ が $N(\mu_1,\sigma_1^2)$ に従い、$x_{21}\sim x_{2n}$ が $N(\mu_2,\sigma_2^2)$ に従うとき、以下の $F$ は自由度 $\phi_1=n_1-1$ 、$\phi_2=n_2-1$ の $F$ 分布に従うことが知られています。

$$F=\frac{V_1/\sigma_1^2}{V_2/\sigma_2^2}$$

このとき棄却域は $F\ge F(\phi_1,\phi_2,\alpha/2)$( $V_1\ge V_2$ )であるから、信頼率 $100(1-\alpha)\%$ の $\sigma^2$ の信頼区間は、

$$\mathrm{Pr}\left(F(\phi_1,\phi_2,1-\alpha/2)\le\frac{V_1/\sigma_1^2}{V_2/\sigma_2^2}\le F(\phi_1,\phi_2,\alpha/2)\right)=1-\alpha$$

より、以下で表されます。

$$\frac{V_1}{V_2}\cdot\frac{1}{F(\phi_1,\phi_2,\alpha/2)}\le\frac{\hat{\sigma}_1^2}{\hat{\sigma}_2^2}\le\frac{V_1}{V_2}\cdot\frac{1}{F(\phi_1,\phi_2,1-\alpha/2)}$$

 

数学
解析学、代数学、幾何学、統計学、論理・基礎論、情報・暗号、機械学習、金融・ゲーム理論、高校数学
散策路TOP
数学、応用数学、古典物理、量子力学、物性論、電子工学、IT、力学、電磁気学、熱・統計力学、連続体力学、解析学、代数学、幾何学、統計学、論理・基礎論、プラズマ物理、量子コンピュータ、情報・暗号、機械学習、金融・ゲーム理論

 

タイトルとURLをコピーしました