View on GitHub

memo

Chapter3. Uniformly Most Powerful Tests

3.1 Stating The Problem

3章は仮説検定の話。 ここでは、仮説を採択するか棄却するかの2-side decision prolblemを扱う。 このような決定問題を 仮説のtest(検定) という。

検定の2つのえらー。

  1. 仮説が正しいのに、棄却する
    • Error of the first kind
    • True Negativeとも
  2. 仮説が間違っているのに、採択する
    • Error of the second kind
    • False Positiveとも

病気の有無の検定を考える。 病気であるという仮説をたてる。

  1. 病気であるのに、病気でないという
    • 病気の場合は治療が必要なので、命に関わる病気であれば、このミスは減らす必要がある
  2. 病気でないのに、病気であるという
    • 病気の場合は治療が必要なので、このミスが増えると、無駄な治療費がかかる

どちらを減らすかは、問題によって考える必要がある。 一般にどちらのミスを減らすような両立はできないことが知られている。

そのため、間違って仮説$H$を棄却する確率$\alpha \in [0, 1]$を使って、以下のような条件をつける。

\[\begin{equation} P_{\theta}(\delta(X) = d_{1}) = P_{\theta}(X \in S_{1}) \le \alpha \quad \theta \in \Theta_{H} \label{chap03_3_1_level_of_significance} \end{equation}\]

仮説が正しい(つまり、parameterが$\theta \in \Theta_{H}$)の時の、棄却するという決定$d_{1}$を取る確率が$\alpha$以下であるとする。 この条件のもと、仮説が間違っている(つまり、parameterが$\theta \in \Theta_{K}$)ときの、採択する確率を最小にするようにする。 つまり、以下の最適化問題を解く。

\[\begin{align} \min_{\theta \in \Theta_{K}} & & & P_{\theta}(\delta(X) = d_{0}) \nonumber \\ \mathrm{subject\ to} & & & P_{\theta}(\delta(X) = d_{1}) \le \alpha \quad \theta \in \Theta_{H} \nonumber \end{align}\]

これは、以下と同値である。

\[\begin{align} \min_{\theta \in \Theta_{K}} & & & P_{\theta}(X = S_{0}) \nonumber \\ \mathrm{subject\ to} & & & P_{\theta}(X = S_{1}) \le \alpha \quad \theta \in \Theta_{H} \nonumber \end{align}\]

多くの場合、目的関数の最小化によって、制約は等号で達成されることが期待される。 つまり、

\[\begin{equation} \sup_{\theta \in \Theta_{H}} P_{\theta}(X \in S_{1}) = \alpha \label{chap03_3_3_size} \end{equation}\]

\(\eqref{chap03_3_3_size}\)の左辺は、size of the testと呼ばれるものである。 また、Error of the second kindに当たる、以下の式をpower of the testという。

\[\begin{equation} \theta \in \Theta_{K}, \ P_{\theta}(\delta(X) = d_{1}) = P_{\theta}(X \in S_{1}) \label{chap03_3_2_power} \end{equation}\]

また、Error of the second kindを$\Theta_{K}$で定義された関数とみなした$\beta: \Theta_{K} \rightarrow [0, 1]$をpower function of the testという。

\[\theta \in \Theta_{K}, \ \beta(\theta) := P_{\theta}(\delta(X) = d_{1})\]

Error of the first kindの値については問題ごとに設定するしかない。 $\alpha$の値は0.05や0.01が使われることが多い。

level of siginifanceは小さい値をとることが多いが、本来であればpower of the testを考慮して決めるべきものである。

理想的には、significance levelとpowerの両方に対して適当な値をえらうためには、sample sizeは十分大きく取る必要があることが知られている。 Cohen(1962), Freiman et al. (1978)など。 powerと両立した$\alpha$の選び方については、Lehmann (1958), Arrow(1960), Sanathanan (1974)などがある。 また、Bayesianの観点から Savage(1962 pp 62-66)、Rosenthal and Rubin (1958)などがある。

また、significance levelを決める別の指針は、仮定に対する確信度である。 仮定が成り立つとかんがえられる時は、十分significance levelを小さくする。

次に、randomized testについて述べる。

randomized testのrejectionの確率は

\[\beta_{\phi}(\theta) := E_{\theta} \left[ \phi \right] = \int \phi(x) \ d P_{\theta}(x)\]

で定義する。

\[\beta_{\phi}: \Theta_{K} \rightarrow [0, 1]\]

is said to be power. $\phi$は、Error of the first kindとError of the second kindを減らすように選ぶべきである。 よって、

\[\begin{equation} \theta \in \Theta_{K}, \ \beta_{\theta}(\phi) \label{chap03_3_4} \end{equation}\]

の最大化を

\[\begin{equation} \theta \in \Theta_{H}, \ \mathrm{E}_{\theta}(\phi) \le \alpha, \label{chap03_3_5} \end{equation}\]

の下に行いたい。 もし、\(\Theta_{K} := \{\theta_{K}\}\)が1点集合であれば、適当な$\phi$のクラス$A$から

\[\begin{align} \max_{\phi \in A} & & & \beta_{\phi}(\theta_{K}) \nonumber \\ \mathrm{subject\ to} & & & \mathrm{E}_{\theta}(\phi) \le \alpha, \ \forall \theta \in \Theta_{H} \nonumber \end{align}\]

を解けば良い。 一般に$\Theta_{K}$が1点でない場合は、Uniformly most powerful (UMP) testというクラスが重要となる。 これについては、Section 3.4, Section 3.7で議論する。

検定の場合は、次の2つのloss function\(L_{1},L_{2}\)を考えることができる。

\[\begin{eqnarray} L_{1}(\theta, d_{1}) & := & \begin{cases} 1 & \theta \in \Theta_{H} \\ 0 & \theta \in \Theta_{K} \end{cases} \nonumber \\ L_{1}(\theta, d_{0}) & := & 0 \ \forall \theta \nonumber \end{eqnarray}\] \[\begin{eqnarray} L_{2}(\theta, d_{0}) & := & \begin{cases} 0 & \theta \in \Theta_{H} \\ 1 & \theta \in \Theta_{K} \end{cases} \nonumber \\ L_{2}(\theta, d_{1}) & := & 0 \ \forall \theta \nonumber \end{eqnarray}\]

Remark

Then we can construct decision function.

\[\begin{eqnarray} \delta(x) := 1_{S_{1}}(x) . \end{eqnarray}\] \[\phi(x) := \gamma 1_{S_{1}}(x) + 1_{S_{1}}\] \[x \in \mathcal{X}, \ \delta_{\phi}(dz \mid x) := \phi(x) \epsilon_{1}(dz) + (1 - \phi(x)) \epsilon_{0}(dz)\]

Defintion test

$\phi$ is said to be test at level $\alpha$ if

\[\begin{equation} \sup_{\theta \in \Theta_{H}} \mathrm{E}_{\theta} \left[ \phi \right] \le \alpha . \nonumber \end{equation}\]

We denote by $\Phi_{\alpha}$ a set of test at level $\alpha$, that is,

\[\Phi_{\alpha} := \{ \phi: \text{test} \mid \theta \in \Theta_{H}, \ \mathrm{E}_{\theta} \left[ \phi \right] \le \alpha \} .\]

Defintion most poweful test

We define power function $\beta_{\phi}: \Theta \rightarrow [0, 1]$ of test $\phi$ by

\[\beta_{\phi}(\theta) := \mathrm{E}_{\theta} \left[ \phi \right] .\]

$\phi$ is said to be most poweful test at level $\alpha$ if

\[\begin{equation} \forall \phi_{0} \in \Phi_{\alpha}, \ \forall \theta \in \Theta_{K}, \ \beta_{\phi}(\theta) \ge \beta_{\phi}(\theta^{\prime}) \nonumber \end{equation}\]

Remark

The following equation holds;

\[\arg\inf_{\theta \in \Theta_{K}} P(X \in S_{0}) = \arg\sup_{\theta \in \Theta_{K}} P(X \in S_{1})\]

Indeed,

\[\begin{eqnarray} \inf_{\theta \in \Theta_{K}} P_{\theta}(X \in S_{0}) & = & \inf_{\theta \in \Theta_{K}} (P_{\theta}(X \in (S_{0} \cup S_{1})) - P_{\theta}(X \in S_{1})) \nonumber \\ & = & 1 + \inf_{\theta \in \Theta_{K}}-P_{\theta}(X \in S_{1}) \nonumber \\ & = & 1 - \sup_{\theta \in \Theta_{K}}P_{\theta}(X \in S_{1}) \nonumber \end{eqnarray}\]

In particular, \(\Theta_{H} := \{\theta_{0}\}\), then we have

\[\begin{eqnarray} \inf_{\theta \in \Theta_{H}} P_{\theta}(X \in S_{0}) & = & \inf_{\theta \in \Theta_{H}} (P_{\theta}(X \in (S_{0} \cup S_{1})) - P_{\theta}(X \in S_{1})) \nonumber \\ & = & 1 - \sup_{\theta \in \Theta_{H}} P_{\theta}(X \in S_{1}) \nonumber \\ & \ge & 1 - \alpha \end{eqnarray}\]