けーじの学び場

元メーカー勤めのデータサイエンティスト。AIや統計、転職とかについて気ままに綴る予定


2024 統計検定1級 過去問解いてみた 統計数理 問2


今回は2024年に解いた統計検定の過去問を解いてみました。公式の回答ではなく、間違っているところもあるかもしれないですが、理解の助けになれば幸いです。もう受験してから3か月がたっていますが、これからもわかる範囲で投稿していこうと思うので、気長にお待ちいただければと思います。

この問題は本番では解きませんでした。円の式があり、定石としては $X = R\cos\theta, Y=R\sin\theta$などと置いて、ヤコビアンを計算して、 $R$と $\theta$について確率密度関数を出して… とやっていくのだと考えていました。少々時間がとられるタイプだなと思って解かなかったのですが、実際はそのような必要ありませんでした…。今回の試験でトップレベルに簡単な部類かなと個人的には思ってまして、本番で解かなかったことを後悔しています…。

[1]

$R=\sqrt{X^2+Y^2}$ として与えられているので、 $R$は $h(x, y)$に従って発生させた座標平面上の点の原点からの距離になります。これを前提に、 $F(r)=P(R \le r)$の意味を考えましょう。例えば、 $r=0$とすると、 $R \le 0$は発生させた点が原点そのものの時にしか成り立ちません。よって、 $P(R \le r)=0$ となります。 $r=\theta$とすると、発生させる点は $S(\theta)$上にあるはずなので、必ず $R \le r$となります。よって $P(R \le r)=1$となります。

要は、

$h(x, y)$に従って乱数を発生させる→原点を中心とした半径 $\theta$の円内に一点をとった時に、その点が原点を中心とする半径 $r$の円内に入る確率を聞かれているのですね。このように考えると、求めている確率を円の面積に置き換えて議論することができます。

$r \le 0$のときは、非正の値の半径の円に入る事象は考えられないため確率は0、 $r > \theta$のときは、発生する点は半径 $\theta$の円内にあるので、それより大きい円を考えているため確率は1となります。その間にあたる $0 < r \le \theta$のときは、面積比を考えることで確率が求まります。これらをまとめると

$$
F(r) = \begin{cases}
\space 0 & (r \le 0) \\
\frac{r^2}{\theta^2} & (0 < r \le \theta) \\
\space 1 & (r \ge \theta)
\end{cases}
$$

となります。 $r$で微分すれば確率密度関数が求まるので以下のようになります。

$$
g(r) = \begin{cases}
\kern{1.5em} 0 & (r \le 0, r > \theta) \\
2n\frac{r^{2n-1}}{\theta^{2n}} & (0 < r \le \theta)
\end{cases}
$$

(問題文中の「一様分布に従う」は非常に重要です。この記述があるからこそ、上記のように単純に確率を面積で語ることができます。)

図にしてみると以下のようになりますね。青い円が半径 $\theta$の円内だとして、その中でランダムに点が発生すると考えて、半径 $r$の赤い円内に入る確率を聞かれています。赤い円が青い円より小さいときは面積比。赤い円が青い円より大きいときは必ず赤い円内に点が発生するので確率1、そもそも赤い円に半径がないときは確率0となります。

[2]

確率密度関数が求まっているので計算するだけですね。

$$ E[R] = \int_0^\theta r・\frac{2r}{\theta^2}\space dr = \frac{2}{3}\theta $$

$$ E[R^2] = \int_0^\theta r^2・\frac{2r}{\theta^2}\space dr = \frac{1}{2}\theta^2 $$

$$ V[R] = E[R^2] – E[R]^2=\frac{1}{18}\theta^2 $$

が答えになります。

[3]

各 $R_1, R_2, … R_n$は全問と同様の確率分布に、それぞれ独立に従います。その中の最大値 $R_{(n)}$がある定数 $r$以下である確率を考えます。

[1]と同じような考え方で、 $r\le 0$のときはすべての $R_i\space(i=1, 2, …,n)$が0以上となるため、 $R_{(n)} \le r$となる確率は0となります。 $r > \theta$のときは、すべての $R_i$が $\theta$以下になるため確率は1となります。

$0 < r \le \theta$のときについて考えましょう。最大値 $R_{(n)}$が $r$以下となる場合は、 $R_1, R_2, … R_n$のすべてが $r$以下となる場合に等しいです。これらは[1]で求めた確率分布に従いますので、

$$ G(r)=\{F(r)\}^n = \frac{r^{2n}}{\theta^{2n}} $$

となります。すべての場合をまとめて再度書き直すと

$$
G(r) = \begin{cases}
\space 0 & (r \le 0) \\
\frac{r^{2n}}{\theta^{2n}} & (0 < r \le \theta) \\
\space 1 & (r \ge \theta)
\end{cases}
$$

とあらわされます。 $g(r)$は $r$で微分することにより

$$
g(r) = \begin{cases}
\kern{1.5em} 0 & (r \le 0, r > \theta) \\
2n\frac{r^{2n-1}}{\theta^{2n}} & (0 < r \le \theta)
\end{cases}
$$

となります。

[4]

最尤推定量を求めるパターンとしては、対数尤度関数を微分して0になる点を求めるものが多いですが、今回はそうではありません。尤度関数の形から単調減少することがわかるので、パラメータの取りうる最小値が最尤推定量となる問題です。

実際に考えてみましょう。まず、パラメータ $\theta$のもとで、$R_1, R_2, …, R_n$の同時確率密度分布を $h(r_1, r_2, …, r_n|\theta)$とすると、

$$ h(r_1, r_2, …, r_n|\theta) = \{f(r)\}^n= \prod_{i=1}^n\frac{2r_i}{\theta^2} $$

となります。これをパラメータ $\theta$を変数としてみてあげたのが尤度関数で、 $L(\theta|R_1, R_2, …, R_n)$とすると、

$$ L(\theta|R_1, R_2, …, R_n) = \prod_{i=1}^n\frac{2R_i}{\theta^2} = \frac{1}{\theta^{2n}}\prod_{i=1}^n2R_i $$

となります。(ほぼほぼ形は変わっていません。) $\theta$を変化させて尤度関数 $L$を最大化させようと考えると、 $\theta$に依存する部分は、 $\frac{1}{\theta^{2n}}$の部分だけなので、できるだけ小さい $\theta$を考えてあげればよいです。

$R_1, R_2, …, R_n$が得られている状態では、 $\theta$は少なくともこれらの最大値以上でないといけないです。なぜなら、仮に最大値未満とした場合は、その最大値は確率分布の定義域である、 $0 < r \le \theta$を満たしていないからです。逆に言えば、最大値以上の $\theta$であればどのような $\theta$でも矛盾なく考えることができます。いまはなるべく小さい値を最尤推定量として採用しようとしているので、 $R_1, R_2, … R_n$のうち最大値、すなわち $R_{(n)}$を $\hat \theta_{ML}$とすればよいです。

[5]

この手の不偏推定量を考える問題は過去問でもたまに見られるので、本番までに得点できるようにしておきましょう。 $\hat \theta_{ML}$の期待値を求めて、それとつじつまを合わせるように定数 $a, b$を考えるのがよいと思います。

$$ E[\hat \theta_{ML}] = E[R_{(n)}]=\int_0^\theta rg(r)\space dr = \int_0^\theta r・2n\frac{r^{2n-1}}{\theta^{2n}}\space dr = \frac{2n}{2n+1}\theta $$

となります。

よって、 $a = \frac{2n+1}{2n}, b=0$とすれば、 $E[\hat \theta_{ML}]=\theta$となりますので、これが解答となります。

$\hat \theta_U$の分散も聞かれています。まず、 $Var[\hat \theta_{ML}]$を求めていきましょう。

$$ E[\hat \theta_{ML}^2] = \int_0^\theta r^2g(r)\space dr = \int_0^\theta r^2・2n\frac{r^{2n-1}}{\theta^{2n}}\space dr = \frac{2n}{2n+2}\theta^2 = \frac{n}{n+1}\theta^2 $$

$$ Var[\hat \theta_{ML}]=E[\hat \theta_{ML}^2]-E[\hat \theta_{ML}]^2 = \frac{n}{n+1}\theta^2 – \left(\frac{2n}{2n+1}\right)^2\theta^2 = \frac{n}{(n+1)(2n+1)^2}\theta^2 $$

以上から、

$$ Var[\hat \theta_U] = a^2Var[\hat \theta_{ML}]=\left(\frac{2n+1}{2n}\right)^2\frac{n}{(n+1)(2n+1)^2}\theta^2 = \frac{1}{4n(n+1)}\theta^2 $$

と計算できます。

過去問を2,3年分触れていれば難なくこたえられる問題ばかりだったと思います。問題を解く力はもちろん大事ですが、どの問題を解くか選択する力も同じくらい重要ですね。


コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

PAGE TOP