とある数学の問題と解答のメモ234

/ Math Exercise

問題

(1) 確率変数Zi=(Xi,Yi),i=1,2,,nは独立に次のように定義される確率分布に従う。各Xi,Yiは0または1を値にとり、P(Xi=1)=α, P(Yi=1|Xi)=βXiとする(一般にXiYiは独立ではない)。ただしnは正の整数、0<α<1, 0<β<1は未知パラメータである。このとき以下の設問に答えなさい。

(1-1) 同時確率P(Xi=x,Yi=y)(x,y)の取りうるすべての値について求めなさい。ただしα,βを用いること。

(1-2) Zi, i=1,2,,nをすべて用いて、α,βの最尤推定量α^n,β^nを求めなさい。

(1-3) 制約条件α+β=1を仮定する。このときZi, i=1,2,,nをすべて用いて、αの最尤推定量α^nを求めなさい。

(1-4) 設問(1-3)のα^nは極限nにおいてある値に収束する。その値を求めなさい。

(2) 袋の中にN,(N=1,2,)個のボールがあり、そのうちm,(m{0,1,,N})個は赤色、残りは白色である。袋から、ランダムかつ同時にn,(n{1,,N})個取り出した際にその中で赤色であるボールの個数を確率変数X,(X{0,1,,n})で表すことにする。以下の設問に答えよ。

(2-1) X=k,(k=0,1,,n)となる確率P(X=k)を求めよ。

(2-2) 確率変数Xの期待値を求めなさい。

袋の中に白いボールが多数入っている。その個数がわからないので未知パラメータNとおき、これを以下の手続きで見積もることにした。まず、袋の中からランダムかつ同時にm個を取り出し赤く塗った。それらを袋に戻してよくかきまぜた。その後、今度は袋の中からランダムかつ同時にn個のボールを取り出したところ、そのうちk{0,1,,n}個が赤く塗られていた。N,m,nは正の整数である。以下の設問に答えよ。

(2-3) Nに関する尤度L(N)を求めなさい。

(2-4) 設問(2-3)のL(N)について、L(N)/L(N1)、ただしN=2,3,、を計算しなさい。

(2-5) Nの最尤推定値を求めなさい。ただしk1とする。

解答

(1-1) (x,y)=(0,0),(0,1),(1,0),(1,1)が全ての取りうる値。

P((Xi,Yi)=(0,0))=P(Xi=0)P(Yi=0|Xi=0)=(1α)×1=1αP((Xi,Yi)=(0,1))=P(Xi=0)P(Yi=1|Xi=0)=(1α)×0=0P((Xi,Yi)=(1,0))=P(Xi=1)P(Yi=0|Xi=1)=α(1β)P((Xi,Yi)=(1,1))=P(Xi=1)P(Yi=1|Xi=1)=αβ

念のため全部足して1になるかどうか確認しておくと

1α+α(1β)+αβ=1

でok。

(1-2) 対数尤度をα,βで微分してゼロとく。まずは対数を取る前の尤度を書き下すと

l(α,β;{Zi})=i=1n(1α)(1Xi)(1Yi)(αβ)XiYi{α(1β)}Xi(1Yi)

対数尤度はこれの対数を取ったもの。

logl(α,β;{Zi})=i=1n[(1Xi)(1Yi)log(1α)+XiYilog(αβ)+Xi(1Yi)logα(1β)]=i=1n[(1Xi)(1Yi)log(1α)+XiYi(logα+logβ)+XilogαXiYilogα+Xi(1Yi)log(1β)]=i=1n[(1Xi)(1Yi)log(1α)+XiYilogβ+Xilogα+Xi(1Yi)log(1β)]

キレイになったのかどうかはわからない。とりあえず項がひとつは消えた。まずαで微分する。

logl(α,β)α=i=1n[(1Xi)(1Yi)α1+Xiα]=1α1i=1n(1Xi)(1Yi)+1αi=1nXi=00=αi=1n(1Xi)(1Yi)+(α1)i=1nXiα=(i=1nXi)/(i=1n(1Xi)(1Yi)+i=1nXi)=α^n

次にβで微分する。

logl(α,β)β=i=1n[XiYiβ+Xi(1Yi)β1]=1βi=1nXiYi+1β1i=1nXi(1Yi)=00=(β1)i=1nXiYi+βi=1nXi(1Yi)β=(i=1nXiYi)/(i=1nXi(1Yi)+i=1nXiYi)=β^n

どちらも似たような式が出てきた。1以下になることは式形から確かめられる。

(1-3) ラグランジュの未定乗数法を使う。g(α,β)=1αβ=0を条件としてラグランジュ関数を次のように取る。

L(α,β)=logl(α,β)λg(α,β)

同じようにα,βで微分してゼロとおけばよいのだが第1項は前の問題と同じである。

L(α,β)α=1α1i=1n(1Xi)(1Yi)+1αi=1nXi+λ=0L(α,β)β=1βi=1nXiYi+1β1i=1nXi(1Yi)+λ=0

ここまでくればあとは方程式を解くだけの問題になる。λでつないでβ=1αを入れる。

1α1i=1n(1Xi)(1Yi)+1αi=1nXi=1βi=1nXiYi+1β1i=1nXi(1Yi)1α1(i=1n(1Xi)(1Yi)+i=1nXiYi)+1α(i=1nXi+i=1nXi(1Yi))=0α(i=1n(1Xi)(1Yi)+i=1nXiYi)+(α1)(i=1nXi+i=1nXi(1Yi))=0α=i=1nXi+i=1nXi(1Yi)i=1n(1Xi)(1Yi)+i=1nXiYi+i=1nXi+i=1nXi(1Yi)=α^n

これが条件のもとでの最尤推定量。

(1-4) 前問の式の分母分子をnで割る。するとそれぞれの項は設問(1-1)で求めた確率に収束する。つまりnにおいて

1ni=1nXi(1Yi)P((Xi,Yi)=(1,0))=α(1β)1ni=1n(1Xi)(1Yi)P((Xi,Yi)=(0,0))=1α1ni=1nXiYiP((Xi,Yi)=(1,1))=αβ1ni=1nXiP(Xi=1)=α

これを代入すると

α^nα+α(1β)1α+αβ+α+α(1β)=α+α(1(1α))1+α=α(1+α)1+α=α

となる。条件付きではあれど最尤推定量なのでこうなっていてくれると安心する。こういうことが起こる理由は抽象的なパラメータ空間の図を描くとわかりやすいんだろうけどいちいち説明しない。

(2-1) ランダムかつ同時に取り出すのだからm/Nの確率で赤を引くと考えればよい。通常の2項分布になる。(本当か?((mk)+(Nmnk))/(Nn)とかしなくていいんか?)

P(X=k)=(nk)(mN)k(1mN)nk

(2-2) 試行回数nで確率pの二項分布の期待値はnpと覚えて置く。これを用いるとXの期待値はnm/Nとなる。

(2-3) ここでの尤度の意味は結果がkであったときにボールの総数がNである確率のこと。前問のP(X=k)はここではP(X=k | N)と見ることが出来てこれをNの関数と見なしたものが尤度関数そのもの。

L(N)=P(X=k | N)=(nk)(mN)k(1mN)nk

(2-4) 先頭の二項係数は打ち消しあう。素朴に書き下すだけ。

L(N)L(N1)=mk(Nm)nkNn(N1)nmk(N1m)nk=(N1N)n(Nm)nk(N1m)nk=(N1N)n(NmN1m)nk

(2-5) 普通に対数尤度を微分する。

logL(N)=log(nk)+klogmN+(nk)log(NmN)NlogL(N)=kN+(nk)(1Nm1N)0=kN+(nk)mN(Nm)0=k(Nm)+(nk)mN=nmk=:N^

これで最尤推定値はnm/kとわかった。でもnmkで割り切れるとは限らないので一般にnm/kは有理数となる。なので自然数にするには切り上げるか切り下げるかしないといけない。多分L(N)/L(N1)N^を代入して1より大きいかとか小さいかとかやるんでしょうが省略する。