続・わかりやすいパターン認識 ひとり読書会 6
今回はP(s)の妥当性第二回です。
続パタ読書会 1:ディリクレ過程混合モデル
続パタ読書会 2:ディリクレ過程混合モデルのアルゴリズム
続パタ読書会 3:実験
続パタ読書会 4:実装
続パタ読書会 5:事前確率P(s)の妥当性 1
続パタ読書会 6:事前確率P(s)の妥当性 2
続パタ読書会 7:ベル数 1
続パタ読書会 8:ベル数 2
続パタ読書会 9:P(s_k|x_k, s_-k, θ)の導出
続パタ読書会 10:演習問題12.5の計算
続パタ読書会 11:演習問題12.6の計算 1
続パタ読書会 12:演習問題12.6の計算 2
の妥当性第二回です。
事前確率の妥当性 2
はどのような分布か
まだがどのような分布かは示されていません。このはを生成するごとに形状を変えていく分布のため決まった形を持つわけではありませんが、生成後の結果の形状だけを見ることで理解しやすくなります。この方法だと式の上でも意外と直感的に理解できます。具体的にを観測した下でのの式は
となります。この式を見ても明らかなように集中度が大きければよりから生成されやすく、クラスタ数が増加するとともにの形状はよりに近いものとなることが分かります。すなわちこれが集中度が果たす役割に他なりません。この分布は確率的にからも生成されるための形状自体は依然として抽象的です。そこでを観測した下でのを考えるのではなく、を観測した下で出来上がったの形状を考えます。このは新たにを生成したり、の確率を求めたりすることが出来る分布としてのではなくあくまで結果でしかありませんが、の形状を理解するにはより具体的でわかりやすいかと思います。新たにから生成されるわけではないのでこの場合のは
という離散分布になります。式の通りの結果の分布は既存の各クラスタに所属しているパターンの数に比例しているだけの分布であり、その既存の各クラスタはから確率的に生成されている事を考えると理解しやすいかと思います。具体的な分布の形状の例はテキストの11章6節にも載っていますが、あらためてを平均、分散の正規分布とした場合の一例を下記に挙げます。
上のグラフは個のパターンを生成した後のを、下のグラフのオレンジの棒グラフはのヒストグラム、青い実線はを表しています。テキストではヒストグラムは各毎に500個の累積で作成されているためどの下でもにそれなりに近い形状をしていますが、上のグラフのヒストグラムは一回のみのの生成によって作られたものなのでテキストに比べより大きなばらつきになっています。見てわかる通り集中度が大きくなればなるほどクラスタ数は増え、よりの形状に近づくことが見て取れます。は生成するたびに違う分布になりますのでこれはあくまで一例です。また、下はの設定でを作成した場合のアニメーションです。
が大きくなるごとに偏りがなくなりの形状に近いが生成されやすくなりますが、決してそのものの分布になるわけではなく適度にばらつきのある分布が作成されることが見て取れます。
の計算
保留になっていたを具体的に計算していきます。そのためにまずを考えます。
ここで
であることを思い出すと、なので
また、なので
となります。結局
と求まりました。さらにこの式をすべてのについてまとめることにより
となります。ここでは各々個の値のどれかを取ったものとし、各に個のが属していたとするとこの式は等価的に
と書くことができ、これがまさに求めたかった結果です。
まとめ
これまでのの事前確率に関する考察をまとめます。ディリクレ過程によりパターンがクラスタリングされたものとしてクラスタリング構造をモデル化すると、その構造はCRPによる分割として実現できました。そこでCRPにおいてあるクラスタ構造の事前確率を考えれば結果は最初に提示した通り
となりましたが、この式は集中度、クラスタ数、各クラスタの所属パターン数、及び総パターン数の四つの要素にしか依存していません。ということはクラスタ構造に関しての事前確率を計算したいだけならば基底分布がどのようなものかは結果にかかわらないことになります。また、我々が知りたかった事前確率はあくまでパターンを観測する前のものです。つまりディリクレ過程で生成されたと仮定されるパターンが作るクラスタ構造であれば、あるというクラスタ構造はどのような確率で起こりうるのかを知りたいわけです。結果としてはディリクレ過程における基底分布をどのような分布と仮定するかによらず上式の結果になる、というのが結論ということになります。
今回はこのくらいにして次回はベル数について考えていきます。
続パタ読書会 1:ディリクレ過程混合モデル
続パタ読書会 2:ディリクレ過程混合モデルのアルゴリズム
続パタ読書会 3:実験
続パタ読書会 4:実装
続パタ読書会 5:事前確率P(s)の妥当性 1
続パタ読書会 6:事前確率P(s)の妥当性 2
続パタ読書会 7:ベル数 1
続パタ読書会 8:ベル数 2
続パタ読書会 9:P(s_k|x_k, s_-k, θ)の導出
続パタ読書会 10:演習問題12.5の計算
続パタ読書会 11:演習問題12.6の計算 1
続パタ読書会 12:演習問題12.6の計算 2