続・わかりやすいパターン認識 ひとり読書会 9
今回は保留にしてあったP(s_k|x_k, s_-k, θ)の導出を行います。
続パタ読書会 1:ディリクレ過程混合モデル
続パタ読書会 2:ディリクレ過程混合モデルのアルゴリズム
続パタ読書会 3:実験
続パタ読書会 4:実装
続パタ読書会 5:事前確率P(s)の妥当性 1
続パタ読書会 6:事前確率P(s)の妥当性 2
続パタ読書会 7:ベル数 1
続パタ読書会 8:ベル数 2
続パタ読書会 9:P(s_k|x_k, s_-k, θ)の導出
続パタ読書会 10:演習問題12.5の計算
続パタ読書会 11:演習問題12.6の計算 1
続パタ読書会 12:演習問題12.6の計算 2
今回は保留にしてあった
の導出を行います。この結果はに対するギブスサンプリングで用いられました。
の導出
導出
まずはテキスト通り式を展開していくと
となります。ここで最後の式の第一項と第二項を順に考察していきます。まずは第一項ですがが既存クラスタか新規クラスタかによって結果が違います。そこで以降は既存クラスタを、新規クラスタをとして表すとします。まず既存クラスタの場合は素直に
となります。ところがの場合はが未定のためは計算できません。そこでの事前分布で期待値を取ることになります。具体的には
となります。この積分はがの共役事前分布の場合は解析的に解けは積分消去されるため、未定であることは問題となりません。続いて第二項のですが、はCRPにより生成されたとするモデルですので読書会5, 6で記載した通り
となります。結果最初の式の通り
が導出できます。
参照
ディリクレ過程混合モデルにおけるマルコフ連鎖についてはテキストでも参照されている下記論文に詳細があります。
ディリクレ過程混合モデルにおけるマルコフ連鎖の論文です。ディリクレ過程混合モデルにメトロポリス・ヘイスティングス法を適用するアルゴリズム等も記載されています。
「続・わかりやすいパターン認識」の著者の一人である上田修功さんと、山田 武士さんの共著論文です。ここでは具体的に解説しなかったディリクレ過程の無限次元拡張からのCRP分割ルール導出や、いずれ私のページでも載せる予定のIRMについても詳しく載っています。ただしこれらのトピックは「続・わかりやすいパターン認識」にもかみ砕いて載っていますのでそちらで参照することも可能です。
今回はこれくらいにして次回は演習問題12.5の導出を行います。
続パタ読書会 1:ディリクレ過程混合モデル
続パタ読書会 2:ディリクレ過程混合モデルのアルゴリズム
続パタ読書会 3:実験
続パタ読書会 4:実装
続パタ読書会 5:事前確率P(s)の妥当性 1
続パタ読書会 6:事前確率P(s)の妥当性 2
続パタ読書会 7:ベル数 1
続パタ読書会 8:ベル数 2
続パタ読書会 9:P(s_k|x_k, s_-k, θ)の導出
続パタ読書会 10:演習問題12.5の計算
続パタ読書会 11:演習問題12.6の計算 1
続パタ読書会 12:演習問題12.6の計算 2