続・わかりやすいパターン認識 ひとり読書会 5
今回は保留になっていたものの一つ、事前確率P(s)の妥当性について考えます。
続パタ読書会 1:ディリクレ過程混合モデル
続パタ読書会 2:ディリクレ過程混合モデルのアルゴリズム
続パタ読書会 3:実験
続パタ読書会 4:実装
続パタ読書会 5:事前確率P(s)の妥当性 1
続パタ読書会 6:事前確率P(s)の妥当性 2
続パタ読書会 7:ベル数 1
続パタ読書会 8:ベル数 2
続パタ読書会 9:P(s_k|x_k, s_-k, θ)の導出
続パタ読書会 10:演習問題12.5の計算
続パタ読書会 11:演習問題12.6の計算 1
続パタ読書会 12:演習問題12.6の計算 2
今回は保留になっていたものの一つ、何故の事前確率を
と定めるのが妥当なのか、また集中度パラメータαの意味は何なのかについて考えます。長いため読書会5と6に分けて記述します。
事前確率の妥当性 1
は個の観測パターンが各々どのパターンに属するかを表す潜在変数の事前確率です。つまりパターンを観測する前に個のパターンを分割するとすればどのような分割がどのような確率で起こりうるかをモデル化したものです。妥当な事前分布を定めるためにはまず妥当な分割ルールを定めなくてはいけません。結果としてディリクレ過程を分割の確率モデルとして使用しますが、その実現例の一つにCRPがあります。
CRP
CRP(Chinese Restaurant Process)は中華料理店過程と呼ばれるもので、テーブルが無限にある中華料理店に客が一人ずつ来店し以下のルールに従ってテーブルに着席する過程のことを指します。
- 最初の客は任意のテーブルに着席する
- 番目以降の客はすでに人着席しているテーブルに確率で、誰も着席していないテーブルに確率で着席する
CRPでの各テーブルは各クラスタに対応し、人の客はこのパターンに対応しています。この分割ルールがディリクレ過程の実現例であることの説明は別途行うとして、ここではこのルールの下6人の来客があったケースを考えます。まずの順で着席する確率を考えると
またの順で着席する確率を考えると
となり結果は変わりません。つまり6人の客を3人、2人、1人のテーブルに分割する確率は来店の順にかかわらず
となります。つまりCRPによる分割の確率は
- テーブルがいくつあるか
- 各テーブルに何人ずつ着席しているか
のみに依存しており、来客の順番やテーブルの種類には依存しません。クラスタリングとして考えると
のみに依存し、パターンがクラスタに割り当てられる順序やどのクラスタに割り当てられているかに依存しないことを意味します。これを人の客が個のテーブルに各々人着席した場合に一般化すると
となり、これがディリクレ過程に基づくの事前確率に他なりません。結果として初めの式
はCRPを妥当な分割ルールであるとするならば妥当な式であると言えます。CRP自体が妥当な分割ルールであることはこれがディリクレ過程の実現例であることによって示されます。
ディリクレ過程の定義
CRPによる分割ルールがディリクレ過程の実現例である事を示すため、まずはディリクレ過程の定義から始めます。これはテキスト通りの定義ですのでテキスト持っている方はすっ飛ばしてください。
- ディリクレ過程の定義 1
- 集合とその部分集合を要素とする集合族からなる可測空間の基底分布を、集中度パラメータをとする。確率測度がのいかなる可測な排他的分割
- に対しても次元確率ベクトルがディリクレ分布に従うときすなわち
- のとき、その時に限りはディリクレ過程に従うといい
- と記す。ただしはから生成されたが区間に所属する確率
- を意味する。
ディリクレ過程の定義を多少かみ砕いた形に変えるために以下の定義を導入します。
この定義において
であることを考えると
が成り立つことに注意します。この定義の下ディリクレ過程の定義は次のように書き換えられます。
- ディリクレ過程の定義 2
- の下で確率ベクトルが分割数及び分割の仕方にかかわらず
- を満たすとき、このような確率分布を生成する確率過程をディリクレ過程といい
- と記す。
CRPによる分割ルールがディリクレ過程の実現例であることの確認
ディリクレ過程において生成されたにおいてがどのように生成されるかを考えます。をから独立に生成された系列とすると、の事後分布は
となります。この式の導出は後ほど行います。ここではクラスタを表しており、です。またはに位置する大きさの点を表し、はクラスタに所属するの数、つまりとなるの数です。が成り立つことに注意します。この式をクラスタリングの過程として考えればの観測の下の比で新規クラスタ、もしくは既存のクラスタに確率的に割り当てていることになります。つまり
といった割り当て方です。これはCRPでの分割ルールと等価であり、よってCRPがディリクレ過程の実現例であることが確認できました。
ディリクレ過程の共役性
CRPがディリクレ過程の実現例であることは確認できましたが、ディリクレ過程で生成されるがどのような分布か、また先のをどのように求めるかは保留されています。ですのでそれを知るためにまずディリクレ過程の共役性について考えます。初めにをから独立に生成された系列としたとき、これらを観測した後のの事後分布を求めます。
ここで区間内に位置するの総数をとすると
と計算できるので結局
となります。右辺はディリクレ分布型ですので正規化項を計算するまでもなく
となります。ここでとしています。また、をに位置する大きさ1の点とすると
なのでパラメータは以下のように書き換えることが出来ます。
ここで
と置くと
とあらわせます。さらに
の二つが言えます。この結果からからを生成した下での事後分布においても下記のように「ディリクレ過程の定義 2」を満たすことを示すことが出来ます。
- ディリクレ過程の定義 2(事後分布)
- の下で確率ベクトルが分割数及び分割の仕方にかかわらず
- を満たしているため、事後分布はディリクレ過程に従い
- である。
よってディリクレ過程はの観測に対し共役性を持つことが示されました。
今回はここまでにして次回は事前確率の妥当性の続きとしての形状等を記述します。
続パタ読書会 1:ディリクレ過程混合モデル
続パタ読書会 2:ディリクレ過程混合モデルのアルゴリズム
続パタ読書会 3:実験
続パタ読書会 4:実装
続パタ読書会 5:事前確率P(s)の妥当性 1
続パタ読書会 6:事前確率P(s)の妥当性 2
続パタ読書会 7:ベル数 1
続パタ読書会 8:ベル数 2
続パタ読書会 9:P(s_k|x_k, s_-k, θ)の導出
続パタ読書会 10:演習問題12.5の計算
続パタ読書会 11:演習問題12.6の計算 1
続パタ読書会 12:演習問題12.6の計算 2