Processing math: 100%

マルコフ連鎖

Takami Torao

定義と性質

時刻やステップの推移で状態空間 {1,2,,k} のいずれかの値を持つ確率変数について考える。ある時点 t(0,1,) での確率変数を x(t) とする。

確率過程 (x(0),x(1),) において、ある確率変数 x(t+1) が直前の確率変数 x(t) のみに依存するとき、確率過程はマルコフ連鎖 (Markov chain)である。P(x(t+1)|x(0),x(1),,x(t))=P(x(t+1)|x(t))

マルコフ連鎖は t+1 時点での条件付確率分布が t 時点よりも前の履歴には依存しない確率過程である。この性質はマルコフ性 (Markov property) という。

推移行列

式 (1) の条件付確率より、時点 t から t+1 への推移で状態空間の i から j へ移動する推移確率P(x(t+1)=j|x(t)=i)=p(i,j) とするとき、推移確率の k×k 行列を推移行列 (transition matrix) と呼ぶ。T=(p(1,1)p(1,2)p(1,k)p(2,1)p(2,2)p(2,k)p(k,1)p(k,2)p(k,k)) ここで p(i,j)0, kj=1p(i,j)=1 である。

ある時点 t において確率変数 x(t) の取りうる状態空間のそれぞれ確率を行ベクトル π(t) で表す。π(t)=(π(t)1,π(t)2,,π(t)k)=(P(x(t)=1),P(x(t)=2),,P(x(t)=k))

t+1 時点で確率変数 xj である確率は以下のように表される。π(t+1)j=P(x(t+1)=j)=ki=1P(x(t)=i,x(t+1)=j)=ki=1P(x(t)=i)P(x(t+1)=j|x(t)=i)=ki=1π(t)ip(i,j) π(t+1)=π(t)T=π(t1)T2==π(0)Tt よってマルコフ連鎖の確率的振る舞いは初期分布 π(0) と遷移行列 T によって完全に決定する。

既約性 (irreduciiblity)

到達不能な状態が存在しない性質。任意の状態 ij について、i から j へ有限回のステップでたどり着くことができるときマルコフ連鎖は既約である。

以下の推移行列 T は、状態 2 から状態 1 へは移ることができるが状態 1 から状態 2 へはたどり着くことができないため既約ではない。T=(100.60.4)

非周期性 (aperiodicity)

推移行列において元の状態に戻るまでに必要なそれぞれの要素のステップ数の最大公約数が 1 の時、連鎖は非周期性である。

以下の推移行列 T はステップ 2 で元の状態へ戻るため非周期ではない。T=(0110)

不変分布 (invariant distribution)

推移行列 T のマルコフ連鎖に対して行ベクトル π=(π1,,πk) が以下の条件をみたすとき πT の不変分布である。πi0,  ki=1πk=1π=πT

マルコフ連鎖が規約性と周期性を満たすとき、不変分布が一意に存在し π(t) は不変分布 π に収束する。

参考文献