One-pass アルゴリズム

<html> <div class="amazlet-box" style="margin-bottom:0px;"><div class="amazlet-image" style="float:left;"><a href="http://www.amazon.co.jp/exec/obidos/ASIN/0130151572/r4wh-22/ref=nosim/" name="amazletlink" target="_blank"><img src="http://ecx.images-amazon.com/images/I/51B%2BThmy0fL._SL160_.jpg" alt="Fundamentals of Speech Recognition (Prentice Hall Signal Processing Series)" style="border: none;" /></a></div><div class="amazlet-info" style="float:left;margin-left:15px;line-height:120%"><div class="amazlet-name" style="margin-bottom:10px;line-height:120%"><a href="http://www.amazon.co.jp/exec/obidos/ASIN/0130151572/r4wh-22/ref=nosim/" name="amazletlink" target="_blank">Fundamentals of Speech Recognition (Prentice Hall Signal Processing Series)</a><div class="amazlet-powered-date" style="font-size:7pt;margin-top:5px;font-family:verdana;line-height:120%">posted with <a href="http://www.amazlet.com/browse/ASIN/0130151572/r4wh-22/ref=nosim/" title="Fundamentals of Speech Recognition (Prentice Hall Signal Processing Series)" target="_blank">amazlet</a> at 10.04.24</div></div><div class="amazlet-detail">Lawrence Rabiner Biing-Hwang Juang <br />Prentice Hall <br />売り上げランキング: 171670<br /></div><div class="amazlet-link" style="margin-top: 5px"><a href="http://www.amazon.co.jp/exec/obidos/ASIN/0130151572/r4wh-22/ref=nosim/" name="amazletlink" target="_blank">Amazon.co.jp で詳細を見る</a></div></div><div class="amazlet-footer" style="clear: left"></div></div> </html>

<html> <div class="amazlet-box" style="margin-bottom:0px;"><div class="amazlet-image" style="float:left;"><a href="http://www.amazon.co.jp/exec/obidos/ASIN/4900886025/r4wh-22/ref=nosim/" name="amazletlink" target="_blank"><img src="http://images-jp.amazon.com/images/G/09/icons/books/comingsoon_books.gif" alt="音声認識の基礎 (下)" style="border: none;" alt="no image" /></a></div><div class="amazlet-info" style="float:left;margin-left:15px;line-height:120%"><div class="amazlet-name" style="margin-bottom:10px;line-height:120%"><a href="http://www.amazon.co.jp/exec/obidos/ASIN/4900886025/r4wh-22/ref=nosim/" name="amazletlink" target="_blank">音声認識の基礎 (下)</a><div class="amazlet-powered-date" style="font-size:7pt;margin-top:5px;font-family:verdana;line-height:120%">posted with <a href="http://www.amazlet.com/browse/ASIN/4900886025/r4wh-22/ref=nosim/" title="音声認識の基礎 (下)" target="_blank">amazlet</a> at 10.04.24</div></div><div class="amazlet-detail">Lawrence Rabiner Biing‐Hwang Juang <br />NTTアドバンステクノロジ <br />売り上げランキング: 1410268<br /></div><div class="amazlet-link" style="margin-top: 5px"><a href="http://www.amazon.co.jp/exec/obidos/ASIN/4900886025/r4wh-22/ref=nosim/" name="amazletlink" target="_blank">Amazon.co.jp で詳細を見る</a></div></div><div class="amazlet-footer" style="clear: left"></div></div> </html>

定式化

 テストパターン : T 
 参照パターン : {R_1, R_2, ... R_V}
 テストフレームインデックス : m (1 <= m <= M)
 参照パターン R_v のインデックス : n (1 <= n <= N_v)
 R_v におけるフレームのインデックス n (1 <= n <= N_v)

 テストパターンのフレーム t(m) と参照パターンのフレーム r_v(n) の
 局所的な距離 : d(m, n, v)

 各テストフレームに対する累積距離 : d_A(m, n, v)

仮定

- 最大のpath伸縮を2倍までとする

n = 1 の場合

 d_A(m, 1, v) = d(m, 1, v) 
 + min | min         [d_A(m-1, N_r, r)] |
       | 1 <= r <= V                    |
       |                                |
       | d_A(m-1, 1, v)                 |

- すべての参照パターンの最終状態からの遷移の最小コスト候補
- 同じ参照の先頭フレームを繰り返しマッチングさせる場合

n >= 2 の場合

 d_A(m, n, v) = d(m, n, v) 
 + min           (d_A(m-1, j, v))
   n-2 <= j <= n

- j のループは，(m-1, n-2), (m-1, n-1), (m-1, n) のそれぞれから
(m, n) に遷移するパスを比較することに対応する

- 実際には argmin のインデックスも保存する必要がある

最終解

 D^* = min         [ d_A(M, N_v, v) ]
       1 <= v <= V

テストパターンの最終フレームに対して，
すべての参照パターン v について、
参照パターンの最終フレームに対応する累積コストの最小値を求める。
実際にはそのような解が得られる添字を「最後のラベル」とする。

バックトレースして，テストパターン全体と、参照パターンの
アラインメントを求める。

ja.nishimotz.com

目次

One-pass アルゴリズム