JP2775140B2

JP2775140B2 - パターン認識方法、音声認識方法および音声認識装置

Info

Publication number: JP2775140B2
Application number: JP6048694A
Authority: JP
Inventors: 隆小森; 滋片桐
Original assignee: Ei Tei Aaru Ningen Joho Tsushin Kenkyusho Kk
Current assignee: Ei Tei Aaru Ningen Joho Tsushin Kenkyusho Kk
Priority date: 1994-03-18
Filing date: 1994-03-18
Publication date: 1998-07-16
Anticipated expiration: 2013-07-16
Also published as: JPH07261784A; US5749069A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、パターン認識方法、
音声認識方法および音声認識装置に関し、特に、事後オ
ッズを用いたパターン認識方法、音声認識方法および音
声認識装置に関する。

【０００２】

【従来の技術および発明が解決しようとする課題】人間
による自然な発話は、必ずしも文法規則に従うとは限ら
ないうえ、間投詞や舌打ちなど様々な音響現象が混入し
ている。これを機械への入力インタフェースとして用い
るための有望な方法の１つは、発話音声からシステムに
とって重要な限定された単語のみをその位置とともに検
出し（ワードスポッティング）、その結果を基に構文解
析などの高次処理を得て最も確からしい単語列を決定す
るものである。

【０００３】ワードスポッティングの１つの方法は、対
象単語との一致性を図る何らかのスコアを観測音声のあ
らゆる部分パターンごとに計算し、しきい値との比較に
よって単語候補を決定するものである。ただしこの場
合、しきい値は経験的に選ばれていた。さらに、個々の
単語候補のスコアは、しきい値と比較するために単語の
時間長に依存しないように正規化されるため、長さの異
なる単語列の認識の確からしさを単語スコアの単純な累
積によって直接比較することはできない。主にこの理由
のため、この枠組における従来の単語列スコアも経験則
に基づくもののみであった。

【０００４】ワードスポッティングの他の方法は、対象
単語の各類に加えて、「ごみ類」、すなわち、対象単語
以外の音響現象をすべて包含する類、を用意し、観測音
声をそれらの類の音響現象が隙間なく連続したものとみ
なして単語列を認識するものである。この方法は、従来
の連続音声認識の枠組と全く同じ問題に煩わされる。す
なわち、各時刻において累積スコアを文法ノードの数だ
け保存かつ計算しなければならないが、文法の複雑さの
増加に伴い、文法ノード数は爆発的に増大し、計算は非
現実的なものになる。これを防ぐため、累積スコアの低
い文法ノードを途中で棄却する方法（ビームサーチ）が
とられる。ビームサーチも経験則の１つでしかない。

【０００５】両者に共通の戦略は、観測音声に対して最
も確からしい単語列を求めるための膨大な計算量を、理
論的最適性を犠牲にし、経験的知識に基づく候補絞り込
みによって削減することである。この場合、たとえスコ
ア計算部と候補絞り込み部の２つの部分を最適に設計し
ても、それぞれに異なる基準を用いている限り、システ
ム全体を最適化することにはならない。スコア計算部と
候補絞り込み部の両方を含んだ系全体を単一の目的関数
によって直接的に最適化すべきである。ところが、ワー
ドスポッティングに基づく音声認識器の従来の設計にお
いては、スコア計算部の設計と候補絞り込み処理部の設
計は別々になされていた。

【０００６】以上のことをまとめると、ワードスポッテ
ィングに基づく連続音声認識器は、スコアに基づく部分
仮説の絞り込みと部分仮説の組合せによる単語列の決定
という２つの処理機構から構成されていた。その設計法
は、構成上の複雑さのため、部分的にのみ最適なものや
経験的なものにとどまっており、理論的な背景を持つ系
全体の最適化方法は提案されていなかった。

【０００７】一方、近年発表された一般化確率的降下法
（ＧＰＤ）は、一次微分可能な連続関数による近似の採
用により、最小値選択や決定処理という不連続的な処理
を含む系の勾配探索による最適化の枠組を提供した。そ
の具体的応用として、音声の分類における誤識別率を最
小化する学習法が提案されている他、スポッティングに
も応用されている。

【０００８】ゆえに、この発明は、まだ提案されたこと
のない事後オッズに基づくスコアを用い、そのスコアに
基づく部分仮説の絞り込みを行ない、さらに部分仮説の
組合せによる単語列の決定をして音声を認識することが
できるような音声認識方法および音声認識装置を提供す
ることである。

【０００９】さらに、本発明は、事後オッズに基づくス
コア決定部と候補絞り込み部の両方を含んだ系全体を最
適化することができるような音声認識方法および音声認
識装置を提供することである。

【００１０】また、この発明は、音声認識方法および音
声認識装置のみならず、部分パターンのスコアとして事
後オッズに基づくものを用い、そのスコアによる絞り込
みを行ない、その部分パターンの組合せによる連続パタ
ーンの決定を行なってパターンを認識することができる
ようなパターン認識方法を提供することである。

【００１１】

【課題を解決するための手段】請求項１の発明に係るパ
ターン認識方法は、連続パターンの複数の部分パターン
を認識し、その組合せとして連続パターンを認識するパ
ターン認識方法において、それぞれが各部分パターンの
認識の確からしさを表わし、かつ各部分パターンに対応
する複数の物理量を事後オッズの推定値に基づいて決定
する第１のステップと、各物理量に基づいて、各部分パ
ターンの組合せの認識の確からしさを表現する累積物理
量を決定する第２のステップと、決定された累積物理量
に基づいて、連続パターンを組合せの所定の類に分類す
る第３のステップとを含んでいる。

【００１２】請求項２では、請求項１のステップは、累
積物理量の決定または連続パターンの分類のために、部
分パターンの候補を絞り込むステップを含んでいる。

【００１３】請求項３では、請求項１または２の第１の
ステップは、物理量の決定のために、推定事後オッズの
尤度を最大化するパラメータを用いて事後オッズの推定
値を求めるステップを含んでいる。

【００１４】請求項４では、請求項１または２の第１の
ステップは、物理量の決定のために、分類による誤り率
を所定の関数で表現し、その関数の値を最小化するパラ
メータを用いて事後オッズの推定値を求めるステップを
含んでいる。

【００１５】請求項５では、請求項１または２の第１の
ステップは、物理量の決定のために、分類による誤り率
および計算量を所定の関数で表現し、その関数の値を最
小化するパラメータを用いて事後オッズの推定値を求め
るステップを含んでいる。

【００１６】請求項６では、請求項２の第１のステップ
は、物理量の決定および部分パターンの絞り込みのため
に、分類による誤り率を所定の関数で表現し、その関数
の値を最小化するパラメータを用いて事後オッズの推定
値を求めるステップを含んでいる。

【００１７】請求項７では、請求項２の第１のステップ
は、物理量の決定および部分パターンの絞り込みのため
に、分類による誤り率および計算量を所定の関数で表現
し、その関数の値を最小化するパラメータを用いて事後
オッズの推定値を求めるステップを含んでいる。

【００１８】請求項８の発明に係る音声認識方法は、時
系列からなる音声パターンの複数の部分パターンを認識
し、その組合せとして音声パターンを認識する音声認識
方法であって、それぞれが各部分パターンの認識の確か
らしさを表わし、かつ各部分パターンに対応する複数の
スコアを事後オッズの推定値に基づいて決定する第１の
ステップと、各スコアに基づいて、各部分パターンの組
合せの認識の確からしさを表現する累積スコアを決定す
る第２のステップと、決定された累積スコアに基づい
て、音声パターンを組合せの所定の類に分類する第３の
ステップとを含んでいる。

【００１９】請求項９では、請求項８の第１のステップ
は、累積スコアの決定または音声パターンの分類のため
に、部分パターンの候補を絞り込むステップを含んでい
る。

【００２０】請求項１０では、請求項８または９の第１
のステップは、スコアの決定のために、推定事後オッズ
の尤度を最大化するパラメータを用いて事後オッズの推
定値を求めるステップを含んでいる。請求項１１では、
請求項８または９の第１のステップは、スコアの決定の
ために、分類による誤り率を所定の関数で表現し、その
関数の値を最小化するパラメータを用いて事後オッズの
推定値を求めるステップを含んでいる。

【００２１】請求項１２では、請求項８または９の第１
のステップは、スコアの決定のために、分類による誤り
率および計算量を所定の関数で表現し、その関数の値を
最小化するパラメータを用いて事後オッズの推定値を求
めるステップを含んでいる。

【００２２】請求項１３では、請求項９の第１のステッ
プは、スコアの決定および部分パターンの候補の絞り込
みのために、分類による誤り率を所定の関数で表現し、
その関数の値を最小化するパラメータを用いて事後オッ
ズの推定値を求めるステップを含んでいる。

【００２３】請求項１４では、請求項９の第１のステッ
プは、スコアの決定および部分パターンの候補の絞り込
みのために、分類による誤り率および計算量を所定の関
数で表現し、その関数の値を最小化するパラメータを用
いて事後オッズの推定値を求めるステップを含んでい
る。

【００２４】請求項１５の発明に係る音声認識装置は、
時系列からなる音声パターンの複数の部分パターンを認
識し、その組合せとして音声パターンを認識する音声認
識装置であって、それぞれが各部分パターンの認識の確
からしさを表現し、かつ各部分パターンに対応する複数
のスコアを事後オッズの推定値に基づいて決定するスコ
ア決定手段と、各スコアに基づいて、各部分パターンの
組合せの認識の確からしさを表現する累積スコアを決定
する累積スコア決定手段と、決定された累積スコアに基
づいて、音声パターンを組合せの所定の類に分類する分
類手段とを備えている。

【００２５】請求項１６の発明に係る音声認識装置は、
さらに、スコアの決定または音声パターンの分類のため
に、各部分パターンの候補を絞り込む絞り込み手段を備
えている。

【００２６】請求項１７の発明に係る音声認識装置は、
さらに、スコアの決定のために、推定事後オッズの尤度
を最大化するパラメータを用いて事後オッズの推定値を
最適化する最適化手段を備えている。

【００２７】請求項１８の発明に係る音声認識装置は、
さらに、スコアの決定のために、分類による誤り率を所
定の関数で表現し、その関数の値を最小化するパラメー
タを用いて事後オッズの推定値を最適化する最適化手段
を備えている。

【００２８】請求項１９の発明に係る音声認識装置は、
さらに、スコアの決定のために、分類による誤り率およ
び計算量を所定の関数で表現し、その関数の値を最小化
するパラメータを用いて事後オッズの推定値を最適化す
る最適化手段を備えている。

【００２９】請求項２０の発明に係る音声認識装置は、
さらに、スコアの決定および部分パターンの候補の絞り
込みのために、分類による誤り率を所定の関数で表現
し、その関数の値を最小化するパラメータを用いて事後
オッズの推定値を最適化する最適化手段を備えている。

【００３０】請求項２１の発明に係る音声認識装置は、
さらに、スコアの決定および部分パターンの候補の絞り
込みのために、分類による誤り率および計算量を所定の
関数で表現し、その関数の値を最小化するパラメータを
用いて事後オッズの推定値を最適化する最適化手段を備
えている。

【００３１】

【作用】請求項１の発明に係るパターン認識方法は、連
続パターンを形成している複数の部分パターンの認識の
確からしさを、事後オッズの推定値に基づく物理量で決
定し、その物理量に基づいて決定した部分パターンの組
合せの認識の確からしさに基づいて、連続パターンを認
識できる。

【００３２】請求項２の発明に係るパターン認識方法
は、部分パターンの候補を絞り込み、その組合せを減ら
して、連続パターンの認識を効率化できる。

【００３３】請求項３の発明に係るパターン認識方法
は、推定事後オッズの尤度を最大化するパラメータを用
い、連続パターンの認識を最適化できる。

【００３４】請求項４の発明に係るパターン認識方法
は、物理量の決定のために、分類による誤り率を所定の
関数で表現し、その関数の値を最小化するパラメータを
用い、連続パターンの認識を最適化できる。

【００３５】請求項５の発明に係るパターン認識方法
は、物理量の決定のために、分類による誤り率および計
算量を所定の関数で表現し、その関数の値を最小化する
パラメータを用い、連続パターンの認識を最適化でき
る。

【００３６】請求項６の発明に係るパターン認識方法
は、物理量の決定および部分パターンの絞り込みのため
に、分類による誤り率を所定の関数で表現し、その関数
の値を最小化するパラメータを用い、連続パターンの認
識を最適化できる。

【００３７】請求項７の発明に係るパターン認識方法
は、物理量の決定および部分パターンの絞り込みのため
に、分類による誤り率および計算量を所定の関数で表現
し、その関数の値を最小化するパラメータを用い、連続
パターンの認識を最適化できる。

【００３８】請求項８の発明に係る音声認識方法は、部
分パターンの認識の確からしさを事後オッズの推定値に
基づくスコアで決定し、そのスコアに基づいて決定した
部分パターンの組合せの認識の確からしさに基づいて、
音声パターンを認識できる。

【００３９】請求項９の発明に係る音声認識方法は、部
分パターンの候補を絞り込み、その組合せを減らして、
音声パターンの認識を効率化できる。

【００４０】請求項１０の発明に係る音声認識方法は、
推定事後オッズの尤度を最大化するパラメータを用い、
音声パターンの認識を最適化できる。

【００４１】請求項１１の発明に係る音声認識方法は、
スコアの決定のために、分類による誤り率を所定の関数
で表現し、その関数の値を最小化するパラメータを用
い、音声パターンの認識を最適化できる。

【００４２】請求項１２の発明に係る音声認識方法は、
スコアの決定のために、分類による誤り率および計算量
を所定の関数で表現し、その関数の値を最小化するパラ
メータを用い、音声パターンの認識を最適化できる。

【００４３】請求項１３の発明に係る音声認識方法は、
スコアの決定および部分パターンの候補の絞り込みのた
めに、分類による誤り率を所定の関数で表現し、その関
数の値を最小化するパラメータを用い、音声パターンの
認識を最適化できる。

【００４４】請求項１４の発明に係る音声認識方法は、
スコアの決定および部分パターンの候補の絞り込みのた
めに、分類による誤り率および計算量を所定の関数で表
現し、その関数の値を最小化するパラメータを用い、音
声パターンの認識を最適化できる。

【００４５】請求項１５の発明に係る音声認識装置は、
部分パターンの認識の確からしさを事後オッズの推定値
に基づくスコアで決定し、そのスコアに基づいて決定し
た部分パターンの組合せの認識の確からしさに基づい
て、音声パターンを認識できる。

【００４６】請求項１６の発明に係る音声認識装置は、
部分パターンの候補を絞り込み、その組合せを減らし
て、音声パターン認識を効率化できる。

【００４７】請求項１７の発明に係る音声認識装置は、
推定事後オッズの尤度を最大化するパラメータを用い、
音声パターンの認識を最適化できる。

【００４８】請求項１８の発明に係る音声認識装置は、
スコアの決定のために、分類による誤り率を所定の関数
で表現し、その関数を最小化するパラメータを用い、音
声パターンの認識を最適化できる。

【００４９】請求項１９の発明に係る音声認識装置は、
スコアの決定のために、分類による誤り率および計算量
を所定の関数で表現し、その関数を最小化するパラメー
タを用い、音声パターンの認識を最適化できる。

【００５０】請求項２０の発明に係る音声認識装置は、
スコアの決定および部分パターンの候補の絞り込みのた
めに、分類による誤り率を所定の関数で表現し、その関
数を最小化するパラメータを用い、音声パターンの認識
を最適化できる。

【００５１】請求項２１の発明に係る音声認識装置は、
スコアの決定および部分パターンの候補の絞り込みのた
めに、分類による誤り率および計算量を所定の関数で表
現し、その関数を最小化するパラメータを用い、音声パ
ターンの認識を最適化できる。

【００５２】

【実施例】まず、図面を用いて実施例を説明する前に、
概念的な説明をする。第１段階として、ワードスポッテ
ィングによる音声認識装置が個々の単語候補の決定の組
合せによって音声を認識すると考えられるので、一般的
な組合せ決定問題を解く機構の定式化を説明する。第２
段階として、その最適化設計法として、最尤推定、最小
組合せ決定誤り、最小組合せ決定誤りに最小計算量を加
味したものによる設計基準について説明する。そして、
第３段階で図面を用いて音声認識装置について説明す
る。

【００５３】［組合せ決定機構の定式化］１．１対数事後オッズに基づく決定機構証拠ｘを得て結論ａをくだす決定機構について説明す
る。選び得る結論の集合をＡ†（以下、カリグラフィッ
ク文字で表わすべき集合には†をつける）＝｛α _j｝
_j=1 ^Jとすると、一般的には、各々のα_jが互いに排反
であるとは限らないので複数の結論が導かれることもあ
り得、また、証拠ｘからはいずれの結論をも導き出せな
いということも起こり得る。このような場合は、ａ∈Ａ
†ではなく、ａ∈Ｐ†⊆ｐ†（Ａ†）とすべきである。
ここに、ｐ†（Ａ†）は、Ａ†のべき集合であり、｜ａ
｜＞１の場合は複数の結論が導かれることを、ａ＝ф
（фは、空集合である。）の場合はいずれの結論も導か
れないことを表わす。部分的に排反な結論もあり得るの
で、一般にＰ†はｐ†（Ａ†）の部分集合である。

【００５４】証拠ｘを得たときの結論ａの事後確率Ｐｒ
（ａ｜ｘ）が与えられるとき、Ｂａｙｅｓの決定則、す
なわち、第（１）式によるａ^*が選ばれれば、決定誤り
は最小になる。そして、証拠ｘを得たときに各々の結論
α_jが導き出される事後確率Ｐｒ（α_j｜ｘ）が独立で
あると仮定すると、第（２）式が成り立つ。ただし、１
（・）は括弧内の論理式が真の値のとき１、偽のとき０
をとる２値関数である。

【００５５】ここで、ａ^*は、第（３）式および第
（４）式で示されるような結論ａの結論фに対する事後
確率の比の対数によるスコアＳ_a（ｘ）を用いて、第
（５）式に示すような状態でも得られる。第（４）式に
おいて、Ｐｒ（α_j｜ｘ）／（１−Ｐｒ（α_j｜ｘ））
を第（６）式に示すように定義すると、Ｏ（α_j｜ｘ）
は証拠ｘに基づく結論α_jの認識の確からしさを表わす
量で事後オッズと呼ばれる。第（５）式は、結論ａの認
識の確からしさが個々の結論α_j∈ａの対数事後オッズ
の和によって見積もられ、その最大値の探索によって最
良の結論ａ^*を導き出せることを示している。

【００５６】この考えに基づき、以下では、対数事後オ
ッズの和によるスコアＳ_a（ｘ）の推定値の比較により
決定を下す決定機構を取り扱う。すなわち、対数事後オ
ッズｌｎＯ（α_j｜ｘ）の推定値が決定機構の系全体の
パラメータ集合Λによってη _j（ｘ；Λ）として得られ
るとき、第（７）式で示されるスコアＳ_a（ｘ）の推定
値Ｓ∧_a（ｘ；Λ）の最大値の探索によって決定が下さ
れる。

【００５７】

【数１】

【００５８】１．２対数事後オッズの累積スコアによ
る組合せ決定機構次に、複数の決定問題の組合せを解く場合について考え
る。Ｉ個の問題の組Ｑ＝｛ｑ_i｝_i=1 ^Iの各要素ｑ_iに
ついての結論をそれぞれａ_i∈Ｐ†とする。それぞれに
対する証拠ｘ_iの組Ｘ＝｛ｘ_i｝_i=1 ^Iが得られたと
き、選び得る結論の組の集合Ω⊆Ｐ†^Iの中で最も確か
らしい結論の組を求めることについて考える。各問題ｑ
_iが互いに独立であるとき、結論の組Ａ＝｛ａ_i｝_i=1
^I∈Ωの事後確率Ｐｒ（Ａ｜Ｘ）について、第（８）式
が成り立つので、１．１節と同様に結論の組Ａのスコア
Ｓ_A（Ｘ）を第（９）式および第（１０）式のように定
めれば、第（１１）式に示される結論の組Ａ^*を選ぶこ
とはＢａｙｅｓの決定則と等価である。実際には真の事
後確率Ｐｒ（Ａ｜Ｘ）は未知なので、第（１２）式で示
される対数事後オッズの推定値の和で定義されるスコア
Ｓ∧_A（Ｘ；Λ）を最大化する第（２０）式に示すよう
なＡ^*を最適な結論の組とみなす。

【００５９】

【数２】

【００６０】１．３対数事後オッズの累積スコアによ
る組合せ分類機構次に、証拠の組Ｘによって結論の組Ａの全体集合Ωの互
いに排反なＣ個の類Ω ₁，Ω₂，…，Ω_Cのいずれかに
分類する場合を考える。分類の場合は、Ｂａｙｅｓの決
定則は第（１４）式および第（１５）式に示されるｃ^*
を分類結果として採用することである。この決定則は、
第（１４）式および第（１５）式と等価な第（１６）式
および第（１７）式で示される決定則で置換えてもよ
い。

【００６１】実際には、真のＳ_A（Ｘ；Λ）の値は未知
なので、その推定値Ｓ∧_A（Ｘ；Λ）によって類ごとの
スコアを第（１８）式で示されるように決定し、第（１
９）式で示されるｃ^*を分類結果とすればよい。ただ
し、すべての類に含まれるすべての元Ａについてスコア
Ｓ_A（Ｘ）を求めることは現実的には難しいので、第
（２０）式で示されるスコアで代用することもできる。
最大値の探索には動的計画法を用いることができて計算
量がずっと少なくて済む。

【００６２】以下では、第（１８）式と第（２０）式で
示される両者を一般化した第（２１）式で示されるスコ
アＳ∧_C（Ｘ；Λ）を用いる。ただし、ξ_Cは正の定数
である。Ｓ∧_C（Ｘ；Λ）は、ξ_C＝１のとき第（１
８）式に一致し、ξ_C→∞のとき第（２０）式に限りな
く近づく。

【００６３】

【数３】

【００６４】１．４組合せ決定・分類のための候補絞
り込み 1 ．２節のような組合せ決定や１．３節のような組合せ
分類を計算機の上で実現するためには、考えられるすべ
ての結論ＡについてスコアＳ∧_A（Ｘ；Λ）を求める必
要がある。ところが結論の組合せＡの総数はＯ（２^JI）
であるため、ＩやＪの数の大きさに伴い爆発的に増大す
る。最大値探索においては動的計画法を用いればある程
度減らされるが、それよりさらに計算量を減らしたいと
きには、結果の最適性を犠牲にする方法を取らなければ
ならない。その１つは候補絞り込みであり、ある部分的
組合せ結論Ｂ∈Ｐ†^I'（Ｉ′＜Ｉ）について、Ｂをその
一部とする組合せ結論Ａのすべてのスコアの値が他の結
論のスコアと比較して無視できるくらい小さいと経験的
に判断される場合は、それらのスコアＳ∧_A（Ｘ；Λ）
を最後まで計算することなく計算から除外してしまうと
いう方法である。たとえば、ある固定のＩ′＜Ｉについ
て、すべてのＢ∈Ｐ†^I'に候補絞り込み処理を施し、そ
の数を１／Ｎに減らした場合は、その総数を１／Ｎ^I-I'
に減らすことができるので、劇的な効果がある。

【００６５】ある組合せ結論Ａに至る部分的組合せ結論
のうちで絞り込みの判定に用いられるものの全体集合を
Φ（Ａ）とし、部分的組合せ結論Ｂによる絞り込みの判
定を関数ω_Ｂ（Ｘ；Λ）で表わすと、候補絞り込み関数
ω_Ｂ（Ｘ；Λ）は、Ｂをその一部とする組合せ結論のス
コアの値が無視できるくらい小さいと判定する場合は
０、そうでないとき１をとる関数である。このとき、候
補絞り込み処理を含めた場合の組合せ結論の決定および
分類は、スコア関数を第（２２）式および第（２３）式
とし、第（２４）式および第（２５）式に示されるＡ〜
^＊およびｃ〜^＊を選ぶことである。第（２２）式で示さ
れるスコア関数Ｓ〜_Ａ（Ｘ；Λ）の計算において、棄却
される組合せ結論の候補については、Ｓ〜_Ａ（Ｘ；Λ）
の値が負の無限大となり、最適解にはなり得ない。また
は、第（２３）式のΣの中のｅｘｐ（Ｓ〜_Ａ（Ｘ；
Λ））の値が０となり、第（２３）式のＳ〜_ｃ（Ｘ；
Λ）の値に影響しないとみなし、Ｓ∧_Ａ（Ｘ；Λ）の値
を求めない。

【００６６】Ａ〜^*とＡ^*、Ｃ〜^*とＣ^*は一般に一致
しないが、候補絞り込み関数ω_B（Ｘ；Λ）の選択がそ
の不一致の頻度と計算量に大きく影響を及ぼす。その点
が考慮され、通常、候補絞り込み関数は経験的な知識に
基づいて適当に選ばれる。

【００６７】

【数４】

【００６８】［組合せ決定・分類のための最適化設計
法］ここでは、第（２２）式および第（２３）式による
スコアＳ〜_A（Ｘ；Λ），Ｓ〜_C（Ｘ；Λ）に基づいて
結論の組を決定あるいは分類する機構のための、パラメ
ータ集合Λの設計法について説明する。

【００６９】２．１最大尤度基準に基づく設計パラメータ集合Λからなる決定機構による結論α_jの事
後確率Ｐｒ（α_j｜ｘ）の推定値π_j（ｘ；Λ）は、第
（６）式により第（２６）式に示されるように与えられ
る。ｐ_j（ｘ）を、証拠ｘに対する結論α_jが正しかっ
たとき１、そうでなかったとき０をとる２値関数とする
と、証拠ｘに対するパラメータ集合Λの対数尤度ｌ
（ｘ；Λ）は、第（２７）式および第（２８）式のよう
に示される。このとき、第（２９）式で示される尤度関
数Ｌ（Λ）を最大化する第（３０）式に示すようなパラ
メータ集合Λ^*は最大尤度基準の下に最適である。

【００７０】ｌ（ｘ；Λ）がΛに関して１次微分可能な
連続関数であれば、最急降下法や一般化確率的降下法を
用いてΛ^*の準最適解を数値的に求めることができる。

【００７１】この設計法は候補絞り込み処理に関しての
考慮ができない。そのうえ、一般に事後確率分布の形は
不明であるので、このように事後確率分布形状を仮定し
たうえでの最尤推定に基づくパラメータ集合は与えられ
たデータに対する最小決定誤りを保証しない。類ごとの
データの数の偏りがある場合の非頑健性も指摘されてい
る。また、組合せ分類においては、各証拠ｘ_iごとにｐ
_j（ｘ_i）の値を確定することができないので、最尤推
定は難しい。たとえばＥＭアルゴリズムが使用されなけ
ればならない。ただし、以下に示す確率的勾配探索によ
る設計法のための妥当な初期値を与えることはできる。

【００７２】

【数５】

【００７３】２．２最小決定誤り基準に基づく設計パラメータ集合設計における最も重要な目的は結果とし
て与えられる決定機構の決定誤りを最小化することであ
るので、この節では、決定誤りを直接最小化することを
基準とする設計法について説明する。

【００７４】正しい結論の組がＡ^Oであるとき、費用関
数ｌ（Ｘ；Λ）を第（３１）式のように決定する。この
費用関数ｌ（Ｘ；Λ）は、第（１３）式による組合せ決
定が誤っていたとき１、正しかったとき０をとる関数で
あるので、第（３２）式で示されるその期待値Ｌ（Λ）
は決定誤り率を示す。期待値Ｌ（Λ）を損失関数として
それを最小化するパラメータ集合Λ^**が組合せ決定誤り
を最小化するパラメータ集合である。

【００７５】分類問題の場合は、正しい分類結果をｃ^O
とすると、第（３４）式で示される費用関数ｌ（Ｘ；
Λ）が用いられる。

【００７６】上の定義に基づくΛ^**を有限の標本から効
果的に求める方法は知られていないので、費用関数を第
（３５）式に示す連続関数ｌ〜（Ｘ；Λ）で近似する。
ただし、ζ_Aは正の定数、演算子｜・｜は集合の要素の
総数を表わし、関数１〜（・）は、第（３６）式に示す
ような２値ステップを近似する１次微分可能な連続関数
である。たとえばシグモイド関数１〜（ｘ）＝１／｛１
＋ｅｘｐ（−ｘ）｝が考えられる。以下、関数１〜
（・）を平滑化ステップ関数と呼ぶことにする。

【００７７】分類問題の場合は、第（３７）式で近似す
る。ただし、ζ_Cは正の定数である。ｌ〜（Ｘ；Λ）が
Λに関して１次微分可能な連続関数であれば、一般化確
率的降下法を用いることができる。１〜（ｙ）→１
（ｙ）とすることで、近似費用関数をいくらでも真の費
用関数に近づけることができる。

【００７８】

【数６】

【００７９】２．３最小決定誤りに計算量を加味した
基準に基づく設計パラメータ集合は、決定誤り率の最小化だけではなく、
計算量の観点からも最適化されるべきである。

【００８０】そこで、決定誤りあるいは分類誤りの費用
関数ｌ（Ｘ；Λ）を２．２節と同様に第（３１）式また
は第（３４）式によって定め、その他に、計算量を直接
反映する費用関数ｌ′（Ｘ；Λ）を定義する。たとえ
ば、第（３８）式に示されるｌ′（Ｘ；Λ）などであ
る。ただし、Ψ（Ｘ）は証拠の組Ｘが得られたときに結
論の組を得るときの候補絞り込みに使用する部分的結論
Ｂの集合である。この場合、ｌ′（Ｘ；Λ）の期待値は
絞り込みの甘さの度合いを表わしており、絞り込みが甘
いほど計算量が多くなることは予想される。損失関数を
第（３９）式に示すように、２つの費用関数の正の定数
γによる加重和の期待値Ｌ′（Λ）で定義するとき、第
（４０）式で示されるようなこのＬ′（Λ）を最小化す
るパラメータ集合Λ′^**は、決定誤りの数と計算量の両
方の観点からの最適なパラメータ集合とみなすことがで
きる。両者の均衡の度合いは定数γによって制御され
る。

【００８１】２つの費用関数ｌ（Ｘ；Λ）およびｌ′
（Ｘ；Λ）の両方を、第（３５）式と同様に平滑化ステ
ップ関数を用いてΛについて１次微分可能な連続関数で
近似すると、一般化確率的降下法を用いてΛ′^**の準最
適数値解を求めることができる。

【００８２】

【数７】

【００８３】なお、費用関数ｌ（Ｘ；Λ）、ｌ′（Ｘ；
Λ）は、第（３１）式などで決定した関数に限定される
ものでない。

【００８４】［音声認識装置の実施例］図１は、この発
明の一実施例による音声認識装置を示す概略ブロック図
であり、図２は、図１に示した音声認識装置の動作を説
明するためのフローチャートであり、図３は、図１の最
適化設計部の内部構成を示した概略ブロック図であり、
図４は、図３の最適化設計部の動作を説明するためのフ
ローチャートである。

【００８５】この節では、組合せ決定機構の具体事例と
して、音声認識装置を説明する。まず、図１から図４を
用いて具体的に説明し、その後で注意すべきことについ
て、特に対数事後オッズ推定関数、単語列の認識、単語
レベルの絞り込みなどについて説明する。

【００８６】図１を参照して、音声認識装置１は、デー
タ入力部５と、スコア計算部７と、絞り込み処理部９
と、累積スコア計算部１１と、認識結果決定部１３と、
認識結果出力部１５と、最適化設計部１８とを含む。デ
ータ入力部５には、入力データ３が入力される。入力デ
ータ３は、具体的には音声に関する時系列の音声パター
ンである。データ入力部５に入力された入力データ３に
基づき、スコア計算部７は１．１節で説明した事後オッ
ズに基づくスコアを決定する。絞り込み処理部９はスコ
ア計算部７で計算されたスコアの中で、累積スコア計算
部１１および認識結果決定部１３での処理を容易にする
ために絞り込みを行なう。具体的には、１．４節で説明
した組合せ決定・分類のための候補絞り込みが行なわれ
る。

【００８７】累積スコア計算部１１は、１．２節で説明
した対数事後オッズの累積スコアを決定する。この累積
スコアは、スコア計算部７で計算されたスコアの累積で
ある。この累積スコアは、スコアの数が多くなればなる
ほど、前述したように組合せが多くなるので、それを絞
り込み処理部９が極力押さえている。認識結果決定部１
３は、累積スコア計算部１１で計算された累積スコアに
基づいて音声の認識結果を決定している。認識結果出力
部１５は、それを認識結果１７として出力している。

【００８８】次に、図３および図４を参照して、図１に
示した最適化設計部１８について説明する。

【００８９】最適化設計部１８は、スコア計算部７のス
コア決定のみの最適化、またはスコア計算部７のスコア
決定および絞り込み処理部９の絞り込み処理の最適化を
行なう。この最適化設計部１８の動作は、スコア計算部
７の動作と同時に逐次的に行なわれてもよく、スコア計
算部７の動作よりも前に行なってもよい。その最適化と
しては、たとえば２．１節で説明した最大尤度基準に基
づく設計、２．２節で説明した最小決定誤り基準に基づ
く設計および２．３節で説明した候補絞り込みの最適化
設計が挙げられる。最適化設計部１８は、このような設
計に基づいて、初期パラメータ１９が入力される初期パ
ラメータ入力部２１と、学習データ２３が入力される学
習データ入力部２５と、パラメータ修正部２７と、修正
パラメータ２９を出力する修正パラメータ出力部３１と
を含んでいる。初期パラメータ１９は、前述した系のパ
ラメータである。学習データ２３は、時系列からなる音
声パターンとともにその音声パターンの正しい認識結果
が付随したデータである。この正しい認識結果が付随し
ていることにより、時系列の音声パターンの認識結果は
正しいのかまたは誤っているのかが明らかとなってい
る。したがって、正しい認識結果に基づいてパラメータ
修正部２７がパラメータすなわち前述のΛを修正する。
この修正のための基準として、たとえば２．１節で説明
した最大尤度基準が用いられれば、パラメータ集合が最
大尤度基準の下で最適にされる。また、パラメータ修正
部２７が２．２節の最小決定誤り基準に基づいてパラメ
ータを修正すれば、図１に示す認識結果決定部１３での
認識結果の決定の誤り率が最小になる。さらに、パラメ
ータ修正部２７が２．３節の最小決定誤りに計算量を加
味した基準に基づいてパラメータを修正すれば、認識結
果設定部１３における認識結果の決定誤り率に計算量が
加味された形で最適化される。

【００９０】図４に示すフローチャートに示すように、
学習データ入力から学習終了判定までが繰返されること
により、最適化設計部１８は、より最適なパラメータの
設計を行なうことができる。

【００９１】次に、１．１節から２．３節までで説明し
たことが集合を用いたものであったので、多少一般化し
た形であるが、この音声認識装置の注意事項について以
下説明する。まず、観測音声をＸ＝｛ｘ_i↑｝_i=1 ^Iと
する。ただし、各要素はＳ次元実ベクトル（ｘ_i↑∈Ｒ
_e ^S）。単語語彙がＷ†＝｛ｗ_k｝_k=1 ^Kであるとき、
文法によって許される単語列の集合をＧとして、観測時
系列Ｘを得たとき、第（４１）式で示されるすべての単
語列Ｗ_Cのうちで最も確からしい単語列Ｗ_C*が求められ
たいとする。

【００９２】第（４２）式に示す観測部分時系列Ｘ_s ^e
がどの単語に一致するかという結論ａ_s ^eのすべての
ｓ，ｅについての組合せのうちで、結果として単語列Ｗ
_Cが得られるものの集合をΩ_Cとすると、最適化設計部
１８は３種類のいずれかの最適基準を用いてパラメータ
集合Λ′^**を設計できる。

【００９３】

【数８】

【００９４】３．１対数事後オッズ推定関数観測部分時系列Ｘ_s ^eが単語ｗ_kである対数事後オッズ
がパラメータ集合ΛによってＹ_k（Ｘ_s ^e；Λ）である
と推定されるものとする。各単語ｗ_kはサブワード（た
とえば音素や音響イベント）集合Ａ†＝｛α_j｝_j=1 ^J
の要素の連結として表現されるものとし、Λはサブワー
ドごとのモデルλ_jからなる（Λ＝｛λ _j｝_j=1 ^J）と
する。

【００９５】各サブワードモデルは、プロトタイプＲ_j
と分散共分散行列集合Ｖ_jと係数ベクトルφ_j↑からな
る（λ_j＝｛Ｒ_j，Ｖ_j，φ_j↑｝）とする。ただし、
プロトタイプは、Ｍ個の参照ベクトルの集合がＮ個継続
に連結されたものとし、Ｒ_j＝｛Ｒ_jn＝｛ｒ_jnm↑｝
_m=1 ^M｝_n=1 ^N，Ｖ_j＝｛Ｖ_jn＝｛Σ_jnm｝_m=1 ^M｝_n=
₁ ^N，φ_j↑＝｛φ_j0，φ_j1｝である。ここに、ｒ_jnm
↑∈Ｒ_e ^S，Σ_jnm∈Ｒ _e ^S*S（ｓ＊ｓは、ｓ×ｓを意
味する）である。

【００９６】まず、観測部分時系列Ｘ_s ^eがサブワード
α_jである対数事後オッズがプロトタイプＲ_jの分散共
分散行列集合Ｖ_jによる距離Ｄ（Ｘ_s ^e，Ｒ_j，Ｖ_j）
の１次式によって推定されるモデルを想定し、第（４
３）式のようにη_j（Ｘ_s ^e；Λ）を定義する。ここ
で、距離Ｄ（Ｘ_s ^e，Ｒ_j，Ｖ_j）は次のように階層的
に定義される。

【００９７】第１に、観測音声の時刻ｉのベクトルｘ_i
↑と一参照ベクトルｒ_jnm↑との距離δを、対応する分
散共分散行列Σ_jnmによる２次形式によって第（４４）
式に示すように定義する。これを局所距離と呼ぶことに
する。

【００９８】第２に、観測音声の時刻ｉのベクトルｘ_i
↑とプロトタイプＲ_jのｎ番目の参照ベクトル集合Ｒ_jn
との距離Δを、第（４５）式に示すように定義し、状態
距離と呼ぶことにする。ただし、ξ_Sは正の定数であ
る。

【００９９】第３に、観測部分時系列Ｘ_s ^eとプロトタ
イプＲ_jの１つの対応経路における距離を考える。対応
経路θは、第（４６）式に示すような形式で与えられ、
｛ｉ，ｍ｝＝｛ι_l，ν_l｝によって時刻ｉ＝ｓ，ｓ＋
１，…，ｅ−１，ｅとプロトタイプの参照ベクトル集合
の指標ｎ＝１，２，…，Ｎを対応づける２次元座標の集
合である。また、対応経路θは、第（４７）式に示すよ
うに端点条件と、第（４８）式に示すような順序条件を
すべて満たすものとする。このとき、各々の対応経路θ
における距離を第（４９）式に示すように定義する。

【０１００】最後に、第（４３）式の距離Ｄ（・）を第
（５０）式に示すように定義し、以後、一般距離と呼ぶ
ことにする。ただし、ξ_Gは正の定数である。

【０１０１】次に、サブワードごとの対数事後オッズη
_j（・）を用いて、サブワードα_jの連結で表現された
第（５１）式に示すような単語ｗ_kの対数事後オッズＹ
_k（Ｘ_s ^e；Λ）を次のように階層的に定義する。

【０１０２】第１に、観測部分時系列Ｘ_s ^eの１つサブ
ワード境界列における対数事後オッズを考える。第（５
２）式に示す境界列βは、第（５３）式に示す部分時系
列と単語ｗ_kの第（５４）式に示すｌ番目のサブワード
を対応づけ、第（５５）式に示す端点条件を満たすもの
とする。このとき、各々のサブワード境界列における単
語ｗ_kの対数事後オッズを第（５６）式に示すように決
定する。

【０１０３】第２に、単語ｗ_ｋの対数事後オッズＹ
_ｋを、第（５７）式に示すように定義する。ただし、ξ
_ｗは正の定数、Ｂ†_ｓ ^ｅはＸ_ｓ ^ｅにおいて考えられ得る
境界列βの全体集合である。

【０１０４】

【数９】

【０１０５】

【数１０】

【０１０６】３．２単語列の認識連続音声認識という問題の特性から、単語列を得るため
の決定の組合せの全体集合Ωは、次の条件を満たすＡの
集合である。その条件は、単語が存在するときは１つに
決定されなければならないので、第（５８）式に示すよ
うな条件１、時間的に隣接する単語の時間的重なりがあ
ってはいけないので、第（５９）式に示すような条件２
である。このとき、条件１によりａ_s ^e≠фとなる部分
的結論からは単語が一意的に決まり、条件２により単語
の時間的前後関係が明確になるので、単語列も一意に決
定される。

【０１０７】前述のパラメータ集合により、部分的結論
ａ_s ^eの組合せＡのスコアは、第（６０）式に示すよう
に計算されるので、単語列Ｗ_Cのスコアは、この第（６
０）式と第（２１）式を用いて計算される。このように
単語列のスコアとして対数事後オッズの累積を用いた場
合は、単語列中に含まれる単語数に関係なく比較され
る。

【０１０８】

【数１１】

【０１０９】３．３単語レベルの絞り込みすべての部分観測時系列Ｘ_s ^eについて｜Ｐ†｜＝Ｊ＋
１通りの結論があるので、組合せ結論Ａの総数は、第
（６１）式に示すオーダとなり、かなり多い。そこで、
この節では、これを減らすために、単語レベルの絞り込
みを導入する場合を考える。ここでは、一例として、次
に述べる簡単で古典的な方法を採用する。すなわち、各
単語について、近傍の部分観測時系列に対するスコアの
中で最大値をとるという条件１と、スコアの値がしきい
値を超えるという条件２の両方を満たす部分観測時系列
のみをその単語の候補として残す。

【０１１０】部分観測時系列Ｘ_s ^eが単語ｗ_kに一致す
るという部分的結論をＢ（ｗ_k｜Ｘ _s ^e）と表記する
と、上の条件に基づく絞り込みを含めた単語列のスコア
は、第（６２）式に示されるように表わされる。第（６
３）式の右辺で定義される候補絞り込み関数が第（６
２）式で用いられている。ここで、ω_1k（・）、ω
_2k（・）はそれぞれ条件１、２に対応し、第（６４）式
および第（６５）式のそれぞれに示されるように決定さ
れるとする。ただし、κ_kは定数、ｈ_kはしきい値、Ｓ
†_k（ｅ）は終端ｅに対して単語ｗ_kの始端ｓが取り得
る値の集合であり、Λ＝｛｛λ_j｝_j=1 ^J，｛ｈ_k｝
_k=1 ^K｝である。

【０１１１】ω_1k（・）は、探索の効率の観点から、
「近傍の部分観測時系列の中でスコアが最大」という条
件を、始端に関する最大条件と終端に関する最大条件の
２段階に分けて表現している。２．３節の最適化を適用
するために、第（６３）式に示す関数を連続関数で近似
すると、第（６６）式のように決定される。

【０１１２】

【数１２】

【０１１３】３．４実装のための工夫このように、最適化法が用いられた音声認識装置は、理
論的に可能なはずである。しかしながら、現実に与えら
れるのは限られた計算機資源と限られた学習標本のみで
あり、実際には様々な問題に直面すると考えられる。そ
こで、それらの問題のための現実的な対処の仕方につい
て説明する。

【０１１４】第１に、限られた計算量で認識および学習
を実現することを考える。まず、対数事後オッズ推定関
数によるスコアの定義において、第（２１）式に示すよ
うな形が多用されている。前述のとおり、この値を求め
るには非常に多くの計算量を要する。そこで、必要に応
じてξ_Cなどの定数の正の無限大極限、すなわち最大値
や最小値で代用する。これにより、動的計画法などによ
る計算量の削減が可能となる。

【０１１５】また、第（６３）式による候補絞り込み関
数の定義に現われる平滑化ステップ関数１〜（・）とし
てたとえば例に挙げたシグモイド関数を用いると、その
値は常に正なので、本来は候補絞り込みにおいて棄却さ
れるはずのすべての単語仮説を学習時には棄却せずに残
しておかなくてはならない。そこで、しきい値から遠い
ところでは、恒等的に値０をとる第（７０）式に示す区
分線形関数または第（７１）式に示す区分放物線関数で
代用する。

【０１１６】第２に、限られた数の学習標本から最適な
パラメータを推定しなければならない現実を考えると、
自由パラメータの数はできるだけ少ないように工夫しな
ければならない。たとえば、サブワードモデルにおける
分散共分散行列Σ_ｊｎｍは自由パラメータ数が多いの
で、単位行列に固定したり、対角行列にして対角成分の
みを自由パラメータとするなどである。特に、独立性が
低いと思われるパラメータを「結び」の関係にすること
は有効である。たとえば、予備選択のしきい値ｈ_ｋを単
語によらず共通の値にすること、または既に述べたよう
にすべての単語のモデルを少ない種類のサブワードの連
結で表現することなどである。

【０１１７】第３に、この実施例で説明している方法は
勾配探索によっているので、収束が極端に遅くならない
ようにそれぞれのパラメータの歩み幅の均衡に注意する
必要がある。また、パラメータの変域にも注意しなけれ
ばならない。たとえば、φ_j1の変域は（−∞，０）であ
るので、勾配探索の定義による微修正によって許された
変域からはみ出してしまうことがある。このような場合
は、たとえばφ_j1＝−ｅｘｐ（φ′_j1）と置換え、φ′
_j1を変域（−∞，∞）の自由パラメータとすればよい。
あるいは、最初から歩み幅の調整の難しいパラメータを
扱わないようにして系を構成してもよい。たとえば３．
１節で用いた第（４３）式の代わりに、係数ベクトルφ
_j↑をパラメータとして用いないで、近隣の類あるいは
前述の「ごみ類」との競合に基づく確からしさとして第
（７２）式に示される関数、または第（７３）式に示さ
れる関数などで定義できる。ただし、ζ_Dは正の定数、
λ ₀＝｛Ｒ₀，Ｖ₀｝は「ごみ類」のモデルである。

【０１１８】

【数１３】

【０１１９】［まとめ］不確実性を伴う組合せ決定問題
を解く枠組として、対数事後オッズの累積に基づくもの
を定式化し、計算量や記憶容量の節約のための絞り込み
処理も含めた枠組での決定誤りの数と計算量を最小化す
る設計法について説明した。この方法として、音声認識
方法および音声認識装置の枠組を説明したが、これは、
音声認識のみならず、不確実性を伴う推論問題一般に適
用できると言える。また、音声認識に限っても、対数事
後オッズ推定関数や候補絞り込みの基準には数多くの選
択肢があるので、それらの決定は様々な条件が考慮され
て行なわれる必要がある。

【０１２０】なお、決定機構は、１つの証拠から導かれ
得る複数の結論についてそれぞれ独立評価したスコアを
用いるものであるので、並列分散型の計算機に適用でき
ると思われる。

【０１２１】

【発明の効果】以上のように、この発明によれば、連続
パターンを形成する複数の部分パターンのそれぞれの認
識の確からしさを、事後オッズの推定値に基づく物理量
で決定し、その累積によって決定した部分パターンの組
合せの認識の確からしさに基づいて連続パターンを認識
するので、理論的に裏付けられたパターン認識を行なえ
る。

【０１２２】また、この発明によれば、部分パターンの
候補を事後オッズの推定値に基づく物理量に基づいて絞
り込むことにより、累積物理量の計算が容易になり、効
率よくパターン認識を行なえる。

【０１２３】さらに、この発明によれば、所定の基準に
基づいて最適化されたパラメータを用いることにより、
最適化されたパターン認識を行なえる。

【０１２４】さらに、この発明によれば、音声パターン
を形成する複数の部分パターンのそれぞれの認識の確か
らしさを、事後オッズの推定値に基づくスコアで決定
し、その累積によって決定した部分パターンの組合せの
認識の確からしさに基づいて音声パターンを認識するの
で、理論的に裏付けられた音声認識を行なえる。

【０１２５】さらに、この発明によれば、部分パターン
の候補を事後オッズの推定値に基づいてスコアに基づい
て絞り込むことにより、累積スコアの計算が容易にな
り、効率よく音声認識を行なえる。

【０１２６】さらに、この発明によれば、所定の基準に
基づく最適化されたパラメータを用いることにより、最
適化された音声認識を行なえる。

【図面の簡単な説明】

【図１】この発明の一実施例による音声認識装置を示す
概略ブロック図である。

【図２】図１に示した音声認識装置の動作を説明するた
めのフローチャートである。

【図３】図１の最適化設計部の内部構成を示した概略ブ
ロック図である。

【図４】図３の最適化設計部の動作を説明するためのフ
ローチャートである。

【符号の説明】

１音声認識装置７スコア計算部９絞り込み処理部１１累積スコア計算部１３認識結果決定部１８最適化設計部２３学習データ２７パラメータ修正部

フロントページの続き (56)参考文献特開平１−251100（ＪＰ，Ａ) ＴＨＥＪＯＵＲＮＡＬＯＦＴＨＥＡＣＯＵＳＴＩＣＡＬＳＯＣＩＥＴＹＯＦＪＡＰＡＮ（Ｅ）ＮＯ．16，ＶＯＬ．３，Ｐ．147〜157 （1995) (58)調査した分野(Int.Cl.⁶，ＤＢ名) G10L 3/00 531 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】連続パターンの複数の部分パターンを認
識し、その組合せとして前記連続パターンを認識するパ
ターン認識方法において、それぞれが前記各部分パターンの認識の確からしさを表
わし、かつ各部分パターンに対応する複数の物理量を事
後オッズの推定値に基づいて決定する第１のステップ
と、前記各物理量に基づいて、前記各部分パターンの組合せ
の認識の確からしさを表現する累積物理量を決定する第
２のステップと、前記決定された累積物理量に基づいて、前記連続パター
ンを前記組合せの所定の類に分類する第３のステップと
を含む、パターン認識方法。
【請求項２】前記第１のステップは、前記累積物理量
の決定または前記連続パターンの分類のために、前記部
分パターンの候補を絞り込むステップを含む、請求項１
記載のパターン認識方法。
【請求項３】前記第１のステップは、前記物理量の決
定のために、推定事後オッズの尤度を最大化するパラメ
ータを用いて前記事後オッズの推定値を求めるステップ
を含む、請求項１または２記載のパターン認識方法。
【請求項４】前記第１のステップは、前記物理量の決
定のために、前記分類による誤り率を所定の関数で表現
し、その関数の値を最小化するパラメータを用いて前記
事後オッズの推定値を求めるステップを含む、請求項１
または２記載のパターン認識方法。
【請求項５】前記第１のステップは、前記物理量の決
定のために、前記分類による誤り率および計算量を所定
の関数で表現し、その関数の値を最小化するパラメータ
を用いて前記事後オッズの推定値を求めるステップを含
む、請求項１または２記載のパターン認識方法。
【請求項６】前記第１のステップは、前記物理量の決
定および前記部分パターンの絞り込みのために、前記分
類による誤り率を所定の関数で表現し、その関数の値を
最小化するパラメータを用いて前記事後オッズの推定値
を求めるステップを含む、請求項２記載のパターン認識
方法。
【請求項７】前記第１のステップは、前記物理量の決
定および前記部分パターンの絞り込みのために、前記分
類による誤り率および計算量を所定の関数で表現し、そ
の関数の値を最小化するパラメータを用いて前記事後オ
ッズの推定値を求めるステップを含む、請求項２記載の
パターン認識方法。
【請求項８】時系列からなる音声パターンの複数の部
分パターンを認識し、その組合せとして前記音声パター
ンを認識する音声認識方法であって、それぞれが前記各部分パターンの認識の確からしさを表
わし、かつ各部分パターンに対応する複数のスコアを事
後オッズの推定値に基づいて決定する第１のステップ
と、前記各スコアに基づいて、前記各部分パターンの組合せ
の認識の確からしさを表現する累積スコアを決定する第
２のステップと、前記決定された累積スコアに基づいて、前記音声パター
ンを前記組合せの所定の類に分類する第３のステップと
を含む、音声認識方法。
【請求項９】前記第１のステップは、前記累積スコア
の決定または前記音声パターンの分類のために、前記部
分パターンの候補を絞り込むステップを含む、請求項８
記載の音声認識方法。
【請求項１０】前記第１のステップは、前記スコアの
決定のために、推定事後オッズの尤度を最大化するパラ
メータを用いて前記事後オッズの推定値を求めるステッ
プを含む、請求項８または９記載の音声認識方法。
【請求項１１】前記第１のステップは、前記スコア決
定のために、前記分類による誤り率を所定の関数で表現
し、その関数の値を最小化するパラメータを用いて前記
事後オッズの推定値を求めるステップを含む、請求項８
または９記載の音声認識方法。
【請求項１２】前記第１のステップは、前記スコアの
決定のために、前記分類による誤り率および計算量を所
定の関数で表現し、その関数の値を最小化するパラメー
タを用いて前記事後オッズの推定値を求めるステップを
含む、請求項８または９記載の音声認識方法。
【請求項１３】前記第１のステップは、前記スコアの
決定および前記部分パターンの候補の絞り込みのため
に、前記分類による誤り率を所定の関数で表現し、その
関数の値を最小化するパラメータを用いて前記事後オッ
ズの推定値を求めるステップを含む、請求項９記載の音
声認識方法。
【請求項１４】前記第１のステップは、前記スコアの
決定および前記部分パターンの候補の絞り込みのため
に、前記分類による誤り率および計算量を所定の関数で
表現し、その関数の値を最小化するパラメータを用いて
前記事後オッズの推定値を求めるステップを含む、請求
項９記載の音声認識方法。
【請求項１５】時系列からなる音声パターンの複数の
部分パターンを認識し、その組合せとして前記音声パタ
ーンを認識する音声認識装置であって、それぞれが前記各部分パターンの認識の確からしさを表
現し、かつ各部分パターンに対応する複数のスコアを事
後オッズの推定値に基づいて決定するスコア決定手段
と、前記各スコアに基づいて、前記各部分パターンの組合せ
の認識の確からしさを表現する累積スコアを決定する累
積スコア決定手段と、前記決定された累積スコアに基づいて、前記音声パター
ンを前記組合せの所定の類に分類する分類手段とを備え
た、音声認識装置。
【請求項１６】さらに、前記スコアの決定または前記
音声パターンの分類のために、前記部分パターンの候補
を絞り込む絞り込み手段を備えた、請求項１５記載の音
声認識装置。
【請求項１７】さらに、前記スコアの決定のために、
推定事後オッズの尤度を最大化するパラメータを用いて
前記事後オッズの推定値を最適化する最適化手段を備え
た、請求項１５または１６記載の音声認識装置。
【請求項１８】さらに、前記スコアの決定のために、
前記分類による誤り率を所定の関数で表現し、その関数
の値を最小化するパラメータを用いて前記事後オッズの
推定値を最適化する最適化手段を備えた、請求項１５ま
たは１６記載の音声認識装置。
【請求項１９】さらに、前記スコアの決定のために、
前記分類による誤り率および計算量を所定の関数で表現
し、その関数の値を最小化するパラメータを用いて前記
事後オッズの推定値を最適化する最適化手段を備えた、
請求項１５または１６記載の音声認識装置。
【請求項２０】さらに、前記スコアの決定および前記
部分パターンの候補の絞り込みのために、前記分類によ
る誤り率を所定の関数で表現し、その関数の値を最小化
するパラメータを用いて前記事後オッズの推定値を最適
化する最適化手段を備えた、請求項１６記載の音声認識
装置。
【請求項２１】さらに、前記スコアの決定および前記
部分パターンの候補の絞り込みのために、前記分類によ
る誤り率および計算量を所定の関数で表現し、その関数
の値を最小化するパラメータを用いて前記事後オッズの
推定値を最適化する最適化手段を備えた、請求項１６記
載の音声認識装置。