JPH0362000A

JPH0362000A - 陰マルコフモデル音声認識の効率的簡潔化アルゴリズム

Info

Publication number: JPH0362000A
Application number: JP2097429A
Authority: JP
Inventors: George R Doddington; ジョージ　アール　ドッディントン; Basavaraj I Pawate; バサヴァライ　アイ　パワト
Original assignee: Texas Instruments Inc
Current assignee: Texas Instruments Inc
Priority date: 1989-04-13
Filing date: 1990-04-12
Publication date: 1991-03-18
Also published as: EP0392728A2; EP0392728A3; US4977598A; DE69028430T2; DE69028430D1; EP0392728B1

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、コンピュータプロセッサに関し、特に、音声
認識時のコンピュータ処理装置のローディングを軽減す
る効率的ＮＱＭ化アルゴリズムに関する。

（従来技術とその問題点）以前の動的時間ワーピング（Ｄｙｎａｍｉｃ　Ｔｉｍｅ
匈ａｒｐｉｎｇ（ＤＴＷ））に基づく音声認識装置は、
単語レベル又は音声レベルの仮説を自律単語仮説装置に
より発生させる伝統的ボトムアップ（ｂｏｔｔｏｓ　ｕ
ｐ）法を使用していた。これらの仮説は、次に、分野に
応じた知識（文法〉を使って全ての文法的候補から最良
の文仮説を選ぶ文仮説装置により後処理された。

近時、ｒ自然言語の文法的関係を解析するシステム及び
方法ｊ　（米国特許出願第９１９．１５６号）及び「確
率的統一文法の図表解析装置ｊ　（米国特許出願第３１
２．８３５号）　（これらは共に本願の譲受人に譲渡さ
れた〉に、音声認識のトップダウン法が開示されている
。要約すると、単語仮説装置は最早自律的ではなくて、
文仮説装置により案内される。フレームが処理される時
、各々の活きている文仮説が必要に応じてデータを要求
する。データ要求のシーケンスは、一般的には、単語仮
説を要求する文で始まる（即ち、候補単語及びその発生
の可能性が今の経歴を与える）。一方、単語仮説につい
てのこれらの要求は、単語仮説を要求する、などである
。このプロセスは、音声データのフレームについての要
求で終わる。この点で、音声データの、入ってくるフレ
ームは、この文仮説により予言される文脈に記入される
。各々のレベルが、文法的構造、即ち、陰マルコフモデ
ル（ＨｉｄｄｅｎＭａｒｋｏｖ　Ｍｏｄｅｌｓ（Ｉ（Ｍ
Ｍｓ））の制約を、その下のレベルのデータ表現に課す
。

第１図は、この様に階層化した文法、又はモデル駆動式
の、音声Ｐ！識の方法のブロック図を示す。

それには二つの主な特徴、即ち、どんな数のレベルのデ
ータ表現でも共存することを許す階層構造と、全てのレ
ベルで情報の流れを支配する連続濃度ＨＭＭ計算フレー
ムワークと、がある。第１図に示されているのと同様の
システムの詳細が「確率的統一文法の図表解析装置ｊ　
（米国特許出願第３１２．８３５号〉に充分に説明され
ている。この出願は本願の譲受人に譲渡された。トップ
ダウン仮説方式は、従来のボトムアンプ・システムに比
べて著しく改善した性能を持つものであることが経験的
に示された。

残念なことに、音声認識方式に使われるトップダウン・
モデル駆動法は、実時間で作動しなければならないので
、計算上負担になる。また、現在の音声認識システムは
、一般的には高価な高速ランダムアクセスメモリー内に
維持される数百キロバイトのデータメモリーのスコアリ
ング・バッファーを必要とする。従って、音声認識アル
ゴリズムを処理する時、ＣＰＵの使用する高速ＲＡＭの
量を減らし、これによりシステムの費用を減らすことが
非常に望ましい。

（発明の（既要）関連技術に伴う上記の問題を考慮して、本発明の目的は
、臨界スコアを使用し、バックポインタが指す状態に影
響を与えること、により２レベルで効率的に簡潔化を行
って中央処理装置のローディングを軽減する方法を提供
することである。

本発明の他の目的は、実時間で作動して、音声認識アル
ゴリズムを処理する時に中央処理装置が必要とする高速
ＲＡＭの量を安価に且つ効果的に軽減することにより計
算サイクル時間を出来るだけ短縮する方法を提供するこ
とである。

本発明の他の目的は、中央処理装置がスコアリング・バ
ッファー内の使用可能なスロットを素早く発見できるよ
うにし、されにより計算サイクル時間を短縮することの
出来る方法を提供することである。

これらの目的は、好適な実施例において、ＣＰＵに指令
して現在の状態の、先に計算してあった確率スコアを所
定臨界値と比較させ、該臨界値より低い確率スコアを持
った状態を包含する仮説を捨てさせるアルゴリズムを使
用することにより達成される。現在の状態を維持するべ
きであると判定した後、ＣＰＵは、スコアリング・バッ
ファー内の使用可能なスロットを発見するように指令さ
れ、そのスロット内に、現在の状態についての情報が格
納される。ＣＰＵは、現在の時間指標を、各スコアリン
グ・バッファー・スロットに随伴する時間指標と比較す
ることにより、使用可能なスロットを発見する。それら
が等しいとき、該スロットは使用不能であり、現在の時
間指標の方が大きいときは、該スロットは使用可能であ
る。

現在の状態についての情報が格納された後、ＣＰＵは、
現在の状態が完成したモデルを表すならば、現在の最良
の経路のスタート状態を指す様に現在の状態のバンクポ
インタを調整する。その後、現在の状態の状況に関わら
ず、ＣＰＵは、現在の時間指標を、現在の状態への最良
の経路に沿う全てのスロットの時間指標と関連させる。

ＣＰＵは、その後、次の現在の状態の確率スコアを計算
し、アルゴリズムは、全ての状態が完成するまで反復す
る。

当業者は、添付図面と関連させて好適な実施例に関する
以下の詳しい記述を読むことから本発明の上記特徴及び
利点並びにその他の特徴及び利点を良く理解することが
出来よう。

（実施例）本発明のアルゴリズムは、例えばテキサスインスツルメ
ント社が開発したＣａ１ｙｐｓｏ等の多重処理システム
を含むどんな中央処理システムでも実施することが出来
る。該アルゴリズムを多重処理装置に使用することによ
り、該多重処理装置にわたってＨＭＭｉｉを分割すると
こが出来、これにより、音声認識システムがより大量の
諸量の認識できるようにすることが出来る。

第２図は、左右型・陰マルコフ・モデル（ＨＭＭ）の典
型的表示である。この例にっていは、状態Ｏはスタート
状態であり、状態４はストツブ状態である。観察シーケ
ンスＳＯが与えられると、問題は、観察されたデータを
説明する単一の最善の状態シーケンスを発見することと
なる。この最善の状態シーケンスを発見するために、Ｖ
ｉｔｅｒｂｉアルゴリズム（Ｇ、　Ｄａｖｉｄ　Ｆｏｒ
ｎｅｙ＋　Ｊｒ、、　”Ｔｈｅ　ＶｉｔｅｒｂｉＡ１ｇ
ｏｒｉｔｈｍ″、　Ｐｒｏｃ、　ｏｆ　ｔｈｅ　ＩＢＢ
Ｂ、　ｖｏｌ、　６１、ｎｏ。

３　、Ｍａｒｃｈ　１９７３）を使用する。これは、ｐ
ａｔｈｓｃｏｒｅｔ（ｊ）＝　１ＩｌａＸ　（ｐａｔｈ
ｓｃｏｒｅｚ−ｔ（ｉ）＋１ｎ（ａｔａ）１＜ｉ＜ｎ〕ｂａｃｋｐｏｉｎｔｅｒｔ（ｊ）＝ａｒｇｍａｘ　（ｐ
ａｔｈｓｃｏｒｅｔ−＋（ｉ）ａｔｊ＋　　Ｉｎ（ａｔ
＝））１＜ｉ＜ｎで示される。ここで、ｃｉｊ＝時刻ｔにおいて状態ｊが観察ＳＯと一致する確
率、ａｉｊ−状態ｉから状態ｊへの遷移確率、ｎ　＝モデル
における状態の数である。

文モデル文法に基づく最上層状態経路のフローチャート
例が第３図に示されている。該モデル処理装置により評
価されるとき、処理されつつある現在の話された人力と
色々なプログラムされた文法とを考慮して、技として示
されている異なる状態経路が可能であるとされる。図示
の仮説技は、他の語に続くことの出来る成る語のみを指
定する予めプログラムされた文法又は規則の結果として
生成される。この様な規則を使用することは、この技術
分野では周知されていることであるので、ここでは説明
しない。

第４図は、第３図の文モデルについて作られた状態経路
の例であり、これは陰マルコフ・モデルに基づいている
。ＨＭＭは、最上層文モデル以外の、語レベル又は句レ
ベルでの音声認識文法の層に一般的に適用される。また
、２レベルだけ（第３図及び第４図）が示されているけ
れども、本発明のアルゴリズムは、フレームレベルまで
、追加の文法層を包含する様に拡張することの出来るも
のである。また、予めプログラムされた規則は、このレ
ベルにおいて、どの文字が他の文字に続くことが出来る
かも指定する。

第３図及び第４図の両方を見ると、処理装置は、節６０
（第３図）について開始確率を計算するが、これは’ｓ
ｅｔ　Ｊという語の前に現れる。’ｓｅｔ　Ｊという語
が発音されたか否か判定するために、処理装置はこの確
率を第４図のスタート状態節６０へ送って解析を開始す
る。処理装置は、文字が発音されたと判定すると、その
文字が発音される確率を、既に存在している開始確率に
加える。各文字が発音されたと判定されてゆくとき、処
理装置は、ストップ状態節４０に達するまで確率を加え
続けるが、ここで処理装置は’ｓｅｔ　Ｊという語を見
たという全確率を持つこととなる。この時、処理装置は
この確率を第３図の節４０に送り戻す。

この点で処理装置は、’ｓｅｔ　Ｊという語を多分見た
ということを示し、次の語が何であるか、について二つ
の仮説’ａｌｔｉｔｕｄｅ」か’ｖａｌｕｅ　ｊか、を
生成する。文法の異なる層間での確率スコアの遺り取り
のプロセスは、発音された文全体が認識されるまで進行
する。前述の様に、文法の多数の層があることもあり、
処理装置は確率を下のフレームレベルへ確率を送り、連
続する発音された入力を認識しようと支援する。

ＨＭＭの状態（節とも称する）の確率が計算されである
時には、スコアが付けられたのであると見なされる。ス
コアは、スコアリング・バッファー１２と称するメモリ
ーのバッファーのスロットに保存される。第５図は、Ｎ
個のスロットを持ったスコアリング・バッファー１２を
示す。各スロットは、特定の状態についての経路スコア
と、その先の状態へのバンクポインタと、その他の付随
的情報とを記憶する。従って、スロットは、数個の１６
ビツト語の情報を記憶する。例えば、スロット５は、８
個の１６ビツト語の情報Ａ　−Ｈを伴って示されている
。この１６ビツト語Ａ−Ｈのうちの一つは該スロットの
現在の時間指標を示す。

他の語、例えば語Ｅは、先の状態に関する情報を内蔵す
るスコアリング・バフファー１２内のスロットの場所を
示す。語Ｅに格納される情報は、バックポインタと称す
る。残りの語は、最善の経路確率スコア等の追加の付随
情報を内蔵する。

連続語認識では、各ＨＭＭは、全ての人力フレームにつ
いて数回スコアを付けられる。その結果、第３図の最上
層文モデルの複雑さに応じて、スコアリング・バッファ
ー１２は、典型的中央処理装置のデータ記憶容量を簡単
に越えて、数百キロバイトを専有することがある。

予言された色々な文レベル仮説は、最善の経路確率を持
ち始める仮説が後に競合する仮説により迂回される場合
には、記憶されなければならない。

文の初めの数語の際には、競合する仮説の数は多い。こ
れらの仮説を管理するために、大量の簿記、従ってそれ
に匹敵する量のＣＰＵメモリー、が必要である。本発明
は、以下の記述が示すように、これらのメモリー及びＣ
ＰＵ処理に関する要件を軽減する精確な簡潔化技術を提
供する。

本発明のアルゴリズムは、２レベルの簡潔化を使用する
。成る最善スコア文経路が高い確率を有すると分かった
ならば、最善の文及びその次に良い文の間の差は一般的
には大きく、活きている仮説の数を、その確率スコアに
基づいて削減するこＬ力咄来る。従って、本発明におい
て具体化される第ルベルのＮ潔化は、現在の最も確から
しい仮説の確率の分数として確率臨界値を計算すること
を含む。これは次に正規化され、−１に等しくされる。

この臨界値より低い仮説は捨てられる。

例えば、文経路ｌは最善の経路確率スコアー０．２を有
し、文経路２は確率すスコアー０．５を有し、文経路３
は確率スコアー０．８を有するものとする。最善の確率
は最小の負の値を持っており、−〇、２は−０，５より
良い確率であるので、経路１が勝つ。オペレータが最善
の経路スコアと遮断臨界値との間の最大の差を０．４に
等しくセットすると、臨界遮断値は−０，６となる（−
０，２−０，４＝−０，６＞。よって、ＣＰＵは、経路
１及び２を維持し、経路３を捨てる、即ち、簡潔化する
。

所要のスコアリング・バッファーの大きさ（スロットの
個数）と、認識装置の性能に対するＮ？Ｍ化臨界の効果
の例が下記の表１に示されている。

ここから分かる様に、連続数字認識などの少語党用途で
は、スコアリング・バッファーに２０００個のスロット
を割り当てて丈夫な性能を維持出来ることが経験的に分
かっている。しかし、必要なスロットの数は、用途によ
ることに注意しなければならない。

ｌ　：とメモ貫 −の１５６５０７６２０　　　　　　　　１０００　　　　　　　　　１８
３０　　　　　　　　２０００　　　　　　　　　１０
４０　　　　　　　　３０００　　　　　　　　　１０
ＣＰＵのローディングを更に軽減するため、本発明は、
第２レベルの簡潔化を行う。この第２レベルは、処理装
置がスコアリング・バッファー内の使用可能なスロット
を速やかに発見するのを支援し、モデル内の状態のバッ
クポインタをそのスタート状態へ飛ばすことを含む。

現在の状態を維持するべきであると判定した後、本発明
のアルゴリズムは、スコアリング・バッファー１２内の
使用可能なスロットを発見するようにＣＰＵに指令する
。本発明の好適な実施例によると、ＣＰＵは、現在の時
間指標を、スコアリング・バッファーの各スロットに随
伴する最後時フィールドの内容と比較することによって
使用可能なスロットを発見する。

スコアリング・バッファーの各スロットは、二つの時間
フィールド、即ち、スロットが生成された時間指標を内
蔵する生成時フィールドと、この状態が存在する最善の
経路の時間指標を内蔵する最後時フィールドと、を有す
る。最善の経路上の全てのスロットが、それぞれの最後
時フィールドに同じ時間指標値を格納しており、その値
は現在の時間指標に等しい。最終時フィールドに内蔵さ
れている時間指標が現在の時間指標から１を引いた値よ
り小さければ、スロットは開放されていると言われる。

ＣＰＵは、スロットの１語のみを抽出して（読み出し）
でスロットの最後時フィールドの内容を現在の時間指標
と比較することにより、使用可能なスロットを速やかに
発見することが出来る。スロットの時間指標が現在の時
間指標から１を引いた値より小さいことが分かった時、
ＣＰＵは使用可能な、即ち、「開放されたｊスロットを
発見したものである。その後、ＣＰＵは、現在の状態の
、生成時間指標及び最終時フィールド時間指標を含む情
報を、その使用可能なスロットの内容物に重ね書きする
。

最善の経路内のスロットの簡潔化を防止するために、現
在の時間指標を最善の経路中の全てのスロットへ伝播さ
せなければならない。換言すれば、現在の状態の情報が
スロットに格納されていれば、現在の状態のスロットに
到る最善の経路を構成する全てのスロットに沿って現在
の時間指標を逆方向に伝播させなければならない。しか
し、時間指標の後戻り伝播はＣＰＵのローディングを増
大させる。本発明の好適な実施例は、モデル内の状態の
バンクポインタをそのスタート状態へ向けることにより
、このローディングを軽減する。

例えば、第３図を再び考察する。処理装置が、’ｅｑｕ
ａｌ　Ｊという語を見たと判定すると、現在の状態又は
節５０に関する情報を使用可能なスロットに格納した後
、処理装置は、節４６、節４０及び節６０を内蔵するそ
れぞれのスロットへ現在の時間指標を後戻り伝播させる
。第４図の語レベルでは、処理処置は、節４０及び節６
０を内蔵するそれぞれのスロットへ現在の時間指標を後
戻り伝播させるだけである。よって、処理装置が’ｓｅ
ｔ　Ｊという語を多分見ても、’ｓｅｔ　Ｊという語を
解析に使用された節は重要ではなくて、スタート状態及
びストップ状態又は節のみが重要である。

文の最善の経路が興味あるものであって、語モデル内の
最善の経路は興味あるものではない。モデル内では、Ｃ
ＰＵのローディングの大部分が生じるが、最善の経路の
指標を伝播させる必要はなく、後戻り伝播時間を節約す
ることが出来、これにより計算サイクルを著しく短縮す
ることが出来る。また、処理装置は節６２．６４及び６
６を内蔵するスロットへ現在の時間指標を後戻り伝播さ
せないので、これらのスロットは、現在の時間指標に等
しいそれぞれの最後時フィールドに更新された時間指標
を持たず、従って、それらは、後に処理装置が開放され
たスロットを探す時に処理装置が使用することが出来る
様になり、従ってＣＰＵメモリーと計算サイクル時間が
節約される。

第６図は、上に詳しく記述した本発明の好適な実施例の
フローチャートである。

本発明の特別の実施例を図示し説明したが、当業者は色
々な変形及び別の実施例に想到するであろう。従って、
本発明は、特許請求の範囲の欄の記載内容にのみ限定さ
れるものである。

以上の記載に関連して、以下の各項を開示する。

（１）　　音声Ｌ３識時の中央処理装置のローディング
を軽減する方法であって、ａ）情報を帯びた現在の状態のスコアを計算し、ｂ）　
前記スコアを所定の臨界値と比較し、ｃ）使用可能なス
コアリング・バッファーのスロットの位置を発見し、ｄ）前記の現在の状態に関する情報を前記の使用可能な
スロット内に格納し、ｅ）　スコアリング・バッファーのスロットのバンクポ
インタをセットし、ｆ）前記の使用可能なスロット内の最後時フィールド値
を現在の時間指標に等しく指定し、ｇ）前記の現在の時
間指標に等しい時間値を、前記の現在の状態についての
情報を内蔵する前記の使用可能なスロットに続く最善の
経路に沿う全てのスコアリング・バッファーのスロット
へ伝播させ、ｈ）次の現在の状態を解析し、ｉ）全ての状態が完成するまでステップａ）ないしｈ）
を反復するステップから成ることを特徴とする方法。

（２１（１１の中央処理装置のローディングを軽減する
方法であって、使用可能なスロットの位置を発見するた
めの前記ステップＣ）は、更に、ｊ）　スロットの最後
時フィールド値を読み出し、ｋ）前記の使用可能な最後
時フィールドを中央処理装置の現在の時間指標と比較し
、ｌ）前記現在の時間指標から１を引いて得た値が前記最
後時フィールドより小さければ、該スロットが使用可能
であることを示し、翔）前記現在の時間指標から１を引いて得た値が前記最
後時フィールドより大きいか又は等しければ、該スロッ
トを除外し、ｎ）　使用可能なスロットの位置が発見されるまでステ
ップｊ）ないしｍ〉を反復するステップから成ることを
特徴とする前記第（１１項に記載の方法。

（３）前記スコアを所定の臨界値と比較する前記ステッ
プｂ）は、更に、０）　前記スコアが前記所定臨界値より大きいか又は等
しければ、使用可能なスコアリング・バッファーのスロ
ットの位置を発見するステップＣ）へ続き、ｐ）　前記スコアが前記所定臨界値より小さければ、前
記状態を捨てて、情報を帯びた現在の状態のスコアを計
算するステップａ）に戻るステップから成ることを特徴
とする前記第（１１項に記載の中央処理装置のローディ
ングを軽減する方法。

（４）前記音声認識は陰マルコフ・モデル及び統一文法
を包含することを特徴とする前記第（１１項に記載の中
央処理装置のローディングを軽減する方法。

（５）前記音声認識は、文法の階層の使用を包含し、こ
れらの階層のモデルはスタート状態及びストップ状態を
包含し、スコアリング・バッファーのスロットのバンク
ポインタをセットする前記ステップｅ）は、更に、ｑ）前記の現在の状態が文法の最上層からのものであれ
ば、直前の現在の状態のスコアリング・バッファーのス
ロットのアドレスを指す様に前記バンクポインタをセッ
トし、ｒ）若し現在の状態が文法の前記最上層からのものでな
ければ、前記モデルのスタート状態を指す様に前記バッ
クポインタをセットするステップから成ることを特徴と
する前記第（１）項に記載の中央処理装置のローディン
グを軽減する方法。

（６）前記の現在の時間指標に等しい時間値を、前記の
現在の状態についての情報を内蔵する前記の使用可能な
スロットに続く最善の経路に沿う全てのスコアリング・
バッファーのスロットへ伝播させる前記ステップｇ）に
おいて、前記の使用可能なスロットに続く最善の経路に
沿う前記の全てのスコアリング・バッファーのスロット
の位置は前記バンクポインタにより示されることを特徴
とする前記第（１１項に記載の中央処理装置のローディ
ングを軽減する方法。

（７）音声認識の効率的Ｍ濃化方法であって、Ｓ）　現
在の状態のスコアを計算し、０　前記スコアを所定臨界値と比較し、若し前記スコア
が前記所定臨界値より大きいか又は等しければステップ
Ｕ）へ続き、若し前記スコアが前記所定臨界値より小さ
ければ、前記状態を捨ててステップＳ）に戻り、Ｕ）使用可能なスコアリング・バッファーのスロットの
位置を発見し、Ｖ）　前記の現在の状態に関する情報を前記の使用可能
なスロット内に格納し、 −）　スコアリング・バッファーのスロットのバックポ
インタをセットし、 ×）　前記の使用可能なスロット内の最後時フィールド
値を現在の時間指標に等しく指定し、ｙ）　前記の現在
の状態についての情報を内蔵する前記の使用可能なスロ
ットに続く最善の経路に沿う全てのスコアリング・バッ
ファーのスロットへ前記現在の時間指標に等しい時間値
を後戻り伝播させ、ここで前記の全てのスコアリング・
バッファーのスロットの位置は前記バックポインタによ
り示され、２）次の現在の状態を解析し、ａａ）全ての状態が完成するまでステップＳないし２）
を反復するステップから成ることを特徴とする音声認識
の効率的簡潔化方法。

（８）　　スコアリング・バッファーのスロットのバン
クポインタをセットする前記ステップＷ）は、文法の階
層の使用を包含し、これらの階層のモデルはスタート状
態及びストップ状態を包含し、該ステップＷ）は、更に
、ｂｂ）若し前記の現在の状態が文法の最上層からのもの
であれば、直前の現在の状態のスコアリング・バッファ
ーのスロットのアドレスを指す様に前記バックポインタ
をセットし、ｃｃ）若し前記の現在の状態が文法の前記最上層からの
ものでなければ、前記モデルのスタート状態を指す様に
前記バンクポインタをセットするステップから成ること
を特徴とする前記第（７）項に記載の音声認識の効率的
簡潔化方法。

（９）前記音声認識は、陰マルコフ・モデル及び統一文
法を包含することを特徴とする前記第（７）項に記載の
音声認識の効率的簡潔化方法。

０ω　改良された音声認識方法であって、前記音声認識
は、文法の階層を使用し、文法のこれらの階層のモデル
はスタート状態及びストップ状態を採用し、この方法は
、ｄｄ）現在の状態のスコアを計算し、ｅｅ）前記スコアを所定臨界値と比較し、若し前記スコ
アが前記所定臨界値より大きいか又は等しければステッ
プｆｆ）へ続き、若し前記スコアが前記所定臨界値より
小さければ、前記状態をＩ舎ててステップｄｄ）へ戻り
、ｒｒ）　使用可能なスコアリング・バフファーのスロッ
トの位置を発見し、ｇｇ）前記の現在の状態に関する情報を前記の使用可能
なスロットに格納し、ｈｈ）若し前記の現在の状態が文法の最上層からのもの
であれば直前の現在の状態のスコアリング・バッファー
のスロットのアドレスを指す様にスコアリング・バッフ
ァーのスロットのバックポインタをセットし、ｉｔ）若し前記現在の状態が前記文法の前記最上層から
のものでなければ、前記モデルのスタート状態を指すよ
うにスコアリング・バッファーのスロットのバックポイ
ンタをセットし、ｊｊ）前記の使用可能なスロット内の
最終時フィールド値を現在の時間指標に等しく指定し、
ｋｋ）前記の現在の状態についての情報を内蔵する前記
の使用可能なスロットに続く最善の経路に沿う全てのス
コアリング・バッファーのスロットへ前記現在の時間指
標に等しい時間値を後戻り伝播させ、ここで前記の全て
のスコアリング・バッファーのスロットの位置は前記バ
ックポインタにより示され、１１）次の現在の状態を解析し、ｍｍ）全ての状態が完成するまでスソテプｄｄないし１
１）を反復するステップから戒ることを特徴とする方法
。

０１）前記音声認識は、陰マルコフ・モデル及び統一文
法を包含することを特徴とする前記第００）項に記載の
改良された音声認識方法。

０′ＩＪ　　実時間音声認識時の中央処理装置のローデ
ィングを軽減する効率的簡潔化方法。ＣＰＵは、役に立
たない又は不要な情報を捨てるために所定の臨界値を使
用する。有用な情報は、使用可能なスコアリング・バッ
ファーのスロットに格納される。

スロットは、若しその最後時フィールドが現在の時間指
標に等しくなければ、使用可能であるとされる。最善の
経路中のスロットの簡潔化を防止するために、現在の時
間指標を最善の経路中の全てのスロットに伝播させなけ
ればならない。この後戻り伝播は、ＣＰＵ０ローデイン
グを増大させるが、モデル内の状態のバックポインタを
そのスタート状態を指す様に調整することにより軽減さ
れる。

【図面の簡単な説明】

第１図は、音声認識の階層文法方式のブロック図である
。第２図は、左右型・陰マルコフ・モデルの典型的フロー
チャート表示である。第３図は、典型的文モデルに基づく最上層状態経路のフ
ローチャート例である。第４図は、陰マルコフ・モデルに基づく第３図の文モデ
ルについて生成された状態経路のフローチャート例表示
である。第５図は、本発明を使用することの出来るスコアリング
・バッファーのブロック図である。第６図は、本発明の好適な実施例のフローチャートであ
る。５・・・スロット、１２・・・スコアリング・バッファ
ー手続補正書（方式）、３．補正をする者事件との関係出願人４、代理人５、補正命令の日付平ＦＪｉ、２年７月３１日

Claims

【特許請求の範囲】音声認識時の中央処理装置の負担を軽減する方法であっ
て、ａ）情報を帯びた現在の状態のスコアを計算し、ｂ）前記スコアを所定の臨界値と比較し、ｃ）使用可能なスコアリング・バッファーのスロットの
位置を発見し、ｄ）前記の現在の状態に関する情報を前記の使用可能な
スロット内に格納し、ｅ）スコアリング・バッファーのスロットのバックポイ
ンタをセットし、ｆ）前記の使用可能なスロット内の最終時フィールド値
を現在の時間指標に等しく指定し、ｇ）前記の現在の時間指標に等しい時間値を、前記の現
在の状態についての情報を内蔵する前記の使用可能なス
ロットに続く最善の経路に沿う全てのスコアリング・バ
ッファーのスロットへ伝播させ、ｈ）次の現在の状態を解析し、ｉ）全ての状態が完成するまでステップａ）ないしｈ）
を反復するステップから成ることを特徴とする方法。