JP3355248B2

JP3355248B2 - 連続音声認識方式

Info

Publication number: JP3355248B2
Application number: JP16196194A
Authority: JP
Inventors: 喜永加藤; 秀夫伊東
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1994-07-14
Filing date: 1994-07-14
Publication date: 2002-12-09
Anticipated expiration: 2017-12-09
Also published as: JPH0830291A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、連続音声認識方式に関
し、より詳細には、入力音声の特徴量を抽出し、音声記
号列を文法により解析し、入力音声が属する類を決定し
て認識結果を得る連続音声認識方式に関する。

【０００２】

【従来の技術】従来の音声認識方式について説明する。
まず、音声データを分析し、特徴量に変換した後に、あ
らかじめ認識対象語となる音声パタンを辞書に登録して
おく。次に、認識時には、マイクなどによって入力され
た未知の音声パタンを同じく分析し、特徴量に変換す
る。その後、前述の辞書と照合し、最も類似した辞書パ
タンに対応する語を認識結果として出力する。連続音声
認識の場合は、独立単語認識のように一発声に対して一
つの辞書パタンを作成することは実用的ではない。例え
ば、連続数字認識で、“４５３３”と発声した場合を考
えてみる。照合時に“４５３３”を始めあらゆる４桁の
数字の辞書パタンと照合するよりも“４”，“５”，
“３”などのような一つの数字単位の辞書パタンを連結
して照合した方が辞書の容量を縮小できる。これは桁数
が増えれば増えるほどその差が顕著となる。

【０００３】また、独立単語音声認識に比べて連続音声
認識は入力音声長のばらつきが大きくなる。そこで、対
策として短い単語や音素の単位で辞書パタンを登録して
おき、「確率モデルによる音声認識」（中川著，電子情
報通信学会，１９８８．）などに詳述される２段ＤＰ
（ＤｙｎａｍｉｃＰｒｏｇｒａｍｍｉｎｇ）法、レベ
ルビルディング法、Ｏｎｅ−ＰａｓｓＤＰ法などを用
いて認識を行う。ところが、音素単位など単語に比べて
小さな単位を辞書パタンとする認識方式は辞書の容量を
小さくできるが発声の変動に弱く、認識率は低くなる。
このため、辞書の代わりに音声パタンを高精度にかつ効
率よくモデル化するために隠れマルコフモデル（ＨＭ
Ｍ：ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌ）や神経
回路網を用いる方式がある。これら認識方式は前述の文
献や、「自動翻訳電話」（ＡＴＲ編、オーム社，１９９
４．）に詳述されている。

【０００４】

【発明が解決しようとする課題】前述した従来の連続音
声認識方式では、音素単位などの辞書パタンを連結して
認識対象の音声パタンと照合するのであるが、連結時に
何も情報がないと、連結時の組合せの対象が登録されて
いる全てのパタンに関わる。従って、認識の照合範囲が
広がり、認識率の低下や照合時間が長くなるという問題
点がある。そこで、文脈自由文法などから得られる言語
的な情報を用いて、発話された文がどのようなものであ
るかを解析し、照合すべき辞書パタンを限定する方法が
ある。例えば、特開平２−１１３２９７号公報に記載の
「連続音声認識装置」や特開平４−８６９４６号公報に
記載の「拡張ＬＲパーザによる文認識方式」に記載され
ている。これらは、類を認識するモデルとＬＲアルゴリ
ズムを統合化し、音声認識照合範囲を狭くしている。

【０００５】ところが、ＬＲ（Ｌｅｆｔ−ｔｏ−Ｒｉｇ
ｈｔＲｉｇｈｔｍｏｓｔｄｅｒｉｖａｔｉｏｎ）
アルゴリズムではグラフ構造化スタップと呼ばれるデー
タ構造を用いるため、機構が複雑になるという問題があ
る。また、このデータ構造の記憶量が解析実行時に無視
できないほど増大してしまう問題がある。また、認識対
象の語の種類により、データを頻繁に生成消去すること
もあり、処理時間効率が低下するという問題があった。

【０００６】最近では、「逐次状態分割法による隠れマ
ルコフ網の自動生成」（鷹見著，電子情報通信学会論文
誌、Ｖｏｌ．Ｊ７６−ＤＩＩ，Ｎｏ．１０，ｐｐ．２１
５５−２１６４，１９９３−１０．）に報告されている
ように、ＨＭＭをさらに高精度化するため、音素単位で
はなく当該音素の環境を考慮するようにモデル（例え
ば、／ａｋａ／と発声された音声の／ｋ／を認識するの
に／ｋ／に対応するＨＭＭではなく、ｋの前後にａがあ
るという情報をもった／ａ−ｋ−ａ／というＨＭＭを用
いる）が提案されている。この方式によれば、照合すべ
きＨＭＭの数が多くなるために上記問題はさらに深刻と
なる。

【０００７】本発明は、このような実情に鑑みてなされ
たもので、機構が単純で、記憶量の小さい構文解析部に
より、音声認識の照合範囲を小さくし、高速な照合をす
ることができる連続音声認識方式を提供することを目的
としている。

【０００８】

【課題を解決するための手段】本発明は、上記目的を達
成するために、（１）入力音声の特徴量を抽出する特徴
量抽出手段と、音声記号列を文法により解析する構文解
析手段と、入力音声が属する類を決定する照合手段とを
備えて認識結果を得る連続音声認識方式において、終端
記号と２つの位置番号とを記憶する入力部と、終端記号
または非終端記号を記憶するチャート部と、文脈自由文
法を記憶する文法部と、ＬＲ表を記憶する動作表部とを
設け、特定の類を未知入力音声の照合対象として導出す
ること、更には、（２）前記終端記号と２つの位置番号
とを記憶する入力部と、終端記号または非終端記号を記
憶するチャート部と、文脈自由文法を記憶する文法部
と、ＬＲ表を記憶する動作表部とを設け、特定の類を未
知入力音声の照合対象として導出し、文として受理され
た後に類に対応する音声記号列を照合部で照合するこ
と、更には、（３）前記終端記号と２つの位置番号とを
記憶する入力部と、終端記号または非終端記号を記憶す
るチャート部と、文脈自由文法を記憶する文法部と、Ｌ
Ｒ表を記憶する動作表部と照合スコア蓄積部とを設け、
特定の類を未知入力音声の照合対象として導出する度に
類に対応する辞書パタンを照合部で照合すること、或い
は、（４）入力音声の特徴量を抽出する特徴量抽出手段
と、音声記号列を文法により解析する構文解析手段と、
入力音声が属する類を決定する照合手段とを備えて認識
結果を得る連続音声認識方式において、終端記号と２つ
の位置番号とを記憶する入力部と、終端記号または非終
端記号を記憶するチャート部と、文脈自由文法を記憶す
る文法部と、ＬＲ表を記憶する動作表部と、音声記号記
憶部とを設け、特定の類を未知入力音声との照合対象と
して導出し、連接すること、更には、（５）前記（４）
において、前記終端記号と２つの位置番号とを記憶する
入力部と、終端記号または非終端記号を記憶するチャー
ト部と、文脈自由文法を記憶する文法部と、ＬＲ表を記
憶する動作表部と、音声記号記憶部とを設け、特定の類
を未知入力音声の照合対象として導出し、連接し、文と
して受理された後に類の連接に対応する音声記号列を照
合部で照合すること、更には、（６）前記（４）におい
て、前記終端記号と２つの位置番号とを記憶する入力部
と、終端記号または非終端記号を記憶するチャート部
と、文脈自由文法を記憶する文法部と、ＬＲ表を記憶す
る動作表部と、音声記号記憶部と、照合スコア蓄積部と
を設け、特定の類を未知入力音声の照合対象として導出
し、連接する度に類の連接に対応する音声記号を照合部
で照合することを特徴としたものである。

【０００９】

【作用】前記構成を有する本発明の連続音声認識方式
は、（１）入力音声の特徴量を抽出する手段と、音声記号列
を文法により解析する構文解析手段と、入力音声が属す
る類を決定する照合手段とを備え、認識結果を得る連続
音声認識装置において、終端記号と２つの位置番号とを
記憶する入力部と、終端記号または非終端記号を記憶す
るチャート部と、文脈自由文法を記憶する文法部と、Ｌ
Ｒ表を記憶する動作表部とを設けることにより、特定の
類を未知入力音声の照合対象として導出するので、機構
が単純で、記憶量が小さく、効率的な構文解析が可能と
なる。その結果、音声認識の精度を保ったまま、照合範
囲を小さくすることができ、高速な連続音声認識を実現
することができる。また、（２）終端記号と２つの位置
番号とを記憶する入力部と、終端記号または非終端記号
を記憶するチャート部と、文脈自由文法を記憶する文法
部と、ＬＲ表を記憶する動作表部と、音声記憶部とを設
けることにより、特定の類を未知入力音声との照合対象
として導出し、連接するので、（１）と同様に高速な連
続音声認識を実現することができる。

【００１０】

【実施例】実施例について、図面を参照して以下に説明
する。図１は、本発明による連続音声認識方式の一実施
例を説明するための構成図で、図中、１はフィルタバン
ク、２は照合部、３は文法部、４は状態リスト部、５は
チャート部、６は解析部、７は入力部、８は動作表部、
９はパタン辞書、１０はパタン連続部、１１は判定部で
ある。

【００１１】フィルタバンク１は入力音声を周波数分析
し、解析部６は音声記号列を文法により解析する。照合
部２は入力音声が属する類を決定する。入力部７は終端
記号と２つの位置番号とを記憶し、チャート部５は終端
記号又は非終端記号を記憶し、文法部３は文脈自由文法
を記憶する。また、動作表部８はＬＲ表を記憶する。こ
のような構成により、特定の類を未知入力音声の照合対
象として導出する。

【００１２】すなわち、入力音声は周波数分析するため
にフィルタバンク１に入力される。周波数分析は、通常
１フレームあたり、３msec〜３０msec程度の間隔で行わ
れる。また、フィルタバンク１はいくつかのバンドパス
フィルタによって構成されたものであり、通常は、８〜
３２個程度使用される。分析手法として周波数分析を用
いているが、「音声認識」（新美著，共立出版，197
9.）などで詳述されているようなＬＰＣ（Linear Predi
ctive Coding：線形予測分析法）分析をはじめ、どのよ
うな音響分析手法を用いてもよい。

【００１３】一方、認識対象となる類を導出するための
構文解析は次のように動作する。ここでは、どの類を照
合すればよいかを判断し、特定の類に対する照合指令を
照合部２へ送る。まず、動作を詳しく説明するために、
照合する類はあらかじめわかっているものとして説明
し、その後、実際に照合すべき類を導出する様子を説明
する。まず、例として、図２に示すように、／ｋｏｒｅ
ｏｋｕｒｅ／という記号列が既に入力部７に与えられて
いる場合の解析の様子を示す。図中の開始位置番号と
は、終端記号に対応する音素の開始位置を表している。
終了位置番号とは、同様に当該音素の終了位置を表す。

【００１４】文法部３には、図３に示す文法を格納して
おく。終端記号を小文字で表し、それぞれ音素の類を表
す。ここでは終端記号、すなわち、導出する類を音素に
しているが、単語をはじめどのような類を採用してもか
まわない。文法から得られる動作表を図４に示すように
記憶する。図４の内容は、「Compilers-Principles,Tec
hniques,and Tools」（A.V.Aho他、Addison-Wesley，19
86）などに詳述されるＬＲ解析表と同じで、ＡＣＴＩＯ
Ｎ部とＧＯＴＯ部とから成り立っている。動作には、状
態の遷移、文法の適用、受理、誤りの４種類がある。

【００１５】ＡＣＴＩＯＮ部でｓで始まるものが状態遷
移動作であり、ｒで始まるものが文他の適用動作であ
る。図中、空欄であるものは誤りであることを示してい
る。図４では、ＡＣＴＩＯＮ部の状態Ｏでｏとｋとにそ
れぞれｓ３，ｓ４という状態遷移動作が記されている
が、これは次の入力がｏであれば状態３へ、ｋであれば
状態４へ進むことを示している。状態２０では、＄にｒ
８という文法に適読動作が与えられている。これは、記
号の終りであれば８番目の文法を適用することを示して
いる。＄は最後を表す終端記号で文の最後の位置に設定
される。

【００１６】次に、解析部の動作について説明する。入
力部７に記憶されている終端記号を先頭から１つずつ取
り出し、図７〜図９に示すアルゴリズムを適用し、その
結果を図５に示すチャート部と図６に示す状態リスト部
４に記憶する。最終的に受理の動作を行えばその文は正
しいことになる。また、チャート部には文法で正しいと
規定された全ての句構造が記録される。

【００１７】まず、ＰＲＯＣ１を実行する。ＰＲＯＣ１：文頭の位置番号１の状態リストに開始状態
番号を格納する。開始状態番号を０とする。最初の終端
記号、開始位置番号、終了位置番号はそれぞれｋ,１,２
であるので、ＰＲＯＣ２(ｋ,１,２)を行う。ＰＲＯＣ２(ｋ,１,２)：チャート部５に(ｋ,１,２)は記
憶されていないので、ＰＲＯＣ３(ｋ,１,２)を行う。

【００１８】ＰＲＯＣ３(ｋ,１,２)：位置番号１の状態
リストを取り出する［０］である。次に、図４の動作表
から状態０における終端記号ｋの状態遷移先を調べる。
４が遷移先状態番号であることがわかるので、リストＬ
＝［４］とする。Ｌ中の状態番号４に対して、２を開始
位置番号とする入力部の終端記号ｏの状態遷移先を動作
表から調べる。状態４において、状態遷移が可能である
ので、状態番号４を位置番号２の状態リストに記録す
る。

【００１９】Ｌの状態番号４に対して、終端記号ｏが次
に来る場合に適用できる文法番号を動作表から調べると
ないので、ＰＲＯＣ３の手続き４におけるＲＬは空リス
ト［］になる。ここまでで変数Ｒet＝１であるのでＰＲ
ＯＣ３(ｋ,１,２)を成功して終了し、ＰＲＯＣ２(ｋ,
１,２)に戻る。

【００２０】ＰＲＯＣ２(ｋ,１,２)：(ｋ,１,２)をチャ
ート部５に記憶し、成功して終了し、ＰＲＯＣ１に戻
る。ここまでの状態を図１０に示す。入力部の組(ｒ,
３,４)までは、上記と同様に解析が進む。ここまでの状
態を図１１に示す。

【００２１】さらに、次の処理を行うためＰＲＯＣ１を
実行する。ＰＲＯＣ１：次の組(ｅ,４,５)を取り出し、ＰＲＯＣ２
(ｅ,４,５)を行う。ＰＲＯＣ２(ｅ,４,５)：チャート部５に(ｅ,４,５)は記
憶されていないので、ＰＲＯＣ３(ｅ,４,５)を実行す
る。ＰＲＯＣ３(ｅ,４,５)：位置番号４の状態リストを取り
出すと［１５］である。次に、動作表から状態１５にお
ける終端記号ｅの状態遷移先を調べる。１８が遷移先状
態番号であることがわかるので、リストＬ＝［１８］と
する。Ｌ中の状態番号１８に対して、５を開始位置番号
とする入力部７の終端記号ｏの状態遷移先を動作表から
調べる。ｏに対応する動作はｒ５なので状態遷移は不可
能である。

【００２２】手続き４に進み、動作がｒ５なのでＲＬ＝
［５］とする。リストＲＬ中の文法番号５を文法部３か
ら取り出すと（Ｎ，[kore])である。右辺の最右要素を
除いたＲ_h′は［kor］である。Ｒ_h′の最左要素である
［ｋ］と、現在記憶されているチャート部５の句構造と
を、文頭方向に向かって照合する。チャート部５の
（ｋ,１,２）と照合するので、ＰＲＯＣ２(Ｎ,１,５)を
実行する。

【００２３】ＰＲＯＣ２(Ｎ,１,５)：チャート部５に
（Ｎ,１,５）は記憶されていないのでＰＲＯＣ３(Ｎ,
１,５)を実行する。ＰＲＯＣ３(Ｎ,１,５)：位置番号１の状態リストを取り
出すと［０］である。次に、動作表から状態０における
非終端記号Ｎの状態遷移先を調べる。６が遷移先状態番
号であることがわかるので、Ｌ＝［６］とする。Ｌ中の
状態番号６に対して、５を開始位置番号とする入力部７
の終端記号ｏの状態遷移先を動作表から調べる。ｏに対
応する動作にａ１３があるので状態遷移は可能である。
従って、Ｌ＝［６］を位置番号５の状態リストに記録す
る。

【００２４】手続き４に進み、ｏに対応する動作として
ｒ３も存在するので、ＲＬ＝［３］とする。リストＲＬ
中の文法番号３を文法部３から取り出すと（ＮＰ，
[Ｎ]）である。右辺の最右要素を除いたＲ_h′は空リス
ト［］になるので、ＰＲＯＣ２(ＮＰ,１,５)を実行す
る。

【００２５】ＰＲＯＣ２(ＮＰ,１,５)：チャート部５に
（ＮＰ,１,５）は記憶されていないので、ＰＲＯＣ３
(ＮＰ,１,５)を実行する。ＰＲＯＣ３(ＮＰ,１,５)：位置番号１の状態リストを取
り出すと［０］である。次に、動作表から状態０におけ
る非終端記号ＮＰの状態遷移先を調べる。５が遷移先状
態番号であることがわかるので、Ｌ＝［５］とする。Ｌ
中の状態番号５に対して、５を開始位置番号とする入力
部７の終端記号ｏの状態遷移先を動作表から調べる。ｏ
に対応する動作にｓ３があるので状態遷移は可能であ
る。従って、Ｌ＝［５］を位置番号５の状態リストに記
録する。ここまでで、Ｒet＝１なので成功して終了し、
ＰＲＯＣ２(ＮＰ,１,５)に戻る。

【００２６】ＰＲＯＣ２(ＮＰ,１,５)：チャート部５に
（ＮＰ,１,５）を記憶し、成功して終了し、ＰＲＯＣ３
(Ｎ,１,５)に戻る。ＰＲＯＣ３(Ｎ,１,５)：Ｒet＝１なので成功して終了
し、ＰＲＯＣ２(Ｎ,１,５)に戻る。ＰＲＯＣ２(Ｎ,１,５)：チャート部５に（Ｎ,１,５）を
記憶し、ＰＲＯＣ３(ｅ,４,５)に戻る。ＰＲＯＣ３(ｅ,４,５)：Ｒet＝１なので成功して終了
し、ＰＲＯＣ２(ｅ,４,５)に戻る。ＰＲＯＣ２(ｅ,４,５)：チャート部５に（ｅ,４,５）を
記憶し、成功して終了し、ＰＲＯＣ１に戻る。ここまでで図１２に示すように／ｋｏｒｅ／までの解析
が進む。

【００２７】以下同様に処理を進めると、この記号列は
受理され、図１３になる。そして記号列／ｋｏｒｅｏｋ
ｕｒｅ／を出力する。以上が解析部６の動作である。前
述の説明において、解析部６の動作が複雑になるのを避
けるために、照合部２に導出するべき類が一つに決まっ
ているものと仮定した。しかし、動作表中の状態遷移は
複数の類に存在することがほとんどである。その場合の
動作を前述の例を用いて説明する。

【００２８】まず、ＰＲＯＣ１を実行する。ＰＲＯＣ１：文頭の位置番号１の状態リストに開始状態
番号を格納する。開始状態番号を０とする。この状態番
号から遷移が可能な終端記号は、ｏとｋである。従っ
て、入力部７に（０,１,２）、別の入力部に（ｋ,１,
２）を記憶する。ＰＲＯＣ２(ｏ,１,２）とＰＲＯＣ２
(ｋ,１,２）とが発生し、それぞれ独立に処理を進めて
いく。ＰＲＯＣ２(ｏ,１,２）：チャート部に(ｏ,１,２）は記
憶されていないので、ＰＲＯＣ３(ｏ,１,２）を実行す
る。

【００２９】ＰＲＯＣ３(ｏ,１,２）：位置番号１の状
態リストを取り出すと［０］である。次に、図４の動作
表から状態０における終端記号ｏの状態遷移先を調べ
る。３が遷移先状態番号であることがわかるので、リス
トＬ＝［３］とする。Ｌ中の状態番号３に対して、２を
開始位置番号とする状態遷移先を動作表から調べる。状
態３において非終端記号ｋへの遷移が可能であるので、
状態番号３を位置番号２の状態リストに記録する。ま
た、入力部７に(ｋ,２,３）を記憶する。

【００３０】Ｌの状態番号３に対して、終端記号ｋが次
に来る場合に適用できる文法番号を動作表から調べると
ないので、ＰＲＯＣ３の手続き４におけるＲＬは空リス
ト［］になる。ここまでで変数Ｒet＝１であるのでＰ
ＲＯＣ３(ｏ,１,２）を成功して終了し、ＰＲＯＣ２
(ｏ,１,２）に戻る。

【００３１】ＰＲＯＣ２(ｏ,１,２）：(ｏ,１,２）をチ
ャート部５に記憶し、成功して終了し、ＰＲＯＣ１に戻
る。ＰＲＯＣ２(ｋ,１,２）：チャート部５に(ｋ,１,２）は
記憶されていないので、ＰＲＯＣ３(ｋ,１,２）を実行
する。ＰＲＯＣ３(ｋ,１,２）：位置番号１の状態リストを取
り出すと［０］である。次に、図４の動作表から状態０
における終了端記号ｋの状態遷移先を調べる。４が遷移
先状態番号であることがわかるので、リストＬ＝［４］
とする。Ｌ中の状態番号４に対して、２を開始位置番号
とする状態遷移先を動作表から調べる。状態４におい
て、非終端記号ｏとｕへの遷移が可能であるので、状態
番号４を位置番号２の状態リストに記録する。また、入
力部７に(ｋ,２,３）を、別の入力部に(ｕ,２,３）を記
憶する。

【００３２】Ｌの状態番号４に対して、終端記号ｏまた
はｕが次に来る場合に適用できる文法番号を動作表から
調べるとないので、ＰＲＯＣ３の手続き４におけるＲＬ
は空リスト［］になる。ここまでで変数Ｒet＝１であ
るのでＰＲＯＣ３(ｋ,１,２）を成功して終了し、ＰＲ
ＯＣ２(ｋ,１,２）に戻る。ＰＲＯＣ２(ｋ,１,２）：(ｋ,１,２）をチャート部５に
記憶し、成功して終了し、ＰＲＯＣ１に戻る。ここまで
の状態を図１４に示す。

【００３３】以下、同様に処理を進めると、最終的に記
号列／ｏｋｕｒｅ／，／ｋｏｒｅｏｋｕｒｅ／，／ｋｕ
ｒｅ／などが入力部に記憶される。これらの記号列の情
報から対応する、音素辞書パタンを選択し連結する。そ
の後、連結した辞書パタンと入力音声の特徴量とをＤＰ
マッチングなどよく知られた方法によって照合し、最も
類似した連結パタンに対応する音素記号列を認識結果と
する。辞書パタンの代わりに、ＨＭＭや神経回路網によ
って各音素の特徴をモデル化したものを用いてもかまわ
ない。

【００３４】図１５は、本発明による連続音声認識方式
の他の実施例を説明するための構成図で、図中、１２は
照合スコア蓄積部、１３は枝刈り部で、その他、図１と
同じ作用をする部分は同一の符号を付してある。解析途
中の照合結果によって枝刈りを行い、照合範囲を狭くす
ることができる。従って、より高速な認識を行うことが
できる。図１５の解析部のアルゴリズムには、図７の代
わりに図１６を用いる。すなわち、図７では全ての解析
を終了した後に照合を行ったのに対し、図１６では、手
続き４が示すように終端記号を持つ組がチャート部に記
録されるたびに、その終端記号を出力する。

【００３５】照合スコア蓄積部１２には解析部６から既
に出力された記号列の照合スコアと、そのスコアを算出
した時点での入力音声のフレーム番号を記憶しておく。
その後、照合スコア蓄積部１２の情報により、解析部６
から新たに出力された終端記号に対応する辞書パタンの
照合開始フレームを決定する。開始フレームからの照合
スコアを蓄積部のスコアに加え、認識候補の照合スコア
を更新する。現時点までの全ての候補のスコアを枝刈り
部に送り、候補の数がある所定の数より多くなった場合
にはスコアの低い候補を蓄積部から除外する。この操作
を繰り返し、最終的に全ての解析を終了した候補の中か
ら最も高いスコアをもつものを認識結果として出力す
る。

【００３６】図１７は、本発明による連続音声認識方式
のさらに他の実施例を説明するための構成図で、図中、
１４は音声記号記憶部で、その他、図１と同じ作用をす
る部分は同一の符号を付してある。図１７に示す実施例
は、図１に音声記号記憶部１４を加えたものである。音
声記号記憶部１４では過去に解析部が出力した記号を現
在から（Ｎ−１）個前まで記憶しておく。これによっ
て、Ｎ個の音素によって過去の環境を考慮しているよう
なパタン辞書に対して照合命令を出すことができる。例
えば、／ａｋａｉ／という記号列が解析部から出力さ
れ、Ｎ＝２の記憶部をもっているとすれば、辞書パタン
は順に／−ａ／，／ａｋ／，／ｋａ／，／ａｉ／を表す
辞書パタンを順に照合することになる。このような環境
を考慮したパタン辞書を照合することで、認識精度を高
めることができる。なお、図１７に示した音声記号記憶
部１４は図１５の実施例にも実現することができる。

【００３７】

【発明の効果】以上の説明から明らかなように、本発明
によると、以下のような効果がある。（１）請求項１〜３に対応する効果：終端記号と２つの
位置番号とを記憶する入力部と、終端記号または非終端
記号を記憶するチャート部と、文脈自由文法を記憶する
文法部と、ＬＲ表を記憶する動作表部とを設け、特定の
類を未知入力音声の照合対象として導出するようにした
ので、機構が単純で、記憶量が小さく、効率的な構文解
析が可能となる。その結果、音声認識の精度を保ったま
ま、照合範囲を小さくすることができ、高速な連続音声
認識を実現することができる。（２）請求項４〜６に対応する効果：終端記号と２つの
位置番号とを記憶する入力部と、終端記号または非終端
記号を記憶するチャート部と、文脈自由文法を記憶する
文法部と、ＬＲ表を記憶する動作表部と、音声記号記憶
部とを設け、特定の類を未知入力音声の照合対象として
導出し、連接するようにしたので、機構が単純で、記憶
量が小さく、効率的な構文解析が可能となる。その結
果、音声認識の精度を保ったまま、照合範囲を小さくす
ることができ、高速な連続音声認識を実現することがで
きる。

【図面の簡単な説明】

【図１】本発明による連続音声認識方式の一実施例を
説明するための構成図である。

【図２】図１における入力部の例を示す図である。

【図３】図１における文法部の例を示す図である。

【図４】図１における動作表部の例を示す図である。

【図５】図１におけるチャート部の例を示す図であ
る。

【図６】図１における状態リスト部の例を示す図であ
る。

【図７】本発明におけるアルゴリズムＰＲＯＣ１を示
す図である。

【図８】本発明におけるアルゴリズムＰＲＯＣ２(Ｘ,
Ｂ,Ｅ)を示す図である。

【図９】本発明におけるアルゴリズムＰＲＯＣ３(Ｘ,
Ｂ,Ｅ)を示す図である。

【図１０】本発明における最初の終端記号／ｋ／の解
析が終了した状態を示す図である。

【図１１】本発明における終端記号／ｋｏｒ／までの
解析が終了した状態を示す図である。

【図１２】本発明における終端記号／ｋｏｒｅ／まで
の解析が終了した状態を示す図である。

【図１３】本発明における入力記号列が受理された状
態を示す図である。

【図１４】本発明における複数の記号を解析している
状態を示す図である。

【図１５】本発明による連続音声認識方式の他の実施
例を説明するための構成図である。

【図１６】本発明におけるアルゴリズムＰＲＯＣ１′
を示す図である。

【図１７】本発明による連続音声認識方式の更に他の
実施例を説明するための構成図である。

【符号の説明】

１…フィルタバンク、２…照合部、３…文法部、４…状
態リスト部、５…チャート部、６…解析部、７…入力
部、８…動作表部、９…パタン辞書、１０…パタン連続
部、１１…判定部、１２…照合スコア蓄積部、１３…枝
刈り部、１４…音声記号記憶部。

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平４−86946（ＪＰ，Ａ) 特開平２−113297（ＪＰ，Ａ) 特開昭60−73698（ＪＰ，Ａ) 特開平６−118989（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 15/18

Claims

(57)【特許請求の範囲】

【請求項１】入力音声の特徴量を抽出する特徴量抽出
手段と、音声記号列を文法により解析する構文解析手段
と、入力音声が属する類を決定する照合手段とを備えて
認識結果を得る連続音声認識方式において、終端記号と
２つの位置番号とを記憶する入力部と、終端記号または
非終端記号を記憶するチャート部と、文脈自由文法を記
憶する文法部と、ＬＲ表を記憶する動作表部とを設け、
特定の類を未知入力音声の照合対象として導出すること
を特徴とする連続音声認識方式。
【請求項２】前記終端記号と２つの位置番号とを記憶
する入力部と、終端記号または非終端記号を記憶するチ
ャート部と、文脈自由文法を記憶する文法部と、ＬＲ表
を記憶する動作表部とを設け、特定の類を未知入力音声
の照合対象として導出し、文として受理された後に類に
対応する音声記号列を照合部で照合することを特徴とす
る請求項１記載の連続音声認識方式。
【請求項３】前記終端記号と２つの位置番号とを記憶
する入力部と、終端記号または非終端記号を記憶するチ
ャート部と、文脈自由文法を記憶する文法部と、ＬＲ表
を記憶する動作表部と照合スコア蓄積部とを設け、特定
の類を未知入力音声の照合対象として導出する度に類に
対応する辞書パタンを照合部で照合することを特徴とす
る請求項１記載の連続音声認識方式。
【請求項４】入力音声の特徴量を抽出する特徴量抽出
手段と、音声記号列を文法により解析する構文解析手段
と、入力音声が属する類を決定する照合手段とを備えて
認識結果を得る連続音声認識方式において、終端記号と
２つの位置番号とを記憶する入力部と、終端記号または
非終端記号を記憶するチャート部と、文脈自由文法を記
憶する文法部と、ＬＲ表を記憶する動作表部と、音声記
号記憶部とを設け、特定の類を未知入力音声との照合対
象として導出し、連接することを特徴とする連続音声認
識方式。
【請求項５】前記終端記号と２つの位置番号とを記憶
する入力部と、終端記号または非終端記号を記憶するチ
ャート部と、文脈自由文法を記憶する文法部と、ＬＲ表
を記憶する動作表部と、音声記号記憶部とを設け、特定
の類を未知入力音声の照合対象として導出し、連接し、
文として受理された後に類の連接に対応する音声記号列
を照合部で照合することを特徴とする請求項４記載の連
続音声認識方式。
【請求項６】前記終端記号と２つの位置番号とを記憶
する入力部と、終端記号または非終端記号を記憶するチ
ャート部と、文脈自由文法を記憶する文法部と、ＬＲ表
を記憶する動作表部と、音声記号記憶部と、照合スコア
蓄積部とを設け、特定の類を未知入力音声の照合対象と
して導出し、連接する度に類の連接に対応する音声記号
を照合部で照合することを特徴とする請求項４記載の連
続音声認識方式。