JP3355248B2 - 連続音声認識方式 - Google Patents

連続音声認識方式

Info

Publication number
JP3355248B2
JP3355248B2 JP16196194A JP16196194A JP3355248B2 JP 3355248 B2 JP3355248 B2 JP 3355248B2 JP 16196194 A JP16196194 A JP 16196194A JP 16196194 A JP16196194 A JP 16196194A JP 3355248 B2 JP3355248 B2 JP 3355248B2
Authority
JP
Japan
Prior art keywords
unit
storing
symbol
grammar
terminal symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP16196194A
Other languages
English (en)
Other versions
JPH0830291A (ja
Inventor
喜永 加藤
秀夫 伊東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP16196194A priority Critical patent/JP3355248B2/ja
Publication of JPH0830291A publication Critical patent/JPH0830291A/ja
Application granted granted Critical
Publication of JP3355248B2 publication Critical patent/JP3355248B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Devices For Executing Special Programs (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、連続音声認識方式に関
し、より詳細には、入力音声の特徴量を抽出し、音声記
号列を文法により解析し、入力音声が属する類を決定し
て認識結果を得る連続音声認識方式に関する。
【0002】
【従来の技術】従来の音声認識方式について説明する。
まず、音声データを分析し、特徴量に変換した後に、あ
らかじめ認識対象語となる音声パタンを辞書に登録して
おく。次に、認識時には、マイクなどによって入力され
た未知の音声パタンを同じく分析し、特徴量に変換す
る。その後、前述の辞書と照合し、最も類似した辞書パ
タンに対応する語を認識結果として出力する。連続音声
認識の場合は、独立単語認識のように一発声に対して一
つの辞書パタンを作成することは実用的ではない。例え
ば、連続数字認識で、“4533”と発声した場合を考
えてみる。照合時に“4533”を始めあらゆる4桁の
数字の辞書パタンと照合するよりも“4”,“5”,
“3”などのような一つの数字単位の辞書パタンを連結
して照合した方が辞書の容量を縮小できる。これは桁数
が増えれば増えるほどその差が顕著となる。
【0003】また、独立単語音声認識に比べて連続音声
認識は入力音声長のばらつきが大きくなる。そこで、対
策として短い単語や音素の単位で辞書パタンを登録して
おき、「確率モデルによる音声認識」(中川著,電子情
報通信学会,1988.)などに詳述される2段DP
(Dynamic Programming)法、レベ
ルビルディング法、One−Pass DP法などを用
いて認識を行う。ところが、音素単位など単語に比べて
小さな単位を辞書パタンとする認識方式は辞書の容量を
小さくできるが発声の変動に弱く、認識率は低くなる。
このため、辞書の代わりに音声パタンを高精度にかつ効
率よくモデル化するために隠れマルコフモデル(HM
M:Hidden Markov Model)や神経
回路網を用いる方式がある。これら認識方式は前述の文
献や、「自動翻訳電話」(ATR編、オーム社,199
4.)に詳述されている。
【0004】
【発明が解決しようとする課題】前述した従来の連続音
声認識方式では、音素単位などの辞書パタンを連結して
認識対象の音声パタンと照合するのであるが、連結時に
何も情報がないと、連結時の組合せの対象が登録されて
いる全てのパタンに関わる。従って、認識の照合範囲が
広がり、認識率の低下や照合時間が長くなるという問題
点がある。そこで、文脈自由文法などから得られる言語
的な情報を用いて、発話された文がどのようなものであ
るかを解析し、照合すべき辞書パタンを限定する方法が
ある。例えば、特開平2−113297号公報に記載の
「連続音声認識装置」や特開平4−86946号公報に
記載の「拡張LRパーザによる文認識方式」に記載され
ている。これらは、類を認識するモデルとLRアルゴリ
ズムを統合化し、音声認識照合範囲を狭くしている。
【0005】ところが、LR(Left−to−Rig
ht Right most derivation
アルゴリズムではグラフ構造化スタップと呼ばれるデー
タ構造を用いるため、機構が複雑になるという問題があ
る。また、このデータ構造の記憶量が解析実行時に無視
できないほど増大してしまう問題がある。また、認識対
象の語の種類により、データを頻繁に生成消去すること
もあり、処理時間効率が低下するという問題があった。
【0006】最近では、「逐次状態分割法による隠れマ
ルコフ網の自動生成」(鷹見著,電子情報通信学会論文
誌、Vol.J76−DII,No.10,pp.21
55−2164,1993−10.)に報告されている
ように、HMMをさらに高精度化するため、音素単位で
はなく当該音素の環境を考慮するようにモデル(例え
ば、/aka/と発声された音声の/k/を認識するの
に/k/に対応するHMMではなく、kの前後にaがあ
るという情報をもった/a−k−a/というHMMを用
いる)が提案されている。この方式によれば、照合すべ
きHMMの数が多くなるために上記問題はさらに深刻と
なる。
【0007】本発明は、このような実情に鑑みてなされ
たもので、機構が単純で、記憶量の小さい構文解析部に
より、音声認識の照合範囲を小さくし、高速な照合をす
ることができる連続音声認識方式を提供することを目的
としている。
【0008】
【課題を解決するための手段】本発明は、上記目的を達
成するために、(1)入力音声の特徴量を抽出する特徴
量抽出手段と、音声記号列を文法により解析する構文解
析手段と、入力音声が属する類を決定する照合手段とを
備えて認識結果を得る連続音声認識方式において、終端
記号と2つの位置番号とを記憶する入力部と、終端記号
または非終端記号を記憶するチャート部と、文脈自由文
法を記憶する文法部と、LR表を記憶する動作表部とを
設け、特定の類を未知入力音声の照合対象として導出す
ること、更には、(2)前記終端記号と2つの位置番号
とを記憶する入力部と、終端記号または非終端記号を記
憶するチャート部と、文脈自由文法を記憶する文法部
と、LR表を記憶する動作表部とを設け、特定の類を未
知入力音声の照合対象として導出し、文として受理され
た後に類に対応する音声記号列を照合部で照合するこ
と、更には、(3)前記終端記号と2つの位置番号とを
記憶する入力部と、終端記号または非終端記号を記憶す
るチャート部と、文脈自由文法を記憶する文法部と、L
R表を記憶する動作表部と照合スコア蓄積部とを設け、
特定の類を未知入力音声の照合対象として導出する度に
類に対応する辞書パタンを照合部で照合すること、或い
は、(4)入力音声の特徴量を抽出する特徴量抽出手段
と、音声記号列を文法により解析する構文解析手段と、
入力音声が属する類を決定する照合手段とを備えて認識
結果を得る連続音声認識方式において、終端記号と2つ
の位置番号とを記憶する入力部と、終端記号または非終
端記号を記憶するチャート部と、文脈自由文法を記憶す
る文法部と、LR表を記憶する動作表部と、音声記号記
憶部とを設け、特定の類を未知入力音声との照合対象と
して導出し、連接すること、更には、(5)前記(4)
において、前記終端記号と2つの位置番号とを記憶する
入力部と、終端記号または非終端記号を記憶するチャー
ト部と、文脈自由文法を記憶する文法部と、LR表を記
憶する動作表部と、音声記号記憶部とを設け、特定の類
を未知入力音声の照合対象として導出し、連接し、文と
して受理された後に類の連接に対応する音声記号列を照
合部で照合すること、更には、(6)前記(4)におい
て、前記終端記号と2つの位置番号とを記憶する入力部
と、終端記号または非終端記号を記憶するチャート部
と、文脈自由文法を記憶する文法部と、LR表を記憶す
る動作表部と、音声記号記憶部と、照合スコア蓄積部と
を設け、特定の類を未知入力音声の照合対象として導出
し、連接する度に類の連接に対応する音声記号を照合部
で照合することを特徴としたものである。
【0009】
【作用】前記構成を有する本発明の連続音声認識方式
は、 (1)入力音声の特徴量を抽出する手段と、音声記号列
を文法により解析する構文解析手段と、入力音声が属す
る類を決定する照合手段とを備え、認識結果を得る連続
音声認識装置において、終端記号と2つの位置番号とを
記憶する入力部と、終端記号または非終端記号を記憶す
るチャート部と、文脈自由文法を記憶する文法部と、L
R表を記憶する動作表部とを設けることにより、特定の
類を未知入力音声の照合対象として導出するので、機構
が単純で、記憶量が小さく、効率的な構文解析が可能と
なる。その結果、音声認識の精度を保ったまま、照合範
囲を小さくすることができ、高速な連続音声認識を実現
することができる。また、(2)終端記号と2つの位置
番号とを記憶する入力部と、終端記号または非終端記号
を記憶するチャート部と、文脈自由文法を記憶する文法
部と、LR表を記憶する動作表部と、音声記憶部とを設
けることにより、特定の類を未知入力音声との照合対象
として導出し、連接するので、(1)と同様に高速な連
続音声認識を実現することができる。
【0010】
【実施例】実施例について、図面を参照して以下に説明
する。図1は、本発明による連続音声認識方式の一実施
例を説明するための構成図で、図中、1はフィルタバン
ク、2は照合部、3は文法部、4は状態リスト部、5は
チャート部、6は解析部、7は入力部、8は動作表部、
9はパタン辞書、10はパタン連続部、11は判定部で
ある。
【0011】フィルタバンク1は入力音声を周波数分析
し、解析部6は音声記号列を文法により解析する。照合
部2は入力音声が属する類を決定する。入力部7は終端
記号と2つの位置番号とを記憶し、チャート部5は終端
記号又は非終端記号を記憶し、文法部3は文脈自由文法
を記憶する。また、動作表部8はLR表を記憶する。こ
のような構成により、特定の類を未知入力音声の照合対
象として導出する。
【0012】すなわち、入力音声は周波数分析するため
にフィルタバンク1に入力される。周波数分析は、通常
1フレームあたり、3msec〜30msec程度の間隔で行わ
れる。また、フィルタバンク1はいくつかのバンドパス
フィルタによって構成されたものであり、通常は、8〜
32個程度使用される。分析手法として周波数分析を用
いているが、「音声認識」(新美著,共立出版,197
9.)などで詳述されているようなLPC(Linear Predi
ctive Coding:線形予測分析法)分析をはじめ、どのよ
うな音響分析手法を用いてもよい。
【0013】一方、認識対象となる類を導出するための
構文解析は次のように動作する。ここでは、どの類を照
合すればよいかを判断し、特定の類に対する照合指令を
照合部2へ送る。まず、動作を詳しく説明するために、
照合する類はあらかじめわかっているものとして説明
し、その後、実際に照合すべき類を導出する様子を説明
する。まず、例として、図2に示すように、/kore
okure/という記号列が既に入力部7に与えられて
いる場合の解析の様子を示す。図中の開始位置番号と
は、終端記号に対応する音素の開始位置を表している。
終了位置番号とは、同様に当該音素の終了位置を表す。
【0014】文法部3には、図3に示す文法を格納して
おく。終端記号を小文字で表し、それぞれ音素の類を表
す。ここでは終端記号、すなわち、導出する類を音素に
しているが、単語をはじめどのような類を採用してもか
まわない。文法から得られる動作表を図4に示すように
記憶する。図4の内容は、「Compilers-Principles,Tec
hniques,and Tools」(A.V.Aho他、Addison-Wesley,19
86)などに詳述されるLR解析表と同じで、ACTIO
N部とGOTO部とから成り立っている。動作には、状
態の遷移、文法の適用、受理、誤りの4種類がある。
【0015】ACTION部でsで始まるものが状態遷
動作であり、rで始まるものが文他の適用動作であ
る。図中、空欄であるものは誤りであることを示してい
る。図4では、ACTION部の状態Oでoとkとにそ
れぞれs3,s4という状態遷移動作が記されている
が、これは次の入力がoであれば状態3へ、kであれば
状態4へ進むことを示している。状態20では、$にr
8という文法に適読動作が与えられている。これは、記
号の終りであれば8番目の文法を適用することを示して
いる。$は最後を表す終端記号で文の最後の位置に設定
される。
【0016】次に、解析部の動作について説明する。入
力部7に記憶されている終端記号を先頭から1つずつ取
り出し、図7〜図9に示すアルゴリズムを適用し、その
結果を図5に示すチャート部と図6に示す状態リスト部
4に記憶する。最終的に受理の動作を行えばその文は正
しいことになる。また、チャート部には文法で正しいと
規定された全ての句構造が記録される。
【0017】まず、PROC1を実行する。 PROC1:文頭の位置番号1の状態リストに開始状態
番号を格納する。開始状態番号を0とする。最初の終端
記号、開始位置番号、終了位置番号はそれぞれk,1,2
であるので、PROC2(k,1,2)を行う。 PROC2(k,1,2):チャート部5に(k,1,2)は記
憶されていないので、PROC3(k,1,2)を行う。
【0018】PROC3(k,1,2):位置番号1の状態
リストを取り出する[0]である。次に、図4の動作表
から状態0における終端記号kの状態遷移先を調べる。
4が遷移先状態番号であることがわかるので、リストL
=[4]とする。L中の状態番号4に対して、2を開始
位置番号とする入力部の終端記号oの状態遷移先を動作
表から調べる。状態4において、状態遷移が可能である
ので、状態番号4を位置番号2の状態リストに記録す
る。
【0019】Lの状態番号4に対して、終端記号oが次
に来る場合に適用できる文法番号を動作表から調べると
ないので、PROC3の手続き4におけるRLは空リス
ト[]になる。ここまでで変数Ret=1であるのでPR
OC3(k,1,2)を成功して終了し、PROC2(k,
1,2)に戻る。
【0020】PROC2(k,1,2):(k,1,2)をチャ
ート部5に記憶し、成功して終了し、PROC1に戻
る。ここまでの状態を図10に示す。入力部の組(r,
3,4)までは、上記と同様に解析が進む。ここまでの状
態を図11に示す。
【0021】さらに、次の処理を行うためPROC1を
実行する。 PROC1:次の組(e,4,5)を取り出し、PROC2
(e,4,5)を行う。 PROC2(e,4,5):チャート部5に(e,4,5)は記
憶されていないので、PROC3(e,4,5)を実行す
る。 PROC3(e,4,5):位置番号4の状態リストを取り
出すと[15]である。次に、動作表から状態15にお
ける終端記号eの状態遷移先を調べる。18が遷移先状
態番号であることがわかるので、リストL=[18]と
する。L中の状態番号18に対して、5を開始位置番号
とする入力部7の終端記号oの状態遷移先を動作表から
調べる。oに対応する動作はr5なので状態遷移は不可
能である。
【0022】手続き4に進み、動作がr5なのでRL=
[5]とする。リストRL中の文法番号5を文法部3か
ら取り出すと(N,[kore])である。右辺の最右要素を
除いたRh′は[kor]である。Rh′の最左要素である
[k]と、現在記憶されているチャート部5の句構造と
を、文頭方向に向かって照合する。チャート部5の
(k,1,2)と照合するので、PROC2(N,1,5)を
実行する。
【0023】PROC2(N,1,5):チャート部5に
(N,1,5)は記憶されていないのでPROC3(N,
1,5)を実行する。 PROC3(N,1,5):位置番号1の状態リストを取り
出すと[0]である。次に、動作表から状態0における
非終端記号Nの状態遷移先を調べる。6が遷移先状態番
号であることがわかるので、L=[6]とする。L中の
状態番号6に対して、5を開始位置番号とする入力部7
の終端記号oの状態遷移先を動作表から調べる。oに対
応する動作にa13があるので状態遷移は可能である。
従って、L=[6]を位置番号5の状態リストに記録す
る。
【0024】手続き4に進み、oに対応する動作として
r3も存在するので、RL=[3]とする。リストRL
中の文法番号3を文法部3から取り出すと(NP,
[N])である。右辺の最右要素を除いたRh′は空リス
ト[ ]になるので、PROC2(NP,1,5)を実行す
る。
【0025】PROC2(NP,1,5):チャート部5に
(NP,1,5)は記憶されていないので、PROC3
(NP,1,5)を実行する。 PROC3(NP,1,5):位置番号1の状態リストを取
り出すと[0]である。次に、動作表から状態0におけ
る非終端記号NPの状態遷移先を調べる。5が遷移先状
態番号であることがわかるので、L=[5]とする。L
中の状態番号5に対して、5を開始位置番号とする入力
部7の終端記号oの状態遷移先を動作表から調べる。o
に対応する動作にs3があるので状態遷移は可能であ
る。従って、L=[5]を位置番号5の状態リストに記
録する。ここまでで、Ret=1なので成功して終了し、
PROC2(NP,1,5)に戻る。
【0026】PROC2(NP,1,5):チャート部5に
(NP,1,5)を記憶し、成功して終了し、PROC3
(N,1,5)に戻る。 PROC3(N,1,5):Ret=1なので成功して終了
し、PROC2(N,1,5)に戻る。 PROC2(N,1,5):チャート部5に(N,1,5)を
記憶し、PROC3(e,4,5)に戻る。 PROC3(e,4,5):Ret=1なので成功して終了
し、PROC2(e,4,5)に戻る。 PROC2(e,4,5):チャート部5に(e,4,5)を
記憶し、成功して終了し、PROC1に戻る。 ここまでで図12に示すように/kore/までの解析
が進む。
【0027】以下同様に処理を進めると、この記号列は
受理され、図13になる。そして記号列/koreok
ure/を出力する。以上が解析部6の動作である。前
述の説明において、解析部6の動作が複雑になるのを避
けるために、照合部2に導出するべきが一つに決まっ
ているものと仮定した。しかし、動作表中の状態遷移は
複数の類に存在することがほとんどである。その場合の
動作を前述の例を用いて説明する。
【0028】まず、PROC1を実行する。 PROC1:文頭の位置番号1の状態リストに開始状態
番号を格納する。開始状態番号を0とする。この状態番
号から遷移が可能な終端記号は、oとkである。従っ
て、入力部7に(0,1,2)、別の入力部に(k,1,
2)を記憶する。PROC2(o,1,2)とPROC2
(k,1,2)とが発生し、それぞれ独立に処理を進めて
いく。 PROC2(o,1,2):チャート部に(o,1,2)は記
憶されていないので、PROC3(o,1,2)を実行す
る。
【0029】PROC3(o,1,2):位置番号1の状
態リストを取り出すと[0]である。次に、図4の動作
表から状態0における終端記号oの状態遷移先を調べ
る。3が遷移先状態番号であることがわかるので、リス
トL=[3]とする。L中の状態番号3に対して、2を
開始位置番号とする状態遷移先を動作表から調べる。状
態3において非終端記号kへの遷移が可能であるので、
状態番号3を位置番号2の状態リストに記録する。ま
た、入力部7に(k,2,3)を記憶する。
【0030】Lの状態番号3に対して、終端記号kが次
に来る場合に適用できる文法番号を動作表から調べると
ないので、PROC3の手続き4におけるRLは空リス
ト[ ]になる。ここまでで変数Ret=1であるのでP
ROC3(o,1,2)を成功して終了し、PROC2
(o,1,2)に戻る。
【0031】PROC2(o,1,2):(o,1,2)をチ
ャート部5に記憶し、成功して終了し、PROC1に戻
る。 PROC2(k,1,2):チャート部5に(k,1,2)は
記憶されていないので、PROC3(k,1,2)を実行
する。 PROC3(k,1,2):位置番号1の状態リストを取
り出すと[0]である。次に、図4の動作表から状態0
における終了端記号kの状態遷移先を調べる。4が遷移
先状態番号であることがわかるので、リストL=[4]
とする。L中の状態番号4に対して、2を開始位置番号
とする状態遷移先を動作表から調べる。状態4におい
て、非終端記号oとuへの遷移が可能であるので、状態
番号4を位置番号2の状態リストに記録する。また、入
力部7に(k,2,3)を、別の入力部に(u,2,3)を記
憶する。
【0032】Lの状態番号4に対して、終端記号oまた
はuが次に来る場合に適用できる文法番号を動作表から
調べるとないので、PROC3の手続き4におけるRL
は空リスト[ ]になる。ここまでで変数Ret=1であ
るのでPROC3(k,1,2)を成功して終了し、PR
OC2(k,1,2)に戻る。 PROC2(k,1,2):(k,1,2)をチャート部5に
記憶し、成功して終了し、PROC1に戻る。ここまで
の状態を図14に示す。
【0033】以下、同様に処理を進めると、最終的に記
号列/okure/,/koreokure/,/ku
re/などが入力部に記憶される。これらの記号列の情
報から対応する、音素辞書パタンを選択し連結する。そ
の後、連結した辞書パタンと入力音声の特徴量とをDP
マッチングなどよく知られた方法によって照合し、最も
類似した連結パタンに対応する音素記号列を認識結果と
する。辞書パタンの代わりに、HMMや神経回路網によ
って各音素の特徴をモデル化したものを用いてもかまわ
ない。
【0034】図15は、本発明による連続音声認識方式
の他の実施例を説明するための構成図で、図中、12は
照合スコア蓄積部、13は枝刈り部で、その他、図1と
同じ作用をする部分は同一の符号を付してある。解析途
中の照合結果によって枝刈りを行い、照合範囲を狭くす
ることができる。従って、より高速な認識を行うことが
できる。図15の解析部のアルゴリズムには、図7の代
わりに図16を用いる。すなわち、図7では全ての解析
を終了した後に照合を行ったのに対し、図16では、手
続き4が示すように終端記号を持つ組がチャート部に記
録されるたびに、その終端記号を出力する。
【0035】照合スコア蓄積部12には解析部6から既
に出力された記号列の照合スコアと、そのスコアを算出
した時点での入力音声のフレーム番号を記憶しておく。
その後、照合スコア蓄積部12の情報により、解析部6
から新たに出力された終端記号に対応する辞書パタンの
照合開始フレームを決定する。開始フレームからの照合
スコアを蓄積部のスコアに加え、認識候補の照合スコア
を更新する。現時点までの全ての候補のスコアを枝刈り
部に送り、候補の数がある所定の数より多くなった場合
にはスコアの低い候補を蓄積部から除外する。この操作
を繰り返し、最終的に全ての解析を終了した候補の中か
ら最も高いスコアをもつものを認識結果として出力す
る。
【0036】図17は、本発明による連続音声認識方式
のさらに他の実施例を説明するための構成図で、図中、
14は音声記号記憶部で、その他、図1と同じ作用をす
る部分は同一の符号を付してある。図17に示す実施例
は、図1に音声記号記憶部14を加えたものである。音
声記号記憶部14では過去に解析部が出力した記号を現
在から(N−1)個前まで記憶しておく。これによっ
て、N個の音素によって過去の環境を考慮しているよう
なパタン辞書に対して照合命令を出すことができる。例
えば、/akai/という記号列が解析部から出力さ
れ、N=2の記憶部をもっているとすれば、辞書パタン
は順に/−a/,/ak/,/ka/,/ai/を表す
辞書パタンを順に照合することになる。このような環境
を考慮したパタン辞書を照合することで、認識精度を高
めることができる。なお、図17に示した音声記号記憶
部14は図15の実施例にも実現することができる。
【0037】
【発明の効果】以上の説明から明らかなように、本発明
によると、以下のような効果がある。 (1)請求項1〜3に対応する効果:終端記号と2つの
位置番号とを記憶する入力部と、終端記号または非終端
記号を記憶するチャート部と、文脈自由文法を記憶する
文法部と、LR表を記憶する動作表部とを設け、特定の
類を未知入力音声の照合対象として導出するようにした
ので、機構が単純で、記憶量が小さく、効率的な構文解
析が可能となる。その結果、音声認識の精度を保ったま
ま、照合範囲を小さくすることができ、高速な連続音声
認識を実現することができる。 (2)請求項4〜6に対応する効果:終端記号と2つの
位置番号とを記憶する入力部と、終端記号または非終端
記号を記憶するチャート部と、文脈自由文法を記憶する
文法部と、LR表を記憶する動作表部と、音声記号記憶
部とを設け、特定の類を未知入力音声の照合対象として
導出し、連接するようにしたので、機構が単純で、記憶
量が小さく、効率的な構文解析が可能となる。その結
果、音声認識の精度を保ったまま、照合範囲を小さくす
ることができ、高速な連続音声認識を実現することがで
きる。
【図面の簡単な説明】
【図1】 本発明による連続音声認識方式の一実施例を
説明するための構成図である。
【図2】 図1における入力部の例を示す図である。
【図3】 図1における文法部の例を示す図である。
【図4】 図1における動作表部の例を示す図である。
【図5】 図1におけるチャート部の例を示す図であ
る。
【図6】 図1における状態リスト部の例を示す図であ
る。
【図7】 本発明におけるアルゴリズムPROC1を示
す図である。
【図8】 本発明におけるアルゴリズムPROC2(X,
B,E)を示す図である。
【図9】 本発明におけるアルゴリズムPROC3(X,
B,E)を示す図である。
【図10】 本発明における最初の終端記号/k/の解
析が終了した状態を示す図である。
【図11】 本発明における終端記号/kor/までの
解析が終了した状態を示す図である。
【図12】 本発明における終端記号/kore/まで
の解析が終了した状態を示す図である。
【図13】 本発明における入力記号列が受理された状
態を示す図である。
【図14】 本発明における複数の記号を解析している
状態を示す図である。
【図15】 本発明による連続音声認識方式の他の実施
例を説明するための構成図である。
【図16】 本発明におけるアルゴリズムPROC1′
を示す図である。
【図17】 本発明による連続音声認識方式の更に他の
実施例を説明するための構成図である。
【符号の説明】
1…フィルタバンク、2…照合部、3…文法部、4…状
態リスト部、5…チャート部、6…解析部、7…入力
部、8…動作表部、9…パタン辞書、10…パタン連続
部、11…判定部、12…照合スコア蓄積部、13…枝
刈り部、14…音声記号記憶部。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−86946(JP,A) 特開 平2−113297(JP,A) 特開 昭60−73698(JP,A) 特開 平6−118989(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 15/18

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声の特徴量を抽出する特徴量抽出
    手段と、音声記号列を文法により解析する構文解析手段
    と、入力音声が属する類を決定する照合手段とを備えて
    認識結果を得る連続音声認識方式において、終端記号と
    2つの位置番号とを記憶する入力部と、終端記号または
    非終端記号を記憶するチャート部と、文脈自由文法を記
    憶する文法部と、LR表を記憶する動作表部とを設け、
    特定の類を未知入力音声の照合対象として導出すること
    を特徴とする連続音声認識方式。
  2. 【請求項2】 前記終端記号と2つの位置番号とを記憶
    する入力部と、終端記号または非終端記号を記憶するチ
    ャート部と、文脈自由文法を記憶する文法部と、LR表
    を記憶する動作表部とを設け、特定の類を未知入力音声
    の照合対象として導出し、文として受理された後に類に
    対応する音声記号列を照合部で照合することを特徴とす
    る請求項1記載の連続音声認識方式。
  3. 【請求項3】 前記終端記号と2つの位置番号とを記憶
    する入力部と、終端記号または非終端記号を記憶するチ
    ャート部と、文脈自由文法を記憶する文法部と、LR表
    を記憶する動作表部と照合スコア蓄積部とを設け、特定
    の類を未知入力音声の照合対象として導出する度に類に
    対応する辞書パタンを照合部で照合することを特徴とす
    る請求項1記載の連続音声認識方式。
  4. 【請求項4】 入力音声の特徴量を抽出する特徴量抽出
    手段と、音声記号列を文法により解析する構文解析手段
    と、入力音声が属する類を決定する照合手段とを備えて
    認識結果を得る連続音声認識方式において、終端記号と
    2つの位置番号とを記憶する入力部と、終端記号または
    非終端記号を記憶するチャート部と、文脈自由文法を記
    憶する文法部と、LR表を記憶する動作表部と、音声記
    号記憶部とを設け、特定の類を未知入力音声との照合対
    象として導出し、連接することを特徴とする連続音声認
    識方式。
  5. 【請求項5】 前記終端記号と2つの位置番号とを記憶
    する入力部と、終端記号または非終端記号を記憶するチ
    ャート部と、文脈自由文法を記憶する文法部と、LR表
    を記憶する動作表部と、音声記号記憶部とを設け、特定
    の類を未知入力音声の照合対象として導出し、連接し、
    文として受理された後に類の連接に対応する音声記号列
    を照合部で照合することを特徴とする請求項4記載の連
    続音声認識方式。
  6. 【請求項6】 前記終端記号と2つの位置番号とを記憶
    する入力部と、終端記号または非終端記号を記憶するチ
    ャート部と、文脈自由文法を記憶する文法部と、LR表
    を記憶する動作表部と、音声記号記憶部と、照合スコア
    蓄積部とを設け、特定の類を未知入力音声の照合対象と
    して導出し、連接する度に類の連接に対応する音声記号
    を照合部で照合することを特徴とする請求項4記載の連
    続音声認識方式。
JP16196194A 1994-07-14 1994-07-14 連続音声認識方式 Expired - Fee Related JP3355248B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16196194A JP3355248B2 (ja) 1994-07-14 1994-07-14 連続音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16196194A JP3355248B2 (ja) 1994-07-14 1994-07-14 連続音声認識方式

Publications (2)

Publication Number Publication Date
JPH0830291A JPH0830291A (ja) 1996-02-02
JP3355248B2 true JP3355248B2 (ja) 2002-12-09

Family

ID=15745366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16196194A Expired - Fee Related JP3355248B2 (ja) 1994-07-14 1994-07-14 連続音声認識方式

Country Status (1)

Country Link
JP (1) JP3355248B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7054813B2 (en) 2002-03-01 2006-05-30 International Business Machines Corporation Automatic generation of efficient grammar for heading selection

Also Published As

Publication number Publication date
JPH0830291A (ja) 1996-02-02

Similar Documents

Publication Publication Date Title
US7676365B2 (en) Method and apparatus for constructing and using syllable-like unit language models
JP5040909B2 (ja) 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム
US6385579B1 (en) Methods and apparatus for forming compound words for use in a continuous speech recognition system
US5878390A (en) Speech recognition apparatus equipped with means for removing erroneous candidate of speech recognition
US7590533B2 (en) New-word pronunciation learning using a pronunciation graph
EP0978823B1 (en) Speech recognition
Jelinek et al. 25 Continuous speech recognition: Statistical methods
Bahl et al. A method for the construction of acoustic Markov models for words
EP1444686B1 (en) Hmm-based text-to-phoneme parser and method for training same
EP1126438B1 (en) Speech recognizer and speech recognition method
Ney Dynamic programming speech recognition using a context-free grammar
Ney et al. An overview of the Philips research system for large vocabulary continuous speech recognition
EP1111587B1 (en) Speech recognition device implementing a syntactic permutation rule
Ney et al. Dynamic programming search strategies: From digit strings to large vocabulary word graphs
Evermann Minimum word error rate decoding
JP3364631B2 (ja) 統計的言語モデル生成装置及び音声認識装置
JP3355248B2 (ja) 連続音声認識方式
JP3027557B2 (ja) 音声認識方法及び装置、並びに音声認識処理プログラムを記録した記録媒体
JP2000259176A (ja) 音声認識装置およびその記録媒体
JP3042455B2 (ja) 連続音声認識方式
CN113284487B (zh) 基于语音识别结果的匹配方法
JP2905686B2 (ja) 音声認識装置
JP2968792B1 (ja) 統計的言語モデル生成装置及び音声認識装置
EP0469485B1 (en) Language processing system using an expanded LR parser
JP3535688B2 (ja) 音声認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090927

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090927

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100927

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110927

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120927

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130927

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees