JP3355248B2 - 連続音声認識方式 - Google Patents
連続音声認識方式Info
- Publication number
- JP3355248B2 JP3355248B2 JP16196194A JP16196194A JP3355248B2 JP 3355248 B2 JP3355248 B2 JP 3355248B2 JP 16196194 A JP16196194 A JP 16196194A JP 16196194 A JP16196194 A JP 16196194A JP 3355248 B2 JP3355248 B2 JP 3355248B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- storing
- symbol
- grammar
- terminal symbol
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Devices For Executing Special Programs (AREA)
- Machine Translation (AREA)
Description
し、より詳細には、入力音声の特徴量を抽出し、音声記
号列を文法により解析し、入力音声が属する類を決定し
て認識結果を得る連続音声認識方式に関する。
まず、音声データを分析し、特徴量に変換した後に、あ
らかじめ認識対象語となる音声パタンを辞書に登録して
おく。次に、認識時には、マイクなどによって入力され
た未知の音声パタンを同じく分析し、特徴量に変換す
る。その後、前述の辞書と照合し、最も類似した辞書パ
タンに対応する語を認識結果として出力する。連続音声
認識の場合は、独立単語認識のように一発声に対して一
つの辞書パタンを作成することは実用的ではない。例え
ば、連続数字認識で、“4533”と発声した場合を考
えてみる。照合時に“4533”を始めあらゆる4桁の
数字の辞書パタンと照合するよりも“4”,“5”,
“3”などのような一つの数字単位の辞書パタンを連結
して照合した方が辞書の容量を縮小できる。これは桁数
が増えれば増えるほどその差が顕著となる。
認識は入力音声長のばらつきが大きくなる。そこで、対
策として短い単語や音素の単位で辞書パタンを登録して
おき、「確率モデルによる音声認識」(中川著,電子情
報通信学会,1988.)などに詳述される2段DP
(Dynamic Programming)法、レベ
ルビルディング法、One−Pass DP法などを用
いて認識を行う。ところが、音素単位など単語に比べて
小さな単位を辞書パタンとする認識方式は辞書の容量を
小さくできるが発声の変動に弱く、認識率は低くなる。
このため、辞書の代わりに音声パタンを高精度にかつ効
率よくモデル化するために隠れマルコフモデル(HM
M:Hidden Markov Model)や神経
回路網を用いる方式がある。これら認識方式は前述の文
献や、「自動翻訳電話」(ATR編、オーム社,199
4.)に詳述されている。
声認識方式では、音素単位などの辞書パタンを連結して
認識対象の音声パタンと照合するのであるが、連結時に
何も情報がないと、連結時の組合せの対象が登録されて
いる全てのパタンに関わる。従って、認識の照合範囲が
広がり、認識率の低下や照合時間が長くなるという問題
点がある。そこで、文脈自由文法などから得られる言語
的な情報を用いて、発話された文がどのようなものであ
るかを解析し、照合すべき辞書パタンを限定する方法が
ある。例えば、特開平2−113297号公報に記載の
「連続音声認識装置」や特開平4−86946号公報に
記載の「拡張LRパーザによる文認識方式」に記載され
ている。これらは、類を認識するモデルとLRアルゴリ
ズムを統合化し、音声認識照合範囲を狭くしている。
ht Right most derivation)
アルゴリズムではグラフ構造化スタップと呼ばれるデー
タ構造を用いるため、機構が複雑になるという問題があ
る。また、このデータ構造の記憶量が解析実行時に無視
できないほど増大してしまう問題がある。また、認識対
象の語の種類により、データを頻繁に生成消去すること
もあり、処理時間効率が低下するという問題があった。
ルコフ網の自動生成」(鷹見著,電子情報通信学会論文
誌、Vol.J76−DII,No.10,pp.21
55−2164,1993−10.)に報告されている
ように、HMMをさらに高精度化するため、音素単位で
はなく当該音素の環境を考慮するようにモデル(例え
ば、/aka/と発声された音声の/k/を認識するの
に/k/に対応するHMMではなく、kの前後にaがあ
るという情報をもった/a−k−a/というHMMを用
いる)が提案されている。この方式によれば、照合すべ
きHMMの数が多くなるために上記問題はさらに深刻と
なる。
たもので、機構が単純で、記憶量の小さい構文解析部に
より、音声認識の照合範囲を小さくし、高速な照合をす
ることができる連続音声認識方式を提供することを目的
としている。
成するために、(1)入力音声の特徴量を抽出する特徴
量抽出手段と、音声記号列を文法により解析する構文解
析手段と、入力音声が属する類を決定する照合手段とを
備えて認識結果を得る連続音声認識方式において、終端
記号と2つの位置番号とを記憶する入力部と、終端記号
または非終端記号を記憶するチャート部と、文脈自由文
法を記憶する文法部と、LR表を記憶する動作表部とを
設け、特定の類を未知入力音声の照合対象として導出す
ること、更には、(2)前記終端記号と2つの位置番号
とを記憶する入力部と、終端記号または非終端記号を記
憶するチャート部と、文脈自由文法を記憶する文法部
と、LR表を記憶する動作表部とを設け、特定の類を未
知入力音声の照合対象として導出し、文として受理され
た後に類に対応する音声記号列を照合部で照合するこ
と、更には、(3)前記終端記号と2つの位置番号とを
記憶する入力部と、終端記号または非終端記号を記憶す
るチャート部と、文脈自由文法を記憶する文法部と、L
R表を記憶する動作表部と照合スコア蓄積部とを設け、
特定の類を未知入力音声の照合対象として導出する度に
類に対応する辞書パタンを照合部で照合すること、或い
は、(4)入力音声の特徴量を抽出する特徴量抽出手段
と、音声記号列を文法により解析する構文解析手段と、
入力音声が属する類を決定する照合手段とを備えて認識
結果を得る連続音声認識方式において、終端記号と2つ
の位置番号とを記憶する入力部と、終端記号または非終
端記号を記憶するチャート部と、文脈自由文法を記憶す
る文法部と、LR表を記憶する動作表部と、音声記号記
憶部とを設け、特定の類を未知入力音声との照合対象と
して導出し、連接すること、更には、(5)前記(4)
において、前記終端記号と2つの位置番号とを記憶する
入力部と、終端記号または非終端記号を記憶するチャー
ト部と、文脈自由文法を記憶する文法部と、LR表を記
憶する動作表部と、音声記号記憶部とを設け、特定の類
を未知入力音声の照合対象として導出し、連接し、文と
して受理された後に類の連接に対応する音声記号列を照
合部で照合すること、更には、(6)前記(4)におい
て、前記終端記号と2つの位置番号とを記憶する入力部
と、終端記号または非終端記号を記憶するチャート部
と、文脈自由文法を記憶する文法部と、LR表を記憶す
る動作表部と、音声記号記憶部と、照合スコア蓄積部と
を設け、特定の類を未知入力音声の照合対象として導出
し、連接する度に類の連接に対応する音声記号を照合部
で照合することを特徴としたものである。
は、 (1)入力音声の特徴量を抽出する手段と、音声記号列
を文法により解析する構文解析手段と、入力音声が属す
る類を決定する照合手段とを備え、認識結果を得る連続
音声認識装置において、終端記号と2つの位置番号とを
記憶する入力部と、終端記号または非終端記号を記憶す
るチャート部と、文脈自由文法を記憶する文法部と、L
R表を記憶する動作表部とを設けることにより、特定の
類を未知入力音声の照合対象として導出するので、機構
が単純で、記憶量が小さく、効率的な構文解析が可能と
なる。その結果、音声認識の精度を保ったまま、照合範
囲を小さくすることができ、高速な連続音声認識を実現
することができる。また、(2)終端記号と2つの位置
番号とを記憶する入力部と、終端記号または非終端記号
を記憶するチャート部と、文脈自由文法を記憶する文法
部と、LR表を記憶する動作表部と、音声記憶部とを設
けることにより、特定の類を未知入力音声との照合対象
として導出し、連接するので、(1)と同様に高速な連
続音声認識を実現することができる。
する。図1は、本発明による連続音声認識方式の一実施
例を説明するための構成図で、図中、1はフィルタバン
ク、2は照合部、3は文法部、4は状態リスト部、5は
チャート部、6は解析部、7は入力部、8は動作表部、
9はパタン辞書、10はパタン連続部、11は判定部で
ある。
し、解析部6は音声記号列を文法により解析する。照合
部2は入力音声が属する類を決定する。入力部7は終端
記号と2つの位置番号とを記憶し、チャート部5は終端
記号又は非終端記号を記憶し、文法部3は文脈自由文法
を記憶する。また、動作表部8はLR表を記憶する。こ
のような構成により、特定の類を未知入力音声の照合対
象として導出する。
にフィルタバンク1に入力される。周波数分析は、通常
1フレームあたり、3msec〜30msec程度の間隔で行わ
れる。また、フィルタバンク1はいくつかのバンドパス
フィルタによって構成されたものであり、通常は、8〜
32個程度使用される。分析手法として周波数分析を用
いているが、「音声認識」(新美著,共立出版,197
9.)などで詳述されているようなLPC(Linear Predi
ctive Coding:線形予測分析法)分析をはじめ、どのよ
うな音響分析手法を用いてもよい。
構文解析は次のように動作する。ここでは、どの類を照
合すればよいかを判断し、特定の類に対する照合指令を
照合部2へ送る。まず、動作を詳しく説明するために、
照合する類はあらかじめわかっているものとして説明
し、その後、実際に照合すべき類を導出する様子を説明
する。まず、例として、図2に示すように、/kore
okure/という記号列が既に入力部7に与えられて
いる場合の解析の様子を示す。図中の開始位置番号と
は、終端記号に対応する音素の開始位置を表している。
終了位置番号とは、同様に当該音素の終了位置を表す。
おく。終端記号を小文字で表し、それぞれ音素の類を表
す。ここでは終端記号、すなわち、導出する類を音素に
しているが、単語をはじめどのような類を採用してもか
まわない。文法から得られる動作表を図4に示すように
記憶する。図4の内容は、「Compilers-Principles,Tec
hniques,and Tools」(A.V.Aho他、Addison-Wesley,19
86)などに詳述されるLR解析表と同じで、ACTIO
N部とGOTO部とから成り立っている。動作には、状
態の遷移、文法の適用、受理、誤りの4種類がある。
移動作であり、rで始まるものが文他の適用動作であ
る。図中、空欄であるものは誤りであることを示してい
る。図4では、ACTION部の状態Oでoとkとにそ
れぞれs3,s4という状態遷移動作が記されている
が、これは次の入力がoであれば状態3へ、kであれば
状態4へ進むことを示している。状態20では、$にr
8という文法に適読動作が与えられている。これは、記
号の終りであれば8番目の文法を適用することを示して
いる。$は最後を表す終端記号で文の最後の位置に設定
される。
力部7に記憶されている終端記号を先頭から1つずつ取
り出し、図7〜図9に示すアルゴリズムを適用し、その
結果を図5に示すチャート部と図6に示す状態リスト部
4に記憶する。最終的に受理の動作を行えばその文は正
しいことになる。また、チャート部には文法で正しいと
規定された全ての句構造が記録される。
番号を格納する。開始状態番号を0とする。最初の終端
記号、開始位置番号、終了位置番号はそれぞれk,1,2
であるので、PROC2(k,1,2)を行う。 PROC2(k,1,2):チャート部5に(k,1,2)は記
憶されていないので、PROC3(k,1,2)を行う。
リストを取り出する[0]である。次に、図4の動作表
から状態0における終端記号kの状態遷移先を調べる。
4が遷移先状態番号であることがわかるので、リストL
=[4]とする。L中の状態番号4に対して、2を開始
位置番号とする入力部の終端記号oの状態遷移先を動作
表から調べる。状態4において、状態遷移が可能である
ので、状態番号4を位置番号2の状態リストに記録す
る。
に来る場合に適用できる文法番号を動作表から調べると
ないので、PROC3の手続き4におけるRLは空リス
ト[]になる。ここまでで変数Ret=1であるのでPR
OC3(k,1,2)を成功して終了し、PROC2(k,
1,2)に戻る。
ート部5に記憶し、成功して終了し、PROC1に戻
る。ここまでの状態を図10に示す。入力部の組(r,
3,4)までは、上記と同様に解析が進む。ここまでの状
態を図11に示す。
実行する。 PROC1:次の組(e,4,5)を取り出し、PROC2
(e,4,5)を行う。 PROC2(e,4,5):チャート部5に(e,4,5)は記
憶されていないので、PROC3(e,4,5)を実行す
る。 PROC3(e,4,5):位置番号4の状態リストを取り
出すと[15]である。次に、動作表から状態15にお
ける終端記号eの状態遷移先を調べる。18が遷移先状
態番号であることがわかるので、リストL=[18]と
する。L中の状態番号18に対して、5を開始位置番号
とする入力部7の終端記号oの状態遷移先を動作表から
調べる。oに対応する動作はr5なので状態遷移は不可
能である。
[5]とする。リストRL中の文法番号5を文法部3か
ら取り出すと(N,[kore])である。右辺の最右要素を
除いたRh′は[kor]である。Rh′の最左要素である
[k]と、現在記憶されているチャート部5の句構造と
を、文頭方向に向かって照合する。チャート部5の
(k,1,2)と照合するので、PROC2(N,1,5)を
実行する。
(N,1,5)は記憶されていないのでPROC3(N,
1,5)を実行する。 PROC3(N,1,5):位置番号1の状態リストを取り
出すと[0]である。次に、動作表から状態0における
非終端記号Nの状態遷移先を調べる。6が遷移先状態番
号であることがわかるので、L=[6]とする。L中の
状態番号6に対して、5を開始位置番号とする入力部7
の終端記号oの状態遷移先を動作表から調べる。oに対
応する動作にa13があるので状態遷移は可能である。
従って、L=[6]を位置番号5の状態リストに記録す
る。
r3も存在するので、RL=[3]とする。リストRL
中の文法番号3を文法部3から取り出すと(NP,
[N])である。右辺の最右要素を除いたRh′は空リス
ト[ ]になるので、PROC2(NP,1,5)を実行す
る。
(NP,1,5)は記憶されていないので、PROC3
(NP,1,5)を実行する。 PROC3(NP,1,5):位置番号1の状態リストを取
り出すと[0]である。次に、動作表から状態0におけ
る非終端記号NPの状態遷移先を調べる。5が遷移先状
態番号であることがわかるので、L=[5]とする。L
中の状態番号5に対して、5を開始位置番号とする入力
部7の終端記号oの状態遷移先を動作表から調べる。o
に対応する動作にs3があるので状態遷移は可能であ
る。従って、L=[5]を位置番号5の状態リストに記
録する。ここまでで、Ret=1なので成功して終了し、
PROC2(NP,1,5)に戻る。
(NP,1,5)を記憶し、成功して終了し、PROC3
(N,1,5)に戻る。 PROC3(N,1,5):Ret=1なので成功して終了
し、PROC2(N,1,5)に戻る。 PROC2(N,1,5):チャート部5に(N,1,5)を
記憶し、PROC3(e,4,5)に戻る。 PROC3(e,4,5):Ret=1なので成功して終了
し、PROC2(e,4,5)に戻る。 PROC2(e,4,5):チャート部5に(e,4,5)を
記憶し、成功して終了し、PROC1に戻る。 ここまでで図12に示すように/kore/までの解析
が進む。
受理され、図13になる。そして記号列/koreok
ure/を出力する。以上が解析部6の動作である。前
述の説明において、解析部6の動作が複雑になるのを避
けるために、照合部2に導出するべき類が一つに決まっ
ているものと仮定した。しかし、動作表中の状態遷移は
複数の類に存在することがほとんどである。その場合の
動作を前述の例を用いて説明する。
番号を格納する。開始状態番号を0とする。この状態番
号から遷移が可能な終端記号は、oとkである。従っ
て、入力部7に(0,1,2)、別の入力部に(k,1,
2)を記憶する。PROC2(o,1,2)とPROC2
(k,1,2)とが発生し、それぞれ独立に処理を進めて
いく。 PROC2(o,1,2):チャート部に(o,1,2)は記
憶されていないので、PROC3(o,1,2)を実行す
る。
態リストを取り出すと[0]である。次に、図4の動作
表から状態0における終端記号oの状態遷移先を調べ
る。3が遷移先状態番号であることがわかるので、リス
トL=[3]とする。L中の状態番号3に対して、2を
開始位置番号とする状態遷移先を動作表から調べる。状
態3において非終端記号kへの遷移が可能であるので、
状態番号3を位置番号2の状態リストに記録する。ま
た、入力部7に(k,2,3)を記憶する。
に来る場合に適用できる文法番号を動作表から調べると
ないので、PROC3の手続き4におけるRLは空リス
ト[ ]になる。ここまでで変数Ret=1であるのでP
ROC3(o,1,2)を成功して終了し、PROC2
(o,1,2)に戻る。
ャート部5に記憶し、成功して終了し、PROC1に戻
る。 PROC2(k,1,2):チャート部5に(k,1,2)は
記憶されていないので、PROC3(k,1,2)を実行
する。 PROC3(k,1,2):位置番号1の状態リストを取
り出すと[0]である。次に、図4の動作表から状態0
における終了端記号kの状態遷移先を調べる。4が遷移
先状態番号であることがわかるので、リストL=[4]
とする。L中の状態番号4に対して、2を開始位置番号
とする状態遷移先を動作表から調べる。状態4におい
て、非終端記号oとuへの遷移が可能であるので、状態
番号4を位置番号2の状態リストに記録する。また、入
力部7に(k,2,3)を、別の入力部に(u,2,3)を記
憶する。
はuが次に来る場合に適用できる文法番号を動作表から
調べるとないので、PROC3の手続き4におけるRL
は空リスト[ ]になる。ここまでで変数Ret=1であ
るのでPROC3(k,1,2)を成功して終了し、PR
OC2(k,1,2)に戻る。 PROC2(k,1,2):(k,1,2)をチャート部5に
記憶し、成功して終了し、PROC1に戻る。ここまで
の状態を図14に示す。
号列/okure/,/koreokure/,/ku
re/などが入力部に記憶される。これらの記号列の情
報から対応する、音素辞書パタンを選択し連結する。そ
の後、連結した辞書パタンと入力音声の特徴量とをDP
マッチングなどよく知られた方法によって照合し、最も
類似した連結パタンに対応する音素記号列を認識結果と
する。辞書パタンの代わりに、HMMや神経回路網によ
って各音素の特徴をモデル化したものを用いてもかまわ
ない。
の他の実施例を説明するための構成図で、図中、12は
照合スコア蓄積部、13は枝刈り部で、その他、図1と
同じ作用をする部分は同一の符号を付してある。解析途
中の照合結果によって枝刈りを行い、照合範囲を狭くす
ることができる。従って、より高速な認識を行うことが
できる。図15の解析部のアルゴリズムには、図7の代
わりに図16を用いる。すなわち、図7では全ての解析
を終了した後に照合を行ったのに対し、図16では、手
続き4が示すように終端記号を持つ組がチャート部に記
録されるたびに、その終端記号を出力する。
に出力された記号列の照合スコアと、そのスコアを算出
した時点での入力音声のフレーム番号を記憶しておく。
その後、照合スコア蓄積部12の情報により、解析部6
から新たに出力された終端記号に対応する辞書パタンの
照合開始フレームを決定する。開始フレームからの照合
スコアを蓄積部のスコアに加え、認識候補の照合スコア
を更新する。現時点までの全ての候補のスコアを枝刈り
部に送り、候補の数がある所定の数より多くなった場合
にはスコアの低い候補を蓄積部から除外する。この操作
を繰り返し、最終的に全ての解析を終了した候補の中か
ら最も高いスコアをもつものを認識結果として出力す
る。
のさらに他の実施例を説明するための構成図で、図中、
14は音声記号記憶部で、その他、図1と同じ作用をす
る部分は同一の符号を付してある。図17に示す実施例
は、図1に音声記号記憶部14を加えたものである。音
声記号記憶部14では過去に解析部が出力した記号を現
在から(N−1)個前まで記憶しておく。これによっ
て、N個の音素によって過去の環境を考慮しているよう
なパタン辞書に対して照合命令を出すことができる。例
えば、/akai/という記号列が解析部から出力さ
れ、N=2の記憶部をもっているとすれば、辞書パタン
は順に/−a/,/ak/,/ka/,/ai/を表す
辞書パタンを順に照合することになる。このような環境
を考慮したパタン辞書を照合することで、認識精度を高
めることができる。なお、図17に示した音声記号記憶
部14は図15の実施例にも実現することができる。
によると、以下のような効果がある。 (1)請求項1〜3に対応する効果:終端記号と2つの
位置番号とを記憶する入力部と、終端記号または非終端
記号を記憶するチャート部と、文脈自由文法を記憶する
文法部と、LR表を記憶する動作表部とを設け、特定の
類を未知入力音声の照合対象として導出するようにした
ので、機構が単純で、記憶量が小さく、効率的な構文解
析が可能となる。その結果、音声認識の精度を保ったま
ま、照合範囲を小さくすることができ、高速な連続音声
認識を実現することができる。 (2)請求項4〜6に対応する効果:終端記号と2つの
位置番号とを記憶する入力部と、終端記号または非終端
記号を記憶するチャート部と、文脈自由文法を記憶する
文法部と、LR表を記憶する動作表部と、音声記号記憶
部とを設け、特定の類を未知入力音声の照合対象として
導出し、連接するようにしたので、機構が単純で、記憶
量が小さく、効率的な構文解析が可能となる。その結
果、音声認識の精度を保ったまま、照合範囲を小さくす
ることができ、高速な連続音声認識を実現することがで
きる。
説明するための構成図である。
る。
る。
す図である。
B,E)を示す図である。
B,E)を示す図である。
析が終了した状態を示す図である。
解析が終了した状態を示す図である。
の解析が終了した状態を示す図である。
態を示す図である。
状態を示す図である。
例を説明するための構成図である。
を示す図である。
実施例を説明するための構成図である。
態リスト部、5…チャート部、6…解析部、7…入力
部、8…動作表部、9…パタン辞書、10…パタン連続
部、11…判定部、12…照合スコア蓄積部、13…枝
刈り部、14…音声記号記憶部。
Claims (6)
- 【請求項1】 入力音声の特徴量を抽出する特徴量抽出
手段と、音声記号列を文法により解析する構文解析手段
と、入力音声が属する類を決定する照合手段とを備えて
認識結果を得る連続音声認識方式において、終端記号と
2つの位置番号とを記憶する入力部と、終端記号または
非終端記号を記憶するチャート部と、文脈自由文法を記
憶する文法部と、LR表を記憶する動作表部とを設け、
特定の類を未知入力音声の照合対象として導出すること
を特徴とする連続音声認識方式。 - 【請求項2】 前記終端記号と2つの位置番号とを記憶
する入力部と、終端記号または非終端記号を記憶するチ
ャート部と、文脈自由文法を記憶する文法部と、LR表
を記憶する動作表部とを設け、特定の類を未知入力音声
の照合対象として導出し、文として受理された後に類に
対応する音声記号列を照合部で照合することを特徴とす
る請求項1記載の連続音声認識方式。 - 【請求項3】 前記終端記号と2つの位置番号とを記憶
する入力部と、終端記号または非終端記号を記憶するチ
ャート部と、文脈自由文法を記憶する文法部と、LR表
を記憶する動作表部と照合スコア蓄積部とを設け、特定
の類を未知入力音声の照合対象として導出する度に類に
対応する辞書パタンを照合部で照合することを特徴とす
る請求項1記載の連続音声認識方式。 - 【請求項4】 入力音声の特徴量を抽出する特徴量抽出
手段と、音声記号列を文法により解析する構文解析手段
と、入力音声が属する類を決定する照合手段とを備えて
認識結果を得る連続音声認識方式において、終端記号と
2つの位置番号とを記憶する入力部と、終端記号または
非終端記号を記憶するチャート部と、文脈自由文法を記
憶する文法部と、LR表を記憶する動作表部と、音声記
号記憶部とを設け、特定の類を未知入力音声との照合対
象として導出し、連接することを特徴とする連続音声認
識方式。 - 【請求項5】 前記終端記号と2つの位置番号とを記憶
する入力部と、終端記号または非終端記号を記憶するチ
ャート部と、文脈自由文法を記憶する文法部と、LR表
を記憶する動作表部と、音声記号記憶部とを設け、特定
の類を未知入力音声の照合対象として導出し、連接し、
文として受理された後に類の連接に対応する音声記号列
を照合部で照合することを特徴とする請求項4記載の連
続音声認識方式。 - 【請求項6】 前記終端記号と2つの位置番号とを記憶
する入力部と、終端記号または非終端記号を記憶するチ
ャート部と、文脈自由文法を記憶する文法部と、LR表
を記憶する動作表部と、音声記号記憶部と、照合スコア
蓄積部とを設け、特定の類を未知入力音声の照合対象と
して導出し、連接する度に類の連接に対応する音声記号
を照合部で照合することを特徴とする請求項4記載の連
続音声認識方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16196194A JP3355248B2 (ja) | 1994-07-14 | 1994-07-14 | 連続音声認識方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16196194A JP3355248B2 (ja) | 1994-07-14 | 1994-07-14 | 連続音声認識方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0830291A JPH0830291A (ja) | 1996-02-02 |
JP3355248B2 true JP3355248B2 (ja) | 2002-12-09 |
Family
ID=15745366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16196194A Expired - Fee Related JP3355248B2 (ja) | 1994-07-14 | 1994-07-14 | 連続音声認識方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3355248B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7054813B2 (en) | 2002-03-01 | 2006-05-30 | International Business Machines Corporation | Automatic generation of efficient grammar for heading selection |
-
1994
- 1994-07-14 JP JP16196194A patent/JP3355248B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH0830291A (ja) | 1996-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7676365B2 (en) | Method and apparatus for constructing and using syllable-like unit language models | |
JP5040909B2 (ja) | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム | |
US6385579B1 (en) | Methods and apparatus for forming compound words for use in a continuous speech recognition system | |
US5878390A (en) | Speech recognition apparatus equipped with means for removing erroneous candidate of speech recognition | |
US7590533B2 (en) | New-word pronunciation learning using a pronunciation graph | |
EP0978823B1 (en) | Speech recognition | |
Jelinek et al. | 25 Continuous speech recognition: Statistical methods | |
Bahl et al. | A method for the construction of acoustic Markov models for words | |
EP1444686B1 (en) | Hmm-based text-to-phoneme parser and method for training same | |
EP1126438B1 (en) | Speech recognizer and speech recognition method | |
Ney | Dynamic programming speech recognition using a context-free grammar | |
Ney et al. | An overview of the Philips research system for large vocabulary continuous speech recognition | |
EP1111587B1 (en) | Speech recognition device implementing a syntactic permutation rule | |
Ney et al. | Dynamic programming search strategies: From digit strings to large vocabulary word graphs | |
Evermann | Minimum word error rate decoding | |
JP3364631B2 (ja) | 統計的言語モデル生成装置及び音声認識装置 | |
JP3355248B2 (ja) | 連続音声認識方式 | |
JP3027557B2 (ja) | 音声認識方法及び装置、並びに音声認識処理プログラムを記録した記録媒体 | |
JP2000259176A (ja) | 音声認識装置およびその記録媒体 | |
JP3042455B2 (ja) | 連続音声認識方式 | |
CN113284487B (zh) | 基于语音识别结果的匹配方法 | |
JP2905686B2 (ja) | 音声認識装置 | |
JP2968792B1 (ja) | 統計的言語モデル生成装置及び音声認識装置 | |
EP0469485B1 (en) | Language processing system using an expanded LR parser | |
JP3535688B2 (ja) | 音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080927 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080927 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090927 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090927 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100927 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110927 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120927 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130927 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |