JP3148322B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP3148322B2
JP3148322B2 JP01078692A JP1078692A JP3148322B2 JP 3148322 B2 JP3148322 B2 JP 3148322B2 JP 01078692 A JP01078692 A JP 01078692A JP 1078692 A JP1078692 A JP 1078692A JP 3148322 B2 JP3148322 B2 JP 3148322B2
Authority
JP
Japan
Prior art keywords
time
voice
candidates
preliminary
codebook
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP01078692A
Other languages
English (en)
Other versions
JPH05204396A (ja
Inventor
明雄 天野
浩明 小窪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP01078692A priority Critical patent/JP3148322B2/ja
Publication of JPH05204396A publication Critical patent/JPH05204396A/ja
Application granted granted Critical
Publication of JP3148322B2 publication Critical patent/JP3148322B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声認識装置に関し、特
に認識に要する処理量を低減し応答を速くする方法に関
する。
【0002】
【従来の技術】一般に音声認識には非常に大きな処理量
を要し、実用化に向けては処理量の削減が課題となる。
【0003】音声認識の処理の中で特に大きな処理量を
要するのは、入力音声の特徴ベクトル時系列と標準パタ
ンとの照合を行う照合処理である。通常の認識手法で
は、標準パタン格納部に格納されたすべての標準パタン
と入力音声との照合を行うため、必要な処理量は認識対
象の語彙数に比例する。音声認識に必要な処理量削減の
ためには、照合処理量の削減を考える必要がある。
【0004】処理量削減の手法としては、途中まで計算
して可能性が低いとみなされた候補に関する計算処理は
その段階で打ち切るビームサーチ方式、計算量の少ない
方法を使って予め認識対象の全候補の中から有望な候補
を選択しておき、選択された候補についてのみ照合処理
を行う予備選択方式などが従来から試みられている。
【0005】ビームサーチ方式の例としては、電子情報
通信学会論文誌、D、Vol.J71−D No.9
pp.1650−1659、(1988−9)“フレー
ム同期化、ビームサーチ、ベクトル量子化の統合による
DPマッチングの高速化”あるいは電子情報通信学会論
文誌、D−II、Vol.J72−D−II No.8p
p.1248−1255、(1989−8)“DPビー
ムサーチのしきい値関数の検討”に記載のようなものが
ある。上記両従来例では認識対象語彙数が100語程度
の場合に、標準手法に対して1桁少ない計算量で標準手
法と同等の認識性能が達成されており、その有効性が示
されている。
【0006】一方、予備選択方式の例としては、日本音
響学会講演論文集、1−3−17、(1986−10)
“大語彙単語音声認識のためのスペクトル動特性を用い
た予備選択法”に記載のようなものがある。上記従来例
では、予め認識対象の単語毎にベクトル量子化のコード
ブックを用意しておき、入力音声の終端が検出された後
に入力音声全体を上記各コードブックを用いてそれぞれ
ベクトル量子化する。このときの量子化歪を各コードブ
ック毎に累積し、その累積値がある一定の閾値より小さ
いものだけについて入力音声と照合する。上記文献に記
載の方法を用いてコードブックを作成しておけば、ベク
トル量子化に要する計算量は認識対象の語彙数によらず
にほぼ一定に押さえることができる。したがって全体の
処理量は予備選択によって残った候補の数にほぼ比例
し、予備選択により候補数を十分に少なく絞ることがで
きれば必要な計算量は大幅に削減される。
【0007】
【発明が解決しようとする課題】しかしながら、上記ビ
ームサーチ方式を採用した場合、入力音声の始端を検出
してからしばらくの間は全認識対象候補を計算対象にし
なければならず、認識対象語彙数が多い場合には所要処
理量が多くなり、これにより結果的に応答が遅くなって
しまうという問題があった。
【0008】他方、上記予備選択法では、入力音声の終
端が検出された後に標準パタンとの照合が開始されるた
め、認識結果は入力音声の終端が検出され、照合処理が
終了した後でないと得られず、結果として、照合処理の
削減はなされるものの、応答は遅くなってしまうという
問題があった。
【0009】本発明の目的は、上記従来技術において考
慮が不十分であった応答の高速化の課題を解決すること
にある。
【0010】
【課題を解決するための手段】本発明による音声認識方
法は、計算量の少ない方法を使って予め認識対象の全候
補の中から有望な候補を選択しておき、選択された候補
についてのみ照合処理を行う予備選択方式を用いた音声
認識方法において、入力音声の特徴ベクトルを一定時間
間隔で求め、該一定時間間隔で入力音声の特徴ベクトル
が得られる毎に予備選択処理を行い、該予備選択処理に
より得られた予備選択候補の数を監視し、この数が予め
設定した数を下まわった時点で照合処理を開始するよう
にしたものである。
【0011】本発明による音声認識装置は、音声を入力
する音声入力手段と、該音声入力手段により入力された
音声を一定時間ごとに分析して特徴ベクトルを一定時間
ごとに出力する音声分析手段と、該音声分析手段から出
力された特徴ベクトルを一定時間長分蓄積するバッファ
メモリと、予め認識の基準となる標準パタンを格納して
おく標準パタン格納手段と、前記バッファメモリに蓄積
された特徴ベクトルの時系列を用いて認識対象の全候補
の中から有効な候補を選択する予備選択手段と、該予備
選択手段により選択された前記標準パタン格納手段に格
納された標準パタンと入力音声の特徴ベクトルの時系列
とを照合する照合手段とを備え、前記予備選択手段は、
選択により残された候補の数を監視し、該候補の数が予
め定めた一定数よりも少なくなった時点で前記照合手段
を起動するようにしたものである。
【0012】
【作用】本発明によれば、入力音声の終端が検出される
前に、当該時点までに得られた入力情報に基づいて予備
選択処理を開始する。この予備選択処理により、候補が
しぼられていき、予め定めた一定数を下まわった時点で
照合処理を開始する。したがって、入力音声の終端が検
出されるのを待つことなく、照合を始めることができ、
応答の遅れを最小限に押さえることができる。
【0013】また、後述するように、予備選択に用いる
コードブックを音声の時間構造を考慮して構成すること
により、候補数の削減の程度を大きくして、かつ、予備
選択の精度を向上させることができる。
【0014】
【実施例】以下、図を用いて本発明の実施例を説明す
る。
【0015】図1は本発明の音声認識装置の一実施例を
示すブロック図である。この音声認識装置は、音声入力
手段1、音声分析手段2、バッファメモリ3、予備選択
手段4、標準パタン格納手段5、照合手段6、および判
定手段7からなる。
【0016】図1の音声認識装置において、入力された
音声は音声入力手段1において電気信号に変換される。
電気信号に変換された音声はさらに音声分析手段2にお
いて分析され、特徴ベクトルの時系列に変換される。こ
の特徴ベクトルの時系列は、図7に示すように、単位時
間(10〜20ms)間隔の入力音声ごとにその周波数
特性を求めたものである。この1単位時間をフレームと
呼ぶ。通常、1音素は、100〜300msであり、複
数のフレームからなる。音声分析手段2から出力された
特徴ベクトルの時系列はバッファメモリ3に一時的に蓄
積される。
【0017】予備選択手段4では、バッファメモリ3の
内容を参照して標準パタン格納手段5に格納されている
認識対象全候補に対して尤もらしさの計算を行い、この
尤もらしさの度合いがある一定値を越えた候補が何れで
あるかの情報を標準パタン格納手段5に送る。予備選択
手段4は、前記尤もらしさの度合いが一定値以上の候補
の個数がいくつあるかを常に監視し、これがある一定の
値を下回ったときに照合手段6に起動をかける。なお実
際には、候補の個数の監視は、尤もらしさの度合いが一
定値に満たないものを順次除外していき、除外されない
候補の個数を監視することにより行われる。予備選択動
作は、音声分析手段2が特徴ベクトルを出力する時間間
隔に同期して処理を行われ、この時間間隔またはその整
数倍の時間間隔ごとに予備選択結果が出力される照合手
段6は、予備選択手段4からの起動により処理を開始す
る。起動がかかると、照合手段6はバッファメモリ3に
蓄積されている入力音声の始端から現在時点までの特徴
ベクトルの時系列と、標準パタン格納手段5に格納され
た標準パタンのうち予備選択手段4で尤もらしさの度合
いが一定値以上と判定された候補との照合を行なう。照
合手段6における照合処理は音声分析手段2における音
声分析処理と並行して行われる。入力音声の始端から照
合に起動がかかった時点までの特徴ベクトルの時系列に
対する処理が終了した後も、それ以降にバッファメモリ
3に書き込まれた特徴ベクトルの時系列に対する照合処
理は継続され、入力音声の終端が検出された段階で照合
処理を終了する。
【0018】判定手段7では、照合処理終了時点で求め
られている各候補毎のスコアに基づいて認識結果を出力
する。
【0019】図5のフローチャートにより、図1に示し
た構成の音声認識装置の動作をまとめて説明する。ま
ず、単位時間分の音声入力を受けて(51)、この単位
時間分の音声を分析する(52)。次に、この分析結果
をバッファメモリ3に格納する(53)。ステップ54
を経て予備選択処理が行われる(55)。以上の処理
は、候補数が予め定めた数N以下になるまで繰り返して
実行される(56)。ステップ56で候補数がN以下に
なったら、音声入力が終了する前であっても、次のステ
ップ57へ移行し、照合処理を開始する(57)。入力
音声の終端が検出されるまでは、ステップ51へ戻り、
音声入力(51)、音声分析(52)、バッファメモリ
格納(53)の各処理を再度実行する。但し、ステップ
54へ達すると、この時点ではステップ54で候補数が
N以下になっているので、予備選択処理(55)をバイ
パスして照合処理(57)へ戻る。このようにして音声
入力が終了するまで照合処理を繰返し、終了時に音声認
識結果を出力する(59)。
【0020】この方法によれば、図6(a)に示すよう
な音素列“ichi”からなる音声入力に対して、入力
開始から直ちに入力情報に基づいて予備選択処理が実行
され、当初の候補数Mが候補数Nにまで絞られた時点で
照合処理が開始される。したがって、従来のように音声
入力が終了してから予備選択を開始する場合に比べて、
音声認識結果をより早い時点で得ることができる。
【0021】次に本発明の実施例の中で用いる予備選択
手段4の具体例について説明する。
【0022】まず、認識対象のカテゴリ毎に用意したベ
クトル量子化用のコードブックによりベクトル量子化し
た際の量子化歪みの大きさに基づいて選択を行うものを
示す。図2の例では、単語別のコードブックを利用する
予備選択手段4の実現方法について説明する。認識対象
の語彙数はnであるとする。図2において42−1〜4
2−nは認識対象の各単語毎にあらかじめ用意したコー
ドブックである。バッファメモリ3から読み出された特
徴ベクトルはベクトル量子化器41において、各コード
ブック毎にベクトル量子化され、各コードブックごとの
量子化歪が計算される。ここで得られた量子化歪は量子
化歪累積手段43に送られ、ここで各コードブック毎に
累積される。各コードブック毎に累積された累積量子化
歪は予備選択判定手段44に送られ、ここで単位時間あ
たりの歪に変換され、この値が予め定めた値を越えたも
のは認識の対象とせず、その他の候補を選択された候補
として出力する。予備選択判定手段44での判定処理は
一定時間間隔毎に行なわれ、この各時点毎に選択により
残った候補の数を調べ、これが予め定めた値を下回った
時点で、照合手段6に起動をかける。なお、図2では簡
単のためにn個の各コードブック毎に独立にベクトル量
子化を行なうような構成として説明したが、文献、日本
音響学会講演論文集、1−3−17、(1986−1
0)“大語彙単語音声認識のためのスペクトル動特性を
用いた予備選択法”に記載のように、予め全単語を対象
とした汎用コードブックを作成しておき、各単語毎のn
個のコードブック42−1〜42−n中のコードベクト
ルが汎用コードブック中のコードベクトルに含まれるよ
うに各単語毎のコードブックを構成しておけば、ベクト
ル量子化のために必要な歪計算の回数は汎用コードブッ
ク中のコードベクトルの数で押さえられ少ない計算量で
予備選択処理を行なうことができる。なお、ベクトル量
子化のコードブックの作成手法としては、例えば、IE
EE Trans.Commun.,COM−28,N
o.1(January 1980),pp84−85
“An Algorithm for Vector
Quantizer Design”に記載のような公
知の手法を用いれば良い。
【0023】図2では単語別のコードブックを利用する
予備選択手段を示したが、これとは別に、音素(または
音節)別のコードブックを利用する予備選択手段を図3
に示す。音素の総数はmであるとする。図3において4
5−1〜45−mは各音素毎にあらかじめ用意したコー
ドブックである。バッファメモリ3から読み出された特
徴ベクトルはベクトル量子化器41においてベクトル量
子化され量子化歪が計算されるが、この際、前記m個の
コードブックをどのように用いるかの制御がコードブッ
ク選択手段46でなされる。コードブック選択手段46
では認識対象の各単語毎に各時点でどの音素のコードブ
ックを用いてベクトル量子化を行なうかを制御する。
【0024】なお、この制御を具体的に行なうには、図
8(a)に示すように、各単語毎に音素の持続時間の上
限、下限を記したテーブル80を用意しておき、このテ
ーブル80を参照しながら音素のコードブックを選択す
るようにすれば良い。この例では、持続時間はフレーム
の個数で規定してある。このテーブル内容に基づいて、
音素列P123…Pnなる単語について予め音素Pi
存在する時間範囲を求めておく。例えば、 P1については、 0≦t≦t1max、 P2については、 t1min≦t≦t1max+t2max、 P3については、 t1min+t2min≦t≦t1max+t
2max+t3max、 … このような準備をオフラインで行っておき、図8(b)
の処理を行う。同図から分かるように、フレーム時刻t
の各時点で上記関係に該当するコードブックをすべて選
択する。これにより、不要なコードブックの一部が除外
されるので、予備選択の精度が向上する。
【0025】ベクトル量子化器41において、各単語毎
に計算された量子化歪は量子化歪累積手段43に送ら
れ、ここで各単語に累積される。各単語毎に累積された
累積量子化歪は予備選択判定手段44に送られ、ここで
単位時間あたりの歪に変換され、この値が予め定めた値
を越えたものは認識の対象とせず、その他の候補を選択
された候補として出力する。予備選択判定手段44での
判定処理は一定時間間隔毎に行なわれ、この各時点毎に
選択により残った候補の数を調べ、これが予め定めた値
を下回った時点で、照合手段6に起動をかける。
【0026】次に、図4を用いて各単語毎に時間別に複
数用意したコードブックを利用して予備選択手段を実現
する方法について説明する。語彙数はnであるとし、各
単語毎に最大k個の時間区分に分割するものとする。図
4において47−1−1〜kは第1番目の単語につい
て、時間区分1〜kについて用意したコードブックであ
る。47−2−1〜k、47−3−1〜k・・・につい
ても同様である。バッファメモリ3から読み出された特
徴ベクトルはベクトル量子化器41においてベクトル量
子化され量子化歪が計算されるが、この際、前記複数個
のコードブックをどのように用いるかの制御がコードブ
ック選択手段46でなされる。コードブック選択手段4
6では入力音声の始端からの経過時間に応じて各単語毎
のコードブックの内、どの時間区分のものを用いるかを
決め前記複数個のコードブックの中から選ぶ。1つの時
間区分をT個の単位時間(フレーム)分とすると、コー
ドブックの選択処理は図9のように行われる。すなわ
ち、フレーム時刻tの各時点で、 (k−1)T<t≦kT を満たすk番目のコードブックを選択する。これによ
り、不要なコードブックが予め除外されるので予備選択
の精度を向上させることができる。
【0027】ベクトル量子化器41において、各単語毎
に計算された量子化歪は量子化歪累積手段43に送ら
れ、ここで各単語に累積される。各単語毎に累積された
累積量子化歪は予備選択判定手段44に送られ、ここで
単位時間あたりの歪に変換され、この値が予め定めた値
を越えたものは認識の対象とせず、その他の候補を選択
された候補として出力する。予備選択判定手段44での
判定処理は一定時間間隔毎に行なわれ、この各時点毎に
選択により残った候補の数を調べ、これが予め定めた値
を下回った時点で、照合手段6に起動をかける。
【0028】以上、本発明の好適な実施例について説明
したが、本発明の要旨を逸脱することなく種々の変形・
変更を行うことが可能である。
【0029】
【発明の効果】本発明によれば、予備選択手段の導入に
より音声認識にかかる処理量を削減することができ、か
つ、入力音声の終端が検出されるのを待たずに本照合に
起動をかけられるので、少ない計算量で高速に応答する
できる音声認識装置を提供できる。また、予備選択手段
において音声の時間構造を考慮の上、予備選択を行なう
ことにより、候補数の削減の程度を大きくして、かつ、
選択精度を高く保つことができる。
【図面の簡単な説明】
【図1】本発明の音声認識装置の一実施例を示すブロッ
ク図。
【図2】本発明に用いる予備選択手段を単語毎のコード
ブックによるベクトル量子化により実現した例を示すブ
ロック図。
【図3】本発明に用いる予備選択手段を音節毎のコード
ブックによるベクトル量子化により実現した例を示すブ
ロック図。
【図4】本発明に用いる予備選択手段を各単語毎にかつ
各時間ブロック毎に用意したコードブックによるベクト
ル量子化により実現した例を示すブロック図。
【図5】図1の実施例の動作を示すフローチャート。
【図6】図1の実施例の予備選択の原理を説明するため
の説明図。
【図7】図1の実施例における音声分析結果の説明図。
【図8】図3の予備選択手段の説明図。
【図9】図4の予備選択手段の説明図。
【符号の説明】
1・・・音声入力手段、2・・・音声分析手段、3・・
・バッファメモリ 4・・・予備選択手段、5・・・標準パタン格納手段、
6・・・照合手段 7・・・判定手段
フロントページの続き (56)参考文献 特開 昭57−102698(JP,A) 特開 平1−138596(JP,A) 特開 昭63−304299(JP,A) 特開 昭63−40200(JP,A) 特開 昭63−11998(JP,A) 特開 昭63−300298(JP,A) 特開 平1−227198(JP,A) 特開 平3−84600(JP,A) 特開 昭60−237496(JP,A) 特開 昭63−236097(JP,A) 実開 昭60−152200(JP,U) 電子情報通信学会技術研究報告[音 声」,Vol.91,No.95,SP91− 9,好田正紀外「予備選択法を利用する DPビームサーチの検討」,p.25−32 (1991年6月20日発行) (58)調査した分野(Int.Cl.7,DB名) G10L 15/00 - 17/00 JICSTファイル(JOIS)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】音声を入力する音声入力手段と、 該音声入力手段により入力された音声を一定時間ごとに
    分析して特徴ベクトルを一定時間ごとに出力する音声分
    析手段と、 該音声分析手段から出力された特徴ベクトルを一定時間
    長分蓄積するバッファメモリと、 予め認識の基準となる標準パタンを格納しておく標準パ
    タン格納手段と、 前記バッファメモリに蓄積された特徴ベクトルの時系列
    を用いて認識対象の全候補の中から有効な候補を選択す
    る予備選択手段と、 該予備選択手段により選択された前記標準パタン格納手
    段に格納された標準パタンと入力音声の特徴ベクトルの
    時系列とを照合する照合手段とを備え、 前記予備選択手段は、 音素(あるいは音節)毎に用意したベクトル量子化用の
    コードブックを用い、各認識対象のカテゴリ毎にどのコ
    ードブックをどの時間で用いるかを制御しながらベクト
    ル量子化した際の量子化歪の大きさに基づいて選択を行
    い、 選択により残された候補の数を監視し、該候補の数が予
    め定めた一定数よりも少なくなった時点で前記照合手段
    を起動する ようにしたことを特徴とする音声認識装置。
  2. 【請求項2】音声を入力する音声入力手段と、 該音声入力手段により入力された音声を一定時間ごとに
    分析して特徴ベクトルを一定時間ごとに出力する音声分
    析手段と、 該音声分析手段から出力された特徴ベクトルを一定時間
    長分蓄積するバッファメモリと、 予め認識の基準となる標準パタンを格納しておく標準パ
    タン格納手段と、 前記バッファメモリに蓄積された特徴ベクトルの時系列
    を用いて認識対象の全候補の中から有効な候補を選択す
    る予備選択手段と、 該予備選択手段により選択された前記標準パタン格納手
    段に格納された標準パ タンと入力音声の特徴ベクトルの
    時系列とを照合する照合手段とを備え、 前記予備選択手段は、 認識対象のカテゴリ毎にその発声パターンを一定時間間
    隔に分割した各ブロック毎に用意したベクトル量子化用
    のコードブックを用い、各認識対象のカテゴリ毎にどの
    コードブックをどの時間で用いるかを制御しながらベク
    トル量子化した際の量子化歪の大きさに基づいて選択を
    い、 選択により残された候補の数を監視し、該候補の数が予
    め定めた一定数よりも少なくなった時点で前記照合手段
    を起動する ようにしたことを特徴とする音声認識装置。
  3. 【請求項3】予め認識対象の全候補の中から有望な候補
    を選択しておき、選択された候補についてのみ照合処理
    を行う予備選択手段を備えた音声認識装置において、 前記予備選択手段は、音素(あるいは音節)毎に用意し
    たベクトル量子化用のコードブックと、各単語毎に音素
    の持続時間の上限、下限を記したテーブルとを有し、該
    テーブルに基づいて各音素の存在しうる時間範囲を予め
    求めておき、予備選択処理の各時点で、当該時点が内包
    される前記時間範囲に該当する音素のコードブックをす
    べて選択して予備選択処理に利用することを特徴とする
    音声認識装置。
  4. 【請求項4】予め認識対象の全候補の中から有望な候補
    を選択しておき、選択された候補についてのみ照合処理
    を行う予備選択手段を備えた音声認識装置において、 前記予備選択手段は、認識対象のカテゴリ毎に、かつ、
    その発声パターンを一定時間間隔に分割した各ブロック
    毎に用意したベクトル量子化用のコードブックを有し、
    予備選択処理の各時点で、当該時点に該当するブロック
    のコードブックを認識対象毎に選択して利用するように
    したことを特徴とする音声認識装置。
JP01078692A 1992-01-24 1992-01-24 音声認識装置 Expired - Fee Related JP3148322B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01078692A JP3148322B2 (ja) 1992-01-24 1992-01-24 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01078692A JP3148322B2 (ja) 1992-01-24 1992-01-24 音声認識装置

Publications (2)

Publication Number Publication Date
JPH05204396A JPH05204396A (ja) 1993-08-13
JP3148322B2 true JP3148322B2 (ja) 2001-03-19

Family

ID=11760021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01078692A Expired - Fee Related JP3148322B2 (ja) 1992-01-24 1992-01-24 音声認識装置

Country Status (1)

Country Link
JP (1) JP3148322B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
JP2014238812A (ja) * 2013-05-10 2014-12-18 株式会社リコー 情報処理装置、動作特定方法及び動作特定プログラム
EP4047596B1 (en) * 2019-06-04 2025-02-19 Google LLC Two-pass end to end speech recognition
WO2021113443A1 (en) 2019-12-04 2021-06-10 Google Llc Two-pass end to end speech recognition

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子情報通信学会技術研究報告[音声」,Vol.91,No.95,SP91−9,好田正紀外「予備選択法を利用するDPビームサーチの検討」,p.25−32(1991年6月20日発行)

Also Published As

Publication number Publication date
JPH05204396A (ja) 1993-08-13

Similar Documents

Publication Publication Date Title
JP3114975B2 (ja) 音素推定を用いた音声認識回路
JP3126985B2 (ja) 音声認識システムの言語モデルのサイズを適応させるための方法および装置
US6260013B1 (en) Speech recognition system employing discriminatively trained models
US7269556B2 (en) Pattern recognition
US7366669B2 (en) Acoustic model creation method as well as acoustic model creation apparatus and speech recognition apparatus
US6374219B1 (en) System for using silence in speech recognition
US20050021330A1 (en) Speech recognition apparatus capable of improving recognition rate regardless of average duration of phonemes
US5018201A (en) Speech recognition dividing words into two portions for preliminary selection
US20020188446A1 (en) Method and apparatus for distribution-based language model adaptation
JP3459712B2 (ja) 音声認識方法及び装置及びコンピュータ制御装置
JP2815579B2 (ja) 音声認識における単語候補削減装置
JP2002507010A (ja) 同時に起こるマルチモード口述のための装置及び方法
JP2023539948A (ja) ロングコンテキストエンドツーエンド音声認識システム
JPH06214587A (ja) 事前指定ワードスポッティングサブシステム及び事前ワードスポッティング方法
Ponting et al. The use of variable frame rate analysis in speech recognition
JP2980026B2 (ja) 音声認識装置
KR101122591B1 (ko) 핵심어 인식에 의한 음성 인식 장치 및 방법
JP3148322B2 (ja) 音声認識装置
US20020065655A1 (en) Method for the encoding of prosody for a speech encoder working at very low bit rates
US4790017A (en) Speech processing feature generation arrangement
JP2880436B2 (ja) 音声認識装置
JP2979912B2 (ja) 音声認識装置
JPH06118988A (ja) 音声対話処理装置
JP2658426B2 (ja) 音声認識方法
JPH04291399A (ja) 音声認識方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees