JP2808906B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2808906B2
JP2808906B2 JP3060786A JP6078691A JP2808906B2 JP 2808906 B2 JP2808906 B2 JP 2808906B2 JP 3060786 A JP3060786 A JP 3060786A JP 6078691 A JP6078691 A JP 6078691A JP 2808906 B2 JP2808906 B2 JP 2808906B2
Authority
JP
Japan
Prior art keywords
unit
similarity
standard pattern
recognition
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3060786A
Other languages
English (en)
Other versions
JPH04255900A (ja
Inventor
聡 塚田
隆夫 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP3060786A priority Critical patent/JP2808906B2/ja
Priority to CA002060733A priority patent/CA2060733C/en
Priority to DE69216648T priority patent/DE69216648T2/de
Priority to EP92101984A priority patent/EP0498419B1/en
Priority to US07/832,600 priority patent/US5432886A/en
Publication of JPH04255900A publication Critical patent/JPH04255900A/ja
Application granted granted Critical
Publication of JP2808906B2 publication Critical patent/JP2808906B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声認識装置において、
認識対象語以外の発声をリジェクトしたり、未知語を検
出する方法の改良に関するものである。
【0002】
【従来の技術】従来、音声認識では、東海大学出版会刊
行の「ディジタル音声処理」(以下、文献1と称す)の
149−177ページに述べられているように、入力さ
れた未知音声とあらかじめ登録された標準パターンを各
々、比較照合して、最大の類似度を与えるカテゴリを選
択することによって認識を行う。ここで、類似度として
は、特徴ベクトル間距離に基づくものや特徴ベクトル出
現確率に基づくものなどが用いられる。このようにして
求められた類似度を用いて、標準パターンに登録されて
いない未知の語が入力された時に、それを未知単語と判
定することができる。例えば、電子情報通信学会技術研
究報告、Vol.89,No.91,1989年6月,
1−8ページに掲載の「高騒音下における自動券売機用
不特定話者単語音声認識装置の開発」(以下、文献2と
称す)に述べられているように、得られた類似度があら
かじめ定められた閾値より小さい場合未知単語であると
判定しリジェクトする方法がある。
【0003】
【発明が解決しようとする課題】このようにして求めた
類似度の大きさは、話者や発声環境によって大きく変化
する。このため、話者や発声環境が異なる場合に、未知
語の検出精度を高くするためには、話者ごと、発声環境
ごとに異った閾値を設定する必要があった。しかし、こ
のような方法は非常な労力を必要とするという問題点が
ある。
【0004】本発明の目的は、話者や発声環境が異なっ
た場合でも、類似度を同一の尺度で比較できるように類
似度を補正することにより、安定した未知語の検出を可
能にした音声認識装置を提供することにある。
【0005】
【課題を解決するための手段】第1の発明の音声認識装
置は、入力された音声信号を特徴ベクトル時系列に変換
する特徴分析部と、前記特徴ベクトル時系列とあらかじ
め登録された標準パターンと比較照合し、最大の類似度
を与える標準パターンを認識結果として求める比較照合
部と、認識単位の標準パターンを保持する単位標準パタ
ーン記憶部と、前記認識単位の標準パターンをあらかじ
め定められた順序で結合した標準パターンと前記特徴ベ
クトル時系列との類似度の最大値を求める参照類似度計
算部と、前記比較照合部によって求められた類似度を前
記参照類似度計算部によって求められた類似度によって
補正した補正類似度を求める類似度補正部とを有するこ
とを特徴とする。
【0006】第2の発明の音声認識装置は、入力された
音声信号を特徴ベクトル時系列に変換する特徴分析部
と、前記特徴ベクトル時系列とあらかじめ登録された標
準パターンと比較照合し、最大の類似度を与える標準パ
ターンを認識結果として求める比較照合部と、前記標準
パターンを構成する特徴ベクトルと前記入力された音声
信号の特徴ベクトルとのベクトル間類似度を求めるベク
トル間類似度計算部と、前記ベクトル間類似度の最大値
を入力された音声信号の全フレームに対して累積した値
を参照類似度として求めるベクトル間類似度累積部と、
前記比較照合部によって求められた類似度を前記参照類
似度によって補正した補正類似度を求める類似度補正部
とを有することを特徴とする。
【0007】第3の発明の音声認識装置は、前記類似度
補正部により得られた補正類似度を継続時間長で正規化
した正規化類似度を求める正規化部を有することを特徴
とする。
【0008】第4の発明の音声認識装置は、前記類似度
補正部により得られた補正類似度があらかじめ定められ
た閾値より小さい場合にリジェクト信号を出力するリジ
ェクト部を有することを特徴とする。
【0009】第5の発明の音声認識装置は、前記正規化
部により得られた正規化類似度があらかじめ定められた
閾値より小さい場合にリジェクト信号を出力するリジェ
クト部を有することを特徴とする。
【0010】第6の発明の音声認識装置は、前記補正類
似度があらかじめ定められた閾値より小さい場合に前記
参照類似度計算部で求められた最大の類似度を与える認
識単位の結合列を認識結果として出力する認識結果決定
部を有することを特徴とする。
【0011】第7の発明の音声認識装置は、前記正規化
補正類似度があらかじめ定められた閾値より小さい場合
に前記参照類似度計算部で求められた最大の類似度を与
える認識単位の結合列を認識結果として出力する認識結
果決定部を有することを特徴とする。
【0012】第8の発明の音声認識装置は、入力された
音声信号を特徴ベクトル時系列に変換する特徴分析部
と、第1の認識単位の標準パターンを記憶する第1の単
位標準パターン記憶部と、前記特徴ベクトル時系列と前
記第1の認識単位の標準パターンをあらかじめ定められ
た順序で結合した標準パターンと比較照合し、最大の類
似度を与える第1の単位パターンの結合列を求める比較
照合部と、前記第1の単位パターンの結合列の各々の単
位パターンについての類似度を単位類似度として求める
単位類似度計算部と、第2の認識単位の標準パターンを
記憶する第2の単位標準パターン記憶部と、前記特徴ベ
クトル時系列と前記第2の認識単位の標準パターンをあ
らかじめ定められた順序で結合した標準パターンと比較
照合し、最大の類似度を参照類似度として求める参照類
似度計算部と、前記単位類似度の各々に対し前記参照類
似度から対応する区間の類似度を求め、前記単位類似度
を補正した補正単位類似度を求める単位類似度補正部
と、前記補正単位類似度があらかじめ定められた閾値よ
り小さい場合にその単位に対応する区間を未知語である
とする未知語判定部を有することを特徴とする。
【0013】第9の発明の音声認識装置は、前記補正単
位類似度があらかじめ定められた閾値より小さい区間に
対して、前記参照類似度計算部で求められた最大の類似
度を与える第2の認識単位の結合列の中で前記区間に対
応する区間を用いて置き換えたものを認識結果として出
力する認識結果決定部を有することを特徴とする。
【0014】第10の発明の音声認識装置は、入力され
た音声信号を特徴ベクトル時系列に変換する特徴分析部
と、第1の認識単位の標準パターンを記憶する第1の単
位標準パターン記憶部と、前記特徴ベクトル時系列と前
記第1の認識単位の標準パターンをあらかじめ定められ
た順序で結合した標準パターンと比較照合し、最大の類
似度を与える第1の単位パターンの結合列を求める比較
照合部と、前記第1の単位パターンの結合列の各々の単
位パターンについての類似度を単位類似度として求める
単位類似度計算部と、前記認識単位パターンを構成する
特徴ベクトルと前記入力された音声信号の特徴ベクトル
とのベクトル間類似度を求めるベクトル間類似度計算部
と、前記ベクトル間類似度の最大値を入力された音声信
号の全フレームに対して累積した値を参照類似度として
求めるベクトル間類似度累積部と、前記単位類似度の各
々に対し前記参照類似度から対応する区間の類似度を求
め、前記単位類似度を補正した補正単位類似度を求める
単位類似度補正部と、前記補正単位類似度があらかじめ
定められた閾値より小さい場合にその単位に対応する区
間を未知語であるとする未知語判定部を有することを特
徴とする。
【0015】第11の発明の音声認識装置は、前記補正
単位類似度を対応する区間の継続時間長で正規化して正
規化補正単位類似度を求める単位類似度補正部と、前記
補正単位類似度があらかじめ定められた閾値より小さい
場合にその単位に対応する区間を未知語であるとする未
知語判定部を有することを特徴とする。
【0016】第12の発明の音声認識装置は、前記正規
化補正単位類似度があらかじめ定められた閾値より小さ
い区間に対して、前記参照類似度計算部で求められた最
大の類似度を与える第2の認識単位の結合列の中で前記
区間に対応する区間を用いて置き換えたものを認識結果
として出力する認識結果決定部を有することを特徴とす
る。
【0017】
【作用】本発明においては、入力音声の特徴ベクトル時
系列に対して、あらかじめ登録された標準パターンとの
類似度を求めると共に、単語辞書の制約をなくし、言語
による拘束を弱めた場合の類似度を参照類似度として求
め、先の類似度を参照類似度を用いて補正するようにし
たものである。
【0018】第1の発明による音声認識装置において
は、まず入力された音声信号を特徴分析部によって特徴
ベクトル時系列に変換する。ここでの分析には、文献1
の32−98ページに示されているメルケプストラムに
よる方法やLPC分析による方法などを用いることがで
きる。
【0019】次に、比較照合部において、特徴分析部で
得られた特徴ベクトル時系列とあらかじめ登録しておい
た複数の標準パターンとの類似度が計算され、最大の類
似度を与える標準パターンが認識結果として求められ
る。単語パターンとの比較照合の方法としては文献1の
154−165ページに示されているように、標準パタ
ーンとして特徴ベクトル時系列を保持し特徴ベクトル間
距離に基づいて類似度を計算し動的計画法に基づいて比
較照合する方法や、S.E.レビンソン(S.E.Le
vinson)や、L.R.ラビナー(L.R.Rab
iner)、およびM.M.ソンディ(M.M.Son
dhi)らの、ベルシステムテクニカルジャーナル(T
he Bell System Technical
Journal)、Vol.62,No.4,1983
年4月,1035−1074ページに掲載の論文「アン
イントロダクション ツー ジ アプリケーション
オブザ セオリー オブ プロバブリスティック ファ
ンクションズ オブ アマルコフ プロセス ツー オ
ートマチック スピーチ レコグニション(AnInt
roduction to the Applicat
ion ofthe Theory of Proba
blistic Functionsof a Mar
cov Process to Automatic
Speech Recognition)」(以下、文
献3と称す)に述べられているような隠れマルコフモデ
ル(以下、HMMと呼ぶ)に基づいて比較照合する方法
などがある。
【0020】あらかじめ登録しておく標準パターンの単
位としては、単語や単語あるいはその他の単位のパター
ンをあらかじめ定めておいた順序によって結合したパタ
ーンなどを用いることができる。単位パターンをあらか
じめ定めておいた順序によって結合したパターンとの比
較照合の方法としては、電子情報通信学会論文誌、Vo
l.J71−D,No.9,1650−1659ページ
に掲載の「フレーム同期化、ビームサーチ、ベクトル量
子化の統合によるDPマッチングの高速化」(以下、文
献4と称す)に示されているようなフレーム同期DPマ
ッチングによる連続音声認識や、電子情報通信学会刊行
の「確率モデルによる音声認識」(以下、文献5と称
す)の40−50ページに示されているようなHMMに
よる連続音声認識アルゴリズムを用いることができる。
【0021】これと並行して、単位標準パターン記憶部
に記憶されている単位標準パターンをある定められた順
序で結合した複数の標準パターンと入力音声の特徴ベク
トル時系列と比較照合して、参照類似度として求める。
比較照合の方法としては比較照合部と同様の方法を用い
ることができる。また、ここでの単位標準パターンとし
ては、文献1の5ページに示されているような音節や音
素あるいは単語などを用いることができる。
【0022】次に、類似度補正部において、類似度を参
照類似度を用いて補正し、補正類似度が計算される。こ
こでの補正方法としては、類似度と参照類似度の差や類
似度と参照類似度の比を求める方法などを用いることが
できる。
【0023】入力音声に現れる話者や環境の影響は、類
似度を求める場合にも、参照類似度を求める場合にも、
どちらにも同様に現れるので、このようにして求めた補
正類似度においては、話者や環境の影響が相殺されてい
る。このことにより、第1の発明による音声認識装置に
おいては、話者や環境の違いによる類似度の大きさの違
いを抑えることができる。
【0024】第2の発明の音声認識装置においては、ベ
クトル間類似度計算部で、標準パターンを構成する特徴
ベクトルと入力された音声信号の特徴ベクトルとのベク
トル間類似度を計算する。ベクトル間類似度を求める方
法としては、文献1の154−161ページに述べられ
ているようなベクトル間距離に基づく方法やベクトル出
現確率による方法を用いることができる。次に、ベクト
ル間類似度累積部でベクトル間類似度の最大値を入力さ
れた音声信号の全フレームに対して累積した値を求め、
参照類似度とする。第2の発明においても、第1の発明
と同様に、話者や環境の違いによる類似度の大きさの違
いを抑えることができる。
【0025】しかし、類似度の大きさは、入力音声の継
続時間長によっても大きさの違いが生じることがあり、
上記の発明によっても類似度の大きさの違いが生じるこ
とがある。そこで、第3の発明においては、補正類似度
を入力音声の継続時間長で正規化する正規化部を備える
ことにより、類似度の大きさの違いを抑えることができ
る。
【0026】第4の発明は、リジェクト部で補正類似度
があらかじめ定められた閾値より小さい場合にリジェク
ト信号を発生する。ここで、補正類似度は話者や環境の
違いによる類似度の大きさの違いが補正されており、一
定の閾値を用いてリジェクトすることができる。
【0027】第5の発明は、リジェクト部で正規化補正
類似度があらかじめ定められた閾値より小さい場合にリ
ジェクト信号を発生する。ここで、正規化補正類似度は
話者や環境の違いによる類似度の大きさの違いが補正さ
れており、一定の閾値を用いてリジェクトすることがで
きる。
【0028】第6の発明では、認識結果決定部で、補正
類似度があらかじめ定められた閾値より小さい場合に、
参照類似度計算部で求めた最大の類似度を与える単位パ
ターンの結合列を、認識結果として出力する。
【0029】第7の発明では、認識結果決定部で、正規
化補正類似度があらかじめ定められた閾値より小さい場
合に、参照類似度計算部で求めた類似度を与える単位パ
ターンの結合列を、認識結果として出力する。
【0030】第8の発明においては、まず入力された音
声信号を特徴分析部によって特徴ベクトル時系列に変換
する。次に、比較照合部において、特徴分析部で得られ
た特徴ベクトル時系列と第1の単位標準パターン記憶部
に記憶しておいた複数の単位標準パターンをあらかじめ
定められた順序で結合した標準パターンと比較照合し、
最も類似度の大きい単位パターンの結合列と類似度を求
める。
【0031】次に、単位類似度計算部において、求めら
れた第1の単位パターンの結合列の単位パターンごとに
単位類似度を計算する。
【0032】これと並行して、第2の単位標準パターン
記憶部に記憶されている単位標準パターンをある定めら
れた順序で結合した複数の標準パターンと入力音声の特
徴ベクトル時系列と比較照合して、参照類似度として求
める。
【0033】次に、単位類似度補正部において、第1の
単位パターンに対応する区間の参照類似度を求め、単位
類似度を対応する区間の参照類似度で補正し、単位補正
類似度を計算する。
【0034】続いて、未知語判定部で、各々の単位補正
類似度について、あらかじめ定められた閾値よりも小さ
い場合には、その単位パターンに対応する区間は未知語
であるという情報を出力する。
【0035】第9の発明では、認識結果決定部で、単位
補正類似度があらかじめ定められた閾値より小さい場合
に、その単位パターンについて、対応する区間を、参照
類似度計算部で求めた最大の類似度を与える第2の単位
パターンの結合列の対応する区間で置き換えたものを、
認識結果として出力する。
【0036】第10の発明では、ベクトル間類似度計算
部で、単位標準パターンを構成する特徴ベクトルと入力
された音声信号の特徴ベクトルとのベクトル間類似度を
計算する。次に、ベクトル間類似度累積部でベクトル間
類似度の最大値を入力された音声信号の全フレームに対
して累積した値を求め、参照類似度とする。
【0037】第11の発明では、正規化部において、単
位補正類似度を単位パターンの対応する区間に継続時間
長によって単位類似度正規化を行い、正規化単位補正類
似度を求める。
【0038】未知語判定部では、正規化単位補正類似度
があらかじめ定められた閾値より小さい場合に、その単
位パターンに対応する区間は未知語であるという情報を
出力する。
【0039】第12の発明では、認識結果決定部で、正
規化単位補正類似度があらかじめ定められた閾値より小
さい場合に、その単位パターンについて、対応する区間
を、参照類似度計算部で求めた最大の類似度を与える第
2の単位パターンの結合列の対応する区間で置き換えた
ものを、認識結果として出力する。
【0040】
【実施例】本発明の実施例について図面を参照して説明
する。
【0041】図1は本発明の一実施例を示す図である。
【0042】この音声認識装置は、特徴計算部1,比較
照合部2,単位標準パターン記憶部3,参照類似度計算
部4,類似度補正部5,正規化部6,リジェクト部7,
認識結果決定部8を備えている。
【0043】特徴計算部1では入力された音声信号Iの
特徴分析を行い、特徴ベクトル時系列Vに変換するもの
である。
【0044】比較照合部2は、特徴ベクトル時系列V
と、あらかじめ登録しておいた標準パターンの各々とを
比較照合し、最大の類似度Sを求め、その時の標準パタ
ーンを認識結果とするものである。
【0045】単位標準パターン記憶部3は、単位標準パ
ターンを記憶しておくものである。
【0046】参照類似度計算部4は、単位標準パターン
記憶部3に登録しておいた単位標準パターンをあらかじ
め決めておいた順序で結合した標準パターンと、特徴ベ
クトル時系列Vとを比較照合し、各々の標準パターンに
ついて類似度を計算し、最大の類似度を参照類似度Rと
して求めるものである。
【0047】類似度補正部5は、類似度Sを参照類似度
Rを用いて補正し、補正類似度Cを求めるものである。
【0048】正規化部6は、補正類似度Cを継続時間長
で正規化し、正規化類似度Nを求めるものである。
【0049】リジェクト部7は、補正類似度Cあるいは
正規化類似度Nがあらかじめ定めておいた閾値より小さ
かった時に、リジェクト信号Jを出力するものである。
【0050】認識結果決定部8は、補正類似度Cあるい
は正規化類似度Nが、あらかじめ定めておいた閾値より
小さかった時に、参照類似度計算部4で最大の類似度を
与える単位標準パターンの結合列を認識結果Aとして出
力するものである。
【0051】次に、図1の実施例の動作について説明す
る。
【0052】入力された音声信号Iは特徴計算部1に入
力され、特徴分析によって特徴ベクトル時系列Vに変換
される。ここでの分析は、例えば、文献1の155ペー
ジで示されているようなメルケプストラムによる方法を
用いることができる。
【0053】特徴ベクトル時系列Vは、比較照合部2へ
入力され、あらかじめ登録しておいた複数の標準パター
ンとの類似度が計算され、最大の類似度Sと最大の類似
度を与える標準パターンが求められる。ここで類似度の
計算方法としては文献1,文献4に示されているような
DPマッチングに基づく方法や、文献3,文献5に示さ
れているようなHMMに基づく方法を用いることができ
る。
【0054】また、特徴ベクトル時系列Vは、参照類似
度計算部4に入力され単位標準パターン記憶部3に記憶
されている単位標準パターンをある定められた順序で結
合した複数の標準パターンと比較照合され、参照類似度
Rが出力される。ここでの単位標準パターンとしては、
文献1の5ページに示されているような音節を用いるこ
とができる。
【0055】次に、類似度Sと参照類似度Rは類似度補
正部5に入力され、類似度Sを参照類似度Rを用いて補
正された補正類似度Cが出力される。ここでの補正方法
としては、SとRの差をとる方法を用いることができ
る。
【0056】このようにして、第1の発明によって、話
者や環境に影響されない補正された類似度を得ることが
できる。
【0057】第3の発明によれば、補正類似度Cは正規
化部6によって継続時間長で正規化され、正規化類似度
Nが求められる。
【0058】第4の発明によれば、リジェクト部7によ
って、補正類似度Cがあらかじめ定めておいた閾値より
小さい場合には、リジェクト信号Jが出力される。
【0059】第5の発明によれば、リジェクト部7の入
力として、補正類似度Cの代わりに図1に破線で示され
ている正規化類似度Nを用い、正規化類似度Nがあらか
じめ定めておいた閾値より小さい場合には、リジェクト
信号Jが出力される。
【0060】第6の発明によれば、認識結果決定部8に
よって、補正類似度Cがあらかじめ定めておいた閾値よ
り小さかった時に、参照類似度計算部4で最大の類似度
を与える単位標準パターンの結合列を認識結果Aとして
出力するものである。
【0061】第7の発明によれば、認識結果決定部8に
入力として、補正類似度Cの代わりに図1に破線で示さ
れている正規化類似度Nを用い、正規化類似度Nがあら
かじめ定めておいた閾値より小さかった時に、参照類似
度計算部4で最大の類似度を与える単位標準パターンの
結合列を認識結果Aとして出力するものである。
【0062】図2は、本発明の一実施例を示す図であ
る。
【0063】この音声認識装置は、特徴計算部10,比
較照合部11,ベクトル間類似度計算部12,ベクトル
間類似度累積部13,類似度補正部14,正規化部1
5,リジェクト部16を備えている。
【0064】特徴計算部10では入力された音声信号I
の特徴分析を行い、特徴ベクトル時系列Vに変換するも
のである。
【0065】比較照合部11は、特徴ベクトル時系列V
と、あらかじめ登録しておいた標準パターンの各々とを
比較照合し、最大の類似度Sを求め、その時の標準パタ
ーンを認識結果とするものである。
【0066】ベクトル間類似度計算部12は、特徴ベク
トル時系列Vの1フレームの特徴ベクトルと比較照合部
であらかじめ登録しておいた標準パターンを構成する特
徴ベクトルとのベクトル間類似度Dを求めるものであ
る。
【0067】ベクトル間類似度累積部13は、ベクトル
間類似度Uの1フレームについての最大値を全フレーム
について累積し、参照類似度Rとして求めるものであ
る。
【0068】類似度補正部14は、類似度Sを参照類似
度Rを用いて補正し、補正類似度Cを求めるものであ
る。
【0069】正規化部15は、補正類似度Cを継続時間
長で正規化し、正規化類似度Nを求めるものである。
【0070】リジェクト部16は、補正類似度Cあるい
は正規化類似度Nが、あらかじめ定めておいた閾値より
小さかった時に、リジェクト信号Jを出力するものであ
る。
【0071】次に、図2の実施例の動作について説明す
る。
【0072】入力された音声信号Iは特徴計算部10に
入力され、特徴分析によって特徴ベクトル時系列Vに変
換される。
【0073】特徴ベクトル時系列Vは、比較照合部11
へ入力され、あらかじめ登録しておいた複数の標準パタ
ーンとの類似度が計算され、最大の類似度Sと最大の類
似度を与える標準パターンが求められる。
【0074】また、特徴ベクトル時系列Vは、ベクトル
間類似度計算部13に入力され、1フレームの特徴ベク
トルと比較照合部であらかじめ登録しておいた標準パタ
ーンを構成する全ての特徴ベクトルとのベクトル間類似
度Dが求められ出力される。
【0075】ベクトル間類似度Uはベクトル間類似度累
積部13に入力され、1フレームについての最大値を全
フレームについて累積したものが参照類似度Rとして出
力する。
【0076】次に、類似度Sと参照類似度Rは類似度補
正部14に入力され、類似度Sを参照類似度Rを用いて
補正された補正類似度Cが出力される。
【0077】このようにして、第2の発明によって、話
者や環境に影響されない補正された類似度を得ることが
できる。
【0078】第3の発明によれば、補正類似度Cは正規
化部15によって継続時間長で正規化され、正規化類似
度Nが求められる。
【0079】第4の発明によれば、リジェクト部7によ
って、補正類似度Cがあらかじめ決めておいた閾値より
小さい場合には、リジェクト信号Jが出力される。
【0080】第5の発明によれば、リジェクト部7の入
力として、補正類似度Cの代わりに図2に破線で示され
ている正規化類似度Nを用い、正規化類似度Nがあらか
じめ定めておいた閾値より小さい場合には、リジェクト
信号Jが出力される。
【0081】図3は、本発明の一実施例を示す図であ
る。
【0082】この音声認識装置は、特徴計算部20,第
1の単位標準パターン記憶部21,比較照合部22,単
位類似度計算部23,第2の単位標準パターン記憶部2
4,参照類似度計算部25,単位類似度補正部26,単
位類似度正規化部27,未知語判定部28,認識結果決
定部29を備えている。
【0083】特徴計算部20では入力された音声信号I
の特徴分析を行い、特徴ベクトル時系列Vに変換するも
のである。
【0084】第1の単位標準パターン記憶部21は、認
識対象の単位標準パターンを記憶しておくものである。
【0085】比較照合部22は、特徴ベクトル時系列V
と、第1の単位標準パターン記憶部21に記憶しておい
た第1の単位標準パターンをあらかじめ決めておいた順
序に従って結合した標準パターンの各々とを比較照合
し、最も類似度の大きい単位パターンの結合列Sを出力
するものである。
【0086】単位類似度計算部23は、第1の単位標準
パターンの結合列Sを構成する各々の単位標準パターン
についてその対応する区間の類似度を求め、各々単位類
似度Uとして出力するものである。
【0087】第2の単位標準パターン記憶部24は、参
照用の標準パターンの単位標準パターンを記憶しておく
ものである。
【0088】参照類似度計算部25は、特徴ベクトル時
系列Vと第2の単位標準パターン記憶部に記憶しておい
た第2の単位標準パターンをあらかじめ決めておいた順
序に従って結合した標準パターンの各々とを比較照合
し、最大の類似度を求め、参照類似度Rとして出力する
ものである。
【0089】単位類似度補正部26は、単位類似度Uに
ついて、参照類似度Rから対応する区間の類似度を求め
て、この類似度によって単位類似度Uを補正し、補正単
位類似度Cとするものである。
【0090】単位類似度正規化部27は、補正単位類似
度Cを対応する単位標準パターンの継続時間長で正規化
し、正規化単位類似度Nを求めるものである。
【0091】未知語判定部28は、補正単位類似度Cあ
るいは正規化単位類似度Nが、あらかじめ定めておいた
閾値より小さかった時に、対応する区間が未知語である
とした認識結果Jを出力するものである。
【0092】認識結果決定部29は、補正単位類似度C
あるいは正規化単位類似度Nが、あらかじめ定めておい
た閾値より小さかった時に、参照類似度計算部で最大の
類似度を与える第2の単位標準パターンの結合列の対応
する区間で置き換えて認識結果Aとして出力するもので
ある。
【0093】次に、図3の実施例の動作について説明す
る。
【0094】入力された音声信号Iは特徴計算部20に
入力され、特徴分析によって特徴ベクトル時系列Vに変
換される。
【0095】特徴ベクトル時系列Vは、比較照合部22
へ入力され、第1の単位標準パターン記憶部21に記憶
しておいた単位パターンをあらかじめ定めておいた順序
に従って結合した標準パターンの各々と比較照合され、
最も類似度の大きい単位パターンの結合列Sが出力され
る。
【0096】次に、単位類似度計算部23において、第
1の単位標準パターンの結合列Sを構成する各々の単位
標準パターンについてその対応する区間の類似度を求
め、各々単位類似度Uを求める。
【0097】また、特徴ベクトル時系列Vは、参照類似
度計算部25へ入力され、第2の単位標準パターン記憶
部24に記憶しておいた単位パターンをあらかじめ定め
ておいた順序に従って結合した標準パターンの各々と比
較照合され、最も大きい類似度が参照類似度Rとして出
力される。
【0098】単位類似度Uと参照類似度Rは単位類似度
補正部26に入力され、単位類似度Uを参照類似度Rを
用いて補正した補正単位類似度Cが出力される。
【0099】次に、未知語判定部28において、補正単
位類似度Cがあらかじめ定めておいた閾値より小さかっ
た時に、対応する区間が未知語であるとした認識結果J
を出力する。
【0100】第9の発明によれば、認識結果決定部29
において、補正単位類似度Cがあらかじめ定めておいた
閾値より小さかった時に、参照類似度計算部で最大の類
似度を与える第2の単位標準パターンの結合列の対応す
る区間で置き換えて認識結果Aとして出力する。
【0101】第11の発明によれば、補正単位類似度C
は単位類似度正規化部27によって継続時間長で正規化
され、正規化単位類似度Nが求められる。
【0102】次に、未知語判定部28において、補正単
位類似度Cの代わりに、図3に破線で示されている正規
化単位類似度Nが入力され、正規化単位類似度Nがあら
かじめ定めておいた閾値より小さかった時に、対応する
区間が未知語であるとした認識結果Jを出力する。
【0103】第12の発明によれば、認識結果決定部2
9の入力として、補正単位類似度Cの代わりに、図3に
破線で示されている正規化単位類似度Nが入力され、正
規化単位類似度Nがあらかじめ定めておいた閾値より小
さかった時に、参照類似度計算部で最大の類似度を与え
る第2の単位標準パターンの結合列の対応する区間で置
き換えて認識結果Aとして出力する。
【0104】図4は、本発明の一実施例を示す図であ
る。
【0105】この音声認識装置は、特徴計算部30,第
1の単位標準パターン記憶部31,比較照合部32,単
位類似度計算部33,ベクトル間類似度計算部34,ベ
クトル間類似度累積部35,単位類似度補正部36,単
位類似度正規化部37,未知語判定部38を備えてい
る。
【0106】特徴計算部30では入力された音声信号I
の特徴分析を行い、特徴ベクトル時系列Vに変換するも
のである。
【0107】第1の単位標準パターン記憶部31は、認
識対象の単位標準パターンを記憶しておくものである。
【0108】比較照合部32は、特徴ベクトル時系列V
と、第1の単位標準パターン記憶部に記憶しておいた第
1の単位標準パターンをあらかじめ決めておいた順序に
従って結合した標準パターンの各々とを比較照合し、最
も類似度の大きい単位パターンの結合列Sを出力するも
のである。
【0109】単位類似度計算部33は、第1の単位標準
パターンの結合列Sを構成する各々の単位標準パターン
についてその対応する区間の類似度を求め、各々単位類
似度Uとして出力するものである。
【0110】ベクトル間類似度計算部34は、特徴ベク
トル時系列Vの1フレームの特徴ベクトルと比較照合部
であらかじめ登録しておいた標準パターンを構成する特
徴ベクトルとのベクトル間類似度Dを求めるものであ
る。
【0111】ベクトル間類似度累積部35は、ベクトル
間類似度Uの1フレームについての最大値を全フレーム
について累積し、参照類似度Rとして求めるものであ
る。
【0112】単位類似度補正部36は、単位類似度Uに
ついて、参照類似度Rから対応する区間の類似度を求め
て、この類似度によって単位類似度Uを補正し、補正単
位類似度Cとするものである。
【0113】単位類似度正規化部37は、単位補正類似
度Cを対応する単位標準パターンの継続時間長で正規化
し、正規化単位類似度Nを求めるものである。
【0114】未知語判定部38は、補正単位類似度Cあ
るいは正規化単位類似度Nが、あらかじめ定めておいた
閾値より小さかった時に、対応する区間が未知語である
とした認識結果Jを出力するものである。
【0115】認識結果決定部39は、補正単位類似度C
あるいは正規化単位類似度Nが、あらかじめ定めておい
た閾値より小さかった時に、参照類似度計算部で最大の
類似度を与える第2の単位標準パターンの結合列の対応
する区間で置き換えて認識結果Aとして出力するもので
ある。
【0116】次に、図4の実施例の動作について説明す
る。
【0117】入力された音声信号Iは特徴計算部30に
入力され、特徴分析によって特徴ベクトル時系列Vに変
換される。
【0118】特徴ベクトル時系列Vは、比較照合部32
へ入力され、第1の単位標準パターン記憶部31に記憶
しておいた単位パターンをあらかじめ定めておいた順序
に従って結合した標準パターンの各々と比較照合され、
最も類似度の大きい単位パターンの結合列Sが出力され
る。
【0119】次に、単位類似度計算部33において、第
1の単位標準パターンの結合列Sを構成する各々の単位
標準パターンについてその対応する区間の類似度を求
め、各々単位類似度Uを求める。
【0120】また、特徴ベクトル時系列Vは、ベクトル
間類似度計算部34に入力され、1フレームの特徴ベク
トルと第1の単位標準パターンを構成する全ての特徴ベ
クトルとのベクトル間類似度Dが求められ出力される。
【0121】ベクトル間類似度Uはベクトル間類似度累
積部35に入力され、1フレームについての最大値を全
フレームについて累積したものが参照類似度Rとして出
力する。
【0122】単位類似度Uと参照類似度Rは単位類似度
補正部36に入力され、単位類似度Uを参照類似度Rを
用いて補正した補正単位類似度Cが出力される。
【0123】次に、未知語判定部38において、補正単
位類似度Cがあらかじめ定めておいた閾値より小さかっ
た時に、対応する区間が未知語であるとした認識結果J
を出力する。
【0124】第11の発明によれば、補正類似度Cは単
位類似度正規化部37によって継続時間長で正規化さ
れ、正規化類似度Nが求められる。
【0125】次に、未知語判定部38において、補正単
位類似度Cの代わりに、図4に破線で示されている正規
化単位類似度Nが入力され、正規化単位類似度Nがあら
かじめ定めておいた閾値より小さかった時に、対応する
区間が未知語であるとした認識結果Jを出力する。
【0126】
【発明の効果】以上説明したように本発明によれば、入
力音声の特徴ベクトル時系列と登録した標準パターンと
の類似度を入力音声と参照用の標準パターンとの参照類
似度を用いて補正することにより、話者や発声環境が異
なった場合でも同一の尺度で類似度を比較でき、安定し
たリジェクトや未知語検出を実現することができる。
【図面の簡単な説明】
【図1】本発明の一実施例のブロック図である。
【図2】本発明の一実施例のブロック図である。
【図3】本発明の一実施例のブロック図である。
【図4】本発明の一実施例のブロック図である。
【符号の説明】
1 特徴分析部 2 比較照合部 3 単位標準パターン記憶部 4 参照類似度計算部 5 類似度補正部 6 正規化部 7 リジェクト部 8 認識結果決定部 10 特徴分析部 11 比較照合部 12 ベクトル間類似度計算部 13 ベクトル間類似度累積部 14 類似度補正部 15 正規化部 16 リジェクト部 20 特徴分析部 21 第1の単位標準パターン記憶部 22 比較照合部 23 単位類似度計算部 24 第2の単位標準パターン記憶部 25 参照類似度計算部 26 単位類似度補正部 27 単位類似度正規化部 28 未知語判定部 29 認識結果決定部 30 特徴分析部 31 第1の単位標準パターン記憶部 32 比較照合部 33 単位類似度計算部 34 ベクトル間類似度計算部 35 ベクトル間類似度累積部 36 単位類似度補正部 37 単位類似度正規化部 38 未知語判定部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 571 G10L 3/00 531 G10L 3/00 561

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された音声信号を特徴ベクトル時系列
    に変換する特徴分析部と、前記特徴ベクトル時系列とあ
    らかじめ登録された標準パターンと比較照合し、最大の
    類似度を与える標準パターンを認識結果として求める比
    較照合部と、認識単位の標準パターンを保持する単位標
    準パターン記憶部と、前記認識単位の標準パターンをあ
    らかじめ定められた順序で結合した標準パターンと前記
    特徴ベクトル時系列との類似度の最大値を求める参照類
    似度計算部と、前記比較照合部によって求められた類似
    度を前記参照類似度計算部によって求められた類似度に
    よって補正した補正類似度を求める類似度補正部とを有
    する音声認識装置。
  2. 【請求項2】入力された音声信号を特徴ベクトル時系列
    に変換する特徴分析部と、前記特徴ベクトル時系列とあ
    らかじめ登録された標準パターンと比較照合し、最大の
    類似度を与える標準パターンを認識結果として求める比
    較照合部と、前記標準パターンを構成する特徴ベクトル
    と前記入力された音声信号の特徴ベクトルとのベクトル
    間類似度を求めるベクトル間類似度計算部と、前記ベク
    トル間類似度の最大値を入力された音声信号の全フレー
    ムに対して累積した値を参照類似度として求めるベクト
    ル間類似度累積部と、前記比較照合部によって求められ
    た類似度を前記参照類似度によって補正した補正類似度
    を求める類似度補正部とを有する音声認識装置。
  3. 【請求項3】前記類似度補正部により得られた補正類似
    度を継続時間長で正規化した正規化類似度を求める正規
    化部を有する請求項1または2記載の音声認識装置。
  4. 【請求項4】前記類似度補正部により得られた補正類似
    度があらかじめ定められた閾値より小さい場合にリジェ
    クト信号を出力するリジェクト部を有する請求項1また
    は2記載の音声認識装置。
  5. 【請求項5】前記正規化部により得られた正規化類似度
    があらかじめ定められた閾値より小さい場合にリジェク
    ト信号を出力するリジェクト部を有する請求項3記載の
    音声認識装置。
  6. 【請求項6】前記補正類似度があらかじめ定められた閾
    値より小さい場合に前記参照類似度計算部で求められた
    最大の類似度を与える認識単位の結合列を認識結果とし
    て出力する認識結果決定部を有する請求項1記載の音声
    認識装置。
  7. 【請求項7】前記正規化補正類似度があらかじめ定めら
    れた閾値より小さい場合に前記参照類似度計算部で求め
    られた最大の類似度を与える認識単位の結合列を認識結
    果として出力する認識結果決定部を有する請求項3記載
    の音声認識装置。
  8. 【請求項8】入力された音声信号を特徴ベクトル時系列
    に変換する特徴分析部と、第1の認識単位の標準パター
    ンを記憶する第1の単位標準パターン記憶部と、前記特
    徴ベクトル時系列と前記第1の認識単位の標準パターン
    をあらかじめ定められた順序で結合した標準パターンと
    比較照合し、最大の類似度を与える第1の単位パターン
    の結合列を求める比較照合部と、前記第1の単位パター
    ンの結合列の各々の単位パターンについての類似度を単
    位類似度として求める単位類似度計算部と、第2の認識
    単位の標準パターンを記憶する第2の単位標準パターン
    記憶部と、前記特徴ベクトル時系列と前記第2の認識単
    位の標準パターンをあらかじめ定められた順序で結合し
    た標準パターンと比較照合し、最大の類似度を参照類似
    度として求める参照類似度計算部と、前記単位類似度の
    各々に対し前記参照類似度から対応する区間の類似度を
    求め、前記単位類似度を補正した補正単位類似度を求め
    る単位類似度補正部と、前記補正単位類似度があらかじ
    め定められた閾値より小さい場合にその単位に対応する
    区間を未知語であるとする未知語判定部を有する音声認
    識装置。
  9. 【請求項9】前記補正単位類似度があらかじめ定められ
    た閾値より小さい区間に対して、前記参照類似度計算部
    で求められた最大の類似度を与える第2の認識単位の結
    合列の中で前記区間に対応する区間を用いて置き換えた
    ものを認識結果として出力する認識結果決定部を有する
    請求項8記載の音声認識装置。
  10. 【請求項10】入力された音声信号を特徴ベクトル時系
    列に変換する特徴分析部と、第1の認識単位の標準パタ
    ーンを記憶する第1の単位標準パターン記憶部と、前記
    特徴ベクトル時系列と前記第1の認識単位の標準パター
    ンをあらかじめ定められた順序で結合した標準パターン
    と比較照合し、最大の類似度を与える第1の単位パター
    ンの結合列を求める比較照合部と、前記第1の単位パタ
    ーンの結合列の各々の単位パターンについての類似度を
    単位類似度として求める単位類似度計算部と、前記認識
    単位パターンを構成する特徴ベクトルと前記入力された
    音声信号の特徴ベクトルとのベクトル間類似度を求める
    ベクトル間類似度計算部と、前記ベクトル間類似度の最
    大値を入力された音声信号の全フレームに対して累積し
    た値を参照類似度として求めるベクトル間類似度累積部
    と、前記単位類似度の各々に対し前記参照類似度から対
    応する区間の類似度を求め、前記単位類似度を補正した
    補正単位類似度を求める単位類似度補正部と、前記補正
    単位類似度があらかじめ定められた閾値より小さい場合
    にその単位に対応する区間を未知語であるとする未知語
    判定部を有する音声認識装置。
  11. 【請求項11】前記補正単位類似度を対応する区間の継
    続時間長で正規化して正規化補正単位類似度を求める単
    位類似度補正部と、前記補正単位類似度があらかじめ定
    められた閾値より小さい場合にその単位に対応する区間
    を未知語であるとする未知語判定部を有する請求項8ま
    たは10記載の音声認識装置。
  12. 【請求項12】前記正規化補正単位類似度があらかじめ
    定められた閾値より小さい区間に対して、前記参照類似
    度計算部で求められた最大の類似度を与える第2の認識
    単位の結合列の中で前記区間に対応する区間を用いて置
    き換えたものを認識結果として出力する認識結果決定部
    を有する請求項11記載の音声認識装置。
JP3060786A 1991-02-07 1991-02-07 音声認識装置 Expired - Lifetime JP2808906B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP3060786A JP2808906B2 (ja) 1991-02-07 1991-02-07 音声認識装置
CA002060733A CA2060733C (en) 1991-02-07 1992-02-06 Speech recognition device for calculating a corrected similarity scarcely dependent on circumstances of production of input patterns
DE69216648T DE69216648T2 (de) 1991-02-07 1992-02-06 Spracherkennungsgerät zur Berechnung einer korrigierten Ähnlichkeit die kaum abhängig ist von Umständen der Erzeugung von Eingangsmustern
EP92101984A EP0498419B1 (en) 1991-02-07 1992-02-06 Speech recognition device for calculating a corrected similarity scarcely dependent on circumstances of production of input patterns
US07/832,600 US5432886A (en) 1991-02-07 1992-02-07 Speech recognition device for calculating a corrected similarity partially dependent on circumstances of production of input patterns

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3060786A JP2808906B2 (ja) 1991-02-07 1991-02-07 音声認識装置

Publications (2)

Publication Number Publication Date
JPH04255900A JPH04255900A (ja) 1992-09-10
JP2808906B2 true JP2808906B2 (ja) 1998-10-08

Family

ID=13152328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3060786A Expired - Lifetime JP2808906B2 (ja) 1991-02-07 1991-02-07 音声認識装置

Country Status (5)

Country Link
US (1) US5432886A (ja)
EP (1) EP0498419B1 (ja)
JP (1) JP2808906B2 (ja)
CA (1) CA2060733C (ja)
DE (1) DE69216648T2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3459712B2 (ja) 1995-11-01 2003-10-27 キヤノン株式会社 音声認識方法及び装置及びコンピュータ制御装置
US7260527B2 (en) 2001-12-28 2007-08-21 Kabushiki Kaisha Toshiba Speech recognizing apparatus and speech recognizing method
US7813928B2 (en) 2004-06-10 2010-10-12 Panasonic Corporation Speech recognition device, speech recognition method, and program
US8731926B2 (en) 2010-03-04 2014-05-20 Fujitsu Limited Spoken term detection apparatus, method, program, and storage medium

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2738403B2 (ja) * 1995-05-12 1998-04-08 日本電気株式会社 音声認識装置
US5754978A (en) * 1995-10-27 1998-05-19 Speech Systems Of Colorado, Inc. Speech recognition system
JPH1152979A (ja) * 1997-08-08 1999-02-26 Fujitsu Ltd 順序データの音声認識装置
JP2000020089A (ja) 1998-07-07 2000-01-21 Matsushita Electric Ind Co Ltd 音声認識方法及びその装置、並びに音声制御システム
JP2001175276A (ja) * 1999-12-17 2001-06-29 Denso Corp 音声認識装置及び記録媒体
JP4393648B2 (ja) * 2000-01-11 2010-01-06 富士通株式会社 音声認識装置
US20030105622A1 (en) * 2001-12-03 2003-06-05 Netbytel, Inc. Retrieval of records using phrase chunking
JP2007522958A (ja) * 2003-12-31 2007-08-16 コリンズ・アンド・アイクマン・プロダクツ・コーポレーション 主基材に対する装飾製品のインモールドラミネーション
JP4297349B2 (ja) * 2004-03-30 2009-07-15 Kddi株式会社 音声認識システム
US20080154591A1 (en) * 2005-02-04 2008-06-26 Toshihiro Kujirai Audio Recognition System For Generating Response Audio by Using Audio Data Extracted
JP4393494B2 (ja) 2006-09-22 2010-01-06 株式会社東芝 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
US8364481B2 (en) 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
JP5158877B2 (ja) * 2009-01-29 2013-03-06 Kddi株式会社 音声認識方法および装置
JP6263868B2 (ja) 2013-06-17 2018-01-24 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム
JP6524674B2 (ja) 2015-01-22 2019-06-05 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム
JP6544439B2 (ja) 2015-11-18 2019-07-17 富士通株式会社 困惑状態判定装置、困惑状態判定方法、及びプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4059725A (en) * 1975-03-12 1977-11-22 Nippon Electric Company, Ltd. Automatic continuous speech recognition system employing dynamic programming
JPS5529803A (en) * 1978-07-18 1980-03-03 Nippon Electric Co Continuous voice discriminating device
JPS58130396A (ja) * 1982-01-29 1983-08-03 株式会社東芝 音声認識装置
JP2595495B2 (ja) * 1982-09-03 1997-04-02 日本電気株式会社 パタンマッチング装置
US4723290A (en) * 1983-05-16 1988-02-02 Kabushiki Kaisha Toshiba Speech recognition apparatus
JPS6024597A (ja) * 1983-07-21 1985-02-07 日本電気株式会社 音声登録方式
JPS62169199A (ja) * 1986-01-22 1987-07-25 株式会社デンソー 音声認識装置
GB8716194D0 (en) * 1987-07-09 1987-08-12 British Telecomm Speech recognition

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
日本音響学会講演論文集(平成3年3月)3−P−28,P.203−204

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3459712B2 (ja) 1995-11-01 2003-10-27 キヤノン株式会社 音声認識方法及び装置及びコンピュータ制御装置
US7260527B2 (en) 2001-12-28 2007-08-21 Kabushiki Kaisha Toshiba Speech recognizing apparatus and speech recognizing method
US7813928B2 (en) 2004-06-10 2010-10-12 Panasonic Corporation Speech recognition device, speech recognition method, and program
US8731926B2 (en) 2010-03-04 2014-05-20 Fujitsu Limited Spoken term detection apparatus, method, program, and storage medium

Also Published As

Publication number Publication date
EP0498419A2 (en) 1992-08-12
CA2060733C (en) 1996-10-29
CA2060733A1 (en) 1992-08-08
EP0498419B1 (en) 1997-01-15
DE69216648D1 (de) 1997-02-27
EP0498419A3 (en) 1993-05-12
JPH04255900A (ja) 1992-09-10
US5432886A (en) 1995-07-11
DE69216648T2 (de) 1997-05-28

Similar Documents

Publication Publication Date Title
JP2808906B2 (ja) 音声認識装置
EP0501631B1 (en) Temporal decorrelation method for robust speaker verification
US7447634B2 (en) Speech recognizing apparatus having optimal phoneme series comparing unit and speech recognizing method
US5692097A (en) Voice recognition method for recognizing a word in speech
US5018201A (en) Speech recognition dividing words into two portions for preliminary selection
EP1355296B1 (en) Keyword detection in a speech signal
US6922668B1 (en) Speaker recognition
EP1355295A2 (en) Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded
WO2009156903A2 (en) Method and device for generating vocabulary entry from acoustic data
JP3066920B2 (ja) 音声認識方法及び装置
CN112750445B (zh) 语音转换方法、装置和系统及存储介质
JPWO2005096271A1 (ja) 音声認識装置及び音声認識方法
US5191635A (en) Pattern matching system for speech recognition system, especially useful for discriminating words having similar vowel sounds
JPH04369696A (ja) 音声認識方法
US4918731A (en) Speech recognition method and apparatus
JP3444108B2 (ja) 音声認識装置
JP3403838B2 (ja) 句境界確率計算装置および句境界確率利用連続音声認識装置
JP3428058B2 (ja) 音声認識装置
JP3039095B2 (ja) 音声認識装置
Benıtez et al. Different confidence measures for word verification in speech recognition
JP2853418B2 (ja) 音声認識方法
JP3461789B2 (ja) 音声認識装置および音声認識方法、並びに、プログラム記録媒体
US6298325B1 (en) Speech recognition system for sequence data
KR20040100592A (ko) 이동 기기에서의 실시간 화자독립가변어 음성인식 방법
JP3291073B2 (ja) 音声認識方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070731

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080731

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090731

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100731

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110731

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110731

Year of fee payment: 13