JPH0776880B2 - パターン認識方法および装置 - Google Patents

パターン認識方法および装置

Info

Publication number
JPH0776880B2
JPH0776880B2 JP5003647A JP364793A JPH0776880B2 JP H0776880 B2 JPH0776880 B2 JP H0776880B2 JP 5003647 A JP5003647 A JP 5003647A JP 364793 A JP364793 A JP 364793A JP H0776880 B2 JPH0776880 B2 JP H0776880B2
Authority
JP
Japan
Prior art keywords
vector
state
probability
feature vector
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5003647A
Other languages
English (en)
Other versions
JPH06208392A (ja
Inventor
健一 磯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5003647A priority Critical patent/JPH0776880B2/ja
Priority to CA002113316A priority patent/CA2113316C/en
Priority to EP94100445A priority patent/EP0606913B1/en
Priority to DE69417273T priority patent/DE69417273T2/de
Publication of JPH06208392A publication Critical patent/JPH06208392A/ja
Publication of JPH0776880B2 publication Critical patent/JPH0776880B2/ja
Priority to US08/797,888 priority patent/US5920839A/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • G10L15/144Training of HMMs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号のような特徴
ベクトルの時系列で表されるパターンを自動認識するた
めのパターン認識方法および装置に関するものである。
【0002】
【従来の技術】時系列パターンを認識するためのパター
ン認識方式に関しては種々の技術が開発されているが、
それらの中で最も確立され重用されているものの一つと
して「確率モデルによる音声認識(中川聖一著、電子情
報通信学会発行)」に詳しく解説されている「隠れマル
コフモデル(HMM)」がある。以下においてこのHM
Mの要部を説明する。
【0003】単語名を番号wで指定することとして、
【0004】
【数1】
【0005】なる単語セットを認識対象とする。各単語
の標準パターンは状態の系列で表される。単語wの第n
番目の状態は
【0006】
【数2】
【0007】で決まる
【0008】
【外13】
【0009】をベクトル出力確率分布として有する。
【0010】
【数3】
【0011】Pはベクトルxおよび
【0012】
【外14】
【0013】の次元、
【0014】
【外15】
【0015】の逆行列、
【0016】
【外16】
【0017】は転置を表している。また各状態の間の遷
移には遷移確率が付随する。単語の標準パターンの例
(状態数がNw の場合)を図6に示す。図6においては
第n番目の状態は自分自身への遷移
【0018】
【外17】
【0019】と隣接する第n+1番目の状態への遷移
【0020】
【外18】
【0021】を有している。この単語wの標準パターン
が特徴ベクトルの系列a1 ,…,aTを出力する単語出
力確率P(a1 ,…,aT |w)は次式で与えられる。
【0022】
【数4】
【0023】ここでn1 ,…,nT は時刻t=1に状態
1 に滞在し、時刻t=Tに状態nTに到達する状態遷
移を表しており、上式での和はすべての可能な状態遷移
に関する和を表している。状態遷移に関しては図7に示
したようなトレリス(格子図)上で説明できる。図7に
おいて横軸は特徴ベクトル系列に対応し、縦軸は単語の
標準パターンの状態系列(図6参照)に対応している。
状態遷移はこのトレリス上の経路(太線)で指定され
る。n1 ,…,nT はこれを式で表したものである。
式4のP(a1 ,…,aT |n1 ,…,nT ,w)は状
態遷移が確定した場合にその状態遷移で特徴ベクトル系
列が出力される確率、P(n1 ,…,nT |w)はある
状態遷移が生じる確率である。これらの確率はそれぞれ
ベクトル出力確率分布と遷移確率から以下のように計算
される。
【0024】
【数5】
【0025】
【数6】
【0026】式4で与えられる単語出力確率P(a1
…,aT |w)の効率的な計算法は「フォワード計算
法」として知られている。「フォワード計算法」に関し
ては前記刊行物「確率モデルによる音声認識」の42ペ
ージのアルゴリズム3.2に「前向きパスアルゴリズ
ム」として説明されている。結果として時刻tに状態n
に滞在する
【0027】
【外19】
【0028】を次式にしたがって初期化し、
【0029】
【数7】
【0030】以下の漸化式にしたがって時刻t=2から
t=Tまで逐次計算することによって、
【0031】
【数8】
【0032】単語出力確率P(a1 ,…,aT |w)を
【0033】
【数9】
【0034】として求めることができる。
【0035】また式4におけるすべての可能な状態遷移
に関する和を最大確率を与える状態遷移だけで近似して
代用する「ビタビ計算法」も前記刊行物の46ページの
アルゴリズム3.4に説明されている。「ビタビ計算
法」では、式4の代わりに以下の式が計算される。
【0036】
【数10】
【0037】この場合はフォワード計算法の漸化式8に
おける和を最大値をとる演算に変更すれば他は同じであ
る。
【0038】
【数11】
【0039】「フォワード計算法」あるいは「ビタビ計
算法」を用いれば、各認識対象単語の標準パターンが入
力信号の特徴ベクトル系列を出力する単語出力確率が計
算される。そのなかで最大の単語出力確率を有する単語
名を認識結果として選択することによって、認識を行う
ことができる。
【0040】
【発明が解決しようとする課題】「従来の技術」の項で
説明したHMM法においては、単語の標準パターンは多
次元ガウス分布を有する状態の系列で表されている。す
なわちある単語wの標準パターンがNw 個の状態の系列
であるとすると、入力をNw 個の区間に分割して、各区
間は一つのガウス分布でモデル化されている。この様子
を図8に示す。図の横軸は入力信号の時間、縦軸は特徴
ベクトルの値at を表している。ここでは見易くするた
めに特徴ベクトルの次元は一次元としている。
【0041】
【外20】
【0042】は状態nのガウス分布の平均ベクトル、
【0043】
【外21】
【0044】は状態n+1のガウス分布の平均ベクトル
を表している。図8では時刻tn からtn+1 まで状態n
に滞在し、時刻tn+1 からtn+2 までは状態n+1に滞
在するような状態遷移を取り出して、標準パターンと入
力信号のマッチングの様子を示している。この図からも
明白なように、HMMはそれぞれの状態に対応付けられ
た区間の入力信号を平均値とそのまわりの分散で近似し
ている。たとえば時刻tn からtn+1 まで入力信号が滑
らかに変化している部分を
【0045】
【外22】
【0046】で近似している。このような区分的に平坦
なパターン(平均ベクトル)の系列に基づいて、音声信
号のような動的に変化する信号をモデル化するために
は、非常に多くの区間(状態)を必要とする。しかし状
態数を多くすることはモデルのパラメータ数(各状態の
平均ベクトルと共分散行列)の増加を伴う。さらに多数
のパラメータを信頼できる精度で推定するためには学習
データも膨大な数必要となる。
【0047】本発明の目的は、区分的に平坦なパターン
の系列による信号のモデル化では、精度の高いモデル化
を行うためにはモデルのパラメータ数が膨大になるとい
うHMM法が有する欠点を改良し、少ないパラメータ数
で高精度な信号のモデル化を行い、低コストかつ高性能
なパターン認識装置を実現するためのパターン認識方法
および装置を提供することにある。
【0048】
【課題を解決するための手段】本発明は、入力信号を特
徴ベクトルの系列a1 ,…,at ,…,aT に変換する
特徴抽出手段と、複数の状態とその状態間の遷移で構成
された認識対象単語wの標準パターンの各状態が有する
【0049】
【外23】
【0050】と、各状態の間の
【0051】
【外24】
【0052】を記憶する標準パターン記憶手段と、第t
−1フレームの特徴ベクトルat-1
【0053】
【外25】
【0054】を入力とする予測器を用いて第tフレーム
の特徴ベクトルat に対する
【0055】
【外26】
【0056】を計算する予測ベクトル計算手段と、認識
対象単語wの標準パターンの第n番目の状態において第
tフレームの特徴ベクトルat を出力する確率を計算す
るための出力確率分布として、前記予測ベクトル計算手
段により計算される
【0057】
【外27】
【0058】を平均ベクトルとし、
【0059】
【外28】
【0060】を共分散行列とする多次元ガウス分布を用
いる特徴ベクトル出力確率計算手段と、前記特徴ベクト
ル出力確率を用いて認識対象単語wの標準パターンが入
力信号の特徴ベクトル系列を出力する確率を隠れマルコ
フモデルのフォワード計算法あるいはビタビ計算法によ
り計算する単語確率計算手段と、すべての認識対象単語
に対する前記単語確率計算手段の出力のなかで最大の確
率値を有する単語を認識結果として出力する認識結果出
力手段とからなることを特徴とする。
【0061】
【作用】本発明の特徴は、HMM法における標準パター
ンの各状態の多次元ガウス分布の平均ベクトルを定数と
せずに、一時刻前の入力信号の特徴ベクトルから予測器
によって計算した予測ベクトルを用いることによって、
音声のような動的に変化する入力信号を少ないパラメー
タで効率良く表現することができる点である。
【0062】HMM法の場合、単語wの長さNw の標準
パターンは長さNw の状態の系列であり、第n番目の状
態は
【0063】
【数12】
【0064】で決まる
【0065】
【外29】
【0066】をベクトル出力確率分布として有する。
【0067】
【数13】
【0068】このベクトル出力確率分布を用いて、単語
出力確率が式4によって計算される。
【0069】本発明の場合、単語の長さNw の標準パタ
ーンは長さNw の状態の系列であり、第n番目の状態は
【0070】
【外30】
【0071】を有している。第n番目の状態が入力信号
の第t番目の特徴ベクトルat を出力するベクトル出力
確率は、次の多次元ガウス分布から算出される。
【0072】
【数14】
【0073】ここで従来のHMM法と異なるのはガウス
分布の平均ベクトルが定数の
【0074】
【外31】
【0075】ではなく、
【0076】
【外32】
【0077】に代わっている点である。この予測ベクト
ルは第n番目の状態のもつ
【0078】
【外33】
【0079】と入力信号の第t−1番目の特徴ベクトル
t-1 を用いて、予測器f(・)によって計算される。
【0080】
【数15】
【0081】ここで関数fは、特徴ベクトルの次元をP
次元、制御信号ベクトルの次元をQ次元とすると、P+
Q次元からP次元への関数である。この関数f(・)
は、時刻t−1の特徴ベクトルから時刻tの特徴ベクト
ルを予測する予測器とみなすことができる。予測の様子
を図1を用いて説明する。図は長さTの入力信号の特徴
ベクトル系列a1 ,…,at ,…,aT と長さNw の標
準パターンのマッチングを図式的に示したもので、HM
M法におけるトレリス(図7)に対応したものである。
ここで入力信号の時刻tと標準パターンの状態nで指定
されるトレリス上の格子点(t,n)において
【0082】
【外34】
【0083】を計算するために、予測器f(・)を用い
て多次元ガウス分布の平均ベクトルを
【0084】
【外35】
【0085】として計算している。この予測ベクトルの
計算には図からわかるように、第n番目の状態の有する
【0086】
【外36】
【0087】と一時刻前の入力信号の特徴ベクトルa
t-1 を用いている。
【0088】以上のように本発明によれば、第n番目の
状態のガウス分布の
【0089】
【外37】
【0090】が、時々刻々と入力信号に応じて
【0091】
【外38】
【0092】として計算し直される。そのためHMM法
において図8で指摘したような一定値の平均ベクトル
で、動的に変化する入力信号を記述するという問題点が
解消され、入力信号に追従して動的に変化する平均ベク
トルを用いて、入力音声と精度良くマッチングする標準
パターンを提供できる。その様子を図8に対比して、図
2に示した。この2つの図を比較することによっても、
本発明の有効性は明白である。
【0093】次に本発明において用いる予測器f(・)
について補足説明する。xとzをP次元のベクトル、y
をQ次元のベクトルとすると予測器は
【0094】
【数16】
【0095】と表される。このようなP+Q次元からP
次元への関数としてはさまざまなものが考えられる。
【0096】線形な関数としては行列を用いることがで
きる。
【0097】
【数17】
【0098】ここでzi ,xi ,yi はそれぞれベクト
ルの成分を表している。予測器は、P行P列の行列Fij
とP行Q列の行列GijとP次元のベクトルHi で表され
る。予測器のパラメータ数はP(P+Q+1)個であ
る。
【0099】非線形な関数としては、入力ユニットをP
+Q個、出力ユニットをP個有する階層的ニューラルネ
ットワークを用いることができる。階層的ニューラルネ
ットワークに関しては、「ニューラルネットワーク情報
処理(麻生英樹著、産業図書)」に詳しく解説されてい
る。隠れユニット数をH個とした3層ネットワークを用
いた場合の構成を図3に示す。この場合、予測器のパラ
メータは、入力層から隠れ層への結合係数(P+Q)H
個、隠れ層の閾値H個、隠れ層から出力層への結合係数
HP個と出力層の閾値P個である。
【0100】本発明で用いている予測器は上記のような
関数として実現されるが、これはすべての認識対象単語
の標準パターンのすべての状態に対して同じ予測器が使
用される。各認識対象単語の標準パターンの各状態にお
いてそれぞれ異なる制御信号ベクトルを用いて予測器を
駆動することによって、同じ特徴ベクトルat-1 から単
語や状態に応じて異なった
【0101】
【外39】
【0102】が出力される。
【0103】
【実施例】図4は本発明を実施した単語音声認識装置の
ブロック図である。マイクロホン10より入力された音
声信号は、分析部20によって標本化,デジタル化され
てから高速フーリエ変換などによって特徴ベクトルat
に変換されマイクロプロセッサ30に送られる。このマ
イクロプロセッサには、メモリとして標準パターン記憶
部40と、予測器パラメータ記憶部50と、特徴ベクト
ル記憶部60と、ワークメモリ70が接続されている。
【0104】標準パターン記憶部40には、各単語wの
標準パターンのパラメータとして、
【0105】
【外40】
【0106】の系列(ただしn=1,…,Nw )と各状
態間の
【0107】
【外41】
【0108】が記憶されている。予測器パラメータ記憶
部50には、予測器のパラメータが記憶されている(予
測器として線形なものを用いる場合、パラメータは
ij,Gij,Hi )。特徴ベクトル器部60に、一時刻
前の入力信号の特徴ベクトルat-1が記憶されている。
ワークメモリ70は、各認識対象単語の標準パターンに
よる単語出力確率を計算する際に、ベクトル出力確率や
累積確率を一時記憶しておくための作業エリアである。
これらの標準パターン記憶部40,予測器パラメータ記
憶部50,特徴ベクトル記憶部60,ワークメモリ70
は、マイクロプロセッサの主記憶内にあって区別される
メモリエリアとして定義されても良い。
【0109】認識処理は、マイクロプロセッサ30のプ
ログラムによって実行される。入力信号の先頭の特徴ベ
クトルa1 が入力されると、次のような初期設定が各認
識対象単語wの各状態に対して行われる(w=1,…,
W、n=1,…,Nw 、Nwは単語wの標準パターンの
状態数)。
【0110】
【数18】
【0111】これはフォワード計算法(あるいはビタビ
計算法)の式7の初期条件に対応したものである。また
特徴ベクトル記憶部60に、特徴ベクトルa1 を記憶す
る。
【0112】以下、入力信号の特徴ベクトルat が入力
される毎に、図5のフローチャートに示す処理がマイク
ロプロセッサ30によって実行される。図中の101の
ブロックでは、特徴ベクトル記憶部60に記憶された一
時刻前の特徴ベクトルat-1と標準パターン記憶部40
に記憶された
【0113】
【外42】
【0114】から式15に基づいて予測ベクトルを算出
する。そこで算出された予測ベクトルを平均ベクトルと
して、102のブロックにおいて
【0115】
【外43】
【0116】が式14に基づいて計算され、ワークメモ
リ70上に変数bとして格納される。103のブロック
においてはワークメモリ70上から累積確率αw (n)
を読み出して、それに標準パターン記憶部40から読み
出した
【0117】
【外44】
【0118】を乗じて、ワークメモリ70上に変数Pと
して格納する。104のブロックにおいてはワークメモ
リ70上から累積確率αw (n−1)を読み出して、そ
れに標準パターン記憶部40から読み出した
【0119】
【外45】
【0120】を乗じて、ワークメモリ70上の変数Pに
加算して格納する。103から104のブロックにおけ
る処理は、式8による漸化式計算に対応する。
【0121】以上の処理が終了すると、入力信号の時刻
が1時刻増加され、次の特徴ベクトルat の入力を待っ
て同様の処理が行われる。入力信号が終了して最後の特
徴ベクトルaT が処理された後、マイクロプロセッサ3
0の内部では次のような処理が行われる。ワークメモリ
70に記憶されている各単語w毎の累積確率α
w (NW )は、各単語の標準パターンが入力信号を出力
する単語出力確率を与えている。これらを順次比較する
ことによって最大値を求め、これに対応する
【0122】
【外46】
【0123】を認識結果として出力する。
【0124】
【発明の効果】以上述べたように、HMM法の各状態の
ガウス分布の平均ベクトルを定数ではなく、予測器によ
る予測ベクトルとして入力信号に応じて時々刻々計算し
直すことによって、少ない状態数、すなわち少ないパラ
メータ数で高精度な信号のモデル化を行い、低コストか
つ高性能なパターン認識装置の実現が可能となった。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理を説明するための図である。
【図3】本発明の原理を説明するための図である。
【図4】本発明の一実施例を示すブロック図である。
【図5】要部の処理を示すフローチャートである。
【図6】従来技術を説明するための図である。
【図7】従来技術を説明するための図である。
【図8】従来技術を説明するための図である。
【符号の説明】
10 マイクロホン 20 分析部 30 マイクロプロセッサ 40 標準パターン記憶部 50 予測器パラメータ記憶部 60 特徴ベクトル記憶部 70 ワークメモリ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】HMM法によって時系列パターンを認識す
    るパターン認識方法において、 HMM法の各状態のベクトル出力確率分布の平均ベクト
    ルとして、状態が有する制御信号ベクトルと入力信号の
    一時刻前の特徴ベクトルから予測器によって予測した予
    測ベクトルを用いることを特徴とするパターン認識方
    法。
  2. 【請求項2】入力信号を特徴ベクトルの系列a1 ,…,
    t ,…,aT に変換し、 複数の状態とその状態間の遷移で構成された認識対象単
    語wの標準パターンの各状態が有する 【外1】 と、各状態の間の 【外2】 を記憶し、 第t−1フレームの特徴ベクトルat-1 と 【外3】 を入力とする予測器を用いて第tフレームの特徴ベクト
    ルat に対する 【外4】 を計算し、 認識対象単語wの標準パターンの第n番目の状態におい
    て第tフレームの特徴ベクトルat を出力する確率を計
    算するための出力確率分布として、前記計算された 【外5】 を平均ベクトルとし、 【外6】 を共分散行列とする多次元ガウス分布を用い、 前記特徴ベクトル出力確率を用いて認識対象単語wの標
    準パターンが入力信号の特徴ベクトル系列を出力する確
    率を隠れマルコフモデルのフォワード計算法あるいはビ
    タビ計算法により計算し、 すべての認識対象単語に対する前記計算された確率のな
    かで最大の確率値を有する単語を認識結果として出力す
    ることを特徴とするパターン認識方法。
  3. 【請求項3】入力信号を特徴ベクトルの系列a1 ,…,
    t ,…,aT に変換する特徴抽出手段と、 複数の状態とその状態間の遷移で構成された認識対象単
    語wの標準パターンの各状態が有する 【外7】 と、各状態の間の 【外8】 を記憶する標準パターン記憶手段と、 第t−1フレームの特徴ベクトルat-1 と 【外9】 を入力とする予測器を用いて第tフレームの特徴ベクト
    ルat に対する 【外10】 を計算する予測ベクトル計算手段と、 認識対象単語wの標準パターンの第n番目の状態におい
    て第tフレームの特徴ベクトルat を出力する確率を計
    算するための出力確率分布として、前記予測ベクトル計
    算手段により計算される 【外11】 を平均ベクトルとし、 【外12】 を共分散行列とする多次元ガウス分布を用いる特徴ベク
    トル出力確率計算手段と、 前記特徴ベクトル出力確率を用いて認識対象単語wの標
    準パターンが入力信号の特徴ベクトル系列を出力する確
    率を隠れマルコフモデルのフォワード計算法あるいはビ
    タビ計算法により計算する単語確率計算手段と、 すべての認識対象単語に対する前記単語確率計算手段の
    出力のなかで最大の確率値を有する単語を認識結果とし
    て出力する認識結果出力手段とからなることを特徴とす
    るパターン認識装置。
JP5003647A 1993-01-13 1993-01-13 パターン認識方法および装置 Expired - Fee Related JPH0776880B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP5003647A JPH0776880B2 (ja) 1993-01-13 1993-01-13 パターン認識方法および装置
CA002113316A CA2113316C (en) 1993-01-13 1994-01-12 Method and system for recognizing pattern
EP94100445A EP0606913B1 (en) 1993-01-13 1994-01-13 Method and system for recognizing pattern
DE69417273T DE69417273T2 (de) 1993-01-13 1994-01-13 Verfahren und Vorrichtung zur Mustererkennung
US08/797,888 US5920839A (en) 1993-01-13 1997-02-10 Word recognition with HMM speech, model, using feature vector prediction from current feature vector and state control vector values

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5003647A JPH0776880B2 (ja) 1993-01-13 1993-01-13 パターン認識方法および装置

Publications (2)

Publication Number Publication Date
JPH06208392A JPH06208392A (ja) 1994-07-26
JPH0776880B2 true JPH0776880B2 (ja) 1995-08-16

Family

ID=11563277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5003647A Expired - Fee Related JPH0776880B2 (ja) 1993-01-13 1993-01-13 パターン認識方法および装置

Country Status (5)

Country Link
US (1) US5920839A (ja)
EP (1) EP0606913B1 (ja)
JP (1) JPH0776880B2 (ja)
CA (1) CA2113316C (ja)
DE (1) DE69417273T2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL122258A (en) * 1997-11-20 2002-08-14 Israel Aircraft Ind Ltd Method and system for determining temperature and/or emissivity function of objects by remote sensing
US6691110B2 (en) 2001-03-22 2004-02-10 International Business Machines Corporation System and method for discovering patterns with noise
US6772152B2 (en) * 2001-03-22 2004-08-03 International Business Machines Corporation System and method for mining patterns from a dataset
JP5200712B2 (ja) 2008-07-10 2013-06-05 富士通株式会社 音声認識装置、音声認識方法及びコンピュータプログラム
JP5089655B2 (ja) * 2009-06-22 2012-12-05 日本電信電話株式会社 音響モデル作成装置、その方法及びプログラム
US9015093B1 (en) 2010-10-26 2015-04-21 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
US8775341B1 (en) 2010-10-26 2014-07-08 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
US8478711B2 (en) 2011-02-18 2013-07-02 Larus Technologies Corporation System and method for data fusion with adaptive learning
CN104064183B (zh) * 2014-06-20 2017-12-08 哈尔滨工业大学深圳研究生院 一种基于动态hmm观察符号数的提高语音识别准确率的方法
CN104064179B (zh) * 2014-06-20 2018-06-08 哈尔滨工业大学深圳研究生院 一种基于动态hmm事件数的提高语音识别准确率的方法
US10741195B2 (en) * 2016-02-15 2020-08-11 Mitsubishi Electric Corporation Sound signal enhancement device
US11256869B2 (en) * 2018-09-06 2022-02-22 Lg Electronics Inc. Word vector correction method

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62231993A (ja) * 1986-03-25 1987-10-12 インタ−ナシヨナル ビジネス マシ−ンズ コ−ポレ−シヨン 音声認識方法
JP2545982B2 (ja) * 1989-05-10 1996-10-23 日本電気株式会社 パターン認識方法および標準パターン学習方法
JP2964507B2 (ja) * 1989-12-12 1999-10-18 松下電器産業株式会社 Hmm装置
US5696877A (en) * 1990-05-10 1997-12-09 Nec Corporation Pattern recognition using a predictive neural network
US5193142A (en) * 1990-11-15 1993-03-09 Matsushita Electric Industrial Co., Ltd. Training module for estimating mixture gaussian densities for speech-unit models in speech recognition systems
JP2979711B2 (ja) * 1991-04-24 1999-11-15 日本電気株式会社 パターン認識方式および標準パターン学習方式
US5276766A (en) * 1991-07-16 1994-01-04 International Business Machines Corporation Fast algorithm for deriving acoustic prototypes for automatic speech recognition

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子情報通信学会論文紙D−▲II▼J75−D−▲II▼No.11P.1770〜1777(平成4年11月)

Also Published As

Publication number Publication date
CA2113316A1 (en) 1994-07-14
JPH06208392A (ja) 1994-07-26
EP0606913A2 (en) 1994-07-20
DE69417273T2 (de) 1999-12-09
EP0606913A3 (en) 1994-12-28
EP0606913B1 (en) 1999-03-24
US5920839A (en) 1999-07-06
DE69417273D1 (de) 1999-04-29
CA2113316C (en) 1999-11-02

Similar Documents

Publication Publication Date Title
JP3581401B2 (ja) 音声認識方法
KR102167719B1 (ko) 언어 모델 학습 방법 및 장치, 음성 인식 방법 및 장치
JP2964507B2 (ja) Hmm装置
US5956679A (en) Speech processing apparatus and method using a noise-adaptive PMC model
KR20190125463A (ko) 음성 감정 검출 방법 및 장치, 컴퓨터 장치 및 저장 매체
JPH0934486A (ja) 音声認識方法、情報形成方法、音声認識装置および記録媒体
KR20020029494A (ko) 역 히든 마르코브 모델(ihmm)을 이용한 정보 탐색방법및 장치
WO1996002912A1 (en) Method and apparatus for speech recognition using optimised partial probability mixture tying
KR102541660B1 (ko) 음성 신호에 기반한 감정 인식 장치 및 방법
JPH0776880B2 (ja) パターン認識方法および装置
KR20220130565A (ko) 키워드 검출 방법 및 장치
WO2019138897A1 (ja) 学習装置および方法、並びにプログラム
CN113852432A (zh) 基于rcs-gru模型的频谱预测感知方法
CN110751260A (zh) 电子设备、任务处理的方法以及训练神经网络的方法
EP0725383A2 (en) Pattern adaptation system using tree scheme
CN116324973A (zh) 包含时间缩减层的基于变换器的自动语音识别系统
JP3589044B2 (ja) 話者適応化装置
CN112885367B (zh) 基频获取方法、装置、计算机设备和存储介质
KR20190141350A (ko) 로봇에서의 음성인식 장치 및 방법
JP2545982B2 (ja) パターン認識方法および標準パターン学習方法
JP2600871B2 (ja) Hmm作成装置及びそれを用いた尤度計算装置、時系列パターン認識装置
JP2008197463A (ja) 音声認識装置及び音声認識方法
JP2734828B2 (ja) 確率演算装置及び確率演算方法
Garg et al. Asynchronous HMM with applications to speech recognition
JP2845019B2 (ja) 類似度演算装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees