JP2983364B2 - 隠れマルコフモデルと音声信号との類似度計算方法 - Google Patents

隠れマルコフモデルと音声信号との類似度計算方法

Info

Publication number
JP2983364B2
JP2983364B2 JP4010077A JP1007792A JP2983364B2 JP 2983364 B2 JP2983364 B2 JP 2983364B2 JP 4010077 A JP4010077 A JP 4010077A JP 1007792 A JP1007792 A JP 1007792A JP 2983364 B2 JP2983364 B2 JP 2983364B2
Authority
JP
Japan
Prior art keywords
ijm
hmm
state
probability
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4010077A
Other languages
English (en)
Other versions
JPH05197388A (ja
Inventor
敬 三木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP4010077A priority Critical patent/JP2983364B2/ja
Publication of JPH05197388A publication Critical patent/JPH05197388A/ja
Application granted granted Critical
Publication of JP2983364B2 publication Critical patent/JP2983364B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は隠れマルコフモデルを
用いる音声認識方法において、隠れマルコフモデルと音
声信号との類似度を計算する方法に関する。
【0002】
【従来の技術】隠れマルコフモデル(Hidden M
arkov Model、以下HMMと呼ぶ)は、その
統計的性質から音声パタンのような発声速度の変化に伴
う時間変動、或いは発声の個人差や調音結合などの揺ら
ぎを含むパタンを適切に表現出来ることから、音声認識
の分野において近年広く用いられている。このHMMを
用いて音声を認識する方法、即ちHMM音声認識方法と
は、音声を確率的な遷移ネットワ−クと見做して認識処
理を行うものである。
【0003】HMMは図2に示すように幾つかの状態S
i ( 図ではS0 、S1 、S2 、S3)とそれらの状態間
の遷移を表す弧で表現される。各弧には状態Si からS
j に遷移する際の遷移確率AijとシンボルVk を出力す
る確率Bij(k) がパラメ−タとして与えられている。
【0004】HMMは初期状態と呼ばれる状態(図2の
0 )から遷移を開始して、最終状態と呼ばれる状態
(図2のS3 )に到達するまで弧を通って遷移を繰り返
し、様々なシンボル系列及びそのシンボル系列を出力す
る確率が得られる。
【0005】HMMが出力するシンボルは、例えば下記
の文献1に見られるような音声スペクトルをベクトル量
子化したコ−ド番号の場合もあれば、下記の文献2のよ
うに音声スペクトルそのものをシンボルと見立てる場合
もある。
【0006】文献1:“アン イントロダクション ツ
ウ ジ アプリケイション オブザ セオリイ オブ
プロバビリスティック ファンクション オブ ア マ
ルコフ プロセス ツウ オウトマティック スピイチ
レコグニション ”(“An Introducti
on to the Applicationof t
he theory of Probabilisti
cFunction of a Markov Pro
cess toAutomatic Speech R
ecognition ”,The Bell Sys
tem Technical Journal,Vo
l.62,No.4,Aplil 1983 pp.1
035〜1074S.E.Levinson,L.R.
Rabiner,M.M.Sondhi)
【0007】文献2:“レコグニション オブ アイソ
レイテッド ディジッツ ユウジング ヒドゥン マル
コフ モデルズ ウィズ コンティニュアス ミクスチ
ュアデンシテイズ ”(“Recognition o
f isolatedDigits Using Hi
dden Markov Modelswith Co
ntinuous Mixture Densitie
s”,Vol.64,No.6,July−Augus
t 1985 pp.1211〜1234, L.R.
Labiner, B.−H.juang,S.E.L
evinson,and M.M.Sondhi”)
【0008】文献1に記載される方法では、入力された
音声信号はスペクトル特徴系列に変換され、更に、ベク
トル量子化の手法によりコ−ド番号系列に変換された
後、予め設定された認識対象の音声を表現したHMMと
の尤度が計算される。
【0009】通常この場合のHMMは離散確率分布HM
Mと呼ばれており、その主要なパラメ−タは状態遷移確
率と各状態に対するコ−ドの出現確率の2つである。こ
の離散確率分布HMMでは、ある状態でのコ−ドの出現
確率密度関数をB(x)とするとxは離散化されたコ−
ド番号となるので、B(x)を記述するにはxの各番号
に対する出現確率の値が設定されたテ−ブルを用意すれ
ばよいことになる。従って、コ−ドの出現確率密度関数
の記述は正確に行える。
【0010】しかしながら、xを離散化する際の誤差、
即ち入力された音声信号の生のスペクトルとコ−ドの表
しているスペクトルとの差(量子化誤差)が生じ、認識
率が低下する原因となっていた。
【0011】また、文献2に示される方法では、このよ
うな問題点を解決するために、スペクトルの量子化を行
わず、ある状態でのシンボルxの出現確率密度関数B
(x)のxをコード番号では無く直接スペクトルを扱う
ようにしたものである。従って、B(x)は連続確率密
度分布になる。B(x)の真の関数型を求めるのは実際
上不可能なので、通常B(x)として数学的取扱が簡単
でかつ表現能力が高い多次元正規分布がよく用いられ
る。
【0012】しかしながら、一般に、ある状態遷移にお
けるシンボルの出現分布は一つの正規分布で近似できな
い場合があり、複数個の連続分布の和(混合分布)で近
似することがよく行われる。即ち、スペクトルを直接取
り扱うような場合には、混合連続確率密度分布をもつH
MMが用いられる。
【0013】
【発明が解決しようとする課題】しかしながら、音声信
号から求めたスペクトル特徴系列と、前述の混合連続確
率分布密度を持つHMMとの尤度を求めるのは膨大な計
算量を必要とし、実用的な方法とはいえない。
【0014】この発明の目的は、混合多次元正規分布に
よる連続確率密度分布をもつHMMと音声信号から抽出
されたスペクトル特徴系列との尤度算出時の演算量を、
認識精度を低下させることなく大幅に低減することがで
きる、隠れマルコフモデルと音声信号との類似度計算方
法を提供することにある。
【0015】
【課題を解決するための手段】この発明は前記課題を解
決するために、混合多次元正規分布による連続確率密度
分布bij(x) を状態Si から状態Sj に遷移する際の音
声の特徴ベクトルxの出現確率とするHMMを用いる音
声認識方法に於いて、(a) 入力音声から特徴ベクトル系
列x1 ,x2 ,・・・,xt ,・・・,xTを求める処
理と、(b) 前記連続確率密度分布bij(xt) のm番目の
正規分布N(μijm ,ρijm )の確率密度関数であるb
ijm(xt) を、ベクトルxt の次元pと共分散行列ρijm
と、平均ベクトルμijm 及びρijm の逆行列(ρijm )
-1に基づいて計算されるマハラノビスの汎距離Dijm
を用いて bijm(xt) = (2π)-p/2・|ρijm-1/2・exp(−D2 ijm /2) と定義し、更に前記連続確率密度分布bij(xt) を、分
岐確率λijm と状態Siから状態Sj に遷移する際の連
続確率密度分布bij(x) の混合数M(i,j) とを用いて、 と定式化し、bij(xt) の自然対数値Bij(xt) (=ln
(bij(xt)))を、 ijm =ln[(2π)-p/2・|ρijm-1/2]+ ln(λijm ) として求める処理と、(c) 当該HMMにおける状態Si
から状態Sj に遷移する際の遷移確率aijの自然対数値
ij(=ln( aij) )と前記Bij(xt) とを用いてビタ
ビアルゴリズムにより、当該HMMにおける特徴ベクト
ル系列x1 ,x2 ,・・・,xt ,・・・,xT の対数
出現確率lnP(x1 ,x2 ,・・・,xt ,・・・,x
T )を求めることにより、当該HMMと音声信号の特徴
ベクトル系列x1 ,x2 ,・・・,xt ,・・・,xT
との尤度を算出することを特徴とする。
【0016】
【作用】混合多次元正規分布による連続確率密度分布を
持つHMMと音声信号のスペクトル特徴系列との尤度算
出時の演算量低減の原理を以下で説明する。
【0017】HMMは次の6つのパラメ−タ群で定義さ
れる。 Si : 状態の集合 (i=1,2,3,・・・,I) x : 出力シンボルの集合 aij : 状態Si から状態Sj への遷移確率 (i,j=1,2,3,・・・,I) bij(x) : 状態Si から状態Sj への遷移時にシンボルxを出力する確率 (i,j=1,2,3,・・・,I) φi : 初期状態がSi である確率 (i=1,2,3,・・・,I) F : 最終状態の集合
【0018】連続出力分布型のHMMでは出力シンボル
は音声の特徴ベクトルxそのものであり、シンボルx
(即ち特徴ベクトルx)を出力する確率bij(x)として
は混合多次元正規分布による連続確率密度分布を用い
る。
【0019】混合多次元正規分布による連続確率密度分
布bij(x)のm番目の正規分布N(μijm ,ρijm )の確
率密度関数bijm(x)は、次のように表される。
【0020】 bijm(x) = (2π)-p/2 ・|ρijm-1/2 ・exp(−D2 ijm /2) (1) D2 ijm = (x−μijm )’・ ρijm -1 ・(x−μijm ) (2)
【0021】但しpはベクトルxの次元を表し、(x−
μijm )’はベクトル(x−μijm)の転置を意味す
る。また、bijm(x)は分岐密度と呼ばれ、Dはマハラ
ノビスの汎距離と呼ばれるものである。
【0022】更に、連続確率密度分布bij(x)は分岐密
度bijm(x)とm番目の分布の出現確率を表す分岐確率
λijm とを用いて、次式(3)のように表される。
【0023】尚、M(i,j) は混合数であり、λijm につ
いては以下の条件が成り立つ。
【0024】シンボル系列、即ち特徴ベクトルx1 ,x
2 ,・・・ ,xT が与えられた場合、HMMからの出現確
率P(x1 ,x2 ,・・・ ,xT )(単に出現確率Pと記
述する場合もある)を近似的に算出する方法としてビタ
ビ(Viterbi)アルゴリズムと呼ばれる方法が適
用できる。以下ビタビアルゴリズムによる出現確率Pの
計算手順を述べる。
【0025】<記号の定義> xt : 特徴ベクトル系列 (t=1,2,3,・・・,T) αit : 前向き確率(初期状態から遷移を開始し、特
徴ベクトル系列x1 ,x2 ,・・・ ,xt を生成して状態
i に至る確率)
【0026】前向き確率αitを次に示す漸化式(5),
(6)により求める。 αi0 = φi (5)
【0027】このとき、HMMからの出現確率P(x1 ,x2 ,…,xT )は次
式(7)で表される。 P(x1 ,x2 ,…,xT )=max(αiT) (7) i 但しiはSi ∈Fの条件を満たすものとする。
【0028】更に出現確率Pの自然対数値ln(P)を
直接求めることを考える。この値は、入力音声を表した
特徴ベクトルと認識対象カテゴリの音声を表現したHM
Mとの類似度と見做すことが出来る。ln(P)を計算す
る場合、前式(5)、(6)、(7)は次のように変更
される。 α'i0 = ln(φi) (8) 但し、Aij及びBij(xt)は其々aij、bij(xt)の自然
対数値である。 Aij = ln(aij) (11) Bij(xt) = ln(bij(xt)) (12)
【0029】ここで、前式(3)で表される連続確率密
度分布bij(x)の定式化を次のように変更する。
【0030】このように定式化を変更することによりb
ij(x)の自然対数値であるBij(x)は次式(14)で表
せる。
【0031】ここで、Bijm(x)=ln(bijm(x))とす
ると、式(1)より Bijm(x) = ln{(2π)-p/2・|ρijm-1/2}−D2 ijm /2 (15) と表され、式(14)、(15)の定数項をCijm とし
てまとめるとBij(x)は結局次式(16)で計算出来
る。 ijm = ln{(2π)-p/2・|ρijm |-1/2}+ ln(λijm ) (17)
【0032】従って連続確率密度分布bij(x)を式(1
3)に従って定式化することにより、式(16)で示さ
れるようにexpの計算が不要になり、HMMからの出
現確率Pの自然対数値ln(P)を算出する場合の演算が
簡略化され、前記課題が解決されるのである。
【0033】
【実施例】図1は本発明の実施例の構成を示す機能ブロ
ック図であり、音響処理部100、HMM照合部10
1、辞書部102とから構成されている。
【0034】入力音声信号は音響処理部100において
音声の特徴を表す特徴パラメ−タで構成される特徴ベク
トル系列xt (t=1,2,・・・,T)に変換され
る。
【0035】この特徴パラメ−タとしては、中心周波数
が少しづつ異なる複数のバンドパスフィルタ群の出力や
フ−リエ解析のパワ−スペクトルを使用するもの、また
は、線形予測分析即ちLPC分析から求めたLPCケプ
ストラム係数を用いるのが一般的である。本実施例では
バンドパスフィルタ群を使用する方法を用いる。
【0036】音声信号は音響処理部100でアナログ・
デジタル変換された後、バンドパスフィルタによりその
中心周波数成分のみが抽出される。このようにして各バ
ンドパスフィルタによって振り分けられたデ−タの系列
をチャネルと称する。各チャネル毎のフィルタの出力を
整流して絶対値を取り、フレ−ム単位でその平均値を算
出する。この平均値がそのフレ−ムにおける各チャネル
の特徴ベクトルになる。t番目のフレ−ムにおける特徴
ベクトルxt はpをチャネル数として、xt =(xt1
t2,・・・,xtp)と表される。音声の始端フレ−ム
をt=1,終端フレ−ムをt=Tとすると、特徴ベクト
ル系列xt は音声全体の特徴を表現したものとなる。
【0037】このようにして求められたシンボル系列、
即ち特徴ベクトル系列xt はHMM照合部101に送ら
れる。HMM照合部101は、辞書部102に格納され
ている認識対象カテゴリzを表現したHMMとシンボル
系列xt とを照合し、出現確率の自然対数値ln(pz
を計算する。以上が認識動作の概要である。
【0038】以下、辞書部102に格納するHMMパラ
メ−タの設定方法とHMM照合部101の動作について
説明する。
【0039】認識対象カテゴリzのHMMパラメ−タを
以下で定義する。 IZ : HMMの状態数 az ij : 状態Si から状態Sj への状態遷移確率 (i,j=1,2,・・・, IZ ) bz ij(x) : 状態Si から状態Sj への遷移時のシンボルxの出力確率 φz i : 初期状態がSi である確率 (i=1,2,・・・,IZ ) Fz : 最終状態の集合
【0040】前記HMMパラメ−タの設定方法を下記の
(a)〜(d)に示す。 (a) 予め認識対象となる学習用音声デ−タを収集す
る。
【0041】(b) 学習用音声デ−タを音響処理部1
00で分析し、学習用音声デ−タについての前記特徴ベ
クトルの系列を表した学習特徴ベクトル系列デ−タを作
成する。
【0042】(c) HMMパラメ−タの初期値を下記
の手順で設定する。 (c-1) HMMのステ−ト数IZ を学習特徴ベクトル系
列長の平均値に基づいて設定する(通常、平均値の数分
の1程度に設定する)。 (c-2) 混合分布数MZ(i,j) を学習用音声デ−タ数に基
づき設定する(通常、音声デ−タ数の数分の1程度に設
定する)。 する。 az ij = 1/IZ +ε (18) (c-4) bz ij(x) 及び第m番目の正規分布N(μ
z ijm ,ρz ijm )を表現するためのパラメ−タであるμ
z ijm 、ρz ijm 及び分岐確率をλz ijm を、次式(1
9)〜(21)のように設定する。 μz ijm = μz +ε (19) ρz ijm = ρz (20) λz ijm = 1/MZ(i,j) (21) 但し、μz 、ρz は各々学習特徴ベクトルの平均ベクト
ル、分散である。また、式(18)及び(19)におけ
るεは平均値が0となるような小さな乱数値である。 (c-5) 初期状態φz i を次のように設定する。 φz i = 1 (i=0) = 0 (i≠0) (22)
【0043】(d) 学習特徴ベクトル系列の出力確率
が最大となるHMMパラメ−タ、即ち認識対象カテゴリ
zを表現したHMMパラメ−タを求める。この計算方法
は、下記文献3のセクション1.CのHMMにおける3
つの基本的問題(261頁参照)の3番目に相当する。
この解法の詳細については文献3を参照のこと。
【0044】文献3:“ア チュウトリアル オン ヒ
ドゥン マルコフ モデルズ アンド セレクティッド
アプリケイションズ イン スピイチ レコグニショ
ン”(“A Tutorial on Hidden
Markov Modelsand Selected
Applications in SpeechRe
cognition ”,Prodeeding of
the IEEE,Vol.77,No.2,Feb.1
989,pp.257〜286,L.R.Rabine
r)
【0045】次にHMM照合部101の動作を説明す
る。bz ij(x)の第m番目の正規分布をN(μz ijm ,ρ
z ijm )とし、その分岐確率をλz ijm とすると、b
z ij(x)は式(23)、(24)、(25)で計算出来る。但しMz(i,
j)はカテゴリzにおける混合数である。 z 2 ijm =(x−μz ijm )’・ρz ijm -1・(x−μz ijm ) (24) Cz ijm = ln{(2π)-p/2・|ρz ijm-1/2}+ ln(λz ijm ) (25)
【0046】また、前式(11)、(12) におけるAij、Bij
(x)に対応してAz ij、Bz ij(x)は各々下記式(2
6)、(27) となる。 Az ij = ln(az ij) (26) Bz ij(x) = ln(bz ij(x)) (27)
【0047】HMMにおけるカテゴリzのシンボル系列
の出現確率Pz に対する自然対数値ln(Pz)は式(8)、
(9)、(10)を用いて計算される。即ち、式(9) はtの漸化
式であるからt=1,2,・・・,Tの順にα'itが計
算出来る。具体的な計算の手順を下記に示す。
【0048】
【0049】この結果と式(10)から出現確率の自然対数
値ln(pz)が計算される。この値は、入力音声を表し
た特徴ベクトル系列と認識対象カテゴリの音声を表した
HMMとの類似度と見做すことが出来る。一つのカテゴ
リに対する前述の計算を認識対象カテゴリの数だけ実行
し、その結果ln(pz)が最大となるカテゴリ、即ち類似
度が最大となるカテゴリが認識対象カテゴリとして出力
される(結果出力)。
【0050】表1は、男女各50名が発声した32単語
のデ−タを評価デ−タとして不特定話者単語認識を行っ
た時の認識性能の評価結果を示したものである。本発明
の方法は従来の方法に比べて処理時間が63%削減さ
れ、更に、そのような高速処理にもかかわらず認識率の
低下は全くみられず、本発明の方法の有効性はこの実験
結果からも明らかである。
【0051】
【表1】
【0052】
【発明の効果】以上説明したように、本発明によればス
ペクトルの量子化歪が無く、高い認識性能が得られる混
合多次元正規分布による連続確率密度分布を持つHMM
を用いた音声認識装置において、スペクトル特徴系列と
の尤度算出の演算量を、認識精度を低下させることなく
大幅に低減することができるという優れた効果を奏す
る。
【図面の簡単な説明】
【図1】実施例の構成を示す機能ブロック図である。
【図2】HMMの一例を示す図である。
【符号の説明】
100 音響処理部 101 HMM照合部 102 辞書部
フロントページの続き (56)参考文献 特開 平5−6194(JP,A) 特開 平4−125599(JP,A) 特開 平4−83296(JP,A) Proceedings of 1989 IEEE Internationa l Conference on Ac oustics,Speech and Signal Processin g,Vol.1”Vector Qua ntization of the C ontinous Distribut ion of an HMM Spee ch Recogniser base d on Mixtures of C ontinuous Distribu tions”p.9−12 Proceedings of 1989 IEEE Internationa l Conference on Ac oustics,Speech and Signal Processin g,Vol.1”Phoneme Mo delling using Cont inuous Mixture Den sities”p.437−440 Proceedings of 1986 IEEE Internationa l Conference on Ac oustics,Speech and Signal Processin g,Vol.1”Mixture Au toregressive Hidde n Markov Models fo r Speaker Independ ent Isolated Word Recognition”p.41−44 IEEE Transactions on Acoustics,Spee ch and Signal Proc essing,Vol.ASSP−33, No.6,December 1985," Mixture Autoregres sive Hidden Markov Models for Speech Signals”,p.1404−1413 Computer Speech a nd Language,Vol.3, No.3,1989,”Semi−Cont inuous Hidden Mark ov Models for Spee ch Signals”,p.239−251 AT&T Technical Jo urnal,Vol.64,No.6,J uly−August 1985,”Rec ognition of Isolat ed Digits Using Hi dden Markov Models with Continuous M ixture Desities”, p.1211−1234 電子情報通信学会技術研究報告[電気 音響]Vol.91,No.44,EA91− 5,「複数話者音声認識におけるHMM の設計法」p.9−15(1991) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 535 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 混合多次元正規分布による連続確率密度
    分布bij(x) を状態Si から状態Sj に遷移する際の音
    声の特徴ベクトルxの出現確率とするHMMを用いる音
    声認識方法に於いて、 (a) 入力音声から特徴ベクトル系列x1 ,x2 ,・・
    ・,xt ,・・・,xTを求める処理と、 (b) 前記連続確率密度分布bij(xt) のm番目の正規分
    布N(μijm ,ρijm )の確率密度関数であるbijm(xt)
    を、ベクトルxt の次元pと、共分散行列ρijmと、平
    均ベクトルμijm 及びρijm の逆行列(ρijm-1に基
    づいて計算されるマハラノビスの汎距離Dijm とを用い
    て bijm(xt) = (2π)-p/2・|ρijm-1/2・exp(−D2 ijm /2) と定義し、更に前記連続確率密度分布bij(xt) を、分
    岐確率λijm と状態Siから状態Sj に遷移する際の連
    続確率密度分布bij(x) の混合数M(i,j) とを用いて、 と定式化し、bij(xt) の自然対数値Bij(xt) (=ln(
    ij(xt)))を、 ijm = ln[(2π)-p/2・|ρijm-1/2]+ ln(λijm ) として求める処理と、 (c) 当該HMMにおける状態Si から状態Sj に遷移す
    る際の遷移確率aijの自然対数値Aij(=ln( aij) )
    と前記Bij(xt) とを用いてビタビアルゴリズムによ
    り、当該HMMにおける特徴ベクトル系列x1 ,x2
    ・・・,xt ,・・・,xT の対数出現確率lnP(x
    1 ,x2 ,・・・,xt ,・・・,xT )を求めること
    により、当該HMMと音声信号の特徴ベクトル系列x
    1 ,x2 ,・・・,xt ,・・・,xT との尤度を算出
    することを特徴とする、隠れマルコフモデルと音声信号
    の類似度計算方法。
JP4010077A 1992-01-23 1992-01-23 隠れマルコフモデルと音声信号との類似度計算方法 Expired - Fee Related JP2983364B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4010077A JP2983364B2 (ja) 1992-01-23 1992-01-23 隠れマルコフモデルと音声信号との類似度計算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4010077A JP2983364B2 (ja) 1992-01-23 1992-01-23 隠れマルコフモデルと音声信号との類似度計算方法

Publications (2)

Publication Number Publication Date
JPH05197388A JPH05197388A (ja) 1993-08-06
JP2983364B2 true JP2983364B2 (ja) 1999-11-29

Family

ID=11740296

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4010077A Expired - Fee Related JP2983364B2 (ja) 1992-01-23 1992-01-23 隠れマルコフモデルと音声信号との類似度計算方法

Country Status (1)

Country Link
JP (1) JP2983364B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002007146A1 (fr) * 2000-07-13 2002-01-24 Asahi Kasei Kabushiki Kaisha Dispositif de reconnaissance vocale et procede de reconnaissance vocale
US7813925B2 (en) 2005-04-11 2010-10-12 Canon Kabushiki Kaisha State output probability calculating method and apparatus for mixture distribution HMM

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5200712B2 (ja) 2008-07-10 2013-06-05 富士通株式会社 音声認識装置、音声認識方法及びコンピュータプログラム
CN115273892A (zh) * 2022-07-27 2022-11-01 腾讯科技(深圳)有限公司 音频处理方法、装置、设备、存储介质和计算机程序产品

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
AT&T Technical Journal,Vol.64,No.6,July−August 1985,"Recognition of Isolated Digits Using Hidden Markov Models with Continuous Mixture Desities",p.1211−1234
Computer Speech and Language,Vol.3,No.3,1989,"Semi−Continuous Hidden Markov Models for Speech Signals",p.239−251
IEEE Transactions on Acoustics,Speech and Signal Processing,Vol.ASSP−33,No.6,December 1985,"Mixture Autoregressive Hidden Markov Models for Speech Signals",p.1404−1413
Proceedings of 1986 IEEE International Conference on Acoustics,Speech and Signal Processing,Vol.1"Mixture Autoregressive Hidden Markov Models for Speaker Independent Isolated Word Recognition"p.41−44
Proceedings of 1989 IEEE International Conference on Acoustics,Speech and Signal Processing,Vol.1"Phoneme Modelling using Continuous Mixture Densities"p.437−440
Proceedings of 1989 IEEE International Conference on Acoustics,Speech and Signal Processing,Vol.1"Vector Quantization of the Continous Distribution of an HMM Speech Recogniser based on Mixtures of Continuous Distributions"p.9−12
電子情報通信学会技術研究報告[電気音響]Vol.91,No.44,EA91−5,「複数話者音声認識におけるHMMの設計法」p.9−15(1991)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002007146A1 (fr) * 2000-07-13 2002-01-24 Asahi Kasei Kabushiki Kaisha Dispositif de reconnaissance vocale et procede de reconnaissance vocale
US7272561B2 (en) 2000-07-13 2007-09-18 Asahi Kasei Kabushiki Kaisha Speech recognition device and speech recognition method
US7813925B2 (en) 2005-04-11 2010-10-12 Canon Kabushiki Kaisha State output probability calculating method and apparatus for mixture distribution HMM

Also Published As

Publication number Publication date
JPH05197388A (ja) 1993-08-06

Similar Documents

Publication Publication Date Title
US5345536A (en) Method of speech recognition
JP3373305B2 (ja) 音声認識用データ圧縮
EP0921519B1 (en) Technique for adaptation of hidden Markov Models for speech recognition
US6529866B1 (en) Speech recognition system and associated methods
Bahl et al. Multonic Markov word models for large vocabulary continuous speech recognition
JPH0555040B2 (ja)
US5459815A (en) Speech recognition method using time-frequency masking mechanism
US5594834A (en) Method and system for recognizing a boundary between sounds in continuous speech
JP2002366187A (ja) 音声認識装置および音声認識方法、並びにプログラムおよび記録媒体
JP2002511609A (ja) 音声認識システムのための動的にコンフィギュレーション可能な音響モデル
US5734793A (en) System for recognizing spoken sounds from continuous speech and method of using same
US20010010039A1 (en) Method and apparatus for mandarin chinese speech recognition by using initial/final phoneme similarity vector
US4876720A (en) Speech recognition system
US5943647A (en) Speech recognition based on HMMs
Bahi et al. Combination of vector quantization and hidden Markov models for Arabic speech recognition
Nakamura et al. Speaker adaptation applied to HMM and neural networks
Fukuda et al. Distinctive phonetic feature extraction for robust speech recognition
Manasa et al. Comparison of acoustical models of GMM-HMM based for speech recognition in Hindi using PocketSphinx
JP2983364B2 (ja) 隠れマルコフモデルと音声信号との類似度計算方法
Syfullah et al. Efficient vector code-book generation using K-means and Linde-Buzo-Gray (LBG) algorithm for Bengali voice recognition
Wu et al. Speaker identification based on the frame linear predictive coding spectrum technique
JP3029803B2 (ja) 音声認識のための単語モデル生成装置及び音声認識装置
Ranjan et al. Acoustic Feature Extraction and Isolated Word Recognition of Speech Signal Using HMM for Different Dialects
Li Speech recognition of mandarin monosyllables
Guerid et al. Recognition of isolated digits using HMM and harmonic noise model

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990831

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070924

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080924

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080924

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090924

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees