JPH1138993A

JPH1138993A - Ｈｍｍパラメータ学習方法と装置

Info

Publication number: JPH1138993A
Application number: JP9191116A
Authority: JP
Inventors: Takashi Miki; 敬三木
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1997-07-16
Filing date: 1997-07-16
Publication date: 1999-02-12

Abstract

(57)【要約】【課題】学習データ以外のデータを考慮した安定なＨ
ＭＭパラメータを、従来のＢＷ法による学習と大差ない
演算量で学習すること。【解決手段】ステップS101では、カテゴリーk に属す
る複数の音声学習データを読み込み、これを分析して特
徴ベクトル（以下学習データという）Ｙaknを求める。
ステップS102では、この学習データＹakn を用いて、Ｈ
ＭＭパラメータΘa を推定する。ステップS103では、ス
テップS102で推定したＨＭＭパラメータΘa により学習
データＹakn を識別し、カテゴリーが間違って識別され
た誤識別データＹbkn を見いだす。ステップS104では、
ＢＷ法により、ステップS103で見いだした誤識別データ
Ｙbkn を用いてＨＭＭパラメータΘb を推定する。ステ
ップS105では、ステップS102で推定したＨＭＭパラメー
タΘa とステップS103で推定したＨＭＭパラメータΘb
とを併用して識別処理を実行する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ＨＭＭパラメータ
学習方法とその方法を用いたＨＭＭパラメータ学習装置
に関するものである。

【０００２】

【従来の技術】隠れマルコフモデル(Hidden Markov Mod
el、以下ＨＭＭと呼ぶ) を用いて音声を認識するＨＭＭ
音声認識方法は、音声を確率的な遷移ネットワークとみ
なして認識処理を行うものである。このＨＭＭは、図６
に示すようにいくつかの状態Si（図６ではS0、S1、S2、
S3）とそれら状態間の遷移を表わす弧で表現され、各弧
には、その弧を遷移する遷移確率Ａklと、遷移の際にあ
る音声スペクトルx を出力する確率Ｂkl(x) とがパラメ
ータとして与えられている。そして、初期状態（図６で
はS0）から遷移を開始して最終状態（図６ではS3）に到
達するまでに弧を通って遷移を繰り返し、スペクトル系
列を出力する確率が得られる。

【０００３】このようなＨＭＭ音声認識方法を用いた音
声認識装置の構成例を図７に示す。この装置は、学習デ
ータ記憶部701 に予め格納されている学習データを用い
て、ＨＭＭパラメータ学習部702 により音声の特徴を表
現したＨＭＭパラメータを学習し、学習後のＨＭＭパラ
メータ（辞書）をＨＭＭパラメータ記憶部703 に格納す
る。そして、音声認識部704 により、音声認識の対象と
なる入力音声とＨＭＭパラメータ記憶部703 に格納され
ているＨＭＭパラメータとを照合してその入力音声を認
識し、その認識結果を出力するものである。

【０００４】このＨＭＭパラメータ学習部702 によるＨ
ＭＭパラメータの学習には、Baum-Welchアルゴリズム
（以下ＢＷ法と呼ぶ）（例えば、中川、『確率モデルに
よる音声認識』、第29〜73頁、電子情報通信学会発行
（昭和63年７月）、以下文献１という）が一般に用いら
れている。また、識別誤り最小化基準に基づく学習法
（以下ＭＣＥ（Minimum Classification Error）法と呼
ぶ）が提案されている（例えば、ヤング他、『Discrimi
native Learning for Minimum Error Classification』
IEEE Trans.Signal Processing、第40巻、第12号、第30
43〜3054頁（1992年10月、以下文献２という）。このＭ
ＣＥ法は、ＨＭＭパラメータΘと学習データＹから算出
される識別誤り量Ｌ（Θ、Ｙ）を最小化する学習方法で
ある。

【０００５】

【発明が解決しようとする課題】しかしながら、上述の
ＢＷ法は、比較的少ない演算量で安定なＨＭＭパラメー
タを得ることができるが、学習データに対するＨＭＭパ
ラメータの最適値を求める際、学習データ以外のデータ
は全く考慮していなかった。このため、学習データ以外
のデータに対しては誤って識別する場合が生じ、識別性
能を一定以上に高くすることが困難となる可能性があっ
た。

【０００６】一方、ＭＣＥ法は、学習データ全体の誤り
を考慮しているが、ＨＭＭパラメータの数を固定した場
合の最適値を求める方法であるため、パラメータ数の増
減を伴う場合には適応できないという問題点があった。
また、ＢＷ法に比べ演算量が膨大になるという課題もあ
った。更には、学習データ数が少ない場合には、求めた
ＨＭＭパラメータが学習データに極端に依存する傾向が
あるので、学習データ数を多くとる必要があり、その結
果演算量がますます膨大になるという問題点があった。

【０００７】本発明はこのような従来技術の問題点を解
消し、学習データ以外のデータを考慮した安定なＨＭＭ
パラメータを、従来のＢＷ法による学習と大差ない演算
量で学習できるＨＭＭパラメータ学習方法と装置を提供
することを目的とする。

【０００８】

【課題を解決するための手段】本発明は上述の課題を解
決するために、学習データを用いてＢＷ法により第１の
ＨＭＭパラメータを推定する第１の工程と、第１のＨＭ
Ｍパラメータにより学習データを識別することにより識
別誤りを起こした誤識別データを見いだす第２の工程
と、誤識別データを用いてＢＷ法により第２のＨＭＭパ
ラメータを推定する第３の工程とを含み、前記第１のＨ
ＭＭパラメータおよび第２のＨＭＭパラメータはデータ
識別処理において併用されるものであることを特徴とす
る。

【０００９】また、本発明は、学習データを用いてＢＷ
法により第１のＨＭＭパラメータを推定する第１の工程
と、第１のＨＭＭパラメータにより学習データを識別す
ることにより識別誤りを起こした誤識別データを見いだ
す第２の工程と、誤識別データを用いてＢＷ法により第
２のＨＭＭパラメータを推定する第３の工程と、第１の
ＨＭＭパラメータと第２のＨＭＭパラメータを混合して
第３のＨＭＭパラメータを生成する第４の工程とを含
み、第３のＨＭＭパラメータをモデルのＨＭＭパラメー
タとすることを特徴とする。

【００１０】また、本発明は、学習データを用いてＢＷ
法により第１のＨＭＭパラメータを推定する第１の工程
と、第１のＨＭＭパラメータにより学習データを識別す
ることにより識別誤りを起こした誤識別データを見いだ
す第２の工程と、誤識別データを用いてＢＷ法により第
２のＨＭＭパラメータを推定する第３の工程と、第１の
ＨＭＭパラメータと第２のＨＭＭパラメータを混合して
第３のＨＭＭパラメータを生成する第４の工程と、第１
のＨＭＭパラメータの内容を第３のＨＭＭパラメータの
内容で置き換える第５の工程とを含み、第２の工程から
第５の工程までの処理を、第２の工程で見いだす誤識別
データの数が所定値以下になるまで順次繰り返し実行
し、実行後の第３のＨＭＭパラメータをモデルのＨＭＭ
パラメータとすることを特徴とする。

【００１１】また、本発明は、学習データを用いてＢＷ
法により第１のＨＭＭパラメータを推定する第１の工程
と、第１のＨＭＭパラメータにより学習データを識別す
ることにより識別誤りを起こした誤識別データを見いだ
す第２の工程と、誤識別データを用いてＢＷ法により第
２のＨＭＭパラメータを推定する第３の工程と、第１の
ＨＭＭパラメータと第２のＨＭＭパラメータを混合して
第３のＨＭＭパラメータを生成する第４の工程と、第３
のＨＭＭパラメータを初期値としてＢＷ法により第４の
ＨＭＭパラメータを推定し、第１のＨＭＭパラメータの
内容第４のＨＭＭパラメータの内容で置き換える第５の
工程とを含み、第２の工程から第５の工程までの処理
を、第２の工程で見いだす誤識別データの数が所定値以
下になるまで順次繰り返し実行し、実行後の第４のＨＭ
ＭパラメータをモデルのＨＭＭパラメータとすることを
特徴とする。

【００１２】また、本発明は、学習データを用いてＢＷ
法によりＨＭＭパラメータを推定し、推定したＨＭＭパ
ラメータを初期値としてＭＣＥ法により第１のＨＭＭパ
ラメータを推定する第１の工程と、第１のＨＭＭパラメ
ータにより学習データを識別することにより識別誤りを
起こした誤識別データを見いだす第２の工程と、誤識別
データを用いてＢＷ法により第２のＨＭＭパラメータを
推定する第３の工程と、第１のＨＭＭパラメータと第２
のＨＭＭパラメータを混合して第３のＨＭＭパラメータ
を生成する第４の工程と、第３のＨＭＭパラメータを初
期値としてＭＣＥ法により第４のＨＭＭパラメータを推
定し、第１のＨＭＭパラメータの内容を第４のＨＭＭパ
ラメータの内容で置き換える第５の工程とを含み、第２
の工程から第５の工程までの処理を、第２の工程で見い
だす誤識別データの数が所定値以下になるまで順次繰り
返し実行し、実行後の第４のＨＭＭパラメータをモデル
のＨＭＭパラメータとすることを特徴とする。

【００１３】

【発明の実施の形態】次に添付図面を参照して本発明に
よるＨＭＭパラメータ学習方法の実施例を詳細に説明す
る。

【００１４】本実施例は、本発明を音声認識におけるＨ
ＭＭパラメータ学習方法に適用した場合の例であって、
図７に示す音声認識装置のＨＭＭパラメータ学習部702
により実行される。なお、ＨＭＭパラメータ学習部702
における処理は、例えば、プログラム制御によるコンピ
ュータにより実現することができる。

【００１５】まず、本発明の第１の実施例のＨＭＭパラ
メータ学習方法について図１のフローチャートを用いて
説明する。この第１の実施例は、学習データを用いてＢ
Ｗ法によりＨＭＭパラメータΘa を推定し、この推定し
たＨＭＭパラメータΘa により学習データを識別して誤
識別データを見いだす。そして、この誤識別データを用
いてＢＷ法によりＨＭＭパラメータΘb を推定し、推定
したＨＭＭパラメータΘa とΘb を併用して識別処理を
行うものである。

【００１６】図１において、最初のステップS101では、
図７の学習データ記憶部701 に格納してあるカテゴリー
k に属する複数の音声学習データを読み込み、これを分
析して音声の物理的な特徴を表わす特徴ベクトル（以下
学習データという）Ｙakn (n＝1,2,...,N)を求める。な
お、音声学習データの分析には、例えば、文献１（第５
〜12頁）に記載されているＬＰＣケプストラム法を用い
ることができる。ステップS102では、この学習データＹ
akn を用いて、ＨＭＭパラメータΘa を推定する。具体
的には、学習データＹakn を出力する確率を最大にする
するようなＨＭＭパラメータΘa を、例えば、文献１
（第51〜67頁）に記載されているＢＷ法により推定す
る。

【００１７】ステップS103では、ステップS102で推定し
たＨＭＭパラメータΘa により学習データＹakn を識別
し、カテゴリーが間違って識別された誤識別データＹbk
n を見いだす。具体的には、カテゴリーk の学習データ
Ｙakn に対して、カテゴリーk のＨＭＭパラメータΘa
による尤度Ｐ（Θa ）と、カテゴリーk 以外の全てのＨ
ＭＭパラメータΘx 中で最大の尤度Ｐ（Θx ）とを算出
して比較する。そして、尤度Ｐ（Θx ）が尤度Ｐ（Θa
）より大きい場合のデータを、カテゴリーk のデータ
がカテゴリーk 以外のデータであると間違って識別され
た誤識別データＹbkn であるとする。ここで、尤度Ｐ
（Θ）は、ＨＭＭパラメータΘのＨＭＭが学習データＹ
knを出力する確率であり、例えば、文献１（第40〜46
頁）に記載された前向きパスアルゴリズム、ビタビアル
ゴリズム等を用いて算出することができる。

【００１８】ステップS104では、ステップS102の場合と
同様にＢＷ法により、ステップS103で見いだした誤識別
データＹbkn を用いてＨＭＭパラメータΘb を推定す
る。ステップS105では、ステップS102で推定したＨＭＭ
パラメータΘa とステップS103で推定したＨＭＭパラメ
ータΘb とを併用して識別処理を実行する。具体的に
は、ＭＭパラメータΘa をサブカテゴリーakに対応する
ＭＭパラメータΘakとし、ＨＭＭパラメータΘb をサブ
カテゴリーbkに対応するＭＭパラメータΘbkとして、カ
テゴリーk は、サブカテゴリーakと bk が合成されたも
のと定義する。

【００１９】したがって、図７の音声認識部704 により
カテゴリーk の識別処理を実行する場合には、サブカテ
ゴリーakに対応するＭＭパラメータΘakによる尤度Ｐ
（Θak）と、サブカテゴリーbkに対応するＭＭパラメー
タΘbkによる尤度Ｐ（Θbk）とを算出し、両尤度のうち
値の大きい尤度を求める尤度Ｐ（Θk ）として処理すれ
ばよいことになる。

【００２０】以上説明したように第１の実施例によれ
ば、識別処理の際にＨＭＭパラメータΘa と併用するＨ
ＭＭパラメータΘb を極めて簡便かつ従来の処理と大差
ない演算量で推定できるので、高精度な音声認識装置を
短期間で作り上げることができる。

【００２１】次に、本発明の第２の実施例のＨＭＭパラ
メータ学習方法について図２のフローチャートを用いて
説明する。この第２の実施例は、学習データを用いてＢ
Ｗ法により推定したＨＭＭパラメータΘa の出力密度関
数Ｂaks と、誤識別データを用いてＢＷ法により推定し
たＨＭＭパラメータΘb の出力密度関数Ｂbks との類似
性を判定し、類似しない場合には、ＨＭＭパラメータΘ
a とＨＭＭパラメータΘb の出力密度関数を混合してＨ
ＭＭパラメータΘc を作成するものである。

【００２２】図２において、ステップS201からS204まで
の処理は、図１に示す第１の実施例のステップS101から
S104までの処理と同じであり、ステップS201では、カテ
ゴリー kに属する複数の音声学習データを分析してその
特徴ベクトル（以下学習データという）Ｙakn を求め、
ステップS202では、この学習データＹakn を用いてＢＷ
法によりＨＭＭパラメータΘa を推定し、ステップS203
では、このＨＭＭパラメータΘa のＨＭＭにより学習デ
ータＹakn を識別して過識別データＹbkn を見いだし、
ステップS204では、この誤識別データＹbkn を用いてＨ
ＭＭパラメータΘb を推定する。

【００２３】ステップS204に続くステップS205では、ス
テップS202で推定したＨＭＭパラメータΘa とステップ
S204で推定したＨＭＭパラメータΘb を混合したＨＭＭ
パラメータΘc を生成する。その混合方法について以下
に詳細に説明する。なお、ＨＭＭにおける出力密度関数
は正規分布とし、説明を簡単にするために、ＨＭＭパラ
メータΘa とΘb における出力密度関数は共に単一正規
分布とする。また、ＨＭＭパラメータΘa 、Θb 、Θc
におけるカテゴリーk 、状態s の出力密度関数をそれぞ
れＢaks 、Ｂbks 、Ｂcks とし、出力密度関数Ｂaks 、
Ｂbks の平均ベクトルをそれぞれμaks(i)、μbks(i)と
する。ここで、i は、特徴ベクトルＹknの次元を示すサ
フィックスである。

【００２４】ところで、出力密度関数Ｂaks とＢbks の
類似性は、両者の距離によって表わすことができる。出
力密度関数Ｂaks とＢbks との距離Ｄ（Ｂaks,Ｂbks ）
を、最も簡単な距離定義である平均ベクトル間のユーク
リッド距離を用いて表わすと式(1) のようになる。

【００２５】

【数１】なお、距離Ｄ（Ｂaks,Ｂbks ）は、Kullback、Chernof
f、Bhattachayya距離（例えば、文献１の第80〜81頁）
を用いて定義してもよい。(1) 式の距離Ｄ（Ｂaks,Ｂbk
s ）が予め定められた閾値Ｅよりも小さいとき（Ｄ（Ｂ
aks,Ｂbks)〈Ｅ）、出力密度関数Ｂaks とＢbks とは互
いに類似する分布であるので、ＨＭＭパラメータΘc に
おける出力密度関数Ｂcks は、式(2) のようにＨＭＭパ
ラメータΘa における出力密度関数Ｂask （またはＨＭ
ＭパラメータΘb における出力密度関数Ｂbks ）で表わ
すことができる。したがって、この場合には、出力密度
関数Ｂaks とＢbks とを混合して出力密度関数Ｂcks を
生成する必要はないので、それだけＨＭＭ辞書をコンパ
クトにすることができる。

【００２６】Ｂcks ＝Ｂaks ...(2) 逆に、距離Ｄ（Ｂaks,Ｂbks)が予め定められた閾値Ｅよ
り大きいかまたは等しいとき（Ｄ（Ｂaks,Ｂbks)≧
Ｅ）、出力密度関数Ｂaks とＢbks とは互いに非類似の
分布であるので、出力密度関数Ｂcks は、式(3) のよう
に出力密度関数Ｂaks とＢbks を混合した混合分布で表
わすことができる。

【００２７】Ｂcks ＝λa Ｂaks ＋λb Ｂbks ...(3) ここでλa 、λb は、それぞれ出力密度関数Ｂaks 、Ｂ
bks の分岐確率であり、学習データＹakn の数をＺakn
、誤識別データＹbkn の数をＺbkn とすると式(4) 、
式(5) で表わされる。

【００２８】

【数２】 λa ＝Ｚakn ／( Ｚakn ＋Ｚbkn ） ...(4) λb ＝Ｚbkn ／( Ｚakn ＋Ｚbkn ） ...(5) このように、ＨＭＭパラメータΘa における出力密度関
数Ｂaks とＨＭＭパラメータΘb における出力密度関数
Ｂbks とが類似する場合には、その類似の度合いを考慮
して出力密度関数Ｂaks とＢbks を混合することにより
出力密度関数Ｂcks を作成し、誤識別データを考慮した
ＨＭＭパラメータΘc を得るものである。したがって、
図７の音声認識部704 においてカテゴリーk の識別処理
を実行する場合には、ＨＭＭパラメータΘa の尤度Ｐ
（Θa ）の代わりに、ＨＭＭパラメータΘc の尤度Ｐ
（Θc ）を用いればよいことになる。

【００２９】以上説明したように第２の実施例によれ
ば、誤識別データＹbkn を考慮した安定なＨＭＭパラメ
ータΘc を、極めて簡便かつ従来の処理と大差ない演算
量で推定することができる。また、各カテゴリー別、状
態別に、誤識別データＹbkn から学習した出力密度関数
Ｂbks の要不要を判定してＨＭＭパラメータΘc を生成
しているので、コンパクトでかつ高精度なＨＭＭパラメ
ータΘc を得ることができる。その結果、実験によれば
ＨＭＭ辞書のメモリ量を従来の場合に比べて５％未満増
加するだけで、高精度な音声認識を行うことができた。

【００３０】次に、本発明の第３の実施例のＨＭＭパラ
メータ学習方法について図３のフローチャートを用いて
説明する。この第３の実施例は、ＨＭＭパラメータΘa
により見出される誤識別データ数が所定数以下になるま
で、誤識別データを用いてＨＭＭパラメータΘb を推定
し、推定したＨＭＭパラメータΘb と先のＨＭＭパラメ
ータΘa とを混合してＨＭＭパラメータΘc を生成し、
ＨＭＭパラメータΘaの内容をこのＨＭＭパラメータΘc
の内容で置き換え、置き換え後のＨＭＭパラメータΘa
により誤識別データを見出すという処理を順次繰り返
し実行することにより、誤識別データを十分に考慮した
ＨＭＭパラメータΘc を得るものである。

【００３１】図３において、ステップS301、S303、S30
4、S307の各処理は、図２に示す第２の実施例のステッ
プS201、S202、S203、S204の各処理とそれぞれ同じであ
る。まず、図３のステップS301では、カテゴリー kに属
する複数の音声学習データを分析してその特徴ベクトル
（以下学習データという）Ｙakn を求め、ステップS302
では、繰り返し数(n) を n＝1 に、誤り総数( Ｅrr) を
Ｅrr(0) ＝Ｚにそれぞれ設定する。ここで、Ｚは、学習
データＹknの総数である。ステップS303では、ステップ
S301で求めた学習データＹakn を用いてＢＷ法によりＨ
ＭＭパラメータΘa を推定する。

【００３２】ステップS304では、ステップS303で推定し
たＨＭＭパラメータΘa またはステップS309で得たＨＭ
ＭパラメータΘa により学習データＹakn を識別し、カ
テゴリーk 以外のデータであると間違って識別された誤
識別データＹbkn を見いだす。ここで、繰り返し数がn
であるとき、過識別データＹbkn の数である誤り総数
は、Ｅrr(n) で表わされる。ステップS305では、この誤
り総数Ｅrr(n) と前回の誤り総数Ｅrr(n−1)とを用い
て、式(6) により改善率Ｒ(n) を算出する。

【００３３】Ｒ(n) ＝（Ｅrr(n−1)−Ｅrr(n））／Ｚ ...(6) ステップS306では、ステップS305で求めた改善率Ｒ(n)
と予め定められた値Ｆとを比較する。そして、改善率Ｒ
(n) が値Ｆより小さいときは、現段階のＨＭＭパラメー
タΘa は誤識別データを既に十分考慮したものであるの
で、これを最終的に得られたモデルのＨＭＭパラメータ
として処理を終了する。逆に、改善率Ｒ(n) が値Ｆより
大きいかまたは等しいときは、現段階のＨＭＭパラメー
タΘa は誤識別データを十分に考慮したものではないの
で、ＨＭＭパラメータΘa を再推定するためステップS3
07へ進む。ステップS307では、繰り返し数をn ＝ n＋1
とし、ＢＷ法により、ステップS304で見いだした誤識別
データＹbkn を用いてＨＭＭパラメータΘb を推定す
る。

【００３４】ステップS308では、ステップS303で推定し
たＨＭＭパラメータΘa またはステップS309で得られた
ＨＭＭパラメータΘa と、ステップS307で推定されたＨ
ＭＭパラメータΘb とを混合してＨＭＭパラメータΘc
を作成する。この混合方法について以下に詳細に説明す
る。なお、ＨＭＭの出力密度関数は正規分布とし、ＨＭ
ＭパラメータΘa における出力密度関数はＭaks 個の混
合分布とし、説明を簡単にするために、ＨＭＭパラメー
タΘa における各出力密度関数およびＨＭＭパラメータ
Θb における出力密度関数はそれぞれ単一正規分布とす
る。また、ＨＭＭパラメータΘa におけるカテゴリーk
、状態s のm 番目の出力密度関数をＢaksmとし、ＨＭ
ＭパラメータΘb 、Θc におけるカテゴリーk 、状態s
の出力密度関数をそれぞれＢbks 、Ｂcks とし、出力密
度関数Ｂaksm、Ｂbks の平均ベクトルをそれぞれμaksm
(i) 、μbks(i)とする。

【００３５】ところで、出力密度関数ＢaksmとＢbks の
類似性は、両者の距離によって表わすことができる。出
力密度関数ＢaksmとＢbks との距離Ｄ（Ｂaksm, Ｂbks
）を、最も簡単な距離定義である平均ベクトル間のユ
ークリッド距離を用いて表わすと式(7) のようになる。

【００３６】

【数３】なお、距離Ｄ（Ｂaksm, Ｂbks ）は、Kullback、Cherno
ff、Bhattachayya距離（例えば、文献１の第80〜81頁）
を用いて定義してもよい。ここで、Ｍaks 個の出力密度
関数Ｂaksm（m ＝1,...,Ｍaks ）のうちＢbks との距離
Ｄ（Ｂaksm, Ｂbks ）が最小値となる距離をＤＤ（Ｂak
s,Ｂbks ）とすると、ＤＤ（Ｂaks,Ｂbks ）は、(8) 式
により表わされる。

【００３７】

【数４】この距離ＤＤ（Ｂaks,Ｂbks ）が予め定められた閾値Ｅ
よりも小さいとき（ＤＤ（Ｂaks,Ｂbks)〈Ｅ）、出力密
度関数Ｂaks とＢbks とは互いに類似する分布であるの
で、ＨＭＭパラメータΘc における出力密度関数Ｂcks
は、式(9) のようにＨＭＭパラメータΘa の出力密度関
数Ｂask （またはＢbks ）で表わすことができる。した
がって、この場合には、出力密度関数Ｂaks とＢbks と
を混合して出力密度関数Ｂcks を生成する必要はないの
で、それだけＨＭＭ辞書をコンパクトにすることができ
る。

【００３８】Ｂcks ＝Ｂaks ...(9) 逆に、距離ＤＤ（Ｂaks,Ｂbks)が予め定められた閾値Ｅ
より大きいかまたは等しいとき（ＤＤ（Ｂaks,Ｂbks)≧
Ｅ）、出力密度関数Ｂaks とＢbks とは互いに非類似の
分布となるので、出力密度関数Ｂcks は、式(10)のよう
に出力密度関数Ｂaks とＢbks を混合することにより生
成することができる。

【００３９】

【数５】ここでλa 、λb は、それぞれ出力密度関数Ｂaks 、Ｂ
bks の分岐確率であり、学習データＹakn の数をＺakn
、誤識別データＹbkn の数をＺbkn とすると式(11)、
式(12)で表わされる。

【００４０】

【数６】λa ＝Ｚakn ／( Ｚakn ＋Ｚbkn ） ...(11) λb ＝Ｚbkn ／( Ｚakn ＋Ｚbkn ） ...(12) ステップS309では、ＨＭＭパラメータΘa の内容をステ
ップS308で得られたＨＭＭパラメータΘc の内容で置き
換えてステップS304に進む。そして、ステップS304から
S309までの処理を、ステップS306において改善率Ｒ(n)
が値Ｆより小さいと判定されるまで繰り返し実行する。
これにより、誤識別データを十分に考慮したＨＭＭパラ
メータΘc を得ることができ、また、追加される出力密
度関数Ｂbks の数は、誤識別データ数Ｚbkn の大小に応
じて自動的に設定されることになる。

【００４１】以上説明したように第３の実施例によれ
ば、誤識別データＹbkn を考慮した安定なＨＭＭパラメ
ータΘc を、極めて簡便かつ従来の処理と大差ない演算
量で推定することができる。また、追加される出力密度
関数Ｂbks の数は、各カテゴリ別、状態別に、誤識別デ
ータ数の大小に対応して自動的に設定されるので、どの
カテゴリにおいても適切なＨＭＭパラメータ数を持つＨ
ＭＭ辞書を生成することができる。その結果、カテゴリ
内のデータ分布と誤り分布に応じたＨＭＭ辞書を生成す
ることが可能となり、カテゴリの設定基準が明確に決め
にくい場合や設定基準が多少不適切な場合においても、
高い識別精度をもつＨＭＭ辞書を得ることができる。

【００４２】次に、本発明の第４の実施例のＨＭＭパラ
メータ学習方法について図４のフローチャートを用いて
説明する。先に説明した第３の実施例では、出力密度関
数Ｂaks とＢbks を混合することにより生成したＨＭＭ
パラメータΘc の内容でＨＭＭパラメータΘa の内容を
置き換え、置き換え後のＨＭＭパラメータΘa に基づい
てＨＭＭパラメータを再推定しているが、この第４の実
施例は、出力密度関数Ｂaks とＢbks を混合することに
より生成したＨＭＭパラメータΘc を初期値としてＢＷ
法によりＨＭＭパラメータΘa を推定し、このＨＭＭパ
ラメータΘa によりＨＭＭパラメータを再推定するもの
である。

【００４３】図４において、ステップS401からS408まで
の各処理は、図３に示す第３の実施例のステップS301か
らS308までの各処理とそれぞれ同じであるので、説明を
省略する。ステップS408に続くステップS409では、ステ
ップS408で得られたＨＭＭパラメータΘc を初期値とし
て、ＢＷ法により、学習データＹknを用いてＨＭＭパラ
メータΘa を推定する。ステップS408で作成したＨＭＭ
パラメータΘc は、出力密度関数Ｂaks とＢbks を混合
しただけであり、このＨＭＭパラメータΘc が学習デー
タ全体に対して適切であるかどうかは必ずしも保証され
ていない。そこで、ステップS409において、ＨＭＭパラ
メータΘc を初期値としてＢＷ法により、ＨＭＭパラメ
ータを再学習することにより、より適切なＨＭＭパラメ
ータΘaを得るものである。

【００４４】ステップS409の処理を終了するとステップ
S404に進む。そして、ステップS404からS409までの処理
を、ステップS406において改善率Ｒ(n) が値Ｆより小さ
いと判定されるまで繰り返し順次実行する。これによ
り、誤識別データを十分に考慮したＨＭＭパラメータΘ
a を得ることができ、また、追加される出力密度関数Ｂ
bks の数は、誤識別データ数Ｚbkn の大小に応じて自動
的に設定されることになる。

【００４５】以上説明したように第４の実施例によれ
ば、誤識別データをＹbkn を考慮した安定なＨＭＭパラ
メータΘc を、極めて簡便かつ従来の処理と大差ない演
算量で推定することができる。また、各カテゴリ別、状
態別に、誤りデータの大小に対応したパラメータを追加
したＨＭＭ辞書を更に全体の学習データＹknにより再学
習することにより、追加前のパラメータΘa と追加する
パラメータΘb との整合をとっているので、より少ない
パラメータ増加数でどのカテゴリにおいても適切なＨＭ
Ｍパラメータ数を持つＨＭＭ辞書を生成することができ
る。その結果、カテゴリ内のデータ分布と誤り分布に応
じたＨＭＭ辞書を生成することが可能となり、カテゴリ
の設定基準が明確に決めにくい場合や設定基準が多少不
適切な場合においても、高い識別精度をもつＨＭＭ辞書
を得ることができる。

【００４６】次に、本発明の第５の実施例のＨＭＭパラ
メータ学習方法について図５のフローチャートを用いて
説明する。先に説明した第４の実施例は、ＨＭＭパラメ
ータΘa の推定をＢＷ法により行い（ステップS403）、
また、ＨＭＭパラメータΘaの再推定をＨＭＭパラメー
タΘc を初期値とするＢＷ法により行っている（ステッ
プS409）のに対して、この第５の実施例は、ＨＭＭパラ
メータΘa の推定を、ＢＷ法により推定したＨＭＭパラ
メータΘaaを初期値とするＭＣＥ法により行い（ステッ
プS504）、また、ＨＭＭパラメータΘa の再推定を、Ｈ
ＭＭパラメータΘc を初期値とするＭＣＥ法により行う
（ステップS510）ものであり、より高性能のＨＭＭ辞書
を実現しようとするものである。

【００４７】図５において、ステップS501からS503まで
の各処理は、図４に示す第４の実施例のステップS401か
らS403までの各処理と同じであり、ステップS501では、
カテゴリー kに属する複数の音声学習データを分析して
その特徴ベクトル（以下学習データという）Ｙakn を求
め、ステップS502では、繰り返し数 nおよび誤り総数を
Ｅrrを初期設定し、ステップS503では、ステップS501で
求めた学習データＹakn を用いてＢＷ法によりＨＭＭパ
ラメータΘaaを推定する。

【００４８】ステップS503に続くステップS504では、ス
テップS503で推定したＨＭＭパラメータΘaaを初期値と
してＭＣＥ法（例えば、文献２）によりＨＭＭパラメー
タΘa を推定する。ＢＷ法が自カテゴリーの尤度を大き
くする学習方法であるのに対して、ＭＣＥ法は、自カテ
ゴリーの尤度と他カテゴリーの尤度との差を広げるよう
な学習方法であるので、パラメータ数が固定されている
場合、ＭＣＥ法はＢＷ法より高い性能を得ることができ
る。ステップS504における処理ではパラメータ数が固定
されているので、この高性能のＭＣＥ法を用いることに
よりＨＭＭパラメータΘa を推定するものである。

【００４９】ステップS505からS509までの各処理は、図
４に示す第４の実施例のステップS404からS408までの各
処理と同じであり、ステップS505では、ステップS504で
推定したＨＭＭパラメータΘa により誤識別データＹbk
n を見出し、ステップS506では、その誤識別データＹbk
n により改善率Ｒ(n) を計算し、ステップS507では、こ
の改善率Ｒ(n) と予め定められた値Ｆとを比較し、ステ
ップS508では、改善率Ｒ(n) が値Ｆより大きい場合は誤
識別データＹbkn を用いてＨＭＭパラメータΘb を推定
し、そして、ステップS509では、ＨＭＭパラメータΘa
とΘb とを混合してＨＭＭパラメータΘc を生成する。

【００５０】ステップS509に続くステップS510では、ス
テップS509で得られたＨＭＭパラメータΘc を初期値と
して、ＭＣＥ法により、学習データＹknを用いてＨＭＭ
パラメータΘa を推定する。ステップS510における処理
ではパラメータ数が固定されているので、ステップS504
の場合と同様に、ＢＷ法に比べて性能の高いＭＣＥ法を
用いて推定処理を行うものである。ステップS510での処
理が終了した後、ステップS505に進む。そして、ステッ
プS505からS510までの処理を、ステップS507において改
善率Ｒ(n) が値Ｆより小さいと判定されるまで繰り返し
順次実行する。これにより、誤識別データを十分に考慮
したＨＭＭパラメータΘa を得ることができる。

【００５１】以上説明したように第５の実施例によれ
ば、誤識別データをＹbkn を考慮した安定なＨＭＭパラ
メータΘc を推定することができる。また、各カテゴリ
別、状態別に、誤りデータの大小に対応したパラメータ
を追加した辞書を更に全体の学習データＹknにより誤り
最小化基準（ＭＣＥ法）で再学習しているので、どのカ
テゴリにおいても必要最小限のＨＭＭパラメータ数で、
最大の識別性能を持つ辞書を生成することができる。し
たがって、コンパクトでかつ非常に高い識別精度をもつ
ＨＭＭ辞書を得ることができる。

【００５２】なお、本発明は、多次元正規出力確率ＨＭ
Ｍを用いた全ての音声認識装置やパタン認識装置にも適
用することができる。

【００５３】

【発明の効果】このように本発明によれば、誤識別デー
タを考慮したＨＭＭパラメータを極めて簡便かつ従来の
処理と大差ない演算量で推定することができる。また、
各カテゴリー別、状態別に、誤識別データから学習した
出力密度関数の要不要を判定してＨＭＭパラメータを生
成しているので、コンパクトでかつ高精度なＨＭＭパラ
メータを得ることができる。また、追加される出力密度
関数の数は、各カテゴリ別、状態別に、誤識別データ数
の大小に対応して自動的に設定されるので、どのカテゴ
リにおいても適切なＨＭＭパラメータ数を持つＨＭＭ辞
書を生成することができる。

【００５４】また、各カテゴリ別、状態別に、誤りデー
タの大小に対応したパラメータを追加した辞書を更に全
体の学習データにより再学習することにより、追加前の
パラメータと追加するパラメータとの整合をとっている
ので、より少ないパラメータ増加数でどのカテゴリにお
いても適切なＨＭＭパラメータ数を持つＨＭＭ辞書を生
成することができる。また、各カテゴリ別、状態別に、
誤りデータの大小に対応したパラメータを追加したＨＭ
Ｍ辞書を更に全体の学習データにより識別誤り最小化基
準（ＭＣＥ法）で再学習するようにすれば、どのカテゴ
リにおいても必要最小限のＨＭＭパラメータ数で、最大
の識別性能を持つＨＭＭ辞書を生成することができる。

【図面の簡単な説明】

【図１】本発明の第１の実施例のＨＭＭパラメータ学習
方法を示すフローチャートである。

【図２】本発明の第２の実施例のＨＭＭパラメータ学習
方法を示すフローチャートである。

【図３】本発明の第３の実施例のＨＭＭパラメータ学習
方法を示すフローチャートである。

【図４】本発明の第４の実施例のＨＭＭパラメータ学習
方法を示すフローチャートである。

【図５】本発明の第５の実施例のＨＭＭパラメータ学習
方法を示すフローチャートである。

【図６】ＨＭＭの説明図である。

【図７】ＨＭＭを用いた音声認識装置の構成図である。

【符号の説明】

701 学習データ記憶部 702 ＨＭＭパラメータ学習部 703 ＨＭＭパラメータ記憶部 704 音声認識部

Claims

【特許請求の範囲】

【請求項１】学習データを用いてＢＷ法により第１の
ＨＭＭパラメータを推定する第１の工程と、前記第１のＨＭＭパラメータにより前記学習データを識
別することにより識別誤りを起こした誤識別データを見
いだす第２の工程と、前記誤識別データを用いてＢＷ法により第２のＨＭＭパ
ラメータを推定する第３の工程とを含み、前記第１のＨ
ＭＭパラメータおよび第２のＨＭＭパラメータはデータ
識別処理において併用されるものであることを特徴とす
るＨＭＭパラメータ学習方法。
【請求項２】学習データを用いてＢＷ法により第１の
ＨＭＭパラメータを推定する第１の工程と、前記第１のＨＭＭパラメータにより前記学習データを識
別することにより識別誤りを起こした誤識別データを見
いだす第２の工程と、前記誤識別データを用いてＢＷ法により第２のＨＭＭパ
ラメータを推定する第３の工程と、前記第１のＨＭＭパラメータと第２のＨＭＭパラメータ
を混合して第３のＨＭＭパラメータを生成する第４の工
程とを含み、該第３のＨＭＭパラメータをモデルのＨＭ
Ｍパラメータとすることを特徴とするＨＭＭパラメータ
学習方法。
【請求項３】学習データを用いてＢＷ法により第１の
ＨＭＭパラメータを推定する第１の工程と、前記第１のＨＭＭパラメータにより前記学習データを識
別することにより識別誤りを起こした誤識別データを見
いだす第２の工程と、前記誤識別データを用いてＢＷ法により第２のＨＭＭパ
ラメータを推定する第３の工程と、前記第１のＨＭＭパラメータと第２のＨＭＭパラメータ
を混合して第３のＨＭＭパラメータを生成する第４の工
程と、前記第１のＨＭＭパラメータの内容を前記第３のＨＭＭ
パラメータの内容で置き換える第５の工程とを含み、前記第２の工程から第５の工程までの処理を、前記第２
の工程で見いだす誤識別データの数が所定値以下になる
まで順次繰り返し実行し、実行後の前記第３のＨＭＭパ
ラメータをモデルのＨＭＭパラメータとすることを特徴
とするＨＭＭパラメータ学習方法。
【請求項４】学習データを用いてＢＷ法により第１の
ＨＭＭパラメータを推定する第１の工程と、前記第１のＨＭＭパラメータにより前記学習データを識
別することにより識別誤りを起こした誤識別データを見
いだす第２の工程と、前記誤識別データを用いてＢＷ法により第２のＨＭＭパ
ラメータを推定する第３の工程と、前記第１のＨＭＭパラメータと第２のＨＭＭパラメータ
を混合して第３のＨＭＭパラメータを生成する第４の工
程と、前記第３のＨＭＭパラメータを初期値としてＢＷ法によ
り第４のＨＭＭパラメータを推定し、前記第１のＨＭＭ
パラメータの内容を該第４のＨＭＭパラメータの内容で
置き換える第５の工程とを含み、前記第２の工程から第５の工程までの処理を、前記第２
の工程で見いだす誤識別データの数が所定値以下になる
まで順次繰り返し実行し、実行後の前記第４のＨＭＭパ
ラメータをモデルのＨＭＭパラメータとすることを特徴
とするＨＭＭパラメータ学習方法。
【請求項５】学習データを用いてＢＷ法によりＨＭＭ
パラメータを推定し、推定した該ＨＭＭパラメータを初
期値としてＭＣＥ法により第１のＨＭＭパラメータを推
定する第１の工程と、前記第１のＨＭＭパラメータにより前記学習データを識
別することにより識別誤りを起こした誤識別データを見
いだす第２の工程と、前記誤識別データを用いてＢＷ法により第２のＨＭＭパ
ラメータを推定する第３の工程と、前記第１のＨＭＭパラメータと第２のＨＭＭパラメータ
を混合して第３のＨＭＭパラメータを生成する第４の工
程と、前記第３のＨＭＭパラメータを初期値としてＭＣＥ法に
より第４のＨＭＭパラメータを推定し、前記第１のＨＭ
Ｍパラメータの内容を該第４のＨＭＭパラメータの内容
で置き換える第５の工程とを含み、前記第２の工程から第５の工程までの処理を、前記第２
の工程で見いだす誤識別データの数が所定値以下になる
まで順次繰り返し実行し、実行後の前記第４のＨＭＭパ
ラメータをモデルのＨＭＭパラメータとすることを特徴
とするＨＭＭパラメータ学習方法。
【請求項６】請求項２ないし５のいずれかに記載の方
法において、前記第４の工程は、前記第１のＨＭＭパラ
メータと第２のＨＭＭパラメータ間の類似性を判定し、
類似性がないときは両パラメータを混合して前記第３の
ＨＭＭパラメータを生成し、類似性があるときは両パラ
メータのいずれか一方を前記第３のＨＭＭパラメータと
することを特徴とするＨＭＭパラメータ学習方法。
【請求項７】請求項６に記載の方法において、前記混
合は、前記第１のＨＭＭパラメータと第２のＨＭＭパラ
メータとの出力密度関数を、学習データ数と誤識別デー
タ数の割合に応じて加算するものであることを特徴とす
るＨＭＭパラメータ学習方法。
【請求項８】学習データを用いてＢＷ法により第１の
ＨＭＭパラメータを推定する第１のＨＭＭパラメータ推
定手段と、前記第１のＨＭＭパラメータにより前記学習データを識
別することにより識別誤りを起こした誤識別データを見
いだす誤識別データ検出手段と、前記誤識別データを用いてＢＷ法により第２のＨＭＭパ
ラメータを推定する第２のＨＭＭパラメータ推定手段と
を含み、前記第１のＨＭＭパラメータおよび第２のＨＭ
Ｍパラメータはデータ識別処理において併用されるもの
であることを特徴とするＨＭＭパラメータ学習装置。
【請求項９】学習データを用いてＢＷ法により第１の
ＨＭＭパラメータを推定する第１のＨＭＭパラメータ推
定手段と、前記第１のＨＭＭパラメータにより前記学習データを識
別することにより識別誤りを起こした誤識別データを見
いだす誤識別データ検出手段と、前記誤識別データを用いてＢＷ法により第２のＨＭＭパ
ラメータを推定する第２のＨＭＭパラメータ推定手段
と、前記第１のＨＭＭパラメータと第２のＨＭＭパラメータ
を混合して第３のＨＭＭパラメータを生成する生成手段
とを含み、該第３のＨＭＭパラメータをモデルのＨＭＭ
パラメータとすることを特徴とするＨＭＭパラメータ学
習装置。
【請求項１０】学習データを用いてＢＷ法により第１
のＨＭＭパラメータを推定する第１のＨＭＭパラメータ
推定手段と、前記第１のＨＭＭパラメータにより前記学習データを識
別することにより識別誤りを起こした誤識別データを見
いだす誤識別データ検出手段と、前記誤識別データを用いてＢＷ法により第２のＨＭＭパ
ラメータを推定する第２のＨＭＭパラメータ推定手段
と、前記第１のＨＭＭパラメータと第２のＨＭＭパラメータ
を混合して第３のＨＭＭパラメータを生成する生成手段
と、前記第１のＨＭＭパラメータの内容を前記第３のＨＭＭ
パラメータの内容で置き換える置き換え手段と、前記誤識別データ検出手段、第２のＨＭＭパラメータ推
定手段、生成手段、および置き換え手段を制御する制御
手段とを含み、該制御手段は、前記誤識別データ検出手段により見いだ
された誤識別データの数が所定値以下になるまで、前記
誤識別データ検出手段から置き換え手段までを順次繰り
返し動作させ、前記誤識別データの数が所定値以下にな
ったときの前記第３のＨＭＭパラメータをモデルのＨＭ
Ｍパラメータとすることを特徴とするＨＭＭパラメータ
学習装置。
【請求項１１】学習データを用いてＢＷ法により第１
のＨＭＭパラメータを推定する第１のＨＭＭパラメータ
推定手段と、前記第１のＨＭＭパラメータにより前記学習データを識
別することにより識別誤りを起こした誤識別データを見
いだす誤識別データ検出手段と、前記誤識別データを用いてＢＷ法により第２のＨＭＭパ
ラメータを推定する第２のＨＭＭパラメータ推定手段
と、前記第１のＨＭＭパラメータと第２のＨＭＭパラメータ
を混合して第３のＨＭＭパラメータを生成する生成手段
と、前記第３のＨＭＭパラメータを初期値としてＢＷ法によ
り第４のＨＭＭパラメータを推定し、前記第１のＨＭＭ
パラメータの内容を該第４のＨＭＭパラメータの内容で
置き換える置き換え手段と、前記誤識別データ検出手段、第２のＨＭＭパラメータ推
定手段、生成手段、および置き換え手段を制御する制御
手段とを含み、該制御手段は、前記誤識別データ検出手段により見いだ
された誤識別データの数が所定値以下になるまで、前記
誤識別データ検出手段から置き換え手段までを順次繰り
返し動作させ、前記誤識別データの数が所定値以下にな
ったときの前記第４のＨＭＭパラメータをモデルのＨＭ
Ｍパラメータとすることを特徴とするＨＭＭパラメータ
学習装置。
【請求項１２】学習データを用いてＢＷ法によりＨＭ
Ｍパラメータを推定し、推定した該ＨＭＭパラメータを
初期値としてＭＣＥ法により第１のＨＭＭパラメータを
推定する第１のＨＭＭパラメータ推定手段と、前記第１のＨＭＭパラメータにより前記学習データを識
別することにより識別誤りを起こした誤識別データを見
いだす誤識別データ検出手段と、前記誤識別データを用いてＢＷ法により第２のＨＭＭパ
ラメータを推定する第２のＨＭＭパラメータ推定手段
と、前記第１のＨＭＭパラメータと第２のＨＭＭパラメータ
を混合して第３のＨＭＭパラメータを生成する生成手段
と、前記第３のＨＭＭパラメータを初期値としてＭＣＥ法に
より第４のＨＭＭパラメータを推定し、前記第１のＨＭ
Ｍパラメータの内容を該第４のＨＭＭパラメータの内容
で置き換える置き換え手段と、前記誤識別データ検出手段、第２のＨＭＭパラメータ推
定手段、生成手段、および置き換え手段を制御する制御
手段とを含み、該制御手段は、前記誤識別データ検出手段により見いだ
された誤識別データの数が所定値以下になるまで、前記
誤識別データ検出手段から置き換え手段までを順次繰り
返し動作させ、前記誤識別データの数が所定値以下にな
ったときの前記第４のＨＭＭパラメータをモデルのＨＭ
Ｍパラメータとすることを特徴とするＨＭＭパラメータ
学習装置。