JP3102989B2 - パタン表現モデル学習装置及びパタン認識装置 - Google Patents
パタン表現モデル学習装置及びパタン認識装置Info
- Publication number
- JP3102989B2 JP3102989B2 JP06132772A JP13277294A JP3102989B2 JP 3102989 B2 JP3102989 B2 JP 3102989B2 JP 06132772 A JP06132772 A JP 06132772A JP 13277294 A JP13277294 A JP 13277294A JP 3102989 B2 JP3102989 B2 JP 3102989B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- learning
- pattern
- small
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【0001】
【産業上の利用分野】本発明は、認識対象となるカテゴ
リのパタン表現モデルの学習装置及びパタン認識装置に
関し、特にカテゴリ間の認識能力の高いパタン表現モデ
ル学習装置及びパタン認識装置を提供するものである。
リのパタン表現モデルの学習装置及びパタン認識装置に
関し、特にカテゴリ間の認識能力の高いパタン表現モデ
ル学習装置及びパタン認識装置を提供するものである。
【0002】
【従来の技術】音声パタンの表現モデルとして、近年H
MM(Hidden Markov Model 、隠れマルコフモデル)が
広く用いられており、ここではパタン表現モデルとして
HMMを用いた場合を例にとり、従来技術の説明を行う
こととする。
MM(Hidden Markov Model 、隠れマルコフモデル)が
広く用いられており、ここではパタン表現モデルとして
HMMを用いた場合を例にとり、従来技術の説明を行う
こととする。
【0003】HMMは音声パタンの特徴ベクトルの時系
列を確率的に表現するモデルであり、音声パタンはHM
Mにより複数の状態とその間の遷移によりモデル化され
る。HMMは状態間遷移の確率と、遷移時に出力される
特徴ベクトルの出力確率分布をパラメータとする。HM
Mの学習、すなわちパラメータ推定方式として最も一般
的なものは、学習に用いる特徴ベクトルの時系列に対し
てHMMの出力する尤度が大きくなるようにHMMのパ
ラメータを設定する方式で、最尤推定法と呼ばれてい
る。
列を確率的に表現するモデルであり、音声パタンはHM
Mにより複数の状態とその間の遷移によりモデル化され
る。HMMは状態間遷移の確率と、遷移時に出力される
特徴ベクトルの出力確率分布をパラメータとする。HM
Mの学習、すなわちパラメータ推定方式として最も一般
的なものは、学習に用いる特徴ベクトルの時系列に対し
てHMMの出力する尤度が大きくなるようにHMMのパ
ラメータを設定する方式で、最尤推定法と呼ばれてい
る。
【0004】この最尤推定法によるHMMの学習は、モ
デル間の識別能力を学習時に考慮していないため、得ら
れたモデルによる識別性能には限界がある。音声認識の
ためのHMM学習法についてこの問題を解決する目的で
提案されているものは、本発明の発明者ら(水田忍、中
島邦男)による、文献:「混合連続分布HMMに対する
最適識別学習法の検討」(日本音響学会平成2年春季研
究発表会講演論文集、1−3−12)のようなものがあ
る。
デル間の識別能力を学習時に考慮していないため、得ら
れたモデルによる識別性能には限界がある。音声認識の
ためのHMM学習法についてこの問題を解決する目的で
提案されているものは、本発明の発明者ら(水田忍、中
島邦男)による、文献:「混合連続分布HMMに対する
最適識別学習法の検討」(日本音響学会平成2年春季研
究発表会講演論文集、1−3−12)のようなものがあ
る。
【0005】図6は文献に記述されているパタン表現モ
デル学習装置及びパタン認識装置の一実施例を示す構成
図である。
デル学習装置及びパタン認識装置の一実施例を示す構成
図である。
【0006】本例では、パタン表現モデルとして、出力
確率分布が多次元正規分布の混合分布で表現された連続
型のHMMを用いるものとする。
確率分布が多次元正規分布の混合分布で表現された連続
型のHMMを用いるものとする。
【0007】また、学習や認識の対象となるカテゴリの
単位は単語であるとする。
単位は単語であるとする。
【0008】図6において、1は学習用パタンであり、
各カテゴリの音声を音響分析して得られる音響特徴ベク
トルの時系列である。2は各カテゴリ毎にHMMの初期
モデルを設定する初期モデル設定手段、3は初期モデル
設定手段2によって設定された各カテゴリの初期モデ
ル、4は入力された学習用パタンに応じて学習するカテ
ゴリを選択する学習用カテゴリ選択手段、6は学習用カ
テゴリ選択手段4によって選択された学習カテゴリのパ
タン表現モデルのパラメータを制御するパラメータ制御
手段、7はパラメータ制御手段によって得られた学習結
果モデル、8は発声内容が未知の音声を音響分析して得
られる音響特徴ベクトルの時系列である、認識パタン、
9は認識パタン8のカテゴリを決定する認識用カテゴリ
選択手段、10は認識結果である。
各カテゴリの音声を音響分析して得られる音響特徴ベク
トルの時系列である。2は各カテゴリ毎にHMMの初期
モデルを設定する初期モデル設定手段、3は初期モデル
設定手段2によって設定された各カテゴリの初期モデ
ル、4は入力された学習用パタンに応じて学習するカテ
ゴリを選択する学習用カテゴリ選択手段、6は学習用カ
テゴリ選択手段4によって選択された学習カテゴリのパ
タン表現モデルのパラメータを制御するパラメータ制御
手段、7はパラメータ制御手段によって得られた学習結
果モデル、8は発声内容が未知の音声を音響分析して得
られる音響特徴ベクトルの時系列である、認識パタン、
9は認識パタン8のカテゴリを決定する認識用カテゴリ
選択手段、10は認識結果である。
【0009】まずパタン表現モデル学習装置の動作につ
いて説明する。
いて説明する。
【0010】学習手続きに先立ち、初期モデル設定手段
2によって、各カテゴリの初期モデル3は既に設定され
ているものとする。本例では初期モデル3は最尤推定法
により設定されているものとする。
2によって、各カテゴリの初期モデル3は既に設定され
ているものとする。本例では初期モデル3は最尤推定法
により設定されているものとする。
【0011】また学習用パタン1は、学習対象となるカ
テゴリの各々に対して一個以上用意されているものとす
る。
テゴリの各々に対して一個以上用意されているものとす
る。
【0012】学習は以下のように行う。
【0013】(学習手順1)学習対象となる前記複数の
単語カテゴリのいずれかに属する、一個の学習用パタン
1が、学習用カテゴリ選択手段4に入力されると、学習
用カテゴリ選択手段4は、この学習パタン1に対して、
前記各カテゴリの初期モデル3の各々からの生起確率を
求め、これら複数の初期モデル3のうち、前記学習用パ
タン1と異なるカテゴリに属し、生起確率が最大となる
最近傍他カテゴリのモデルを選択し、選択結果5を出力
する。
単語カテゴリのいずれかに属する、一個の学習用パタン
1が、学習用カテゴリ選択手段4に入力されると、学習
用カテゴリ選択手段4は、この学習パタン1に対して、
前記各カテゴリの初期モデル3の各々からの生起確率を
求め、これら複数の初期モデル3のうち、前記学習用パ
タン1と異なるカテゴリに属し、生起確率が最大となる
最近傍他カテゴリのモデルを選択し、選択結果5を出力
する。
【0014】(学習手順2)パラメータ制御手段6で
は、前記初期モデル3のうち前記学習パタン1と同じ単
語カテゴリに属する自カテゴリモデル、及び前記選択手
段により選択された最近傍他カテゴリモデルについて、
この学習用パタン1が生起する確率が自カテゴリモデル
では高く、最近傍他カテゴリモデルでは低くなるように
モデルのパラメータを再推定する。
は、前記初期モデル3のうち前記学習パタン1と同じ単
語カテゴリに属する自カテゴリモデル、及び前記選択手
段により選択された最近傍他カテゴリモデルについて、
この学習用パタン1が生起する確率が自カテゴリモデル
では高く、最近傍他カテゴリモデルでは低くなるように
モデルのパラメータを再推定する。
【0015】このパラメータ再推定は、モデルの出力確
率分布と前記学習用パタン1との対応関係をViterbi パ
ス(生起確率が最大となるような、前記学習パタン1の
特徴ベクトルの時系列とモデルの状態との対応関係)に
より決定し、パラメータ更新は混合連続分布で表現され
た出力確率分布の中心ベクトルを、学習用パタン1を構
成する音響特徴ベクトルの対応するベクトルに近づけ、
また遠ざけることで実現する。
率分布と前記学習用パタン1との対応関係をViterbi パ
ス(生起確率が最大となるような、前記学習パタン1の
特徴ベクトルの時系列とモデルの状態との対応関係)に
より決定し、パラメータ更新は混合連続分布で表現され
た出力確率分布の中心ベクトルを、学習用パタン1を構
成する音響特徴ベクトルの対応するベクトルに近づけ、
また遠ざけることで実現する。
【0016】(学習手順3)再推定されたモデルを初期
モデル3と置き換える。
モデル3と置き換える。
【0017】(学習手順4)すべての学習パタンの各々
に対して、上記の学習手順1から3を行う。
に対して、上記の学習手順1から3を行う。
【0018】(学習手順5)上記 の学習手順1から4までの処理を必要回数行った
後、得られたモデルを学習結果モデル7として出力す
る。
後、得られたモデルを学習結果モデル7として出力す
る。
【0019】次にパタン認識装置の動作について説明す
る。
る。
【0020】認識対象となる前記複数の単語カテゴリの
いずれかに属する、カテゴリ未知の認識パタン8が認識
用カテゴリ選択手段9に入力されると、認識用カテゴリ
選択手段9では、前記認識パタン8に対する学習結果モ
デル7の各々からの生起確率を求め、これらの学習結果
モデルのうち、生起確率が最大となるモデルを選択し、
このモデルの属するカテゴリを認識結果10として出力
する。
いずれかに属する、カテゴリ未知の認識パタン8が認識
用カテゴリ選択手段9に入力されると、認識用カテゴリ
選択手段9では、前記認識パタン8に対する学習結果モ
デル7の各々からの生起確率を求め、これらの学習結果
モデルのうち、生起確率が最大となるモデルを選択し、
このモデルの属するカテゴリを認識結果10として出力
する。
【0021】
【発明が解決しようとする課題】上記従来例のパタン表
現モデル学習方式では、複数のカテゴリの各カテゴリ間
のすべての対立関係を考慮した学習が行われる。
現モデル学習方式では、複数のカテゴリの各カテゴリ間
のすべての対立関係を考慮した学習が行われる。
【0022】具体的には、例えばA,B,C,……,J
の認識すべき10個の単語カテゴリがある場合、カテゴ
リAに属する学習用パタン1を入力した時、学習用カテ
ゴリBが最近傍他カテゴリとして選択されたならば、パ
ラメータ制御手段5により前記学習用パタン1が属する
カテゴリAのモデルに対しては、この学習用パタン1が
生起する確率が高くなるようにパラメータを再推定し、
逆にカテゴリBのモデルに対しては、この学習用パタン
1が生起する確率が低くなるようにパラメータを再推定
する。
の認識すべき10個の単語カテゴリがある場合、カテゴ
リAに属する学習用パタン1を入力した時、学習用カテ
ゴリBが最近傍他カテゴリとして選択されたならば、パ
ラメータ制御手段5により前記学習用パタン1が属する
カテゴリAのモデルに対しては、この学習用パタン1が
生起する確率が高くなるようにパラメータを再推定し、
逆にカテゴリBのモデルに対しては、この学習用パタン
1が生起する確率が低くなるようにパラメータを再推定
する。
【0023】以上より、上記パタン表現モデル学習方式
においては、カテゴリAとカテゴリBとの識別性能の向
上が期待される。しかし、前記パラメータの再推定によ
り、他の認識すべき8個(C,D,E,……,J)の単
語カテゴリの一つまたは複数との識別性能が低下する方
向に前記パラメータが再推定されてしまう可能性があ
る。このような悪影響はカテゴリ総数が大きくなるほ
ど、発生しやすくなるものと考えられる。
においては、カテゴリAとカテゴリBとの識別性能の向
上が期待される。しかし、前記パラメータの再推定によ
り、他の認識すべき8個(C,D,E,……,J)の単
語カテゴリの一つまたは複数との識別性能が低下する方
向に前記パラメータが再推定されてしまう可能性があ
る。このような悪影響はカテゴリ総数が大きくなるほ
ど、発生しやすくなるものと考えられる。
【0024】本発明は、上記問題点を解決するためにな
されたもので、識別性能の高いパタン表現モデル学習装
置及びパタン認識装置を提供することを目的とする。
されたもので、識別性能の高いパタン表現モデル学習装
置及びパタン認識装置を提供することを目的とする。
【0025】
【課題を解決するための手段】請求項1記載の発明にお
いては、認識の対象となるカテゴリに属する学習用パタ
ンを用いて、前記カテゴリに属するパタンを表現するパ
タン表現モデルのパラメータの初期値を設定する初期モ
デル設定手段と、前記初期モデル設定手段によって得ら
れた各々のカテゴリに属する初期モデルを用いて、各カ
テゴリ間の類似度を求め、類似度の高いカテゴリ同士を
一つの小カテゴリ群にクラス分けすることによって、前
記認識対象となる複数のカテゴリ全体を所定数の小カテ
ゴリ群に分類し、この分類結果を小カテゴリ群帳に登録
する小カテゴリ群登録手段と、前記認識対象となる複数
のカテゴリのいずれかに属するカテゴリ既知の学習パタ
ンを入力とし、この学習パタンが属するカテゴリを含む
小カテゴリ群全てをまず選択し、選択された小カテゴリ
群の中からこの学習パタンとの類似度が最大となる小カ
テゴリ群一個を、最終選択結果として出力する学習用小
カテゴリ群選択手段と、前記学習用小カテゴリ群選択手
段により選択された一個の小カテゴリ群を構成する複数
のカテゴリのうち、前記学習パタンが属するカテゴリで
ある学習自カテゴリと、前記学習パタンが属するカテゴ
リ以外で前記学習パタンとの類似度が最大となるカテゴ
リである最近学習他カテゴリとを、選択結果として出力
する学習用カテゴリ選択手段と、前記学習用カテゴリ選
択手段により選択された前記学習自カテゴリのパタン表
現モデルに対しては前記学習パタンとの類似度がより高
くなるようにモデルのパラメータを制御し、前記最近傍
学習他カテゴリのパタン表現モデルに対しては前記学習
パタンとの類似度がより低くなるようにモデルのパラメ
ータを制御するパラメータ制御手段とを備える。
いては、認識の対象となるカテゴリに属する学習用パタ
ンを用いて、前記カテゴリに属するパタンを表現するパ
タン表現モデルのパラメータの初期値を設定する初期モ
デル設定手段と、前記初期モデル設定手段によって得ら
れた各々のカテゴリに属する初期モデルを用いて、各カ
テゴリ間の類似度を求め、類似度の高いカテゴリ同士を
一つの小カテゴリ群にクラス分けすることによって、前
記認識対象となる複数のカテゴリ全体を所定数の小カテ
ゴリ群に分類し、この分類結果を小カテゴリ群帳に登録
する小カテゴリ群登録手段と、前記認識対象となる複数
のカテゴリのいずれかに属するカテゴリ既知の学習パタ
ンを入力とし、この学習パタンが属するカテゴリを含む
小カテゴリ群全てをまず選択し、選択された小カテゴリ
群の中からこの学習パタンとの類似度が最大となる小カ
テゴリ群一個を、最終選択結果として出力する学習用小
カテゴリ群選択手段と、前記学習用小カテゴリ群選択手
段により選択された一個の小カテゴリ群を構成する複数
のカテゴリのうち、前記学習パタンが属するカテゴリで
ある学習自カテゴリと、前記学習パタンが属するカテゴ
リ以外で前記学習パタンとの類似度が最大となるカテゴ
リである最近学習他カテゴリとを、選択結果として出力
する学習用カテゴリ選択手段と、前記学習用カテゴリ選
択手段により選択された前記学習自カテゴリのパタン表
現モデルに対しては前記学習パタンとの類似度がより高
くなるようにモデルのパラメータを制御し、前記最近傍
学習他カテゴリのパタン表現モデルに対しては前記学習
パタンとの類似度がより低くなるようにモデルのパラメ
ータを制御するパラメータ制御手段とを備える。
【0026】また請求項2記載の発明においては、カテ
ゴリ未知の認識パタンを入力とし、前記小カテゴリ群帳
に登録された所定数の小カテゴリ群の中から、前記認識
パタンとの類似度が最大となる一個の小カテゴリ群を選
択する認識用小カテゴリ群選択手段と、前記パラメータ
制御手段によってパラメータを制御された学習結果モデ
ルを用いて、前記認識用小カテゴリ群選択手段によって
選択された一個の小カテゴリ群を構成する複数のカテゴ
リのパタン表現モデルの各々と、前記認識パタンとの類
似度を求め、類似度が最大となるパタン表現モデルの属
するカテゴリを出力する認識用カテゴリ選択手段とを備
える。
ゴリ未知の認識パタンを入力とし、前記小カテゴリ群帳
に登録された所定数の小カテゴリ群の中から、前記認識
パタンとの類似度が最大となる一個の小カテゴリ群を選
択する認識用小カテゴリ群選択手段と、前記パラメータ
制御手段によってパラメータを制御された学習結果モデ
ルを用いて、前記認識用小カテゴリ群選択手段によって
選択された一個の小カテゴリ群を構成する複数のカテゴ
リのパタン表現モデルの各々と、前記認識パタンとの類
似度を求め、類似度が最大となるパタン表現モデルの属
するカテゴリを出力する認識用カテゴリ選択手段とを備
える。
【0027】また請求項3及び請求項4記載の発明にお
いては、前記初期モデル設定手段によって得られた各々
のカテゴリに属する初期モデルと学習用パタンを用い
て、各カテゴリ間での認識混同情報を生成する混同情報
生成手段と、前記混同情報をもとに認識時に混同を生じ
やすいカテゴリ同士を一つの小カテゴリ群にクラス分け
することによって、前記認識対象となる複数のカテゴリ
全体を所定数の小カテゴリ群に分類し、この分類結果を
小カテゴリ群帳に登録する小カテゴリ群登録手段を備え
る。
いては、前記初期モデル設定手段によって得られた各々
のカテゴリに属する初期モデルと学習用パタンを用い
て、各カテゴリ間での認識混同情報を生成する混同情報
生成手段と、前記混同情報をもとに認識時に混同を生じ
やすいカテゴリ同士を一つの小カテゴリ群にクラス分け
することによって、前記認識対象となる複数のカテゴリ
全体を所定数の小カテゴリ群に分類し、この分類結果を
小カテゴリ群帳に登録する小カテゴリ群登録手段を備え
る。
【0028】
【作用】請求項1記載の発明に係わるパタン学習装置に
おいて、小カテゴリ群登録手段は、類似度の高いカテゴ
リ同士を一つの小カテゴリ群にクラス分けすることによ
って、複数のカテゴリ全体を所定数の小カテゴリ群に分
類し、この分類結果を小カテゴリ群帳に登録する。学習
用小カテゴリ群選択手段は、前記複数のカテゴリのいず
れかに属するカテゴリ既知の学習パタンを入力とし、こ
の学習パタンが属するカテゴリを含む小カテゴリ群全て
をまず選択し、選択された小カテゴリ群の中からこの学
習パタンとの類似度が最大となる小カテゴリ群一個を最
終的に選択する。パラメータ制御手段は、この選択され
た一個の小カテゴリ群の内部でのみ、カテゴリの識別能
力を向上させるためのパラメータの再推定を行う。
おいて、小カテゴリ群登録手段は、類似度の高いカテゴ
リ同士を一つの小カテゴリ群にクラス分けすることによ
って、複数のカテゴリ全体を所定数の小カテゴリ群に分
類し、この分類結果を小カテゴリ群帳に登録する。学習
用小カテゴリ群選択手段は、前記複数のカテゴリのいず
れかに属するカテゴリ既知の学習パタンを入力とし、こ
の学習パタンが属するカテゴリを含む小カテゴリ群全て
をまず選択し、選択された小カテゴリ群の中からこの学
習パタンとの類似度が最大となる小カテゴリ群一個を最
終的に選択する。パラメータ制御手段は、この選択され
た一個の小カテゴリ群の内部でのみ、カテゴリの識別能
力を向上させるためのパラメータの再推定を行う。
【0029】また請求項2記載の発明に係わるパタン認
識装置において、カテゴリ未知の認識パタンを入力と
し、認識用小カテゴリ群選択手段は前記小カテゴリ群帳
に登録された所定数の小カテゴリ群の中から、前記認識
パタンとの類似度が最大となる一個の小カテゴリ群を選
択する。認識用カテゴリ選択手段は、前記認識小カテゴ
リ群選択手段によって選択された一個の小カテゴリ群を
構成する複数のカテゴリのパタン表現モデルの各々と、
前記認識パタンとの類似度を求め、類似度が最大となる
パタン表現モデルの属するカテゴリを出力する。
識装置において、カテゴリ未知の認識パタンを入力と
し、認識用小カテゴリ群選択手段は前記小カテゴリ群帳
に登録された所定数の小カテゴリ群の中から、前記認識
パタンとの類似度が最大となる一個の小カテゴリ群を選
択する。認識用カテゴリ選択手段は、前記認識小カテゴ
リ群選択手段によって選択された一個の小カテゴリ群を
構成する複数のカテゴリのパタン表現モデルの各々と、
前記認識パタンとの類似度を求め、類似度が最大となる
パタン表現モデルの属するカテゴリを出力する。
【0030】また請求項3及び請求項4記載の発明にお
いては、混同情報生成手段は初期設定により得られた各
々のカテゴリに属するパタン表現モデルと、パタン表現
モデル学習用の音声データを用いて各カテゴリ間での認
識混同情報を生成し、小カテゴリ群登録手段は、この混
同情報をもとに、認識時に混同を生じやすいカテゴリ同
士を一つの小カテゴリ群にまとめ、前記認識対象となる
複数のカテゴリ全体を所定数の小カテゴリ群に分類し、
この分類結果を小カテゴリ群帳に登録する。
いては、混同情報生成手段は初期設定により得られた各
々のカテゴリに属するパタン表現モデルと、パタン表現
モデル学習用の音声データを用いて各カテゴリ間での認
識混同情報を生成し、小カテゴリ群登録手段は、この混
同情報をもとに、認識時に混同を生じやすいカテゴリ同
士を一つの小カテゴリ群にまとめ、前記認識対象となる
複数のカテゴリ全体を所定数の小カテゴリ群に分類し、
この分類結果を小カテゴリ群帳に登録する。
【0031】
実施例1.図1は、請求項1と請求項2記載の発明の一
実施例に係わる、パタン表現モデル学習装置及びパタン
認識装置の構成図である。
実施例に係わる、パタン表現モデル学習装置及びパタン
認識装置の構成図である。
【0032】図1において、1は学習用パタンであり、
各カテゴリの音声を音響分析して得られる音響特徴ベク
トルの時系列である。2は各カテゴリ毎にHMMの初期
モデルを設定する初期モデル設定手段、3は初期モデル
設定手段2によって設定された各カテゴリの初期モデ
ル、4は入力された学習用パタンに応じて学習するカテ
ゴリを選択する学習用カテゴリ選択手段、6は学習用カ
テゴリ選択手段4によって選択された学習カテゴリのパ
タン表現モデルのパラメータを制御するパラメータ制御
手段、7はパラメータ制御手段によって得られた学習結
果モデル(図1には示されず、後述する図6に示されて
いる。)、8は発声内容が未知の音声を音響分析して得
られる音響特徴ベクトルの時系列である、認識パタン、
9は認識パタン8のカテゴリを決定する認識用カテゴリ
選択手段、10は認識結果、11は小カテゴリ群登録手
段、12は小カテゴリ群が登録されている小カテゴリ群
帳、13は学習用小カテゴリ群を選択する学習用小カテ
ゴリ群選択手段、14は学習用小カテゴリ群の選択結
果、15は学習途中の小カテゴリ群別学習途中モデル、
16は学習が完了した小カテゴリ群別学習結果モデル、
17は認識用の小カテゴリ群を選択する認識用小カテゴ
リ群選択手段、18は認識用小カテゴリ群の選択結果で
ある。
各カテゴリの音声を音響分析して得られる音響特徴ベク
トルの時系列である。2は各カテゴリ毎にHMMの初期
モデルを設定する初期モデル設定手段、3は初期モデル
設定手段2によって設定された各カテゴリの初期モデ
ル、4は入力された学習用パタンに応じて学習するカテ
ゴリを選択する学習用カテゴリ選択手段、6は学習用カ
テゴリ選択手段4によって選択された学習カテゴリのパ
タン表現モデルのパラメータを制御するパラメータ制御
手段、7はパラメータ制御手段によって得られた学習結
果モデル(図1には示されず、後述する図6に示されて
いる。)、8は発声内容が未知の音声を音響分析して得
られる音響特徴ベクトルの時系列である、認識パタン、
9は認識パタン8のカテゴリを決定する認識用カテゴリ
選択手段、10は認識結果、11は小カテゴリ群登録手
段、12は小カテゴリ群が登録されている小カテゴリ群
帳、13は学習用小カテゴリ群を選択する学習用小カテ
ゴリ群選択手段、14は学習用小カテゴリ群の選択結
果、15は学習途中の小カテゴリ群別学習途中モデル、
16は学習が完了した小カテゴリ群別学習結果モデル、
17は認識用の小カテゴリ群を選択する認識用小カテゴ
リ群選択手段、18は認識用小カテゴリ群の選択結果で
ある。
【0033】ここで小カテゴリ群別学習途中モデル15
及び小カテゴリ群別学習結果モデル16は、各小カテゴ
リ群毎に別々に用意する。すなわち、複数の小カテゴリ
群に属するカテゴリは、そのカテゴリが所属する小カテ
ゴリ毎に別々のパタン表現モデルを設定する。
及び小カテゴリ群別学習結果モデル16は、各小カテゴ
リ群毎に別々に用意する。すなわち、複数の小カテゴリ
群に属するカテゴリは、そのカテゴリが所属する小カテ
ゴリ毎に別々のパタン表現モデルを設定する。
【0034】本実施例においても従来技術の例と同様
に、パタン表現モデルとして、出力確率分布が多次元正
規分布の混合分布で表現された連続型のHMMを用いる
ものとする。また学習や認識の対象となるカテゴリの単
位は単語であるとする。
に、パタン表現モデルとして、出力確率分布が多次元正
規分布の混合分布で表現された連続型のHMMを用いる
ものとする。また学習や認識の対象となるカテゴリの単
位は単語であるとする。
【0035】まずパタン表現モデル学習装置の動作につ
いて説明する。
いて説明する。
【0036】学習手続きに先立ち、初期モデル設定手段
2によって、各カテゴリの初期モデル3は既に設定され
ているものとする。本例では初期モデル3は最尤推定法
により設定されているものとする。
2によって、各カテゴリの初期モデル3は既に設定され
ているものとする。本例では初期モデル3は最尤推定法
により設定されているものとする。
【0037】また小カテゴリ群別学習途中モデル15の
初期値としては、初期モデル3の値を各小カテゴリ群で
共通に設定することとする。例えば、A,B,C,…
…,Jの認識すべき10の単語カテゴリがあり、小カテ
ゴリ群帳にI 、II、III の3個の小カテゴリ群が登録さ
れており、それぞれに属するカテゴリとして、I :
(A,B,D,F)、II:(A,C,G,I)、III :
(A,E,H,J)と分類されているとき、小カテゴリ
群I に属するカテゴリAのパタン表現モデルも、小カテ
ゴリ群IIに属するカテゴリAのパタン表現モデルも、初
期モデル3のカテゴリAを表現するモデルのパラメータ
を初期値として設定する。
初期値としては、初期モデル3の値を各小カテゴリ群で
共通に設定することとする。例えば、A,B,C,…
…,Jの認識すべき10の単語カテゴリがあり、小カテ
ゴリ群帳にI 、II、III の3個の小カテゴリ群が登録さ
れており、それぞれに属するカテゴリとして、I :
(A,B,D,F)、II:(A,C,G,I)、III :
(A,E,H,J)と分類されているとき、小カテゴリ
群I に属するカテゴリAのパタン表現モデルも、小カテ
ゴリ群IIに属するカテゴリAのパタン表現モデルも、初
期モデル3のカテゴリAを表現するモデルのパラメータ
を初期値として設定する。
【0038】また学習用パタン1は、学習対象となるカ
テゴリの各々に対して一個以上用意されているものとす
る。
テゴリの各々に対して一個以上用意されているものとす
る。
【0039】学習は以下のように行う。
【0040】(学習手順1)学習対象となる前記複数の
単語カテゴリのいずれかに属する、一個の学習用パタン
1が、学習用小カテゴリ群選択手段13に入力される
と、学習用小カテゴリ群選択手段13では、初期モデル
3を用いて、小カテゴリ群帳12に登録された小カテゴ
リ群のうち、学習パタン1の属するカテゴリを含み、こ
の学習用パタン1に最も適合した小カテゴリ群を選択
し、小カテゴリ群選択結果14を出力する。ここでは小
カテゴリ群の選択を以下のように行う。
単語カテゴリのいずれかに属する、一個の学習用パタン
1が、学習用小カテゴリ群選択手段13に入力される
と、学習用小カテゴリ群選択手段13では、初期モデル
3を用いて、小カテゴリ群帳12に登録された小カテゴ
リ群のうち、学習パタン1の属するカテゴリを含み、こ
の学習用パタン1に最も適合した小カテゴリ群を選択
し、小カテゴリ群選択結果14を出力する。ここでは小
カテゴリ群の選択を以下のように行う。
【0041】初期モデル3と学習用パタン1の類似度を
求め、モデルの属する単語カテゴリを類似度の高いもの
から順にC(1)、C(2)、……とおく。小カテゴリ
群kに単語カテゴリC(1)、C(2)、……C(N)
がすべて含まれるとし、kに関するNの最大値をN
(k)とおくとき、N(k)の最も大きい小カテゴリ群
kを選択結果14として出力するものとする。ただし、
選択された小カテゴリ群はこの学習パタン1が属するカ
テゴリを必ず含むものとする。ここで、前記複数の単語
カテゴリの各々は前記複数の小カテゴリ群のいずれかに
属するものとし、1つの単語カテゴリが複数の小カテゴ
リ群に属することも可能である。
求め、モデルの属する単語カテゴリを類似度の高いもの
から順にC(1)、C(2)、……とおく。小カテゴリ
群kに単語カテゴリC(1)、C(2)、……C(N)
がすべて含まれるとし、kに関するNの最大値をN
(k)とおくとき、N(k)の最も大きい小カテゴリ群
kを選択結果14として出力するものとする。ただし、
選択された小カテゴリ群はこの学習パタン1が属するカ
テゴリを必ず含むものとする。ここで、前記複数の単語
カテゴリの各々は前記複数の小カテゴリ群のいずれかに
属するものとし、1つの単語カテゴリが複数の小カテゴ
リ群に属することも可能である。
【0042】(学習手順2)学習用カテゴリ選択手段4
は、前記学習パタン1が属するカテゴリを自カテゴリと
して選択する。
は、前記学習パタン1が属するカテゴリを自カテゴリと
して選択する。
【0043】また学習小カテゴリ群選択手段13によっ
て選択された小カテゴリ群に属する小カテゴリ群別学習
途中モデル15を用いて、前記学習パタン1に対して、
前記学習パタン1が属するカテゴリ以外のモデルからの
生起確率を求め、前記生起確率が最大となるもののカテ
ゴリを最近傍他カテゴリとして選択する。
て選択された小カテゴリ群に属する小カテゴリ群別学習
途中モデル15を用いて、前記学習パタン1に対して、
前記学習パタン1が属するカテゴリ以外のモデルからの
生起確率を求め、前記生起確率が最大となるもののカテ
ゴリを最近傍他カテゴリとして選択する。
【0044】(学習手順3)パラメータ制御手段6で
は、小カテゴリ群別学習途中モデル15において、学習
用小カテゴリ群選択手段13によって選択された小カテ
ゴリ群に属し、かつ学習用カテゴリ選択手段4によって
選択された自カテゴリのモデル、及び最近傍他カテゴリ
のモデルに対して、この学習用パタン1が生起する確率
が自カテゴリモデルでは高く、最近傍他カテゴリモデル
では低くなるようにモデルのパラメータを再推定する。
は、小カテゴリ群別学習途中モデル15において、学習
用小カテゴリ群選択手段13によって選択された小カテ
ゴリ群に属し、かつ学習用カテゴリ選択手段4によって
選択された自カテゴリのモデル、及び最近傍他カテゴリ
のモデルに対して、この学習用パタン1が生起する確率
が自カテゴリモデルでは高く、最近傍他カテゴリモデル
では低くなるようにモデルのパラメータを再推定する。
【0045】このパラメータ再推定は従来技術と同様の
方法で行う。すなわち、モデルの出力確率分布と前記学
習用パタン1との対応関係をViterbi パスにより決定
し、出力確率分布の中心ベクトルを、学習用パタン1を
構成する音響特徴ベクトルの対応するベクトルに自カテ
ゴリモデルでは近づけ、最近傍他カテゴリモデルでは遠
ざけることで実現する。
方法で行う。すなわち、モデルの出力確率分布と前記学
習用パタン1との対応関係をViterbi パスにより決定
し、出力確率分布の中心ベクトルを、学習用パタン1を
構成する音響特徴ベクトルの対応するベクトルに自カテ
ゴリモデルでは近づけ、最近傍他カテゴリモデルでは遠
ざけることで実現する。
【0046】パラメータの再推定は、学習用小カテゴリ
群選択手段13によって選択された小カテゴリ群以外の
小カテゴリ群に属するモデルに対しては行わない。
群選択手段13によって選択された小カテゴリ群以外の
小カテゴリ群に属するモデルに対しては行わない。
【0047】(学習手順4)再推定されたモデルを、対
応する小カテゴリ群別学習途中モデル15と置き換え
る。
応する小カテゴリ群別学習途中モデル15と置き換え
る。
【0048】(学習手順5)すべての学習パタンの各々
に対して、上記の学習手順1から4を行う。
に対して、上記の学習手順1から4を行う。
【0049】(学習手順6)上記の学習手順1から5ま
での処理を必要回数行った後、得られたモデルを小カテ
ゴリ群別学習結果モデル16として出力する。
での処理を必要回数行った後、得られたモデルを小カテ
ゴリ群別学習結果モデル16として出力する。
【0050】本発明に係わるパタン表現モデル学習装置
におけるパタン表現モデルの学習方式を例をあげて説明
する。例えば、A,B,C,……,Jの認識すべき10
の単語カテゴリがあり、小カテゴリ群帳12にI ,II,
III の3個の小カテゴリ群が登録されており、それぞれ
に属するカテゴリとして、I :(A,B,D,F)、I
I:(A,C,G,I)、III :(A,E,H,J)と
分類されているとする。カテゴリAに属する学習用パタ
ン1を入力したとき、学習用小カテゴリ群選択手段13
によって小カテゴリ群I が選択され、さらに学習用カテ
ゴリ選択手段4により、カテゴリAの最近傍カテゴリと
してカテゴリBが選択されたならば、パラメータ制御手
段6により、小カテゴリ群Iに属するカテゴリAのモデ
ルに対しては、学習用パタン1が生起する確率が高くな
るようにパラメータを再推定し、逆に小カテゴリI のカ
テゴリBのモデルに対しては、この学習用パタン1が生
起する確率が低くなるようにパラメータを再推定するこ
とにより、カテゴリAとカテゴリBの識別性能を高める
ことができる。
におけるパタン表現モデルの学習方式を例をあげて説明
する。例えば、A,B,C,……,Jの認識すべき10
の単語カテゴリがあり、小カテゴリ群帳12にI ,II,
III の3個の小カテゴリ群が登録されており、それぞれ
に属するカテゴリとして、I :(A,B,D,F)、I
I:(A,C,G,I)、III :(A,E,H,J)と
分類されているとする。カテゴリAに属する学習用パタ
ン1を入力したとき、学習用小カテゴリ群選択手段13
によって小カテゴリ群I が選択され、さらに学習用カテ
ゴリ選択手段4により、カテゴリAの最近傍カテゴリと
してカテゴリBが選択されたならば、パラメータ制御手
段6により、小カテゴリ群Iに属するカテゴリAのモデ
ルに対しては、学習用パタン1が生起する確率が高くな
るようにパラメータを再推定し、逆に小カテゴリI のカ
テゴリBのモデルに対しては、この学習用パタン1が生
起する確率が低くなるようにパラメータを再推定するこ
とにより、カテゴリAとカテゴリBの識別性能を高める
ことができる。
【0051】このパラメータの再推定により、小カテゴ
リ群I に属する他のカテゴリであるカテゴリDと、カテ
ゴリAまたはカテゴリBとの、識別性能を低下させるよ
うなパラメータに推定される可能性もあるが、このよう
な悪影響を及ぼす可能性は小カテゴリ群I 内のみに限定
されているので、全てのカテゴリを分割せずに一括して
扱う従来技術として比較して、前記のような悪影響を及
ぼす可能性のあるカテゴリ数が少ない。ゆえにモデルA
とモデルBのパラメータを再推定したことにより、小カ
テゴリ群I 内の他カテゴリのモデルとの識別性能が低下
した場合でも、さらに前記識別性能が低下したモデル同
士のパラメータを再推定すればよく、その再推定結果が
他のモデルとの識別性能に影響を与えた場合でも、小カ
テゴリ群内ではカテゴリ数が少ないので、さらに再推定
を繰り返し行うことにより、前記悪影響を非常に小さく
抑えることができる。
リ群I に属する他のカテゴリであるカテゴリDと、カテ
ゴリAまたはカテゴリBとの、識別性能を低下させるよ
うなパラメータに推定される可能性もあるが、このよう
な悪影響を及ぼす可能性は小カテゴリ群I 内のみに限定
されているので、全てのカテゴリを分割せずに一括して
扱う従来技術として比較して、前記のような悪影響を及
ぼす可能性のあるカテゴリ数が少ない。ゆえにモデルA
とモデルBのパラメータを再推定したことにより、小カ
テゴリ群I 内の他カテゴリのモデルとの識別性能が低下
した場合でも、さらに前記識別性能が低下したモデル同
士のパラメータを再推定すればよく、その再推定結果が
他のモデルとの識別性能に影響を与えた場合でも、小カ
テゴリ群内ではカテゴリ数が少ないので、さらに再推定
を繰り返し行うことにより、前記悪影響を非常に小さく
抑えることができる。
【0052】また、この時、小カテゴリ群II、III に属
するカテゴリAのパタン表現モデルのパラメータは変更
しない。このため、小カテゴリ群II、及びIII に属する
カテゴリ同士の識別性能には変化をあたえることなく、
小カテゴリ群I に属するカテゴリ同士の識別性能を高め
ることが可能である。このため、学習精度を高めること
が可能である。
するカテゴリAのパタン表現モデルのパラメータは変更
しない。このため、小カテゴリ群II、及びIII に属する
カテゴリ同士の識別性能には変化をあたえることなく、
小カテゴリ群I に属するカテゴリ同士の識別性能を高め
ることが可能である。このため、学習精度を高めること
が可能である。
【0053】次に認識の動作について説明する。
【0054】認識パタン8が入力されると、認識用小カ
テゴリ群選択手段17では、初期モデル3を用いて、小
カテゴリ群帳12に登録された小カテゴリ群のうち、認
識パタン8に最も適合した小カテゴリ群を選択し、認識
用小カテゴリ群選択結果18を出力する。ここでは学習
用小カテゴリ群選択手段13と同様にして選択を行う。
ただし学習用小カテゴリ群選択手段13では、選択され
た小カテゴリ群は学習用パタン1が属するカテゴリを必
ず含むものとしたが、ここでは対応する条件は設けな
い。
テゴリ群選択手段17では、初期モデル3を用いて、小
カテゴリ群帳12に登録された小カテゴリ群のうち、認
識パタン8に最も適合した小カテゴリ群を選択し、認識
用小カテゴリ群選択結果18を出力する。ここでは学習
用小カテゴリ群選択手段13と同様にして選択を行う。
ただし学習用小カテゴリ群選択手段13では、選択され
た小カテゴリ群は学習用パタン1が属するカテゴリを必
ず含むものとしたが、ここでは対応する条件は設けな
い。
【0055】認識用カテゴリ選択手段9では、前記認識
用小カテゴリ群選択手段17によって選択された小カテ
ゴリ群を構成するカテゴリに対して、小カテゴリ群別学
習結果モデル16を用いて、前記認識パタン8との生起
確率を求め、これらのモデルのうち生起確率が最大とな
るカテゴリのモデルを選択し、認識結果10を出力す
る。
用小カテゴリ群選択手段17によって選択された小カテ
ゴリ群を構成するカテゴリに対して、小カテゴリ群別学
習結果モデル16を用いて、前記認識パタン8との生起
確率を求め、これらのモデルのうち生起確率が最大とな
るカテゴリのモデルを選択し、認識結果10を出力す
る。
【0056】実施例2.図2は、請求項1記載の発明の
実施例に係わるパタン表現モデル学習装置及びパタン認
識装置において、小カテゴリ群として2つの相異なるカ
テゴリの対を設定した場合の一実施例を示す構成図であ
る。
実施例に係わるパタン表現モデル学習装置及びパタン認
識装置において、小カテゴリ群として2つの相異なるカ
テゴリの対を設定した場合の一実施例を示す構成図であ
る。
【0057】図2において、1は学習用パタンであり、
各カテゴリの音声を音響分析して得られる音響特徴ベク
トルの時系列である。2は各カテゴリ毎にHMMの初期
モデルを設定する初期モデル設定手段、3は初期モデル
設定手段2によって設定された各カテゴリの初期モデ
ル、4は入力された学習用パタンに応じて学習するカテ
ゴリを選択する学習用カテゴリ選択手段、6は学習用カ
テゴリ選択手段4によって選択された学習カテゴリのパ
タン表現モデルのパラメータを制御するパラメータ制御
手段、8は発声内容が未知の音声を音響分析して得られ
る音響特徴ベクトルの時系列である、認識パタン、10
は認識結果、19はカテゴリ対登録手段、20はカテゴ
リ対帳、21は学習用カテゴリ対選択手段、22は学習
用カテゴリ対の選択結果、23は学習途中のカテゴリ対
別学習途中モデル、24は学習が完了したカテゴリ対別
学習結果モデル、25は認識用のカテゴリ対を選択する
認識用カテゴリ対選択手段、26は認識用カテゴリ対の
選択結果である。
各カテゴリの音声を音響分析して得られる音響特徴ベク
トルの時系列である。2は各カテゴリ毎にHMMの初期
モデルを設定する初期モデル設定手段、3は初期モデル
設定手段2によって設定された各カテゴリの初期モデ
ル、4は入力された学習用パタンに応じて学習するカテ
ゴリを選択する学習用カテゴリ選択手段、6は学習用カ
テゴリ選択手段4によって選択された学習カテゴリのパ
タン表現モデルのパラメータを制御するパラメータ制御
手段、8は発声内容が未知の音声を音響分析して得られ
る音響特徴ベクトルの時系列である、認識パタン、10
は認識結果、19はカテゴリ対登録手段、20はカテゴ
リ対帳、21は学習用カテゴリ対選択手段、22は学習
用カテゴリ対の選択結果、23は学習途中のカテゴリ対
別学習途中モデル、24は学習が完了したカテゴリ対別
学習結果モデル、25は認識用のカテゴリ対を選択する
認識用カテゴリ対選択手段、26は認識用カテゴリ対の
選択結果である。
【0058】ここでカテゴリ対別学習途中モデル23及
びカテゴリ対別学習結果モデル24は、各カテゴリ対毎
に別々に用意する。
びカテゴリ対別学習結果モデル24は、各カテゴリ対毎
に別々に用意する。
【0059】本実施例においてもパタン表現モデルとし
て、出力確率分布が多次元正規分布の混合分布で表現さ
れた連続型のHMMを用いるものとする。また学習や認
識の対象となるカテゴリの単位は単語であるとする。
て、出力確率分布が多次元正規分布の混合分布で表現さ
れた連続型のHMMを用いるものとする。また学習や認
識の対象となるカテゴリの単位は単語であるとする。
【0060】まずパタン表現モデル学習装置の動作につ
いて説明する。
いて説明する。
【0061】学習手続きに先立ち、初期モデル設定手段
2によって、各カテゴリの初期モデル3は既に設定され
ているものとする。本例では初期モデル3は最尤推定法
により設定されているものとする。
2によって、各カテゴリの初期モデル3は既に設定され
ているものとする。本例では初期モデル3は最尤推定法
により設定されているものとする。
【0062】またカテゴリ対別学習途中モデル23の初
期値としては、初期モデル3の値を各カテゴリ対で共通
に設定することとする。
期値としては、初期モデル3の値を各カテゴリ対で共通
に設定することとする。
【0063】また学習用パタン1は、学習対象となるカ
テゴリの各々に対して一個以上用意されているものとす
る。
テゴリの各々に対して一個以上用意されているものとす
る。
【0064】まずパタン表現モデルの学習時の動作につ
いて説明する。
いて説明する。
【0065】パタン表現モデルの学習は、(1)カテゴ
リ対登録、(2)小カテゴリ対内のパタン表現モデルの
学習、の2つの手続きによって行う。
リ対登録、(2)小カテゴリ対内のパタン表現モデルの
学習、の2つの手続きによって行う。
【0066】(1)カテゴリ対登録 学習対象となっている全てのカテゴリを用いて作られる
相異なる2個のカテゴリの対を、すべてカテゴリ対帳2
0に登録する。例えば、学習対象となっているカテゴリ
が、A,B,C,D,Eの5個であったとすると、登録
されているカテゴリの対は、(A,B),(A,C),
(A,D),(A,E),(B,C),(B,D),
(B,E),(C,D),(C,E),(D,E)の1
0個である。
相異なる2個のカテゴリの対を、すべてカテゴリ対帳2
0に登録する。例えば、学習対象となっているカテゴリ
が、A,B,C,D,Eの5個であったとすると、登録
されているカテゴリの対は、(A,B),(A,C),
(A,D),(A,E),(B,C),(B,D),
(B,E),(C,D),(C,E),(D,E)の1
0個である。
【0067】(2)カテゴリ対内のパタン表現モデルの
学習 学習は以下のように行う。
学習 学習は以下のように行う。
【0068】(学習手順1)学習対象となる前記複数の
単語カテゴリのいずれかに属する、1個の学習用パタン
1が、学習用カテゴリ対選択手段21に入力されると、
学習用カテゴリ対選択手段21では、初期モデル3を用
いて、カテゴリ対帳20に登録されたカテゴリ対のう
ち、学習パタン1の属するカテゴリを含み、この学習用
パタン1に最も適合したカテゴリ対を選択し、カテゴリ
対選択結果22を出力する。
単語カテゴリのいずれかに属する、1個の学習用パタン
1が、学習用カテゴリ対選択手段21に入力されると、
学習用カテゴリ対選択手段21では、初期モデル3を用
いて、カテゴリ対帳20に登録されたカテゴリ対のう
ち、学習パタン1の属するカテゴリを含み、この学習用
パタン1に最も適合したカテゴリ対を選択し、カテゴリ
対選択結果22を出力する。
【0069】学習カテゴリ対の選択は以下のように行
う。
う。
【0070】(選択手順1) カテゴリ対帳20に登録
されたカテゴリ対のうち、学習用パタン1が属するカテ
ゴリを含むカテゴリ対全てを選択対象とする。
されたカテゴリ対のうち、学習用パタン1が属するカテ
ゴリを含むカテゴリ対全てを選択対象とする。
【0071】(選択手順2) 選択対象となっているカ
テゴリ対に含まれるカテゴリのうち、学習用パタン1が
属するカテゴリを除く全てのカテゴリの初期モデル3と
学習用パタン1との類似度を求め、類似度のもっとも高
いカテゴリを含むカテゴリ対を学習カテゴリ対選択結果
として出力する。
テゴリ対に含まれるカテゴリのうち、学習用パタン1が
属するカテゴリを除く全てのカテゴリの初期モデル3と
学習用パタン1との類似度を求め、類似度のもっとも高
いカテゴリを含むカテゴリ対を学習カテゴリ対選択結果
として出力する。
【0072】(学習手順2) 学習用カテゴリ選択手段4では、学習用カテゴリ対選択
手段21による選択結果22を構成するカテゴリのう
ち、前記学習用パタン1が属するカテゴリを学習自カテ
ゴリとして選択し、また対を構成する他方のカテゴリと
して選択し、選択結果5を出力する。
手段21による選択結果22を構成するカテゴリのう
ち、前記学習用パタン1が属するカテゴリを学習自カテ
ゴリとして選択し、また対を構成する他方のカテゴリと
して選択し、選択結果5を出力する。
【0073】(学習手順3) パラメータ制御手段6では、カテゴリ対別学習途中モデ
ル23において、学習用カテゴリ対選択手段21により
選択されたカテゴリ対に属する自カテゴリのモデル、及
び最近傍他カテゴリのモデルに対して、この学習用パタ
ン1が生起する確率が自カテゴリモデルでは高く、最近
傍他カテゴリモデルでは低くなるようにモデルのパラメ
ータを再推定する。
ル23において、学習用カテゴリ対選択手段21により
選択されたカテゴリ対に属する自カテゴリのモデル、及
び最近傍他カテゴリのモデルに対して、この学習用パタ
ン1が生起する確率が自カテゴリモデルでは高く、最近
傍他カテゴリモデルでは低くなるようにモデルのパラメ
ータを再推定する。
【0074】このパラメータ再推定は実施例1と同様の
方法で行う。
方法で行う。
【0075】パラメータの再推定は、学習用カテゴリ対
選択手段21によって選択されたカテゴリ対以外のカテ
ゴリ対に属するモデルに対しては行わない。
選択手段21によって選択されたカテゴリ対以外のカテ
ゴリ対に属するモデルに対しては行わない。
【0076】(学習手順4)再推定されたモデルを対応
するカテゴリ対別学習途中モデル23と置き換える。
するカテゴリ対別学習途中モデル23と置き換える。
【0077】(学習手順5)すべての学習パタンの各々
に対して、上記の学習手順1から4を行う。
に対して、上記の学習手順1から4を行う。
【0078】(学習手順6)上記の学習手順1から5ま
での処理を必要回数行った後、得られたモデルをカテゴ
リ対別学習結果モデル24として出力する。
での処理を必要回数行った後、得られたモデルをカテゴ
リ対別学習結果モデル24として出力する。
【0079】次に認識の動作について説明する。
【0080】カテゴリ未知の認識用音響的特徴系列が入
力されると、認識用カテゴリ対選択手段25では、初期
モデル3を用いて、カテゴリ対帳20に登録されたカテ
ゴリ対のうち、認識パタン8に最も適合したカテゴリ対
を選択し、カテゴリ対選択結果22を出力する。
力されると、認識用カテゴリ対選択手段25では、初期
モデル3を用いて、カテゴリ対帳20に登録されたカテ
ゴリ対のうち、認識パタン8に最も適合したカテゴリ対
を選択し、カテゴリ対選択結果22を出力する。
【0081】認識カテゴリ対の選択は以下のように行
う。
う。
【0082】(選択手順1) カテゴリ群帳に登録され
ているカテゴリ対全てを選択対象とする。
ているカテゴリ対全てを選択対象とする。
【0083】(選択手順2) 認識用カテゴリ対選択手
段25では、選択対象となっているカテゴリ対に含まれ
る全てのカテゴリの初期モデル3と認識パタン8との類
似度を求め、類似度の高い1位、2位のカテゴリを、対
として持っているカテゴリ対を認識カテゴリ対選択結果
26として出力する。
段25では、選択対象となっているカテゴリ対に含まれ
る全てのカテゴリの初期モデル3と認識パタン8との類
似度を求め、類似度の高い1位、2位のカテゴリを、対
として持っているカテゴリ対を認識カテゴリ対選択結果
26として出力する。
【0084】認識用カテゴリ選択手段9では、認識用カ
テゴリ対選択手段25によって選択されたカテゴリ対に
対して、カテゴリ対別学習結果モデル24を用いて、認
識パタン8と前記カテゴリ対を構成する2個のモデルと
の類似度を求め、これらのモデルのうち類似度が最大と
なるカテゴリのモデルを選択し、認識結果10を出力す
る。
テゴリ対選択手段25によって選択されたカテゴリ対に
対して、カテゴリ対別学習結果モデル24を用いて、認
識パタン8と前記カテゴリ対を構成する2個のモデルと
の類似度を求め、これらのモデルのうち類似度が最大と
なるカテゴリのモデルを選択し、認識結果10を出力す
る。
【0085】実施例3.図3は、請求項3及び請求項4
記載の発明に係わるパタン表現モデル学習装置及びパタ
ン認識装置の一実施例を示す構成図である。
記載の発明に係わるパタン表現モデル学習装置及びパタ
ン認識装置の一実施例を示す構成図である。
【0086】図3において、1は学習用パタンであり、
各カテゴリの音声を音響分析して得られる音響特徴ベク
トルの時系列である。2は各カテゴリ毎にHMMの初期
モデルを設定する初期モデル設定手段、3は初期モデル
設定手段2によって設定された各カテゴリの初期モデ
ル、4は入力された学習用パタンに応じて学習するカテ
ゴリを選択する学習用カテゴリ選択手段、6は学習用カ
テゴリ選択手段4によって選択された学習カテゴリのパ
タン表現モデルのパラメータを制御するパラメータ制御
手段、7はパラメータ制御手段によって得られた学習結
果モデル(図3には示されず、後述する図6に示されて
いる。)、8は発声内容が未知の音声を音響分析して得
られる音響特徴ベクトルの時系列である、認識パタン、
9は認識パタン8のカテゴリを決定する認識用カテゴリ
選択手段、10は認識結果、11は小カテゴリ群登録手
段、12は小カテゴリ群が登録されている小カテゴリ群
帳、13は学習用小カテゴリ群を選択する学習用小カテ
ゴリ群選択手段、14は学習用小カテゴリ群の選択結
果、15は学習途中の小カテゴリ群別学習途中モデル、
16は学習が完了した小カテゴリ群別学習結果モデル、
17は認識用の小カテゴリ群を選択する認識用小カテゴ
リ群選択手段、18は認識用小カテゴリ群の選択結果、
27は各カテゴリ間の認識混同情報を生成する混同情報
生成手段、28は学習用パタン1の出力場所を切り換え
るスイッチである。
各カテゴリの音声を音響分析して得られる音響特徴ベク
トルの時系列である。2は各カテゴリ毎にHMMの初期
モデルを設定する初期モデル設定手段、3は初期モデル
設定手段2によって設定された各カテゴリの初期モデ
ル、4は入力された学習用パタンに応じて学習するカテ
ゴリを選択する学習用カテゴリ選択手段、6は学習用カ
テゴリ選択手段4によって選択された学習カテゴリのパ
タン表現モデルのパラメータを制御するパラメータ制御
手段、7はパラメータ制御手段によって得られた学習結
果モデル(図3には示されず、後述する図6に示されて
いる。)、8は発声内容が未知の音声を音響分析して得
られる音響特徴ベクトルの時系列である、認識パタン、
9は認識パタン8のカテゴリを決定する認識用カテゴリ
選択手段、10は認識結果、11は小カテゴリ群登録手
段、12は小カテゴリ群が登録されている小カテゴリ群
帳、13は学習用小カテゴリ群を選択する学習用小カテ
ゴリ群選択手段、14は学習用小カテゴリ群の選択結
果、15は学習途中の小カテゴリ群別学習途中モデル、
16は学習が完了した小カテゴリ群別学習結果モデル、
17は認識用の小カテゴリ群を選択する認識用小カテゴ
リ群選択手段、18は認識用小カテゴリ群の選択結果、
27は各カテゴリ間の認識混同情報を生成する混同情報
生成手段、28は学習用パタン1の出力場所を切り換え
るスイッチである。
【0087】ここで小カテゴリ群別学習途中モデル15
及び小カテゴリ群別学習結果モデル16は、各小カテゴ
リ群毎に別々に用意する。すなわち、複数の小カテゴリ
群に属するカテゴリは、そのカテゴリが所属する小カテ
ゴリ毎に別々のパタン表現モデルを設定する。
及び小カテゴリ群別学習結果モデル16は、各小カテゴ
リ群毎に別々に用意する。すなわち、複数の小カテゴリ
群に属するカテゴリは、そのカテゴリが所属する小カテ
ゴリ毎に別々のパタン表現モデルを設定する。
【0088】本実施例においても、パタン表現モデルと
して、出力確率分布が多次元正規分布の混合分布で表現
された連続型のHMMを用いるものとする。また学習や
認識の対象となるカテゴリの単位は単語であるとする。
して、出力確率分布が多次元正規分布の混合分布で表現
された連続型のHMMを用いるものとする。また学習や
認識の対象となるカテゴリの単位は単語であるとする。
【0089】まずパタン表現モデル学習装置の動作につ
いて説明する。
いて説明する。
【0090】学習手続きに先立ち、初期モデル設定手段
2によって、各カテゴリの初期モデル3は既に設定され
ているものとする。本例では初期モデル3は最尤推定法
により設定されているものとする。
2によって、各カテゴリの初期モデル3は既に設定され
ているものとする。本例では初期モデル3は最尤推定法
により設定されているものとする。
【0091】また小カテゴリ群別学習途中モデル15の
初期値としては、実施例1と同様に初期モデル3の値を
各小カテゴリ群で共通に設定することとする。
初期値としては、実施例1と同様に初期モデル3の値を
各小カテゴリ群で共通に設定することとする。
【0092】また学習用パタン1は、学習対象となるカ
テゴリの各々に対して一個以上用意されているものとす
る。
テゴリの各々に対して一個以上用意されているものとす
る。
【0093】まずパタン表現モデルの学習時の動作につ
いて説明する。
いて説明する。
【0094】パタン表現モデルの学習は、(1)小カテ
ゴリ群登録、(2)各小カテゴリ群内のパタン表現モデ
ルの学習、の2つの手続きによって行う。
ゴリ群登録、(2)各小カテゴリ群内のパタン表現モデ
ルの学習、の2つの手続きによって行う。
【0095】(1)小カテゴリ群登録 切り換えスイッチ28を端子Aに接続し、学習用パタン
1が混同情報生成手段27に入力されるようにする。混
同情報生成手段27では、学習対象となっている各カテ
ゴリの初期モデル3を用いて、前記学習用パタン1に対
する音声認識を行い、カテゴリ間の混同情報を生成す
る。
1が混同情報生成手段27に入力されるようにする。混
同情報生成手段27では、学習対象となっている各カテ
ゴリの初期モデル3を用いて、前記学習用パタン1に対
する音声認識を行い、カテゴリ間の混同情報を生成す
る。
【0096】例えば、学習用音響的特徴系列が属するカ
テゴリがAであり、認識結果がカテゴリBであったとす
ると、カテゴリAのカテゴリBへの認識混同情報として
保持しておく。
テゴリがAであり、認識結果がカテゴリBであったとす
ると、カテゴリAのカテゴリBへの認識混同情報として
保持しておく。
【0097】他の全ての学習用パタンに対しても、上記
と同様に各カテゴリの初期モデルとの類似度を計算し、
認識誤りの情報を保持しておく。全ての学習用パタンに
対する上記処理の終了後の混同情報を表1に示す。表1
からカテゴリAの学習用音響的特徴系列を入力した場合
には、カテゴリB,D,Eと誤って認識される場合があ
ることがわかる。
と同様に各カテゴリの初期モデルとの類似度を計算し、
認識誤りの情報を保持しておく。全ての学習用パタンに
対する上記処理の終了後の混同情報を表1に示す。表1
からカテゴリAの学習用音響的特徴系列を入力した場合
には、カテゴリB,D,Eと誤って認識される場合があ
ることがわかる。
【0098】
【表1】 小カテゴリ群登録手段11では、混同情報生成手段27
によって生成された、混同情報に基づいて小カテゴリ群
を設定し、小カテゴリ群帳12に登録する。
によって生成された、混同情報に基づいて小カテゴリ群
を設定し、小カテゴリ群帳12に登録する。
【0099】本実施例では、各カテゴリにおいて、当該
カテゴリの学習用音響的特徴系列を入力した場合に、認
識結果として出力されたカテゴリ及び当該カテゴリの混
同情報から導かれるカテゴリの和集合を一つの小カテゴ
リ群とする。すなわち表1において、入力カテゴリがA
である場合の混同情報の結果から、構成要素がカテゴリ
A,B,D,Eである小カテゴリ群を小カテゴリ群帳1
2に登録する。同様に入力カテゴリがBである場合の混
同情報の結果から、構成要素がカテゴリB,F,Gであ
る小カテゴリ群を小カテゴリ群帳12に登録する。
カテゴリの学習用音響的特徴系列を入力した場合に、認
識結果として出力されたカテゴリ及び当該カテゴリの混
同情報から導かれるカテゴリの和集合を一つの小カテゴ
リ群とする。すなわち表1において、入力カテゴリがA
である場合の混同情報の結果から、構成要素がカテゴリ
A,B,D,Eである小カテゴリ群を小カテゴリ群帳1
2に登録する。同様に入力カテゴリがBである場合の混
同情報の結果から、構成要素がカテゴリB,F,Gであ
る小カテゴリ群を小カテゴリ群帳12に登録する。
【0100】同様に入力カテゴリがC,D,E,……,
Jの場合に対しても小カテゴリ群を構成し、小カテゴリ
群帳12に登録する。
Jの場合に対しても小カテゴリ群を構成し、小カテゴリ
群帳12に登録する。
【0101】以上で小カテゴリ群登録の手続きを終了す
る。
る。
【0102】 (2)各小カテゴリ群内のパタン表現モデルの学習 切り換えスイッチ28を端子Bに接続し、学習用パタン
1が学習用小カテゴリ群選択手段13に入力されるよう
にする。
1が学習用小カテゴリ群選択手段13に入力されるよう
にする。
【0103】学習は以下のように行う。
【0104】(学習手順1) 学習対象となる前記複数の単語カテゴリのいずれかに属
する、1個の学習用パタン1が、学習用小カテゴリ群選
択手段13に入力されると、学習用小カテゴリ群選択手
段13では、初期モデル3を用いて、小カテゴリ群帳1
2に登録された小カテゴリ群のうち、学習パタン1の属
するカテゴリを含み、この学習用パタン1に最も適合し
た小カテゴリ群を選択し、小カテゴリ群選択結果14を
出力する。学習用小カテゴリ群の選択は図4に示すよう
に行う。
する、1個の学習用パタン1が、学習用小カテゴリ群選
択手段13に入力されると、学習用小カテゴリ群選択手
段13では、初期モデル3を用いて、小カテゴリ群帳1
2に登録された小カテゴリ群のうち、学習パタン1の属
するカテゴリを含み、この学習用パタン1に最も適合し
た小カテゴリ群を選択し、小カテゴリ群選択結果14を
出力する。学習用小カテゴリ群の選択は図4に示すよう
に行う。
【0105】すなわち、 (選択手順1) 小カテゴリ群帳12に登録された小カ
テゴリ群のうち、学習用パタン1が属するカテゴリを含
む小カテゴリ群全てを選択対象とする。
テゴリ群のうち、学習用パタン1が属するカテゴリを含
む小カテゴリ群全てを選択対象とする。
【0106】(選択手順2) 選択対象となっている小
カテゴリ群に含まれるカテゴリのうち、学習用パタン1
が属するカテゴリを除く全てのカテゴリの初期モデル3
と学習用パタン1との類似度を求め、各カテゴリに対し
て類似度の高いものから順に類似度の順位を1位、2
位、……と付与する。
カテゴリ群に含まれるカテゴリのうち、学習用パタン1
が属するカテゴリを除く全てのカテゴリの初期モデル3
と学習用パタン1との類似度を求め、各カテゴリに対し
て類似度の高いものから順に類似度の順位を1位、2
位、……と付与する。
【0107】(選択手順3) 類似度の順位を指定する
変数nを、n=1とする。
変数nを、n=1とする。
【0108】(選択手順4) 選択対象となっている小
カテゴリ群のなかから、類似度の順位がn位のカテゴリ
を含む小カテゴリ群を選択する。
カテゴリ群のなかから、類似度の順位がn位のカテゴリ
を含む小カテゴリ群を選択する。
【0109】(選択手順5A) 選択手順4で選択され
た小カテゴリ群が1個の場合、その選択された小カテゴ
リ群を選択結果14として出力する。
た小カテゴリ群が1個の場合、その選択された小カテゴ
リ群を選択結果14として出力する。
【0110】(選択手順5B) 選択手順4で選択され
た小カテゴリ群が0個の場合、類似度の順位を示す変数
nを、n=n+1として選択手順4に戻る。
た小カテゴリ群が0個の場合、類似度の順位を示す変数
nを、n=n+1として選択手順4に戻る。
【0111】(選択手順5C) 選択手順4で選択され
た小カテゴリ群が2個以上の場合は、選択対象とする小
カテゴリ群を選択手順4で選択された小カテゴリ群のみ
に限定し、また類似度の順位を示す変数nを、n=n+
1として選択手順4に戻る。
た小カテゴリ群が2個以上の場合は、選択対象とする小
カテゴリ群を選択手順4で選択された小カテゴリ群のみ
に限定し、また類似度の順位を示す変数nを、n=n+
1として選択手順4に戻る。
【0112】(学習手順2)学習用カテゴリ選択手段4
は、前記学習パタン1が属するカテゴリを自カテゴリと
して選択する。
は、前記学習パタン1が属するカテゴリを自カテゴリと
して選択する。
【0113】また学習用小カテゴリ群選択手段13によ
って選択された小カテゴリ群に属する小カテゴリ群別学
習途中モデル15を用いて、前記学習パタン1に対し
て、前記学習パタン1が属するカテゴリ以外のモデルか
らの生起確率を求め、前記生起確率が最大となるものの
カテゴリを最近傍他カテゴリとして選択する。
って選択された小カテゴリ群に属する小カテゴリ群別学
習途中モデル15を用いて、前記学習パタン1に対し
て、前記学習パタン1が属するカテゴリ以外のモデルか
らの生起確率を求め、前記生起確率が最大となるものの
カテゴリを最近傍他カテゴリとして選択する。
【0114】(学習手順3) パラメータ制御手段6では、小カテゴリ群別学習途中モ
デル15において、学習用小カテゴリ群選択手段13に
より選択された小カテゴリ群に属し、かつ学習用カテゴ
リ選択手段4によって選択された自カテゴリのモデル、
及び最近傍他カテゴリのモデルに対して、この学習用パ
タン1が生起する確率が自カテゴリモデルでは高く、最
近傍他カテゴリモデルでは低くなるようにモデルのパラ
メータを再推定する。
デル15において、学習用小カテゴリ群選択手段13に
より選択された小カテゴリ群に属し、かつ学習用カテゴ
リ選択手段4によって選択された自カテゴリのモデル、
及び最近傍他カテゴリのモデルに対して、この学習用パ
タン1が生起する確率が自カテゴリモデルでは高く、最
近傍他カテゴリモデルでは低くなるようにモデルのパラ
メータを再推定する。
【0115】このパラメータ再推定は実施例1と同様の
方法で行う。
方法で行う。
【0116】パラメータの再推定は、学習用小カテゴリ
群選択手段13によって選択された小テゴリ対以外の小
カテゴリ群に属するモデルに対しては行わない。
群選択手段13によって選択された小テゴリ対以外の小
カテゴリ群に属するモデルに対しては行わない。
【0117】(学習手順4)再推定されたモデルを、対
応する小カテゴリ群別学習途中モデル15と置き換え
る。
応する小カテゴリ群別学習途中モデル15と置き換え
る。
【0118】(学習手順5)すべての学習パタンの各々
に対して、上記の学習手順1から4を行う。
に対して、上記の学習手順1から4を行う。
【0119】(学習手順6)上記の学習手順1から5ま
での処理を必要回数行った後、得られたモデルを小カテ
ゴリ群別学習結果モデル16として出力する。
での処理を必要回数行った後、得られたモデルを小カテ
ゴリ群別学習結果モデル16として出力する。
【0120】次に認識の動作について説明する。
【0121】認識パタン8が入力されると、認識用小カ
テゴリ群選択手段17では、初期モデル3を用いて、小
カテゴリ群帳12に登録された小カテゴリ群のうち、認
識パタン8に最も適合した小カテゴリ群を選択し、小カ
テゴリ群選択結果18を出力する。この小カテゴリ群の
選択は図5に示すように行う。
テゴリ群選択手段17では、初期モデル3を用いて、小
カテゴリ群帳12に登録された小カテゴリ群のうち、認
識パタン8に最も適合した小カテゴリ群を選択し、小カ
テゴリ群選択結果18を出力する。この小カテゴリ群の
選択は図5に示すように行う。
【0122】すなわち、(選択手順1) 小カテゴリ群
帳12に登録されている小カテゴリ群全てを選択対象と
する。
帳12に登録されている小カテゴリ群全てを選択対象と
する。
【0123】(選択手順2) 選択対象となっている小
カテゴリ群に含まれる全てのカテゴリの初期モデルと認
識用パタン8との類似度を求め、各カテゴリに対して類
似度の高いものから順に類似度の順位を1位、2位、…
…と付与しておく。
カテゴリ群に含まれる全てのカテゴリの初期モデルと認
識用パタン8との類似度を求め、各カテゴリに対して類
似度の高いものから順に類似度の順位を1位、2位、…
…と付与しておく。
【0124】(選択手順3) 類似度の順位を指定す変
数nを、n=1とする。
数nを、n=1とする。
【0125】(選択手順4) 選択対象となっている小
カテゴリ群のなかから、類似度の順位がn位のカテゴリ
を含む小カテゴリ群を選択する。
カテゴリ群のなかから、類似度の順位がn位のカテゴリ
を含む小カテゴリ群を選択する。
【0126】(選択手順5A) 選択手順4で選択され
た小カテゴリ群が1個の場合、その選択された小カテゴ
リ群を選択結果18として出力する。
た小カテゴリ群が1個の場合、その選択された小カテゴ
リ群を選択結果18として出力する。
【0127】(選択手順5B) 選択手順4で選択され
た小カテゴリ群が0個の場合、類似度の順位を示す変数
nを、n=n+1として選択手順4に戻る。
た小カテゴリ群が0個の場合、類似度の順位を示す変数
nを、n=n+1として選択手順4に戻る。
【0128】(選択手順5C) 選択手順4で選択され
た小カテゴリ群が2個以上の場合は、選択対象とする小
カテゴリ群を選択手順4で選択された小カテゴリ群のみ
に限定し、また類似度の順位を示す変数nを、n=n+
1として選択手順4に戻る。
た小カテゴリ群が2個以上の場合は、選択対象とする小
カテゴリ群を選択手順4で選択された小カテゴリ群のみ
に限定し、また類似度の順位を示す変数nを、n=n+
1として選択手順4に戻る。
【0129】認識用カテゴリ選択手段9では、前記認識
用小カテゴリ群選択手段17によって選択された小カテ
ゴリ群を構成するカテゴリに対して、小カテゴリ群別学
習結果モデル16を用いて、前記認識パタン8との生起
確率を求め、これらのモデルのうち生起確率が最大とな
るカテゴリのモデルを選択し、認識結果10を出力す
る。
用小カテゴリ群選択手段17によって選択された小カテ
ゴリ群を構成するカテゴリに対して、小カテゴリ群別学
習結果モデル16を用いて、前記認識パタン8との生起
確率を求め、これらのモデルのうち生起確率が最大とな
るカテゴリのモデルを選択し、認識結果10を出力す
る。
【0130】上記実施例1、2、3においては、学習の
対象を音声としたが、画像など他の対象に対して用いて
もよい。また、小カテゴリ群選択及びカテゴリ選択に用
いるモデルとして連続モデルを用い、パラメータ制御方
式として最適識別学習を用いてモデルの確率分布の平均
ベクトルを再推定したが、カテゴリを代表する平均ベク
トルをモデルとして用い、LVQ(Learning Vector Qu
antizatin)をパラメータ制御方式として用いる等、他の
モデル、他の制御方式でもよい。
対象を音声としたが、画像など他の対象に対して用いて
もよい。また、小カテゴリ群選択及びカテゴリ選択に用
いるモデルとして連続モデルを用い、パラメータ制御方
式として最適識別学習を用いてモデルの確率分布の平均
ベクトルを再推定したが、カテゴリを代表する平均ベク
トルをモデルとして用い、LVQ(Learning Vector Qu
antizatin)をパラメータ制御方式として用いる等、他の
モデル、他の制御方式でもよい。
【0131】また、例えば、小カテゴリ群選択及びカテ
ゴリ選択に用いるモデルとして、音声の音響的特徴量を
ベクトル量子化して扱う離散分布モデルを用いてもよ
く、パラメータ再推定には遷移確率と、音声の音響的特
徴量をベクトル量子化したコードラベルの出力確率を再
推定すればよい。この場合のパラメータ制御方式すなわ
ち再推定方式としては、例えばcorrective training を
用いればよい。
ゴリ選択に用いるモデルとして、音声の音響的特徴量を
ベクトル量子化して扱う離散分布モデルを用いてもよ
く、パラメータ再推定には遷移確率と、音声の音響的特
徴量をベクトル量子化したコードラベルの出力確率を再
推定すればよい。この場合のパラメータ制御方式すなわ
ち再推定方式としては、例えばcorrective training を
用いればよい。
【0132】
【発明の効果】以上のように、請求項1または請求項3
記載の発明に係るパタン表現モデル学習装置では、類似
するカテゴリ同士をまとめ、所定数の学習小カテゴリ群
として分類し、この所定数の学習小カテゴリ群の中か
ら、各学習パタン毎に、その学習パタンに最も類似する
小カテゴリ群を、学習小カテゴリ群選択手段により、1
個選択する。この選択された1個の小カテゴリ群の内部
でのみ、パラメータの再推定をパラメータ制御手段によ
り行う。この小カテゴリ群内のカテゴリ数は少ないの
で、再推定を繰り返すことにより選択された小カテゴリ
群内におけるカテゴリ間の識別性能を向上させることが
できる。また、前記パラメータ制御手段は、前記選択さ
れた小カテゴリ群以外の小カテゴリ群には全く影響を及
ぼさないため、前記選択された小カテゴリ群の内部のカ
テゴリの識別性能は高められ、かつ前記選択された小カ
テゴリ群以外のカテゴリの識別性能には影響を与えるこ
とがない。その結果、識別性能の高いパタン表現モデル
学習装置を実現することを可能とする。
記載の発明に係るパタン表現モデル学習装置では、類似
するカテゴリ同士をまとめ、所定数の学習小カテゴリ群
として分類し、この所定数の学習小カテゴリ群の中か
ら、各学習パタン毎に、その学習パタンに最も類似する
小カテゴリ群を、学習小カテゴリ群選択手段により、1
個選択する。この選択された1個の小カテゴリ群の内部
でのみ、パラメータの再推定をパラメータ制御手段によ
り行う。この小カテゴリ群内のカテゴリ数は少ないの
で、再推定を繰り返すことにより選択された小カテゴリ
群内におけるカテゴリ間の識別性能を向上させることが
できる。また、前記パラメータ制御手段は、前記選択さ
れた小カテゴリ群以外の小カテゴリ群には全く影響を及
ぼさないため、前記選択された小カテゴリ群の内部のカ
テゴリの識別性能は高められ、かつ前記選択された小カ
テゴリ群以外のカテゴリの識別性能には影響を与えるこ
とがない。その結果、識別性能の高いパタン表現モデル
学習装置を実現することを可能とする。
【0133】また、請求項2または請求項4記載の発明
に係わるパタン認識装置では、類似するカテゴリ同士を
クラス分けすることによって、所定数の認識小カテゴリ
群として分類し、未知の認識用パタンに対して、この所
定数の認識小カテゴリ群の中から、最も類似する認識小
カテゴリ群を選択し、この認識小カテゴリ群に含まれる
カテゴリのモデルに対してのみ、前記未知の認識パタン
との類似度を計算する。認識小カテゴリ群内の各カテゴ
リのモデルは本発明に係わるパラメータ制御手段によっ
て識別性能が高められており、その結果、認識性能の高
いパタン認識装置を実現することができる。
に係わるパタン認識装置では、類似するカテゴリ同士を
クラス分けすることによって、所定数の認識小カテゴリ
群として分類し、未知の認識用パタンに対して、この所
定数の認識小カテゴリ群の中から、最も類似する認識小
カテゴリ群を選択し、この認識小カテゴリ群に含まれる
カテゴリのモデルに対してのみ、前記未知の認識パタン
との類似度を計算する。認識小カテゴリ群内の各カテゴ
リのモデルは本発明に係わるパラメータ制御手段によっ
て識別性能が高められており、その結果、認識性能の高
いパタン認識装置を実現することができる。
【図1】 請求項1及び請求項2記載発明の一実施例に
係るパタン表現モデル学習装置及びパタン認識装置の構
成を示す構成図である。
係るパタン表現モデル学習装置及びパタン認識装置の構
成を示す構成図である。
【図2】 請求項1及び請求項2記載発明の他の実施例
に係るパタン表現モデル学習装置及びパタン認識装置の
構成を示す構成図である。
に係るパタン表現モデル学習装置及びパタン認識装置の
構成を示す構成図である。
【図3】 請求項3及び請求項4記載発明の一実施例に
係るパタン表現モデル学習装置及びパタン認識装置の構
成を示す構成図である。
係るパタン表現モデル学習装置及びパタン認識装置の構
成を示す構成図である。
【図4】 請求項3記載発明の一実施例に係るパタン表
現モデル学習装置における学習用小カテゴリ群選択手段
の動作を示すフローチャートである。
現モデル学習装置における学習用小カテゴリ群選択手段
の動作を示すフローチャートである。
【図5】 請求項4記載発明の一実施例に係るパタン認
識装置における認識用小カテゴリ群選択手段の動作を示
すフローチャートである。
識装置における認識用小カテゴリ群選択手段の動作を示
すフローチャートである。
【図6】 従来例に係るパタン表現モデル学習装置を示
す構成図である。
す構成図である。
1 学習用パタン、2 初期モデル設定手段、3 初期
モデル、4 学習用カテゴリ選択手段、5 学習用カテ
ゴリ選択手段の選択結果、6 パラメータ制御手段、7
学習結果モデル、8 認識パタン、9 認識用カテゴ
リ選択手段、10 認識結果、11 小カテゴリ群登録
手段、12 小カテゴリ群帳、13 学習用小カテゴリ
群選択手段、14 学習用小カテゴリ群選択結果、15
小カテゴリ群別学習途中モデル、16 小カテゴリ群
別学習結果モデル、17 認識用小カテゴリ群選択手
段、18 認識用小カテゴリ群選択結果、19 カテゴ
リ対登録手段、20 カテゴリ対帳、21 学習用カテ
ゴリ対選択手段、22 学習用カテゴリ対選択手段の選
択結果、23 カテゴリ対別学習途中モデル、24 カ
テゴリ対別学習結果モデル、25 認識用カテゴリ対選
択手段、26 認識用カテゴリ対選択手段の選択結果、
27 混同情報生成手段、28 切り換えスイッチ。
モデル、4 学習用カテゴリ選択手段、5 学習用カテ
ゴリ選択手段の選択結果、6 パラメータ制御手段、7
学習結果モデル、8 認識パタン、9 認識用カテゴ
リ選択手段、10 認識結果、11 小カテゴリ群登録
手段、12 小カテゴリ群帳、13 学習用小カテゴリ
群選択手段、14 学習用小カテゴリ群選択結果、15
小カテゴリ群別学習途中モデル、16 小カテゴリ群
別学習結果モデル、17 認識用小カテゴリ群選択手
段、18 認識用小カテゴリ群選択結果、19 カテゴ
リ対登録手段、20 カテゴリ対帳、21 学習用カテ
ゴリ対選択手段、22 学習用カテゴリ対選択手段の選
択結果、23 カテゴリ対別学習途中モデル、24 カ
テゴリ対別学習結果モデル、25 認識用カテゴリ対選
択手段、26 認識用カテゴリ対選択手段の選択結果、
27 混同情報生成手段、28 切り換えスイッチ。
フロントページの続き (56)参考文献 特許2763704(JP,B2) 特公 平8−33739(JP,B2) 電子情報通信学会技術研究報告[音声 ],Vol.91,No.243,SP91− 58,水田忍外「混合連続分布音素片HM Mを用いた不特定話者単語認識方式にお ける最適識別学習法の検討」,p.21− 28(1991年9月27日発行) 日本音響学会平成2年度春季研究発表 会講演論文集▲I▼,1−3−12,水田 忍外「混合連続分布HMMに対する最適 識別学習法の検討」,p.23−24(平成 2年3月発行) 日本音響学会平成3年度秋季研究発表 会講演論文集▲I▼,3−5−16,水田 忍外「認識語彙の音韻対立関係を考慮し た音素片HMMの最適識別学習法」, p.121−122(平成3年10月4日特許庁 資料館受入) (58)調査した分野(Int.Cl.7,DB名) G10L 15/14 G10L 15/06 G06K 9/68 JICSTファイル(JOIS)
Claims (4)
- 【請求項1】 パタン認識において、認識の対象となる
カテゴリに属する学習用パタンを用いて、前記カテゴリ
に属するパタンを表現するパタン表現モデルのパラメー
タの初期値を設定する初期モデル設定手段と、 前記初期モデル設定手段によって得られた各々のカテゴ
リに属する初期モデルを用いて、各カテゴリ間の類似度
を求め、類似度の高いカテゴリ同士を一つの小カテゴリ
群にクラス分けすることによって、前記認識対象となる
複数のカテゴリ全体を所定数の小カテゴリ群に分類し、
この分類結果を小カテゴリ群帳に登録する小カテゴリ群
登録手段と、 前記認識対象となる複数のカテゴリのいずれかに属する
カテゴリ既知の学習パタンを入力とし、この学習パタン
が属するカテゴリを含む小カテゴリ群全てをまず選択
し、選択された小カテゴリ群の中からこの学習パタンと
の類似度が最大となる小カテゴリ群一個を、最終選択結
果として出力する学習用小カテゴリ群選択手段と、 前記学習用小カテゴリ群選択手段により選択された一個
の小カテゴリ群を構成する複数のカテゴリのうち、前記
学習パタンが属するカテゴリである学習自カテゴリと、
前記学習パタンが属するカテゴリ以外で前記学習パタン
との類似度が最大となるカテゴリである最近傍学習他カ
テゴリとを、選択結果として出力する学習用カテゴリ選
択手段と、 前記学習用カテゴリ選択手段により選択された前記学習
自カテゴリのパタン表現モデルに対しては前記学習パタ
ンとの類似度がより高くなるようにモデルのパラメータ
を制御し、前記最近傍学習他カテゴリのパタン表現モデ
ルに対しては前記学習パタンとの類似度がより低くなる
ようにモデルのパラメータを制御するパラメータ制御手
段とを備え、 前記パラメータ制御手段の出力パラメータを学習結果と
するパタン表現モデル学習装置。 - 【請求項2】 パタン認識において、認識の対象となる
カテゴリに属する学習用パタンを用いて、前記カテゴリ
に属するパタンを表現するパタン表現モデルのパラメー
タの初期値を設定する初期モデル設定手段と、 前記初期モデル設定手段によって得られた各々のカテゴ
リに属する初期モデルを用いて、各カテゴリ間の類似度
を求め、類似度の高いカテゴリ同士を一つの小カテゴリ
群にクラス分けすることによって、前記認識対象となる
複数のカテゴリ全体を所定数の小カテゴリ群に分類し、
この分類結果を小カテゴリ群帳に登録する小カテゴリ群
登録手段と、 前記認識対象となる複数のカテゴリのいずれかに属する
カテゴリ既知の学習パタンを入力とし、この学習パタン
が属するカテゴリを含む小カテゴリ群全てをまず選択
し、選択された小カテゴリ群の中からこの学習パタンと
の類似度が最大となる小カテゴリ群一個を、最終選択結
果として出力する学習用小カテゴリ群選択手段と、 前記学習用小カテゴリ群選択手段により選択された一個
の小カテゴリ群を構成する複数のカテゴリのうち、前記
学習パタンが属するカテゴリである学習自カテゴリと、
前記学習パタンが属するカテゴリ以外で前記学習パタン
との類似度が最大となるカテゴリである最近傍学習他カ
テゴリとを、選択結果として出力する学習用カテゴリ選
択手段と、 前記学習用カテゴリ選択手段により選択された前記学習
自カテゴリのパタン表現モデルに対しては前記学習パタ
ンとの類似度がより高くなるようにモデルのパラメータ
を制御し、前記最近傍学習他カテゴリのパタン表現モデ
ルに対しては前記学習パタンとの類似度がより低くなる
ようにモデルのパラメータを制御するパラメータ制御手
段と、 カテゴリ未知の認識パタンを入力とし、前記小カテゴリ
群帳に登録された所定数の小カテゴリ群の中から、前記
認識パタンとの類似度が最大となる一個の小カテゴリ群
を選択する認識用小カテゴリ群選択手段と、 前記パラメータ制御手段によってパラメータを制御され
た学習結果モデルを用いて、前記認識用小カテゴリ群選
択手段によって選択された一個の小カテゴリ群を構成す
る複数のカテゴリのパタン表現モデルの各々と、前記認
識パタンとの類似度を求め、類似度が最大となるパタン
表現モデルの属するカテゴリを出力する認識用カテゴリ
選択手段とを備え、 前記認識用カテゴリ選択手段の出力であるカテゴリを、
認識結果として得ることを特徴とするパタン認識装置。 - 【請求項3】 パタン認識において、認識の対象となる
カテゴリに属する学習用パタンを用いて、前記カテゴリ
に属するパタンを表現するパタン表現モデルのパラメー
タの初期値を設定する初期モデル設定手段と、 前記初期モデル設定手段によって得られた各々のカテゴ
リに属する初期モデルと学習用パタンを用いて、各カテ
ゴリ間での認識混同情報を生成する混同情報生成手段
と、 前記混同情報をもとに認識時に混同を生じやすいカテゴ
リ同士を一つの小カテゴリ群にクラス分けすることによ
って、前記認識対象となる複数のカテゴリ全体を所定数
の小カテゴリ群に分類し、この分類結果を小カテゴリ群
帳に登録する小カテゴリ群登録手段と、 前記認識対象となる複数のカテゴリのいずれかに属する
カテゴリ既知の学習パタンを入力とし、この学習パタン
が属するカテゴリを含む小カテゴリ群全てをまず選択
し、選択された小カテゴリ群の中からこの学習パタンと
の類似度が最大となる小カテゴリ群一個を、最終選択結
果として出力する学習用小カテゴリ群選択手段と、 前記学習用小カテゴリ群選択手段により選択された一個
の小カテゴリ群を構成する複数のカテゴリのうち、前記
学習パタンが属するカテゴリである学習自カテゴリと、
前記学習パタンが属するカテゴリ以外で前記学習パタン
との類似度が最大となるカテゴリである最近傍学習他カ
テゴリとを、選択結果として出力する学習用カテゴリ選
択手段と、 前記学習用カテゴリ選択手段により選択された前記学習
自カテゴリのパタン表現モデルに対しては前記学習パタ
ンとの類似度がより高くなるようにモデルのパラメータ
を制御し、前記最近傍学習他カテゴリのパタン表現モデ
ルに対しては前記学習パタンとの類似度がより低くなる
ようにモデルのパラメータを制御するパラメータ制御手
段とを備え、 前記パラメータ制御手段の出力パラメータを学習結果と
するパタン表現モデル学習装置。 - 【請求項4】 パタン認識において、認識の対象となる
カテゴリに属する学学習用パタンを用いて、前記カテゴ
リに属するパタンを表現するパタン表現モデルのパラメ
ータの初期値を設定する初期モデル設定手段と、 前記初期モデル設定手段によって得られた各々のカテゴ
リに属する初期モデルと学習用パタンを用いて、各カテ
ゴリ間での認識混同情報を生成する混同情報生成手段
と、 前記混同情報をもとに認識時に混同を生じやすいカテゴ
リ同士を一つの小カテゴリ群にクラス分けすることによ
って、前記認識対象となる複数のカテゴリ全体を所定数
の小カテゴリ群に分類し、この分類結果を小カテゴリ群
帳に登録する小カテゴリ群登録手段と、 前記認識対象となる複数のカテゴリのいずれかに属する
カテゴリ既知の学習パタンを入力とし、この学習パタン
が属するカテゴリを含む小カテゴリ群全てをまず選択
し、選択された小カテゴリ群の中からこの学習パタンと
の類似度が最大となる小カテゴリ群一個を、最終選択結
果として出力する学習用小カテゴリ群選択手段と、 前記学習用小カテゴリ群選択手段により選択された一個
の小カテゴリ群を構成する複数のカテゴリのうち、前記
学習パタンが属するカテゴリである学習自カテゴリと、
前記学習パタンが属するカテゴリ以外で前記学習パタン
との類似度が最大となるカテゴリである最近傍学習他カ
テゴリとを、選択結果として出力する学習用カテゴリ選
択手段と、 前記学習用カテゴリ選択手段により選択された前記学習
自カテゴリのパタン表現モデルに対しては前記学習パタ
ンとの類似度がより高くなるようにモデルのパラメータ
を制御し、前記最近傍学習他カテゴリのパタン表現モデ
ルに対しては前記学習パタンとの類似度がより低くなる
ようにモデルのパラメータを制御するパラメータ制御手
段と、 カテゴリ未知の認識パタンを入力とし、前記小カテゴリ
群帳に登録された所定数の小カテゴリ群の中から、前記
認識パタンとの類似度が最大となる一個の小カテゴリ群
を選択する認識用小カテゴリ群選択手段と、前記パラメ
ータ制御手段によってパラメータを制御された学習結果
モデルを用いて、前記認識用小カテゴリ群選択手段によ
って選択された一個の小カテゴリ群を構成する複数のカ
テゴリのパタン表現モデルの各々と、前記認識パタンと
の類似度を求め、類似度が最大となるパタン表現モデル
の属するカテゴリを出力する認識用カテゴリ選択手段と
を備え、この認識用カテゴリ選択手段の出力であるカテ
ゴリを、認識結果として得ることを特徴とするパタン認
識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06132772A JP3102989B2 (ja) | 1993-06-17 | 1994-06-15 | パタン表現モデル学習装置及びパタン認識装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14637793 | 1993-06-17 | ||
JP5-146377 | 1993-06-17 | ||
JP06132772A JP3102989B2 (ja) | 1993-06-17 | 1994-06-15 | パタン表現モデル学習装置及びパタン認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0764587A JPH0764587A (ja) | 1995-03-10 |
JP3102989B2 true JP3102989B2 (ja) | 2000-10-23 |
Family
ID=26467271
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP06132772A Expired - Fee Related JP3102989B2 (ja) | 1993-06-17 | 1994-06-15 | パタン表現モデル学習装置及びパタン認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3102989B2 (ja) |
-
1994
- 1994-06-15 JP JP06132772A patent/JP3102989B2/ja not_active Expired - Fee Related
Non-Patent Citations (3)
Title |
---|
日本音響学会平成2年度春季研究発表会講演論文集▲I▼,1−3−12,水田忍外「混合連続分布HMMに対する最適識別学習法の検討」,p.23−24(平成2年3月発行) |
日本音響学会平成3年度秋季研究発表会講演論文集▲I▼,3−5−16,水田忍外「認識語彙の音韻対立関係を考慮した音素片HMMの最適識別学習法」,p.121−122(平成3年10月4日特許庁資料館受入) |
電子情報通信学会技術研究報告[音声],Vol.91,No.243,SP91−58,水田忍外「混合連続分布音素片HMMを用いた不特定話者単語認識方式における最適識別学習法の検討」,p.21−28(1991年9月27日発行) |
Also Published As
Publication number | Publication date |
---|---|
JPH0764587A (ja) | 1995-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0109190B1 (en) | Monosyllable recognition apparatus | |
US5812975A (en) | State transition model design method and voice recognition method and apparatus using same | |
JP3948747B2 (ja) | ツリー構成確率密度に基づくパターン認識の方法及びシステム | |
US7729914B2 (en) | Method for detecting emotions involving subspace specialists | |
JPS61177493A (ja) | 音声認識方法 | |
EP0043006A2 (en) | Pattern recognition apparatus using prototype probability matching | |
JPH03144875A (ja) | 文字の認識方法及び音素の認識方法 | |
JPH0634185B2 (ja) | 入力語認識装置 | |
JPH06332497A (ja) | ニューラル・ネットワークを使用する話者非依存隔離単語音声認識システム | |
WO1993013519A1 (en) | Composite expert | |
EP2462586A1 (en) | A method of speech synthesis | |
CN111883122A (zh) | 语音识别方法及装置、存储介质、电子设备 | |
Nguyen et al. | Investigation of combining SVM and decision tree for emotion classification | |
JP3102989B2 (ja) | パタン表現モデル学習装置及びパタン認識装置 | |
Singh et al. | Simultaneously learning robust audio embeddings and balanced hash codes for query-by-example | |
Karanasou et al. | I-vectors and structured neural networks for rapid adaptation of acoustic models | |
JPH11149296A (ja) | 単語認識装置 | |
JPH08123469A (ja) | 句境界確率計算装置および句境界確率利用連続音声認識装置 | |
JPS61148497A (ja) | 標準パタン作成装置 | |
JP2000122690A (ja) | パターン認識方法およびパターン認識装置 | |
JP4424023B2 (ja) | 素片接続型音声合成装置 | |
JP3439700B2 (ja) | 音響モデル学習装置、音響モデル変換装置及び音声認識装置 | |
JPH10319986A (ja) | 音響モデル作成方法 | |
JP2000122693A (ja) | 話者認識方法および話者認識装置 | |
JP3322536B2 (ja) | ニューラルネットワークの学習方法および音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070825 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080825 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |