JP3135594B2 - パターン認識装置およびパターン認識方法 - Google Patents

パターン認識装置およびパターン認識方法

Info

Publication number
JP3135594B2
JP3135594B2 JP03062118A JP6211891A JP3135594B2 JP 3135594 B2 JP3135594 B2 JP 3135594B2 JP 03062118 A JP03062118 A JP 03062118A JP 6211891 A JP6211891 A JP 6211891A JP 3135594 B2 JP3135594 B2 JP 3135594B2
Authority
JP
Japan
Prior art keywords
recognition
data
learning
recognition dictionary
likelihood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03062118A
Other languages
English (en)
Other versions
JPH04305700A (ja
Inventor
博史 金澤
洋一 竹林
宏之 坪井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP03062118A priority Critical patent/JP3135594B2/ja
Publication of JPH04305700A publication Critical patent/JPH04305700A/ja
Application granted granted Critical
Publication of JP3135594B2 publication Critical patent/JP3135594B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字や音声などを認識
するためのパターン認識装置およびパターン認識方法
関するものである。
【0002】
【従来技術】従来、文字や音声などを認識するパターン
認識装置として次のようなものが知られている。例え
ば、音声パターンを認識するパターン認識装置では、入
力された音声データから音声パターンを抽出し、このパ
ターンの認識対象カテゴリについて認識辞書の内容を照
合して、その類似度を求め、このうちで最大類似度を示
すカテゴリを認識結果として出力するようにしている。
【0003】この場合、認識辞書とパターンの照合によ
り求められる類似度は、類似度演算に供されるパターン
が認識辞書の内容にどの程度類似しているかを示す尺度
である。つまり、ここでの類似度は、パターンが認識対
象カテゴリのうち、どのカテゴリに最も似ているかを示
すのに止まるもので、この時の抽出パターンが、あるカ
テゴリであるか、そうでないかを同定することは困難と
されていた。
【0004】そこで、従来、カテゴリを同定するための
手段として、類似度に対して所定のしきい値を設定し、
上述の認識辞書とパターンの照合により求められる類似
度がしきい値より小さい場合には、棄却(リジェクト)
処理を実行し、しきい値よりも大きい場合には、その時
のカテゴリであると同定する方法が考えられている。
【0005】ところが、類似度に対して設定されるしき
い値は、例えば、雑音の重畳した音声データをパターン
認識する場合は、全体的に類似度が低下することを見越
して低目に設定し、一方、雑音のない音声データをパタ
ーン認識する場合には、逆に高目に設定するといったよ
うに認識条件に依存する傾向があり、一意に定めること
は困難とされていた。
【0006】したがって、このような類似度を用いるこ
とは、いずれにしても抽出パターンと認識辞書がどの程
度似ているかを知る程度に過ぎず、その類似度値を取る
ことでどの程度の確率で正確な結果が得られるかについ
ては有効な方法とは言えなかった。
【0007】そこで、従来、類似度の値を尤度化する方
法が考えられている。つまり、この方法では、類似度値
を尤度化し、類似度を確率事象としてとらえることによ
り、確実性の表現を可能として、それまであるカテゴリ
と別カテゴリとの関係が不明確であったものを明確な関
係として扱えるようにしている。(参考文献:Teruhiko
Ukita et al."A Speaker Independent Recognition Al
gorithm for Connected Word Using Word Boundary Hyp
othesizer", Proceedings of ICASSP86, pp-1077〜108
0)しかしながら、この方法によっても、例えば、認識
辞書の学習に用いたデータセットから求めた尤度化のた
めのパラメータと、これ以外のデータセットから求めた
尤度化のためのパラメータとは大きく異なり、認識辞書
の学習と尤度化のためのパラメータの推定を同じデータ
セットで行ったとしても、認識の性能向上は何等望むこ
とができず、別のデータセットで行うにしても、実際に
どのようにして認識辞書の学習を行えばよいかなどの指
針がないことから、認識性能の向上を期待するのが難し
かった。
【0008】
【発明が解決しようとする課題】このように、従来のパ
ターン認識装置では、認識辞書と入力パターンの照合に
よって得られる類似度値を尤度化する場合に、認識辞書
の学習と尤度化のためのパラメータの推定をどのように
行うかという明確な指針がないことから、認識性能の優
れたパターン認識を期待するのが難しいという問題があ
った。
【0009】従って、本発明の目的とするところは、
識辞書の学習と尤度演算のためのパラメータの推定を効
率よく行うことができ、認識性能の向上を期待できるパ
ターン認識装置およびパターン認識方法を提供すること
にある
【0010】
【課題を解決するための手段】上記目的を達成するた
め、本発明は次のように構成する。すなわち、入力デー
タを分析した特徴パラメータから一定次元の特徴ベクト
ルを抽出し、この特徴ベクトルを認識辞書と照合して類
似度を求めるとともに、類似度に対応する尤度を演算
し、この尤度を用いて上記入力データに対する認識結果
を求めるようにしたパターン認識装置において、与えら
れる認識辞書学習用データから抽出した特徴ベクトルと
該データの認識結果を用いて上記辞書の学習を行う認識
辞書学習手段と、尤度演算用パラメータ推定データから
抽出した特徴ベクトルと学習後の認識辞書との照合によ
り求められる類似度から上記尤度演算用のパラメータを
推定し、次回の認識処理に供する推定手段と、を具備
たことを特徴とする。
【0011】また、本発明は、入力データを分析した特
徴パラメータから一定次元の特徴ベクトルを抽出し、こ
の特徴ベクトルを認識辞書と照合して類似度を求めると
ともに、類似度に対応する尤度を演算し、この尤度を用
いて上記入力データに対する認識結果を求めるようにし
たパターン認識装置において、 あらかじめ用意された複
数のデータセットより認識辞書学習処理および尤度演算
用パラメータ推定に供するデータセットを選択すると共
に、次回の認識辞書の学習には今回の尤度演算用パラメ
ータ推定に選択したデータセットを含めてデータセット
を選択し、尤度演算用パラメータ推定用には認識辞書学
習用としていないデータセットを選択するデータセット
選択手段と、認識辞書学習用として選択されて与えられ
たデータセットによる特徴ベクトルと該データの認識結
果を用いて認識辞書学習を実行する認識辞書学習手段
と、上記データセット選択手段より尤度演算用パラメー
タ推定用として選択されたデータセットによる特徴ベク
トルと学習後の上記認識辞書との照合により尤度演算用
のパラメータを推定する推定手段とを備えたことを特徴
とする。
【0012】
【作用】本発明のパターン認識装置およびパターン認識
方法は、入力データを分析した特徴パラメータから一定
次元の特徴ベクトルを抽出し、この特徴ベクトル抽出を
認識辞書と照合して類似度を求めるとともに、類似度に
対応する尤度を演算し、この演算された尤度を用いて上
記入力データに対する認識結果を求めるようにしたもの
であって、認識対象カテゴリに属する認識辞書学習用デ
ータから抽出した特徴ベクトルと、この特徴ベクトルの
認識結果を用いて上記認識辞書の学習を行うとともに、
尤度演算用パラメータ推定データから抽出した特徴ベク
トルと学習後の認識辞書との照合により求められる類似
度から尤度演算用のパラメータを推定して次回の認識処
理に供する。 また、本発明のパターン認識装置およびパ
ターン認識方法は、入力データを分析した特徴パラメー
タから一定次元の特徴ベクトルを抽出し、この特徴ベク
トルを認識辞書と照合して類似度を求めるとともに、類
似度に対応する尤度を演算し、この尤度を用いて上記入
力データに対する認識結果を求めるようにしたものであ
って、あらかじめ用意された複数のデータセットより認
識辞書学習処理および尤度演算用パラメータ推定に供す
るデータセットを選択可能にしたデータセット選択手段
を具備し、データセット選択手段より認識辞書学習用と
して選択されたデータセットによる特徴ベクトルの認識
結果を用いて認識辞書学習を実行するとともに、データ
セット選択手段より尤度演算用パラメータ推定用として
選択されたデータセットによる特徴ベクトルと学習後の
認識辞書との照合により尤度演算用のパラメータを推定
し、且つ次回の認識辞書の学習用には前回の尤度演算用
パラメータ推定用■に選択したデータセットを含めてデ
ータセットを選択するとともに、尤度演算用パラメータ
推定用には認識辞書学習用としていないデータセットを
選択する。この結果、本発明によれば、認識辞書の学習
と、尤度演算のためのパラメータ推定を効率よく行うこ
とができ、認識性能の優れたるパターン認識を実現する
ことができる。
【0013】
【実施例】以下、本発明の一実施例を図面にしたがい説
明する。
【0014】図1は、本発明を音声認識装置に適用した
場合の概略構成を示すものである。この場合、1は音声
入力部で、この音声入力部1は、図示しないマイクロホ
ンなどを介して入力される音声信号をディジタル信号に
変換して出力するようにしている。
【0015】この場合、音声入力部1は、高周波雑音成
分を除去するローパスフィルタ(LPF)と、このLP
Fを介して取り込まれる入力音声信号を例えば標本化周
波数12kHz、量子化ビット数12bitsによりディ
ジタル信号に変換するA/D変換器により構成されてい
る。なお、ここでの入力音声信号に対するディジタル化
処理は、例えば8kHzの標本化周波数で量子化ビット数
が16bitsのディジタル信号を求めるようにしても
よいなど、その仕様は、入力音声に対して要求される認
識性能などに応じて適宜定めることができる。また、こ
の音声入力部1には、認識対象カテゴリに属するデータ
である認識辞書学習用データ7および尤度演算用パラメ
ータを推定するための尤度演算用パラメータ推定用デー
タ8が入力可能にもなっている。
【0016】そして、この音声入力部1にてデジタル信
号に変換された出力は、音声分析部2に送られる。この
音声分析部2は、音声入力部1より与えられる音声デー
タを分析するためのもので、基本的にはFFT分析や、
LPC分析などの手法が用いられ、例えば、8msec 毎
に、その特徴パラメータを求めるようになっている。
【0017】音声分析部2にて求められる特徴パラメー
タの時系列は、認識処理部3に送られ、認識処理に供さ
れるようになる。この認識処理部3は、音声分析部2で
求められた特徴パラメータを用いて音声特徴ベクトルを
抽出する音声特徴ベクトル抽出部31、この音声特徴ベ
クトル抽出部31で抽出された音声特徴ベクトルと認識
対象カテゴリの認識辞書4との間でパターン照合を行い
類似度を演算する類似度演算部32および類似度演算部
32で求められた類似度値から尤度を求める尤度演算部
33により構成されている。
【0018】この場合、音声特徴ベクトル抽出部31
は、音声特徴パラメータを用いて入力音声の始終端を検
出するとともに、始終端点で挟まれる音声区間の特徴パ
ラメータをリサンプル抽出し、例えば、第2図に示す周
波数方向に16次元、時間軸方向に16次元のような一
定次元の音声特徴ベクトルを求めるようにしている。そ
して音声特徴ベクトル抽出部31で求められる音声特徴
ベクトルは、類似度演算部32および認識辞書学習部6
に送られるようになっている。ここでの認識辞書学習部
6は、音声特徴ベクトルと後述する認識結果出力部5の
認識結果を用いて認識辞書の学習を行うものである。類
似度演算部32は、音声特徴ベクトル抽出部31より与
えられる音声特徴ベクトルと認識辞書4に登録されてい
る認識対象カテゴリとの間でのパターン照合を行うよう
にしている。ここでの類似度演算部32におけるパター
ン照合は、例えば複合類似度演算などの手法を用いるよ
うにしている。また、この類似度演算部32での照合結
果は、尤度演算用パラメータ推定部9に送られ、尤度演
算用パラメータ10の推定に供するようにもしている。
尤度演算部33は、類似度演算部32で求められた類似
度値を尤度演算用パラメータ10を用いて尤度に変換す
るようにしている。
【0019】ここで、尤度として事後確率を求めるに
は、カテゴリCiに対して類似度値Siを持った時に、
実際にCiに属する確率P(Ci|Si)を求めるよう
になるが、事後確率P(Ci|Si)は直接的に求める
ことができないため、ベイズの定理から
【0020】
【数1】
【0021】により求めるようになる。
【0022】なお、P(Si|Ci)は、カテゴリがC
iの時に類似度Siをとる確率、P(Ci)は、カテゴ
リCiが出現する確率で、等しいとおける。これによ
り、P(Si|Ci)よりP(Ci|Si)を導き出す
ことが可能になる。(参考文献:電子情報通信学会 パ
ターン認識・理解研究会 資料PRU87−18(19
87))図1では、P(Si|Ci)は、尤度パラメー
タ推定用音声データ8を音声入力部1に入力すること
で、音声分析部2の音声分析で音声特徴パラメータを抽
出し、音声特徴ベクトルを抽出した後に、類似度演算部
32により演算される類似度値の分布から求めることが
可能になる。実際には、入力音声の属するカテゴリの認
識辞書4と音声特徴ベクトルとの類似度を用い、その類
似度分布の従う分布関数を求め、その分布関数を決定す
るいくつかのパラメータを求めることで、各カテゴリ毎
に求めることができる。
【0023】また、
【0024】
【数2】
【0025】についても認識対象となる全力カテゴリの
認識辞書と音声特徴ベクトルとの類似度を用いて、その
類似度分布を求め、P(Si|Ci)と同様の方法で求
めることができる。そして、これらのP(Si|Ci)
から、P(Ci|Si)を求めることで、類似度の尤度
化(事後確率化)が可能となる。
【0026】そして、尤度演算部33で類似度の尤度化
が行われた結果は、認識結果出力部5に送られ、認識結
果が出力される。また、この認識結果出力部5での認識
結果は、認識辞書学習部6に送られる。
【0027】ここで、認識処理部3は、音声特徴ベクト
ル抽出部31と類似度演算部32を分けて述べたが、こ
れらを1つにまとめ、入力音声の始終端検出を行うこと
なしに連続パターン照合によるワードスポッティング手
法を用いて、各カテゴリの類似度を求めることも可能で
ある。
【0028】次に、このように構成した実施例の動作を
説明する。
【0029】まず、図3に示すような連続する音声パタ
ーンの照合の場合を説明すると、基本的には、音声入力
部1の入力音声を音声分析部2で分析することで求めら
れる特徴パラメータの系列から、その特徴パラメータを
求めた各分析フレームをそれぞれ終端点Eに仮設定し、
これら終端点Eを基準にして、ある音声区間条件を満た
す複数の始端点からなる始端候補区間Sを仮設定する。
そして、これらの始終端点で示される仮の音声区間の特
徴パラメータの系列を時間軸方向にリサンプル処理し、
音声区間を異にする所定の次元数の特徴ベクトルを終端
点Eを基準として求める。次いで、このように終端点E
を基準に求められた所定の次元数の複数特徴ベクトルを
終端点Eを時間軸方向にシフトしながら順次連続的に抽
出し、各特徴ベクトルと認識辞書4との類似度をそれぞ
れ求めるとともに、各特徴ベクトルについて求められた
類似度系列から各カテゴリごとに最大類似度を示す音声
特徴ベクトルと、始終端情報を求めるようにする。この
ようにすることで始終端検出の誤りを低減できる。
【0030】次に、同実施例装置の動作を図4に従い説
明する。
【0031】まず、認識辞書学習用データ7を分析し、
始終端検出を行なった後に抽出した音声特徴ベクトルを
元にして初期の認識辞書4を作成する。(ステップA
1)。
【0032】次に、尤度演算用パラメータ推定用データ
8から抽出した音声特徴ベクトルを元に類似度を求め、
その類似度分布から尤度演算用パラメータ推定部9で尤
度演算用パラメータの推定を行い、初期の尤度演算用パ
ラメータ10を作成する(ステップA2)。
【0033】そして、ステップ1で作成した初期の認識
辞書4を用いて認識辞書学習用データ7から抽出した音
声特徴ベクトルとの類似度を求めるとともに(ステップ
A3)、初期尤度演算用パラメータ10を用いて、類似
度を尤度に変換する(ステップA4)。そして、ステッ
プA4で求められた尤度に基づいて認識結果出力部5に
て認識処理を実行する(ステップA5)。
【0034】次に、ステップA6でデータ終了かを判断
する。ここではデータ終了によりYESと判断されるま
では、ステップA3〜ステップA5の動作が繰り返して
実行される。
【0035】そして、ステップA6でデータ終了を判断
すると、類似度演算に用いた音声特徴ベクトルと認識結
果出力部5の認識結果を用いて認識辞書学習部6により
認識辞書4の更新を行う(ステップA7)。
【0036】ここで、認識辞書4の更新にともなう学習
は、以下述べるように共分散行列を更新し、主成分分析
を行うことで実行される。具体的には、式(1)で共分
散行列の更新を行う。
【0037】
【数3】
【0038】なお、更新係数αは、認識結果にしたがっ
て変化される。
【0039】そして、このようにして更新される共分散
行列より主成分分析の1つであるK−L展開により複数
個の固有値、固有ベクトルを求め、これを複合類似度の
認識辞書とする。(参考文献:日本音響学会講演論文集
pp.109〜110(昭和61年10月))次に、
更新された認識辞書4を用いて尤度演算用パラメータ推
定用データ8から抽出した音声特徴ベクトルとの類似度
を求める(ステップA8)。次に、ステップA9でデー
タ終了かを判断する。ここではデータ終了によりYES
と判断されるまでは、ステップA8の動作が繰り返して
実行される。
【0040】そして、ステップA9でデータ終了を判断
すると、ステップA8で得られた類似度値を用いて尤度
演算用のパラメータを再推定して次回の尤度演算に供え
るようになる(ステップA10)。
【0041】その後、ステップA11で認識辞書の学習
終了かを判断する。ここでは学習終了によりYESと判
断されるまでは、ステップA3以降の動作が繰り返して
実行され、YESと判断されると処理を終了する。
【0042】したがって、このようにすれば認識辞書学
習用データ7から抽出した特徴ベクトルと該特徴ベクト
ルの認識結果を用いて認識辞書4の学習を行うととも
に、尤度演算用パラメータ推定データ8から抽出した特
徴ベクトルと学習後の認識辞書4との照合により求めら
れる類似度から上記尤度演算用のパラメータを推定して
次回の認識処理に供するようになるので、類似度演算に
用いる認識辞書4の充実が可能となり、かつ認識辞書に
対して最適な尤度演算用パラメータを推定することがで
き、認識性能の向上を期待することができる。また、こ
の実施例では、認識辞書学習用データ7と尤度演算用パ
ラメータ推定用データ8を別個に有することにより、信
頼性の高い認識辞書4を学習を期待できる。
【0043】ここで、認識辞書学習用データ7と尤度演
算用パラメータ推定用データ8を同じものとした場合、
これにより求められる類似度の分布は、図5(a)に示
すように認識辞書4の学習が進むにつれて高い値を示す
ようになり、同図(b)に示す認識辞書学習用データ以
外の音声データの示す類似度分布と大きくずれる。これ
により認識辞書学習用音声データから得られた類似度分
布を用いて尤度演算用パラメータを推定し、この尤度演
算パラメータを用いて、未知入力の音声を認識するので
は認識性能の向上は期待できないことになる。この結果
からも、認識辞書学習用データ7と尤度演算用パラメー
タ推定用データ8を別々にすることで認識辞書の信頼性
が高まることが理解できる。
【0044】次に、図6は本発明の他の実施例を示すも
のである。
【0045】この場合、図6は、上述した図1に示す認
識辞書学習用データ7および尤度演算用パラメータ推定
用データ8に代えてデータセット選択部11により各種
データが選択されるデータセット部12を用いるように
している。その他は図1と同様であり、同一部分には同
符号を付してその説明を省略する。
【0046】ここで、データセット選択部11は、上述
した認識辞書の学習処理および尤度演算用パラメータ推
定に供するデータをデータセット部12より選択するも
のである。そして、データセット部12は、次のように
構成されている。
【0047】図7は、データセット部12を説明するた
めの模式図である。この場合、データセット部12は、
認識対象カテゴリ別に、例えば50のデータを格納した
データセット121を複数(図示例では#1〜#nのn
個)有している。そして、このデータセット部12の複
数のデータセット121は、データ選択部11の動作に
より認識辞書学習時には認識辞書学習用データ122と
して、また尤度演算用パラメータの推定時には尤度演算
用パラメータ推定用データ123としてそれぞれ選択さ
れ、音声入力部1に送り出されるようになっている。
【0048】ここで、データセット選択部11でのデー
タセット121の選択は、同時に認識辞書学習用データ
122および尤度演算用パラメータ推定用データ123
として重複しないようにしている。また、尤度演算用パ
ラメータ推定用データ123として選択されたデータセ
ット121は、次回の認識辞書学習時の認識辞書学習用
データ122として選択されるようにしている。
【0049】次に、図8はデータ選択部11によるデー
タセット部12でのデータセット121の選択処理の手
順を示すものである。この場合、データセット部12は
5個(=N)のデータセット121を有し、それぞれの
データセット121は、認識対象カテゴリ別に、例えば
50のデータを格納しているものとする。
【0050】まず、nを1とし(ステップB1)、n=
1で#1のデータセット121が認識辞書学習用データ
122として選択され(ステップB2)、音声入力部1
に送り出される。これにより、#1のデータセット12
1を用いて、上述した図4のフローチャートに従った認
識辞書4の学習が実行される(ステップB3)。この場
合、#1のデータセット121が選択されることから認
識辞書4の学習に供される各認識対象単語のデータ数
は、50個となる。なお、初期辞書および尤度演算用パ
ラメータは、あらかじめ別のデータセットにより求めら
れているものとする。
【0051】次に、nに1を加えた値をjとし(ステッ
プB4)、j=2で#2のデータセット121が、尤度
演算用パラメータ推定用データ123として選択され
(ステップB5)、音声入力部1に送り出される。これ
により、#2のデータセット121を用いて、上述した
図4のフローチャートに従った尤度演算用パラメータの
推定処理が実行される(ステップB6)。
【0052】次に、nに1を加えてn=2とし(ステッ
プB7)、次のステップB8でデータセット121の数
N(=5)と比較する。ここでは、nはNより小さくN
Oと判断されるので、ステップB2に戻され、今度は、
n=2で#1および#2のデータセット121が認識辞
書学習用データ122として選択され(ステップB
2)、これら#1および#2のデータセット121を用
いて、認識辞書4の学習が実行される(ステップB
3)。この場合、#1および#2のデータセット121
が選択されることから認識辞書4の学習に供されるデー
タ数は、50個から100個になる。
【0053】次に、nに1を加えた値をjとし(ステッ
プB4)、j=3で#3のデータセット121が、尤度
演算用パラメータ推定用データ123として選択され
(ステップB5)、この#3のデータセット121を用
いて、尤度演算用パラメータの推定処理が実行される
(ステップB6)。
【0054】そして、次に、nに1を加えてn=3とし
(ステップB7)、次のステップB8でデータセット1
21の数N(=5)と比較する。
【0055】以下、ステップB8でnがNより小さくN
Oと判断される場合は、上述した処理が繰り返して実行
され、一方、nがN(=5)より大きくなりYESと判
断されたら処理を終了する。
【0056】この場合、3回目の認識辞書学習処理で
は、認識辞書学習用データ122として#1〜#3のデ
ータセット121が選択され、これら#1〜#3のデー
タセット121を用いて、認識辞書4の学習が実行され
る。この場合、認識辞書4の学習に供されるデータ数は
150個となる。また、尤度演算用パラメータ推定用デ
ータ123として#4のデータセット121が選択され
る。
【0057】また、4回目の認識辞書学習処理では、認
識辞書学習用データ122として#1〜#4のデータセ
ット121が選択され、これら#1〜#4のデータセッ
ト121を用いて、認識辞書4の学習が実行される。こ
の場合、認識辞書4の学習に供されるデータ数は200
個となる。また、尤度演算用パラメータ推定用データ1
23として#5のデータセット121が選択される。
【0058】したがって、このようにすれば複数のデー
タセット121の中から認識辞書学習用と尤度演算用パ
ラメータ推定用のデータセット121を別々に選択し
て、認識辞書学習用として選択されたデータセット12
1によりこのデータセット121による特徴ベクトルの
認識結果を用いて認識辞書4の学習を行うとともに、尤
度演算用パラメータ推定用として選択されたデータセッ
ト121による特徴ベクトルと学習後の認識辞書との照
合により尤度演算用パラメータを推定し、更に、次回の
認識辞書の学習用には、前回の尤度演算用パラメータ推
定用のデータセット121を含めてデータセット121
を選択し、尤度演算用パラメータ推定には、残ったデー
タセット121のうち認識辞書学習用として選択されて
いないデータセット121を選択するようになるので、
認識辞書4の学習処理をきめ細かに行うことができ、類
似度演算に用いられる認識辞書をより一層充実したもの
にでき、しかも、認識辞書に対する尤度演算用パラメー
タの推定処理も充実したものにでき、認識性能の向上を
更に期待できるようになる。
【0059】なお、本発明は、上述した実施例に限定さ
れるものでなく、例えば、上述の実施例では入力データ
として音声データを用い、この音声データについての認
識および学習処理の例を述べたが、音声データの代わり
に文字データについて認識、学習処理を行うことも可能
である。この場合の認識処理および学習処理に用いられ
る特徴ベクトルの次元数やパターン照合の手法について
も特に限定されることはない。
【0060】本発明のポイントは、認識辞書の学習に用
いるデータと尤度演算パラメータ推定用のデータを別々
に持ち、各々のデータから生成した認識辞書および尤度
演算パラメータを用いて、入力データの認識処理および
学習処理を行うものであり、その要旨を逸脱しない範囲
で種々変形して実施することができる。
【0061】
【発明の効果】以上、詳述したように、本発明によれ
ば、認識辞書の学習と、尤度演算のためのパラメータ推
定を高い信頼性により効率よく行うことができ、認識性
能の優れたパターン認識を実現することができる。
【図面の簡単な説明】
【図1】本発明の一実施例の概略構成を示すブロック
図。
【図2】図1の実施例において音声特徴ベクトルの一例
を示す図。
【図3】図1の実施例において連続する音声パターン照
合の場合を説明するための図。
【図4】図1の実施例の動作を説明するためのフローチ
ャート。
【図5】図1の実施例で認識辞書学習用データと尤度演
算用パラメータ推定用データを同じものとした場合の状
態を説明するための図。
【図6】本発明の他の実施例の概略構成を示すブロック
図。
【図7】図6の他の実施例に用いられるデータセット部
を説明するための模式図。
【図8】図6の他の実施例でのデータ選択部によるデー
タセット部でのデータセットの選択処理の手順を説明す
るためのフローチャート。
【符号の説明】
1…音声入力部、2…音声分析部、3…認識処理部、3
1…音声特徴ベクトル抽出部、32…類似度演算部、3
3…尤度演算部、4…認識辞書、5…認識結果出力部、
6…認識辞書学習部、7…認識辞書学習用データ、8…
尤度演算用パラメータ推定用データ、9…尤度演算用パ
ラメータ推定部、10…尤度演算用パラメータ、11…
データセット選択部、12…データセット部、121…
データセット。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭62−100799(JP,A) 特開 平1−251100(JP,A) 特開 昭60−93498(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 15/00 - 17/00 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】入力データを分析した特徴パラメータから
    一定次元の特徴ベクトルを抽出し、この特徴ベクトルを
    認識辞書と照合して類似度を求めるとともに、類似度に
    対応する尤度を演算し、この尤度を用いて上記入力デー
    タに対する認識結果を求めるようにしたパターン認識装
    置において、与えられる 認識辞書学習用データから抽出した特徴ベク
    トルと該データの認識結果を用いて上記辞書の学習を行
    認識辞書学習手段と、 尤度演算用パラメータ推定データから抽出した特徴ベク
    トルと学習後の認識辞書との照合により求められる類似
    度から上記尤度演算用のパラメータを推定し、次回の認
    識処理に供する推定手段と、 を具備 したことを特徴とするパターン認識装置。
  2. 【請求項2】入力データを分析した特徴パラメータから
    一定次元の特徴ベクトルを抽出し、この特徴ベクトルを
    認識辞書と照合して類似度を求めるとともに、類似度に
    対応する尤度を演算し、この尤度を用いて上記入力デー
    タに対する認識結果を求めるようにしたパターン認識装
    置において、 あらかじめ用意された複数のデータセットより認識辞書
    学習処理および尤度演算用パラメータ推定に供するデー
    タセットを選択すると共に、次回の認識辞書の学習には
    今回の尤度演算用パラメータ推定に選択したデータセッ
    トを含めてデータセットを選択し、尤度演算用パラメー
    タ推定用には認識辞書学習用としていないデータセット
    を選択するデータセット選択手段と、 認識辞書学習用として選択されて与えられたデータセッ
    トによる特徴ベクトルと該データの認識結果を用いて認
    識辞書学習を実行する認識辞書学習手段と、 上記データセット選択手段より尤度演算用パラメータ推
    定用として選択されたデータセットによる特徴ベクトル
    と学習後の上記認識辞書との照合により尤度演算用のパ
    ラメータを推定する推定手段と、 を備えた ことを特徴とするパターン認識装置。
  3. 【請求項3】請求項1または請求項2に記載のパターン
    認識装置において、 認識辞書の学習および尤度演算用パラメータ推定を繰り
    返して実行することを特徴とするパターン認識装置。
  4. 【請求項4】入力データを分析した特徴パラメータから
    一定次元の特徴ベクトルを抽出し、この特徴ベクトルを
    認識辞書と照合して類似度を求めるとともに、類似度に
    対応する尤度を演算し、この尤度を用いて上記入力デー
    タに対する認識結果を求めるようにしたパターン認識方
    法において、 認識辞書学習用データから抽出した特徴ベクトルと該デ
    ータの認識結果を用いて上記辞書の学習を行うととも
    に、尤度演算用パラメータ推定データから抽出した特徴
    ベクトルと学習後の認識辞書との照合により求められる
    類似度から上記尤度演算用のパラメータを推定して次回
    の認識処理に供するようにしたことを特徴とするパター
    ン認識方法。
  5. 【請求項5】入力データを分析した特徴パラメータから
    一定次元の特徴ベクトルを抽出し、この特徴ベクトルを
    認識辞書と照合して類似度を求めるとともに、類似度に
    対応する尤度を演算し、この尤度を用いて上記入力デー
    タに対する認識結果を求めるようにしたパターン認識方
    法において、 あらかじめ用意された複数のデータセットより認識辞書
    学習処理および尤度演算用パラメータ推定に供するデー
    タセットを選択可能にし、これにより認識辞書学習用と
    して選択されたデータセットによる特徴ベクトルと該デ
    ータの認識結果を用いて認識辞書学習を実行すると共
    に、上記データセット選択により尤度演算用パラメータ
    推定用として選択されたデータセットによる特徴ベクト
    ルと学習後の認識辞書との照合により尤度演算用のパラ
    メータを推定し、且つ次回の認識辞書の学習には今回の
    尤度演算用パラメータ推定に選択したデータセットを含
    めてデータセットを選択するとともに、尤度演算用パラ
    メータ推定用には認識辞書学習用としていないデータセ
    ットを選択することを特徴とするパターン認識方法。
  6. 【請求項6】請求項4または請求項5に記載のパターン
    認識方法において、 認識辞書の学習および尤度演算用パラメータ推定を繰り
    返して実行することを特徴とするパターン認識方法。
JP03062118A 1991-02-13 1991-03-26 パターン認識装置およびパターン認識方法 Expired - Fee Related JP3135594B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03062118A JP3135594B2 (ja) 1991-02-13 1991-03-26 パターン認識装置およびパターン認識方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP4131791 1991-02-13
JP3-41317 1991-02-13
JP03062118A JP3135594B2 (ja) 1991-02-13 1991-03-26 パターン認識装置およびパターン認識方法

Publications (2)

Publication Number Publication Date
JPH04305700A JPH04305700A (ja) 1992-10-28
JP3135594B2 true JP3135594B2 (ja) 2001-02-19

Family

ID=26380905

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03062118A Expired - Fee Related JP3135594B2 (ja) 1991-02-13 1991-03-26 パターン認識装置およびパターン認識方法

Country Status (1)

Country Link
JP (1) JP3135594B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2673871B2 (ja) * 1993-08-26 1997-11-05 日本アイ・ビー・エム株式会社 ニューラル・ネットワークによるパターン認識方法及び装置
JP6313062B2 (ja) * 2014-02-17 2018-04-18 株式会社東芝 パターン認識装置、パターン認識方法およびプログラム
CN107533672B (zh) 2015-05-11 2021-01-12 株式会社东芝 模式识别装置、模式识别方法以及记录介质

Also Published As

Publication number Publication date
JPH04305700A (ja) 1992-10-28

Similar Documents

Publication Publication Date Title
US6195634B1 (en) Selection of decoys for non-vocabulary utterances rejection
JP3630216B2 (ja) 話者認証用確率的マッチング方法
US6405168B1 (en) Speaker dependent speech recognition training using simplified hidden markov modeling and robust end-point detection
JP4531166B2 (ja) 信頼性尺度の評価を用いる音声認識方法
EP0335739A2 (en) Pattern recognition system
JP2002500779A (ja) 識別訓練されたモデルを用いる音声認識システム
JPH05257492A (ja) 音声認識方式
JP3298858B2 (ja) 低複雑性スピーチ認識器の区分ベースの類似性方法
JP2955297B2 (ja) 音声認識システム
JP4318475B2 (ja) 話者認証装置及び話者認証プログラム
JP3004023B2 (ja) 音声認識装置
JP3135594B2 (ja) パターン認識装置およびパターン認識方法
JPH10509526A (ja) ヒドンマルコフモデルを使用して設計された決定木分類子
JPH06266386A (ja) ワードスポッティング方法
JP4244524B2 (ja) 音声認証装置、音声認証方法、及びプログラム
KR100586045B1 (ko) 고유음성 화자적응을 이용한 재귀적 화자적응 음성인식시스템 및 방법
JP2000259198A (ja) パターン認識装置および方法、並びに提供媒体
JP2543584B2 (ja) 音声標準パタン登録方式
JP2705061B2 (ja) 音声認識方法
JP3011421B2 (ja) 音声認識装置
JPH0777998A (ja) 連続単語音声認識装置
JP2001083978A (ja) 音声認識装置
JP2506730B2 (ja) 音声認識方法
JPH10207485A (ja) 音声認識装置及び話者適応方法
JP4297349B2 (ja) 音声認識システム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071201

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081201

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091201

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091201

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101201

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees