JPH08297495A - Method and device for learning signal pattern recognization device - Google Patents
Method and device for learning signal pattern recognization deviceInfo
- Publication number
- JPH08297495A JPH08297495A JP7101906A JP10190695A JPH08297495A JP H08297495 A JPH08297495 A JP H08297495A JP 7101906 A JP7101906 A JP 7101906A JP 10190695 A JP10190695 A JP 10190695A JP H08297495 A JPH08297495 A JP H08297495A
- Authority
- JP
- Japan
- Prior art keywords
- signal pattern
- feature
- learning
- class
- feature extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、種々の信号パターンを
認識するための信号パターン認識装置の学習方法及び学
習装置に関し、特に、例えば音声、文字、画像、医療測
定等、数値表現が可能なあらゆる物理的又は化学的な信
号パターンを認識するための信号パターン認識装置の学
習方法及び学習装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a learning method and a learning device for a signal pattern recognition device for recognizing various signal patterns, and in particular, it is capable of expressing numerical values such as voices, characters, images, and medical measurements. The present invention relates to a learning method and a learning device for a signal pattern recognition device for recognizing any physical or chemical signal pattern.
【0002】[0002]
【従来の技術】従来の信号パターン認識装置は、基本的
には、図4に示すように、特徴抽出部2と分類部3とか
ら構成される。特徴抽出部2は、信号データメモリ1に
格納された信号パターンに応答して、ある予め定められ
た特徴表現の形式の信号に変換し、さらに、分類部3
は、類モデルメモリ7に予め格納された類モデルを用い
て、変換された信号が有する特徴が構成する特徴空間に
おける類境界の設定し、すなわち分類処理を行って、そ
の分類処理結果であるパターン認識結果データをパター
ン認識結果データメモリ4に格納する。2. Description of the Related Art A conventional signal pattern recognition device basically comprises a feature extraction section 2 and a classification section 3, as shown in FIG. The feature extraction unit 2 responds to the signal pattern stored in the signal data memory 1, converts the signal into a signal having a predetermined feature expression format, and further, the classification unit 3
Is a class which is a result of the classification process by setting the class boundary in the feature space formed by the features of the converted signal using the class model stored in advance in the class model memory 7, that is, performing the classification process. The recognition result data is stored in the pattern recognition result data memory 4.
【0003】このような信号パターン認識装置の学習の
目的は、将来発生し得るあらゆる動作条件や環境、例え
ば未知なる発話者の音声入力信号パターンや、未知なる
電話回線を経由する音声入力信号パターン、未知なる書
き手による文字入力信号パターン等を高い精度で認識で
きるように、装置のパラメータ形式を選択し、かつその
パラメータの状態を決定して設定するすることである。The purpose of learning of such a signal pattern recognition device is to consider all operating conditions and environments that may occur in the future, such as a voice input signal pattern of an unknown speaker or a voice input signal pattern passing through an unknown telephone line. In order to recognize a character input signal pattern or the like by an unknown writer with high accuracy, the parameter format of the device is selected, and the state of the parameter is determined and set.
【0004】しかしながら、その学習段階で、将来発生
し得る全ての動作条件情報、すなわち結果的には、信号
パターン情報を知ることは不可能であり、一般に、信号
パターン認識装置の認識性能である精度は、学習段階で
知りえなかった新しい動作環境においては低下する。明
らかに、信号パターン認識装置は、学習段階で知ること
ができなかった新しい動作条件に対してなんらかの形で
適応できる能力を持つことが望まれている。However, at the learning stage, it is impossible to know all the operating condition information that may occur in the future, that is, the signal pattern information as a result. In general, the accuracy which is the recognition performance of the signal pattern recognition device. In a new operating environment that was unknown during the learning phase. Clearly, it is desired that the signal pattern recognizer has somehow the ability to adapt to new operating conditions that were not known during the learning phase.
【0005】上記の問題を解決するための従来の解決方
法は、学習段階において予めある程度の認識精度で動作
することができるように学習された信号パターン認識装
置の分類部3の動作パラメータを、比較的少数の適応用
信号パターン標本を用いて認識性能を向上するように更
新するものであった。The conventional solution for solving the above-mentioned problem is to compare the operation parameters of the classification unit 3 of the signal pattern recognition apparatus that are learned in advance so that they can operate with a certain degree of recognition accuracy in the learning stage. It was updated to improve the recognition performance by using a small number of adaptive signal pattern samples.
【0006】しかしながら、少数の適応用信号パターン
のみを用いた分類部3の更新は、認識装置が扱う全類の
類境界を適切に更新するには不十分である。何故なら、
原理的にこれらの少数信号パターンが含む分類に関する
情報は、関連する類、言い換えれば、それらの信号パタ
ーンが属する類、あるいはその分類決定に関与する類に
のみ限定されているためである。この不十分さは、信号
パターン認識装置が取り扱う類の数が大きくなるほど大
きくなり深刻なものとなる。この不十分さを軽減するた
め、これまでにもいくつかの改善方法が提案されてきた
(例えば、文献1「Y. Nakato et al.,“A Study on Un
supervised Speaker Adaptation of Continuous Parame
ter HMM", Acoustic Society Japan, SP90-67, pp.79-8
6,1990年」及び文献2「C.-H. Lee et al.,“Speaker A
daptation Based on MAP Estimation of HMM Parameter
s", Proceedings of IEEE, ICASSP93, Vol. 2, pp.558-
561,1993年4月」参照。)。その改善方法とは、分類部
3の動作パラメータの更新の枠組みにおいて、少数標本
を用いることから生じる更新の標本特徴空間における局
所性を軽減するために、標本の特徴空間に分布等に関連
するなんらかの仮定を設け、その仮定に基づいた追加的
な更新を行うものであった。However, updating the classifying unit 3 using only a small number of adaptation signal patterns is not sufficient to appropriately update the class boundaries of all classes handled by the recognition device. Because,
This is because, in principle, the information about the classification included in these minority signal patterns is limited to only the related classes, in other words, the classes to which those signal patterns belong, or the classes involved in the classification determination. This insufficiency becomes more serious as the number of classes handled by the signal pattern recognition device increases. In order to alleviate this insufficiency, several improvement methods have been proposed so far (for example, in Reference 1, “Y. Nakato et al.,“ A Study on Un
supervised Speaker Adaptation of Continuous Parame
ter HMM ", Acoustic Society Japan, SP90-67, pp.79-8
6, 1990 ”and reference 2“ C.-H. Lee et al., “Speaker A
daptation Based on MAP Estimation of HMM Parameter
s ", Proceedings of IEEE, ICASSP93, Vol. 2, pp.558-
561, April 1993 ". ). In order to reduce the locality in the sample feature space of updating that occurs due to the use of a small number of samples in the framework of updating the operating parameters of the classifying unit 3, some improvement method is related to distribution or the like in the sample feature space. It made assumptions and made additional updates based on those assumptions.
【0007】[0007]
【発明が解決しようとする課題】しかしながら、それら
の仮定が多様な要因を包含する、例えば音声信号パター
ン認識の場合、新しい発話者のみならず電話回線等に関
連する新しい音響系などの新しい動作条件全体に関して
最適である保証はなく、優れた適応結果を示し適応後の
高い認識精度を得るには多くの適応用標本を必要とし、
結果的に、少数標本のみを用いて十分に適応できる能力
を持つ信号パターン認識装置は達成されなかった。However, in the case of voice signal pattern recognition, these assumptions include various factors, such as new operating conditions such as a new speaker and a new acoustic system related to a telephone line. There is no guarantee that it is optimal for the whole, and many adaptation samples are required to obtain excellent adaptation results and obtain high recognition accuracy after adaptation.
As a result, no signal pattern recognizer has been achieved that has the capacity to be adequately adapted using only a small number of samples.
【0008】本発明は以上の問題点を解決し、少数の適
応用標本を用いて従来例に比較してより高い効率でかつ
より高い認識精度を達成することができる信号パターン
認識装置の学習方法及び学習装置を提供することにあ
る。The present invention solves the above problems and uses a small number of adaptive samples to achieve a higher efficiency and higher recognition accuracy than the conventional example, and a learning method for a signal pattern recognition apparatus. And to provide a learning device.
【0009】[0009]
【課題を解決するための手段】本発明に係る請求項1記
載の信号パターン認識装置のための学習方法は、学習可
能な動作パラメータを有し、入力される信号パターン
を、信号パターンの認識のための所定の特徴信号パター
ンに変換する特徴抽出手段と、上記特徴抽出手段によっ
て変換された特徴信号パターンを、予め決められた複数
の類のうちの少なくとも1つに分類するための分類処理
を実行することにより、より尤度の高い少なくとも1つ
の類を信号パターンの認識結果として出力する分類手段
とを備えた信号パターン認識装置のための学習方法であ
って、類属性が既知の信号パターンを上記特徴抽出手段
に入力したときに、上記特徴抽出手段から出力される特
徴信号パターンを、上記既知の信号パターンの類モデル
に近づけるように、上記分類手段の分類処理を変更する
ことなく、上記特徴抽出手段の学習可能な動作パラメー
タを適応的に更新することを特徴とする。A learning method for a signal pattern recognition device according to a first aspect of the present invention has an operation parameter that can be learned, and an input signal pattern is recognized as a signal pattern recognition device. For extracting a feature signal pattern for converting the feature signal pattern converted by the feature extracting means into at least one of a plurality of predetermined classes. By doing so, a learning method for a signal pattern recognition device, comprising: a classifying unit that outputs at least one class with higher likelihood as a recognition result of a signal pattern, wherein When input to the feature extraction means, the feature signal pattern output from the feature extraction means, so as to approach the similar model of the known signal pattern, Without changing the classification process of the serial classification unit, and updates the learning possible operating parameters of the feature extraction means adaptively.
【0010】また、請求項2記載の信号パターン認識装
置の学習方法は、請求項1記載の信号パターン認識装置
の学習方法において、上記特徴抽出手段から出力される
特徴信号パターンと、上記既知の信号パターンの類モデ
ルとの間の類似度に対応する損失が最小となるように、
上記特徴抽出手段の学習可能な動作パラメータを適応的
に更新することを特徴とする。A learning method of the signal pattern recognition device according to a second aspect is the learning method of the signal pattern recognition device according to the first aspect, wherein the feature signal pattern output from the feature extracting means and the known signal are used. In order to minimize the loss corresponding to the similarity between the pattern and the model,
It is characterized by adaptively updating the learnable operation parameters of the feature extraction means.
【0011】本発明に係る請求項3記載の信号パターン
認識装置の学習装置は、学習可能な動作パラメータを有
し、入力される信号パターンを、信号パターンの認識の
ための所定の特徴信号パターンに変換する特徴抽出手段
と、上記特徴抽出手段によって変換された特徴信号パタ
ーンを、予め決められた複数の類のうちの少なくとも1
つに分類するための分類処理を実行することにより、よ
り尤度の高い少なくとも1つの類を信号パターンの認識
結果として出力する分類手段とを備えた信号パターン認
識装置のための学習装置であって、類属性が既知の信号
パターンを上記特徴抽出手段に入力したときに、上記特
徴抽出手段から出力される特徴信号パターンを、上記既
知の信号パターンの類モデルに近づけるように、上記分
類手段の分類処理を変更することなく、上記特徴抽出手
段の学習可能な動作パラメータを適応的に更新する調整
手段を備えたことを特徴とする。According to a third aspect of the present invention, there is provided a learning device for a signal pattern recognition device, which has an operation parameter that can be learned and converts an input signal pattern into a predetermined characteristic signal pattern for recognition of the signal pattern. At least one of a plurality of predetermined classes of the characteristic extracting means for converting and the characteristic signal pattern converted by the characteristic extracting means.
A learning device for a signal pattern recognition device, comprising: a classifying unit that outputs at least one class having a higher likelihood as a recognition result of a signal pattern by executing a classification process for classifying into one. , When the signal pattern whose class attribute is known is input to the feature extraction means, the classification of the classification means is performed so that the feature signal pattern output from the feature extraction means approaches the class model of the known signal pattern. The present invention is characterized by comprising adjusting means for adaptively updating the learnable operation parameter of the feature extracting means without changing the processing.
【0012】また、請求項4記載の信号パターン認識装
置の学習装置は、請求項3記載の信号パターン認識装置
の学習装置において、上記調整手段は、上記特徴抽出手
段から出力される特徴信号パターンと、上記既知の信号
パターンの類モデルとの間の類似度に対応する損失が最
小となるように、上記特徴抽出手段の学習可能な動作パ
ラメータを適応的に更新することを特徴とする。A learning device for a signal pattern recognition device according to a fourth aspect is the learning device for a signal pattern recognition device according to the third aspect, wherein the adjusting means is a feature signal pattern output from the feature extracting means. , The learning operation parameters of the feature extraction means are adaptively updated so that the loss corresponding to the similarity with the known model of the signal pattern is minimized.
【0013】本発明に係る請求項5記載の信号パターン
認識装置の学習方法は、学習可能な動作パラメータを有
し、入力される信号パターンを、信号パターンの認識の
ための所定の特徴信号パターンに変換する特徴抽出手段
と、上記特徴抽出手段によって変換された特徴信号パタ
ーンを、予め決められた複数の類のうちの少なくとも1
つに分類するための分類処理を実行することにより、よ
り尤度の高い少なくとも1つの類を信号パターンの認識
結果として出力する分類手段とを備えた信号パターン認
識装置のための学習方法であって、類属性が未知の信号
パターンを上記特徴抽出手段に入力したときに、上記未
知の信号パターンを、上記分類手段から出力される認識
結果である複数の類のうち最も高い尤度を有する最尤の
類モデルに近づけるように、上記分類手段の分類処理を
変更することなく、上記特徴抽出手段の学習可能な動作
パラメータを適応的に更新することを特徴とする。According to a fifth aspect of the present invention, there is provided a learning method for a signal pattern recognizing apparatus, which has a learnable operation parameter and converts an input signal pattern into a predetermined characteristic signal pattern for recognizing the signal pattern. At least one of a plurality of predetermined classes of the characteristic extracting means for converting and the characteristic signal pattern converted by the characteristic extracting means.
A learning method for a signal pattern recognition device, comprising: a classification unit that outputs at least one class having a higher likelihood as a recognition result of a signal pattern by executing a classification process for classifying into one. , When a signal pattern whose class attribute is unknown is input to the feature extracting means, the unknown signal pattern is the maximum likelihood having the highest likelihood among the plurality of classes which are the recognition results output from the classifying means. It is characterized in that the learnable operation parameter of the feature extracting means is adaptively updated without changing the classification process of the classifying means so as to approach the class model.
【0014】また、請求項6記載の信号パターン認識装
置の学習方法は、請求項5記載の信号パターン認識装置
の学習方法においては、上記特徴抽出手段から出力され
る特徴信号パターンと、上記未知ではあるが最尤の信号
パターンの類モデルとの間の類似度に対応する損失が最
小となるように、上記特徴抽出手段の学習可能な動作パ
ラメータを適応的に更新することを特徴とする。According to a sixth aspect of the present invention, there is provided a learning method for a signal pattern recognition apparatus according to the fifth aspect, wherein the characteristic signal pattern output from the characteristic extraction means is the same as the unknown characteristic pattern. However, it is characterized in that the learnable operation parameter of the feature extracting means is adaptively updated so that the loss corresponding to the similarity with the model of the maximum likelihood signal pattern is minimized.
【0015】本発明に係る請求項7記載の信号パターン
認識装置の学習装置は、学習可能な動作パラメータを有
し、入力される信号パターンを、信号パターンの認識の
ための所定の特徴信号パターンに変換する特徴抽出手段
と、上記特徴抽出手段によって変換された特徴信号パタ
ーンを、予め決められた複数の類のうちの少なくとも1
つに分類するための分類処理を実行することにより、よ
り尤度の高い少なくとも1つの類を信号パターンの認識
結果として出力する分類手段とを備えた信号パターン認
識装置のための学習装置であって、類属性が未知の信号
パターンを上記特徴抽出手段に入力したときに、上記未
知の信号パターンを、上記分類手段から出力される認識
結果である複数の類のうち最も高い尤度を有する最尤の
類モデルに近づけるように、上記分類手段の分類処理を
変更することなく、上記特徴抽出手段の学習可能な動作
パラメータを適応的に更新する調整手段を備えたことを
特徴とする。According to a seventh aspect of the present invention, there is provided a learning device for a signal pattern recognizing device, which has a learnable operation parameter and converts an input signal pattern into a predetermined characteristic signal pattern for recognizing the signal pattern. At least one of a plurality of predetermined classes of the characteristic extracting means for converting and the characteristic signal pattern converted by the characteristic extracting means.
A learning device for a signal pattern recognition device, comprising: a classifying unit that outputs at least one class having a higher likelihood as a recognition result of a signal pattern by executing a classification process for classifying into one. , When a signal pattern whose class attribute is unknown is input to the feature extracting means, the unknown signal pattern is the maximum likelihood having the highest likelihood among the plurality of classes which are the recognition results output from the classifying means. It is characterized by comprising adjusting means for adaptively updating the learnable operation parameter of the feature extracting means without changing the classification process of the classifying means so as to approach the class model.
【0016】また、請求項8記載の信号パターン認識装
置の学習装置は、請求項7記載の信号パターン認識装置
の学習装置において、上記調整手段は、上記特徴抽出手
段から出力される特徴信号パターンと、上記未知ではあ
るが最尤の信号パターンの類モデルとの間の類似度に対
応する損失が最小となるように、上記特徴抽出手段の学
習可能な動作パラメータを適応的に更新することを特徴
とする。A learning device for a signal pattern recognition device according to an eighth aspect is the learning device for a signal pattern recognition device according to the seventh aspect, wherein the adjusting means is a feature signal pattern output from the feature extracting means. , A feature that the learned parameter of the feature extracting means is adaptively updated so that the loss corresponding to the similarity with the unknown but maximum likelihood signal pattern type model is minimized. And
【0017】[0017]
【作用】以上のように構成された請求項1記載の信号パ
ターン認識装置のための学習方法においては、上記特徴
抽出手段は、学習可能な動作パラメータを有し、入力さ
れる信号パターンを、信号パターンの認識のための所定
の特徴信号パターンに変換し、上記分類手段は、上記特
徴抽出手段によって変換された特徴信号パターンを、予
め決められた複数の類のうちの少なくとも1つに分類す
るための分類処理を実行することにより、より尤度の高
い少なくとも1つの類を信号パターンの認識結果として
出力する。ここで、類属性が既知の信号パターンを上記
特徴抽出手段に入力したときに、上記特徴抽出手段から
出力される特徴信号パターンを、上記既知の信号パター
ンの類モデルに近づけるように、上記分類手段の分類処
理を変更することなく、上記特徴抽出手段の学習可能な
動作パラメータを適応的に更新する。In the learning method for the signal pattern recognition device according to claim 1 configured as described above, the feature extraction means has a learnable operation parameter, and the input signal pattern is a signal. For converting into a predetermined characteristic signal pattern for pattern recognition, the classification means classifies the characteristic signal pattern converted by the characteristic extraction means into at least one of a plurality of predetermined classes. By executing the classification processing of, at least one class with higher likelihood is output as the recognition result of the signal pattern. Here, when a signal pattern having a known class attribute is input to the feature extracting means, the feature signal pattern output from the feature extracting means approximates the class model of the known signal pattern to the classifying means. The operation parameters that can be learned by the feature extraction means are adaptively updated without changing the classification process of.
【0018】また、請求項2記載の信号パターン認識装
置の学習方法においては、請求項1記載の信号パターン
認識装置の学習方法において、好ましくは、上記特徴抽
出手段から出力される特徴信号パターンと、上記既知の
信号パターンの類モデルとの間の類似度に対応する損失
が最小となるように、上記特徴抽出手段の学習可能な動
作パラメータを適応的に更新する。Further, in the learning method of the signal pattern recognition device according to claim 2, in the learning method of the signal pattern recognition device according to claim 1, preferably, the feature signal pattern output from the feature extraction means, The learnable operation parameter of the feature extracting means is adaptively updated so that the loss corresponding to the similarity with the known model of the signal pattern is minimized.
【0019】本発明に係る請求項3記載の信号パターン
認識装置の学習装置においては、上記特徴抽出手段は、
学習可能な動作パラメータを有し、入力される信号パタ
ーンを、信号パターンの認識のための所定の特徴信号パ
ターンに変換し、上記分類手段は、上記特徴抽出手段に
よって変換された特徴信号パターンを、予め決められた
複数の類のうちの少なくとも1つに分類するための分類
処理を実行することにより、より尤度の高い少なくとも
1つの類を信号パターンの認識結果として出力する。こ
こで、上記調整手段は、類属性が既知の信号パターンを
上記特徴抽出手段に入力したときに、上記特徴抽出手段
から出力される特徴信号パターンを、上記既知の信号パ
ターンの類モデルに近づけるように、上記分類手段の分
類処理を変更することなく、上記特徴抽出手段の学習可
能な動作パラメータを適応的に更新する。In the learning device of the signal pattern recognition device according to the third aspect of the present invention, the feature extracting means comprises:
Having an operation parameter that can be learned, the input signal pattern is converted into a predetermined feature signal pattern for recognition of the signal pattern, the classification means, the feature signal pattern converted by the feature extraction means, By performing a classification process for classifying into at least one of a plurality of predetermined classes, at least one class with higher likelihood is output as a recognition result of the signal pattern. Here, the adjusting means, when a signal pattern whose class attribute is known is input to the feature extracting means, makes the feature signal pattern output from the feature extracting means close to the class model of the known signal pattern. Further, the learnable operation parameter of the feature extracting means is adaptively updated without changing the classification process of the classifying means.
【0020】また、請求項4記載の信号パターン認識装
置の学習装置においては、請求項3記載の信号パターン
認識装置の学習装置において、上記調整手段は、好まし
くは、上記特徴抽出手段から出力される特徴信号パター
ンと、上記既知の信号パターンの類モデルとの間の類似
度に対応する損失が最小となるように、上記特徴抽出手
段の学習可能な動作パラメータを適応的に更新する。Further, in the learning device of the signal pattern recognition device according to claim 4, in the learning device of the signal pattern recognition device according to claim 3, the adjusting means is preferably output from the feature extracting means. The learnable operation parameter of the feature extracting means is adaptively updated so that the loss corresponding to the similarity between the feature signal pattern and the known model of the signal pattern is minimized.
【0021】本発明に係る請求項5記載の信号パターン
認識装置の学習方法においては、上記特徴抽出手段は、
学習可能な動作パラメータを有し、入力される信号パタ
ーンを、信号パターンの認識のための所定の特徴信号パ
ターンに変換し、上記分類手段は、上記特徴抽出手段に
よって変換された特徴信号パターンを、予め決められた
複数の類のうちの少なくとも1つに分類するための分類
処理を実行することにより、より尤度の高い少なくとも
1つの類を信号パターンの認識結果として出力する。こ
こで、類属性が未知の信号パターンを上記特徴抽出手段
に入力したときに、上記未知の信号パターンを、上記分
類手段から出力される認識結果である複数の類のうち最
も高い尤度を有する最尤の類モデルに近づけるように、
上記分類手段の分類処理を変更することなく、上記特徴
抽出手段の学習可能な動作パラメータを適応的に更新す
る。In the learning method of the signal pattern recognition device according to claim 5 of the present invention, the feature extracting means is
Having an operation parameter that can be learned, the input signal pattern is converted into a predetermined feature signal pattern for recognition of the signal pattern, the classification means, the feature signal pattern converted by the feature extraction means, By performing a classification process for classifying into at least one of a plurality of predetermined classes, at least one class with higher likelihood is output as a recognition result of the signal pattern. Here, when a signal pattern whose class attribute is unknown is input to the feature extracting means, the unknown signal pattern has the highest likelihood among the plurality of classes which are the recognition results output from the classifying means. To approach the maximum likelihood class model,
The learnable operation parameter of the feature extraction means is adaptively updated without changing the classification process of the classification means.
【0022】また、請求項6記載の信号パターン認識装
置の学習方法においては、請求項5記載の信号パターン
認識装置の学習方法においては、好ましくは、上記特徴
抽出手段から出力される特徴信号パターンと、上記未知
ではあるが最尤の信号パターンの類モデルとの間の類似
度に対応する損失が最小となるように、上記特徴抽出手
段の学習可能な動作パラメータを適応的に更新する。Further, in the learning method of the signal pattern recognition device according to claim 6, in the learning method of the signal pattern recognition device according to claim 5, it is preferable that the feature signal pattern output from the feature extraction means is , The learning parameters of the feature extracting means are adaptively updated so that the loss corresponding to the similarity with the unknown but maximum likelihood signal pattern type model is minimized.
【0023】本発明に係る請求項7記載の信号パターン
認識装置の学習装置においては、上記特徴抽出手段は、
学習可能な動作パラメータを有し、入力される信号パタ
ーンを、信号パターンの認識のための所定の特徴信号パ
ターンに変換し、上記分類手段は、上記特徴抽出手段に
よって変換された特徴信号パターンを、予め決められた
複数の類のうちの少なくとも1つに分類するための分類
処理を実行することにより、より尤度の高い少なくとも
1つの類を信号パターンの認識結果として出力する。こ
こで、上記調整手段は、類属性が未知の信号パターンを
上記特徴抽出手段に入力したときに、上記未知の信号パ
ターンを、上記分類手段から出力される認識結果である
複数の類のうち最も高い尤度を有する最尤の類モデルに
近づけるように、上記分類手段の分類処理を変更するこ
となく、上記特徴抽出手段の学習可能な動作パラメータ
を適応的に更新する。In the learning device of the signal pattern recognition device according to the seventh aspect of the present invention, the feature extracting means comprises:
Having an operation parameter that can be learned, the input signal pattern is converted into a predetermined feature signal pattern for recognition of the signal pattern, the classification means, the feature signal pattern converted by the feature extraction means, By performing a classification process for classifying into at least one of a plurality of predetermined classes, at least one class with higher likelihood is output as a recognition result of the signal pattern. Here, the adjusting means, when inputting a signal pattern whose class attribute is unknown to the feature extracting means, selects the unknown signal pattern among the plurality of classes which are the recognition results output from the classifying means. The learnable operation parameter of the feature extraction means is adaptively updated without changing the classification processing of the classification means so as to approach the maximum likelihood class model having a high likelihood.
【0024】また、請求項8記載の信号パターン認識装
置の学習装置においては、請求項7記載の信号パターン
認識装置の学習装置において、上記調整手段は、好まし
くは、上記特徴抽出手段から出力される特徴信号パター
ンと、上記未知ではあるが最尤の信号パターンの類モデ
ルとの間の類似度に対応する損失が最小となるように、
上記特徴抽出手段の学習可能な動作パラメータを適応的
に更新する。Further, in the learning device of the signal pattern recognition device according to claim 8, in the learning device of the signal pattern recognition device according to claim 7, the adjusting means is preferably output from the feature extracting means. In order to minimize the loss corresponding to the similarity between the characteristic signal pattern and the unknown but maximum likelihood signal pattern type model,
The learnable operation parameter of the feature extraction means is adaptively updated.
【0025】[0025]
【実施例】以下、図面を参照して本発明に係る実施例に
ついて説明する。 <第1の実施例>図1に本発明に係る第1の実施例の信
号パターン認識装置を示す。この第1の実施例の信号パ
ターン認識装置は、学習可能な動作パラメータを有し、
入力される信号パターンを、信号パターンの認識のため
の所定の特徴信号パターンに変換する特徴抽出部20
と、特徴抽出部20によって変換された特徴信号パター
ンを、予め決められて類モデルメモリ22に格納された
複数の類モデルに対応する複数の類のうちの少なくとも
1つに分類するための分類処理を実行することにより、
より尤度の高い少なくとも1つの類を信号パターンの認
識結果として出力する従来例の分類部3とを備え、類属
性が既知の信号パターンを特徴抽出部20に入力したと
きに、類モデルメモリ22に格納されている類モデルを
参照して、特徴抽出部20から出力される特徴信号パタ
ーンを、上記既知の信号パターンの類モデルに近づける
ように、分類部3の分類処理を変更することなく、特徴
抽出部20の学習可能な動作パラメータを適応的に更新
する特徴抽出パターン調整部21をさらに備えたことを
特徴とする。ここで、特徴抽出パターン調整部21は、
好ましくは、特徴抽出部20から出力される特徴信号パ
ターンと、上記既知の信号パターンの類モデルとの間の
類似度に対応する損失が最小となるように、上記特徴抽
出部20の学習可能な動作パラメータを適応的に更新す
る。Embodiments of the present invention will be described below with reference to the drawings. <First Embodiment> FIG. 1 shows a signal pattern recognition apparatus according to the first embodiment of the present invention. The signal pattern recognition device according to the first embodiment has a learnable operation parameter,
A feature extraction unit 20 that converts an input signal pattern into a predetermined feature signal pattern for signal pattern recognition.
And a classification process for classifying the feature signal pattern converted by the feature extraction unit 20 into at least one of a plurality of classes corresponding to a plurality of class models determined in advance and stored in the class model memory 22. By executing
The classification unit 3 of the conventional example that outputs at least one class with higher likelihood as a recognition result of a signal pattern, and when a signal pattern with a known class attribute is input to the feature extraction unit 20, the class model memory 22 Without changing the classification process of the classification unit 3 so that the characteristic signal pattern output from the characteristic extraction unit 20 can be brought closer to the similar model of the known signal pattern by referring to the similar model stored in A feature extraction pattern adjusting unit 21 that adaptively updates the learnable operation parameter of the feature extracting unit 20 is featured. Here, the feature extraction pattern adjustment unit 21
Preferably, the feature extraction unit 20 can perform learning so that the loss corresponding to the similarity between the feature signal pattern output from the feature extraction unit 20 and the known model of the signal pattern is minimized. Adaptively update operating parameters.
【0026】この第1の実施例においては、M個の類
(Ci;i=1,…,M)のいずれか1つに属する信号
パターンを認識する課題のために、図1に示す信号パタ
ーン認識装置を考える。ここで、上記信号パターンは、
固定次元ベクトルであっても、可変長信号パターン(前
記ベクトルの系列)であってもよい。この信号パターン
認識装置は、特徴抽出部20と分類部3とを備える。特
徴抽出部20の学習可能な動作パラメータ集合をΦと
し、分類部3の学習可能な動作パラメータ集合をΛとす
る。特徴抽出部20は、信号データメモリ1から信号パ
ターン認識装置に入力される信号パターンxを特徴信号
パターンYに変換して分類部3に出力する。すなわち特
徴抽出部20の処理は、次の数1で表される。In the first embodiment, the signal shown in FIG. 1 is used for the purpose of recognizing a signal pattern belonging to any one of M classes (C i ; i = 1, ..., M). Consider a pattern recognizer. Here, the signal pattern is
It may be a fixed dimension vector or a variable length signal pattern (sequence of the vectors). This signal pattern recognition device includes a feature extraction unit 20 and a classification unit 3. Let Φ be the learned parameter set of the feature extraction unit 20, and let Λ be the learned parameter set of the classification unit 3. The feature extraction unit 20 converts the signal pattern x input from the signal data memory 1 into the signal pattern recognition device into a feature signal pattern Y and outputs the feature signal pattern Y to the classification unit 3. That is, the process of the feature extraction unit 20 is expressed by the following mathematical expression 1.
【0027】[0027]
【数1】Y=f(x;Φ)## EQU1 ## Y = f (x; Φ)
【0028】ここで、f(・;Φ)は特徴抽出機能を表
す関数であり、その機能は動作パラメータ集合Φによっ
て決定される。分類部3は、この変換された特徴が構成
する特徴空間において、動作パラメータ集合Λの関数と
して各類Ci毎に類モデルωi(Λ)を予め類モデルメ
モリ22に格納され、これを用いて、入力信号パターン
xが各類Ciに属する帰属度を表わす判別関数g
i(Y;Λ)又はgi(f(x;Φ);Λ)を用いてその
関数値を計算する。すなわち、分類部3は次の数2で表
される分類決定規則を用いて、分類結果である類を出力
する。Here, f (·; Φ) is a function representing a feature extraction function, and the function is determined by the operation parameter set Φ. The classifying unit 3 stores the class model ω i (Λ) in advance in the class model memory 22 for each class C i as a function of the motion parameter set Λ in the feature space formed by the converted features, and uses this. Then, the discriminant function g representing the degree of membership of the input signal pattern x belonging to each class C i
The function value is calculated using i (Y; Λ) or g i (f (x; Φ); Λ). That is, the classification unit 3 outputs the class that is the classification result using the classification determination rule represented by the following Expression 2.
【0029】[0029]
【数2】C(x)=Cj, ここで、 j=argminigi(Y;Λ)## EQU2 ## C (x) = C j , where j = argmin i g i (Y; Λ)
【0030】ここで、C(・)は分類処理操作であり、
argmini(・)は関数値が最小となるときの変数
iの値を示す関数である。この分類決定規則の利用は、
判別関数gi(Y;Λ)が、入力特徴信号パターンYと
対応するモデルωi(Λ)とが類似する程その値が小さ
くなるように定義されていることを意味している。学習
可能な動作パラメータ集合Λ及びΦの状態又は設定値
は、学習段階において学習用標本集合を用いて予め適切
に、すなわち少なくとも学習用標本集合に対して高い精
度を達成するように学習されているものと仮定する。Here, C (•) is a classification processing operation,
argmin i (·) is a function indicating the value of the variable i when the function value becomes the minimum. The use of this classification decision rule is
This means that the discriminant function g i (Y; Λ) is defined such that its value decreases as the input feature signal pattern Y and the corresponding model ω i (Λ) become more similar. The states or set values of the learnable operating parameter sets Λ and Φ have been learned in advance in the learning stage by using the learning sample set appropriately, that is, at least to achieve high accuracy with respect to the learning sample set. Suppose.
【0031】以上の状況において、本発明に基づく適応
学習方法は以下の要領で実施される。明瞭性のためにこ
の提案される方法を適応特徴抽出に基づく信号パターン
認識法(Adaptive Feature Extraction-based pattern
recognition method)(以下、AFE法という。)と呼
ぶ。AFE法はさらに、適応用標本が属する類に関する
情報の有無に基づき、2種の異なる方法によって実施す
ることができる。適応標本が属する類が既知である場
合、AFEは、いわゆる教師付き学習形式で実施するこ
とができる。これをSAFE法(Supervised Adaptive
Feature Extraction-based pattern recognition metho
d)と呼ぶ。また、適応標本が属する類が未知である場
合、AFE法は教師無し学習形式で実施することにな
る。これをUSAFE法(UnSupervised Adaptive Fea
ture Extraction-based pattern recognition method)
と呼ぶ。なお、このUSAFE法については第2の実施
例において説明する。In the above situation, the adaptive learning method according to the present invention is implemented as follows. For the sake of clarity, the proposed method is based on the adaptive feature extraction-based pattern recognition method.
recognition method) (hereinafter referred to as the AFE method). The AFE method can also be implemented by two different methods, based on the presence or absence of information about the class to which the adaptation sample belongs. If the class to which the adaptive sample belongs is known, AFE can be implemented in a so-called supervised learning format. The SAFE method (Supervised Adaptive)
Feature Extraction-based pattern recognition metho
d). Further, when the class to which the adaptive sample belongs is unknown, the AFE method is executed in the unsupervised learning format. This is the USAFE method (UnSupervised Adaptive Fea
ture Extraction-based pattern recognition method)
Call. The USAFE method will be described in the second embodiment.
【0032】SAFE法を用いる第1の実施例において
は、まず、適応学習のため処理は特徴抽出パラメータ調
整部21において実行され、図1に示すように、属する
類が既知の、新しい動作環境における適応用標本である
信号データx1(∈Ck)が信号データメモリ1から特徴
抽出部20に入力される。特徴抽出パラメータ調整部2
1は、この適応用標本である信号データx1から特徴抽
出部20で変換された特徴信号パターンY1が、類モデ
ルメモリ22に格納されている類Ckのモデル(特徴信
号パターンのモデル)ωk(Λ)に近づくように、特徴
抽出部20の特徴抽出関数f(x;Φ)を決定する動作
パラメータΦを更新する。具体的には、類属性が既知の
入力信号パターンを特徴抽出部20に入力したときに、
その類Ckのモデルωk(Λ)と、類属性が既知の入力信
号パターンの特徴信号パターンY1との間の類似度を、
次の数3で表される損失lk(Y1;Λ)として新たに定
義し、この損失ができるだけ小さくなるように動作パラ
メータΦを更新する。In the first embodiment using the SAFE method, first, the processing for adaptive learning is executed in the feature extraction parameter adjusting unit 21, and as shown in FIG. 1, in a new operating environment in which the class to which it belongs is known. Signal data x 1 (εC k ) which is an adaptation sample is input from the signal data memory 1 to the feature extraction unit 20. Feature extraction parameter adjustment unit 2
1 is a model of the class C k (model of the characteristic signal pattern) in which the characteristic signal pattern Y 1 converted from the signal data x 1 which is the adaptation sample by the characteristic extraction unit 20 is stored in the type model memory 22. The operation parameter Φ that determines the feature extraction function f (x; Φ) of the feature extraction unit 20 is updated so as to approach ω k (Λ). Specifically, when an input signal pattern with a known class attribute is input to the feature extraction unit 20,
The similarity between the model ω k (Λ) of the class C k and the characteristic signal pattern Y 1 of the input signal pattern whose class attribute is known is
A loss l k (Y 1 ; Λ) represented by the following expression 3 is newly defined, and the operating parameter Φ is updated so that this loss becomes as small as possible.
【0033】[0033]
【数3】lk(Y1;Λ)=lk(f(x1;Φ);Λ)## EQU00003 ## l k (Y 1 ; Λ) = l k (f (x 1 ; Φ); Λ)
【0034】損失を小さくするためには、この類似度は
類Ckのモデルωk(Λ)と特徴信号パターンY1との間
のある種の距離であると考えることが自然である。この
ような1つの適応標本に対する損失の最小化には、勾配
法等の既存の様々な方法を用いることができる。しかし
ながら、入力信号パターンxが音声信号等のように可変
長であることを考えると、特に、好ましくは、例えば文
献3「S. Katagiri etal.,“A Generalized Probabilis
tic Descent Method", Acoustic Society Japan Procee
ding of Fall Conference, pp.141-142,1990年9月」及
び文献4「B.-H. Juang et al.,“Discriminative Lear
ning for Minimum Error Classification", IEEE Trans
action on Signal Processing, Vol. 40, No. 12, pp.3
043-3054,1992年12月」において提案されている公知の
一般化確率的降下法(the Generalized Probabilistic
Descent method)(以下、GPD法という。)に基づく
更新規則を用いることが有効である。In order to reduce the loss, it is natural to think of this similarity as a kind of distance between the model ω k (Λ) of class C k and the characteristic signal pattern Y 1 . Various existing methods such as the gradient method can be used to minimize the loss for such one adaptive sample. However, considering that the input signal pattern x has a variable length such as a voice signal, it is particularly preferable to refer to, for example, Document 3 “S. Katagiri et al.,“ A Generalized Probabilis ”.
tic Descent Method ", Acoustic Society Japan Procee
ding of Fall Conference, pp.141-142, September 1990 "and Reference 4" B.-H. Juang et al., "Discriminative Lear
ning for Minimum Error Classification ", IEEE Trans
action on Signal Processing, Vol. 40, No. 12, pp.3
043-3054, December 1992 ”, the well-known generalized probabilistic descent method.
It is effective to use an update rule based on the Descent method (hereinafter referred to as the GPD method).
【0035】GPD法を用いるSAFE法の一実施例
は、例えば図3に示すような音声認識装置である。この
音声認識装置は、図3に示すように、マイクロホン41
と、A/D変換器42と、図1に図示された装置と同様
の構成を有する音声認識用信号パターン認識装置43と
を備える。発声音声はマイクロホン41に入力されて、
音声信号に変換された後、A/D変換器42に入力され
る。A/D変換器42は入力された音声信号を所定のサ
ンプリング周波数でA/D変換してディジタル音声信号
に変換して入力信号パターンとして音声認識用信号パタ
ーン認識装置43に入力されて、信号パターン認識処理
が実行されることにより音声認識処理が実行され、信号
パターン認識装置43から音声認識結果データが出力さ
れる。An example of the SAFE method using the GPD method is a voice recognition device as shown in FIG. 3, for example. This voice recognition device, as shown in FIG.
2, an A / D converter 42, and a voice recognition signal pattern recognition device 43 having the same configuration as the device shown in FIG. The voiced voice is input to the microphone 41,
After being converted into an audio signal, it is input to the A / D converter 42. The A / D converter 42 A / D-converts the input voice signal at a predetermined sampling frequency to convert it into a digital voice signal and inputs it as an input signal pattern to the voice recognition signal pattern recognition device 43, and outputs the signal pattern. The voice recognition process is performed by performing the recognition process, and the voice recognition result data is output from the signal pattern recognition device 43.
【0036】ここで、図3の例で図1の装置を用いた場
合について説明する。A/D変換器42から特徴抽出部
20に入力される信号を、適応学習のために与えられた
可変長の音声波形信号x1とする。当該信号x1のデータ
が特徴抽出部20に入力され、特徴抽出部20は、これ
に応答して、特徴抽出処理を実行することにより、この
信号x1上で固定長の時間窓を移動させながら求めら
れ、次の数4で表される固定次元の音響特徴ベクトルの
系列を特徴信号パターンY1として出力する。The case of using the apparatus of FIG. 1 in the example of FIG. 3 will now be described. The signal input from the A / D converter 42 to the feature extraction unit 20 is a variable-length speech waveform signal x 1 given for adaptive learning. The data of the signal x 1 is input to the feature extraction unit 20, and in response to this, the feature extraction unit 20 executes the feature extraction processing to move the fixed-length time window on this signal x 1. However, the sequence of fixed-dimensional acoustic feature vectors, which is obtained by the following equation 4, is output as the feature signal pattern Y 1 .
【0037】[0037]
【数4】Y1={ν1,…,ντ,…,νT(1)}[Formula 4] Y 1 = {ν 1 , ..., ν τ , ..., ν T (1) }
【0038】ここで、T(1)は特徴信号パターンのベ
クトル系列Y1の長さであり、ντはτ番目の音響特徴
ベクトルであり、このベクトルとしては、多くの音声認
識装置の応用例の場合ケプストラム等の短時間パワース
ペクトルに関連する特徴ベクトルが用いられる。また、
類Ckのモデルωk(Λ)を特徴信号パターン空間におけ
る参照信号パターンRとして次の数5で表されるものと
する。Here, T (1) is the length of the vector sequence Y 1 of the feature signal pattern, and ν τ is the τ th acoustic feature vector, and this vector is an application example of many speech recognition devices. In this case, a feature vector related to the short-time power spectrum such as cepstrum is used. Also,
It is assumed that the model ω k (Λ) of the class C k is represented as the reference signal pattern R in the characteristic signal pattern space by the following Expression 5.
【0039】[0039]
【数5】R={ξ1,…,ξτ,…,ξT(r)}## EQU5 ## R = {ξ 1 , ..., ξ τ , ..., ξ T (r) }
【0040】ここで、T(r)はこの参照信号パターン
であるベクトル系列Rの長さである。信号パラメータ認
識装置を学習するために用いられるGPD法では、分類
結果を反映する損失関数と上記と同様の判別関数との他
に誤分類測度が用いられる。第1の実施例のSAFE法
ではこれらは全て同一の関数として定義する。上記のC
kの類似度には任意の合理的な距離又はその関数を用い
ることができるが、特に、参照信号パターンのベクトル
系列Rと特徴信号パターンY1との間で、動的計画法に
基づく非線形時間軸伸縮に用いられる伸縮整合範囲内の
経路θによって対応づけられるRとY1との特徴ベクト
ル間の自乗ユークリッド距離を、この経路に沿って累積
して得られる累積自乗ユークリッド距離Dθを用いて次
の数6のように与えることができる。Here, T (r) is the length of the vector series R which is the reference signal pattern. In the GPD method used for learning the signal parameter recognition device, a misclassification measure is used in addition to the loss function reflecting the classification result and the discrimination function similar to the above. In the SAFE method of the first embodiment, these are all defined as the same function. C above
Any reasonable distance or a function thereof can be used for the similarity of k , but in particular, a nonlinear time based on dynamic programming between the vector sequence R of the reference signal pattern and the characteristic signal pattern Y 1. Using the cumulative squared Euclidean distance D θ obtained by accumulating the squared Euclidean distance between the feature vectors of R and Y 1 associated with the route θ within the expansion / contraction matching range used for axis expansion / contraction, It can be given by the following equation 6.
【0041】[0041]
【数6】 (Equation 6)
【0042】ここで、dk(f(x1;Φ);Λ)は誤分
類測度であり、ζは正の定数である。Θは可能な伸縮整
合経路の数である。またここで、学習可能な動作パラメ
ータ集合Λが各関数に含まれてはいるものの、これは更
新されない定数として用いられる。上記数6における調
整可能な変数はΦである。これは、SAFE法が分類部
3の動作パラメータの状態又は設定値を固定して、特徴
抽出部20のみを学習可能であるとしているためであ
る。この入力信号x1に対する損失、結果的に全く同一
の判別関数を減少させるΦを学習可能変数とするGPD
の計算は、例えば文献5「T. Komori et al.,“FD Trai
ning of Dynamic Programming-Based Speech Recognize
rs", Jounal of Acoustic Society Japan (E), Vol. 1
3, No. 6, pp.341-349,1992年11月」において提案さ
れているGPD法の更新規則を用いることで実現するこ
とができる。これで、1つの適応用信号パターン標本の
ためのSAFE法の学習処理が完成される。Where d k (f (x 1 ; Φ); Λ) is the misclassification measure and ζ is a positive constant. Θ is the number of possible stretch matching paths. Further, here, although the learnable operation parameter set Λ is included in each function, it is used as a constant that is not updated. The adjustable variable in Equation 6 above is Φ. This is because the SAFE method fixes the state or set value of the operation parameter of the classification unit 3 and allows only the feature extraction unit 20 to learn. GPD with learning as a loss variable for this input signal x 1 and, as a result, Φ that reduces the same discriminant function
For example, reference 5 “T. Komori et al.,“ FD Trai
ning of Dynamic Programming-Based Speech Recognize
rs ", Jounal of Acoustic Society Japan (E), Vol. 1
3, No. 6, pp.341-349, November 1992 ”can be implemented by using the update rule of the GPD method. This completes the learning process of the SAFE method for one adaptation signal pattern sample.
【0043】続いて、この1つの適応用標本のためのS
AFE法の学習処理を、適応用信号パターン標本を{x
2,x3,…}のように取り替えつつ繰り返す。この繰り
返しもGPD法の繰り返しに準ずることができる。こう
して、新しい適応用標本を継時的かつ適応的に与えて行
うSAFE法の学習処理が完成される。Then, S for this one adaptation sample
The learning process of the AFE method is performed using the adaptive signal pattern sample {x
2 , x 3 , ...} and repeat. This repetition can be similar to the repetition of the GPD method. In this way, the learning process of the SAFE method performed by continuously and adaptively giving a new adaptation sample is completed.
【0044】GPD法及びその実際的学習法の1つであ
る学習ベクトル量子化等で実証されているように、この
SAFE学習は、適応用標本を取り替えながらその学習
を進めるにつれて、認識装置の学習段階では知りえなか
った新しい動作条件における入力信号パターン標本を、
予め認識装置に組み込まれている類モデルを学習した場
合に用いた同類の、実際にはモデルによって近似表現さ
れている特徴信号パターンにより近い特徴信号パターン
に変換できるように、特徴抽出パラメータ調整部21に
よって、特徴抽出部20における動作パラメータΦを徐
々に更新していく。As demonstrated by the GPD method and the learning vector quantization which is one of the practical learning methods, this SAFE learning is performed by the recognizer as the learning progresses while replacing the adaptive sample. Input signal pattern samples under new operating conditions
The feature extraction parameter adjusting unit 21 is provided so that the feature signal pattern can be converted into a feature signal pattern that is similar to the feature signal pattern that is actually approximated by the model, which is used when learning a type model that is built in the recognition device in advance. The operation parameter Φ in the feature extraction unit 20 is gradually updated by.
【0045】この第1の実施例においては、上記更新処
理の繰り返しを終了するために、好ましくは、以下に示
す例のうちの1つの終了条件を用いる。 (I)ある適応用パターンに対する損失の値が予め定め
られたしきい値を下回ったら、上記更新処理を終了す
る。 (II)ある適応用パターンに対する認識結果が正しかっ
たら、上記更新処理を終了する。 (III)複数の適応用パターンに対する損失の値の集計
又は平均が予め定められたしきい値を下回ったら、上記
更新処理を終了する。 (IV)複数の適応用パターンに対する平均的認識結果が
予め定められたしきい値を上回ったら、上記更新処理を
終了する。 (V)評価用に準備された適応用パターンとは独立のパ
ターン集合を用いて、上記の(I)乃至(IV)のそれぞ
れにおける適応用パターンをこの新たなる集合から得ら
れる評価用パターンと置き換えて、それぞれの条件の検
証を行う。上記(I)乃至上記(IV)のうちのいずれか
の条件が満足されれば、上記更新処理を終了する。 (VI)上記(I)乃至(V)を選択的又は包括的に組み
合わせて、組み合わされた条件が同時に満たされれば、
上記更新処理を終了する。In the first embodiment, in order to end the repetition of the above-mentioned update processing, it is preferable to use one end condition of the following examples. (I) When the value of loss for a certain adaptation pattern falls below a predetermined threshold value, the updating process is terminated. (II) If the recognition result for a certain adaptation pattern is correct, the updating process is terminated. (III) When the tabulation or average of the loss values for a plurality of adaptation patterns falls below a predetermined threshold value, the updating process is terminated. (IV) When the average recognition result for a plurality of adaptation patterns exceeds a predetermined threshold value, the updating process is terminated. (V) Using the pattern set independent of the adaptation pattern prepared for evaluation, replacing the adaptation pattern in each of the above (I) to (IV) with the evaluation pattern obtained from this new set. Then, each condition is verified. When any one of the above conditions (I) to (IV) is satisfied, the updating process is terminated. (VI) If the above conditions (I) to (V) are selectively or comprehensively combined and the combined conditions are simultaneously satisfied,
The update process ends.
【0046】なお、GPD法を用いた実施例において、
パラメータζを制御することによる累積距離が小さい意
味での最良の経路のみを用いる場合を含む多様な経路の
利用法を用いることも、GPD法と同様に行うことがで
きる。In the embodiment using the GPD method,
It is possible to use various route usage methods including the case of using only the best route in the sense that the cumulative distance by controlling the parameter ζ is small, similarly to the GPD method.
【0047】さらに、上記の例では各類1つの参照パタ
ーンを用いているが、各類毎に複数参照パターンを用い
る認識装置のための定形化を、GPD法と全く同様に行
ってもよい。また、類モデルとしては、例えば、隠れマ
ルコフモデルや人工神経回路網(ニューラルネットワー
ク)等の任意の合理的なモデルを用いることができる。
特徴抽出関数としても、認識対象であるパターンの種類
に応じて、任意の合理的な関数を用いることができる。Furthermore, in the above example, one reference pattern for each class is used, but formalization for a recognition device using a plurality of reference patterns for each class may be performed in exactly the same way as the GPD method. As the class model, any rational model such as a hidden Markov model or an artificial neural network (neural network) can be used.
As the feature extraction function, any rational function can be used according to the type of pattern to be recognized.
【0048】さらに、GPD法に基づく更新規則の一例
について説明する。基本的には、更新規則は用いる信号
パターン認識装置の構成、特に、装置動作パラメータの
種類に依存する。ここでは、特に、分類部3に複数参照
ベクトルを用いる距離分類器を用いるとともに、特徴抽
出部20には、比較的短い時間窓内で特徴抽出を行う、
フーリエ変換に基づくフィルターバンク計算を用いる、
M個の類を認識するための音声認識装置について以下に
説明する。入力音声信号xは、短い時間窓による切り出
しとフリーエ変換に基づく周波数変換などの計算処理を
実行することにより、次の数7で表されるパワースペク
トルの特徴ベクトル系列Xに変換される。上記では、入
力信号として{x1,x2,…}のように指標を付けて記
述していたが、この詳細例の記述では、簡単のため信号
の指標は省略する。Further, an example of the update rule based on the GPD method will be described. Basically, the update rule depends on the configuration of the signal pattern recognition device used, in particular, the type of device operation parameter. Here, in particular, a distance classifier using a plurality of reference vectors is used for the classifying unit 3, and the feature extracting unit 20 performs feature extraction within a relatively short time window.
Using a filterbank calculation based on the Fourier transform,
A voice recognition device for recognizing M classes will be described below. The input audio signal x is converted into a feature vector series X of a power spectrum represented by the following Expression 7 by performing calculation processing such as clipping with a short time window and frequency conversion based on the Freier conversion. In the above description, an index such as {x 1 , x 2 , ...} Is added as an input signal for description, but in the description of this detailed example, the index of the signal is omitted for simplicity.
【0049】[0049]
【数7】 X={χ(1),…,χ(t),…,χ(T0)}X = {χ (1), ..., χ (t), ..., χ (T 0 )}
【0050】ここでχ(t)はt番目の時間窓位置にお
けるF次元のパワースペクトルの特徴ベクトルであり、
T0は系列長である。AFE法を用いる第1の実施例に
おいては、この系列は、適応可能な特徴抽出部20に入
力される入力信号パターンである。特徴抽出部20は、
適応可能な動作パラメータΦによって決定されるフィル
タリングを実行する特徴抽出関数f(・;Φ)の関数計
算処理器を備え、次の数8及び数9に示すように、特徴
ベクトル系列Xを、特徴抽出関数f(・;Φ)を用いて
窓位置毎に、フィルタバンクによってフィルタリングさ
れるS次元の特徴ベクトルYに変換して出力する。Where χ (t) is the feature vector of the F-dimensional power spectrum at the t-th time window position,
T 0 is the sequence length. In the first embodiment using the AFE method, this sequence is an input signal pattern input to the adaptive feature extraction unit 20. The feature extraction unit 20
A function calculation processor of the feature extraction function f (·; Φ) that executes filtering determined by the adaptive operation parameter Φ is provided, and the feature vector series X is represented by the following equations 8 and 9. It is converted into an S-dimensional feature vector Y filtered by the filter bank and output for each window position using the extraction function f (·; Φ).
【0051】[0051]
【数8】 ν(t)[s]=f(χ(t);Φ)[s]Ν (t) [s] = f (χ (t); Φ) [s]
【数9】 Y={ν(1),…,ν(t),…,ν(T0)}Equation 9] Y = {ν (1), ..., ν (t), ..., ν (T 0)}
【0052】ここで、ν(t)はχ(t)から変換され
た特徴ベクトルである。従って、特徴抽出関数f(χ
(t);Φ)はF次元特徴ベクトルχ(t)を、S次元
特徴ベクトルν(t)に変換し、ここで、関数f(χ
(t);Φ)[s]は、関数f(χ(t);Φ)の出力
の第s次元成分を表す。以下でも同様に、[s]は対応
するベクトルの第s成分を表わす。特徴ベクトルYは適
応可能な特徴抽出部20の出力であり、分類部3への入
力となる。Here, ν (t) is a feature vector converted from χ (t). Therefore, the feature extraction function f (χ
(T); Φ) transforms the F-dimensional feature vector χ (t) into an S-dimensional feature vector ν (t), where the function f (χ
(T); Φ) [s] represents the s-th dimension component of the output of the function f (χ (t); Φ). Similarly below, [s] represents the s-th component of the corresponding vector. The feature vector Y is an output of the adaptable feature extraction unit 20 and is an input to the classification unit 3.
【0053】GPD法に基づくAFE法による学習処理
においては、特徴抽出パラメータ調整部21はこの動作
パラメータΦを更新し、結果的に特徴抽出部20の特徴
抽出関数f(・)を新しい動作環境に適応する。分類部
3は、次の数10に示すように、類Ciの分類のために
Bi個の参照信号パターンを有する。In the learning process by the AFE method based on the GPD method, the feature extraction parameter adjustment unit 21 updates this operation parameter Φ, and as a result, the feature extraction function f (·) of the feature extraction unit 20 is changed to a new operation environment. To adapt. The classifying unit 3 has B i reference signal patterns for classifying the classes C i as shown in the following Expression 10.
【0054】[0054]
【数10】 Λ={{Ri 1,…,Ri b,…,Ri Bi}}i=1 i=M Λ = {{R i 1 , ..., R i b , ..., R i Bi }} i = 1 i = M
【0055】この参照信号パターンの構成は、基本的に
上述の特徴ベクトル系列と同じである。この例において
は、類Ciの判別関数は次の数11で表される。The structure of this reference signal pattern is basically the same as the above-mentioned feature vector sequence. In this example, the discriminant function of the class C i is represented by the following Expression 11.
【0056】[0056]
【数11】 [Equation 11]
【0057】ここで、D(X,Ri b;Φ)は次の数12
で表される。Here, D (X, R i b ; Φ) is given by
It is represented by.
【0058】[0058]
【数12】 (Equation 12)
【0059】この数12で表されるD(X,Ri b;Φ)
は、動作パラメータΦによって変換される信号パターン
のベクトル系列Yと、参照パターンのベクトル系列長T
i bを有するベクトル系列Ri bとの間の一般化累積距離で
あり、順次以下のように分解される。なお、ζ及びξと
も予め決められた正の定数である。また、Θi bはRi bと
の整合で許された可能な整合経路の数である。さらに、
Dθ(X,Ri b;Φ)は、特徴ベクトルYと参照パター
ンのベクトル系列Ri bとの間の動的計画法に基づく非線
形時間軸伸縮法において許される第θ整合経路上で定義
される経路距離であり、次の数13で定義される。D (X, R i b ; Φ) represented by the equation 12
Is the vector sequence Y of the signal pattern converted by the operation parameter Φ and the vector sequence length T of the reference pattern.
i b is a generalization of the cumulative distance between the vector sequences R i b having, it is decomposed as sequentially follows. Note that both ζ and ξ are predetermined positive constants. Also, Θ i b is the number of possible matching paths allowed for matching with R i b . further,
D θ (X, R i b ; Φ) is defined on the θ-th matching path allowed in the nonlinear time axis expansion / contraction method based on dynamic programming between the feature vector Y and the reference pattern vector series R i b. The route distance is defined by the following equation 13.
【0060】[0060]
【数13】 (Equation 13)
【0061】この数13におけるδiθt bは、参照パタ
ーンのベクトル系列Ri bの第t番目の特徴ベクトルri b
(t)と、これに第θ整合経路を経て対応付けられる特
徴ベクトル系列Yのθt ib番目の特徴ベクトルν
(θt ib)との間の局所距離であり、次の数14のよう
に定義される。[0061] δ iθt b in the number 13, the t th feature vector r i b of the vector sequences R i b of the reference pattern
(T) and the θ t ib- th feature vector ν of the feature vector series Y that is associated with it via the θ-th matching path.
It is a local distance to (θ t ib ), and is defined as the following Expression 14.
【0062】[0062]
【数14】 [Equation 14]
【0063】ここで、wit bはri b(t)に付随する重
み係数である。Here, w it b is a weighting coefficient associated with r i b (t).
【0064】次に、GPD法に基づく、特徴抽出部20
の学習可能な動作パラメータΦに関する更新規則につい
て述べる。この更新規則は、次の数15で表される。Next, the feature extraction unit 20 based on the GPD method.
The update rule regarding the learnable operating parameter Φ of is described. This update rule is expressed by the following Expression 15.
【0065】[0065]
【数15】Φτ+1=Φτ+δΦτ [Formula 15] Φ τ + 1 = Φ τ + δΦ τ
【0066】ここで、τはGPDの繰り返し更新におけ
る繰り返し回数を示す時間指標である。適応更新用に与
えられた、類Ckに属する入力信号データxに対して、
更新量δΦτは確率的降下定理に従って次の数16で表
される。なお、以下で∇φはΦに関する偏微分を表わ
す。Here, τ is a time index indicating the number of repetitions in the repeated update of GPD. For the input signal data x belonging to the class C k , which is given for adaptive updating,
The update amount δΦ τ is represented by the following Expression 16 according to the stochastic descent theorem. Note that ∇ phi below represents the partial derivative with respect to [Phi.
【0067】[0067]
【数16】δΦτ=−εU∇φgk(X;Λ,Φ)[Number 16] δΦ τ = -εU∇ φ g k ( X; Λ, Φ)
【0068】この更新量δΦτを決定するベクトル∇φ
gk(X;Λ,Φ)は、段階的に次の数17乃至数19
に示すように与えられる。[0068] vector ∇ φ to determine the amount of update δΦ τ
g k (X; Λ, Φ) is expressed by the following equations 17 to 19 stepwise.
Given as shown in.
【0069】[0069]
【数17】 [Equation 17]
【数18】 (Equation 18)
【数19】 [Formula 19]
【0070】ここで、εは単調減少する小さな正数であ
り、Uは正定値行列である。Here, ε is a small positive number that decreases monotonically, and U is a positive definite matrix.
【0071】さらに、上記更新規則を簡単化した場合に
ついて述べる。上記の正の定数ζ及びξを無限大に近付
けることによって、判別関数gi(X;Λ,Φ)は次の
数20のように簡単な形式で近似することができる。Further, a case where the above update rule is simplified will be described. By bringing the above positive constants ζ and ξ close to infinity, the discriminant function g i (X; Λ, Φ) can be approximated in a simple form as in the following Expression 20.
【0072】[0072]
【数20】 (Equation 20)
【0073】ここで、b’は類内の最良である最小一般
化累積距離の参照ベクトルを表し、θ’は各非線形時間
軸伸縮整合における最良である最小累積距離の経路を表
している。このとき、上記数16の更新量を決定するベ
クトル∇φgk(X,Λ;Φ)は次の数21で表され
る。Here, b'represents the reference vector of the best minimum generalized cumulative distance in the class, and θ'represents the path of the best minimum cumulative distance in each non-linear time-axis stretch matching. In this case, the vector ∇ φ g k (X, Λ ; Φ) for determining the update amount of the number 16 is expressed by the following equation 21.
【0074】[0074]
【数21】 [Equation 21]
【0075】以上説明したように、本発明に係る実施例
によれば、特徴抽出部20の動作パラメータを更新する
ことによって、分類部3が類境界を設定する(すなわ
ち、分類判断を実行する)特徴信号パターン空間そのも
のを適応させるため、特徴抽出部20の動作パラメータ
を固定して発見的又は経験的知識を援用しながら分類部
3において類境界を個別に更新する従来の方法に比較し
て、より高い効率で新しい動作条件への適応処理を実行
することができるとともに、従来例よりも少数の適応用
標本のみを用いて新しい動作条件下においても高い認識
精度を達成することができる。As described above, according to the embodiment of the present invention, the classification unit 3 sets the class boundary by updating the operation parameter of the feature extraction unit 20 (that is, the classification judgment is executed). In order to adapt the feature signal pattern space itself, compared with the conventional method in which the class boundary is individually updated in the classifying unit 3 while fixing the operation parameter of the feature extracting unit 20 and applying heuristic or empirical knowledge, It is possible to perform the adaptation process to the new operating condition with higher efficiency, and it is possible to achieve high recognition accuracy even under the new operating condition by using only a small number of adaptation samples as compared with the conventional example.
【0076】<第2の実施例>図2に本発明に係る第2
の実施例の信号パターン認識装置のブロック図を示す。
この第2の実施例においては、上記USFE法を用い
る。この第2の実施例の信号パターン認識装置は、学習
可能な動作パラメータを有し、入力される信号パターン
を、信号パターンの認識のための所定の特徴信号パター
ンに変換する特徴抽出部30と、特徴抽出部30によっ
て変換された特徴信号パターンを、予め決められて類モ
デルメモリ22に格納された複数の類モデルに対応する
複数の類のうちの少なくとも1つに分類するための分類
処理を実行することにより、より尤度の高い少なくとも
1つの類を信号パターンの認識結果として出力する従来
例の分類部3とを備え、複数の類モデルが予め格納され
た類モデルメモリ22を参照して、類属性が未知の信号
パターンを特徴抽出部30に入力したときに、上記未知
の信号パターンを、分類部3から出力される認識結果で
ある複数の類のうち最も高い尤度を有する最尤の類モデ
ル(これら複数の類モデルは類モデルメモリ22に格納
されている。)に近づけるように、分類部3の分類処理
を変更することなく、特徴抽出部30の学習可能な動作
パラメータを適応的に更新する特徴抽出パラメータ調整
部31をさらに備えたことを特徴とする。ここで、特
に、特徴抽出パラメータ調整部31は、好ましくは、特
徴抽出部30から出力される特徴信号パターンと、上記
未知ではあるが信号パターンの類モデルとの間の類似度
に対応する損失が最小となるように、特徴抽出部30の
学習可能な動作パラメータを適応的に更新することを特
徴とする。以下、第1の実施例との相違点について説明
する。<Second Embodiment> FIG. 2 shows a second embodiment of the present invention.
FIG. 3 is a block diagram of a signal pattern recognition device according to the embodiment.
In the second embodiment, the above USFE method is used. The signal pattern recognition apparatus according to the second embodiment has a feature extraction unit 30 that has an operation parameter that can be learned and that converts an input signal pattern into a predetermined feature signal pattern for signal pattern recognition. Performs a classification process for classifying the characteristic signal pattern converted by the characteristic extraction unit 30 into at least one of a plurality of classes corresponding to a plurality of class models stored in the class model memory 22 in advance. By doing so, at least one class having a higher likelihood is provided as the recognition result of the signal pattern, and the classification unit 3 of the conventional example is provided, and the class model memory 22 in which a plurality of class models are stored in advance is referred to, When a signal pattern whose class attribute is unknown is input to the feature extraction unit 30, the unknown signal pattern is selected from among the plurality of classes which are the recognition results output from the classification unit 3. Without changing the classification process of the classification unit 3, the feature extraction unit 30 does not change so as to approach the maximum likelihood class model having a high likelihood (the plurality of class models are stored in the class model memory 22). A feature extraction parameter adjusting unit 31 that adaptively updates the learnable operation parameter is further provided. Here, in particular, the feature extraction parameter adjustment unit 31 preferably has a loss corresponding to the similarity between the feature signal pattern output from the feature extraction unit 30 and the unknown model of the signal pattern. The feature is to adaptively update the learnable operation parameter of the feature extraction unit 30 so as to minimize the value. Hereinafter, differences from the first embodiment will be described.
【0077】この第2の実施例のUSAFE法は、更新
前の状態における信号パターン認識装置によって適応用
の類属性未知の入力標本信号パターンが属する類Cmと
判断される類のモデルωm(Λ)(当該類モデルは類モ
デルメモリ22に格納されている。)を用いる点を除い
て、第1の実施例のSAFE法と全く同様の更新処理を
行う。もしこの適応用の類属性未知の信号パターンに対
する分類判断が正しければ、USAFE法はSAFE法
と同一の結果を導く。しかしながら、一般にこの判断の
正しさは保証されない。USAFE法の学習が進むにつ
れて、特徴抽出部30は新しい動作条件における未知の
入力信号パターン標本を、その各入力に伴う適応更新の
直前の時点における信号パターン認識装置の状態(具体
的には、特徴抽出部30の動作パラメータΦがその各入
力に伴う適応更新の直前の時点における状態)で、上記
数2で表される分類処理を実行して得られる最尤の類モ
デルにより近い特徴信号パターンに変換できるように、
特徴抽出部30の動作パラメータΦを徐々に更新してい
く。In the USAFE method of the second embodiment, the model ω m (of the class C m to which the adaptive input sample signal pattern of unknown class attribute is judged by the signal pattern recognition device in the state before update) Λ) (the class model is stored in the class model memory 22) is used, and the same updating process as the SAFE method of the first embodiment is performed. If the classification judgment for the signal pattern of unknown class attribute for adaptation is correct, the USAFE method leads the same result as the SAFE method. However, the correctness of this judgment is not generally guaranteed. As the learning of the USAFE method progresses, the feature extraction unit 30 acquires the state of the signal pattern recognition device (specifically, the feature) from the unknown input signal pattern sample under the new operation condition immediately before the adaptive update accompanying each input. In the state immediately before the adaptive update associated with each input of the operation parameter Φ of the extraction unit 30), a feature signal pattern closer to the maximum likelihood type model obtained by executing the classification processing represented by the above-mentioned Equation 2 is obtained. So that it can be converted
The operation parameter Φ of the feature extraction unit 30 is gradually updated.
【0078】すなわち、特徴抽出パターン調整部31
は、未知の入力信号データx1から変換された特徴信号
パターンY1が、分類部3から出力される複数の類のモ
デルのうちの最尤類Cmのモデルωm(Λ)の特徴信号パ
ターンに近づくように、特徴抽出部30の特徴抽出関数
f(x;Φ)を決定する動作パラメータΦを更新する。
具体的には、最尤の類Cmのモデルωm(Λ)と、未知の
入力信号パターンから変換された特徴信号パターンY1
との間の類似度を、上記数3で表される損失lm(Y1;
Λ)として新たに定義し、この損失ができるだけ小さく
なるように動作パラメータΦを更新する。なお、複数の
類のモデルは類モデルメモリ22に格納されている。That is, the feature extraction pattern adjusting unit 31
Is the characteristic signal pattern Y 1 converted from the unknown input signal data x 1 is the characteristic signal of the model ω m (Λ) of the maximum likelihood class C m of the plurality of models output from the classification unit 3. The operation parameter Φ that determines the feature extraction function f (x; Φ) of the feature extraction unit 30 is updated so as to approach the pattern.
Specifically, the model ω m (Λ) of the maximum likelihood class C m and the characteristic signal pattern Y 1 converted from the unknown input signal pattern
And the similarity l m (Y 1 ;
Λ) is newly defined, and the operating parameter Φ is updated so that this loss becomes as small as possible. The models of a plurality of classes are stored in the model memory 22.
【0079】以上説明したように、本発明に係る実施例
によれば、特徴抽出部30の動作パラメータを更新する
ことによって、分類部3が類境界を設定する(すなわ
ち、分類処理を実行する)特徴信号パターン空間そのも
のを適応させるため、特徴抽出部30の動作パラメータ
を固定して発見的又は経験的知識を援用しながら分類部
3において類境界を個別に更新する従来の方法に比較し
て、より高い効率で新しい動作条件への適応処理を実行
することができるとともに、従来例よりも少数の適応用
標本のみを用いて新しい動作条件下においても高い認識
精度を達成することができる。As described above, according to the embodiment of the present invention, the classification unit 3 sets the class boundary (that is, executes the classification process) by updating the operation parameter of the feature extraction unit 30. In order to adapt the feature signal pattern space itself, compared to the conventional method in which the class boundary is individually updated in the classifying unit 3 while fixing the operation parameter of the feature extracting unit 30 and applying heuristic or empirical knowledge, It is possible to perform the adaptation process to the new operating condition with higher efficiency, and it is possible to achieve high recognition accuracy even under the new operating condition by using only a small number of adaptation samples as compared with the conventional example.
【0080】なお、第1の実施例のSAFE法及び第2
の実施例のUSAFE法とも、そこにおける適応用信号
パターンの選択は、無作為に行ってもよいし、信号パタ
ーンが持つ特性に関する科学的知見に基づいて学習して
もよい。The SAFE method of the first embodiment and the second method
Also in the USAFE method of the above embodiment, the selection of the adaptive signal pattern may be performed randomly or may be learned based on scientific knowledge about the characteristics of the signal pattern.
【0081】以上の実施例において、特徴抽出部20,
30と、分類部3と、特徴抽出パラメータ調整部21,
31とは例えばディジタル計算機によって構成される。In the above embodiment, the feature extraction unit 20,
30, a classification unit 3, a feature extraction parameter adjustment unit 21,
The numeral 31 is composed of, for example, a digital computer.
【0082】[0082]
【発明の効果】以上詳述したように本発明に係る請求項
1記載の信号パターン認識装置のための学習方法は、学
習可能な動作パラメータを有し、入力される信号パター
ンを、信号パターンの認識のための所定の特徴信号パタ
ーンに変換する特徴抽出手段と、上記特徴抽出手段によ
って変換された特徴信号パターンを、予め決められた複
数の類のうちの少なくとも1つに分類するための分類処
理を実行することにより、より尤度の高い少なくとも1
つの類を信号パターンの認識結果として出力する分類手
段とを備えた信号パターン認識装置のための学習方法で
あって、類属性が既知の信号パターンを上記特徴抽出手
段に入力したときに、上記特徴抽出手段から出力される
特徴信号パターンを、上記既知の信号パターンの類モデ
ルに近づけるように、上記分類手段の分類処理を変更す
ることなく、上記特徴抽出手段の学習可能な動作パラメ
ータを適応的に更新する。従って、上記特徴抽出手段の
動作パラメータを更新することによって、上記分類手段
が分類処理を実行する特徴信号パターン空間そのものを
適応させるため、上記特徴抽出手段の動作パラメータを
固定して発見的又は経験的知識を援用しながら上記分類
手段において類境界を個別に更新する従来の方法に比較
して、より高い効率で新しい動作条件への適応処理を実
行することができるとともに、従来例よりも少数の適応
用標本のみを用いて新しい動作条件下においても高い認
識精度を達成することができる。As described above in detail, the learning method for the signal pattern recognition apparatus according to the first aspect of the present invention has the operation parameter that can be learned, and the input signal pattern Feature extraction means for converting into a predetermined feature signal pattern for recognition, and classification processing for classifying the feature signal pattern converted by the feature extraction means into at least one of a plurality of predetermined classes. By performing at least one of the more likely
A learning method for a signal pattern recognition device, comprising: a classifying unit that outputs two classes as a recognition result of a signal pattern, wherein when the signal pattern having a known class attribute is input to the feature extracting unit, The learnable operation parameter of the feature extracting means is adaptively changed without changing the classification process of the classifying means so that the feature signal pattern output from the extracting means approaches the similar model of the known signal pattern. Update. Therefore, by updating the operation parameter of the feature extracting means, the classifying means adapts the feature signal pattern space itself on which the classification processing is performed. Therefore, the operation parameter of the feature extracting means is fixed to be heuristic or empirical. Compared with the conventional method of individually updating the class boundaries in the classification means while using the knowledge, it is possible to perform the adaptation processing to the new operating condition with higher efficiency, and the number of adaptations is smaller than that of the conventional example. High recognition accuracy can be achieved even under new operating conditions by using only the specimen.
【0083】また、請求項2記載の信号パターン認識装
置の学習方法は、請求項1記載の信号パターン認識装置
の学習方法において、上記特徴抽出手段から出力される
特徴信号パターンと、上記既知の信号パターンの類モデ
ルとの間の類似度に対応する損失が最小となるように、
上記特徴抽出手段の学習可能な動作パラメータを適応的
に更新する。これにより、より簡単な構成で従来例に比
較してより高い認識精度を達成することができる。The learning method of the signal pattern recognition device according to claim 2 is the learning method of the signal pattern recognition device according to claim 1, wherein the characteristic signal pattern output from the characteristic extraction means and the known signal are used. In order to minimize the loss corresponding to the similarity between the pattern and the model,
The learnable operation parameter of the feature extraction means is adaptively updated. As a result, higher recognition accuracy can be achieved with a simpler configuration as compared with the conventional example.
【0084】本発明に係る請求項3記載の信号パターン
認識装置の学習装置は、学習可能な動作パラメータを有
し、入力される信号パターンを、信号パターンの認識の
ための所定の特徴信号パターンに変換する特徴抽出手段
と、上記特徴抽出手段によって変換された特徴信号パタ
ーンを、予め決められた複数の類のうちの少なくとも1
つに分類するための分類処理を実行することにより、よ
り尤度の高い少なくとも1つの類を信号パターンの認識
結果として出力する分類手段とを備えた信号パターン認
識装置のための学習装置であって、類属性が既知の信号
パターンを上記特徴抽出手段に入力したときに、上記特
徴抽出手段から出力される特徴信号パターンを、上記既
知の信号パターンの類モデルに近づけるように、上記分
類手段の分類処理を変更することなく、上記特徴抽出手
段の学習可能な動作パラメータを適応的に更新する調整
手段を備えたことを特徴とする。従って、上記特徴抽出
手段の動作パラメータを更新することによって、上記分
類手段が分類処理を実行する特徴信号パターン空間その
ものを適応させるため、上記特徴抽出手段の動作パラメ
ータを固定して発見的又は経験的知識を援用しながら上
記分類手段において類境界を個別に更新する従来の方法
に比較して、より高い効率で新しい動作条件への適応処
理を実行することができるとともに、従来例よりも少数
の適応用標本のみを用いて新しい動作条件下においても
高い認識精度を達成することができる。According to a third aspect of the present invention, there is provided a learning device for a signal pattern recognition device, which has a learnable operation parameter and converts an input signal pattern into a predetermined characteristic signal pattern for recognition of the signal pattern. At least one of a plurality of predetermined classes of the characteristic extracting means for converting and the characteristic signal pattern converted by the characteristic extracting means.
A learning device for a signal pattern recognition device, comprising: a classifying unit that outputs at least one class having a higher likelihood as a recognition result of a signal pattern by executing a classification process for classifying into one. , When the signal pattern whose class attribute is known is input to the feature extraction means, the classification of the classification means is performed so that the feature signal pattern output from the feature extraction means approaches the class model of the known signal pattern. The present invention is characterized by comprising adjusting means for adaptively updating the learnable operation parameter of the feature extracting means without changing the processing. Therefore, by updating the operation parameter of the feature extracting means, the classifying means adapts the feature signal pattern space itself on which the classification processing is performed. Therefore, the operation parameter of the feature extracting means is fixed to be heuristic or empirical. Compared with the conventional method of individually updating the class boundaries in the classification means while using the knowledge, it is possible to perform the adaptation processing to the new operating condition with higher efficiency, and the number of adaptations is smaller than that of the conventional example. High recognition accuracy can be achieved even under new operating conditions by using only the specimen.
【0085】また、請求項4記載の信号パターン認識装
置の学習装置は、請求項3記載の信号パターン認識装置
の学習装置において、上記調整手段は、上記特徴抽出手
段から出力される特徴信号パターンと、上記既知の信号
パターンの類モデルとの間の類似度に対応する損失が最
小となるように、上記特徴抽出手段の学習可能な動作パ
ラメータを適応的に更新することを特徴とする。これに
より、より簡単な構成で従来例に比較してより高い認識
精度を達成することができる。A learning device for a signal pattern recognition device according to a fourth aspect of the present invention is the learning device for a signal pattern recognition device according to the third aspect, wherein the adjusting means is a feature signal pattern output from the feature extracting means. , The learning operation parameters of the feature extraction means are adaptively updated so that the loss corresponding to the similarity with the known model of the signal pattern is minimized. As a result, higher recognition accuracy can be achieved with a simpler configuration as compared with the conventional example.
【0086】本発明に係る請求項5記載の信号パターン
認識装置の学習方法は、学習可能な動作パラメータを有
し、入力される信号パターンを、信号パターンの認識の
ための所定の特徴信号パターンに変換する特徴抽出手段
と、上記特徴抽出手段によって変換された特徴信号パタ
ーンを、予め決められた複数の類のうちの少なくとも1
つに分類するための分類処理を実行することにより、よ
り尤度の高い少なくとも1つの類を信号パターンの認識
結果として出力する分類手段とを備えた信号パターン認
識装置のための学習方法であって、類属性が未知の信号
パターンを上記特徴抽出手段に入力したときに、上記未
知の信号パターンを、上記分類手段から出力される認識
結果である複数の類のうち最も高い尤度を有する最尤の
類モデルに近づけるように、上記分類手段の分類処理を
変更することなく、上記特徴抽出手段の学習可能な動作
パラメータを適応的に更新することを特徴とする。従っ
て、上記特徴抽出手段の動作パラメータを更新すること
によって、上記分類手段が分類処理を実行する特徴信号
パターン空間そのものを適応させるため、上記特徴抽出
手段の動作パラメータを固定して発見的又は経験的知識
を援用しながら上記分類手段において類境界を個別に更
新する従来の方法に比較して、より高い効率で新しい動
作条件への適応処理を実行することができるとともに、
従来例よりも少数の適応用標本のみを用いて新しい動作
条件下においても高い認識精度を達成することができ
る。According to a fifth aspect of the present invention, there is provided a learning method for a signal pattern recognizing device, which has a learnable operation parameter and converts an input signal pattern into a predetermined characteristic signal pattern for recognizing the signal pattern. At least one of a plurality of predetermined classes of the characteristic extracting means for converting and the characteristic signal pattern converted by the characteristic extracting means.
A learning method for a signal pattern recognition device, comprising: a classification unit that outputs at least one class having a higher likelihood as a recognition result of a signal pattern by executing a classification process for classifying into one. , When a signal pattern whose class attribute is unknown is input to the feature extracting means, the unknown signal pattern is the maximum likelihood having the highest likelihood among the plurality of classes which are the recognition results output from the classifying means. It is characterized in that the learnable operation parameter of the feature extracting means is adaptively updated without changing the classification process of the classifying means so as to approach the class model. Therefore, by updating the operation parameter of the feature extracting means, the classifying means adapts the feature signal pattern space itself on which the classification processing is performed. Therefore, the operation parameter of the feature extracting means is fixed to be heuristic or empirical. Compared with the conventional method of individually updating the class boundaries in the classification means while using the knowledge, it is possible to perform adaptation processing to new operating conditions with higher efficiency,
High recognition accuracy can be achieved even under new operating conditions by using only a small number of adaptation samples as compared with the conventional example.
【0087】また、請求項6記載の信号パターン認識装
置の学習方法は、請求項5記載の信号パターン認識装置
の学習方法において、上記特徴抽出手段から出力される
特徴信号パターンと、上記未知ではあるが最尤の信号パ
ターンの類モデルとの間の類似度に対応する損失が最小
となるように、上記特徴抽出手段の学習可能な動作パラ
メータを適応的に更新することを特徴とする。これによ
り、より簡単な構成で従来例に比較してより高い認識精
度を達成することができる。The learning method of the signal pattern recognition device according to a sixth aspect is the learning method of the signal pattern recognition device according to the fifth aspect, wherein the feature signal pattern output from the feature extraction means is the unknown. Is adaptively updated so as to minimize the loss corresponding to the similarity with the model of the maximum likelihood signal pattern. As a result, higher recognition accuracy can be achieved with a simpler configuration as compared with the conventional example.
【0088】本発明に係る請求項7記載の信号パターン
認識装置の学習装置は、学習可能な動作パラメータを有
し、入力される信号パターンを、信号パターンの認識の
ための所定の特徴信号パターンに変換する特徴抽出手段
と、上記特徴抽出手段によって変換された特徴信号パタ
ーンを、予め決められた複数の類のうちの少なくとも1
つに分類するための分類処理を実行することにより、よ
り尤度の高い少なくとも1つの類を信号パターンの認識
結果として出力する分類手段とを備えた信号パターン認
識装置のための学習装置であって、類属性が未知の信号
パターンを上記特徴抽出手段に入力したときに、上記未
知の信号パターンを、上記分類手段から出力される認識
結果である複数の類のうち最も高い尤度を有する最尤の
類モデルに近づけるように、上記分類手段の分類処理を
変更することなく、上記特徴抽出手段の学習可能な動作
パラメータを適応的に更新する調整手段を備えたことを
特徴とする。従って、上記特徴抽出手段の動作パラメー
タを更新することによって、上記分類手段が分類処理を
実行する特徴信号パターン空間そのものを適応させるた
め、上記特徴抽出手段の動作パラメータを固定して発見
的又は経験的知識を援用しながら上記分類手段において
類境界を個別に更新する従来の方法に比較して、より高
い効率で新しい動作条件への適応処理を実行することが
できるとともに、従来例よりも少数の適応用標本のみを
用いて新しい動作条件下においても高い認識精度を達成
することができる。According to a seventh aspect of the present invention, there is provided a learning device for a signal pattern recognizing device, which has a learnable operation parameter and converts an input signal pattern into a predetermined characteristic signal pattern for recognizing the signal pattern. At least one of a plurality of predetermined classes of the characteristic extracting means for converting and the characteristic signal pattern converted by the characteristic extracting means.
A learning device for a signal pattern recognition device, comprising: a classifying unit that outputs at least one class having a higher likelihood as a recognition result of a signal pattern by executing a classification process for classifying into one. , When a signal pattern whose class attribute is unknown is input to the feature extracting means, the unknown signal pattern is the maximum likelihood having the highest likelihood among the plurality of classes which are the recognition results output from the classifying means. It is characterized by comprising adjusting means for adaptively updating the learnable operation parameter of the feature extracting means without changing the classification process of the classifying means so as to approach the class model. Therefore, by updating the operation parameter of the feature extracting means, the classifying means adapts the feature signal pattern space itself on which the classification processing is performed. Therefore, the operation parameter of the feature extracting means is fixed to be heuristic or empirical. Compared with the conventional method of individually updating the class boundaries in the classification means while using the knowledge, it is possible to perform the adaptation processing to the new operating condition with higher efficiency, and the number of adaptations is smaller than that of the conventional example. High recognition accuracy can be achieved even under new operating conditions by using only the specimen.
【0089】また、請求項8記載の信号パターン認識装
置の学習装置は、請求項7記載の信号パターン認識装置
の学習装置において、上記調整手段は、上記特徴抽出手
段から出力される特徴信号パターンと、上記未知ではあ
るが最尤の信号パターンの類モデルとの間の類似度に対
応する損失が最小となるように、上記特徴抽出手段の学
習可能な動作パラメータを適応的に更新することを特徴
とする。これにより、より簡単な構成で従来例に比較し
てより高い認識精度を達成することができる。A learning device for a signal pattern recognition device according to an eighth aspect is the learning device for a signal pattern recognition device according to the seventh aspect, wherein the adjusting means is a feature signal pattern output from the feature extracting means. , A feature that the learned parameter of the feature extracting means is adaptively updated so that the loss corresponding to the similarity with the unknown but maximum likelihood signal pattern type model is minimized. And As a result, higher recognition accuracy can be achieved with a simpler configuration as compared with the conventional example.
【図1】 本発明に係る第1の実施例である信号パター
ン認識装置のブロック図である。FIG. 1 is a block diagram of a signal pattern recognition device according to a first embodiment of the present invention.
【図2】 本発明に係る第2の実施例である信号パター
ン認識装置のブロック図である。FIG. 2 is a block diagram of a signal pattern recognition device according to a second embodiment of the present invention.
【図3】 本発明に係る第1と第2の実施例の信号パタ
ーン認識装置を用いた応用例を示すブロック図である。FIG. 3 is a block diagram showing an application example using the signal pattern recognition device of the first and second embodiments according to the present invention.
【図4】 従来例の信号パターン認識装置のブロック図
である。FIG. 4 is a block diagram of a conventional signal pattern recognition device.
1…信号データメモリ、 3…分類部、 5,6…信号パターン認識結果データメモリ、 20,30…特徴抽出部、 21,31…特徴抽出パラメータ調整部、 7,22…類モデルメモリ、 41…マイクロホン、 42…A/D変換器、 43…音声認識用信号パターン認識装置。 DESCRIPTION OF SYMBOLS 1 ... Signal data memory, 3 ... Classification part, 5, 6 ... Signal pattern recognition result data memory, 20, 30 ... Feature extraction part, 21, 31 ... Feature extraction parameter adjustment part, 7, 22 ... Model memory, 41 ... Microphone, 42 ... A / D converter, 43 ... Speech recognition signal pattern recognition device.
【手続補正書】[Procedure amendment]
【提出日】平成7年9月14日[Submission date] September 14, 1995
【手続補正1】[Procedure Amendment 1]
【補正対象書類名】明細書[Document name to be amended] Statement
【補正対象項目名】0025[Name of item to be corrected] 0025
【補正方法】変更[Correction method] Change
【補正内容】[Correction content]
【0025】[0025]
【実施例】以下、図面を参照して本発明に係る実施例に
ついて説明する。 <第1の実施例>図1に本発明に係る第1の実施例の信
号パターン認識装置を示す。この第1の実施例の信号パ
ターン認識装置は、学習可能な動作パラメータを有し、
入力される信号パターンを、信号パターンの認識のため
の所定の特徴信号パターンに変換する特徴抽出部20
と、特徴抽出部20によって変換された特徴信号パター
ンを、予め決められて類モデルメモリ22に格納された
複数の類モデルに対応する複数の類のうちの少なくとも
1つに分類するための分類処理を実行することにより、
より尤度の高い少なくとも1つの類を信号パターンの認
識結果として出力する従来例の分類部3とを備え、類属
性が既知の信号パターンを特徴抽出部20に入力したと
きに、類モデルメモリ22に格納されている類モデルを
参照して、特徴抽出部20から出力される特徴信号パタ
ーンを、上記既知の信号パターンの類モデルに近づける
ように、分類部3の分類処理を変更することなく、特徴
抽出部20の学習可能な動作パラメータを適応的に更新
する特徴抽出パラメータ調整部21をさらに備えたこと
を特徴とする。ここで、特徴抽出パラメータ調整部21
は、好ましくは、特徴抽出部20から出力される特徴信
号パターンと、上記既知の信号パターンの類モデルとの
間の類似度に対応する損失が最小となるように、上記特
徴抽出部20の学習可能な動作パラメータを適応的に更
新する。Embodiments of the present invention will be described below with reference to the drawings. <First Embodiment> FIG. 1 shows a signal pattern recognition apparatus according to the first embodiment of the present invention. The signal pattern recognition device according to the first embodiment has a learnable operation parameter,
A feature extraction unit 20 that converts an input signal pattern into a predetermined feature signal pattern for signal pattern recognition.
And a classification process for classifying the feature signal pattern converted by the feature extraction unit 20 into at least one of a plurality of classes corresponding to a plurality of class models determined in advance and stored in the class model memory 22. By executing
The classification unit 3 of the conventional example that outputs at least one class with higher likelihood as a recognition result of a signal pattern, and when a signal pattern with a known class attribute is input to the feature extraction unit 20, the class model memory 22 Without changing the classification process of the classification unit 3 so that the characteristic signal pattern output from the characteristic extraction unit 20 can be brought closer to the similar model of the known signal pattern by referring to the similar model stored in A feature extraction parameter adjusting unit 21 that adaptively updates the learnable operation parameter of the feature extracting unit 20 is featured. Here, the feature extraction parameter adjustment unit 21
Is preferably learned by the feature extraction unit 20 so that the loss corresponding to the similarity between the feature signal pattern output from the feature extraction unit 20 and the known model of the signal pattern is minimized. Adaptively update possible operating parameters.
【手続補正2】[Procedure Amendment 2]
【補正対象書類名】明細書[Document name to be amended] Statement
【補正対象項目名】0040[Correction target item name] 0040
【補正方法】変更[Correction method] Change
【補正内容】[Correction content]
【0040】ここで、T(r)はこの参照信号パターン
であるベクトル系列Rの長さである。信号パターン認識
装置を学習するために用いられるGPD法では、分類結
果を反映する損失関数と上記と同様の判別関数との他に
誤分類測度が用いられる。第1の実施例のSAFE法で
はこれらは全て同一の関数として定義する。上記のCk
の類似度には任意の合理的な距離又はその関数を用いる
ことができるが、特に、参照信号パターンのベクトル系
列Rと特徴信号パターンY1との間で、動的計画法に基
づく非線形時間軸伸縮に用いられる伸縮整合範囲内の経
路θによって対応づけられるRとY1との特徴ベクトル
間の自乗ユークリッド距離を、この経路に沿って累積し
て得られる累積自乗ユークリッド距離Dθを用いて次の
数6のように与えることができる。Here, T (r) is the length of the vector series R which is the reference signal pattern. In the GPD method used for learning the signal pattern recognition device, a misclassification measure is used in addition to the loss function reflecting the classification result and the discrimination function similar to the above. In the SAFE method of the first embodiment, these are all defined as the same function. C k above
Any reasonable distance or a function thereof can be used for the similarity of, but in particular, between the vector sequence R of the reference signal pattern and the characteristic signal pattern Y 1 , a nonlinear time axis based on dynamic programming is used. Using the cumulative squared Euclidean distance D θ obtained by accumulating the squared Euclidean distances between the feature vectors of R and Y 1 associated with the route θ within the expansion / contraction matching range used for expansion / contraction, Can be given as in Equation 6.
【手続補正3】[Procedure 3]
【補正対象書類名】明細書[Document name to be amended] Statement
【補正対象項目名】0076[Correction target item name] 0076
【補正方法】変更[Correction method] Change
【補正内容】[Correction content]
【0076】<第2の実施例>図2に本発明に係る第2
の実施例の信号パターン認識装置のブロック図を示す。
この第2の実施例においては、上記USAFE法を用い
る。この第2の実施例の信号パターン認識装置は、学習
可能な動作パラメータを有し、入力される信号パターン
を、信号パターンの認識のための所定の特徴信号パター
ンに変換する特徴抽出部30と、特徴抽出部30によっ
て変換された特徴信号パターンを、予め決められて類モ
デルメモリ22に格納された複数の類モデルに対応する
複数の類のうちの少なくとも1つに分類するための分類
処理を実行することにより、より尤度の高い少なくとも
1つの類を信号パターンの認識結果として出力する従来
例の分類部3とを備え、複数の類モデルが予め格納され
た類モデルメモリ22を参照して、類属性が未知の信号
パターンを特徴抽出部30に入力したときに、上記未知
の信号パターンを、分類部3から出力される認識結果で
ある複数の類のうち最も高い尤度を有する最尤の類モデ
ル(これら複数の類モデルは類モデルメモリ22に格納
されている。)に近づけるように、分類部3の分類処理
を変更することなく、特徴抽出部30の学習可能な動作
パラメータを適応的に更新する特徴抽出パラメータ調整
部31をさらに備えたことを特徴とする。ここで、特
に、特徴抽出パラメータ調整部31は、好ましくは、特
徴抽出部30から出力される特徴信号パターンと、上記
未知ではあるが最尤の信号パターンの類モデルとの間の
類似度に対応する損失が最小となるように、特徴抽出部
30の学習可能な動作パラメータを適応的に更新するこ
とを特徴とする。以下、第1の実施例との相違点につい
て説明する。<Second Embodiment> FIG. 2 shows a second embodiment of the present invention.
FIG. 3 is a block diagram of a signal pattern recognition device according to the embodiment.
In the second embodiment, the USAFE method is used. The signal pattern recognition apparatus according to the second embodiment has a feature extraction unit 30 that has an operation parameter that can be learned and that converts an input signal pattern into a predetermined feature signal pattern for signal pattern recognition. Performs a classification process for classifying the characteristic signal pattern converted by the characteristic extraction unit 30 into at least one of a plurality of classes corresponding to a plurality of class models stored in the class model memory 22 in advance. By doing so, at least one class having a higher likelihood is provided as the recognition result of the signal pattern, and the classification unit 3 of the conventional example is provided, and the class model memory 22 in which a plurality of class models are stored in advance is referred to When a signal pattern whose class attribute is unknown is input to the feature extraction unit 30, the unknown signal pattern is selected from among the plurality of classes which are the recognition results output from the classification unit 3. Without changing the classification process of the classification unit 3, the feature extraction unit 30 does not change so as to approach the maximum likelihood class model having a high likelihood (the plurality of class models are stored in the class model memory 22). A feature extraction parameter adjusting unit 31 that adaptively updates the learnable operation parameter is further provided. Here, in particular, the feature extraction parameter adjustment unit 31 preferably corresponds to the similarity between the feature signal pattern output from the feature extraction unit 30 and the unknown but maximum likelihood signal pattern type model. The feature is that the learnable operation parameter of the feature extraction unit 30 is adaptively updated so as to minimize the loss. Hereinafter, differences from the first embodiment will be described.
【手続補正4】[Procedure amendment 4]
【補正対象書類名】明細書[Document name to be amended] Statement
【補正対象項目名】0078[Correction target item name] 0078
【補正方法】変更[Correction method] Change
【補正内容】[Correction content]
【0078】すなわち、特徴抽出パラメータ調整部31
は、未知の入力信号データx1から変換された特徴信号
パターンY1が、分類部3から出力される複数の類のモ
デルのうちの最尤類Cmのモデルωm(Λ)の特徴信号パ
ターンに近づくように、特徴抽出部30の特徴抽出関数
f(x;Φ)を決定する動作パラメータΦを更新する。
具体的には、最尤の類Cmのモデルωm(Λ)と、未知の
入力信号パターンから変換された特徴信号パターンY1
との間の類似度を、上記数3で表される損失lm(Y1;
Λ)として新たに定義し、この損失ができるだけ小さく
なるように動作パラメータΦを更新する。なお、複数の
類のモデルは類モデルメモリ22に格納されている。That is, the feature extraction parameter adjusting unit 31
Is the characteristic signal pattern Y 1 converted from the unknown input signal data x 1 is the characteristic signal of the model ω m (Λ) of the maximum likelihood class C m of the plurality of models output from the classification unit 3. The operation parameter Φ that determines the feature extraction function f (x; Φ) of the feature extraction unit 30 is updated so as to approach the pattern.
Specifically, the model ω m (Λ) of the maximum likelihood class C m and the characteristic signal pattern Y 1 converted from the unknown input signal pattern
And the similarity l m (Y 1 ;
Λ) is newly defined, and the operating parameter Φ is updated so that this loss becomes as small as possible. The models of a plurality of classes are stored in the model memory 22.
Claims (8)
される信号パターンを、信号パターンの認識のための所
定の特徴信号パターンに変換する特徴抽出手段と、 上記特徴抽出手段によって変換された特徴信号パターン
を、予め決められた複数の類のうちの少なくとも1つに
分類するための分類処理を実行することにより、より尤
度の高い少なくとも1つの類を信号パターンの認識結果
として出力する分類手段とを備えた信号パターン認識装
置のための学習方法であって、 類属性が既知の信号パターンを上記特徴抽出手段に入力
したときに、上記特徴抽出手段から出力される特徴信号
パターンを、上記既知の信号パターンの類モデルに近づ
けるように、上記分類手段の分類処理を変更することな
く、上記特徴抽出手段の学習可能な動作パラメータを適
応的に更新することを特徴とする信号パターン認識装置
の学習方法。1. A feature extraction unit that has an operation parameter that can be learned and that transforms an input signal pattern into a predetermined feature signal pattern for recognition of the signal pattern, and a feature transformed by the feature extraction unit. A classifying unit that outputs at least one class having a higher likelihood as a recognition result of the signal pattern by performing a classification process for classifying the signal pattern into at least one of a plurality of predetermined classes. A learning method for a signal pattern recognition device comprising: a characteristic signal pattern output from the feature extracting means when a signal pattern having a known attribute is input to the feature extracting means. Of the feature pattern extracting means without changing the classification process of the classifying means so as to approximate the model of the signal pattern of Learning signal pattern recognition device and updates the data adaptively.
号パターンと、上記既知の信号パターンの類モデルとの
間の類似度に対応する損失が最小となるように、上記特
徴抽出手段の学習可能な動作パラメータを適応的に更新
することを特徴とする請求項1記載の信号パターン認識
装置の学習方法。2. The feature extraction means is capable of learning so that the loss corresponding to the similarity between the feature signal pattern output from the feature extraction means and the known model of the signal pattern is minimized. The method for learning a signal pattern recognition device according to claim 1, wherein various operating parameters are adaptively updated.
される信号パターンを、信号パターンの認識のための所
定の特徴信号パターンに変換する特徴抽出手段と、 上記特徴抽出手段によって変換された特徴信号パターン
を、予め決められた複数の類のうちの少なくとも1つに
分類するための分類処理を実行することにより、より尤
度の高い少なくとも1つの類を信号パターンの認識結果
として出力する分類手段とを備えた信号パターン認識装
置のための学習装置であって、 類属性が既知の信号パターンを上記特徴抽出手段に入力
したときに、上記特徴抽出手段から出力される特徴信号
パターンを、上記既知の信号パターンの類モデルに近づ
けるように、上記分類手段の分類処理を変更することな
く、上記特徴抽出手段の学習可能な動作パラメータを適
応的に更新する調整手段を備えたことを特徴とする信号
パターン認識装置の学習装置。3. A feature extraction unit that has an operation parameter that can be learned and that converts an input signal pattern into a predetermined feature signal pattern for recognition of the signal pattern, and a feature converted by the feature extraction unit. A classifying unit that outputs at least one class having a higher likelihood as a recognition result of the signal pattern by performing a classification process for classifying the signal pattern into at least one of a plurality of predetermined classes. A learning device for a signal pattern recognition device comprising: a characteristic signal pattern output from the feature extracting means when a signal pattern having a known attribute is input to the feature extracting means. Of the feature pattern extracting means without changing the classification process of the classifying means so as to approximate the model of the signal pattern of Learning device of the signal pattern recognition apparatus characterized by comprising an adjusting means for updating the data adaptively.
出力される特徴信号パターンと、上記既知の信号パター
ンの類モデルとの間の類似度に対応する損失が最小とな
るように、上記特徴抽出手段の学習可能な動作パラメー
タを適応的に更新することを特徴とする請求項3記載の
信号パターン認識装置の学習装置。4. The adjusting means is configured to minimize the loss corresponding to the similarity between the characteristic signal pattern output from the characteristic extracting means and the similar model of the known signal pattern. The learning device for a signal pattern recognition device according to claim 3, wherein the learnable operation parameter of the extraction means is adaptively updated.
される信号パターンを、信号パターンの認識のための所
定の特徴信号パターンに変換する特徴抽出手段と、 上記特徴抽出手段によって変換された特徴信号パターン
を、予め決められた複数の類のうちの少なくとも1つに
分類するための分類処理を実行することにより、より尤
度の高い少なくとも1つの類を信号パターンの認識結果
として出力する分類手段とを備えた信号パターン認識装
置のための学習方法であって、 類属性が未知の信号パターンを上記特徴抽出手段に入力
したときに、上記未知の信号パターンを、上記分類手段
から出力される認識結果である複数の類のうち最も高い
尤度を有する最尤の類モデルに近づけるように、上記分
類手段の分類処理を変更することなく、上記特徴抽出手
段の学習可能な動作パラメータを適応的に更新すること
を特徴とする信号パターン認識装置の学習方法。5. A feature extraction unit that has an operation parameter that can be learned and that converts an input signal pattern into a predetermined feature signal pattern for recognizing the signal pattern, and a feature converted by the feature extraction unit. A classifying unit that outputs at least one class having a higher likelihood as a recognition result of the signal pattern by performing a classification process for classifying the signal pattern into at least one of a plurality of predetermined classes. A learning method for a signal pattern recognition device comprising: a recognition pattern output from the classification means when the unknown signal pattern is input to the feature extraction means. Without changing the classification processing of the above classification means, the above-mentioned special processing is performed so as to approach the maximum likelihood class model having the highest likelihood among the resulting plural classes. Learning signal pattern recognition apparatus characterized by updating the learning possible operating parameters of the extraction means adaptively.
号パターンと、上記未知ではあるが最尤の信号パターン
の類モデルとの間の類似度に対応する損失が最小となる
ように、上記特徴抽出手段の学習可能な動作パラメータ
を適応的に更新することを特徴とする請求項5記載の信
号パターン認識装置の学習方法。6. The feature so that the loss corresponding to the similarity between the feature signal pattern output from the feature extracting means and the unknown but maximum likelihood signal pattern type model is minimized. 6. The learning method for a signal pattern recognition device according to claim 5, wherein the learnable operation parameter of the extraction means is adaptively updated.
される信号パターンを、信号パターンの認識のための所
定の特徴信号パターンに変換する特徴抽出手段と、 上記特徴抽出手段によって変換された特徴信号パターン
を、予め決められた複数の類のうちの少なくとも1つに
分類するための分類処理を実行することにより、より尤
度の高い少なくとも1つの類を信号パターンの認識結果
として出力する分類手段とを備えた信号パターン認識装
置のための学習装置であって、 類属性が未知の信号パターンを上記特徴抽出手段に入力
したときに、上記未知の信号パターンを、上記分類手段
から出力される認識結果である複数の類のうち最も高い
尤度を有する最尤の類モデルに近づけるように、上記分
類手段の分類処理を変更することなく、上記特徴抽出手
段の学習可能な動作パラメータを適応的に更新する調整
手段を備えたことを特徴とする信号パターン認識装置の
学習装置。7. A feature extraction unit having a learnable operation parameter and converting an input signal pattern into a predetermined feature signal pattern for recognition of the signal pattern, and a feature converted by the feature extraction unit. A classifying unit that outputs at least one class having a higher likelihood as a recognition result of the signal pattern by performing a classification process for classifying the signal pattern into at least one of a plurality of predetermined classes. A learning device for a signal pattern recognition device comprising: a recognition pattern output from the classification means when the unknown signal pattern is input to the feature extraction means. Without changing the classification processing of the above classification means, the above-mentioned special processing is performed so as to approach the maximum likelihood class model having the highest likelihood among the resulting plural classes. Learning device of the signal pattern recognition apparatus characterized by a learnable operating parameters of the extraction means provided with adjustment means for adaptively updated.
出力される特徴信号パターンと、上記未知ではあるが最
尤の信号パターンの類モデルとの間の類似度に対応する
損失が最小となるように、上記特徴抽出手段の学習可能
な動作パラメータを適応的に更新することを特徴とする
請求項7記載の信号パターン認識装置の学習装置。8. The adjusting means minimizes the loss corresponding to the similarity between the characteristic signal pattern output from the characteristic extracting means and the unknown but maximum likelihood signal pattern type model. 8. The learning device for a signal pattern recognition device according to claim 7, wherein the learnable operation parameter of the feature extracting means is adaptively updated.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7101906A JPH08297495A (en) | 1995-04-26 | 1995-04-26 | Method and device for learning signal pattern recognization device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7101906A JPH08297495A (en) | 1995-04-26 | 1995-04-26 | Method and device for learning signal pattern recognization device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08297495A true JPH08297495A (en) | 1996-11-12 |
Family
ID=14312956
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7101906A Pending JPH08297495A (en) | 1995-04-26 | 1995-04-26 | Method and device for learning signal pattern recognization device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08297495A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003317083A (en) * | 2002-04-25 | 2003-11-07 | Dainippon Screen Mfg Co Ltd | Image classifying method, program, and image classifying device |
JP2011090627A (en) * | 2009-10-26 | 2011-05-06 | Panasonic Electric Works Co Ltd | Signal identification method and signal identification apparatus |
WO2020059084A1 (en) * | 2018-09-20 | 2020-03-26 | 日本電気株式会社 | Learning device and pattern recognition device |
JP2020060838A (en) * | 2018-10-05 | 2020-04-16 | 株式会社デンソーアイティーラボラトリ | Learning method and learning system |
CN113971773A (en) * | 2020-07-24 | 2022-01-25 | 阿里巴巴集团控股有限公司 | Data processing method and system |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04219798A (en) * | 1990-12-19 | 1992-08-10 | Fujitsu Ltd | Speaker adaptive voice recognizing method and device |
JPH05134697A (en) * | 1991-11-14 | 1993-05-28 | Oki Electric Ind Co Ltd | Voice recognizing system |
-
1995
- 1995-04-26 JP JP7101906A patent/JPH08297495A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04219798A (en) * | 1990-12-19 | 1992-08-10 | Fujitsu Ltd | Speaker adaptive voice recognizing method and device |
JPH05134697A (en) * | 1991-11-14 | 1993-05-28 | Oki Electric Ind Co Ltd | Voice recognizing system |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003317083A (en) * | 2002-04-25 | 2003-11-07 | Dainippon Screen Mfg Co Ltd | Image classifying method, program, and image classifying device |
JP2011090627A (en) * | 2009-10-26 | 2011-05-06 | Panasonic Electric Works Co Ltd | Signal identification method and signal identification apparatus |
WO2020059084A1 (en) * | 2018-09-20 | 2020-03-26 | 日本電気株式会社 | Learning device and pattern recognition device |
JPWO2020059084A1 (en) * | 2018-09-20 | 2021-08-30 | 日本電気株式会社 | Learning device and pattern recognition device |
US11948554B2 (en) | 2018-09-20 | 2024-04-02 | Nec Corporation | Learning device and pattern recognition device |
JP2020060838A (en) * | 2018-10-05 | 2020-04-16 | 株式会社デンソーアイティーラボラトリ | Learning method and learning system |
CN113971773A (en) * | 2020-07-24 | 2022-01-25 | 阿里巴巴集团控股有限公司 | Data processing method and system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108447490B (en) | Voiceprint recognition method and device based on memorability bottleneck characteristics | |
JP2795058B2 (en) | Time series signal processing device | |
US11264044B2 (en) | Acoustic model training method, speech recognition method, acoustic model training apparatus, speech recognition apparatus, acoustic model training program, and speech recognition program | |
US5790754A (en) | Speech recognition apparatus for consumer electronic applications | |
JP4531166B2 (en) | Speech recognition method using reliability measure evaluation | |
EP0617827B1 (en) | Composite expert | |
CN105206270A (en) | Isolated digit speech recognition classification system and method combining principal component analysis (PCA) with restricted Boltzmann machine (RBM) | |
WO1995034063A1 (en) | Method of partitioning a sequence of data frames | |
JP5060006B2 (en) | Automatic relearning of speech recognition systems | |
CN112863549A (en) | Voice emotion recognition method and device based on meta-multitask learning | |
CN111259189B (en) | Music classification method and device | |
CN117672176A (en) | Rereading controllable voice synthesis method and device based on voice self-supervision learning characterization | |
JP3014177B2 (en) | Speaker adaptive speech recognition device | |
KR102241364B1 (en) | Apparatus and method for determining user stress using speech signal | |
EP1771841B1 (en) | Method for generating and using a vector codebook, method and device for compressing data, and distributed speech recognition system | |
JPH08297495A (en) | Method and device for learning signal pattern recognization device | |
Chetouani et al. | Neural predictive coding for speech discriminant feature extraction: The DFE-NPC. | |
CN112885378A (en) | Speech emotion recognition method and device and storage medium | |
Tóth et al. | Training HMM/ANN hybrid speech recognizers by probabilistic sampling | |
JPH10509526A (en) | Decision Tree Classifier Designed Using Hidden Markov Model | |
CN114898776A (en) | Voice emotion recognition method of multi-scale feature combined multi-task CNN decision tree | |
JPH0895592A (en) | Pattern recognition method | |
CN116189656A (en) | Speech translation method, speech translation device, equipment and storage medium | |
JP2000200098A (en) | Device and method for study, and device and method for recognition | |
Shinozaki et al. | Automated development of dnn based spoken language systems using evolutionary algorithms |