JPS6175982A - Pattern recognizer - Google Patents

Pattern recognizer

Info

Publication number
JPS6175982A
JPS6175982A JP59198031A JP19803184A JPS6175982A JP S6175982 A JPS6175982 A JP S6175982A JP 59198031 A JP59198031 A JP 59198031A JP 19803184 A JP19803184 A JP 19803184A JP S6175982 A JPS6175982 A JP S6175982A
Authority
JP
Japan
Prior art keywords
pattern
recognition
standard
distance
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59198031A
Other languages
Japanese (ja)
Inventor
Toru Shimizu
透 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP59198031A priority Critical patent/JPS6175982A/en
Publication of JPS6175982A publication Critical patent/JPS6175982A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To prevent a decrease of misrecognition due to mixture of similar patterns without averaging a standard pattern, by applying a detailed discrimination method among the results of recognition and the 2nd and lower candidate groups. CONSTITUTION:The feature vector trains of each pattern are stored to a standard pattern memory part 4 and an input pattern memory part 5. Then an input pattern A and a standard pattern B<1> are sent successively to a matching part 6 in 1-P times per l for calculation of distance. Meanwhile (k) units of candidates of recognition are selected by a selection part 7 based on the difference between DP matching distances D (A, B<1>). Then the information on an optimum DP path is stored. When the selection is over with all of P units of standard patterns, a discrimination feature part between two patterns B<x> and B<y> of the lower k-th and (k-1)-th places among the candidates of recognition is sent to a weighting distance calculator 9 from a weight coefficient memory part 8 according to the prescribed order. At the same time, the DP optimum path information on a pattern B<x> and the pattern A is sent to the calculator 9 from the selection part 7 respectively. Thus a weighting distance is calculated.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、音声や文字の如きパタンを認識するシステム
の改良に関する。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to an improvement in a system for recognizing patterns such as speech and characters.

(従来技術とその問題点) 近年、音声2手書文字等、数々の実用的なパタン認識シ
ステムが発売され、産業界で利用されている。これらの
認識システムの大部分はパタンマ、チング法を原理とし
て動作するものである。Tなわち、システム使用tこ先
だち使用者の音声や手書文字等のデータがシステムlこ
入力され、そのパタンか標準パタンとして登録される。
(Prior Art and its Problems) In recent years, a number of practical pattern recognition systems, such as phonetic and handwritten characters, have been released and are being used in industry. Most of these recognition systems operate based on the patterning method. That is, data such as the user's voice and handwritten characters are input into the system when the system is first used, and the pattern is registered as a standard pattern.

その後、実際をこ認識されるべきパタン(入力パタンと
祢する)が入力されると、前記標準パタン群との比較が
行われ、入力パタンと各標準パタンとの間の距離が計算
される。これらの距m4比較することによって、この入
力パタンlこ最も近い標準パタンか選定される。その結
果として、入力パタンはこの標準パタンと同一であると
決定される。
Thereafter, when a pattern to be actually recognized (referred to as an input pattern) is input, a comparison with the standard pattern group is performed, and the distance between the input pattern and each standard pattern is calculated. By comparing these distances m4, this input pattern l is selected as the closest standard pattern. As a result, the input pattern is determined to be identical to this standard pattern.

以上述べたパタンマツチング法は原理が簡単で、しかも
ある程度高い認識率を示すことが実証されている。しか
し、上記、パタンマツチング法においても「和歌山」と
「岡山」等、類似した単語音声、「キ」と「ギ」、「リ
ヤ」と「ミヤ」等類似している単音節音声等は、認識が
困難で、誤りが多い現状である。また、文字認識におい
でも「7」と[′ケ」と「り」等の類似した文字におい
ても同様の問題がある〇 その対策として、特願昭54−88909号明細書に示
されるように、前もって類似した標準パタンの類似部分
を平均化しておく方法が実業されている。しかしこの方
法では、標準パタンの一部分を平均化するため、パタン
かなまり認#il!率が低下するという問題が残されて
いた。
The pattern matching method described above has a simple principle and has been proven to have a relatively high recognition rate. However, even in the pattern matching method described above, similar word sounds such as "Wakayama" and "Okayama", similar monosyllabic sounds such as "ki" and "gi", "riya" and "miya", etc. The current situation is that recognition is difficult and there are many errors. In addition, in character recognition, there is a similar problem with similar characters such as "7", "ke", "ri", etc. As a countermeasure, as shown in the specification of Japanese Patent Application No. 1988-88909, A method has been put into practice in which similar parts of similar standard patterns are averaged in advance. However, this method averages a part of the standard pattern, so the pattern may vary considerably! The problem of declining rates remained.

(発明の目的) 本発明は、このような従来の問題点ζこ着目してなされ
たものである。つまり、認識結果と第2位以下の候補群
の中で、後述のような詳細識別法を採用すること(こよ
り、標準パタンを平均化せずに、類似したパタンが存在
する為tこ起因する認識率の低下の改善を、はかること
のできるパタン認識システムを提供するものである。
(Object of the Invention) The present invention has been made by focusing on these conventional problems. In other words, among the recognition results and the second and lower candidate groups, a detailed classification method as described below is adopted (this is because similar patterns exist, rather than averaging the standard patterns). The present invention provides a pattern recognition system that can improve the reduction in recognition rate.

(発明の構成) 本発明によれば、入力データを分析し特徴バタ7を作る
分析部と、前記分析部より供給されるパタンを標準パタ
ンとして記憶する標準パタン記憶部と、前記分析部より
供給される入力パタンを記憶する入力パタン記憶部と、
入力パタンと標準パタンとの比較処理を行なうマツチン
グ部と、前記比較結果に基づいて上位認識侯補群を抽出
する選択部と、標準パタン間の弁別特徴部に重みをかけ
て距離を計算する重みづけ距離計3を部と、前記重みづ
け距l!1を基Iこ前記認識候補群を選別する識別部を
有する・ 丁なわち本発明は、パタン認識システムにおいて、まず
複数の認識候補を抽出して、その後重みづけ距離を基に
詳細識別を行なうことにより、より信頼度の高い認識結
果を得るものである。
(Structure of the Invention) According to the present invention, there is provided an analysis unit that analyzes input data and creates feature patterns 7, a standard pattern storage unit that stores patterns supplied from the analysis unit as standard patterns, and a standard pattern storage unit that stores patterns supplied from the analysis unit as standard patterns; an input pattern storage unit that stores an input pattern to be input;
a matching unit that performs a comparison process between an input pattern and a standard pattern; a selection unit that extracts a top recognition complement group based on the comparison result; and a weighted distance that calculates a distance by weighting the discriminative features between the standard patterns. 3 in total, and the weighted distance l! According to the present invention, in a pattern recognition system, a plurality of recognition candidates are first extracted, and then detailed identification is performed based on weighted distances. By doing so, more reliable recognition results can be obtained.

(発明の原理) ここでは、不発明の原理を、単語音声パタンの認識を例
にあげて説明する。しかしながら本発明の対象は音声認
識のみにとどまるもので)まない。
(Principle of the Invention) Here, the principle of non-invention will be explained using recognition of word sound patterns as an example. However, the object of the present invention is not limited to voice recognition.

入力パタン「OKAYAMAJの認識を行なう際、標準
パタンfこl’−OKAYAMAJ 、l’−WAKA
Y−A、MAJ  、 [OKUYAMAJという類似
したパタンか含まれているとする。Cの場合、入力パタ
ン「OKAYAMAJと3つの標準パタンとの距離は、
他の標準パタンとの距離よりも、小さいが、正しい認識
結果の「OK A Y A M A Jとの距離が最小
となっていると(ま限らf(い。つまり誤認識している
可能性が高い。これは、前記特願昭54−88909号
明細書に例があげられているように、l KA lとI
KUI 、+01とIWAIの違いが明確に存在してい
る1こもかかわらす、残余の部分の特徴の類似度fこ影
響されて、l KA lとIKUI。
When recognizing the input pattern "OKAYAMAJ," the standard pattern fcol'-OKAYAMAJ, l'-WAKA is used.
Assume that similar patterns such as Y-A, MAJ, and [OKUYAMAJ are included. In the case of C, the distance between the input pattern "OKAYAMAJ" and the three standard patterns is
Although it is smaller than the distance from other standard patterns, if the distance from the correct recognition result "OK A Y A M A J" is the minimum (limit f (i.e., there is a possibility of misrecognition). This is because l KA l and I
Despite the fact that there is a clear difference between KUI, +01 and IWAI, the similarity of the features in the remaining parts is affected by KA and IKUI.

+(JlとIWAl等の弁別的特徴がマスクされてしま
うからである。
+(This is because the discriminative features such as Jl and IWAl are masked.

ゆえ(こ、認識結果を距tafJs最小のものと決定せ
ずに、距蝋の小さいもののいくつかを認識候補として残
しておき、以下(こ述べるような詳細識別を行なって、
最終的に一つの認識結果を得る訳である。今、入力パタ
ン[OKUYAMAJの認識候補が、距離の小さい順に
1位1’−OKUYAMAJ 、2位1’−WAKAY
AMAJ 、 3位「OKAYAMAJであるとする。
Therefore, instead of determining the recognition result as the one with the smallest distance tafJs, we leave some of the ones with small distances as recognition candidates, and perform detailed identification as described below.
In the end, one recognition result is obtained. Now, the recognition candidates for the input pattern [OKUYAMAJ are, in descending order of distance, 1'-OKUYAMAJ, 2nd place 1'-WAKAY
AMAJ, 3rd place: “Suppose it is OKAYAMAJ.

ます、2位と3位の識別を行ない、次にその結果と1位
の識別を行なって、認識結果を得ることにする。前もっ
てこれら標準パタン間の弁別特徴部つまり、異なる音素
101とIWAI。
First, the 2nd and 3rd place will be identified, and then the first place will be identified from that result to obtain the recognition result. Discriminative features between these standard patterns in advance, ie different phonemes 101 and IWAI.

IUIとIAIの位置を、あらかじめ求めておく。Find the positions of IUI and IAI in advance.

そして、その弁別特徴部に重みをかけて、再び入力パタ
ンと距離計算を行ない、弁別特徴部の強調された距離を
用いて判別Tるのである。つまり、パタンの類似してい
る部分lKAYAMAlによって、マスクされていた標
準パタンの弁別特徴部IWAIと101のそれぞれ入力
パタンの101に対する距離を強調して識別し、新たな
認識結果を得るのである。ここで、1WAlと101の
距離と101と101の距離では、+0+と101の距
離のほうが小さいので、強調された結果、全体の重みづ
けされた距離は入力パタンの「OKAYAMAJと標準
パタンのl””OKAYAMAJの組のほうが小さくな
り、正しい順位、2位1”’OKAYAMAJ3位1’
−WAKAYAMAJを得ることができる。
Then, weighting is applied to the discriminative feature, distance calculation is performed again with the input pattern, and discrimination T is performed using the emphasized distance of the discriminative feature. In other words, the distances of the masked discriminative features IWAI and 101 of the standard pattern from the input pattern 101 are emphasized and identified by the similar portion lKAYAMA1 of the pattern, and a new recognition result is obtained. Here, between the distance between 1WAl and 101 and the distance between 101 and 101, the distance between +0+ and 101 is smaller, so as a result of emphasis, the overall weighted distance is equal to "OKAYAMAJ" of the input pattern and "l" of the standard pattern. ``OKAYAMAJ's group is smaller, correct ranking, 2nd place 1'''OKAYAMAJ 3rd place 1''
-WAKAYAMAJ can be obtained.

次に1位1’−OKUYAMAJと新しい2位「Q−K
AYAMAJζこついてもIUIとl A、 lのテS
分を強調し、同様にして正しい認識結果1位「OK A
、 Y AM A J を得る。
Next, 1st place 1'-OKUYAMAJ and new 2nd place "Q-K"
AYAMAJ
In the same way, the first correct recognition result is “OK A
, Y AM A J is obtained.

この例は、認識候補の数が3の場合だが、2つの時でも
、4つ以上の時でも、同様の方法で詳細識別を行なうこ
とができる。
In this example, the number of recognition candidates is three, but detailed identification can be performed using the same method even when there are two or four or more recognition candidates.

ここで、弁別特徴N5を強調する重み係数は、認識を行
なうまえに、あらかじめ計算され記憶されているもので
ある。この標準パタン間の弁別fF?2部を強調する重
み係数を求める方法の一例をあげておく。一般に音声の
特徴ベクトルの距離は、両者が同一の音素φζ属する時
は小さく、異なった音素に属する時は大きい。ゆえlこ
、両パタン間の距離が他より大きく違う部分を異なる音
素、つまり弁別特徴部とみな丁ことかできる。今、標準
パタンベクトル列B =b、 、b、置、b、、・・・
、b−とB r =b、f 、 b、f、・・・Bl、
、・・・b−を考え、両者をDPマツチングする。第1
図はそのマツチングを示す図である。DP最適バス上の
距離で実線の部分の距離d (b、 、b、(1)) 
 が、他とくらべて大きいと下るならば、そのバスlこ
対応するそれぞれの部分り、、L、は、異なる音素つま
り弁別特徴部とみな丁ことができる。そして、その部分
を強調するような重み係数W、f(i)を与えることが
できる。
Here, the weighting coefficient for emphasizing the discriminative feature N5 is calculated and stored in advance before recognition is performed. Discrimination fF between this standard pattern? An example of a method for determining a weighting coefficient that emphasizes the second part will be given below. Generally, the distance between speech feature vectors is small when both belong to the same phoneme φζ, and large when they belong to different phonemes. Therefore, the part where the distance between the two patterns is larger than the other can be regarded as a different phoneme, that is, a discriminative feature. Now, standard pattern vector sequence B = b, , b, position, b, ,...
, b- and B r =b, f , b, f, . . . Bl,
, . . . b-, and perform DP matching between the two. 1st
The figure shows the matching. Distance d (b, , b, (1)) of the solid line part on the DP optimal bus
If it is larger than the others, then each corresponding part of the bass, L, can be treated as a different phoneme, that is, a discriminative feature. Then, weighting coefficients W and f(i) can be given to emphasize that part.

(実施例) 以下、本発明の実施例について図面ととも子こ説明する
。第2図は、本発明の一実施例における音声認識装置の
ブロック図である。
(Example) Hereinafter, an example of the present invention will be explained with reference to the drawings. FIG. 2 is a block diagram of a speech recognition device in one embodiment of the present invention.

同図において、1はマイク、2は入力音声をn次元の特
徴パラメータベクトル列(al +22 、am 。
In the figure, 1 is a microphone, and 2 is an n-dimensional feature parameter vector sequence (al +22 , am ) for input audio.

・・・axlに遂次変換する分析部で、フィルタバンク
またはフーリエ変換器などζこより構成される。
. . . An analysis unit that sequentially converts into axl, and is composed of a filter bank, a Fourier transformer, etc.

3はスイッチで標準パタン作成時にはA1m1+に、入
力パタンを認識する時はB側に切り変わる。4.5は、
それぞれ、標準パタン記憶部、入力パタン記憶部で、分
析部2により作成されたn次元の特徴パラメータベクト
ル列を、標準パタン B =b1.b、 、・・・、b、・・・、B =b、
 、b、 、・・・+ b b *入力パタンA= a
l 、 afi 、・−・a□として記憶Tる。
3 is a switch that switches to A1m1+ when creating a standard pattern, and switches to B side when recognizing an input pattern. 4.5 is
The n-dimensional feature parameter vector sequence created by the analysis unit 2 is stored in the standard pattern storage unit and the input pattern storage unit, respectively, as a standard pattern B = b1. b, ,...,b,...,B=b,
, b, ,...+ b b *Input pattern A= a
It is stored as l, afi, .--a□.

6は特願昭49−2418に述べられているようなダイ
ナミックプログラミング法を利用−して時間方向の変動
を正規化するDPマツチングを行ない標準パタンB J
 == b 1J 、 b、l、・・・B:、・・・b
j と入力パタンA =al l 82 r”’a +
 +”’a 1  とのDPマツチング距離 を計算するマツチング部である。ただしI = + 7
(りは、入力パタンAと標準パタンB′の時間軸正規化
に用いた写像関数である。7はマツチング部6より得ら
れたP個のDPマツチング距離のうち、小さいものから
に個の標準パタンを認識候補として抽出し、さらに、そ
の順位、パタン名、DPi適バス上の各距離d(al、
b、、(1))、写像関数I = 44(i)等を記憶
しておく選択部である。8は類似標準パタン間Bx、B
”の弁別特徴Sを強調する重み係数 W■)が記憶しで
ある重み係数記憶一部である。9は重みつき距離計算部
で、迦択部7から、認識候補の一つであるパタンBXの
DP最適バス上の各距1’lId (a Ir b7x
(+ρ、と写像関数j=jX(I)とを、重み係数記憶
B8から、標準パタンBXと標準パタンByの弁別特徴
部を強調する重み係数 ”J>を読み込み、認識候補パ
タンBxと入カパタン人との重みつき距離 を計算する。第3図はAとBXのDPマツチングの様子
を示す図で、重みつき距離計算(こおいて実線の部分の
DP最適バス上の弁別特徴部分の距離を強調するような
、重み係数 W7(Y)をかけるのである。10は、2
つの重みつき距離の大小を比較して、大きいほうを認識
候補から除く識別部である。なお、選択部7、道みつき
距離計算部9、識別部10については、それぞれ後述の
第4.5.6図において詳細に説明する。
6 uses the dynamic programming method described in Japanese Patent Application No. 49-2418 to perform DP matching to normalize fluctuations in the time direction, and creates a standard pattern BJ.
== b 1J, b, l,...B:,...b
j and input pattern A = al l 82 r”'a +
This is a matching part that calculates the DP matching distance with +”'a 1. However, I = + 7
(RI is a mapping function used for time axis normalization of input pattern A and standard pattern B'. 7 is a mapping function used for normalizing the time axis of input pattern A and standard pattern B'. The pattern is extracted as a recognition candidate, and its rank, pattern name, and each distance d(al,
b, , (1)), mapping function I = 44(i), etc. 8 is between similar standard patterns Bx, B
This is a weighting coefficient storage part in which a weighting coefficient W■) for emphasizing the discrimination feature S of "" is stored. 9 is a weighted distance calculation unit which selects a pattern BX, which is one of the recognition candidates, from the selection unit 7. Each distance 1'lId (a Ir b7x
(+ρ, and mapping function j = j Calculate the weighted distance to the person. Figure 3 is a diagram showing the state of DP matching between A and BX. Multiply the weighting factor W7(Y) to emphasize it.10 is 2
This is an identification unit that compares the magnitude of the two weighted distances and excludes the larger one from recognition candidates. The selection unit 7, the finding distance calculation unit 9, and the identification unit 10 will be explained in detail in FIG. 4.5.6, which will be described later.

次(こ上記のようをこ構成された装置の動作について、
説明下る。標準パタン記憶部4、入力パタン記憶部5に
、各パタンの%徴ベクトル列の記憶が終了した後、入カ
パタン人と、標準バタ7B は、A=1〜P回、111
0次マツチ7り部6へ送られて距、囃計算が行なわれる
。その間、得られた各DPマツチング距離D(A、B 
 )の大小関係をもとに、遂次選択部7でに個の認識候
補を選別し、その最適DPババス情報が記憶される。標
準6772個分すべての選別が終了したら、その順位に
したがい、認識候補の中の下位に位とに一1位2つのパ
タンBX、BY間の詳細識別を行なう。前記2つのパタ
ン間の弁別特徴部 w7,7.を重み係数記憶部8から
、上記パタンBxと入力パタンAとのDP最適バスの情
報を、選択部7から、重みづけ距離計算部9に送り、重
みつき距離Dw(A、B  )=パタンHyfこ対して
も同様にして、 される。そして、2つの重みつき距4Dw(A、B  
)D(A、113”)が識別部10に送られ、そこで屯
みつき距離の大きいほうの認識候補が、除かれる。
Next (about the operation of the device configured as above)
Explain below. After the standard pattern storage unit 4 and the input pattern storage unit 5 have finished storing the % signature vector sequence of each pattern, the input pattern person and the standard pattern 7B are stored for A=1 to P times, 111
The signal is sent to the zero-order matcher 6, where distance and music calculations are performed. During that time, each DP matching distance D (A, B
), the selection unit 7 successively selects recognition candidates, and the optimum DP bus information is stored. After all the standard 6772 patterns have been sorted, detailed discrimination is performed between the two patterns BX and BY in the lower ranks among the recognition candidates according to the ranking. Discrimination feature between the two patterns w7, 7. is sent from the weighting coefficient storage unit 8, and information on the DP optimal bus of the pattern Bx and input pattern A is sent from the selection unit 7 to the weighted distance calculation unit 9, and weighted distance Dw (A, B) = pattern Hyf This is done in the same way. Then, two weighted distances 4Dw (A, B
)D(A, 113'') is sent to the identification unit 10, where the recognition candidate with the larger landing distance is removed.

次に残った認識候補パタンと、k−2位との2つのパタ
ン間で同様の操作が行なわれ、さらに1つ認識候補が除
かれる。以上の操作かに−4回繰り返され、k−1個の
認識候補が除かれて、最終的に、本みづけ距離が最も小
さかった認識候補が、認識結果として出力される。
Next, the same operation is performed between the remaining recognition candidate pattern and the k-2nd pattern, and one more recognition candidate is removed. The above operation is repeated -4 times, k-1 recognition candidates are removed, and finally, the recognition candidate with the smallest actual finding distance is output as the recognition result.

第4図は、選択部7の一具体例を示すブロック図である
。71は比較器、72は認識候補テーブルで、k個のD
Pマツチング距離と、その順位とDP最適バスの情報を
記憶する。73は選択制御部で、各部を次のように制御
する。マツチング部6から、DPマツチング距離D(A
、B)が比較器71(こ送られると、認識候補テーブル
72から、第に位のDPマ、チング距離D(A、B  
)を比較器71に送り、大小比較する。そして、D(A
、B  )<D(A、Bk)  の時のみ、さらに第に
一1位のDPマツチング距離D(A、Bk”  )を比
較回路ζこ送り大小比較する。以上を繰り返し、A(A
、B)>D(A、B”)  とな・つた時点で、マツチ
ング部6から、標準バタ7B のDP最適バスの情報を
受けとり、g識候補テーブル内の第m+1位のデー4と
、標準パタンB のデータを入れ変える。
FIG. 4 is a block diagram showing a specific example of the selection section 7. 71 is a comparator, 72 is a recognition candidate table, and k D
The P matching distance, its ranking, and information on the DP optimal bus are stored. 73 is a selection control section which controls each section as follows. From the matching section 6 to the DP matching distance D(A
, B) is sent to the comparator 71 (the recognition candidate table 72).
) is sent to the comparator 71 and compared in size. And D(A
, B)<D(A, Bk), the comparison circuit ζ compares the DP matching distance D(A, Bk") of the 11th place. Repeating the above, A(A
,B)>D(A,B''), the matching unit 6 receives the information of the DP optimum bus of the standard pattern 7B, and the m+1st data 4 in the g knowledge candidate table and the standard Swap the data of pattern B.

以上のよう番こして、順次送られくるDPマッチンク距
離のデータから、小さい順にに個のデータを、認識候補
テーブルに記憶しておくのである。
As described above, from among the DP matching distance data sent sequentially, pieces of data are stored in the recognition candidate table in descending order.

第5図)よ、貢みつき距Pith計算部9の一具体例を
示すブロック図である。91 、92は、認識候補テー
ブル72より送られてきたDP最適バス上の距離を記憶
しておくメモリ、93は、重み係数記憶部8から送られ
てきた市み係数 W   を記憶してxy(41 おくメモリである。94 、95 、96はそれぞれ、
乗算器、加算器、アキュムレータである。97は各部を
次のように制御する取みつき距離計算制御部であり、第
6図に示すタイムチャートに従った信号を発する。始め
に制御部97は、アキュムレータ96にクリア信号C!
を送信して、アキュムレータ内を0にリセットする。次
に制御部97の発する信号iに従って、メモリ92より
写像関数jx(+)が読み出される。次にそのjlこ従
ってメモリ93より重み係数 Wxyが読み出され、乗
算器94へ入力される。
FIG. 5) is a block diagram showing a specific example of the tribute distance Pith calculation unit 9. 91 and 92 are memories for storing the distance on the DP optimum bus sent from the recognition candidate table 72; 93 is a memory for storing the marketability coefficient W sent from the weighting coefficient storage unit 8; xy( 41. 94, 95, and 96 are the memories, respectively.
They are multipliers, adders, and accumulators. Reference numeral 97 is an approach distance calculation control section that controls each section as follows, and emits a signal according to the time chart shown in FIG. First, the control unit 97 sends a clear signal C! to the accumulator 96.
and reset the accumulator to 0. Next, the mapping function jx(+) is read out from the memory 92 in accordance with the signal i issued by the control section 97. Next, the weighting coefficient Wxy is read out from the memory 93 and input to the multiplier 94.

一万、信号iに従って、メモリ91より距離が計算され
、ざら(こアキュムレータ96、加算器95を用いて加
算され、 が、重みつき距離D  (A、Bx)として、この認識
候補パタンのカテゴリ名とともに出力される。
10,000, the distance is calculated from the memory 91 according to the signal i, and added using the accumulator 96 and the adder 95, and the category name of this recognition candidate pattern is defined as the weighted distance D (A, Bx). is output with

第7図は、識別部10の一具体例そ示すブロック図であ
る。101 、102 、103 、104はレジスタ
、105は比較器、106はスイッチ回路である。10
7は識別制御部で、各部を次のように制御する。レジス
タ1011こは、重みつき距離計算部9のアキュムレー
タ96から、重みつき距離D  (A、B  )、W レジスタ103ζこは、重みつき距離計算制御部97か
ら、認識候補パタンB のカテゴリ名が送られ、記憶さ
れる。その後、同様の経路で、レジスタ102Iこは重
みつき距@D  (A、By)、レジスタ104 #こ
は、その認識候補パタンBYのカテゴリ名が記憶される
。次に比較器105に2つの重みつき距@D  (A、
B  )、D  (lA、By)が送られ、W    
             W大小比較が行なわれる。
FIG. 7 is a block diagram showing a specific example of the identification section 10. 101, 102, 103, and 104 are registers, 105 is a comparator, and 106 is a switch circuit. 10
7 is an identification control section which controls each section as follows. The register 1011 receives the weighted distance D (A, B), W from the accumulator 96 of the weighted distance calculation section 9.The register 103ζ receives the category name of the recognition candidate pattern B from the weighted distance calculation control section 97. recorded and remembered. Thereafter, along a similar path, the weighted distance @D (A, By) is stored in the register 102I, and the category name of the recognition candidate pattern BY is stored in the register 104#. Next, the comparator 105 has two weighted distances @D (A,
B ), D (lA, By) are sent, and W
W magnitude comparison is performed.

その大小結果に基づき、スイッチ回路106に切り換え
られ、喧みつき距離が小さいほうの認識候補パタンのカ
テゴリ名が識別結果として出力される、 以上本発明の原理を実施例に基づいて説明したが、これ
らの記載は本発明の範囲を限定するものではない。特l
こ判定部7に2いて、認識候補抽象の方法を、DPマツ
チング距離の小さいものから順にに個選択するとしたが
、これを、最小のDPマツチング距離との差が小さいも
の、つまり、ID(A、B)−mムn D (A 、B
  ) I < T 。
Based on the magnitude result, the switch circuit 106 is switched, and the category name of the recognition candidate pattern with the smaller collision distance is output as the recognition result. This description is not intended to limit the scope of the present invention. Special
The determination unit 7 selects recognition candidate abstraction methods in descending order of DP matching distance. ,B)-mmunD(A,B
) I < T.

を満たTB、  ただしTDはDP距離の閾値としても
良いし、上記2万式の混合で、DPマツチング距離の小
さいものの内で、上式をみたTBXとしても良い。また
、識別部IOに2いで、識別を認識候補の下位から順に
2つの距離の大小を比較して、距離の大きいほうを除く
方法で行なったが、この方法に限定されず、たとえば、
上位から順に2つの比較を行7,1′っていく方法でも
良い。ざらすこ本発明の原理は、音声以外のパタンを対
象にする場合にも有効に適用されるのは明らかである。
TB, where TD satisfies the above equation. However, TD may be used as a threshold value of the DP distance, or may be a mixture of the above 20,000 equations, and may be TBX that meets the above equation among those with a small DP matching distance. Further, in the identification unit IO, identification was performed by comparing the magnitudes of two distances in order from the lowest recognition candidate and excluding the one with the larger distance, but the method is not limited to this method, for example,
It is also possible to perform two comparisons in rows 7 and 1' in order from the top. It is clear that the principles of the present invention can be effectively applied to patterns other than speech.

例えば、文字認識に適用された場合には、「間」と「間
」のような極めて類似した文字間の弁別に効果がある。
For example, when applied to character recognition, it is effective in distinguishing between extremely similar characters such as "ma" and "ma".

(発明の効果) 本発明lこよれば、パタン認識システムtこおいて、類
似した標準パタンか存在して、それら弁別特徴部の差が
、他の共通な部分の変動(こよって生じる差にかくされ
てしまった場合でも、以上fこ述べたような詳細識別を
行ない正しい認識結果を得ることができ、認識率を向上
させることができる。
(Effects of the Invention) According to the present invention, in the pattern recognition system, there are similar standard patterns, and the difference in their discriminative features is caused by the variation in other common parts (the resulting difference). Even if the object is hidden, the detailed recognition described above can be performed to obtain a correct recognition result, and the recognition rate can be improved.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図及び3図は、DPマツチングを説明するための図
、第2図は、本発明の一実施例を示すブロック図、第4
.5.6図(ま、それぞれ、選択部。 重みつき距離計算部、識別部の構成例を示Tブロック図
、第7図は重みつき距離計算部の動作を説明するための
タイムチャートである。 図において、 1・・・・・・マイク、2・−・・−・分析部−13・
・・・・・スイッチ回路、4・−・・・・標準パタン記
憶部、5・・・・°・入力パタン記憶部、6・・・・・
・マツチノブ部、7911101選択部、8・・・・・
・重み係数記憶部、9・・・・・・重みつき距離計算部
、10・・・・・・識別部、71・・・・・・比較器、
72・・・・・・認識候補テーブル、73・・・・・・
選択制御部、91 、92 、93・・・・−・メモリ
、94・・・・・−乗算器、95・・・・・・加算器、
96・・・・・・アキュムレータ、97・・・・・・重
みつき距離計算制御部、101 、102 、103 
、104・・・・・・レジスタ、105・・・・・・比
較器、106・・・・・・スイッチ回路、第1図
1 and 3 are diagrams for explaining DP matching, FIG. 2 is a block diagram showing an embodiment of the present invention, and FIG.
.. Figures 5 and 6 (respectively, selection units) are block diagrams showing configuration examples of the weighted distance calculation unit and the identification unit, and Figure 7 is a time chart for explaining the operation of the weighted distance calculation units. In the figure, 1...Mike, 2...Analysis section-13.
...Switch circuit, 4.--Standard pattern storage section, 5..°.Input pattern storage section, 6.....
・Matsuchinobu section, 7911101 selection section, 8...
- Weighting coefficient storage unit, 9... Weighted distance calculation unit, 10... Identification unit, 71... Comparator,
72... Recognition candidate table, 73...
Selection control unit, 91, 92, 93...--Memory, 94...-Multiplier, 95...-Adder,
96... Accumulator, 97... Weighted distance calculation control unit, 101, 102, 103
, 104...Register, 105...Comparator, 106...Switch circuit, Fig. 1

Claims (1)

【特許請求の範囲】[Claims] 入力データを分析し特徴パタンを作る分析部と、少なく
とも標準パタン登録時に前記分析部と接続され前記分析
部より供給される標準パタンを記憶する標準パタン記憶
部と、少なくとも認識時に前記分析部と接続され前記分
析部より供給される入力パタンを記憶する入力パタン記
憶部と、入力パタンと標準パタンとの比較処理を行なう
マッチング部と、前記比較結果に基づいて上位認識侯補
群を抽出する選択部と、標準パタン間の弁別特徴部に重
みをかけて距離を計算する重みづけ距離計算部と、前記
重みづけ距離を基に前記認識候補群を選別する識別部を
持つことを特徴とするパタン認識装置。
an analysis section that analyzes input data and creates a characteristic pattern; a standard pattern storage section that is connected to the analysis section at least when registering a standard pattern and stores the standard pattern supplied from the analysis section; and a standard pattern storage section that is connected to the analysis section at least during recognition. an input pattern storage unit that stores the input pattern supplied from the analysis unit; a matching unit that performs a comparison process between the input pattern and a standard pattern; and a selection unit that extracts a group of upper recognition candidate candidates based on the comparison result; A pattern recognition device comprising: a weighted distance calculation section that calculates a distance by weighting a discrimination feature between standard patterns; and an identification section that selects the recognition candidate group based on the weighted distance.
JP59198031A 1984-09-21 1984-09-21 Pattern recognizer Pending JPS6175982A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59198031A JPS6175982A (en) 1984-09-21 1984-09-21 Pattern recognizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59198031A JPS6175982A (en) 1984-09-21 1984-09-21 Pattern recognizer

Publications (1)

Publication Number Publication Date
JPS6175982A true JPS6175982A (en) 1986-04-18

Family

ID=16384373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59198031A Pending JPS6175982A (en) 1984-09-21 1984-09-21 Pattern recognizer

Country Status (1)

Country Link
JP (1) JPS6175982A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH076208A (en) * 1993-06-18 1995-01-10 Nec Corp Character recognition device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH076208A (en) * 1993-06-18 1995-01-10 Nec Corp Character recognition device

Similar Documents

Publication Publication Date Title
US5794190A (en) Speech pattern recognition using pattern recognizers and classifiers
JPH0449717B2 (en)
EP0709826A1 (en) Pattern recognition method
Ekstedt et al. Voice activity projection: Self-supervised learning of turn-taking events
Paliwal Dimensionality reduction of the enhanced feature set for the HMM-based speech recognizer
JPS63259687A (en) Voice signal recognition and apparatus for implementing the same
US5519805A (en) Signal processing arrangements
Kumar et al. Comparative analysis of different feature extraction and classifier techniques for speaker identification systems: A review
JPH04318900A (en) Multidirectional simultaneous sound collection type voice recognizing method
JPS6175982A (en) Pattern recognizer
US4790017A (en) Speech processing feature generation arrangement
JP2589299B2 (en) Word speech recognition device
Morgan et al. A keyword spotter which incorporates neural networks for secondary processing
KR100480506B1 (en) Speech recognition method
JP2589300B2 (en) Word speech recognition device
JP3251460B2 (en) Speaker verification method and apparatus
Park et al. A hybrid of deep audio feature and i-vector for artist recognition
Sun et al. A novel template matching approach to speaker-independent arabic spoken digit recognition
Tripathi et al. Incremental Cauchy non-negative matrix factorization and fuzzy rule-based classifier for acoustic source separation
Timms et al. Speaker verification utilising artificial neural networks and biometric functions derived from time encoded speech (TES) data
WO1997031368A1 (en) Signal processing arrangements
JPS5915993A (en) Voice recognition equipment
JP2989231B2 (en) Voice recognition device
JPH0566597B2 (en)
EP0526515B1 (en) Pattern recognition