JPH0226262B2 - - Google Patents

Info

Publication number
JPH0226262B2
JPH0226262B2 JP56116969A JP11696981A JPH0226262B2 JP H0226262 B2 JPH0226262 B2 JP H0226262B2 JP 56116969 A JP56116969 A JP 56116969A JP 11696981 A JP11696981 A JP 11696981A JP H0226262 B2 JPH0226262 B2 JP H0226262B2
Authority
JP
Japan
Prior art keywords
similarity
pattern
standard pattern
standard
unknown
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56116969A
Other languages
Japanese (ja)
Other versions
JPS5818778A (en
Inventor
Hidefumi Ooga
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP56116969A priority Critical patent/JPS5818778A/en
Publication of JPS5818778A publication Critical patent/JPS5818778A/en
Publication of JPH0226262B2 publication Critical patent/JPH0226262B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

PURPOSE:To enlarge the object to be recognized without lowering the recognition rate, by updating the content of the standard pattern whenever an unknown pattern is given. CONSTITUTION:A sound recognizing section 1 is composed of an unknown pattern area 2, a standard pattern area 3, and a similarity calculating section 4, and the similarity between each standard pattern and an unknown pattern is outputted from the similarity calculating section 4. A standard pattern selecting section 11 selects a standard pattern to be given to the next unknown pattern based on the content of the similarity outputted from the recognizing section 1 and a similarity storing section 10 which stores past similarities. In a standard pattern storing section 7, each standard pattern is stored in tree structure after they are divided into blocks. Since the unknown pattern X(0) is recognized as it is without discriminating the X(0) and the simlarity at the next time point X(1) and that at the time point after next X(2) are judged after they are accumulated, the recognition rate is increased.

Description

【発明の詳細な説明】 本発明は複数の未知パタンの組み合せを認識す
るパタン認識方式に関し、特に単語音声を認識す
るに際し単語音声の組み合せにより認識対象の数
を増大させる場合に、より高い認識率が得られる
方式を提供するものである。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a pattern recognition method that recognizes a combination of a plurality of unknown patterns, and in particular, the present invention relates to a pattern recognition method that recognizes a combination of a plurality of unknown patterns. This method provides a method for obtaining the following.

音声単語認識の場合に、認識でき得る語彙数は
限られており、無限語彙の認識を、音声単語認識
装置自体で行なわせる事は現状では不可能であ
る。認識時間、又は識別出来得る能力の点から現
状はせいぜい100〜200単語である。しかし次に示
す様な方法でみかけ上認識語彙数を増大させた
り、あるいは認識対象の数を増大させたりするこ
とが従来から行なわれている。
In the case of spoken word recognition, the number of vocabulary that can be recognized is limited, and it is currently impossible for the spoken word recognition device itself to recognize an infinite vocabulary. In terms of recognition time or ability to identify, the current number of words is 100 to 200 at most. However, the following methods have been used to apparently increase the number of recognized vocabulary or to increase the number of recognition targets.

以下これを第1図、第2図を用いて説明する。
第1図は構成を示すもので、1は音声認識部であ
る。未知なる音声単語は、周波数分析等により特
徴が抽出されて未知パタンXに変換され、これは
未知パタンエリア2へ格納される。3は標準パタ
ンエリアで、複数の標準パタンY(0),Y(1),Y
(2),……Y(k)……Y(k)が格納されている。4は類
似度算出部で未知パタンXと標準パタンY(k)との
類似度S(k)を算出する。5は判定部で、この類似
度の最も高い値 maxk S(k)を抽出しかつこの maxk
S(k)がすでに定められたしきい値Lより大なる時
maxk S(k)を与えたY(k)を出力する。一方 maxk
(k)がLより少なる時には、棄却される。音声認識
部1は、未知パタンエリア2、標準パタンエリア
3、類似度算出部4、判定部5より構成される。
This will be explained below using FIGS. 1 and 2.
FIG. 1 shows the configuration, and 1 is a voice recognition section. The features of the unknown spoken word are extracted by frequency analysis or the like and converted into an unknown pattern X, which is stored in the unknown pattern area 2. 3 is a standard pattern area where multiple standard patterns Y(0), Y(1), Y
(2),...Y(k)...Y(k) are stored. 4 is a similarity calculation unit that calculates the similarity S(k) between the unknown pattern X and the standard pattern Y(k). 5 is a judgment unit that extracts the value max k S(k) with the highest degree of similarity and
When S(k) is greater than the predetermined threshold L
Output Y(k) given max k S(k). On the other hand, max k S
When (k) is less than L, it is rejected. The speech recognition section 1 includes an unknown pattern area 2, a standard pattern area 3, a similarity calculation section 4, and a determination section 5.

今、この音声認識部1の認識でき得る語彙数が
3単語であるとし、この音声認識部を使用して見
かけ上認識対象の数を増大させる場合について説
明する。
Now, assuming that the number of vocabulary words that can be recognized by this speech recognition unit 1 is three words, a case will be described in which the number of recognition targets is apparently increased using this speech recognition unit.

7は音声認識部とは別に標準パタンを格納して
いる標準パタン格納部であり、これは標準パタン
3個分よりなるブロツクB,B0,B1,B2,
B00,B01,〜B22,より構成されてい
る。第2図は、ブロツクB,B0,〜B22と、
各標準パタンZ(0),Z(1)……Z(0,0),Z
(0,1)……Z(0,0,0)……Z(2,2,
2)との関係、および各標準パタン間の概念関係
を示している図である。標準パタンZ(0,0,
0),Z(0,0,1),Z(0,0,2)の上位概
念が標準パタンZ(0,0)であり、Z(0,0),
Z(0,1),Z(0,2)の上位概念の標準パタ
ンが、Z(0)である事を示す。
7 is a standard pattern storage section which stores standard patterns separately from the speech recognition section, and this is a block B, B0, B1, B2, which is made up of three standard patterns.
It is composed of B00, B01, to B22. FIG. 2 shows blocks B, B0, ~B22,
Each standard pattern Z(0), Z(1)...Z(0,0), Z
(0,1)...Z(0,0,0)...Z(2,2,
2) and a diagram showing the conceptual relationship between each standard pattern. Standard pattern Z (0, 0,
0), Z(0,0,1), and Z(0,0,2) are standard patterns Z(0,0), and Z(0,0),
It shows that the standard pattern of the superordinate concept of Z(0,1) and Z(0,2) is Z(0).

以下他の標準パタンについても同様で、これら
の関係を一般にツリー構造と呼ぶ。例えば住所〇
〇市、〇〇区、〇〇町、を表現する場合、Z
(0),Z(1),Z(2)に市に対応する標準パタンをZ
(0,0)〜Z(2,2)に区に対応する標準パタ
ンを、Z(0,0,0)〜Z(2,2,2)に町に
対応する標準パタンを割り合てておく。それぞれ
の標準パタンは、点線で囲まれている様にブロツ
ク分けしてある。ブロツクBには、Z(0),Z
(1),Z(2)が、ブロツクB0には、Z(0,0),Z
(0,1),Z(0,2)がブロツクB00には、
Z(0,0,0),Z(0,0,1),Z(0,0,
2)が格納されている。他のブロツクについても
図に示す通りである。
The same applies to other standard patterns below, and these relationships are generally referred to as a tree structure. For example, when expressing the address 〇〇 city, 〇〇 ward, 〇〇 town, Z
(0), Z(1), Z(2) are the standard patterns corresponding to the city.
Assign standard patterns corresponding to wards to (0,0) to Z(2,2) and standard patterns corresponding to towns to Z(0,0,0) to Z(2,2,2). put. Each standard pattern is divided into blocks surrounded by dotted lines. Block B has Z(0), Z
(1), Z(2), but block B0 has Z(0,0), Z
(0,1), Z(0,2) are in block B00,
Z(0,0,0),Z(0,0,1),Z(0,0,
2) is stored. The other blocks are also as shown in the figure.

第1図の6は、認識部1からの認識結果を得
て、標準パタン格納部7から、ブロツクを選出
し、標準パタンエリア3の内容を変える標準パタ
ン選出部である。
Reference numeral 6 in FIG. 1 is a standard pattern selection section which obtains the recognition result from the recognition section 1, selects a block from the standard pattern storage section 7, and changes the contents of the standard pattern area 3.

あらかじめ、第2図に示す様な概念関係で、概
念の高い(上位の)順に、3つの未知パタンX
(0),X(1),X(2)を入力する様に決めておき、ま
ず、X(0)が入力されると、この時は標準パタ
ンエリア3の内容はブロツクBの内容にし、X
(0)がZ(0),Z(1),Z(2)の内のいずれである
かを認識部1において識別し、一方、標準パタン
選出部6は認識部1からの結果を受け、次の未知
パタンに対してブロツクB0,B1,B2,の内
のいずれを、標準パタンエリア3へ与えるべきか
判断する。今、X(0)がZ(0)であるとし、次
の未知パタンX(1)が入力されると、標準パタンエ
リア3の内容は、ブロツクB0の内容に変更さ
れ、認識部1は同様にX(1)がZ(0,0),Z(0,
1),Z(0,2)の内のいずれであるかを識別
し、一方標準パタン選出部6は次の未知パタンに
対して、ブロツクB00,B01,B02の内の
いずれを標準パタンエリア3へ与えるべきか判断
する。X(1)がZ(0,0)であるとし、次の未知
パタンX(2)が入力されると、標準パタン3の内容
は、ブロツクB00の内容に変更され、認識部1
は同様にX(2)がZ(0,0,0),Z(0,0,
1),Z(0,0,2)の内のいずれであるかを識
別し、結果を出力する。X(2)がZ(0,0,0)
であるとすると、結局、未知パタンX(0),X
(1),X(2)は、Z(0),Z(0,0),Z(0,0,
0)であると認識される事になり、認識部の語彙
数は3単語であるが、見かけ上、27個の対象を識
別する事が可能となり、単語の組み合せが、概念
構成になつているため、利用者がほとんど負担を
感じることなくX(0),X(1),X(2)を発声する事
が出来る。
In advance, three unknown patterns
It is decided that (0), X(1), and X
The recognition unit 1 identifies whether (0) is Z(0), Z(1), or Z(2), while the standard pattern selection unit 6 receives the result from the recognition unit 1, It is determined which of blocks B0, B1, and B2 should be applied to the standard pattern area 3 for the next unknown pattern. Now, suppose that X(0) is Z(0), and when the next unknown pattern X(1) is input, the contents of standard pattern area 3 are changed to the contents of block B0, and recognition unit 1 , X(1) becomes Z(0,0), Z(0,
1), Z(0, 2), and on the other hand, the standard pattern selection unit 6 selects which of blocks B00, B01, and B02 to the standard pattern area 3 for the next unknown pattern. Decide if you should give it to someone. Assuming that X(1) is Z(0,0), when the next unknown pattern X(2) is input, the content of standard pattern 3 is changed to the content of block B00, and recognition unit 1
Similarly, X(2) is Z(0,0,0), Z(0,0,
1), Z(0, 0, 2), and output the result. X(2) is Z(0,0,0)
Assuming that, the unknown pattern X(0),X
(1), X(2) are Z(0), Z(0,0), Z(0,0,
0), and although the recognition unit's vocabulary is only 3 words, it is apparently possible to identify 27 objects, and the combination of words forms a conceptual structure. Therefore, the user can pronounce X(0), X(1), and X(2) without feeling any burden.

しかし音声認識部自体の認識率をαとすると、
最終的には、この場合の認識率は、α×α×α=
α3であり、α<1であるため、α>α3であるか
ら、結局、認識率が減少してしまう事は、避けが
たい。またX(0)の時点で誤認識を行つた場合
には、X(1),X(2)に対して選ばれる標準パタンは
全く異なつたものになり、さらに誤認識が増長さ
れる。したがつてより高い認識率で、見かけ上認
識対象の数を増大させる手段が強く望まれる。
However, if the recognition rate of the speech recognition unit itself is α, then
Ultimately, the recognition rate in this case is α×α×α=
Since α 3 and α<1, α>α 3 , it is inevitable that the recognition rate will eventually decrease. Furthermore, if an erroneous recognition is made at the time of X(0), the standard patterns selected for X(1) and X(2) will be completely different, further increasing the erroneous recognition. Therefore, a means for increasing the number of apparent recognition targets with a higher recognition rate is strongly desired.

本発明はこのような点に鑑みてなされたもので
あり、以下その一実施例を説明する。
The present invention has been made in view of these points, and one embodiment thereof will be described below.

第3図は本発明の一実施例を示すもので1は、
未知パタンエリア2と標準パタンエリア3と、類
似度算出部4より構成され、これらの機能は第1
図のものと同様である。類似度算出部4から、各
標準パタンと未知パタン間の類似度、S(0),S
(1),S(2)……S(k),……S(k)が出力されている。
10は未知パタンエリア2と、標準パタンエリア
3に与えられていた過去の状態における類似度を
格納しておく類似度格納部である。11は、標準
パタン選出部で、認識部1から出力される類似度
S(0),S(1)……S(k)……S(k)と過去の類似度を
格納している類似度格納部10との内容により、
次の未知パタンに対して与えるべき標準パタンを
選出するためのものである。7は標準パタン格納
部で、ここには第1図で示したと同様、各標準パ
タンがトリー構造でブロツク割けされて格納され
ている。標準パタンの選出が終つた時点で、類似
度格納部10は類似度S(0),S(k)……S(k)の内
標準パタン選出部11からの指令によりM個ほど
取り込み、その内容を更新し、その後、標準パタ
ンエリア3の内容は、次の未知パタンに対しての
標準パタンになる様に、標準パタン格納部7から
標準パタンエリア3へ、標準パタンの転送が行な
われる。
FIG. 3 shows an embodiment of the present invention.
It is composed of an unknown pattern area 2, a standard pattern area 3, and a similarity calculation section 4, and these functions are performed by the first
It is similar to the one shown in the figure. The similarity calculation unit 4 calculates the similarity between each standard pattern and the unknown pattern, S(0), S
(1), S(2)...S(k),...S(k) are output.
Reference numeral 10 denotes a similarity storage unit that stores similarities in past states given to the unknown pattern area 2 and the standard pattern area 3. Reference numeral 11 denotes a standard pattern selection unit, which stores similarities S(0), S(1)...S(k)...S(k) output from the recognition unit 1 and past similarities. Depending on the contents of the degree storage section 10,
This is for selecting a standard pattern to be given to the next unknown pattern. Reference numeral 7 denotes a standard pattern storage section, in which each standard pattern is stored divided into blocks in a tree structure, as shown in FIG. When the selection of the standard patterns is completed, the similarity storage unit 10 takes in about M pieces of similarity S(0), S(k)...S(k) according to a command from the internal standard pattern selection unit 11, and stores them. After updating the contents, the standard pattern is transferred from the standard pattern storage section 7 to the standard pattern area 3 so that the contents of the standard pattern area 3 become the standard pattern for the next unknown pattern.

第2図で示す様な標準パタンを認識する場合に
ついて、本発明の考え方を第3図に従い、M=2
として、説明する。未知パタンはX(0),X(1),
X(2)の順に第1図の説明で述べた同様に、概念の
高い順に入力される。X(0)が入力されると、
標準パタンエリア3の内容はブロツクBの内容、
すなわちZ(0),Z(1),Z(2)になり、かつ類似度
格納部10の内容はクリアされる。認識部はX
(0)とZ(0),Z(1),Z(2)との類似度S(0),
S(1),S(2)を出力し標準パタン選出部11は、類
似度格納部10の内容がクリアされているため、
S(0),S(1),S(2)の内で最も高い値S1と次に
高い値S2を選び、S1と、S2を与えた標準パ
タンの下位概念の標準パタンブロツクを選出し、
選出が終了すると、S1とS2を、類似度格納部
10へ格納する。今、S1がS(0)、S2がS(1)
であるとすると、ブロツクB0とブロツクB1が
選らばれ、標準パタンエリア3へ標準パタンの転
送が行なわれ、類似度格納部10へはS(0)と
S(1)が格納される。
Regarding the case of recognizing a standard pattern as shown in FIG. 2, the idea of the present invention is based on FIG.
I will explain as follows. The unknown pattern is X(0), X(1),
In the same way as described in the explanation of FIG. 1 in the order of X(2), the concepts are input in descending order of concept. When X(0) is input,
The contents of standard pattern area 3 are the contents of block B,
That is, they become Z(0), Z(1), and Z(2), and the contents of the similarity storage unit 10 are cleared. The recognition part is X
(0) and Z(0), Z(1), Z(2) similarity S(0),
The standard pattern selection unit 11 outputs S(1) and S(2) because the content of the similarity storage unit 10 has been cleared.
Select the highest value S1 and the next highest value S2 among S(0), S(1), and S(2), select a standard pattern block of a subordinate concept of the standard pattern given S1 and S2,
When the selection is completed, S1 and S2 are stored in the similarity storage unit 10. Now, S1 is S(0) and S2 is S(1)
If so, block B0 and block B1 are selected, the standard patterns are transferred to the standard pattern area 3, and S(0) and S(1) are stored in the similarity storage unit 10.

次に、未知パタンX(1)が入力されると、認識部
1では、次の類似度が算出される。
Next, when the unknown pattern X(1) is input, the recognition unit 1 calculates the next degree of similarity.

S(0,0):X(1)とZ(0,0) S(0,1):X(1)とZ(0,1) S(0,2):X(1)とZ(0,2) S(1,0):X(1)とZ(1,0) S(1,1):X(1)とZ(1,1) S(1,2):X(1)とZ(1,2) 標準パタン選出部11では、これらの類似度と
類似度格納部10との内容により、 S′(0,0)=S(0)+S(0,0) S′(0,1)=S(0)+S(0,1) S′(0,2)=S(0)+S(0,2) S′(1,0)=S(1)+S(1,0) S′(1,1)=S(1)+S(1,1) S′(1,2)=S(1)+S(1,2) …(1) が計算され、S′(0,0)〜S′(1,2)の内で最
も高い値のS1と、次に高い値のS2が選ばれ、
同様にS1,S2を与えた標準パタンの下位概念
の標準パタンのブロツクを選出する。選出が終了
すると同様にS1,S2を与えた認識部1からの
類似度が、類似度格納部10へさらに格納され
る。今、S1がS(0,0)、S2が、S(1,0)
で、与えられたすると、ブロツクB00と、ブロ
ツクB10が選ばれ、標準パタンエリア3へ転送
され、類似度格納部へは、S(0,0)と、S
(1,0)が、さらに格納される。
S(0,0): X(1) and Z(0,0) S(0,1): X(1) and Z(0,1) S(0,2): X(1) and Z( 0,2) S(1,0): X(1) and Z(1,0) S(1,1): X(1) and Z(1,1) S(1,2): X(1 ) and Z(1,2) The standard pattern selection unit 11 calculates S′(0,0)=S(0)+S(0,0) S′ based on these similarities and the contents of the similarity storage unit 10. (0,1)=S(0)+S(0,1) S'(0,2)=S(0)+S(0,2) S'(1,0)=S(1)+S(1, 0) S'(1,1)=S(1)+S(1,1) S'(1,2)=S(1)+S(1,2) ...(1) is calculated, and S'(0 , 0) to S' (1, 2), the highest value S1 and the next highest value S2 are selected,
Similarly, a block of a standard pattern that is a subordinate concept of the standard pattern given S1 and S2 is selected. When the selection is completed, the similarity from the recognition unit 1 that gave S1 and S2 is further stored in the similarity storage unit 10. Now, S1 is S(0,0), S2 is S(1,0)
Then, block B00 and block B10 are selected and transferred to standard pattern area 3, and S(0,0) and S
(1,0) is further stored.

次にX(2)が入力されると、認識部1では次の類
似度が算出される。
Next, when X(2) is input, the recognition unit 1 calculates the next degree of similarity.

S(0,0,0):X(2)とZ(0,0,0) S(0,0,1):X(2)とZ(0,0,1) S(0,0,2):X(2)とZ(0,0,2) S(1,0,0):X(2)とZ(1,0,0) S(1,0,1):X(2)とZ(1,0,1) S(1,0,2):X(2)とZ(1,0,2) 標準パタン選出部11では、 S′(0,0,0)=S(0,0,0)+S(
0,0)+S(0) S′(0,0,0)=S(0,0,0)+S(
0,0)+S(0) S′(0,0,1)=S(0,0,1)+S(0,0)
+S(0) S′(0,0,0)=S(0,0,0)+S(
0,0)+S(0) S′(0,0,1)=S(0,0,1)+S(0,0)
+S(0) S′(0,0,2)=S(0,0,2)+S(0,0)
+S(0) S′(0,0,0)=S(0,0,0)+S(
0,0)+S(0) S′(0,0,1)=S(0,0,1)+S(0,0)
+S(0) S′(0,0,2)=S(0,0,2)+S(0,0)
+S(0) S′(1,0,0)=S(1,0,0)+S(1,0)
+S(1) S′(0,0,0)=S(0,0,0)+S(
0,0)+S(0) S′(0,0,1)=S(0,0,1)+S(0,0)
+S(0) S′(0,0,2)=S(0,0,2)+S(0,0)
+S(0) S′(1,0,0)=S(1,0,0)+S(1,0)
+S(1) S′(1,0,1)=S(1,0,1)+S(1,0)
+S(1) S′(0,0,0)=S(0,0,0)+S(
0,0)+S(0) S′(0,0,1)=S(0,0,1)+S(0,0)
+S(0) S′(0,0,2)=S(0,0,2)+S(0,0)
+S(0) S′(1,0,0)=S(1,0,0)+S(1,0)
+S(1) S′(1,0,1)=S(1,0,1)+S(1,0)
+S(1) S′(1,0,2)=S(1,0,2)+S(1,0)
+S(1)…(2) の計算が行なわれて、これらのS′(0,0,0)
〜S′(1,0,2)の内で最も類似度の高い値S
1を選出し、S1を与えた標準パタンの組み合せ
が最終的な認識結果となる。
S(0,0,0): X(2) and Z(0,0,0) S(0,0,1): X(2) and Z(0,0,1) S(0,0, 2):X(2) and Z(0,0,2) S(1,0,0):X(2) and Z(1,0,0) S(1,0,1):X(2) ) and Z(1,0,1) S(1,0,2):X(2) and Z(1,0,2) In the standard pattern selection section 11, S'(0,0,0)=S (0,0,0)+S(
0,0)+S(0) S'(0,0,0)=S(0,0,0)+S(
0,0)+S(0) S'(0,0,1)=S(0,0,1)+S(0,0)
+S(0) S'(0,0,0)=S(0,0,0)+S(
0,0)+S(0) S'(0,0,1)=S(0,0,1)+S(0,0)
+S(0) S'(0,0,2)=S(0,0,2)+S(0,0)
+S(0) S'(0,0,0)=S(0,0,0)+S(
0,0)+S(0) S'(0,0,1)=S(0,0,1)+S(0,0)
+S(0) S'(0,0,2)=S(0,0,2)+S(0,0)
+S(0) S'(1,0,0)=S(1,0,0)+S(1,0)
+S(1) S'(0,0,0)=S(0,0,0)+S(
0,0)+S(0) S'(0,0,1)=S(0,0,1)+S(0,0)
+S(0) S'(0,0,2)=S(0,0,2)+S(0,0)
+S(0) S'(1,0,0)=S(1,0,0)+S(1,0)
+S(1) S'(1,0,1)=S(1,0,1)+S(1,0)
+S(1) S'(0,0,0)=S(0,0,0)+S(
0,0)+S(0) S'(0,0,1)=S(0,0,1)+S(0,0)
+S(0) S'(0,0,2)=S(0,0,2)+S(0,0)
+S(0) S'(1,0,0)=S(1,0,0)+S(1,0)
+S(1) S'(1,0,1)=S(1,0,1)+S(1,0)
+S(1) S'(1,0,2)=S(1,0,2)+S(1,0)
+S(1)…(2) are calculated and these S′(0,0,0)
The value S with the highest degree of similarity among ~S' (1, 0, 2)
1 is selected and the standard pattern given S1 becomes the final recognition result.

前式において、S(0,0),S(1,0)S
(0),S(1)は類似度格納部10の内容であり、今
S1がS′(0,0,0)であるとすると、S′(0,
0,0)は、S(0,0,0)とS(0,0)とS
(0)より計算されるものであり、S(0)はX
(0)とZ(0)の類似度でありS(0,0)はX
(1)とZ(0,0)の類似度でありS(0,0,0)
は、X(2)とZ(0,0,0)の類似度であるから、
結局X(0)はZ(0),X(1)はZ(0,0)X(2)は
Z(0,0,0)と認識される。
In the previous equation, S(0,0), S(1,0)S
(0), S(1) are the contents of the similarity storage unit 10, and if S1 is now S'(0, 0, 0), S'(0,
0,0) is S(0,0,0) and S(0,0) and S
(0), and S(0) is
(0) and Z(0), and S(0,0) is X
(1) and Z(0,0), and S(0,0,0)
is the similarity between X(2) and Z(0,0,0), so
In the end, X(0) is recognized as Z(0), X(1) is recognized as Z(0,0), and X(2) is recognized as Z(0,0,0).

最終的なS1があるしきい値Lより大なる時に
のみ認識結果を出力し、しきい値Lより小なる時
には棄却する様にすれば誤認識を防ぐ事も出来
る。
Erroneous recognition can also be prevented by outputting the recognition result only when the final S1 is greater than a certain threshold L and rejecting it when it is smaller than the threshold L.

この様にすれば、従来の方法に比べ、認識部自
体で標準パタンの処理する個数はM倍になるが、
複数の未知パタンの組み合せの場合には、認識率
が向上する。従来の方法では、標準パタンエリア
3へ転送するブロツクは1個であつたが、本発明
の場合は、可能性のあるブロツクM個を抽出し標
準パタンエリアへ与えるために、正解であるべき
標準パタンと未知パタンとの類似度が類似度の最
も高い値からM番目内に入つておれば良い事にな
る。正解であるべき標準パタンと未知パタン間の
類似度が最も高い値になる時の率αと、高い値か
らM番目内に入つている時の率αMはα<αMであ
り、従来の方法では、標準パタンのトリー構造の
段数がT段であるとすると、(未知パタンの数は
T個必要)認識率はαTとなり、本発明の場合は
αT Mとなり、αT<αT Mであるため、本発明の場合に
は、全体として認識率が向上する事になる。また
従来の方法では、未知パタンX(0)で、誤まつ
てしまうと、次のX(1)X(2)は、無意味なものとな
るが、本発明の場合にはX(0)のみでX(0)が
何であるかを判断せず、次のX(1)の時点における
類似度とX(2)の時点における類似度が累積されて
判断されるために、X(0)の正解であるべき標
準パタンの類似度がM番目内に入つているなら
ば、X(1)、X(2)は決して、無意味なものとなら
ず、むしろ良い結果をもたらす事になる。つまり
X(0)の時点で、正解であるべき標準パタンと
X(0)間の類似度が第1番目に高い値でなくて
も、最終的にはX(1),X(2)の時点の類似度の累積
で、未知パタンの組み合せが判断されるため、X
(0)の時点における正解であるべき標準パタン
が最終的には、選ばれる可能性が大きくなる。
In this way, compared to the conventional method, the number of standard patterns processed by the recognition unit itself will be M times larger, but
In the case of a combination of multiple unknown patterns, the recognition rate improves. In the conventional method, only one block was transferred to the standard pattern area 3, but in the case of the present invention, in order to extract M possible blocks and provide them to the standard pattern area, the standard that should be the correct answer is It is sufficient if the degree of similarity between the pattern and the unknown pattern is within the Mth value of the highest degree of similarity. The rate α when the similarity between the standard pattern and the unknown pattern that should be the correct answer is the highest value, and the rate α M when it is within the Mth value from the highest value are α<α M , and the conventional In the method, if the number of stages of the tree structure of the standard pattern is T stages (the number of unknown patterns is T), the recognition rate is α T , and in the case of the present invention it is α T M , and α T < α T M , so in the case of the present invention, the overall recognition rate improves. In addition, in the conventional method, if the unknown pattern X(0) is mistaken, the next X(1)X(2) becomes meaningless; What X(0) is is not judged by only If the similarity of the standard pattern that should be the correct answer is within the Mth, then X(1) and X(2) will never be meaningless, and will in fact yield good results. In other words, even if the similarity between the standard pattern that should be the correct answer and X(0) is not the highest value at the time of X(0), ultimately Since combinations of unknown patterns are judged based on the accumulation of similarities at points in time,
The standard pattern that should be the correct answer at time (0) is ultimately more likely to be selected.

また選出されるブロツクM個は、累積類似度か
ら、(式(1),(2)による、)選出されているが、処理
を簡単にするためには、単に、認識部から出力さ
れる類似度から、次の標準パタンエリアへ転送す
るブロツクM個を選出しても、従来の方法に比べ
α<αT Mであるから、認識率は向上する。
Furthermore, the M blocks to be selected are selected from the cumulative similarity (according to equations (1) and (2)), but in order to simplify the process, it is necessary to simply calculate the similarity output from the recognition unit. Even if M blocks are selected from each block to be transferred to the next standard pattern area, the recognition rate is improved since α<α T M compared to the conventional method.

また式(1),(2)では累積類似度は、ただ単に加算
し未知パタンの組み合せにおける類似度を算出し
ている。これは、市街距離なる類似度の算出方法
でこれ以外に、ユークリツド距離で未知パタンの
組み合せにおける類似度を算出しても良い。この
場合には式(1)(2)は以下の様になる。
Furthermore, in equations (1) and (2), the cumulative similarity is simply added to calculate the similarity in the combination of unknown patterns. This is a method of calculating the degree of similarity based on the city distance.In addition to this method, the degree of similarity between combinations of unknown patterns may be calculated using the Euclidean distance. In this case, equations (1) and (2) become as follows.

S′(0,0)=√(0)2+(0,0)2 …(3) (S′(0,1)〓S′(1,2)においても同様) S′(0,0,0) =√(0,0,0)2+(0,0)2+(0)2
…(4) (S(0,0,1)〓S(1,0,2)について
も同様) このように本発明によれば認識率を低下させる
ことなく認識対象を増大させることができる。
S'(0,0)=√(0) 2 +(0,0) 2 ...(3) (Similarly for S'(0,1)=S'(1,2)) S'(0,0 ,0) =√(0,0,0) 2 +(0,0) 2 +(0) 2
...(4) (Same applies to S(0,0,1)=S(1,0,2)) As described above, according to the present invention, the number of recognition targets can be increased without reducing the recognition rate.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は従来のパタン認識方式を示すブロツク
図、第2図は標準パタンの構成の例を説明する説
明図、第3図は本発明のパタン認識方式の一構成
例を示すブロツク図である。 1……認識部、2……未知パタンエリア、3…
…標準パタンエリア、4……類似度算出部、10
……類似度格納部、11……標準パタン選出部、
7……標準パタン格納部。
FIG. 1 is a block diagram showing a conventional pattern recognition method, FIG. 2 is an explanatory diagram illustrating an example of the configuration of a standard pattern, and FIG. 3 is a block diagram showing an example of the configuration of the pattern recognition method of the present invention. . 1... Recognition section, 2... Unknown pattern area, 3...
...Standard pattern area, 4...Similarity calculation section, 10
...similarity storage unit, 11...standard pattern selection unit,
7...Standard pattern storage section.

Claims (1)

【特許請求の範囲】[Claims] 1 未知パタンと複数の標準パタンとの類似度を
算出する認識部と、認識部とは別に複数の標準パ
タンを格納している標準パタン格納部と、前記認
識部に与える標準パタンを前記標準パタン格納部
から複数選出する標準パタン選出部と、前記認識
部に与えられた過去の未知のパタンと、過去の標
準パタン間の類似度を記憶する類似度格納部とを
有し、前記認識部から出力される類似度と前記類
似度格納部とにより累積類似度を算出して、類似
度格納部の内容を更新するとともに、この累積類
似度により次の未知パタンが入力された時の前記
認識部に与える次の複数の標準パタンを、前記標
準パタン選出部から選出する事を特徴としたパタ
ン認識方式。
1. A recognition unit that calculates the degree of similarity between an unknown pattern and a plurality of standard patterns, a standard pattern storage unit that stores a plurality of standard patterns separately from the recognition unit, and a standard pattern that is given to the recognition unit as the standard pattern. It has a standard pattern selection section that selects a plurality of standard patterns from the storage section, and a similarity storage section that stores the similarity between the past unknown patterns given to the recognition section and the past standard patterns. A cumulative similarity is calculated using the output similarity and the similarity storage section, and the contents of the similarity storage section are updated, and the recognition section uses this cumulative similarity when the next unknown pattern is input. A pattern recognition method characterized in that the next plurality of standard patterns to be given to the standard pattern are selected from the standard pattern selection section.
JP56116969A 1981-07-24 1981-07-24 Pattern recognizing system Granted JPS5818778A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56116969A JPS5818778A (en) 1981-07-24 1981-07-24 Pattern recognizing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56116969A JPS5818778A (en) 1981-07-24 1981-07-24 Pattern recognizing system

Publications (2)

Publication Number Publication Date
JPS5818778A JPS5818778A (en) 1983-02-03
JPH0226262B2 true JPH0226262B2 (en) 1990-06-08

Family

ID=14700231

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56116969A Granted JPS5818778A (en) 1981-07-24 1981-07-24 Pattern recognizing system

Country Status (1)

Country Link
JP (1) JPS5818778A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04163955A (en) * 1990-10-29 1992-06-09 Yamaha Corp Semiconductor device

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2522837B2 (en) * 1989-09-19 1996-08-07 富士通株式会社 Wafer-scale semiconductor device

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54148327A (en) * 1978-05-12 1979-11-20 Fujitsu Ltd Graphic recognizing device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54148327A (en) * 1978-05-12 1979-11-20 Fujitsu Ltd Graphic recognizing device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04163955A (en) * 1990-10-29 1992-06-09 Yamaha Corp Semiconductor device

Also Published As

Publication number Publication date
JPS5818778A (en) 1983-02-03

Similar Documents

Publication Publication Date Title
US5797116A (en) Method and apparatus for recognizing previously unrecognized speech by requesting a predicted-category-related domain-dictionary-linking word
US6751595B2 (en) Multi-stage large vocabulary speech recognition system and method
US6725197B1 (en) Method of automatic recognition of a spelled speech utterance
US6961706B2 (en) Speech recognition method and apparatus
CN106663424A (en) Device and method for understanding user intent
CN110675871B (en) Voice recognition method and device
JP2002123279A (en) Institution retrieval device and its method
US6879953B1 (en) Speech recognition with request level determination
JP2000293191A (en) Device and method for voice recognition and generating method of tree structured dictionary used in the recognition method
JPH0226262B2 (en)
JP2006023572A (en) Dialog system
JP3663012B2 (en) Voice input device
JPH09114493A (en) Interaction controller
JP2980382B2 (en) Speaker adaptive speech recognition method and apparatus
JP2000305590A (en) Speech recognition method
JPS61148497A (en) Standard pattern generator
JP3369121B2 (en) Voice recognition method and voice recognition device
JPH049320B2 (en)
JP2001051690A (en) Pattern recognition device
JP3817784B2 (en) Speech recognition apparatus and speech recognition method
JPH1185182A (en) Speaker recognition method and its apparatus
JPH01118966A (en) Pattern recognizing device
JP2001222557A (en) Brand similarity judging system
JPH0115079B2 (en)
JPH07104675A (en) Recognition result display method