JPH0654503B2 - Pattern recognition device - Google Patents

Pattern recognition device

Info

Publication number
JPH0654503B2
JPH0654503B2 JP58215230A JP21523083A JPH0654503B2 JP H0654503 B2 JPH0654503 B2 JP H0654503B2 JP 58215230 A JP58215230 A JP 58215230A JP 21523083 A JP21523083 A JP 21523083A JP H0654503 B2 JPH0654503 B2 JP H0654503B2
Authority
JP
Japan
Prior art keywords
pattern
recognition
input
category
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58215230A
Other languages
Japanese (ja)
Other versions
JPS60107192A (en
Inventor
洋一 竹林
英範 篠田
宏之 坪井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58215230A priority Critical patent/JPH0654503B2/en
Publication of JPS60107192A publication Critical patent/JPS60107192A/en
Publication of JPH0654503B2 publication Critical patent/JPH0654503B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、認識率の向上を効果的に図り得るパターン認
識装置に関する。
TECHNICAL FIELD OF THE INVENTION The present invention relates to a pattern recognition device that can effectively improve the recognition rate.

〔発明の技術的背景とその問題点〕[Technical background of the invention and its problems]

近時、文字認識,音声認識,図面読取等のパターン認識
技術の発達が目覚ましく、例えば音声ワードプロセッ
サ,回路図面読取装置等が実用化の段階に入りつつあ
る。然し乍ら、不特定多数の利用者を対象とするパター
ン認識や、認識対象とするカテゴリ数が多いパターン認
識にあっては、未だに認識率が低く、パターン認識技術
における大きな課題となっている。
Recently, pattern recognition techniques such as character recognition, voice recognition, and drawing reading have been remarkably developed. For example, a voice word processor, a circuit drawing reading device, and the like are entering the stage of practical application. However, in pattern recognition targeting an unspecified number of users and pattern recognition in which the number of categories to be recognized is large, the recognition rate is still low, which is a major problem in pattern recognition technology.

ところで、認識率の向上を図る為には、予め多数のパタ
ーンを収集して学習を行い、パターン認識に供する認識
用の辞書を十分に作成しておけば良いことが知られてい
る。然し、認識対象とするカテゴリが多数の場合、例え
ば数千種の漢字を認識対象とする場合には、それらの漢
字の変形されたパターンまで十分多く収集することは実
際上殆んど不可能である。しかも、不特定多数の利用者
を対象とするとき、パターン入力者の個性的な癖の影響
が多大であり、この癖に起因するパターンの変形に十分
対処することが甚だ困難であると云う不具合がある。ま
たこれを回避するべく、パターンの繰返し入力を行わし
めて学習を行うには、パターン入力者にあまりにも多大
な負担を強いることになる。
By the way, in order to improve the recognition rate, it is known that a large number of patterns are collected and learned in advance, and a dictionary for recognition used for pattern recognition is sufficiently prepared. However, when there are a large number of categories to be recognized, for example, when thousands of kanji are to be recognized, it is practically impossible to collect sufficiently many deformed patterns of those kanji. is there. Moreover, when targeting an unspecified large number of users, the unique habit of the pattern input person has a great influence, and it is extremely difficult to sufficiently deal with the deformation of the pattern caused by this habit. There is. Further, in order to avoid this, if the pattern input is repeated and learning is performed, the pattern input person is forced to bear too much burden.

〔発明の目的〕[Object of the Invention]

本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、パターン認識に供する特定利用
者や特定利用環境に適応できるように効果的に学習用パ
ターンを収集して通常の認識辞書を充実させることがで
き、もって認識辞書を学習させるための利用者負担を軽
減でき、しかも認識率の向上を図り得る実用性の高いパ
ターン認識装置を提供することにある。
The present invention has been made in consideration of such circumstances, and its purpose is to collect learning patterns effectively so as to adapt to a specific user or a specific usage environment for pattern recognition. It is possible to provide a highly practical pattern recognition device that can enhance the recognition dictionary, reduce the burden on the user for learning the recognition dictionary, and can improve the recognition rate.

〔発明の概要〕[Outline of Invention]

本発明は、次の点に着目したものである。すなわち、パ
ターン認識の際に誤認識が生じるのは、利用者の個人性
や、利用環境や、認識対象カテゴリ間の類似性に依存
し、ある特定のカテゴリに誤認識が集中している。した
がって、多くのカテゴリについては通常の認識辞書でカ
バーできることになる。
The present invention focuses on the following points. That is, what causes misrecognition during pattern recognition depends on the individuality of the user, the usage environment, and the similarity between recognition target categories, and misrecognition is concentrated in a specific category. Therefore, many categories can be covered by a normal recognition dictionary.

このようなことから、本発明に係るパターン認識装置で
は、入力パターンを認識辞書と照合して上記入力パター
ンを認識する認識手段と、この認識手段の認識結果に基
づいて入力パターンにおける真のカテゴリと誤認識結果
として求められたカテゴリとを特定する手段と、この手
段により特定された各カテゴリに基づいて、誤認識を引
き起こした真のカテゴリを含むパターン及び誤認識結果
として求められたカテゴリを含むパターンを学習用のパ
ターンとして入力する手段と、この手段により入力され
た各パターンを用いて前記認識辞書の学習・更新を行う
手段とを備えたものとなっている。
Therefore, in the pattern recognition device according to the present invention, the recognition means for recognizing the input pattern by collating the input pattern with the recognition dictionary, and the true category in the input pattern based on the recognition result of the recognition means Means for identifying the category obtained as the misrecognition result, and a pattern including the true category that caused the misrecognition and a pattern including the category obtained as the misrecognition result, based on each category identified by this means Is input as a learning pattern, and a means for learning / updating the recognition dictionary using each pattern input by this means.

つまり、入力パターンに対する認識結果に基づいて、誤
認識あるいはコンフリクトを生じやすい、特定のカテゴ
リを含むパターンを用いてその認識辞書の学習を行わし
めることにより、上記認識辞書の性能向上,充実化等を
簡易に、且つ効率良く図るようにしたものである。
In other words, based on the recognition result for the input pattern, the recognition dictionary is learned by using a pattern including a specific category that is likely to cause erroneous recognition or conflict, so that the performance of the recognition dictionary can be improved or enhanced. It is designed to be simple and efficient.

〔発明の効果〕〔The invention's effect〕

かくして本発明によれば、入力パターンの認識結果に基
づいて学習すべき認識対象パターンの収集を行い、例え
ば誤認識やコンフリクトの生じ易いパターンを収集して
認識辞書の学習を行うので、通常の認識辞書を少数の学
習用パターンの収集により容易に信頼性の高い認識辞書
に作成し直してその認識率の向上を図ることが可能とな
る。つまり、比較的少ない入力パターンデータを有効に
利用して上記認識辞書の充実化を容易に図ることが可能
となる。
Thus, according to the present invention, the recognition target pattern to be learned is collected based on the recognition result of the input pattern, and for example, the recognition dictionary is learned by collecting the patterns that are likely to cause misrecognition and conflicts. By collecting a small number of learning patterns, the dictionary can be easily re-created as a highly reliable recognition dictionary to improve the recognition rate. That is, it is possible to easily utilize the relatively small amount of input pattern data and easily enhance the recognition dictionary.

〔発明の実施例〕Example of Invention

以下、図面を参照して本発明の実施例につき説明する。 Embodiments of the present invention will be described below with reference to the drawings.

第1図は実施例装置の概略構成図である。この装置を構
成する各要素は、その認識対象によってそれぞれ異なる
が、基本的には次のように構成される。パターン入力部
1は、認識対象とするパターン・データを入力するもの
で、このパターン入力部1を介して入力されたパターン
は前処理部2においてその特徴が抽出される。認識部3
はこのようにして前処理部2が求めた前記入力パターン
の特徴ベクトルと、辞書記憶部4に予め登録されている
複数のカテゴリの認識用辞書との間の距離や類似度、具
体的にはそのマハラノビス距離やユークリッド距離を求
めたり、またその複合類似度を計算する等して認識処理
を行っている。そして、その最小距離、または最大類似
度を持つ認識辞書の予め既知なるカテゴリを前記入力パ
ターンの認識結果として求めている。このようにして求
められた認識結果が、表示部5を介してパターン入力者
(利用者)に提示される。
FIG. 1 is a schematic configuration diagram of the embodiment apparatus. Each element that constitutes this device is different depending on its recognition target, but is basically configured as follows. The pattern input unit 1 inputs pattern data to be recognized, and the features of the pattern input via the pattern input unit 1 are extracted by the preprocessing unit 2. Recognition unit 3
Is the distance or similarity between the feature vector of the input pattern thus obtained by the preprocessing unit 2 and the recognition dictionary of a plurality of categories registered in the dictionary storage unit 4, specifically, The Mahalanobis distance and the Euclidean distance are obtained, and the composite similarity is calculated to perform recognition processing. Then, a previously known category of the recognition dictionary having the minimum distance or the maximum similarity is obtained as the recognition result of the input pattern. The recognition result thus obtained is presented to the pattern input person (user) via the display unit 5.

ここで、認識対象とするパターンが単音節音声や、単語
音声である場合、前記パターン入力部1はマイクロホン
や、このマイクロホンを介して得られた入力信号を増幅
する増幅器等によって構成される。そして、前処理部2
は、例えば16チャンネルのフィルタバンクを通した出
力を2乗検波し、更にこれを単音節毎に時間方向に16
フレームに亘ってリサンプルして合計256点の特徴ベ
クトルを求める如く構成される。また単語音声の場合に
は、例えば上記の如き単音節特徴ベクトルの組合せとし
て、その特徴ベクトルが表現される。
Here, when the pattern to be recognized is a monosyllabic voice or a word voice, the pattern input unit 1 is composed of a microphone, an amplifier that amplifies an input signal obtained through the microphone, and the like. And the preprocessing unit 2
For example, square-law detection is performed on the output that has passed through a filter bank of 16 channels, and this is further detected in the time direction by 16
It is configured to resample over a frame to obtain a total of 256 feature vectors. In the case of word speech, the feature vector is expressed as a combination of the single syllable feature vectors as described above.

また、認識対象が手書された文字パターン等の場合に
は、パターン入力部1は光電変換器等によって構成さ
れ、また前処理部2は文字パターン像に所謂ボケ操作を
加える等して、その特徴ベクトルを抽出する如く構成さ
れる。尚、このような文字パターン等を認識対象とする
場合には、第2図にその要部構成を示すように、特徴ベ
クトル抽出された入力パターンを一旦、パターンメモリ
6に格納しておくようにすれば都合が良い。
When the recognition target is a handwritten character pattern or the like, the pattern input unit 1 is composed of a photoelectric converter or the like, and the preprocessing unit 2 adds a so-called blur operation to the character pattern image to It is configured to extract a feature vector. When such a character pattern or the like is to be recognized, the input pattern extracted from the feature vector should be temporarily stored in the pattern memory 6 as shown in FIG. It will be convenient if you do.

その他、認識対象とするパターンの種別に応じてパター
ン入力部1および前処理部2を構成し、その認識に適し
た入力パターンの特徴ベクトルを抽出すれば良いこと
は、云うまでもない。また、このようにして抽出された
入力パターンの特徴ベクトルに基ずく認識処理も、従来
より種々提唱されている方式を適宜用いれば良いことは
勿論である。
In addition, it goes without saying that the pattern input unit 1 and the preprocessing unit 2 may be configured according to the type of the pattern to be recognized, and the feature vector of the input pattern suitable for the recognition may be extracted. In addition, it goes without saying that the recognition processing based on the feature vector of the input pattern extracted in this way may appropriately use various conventionally proposed methods.

ところで、本発明装置が特徴とするところは、上記の如
く構成された一般的な構成のパターン認識装置本体に加
えて、辞書記憶部4に格納された認識辞書を、前記装置
本体の認識結果に従って学習・更新を行わしめるように
した点にある。学習用入力カテゴリ決定部7は、前記認
識部3が得た認識結果、およびその認識結果に対するパ
ターン入力者の合・否の指示情報等を入力し、これに基
づいて学習すべきカテゴリを決定するものである。例え
ば認識結果に対する「正」「誤」「コンフリクト」の情
報や、認識処理過程で得られた候補カテゴリの順位とそ
の類似度値等から、入力パターンに対するコンフュージ
ョン・マトリックスを作成し、このコンフュージョン・
マトリックスから学習すべきパターンを決定している。
具体的には、誤認識結果を招いたカテゴリを含むパター
ン、および誤認識結果として求められたカテゴリを含む
パターンを学習対象用のパターンとして決定し、またコ
ンフリクトが生じたカテゴリの組合せを調べ、これらの
カテゴリの組を含むパターン学習対象として決定してい
る。しかして入力カテゴリ決定部7は、このようにして
求めた学習対象とするカテゴリを含むパターンの入力を
前記表示部5を介してパターン入力者(利用者)に促し
ている。学習部8は、このような入力要求に応じて入力
されたパターンを用いて、前記辞書記憶部4に登録され
ている認識辞書について学習を行い、その更新を行って
いる。この学習は、例えば入力パターンの1組または複
数組の特徴ベクトルを抽出し、誤りを生じたカテゴリ間
の特徴ベクトルの差異から、その両者を識別するに有効
な特徴ベクトル成分を辞書パターンに加える等して行わ
れる。これによって、辞書パターンは、パターン入力者
に適合したものとなる。
By the way, the feature of the device of the present invention is that in addition to the main body of the pattern recognition device configured as described above, the recognition dictionary stored in the dictionary storage unit 4 is used in accordance with the recognition result of the device body. The point is that learning and updating can be done. The learning input category determination unit 7 inputs the recognition result obtained by the recognition unit 3 and the instruction information of the pass / fail of the pattern input person for the recognition result, and determines the category to be learned based on this. It is a thing. For example, a confusion matrix for the input pattern is created from the information of “correct”, “wrong”, and “conflict” for the recognition result, the rank of the candidate category obtained in the recognition process and the similarity value, and the confusion matrix is created.・
The matrix determines the patterns to be learned.
Specifically, a pattern including a category that causes an erroneous recognition result and a pattern including a category obtained as the erroneous recognition result are determined as patterns for learning, and a combination of categories in which a conflict has occurred is checked. It is determined as a pattern learning target including a set of categories. Then, the input category determination unit 7 prompts the pattern input person (user) via the display unit 5 to input the pattern including the category to be learned thus obtained. The learning unit 8 learns the recognition dictionary registered in the dictionary storage unit 4 using the pattern input in response to such an input request and updates the recognition dictionary. In this learning, for example, one set or a plurality of sets of feature vectors of the input pattern are extracted, and a feature vector component effective for discriminating the two is added to the dictionary pattern from the difference between the feature vectors between the categories in which an error occurs. Done. This makes the dictionary pattern suitable for the person who inputs the pattern.

尚、学習パターンの収集を、誤認識あるいはコンフリク
トの度合いに応じてその入力回数を定めて行うようにす
れば、そのパターンについての学習を集中的に、且つ効
果的に行い得るので都合が良い。また、予め誤認識或い
はコンフリクトが予想されるパターンが存在する場合に
は、パターン認識処理に先立って、そのパターンの入力
を要求し、これに対して入力されたパターンに従って認
識辞書の学習を行った上で上記パターン認識処理を行う
ことも有効である。
It should be noted that it is convenient to collect the learning patterns by setting the number of times of inputting the learning patterns in accordance with the degree of erroneous recognition or conflict, because the learning of the patterns can be intensively and effectively performed. Further, when there is a pattern in which misrecognition or conflict is expected in advance, the input of the pattern is requested prior to the pattern recognition processing, and the recognition dictionary is learned according to the input pattern. It is also effective to perform the above pattern recognition processing.

尚、第1図中9は、これらの一連の制御を司どる制御部
を示している。
It should be noted that reference numeral 9 in FIG. 1 denotes a control unit that controls these series of controls.

かくしてこのように構成された装置によれば、予め登録
された辞書パターンに基づいて認識処理された認識結果
から、誤認識あるいはコンフリクトを生じ易いカテゴリ
だけを選択し、その誤認識結果を招来したカテゴリを含
むパターンおよび、誤認識結果として得られたカテゴリ
を含むパターンからなる少数のパターンデータのみを収
集して、その学習を行うので、学習を行わせるためのパ
ターンデータの収集に大きな負担を招くことがない。ま
た上記の如き少数のパターンデータにて、認識辞書の効
果的な学習を行い得るので、その認識辞書をパターン入
力者に適応した信頼性の高いものとすることができる。
これ故、認識率の向上を効果的に図ることが可能とな
る。
Thus, according to the device configured as described above, from the recognition results subjected to the recognition process based on the dictionary pattern registered in advance, only the categories that are likely to cause misrecognition or conflict are selected, and the category that causes the misrecognition result is selected. It collects only a small number of pattern data consisting of patterns that include and patterns that include categories obtained as a result of misrecognition, and then learns them, which incurs a large burden on the collection of pattern data for learning. There is no. Further, since the recognition dictionary can be effectively learned with a small number of pattern data as described above, the recognition dictionary can be made highly reliable and adapted to the person who inputs the pattern.
Therefore, it is possible to effectively improve the recognition rate.

次に本発明装置の具体的な作用例につき説明する。Next, a specific operation example of the device of the present invention will be described.

第3図は単音節音声パターンの認識を行う場合の処理の
流れを示すものである。例えば、不特定話者用の認識辞
書を備えた装置を用いて、特定話者に適合したパターン
認識装置を実現する場合、先ずCRT等の表示部5を用い
て入力すべき単音節を、単音節の組合せからなる単語と
して発声入力を促す。そして、これらの各単語を構成す
る単音節についてそれぞれ認識処理を行い、その認識結
果からコンフュージョン・マトリックスを作成する。こ
のとき、入力パターンを記憶しておき、後での学習に利
用することが好ましい。しかるのち、多数の認識結果か
ら、誤認識結果を招いた入力パターンのカテゴリと、誤
認識結果として求められたカテゴリ、更にはコンフリク
トを生じたカテゴリの組を抽出する。しかるのち、これ
らのカテゴリを含んで構成される単音節音声の系列、例
えば単語の発声入力を要求し、その入力音声中の学習対
象となる単音節についてその特徴ベクトルを求める。こ
のようにして求められた各単音節パターンの特徴ベクト
ルに従って、認識辞書の学習を行う。例えば単音節
「ぱ」が「あ」に誤認識される確率が高い場合には、上
記単音節「ぱ」を含む単語(例えば「か・ん・ぱ・
い」)および単音節「あ」を含む単語(例えば「し・あ
・い」)の入力パターンについてそれぞれ該当単音節の
特徴ベクトルの抽出を行い、その単音節カテゴリについ
ての辞書の学習を行う。
FIG. 3 shows the flow of processing when recognizing a monosyllabic voice pattern. For example, when implementing a pattern recognition device suitable for a specific speaker by using a device equipped with a recognition dictionary for an unspecified speaker, first, a single syllable to be input is displayed on the display unit 5 such as a CRT. Prompt for vocalization as a word consisting of syllable combinations. Then, the recognition process is performed on each of the monosyllabic words that form each of these words, and a confusion matrix is created from the recognition result. At this time, it is preferable to store the input pattern and use it for later learning. After that, a set of the category of the input pattern that causes the erroneous recognition result, the category obtained as the erroneous recognition result, and the category in which the conflict occurs are extracted from a large number of recognition results. After that, a sequence of monosyllabic voices including these categories, for example, a voicing input of a word is requested, and the feature vector of the learning target single syllable in the input voice is obtained. The recognition dictionary is learned according to the feature vector of each monosyllabic pattern thus obtained. For example, when there is a high probability that a single syllable "pa" is mistakenly recognized as "a", a word including the single syllable "pa" (for example, "ka-n-pa-
I)) and a single syllable "a" (for example, "shi-a-i") input pattern, the feature vector of the corresponding monosyllabic is extracted, and the dictionary for the monosyllabic category is learned.

尚、不特定話者の音声認識装置としては、公衆電話回線
を介して入力された都市名等の単語音声認識が考えられ
る。このような入力形態の場合、一般に回線の伝送特性
等に起因して入力パターンの変動が多く、認識対象語彙
の変更に際しては、大量の入力単語音声パターンを使用
して学習を行い認識辞書を作成することが必要である。
しかしながら、認識辞書を効果的に学習する場合、本装
置にあっては次のように対話形式で辞書学習が進められ
る。即ち、音声認識システムを運用中に、音声が入力さ
れた場合、その認識結果を、例えば、音声合成器を介し
て入力者に伝える。例えば、「浜松(ハママツ)」なる
音声入力に対して、認識結果の第1位を『只今の入力
は、「高松」ですね』等の応答により入力し、『いい
え』なる返答に対して、認識結果を、第2位から順に出
力し、認識結果の確認を行う。この場合、『はい』,
『いいえ』等は、他の音声と明らかに異なり、両者を明
確に識別することが容易であるから、合・否判定の情報
としてそのまま利用することができる。このようにし
て、単語音声入力に対して確認を行うことにより、入力
パターンの真のカテゴリと誤認識結果として求められた
カテゴリとの対応がとれるので、第4図に示すごとく、
システム運用時に、認識結果のコンフュージョンマトリ
ックスを容易に作成することができる。従って、このコ
ンフュージョンマトリックスに従って、その学習すべき
カテゴリを決定し、そのパターン入力を促すか、そのカ
テゴリのパターンの収集をシステム運用時に行うことに
よって、単語辞書の学習を効果的に行うことができる。
As a voice recognition device for an unspecified speaker, word voice recognition of a city name or the like input via a public telephone line can be considered. In the case of such an input form, generally, there are many variations in the input pattern due to the transmission characteristics of the line, etc. When changing the recognition target vocabulary, a large amount of input word voice patterns are used for learning and a recognition dictionary is created. It is necessary to.
However, in the case of effectively learning the recognition dictionary, in the present device, dictionary learning is proceeded interactively as follows. That is, when voice is input during operation of the voice recognition system, the recognition result is transmitted to the input person via, for example, a voice synthesizer. For example, in response to a voice input "Hamamatsu", the first place of the recognition result is input by a response such as "The input is" Takamatsu "isn't it?" The recognition result is output in order from the second rank, and the recognition result is confirmed. In this case, "Yes",
Since "No" and the like are clearly different from other voices and it is easy to clearly distinguish them, they can be used as they are as information for pass / fail determination. In this way, by confirming the word voice input, the correspondence between the true category of the input pattern and the category obtained as the erroneous recognition result can be obtained. Therefore, as shown in FIG.
When operating the system, a confusion matrix of recognition results can be easily created. Therefore, it is possible to effectively learn the word dictionary by determining the category to be learned according to the confusion matrix and urging the pattern input or collecting the pattern of the category during system operation. .

更に、特定話者用の連続数字音声認識装置の場合、数字
の組合せの数が多大であるため、その認識辞書の学習は
困難であったが、第5図に示すような手順で効果的に行
える。即ち、初期学習用の入力すべき数字系列、例え
ば、『3・6・5・3』,『3・7・5・3』,『4・
3・6・9』等を入力話者に提示し、認識装置は不特話
者の認識辞書を用いて、上記入力音声を順次、認識し、
認識結果を記憶する。このとき、連続数字音声パターン
も記憶すると効果的である。このようにして得られた、
初期学習用の連続数字音声の認識結果を用いて、次のよ
うに認識辞書の学習に使用する連続数字が決定される。
すなわち、入力された連続数字音声『4・3・6・9』
が『4・3・5・9』に誤認識されている場合等には、
「6・9」を含む、連接数字音声を学習に用いる。例え
ば、『3・8・6・9』,『6・9』,『2・6・9』
等を話者に提示し、対応する連続音声を入力し、学習す
べき数字音声・パターン部を切り出し、その入力話者に
適応した認識辞書を作成する。かくして、本実施例装置
によれば、話者により異なる数字と数字を連続して発話
する際の癖を利用者に負担をかけずに効果的に学習でき
るため好都合である。
Further, in the case of a continuous numeral voice recognition device for a specific speaker, it was difficult to learn the recognition dictionary because of the large number of combinations of numbers, but the procedure shown in FIG. You can do it. That is, a numerical sequence to be input for initial learning, for example, “3/6/5/3”, “3/7/5/3”, “4.
3/6/9 ”etc. are presented to the input speaker, and the recognition device sequentially recognizes the input voice using the recognition dictionary of the non-special speaker.
The recognition result is stored. At this time, it is effective to store the continuous numeric voice pattern. Thus obtained,
Using the recognition result of the continuous number voice for initial learning, the continuous number used for learning the recognition dictionary is determined as follows.
That is, the input continuous numeric voice “4,3,6,9”
Is mistakenly recognized as "4, 3, 5, 9", etc.,
Concatenated numeral voices including "6.9" are used for learning. For example, "3,8,6,9", "6,9", "2,6,9"
Etc. are presented to the speaker, the corresponding continuous voice is input, the numerical voice / pattern part to be learned is cut out, and a recognition dictionary suitable for the input speaker is created. Thus, the apparatus according to the present embodiment is advantageous because it is possible to effectively learn different numbers depending on the speaker and the habit of continuously speaking the numbers without burdening the user.

尚、このような連続数字音声認識装置は、不特定話者の
ものを基本としなくても、始めから、特定話者用に構成
することも可能である。
It is to be noted that such a continuous numeral voice recognition device can be configured for a specific speaker from the beginning even if it is not based on that of an unspecified speaker.

さらに、本実施例は、他の連続単語認識にも適用可能で
ある。
Furthermore, the present embodiment can be applied to other continuous word recognition.

ところで、以上の例は入力パターンを音声として与える
ものであるが、手書文字パターンの認識等にあっては、
同様に本発明を適用できる。この場合には、例えば第6
図に示すようにして辞書学習を行うようにすれば良い。
即ち、認識対象を漢字パターンとした場合、その数は極
めて多い。従って、手書入力された文字パターンを認識
処理し乍ら、その認識結果のコンフュージョン・マトリ
ックスを作成する。そして誤認識やコンフリクトが生じ
た文字パターンカテゴリや、その誤認識されたカテゴリ
から類推されるカテゴリについてその入力を促し、これ
らの入力パターンを用いてその辞書学習を行わしめる。
例えば一般的に「識,織,職」や「7,ワ,ク,フ」等
にコンフリクトが生じることが多いので、これらのカテ
ゴリについてそれぞれ認識辞書の学習を行うようにす
る。
By the way, although the above example gives an input pattern as a voice, in recognition of a handwritten character pattern, etc.,
The present invention can be similarly applied. In this case, for example, the sixth
Dictionary learning may be performed as shown in the figure.
That is, when the recognition target is a Chinese character pattern, the number is extremely large. Therefore, the character pattern input by handwriting is recognized and a confusion matrix of the recognition result is created. Then, the user is prompted to input a character pattern category in which erroneous recognition or conflict has occurred, or a category inferred from the erroneously recognized category, and the dictionary learning is performed using these input patterns.
For example, in general, a conflict often occurs in "knowledge, texture, job" and "7, wa, ku, fu", etc. Therefore, the recognition dictionary is learned for each of these categories.

このようにすれば、前述した音声認識の場合と同様に、
認識辞書の効果的な学習を行うことが可能となる。
By doing this, as in the case of the voice recognition described above,
It becomes possible to effectively learn the recognition dictionary.

また更に本発明は、話者認識や筆者認識における辞書パ
ターンの学習についても適用することができる。また、
手書図面読取装置における記号・形状認識、また画像入
力された物体に対する品質認識についても適用可能であ
る。即ち、この品質認識にあっては、画像入力された物
体の形状・大きさ・色等の特徴を抽出し、そのクラス分
け(ランク付)を行うが、この場合、上記ランク分けの
基準となるパラメータを前記物体に適応して学習させる
必要があり、このような認識辞書の学習についても本発
明が適用可能である。
Furthermore, the present invention can be applied to learning a dictionary pattern in speaker recognition and writer recognition. Also,
The present invention is also applicable to symbol / shape recognition in a handwriting drawing reading device and quality recognition for an object whose image has been input. That is, in this quality recognition, features such as shape, size, and color of the image-inputted object are extracted and classified (ranked), which in this case serves as a criterion for ranking. It is necessary to adapt the parameters to the object and learn them, and the present invention can be applied to the learning of such a recognition dictionary.

以上説明したように、本発明によれば入力パターンの認
識結果に基づいて、誤認識やコンフリクトの生じ易いカ
テゴリについてのみ集中的に認識辞書の学習を行うの
で、認識辞書を簡易に効率良くパターン入力者に適合さ
せることができる。そして、正しい認識結果が得られる
カテゴリについては格別学習を行うことがないので、そ
の学習効果が非常に高い。これ故、認識対象とするカテ
ゴリ数が多大なときや、入力パターンの変形が多いと
き、またパターン入力者の個性の影響が、つまり入力パ
ターンの変形が大きいとき、更には類似したカテゴリが
多いとき等、辞書の適応化に多大な効果が奏せられる。
そして、全ての認識対象カテゴリについてパターンデー
タを収集することなく、必要最小限の誤認識を生じ易い
カテゴリを含むパターンのみを収集して、その少数のパ
ターンを有効に用いて辞書学習を行い得る。従って、パ
ターン収集の為のパターン提供者に対する負担を大幅に
軽減することができる。
As described above, according to the present invention, based on the recognition result of the input pattern, the recognition dictionary is intensively learned only for the categories in which erroneous recognition and conflicts are likely to occur. Can be adapted to any person. Further, since the special learning is not performed for the category in which the correct recognition result is obtained, the learning effect is very high. Therefore, when there are a large number of categories to be recognized, when there are many deformations of the input pattern, and when the effect of the individuality of the pattern input person, that is, when the deformation of the input pattern is large, and when there are many similar categories For example, a great effect can be achieved in adapting the dictionary.
Then, without collecting the pattern data for all the recognition target categories, only the patterns including the minimum necessary category that easily causes misrecognition can be collected, and the dictionary learning can be performed by effectively using the small number of patterns. Therefore, the burden on the pattern provider for pattern collection can be significantly reduced.

尚、本発明は上述した実施例に限定されるものではな
い。例えば入力パターンを表わす特徴ベクトルの種類
や、その特徴ベクトルを用いたパターン認識法について
は、従来知られた種々の方式をその用途に応じて適宜用
いればよい。また、上述した例以外のパターン認識にも
適用可能できることは云うまでもなく、要するに本発明
はその要旨を逸脱しない範囲で種々変形して実施でき
る。
The present invention is not limited to the above embodiment. For example, regarding the type of feature vector representing the input pattern and the pattern recognition method using the feature vector, various conventionally known methods may be appropriately used according to the application. Further, it goes without saying that the present invention can be applied to pattern recognition other than the above-mentioned examples, and in short, the present invention can be variously modified and implemented without departing from the scope of the invention.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の一実施例装置の基本構成図、第2図は
変形例を示す要部構成図、第3図乃至第6図は実施例装
置における学習処理の流れを示す図である。 1…パターン入力部、2…前処理部、3…認識部、4…
辞書記憶部、5…表示部、6…パターンメモリ、7…学
習用入力カテゴリ決定部、8…学習部、9…制御部。
FIG. 1 is a basic configuration diagram of an embodiment apparatus of the present invention, FIG. 2 is a principal configuration diagram showing a modified example, and FIGS. 3 to 6 are views showing a flow of learning processing in the embodiment apparatus. . 1 ... Pattern input section, 2 ... Preprocessing section, 3 ... Recognition section, 4 ...
Dictionary storage unit, 5 ... Display unit, 6 ... Pattern memory, 7 ... Learning input category determination unit, 8 ... Learning unit, 9 ... Control unit.

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】入力パターンを認識辞書と照合して上記入
力パターンを認識する認識手段と、この認識手段の認識
結果に基づいて入力パターンにおける真のカテゴリと誤
認識結果として求められたカテゴリとを特定する手段
と、この手段により特定された各カテゴリに基づいて、
誤認識を引き起こした真のカテゴリを含むパターン及び
誤認識結果として求められたカテゴリを含むパターンを
学習用のパターンとして入力する手段と、この手段によ
り入力された各パターンを用いて前記認識辞書の学習・
更新を行う手段とを具備してなることを特徴とするパタ
ーン認識装置。
1. A recognition means for recognizing the input pattern by collating the input pattern with a recognition dictionary, and a true category in the input pattern and a category obtained as an erroneous recognition result based on the recognition result of the recognition means. Based on the means to identify and each category identified by this means,
Means for inputting, as a learning pattern, a pattern including a true category that has caused misrecognition and a pattern including a category obtained as a misrecognition result, and learning of the recognition dictionary by using each pattern input by this means・
A pattern recognition device comprising means for updating.
【請求項2】前記カテゴリは、パターンの構成要素の一
部または全部であり、 前記入力する手段は、前記決定されたカテゴリを含むパ
ターンの入力をユーザに要求する手段を含んでいること
を特徴とする特許請求の範囲第1項記載のパターン認識
装置。
2. The category is a part or all of the constituent elements of a pattern, and the means for inputting includes means for requesting a user to input a pattern including the determined category. The pattern recognition device according to claim 1.
JP58215230A 1983-11-16 1983-11-16 Pattern recognition device Expired - Lifetime JPH0654503B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58215230A JPH0654503B2 (en) 1983-11-16 1983-11-16 Pattern recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58215230A JPH0654503B2 (en) 1983-11-16 1983-11-16 Pattern recognition device

Publications (2)

Publication Number Publication Date
JPS60107192A JPS60107192A (en) 1985-06-12
JPH0654503B2 true JPH0654503B2 (en) 1994-07-20

Family

ID=16668861

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58215230A Expired - Lifetime JPH0654503B2 (en) 1983-11-16 1983-11-16 Pattern recognition device

Country Status (1)

Country Link
JP (1) JPH0654503B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6385883A (en) * 1986-09-29 1988-04-16 Toshiba Corp Pattern recognition studying device
JPH05159063A (en) * 1991-12-09 1993-06-25 Nippon Telegr & Teleph Corp <Ntt> Image retrieving device
JPH05159064A (en) * 1991-12-09 1993-06-25 Nippon Telegr & Teleph Corp <Ntt> Image searching device

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58156998A (en) * 1982-03-12 1983-09-19 日本電気株式会社 Information input unit
JPS59133599A (en) * 1983-01-20 1984-07-31 三洋電機株式会社 Voice recognition equipment

Also Published As

Publication number Publication date
JPS60107192A (en) 1985-06-12

Similar Documents

Publication Publication Date Title
JP2607457B2 (en) Pattern recognition device
US6208971B1 (en) Method and apparatus for command recognition using data-driven semantic inference
JP5330450B2 (en) Topic-specific models for text formatting and speech recognition
US4769845A (en) Method of recognizing speech using a lip image
CN105931644B (en) A kind of audio recognition method and mobile terminal
US6487532B1 (en) Apparatus and method for distinguishing similar-sounding utterances speech recognition
US8195459B1 (en) Augmentation and calibration of output from non-deterministic text generators by modeling its characteristics in specific environments
JPH0634185B2 (en) Input word recognition device
JPH08512148A (en) Topic discriminator
CN110047467B (en) Voice recognition method, device, storage medium and control terminal
Howell et al. Development of a two-stage procedure for the automatic recognition of dysfluencies in the speech of children who stutter: I. Psychometric procedures appropriate for selection of training material for lexical dysfluency classifiers
JP2955297B2 (en) Speech recognition system
Aldefeld et al. Automated directory listing retrieval system based on isolated word recognition
US20020184019A1 (en) Method of using empirical substitution data in speech recognition
JPH07219579A (en) Speech recognition device
JPH0654503B2 (en) Pattern recognition device
US5555345A (en) Learning method of neural network
Cole et al. A prototype voice-response questionnaire for the us census.
US6212499B1 (en) Audible language recognition by successive vocabulary reduction
JPH10261083A (en) Device and method for identifying individual
JP2002215184A (en) Speech recognition device and program for the same
JP2966002B2 (en) Voice recognition device
JP3708747B2 (en) Speech recognition method
CN113255361B (en) Automatic voice content detection method, device, equipment and storage medium
JP3515143B2 (en) Pattern registration device