JP2906583B2 - Pattern identification device - Google Patents

Pattern identification device

Info

Publication number
JP2906583B2
JP2906583B2 JP2134657A JP13465790A JP2906583B2 JP 2906583 B2 JP2906583 B2 JP 2906583B2 JP 2134657 A JP2134657 A JP 2134657A JP 13465790 A JP13465790 A JP 13465790A JP 2906583 B2 JP2906583 B2 JP 2906583B2
Authority
JP
Japan
Prior art keywords
category
feature data
pattern
character
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2134657A
Other languages
Japanese (ja)
Other versions
JPH0433084A (en
Inventor
英裕 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2134657A priority Critical patent/JP2906583B2/en
Publication of JPH0433084A publication Critical patent/JPH0433084A/en
Application granted granted Critical
Publication of JP2906583B2 publication Critical patent/JP2906583B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文字認識装置などのパターン識別装置に関す
る。
Description: TECHNICAL FIELD The present invention relates to a pattern recognition device such as a character recognition device.

[従来の技術] 従来のパターン識別装置においては最初に標準特徴デ
ータ記憶手段に持っているすべての標準特徴データとパ
ターンから抽出した特徴データとの類似度を計算し、個
々のパターンの属するカテゴリを決めた後で、後処理と
して単語の知識などを用いて補正や、修正を行ってい
た。例えば、「パターン認識」(森健一監修、コロナ社
刊、75頁)のなでは、文字認識の後処理として記述され
ている。
[Prior Art] In a conventional pattern identification apparatus, first, a similarity between all standard feature data stored in a standard feature data storage unit and feature data extracted from a pattern is calculated, and a category to which each pattern belongs is determined. After deciding, correction and correction were performed using knowledge of words and the like as post-processing. For example, in "pattern recognition" (edited by Kenichi Mori, Corona Publishing Co., Ltd., p. 75), it is described as post-processing of character recognition.

[発明が解決しようとする課題] そのため、標準特徴データ記憶手段にあるすべての標
準特徴データの中から正しいカテゴリを決定することは
困難でかつ類似度の計算時間が長くなり、その上に単語
の知識を用いた補正に要する時間がパターン識別に要す
る時間に加算されて全体として処理時間を著しく長くさ
せる要因となっており、短時間でパターン識別と単語知
識を用いた補正処理ができる装置の出現が望まれてい
た。
[Problems to be Solved by the Invention] For this reason, it is difficult to determine a correct category from all the standard feature data in the standard feature data storage means, and the calculation time of the similarity becomes long. The time required for correction using knowledge is added to the time required for pattern identification, which is a factor that significantly increases the overall processing time. The emergence of a device that can perform pattern identification and correction processing using word knowledge in a short time Was desired.

本発明は係る問題点を解決するために、入力パターン
にある電話番号、郵便番号などの特定形式のパターンの
識別において使用文字が限定されていることを利用し頻
出するカテゴリをあらかじめ登録しておき、最初に頻出
するカテゴリの標準パターンとのみ照合処理を行なった
後、それぞれの特定パターンの形式の知識を用いた補正
処理を行い、補正が適用できなかった入力パターンにつ
いてのみ全標準パターンとの照合処理を行うことで標準
パターンとの照合回数を大幅に削減し、パターン識別装
置を高速に実行すると同時に識別率の高いパターン識別
装置を提供することを目的としている。
According to the present invention, in order to solve such a problem, a frequently used category is registered in advance by using the fact that characters used are limited in identifying a specific format pattern such as a telephone number and a postal code in an input pattern. First, the matching process is performed only for the standard patterns of the most frequently occurring category, then the correction process is performed using the knowledge of the format of each specific pattern, and only the input patterns for which the correction could not be applied are compared with all the standard patterns. It is an object of the present invention to significantly reduce the number of times of collation with a standard pattern by performing processing, and to provide a pattern identification device having a high identification rate while executing the pattern identification device at high speed.

[課題を解決するための手段] 本発明のパターン識別装置は、入力パターン列を個々
のパターン信号に分離し、該パターン信号から特徴デー
タを抽出して所定のカテゴリとして識別するパターン識
別装置であって、 前記特徴データの比較対象となる標準特徴データと、 あらかじめ抽出しておいた単語などを構成する頻出カ
テゴリ列を記憶するカテゴリ列記憶手段と、 前記標準特徴データの一部を前記カテゴリ列記憶手段
に記憶されているカテゴリ列をもとに選択する照合カテ
ゴリ選択手段と、 該照合カテゴリ選択手段によって選択された一部の前
記標準特徴データと、前記特徴データを照合し、前記特
徴データの属するカテゴリ候補を決定する第1のカテゴ
リ識別手段と、 前記第1のカテゴリ識別手段によって識別された識別
結果に対して前記頻出カテゴリ列との照合を行い、前記
頻出カテゴリ列に存在する前記特徴データを判別するカ
テゴリ列判定手段と、 該カテゴリ列判定手段で判別された以外の前記特徴デ
ータに対して、一部の前記標準特徴データ以外の前記標
準特徴データも含めて照合を行い、前記特徴データの属
するカテゴリ候補を決定する第2のカテゴリ識別手段
と、 を有することを特徴とする。
[Means for Solving the Problems] A pattern identification device of the present invention is a pattern identification device that separates an input pattern sequence into individual pattern signals, extracts feature data from the pattern signals, and identifies the feature data as a predetermined category. Standard feature data to be compared with the feature data, category string storage means for storing frequent category strings constituting words or the like extracted in advance, and storing a part of the standard feature data in the category string. Collation category selecting means for selecting based on the category column stored in the means; collating part of the standard feature data selected by the collation category selecting means with the feature data; First category identification means for determining a category candidate; and an identification result identified by the first category identification means. A category sequence determining unit that performs a comparison with the frequent category sequence and determines the feature data present in the frequent category sequence; and a part of the feature data other than the category data determined by the category sequence determining unit. A second category identification unit that performs matching including the standard feature data other than the standard feature data and determines a category candidate to which the feature data belongs.

また、前記頻出カテゴリ列に関連した特定のカテゴリ
を指定する手段と、 前記特徴データに対して前記特定のカテゴリに属する
かを判定し、前記特定のカテゴリに属す場合は認識結果
としてこれを許容する特定カテゴリ許容手段と、を有
し、 前記第2のカテゴリ判別手段は、前記カテゴリ列判定
手段で判別された前記特徴データおよび前記特定カテゴ
リ許容手段によって許容された前記特徴データ、以外の
前記特徴データに対して、一部の前記標準特徴データ以
外の前記標準特徴データも含めて照合を行い、前記特徴
データの属するカテゴリ候補を決定する手段であること
を特徴とする。
Means for designating a specific category related to the frequent category column; determining whether the feature data belongs to the specific category; if the feature data belongs to the specific category, permitting this as a recognition result Specific category permitting means, wherein the second category determining means is the characteristic data other than the characteristic data determined by the category sequence determining means and the characteristic data permitted by the specific category permitting means. In this case, the matching is performed by including the standard feature data other than a part of the standard feature data, and a category candidate to which the feature data belongs is determined.

[作用] 本発明においては、識別しようとする入力パターン列
はパターン入力手段に入力され電気信号列に変換されメ
モリに記憶される。記憶された電気信号列はパターン分
離手段により個々の信号に分離された後、特徴抽出手段
によりパターンの特徴データが抽出される。特徴抽出手
段により抽出された個々の特徴データと、標準特徴デー
タ記憶手段に記憶された標準特徴データから照合カテゴ
リ選択手段により選択された標準特徴データとの照合が
カテゴリ識別手段で行なわれる。ここで照合カテゴリ選
択手段で選択されるカテゴリはカテゴリ列記憶手段に記
憶さてているカテゴリ列で使用されているカテゴリに特
定の形式のパターンで使用されるカテゴリを加えたもの
としてもよい。次にカテゴリ判定手段でカテゴリ列記憶
手段に記憶されているカテゴリ列と一致するカテゴリ列
が存在するか調べられ、一致したカテゴリのパターンに
フラグが立てられる。さらにそのカテゴリ列が特定の形
式を示すものであれば形式にマッチするパターンにもフ
ラグが立てられる。次にフラグの立っていないパターン
についてのみ標準特徴データ記憶手段に記憶されている
すべてのカテゴリの標準特徴データとの照合がカテゴリ
識別手段で行なわれ、パターンの属するカテゴリが決定
される。かくしてパターン列の個々のパターンの属する
カテゴリがすべて決定されることになる。
[Operation] In the present invention, an input pattern sequence to be identified is input to pattern input means, converted into an electric signal sequence, and stored in a memory. After the stored electric signal sequence is separated into individual signals by the pattern separating means, the characteristic data of the pattern is extracted by the characteristic extracting means. Matching of individual feature data extracted by the feature extracting means with standard feature data selected by the matching category selecting means from the standard feature data stored in the standard feature data storage means is performed by the category identifying means. Here, the category selected by the collation category selecting means may be the category used in the category string stored in the category string storage means plus the category used in the pattern of a specific format. Next, the category judging unit checks whether there is a category sequence that matches the category sequence stored in the category sequence storage unit, and flags a pattern of the matching category. Further, if the category column indicates a specific format, a pattern that matches the format is also flagged. Next, only the pattern for which the flag is not set is compared with the standard feature data of all the categories stored in the standard feature data storage means by the category identification means, and the category to which the pattern belongs is determined. Thus, all the categories to which the individual patterns in the pattern sequence belong are determined.

[実施例] 第1図は、本発明によるパターン識別装置を文字認識
に応用した一実施例の構成を示すブロック図である。
Embodiment FIG. 1 is a block diagram showing a configuration of an embodiment in which a pattern identification device according to the present invention is applied to character recognition.

パターン入力手段1であるスキャナから入力された文
字列パターンは二値データ信号としてパターン分離手段
2である文字切り出し装置に送られ、各文字の外接枠を
抽出することで文字単位に分離される。次に特徴抽出手
段3により個々の文字の特徴データが抽出される。その
特徴データをもとにカテゴリ識別手段4で個々の文字が
属する可能性のもっとも高い文字カテゴリが決定され、
パターン識別結果記憶手段7に記憶される。ただし、こ
のとき標準特徴データ記憶手段10である標準特徴辞書の
文字カテゴリのなかで照合対象となるのは照合カテゴリ
選択手段8によって選択される文字カテゴリのみであ
る。次に文字列の識別結果はカテゴリ列判定手段5でそ
の文字列の中にカテゴリ列記憶手段9である単語辞書に
登録されている単語が存在するか否が判定され単語を構
成する文字にフラグが立てられる。さらにその単語が電
話番号、郵便番号など特定の形式を示す単語であれば特
定形式における番号部分を構成する文字にもフラグが立
てられる。最後に、文字列の中にフラグの立っていない
文字であれば、その文字パターンについてのみカテゴリ
識別手段6で標準特徴辞書に記憶されているすべての文
字カテゴリを対象として照合処理が実行され、文字パタ
ーンの属する文字カテゴリが決定される。上記構成によ
り入力文字パターン列を、標準辞書中のすべての文字カ
テゴリと照合することなく、個々の文字パターンが属す
る文字カテゴリ列に変換することを可能としている。
The character string pattern input from the scanner, which is the pattern input means 1, is sent as a binary data signal to the character cutout device, which is the pattern separation means 2, and is separated into characters by extracting the circumscribed frame of each character. Next, feature data of each character is extracted by the feature extracting means 3. Based on the characteristic data, a character category which is most likely to belong to each character is determined by the category identification means 4,
It is stored in the pattern identification result storage means 7. However, at this time, among the character categories of the standard feature dictionary which is the standard feature data storage means 10, only the character category selected by the matching category selection means 8 is to be compared. Next, the identification result of the character string is determined by the category string determining means 5 to determine whether or not a word registered in the word dictionary as the category string storing means 9 exists in the character string. Is set up. Further, if the word is a word indicating a specific format, such as a telephone number or a postal code, the characters constituting the number portion in the specific format are also flagged. Finally, if the character string does not have a flag set, the matching process is performed on all character categories stored in the standard feature dictionary by the category identifying means 6 only for the character pattern. The character category to which the pattern belongs is determined. With the above configuration, it is possible to convert an input character pattern string into a character category string to which each character pattern belongs without checking against all character categories in the standard dictionary.

第2図は、本発明を実施するためのパターン識別装置
を文字認識に応用したハードウェアとしての一構成例を
示しており、20の中味は中央制御装置としてのCPU、メ
モリとしてのRAMとROM、文字認識される対象物を光学的
にスキャンするスキャナ、表示体のCRT、フロッピーデ
ィスク装置などの補助記憶装置、キーボードとこれらを
接続するバスラインをそれぞれ示している。
FIG. 2 shows an example of a configuration as hardware in which a pattern identification device for implementing the present invention is applied to character recognition. The contents of 20 are a CPU as a central control device, and a RAM and a ROM as memories. A scanner for optically scanning an object to be recognized, an auxiliary CRT such as a display CRT, a floppy disk device, a keyboard, and a bus line connecting these components are shown.

次に、第4図(a)に示す「本社TEL0263(36)1212
代表」という文字パターンの認識を例にして詳細な説明
を行う。
Next, "Head office TEL0263 (36) 1212" shown in FIG.
A detailed description will be given by taking recognition of the character pattern “representative” as an example.

カテゴリ列記憶手段9である単語辞書には100語程度
の単語が登録されているが説明を容易にするため、「TE
L」、「本社」、「電話」の3つの単語のみが登録され
ているものとする[第4図(f)]。また各単語はアト
リビュートフラグを持っており、「電話」、「TEL」な
どのように単語の次に必ず数字列(番号)が続く単語に
はアトリビュートフラグに1を立てておく。
About 100 words are registered in the word dictionary as the category string storage means 9.
It is assumed that only three words “L”, “Headquarters”, and “telephone” are registered [FIG. 4 (f)]. Each word has an attribute flag. For words such as "telephone" and "TEL", which are always followed by a digit string (number), the attribute flag is set to "1".

第3図(a)のフローチャート図におけるステップF1
でスキャナ(パターン入力手段1)から入力された文字
列パターンはステップF2の文字切り出し手段(パターン
分離手段2)によって1文字ずつ分離される。ステップ
F3でポインタを第4図(a)の先頭の文字である「本」
にセットする。ステップF4でポインタの指している文字
パターンの特徴が抽出される(特徴抽出手段3)。ステ
ップF5で第4図(f)で示される照合対象文字リストか
ら1文字読みだし(照合カテゴリ選択手段8)、ステッ
プF6でその文字に対応する標準特徴データを辞書(標準
特徴データ記憶手段10)から読み出す。ステップF7で標
準特徴データと、ポインタが指している文字から抽出さ
れた特徴データとの類似度が計算され、類似度は記憶装
置に記憶される。ステップF8で照合対象文字リストのす
べての文字カテゴリについて類似度計算がなされたかど
うかをチェックし、文字カテゴリが残っている場合には
ステップF5に戻る。
Step F1 in the flowchart of FIG.
The character string pattern input from the scanner (pattern input means 1) is separated one by one by the character cutout means (pattern separation means 2) in step F2. Steps
F3 moves the pointer to the "book" which is the first character in FIG. 4 (a).
Set to. In step F4, the features of the character pattern pointed to by the pointer are extracted (feature extraction means 3). In step F5, one character is read from the collation target character list shown in FIG. 4 (f) (collation category selecting means 8), and in step F6, standard feature data corresponding to the character is dictionary (standard feature data storage means 10). Read from In step F7, the similarity between the standard feature data and the feature data extracted from the character pointed to by the pointer is calculated, and the similarity is stored in the storage device. In step F8, it is checked whether or not the similarity has been calculated for all the character categories of the collation target character list. If any character category remains, the process returns to step F5.

このようにしてステップF5からF7までの処理を照合対
象文字リストにあるすべての文字について行う。照合対
象文字リストにある文字は、単語辞書に登録されている
2つの単語で使用されている文字に算用数字、漢数字、
括弧などを加えたものである。それらの文字との類似度
計算結果は記憶装置に記憶されステップF9において、最
も類似度の大きい文字が選択される(カテゴリ識別手段
4)。「本」の場合は当然「本」が最も可能性の高い文
字として選択される。ステップF10でポインタの指す文
字が最後の文字かどうかを判断し末尾でない場合はステ
ップF11でポインタを次の文字「社」に設定してステッ
プF4にジャンプする。このようにして次々に文字を認識
した結果は第4図(b)に示すように照合対象文字リス
トのどれかになる。すなわち「代表」の2文字は照合対
象文字リスト中にない文字なので、「社電」になってし
まう。
In this way, the processing from steps F5 to F7 is performed for all the characters in the collation target character list. Characters in the collation target character list include characters used in two words registered in the word dictionary,
Parentheses are added. The result of calculating the similarity between these characters is stored in the storage device, and in step F9, the character having the highest similarity is selected (category identification means 4). In the case of “book”, “book” is naturally selected as the most likely character. In step F10, it is determined whether the character pointed to by the pointer is the last character. If not, the pointer is set to the next character "company" in step F11, and the process jumps to step F4. The result of successively recognizing characters in this manner becomes one of the collation target character lists as shown in FIG. 4 (b). In other words, the two characters “representative” are not in the collation target character list, and thus become “shaden”.

次にカテゴリ列判定手段5により「TEL」、「本
社」、「電話」の3種の単語のどれかとマッチする文字
列が認識結果のカテゴリ列中にないか調べる。まずステ
ップF12で先頭の文字にポインタをセットする。ステッ
プF13でポインタが指す文字から始まる単語が単語辞書
中にあるか調べる。この場合「本社」がマッチするので
ステップF14で「本」と「社」に対応する文字にフラグ
を立て、ステップF15でポインタを単語の最後の文字に
対応する「社」にセットする。ステップF16でポインタ
の指す文字が文書の末尾の文字かチェックし、もし末尾
の文字でなければステップF17でポインタを次の文字
「T」にセットしてステップF13にジャンプする。以下
順次チェックしていき最後の「電」で、ポインタが末尾
に達すると、第3図(a)の[結合子B]は第3図
(b)の[結合子B]に結合されてステップF18に進
む。ここまでの処理を終えた段階での文字列の状態を第
4図(c)に示す。下線は単語と判定された文字列を表
わし、文字の上にある点はフラグがセットされているこ
とを示している。
Next, the category string determining means 5 checks whether a character string that matches any of the three words “TEL”, “Headquarters”, and “telephone” exists in the category string of the recognition result. First, in step F12, a pointer is set to the first character. In step F13, it is checked whether a word starting from the character indicated by the pointer exists in the word dictionary. In this case, since "headquarters" matches, the character corresponding to "book" and "sha" is flagged in step F14, and the pointer is set to "sha" corresponding to the last character of the word in step F15. In step F16, it is checked whether the character pointed by the pointer is the last character of the document. If not, the pointer is set to the next character "T" in step F17, and the process jumps to step F13. When the pointer reaches the end of the last "den" at the last "den", the "connector B" in FIG. 3A is connected to the "connector B" in FIG. Go to F18. FIG. 4C shows the state of the character string at the stage where the processing up to this point has been completed. An underline indicates a character string determined to be a word, and a dot above a character indicates that the flag is set.

ステップF18でポインタを先頭の文字にセットした
後、ステップF19で単語の探索を行うと、「本社」が見
つかる。ステップF20で、見つかった単語にアトリビュ
ートフラグが立っているかどうか調べる。「本社」の場
合はたっていないのでステップF25に進み、終了チェッ
クをした後、ステップF19の単語の探索へ戻り、次の単
語として「TEL」が見つかる。「TEL」はアトリビュート
フラグが立っているので、次に番号となる数字列が続い
ている筈であるからステップF21で単語の次の文字にポ
インタをセットし、番号部分のチェックに進む。ステッ
プF22で、もし算用数字、漢数字、括弧などの文字であ
れば番号部分であるとしてステップF23でその文字にフ
ラグを立てた後、ステップF24でポインタを次の文字に
セットし、ステップF22に戻る。ステップF22で算用数
字、漢数字、括弧でない場合はステップF25に進み、ポ
インタの指す文字が最後の文字かどうかを判断し、末尾
でない場合はステップF19の単語探索に戻る。末尾であ
った場合はカテゴリ列判定処理を終了する。第4図
(d)はカテゴリ列判定処理の終了状態を示した図であ
り、第4図(c)の状態に比較して電話番号の番号部分
の文字にもフラグが立っている。
After setting the pointer to the first character in step F18, a word search is performed in step F19, and "head office" is found. In step F20, it is checked whether an attribute flag is set for the found word. In the case of "head office", since it has not been completed, the process proceeds to step F25, after performing an end check, returns to the search for the word in step F19, and finds "TEL" as the next word. Since the attribute flag of "TEL" is set, a numeric string to be the next number should follow. Therefore, in step F21, the pointer is set to the next character of the word, and the process proceeds to check the number portion. In step F22, if it is a character such as an arithmetic numeral, a Chinese numeral, a parenthesis, or the like, it is determined that the character is a number portion, and in step F23, the character is flagged.In step F24, the pointer is set to the next character. Return to If it is not an arithmetic numeral, a Chinese numeral, or a parenthesis in step F22, the process proceeds to step F25, in which it is determined whether the character pointed to by the pointer is the last character. If not, the process returns to the word search in step F19. If it is at the end, the category column determination processing ends. FIG. 4 (d) is a diagram showing the end state of the category string determination process, and a flag is also set in the character of the telephone number in comparison with the state of FIG. 4 (c).

最後に、カテゴリ識別手段6により「代表」部分の認
識を行う。ステップF26でポインタを先頭の文字にセッ
トする。ステップF27でポインタの指す文字にフラグが
立っているかどうかを調べ、立っている場合はステップ
F31で末尾の文字かどうかチェックした後、末尾の文字
でなければステップF32でポインタを次の文字にセット
してステップF27に戻る。第4図(d)の場合、最初の
「本」から電話番号部分の最後の「2」まではフラグが
立っているのでポインタは「社電」の「社」まで進む。
フラグが立っていない場合、ステップF28でポインタが
指している文字の特徴を抽出し、ステップF29で標準特
徴データ記憶手段10に登録されているすべての標準特徴
データとの類似度を計算した後、ステップF30で最も類
似度の高い標準特徴データを選択する。ステップ31で
「社」が末尾の文字かどうかがチェックされ、末尾では
ないのでステップ32でポインタを次の文字である「電」
にセットしてステップF27に戻る。「電」もフラグが立
っていないためステップF29、F30の認識処理が行なわ
れ、その結果「社電」は「代表」と正しく認識されるこ
とになる[第4図(e)]。以上の例では簡単のため単
語辞書には「TEL」、「本社」、「電話」の3つの単語
であるとしたが、実際に名刺の認識に応用した場合では
単語数が100語、照合対象文字数が200文字程度である。
Finally, the “representative” part is recognized by the category identifying means 6. In step F26, the pointer is set to the first character. In step F27, check whether a flag is set for the character pointed to by the pointer.
After checking if it is the last character in F31, if it is not the last character, the pointer is set to the next character in step F32 and the process returns to step F27. In the case of FIG. 4 (d), since the flag is set from the first "book" to the last "2" of the telephone number portion, the pointer advances to "shaden" of "shaden".
If the flag is not set, the feature of the character pointed to by the pointer is extracted in step F28, and after calculating the similarity with all the standard feature data registered in the standard feature data storage unit 10 in step F29, In step F30, the standard feature data having the highest similarity is selected. In step 31, it is checked whether "sha" is the last character, and since it is not the last character, the pointer is moved to the next character "den" in step 32.
And returns to step F27. Since no flag is set for "den", the recognition processing in steps F29 and F30 is performed, and as a result, "shaden" is correctly recognized as "representative" [FIG. 4 (e)]. In the above example, for simplicity, the word dictionary assumed that there were three words, “TEL”, “Headquarters”, and “telephone”. However, when actually applied to business card recognition, the number of words was 100, The number of characters is about 200 characters.

[発明の効果] 本発明によれば、カテゴリ列記憶部に記憶されている
カテゴリ列で使用されるカテゴリ数が100〜200程度と標
準辞書にあるカテゴリ数3000の数十分の1であるため、
入力パターン列に存在するカテゴリ列部分(単語部分)
の認識における照合計算を大幅に減少させることで、認
識を高速に実行することを可能とし、かつ単語部分の認
識における照合カテゴリ数を減少させることで単語部分
の認識率を向上させることが可能になった。
[Effects of the Invention] According to the present invention, the number of categories used in the category strings stored in the category string storage unit is about 100 to 200, which is one tenth of the number of categories 3000 in the standard dictionary. ,
Category string part (word part) existing in input pattern string
By significantly reducing the number of matching calculations in the recognition of words, it is possible to execute recognition at high speed, and by reducing the number of matching categories in the recognition of word parts, it is possible to improve the recognition rate of word parts. became.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明となるパターン識別装置の構成を示すブ
ロック図である。 第2図は本発明となるパターン識別装置のハードウェア
構成図である。 第3図は本発明の実施例である文字認識処理におけるフ
ローチャート図である。 第4図は本発明の実施例である文字認識処理における認
識過程を示す説明図である。 1:パターン入力手段 2:パターン分離手段 3:特徴抽出手段 4:カテゴリ識別手段 5:カテゴリ列判定手段 6:カテゴリ識別手段 7:パターン識別結果記憶手段 8:照合カテゴリ選択装置 9:カテゴリ列記憶装置 10:標準特徴データ記憶装置
FIG. 1 is a block diagram showing a configuration of a pattern identification device according to the present invention. FIG. 2 is a hardware configuration diagram of the pattern identification device according to the present invention. FIG. 3 is a flowchart of a character recognition process according to an embodiment of the present invention. FIG. 4 is an explanatory diagram showing a recognition process in a character recognition process according to an embodiment of the present invention. 1: pattern input means 2: pattern separation means 3: feature extraction means 4: category identification means 5: category sequence determination means 6: category identification means 7: pattern identification result storage means 8: collation category selection device 9: category sequence storage device 10: Standard feature data storage

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】入力パターン列を個々のパターン信号に分
離し、該パターン信号から特徴データを抽出して所定の
カテゴリとして識別するパターン識別装置であって、 前記特徴データの比較対象となる標準特徴データと、 あらかじめ抽出しておいた単語などを構成する頻出カテ
ゴリ列を記憶するカテゴリ列記憶手段と、 前記標準特徴データの一部を前記カテゴリ列記憶手段に
記憶されているカテゴリ列をもとに選択する照合カテゴ
リ選択手段と、 該照合カテゴリ選択手段によって選択された一部の前記
標準特徴データと、前記特徴データを照合し、前記特徴
データの属するカテゴリ候補を決定する第1のカテゴリ
識別手段と、 前記第1のカテゴリ識別手段によって識別された識別結
果に対して前記頻出カテゴリ列との照合を行い、前記頻
出カテゴリ列に存在する前記特徴データを判別するカテ
ゴリ列判定手段と、 該カテゴリ列判定手段で判別された以外の前記特徴デー
タに対して、一部の前記標準特徴データ以外の前記標準
特徴データも含めて照合を行い、前記特徴データの属す
るカテゴリ候補を決定する第2のカテゴリ識別手段と、 を有することを特徴とするパターン識別装置。
1. A pattern identification apparatus for separating an input pattern sequence into individual pattern signals, extracting feature data from the pattern signals and identifying the feature data as a predetermined category, wherein a standard feature to be compared with the feature data Data, a category string storage means for storing frequently-used category strings constituting words or the like extracted in advance, and a part of the standard feature data based on the category strings stored in the category string storage means. Matching category selecting means to be selected; a part of the standard feature data selected by the matching category selecting means; and first category identifying means for comparing the feature data and determining a category candidate to which the feature data belongs. Comparing the identification result identified by the first category identification means with the frequent category column, A category sequence determining means for determining the feature data present in the category sequence; and for the feature data other than the category data determined by the category sequence determining means, the standard feature data other than a part of the standard feature data is also included. And a second category identification means for performing a comparison to determine a category candidate to which the feature data belongs.
【請求項2】請求項第1項記載のパターン認識装置であ
って、 前記頻出カテゴリ列に関連した特定のカテゴリを指定す
る手段と、 前記特徴データに対して前記特定のカテゴリに属するか
を判定し、前記特定のカテゴリに属す場合は認識結果と
してこれを許容する特定カテゴリ許容手段と、を有し、 前記第2のカテゴリ判別手段は、前記カテゴリ列判定手
段で判別された前記特徴データおよび前記特定カテゴリ
許容手段によって許容された前記特徴データ、以外の前
記特徴データに対して、一部の前記標準特徴データ以外
の前記標準特徴データも含めて照合を行い、前記特徴デ
ータの属するカテゴリ候補を決定する手段であることを
特徴とするパターン識別装置。
2. The pattern recognition apparatus according to claim 1, wherein: means for designating a specific category related to the frequent category sequence; and determining whether the feature data belongs to the specific category. And a specific category permitting unit that permits the recognition as a recognition result when belonging to the specific category. The second category determining unit includes the feature data and the feature data determined by the category sequence determining unit. The feature data other than the feature data permitted by the specific category permitting unit is collated with the standard feature data other than a part of the standard feature data, and a category candidate to which the feature data belongs is determined. A pattern identification device characterized in that the pattern identification device is a means for performing pattern identification.
JP2134657A 1990-05-24 1990-05-24 Pattern identification device Expired - Fee Related JP2906583B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2134657A JP2906583B2 (en) 1990-05-24 1990-05-24 Pattern identification device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2134657A JP2906583B2 (en) 1990-05-24 1990-05-24 Pattern identification device

Publications (2)

Publication Number Publication Date
JPH0433084A JPH0433084A (en) 1992-02-04
JP2906583B2 true JP2906583B2 (en) 1999-06-21

Family

ID=15133507

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2134657A Expired - Fee Related JP2906583B2 (en) 1990-05-24 1990-05-24 Pattern identification device

Country Status (1)

Country Link
JP (1) JP2906583B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3812770A1 (en) * 1988-04-16 1989-10-26 Bosch Gmbh Robert Circuit for increasing current in accumulator-power apparatuses

Also Published As

Publication number Publication date
JPH0433084A (en) 1992-02-04

Similar Documents

Publication Publication Date Title
US4979227A (en) Method for automatic character recognition employing a lexicon having updated character strings
JP3105967B2 (en) Character recognition method and device
JPH087033A (en) Method and device for processing information
US6535652B2 (en) Image retrieval apparatus and method, and computer-readable memory therefor
JP2906583B2 (en) Pattern identification device
JP3313272B2 (en) Address reading method and identification function weight vector generation method
JPH0696263A (en) Pattern recognizing device
WO2000036530A1 (en) Searching method, searching device, and recorded medium
JPH06103402A (en) Business card recognizing device
JP2746345B2 (en) Post-processing method for character recognition
JP2640472B2 (en) Character recognition method
JP2538543B2 (en) Character information recognition device
JPS63782A (en) Pattern recognizing device
JP2827066B2 (en) Post-processing method for character recognition of documents with mixed digit strings
JP2000132635A (en) Recognizing data confirming method
JPH07271921A (en) Character recognizing device and method thereof
JP2982244B2 (en) Character recognition post-processing method
JPH0433083A (en) Pattern identifying device
JP2875678B2 (en) Post-processing method of character recognition result
JP2654022B2 (en) Dictionary search method
JPS62281082A (en) Character recognizing device
JPH0290384A (en) Post-processing system for character recognizing device
JP2851865B2 (en) Character recognition device
JPH06251187A (en) Method and device for correcting character recognition error
JPS61133487A (en) Character recognizing device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080402

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090402

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090402

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100402

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees