JPS634232B2 - - Google Patents

Info

Publication number
JPS634232B2
JPS634232B2 JP56094908A JP9490881A JPS634232B2 JP S634232 B2 JPS634232 B2 JP S634232B2 JP 56094908 A JP56094908 A JP 56094908A JP 9490881 A JP9490881 A JP 9490881A JP S634232 B2 JPS634232 B2 JP S634232B2
Authority
JP
Japan
Prior art keywords
partial pattern
character
extraction
dictionary
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56094908A
Other languages
Japanese (ja)
Other versions
JPS57209574A (en
Inventor
Yoshihisa Fujii
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56094908A priority Critical patent/JPS57209574A/en
Publication of JPS57209574A publication Critical patent/JPS57209574A/en
Publication of JPS634232B2 publication Critical patent/JPS634232B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries

Description

【発明の詳細な説明】 本発明は、漢字文字認識装置、特に入力された
漢字文字に対して候補カテゴリ抽出部によつて候
補カテゴリを少数に絞つた上で、偏や傍や冠など
の文字構造にしたがつて分割態様をチエツクし、
当該分割された部分パターンについてより詳細な
認識を行なうようにした漢字文字認識装置に関す
るものである。
[Detailed Description of the Invention] The present invention provides a kanji character recognition device, in particular, a candidate category extracting unit that narrows down candidate categories to a small number for input kanji characters, and then Check the division mode according to the structure,
The present invention relates to a kanji character recognition device that performs more detailed recognition of the divided partial patterns.

漢字文字を認識する認識装置においては、カテ
ゴリ数が膨大でありかつ比較的類似した文字構造
をもつものが多いことから、候補カテゴリを少数
個に絞つた上で、更に細部にわたる照合を行なつ
て認識を行なうようにされる。
Recognition devices that recognize kanji characters have a huge number of categories, and many have relatively similar character structures, so it is necessary to narrow down the candidate categories to a small number and then perform more detailed matching. He is brought into recognition.

一方、漢字文字認識するに当つては、漢字文字
が偏や傍や冠などによつて分類できることから、
当該偏や傍や冠などによつて上記候補カテゴリを
抽出し、その上で上記細部にわたる照合を行なう
ことが考慮されている。しかし、上記偏や傍や冠
などによつて大分類を行なわせる方式の場合、例
えば同じ偏をもつ文字の個数が十分大であること
や、入力漢字文字を偏や傍や冠によつて分割する
分割結果が必らずしも正しくないこととが生じる
ことなどのために、十分な効果を得られていな
い。
On the other hand, when recognizing kanji characters, since kanji characters can be classified according to their polarity, side, crown, etc.
Consideration is being given to extracting the candidate categories based on the bias, side, crown, etc., and then performing the detailed matching. However, in the case of a method that performs major classification according to the bias, side, or crown, for example, it is necessary to make sure that the number of characters with the same bias is sufficiently large, or that the input kanji characters are divided according to the bias, side, or crown. However, because the resulting division results are not necessarily correct, sufficient effects cannot be obtained.

本発明は、上記の点を考慮し、予め別の手段に
よつて候補カテゴリを絞つた上で、当該候補カテ
ゴリがもつ偏や傍や冠などと入力された漢字文字
について調べた偏や傍や冠などと対応づけて正し
く分割を行ない、その上で分割された部分パター
ンについて細部にわたる照合を行なうようにし
て、認識率を向上することを目的としている。そ
してそのため、本発明の漢字文字認識装置は、入
力された漢字文字に対応して特徴抽出を行なうと
共に予め用意された辞書部の内容にもとづいて候
補カテゴリを抽出する候補カテゴリ抽出部を有す
る文字認識装置において、各カテゴリの文字に対
応して偏および/または傍および/または冠を含
む文字構造にもとづいて分割した少なくとも当該
分割態様情報を保持する文字構造辞書、上記入力
された漢字文字について上記部分パターンを抽出
する部分パターン抽出部、処理対象部分パターン
を検出する対象部分パターン検出回路部、上記入
力された漢字文字中の当該処理対象部分パターン
についての特徴を抽出する部分パターン特徴抽出
回路部、標準部分パターン特徴を格納する標準部
分パターン辞書、および部分パターン識別回路部
をそなえてなり、上記候補カテゴリ抽出部によつ
て抽出された候補カテゴリについて、上記文字構
造辞書の内容と上記部分パターン抽出部による抽
出結果とにもとづいて少なくとも分割態様チエツ
クを行ない、かつ上記部分パターン特徴抽出回路
部からの抽出結果と上記標準部分パターン辞書の
内容とにもとづいて当該部分パターンについての
識別を行なうようにしたことを特徴としている。
以下図面を参照しつつ説明する。
In consideration of the above points, the present invention narrows down the candidate categories by another means in advance, and then examines the input kanji characters such as bia, ba, kan, etc. of the candidate category. The objective is to improve the recognition rate by correctly dividing the patterns in association with crowns, etc., and then performing detailed matching on the divided partial patterns. Therefore, the kanji character recognition device of the present invention performs character recognition that has a candidate category extraction unit that extracts features corresponding to input kanji characters and extracts candidate categories based on the contents of a dictionary section prepared in advance. In the device, a character structure dictionary that holds at least the division mode information divided based on the character structure including partial and/or side and/or crown corresponding to each category of characters, and the above-mentioned part for the input kanji character. A partial pattern extraction unit that extracts a pattern, a target partial pattern detection circuit unit that detects a partial pattern to be processed, a partial pattern feature extraction circuit unit that extracts features of the partial pattern to be processed from the input kanji characters, standard It is equipped with a standard partial pattern dictionary that stores partial pattern features and a partial pattern identification circuit section, and for candidate categories extracted by the candidate category extraction section, the content of the character structure dictionary and the partial pattern extraction section are At least a division mode check is performed based on the extraction result, and the partial pattern is identified based on the extraction result from the partial pattern feature extraction circuit and the contents of the standard partial pattern dictionary. It is a feature.
This will be explained below with reference to the drawings.

第1図は本発明による認識処理態様を概念的に
説明する説明図、第2図は本発明の一実施例構成
を示す。
FIG. 1 is an explanatory diagram conceptually explaining a recognition processing mode according to the present invention, and FIG. 2 shows the configuration of an embodiment of the present invention.

今第1図図示の如く、漢字文字1が入力され
て、候補カテゴリ抽出部2によつて候補カテゴリ
3−1,3−2,3−3が抽出されたとする。一
方文字構造辞書4内には、各カテゴリ文字に対応
して偏や傍や冠などの文字構造にしたがつて分割
する場合の分割方向(分割態様)情報と分割され
た結果の部分パターンとが用意されている。
Assume now that a Kanji character 1 is input and candidate categories 3-1, 3-2, and 3-3 are extracted by the candidate category extraction section 2, as shown in FIG. On the other hand, the character structure dictionary 4 contains division direction (division mode) information and partial patterns as a result of division when dividing characters according to character structures such as polarity, side, and crown, corresponding to each category character. Provided.

上記候補カテゴリ3−1ないし3−3にもとづ
いて上記文字構造辞書4を索引し、上記候補カテ
ゴリ3−1ないし3−3を識別するに都合のよい
部分パターン5−1ないし5−3を抽出する。こ
の間に入力された漢字文字1について、上記偏や
傍や冠などの文字構造にしたがつて分割する処理
が部分パターン抽出部において行なわれ、上記文
字構造辞書4の内容にもとづいて、部分パターン
抽出部によつて決定された分割位置や分割態様の
チエツクが行なわれる。
The character structure dictionary 4 is indexed based on the candidate categories 3-1 to 3-3, and partial patterns 5-1 to 5-3 convenient for identifying the candidate categories 3-1 to 3-3 are extracted. do. During this time, the input kanji character 1 is divided according to the character structure such as the above-mentioned bias, side, and crown in the partial pattern extraction section, and the partial pattern is extracted based on the contents of the character structure dictionary 4. The division positions and manner of division determined by the division are checked.

該チエツクにおいて、単に分割態様のみのチエ
ツクでなく、必要に応じて分割された結果の各部
分パターンについて照合を行ない、部分パターン
抽出部によつて分割した結果中に含まれる多少の
ノイズを補正するようにしてもよい。勿論、上記
部分パターン抽出部によつて、入力された漢字文
字1が分割できなかつた場合や、分割して部分パ
ターンと文字構造辞書4から抽出された候補カテ
ゴリ3−1ないし3−3の部分パターンとが極端
に異なる場合には、上記候補カテゴリ抽出部2に
よる抽出結果を認識結果として出力し、あるいは
それを他に利用することとなる。
In this check, not only the division mode is checked, but also each partial pattern of the divided results is checked as necessary, and some noise contained in the divided results is corrected by the partial pattern extraction section. You can do it like this. Of course, if the input kanji character 1 cannot be divided by the partial pattern extraction section, or if the input kanji character 1 cannot be divided, the partial pattern and the candidate categories 3-1 to 3-3 extracted from the character structure dictionary 4 If the pattern is extremely different, the extraction result by the candidate category extraction section 2 will be output as a recognition result, or used for other purposes.

上述の如く、入力された漢字文字1についての
部分パターンが上記候補カテゴリ3−1ないし3
−3の部分パターンと対応がとれた部分がある
と、それ以外の部分パターン(図示の場合には部
分パターン5−1ないし5−3)についてのより
詳細な照合処理に入る。即ち、入力された漢字文
字1について、部分パターン「言」を除去した部
分について特徴抽出を行ない、別に用意されてい
る標準部分パターン辞書6の内容と照合するよう
にされる。第1図図示の場合には、言うまでもな
く、入力された漢字文字1の部分パターン「忍」
について照合がとられ、カテゴリ「認」に属する
文字として認識される。
As mentioned above, the partial pattern for the input kanji character 1 falls into the candidate categories 3-1 to 3.
If there is a portion that matches the partial pattern -3, more detailed matching processing begins for the other partial patterns (in the illustrated case, partial patterns 5-1 to 5-3). That is, features are extracted for the portion of the input Kanji character 1 from which the partial pattern ``word'' has been removed, and the extracted features are compared with the contents of a standard partial pattern dictionary 6 prepared separately. In the case shown in Figure 1, it goes without saying that the partial pattern of the input kanji character 1 is ``Shin''.
The characters are compared and recognized as characters belonging to the category "recognized".

第2図は本発明の一実施例構成を示す。図中の
符号1,2,4,6は第1図に対応し、7は部分
パターン抽出部、8は正規化回路部、9は特徴抽
出回路部、10は辞書、11は識別回路部、12
は周辺分布計算回路部であつて入力された漢字文
字1についての文字周辺分布を調べて分割位置検
出などの準備を行なうもの、13は文字分割位置
検出回路部、14は分割判定回路部、15は対象
部分パターン検出回路部、16は正規化回路部、
17は部分パターン特徴抽出回路部、18は部分
パターン識別回路部、19−1ないし19−3は
夫々最小不一致検出回路部を表わしている。
FIG. 2 shows the configuration of an embodiment of the present invention. Reference numerals 1, 2, 4, and 6 in the figure correspond to those in FIG. 1, 7 is a partial pattern extraction section, 8 is a normalization circuit section, 9 is a feature extraction circuit section, 10 is a dictionary, 11 is an identification circuit section, 12
1 is a peripheral distribution calculation circuit unit which examines the character peripheral distribution of the input kanji character 1 and prepares for division position detection, 13 is a character division position detection circuit unit, 14 is a division determination circuit unit, 15 16 is a target partial pattern detection circuit section, 16 is a normalization circuit section,
Reference numeral 17 represents a partial pattern feature extraction circuit, 18 represents a partial pattern identification circuit, and 19-1 to 19-3 each represent a minimum mismatch detection circuit.

入力された漢字文字1について、従来公知の如
く、候補カテゴリ抽出部2は、辞書10の内容に
もとづいて識別を行ない、第1図図示の如く候補
カテゴリ3−1ないし3−3を抽出する。この結
果にもとづいて、文字構造辞書4に格納されてい
る当該候補カテゴリ3−1ないし3−3に対応し
た情報を抽出する。
As is conventionally known, the candidate category extraction unit 2 identifies the input Kanji character 1 based on the contents of the dictionary 10, and extracts candidate categories 3-1 to 3-3 as shown in FIG. Based on this result, information corresponding to the candidate categories 3-1 to 3-3 stored in the character structure dictionary 4 is extracted.

一方この間に、入力された漢字文字1について
は、従来公知の如く、周辺分布計算回路部12や
文字分割位置検出回路部13を含む部分パターン
抽出部7によつて、分割位置や分割方向が抽出さ
れる。上記文字構造辞書4から抽出された情報に
もとづいて、分割判定回路部14は、例えば分割
方向などの情報が一致するか否かをチエツクす
る。対象部分パターン検出回路部15は、以後の
照合対象となるべき部分パターンの部分を検出
し、入力された漢字文字1から該当する部分パタ
ーンを取出すように指示する。第1図図示の場合
には部分パターン「忍」のビデオ信号が取出さ
れ、正規化回路部16に供給される。そして部分
パターン特徴抽出回路部17は当該「忍」につい
ての特徴を抽出する。そして標準部分パターン辞
書6から読出されてくる標準部分パターンと識別
回路部18において照合される。第1図図示の場
合には、標準部分パターン「忍」、「売」、「〓」と
照合されると考えてよい。第1図図示の場合に
は、標準部分パターン「忍」と最もよく照合され
ることとなり、最小不一致検出回路部19−3を
へて解答が得られる。
Meanwhile, for the input Kanji character 1, the division position and division direction are extracted by the partial pattern extraction section 7 including the peripheral distribution calculation circuit section 12 and the character division position detection circuit section 13, as is conventionally known. be done. Based on the information extracted from the character structure dictionary 4, the division determination circuit 14 checks whether information such as the division direction matches. The target partial pattern detection circuit section 15 detects the portion of the partial pattern that is to be the object of subsequent comparison, and instructs to extract the corresponding partial pattern from the input Kanji character 1. In the case shown in FIG. 1, the video signal of the partial pattern "Ninja" is extracted and supplied to the normalization circuit section 16. Then, the partial pattern feature extraction circuit section 17 extracts the features regarding the "ninja". Then, the standard partial pattern read from the standard partial pattern dictionary 6 is compared with the standard partial pattern in the identification circuit section 18. In the case shown in FIG. 1, it can be considered that the standard partial patterns "Shin", "Sale", and "〓" are compared. In the case shown in FIG. 1, the standard partial pattern "Shinobu" is most often matched, and the answer is obtained through the minimum mismatch detection circuit section 19-3.

なお、部分パターン抽出部7において、分割自
体が検出されない場合には、最小不一致検出回路
部19−1によつて解答が得られる。また分割態
様が大きく異なつている場合などでは、最小不一
致検出回路部19−2において解答が得られる。
勿論、最小不一致検出回路部19−1ないし19
−3の結果を綜合して、最終的な認識判定を行な
うようにしてもよい。
Note that if the partial pattern extraction section 7 does not detect the division itself, the minimum mismatch detection circuit section 19-1 obtains an answer. Further, in cases where the division manners are significantly different, an answer can be obtained in the minimum mismatch detection circuit section 19-2.
Of course, the minimum discrepancy detection circuit units 19-1 to 19
-3 results may be combined to make a final recognition determination.

以上説明した如く、本発明によれば、偏や傍や
冠などの文字構造を利用した認識処理を、大分類
された後のより詳細な認識処理に利用するように
している。このため、上記大分類によつて絞られ
た数の候補カテゴリについて、上記偏や傍や冠な
どの文字構造をチエツクすることができる。この
ために、入力された漢字文字1について分割する
部分パターン抽出部7の処理に多少のノイズを含
んでいても、以後の部分パターン抽出に当つて正
しい部分パターンを抽出し、標準部分パターンと
の照合をとることが可能となる。また一旦分割判
定を行なうために、標準部分パターンとの照合に
当つて非所望な形で照合が行なわれることが少な
くなる。
As described above, according to the present invention, recognition processing using character structures such as slant, side, and crown is used for more detailed recognition processing after major classification. Therefore, it is possible to check the character structures such as the above-mentioned bias, side, and crown for the number of candidate categories narrowed down by the above-mentioned major classification. For this reason, even if the process of the partial pattern extracting unit 7 that divides the input kanji character 1 contains some noise, the correct partial pattern will be extracted in subsequent partial pattern extraction, and the correct partial pattern will be extracted and compared with the standard partial pattern. It becomes possible to perform verification. Furthermore, since the division determination is made once, it is less likely that the comparison will be performed in an undesired manner when comparing with the standard partial pattern.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明による認識処理態様を概念的に
説明する説明図、第2図は本発明の一実施例構成
を示す。 図中、1は入力された漢字文字、2は候補カテ
ゴリ抽出部、6は標準部分パターン辞書、7は部
分パターン抽出部、14は分割判定回路部、15
は対象部分パターン検出回路部、17は部分パタ
ーン特徴抽出回路部、18は部分パターン識別回
路部を表わす。
FIG. 1 is an explanatory diagram conceptually explaining a recognition processing mode according to the present invention, and FIG. 2 shows the configuration of an embodiment of the present invention. In the figure, 1 is an input kanji character, 2 is a candidate category extraction unit, 6 is a standard partial pattern dictionary, 7 is a partial pattern extraction unit, 14 is a division determination circuit unit, 15
17 represents a partial pattern detection circuit, 17 represents a partial pattern feature extraction circuit, and 18 represents a partial pattern identification circuit.

Claims (1)

【特許請求の範囲】[Claims] 1 入力された漢字文字に対応して特徴抽出を行
なうと共に予め用意された辞書部の内容にもとづ
いて候補カテゴリを抽出する候補カテゴリ抽出部
を有する文字認識装置において、各カテゴリの文
字に対応して偏および/または傍および/または
冠を含む文字構造にもとづいて分割した少なくと
も当該分割態様情報を保持する文字構造辞書、上
記入力された漢字文字について上記部分パターン
を抽出する部分パターン抽出部、処理対象部分パ
ターンを検出する対象部分パターン検出回路部、
上記入力された漢字文字中の当該処理対象部分パ
ターンについての特徴を抽出する部分パターン特
徴抽出回路部、標準部分パターン特徴を格納する
標準部分パターン辞書、および部分パターン識別
回路部をそなえてなり、上記候補カテゴリ抽出部
によつて抽出された候補カテゴリについて、上記
文字構造辞書の内容と上記部分パターン抽出部に
よる抽出結果とにもとづいて少なくとも分割態様
チエツクを行ない、かつ上記部分パターン特徴抽
出回路部からの抽出結果と上記標準部分パターン
辞書の内容とにもとづいて当該部分パターンにつ
いての識別を行なうようにしたことを特徴とする
漢字文字認識装置。
1 In a character recognition device that has a candidate category extraction section that extracts features corresponding to input kanji characters and extracts candidate categories based on the contents of a dictionary section prepared in advance, A character structure dictionary that holds at least division mode information divided based on a character structure including polarity and/or side and/or crown, a partial pattern extraction unit that extracts the partial pattern for the input kanji character, and a processing target. a target partial pattern detection circuit unit that detects a partial pattern;
It is equipped with a partial pattern feature extraction circuit section for extracting the features of the processing target partial pattern in the input Kanji character, a standard partial pattern dictionary for storing the standard partial pattern features, and a partial pattern identification circuit section, Regarding the candidate categories extracted by the candidate category extraction section, at least a division mode check is performed based on the contents of the character structure dictionary and the extraction results by the partial pattern extraction section, and the partial pattern feature extraction circuit section A kanji character recognition device characterized in that the partial pattern is identified based on the extraction result and the contents of the standard partial pattern dictionary.
JP56094908A 1981-06-19 1981-06-19 Kanji (chinese characters) recognizing device Granted JPS57209574A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56094908A JPS57209574A (en) 1981-06-19 1981-06-19 Kanji (chinese characters) recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56094908A JPS57209574A (en) 1981-06-19 1981-06-19 Kanji (chinese characters) recognizing device

Publications (2)

Publication Number Publication Date
JPS57209574A JPS57209574A (en) 1982-12-22
JPS634232B2 true JPS634232B2 (en) 1988-01-28

Family

ID=14123106

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56094908A Granted JPS57209574A (en) 1981-06-19 1981-06-19 Kanji (chinese characters) recognizing device

Country Status (1)

Country Link
JP (1) JPS57209574A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01321177A (en) * 1988-06-21 1989-12-27 Matsushita Electric Ind Co Ltd Thread fastening device

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59226982A (en) * 1983-06-08 1984-12-20 Comput Basic Mach Technol Res Assoc Character reader
JP2550012B2 (en) * 1984-10-17 1996-10-30 株式会社日立製作所 Pattern cutting and recognition method
JP4805485B2 (en) * 2001-07-11 2011-11-02 株式会社東芝 Word recognition method and word recognition device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01321177A (en) * 1988-06-21 1989-12-27 Matsushita Electric Ind Co Ltd Thread fastening device

Also Published As

Publication number Publication date
JPS57209574A (en) 1982-12-22

Similar Documents

Publication Publication Date Title
JP2821348B2 (en) Fingerprint collation device
Sha et al. Improved fingercode for filterbank-based fingerprint matching
Hambalık Fingerprint recognition system using artificial neural network as feature extractor: design and performance evaluation
de Paula Lemes et al. Dynamic pore filtering for keypoint detection applied to newborn authentication
Alonso-Fernandez et al. Impact of signature legibility and signature type in off-line signature verification
US4491965A (en) Character recognition apparatus
JPS634232B2 (en)
JP2866461B2 (en) Fingerprint collation device
JP2788527B2 (en) Fingerprint matching method
JP2549107B2 (en) Corrective matching and secondary rematching method in fingerprint matching
US8194943B2 (en) Method for automatically recognizing fingerprints
JP2600680B2 (en) Personal verification device
JP2974857B2 (en) Fingerprint dictionary registration processing method
Kour et al. Nonminutiae based fingerprint matching
JP2912759B2 (en) Fingerprint matching method
JP2851865B2 (en) Character recognition device
KR970017037A (en) Fingerprint Recognition Security Method
Al-khassaweneh et al. A hybrid system of iris and fingerprint recognition for security applications
Phromsuthirak et al. Can We Distinguish Genuine Minutiae from Imposter Minutiae
JP3006823B2 (en) Character and word recognition methods
JPH03266185A (en) Dictionary registering method for fingerprint collator
JPS6111886A (en) Character recognition system
JPH06231310A (en) Character recognition method in chracter recognition device
JP3659688B2 (en) Character recognition device
JPS63269267A (en) Character recognizing device