JPH09319825A - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JPH09319825A
JPH09319825A JP8136771A JP13677196A JPH09319825A JP H09319825 A JPH09319825 A JP H09319825A JP 8136771 A JP8136771 A JP 8136771A JP 13677196 A JP13677196 A JP 13677196A JP H09319825 A JPH09319825 A JP H09319825A
Authority
JP
Japan
Prior art keywords
category
candidate
topological structure
pattern
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8136771A
Other languages
Japanese (ja)
Inventor
Shigeru Tanaka
茂 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP8136771A priority Critical patent/JPH09319825A/en
Publication of JPH09319825A publication Critical patent/JPH09319825A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a character recognition device which can set the order of candidates to category candidates with a logical discrimination technique as the base. SOLUTION: A phase structure characteristic generation part 11 generates phase structure features of a known pattern, based on a phase structuring method. A candidate-specifying part 12 refers to a recognition dictionary part 13 to specify category candidates. A distance calculation part 14 uses a phase structure feature table 15, where phase structure features of a standard pattern are described in advance with primitives, to calculate the city block distances between phase structure features of the known pattern and those of the category candidates. A order of candidate determination part 16 sets the rankings of category candidates in the order of small city block distances.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、例えばOCR(Op
tical Character Recognition)等で取り込んだ未知の
文字パタンの識別を行う手段を備えた文字認識装置に係
り、特に、論理的識別手法と解析的識別手法の利点を組
み合わせて文字パタンに対応するカテゴリの識別を行う
技術に関する。なお、この明細書で文字という場合は、
狭義の文字のほか、図形、記号、数字等をも意味するも
のとする。
TECHNICAL FIELD The present invention relates to, for example, OCR (Op (Op
The present invention relates to a character recognition device equipped with a means for identifying an unknown character pattern captured by tical character recognition, etc., and in particular, category identification corresponding to a character pattern by combining the advantages of a logical identification method and an analytical identification method. Related to the technology of doing. In addition, when a character is used in this specification,
In addition to characters in a narrow sense, it also means figures, symbols, numbers, etc.

【0002】[0002]

【従来の技術】文字認識装置における未知の文字パタン
(以下、未知パタンと称する)に対応するカテゴリの識
別手法として、2つの基本的な手法が存在する。一つは
論理的識別手法であり、他の一つは解析的識別手法であ
る。
2. Description of the Related Art There are two basic methods for identifying a category corresponding to an unknown character pattern (hereinafter referred to as an unknown pattern) in a character recognition device. One is a logical identification method, and the other is an analytical identification method.

【0003】論理的識別手法は、プリミティブな特徴に
基づくカテゴリの識別手法である。つまり、未知パタン
がある単純な部分の形から構成されている場合、この構
成要素としての形をプリミティブといい、未知パタンを
記述する上で最小単位となる特徴を表している。論理的
識別手法は、未知パタンをこのプリミテイブで記述する
とともに、これと、予めプリミティブで記述されて辞書
等に蓄積された標準パタン(標準カテゴリ)の記述とを
比較・照合し、一致するか否か、即ち真か偽かの尺度に
よってカテゴリの識別を行う。従って、論理的識別手法
による文字認識結果は、未知パタンの記述に合致する辞
書内の正解カテゴリのみとなる。
The logical identification method is a category identification method based on primitive features. That is, when an unknown pattern is composed of a simple part shape, the shape as this constituent element is called a primitive, and represents the feature that is the minimum unit for describing the unknown pattern. In the logical identification method, an unknown pattern is described by this primitive, and this is compared and collated with the description of the standard pattern (standard category) which is described in the primitive and stored in the dictionary etc. The category is identified by a scale of true or false. Therefore, the character recognition result by the logical identification method is only the correct category in the dictionary that matches the description of the unknown pattern.

【0004】一方、解析的識別手法は、解析関数を用い
て未知パタンの特徴の類似の度合いを検出することを基
本とする。例えば個々のパタンの特徴は、特徴ベクトル
といわれるパラメータの組によって与えられ、特徴ベク
トルの各成分は、パタンの特徴の要素に対応したものに
なっている。したがって、パタン同士が類似するか否か
は、特徴ベクトルがどの程度類似するかによる。特徴ベ
クトルの類似の度合いには、主に距離が用いられる。距
離は、例えば任意の2つの特徴ベクトルの差の絶対値で
与えられる。
On the other hand, the analytical discriminating method is based on detecting the degree of similarity of the features of the unknown pattern using an analytical function. For example, each pattern feature is given by a set of parameters called a feature vector, and each component of the feature vector corresponds to an element of the pattern feature. Therefore, whether the patterns are similar to each other depends on how similar the feature vectors are. Distance is mainly used for the degree of similarity of feature vectors. The distance is given by the absolute value of the difference between any two feature vectors, for example.

【0005】この解析的識別手法により未知パタンに対
応するカテゴリを識別する場合は、まず、未知パタンか
ら識別処理に都合のよい特徴ベクトル空間を求める。そ
して、識別関数として距離の概念を導入し得る解析関数
を用いてカテゴリの識別を行う。このため、解析的識別
手法によれば、未知パタンの特徴ベクトルからの距離が
小さい順、つまり近い順に第1候補、第2候補、第3候
補、・・・のように、候補順位が設定された文字認識結果
を得ることができる。この候補順位を見れば、未知パタ
ンに最も近いカテゴリを認識することが可能となる。な
お、以上の文字認識手法に関する解説は、例えば橋本新
一郎編著、「文字認識概論」(オーム社、1982年、
P29−45)等の記載が参考になる。
When a category corresponding to an unknown pattern is identified by this analytical identification method, first, a feature vector space that is convenient for identification processing is obtained from the unknown pattern. Then, the category is identified using an analytic function that can introduce the concept of distance as the identification function. Therefore, according to the analytical identification method, the candidate ranks are set in the ascending order of the distance from the feature vector of the unknown pattern, that is, in the ascending order such as the first candidate, the second candidate, the third candidate ,. The character recognition result can be obtained. By looking at this candidate rank, it becomes possible to recognize the category closest to the unknown pattern. For a description of the above character recognition method, see "Introduction to Character Recognition", edited by Shinichiro Hashimoto (Ohmsha, 1982,
The description such as P29-45) is helpful.

【0006】[0006]

【発明が解決しようとする課題】上述のように、論理的
識別手法を用いた文字認識装置では、候補順位の設定さ
れた文字認識結果を得ることができない。そのため、文
字認識の結果、複数の候補カテゴリが現れた場合は、未
知パタンと全てのカテゴリ候補とを照合して最も一致す
るカテゴリを特定していく処理が必要であり、処理が複
雑になる問題があった。
As described above, the character recognition device using the logical identification method cannot obtain the character recognition result in which the candidate ranks are set. Therefore, when multiple candidate categories appear as a result of character recognition, it is necessary to match the unknown pattern with all the category candidates to identify the best matching category, which complicates the process. was there.

【0007】解析的識別手法では、複数のカテゴリ候補
が現れた場合は、各々に設定された候補順位を見ること
で直ちに最適なカテゴリ候補を特定することができて便
利であるが、既存の文字認識装置が論理的識別手法を採
用している場合は、識別手法を解析的識別手法に変更し
なければならない。しかし識別手法の変更は、文字認識
における特徴抽出系や認識制御系の変更を伴うため、技
術的に極めて困難であり、コスト的にも不利になる問題
があった。
In the analytical identification method, when a plurality of category candidates appear, it is convenient that the optimum category candidate can be specified immediately by looking at the candidate order set for each category candidate. If the recognizer adopts the logical identification method, the identification method must be changed to the analytical identification method. However, since the change of the identification method involves the change of the feature extraction system and the recognition control system in the character recognition, it is technically extremely difficult and disadvantageous in cost.

【0008】このような問題を解決するため、従来、論
理的識別手法により得られた、候補順位の設定されない
文字認識結果を得た後に、文字列の「妥当性」によって
正解候補(=第一候補)をしぼり込む技法が知られてい
る。この技法は、「後処理」と呼ばれる。しかし、この
後処理では、「妥当性」といった客観性に欠ける尺度を
用いているため、未知パタンが、候補となったカテゴリ
にどの程度類似していたのかを正確に知ることができな
い問題があった。
In order to solve such a problem, conventionally, after a character recognition result in which a candidate rank is not set, which is obtained by a logical identification method, is obtained, the correct answer candidate (= first A technique for squeezing candidates) is known. This technique is called "post-processing". However, since this post-processing uses a scale that lacks objectivity, such as "validity," there is a problem in that it is not possible to accurately know how similar the unknown pattern was to the candidate category. It was

【0009】そこで本発明の課題は、論理的識別手法に
よりカテゴリ識別を行う際に複数のカテゴリ候補が現れ
た場合、各カテゴリ候補に簡易且つ適切な候補順位を設
定することができる文字認識装置を提供することにあ
る。
[0009] Therefore, an object of the present invention is to provide a character recognition device which can easily and appropriately set a candidate order for each category candidate when a plurality of category candidates appear when category identification is performed by a logical identification method. To provide.

【0010】[0010]

【課題を解決するための手段】解析的識別手法ではでき
ないが、論理的識別手法では人間の直感に合ったプリミ
ティブな特徴に基づいてカテゴリを識別することができ
る。本発明では、人間の目でも区別がつきにくい類似形
状のカテゴリに対して、プリミティブで記述された類似
形状の差異の部分、例えば「ク」と「ワ」のように左上
の傾き度合いの差異の部分と、予め記述されたその部分
の標準パタンとの類似の度合い、例えば特徴ベクトル間
のシティ・ブロック距離を求め、この類似の度合い(距
離値)に応じて文字認識結果に候補順位を設定する。
Although not possible with the analytical identification method, the logical identification method can identify a category based on a primitive feature that matches human intuition. In the present invention, for a similar shape category that is difficult to distinguish even by human eyes, the difference portion of the similar shape described by the primitive, for example, the difference in the upper left inclination degree such as “ku” and “wa” A degree of similarity between a part and a standard pattern of the part described in advance, for example, a city block distance between feature vectors is obtained, and a candidate rank is set in the character recognition result according to the degree of similarity (distance value). .

【0011】具体的には、未知パタンの特徴に類似する
少なくとも一つのカテゴリ候補を論理的識別手法により
特定する第1手段と、特定されたカテゴリ候補について
予めプリミティブで記述された標準パタンとの類似の度
合いを求める第2手段と、この類似度合いに応じて前記
カテゴリ候補に候補順位を設定する第3手段とを備えて
文字認識装置を構成する。
Specifically, the similarity between the first means for specifying at least one category candidate similar to the characteristics of the unknown pattern by the logical identification method and the standard pattern described in advance for the specified category candidate by a primitive. The character recognition device is configured to include a second means for determining the degree of the above and a third means for setting the candidate rank for the category candidate according to the degree of similarity.

【0012】論理的識別手法の一例として位相構造化法
がある。この位相構造化法は、未知パタンの位相構造に
着目したGlucksman氏の文字認識法を拡張した
ものである。位相構造化法を実現する装置は、装置構成
が単純且つ容易であるといった利点がある。また、文字
の大域的な構造を抽出するために、雑音や手書きによる
文字変形に対して比較的安定である。位相構造化法は、
未知パタンの描かれた碁盤状の領域の各枡目領域の特徴
を抽出する一次特徴抽出と、一次特徴抽出で得られた局
所情報を全て集積する統合化と、統合化によって得られ
た情報から個々の局所情報に対し他の局所情報を付加し
て大域的な特徴を反映する、さらに精度の高い情報を生
成する高次化から成り立っている。高次化を経て得られ
た未知パタンの大域的構造を反映する情報は位相構造特
徴と呼ばれる。なお、位相構造化法における一次特徴抽
出で得られる情報は、パタンのプリミティブな記述とな
る。
The phase structuring method is an example of the logical identification method. This topological structuring method is an extension of Mr. Glucksman's character recognition method, which focuses on the topological structure of an unknown pattern. A device that realizes the phase structured method has an advantage that the device configuration is simple and easy. Moreover, since the global structure of the character is extracted, it is relatively stable against noise and character deformation due to handwriting. The phase structuring method is
From the information obtained by the primary feature extraction that extracts the features of each grid area of the checkerboard-like area in which the unknown pattern is drawn, the integration that accumulates all the local information obtained by the primary feature extraction, and the information obtained by the integration It consists of higher-order generation of more accurate information that reflects global characteristics by adding other local information to each local information. The information that reflects the global structure of unknown patterns obtained through higher order is called topological structure feature. The information obtained by the primary feature extraction in the topological structuring method is a primitive description of the pattern.

【0013】本発明の文字認識装置における第1手段
は、例えば、予めこの位相構造特徴が既知のカテゴリ群
を蓄積した認識辞書部と、未知の未知パタンの位相構造
特徴を生成する位相構造特徴生成部と、この位相構造特
徴生成部で生成された未知パタンの位相構造特徴の合致
度が規定値を越えるカテゴリを前記認識辞書部より特定
する手段とを有し、特定されたカテゴリをカテゴリ候補
とする。
The first means in the character recognition apparatus of the present invention includes, for example, a recognition dictionary unit in which the category groups of which the topological structure features are known are accumulated, and a topological structure feature generation for generating topological structure features of unknown unknown patterns. Section, and means for specifying from the recognition dictionary section a category in which the degree of coincidence of the topological structure features of the unknown pattern generated by the topological structure feature generation portion exceeds the specified value, and the identified category is defined as a category candidate. To do.

【0014】また、前記第2手段は、例えば、標準パタ
ンの位相構造特徴がプリミティブで記述された位相構造
特徴テーブルと、前記特定されたカテゴリ候補に対する
前記位相構造特徴テーブル内の標準パタンと前記未知パ
タンとの位相構造の類似の度合いを決定する手段とを備
えて構成する。
Further, the second means is, for example, a topological structure feature table in which topological structure features of a standard pattern are described by primitives, a standard pattern in the topological structure feature table for the identified category candidate, and the unknown. And a means for determining the degree of similarity of the phase structure with the pattern.

【0015】なお、前記位相構造特徴テーブルは、規格
化された標準パタンのほか、目的に応じて標準パタンの
位相構造特徴が変形された目的別標準パタンを含ませる
ことで、候補順位を調整することができる。
The topological structure feature table adjusts the candidate ranks by including standardized standard patterns and target-specific standard patterns in which the topological structure features of the standard patterns are modified according to the purpose. be able to.

【0016】[0016]

【発明の実施の形態】以下、図面を参照しながら本発明
の実施形態を詳細に説明する。図1は、本実施形態に係
る文字認識装置の識別系の構成図である。この実施形態
では、論理的識別手法の一つである位相構造化法をベー
スとしてカテゴリ識別を行い、位相構造特徴の類似の度
合いはシティ・ブロック距離により表す場合の例を示す
ものである。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described in detail below with reference to the drawings. FIG. 1 is a configuration diagram of an identification system of the character recognition device according to the present embodiment. In this embodiment, category identification is performed based on the topological structuring method which is one of the logical identification methods, and the degree of similarity of topological structure features is represented by city block distance.

【0017】この文字認識装置1における文字の識別手
法は、従前の論理的識別手法をベースとしており、カテ
ゴリ候補に適切な候補順位を設定するために、位相構造
特徴生成部11、候補特定部12、候補特定部12が参
照する認識辞書部13、距離演算部14、距離演算部1
4が参照する位相構造特徴テーブル15、及び候補順位
決定部16を備えている。なお、各部11〜16は各々
独立した物理的なユニットとして存在してもよく、情報
処理装置内で論理的に構成された機能群として存在して
もよい。また、記憶媒体上に情報処理装置が読み取り可
能なように物理的に実体化され、それが読み取られたと
きに情報処理装置に上記機能を付与する命令集合体とし
て存在してもよい。
The character identification method in the character recognition device 1 is based on the conventional logical identification method. In order to set an appropriate candidate rank for a category candidate, the phase structure feature generation section 11 and the candidate identification section 12 are used. , The recognition dictionary unit 13, the distance calculation unit 14, and the distance calculation unit 1 which are referred to by the candidate specifying unit 12.
4 includes a topological structure feature table 15 and a candidate rank determining unit 16. Each of the units 11 to 16 may exist as an independent physical unit, or may exist as a functional group logically configured in the information processing device. Further, it may be physically embodied on a storage medium so that the information processing apparatus can read it, and may exist as an instruction set that gives the information processing apparatus the above function when the information is read.

【0018】位相構造特徴テーブル15は、例えば「O
CR−HN(JIS X 9006)」、「OCR−H
K(JIS X 9005)」のように規格化された標
準パタンの位相構造特徴がプリミティブで記述されたテ
ーブル、目的に応じて定められた目的別標準パタンの位
相構造特徴がプリミティブで記述されたテーブル、ある
いは両者を組み合わせたものを用いることができる。
The phase structure feature table 15 is, for example, "O".
CR-HN (JIS X 9006) "," OCR-H
K (JIS X 9005) ”, a table in which the standardized topological structure features of standard patterns are described in primitives, and a table in which the topological structural features of the standard patterns by purpose determined according to the purpose are described in primitives. , Or a combination of both can be used.

【0019】位相構造特徴生成部11は、入力された未
知パタンの位相構造特徴を生成するものであり、候補特
定部12は、位相構造特徴生成部11で生成された未知
パタンの位相構造特徴と認識辞書部13に蓄積されてい
る複数の標準パタンの位相構造特徴とを比較して、少な
くとも一つのカテゴリ候補を特定するものである。
The phase structure feature generator 11 generates the phase structure feature of the input unknown pattern, and the candidate specifying unit 12 calculates the phase structure feature of the unknown pattern generated by the phase structure feature generator 11. It compares at least one category candidate by comparing the phase structure features of a plurality of standard patterns stored in the recognition dictionary unit 13.

【0020】距離演算部14は、特定されたカテゴリ候
補に対する位相構造特徴テーブル15内の標準パタンと
未知パタンの位相構造特徴の類似の度合い、即ちシティ
・ブロック距離を演算するものである。候補順位決定部
16は、距離演算部14の演算結果を解析し、距離の小
さい順に、各カテゴリ候補に候補順位1、2、・・・、
を設定するものである。
The distance calculation section 14 calculates the degree of similarity between the phase structure features of the standard pattern and the unknown pattern in the phase structure feature table 15 for the identified category candidate, that is, the city block distance. The candidate rank determination unit 16 analyzes the calculation result of the distance calculation unit 14, and ranks the candidate ranks 1, 2, ...
Is to be set.

【0021】次に、具体例を挙げて本実施形態の文字認
識装置1における識別手法を説明する。まず、位相構造
特徴テーブル15として、規格化された「OCR−HN
(JIS X 9006)」と、「OCR−HK(JI
S X 9005)」を用いる場合について説明する。
Next, the identification method in the character recognition device 1 of the present embodiment will be described with a specific example. First, as the topological structure feature table 15, the standardized “OCR-HN
(JIS X 9006) "and" OCR-HK (JI
S X 9005) ”will be described.

【0022】いま、図2上段に示す形状特徴の未知パタ
ンが位相構造特徴生成部11に入力されたとする。位相
構造特徴生成部11は、位相構造化法に基づいてこの未
知パタンの位相構造特徴を生成し、これを候補特定部1
2と距離演算部14に送る。候補特定部12は、認識辞
書部13に蓄積されている標準カテゴリのプリミティブ
な記述を参照し、未知パタンの位相構造特徴に含まれた
プリミティブな記述に対して予め定められた基準以上に
合致する標準カテゴリを特定する。
Now, assume that the unknown pattern of the shape feature shown in the upper part of FIG. 2 is input to the phase structure feature generator 11. The phase structure feature generation unit 11 generates a phase structure feature of this unknown pattern based on the phase structuring method, and uses this as a candidate identification unit 1
2 and the distance calculation unit 14. The candidate identifying unit 12 refers to the primitive description of the standard category accumulated in the recognition dictionary unit 13, and matches with a predetermined criterion or more for the primitive description included in the topological structure feature of the unknown pattern. Identify standard categories.

【0023】この標準カテゴリの特定過程をより詳しく
説明する。認識辞書部13には図示のように、標準カテ
ゴリ「6」、「7」、「8」、…、「キ」、「ク」、
「ケ」、…、「ロ」、「ワ」、「ヲ」、…のプリミティ
ブな記述が蓄積されている。これらの標準カテゴリのう
ち、未知パタンに比較的類似する形状のものは、
「7」、「ク」、及び「ワ」である。候補特定部12
は、各パタンにおけるこのようなプリミティブな記述を
未知パタンのプリミティブな記述と比較・照合して、三
つのカテゴリ候補「7」、「ク」、「ワ」を特定する。
そして、これらを距離演算部14に送る。
The process of identifying the standard category will be described in more detail. In the recognition dictionary unit 13, as shown in the figure, standard categories “6”, “7”, “8”, ..., “Ki”, “Ku”,
Primitive descriptions of “ke”, ..., “B”, “wa”, “wo”, ... Are accumulated. Of these standard categories, those with a shape relatively similar to the unknown pattern are
"7", "ku", and "wa". Candidate identification unit 12
Compares and collates such a primitive description in each pattern with the primitive description of the unknown pattern to identify three category candidates “7”, “KU”, and “WA”.
Then, these are sent to the distance calculation unit 14.

【0024】距離演算部14は、未知パタンの位相構造
特徴と、上記カテゴリ候補「7」、「ク」、「ワ」の位
相構造特徴との間のシティ・ブロック距離を位相構造特
徴テーブル15のプリミティブな記述を参照して演算す
る。この場合の演算結果は、図3下段に示すとおりであ
る。図示の例では、未知パタンの位相構造特徴とカテゴ
リ候補「7」、「ク」、「ワ」の位相構造特徴との間の
シティ・ブロック距離が、各々、「50」、「10
0」、「25」であることを示している。なお、距離の
単位は本質的なものではないので、ここでは省略する。
The distance calculation unit 14 stores the city block distance between the topological structure feature of the unknown pattern and the topological structure feature of the category candidates “7”, “ku” and “wa” in the topological structure feature table 15. Operate by referring to the primitive description. The calculation result in this case is as shown in the lower part of FIG. In the illustrated example, the city block distances between the topological structure features of the unknown pattern and the topological structure features of the category candidates “7”, “ku”, and “wa” are “50” and “10”, respectively.
It shows that it is "0" and "25". Since the unit of distance is not essential, it is omitted here.

【0025】候補順位決定部16は、図4に示すよう
に、シティ・ブロック距離の小さいカテゴリ候補から順
に候補順位「1」、「2」、「3」を設定する。図示の
例では、シティ・ブロック距離が「25」であったカテ
ゴリ候補「ワ」が第1順位、シティ・ブロック距離が
「50」であったカテゴリ候補「7」が第2順位、シテ
ィ・ブロック距離が「100」であったカテゴリ候補
「ク」が第3順位となる。
As shown in FIG. 4, the candidate rank determining unit 16 sets candidate ranks “1”, “2”, and “3” in order from the category candidate having the smallest city block distance. In the illustrated example, the category candidate “wa” having the city block distance of “25” has the first rank, the category candidate “7” having the city block distance of “50” has the second rank, and the city block The category candidate “ku” whose distance was “100” is ranked third.

【0026】このように、論理的識別手法により複数の
カテゴリ候補が現れた場合に、各カテゴリ候補に対して
それぞれ候補順位が設定されるので、文字認識結果の確
認や修正のためのオペレータ作業の負担が軽減される。
As described above, when a plurality of category candidates appear by the logical identification method, the candidate ranks are set for the respective category candidates, so that the operator's work for confirming or correcting the character recognition result can be performed. The burden is reduced.

【0027】次に、上述の「OCR−HN」や「OCR
−HK」による位相構造特徴テーブル15に代えて、目
的別標準パタンの位相構造特徴が蓄積された位相構造特
徴テーブルを用いる場合について説明する。ここでは、
「読ませたい文字」に対応するカテゴリを目的別標準パ
タンに含ませる。つまり、例えば誤読を防止するため、
図5(a)に示すように、数字の「7」や英字の「Z」
のような文字の位相構造特徴が若干変形されて使用され
ることがある。このような文字を「読ませたい文字」と
称する。この実施形態では、予めこの「読ませたい文
字」の位相構造特徴をプリミティブで記述しておき、こ
れを目的別標準パタンの一つとして蓄積しておく。
Next, the above-mentioned "OCR-HN" and "OCR-HN"
A case will be described in which, instead of the phase structure feature table 15 based on “-HK”, a phase structure feature table in which the phase structure features of the purpose-specific standard patterns are accumulated. here,
Include a category corresponding to "characters you want to read" in the standard pattern for each purpose. That is, for example, to prevent misreading,
As shown in FIG. 5 (a), the numeral "7" and the alphabetic character "Z"
The topological features of a character such as may be used after being slightly modified. Such characters are called "characters to be read". In this embodiment, the topological structure feature of the "character to be read" is described in advance by a primitive and stored as one of the purpose-specific standard patterns.

【0028】図5(a)のような未知パタンが入力され
た場合のカテゴリ候補は、上述の場合と同様、「7」、
「ク」、「ワ」であり、このうち「読ませたい文字」に
対応するカテゴリ候補は「7」である。距離演算部14
は、図5(b)に示すように、目的別標準パタンの位相
構造特徴を蓄積した位相構造特徴テーブル25を参照し
て、未知パタンの位相構造特徴とカテゴリ候補の位相構
造特徴とのシティ・ブロック距離を演算する。この場合
の演算結果の一例が図5(b)の下段に示されている。
図示の例では、各カテゴリ候補「7」、「ク」、「ワ」
に対するシティ・ブロック距離が各々、「10」、「1
50」、「110」となる。
The category candidates when an unknown pattern as shown in FIG. 5A is input are "7", as in the above case.
“Ku” and “wa”, of which the category candidate corresponding to “characters to be read” is “7”. Distance calculator 14
As shown in FIG. 5B, refers to the phase structure feature table 25 that accumulates the phase structure features of the target-specific standard patterns, and refers to the city structure of the topological structure features of the unknown pattern and the category structure. Calculate block distance. An example of the calculation result in this case is shown in the lower part of FIG.
In the illustrated example, each category candidate is “7”, “ku”, “wa”.
City block distances to "10" and "1" respectively
It becomes 50 "and" 110 ".

【0029】候補順位決定部16は、シティ・ブロック
距離の小さいものから順に候補順位を設定する結果、図
6に示されるように、「読ませたい文字」に対応するカ
テゴリ候補「7」が第1順位、その他のカテゴリ候補
「ワ」、「ク」がそれぞれ第2、第3順位となる。
As a result of the candidate rank determining unit 16 setting candidate ranks in order from the smallest city block distance, as shown in FIG. 6, the category candidate "7" corresponding to "characters to be read" is ranked first. The first rank and the other category candidates “wa” and “ku” are the second and third ranks, respectively.

【0030】このように、予め「読ませたい文字」の位
相構造特徴を用意しておくことで、該当するカテゴリ候
補の順位が上がり易くなり、文字認識結果の精度が高ま
る利点がある。なお、この「読ませたい文字」は目的別
標準パタンの単なる例示であって、このほかに言語の種
類や文字種(フォント)等を目的別標準パタンとして用
いることができる。
As described above, by preparing in advance the topological structure feature of the "character to be read", the rank of the corresponding category candidate is likely to be increased, and the accuracy of the character recognition result is increased. It should be noted that this "character to be read" is merely an example of the purpose-specific standard pattern, and the type of language, character type (font), etc. can be used as the purpose-specific standard pattern.

【0031】[0031]

【発明の効果】以上の説明から明らかなように、本発明
によれば、論理的識別手法でカテゴリ識別を行った結
果、複数のカテゴリ候補が得られた場合に、各カテゴリ
候補に適切な候補順位が設定されるので、文字認識結果
の確認や修正のための作業の負担が軽減される効果があ
る。また、この候補順位の設定は、既存の特徴抽出系や
認識制御系の変更を要しないため、コスト的にも有利と
なる。また、候補順位の設定の際に目的別標準パタンの
位相構造特徴を使用することで、未知パタンに近似する
カテゴリ候補をより効率的に特定することができる。
As is apparent from the above description, according to the present invention, when a plurality of category candidates are obtained as a result of category identification by the logical identification method, an appropriate candidate for each category candidate is obtained. Since the order is set, there is an effect that the work load for checking and correcting the character recognition result is reduced. In addition, setting of this candidate order is advantageous in terms of cost because it does not require modification of the existing feature extraction system or recognition control system. Further, by using the phase structure feature of the target-specific standard pattern when setting the candidate rank, it is possible to more efficiently specify the category candidate that approximates the unknown pattern.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施形態に係る文字認識装置の識別
系の構成図。
FIG. 1 is a configuration diagram of an identification system of a character recognition device according to an embodiment of the present invention.

【図2】位相構造法によるカテゴリ候補の特定手順の説
明図。
FIG. 2 is an explanatory diagram of a procedure for identifying a category candidate by the topological structure method.

【図3】距離演算部における距離演算手順の説明図。FIG. 3 is an explanatory diagram of a distance calculation procedure in a distance calculation unit.

【図4】候補順位の決定例を示す説明図。FIG. 4 is an explanatory diagram showing an example of determining a candidate ranking.

【図5】(a)は入力する未知パタンを示した図、
(b)はこのパタンを入力した場合の距離演算部におけ
る距離演算手順の説明図。
FIG. 5 (a) is a diagram showing an unknown pattern to be input,
FIG. 7B is an explanatory diagram of a distance calculation procedure in the distance calculation unit when this pattern is input.

【図6】図5(a)のパタンを入力した場合の候補順位
の決定例を示す説明図。
FIG. 6 is an explanatory diagram showing an example of determining a candidate rank when the pattern of FIG. 5A is input.

【符号の説明】[Explanation of symbols]

1 文字認識装置 11 位相構造特徴生成部 12 候補特定部 13 認識辞書部 14 距離演算部 15 位相構造特徴テーブル 16 候補順位決定部 1 Character Recognition Device 11 Topological Structure Feature Generation Unit 12 Candidate Specification Unit 13 Recognition Dictionary Unit 14 Distance Calculation Unit 15 Phase Structure Feature Table 16 Candidate Rank Determination Unit

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 未知の文字パタンの特徴に類似する少な
くとも一つのカテゴリ候補を論理的識別手法により特定
する第1手段と、 特定されたカテゴリ候補について予めプリミティブで記
述された標準パタンとの類似の度合いを求める第2手段
と、 この類似度合いに応じた候補順位を個々のカテゴリ候補
に設定する第3手段とを有することを特徴とする文字認
識装置。
1. A first means for identifying at least one category candidate similar to a feature of an unknown character pattern by a logical identification method, and a similarity between a standard pattern described in a primitive for the identified category candidate in advance. A character recognition device comprising: a second means for obtaining a degree; and a third means for setting a candidate rank according to the degree of similarity to each category candidate.
【請求項2】 前記第1手段は、 予め位相構造特徴が既知のカテゴリ群を蓄積した認識辞
書部と、 未知の文字パタンの位相構造特徴を生成する位相構造特
徴生成部と、 この位相構造特徴生成部で生成された文字パタンの位相
構造特徴の合致度が規定値を越える前記認識辞書部内の
カテゴリを特定する手段とを有し、 特定されたカテゴリを前記カテゴリ候補とすることを特
徴とする請求項1記載の文字認識装置。
2. The first means includes: a recognition dictionary unit in which category groups having known topological structure features are accumulated in advance; a topological structure feature generating unit that generates topological structure features of unknown character patterns; Means for specifying a category in the recognition dictionary unit in which the degree of matching of the phase structure features of the character pattern generated by the generation unit exceeds a specified value, and the specified category is set as the category candidate. The character recognition device according to claim 1.
【請求項3】 前記第2手段は、 前記標準パタンの位相構造特徴がプリミティブで記述さ
れた位相構造特徴テーブルと、 前記特定されたカテゴリ候補に対する前記位相構造特徴
テーブル内の標準パタンと前記文字パタンとの位相構造
特徴の類似の度合いを決定する手段と、 を有することを特徴とする請求項1記載の文字認識装
置。
3. The second means comprises: a topological structure feature table in which topological structure features of the standard pattern are described in primitives; standard patterns and character patterns in the topological structure feature table for the identified category candidates. 2. The character recognition device according to claim 1, further comprising: a means for determining a degree of similarity of the topological structure feature with.
【請求項4】 前記類似の度合いの尺度が、特徴ベクト
ルのシティ・ブロック距離であることを特徴とする請求
項1、2または3記載の文字認識装置。
4. The character recognition device according to claim 1, 2 or 3, wherein the measure of the degree of similarity is a city block distance of a feature vector.
【請求項5】 前記位相構造特徴テーブルは、目的に応
じて標準パタンの位相構造特徴の一部が変形された目的
別標準パタンを含んで成ることを特徴とする請求項3記
載の文字認識装置。
5. The character recognition apparatus according to claim 3, wherein the topological structure feature table includes a per-purpose standard pattern in which a part of the topological structure feature of the standard pattern is modified according to the purpose. .
JP8136771A 1996-05-30 1996-05-30 Character recognition device Pending JPH09319825A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8136771A JPH09319825A (en) 1996-05-30 1996-05-30 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8136771A JPH09319825A (en) 1996-05-30 1996-05-30 Character recognition device

Publications (1)

Publication Number Publication Date
JPH09319825A true JPH09319825A (en) 1997-12-12

Family

ID=15183137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8136771A Pending JPH09319825A (en) 1996-05-30 1996-05-30 Character recognition device

Country Status (1)

Country Link
JP (1) JPH09319825A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010224787A (en) * 2009-03-23 2010-10-07 Toyota Central R&D Labs Inc Object identification device and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010224787A (en) * 2009-03-23 2010-10-07 Toyota Central R&D Labs Inc Object identification device and program

Similar Documents

Publication Publication Date Title
KR100249055B1 (en) Character recognition apparatus
JP2000353215A (en) Character recognition device and recording medium where character recognizing program is recorded
JP2827994B2 (en) Fingerprint feature extraction device
US6671403B1 (en) Pattern recognition apparatus and method utilizing conversion to a common scale by a linear function
JPH09319825A (en) Character recognition device
JP2001014465A (en) Method and device for recognizing object
JP2671984B2 (en) Information recognition device
JP2001243425A (en) On-line character recognition device and method
JP3130392B2 (en) Character recognition device
JP2002183667A (en) Character-recognizing device and recording medium
JP3487400B2 (en) Character recognition device, character recognition method, and storage medium
JP3754118B2 (en) Pattern recognition apparatus and pattern recognition method
JP4805485B2 (en) Word recognition method and word recognition device
JP2728117B2 (en) Character recognition device
KR100480541B1 (en) Apparatus for recognizing fingerprint and method for registering and recognizing fingerprint thereof
JP2976445B2 (en) Character recognition device
JP3280577B2 (en) Character recognition device
JPH0628462A (en) Fingerprint matching processor
JPS62281082A (en) Character recognizing device
JP2001126063A (en) Method and device for recognizing pattern
JPH0830734A (en) Character string recognition device
JP3553730B2 (en) Pattern recognition method and device
JPH0318987A (en) Dictionary registering method
JPH08212300A (en) Method and device for recognizing character
Duneau et al. An improved classification for Cursive script recognition