JP2000315247A - Character recognizing device - Google Patents

Character recognizing device

Info

Publication number
JP2000315247A
JP2000315247A JP11126053A JP12605399A JP2000315247A JP 2000315247 A JP2000315247 A JP 2000315247A JP 11126053 A JP11126053 A JP 11126053A JP 12605399 A JP12605399 A JP 12605399A JP 2000315247 A JP2000315247 A JP 2000315247A
Authority
JP
Japan
Prior art keywords
character
dictionary
standard pattern
area
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11126053A
Other languages
Japanese (ja)
Other versions
JP4280355B2 (en
Inventor
Yasunao Isaki
保直 伊崎
Hideo Kamata
英夫 鎌田
Shunji Sakane
俊司 坂根
Katsumi Ide
克美 井出
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP12605399A priority Critical patent/JP4280355B2/en
Priority to KR1019990047465A priority patent/KR100582039B1/en
Priority to CNB99123281XA priority patent/CN1181446C/en
Publication of JP2000315247A publication Critical patent/JP2000315247A/en
Application granted granted Critical
Publication of JP4280355B2 publication Critical patent/JP4280355B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

PROBLEM TO BE SOLVED: To provide a character-recognizing device capable of recognizing characters exactly and at high speed even from a character image the characters of which are difficult to be recognized. SOLUTION: This character recognizing device is provided with a character area segmenting part 11 to estimate character width of the inputted character image 10 and to segment a character area with length equivalent to the character width, a feature extracting part 12 to extract features of a character pattern in the segmented character area, a standard pattern dictionary 14 consisting of both of a one-character standard pattern dictionary 14-1 and a plural character standard pattern dictionary 14-2 and a dictionary collating part 15 to extract candidates for the character or character strings to be expressed by the character pattern in the character area by collating features of the character pattern extracted by the feature extracting part 12 with features of each of one character and the character strings described in the one-character standard pattern dictionary 14-1 and the plural character standard pattern dictionary 14-2.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、入力された文字画
像を文字として認識する文字認識装置に関する。
The present invention relates to a character recognition device for recognizing an input character image as a character.

【0002】[0002]

【従来の技術】従来、入力された文字画像を文字として
認識する文字認識装置の分野において、例えばOCR
(光学式文字読取装置)やイメージスキャナとOCRソ
フトとを組み合わせた文字認識装置などが広い業務分野
で用いられている。従来のOCR用帳票では、一文字ず
つの文字記入枠が印刷された帳票が用いられ、漢字を用
いるシステムでは文字記入枠の大きさも漢字が記入しや
すいよう大きな文字記入枠が採用されている。このよう
にすることによりOCRにとっては記入された文字を正
確に認識しやすくなり、また記入者に対して隣の文字と
接触しないように記入することを促す効果がある。
2. Description of the Related Art Conventionally, in the field of character recognition devices for recognizing input character images as characters, for example, OCR
(Optical character reading device) and a character recognition device combining an image scanner and OCR software are used in a wide range of business fields. In the conventional OCR form, a form in which a character entry box is printed for each character is used, and in a system using kanji, a large character entry box is used for the size of the character entry box so that kanji can be easily entered. This makes it easier for the OCR to accurately recognize the entered characters, and has the effect of encouraging the writer to enter the characters without touching the adjacent characters.

【0003】しかし、OCRの利用分野が一層広まるに
従って、一般に使用される通常の帳票のような小さな帳
票を用い文字枠にとらわれずに記入された文字列、すな
わち、通常の伝票などに不規則な文字間隔、不規則な記
入方法で記入された隣接する文字どうしが接触し合うよ
うな低品質の手書きの文字列についても実用になる認識
精度で認識することが可能な文字認識装置が求められて
いる。
However, as the field of use of OCR becomes more widespread, a character string written using a small form such as a general form used without being bound by a character frame, that is, an irregular form such as a normal form is used. There is a need for a character recognition device capable of recognizing a low-quality handwritten character string in which adjacent characters written by an irregular writing method are in contact with each other with practical recognition accuracy. I have.

【0004】また、印刷された文字列の場合は、OCR
−Bあるいはマルチフォントなどのように複数の特定の
文字フォントだけを用いて注意深く印刷されたOCR帳
票が使用されているが、印刷された文字列についても、
不特定のプリンタにより多様な文字ピッチで印刷され
た、多様な変形のある文字列、例えば、文字ピッチが狭
いプリンタやプロポーショナルピッチで印刷された文字
列、あるいは半角文字と全角文字が混在する文字列など
から実用になる認識精度で文字列を切り出すことのでき
る文字認識装置が要望されている。
In the case of a printed character string, an OCR
-OCR forms carefully printed using only a plurality of specific character fonts, such as B or multi-font, are used.
Character strings with various deformations printed by unspecified printers at various character pitches, for example, character strings printed at narrow character pitch printers or proportional pitches, or character strings containing half-width and full-width characters mixed For example, there is a demand for a character recognition device that can cut out a character string with a recognition accuracy that is practical.

【0005】[0005]

【発明が解決しようとする課題】従来の文字認識装置に
おける文字切出し方式、特にフリーピッチの文字列、す
なわち文字枠が設定されていないフィールドからの文字
切出し方式では、孤立した黒画素の連結領域について文
字列の高さ情報を求め、その高さ情報から文字のピッチ
情報を求め、その値により隣り合う文字を統合しあるい
は分離して認識対象とすべき一文字を切り出す方式が採
用されている。あるいは1行、1フィールドの文字列を
行方向、フィールド方向に垂直な方向へ投影しておき、
文字列の高さ情報から文字のピッチ情報を求め、その値
により投影ヒストグラムから文字位置を切り出していく
方式を採用したものもある。その切出しが一通りに決ま
らない場合には複数通りの切出し位置を求めることも行
われている。
In the character extraction system in the conventional character recognition apparatus, particularly in the character extraction system from a free-pitch character string, that is, a field in which a character frame is not set, a connected area of isolated black pixels is used. A method is employed in which height information of a character string is obtained, pitch information of the character is obtained from the height information, and adjacent characters are integrated or separated based on the value to cut out one character to be recognized. Alternatively, a character string of one line and one field is projected in a direction perpendicular to the line direction and the field direction,
There is also a method in which character pitch information is obtained from character string height information, and character positions are cut out from a projection histogram based on the value. If the cut-out is not determined in one way, a plurality of cut-out positions may be obtained.

【0006】通常、不特定多数の筆記者により予め決め
られた書式に従って記入された文字を収集し、これらの
文字から認識方式に依存する文字パターンの特徴を抽出
し統計的な手法などにより標準パターンが作成される。
また、標準パターンは、収集された文字から平均パター
ンとして作成されることもある。手書き文字の場合に
は、記入者により大きな字形変形が生じるため各字種に
ついて複数の標準パターンが作成される。通常一つの標
準パターンをテンプレートとよび、複数の標準パターン
を集めた辞書を複数テンプレート辞書と呼ぶ。辞書照合
方法としては、入力帳票から切り出された一文字からそ
の文字パターンの特徴を抽出し、この特徴と標準パター
ン辞書のテンプレートの特徴との間で類似度計算あるい
は距離計算を行い、最大の類似度を持つカテゴリあるい
は最小の距離を持つテンプレートのカテゴリを認識結果
として求める方法が採用されている。侯補文字列として
は、距離の小さい順に例えば8位までを侯補文字列とし
ている。
Normally, characters written by an unspecified number of writers in accordance with a predetermined format are collected, and from these characters, the characteristics of the character pattern depending on the recognition method are extracted. Is created.
Further, the standard pattern may be created as an average pattern from the collected characters. In the case of handwritten characters, a large character deformation is caused by the writer, so that a plurality of standard patterns are created for each character type. Usually, one standard pattern is called a template, and a dictionary in which a plurality of standard patterns are collected is called a multiple template dictionary. As a dictionary matching method, a feature of a character pattern is extracted from one character cut out from an input form, similarity calculation or distance calculation is performed between this feature and a feature of a template of a standard pattern dictionary, and the maximum similarity is calculated. Or a category of a template having a minimum distance as a recognition result. As candidate character strings, candidate character strings up to the eighth place, for example, are set in ascending order of distance.

【0007】印刷文字に関しても同様な方法で候補文字
列が求められる。複数通りの侯補がある場合はパターン
どうしの類似度評価値により、あるいは知識処理などの
言語処理により最良の切出し候補を決定する方法が採用
されている。
[0007] For print characters, a candidate character string is obtained in a similar manner. When there are a plurality of candidates, a method of determining the best clipping candidate by the similarity evaluation value between patterns or by language processing such as knowledge processing is adopted.

【0008】一般に、通常の伝票に手書き記入する場合
のようにフリーピッチで記入された文字列、あるいは不
特定のプリンタで印刷された文字列を認識する場合に、
隣接する文字どうしが接触することが多く、また、印刷
文字列の場合は半角文字と全角文字が混在することがあ
り、隣り合う文字どうしが接触することが多いため、一
文字ずつ検出して認識する方法では、どの範囲までが一
文字かを判断するのが困難であり、実用に耐える認識精
度を実現することは難しい。ひらがな、カタカナ、およ
び漢字では偏(へん)と旁(つくり)のように、もとも
と分離した文字領域からなる文字もあり、これらの文字
領域が正しく認識できなければ何文字記入してあるのか
さえ判断できない場合もある。
In general, when recognizing a character string written at a free pitch or a character string printed by an unspecified printer as in the case of writing by hand on a normal slip,
Adjacent characters often touch each other, and in the case of a print character string, half-width characters and full-width characters may be mixed, so that adjacent characters often touch each other, so that each character is detected and recognized one by one. According to the method, it is difficult to determine which range is a single character, and it is difficult to realize a recognition accuracy that can withstand practical use. For hiragana, katakana, and kanji characters, there are characters that originally consist of separated character areas, such as “n” and “n”, and if these character areas cannot be recognized correctly, it is possible to determine how many characters have been entered. There are times when you can't.

【0009】印刷文字列の文字切出しでは、1行の文字
列から個々の文字のピッチを推定する方法として次のよ
うな種々の方法が提案されている。
For character extraction of a print character string, the following various methods have been proposed as methods for estimating the pitch of each character from a character string of one line.

【0010】第1の方法は、1行の文字列の黒画素を行
方向に投影して行を構成する文字の平均高さを求める。
次に、文字列の黒画素を行方向に垂直な方向に投影して
黒画素の行方向の頻度をヒストグラムとして表しそのヒ
ストグラムから頻度が0の位置、すなわち文字列が途切
れている位置、あるいはヒストグラムの極小点、すなわ
ち接触文字または重なり文字を切り離すべき切断候補位
置を求める。この切断候補位置に基づき、先に求めた文
字列の平均高さから全角文字、半角文字の列として妥当
と見られる位置を文字切出し位置とする。
In the first method, black pixels of a character string in one line are projected in the line direction to determine the average height of characters forming the line.
Next, the black pixels of the character string are projected in a direction perpendicular to the row direction, and the frequency of the black pixels in the row direction is represented as a histogram. , Ie, a cutting candidate position at which a contact character or an overlapping character is to be separated. Based on this cutting candidate position, a position that is considered to be valid as a full-width character and half-width character string based on the average height of the character string previously obtained is set as a character cutout position.

【0011】第2の方法は、1行の文字列の黒画素を行
方向に垂直な方向に投影して黒画素の行方向の頻度をヒ
ストグラムとして表しそのヒストグラムから頻度が0の
位置、あるいはヒストグラムの極小点を求め、文字切出
し位置と推定される位置をその文字列に対して複数通り
求める。複数通りの文字切出位置のうちのいずれが尤も
らしい文字切出位置であるかの判定は、文字列の類似度
評価値と認識結果からの判断にゆだねる。
The second method is to project the black pixels of a character string in one line in a direction perpendicular to the line direction and to represent the frequency of the black pixels in the line direction as a histogram. Is obtained, and a plurality of positions estimated as character extraction positions are obtained for the character string. The determination of which of the plurality of character cutout positions is a likely character cutout position is left to the judgment based on the similarity evaluation value of the character string and the recognition result.

【0012】第3の方法は、1行の文字列について黒画
素の連結領域を求め、連結領域の並びについて小さな領
域どうしは統合し、大きな領域は複数に分離して一文字
の領域を決めて文字切出しを行なう。その際の小さい領
域、大きい領域の判断は文字列の高さを基準にして行
う。
In a third method, a connected area of black pixels is obtained for one line of a character string, small areas are integrated with respect to the arrangement of the connected areas, and a large area is divided into a plurality of areas to determine one character area. Cut out. At this time, the small area and the large area are determined based on the height of the character string.

【0013】しかし、上記のいずれの方法にもそれぞれ
次のような問題がある。すなわち、第1の方法において
は、1行の文字列が全て全角文字で構成されている場合
には、全角文字は文字幅と文字高さが全て等しいと考え
られるので平均文字高さから文字幅を正確に推定するこ
とができ、従って、一文字ずつ正確に切り出すことがで
きるが、半角文字と全角文字が混在している場合、例え
ば全角の仮名交じり漢字文字列に半角の英数字あるいは
カタカナが混入している場合には、文字位置が半角分だ
けずれたり、半角2文字が一文字分に認識されることが
あり、正しい文字切出位置が求められないことがある。
However, each of the above methods has the following problems. That is, in the first method, when the character string of one line is composed entirely of full-width characters, the full-width characters are considered to have the same character width and character height. Can be accurately estimated, and thus can be cut out exactly one character at a time.However, if half-width characters and full-width characters are mixed, for example, half-width alphanumeric characters or katakana are mixed in full-width kana mixed kanji character strings In such a case, the character position may be shifted by one half-width, or two half-width characters may be recognized as one character, and a correct character extraction position may not be obtained.

【0014】また、第2の方法では、1行の文字列に対
して複数通りの切出し結果が得られるため1行の認識処
理に複数行分の処理時間がかかり、接触文字が多数ある
場合などは非常に多くの切出し結果が出てくるため認識
処理速度が著しく低下するという問題がある。
In the second method, a plurality of cut-out results are obtained from a one-line character string, so that it takes a long processing time for a one-line recognition process for a plurality of lines, and there are many contact characters. However, there is a problem that the recognition processing speed is significantly reduced because a large number of cutout results are obtained.

【0015】また、第3の方法では、接触した文字列部
分の分離に関して認識精度上多くの問題があり、正確に
文字認識を行うことは困難である。
In the third method, there are many problems in recognition accuracy regarding separation of a touched character string portion, and it is difficult to perform accurate character recognition.

【0016】本発明は、上記の事情に鑑み、文字認識の
難しい文字画像からでも正確にかつ高速で文字認識する
ことが可能な文字認識装置を提供することを目的とす
る。
The present invention has been made in view of the above circumstances, and has as its object to provide a character recognition apparatus capable of accurately and quickly recognizing characters even from a character image in which character recognition is difficult.

【0017】[0017]

【課題を解決するための手段】上記の目的を達成する本
発明の文字認識装置は、入力された文字画像から文字幅
を推定してその文字画像から文字幅に相当する長さの文
字領域を切り出す文字領域切出部と、上記文字領域切出
部により切り出された文字領域内の文字パターンの特徴
を抽出する特徴抽出部と、標準的な文字一文字それぞれ
の特徴が記述された一文字標準パターン辞書と標準的な
文字が所定数配列されてなる文字列それぞれの特徴が記
述された複数文字標準パターン辞書との双方からなる標
準パターン辞書と、上記特徴抽出部で抽出された、文字
領域内の文字パターンの特徴を、上記標準パターン辞書
を構成する上記一文字標準パターン辞書および上記複数
文字標準パターン辞書に記述された一文字および文字列
それぞれの特徴と照合してその文字領域内の文字パター
ンが表す文字あるいは文字列の候補を抽出する辞書照合
部とを備えたことを特徴とする。
A character recognition apparatus according to the present invention for achieving the above object estimates a character width from an input character image and calculates a character area having a length corresponding to the character width from the character image. A character area cutout section to be cut out, a feature extraction section to extract the characteristics of the character pattern in the character area cut out by the above character area cutout section, and a one-character standard pattern dictionary in which the characteristics of each standard character are described. And a standard pattern dictionary composed of both a character pattern in which a predetermined number of standard characters are arranged and a multi-character standard pattern dictionary in which the characteristics of each character string are described. The features of the pattern are the features of each of the one-character and character strings described in the one-character standard pattern dictionary and the multi-character standard pattern dictionary that constitute the standard pattern dictionary. Combined and is characterized in that a dictionary collation unit for extracting a candidate character or character string representing a character pattern of the character area.

【0018】ここで、本発明の文字認識装置が、上記辞
書照合部により、上記文字領域内の文字パターンの特徴
を上記複数文字標準パターン辞書に記述された文字列の
特徴と照合した結果文字列の候補が抽出された場合に、
上記特徴抽出部に、文字列の候補が抽出された文字領域
がさらにその文字列を構成する文字数と同数に分割され
てなる各分割領域それぞれの文字パターンの特徴を抽出
させ、上記辞書照合部に、上記分割領域それぞれの文字
パターンの特徴を、上記一文字標準パターン辞書に記述
された一文字それぞれの特徴と照合させて上記分割領域
の配列に対応した文字列の候補を抽出させ、その文字列
の候補が、上記複数文字標準パターン辞書を用いて抽出
された文字列の候補と一致するか否かを検証する検証部
を備えたものであることが好ましい。
Here, the character recognition device of the present invention compares the character pattern feature in the character area with the character string feature described in the multi-character standard pattern dictionary by the dictionary matching unit. When the candidate of is extracted,
The feature extraction unit causes the character region in which the character string candidate is extracted to further extract the characteristic of the character pattern of each divided region obtained by dividing the character region into the same number as the number of characters constituting the character string. The feature of each character pattern of the divided area is compared with the feature of each character described in the one-character standard pattern dictionary to extract a character string candidate corresponding to the arrangement of the divided area, and the character string candidate Is preferably provided with a verification unit for verifying whether or not it matches a candidate for a character string extracted by using the plural-character standard pattern dictionary.

【0019】また、上記文字領域切出部が、上記文字画
像から上記文字幅に相当する長さの文字領域を、該文字
幅を上記所定数と同数に分割したときの一分割分の長さ
ずつずらしながら切り出すものであることも好ましい。
Further, the character area cutout section may divide a character area having a length corresponding to the character width from the character image by a length corresponding to one division when the character width is divided into the same number as the predetermined number. It is also preferable to cut out while shifting each other.

【0020】また、上記辞書照合部が、上記文字領域切
出部により切り出された文字領域それぞれについて文字
あるいは文字列の候補を抽出するとともに抽出された文
字あるいは文字列の候補を総合して文字配列の候補を抽
出するものであることも好ましい態様である。
The dictionary collating unit extracts a character or character string candidate for each of the character regions cut out by the character region extracting unit, and synthesizes the extracted character or character string candidates to form a character arrangement. It is also a preferable embodiment to extract the candidate of (1).

【0021】さらに、上記辞書照合部が、文字認識不能
な文字認識不能領域が残った場合に、上記文字認識不能
領域の文字パターンの特徴を上記一文字標準パターン辞
書に記述された一文字それぞれの特徴と照合して文字候
補を抽出するものであることも好ましい態様の一つであ
る。
Further, the dictionary collating unit, when a character unrecognizable area in which the character cannot be recognized remains, identifies the characteristics of the character pattern in the character unrecognizable area with the characteristics of each character described in the one-character standard pattern dictionary. Extracting character candidates by collation is also a preferred embodiment.

【0022】[0022]

【発明の実施の形態】以下、本発明の実施形態について
説明する。
Embodiments of the present invention will be described below.

【0023】図1は、本発明の文字認識装置が運用され
るコンピュータの外観図(a)および内部構成図(b)
である。
FIG. 1 is an external view (a) and an internal configuration diagram (b) of a computer on which the character recognition device of the present invention is operated.
It is.

【0024】図1(a)および図1(b)に示すよう
に、このコンピュータ60は、CPU61、メモリ6
2、表示装置63、プリンタ64、CD−ROMドライ
ブ65、磁気ディスク66、マウス67、キーボード6
8、およびイメージスキャナ69などがシステムバス7
0によって接続されて構成されおり、このコンピュータ
60に本発明の文字認識装置が形成されている。
As shown in FIGS. 1A and 1B, the computer 60 has a CPU 61 and a memory 6.
2. Display device 63, printer 64, CD-ROM drive 65, magnetic disk 66, mouse 67, keyboard 6
8 and an image scanner 69 are connected to the system bus 7.
The character recognition device of the present invention is formed on the computer 60.

【0025】イメージスキャナ69によりこのコンピュ
ータ60に文字画像が入力されて文字認識が行われる。
A character image is input to the computer 60 by the image scanner 69, and character recognition is performed.

【0026】図2は、本発明の文字認識装置の第1の実
施形態における機能ブロック図である。
FIG. 2 is a functional block diagram of the character recognition device according to the first embodiment of the present invention.

【0027】図2に示すように、この第1の実施形態の
文字認識装置100は、入力された文字画像10から文
字幅を推定して文字画像10から文字幅に相当する長さ
の文字領域を切り出す文字領域切出部11、文字領域切
出部11により切り出された文字領域内の文字パターン
の特徴を抽出する特徴抽出部12、標準的な文字一文字
それぞれの特徴が記述された一文字標準パターン辞書1
4_1と標準的な文字が所定数配列されてなる文字列そ
れぞれの特徴が記述された複数文字標準パターン辞書1
4_2との双方からなる標準パターン辞書14、特徴抽
出部12で抽出された、文字領域内の文字パターンの特
徴を、標準パターン辞書14を構成する一文字標準パタ
ーン辞書14_1および複数文字標準パターン辞書14
_2に記述された一文字および文字列それぞれの特徴と
照合してその文字領域内の文字パターンが表す文字ある
いは文字列の候補を抽出する辞書照合部13、および抽
出された文字あるいは文字列の候補を格納し外部に出力
する候補文字出力部15を備えている。
As shown in FIG. 2, the character recognition apparatus 100 according to the first embodiment estimates a character width from an input character image 10 and calculates a character area having a length corresponding to the character width from the character image 10. A character region extracting unit 11 for extracting characters, a character extracting unit 12 for extracting characteristics of a character pattern in a character region extracted by the character region extracting unit 11, a one-character standard pattern in which the characteristics of each standard character are described. Dictionary 1
A multi-character standard pattern dictionary 1 that describes the characteristics of each character string in which a predetermined number of 4_1 and standard characters are arranged
4_2, the one-character standard pattern dictionary 14_1 and the plural-character standard pattern dictionary 14 constituting the standard pattern dictionary 14 are extracted from the character pattern in the character area extracted by the feature extracting unit 12.
_ 2, a dictionary matching unit 13 that matches a feature of each character and character string described in _ <b> 2 to extract a candidate for a character or a character string represented by a character pattern in the character area, and a candidate for the extracted character or character string. A candidate character output unit 15 for storing and outputting to the outside is provided.

【0028】次に、この第1の実施形態の文字認識装置
100の動作について説明する。
Next, the operation of the character recognition device 100 according to the first embodiment will be described.

【0029】例えば、イメージスキャナなどにより帳票
などから取り込まれた文字画像10がこの文字認識装置
100に入力されると、文字領域切出部11により文字
の平均高さが求められ、それに基づいて文字幅が推定さ
れる。文字の平均高さは、文字列の黒画素を行方向に投
影することによって求められ、日本語の全角文字の幅と
高さはほぼ等しく記入されることが多いという前提に基
づき文字の平均高さから文字ピッチ、すなわち文字幅を
推定することができる。この文字幅により全角文字を検
出することができる。
For example, when a character image 10 fetched from a form or the like by an image scanner or the like is input to the character recognition device 100, an average character height is obtained by the character area cutout unit 11, and the character height is calculated based on the average height. The width is estimated. The average height of a character is determined by projecting the black pixels of the character string in the row direction, and based on the assumption that the width and height of Japanese double-byte characters are often written almost equally. From this, the character pitch, that is, the character width can be estimated. Full-width characters can be detected based on the character width.

【0030】半角文字は全角文字の半分の文字幅である
から文字の平均高さの半分の文字幅で半角文字一文字を
検出することができる。
Since a half-width character has half the width of a full-width character, one half-width character can be detected with a half width of the average character height.

【0031】隣接する文字どうしが接触している接触文
字については、文字領域の幅が上記の文字幅の2文字分
の幅である場合は、文字領域を2分の1に強制的に分割
することにより2文字として検出することができる。ま
た、3文字分の幅がある場合は文字領域を3分の1に強
制的に分割すればよい。
For a contact character in which adjacent characters are in contact with each other, if the width of the character area is two characters of the above character width, the character area is forcibly divided into half. Thus, it can be detected as two characters. If there is a width of three characters, the character area may be forcibly divided into one third.

【0032】こうして得られた文字幅に相当する長さの
文字領域が文字画像10の左端から順次切り出される。
文字幅の推定および文字領域の切出しは、文字画像10
の左端からだけではなく、必要に応じて文字画像10の
途中から行えるように構成してもよい。
A character area having a length corresponding to the character width thus obtained is sequentially cut out from the left end of the character image 10.
Estimation of the character width and extraction of the character area are performed using the character image 10
May be configured not only from the left end, but also from the middle of the character image 10 as necessary.

【0033】特徴抽出部12は、切り出された文字領域
内の文字パターンの特徴を抽出する。文字パターンの特
徴は、例えば、一文字分の矩形の領域を縦8列横8行の
8×8=64領域に分割し、垂直方向と水平方向に走査
して黒画素の個数を計数して得られる投影分布関数によ
り表わすことができる。このような方法で抽出された文
字領域内の文字パターンの特徴は、辞書照合部13にお
いて、一文字標準パターン辞書14_1および複数文字
標準パターン辞書14_2に記述された一文字および文
字列それぞれの特徴と照合され相互間の距離を求めて距
離の小さい順に例えば10個の候補が求められる。
The feature extracting unit 12 extracts the features of the character pattern in the cut-out character region. The feature of the character pattern is obtained, for example, by dividing a rectangular area for one character into 8 × 8 = 64 areas of 8 columns × 8 rows and scanning in the vertical and horizontal directions to count the number of black pixels. Can be represented by the following projected distribution function: The feature of the character pattern in the character region extracted by such a method is compared in the dictionary matching unit 13 with the feature of each of the one character and the character string described in the one-character standard pattern dictionary 14_1 and the plural-character standard pattern dictionary 14_2. For example, ten candidates are obtained in ascending order of the distance by obtaining the distance between them.

【0034】ここで、標準パターン辞書14(図2参
照)は、正常な一文字の文字領域から統計的に作成され
た一文字標準パターン辞書14_1と、標準的な文字が
所定数、例えば2つ配列されてなる文字列それぞれの特
徴が記述された複数文字標準パターン辞書14_2との
2つの部分から構成されている。
The standard pattern dictionary 14 (see FIG. 2) includes a one-character standard pattern dictionary 14_1 statistically created from a normal one-character character area and a predetermined number of standard characters, for example, two. And a multi-character standard pattern dictionary 14_2 in which the characteristics of each character string are described.

【0035】このように、本実施形態において標準パタ
ーン辞書14として一文字標準パターン辞書14_1お
よび複数文字標準パターン辞書14_2の2種類の辞書
を備えているのは、全角文字列の中に半角数字が並んで
いる場合に、文字領域切出部11は、半角2文字を一文
字として検出するので、この半角2文字を一つのパター
ンとして辞書照合を行うようにするためである。
As described above, the two types of dictionaries, the one-character standard pattern dictionary 14_1 and the plural-character standard pattern dictionary 14_2, are provided as the standard pattern dictionary 14 in this embodiment because half-width numbers are arranged in a full-width character string. In this case, the character area cutout unit 11 detects two half-width characters as one character, so that dictionary matching is performed using the two half-width characters as one pattern.

【0036】標準パターン辞書14には、標準パターン
とそのカテゴリ、すなわちその標準パターンを作成した
文字カテゴリを表す文字コードが記述されている。一文
字標準パターン辞書の場合は、例えば「0」というよう
に1つの文字コードが記述されており、複数文字標準パ
ターン辞書の場合は、例えば「00」というように2つ
の文字コードの並びが記述されている。
The standard pattern dictionary 14 describes standard patterns and their categories, that is, character codes representing the character categories in which the standard patterns are created. In the case of a one-character standard pattern dictionary, one character code is described, for example, "0". In the case of a multiple-character standard pattern dictionary, a sequence of two character codes is described, for example, "00". ing.

【0037】辞書照合部13での一文字の標準パターン
辞書を用いた照合により得られた結果は、正常な一文字
として検出できた文字領域であると判断されるのでその
まま1つの文字コードを候補として出力する。辞書照合
部13での複数文字標準パターン辞書を用いた照合によ
り得られた結果は、複数文字コードの並びを候補として
出力する。
The result obtained by the collation using the standard pattern dictionary of one character in the dictionary collation unit 13 is determined to be a character area that can be detected as a normal one character, so that one character code is output as a candidate as it is. I do. The result obtained by the collation using the plural-character standard pattern dictionary in the dictionary collating unit 13 outputs a sequence of a plural-character code as a candidate.

【0038】候補文字出力部15では、辞書照合部13
から出力された文字コードを整理して最終候補文字列を
作成し、一文字の候補は1つの文字コードのまま、複数
文字の候補は複数の文字コードの並びとして外部に出力
される。
In the candidate character output unit 15, the dictionary matching unit 13
A final candidate character string is created by organizing the character codes output from, and a plurality of character candidates are output to the outside as a sequence of a plurality of character codes while one character candidate remains one character code.

【0039】このように、本実施形態の文字認識装置1
00では、文字行全体ではなく局所的な文字列部分に着
目し一文字標準パターン辞書と複数文字標準パターン辞
書との双方からなる標準パターン辞書を用いて照合を行
うことにより、半角文字が含まれていたり文字どうしが
接触していたりしている低品質な文字列からでも、文字
を正確に切り出すことができるので、文字認識の精度は
高くなり、しかも多くの切出し候補を抽出する必要がな
くなるから認識処理時間も短縮される。
As described above, the character recognition device 1 of the present embodiment
In the case of 00, half-width characters are included by focusing on a local character string portion instead of the entire character line and performing matching using a standard pattern dictionary composed of both a one-character standard pattern dictionary and a multi-character standard pattern dictionary. Characters can be cut out accurately even from low-quality character strings where characters touch each other, increasing the accuracy of character recognition and eliminating the need to extract many cutout candidates. Processing time is also reduced.

【0040】次に、本発明の文字認識装置の第2の実施
形態について説明する。
Next, a second embodiment of the character recognition device of the present invention will be described.

【0041】図3は、本発明の文字認識装置の第2の実
施形態を示す概略構成図である。
FIG. 3 is a schematic configuration diagram showing a second embodiment of the character recognition device of the present invention.

【0042】図3に示すように、この第2の実施形態の
文字認識装置200は、図2に示した第1の実施形態の
文字認識装置100と同様の文字領域切出部11、特徴
抽出部12、一文字標準パターン辞書14_1と複数文
字標準パターン辞書14_2との双方からなる標準パタ
ーン辞書14、辞書照合部13、および候補文字出力部
15を備えたほかに、検証部16が追加されている。
As shown in FIG. 3, a character recognition apparatus 200 according to the second embodiment has the same character area extraction unit 11 and feature extraction as the character recognition apparatus 100 according to the first embodiment shown in FIG. Unit 12, a standard pattern dictionary 14, which includes both a single-character standard pattern dictionary 14_1 and a multiple-character standard pattern dictionary 14_2, a dictionary matching unit 13, and a candidate character output unit 15, and a verification unit 16 is added. .

【0043】この検証部16は、辞書照合部13によ
り、文字領域内の文字パターンの特徴を複数文字標準パ
ターン辞書14_2に記述された文字列の特徴と照合し
た結果文字列の候補が抽出された場合に、特徴抽出部1
2に、上記文字列の候補が抽出された文字領域がさらに
その文字列を構成する文字数と同数に分割されてなる各
分割領域それぞれの文字パターンの特徴を抽出させ、辞
書照合部13に、分割領域それぞれの文字パターンの特
徴を、一文字標準パターン辞書14_1に記述された一
文字それぞれの特徴と照合させて分割領域の配列に対応
した文字列の候補を抽出させ、その文字列の候補が、複
数文字標準パターン辞書14_2を用いて抽出された文
字列の候補と一致するか否かを検証するものである。
The verification unit 16 compares the characteristics of the character patterns in the character area with the characteristics of the character strings described in the multiple-character standard pattern dictionary 14_2 by the dictionary matching unit 13, and extracts character string candidates. In this case, the feature extraction unit 1
2, the character region in which the character string candidate is extracted is further extracted with the same number of characters as the number of characters constituting the character string. The character pattern feature of each region is compared with the feature of each character described in the one-character standard pattern dictionary 14_1 to extract a character string candidate corresponding to the arrangement of the divided regions. This is to verify whether or not it matches the character string candidate extracted using the standard pattern dictionary 14_2.

【0044】図4は、第2の実施形態の文字認識装置に
設けられる検証部の動作を説明する流れ図であり、図5
は、第2の実施形態における検証の機能の説明図であ
る。
FIG. 4 is a flowchart for explaining the operation of the verification unit provided in the character recognition device of the second embodiment.
FIG. 9 is an explanatory diagram of a verification function according to the second embodiment.

【0045】図4に示すように、認識結果が複数文字パ
ターンの認識結果であるか否かが判定され(ステップS
1)、判定の結果が複数文字パターンの認識結果である
場合、すなわち、辞書照合部13が、文字領域内の文字
パターンの特徴を複数文字標準パターン辞書14_2に
記述された文字列の特徴と照合した結果、文字列の候補
が抽出された場合に再びその文字領域の切り出しを行う
(ステップS2)。すなわち、特徴抽出部12に、上記
文字列の候補が抽出された文字領域がさらにその文字列
を構成する文字数と同数に分割されてなる各分割領域そ
れぞれの文字パターンの特徴を抽出させる。
As shown in FIG. 4, it is determined whether the recognition result is a recognition result of a plurality of character patterns (step S).
1) If the result of the determination is a recognition result of a plurality of character patterns, that is, the dictionary matching unit 13 matches the features of the character patterns in the character area with the features of the character strings described in the multiple-character standard pattern dictionary 14_2. As a result, when a character string candidate is extracted, the character area is cut out again (step S2). That is, the feature extracting unit 12 causes the character region in which the character string candidate is extracted to further extract the character pattern characteristics of each divided region obtained by dividing the character region into the same number as the number of characters constituting the character string.

【0046】ここまでの処理過程を図5に基づき説明す
ると、辞書照合部13(図3参照)による照合の結果、
複数文字、例えば、「0」の2文字が一つのパターン2
0として認識された場合、文字領域切出部11によりそ
の文字領域の切り出しが行われ、パターン20の垂直方
向の黒画素投影ヒストグラムの極小値を示す位置で分割
が行われる。この例では2文字なのでパターン20_1
とパターン20_2とに2分割される。半角文字が2文
字並んでいる場合には2等分される。
The process up to this point will be described with reference to FIG. 5.
A plurality of characters, for example, two characters “0” are one pattern 2
If it is recognized as 0, the character region is cut out by the character region cutout unit 11, and division is performed at a position indicating the minimum value of the black pixel projection histogram in the vertical direction of the pattern 20. In this example, there are two characters, so pattern 20_1
And a pattern 20_2. If two half-width characters are arranged, they are divided into two equal parts.

【0047】次に、分割された文字それぞれの認識が行
われる(ステップS3)。すなわち、辞書照合部13
は、分割されたそれぞれの文字パターン20_1,20
_2の特徴を、一文字標準パターン辞書14_1に記述
された一文字それぞれの特徴と照合させて分割領域の配
列に対応した文字列の候補を抽出する。
Next, each of the divided characters is recognized (step S3). That is, the dictionary matching unit 13
Are the divided character patterns 20_1 and 20_1.
_2 is compared with the characteristics of each character described in the one-character standard pattern dictionary 14_1 to extract character string candidates corresponding to the arrangement of the divided regions.

【0048】次に、認識結果の検証が行われる(ステッ
プS4)。すなわち、検証部16は、一文字標準パター
ン辞書14_1を用いて抽出した文字列の候補が、複数
文字標準パターン辞書14_2を用いて抽出した文字列
の候補と一致するか否かを検証する。
Next, verification of the recognition result is performed (step S4). That is, the verification unit 16 verifies whether or not the character string candidate extracted using the one-character standard pattern dictionary 14_1 matches the character string candidate extracted using the multiple-character standard pattern dictionary 14_2.

【0049】検証部16による検証の結果(ステップS
5)、一文字標準パターン辞書14_1を用いて抽出し
た文字列の候補が、複数文字標準パターン辞書14_2
を用いて抽出した文字列の候補と一致する場合は、分割
された文字は妥当であると判断し、これらのパターン2
0_1,20_2の文字コード21,22(図5参照)
を候補文字出力部15に出力する。ステップS5におけ
る判定の結果、両者が一致しない場合は分割は不適切で
あるとして分割結果を候補から除外する(ステップS
6)。
The result of the verification by the verification unit 16 (step S
5) A character string candidate extracted using the one-character standard pattern dictionary 14_1 is a plural-character standard pattern dictionary 14_2.
If the character string matches the candidate for the character string extracted using
Character codes 21 and 22 of 0_1 and 20_2 (see FIG. 5)
Is output to the candidate character output unit 15. If the result of determination in step S5 is that they do not match, the division is determined to be inappropriate and the division result is excluded from the candidates (step S5).
6).

【0050】第2の実施形態ではこのような検証が行わ
れるので、図5に示したような2つの文字どうしが接触
した場合の文字画像からでも正確な文字認識を行うこと
ができる。
In the second embodiment, since such verification is performed, accurate character recognition can be performed even from a character image when two characters come into contact with each other as shown in FIG.

【0051】次に、本発明の文字認識装置の第3の実施
形態について説明する。
Next, a third embodiment of the character recognition device of the present invention will be described.

【0052】図6は、本発明の文字認識装置の第3の実
施形態における文字切り出し方式の説明図である。
FIG. 6 is an explanatory diagram of a character cutout method in a third embodiment of the character recognition device of the present invention.

【0053】この第3の実施形態の文字認識装置は、図
2または図3に示した第1または第2の実施形態の文字
認識装置と類似の構成を有しており、文字領域切出部の
機能のみが第1および第2の実施形態の文字認識装置と
相違している。すなわち、第3の実施形態の文字認識装
置の文字領域切出部では、入力された文字画像から文字
幅に相当する長さの文字領域を、文字幅を2つに分割し
たときの一分割分の長さずつずらしながら切り出すよう
構成されている。
The character recognition device according to the third embodiment has a configuration similar to that of the character recognition device according to the first or second embodiment shown in FIG. 2 or FIG. Only the function is different from the character recognition devices of the first and second embodiments. That is, in the character area cutout unit of the character recognition device according to the third embodiment, the character area having the length corresponding to the character width is divided by two when the character width is divided into two from the input character image. It is configured to cut out while shifting by the length of.

【0054】図6に示すような「1」から「0」までの
10個の全角文字列に相当する文字画像30から文字領
域を切り出す場合について説明する。
A case where a character area is cut out from a character image 30 corresponding to ten full-width character strings from "1" to "0" as shown in FIG. 6 will be described.

【0055】先ず、文字画像30の黒画素を文字列方向
と垂直方向に、すなわち、横書き文字列と推定される文
字画像30の場合は、上下方向に投影してヒストグラム
を作成し、そのヒストグラムの極小となる位置を求め、
高さHから判断して文字画像の先頭からHおよびH/2
に相当する距離に現れる極小値の位置の間隔からWおよ
びW/2を推定する。そしてこの文字幅WでピッチをW
/2ずつずらしながら文字領域を切り出していく。
First, in the case of the character image 30 which is estimated to be a horizontally written character string, the black pixels of the character image 30 are projected in the vertical direction to create a histogram. Find the minimum position,
Judged from the height H, H and H / 2 from the top of the character image
W and W / 2 are estimated from the interval of the position of the minimum value appearing at a distance corresponding to. And the pitch is W by this character width W.
The character area is cut out while shifting by / 2.

【0056】図6の場合、先ずalの文字領域「12」
が一文字として切り出され、特徴抽出、辞書照合が行わ
れ、候補が求められる。この文字領域「12」の場合は
複数文字標準パターン辞書14_2(図3参照)の中の
「12」の標準パターンに最も距離が近いので、第2の
実施形態におけると同様な方法で再び文字切出、特徴抽
出、辞書照合、および検証が行われ、文字領域「12」
が2つの文字領域に分割され、「1」および「2」とい
う2文字の候補が得られる。次に、W/2だけずらした
a2の文字領域「23」が一文字として切り出され、文
字領域alの場合と同様な認識処理が行なわれ、「2」
および「3」という2文字の候補が得られる。同様にし
て、文字領域a3,a4,・・・が認識処理され、
「3」および「4」という2文字の候補、「4」および
「5」という2文字の候補、・・・が得られる。
In the case of FIG. 6, first, the character area "12" of al
Is extracted as one character, feature extraction and dictionary matching are performed, and candidates are obtained. In the case of this character area “12”, the distance is closest to the standard pattern of “12” in the multiple-character standard pattern dictionary 14_2 (see FIG. 3), so the character is cut again in the same manner as in the second embodiment. Output, feature extraction, dictionary matching, and verification are performed, and the character area "12"
Is divided into two character regions, and two character candidates of “1” and “2” are obtained. Next, the character area "23" of a2 shifted by W / 2 is cut out as one character, and the same recognition processing as in the case of the character area al is performed.
And "3" are obtained. Similarly, the character areas a3, a4,.
Two character candidates "3" and "4", two character candidates "4" and "5", and so on are obtained.

【0057】辞書照合部13は、上記のようにして切り
出された文字領域それぞれについて文字あるいは文字列
の候補を抽出するとともに抽出された文字あるいは文字
列の候補を総合して文字配列の候補を抽出し候補文字出
力部に出力する。
The dictionary matching unit 13 extracts a character or character string candidate for each of the character regions cut out as described above, and extracts a character arrangement candidate by integrating the extracted character or character string candidates. And outputs it to the candidate character output unit.

【0058】このように文字切出を行うことにより、全
角文字と半角文字とが混在している文字画像であっても
正確な文字認識を行うことができる。
By performing character extraction in this manner, accurate character recognition can be performed even for a character image in which full-width characters and half-width characters are mixed.

【0059】また、この文字切出方式によれば、次に示
すような接触文字の場合にも正確な文字認識を行うこと
ができる。
Further, according to this character extracting method, accurate character recognition can be performed even in the case of the following contact characters.

【0060】図7は、第3の実施形態における文字切り
出し方式による他の処理例を示す図である。
FIG. 7 is a diagram showing another example of processing by the character cutout method in the third embodiment.

【0061】図7に示すように、この文字画像40には
1つの「1」と、互いに接触した7つの「0」とが含ま
れている。この文字画像40の場合にも、図6における
と同様に、先ずalの文字領域「10」が一文字として
切り出され、特徴抽出、辞書照合が行われ、候補が求め
られる。この文字領域「10」の場合は複数文字標準パ
ターン辞書14_2(図3参照)の中の「10」の標準
パターンに最も距離が近いので、第2の実施形態におけ
ると同様の方法により「1」および「0」という2文字
の候補が得られる。次に、W/2だけずらしたa2の文
字領域「00」が一文字として切り出され、「0」およ
び「0」という2文字の候補が得られる。同様にして、
a3,a4,・・・の領域が処理される。
As shown in FIG. 7, the character image 40 includes one "1" and seven "0" s that are in contact with each other. In the case of the character image 40 as well, as in FIG. 6, first, the character area "10" of al is cut out as one character, and feature extraction and dictionary matching are performed to obtain candidates. In the case of the character area “10”, the distance is closest to the standard pattern of “10” in the multiple-character standard pattern dictionary 14_2 (see FIG. 3), and thus “1” is obtained by the same method as in the second embodiment. And two characters “0” are obtained. Next, the character area “00” of a2 shifted by W / 2 is cut out as one character, and two character candidates “0” and “0” are obtained. Similarly,
The areas a3, a4,... are processed.

【0062】辞書照合部13は、上記のようにして切り
出された文字領域それぞれについて文字あるいは文字列
の候補を抽出するとともに抽出された文字あるいは文字
列の候補を総合して文字配列の候補を抽出し候補文字出
力部に出力する。
The dictionary matching unit 13 extracts a character or character string candidate for each of the character regions cut out as described above, and extracts a character arrangement candidate by integrating the extracted character or character string candidates. And outputs it to the candidate character output unit.

【0063】このように文字切出を行うことにより隣り
合う文字どうしが接触した文字画像であっても正確な文
字認識を行うことができる。
By performing character extraction in this manner, accurate character recognition can be performed even for a character image in which adjacent characters contact each other.

【0064】次に、本発明の文字認識装置の第4の実施
形態について説明する。
Next, a fourth embodiment of the character recognition device of the present invention will be described.

【0065】この第4の実施形態の文字認識装置は、図
2または図3に示した文字認識装置100,200とほ
ぼ同様の構成を有しているが、この実施形態の辞書照合
部は、文字認識不能領域が残った場合に、その文字パタ
ーンの特徴を一文字標準パターン辞書14_1に記述さ
れた一文字それぞれの特徴と照合して文字候補を抽出す
るよう構成されている。
The character recognition device according to the fourth embodiment has substantially the same configuration as the character recognition devices 100 and 200 shown in FIG. 2 or FIG. When a character unrecognizable area remains, the feature of the character pattern is matched with the feature of each character described in the one-character standard pattern dictionary 14_1 to extract a character candidate.

【0066】図8は、本発明の文字認識装置の第4の実
施形態における文字切り出し方式の説明図である。
FIG. 8 is an explanatory diagram of a character segmentation method in a fourth embodiment of the character recognition device of the present invention.

【0067】図8(a)に示すように、全角のカタカナ
文字の並びの中に半角に相当する文字幅で濁点あるいは
空白が混入した文字画像50の場合は、図8(b)に示
すように、先ず、第2および第3の実施形態におけると
同様の方法により平均高さHから文字幅Wを推定し、文
字画像50の左端から文字幅Wで文字領域al「カ」を
切り出してカタカナの「カ」が認識される。次に、W/
2だけ切出位置をずらして文字幅Wで文字領域a2を切
り出して認識処理をおこなう。しかしこの文字領域a2
は辞書とマッチングしないので文字候補は得られない。
以下同様にして、a3、a4、a5、a6、の各文字領
域の切り出し、認識処理が続けられる。
As shown in FIG. 8A, in the case of a character image 50 in which a half-width character or a white space is mixed with a character width corresponding to a half-width in the arrangement of full-width katakana characters, as shown in FIG. First, the character width W is estimated from the average height H by the same method as in the second and third embodiments, and the character area al “f” is cut out from the left end of the character image 50 by the character width W to form katakana. Is recognized. Next, W /
The recognition process is performed by shifting the cutout position by 2 and cutting out the character area a2 with the character width W. However, this character area a2
Does not match the dictionary, so no character candidate is obtained.
In the same manner, the processing of cutting out and recognizing each character area of a3, a4, a5, and a6 is continued.

【0068】図8(b)の場合、文字領域al、文字領
域a3、および文字領域a6はそれぞれカタカナ文字
「カ」、カタカナ文字「カ」、およびカタカナ文字
「ク」として認識されるが、文字領域a2、文字領域a
4、および文字領域a5は辞書照合の結果、リジェクト
される。このように切出位置をW/2ずつずらした結果
得られた文字候補は本実施形態の辞書照合部により総合
され、文字配列の候補として抽出される。図8の例で
は、文字領域a1から得られた文字「カ」と文字領域a
3から得られた文字「カ」とが総合された文字配列「カ
カ」が得られるが、文字領域a3から得られた文字
「カ」と文字領域a6から得られた文字「ク」との間に
文字認識不能な文字認識不能領域a7が残ってしまう。
In the case of FIG. 8B, the character area al, the character area a3, and the character area a6 are recognized as katakana character "ka", katakana character "ka", and katakana character "ku", respectively. Area a2, character area a
4 and the character area a5 are rejected as a result of dictionary collation. The character candidates obtained as a result of shifting the cutout position by W / 2 in this manner are integrated by the dictionary matching unit of the present embodiment, and are extracted as character array candidates. In the example of FIG. 8, the character “f” obtained from the character area a1 and the character area a
The character array "Kaka" obtained by integrating the character "K" obtained from the character region a3 and the character "K" obtained from the character region a6 are obtained. A character unrecognizable area a7 where characters cannot be recognized remains.

【0069】そこで、本実施形態の辞書照合部は、文字
認識不能領域a7は半角文字に相当する文字領域である
ことから、この文字認識不能領域a7の文字パターンの
特徴を一文字標準パターン辞書14_1(図2,2参
照)に記述された一文字それぞれの特徴と照合して文字
候補を抽出しなおすことにより文字認識不能領域a7を
半角濁点として認識する。こうして、図8(b)に示す
文字列から図8(c)に示すような認識結果が得られ
る。
Therefore, the dictionary collating unit of the present embodiment uses the one-character standard pattern dictionary 14_1 ( (See FIGS. 2 and 2) The character unrecognizable area a7 is recognized as a half-size cloud point by comparing character features of each character and extracting character candidates again. Thus, a recognition result as shown in FIG. 8 (c) is obtained from the character string shown in FIG. 8 (b).

【0070】図9は、第4の実施形態における文字認識
不能領域の処理の流れ図である。
FIG. 9 is a flowchart showing the processing of a character unrecognizable area in the fourth embodiment.

【0071】図9に示すように、文字領域al〜anの
認識結果を求め(ステップS11)、文字領域al〜a
nの中に認識不能領域があるか否かが判定され(ステッ
プS12)、認識不能領域がある場合は、認識不能領域
を一文字とみなして一文字標準パターン辞書14_1を
用いて辞書参照を行い文字候補を求める。
As shown in FIG. 9, the recognition results of the character areas al to an are obtained (step S11).
It is determined whether or not there is an unrecognizable area in n (step S12). If there is an unrecognizable area, the unrecognizable area is regarded as one character, and a dictionary is referenced using the one-character standard pattern dictionary 14_1 to perform a character candidate. Ask for.

【0072】以上説明したように、この第4の実施形態
では、半角一文字が全角の文字の間に混入していてもそ
れを正確に認識することができる。また、図8(a)に
示すように半角の空白が全角の文字の間に混入している
場合についても上記の半角濁点の場合と同様に正確に認
識することができる。
As described above, in the fourth embodiment, even if one half-width character is mixed between full-width characters, it can be accurately recognized. Also, as shown in FIG. 8A, a case where a half-width space is mixed between full-width characters can be accurately recognized in the same manner as in the case of the above half-width turbid point.

【0073】[0073]

【発明の効果】以上説明したように、本発明の文字認識
装置によれば、標準的な文字一文字それぞれの特徴が記
述された一文字標準パターン辞書と標準的な文字が所定
数配列されてなる文字列それぞれの特徴が記述された複
数文字標準パターン辞書との双方からなる標準パターン
辞書を用いて文字認識を行うので、通常の伝票に記入す
るような不規則な間隔、記入の仕方で記入された文字列
でも、全角文字、半角文字の混在した印刷文字列でも高
精度に文字を切り出して認識することが可能であり、文
字認識の難しい文字画像からでも正確にかつ高速で文字
認識することが可能な文字認識装置を実現することがで
きる。
As described above, according to the character recognition apparatus of the present invention, a one-character standard pattern dictionary in which the characteristics of each standard character are described and a character in which a predetermined number of standard characters are arranged Character recognition is performed using a standard pattern dictionary consisting of both a multi-character standard pattern dictionary in which the characteristics of each column are described. It is possible to cut out and recognize characters with high precision even for character strings and print character strings in which full-width characters and half-width characters are mixed, enabling accurate and high-speed character recognition even from character images that are difficult to recognize. Character recognition device can be realized.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の文字認識装置が運用されるコンピュー
タの外観図(a)および内部構成図(b)である。
FIG. 1A is an external view of a computer in which a character recognition device of the present invention is operated, and FIG.

【図2】本発明の文字認識装置の第1の実施形態におけ
る機能ブロック図である。
FIG. 2 is a functional block diagram of the character recognition device according to the first embodiment of the present invention.

【図3】本発明の文字認識装置の第2の実施形態を示す
概略構成図である。
FIG. 3 is a schematic configuration diagram showing a second embodiment of the character recognition device of the present invention.

【図4】第2の実施形態の文字認識装置に設けられる検
証部の動作を説明する流れ図である。
FIG. 4 is a flowchart illustrating an operation of a verification unit provided in the character recognition device according to the second embodiment.

【図5】第2の実施形態における検証過程の説明図であ
る。
FIG. 5 is an explanatory diagram of a verification process according to the second embodiment.

【図6】本発明の文字認識装置の第3の実施形態におけ
る文字切り出し方式の説明図である。
FIG. 6 is an explanatory diagram of a character cutout method in a third embodiment of the character recognition device of the present invention.

【図7】第3の実施形態における文字切り出し方式によ
る他の処理例を示す図である。
FIG. 7 is a diagram illustrating another example of processing by the character cutout method according to the third embodiment.

【図8】第3の実施形態における文字切り出し方式によ
る処理例を示す図である。
FIG. 8 is a diagram illustrating an example of processing by a character cutout method according to the third embodiment.

【図9】第4の実施形態における文字認識不能領域の処
理の流れ図である。
FIG. 9 is a flowchart of processing of a character unrecognizable area in the fourth embodiment.

【符号の説明】[Explanation of symbols]

10 文字画像 11 文字領域切出部 12 特徴抽出部 13 辞書照合部 14 標準パターン辞書 14_1 一文字標準パターン辞書 14_2 複数文字標準パターン辞書 15 候補文字出力部 16 検証部 20,20_1,20_2 パターン 21,22 文字コード 30,40,50 文字画像 60 コンピュータ 61 CPU 62 メモリ 63 表示装置 64 プリンタ 65 CD−ROMドライブ 66 磁気ディスク 67 マウス 68 キーボード 69 イメージスキャナ 70 システムバス 100,200 文字認識装置 DESCRIPTION OF SYMBOLS 10 Character image 11 Character area extraction part 12 Feature extraction part 13 Dictionary collation part 14 Standard pattern dictionary 14_1 One character standard pattern dictionary 14_2 Multiple character standard pattern dictionary 15 Candidate character output part 16 Verification part 20, 20_1, 20_2 Pattern 21, 22 characters Code 30, 40, 50 Character image 60 Computer 61 CPU 62 Memory 63 Display device 64 Printer 65 CD-ROM drive 66 Magnetic disk 67 Mouse 68 Keyboard 69 Image scanner 70 System bus 100, 200 Character recognition device

───────────────────────────────────────────────────── フロントページの続き (72)発明者 坂根 俊司 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 井出 克美 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 Fターム(参考) 5B064 AA01 AB13 AB14 AB18 BA01 CA08 DA03 DA14 DC27 DC39 EA07 EA36  ────────────────────────────────────────────────── ─── Continuing on the front page (72) Inventor Shunji Sakane 4-1-1, Kamidadanaka, Nakahara-ku, Kawasaki-shi, Kanagawa Prefecture Inside Fujitsu Limited (72) Inventor Katsumi Ide 4-1-1, Kamiodanaka, Nakahara-ku, Kawasaki-shi, Kanagawa No. 1 Fujitsu Limited F-term (reference) 5B064 AA01 AB13 AB14 AB18 BA01 CA08 DA03 DA14 DC27 DC39 EA07 EA36

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 入力された文字画像から文字幅を推定し
て該文字画像から該文字幅に相当する長さの文字領域を
切り出す文字領域切出部と、 前記文字領域切出部により切り出された文字領域内の文
字パターンの特徴を抽出する特徴抽出部と、 標準的な文字一文字それぞれの特徴が記述された一文字
標準パターン辞書と標準的な文字が所定数配列されてな
る文字列それぞれの特徴が記述された複数文字標準パタ
ーン辞書との双方からなる標準パターン辞書と、 前記特徴抽出部で抽出された、文字領域内の文字パター
ンの特徴を、前記標準パターン辞書を構成する前記一文
字標準パターン辞書および前記複数文字標準パターン辞
書に記述された一文字および文字列それぞれの特徴と照
合して該文字領域内の文字パターンが表す文字あるいは
文字列の候補を抽出する辞書照合部とを備えたことを特
徴とする文字認識装置。
1. A character region cutout unit that estimates a character width from an input character image and cuts out a character region having a length corresponding to the character width from the character image, and a character region cutout unit that cuts out the character region. A character extraction unit that extracts the characteristics of the character pattern in the character region, a one-character standard pattern dictionary in which the characteristics of each standard character are described, and the characteristics of each character string in which a predetermined number of standard characters are arranged A standard pattern dictionary composed of both a standard pattern dictionary including a plurality of characters, and a one-character standard pattern dictionary that constitutes the standard pattern dictionary by extracting the characteristics of the character patterns in the character area extracted by the characteristic extracting unit. And a character or a character string represented by a character pattern in the character area by comparing it with the characteristics of each character and the character string described in the plural-character standard pattern dictionary. A character recognition device, comprising: a dictionary matching unit that extracts a candidate of the character.
【請求項2】 前記辞書照合部により、前記文字領域内
の文字パターンの特徴を前記複数文字標準パターン辞書
に記述された文字列の特徴と照合した結果文字列の候補
が抽出された場合に、前記特徴抽出部に、文字列の候補
が抽出された文字領域がさらに該文字列を構成する文字
数と同数に分割されてなる各分割領域それぞれの文字パ
ターンの特徴を抽出させ、前記辞書照合部に、前記分割
領域それぞれの文字パターンの特徴を、前記一文字標準
パターン辞書に記述された一文字それぞれの特徴と照合
させて前記分割領域の配列に対応した文字列の候補を抽
出させ、該文字列の候補が、前記複数文字標準パターン
辞書を用いて抽出された文字列の候補と一致するか否か
を検証する検証部を備えたことを特徴とする請求項1記
載の文字認識装置。
2. A method according to claim 1, wherein the dictionary matching unit extracts a character string candidate as a result of matching a characteristic of a character pattern in the character area with a characteristic of a character string described in the multi-character standard pattern dictionary. The feature extracting unit causes the character region in which the character string candidate is extracted to further extract the characteristic of the character pattern of each divided region obtained by dividing the character region into the same number as the number of characters constituting the character string. The character pattern feature of each of the divided regions is compared with the characteristic of each character described in the one-character standard pattern dictionary to extract a character string candidate corresponding to the arrangement of the divided regions, 2. The character recognition apparatus according to claim 1, further comprising a verification unit configured to verify whether the character string matches a character string candidate extracted using the plural-character standard pattern dictionary.
【請求項3】 前記文字領域切出部が、前記文字画像か
ら前記文字幅に相当する長さの文字領域を、該文字幅を
前記所定数と同数に分割したときの一分割分の長さずつ
ずらしながら切り出すものであることを特徴とする請求
項1又は2記載の文字認識装置。
3. The character area cutout unit is configured to divide a character area having a length corresponding to the character width from the character image by a length equal to one division when the character width is divided into the same number as the predetermined number. 3. The character recognition device according to claim 1, wherein the character recognition device cuts out the characters while shifting them one by one.
【請求項4】 前記辞書照合部が、前記文字領域切出部
により切り出された文字領域それぞれについて文字ある
いは文字列の候補を抽出するとともに抽出された文字あ
るいは文字列の候補を総合して文字配列の候補を抽出す
るものであることを特徴とする請求項3記載の文字認識
装置。
4. The character string extracting unit extracts character or character string candidates for each of the character regions extracted by the character region extracting unit and integrates the extracted character or character string candidates. 4. The character recognition device according to claim 3, wherein the character recognition device extracts a candidate of the character.
【請求項5】 前記辞書照合部が、文字認識不能な文字
認識不能領域が残った場合に、前記文字認識不能領域の
文字パターンの特徴を前記一文字標準パターン辞書に記
述された一文字それぞれの特徴と照合して文字候補を抽
出するものであることを特徴とする請求項4記載の文字
認識装置。
5. The dictionary matching unit according to claim 1, wherein, when a character unrecognizable area in which character recognition is not possible remains, a characteristic of a character pattern in the character unrecognizable area is compared with a characteristic of each character described in the one-character standard pattern dictionary. The character recognition device according to claim 4, wherein the character candidate is extracted by collation.
JP12605399A 1999-05-06 1999-05-06 Character recognition device Expired - Fee Related JP4280355B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP12605399A JP4280355B2 (en) 1999-05-06 1999-05-06 Character recognition device
KR1019990047465A KR100582039B1 (en) 1999-05-06 1999-10-29 Character recognizing apparatus
CNB99123281XA CN1181446C (en) 1999-05-06 1999-11-01 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12605399A JP4280355B2 (en) 1999-05-06 1999-05-06 Character recognition device

Publications (2)

Publication Number Publication Date
JP2000315247A true JP2000315247A (en) 2000-11-14
JP4280355B2 JP4280355B2 (en) 2009-06-17

Family

ID=14925485

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12605399A Expired - Fee Related JP4280355B2 (en) 1999-05-06 1999-05-06 Character recognition device

Country Status (3)

Country Link
JP (1) JP4280355B2 (en)
KR (1) KR100582039B1 (en)
CN (1) CN1181446C (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005301664A (en) * 2004-04-12 2005-10-27 Fuji Xerox Co Ltd Image dictionary forming device, encoding device, data file, image dictionary forming method, and program thereof
JP2005352653A (en) * 2004-06-09 2005-12-22 Omron Corp Character recognition device
JP2008084105A (en) * 2006-09-28 2008-04-10 Oki Electric Ind Co Ltd Character cutout method and character recognition device

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004056266A (en) * 2002-07-17 2004-02-19 Ricoh Co Ltd Image area separating device, image processor, image forming apparatus, program, and storage medium
KR100598115B1 (en) * 2004-08-31 2006-07-10 삼성전자주식회사 High-speed character recognition method and apparatus
CN101226596B (en) * 2007-01-15 2012-02-01 夏普株式会社 Document image processing apparatus and document image processing process
CN101354703B (en) * 2007-07-23 2010-11-17 夏普株式会社 Apparatus and method for processing document image
CN101354704B (en) * 2007-07-23 2011-01-12 夏普株式会社 Apparatus for making grapheme characteristic dictionary and document image processing apparatus having the same
CN101493896B (en) * 2008-01-24 2013-02-06 夏普株式会社 Document image processing apparatus and method
CN101763505B (en) * 2009-12-29 2011-12-07 重庆大学 Vehicle license character feature extracting and classifying method based on projection symmetry
CN102867178B (en) * 2011-07-05 2015-06-10 富士通株式会社 Method and device for Chinese character recognition
CN105869140A (en) * 2015-11-24 2016-08-17 乐视致新电子科技(天津)有限公司 Image processing method and apparatus
CN107016392A (en) * 2016-01-27 2017-08-04 四川效率源信息安全技术股份有限公司 A kind of method of text border in removal picture
CN107071179A (en) * 2017-04-25 2017-08-18 北京小米移动软件有限公司 Agenda managing method and device
JP6729486B2 (en) * 2017-05-15 2020-07-22 京セラドキュメントソリューションズ株式会社 Information processing apparatus, information processing program, and information processing method
KR102570961B1 (en) * 2020-10-21 2023-08-25 엄혜용 Text mining device for recognize character in online games
KR20230164347A (en) * 2022-05-25 2023-12-04 (주)그리드원 String amendment method for target string of ocr and computing device for performing the method

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07152877A (en) * 1993-12-01 1995-06-16 Matsushita Electric Ind Co Ltd English alphabet recognition device
JP2988304B2 (en) * 1995-02-23 1999-12-13 松下電器産業株式会社 String management device
JP2751865B2 (en) * 1995-04-17 1998-05-18 日本電気株式会社 String recognition device
JPH09245120A (en) * 1996-03-11 1997-09-19 Hitachi Ltd Character segmenting method
TW421764B (en) * 1996-05-21 2001-02-11 Hitachi Ltd Input character string estimation and identification apparatus
JPH09326012A (en) * 1996-06-05 1997-12-16 Oki Electric Ind Co Ltd Character recognizing device and its method
JP3452774B2 (en) * 1997-10-16 2003-09-29 富士通株式会社 Character recognition method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005301664A (en) * 2004-04-12 2005-10-27 Fuji Xerox Co Ltd Image dictionary forming device, encoding device, data file, image dictionary forming method, and program thereof
JP2005352653A (en) * 2004-06-09 2005-12-22 Omron Corp Character recognition device
JP2008084105A (en) * 2006-09-28 2008-04-10 Oki Electric Ind Co Ltd Character cutout method and character recognition device

Also Published As

Publication number Publication date
JP4280355B2 (en) 2009-06-17
CN1273401A (en) 2000-11-15
KR20000075420A (en) 2000-12-15
KR100582039B1 (en) 2006-05-23
CN1181446C (en) 2004-12-22

Similar Documents

Publication Publication Date Title
Spitz Determination of the script and language content of document images
KR100658119B1 (en) Apparatus and Method for Recognizing Character
Roy et al. HMM-based Indic handwritten word recognition using zone segmentation
US6341176B1 (en) Method and apparatus for character recognition
EP1016033B1 (en) Automatic language identification system for multilingual optical character recognition
KR100412317B1 (en) Character recognizing/correcting system
US7454063B1 (en) Method of optical character recognition using feature recognition and baseline estimation
JP4280355B2 (en) Character recognition device
JP2730665B2 (en) Character recognition apparatus and method
Okamoto et al. Performance evaluation of a robust method for mathematical expression recognition
Baird Global-to-local layout analysis
Chaudhuri et al. Extraction of type style-based meta-information from imaged documents
JP5041775B2 (en) Character cutting method and character recognition device
JP7282989B2 (en) text classification
Kumar et al. Line based robust script identification for indianlanguages
JP4194020B2 (en) Character recognition method, program used for executing the method, and character recognition apparatus
JP2917427B2 (en) Drawing reader
Al-Barhamtoshy et al. Arabic OCR segmented-based system
JP3428504B2 (en) Character recognition device
JP2906758B2 (en) Character reader
JP2592756B2 (en) Character segmentation device and character recognition device using the same
Leishman Shape-free statistical information in optical character recognition
JP2866920B2 (en) Standard pattern creation method and apparatus, and character recognition apparatus and method
JP2993533B2 (en) Information processing device and character recognition device
JP2851102B2 (en) Character extraction method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090310

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090316

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120319

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140319

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees