JP2000207491A - Reading method and device for character string - Google Patents

Reading method and device for character string

Info

Publication number
JP2000207491A
JP2000207491A JP11004951A JP495199A JP2000207491A JP 2000207491 A JP2000207491 A JP 2000207491A JP 11004951 A JP11004951 A JP 11004951A JP 495199 A JP495199 A JP 495199A JP 2000207491 A JP2000207491 A JP 2000207491A
Authority
JP
Japan
Prior art keywords
character
connected component
character pattern
contact
cutting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11004951A
Other languages
Japanese (ja)
Inventor
Shoji Ikeda
尚司 池田
Yukio Ogawa
祐紀雄 小川
Masashi Koga
昌史 古賀
Yutaka Sako
裕 酒匂
Hiromichi Fujisawa
浩道 藤澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP11004951A priority Critical patent/JP2000207491A/en
Publication of JP2000207491A publication Critical patent/JP2000207491A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To correctly segment and recognize the characters even against a character string where the Kanji (Chinese characters) touches each other by deciding the possibility of touching not for the coupling components included in a character string image but for the character pattern candidates which are generated by combining those coupling components. SOLUTION: A line segmenting part 602 extracts a line including a reading object character from a character line image which is inputted to a character string reading part 601 and outputs the line as a character line image. A character segmenting part 603 segments the character pattern candidates from the character line image. A character identification processing part 604 compares every character pattern candidate with a reference pattern that is previously registered and outputs the character category having the least difference as a character recognition result. Thus, a correct character segmentation candidate is outputted based on the over-segmentation and by a multiple hypothesis verification method. A character string collation processing part 605 collates the lattice of character identification result with a prepared reading object word and outputs the character string reading result while correcting the error of a character identifying part.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は手書き文字列を読み
とって認識する方法と装置に係り、特に互いに接触した
文字を正しく認識する文字列の自動読取り方式に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method and an apparatus for reading and recognizing a handwritten character string, and more particularly to an automatic character string reading method for correctly recognizing characters in contact with each other.

【0002】[0002]

【従来の技術】文書上に記載された文字列を読取るため
には、主に以下の4つの処理手順が必要となる。
2. Description of the Related Art Reading a character string described on a document mainly requires the following four processing procedures.

【0003】(1)文字行切出し:文書画像からの文字
行画像の抽出 (2)文字切出し:文字行画像からの文字パタンの切出
し (3)文字識別:各文字パタンの字種(文字コード)の
識別 (4)文字列照合:予め持っている言語知識を用いた文
字列読取り結果の確定 上記の4つの処理は図1に示したような関係にある。従
来技術としては、(1)の文書画像から文字行画像を抽
出する技術として、トップダウン的に領域を抽出した後
に領域中の文字行を抽出する方式等(秋山他「周辺分布
特徴と線密度特徴を併用した反復型文書画像領域分割
法」電子情報通信学会技術研究報告PRU85-41)がある。
(2)の文字切出しについては、文字行画像中の黒画素
の連続した部分(以下、連結成分)を単位として、これ
を組み合わせて文字パタンの候補を作成し、複数存在す
る連結成分の組合せのすべてを多重仮説として、これら
の仮説を検証し正しい文字切出し結果を出力するする手
法が文献(藤澤他「接触した手書文字の自動分離を行う
文字切出し方式」昭和59年度電子情報通信学会総合大
会No.1588)等によって知られている。正しい文字切出
し結果を得るため、文字識別の結果を用いて文字パタン
候補に確信度を付けることにより、(2)の文字切出し
と(3)の文字識別を相補的に作用させる技術が文献
(村瀬他「言語情報を利用した手書き文字列からの文字
切出しと認識」電子情報通信学会技術研究報告 PRU-92-
40)等に記されている。(4)の文字列照合に関する技
術としては、文字識別結果のラティスから有限オートマ
トンを生成し、これに辞書中の単語を入力することによ
り候補単語を抽出する方式(丸川他「手書き漢字住所認
識のためのエラー修正アルゴリズム」情報処理学会論文
誌第35巻第6号)等が知られている。
(1) Character line extraction: extraction of character line image from document image (2) Character extraction: extraction of character pattern from character line image (3) Character identification: character type (character code) of each character pattern (4) Character string collation: Determining the result of character string reading using language knowledge that has been obtained in advance The above four processes have a relationship as shown in FIG. As a conventional technique, as a technique for extracting a character line image from a document image in (1), a method of extracting a character line in a region after extracting a region in a top-down manner (Akiyama et al. Iterative Document Image Segmentation Using Features "IEICE Technical Report PRU85-41).
With regard to the character extraction of (2), a continuous pattern of black pixels in a character line image (hereinafter referred to as a connected component) is used as a unit to create a character pattern candidate, and a combination of a plurality of connected components is generated. The method of verifying these hypotheses and outputting the correct character segmentation results is described in the literature (Fujisawa et al., "Character segmentation method for automatic separation of contacted handwritten characters", 1984 IEICE General Conference, 1984) No. 1588). In order to obtain a correct character segmentation result, the character pattern candidate is given a certainty factor using the result of character identification, and the character segmentation of (2) and the character identification of (3) are made to act complementarily. Others "Character Extraction and Recognition from Handwritten Character Strings Using Linguistic Information" IEICE Technical Report PRU-92-
40) etc. As a technique relating to the character string collation of (4), a method of generating a finite automaton from a lattice of character identification results and extracting candidate words by inputting words in a dictionary (see Marukawa et al. Error Correction Algorithm for IPSJ Transactions on Information Processing, Vol. 35, No. 6, etc.).

【0004】しかし、上記の文字切出し手法は、連結成分
を単位としているため、文字どうしが互いに接触してい
る場合は、正しい文字パタンを得ることができないとい
う問題がある。
However, since the above-described character segmentation method uses a connected component as a unit, there is a problem that when characters are in contact with each other, a correct character pattern cannot be obtained.

【0005】この問題に対して、接触を含む連結成分を
強制的に切断して文字パタンを得る手法知られている。
例えば、数字を対象に、接触文字間におけるストロークど
うしの接触の仕方を分類し、ストローク形状解析により
接触点を同定、切断する方式(藤澤他「パタン切出し及
び認識方法」 特許番号第2550012)がある。接触の分
離手法の一つとしては、例えば図3に示すように、「56」
という文字列の縦方向に黒画素の数を数え上げてヒスト
グラムを作成し、この形状の変化する点を接触位置の候
補として切断・分離する方法がある。
In order to solve this problem, there is known a method of forcibly cutting a connected component including a contact to obtain a character pattern.
For example, there is a method of classifying strokes between touching characters between touching characters and identifying and cutting contact points by stroke shape analysis (Fujisawa et al., “Pattern Extraction and Recognition Method”, Patent No. 2550012). . As one of the contact separation methods, for example, as shown in FIG.
There is a method in which the number of black pixels is counted in the vertical direction of the character string to create a histogram, and a point at which this shape changes is cut and separated as a contact position candidate.

【0006】[0006]

【発明が解決しようとする課題】本発明で解決しようと
する課題は、接触文字を含む漢字や仮名の文字列に対し
て、正しい文字パタン候補を得るための接触文字切断・
分離機能を、誤った文字パタン候補の生成をできるだけ
少なくすることにより、文字列読取り処理全体の処理時
間を高速化するように実現することである。
SUMMARY OF THE INVENTION The problem to be solved by the present invention is to cut a contact character for obtaining a correct character pattern candidate for a kanji character or a kana character string including a contact character.
An object of the present invention is to realize a separating function so as to reduce the generation of erroneous character pattern candidates as much as possible, thereby speeding up the processing time of the entire character string reading process.

【0007】上記説明の従来の接触文字切出し手法は文
字行画像中の大きな連結成分に着目して、これを切断・
分離する手法である。接触を含むかどうかの判定は基本
的には連結成分のサイズをしきい値と比較することによ
り行う。英数字と異なり、漢字は、偏や旁などで構成され
るため、一つの文字パタンが複数の連結成分からなるこ
とが多く、文字どうしが接触しているとしても、接触を含
む連結成分の大きさは、接触していない文字の大きさと
変わらないことが多い。例えば、図5に示す文字列では、3
01、302、303の三つの接触が存在するが、最初の二つの接
触は、これを含む連結成分は他の連結成分と比較しても
特に大きくはなく、その大きさだけを基準とすれば一文
字とも判断することができる。
The conventional contact character extraction method described above focuses on a large connected component in a character line image, and
It is a technique to separate. The determination as to whether or not a contact is included is basically made by comparing the size of the connected component with a threshold value. Unlike alphanumeric characters, kanji are composed of partial and adjacent characters, so a single character pattern often consists of multiple connected components. The size is often the same as the size of a character that is not touching. For example, in the character string shown in FIG.
Although there are three contacts of 01, 302, and 303, the first two contacts indicate that the connected component including this is not particularly large compared to other connected components, and based on only its size. One character can be determined.

【0008】従って漢字文字列の読取りを行う際、従来
の接触文字の切断・分離手法を適用しようとすると、連
結成分のサイズによる判断では接触があると判断され
ず、文字切出しに失敗する場合があった。一方、接触判定
における連結成分の大きさに関するしきい値をゆるくす
ると、ほとんどの文字パタンが接触ありと判定され、切断
・分離処理の結果、切出し仮説としての文字パタンの数
が著しく増えてしまい、パタン生成の処理時間、さらに
は、これらの文字パタンに対する文字識別処理の時間が
増加し、文字列読取り処理全体の効率を大きく低下させ
てしまう。
[0008] Therefore, when reading a kanji character string, if an attempt is made to apply a conventional contact character cutting / separating method, it is not determined that there is a contact based on the size of the connected component, and character extraction may fail. there were. On the other hand, if the threshold value relating to the size of the connected component in the contact determination is loosened, most of the character patterns are determined to be in contact, and as a result of the cutting / separation processing, the number of character patterns as a cut-out hypothesis increases significantly, The processing time for pattern generation and the time for character identification processing for these character patterns are increased, and the efficiency of the entire character string reading processing is greatly reduced.

【0009】また、接触を含む連結成分の切断・分離に
成功しても、正しい文字パタン候補が別個の文字パタン
候補内に分かれて存在している場合がある。例えば新た
に生成された文字パタン候補が「明」の「日」や「月」
のような漢字の偏や旁であった場合、切断・分離によっ
て新たに生成された連結成分を文字パタンとするだけで
は、正しい文字切出し結果を得られないだけでなく、それ
ぞれ「日」や「月」といった別の文字として識別してし
まうことにより、文字列の誤認識につながってしまう。
[0009] Even if the connection component including the contact is successfully cut / separated, correct character pattern candidates may exist separately in different character pattern candidates. For example, if the newly generated character pattern candidate is "day" or "month"
In the case of kanji biased or near, such as, it is not only possible to obtain a correct character segmentation result by simply using a connected component newly generated by cutting / separation as a character pattern, Recognition as another character such as "month" leads to erroneous recognition of a character string.

【0010】[0010]

【課題を解決するための手段】上記の課題を解決するた
めに、本発明では、第一に、接触可能性の判定を文字列画
像中の連結成分ではなく、連結成分を組合わせることに
より生成された文字パタン候補に対して行う。文字パタ
ン候補を対象に接触可能性の判断を行うことにより、接
触部分が小さな連結成分にしか存在しない場合にも、そ
の連結成分を含む文字パタンが大きくなる場合には、接
触可能性有りと判断され、切断・分離処理を行うことに
より正しい文字切出し結果が得られるようになる。先に
例として用いた図5の文字列においては、文字行の画像は
図7で矩形で囲まれたような連結成分から構成されるが、
本発明方法では、接触可能性の判定はこれらを組み合わ
せた文字パタン候補に対して行うので、図9に示すような
文字パタン候補に対して接触の可能性があるという判断
を行うことになる。
In order to solve the above-mentioned problems, according to the present invention, first, the determination of the possibility of contact is made by combining connected components, not connected components in a character string image. Is performed for the character pattern candidates that have been set. By judging the possibility of contact with a character pattern candidate, even if the contact portion exists only in a small connected component, if the character pattern including the connected component becomes large, it is judged that there is a possibility of contact. By performing the cutting / separating process, a correct character extraction result can be obtained. In the character string of FIG. 5 used as an example earlier, the image of the character line is composed of connected components surrounded by a rectangle in FIG.
In the method of the present invention, the possibility of contact is determined for a character pattern candidate obtained by combining the above. Therefore, it is determined that there is a possibility of contact for a character pattern candidate as shown in FIG.

【0011】第二に、接触可能性有りと判定された文字
パタン候補に対しては、その中から接触を含む連結成分
を選択し、切断・分離を行う。この場合、接触有りと判断
された複数の文字パタン候補において同じ連結成分が切
断の対象となる場合があるため、切断・分離処理の対象
となった連結成分を記憶しておくことにより、切断・分
離処理が一回のみ起動されるようにしておく。これによ
り同じ連結成分を複数回切断しないようにし、文字パタ
ンの増加を防ぐ。これは文字列読取り処理全体の処理時
間の増加をも防ぐ。
Second, for a character pattern candidate determined to have a possibility of contact, a connected component including a contact is selected from the character pattern candidates and cut / separated. In this case, since the same connected component may be the target of cutting in a plurality of character pattern candidates determined to be in contact with each other, by storing the connected component of the target of cutting / separating processing, The separation process should be activated only once. This prevents the same connected component from being cut a plurality of times and prevents an increase in character patterns. This also prevents an increase in the processing time of the entire character string reading process.

【0012】第三に、文字切出し仮説に対する接触文字
パタンの判定、接触文字パタンの分離(切断)処理を接
触文字と判定される文字パタンがなくなるまで再帰的に
繰り返す。これによって、3文字以上の文字が連続して
接触した場合でも文字切出しが出来るようにする。
Third, the process of determining the contact character pattern for the character cut-out hypothesis and the process of separating (cutting) the contact character pattern are recursively repeated until there is no character pattern determined to be a contact character. Thus, even if three or more characters are continuously touched, character extraction can be performed.

【0013】第四に、切断・分離処理により新たに生成
された文字パタン候補と、隣接する文字パタンとの統合
判定を行ない、この基準を満たしたならば、これらの成分
を統合して新たな文字パタンを生成する。これによって
偏や旁といった文字の一部分が接触している場合に、接
触部分を分離した後、文字の残りの部分とを統合して正
しい文字パタンを得ることができるようになる。
Fourth, it is determined whether or not a character pattern candidate newly generated by the cutting / separating process is integrated with an adjacent character pattern. If this criterion is satisfied, these components are integrated to form a new one. Generate a character pattern. In this way, when a part of a character such as unbalanced or adjacent is in contact, after separating the contact part, the remaining part of the character can be integrated to obtain a correct character pattern.

【0014】第五に、切断・分離処理により新たに生成
された連結成分と文字パタン候補内の切断対象にならな
かった連結成分との相対的な位置関係により、切断の妥
当性を判断し、不適切と判断した場合は切断を取りやめ
る。これにより非文字パタンの生成を防ぎ、文字パタン
候補の増加を押さえることができる。
Fifth, the validity of the cutting is determined based on the relative positional relationship between the connected component newly generated by the cutting / separating process and the connected component not to be cut in the character pattern candidate. If determined to be inappropriate, cancel the disconnection. As a result, generation of non-character patterns can be prevented, and an increase in character pattern candidates can be suppressed.

【0015】[0015]

【発明の実施の形態】本発明の実施形態を図を用いて説
明する。まず接触文字を含む文字列読取り処理の流れを
データフロー図、図11を用いて述べる。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of the present invention will be described with reference to the drawings. First, the flow of a character string reading process including a contact character will be described with reference to a data flow diagram and FIG.

【0016】本実施例は、読取り対象の文字列を含む画
像を入力とし、文字列認識結果である文字列を出力とす
る文字列読取処理である。まず、行切出し602は、文字列
読取601に入力された文字行画像から読取り対象の文字
を含む行を抽出し、文字行画像として出力する。文字行
画像は白黒の二値画像である。文字切出し603は、文字行
画像から文字パタン候補を切出す。文字行画像中の黒画
素の連続した部分(連結成分)を単位として、文字パタ
ンの候補を作成する。文字パタン候補は、後述の切り出
し仮説ネットワークの1つのアークに相当する。文字パ
タン候補は、1つの連結成分のみで構成されるか、連結
成分の組み合わせで構成される。文字パタン候補を作成
しただけの段階では正しい文字の切り分け方が一意に定
まらないことが一般的なので、考えられる文字パタン候
補をすべて列挙し、文字パタン候補間の順序関係をネッ
トワーク形式でメモリ上に記憶しておく。このネットワ
ークを切出し仮説ネットワークと呼ぶ。図5の文字行画
像に対する切出し仮説ネットワークを図13に示す。ネッ
トワークのノードが文字パタンの境界、あるいは文字行
の切れ目、アークが文字パタンに対応している。
This embodiment is a character string reading process in which an image including a character string to be read is input and a character string as a result of character string recognition is output. First, the line cutout 602 extracts a line including a character to be read from the character line image input to the character string reading 601 and outputs it as a character line image. The character line image is a black and white binary image. Character extraction 603 extracts character pattern candidates from the character line image. A character pattern candidate is created using a continuous portion (connected component) of black pixels in the character line image as a unit. The character pattern candidate corresponds to one arc of the cut-out hypothesis network described later. A character pattern candidate is composed of only one connected component or a combination of connected components. At the stage of just creating character pattern candidates, it is common that the correct character segmentation method is not uniquely determined, so all possible character pattern candidates are enumerated, and the order relation between the character pattern candidates is stored in memory in a network format. Remember. This network is called a cut-out hypothesis network. FIG. 13 shows a cut-out hypothesis network for the character line image in FIG. Network nodes correspond to character pattern boundaries, character line breaks, and arcs correspond to character patterns.

【0017】切出し仮説ネットワーク中の文字パタン候
補から正しい文字切出し候補を選択するため、文字パタ
ン候補に対する文字識別結果によって文字切出しの確信
度に重み付けを行ったり、あるいは文字パタン間の間隔
や文字パタン候補の高さや幅といった幾何学的特徴を用
いて確信度に重み付けを行う方法が知られている。後者
は文献(Koga et al. Segmentation of Japanese Handw
ritten Characters Using Peripheral Feature Analysi
s International Conference for Pattern Recognitio
n、 1998、 pp.1137-1141)に記されている。
In order to select a correct character extraction candidate from the character pattern candidates in the extraction hypothesis network, the degree of certainty of character extraction is weighted based on the character identification result for the character pattern candidate, or the interval between character patterns and the character pattern candidate are selected. There is known a method of weighting the certainty factor using a geometric feature such as height and width. The latter is described in the literature (Koga et al. Segmentation of Japanese Handw
ritten Characters Using Peripheral Feature Analysi
s International Conference for Pattern Recognitio
n, 1998, pp. 1137-1141).

【0018】文字識別処理604は、各文字パタン候補に対
して予め登録された標準パタンとの比較を行い、最も差
分が小さい文字カテゴリを文字認識結果として出力す
る。このようにオーバーセグメンテーションに基づく多
重仮説検定方式によって、文字切出し603において正しい
文字切出し候補、すなわち候補文字列を出力する。
The character identification processing 604 compares each character pattern candidate with a standard pattern registered in advance, and outputs a character category having the smallest difference as a character recognition result. As described above, a correct character extraction candidate, that is, a candidate character string is output in the character extraction 603 by the multiple hypothesis testing method based on over-segmentation.

【0019】文字列照合処理605は、文字識別結果のラテ
ィスと予め用意した読取対象の単語とを照合することに
より、文字識別部での誤りを訂正しながら文字列読取結
果を出力する。
The character string collation processing 605 compares the lattice of the character identification result with a word to be read prepared in advance, and outputs a character string read result while correcting an error in the character identification unit.

【0020】文字切出し処理603において作成される図1
3に示すような切り出し仮説ネットワークは、連結成分を
最小単位として文字パタン候補が構成されている。各ア
ークの示す部分には1つの連結成分のみ、または複数の
連結成分の組み合わせが示されるが、1つのアークが1
つの文字パタンの候補を示している。文字間の接触のた
めに複数の文字(の一部分)が同一の連結成分を構成し
ている場合は、別途これを分離し新たに文字候補パタン
を作成する必要がある。本実施例では、この接触の分離
と新規文字パタン候補の作成処理を切出し仮説ネットワ
ーク生成後に、このネットワーク上の文字パタン候補に
対して作用させることにより実現する。
FIG. 1 created in the character extracting process 603
In the cut-out hypothesis network as shown in FIG. 3, character pattern candidates are configured using connected components as the minimum unit. In the portion indicated by each arc, only one connected component or a combination of a plurality of connected components is shown.
One character pattern candidate is shown. When (a part of) a plurality of characters constitute the same connected component due to contact between characters, it is necessary to separate them separately and create a new character candidate pattern. In this embodiment, the separation of the contact and the process of creating a new character pattern candidate are realized by operating a character pattern candidate on the network after generating a cut-out hypothesis network.

【0021】上記接触分離と新規文字パタン候補の作成
処理の手順を図15を用いて説明する。以降切出し仮説ネ
ットワークの例として図13を用いることとする。
The procedure of the contact separation and the process of creating a new character pattern candidate will be described with reference to FIG. Hereinafter, FIG. 13 is used as an example of the cut-out hypothesis network.

【0022】最初に、図15のステップ801において、入力
文字行画像から切出し仮説ネットワークを作成する。
First, in step 801 of FIG. 15, a cut-out hypothesis network is created from an input character line image.

【0023】次にステップ802において切出し仮説ネッ
トワーク上のすべての文字候補パタンに対して、接触の
分離と新規文字候補パタンの追加処理を行う。
In step 802, contact separation and new character candidate pattern addition processing are performed on all character candidate patterns on the cut-out hypothesis network.

【0024】接触の分離と新規文字候補パタンの追加処
理における第一のステップ803では、図13の切出し仮説ネ
ットワーク上の文字候補パタンに対して、接触文字を含
んでいる可能性があるかどうかの判定を行う。この接触
文字を含むかどうかの判定処理については後で述べる。
図13の切出し仮説ネットワーク上の文字パタン候補の中
からは、図17に太線で示した文字パタン候補901、902、903
が接触可能性があると判断される。
In the first step 803 in the contact separation and new character candidate pattern addition processing, the character candidate pattern on the cut-out hypothesis network shown in FIG. Make a decision. The process of determining whether or not a contact character is included will be described later.
Among the character pattern candidates on the cut-out hypothesis network in FIG. 13, character pattern candidates 901, 902, and 903 shown by bold lines in FIG.
Is determined to have a possibility of contact.

【0025】ステップ803の判定処理において接触文字
を含まないと判断されると、ステップ804へ進み、ステッ
プ802のループにおける次の文字パタン候補に処理を進
める。
If it is determined in step 803 that the contact character is not included, the process proceeds to step 804, and the process proceeds to the next character pattern candidate in the loop of step 802.

【0026】ステップ803の判定処理において接触文字
を含むと判定された場合は、ステップ805に進む。ステッ
プ805では、接触文字を含むと判定された文字パタン候補
に対して、これを構成する連結成分の中で接触を含む連
結成分を推定し、これを切断・分離し、新たな連結成分画
像を生成する。ここでの連結成分の切断・分離処理につ
いては後述する。
If it is determined in the determination process of step 803 that a contact character is included, the process proceeds to step 805. In step 805, for a character pattern candidate determined to include a contact character, a connected component including a contact is estimated from among the connected components constituting the character pattern candidate, and this is cut and separated, and a new connected component image is formed. Generate. The processing for cutting and separating the connected component will be described later.

【0027】連結成分の切断・分離処理によって新たに
生成された連結成分は、ステップ806において、接触可能
性があると判断された文字パタン候補のうち、切断・分
離処理の対象とならなかった連結成分の中から適切なも
のを選択し組み合わせることにより、新たな文字パタン
候補を生成する。その結果、図17で接触を含むと判断さ
れた文字パタン候補901、902、903からは、それぞれ図19に
おける文字パタン候補1001、1002、1003、1004、1005、1006
が生成され切出し仮説ネットワークに追加される。
The connected component newly generated by the connected component cutting / separating process is a connection component that has not been subjected to the cutting / separating process among the character pattern candidates determined to have a possibility of contact in step 806. New character pattern candidates are generated by selecting and combining appropriate components from the components. As a result, from the character pattern candidates 901, 902, and 903 determined to include the contact in FIG. 17, the character pattern candidates 1001, 1002, 1003, 1004, 1005, and 1006 in FIG.
Is generated and added to the cut-out hypothesis network.

【0028】接触文字パタンの切断・分離処理によって
新たに文字パタン候補を生成しても、正しい文字パタン
候補を構成する連結成分が、切出し仮説ネットワーク上
で異なる文字パタン候補に分断されている場合がある。
このため、切断・分離処理後の切出し仮説ネットワーク
への文字パタン候補追加処理を行った後、ステップ807に
おいて、切断、分離処理により新たに追加された文字パタ
ン候補と切出し仮説ネットワーク上における隣接文字パ
タン候補を統合して新たに文字パタン候補を生成する。
この結果図21において文字パタン候補1101、1102、1103が
新たに生成される。
Even if a new character pattern candidate is generated by cutting / separating a contact character pattern, there is a case where a connected component constituting a correct character pattern candidate is divided into different character pattern candidates on a cut-out hypothesis network. is there.
Therefore, after performing the character pattern candidate addition processing to the cut-out hypothesis network after the cutting / separation processing, in step 807, the character pattern candidate newly added by the cutting / separation processing and the adjacent character pattern on the cut-out hypothesis network The candidates are integrated to generate a new character pattern candidate.
As a result, character pattern candidates 1101, 1102, and 1103 are newly generated in FIG.

【0029】ステップ803からステップ807までの処理を
新たな文字パタン候補が生成されなくなるまで繰り返し
実行する。以上のような処理を経て接触文字を含む文字
列画像に対しても正しい文字パタン候補を含んだ文字切
出し仮説ネットワークを生成することができる。
Steps 803 to 807 are repeatedly executed until no new character pattern candidate is generated. Through the above processing, a character cut-out hypothesis network including a correct character pattern candidate can be generated for a character string image including a contact character.

【0030】次に、図15における処理ステップ803からス
テップ807までの処理の詳細について各ステップ毎に述
べる。
Next, the details of the processing from processing steps 803 to 807 in FIG. 15 will be described for each step.

【0031】まず、ステップ803の接触文字判定について
述べる。日本語の漢字や仮名文字は英数字と異なり、偏
や旁など一つの文字パタンが複数の連結成分からなるこ
とが多く、文字中の連結成分の大きさは文字パタンのサ
イズと比べて小さい場合が多い。そのような場合は、文
字どうしが接触していても、接触を含む連結成分を取り
出すと、連結成分の大きさは接触していない文字のそれ
と変わらない。従って日本語の漢字文字列のに対して、
上記の接触文字の切断・分離手法を適用しようとする
と、連結成分のサイズによる判断では接触があると判断
されず、正しい文字切出し結果を得られない可能性が有
る。そこで入力文字行中の連結成分の大きさによって接
触文字かどうかの判断を行うのではなく、切出し仮説ネ
ットワーク上の文字パタン候補の注目することにより接
触文字の切断を行う。
First, the contact character determination in step 803 will be described. Japanese characters and kana characters differ from alphanumeric characters in that one character pattern, such as one-sided or side-by-side, often consists of multiple connected components, and the size of the connected components in the character is smaller than the size of the character pattern There are many. In such a case, even if the characters are in contact with each other, if the connected component including the contact is taken out, the size of the connected component is not different from that of the non-contacting character. Therefore, for Japanese kanji character strings,
When trying to apply the above-described contact character cutting / separating method, it is not determined that there is a contact based on the size of the connected component, and there is a possibility that a correct character extraction result cannot be obtained. Therefore, instead of determining whether or not the character is a contact character based on the size of the connected component in the input character line, the contact character is cut by noting a character pattern candidate on the cut-out hypothesis network.

【0032】文字パタン候補に対する接触文字判定処理
のフローを図23を用いて述べる。
The flow of the contact character determination process for a character pattern candidate will be described with reference to FIG.

【0033】図13の切出し仮説ネットワークにおける各
文字パタン候補について、まず始めにステップ1201では、
文字パタン候補の幾何学的特徴をしきい値と比較するこ
とによって接触を含むかどうかの判定を行う。幾何学的
特徴の例としては、文字パタン候補の行方向の長さやア
スペクト比がある。文字パタン候補の行方向の長さに関
するしきい値は、図 13の文字行画像の幅1301に係数を乗
じて求めた値1302を用いることができる。
For each character pattern candidate in the cut-out hypothesis network of FIG.
It is determined whether or not a contact is included by comparing the geometric feature of the character pattern candidate with a threshold value. Examples of the geometric feature include the length of the character pattern candidate in the line direction and the aspect ratio. As the threshold value for the length of the character pattern candidate in the line direction, a value 1302 obtained by multiplying the width 1301 of the character line image in FIG. 13 by a coefficient can be used.

【0034】ステップ1201において条件を満たさない文
字パタン候補はステップ1202に進み、接触文字判定処理
を終える。図 13の文字パタン候補701は上記の条件を満
たさず、接触文字ではないと判定される。文字パタン候
補702は上限を満たす。
If the character pattern candidate does not satisfy the condition in step 1201, the process proceeds to step 1202, and the contact character determination processing ends. The character pattern candidate 701 in FIG. 13 does not satisfy the above conditions, and is determined not to be a contact character. Character pattern candidate 702 satisfies the upper limit.

【0035】ステップ1201の条件を満たした文字パタン
候補に対しては、ステップ1203において、実際に切断・分
離される連結成分を選択する。選択の基準としては、連
結成分の行方向の長さを採用し、これが最も長い連結成
分を切断・分離処理の対象として選択する。この基準を
満たした連結成分に対して、文字の大きさと接触を含む
連結成分の大きさを比べ、しきい値よりも小さい連結成
分であれば、切断の対象から除外するという処理を設け
ることによって、接触判定の精度を高めることができ
る。これは、例えば「川」という文字のように、幅の小さ
な連結成分ばかりからなる文字パタン候補や、かすれに
より小さな連結成分ばかりからなる文字パタン候補に対
して無駄な切断処理を働かせないようにすることを目的
とする。図 14に示すように、文字行画像の幅1401を文字
パタンの推定幅と見なし、これに係数をかけることによ
り連結成分の幅の下限に関するしきい値1402とする。図
13の文字パタン候補702を構成する連結成分の中でその
幅が最大の連結成分1403を選択する。この連結成分1403
の幅は、連結成分幅下限に関するしきい値1402よりも大
きいため、連結成分1403は切断・分離処理の対象として
選択される。
In step 1203, for the character pattern candidate satisfying the condition of step 1201, a connected component that is actually cut / separated is selected. As a selection criterion, the length of the connected component in the row direction is adopted, and the connected component having the longest length is selected as a target of cutting / separation processing. By comparing the size of the character and the size of the connected component including the contact with the connected component that satisfies this criterion, by providing a process of excluding from the target of cutting if the connected component is smaller than the threshold value Thus, the accuracy of the contact determination can be improved. This prevents useless cutting processing from being performed on character pattern candidates consisting only of small-width connected components, such as the character "kawa", or character pattern candidates consisting only of small connected components due to blurring. The purpose is to: As shown in FIG. 14, the width 1401 of the character line image is regarded as the estimated width of the character pattern, and is multiplied by a coefficient to obtain a threshold value 1402 relating to the lower limit of the width of the connected component. Figure
The connected component 1403 having the largest width among the connected components constituting the 13 character pattern candidates 702 is selected. This connected component 1403
Is larger than the threshold value 1402 relating to the lower limit of the connected component width, the connected component 1403 is selected as a target of the cutting / separating process.

【0036】文字パタン候補に対する接触判定処理は、
切出し仮説ネットワーク上のすべての文字パタン候補に
対して行われるため、例えば、図 13の文字候補パタン702
と文字候補パタン703はともに接触を含むと判定され、ス
テップ1203では、同じ連結成分1403(図 14)が重複して
切断されてしまうことになり非効率的である。そこで、
切断対象となった連結成分を図 15に示すような切断対
象連結成分管理テーブルに登録しておき、同じ連結成分
が重複して切断対象となる場合は、この連結成分を含む
文字パタン候補の中で、接触ありと判断された候補のう
ち、最小のパタンにおける当該連結成分のみを切断対象
とする。切断対象連結成分管理テーブルには、連結成分
の識別番号、もしくは、文字行画像中における連結成分の
左端1501、右端1502、上端1503、下端1504の相対座標を格
納しておくことにより、連結成分を同定可能である。ま
た文字パタン候補へのポインタ1505を持つことにより当
該連結成分が含まれる文字パタン候補との対応付けも可
能である。
The contact determination process for a character pattern candidate is as follows.
Since this is performed for all character pattern candidates on the cut-out hypothesis network, for example, the character candidate pattern 702 in FIG.
And the character candidate pattern 703 are both determined to include contact, and in step 1203, the same connected component 1403 (FIG. 14) is cut off redundantly, which is inefficient. Therefore,
The connected components to be cut are registered in a cut-target connected component management table as shown in FIG. 15, and when the same connected component is to be cut repeatedly, a character pattern candidate including this connected component is Then, among the candidates determined to be in contact with each other, only the connected component in the smallest pattern is set as a disconnection target. In the cut target connected component management table, the identification number of the connected component, or the relative coordinates of the left end 1501, the right end 1502, the upper end 1503, and the lower end 1504 of the connected component in the character line image are stored, so that the connected component is stored. Can be identified. By having a pointer 1505 to a character pattern candidate, it is possible to associate with a character pattern candidate including the connected component.

【0037】文字候補パタン702に対する接触文字パタ
ン判定処理において、ステップ1204では、切断対象と判断
した連結成分1403が、すでに切断対象の連結成分として
登録されているかどうかを切断対象連結成分管理テーブ
ルを検索することにより調べる。すでに登録されていれ
ば、ステップ1205へ進み、接触文字パタン判定処理を終え
る。
In the contact character pattern determination process for the character candidate pattern 702, in step 1204, a search is performed in the cut target connected component management table to determine whether the connected component 1403 determined to be cut is already registered as a cut target connected component. Find out by doing. If it has already been registered, the process proceeds to step 1205, and the contact character pattern determination processing ends.

【0038】未登録であれば、切出し仮説ネットワーク
上の各文字パタン候補に対して以下の処理を行う。まず
ステップ1206では、図 15の切断対象連結成分管理テーブ
ルに連結成分の座標1501〜1504までを格納する。この
後、切断後の連結成分をもとに新しい文字パタン候補を
生成することになるが、もし接触文字パタン候補として
選択した文字パタン候補に、余分な連結成分が含まれて
いれば、切断後に生成した新しい文字パタン候補中にも
その連結成分が含まれることになり、結果として正しい
文字パタン候補が得られなくなる。そこで、ステップ120
7では、切断対象の連結成分に対する、文字パタン候補と
して、その連結成分を含む接触文字パタン候補の中で最
小の文字パタン候補を選択し、切断対象連結成分管理テ
ーブルに登録する。このようにして図 13における文字
候補パタン703ではなく、文字候補パタン702が切断対象
連結成分1403に対する接触文字パタン候補として、切断
対象連結成分管理テーブルの文字パタン候補ポインタフ
ィールド1505に登録される。
If not registered, the following processing is performed for each character pattern candidate on the cut-out hypothesis network. First, in step 1206, the coordinates 1501 to 1504 of the connected component are stored in the cut target connected component management table of FIG. Thereafter, a new character pattern candidate is generated based on the connected component after cutting, but if the character pattern candidate selected as the contact character pattern candidate includes an extra connected component, after cutting, The connected component is also included in the generated new character pattern candidate, and as a result, a correct character pattern candidate cannot be obtained. So step 120
In step 7, as the character pattern candidate for the connected component to be cut, the smallest character pattern candidate among the contact character pattern candidates including the connected component is selected and registered in the cut target connected component management table. In this way, instead of the character candidate pattern 703 in FIG. 13, the character candidate pattern 702 is registered in the character pattern candidate pointer field 1505 of the cut target connected component management table as a contact character pattern candidate for the cut target connected component 1403.

【0039】この接触文字パタン判定において接触文字
でないと判断、もしくは切断対象連結成分を同定できな
ければ、図 8におけるステップ804に進み、切出し仮説ネ
ットワーク上の次の文字パタン候補に対して接触文字判
定処理を行う。
In this contact character pattern determination, if it is determined that the character is not a contact character, or if the connected component to be cut cannot be identified, the process proceeds to step 804 in FIG. 8, and the next character pattern candidate on the cut-out hypothesis network is contact character determined. Perform processing.

【0040】接触文字であると判断され、切断対象連結
成分を同定できれば、ステップ805に進み、連結成分の切
断・分離処理を行う。以上がステップ803における接触
文字判定処理である。
If it is determined that the character is a contact character, and if the connected component to be cut can be identified, the process proceeds to step 805, where the connected component is cut / separated. The above is the contact character determination processing in step 803.

【0041】次に、図 8におけるステップ805の連結成分
の切断・分離処理について述べる。
Next, the processing for cutting / separating connected components in step 805 in FIG. 8 will be described.

【0042】漢字の接触の例を図 16に示す。縦書きの
場合は1601、1602のように上の文字の「はらい」が下の
文字に接触する場合が多い。一方横書きの場合は、1603
のように左の文字の「はらい」が右の文字に接触する場
合と、1604のように右の文字の「書き出し」が左の文字
に接触する場合がある。そこで、連結成分の切断に際し
ては、 (1)縦書きの場合 縦方向の直線が下部で横方向の直線と接触している場所 (2)横書きの場合 横方向の直線がその右側の縦方向の直線と接触している
場所 縦方向の直線がその右側の横方向の直線と接触している
場所 を切断点として連結成分の切断を行う。また接触点が、1
601のように接触点から水平方向に同じ文字パタン候補
の他の画素が存在しない場合と、1602のように同じ文字
パタンの他の画素が存在する場合があるため、これらを
それぞれ切断できるように、黒画素の行方向への周辺分
布を用いた切断点同定と直線成分の太さの変化量に基づ
く切断点同定の二通りの手法を用いる。
FIG. 16 shows an example of kanji contact. In the case of vertical writing, the upper character "Harai" often contacts the lower character, such as 1601 and 1602. On the other hand, for horizontal writing, 1603
There is a case where “Harai” of the left character touches the right character as in “1” and a case where “Export” of the right character touches the left character as in 1604. Therefore, when cutting the connected component, (1) In the case of vertical writing, the place where the vertical straight line is in contact with the horizontal straight line at the bottom (2) In the case of horizontal writing, the horizontal straight line is the right vertical direction Location where it touches the straight line The connected component is cut using the location where the vertical straight line touches the horizontal straight line on the right side as the cut point. If the contact point is 1
There are cases where there are no other pixels of the same character pattern candidate in the horizontal direction from the contact point as in 601 and cases where there are other pixels in the same character pattern as in 1602. , And two methods of cutting point identification based on the variation of the thickness of the linear component and the cutting point identification using the peripheral distribution of black pixels in the row direction.

【0043】連結成分の切断・分離処理の全体フローを
図 17に示す。まずステップ1701においてストローク幅
の変化追跡による連結成分の切断を行い、その後、ステッ
プ1702において周辺分布形状に基づく連結成分の切断を
行う。以下、縦書きの文字列に対する、それぞれの連結成
分の切断・分離処理について述べる。
FIG. 17 shows the overall flow of the cutting / separating process of the connected component. First, in step 1701, the connected component is cut by tracking the change in the stroke width, and then in step 1702, the connected component is cut based on the marginal distribution shape. Hereinafter, cutting / separating processing of each connected component for a vertically written character string will be described.

【0044】まず、ストローク幅変化追跡による切断処
理について述べる。
First, the cutting process based on the stroke width change tracking will be described.

【0045】文字画像から輪郭を抽出することにより、
ストロークが接する場所を同定し、接触の切断を行う手
法は、文献(H.Fujisawa他「Segmentation Methods for
Character Recognition: From Segmentation to Docume
nt Structure Analysis」Proc. of IEEE Vol.80、 No.7、
July 1992)などによって知られている。本実施例にお
ける第一の連結成分切断手法では、文字行方向に垂直な
ランレングス画像を用意し、隣接したランの長さの変化
を調べることで、画像中のストロークを抽出する手法を
採用する。ストローク幅幅の変化追跡による連結成分切
断・分離処理のフローを図 18に示す。
By extracting the contour from the character image,
A method of identifying the place where a stroke touches and cutting the contact is described in the literature (H. Fujisawa et al., “Segmentation Methods for
Character Recognition: From Segmentation to Docume
nt Structure Analysis '' Proc. of IEEE Vol.80, No.7,
July 1992). In the first connected component cutting method in this embodiment, a method of preparing a run-length image perpendicular to the character line direction and examining a change in the length of an adjacent run to extract a stroke in the image is adopted. . Figure 18 shows the flow of the connected component cutting / separating process by tracking the change in the stroke width.

【0046】まず始めにステップ1801において、切断・
分離処理の対象の連結成分に関する、行方向に垂直なラ
ンレングス形式の画像を作成する。次にステップ1802に
おいて、ランレングス画像からストロークを抽出する。
図 19に示すように、その時点で同じ直線成分に属すると
されたランの長さの平均値をW1 1901とした時、W1からあ
る範囲の値をしきい値1902として、隣接するランの長さ
の差がしきい値1902以内であれば同じストロークと見な
し、しきい値を超えれば異なるストロークと見なす。こ
のようなストロークの抽出法は文献(D.Nishiwaki「A N
ew Recognition Method of Black Ruled Line Form」Pr
oc. of Second IAPR Workshop on GraphicsRecognition
1997)によって知られている。
First, in step 1801,
Create a run-length image perpendicular to the row direction for the connected component to be separated. Next, in step 1802, a stroke is extracted from the run-length image.
As shown in FIG. 19, when the average value of the lengths of runs determined to belong to the same linear component at that time is W 1 1901, a value in a certain range from W 1 is set as a threshold 1902, and adjacent runs are determined. If the difference in length is within the threshold value 1902, the strokes are regarded as the same, and if the difference exceeds the threshold value, the strokes are regarded as different. Such a stroke extraction method is described in the literature (D. Nishiwaki “AN
ew Recognition Method of Black Ruled Line Form '' Pr
oc. of Second IAPR Workshop on GraphicsRecognition
1997).

【0047】抽出したストローク毎にステップ1803にお
いて以下の処理を行う。
The following processing is performed in step 1803 for each extracted stroke.

【0048】まず、ステップ1804では以下の条件を満た
すストローク間の接点を切断点と見なす。
First, in step 1804, a contact point between strokes satisfying the following conditions is regarded as a cutting point.

【0049】(a)当該ストロークがある長さを持った、行
方向に平行な(縦の)ストロークである (b)行方向のストロークと行末側で接するストロークが
行と垂直方向にある長さを持っている (c)行方向のストロークの長さが行と垂直なストローク
に対してある割合よりも長い (d)上記条件における行方向のストロークは、行と垂直方
向のストロークに対して行頭側で接すするストロークの
中で最長か 図 20におけるストローク2001については、ストロークに
含まれるランの長さの平均から幅2003が算出でき、スト
ロークを構成するランの数から長さ2004が算出できるた
め、これを用いて行方向に平行なストロークであるかど
うかが判断できる(条件(a))。ストローク2001と行末
側で接するストローク2002の長さはランの長さ2005から
推定できるので、行と垂直方向のストロークであること
が判断できる(条件(b))。行方向のストロークの長さ2
004と行と垂直なストローク2005から条件(c)も判断でき
る。さらにストローク間の接続関係を図 21に示すよう
なストローク管理テーブルを用いて持っておけば、行と
垂直方向のストロークの行頭側で接するストロークの長
さを比較することは可能である(条件(d))。図 21にお
いて2101は一つのストロークに対する情報を保持する領
域であり、その内部は、ストロークの長さ2102、幅2103、行
頭側に何本のストロークと接しているか2104、接してい
るストロークに関するテーブル内の領域へのポインタ21
05、行末側に何本のストロークと接しているか2106、接し
ているストロークに関するテーブル内の領域へのポイン
タ2107、ストロークのランレングスデータ2109へのポイ
ンタ2108からなる。
(A) The stroke has a certain length and is a (vertical) stroke parallel to the row direction. (B) The length where the stroke in the row direction and the stroke in contact with the end of the row are perpendicular to the row. (C) The length of the stroke in the line direction is longer than a certain percentage of the stroke perpendicular to the line. (D) The stroke in the line direction under the above conditions is the beginning of the line relative to the line and the stroke in the vertical direction. For the stroke 2001 in Fig. 20, the width 2003 can be calculated from the average of the lengths of the runs included in the stroke, and the length 2004 can be calculated from the number of runs that make up the stroke. Therefore, it can be used to determine whether the stroke is parallel to the row direction (condition (a)). Since the length of the stroke 2002 that is in contact with the stroke 2001 at the end of the line can be estimated from the length of the run 2005, it can be determined that the stroke is a stroke perpendicular to the line (condition (b)). Linewise stroke length 2
Condition (c) can also be determined from 004 and a stroke 2005 perpendicular to the line. Furthermore, if the connection relation between strokes is held using a stroke management table as shown in FIG. 21, it is possible to compare the length of the stroke that contacts the line at the beginning of the vertical stroke (condition ( d)). In FIG. 21, reference numeral 2101 denotes an area for holding information on one stroke, and the inside thereof includes a stroke length 2102, a width 2103, the number of strokes at the beginning of the line 2104, and a table relating to the strokes in contact. Pointer to area 21
05, the number of strokes in contact with the end of the line 2106, a pointer 2107 to an area in the table relating to the touching stroke, and a pointer 2108 to run length data 2109 of the stroke.

【0050】これらの条件をすべて満たさなければステ
ップ1805に進み、ステップ1803での次のストロークに関
する処理に移る。
If all of these conditions are not satisfied, the flow advances to step 1805 to shift to the processing related to the next stroke in step 1803.

【0051】条件をすべて満たした場合は、ステップ180
6に進み、当該ストローク間の境界の切断処理を行う。連
結成分の切断は、行方向のストロークの、二つのストロー
クの境界部分から一本のランを削除することにより行
う。
If all the conditions are satisfied, step 180
Proceed to 6 to perform cutting processing of the boundary between the strokes. The disconnection of the connected component is performed by deleting one run from the boundary between two strokes in the stroke in the row direction.

【0052】続くステップ1807では、ステップ1806にお
けるストローク境界部分のランの削除処理によって、連
結成分が複数に分割されたかどうかを調べる。ランレン
グスデータから文献(森「パターン認識」電子情報通信
学会)に記載されているような、ラベリング処理を行い、
複数の連結成分が抽出されるかを調べればよい。
In the following step 1807, it is checked whether or not the connected component has been divided into a plurality by the process of deleting the run at the stroke boundary portion in the step 1806. Perform labeling processing from the run-length data as described in the literature (Mori "Pattern Recognition" IEICE)
It is sufficient to check whether a plurality of connected components are extracted.

【0053】ここで切断対象の連結成分が環状であった
りして、一つのランデータを削除しても複数の連結成分
に分割されない場合は、切断により新たに作成した連結
成分は棄却して、ステップ1808においてステップ1803に
おける次のストロークに関する処理に移る。
Here, if the connected component to be cut is ring-shaped, and one run data is not divided into a plurality of connected components even if one run data is deleted, the connected component newly created by cutting is rejected. In step 1808, the processing shifts to the processing related to the next stroke in step 1803.

【0054】複数の連結成分に分割されていれば、ステ
ップ1809に進み、切断によって新たに生成した連結成分
を受理し、ステップ1803における次のストロークに関す
る処理に移る。
If it has been divided into a plurality of connected components, the flow advances to step 1809 to receive the newly generated connected components by cutting, and the process proceeds to step 1803 for the next stroke.

【0055】ステップ1803においてすべてのストローク
に関する処理が終わると、ステップ1810に進み、切断点候
補の順位付けを行う。この順位に基づき切断候補の取捨
選択を行い、候補数の制限を行うことにより、過剰な切断
を防ぎ、文字列読取処理における誤りの低減や、処理速度
の向上を図ることができる。本実施例においては、切断
点の候補間の順位付けの基準として、交差するストロー
クの長さの積、すなわち、図 20におけるl1とl2の積を採
用し、この値が大きい候補ほど上位に位置付ける。
When the processing for all the strokes is completed in step 1803, the flow advances to step 1810 to rank the cutting point candidates. By cutting and selecting cutting candidates based on this order and limiting the number of candidates, excessive cutting can be prevented, errors in character string reading processing can be reduced, and processing speed can be improved. In the present embodiment, the product of the lengths of the intersecting strokes, that is, the product of l1 and l2 in FIG. 20, is adopted as a standard for ranking the cutting point candidates, and the candidate with a larger value is positioned higher. .

【0056】最後にステップ1811において最上位の切断
候補として選択されたストロークの幅を当該連結成分を
含む文字のストロークの幅の基準値として出力し、スト
ローク幅変化解析による連結成分切断処理を終了する。
Finally, the width of the stroke selected as the top cut candidate in step 1811 is output as the reference value of the stroke width of the character including the connected component, and the connected component cutting process based on the stroke width change analysis ends. .

【0057】次に図 17のステップ1702の投影形状変化
追跡による連結成分切断処理について述べる。
Next, the connected component cutting process by tracking the change of the projected shape in step 1702 in FIG. 17 will be described.

【0058】文字行画像の行方向に対する周辺分布を計
算し、その「谷」部と「山」部の境界において文字を切
出すという手法は、文献(Y.Lu「On the Segmentation o
f Touching Characters」International Conference on
Document Analysis and Recognition 1993)をはじめ、
広く知られている。本実施例における周辺分布形状追跡
による連結成分切断・分離処理フローも同じ考え方に基
づいている。図 22に従い処理フローを述べる。
A method of calculating a marginal distribution in the line direction of a character line image and cutting out characters at the boundary between the “valley” and the “mountain” is described in the literature (Y. Lu “On the Segmentation o”).
f Touching Characters '' International Conference on
Document Analysis and Recognition 1993)
Widely known. The flow of the connected component cutting / separating process by the peripheral distribution shape tracking in the present embodiment is based on the same concept. The processing flow is described according to FIG.

【0059】まずステップ2201において入力連結成分の
行方向に対する黒画素の周辺分布を計算する。図 23に
おける連結成分2301からは2302のような周辺分布が得ら
れる。
First, in step 2201, the peripheral distribution of black pixels in the row direction of the input connected component is calculated. A marginal distribution such as 2302 is obtained from the connected component 2301 in FIG.

【0060】続いてステップ2202において、連結成分を
構成するストロークの幅の推定値を計算する。図 17に
おけるストローク幅変化追跡による連結成分切断処理
(ステップ1701)においてストローク幅を求めることが
できていれば、この値を用いる。求めることができてい
なければ、ステップ2201において求めた連結成分画像の
行方向の周辺分布から、両端部を除いた中央(例えば3/4
の範囲)2303における最小値をストローク幅の最小値と
する。周辺分布の両端部を最小値算出の対象から除いた
のは、文字を書く際の「はらい」などにより線幅が細く
なっていく状態を、ストローク幅推定から除外するため
である。
Subsequently, in step 2202, an estimated value of the width of the stroke constituting the connected component is calculated. If the stroke width can be obtained in the connected component cutting process (step 1701) by tracking the stroke width change in FIG. 17, this value is used. If it cannot be obtained, the center (for example, 3/4) excluding both ends from the peripheral distribution in the row direction of the connected component image obtained in step 2201
Range) 2303 is the minimum value of the stroke width. The reason why both ends of the marginal distribution are excluded from the target of the minimum value calculation is to exclude from the stroke width estimation a state in which the line width becomes narrower due to, for example, “spreading” when writing a character.

【0061】周辺分布形状による連結成分の切断箇所の
選択には大小二つのしきい値を用いて、縦書きの場合、そ
の形状が鞍部から尾根に変化する境界を求める。ステッ
プ2203において、これらのしきい値はステップ2202で求
めた線幅推定値の定数を乗じることにより求める。大き
いほうのしきい値hは線幅をLwとすると、式 α × Lwのh
2304 と w 2305 に示すように α > β であり、hはス
トロークが複数重なった場合の幅の最小値を想定し、wは
線幅の最大値を想定する。連結成分の周辺分布のうち、
複数のストローク幅以下の値を持つ領域のうち、1本のス
トローク幅の最大値以下の点の内、極小点を見つけ、その
最も行末に近い極小点を連結成分の切断候補点とする。
The selection of the cut point of the connected component based on the marginal distribution shape uses two threshold values, large and small, and in the case of vertical writing, a boundary where the shape changes from the saddle portion to the ridge is obtained. In step 2203, these thresholds are obtained by multiplying the constant of the estimated line width obtained in step 2202. When the line width is Lw, the larger threshold value h is given by h in the equation α × Lw.
Α> β as shown in 2304 and w 2305, h assumes the minimum value of the width when multiple strokes overlap, and w assumes the maximum value of the line width. Of the marginal distribution of the connected component,
Among the areas having a value equal to or less than a plurality of stroke widths, a minimum point is found among the points equal to or smaller than the maximum value of one stroke width, and the minimum point closest to the end of the line is set as a candidate cutting point of the connected component.

【0062】ステップ2204に進み、これら二つのしきい
値を用いて、先に述べた連結成分画像の中央部分の探索
範囲において行頭側から行末側に書けて画素毎において
以下の処理を行う。
In step 2204, using the two threshold values, the following processing is performed for each pixel by writing from the head of the line to the end of the line in the search range of the central portion of the connected component image described above.

【0063】ステップ2205では、その位置が周辺分布形
状の鞍部における極小値か否かを判定する。すなわち、
その位置の周辺分布の値がしきい値hよりも小さければ、
周辺分布形状が鞍部にあると判断し、この場合さらに、し
きい値wよりも小さければステップ2207において極小値
として探索範囲に置ける位置を記憶する。これらの条件
を満たさなければステップ2206に進み、探索範囲上の次
の位置に関する処理を続ける。
In step 2205, it is determined whether or not the position is a local minimum value in the saddle portion of the peripheral distribution shape. That is,
If the value of the marginal distribution at that position is smaller than the threshold value h,
It is determined that the peripheral distribution shape is located in the saddle portion. In this case, if it is smaller than the threshold value w, a position that can be placed in the search range as a minimum value is stored in step 2207. If these conditions are not satisfied, the process proceeds to step 2206, and the process for the next position on the search range is continued.

【0064】探索範囲内の処理が終われば、ステップ220
8に進み、探索範囲における周辺分布の値の極小値として
保存しておいた値の中から、最小値を求め、その時の探索
範囲内における位置を切断地点候補として出力する。同
じ極小値を持つ場所が複数有る場合は最も行末に近い場
所を切断点候補として出力する。
When the processing within the search range is completed, step 220
Proceeding to 8, the minimum value is obtained from the values stored as the minimum values of the peripheral distribution in the search range, and the position in the search range at that time is output as a cutting point candidate. If there are a plurality of locations having the same local minimum value, the location closest to the end of the line is output as a cutting point candidate.

【0065】ステップ2209において選択された位置に行
と垂直な方向に一画素分を空白にすることにより、連結
成分の空白を挿入する。
In step 2209, a blank of a connected component is inserted by blanking one pixel in the direction perpendicular to the row at the position selected.

【0066】以上、図 8のステップ805の連結成分の切断
・分離処理について述べた。横書きの文字列に対して
は、行方向に垂直なストロークと平行なストロークの順
序関係を入れ替えた条件を適用して、切断の条件判定を
行い、連結成分の切断・分離処理を行うことにより上記
の(2)で分類した両方の接触に対して連結成分を切断
できる。
The processing for cutting / separating connected components in step 805 in FIG. 8 has been described above. For horizontally written character strings, by applying conditions where the order relation between strokes perpendicular to the line direction and strokes parallel to the line direction is replaced, judgment of cutting conditions is performed, and cutting / separation processing of connected components is performed. The connected component can be cut for both contacts classified in (2).

【0067】次に、図 8のステップ806の切断処理の妥当
性検証と文字切出し仮説ネットワークへの追加処理につ
いて述べる。
Next, the validity verification of the disconnection processing in step 806 in FIG. 8 and the addition processing to the character extraction hypothesis network will be described.

【0068】接触があると判定された文字パタン候補に
おける、接触を含む連結成分の切断・分離処理が終わる
と、次に、切断・分離処理によって新たに生成した連結成
分から文字パタン候補を作成して、切出し仮説ネットワ
ークに追加しなければならない。本実施例では接触文字
パタン候補に対する一回の切断・分離処理で二つの文字
パタン候補を新たに生成することとする。そのために、
接触文字パタン候補において、切断・分離処理の対象と
ならなかった連結成分を切断・分離処理によって新たに
生成された連結成分と組み合わせて、文字パタン候補を
作成する必要がある。本実施例では連結成分の相対的な
位置関係に基づき、それぞれの連結成分が最初の文字パ
タン候補と、二番目の文字パタン候補のどちらかに含ま
れるかを決める。図 24における文字パタン候補2401は
図 9の切出し仮説ネットワーク上で接触文字を含むと判
断された文字パタン候補901であり、その中の連結成分24
02が切断・分離処理の対象となる連結成分である。連結
成分の切断・分離処理において連結成分2403、2404に分
離される。これらの連結成分のうち、行頭側にある連結
成分2403を行頭側の文字パタン候補に、行末側にある連
結成分2404を行末側の文字パタン候補とし、切断・分離
処理の対象とならなかった連結成分2405をどちらの文字
パタンに含めるかを判定する。判定の基準は (i)切断・分離処理の対象でない連結成分2405の行末側
の端2407が行頭側の連結成分2403の行末側の端2408より
も行頭側にあれば行頭側の文字パタン候補に含める (ii)切断・分離処理の対象でない連結成分2405の行頭側
の端2406が行末側の連結成分2404の行頭側の端2409より
も行末側にあれば行末側の文字パタン候補に含める (iii)それ以外の場合は、切断対象でない連結成分2405と
重なりあう部分が多いほうの連結成分と同じ文字パタン
に含める とする。図 24では、連結成分2405は行頭側の文字パタン
候補に含まれるので、文字パタン候補2410と2411が生成
され、図 10の文字パタン候補1001と文字パタン候補1002
として切出し仮説ネットワークに追加される。
When the cutting / separating process of the connected component including the contact is completed in the character pattern candidate determined to have the touch, the character pattern candidate is next created from the newly generated connected component by the cutting / separating process. Must be added to the cut-out hypothesis network. In this embodiment, two character pattern candidates are newly generated by one cutting / separating process for the contact character pattern candidate. for that reason,
In the contact character pattern candidate, it is necessary to create a character pattern candidate by combining a connected component that has not been subjected to the cutting / separating process with a connected component newly generated by the cutting / separating process. In the present embodiment, it is determined whether each connected component is included in the first character pattern candidate or the second character pattern candidate based on the relative positional relationship of the connected components. The character pattern candidate 2401 in FIG. 24 is a character pattern candidate 901 determined to include a contact character on the cut-out hypothesis network in FIG.
02 is a connected component to be cut / separated. In the connected component cutting / separating process, the component is separated into connected components 2403 and 2404. Of these connected components, the connected component 2403 at the beginning of the line is used as a character pattern candidate at the beginning of the line, and the connected component 2404 at the end of the line is used as a character pattern candidate at the end of the line. It is determined which character pattern includes the component 2405. The criterion for determination is (i) if the end 2407 at the end of the line of the connected component 2405 that is not subject to cutting / separation processing is closer to the beginning of the line than the end 2408 of the connected component 2403 at the beginning of the line, the character is a candidate for a character pattern at the beginning of the line. Include (ii) If the end 2406 at the beginning of the line of the connected component 2405 that is not the target of cutting / separation processing is closer to the end of the line than the end 2409 of the connected component 2404 at the end of the line, it is included in the character pattern candidate at the end of the line (iii In other cases, it is assumed that the same character pattern as that of the connected component having a larger portion overlapping with the connected component 2405 that is not to be cut is used. In FIG. 24, since the connected component 2405 is included in the character pattern candidates at the beginning of the line, character pattern candidates 2410 and 2411 are generated, and the character pattern candidates 1001 and 1002 in FIG.
Is added to the extraction hypothesis network.

【0069】この時、切断・分離処理の対象とならなか
った連結成分が、切断・分離処理の対象となる連結成分
を行方向の位置関係において包含関係にある場合は、切
断・分離処理の結果を棄却し、生成された連結成分から
新たな文字パタン候補を作成しない。
At this time, if the connected components that have not been subjected to the cutting / separating process have an inclusive relationship in the row direction with respect to the connected components subject to the cutting / separating process, the result of the cutting / separating process is obtained. And no new character pattern candidates are created from the generated connected components.

【0070】以上が図 8のステップ806の切断処理の妥
当性検証と文字切出し仮説ネットワークへの追加処理で
ある。
The above is the verification of the validity of the disconnection process in step 806 in FIG. 8 and the process of adding the character extraction hypothesis network.

【0071】次に、図 8のステップ807の統合文字パタン
候補の追加処理について述べる。
Next, the process of adding integrated character pattern candidates in step 807 of FIG. 8 will be described.

【0072】切断・分離処理によって新たに切出し仮説
ネットワークに追加された文字パタン候補と、隣接する
文字パタン候補とを統合して新たな文字パタン候補を追
加する。これは、切断・分離処理により接触していた漢
字の一方の偏だけが切出されて、他方の旁が別の文字パ
タン候補としてすでに切出し仮説ネットワーク上に存在
している場合でも、正しい文字パタン候補を生成するた
めである。図 8におけるステップ807において、切断・分
離処理により新たに生成されたすべての文字候補パタン
に対して、切出し仮説ネットワーク上の隣接するアーク
との間で、統合して新たな文字パタン候補とした場合の
行方向の長さが、一文字の幅の最大値に相当するしきい
値よりも小さければ、文字パタン候補を統合して新たに
文字パタン候補を切出し仮説ネットワークに追加する。
図 10の文字パタン候補1002からは、図 11の文字パタン
候補1101と文字パタン候補1102が生成され、追加され
る。
A new character pattern candidate is added by integrating the character pattern candidate newly added to the cut-out hypothesis network by the cutting / separation processing with the adjacent character pattern candidates. This is because even if only one of the kanji that was in contact with the cut / separation process was cut out and the other side was already on the cut-out hypothesis network as another character pattern candidate, the correct character pattern This is to generate candidates. In step 807 in FIG. 8, all character candidate patterns newly generated by the cutting / separation processing are integrated with adjacent arcs on the cut-out hypothesis network to form new character pattern candidates. If the length in the line direction is smaller than the threshold value corresponding to the maximum value of the width of one character, the character pattern candidates are integrated and a new character pattern candidate is cut out and added to the hypothesis network.
A character pattern candidate 1101 and a character pattern candidate 1102 in FIG. 11 are generated and added from the character pattern candidate 1002 in FIG.

【0073】以上が図 8のステップ807の統合文字パタ
ン候補の追加処理である。
The above is the process of adding integrated character pattern candidates in step 807 of FIG.

【0074】このようにして、図 8におけるステップ802
のループ処理をすべての文字パターンに対して行う。切
断・分離処理により新たに生成された文字パタン候補に
対しても行う。これにより、一つの文字パタン候補内に
二文字以上の接触文字が含まれている場合にも、上述し
たように、各文字パタンに対するサイズ、アスペクト比
から接触文字である可能性有りと判断される時に再帰的
に切断・分離処理を適用することにより、正しい文字パ
タン候補を得ることができる。
Thus, step 802 in FIG.
Is performed on all character patterns. The processing is also performed for a character pattern candidate newly generated by the cutting / separating process. As a result, even when two or more contact characters are included in one character pattern candidate, as described above, it is determined that there is a possibility of a contact character from the size and aspect ratio for each character pattern. At times, correct character pattern candidates can be obtained by applying a cutting / separating process recursively.

【0075】本実施例におけるハードウエアの構成を図
25に示す.これまで述べてきた本発明は、例えば同図の
ような文字列読取装置2501に適用される。2502は、画像
入力をつかさどるスキャナである。スキャナ2502は、入
力紙面から読取対象の文字列の記載された文字行画像の
抽出をつかさどる前処理装置2503に接続される。前処理
装置2503は、入出力用インタフェース2504を介して認識
装置のバス2505に接続される。2506は文字列読取結果を
表示する文字列読取結果表示端末である。文字列読取結
果表示端末2506は入出力用インタフェース2507を介して
認識装置のバス2505に接続する。2508は、本発明に必要
なプログラム、文字識別用標準パタン等を格納しておく
ための外部記憶装置である。外部記憶装置にはハードデ
ィスク等を用いる。外部記憶装置は入出力用インタフェ
ース2509を介して認識装置のバス2505に接続する 認識装置2501には、認識装置内部の各部分を接続するた
めのバス2505、認識装置全体の制御および文字列読取処
理をつかさどる演算処理装置2510、外部の装置との入出
力をつかさどる入出力用インタフェース2504、2507、250
9、文字列読取に必要なプログラム、テーブル、辞書などを
格納するためのメモリ2511を備える。装置起動時には、
まず外部記憶装置2508からプログラム、標準パタン辞書
がメモリ2511へロードされる。ロード完了後、前処理装
置2503から文字行画像が認識装置2501へ供給されると、
文字行画像はメモリ2511に複写される。さらに演算処理
装置2510は本発明で説明した方式に従って切出し仮説ネ
ットワークをメモリ2511上に生成しながら文字列を認識
し、読取結果を文字列読取結果表示端末2506へ送信す
る。文字列読取結果表示端末2506は認識結果をその画面
上に表示する。
FIG. 10 shows the hardware configuration in this embodiment.
See Figure 25. The present invention described so far is applied to, for example, a character string reading device 2501 as shown in FIG. A scanner 2502 controls image input. The scanner 2502 is connected to a pre-processing device 2503 that controls extraction of a character line image in which a character string to be read is described from an input page. The preprocessing device 2503 is connected to a bus 2505 of the recognition device via an input / output interface 2504. Reference numeral 2506 denotes a character string reading result display terminal for displaying a character string reading result. The character string reading result display terminal 2506 is connected to the bus 2505 of the recognition device via the input / output interface 2507. Reference numeral 2508 denotes an external storage device for storing programs required for the present invention, standard patterns for character identification, and the like. A hard disk or the like is used as the external storage device. The external storage device is connected to the bus 2505 of the recognition device via the input / output interface 2509. The recognition device 2501 has a bus 2505 for connecting each part inside the recognition device, control of the whole recognition device, and character string reading processing. Processing unit 2510, which controls input / output, and input / output interfaces 2504, 2507, 250, which control input / output with external devices
9. It has a memory 2511 for storing programs, tables, dictionaries, etc. necessary for reading character strings. When starting the device,
First, a program and a standard pattern dictionary are loaded from the external storage device 2508 to the memory 2511. After the loading is completed, when the character line image is supplied from the preprocessing device 2503 to the recognition device 2501,
The character line image is copied to the memory 2511. Further, the arithmetic processing unit 2510 recognizes the character string while generating the cut-out hypothesis network in the memory 2511 according to the method described in the present invention, and transmits the read result to the character string read result display terminal 2506. The character string reading result display terminal 2506 displays the recognition result on its screen.

【0076】以上、本発明の文字読み取り方法と装置の
実施例を説明した。本発明で読みとられる文字は、手書
きの文字列である。手書きの文字は、単なる文書に書か
れたかな漢字交じりの文章のみならず、帳票上の数字や
記号や郵便物に記載された住所氏名などの文字を読みと
る場合にも用いることができる。これらの大量の帳票や
はがきや封書などの郵便物は、迅速に、確実に内容を読み
とる必要がある。例えば、郵便物の場合は、記入された住
所、氏名、郵便番号などを精度よく早く読み取ることがで
き、配達のための区分に役立てることができる。既存の
郵便区分機は、郵便物の宛名を光学的に読みとり、その読
みとった白黒の濃淡画像を文字として認識して、その認
識内容に応じて住所毎に区分するが、その文字認識部分
に本発明を適用すれば、区分の精度が向上し、機械的な機
構に依存する点を除き、区分速度も向上することは明ら
かである。
The embodiments of the character reading method and apparatus according to the present invention have been described above. The characters read in the present invention are handwritten character strings. The handwritten characters can be used not only for reading a sentence containing kana and kanji characters written in a document but also for reading characters such as numbers and symbols on a form and an address name written on a mail. It is necessary to quickly and surely read the contents of such a large number of forms, postcards and sealed letters. For example, in the case of a postal matter, the entered address, name, postal code, and the like can be accurately and quickly read, and can be used for sorting for delivery. Existing mail sorting machines optically read mail addresses and recognize the read black-and-white grayscale images as characters, and classify them by address according to the recognition contents. It is clear that the application of the invention improves the accuracy of the sorting and also improves the sorting speed, except that it depends on a mechanical mechanism.

【0077】[0077]

【発明の効果】漢字と漢字が接触した文字列に大して
も、正しい文字切出し、認識を行うことができるようにな
る。特に、偏や旁といった文字の部分が接触し、接触した
連結成分が他に比べて特に大きくならない場合にも有効
である。また、本発明は手書き文字の認識を行うあらゆ
る装置または方法に適用できる。
According to the present invention, correct character extraction and recognition can be performed even if the kanji is in contact with a character string. In particular, the present invention is also effective in a case where a character portion such as a bias or a side touches and the connected connected component does not become particularly large as compared with others. Further, the present invention can be applied to any apparatus or method for recognizing handwritten characters.

【図面の簡単な説明】[Brief description of the drawings]

【図1】文字列認識の一般的な処理フローである。FIG. 1 is a general processing flow of character string recognition.

【図2】接触した数字の文字切出し手法の例を示す図で
ある。
FIG. 2 is a diagram showing an example of a method of extracting a character from a contacted number.

【図3】接触した漢字文字列画像の例を示す図である。FIG. 3 is a diagram illustrating an example of a touched kanji character string image.

【図4】接触した漢字文字列画像における連結成分の例
を示す図である。
FIG. 4 is a diagram illustrating an example of a connected component in a touched kanji character string image.

【図5】接触した漢字文字パタン候補の例を示す図であ
る。
FIG. 5 is a diagram showing an example of a contacted Kanji character pattern candidate.

【図6】本発明における文字列認識の一実施例の処理フ
ローを示す図である。
FIG. 6 is a diagram showing a processing flow of one embodiment of character string recognition in the present invention.

【図7】切出し仮説ネットワークの例を示す図である。FIG. 7 is a diagram illustrating an example of a cut-out hypothesis network.

【図8】接触漢字文字を含む文字列に対する文字切出し
処理の流れを示す図である。
FIG. 8 is a diagram showing a flow of a character extracting process for a character string including a contact kanji character.

【図9】接触文字パタン候補判定の結果の切出し仮説ネ
ットワーク上での表現の例を示す図である。
FIG. 9 is a diagram illustrating an example of an expression on a cut-out hypothesis network of a result of contact character pattern candidate determination.

【図10】接触文字パタン候補の切断・分離処理結果の
例を示す図である。
FIG. 10 is a diagram illustrating an example of a result of cutting / separating processing of a contact character pattern candidate.

【図11】切断・分離処理の結果生成された文字パタン
候補と既存の文字パタン候補の統合の例を示す図であ
る。
FIG. 11 is a diagram illustrating an example of integration of a character pattern candidate generated as a result of the cutting / separation processing with an existing character pattern candidate.

【図12】文字パタン候補対する接触文字判定処理フロ
ーを示す図である。
FIG. 12 is a diagram showing a contact character determination processing flow for a character pattern candidate.

【図13】文字パタン候補に対する接触文字判定の例を
示す図である。
FIG. 13 is a diagram illustrating an example of contact character determination for a character pattern candidate.

【図14】文字パタン候補中からの切断対象連結成分の
選択の例を示す図である。
FIG. 14 is a diagram illustrating an example of selection of a cutting target connected component from character pattern candidates.

【図15】切断対象連結成分管理テーブルの例を示す図
である。
FIG. 15 is a diagram illustrating an example of a cutting target connected component management table.

【図16】漢字の接触の仕方の例を示す図である。FIG. 16 is a diagram showing an example of how to contact Chinese characters.

【図17】連結成分切断処理の全体フローを示す図であ
る。
FIG. 17 is a diagram showing an overall flow of a connected component cutting process.

【図18】ストローク幅変化解析による連結成分切断・
分離処理のフロー。
FIG. 18 is a diagram illustrating the connection component cutting / analysis by the stroke width change analysis.
Flow of separation processing.

【図19】ランレングス画像からの直線成分抽出手法を
示す図である。
FIG. 19 is a diagram illustrating a method of extracting a straight-line component from a run-length image.

【図20】ストローク幅変化解析による切断判定手法を
示す図である。
FIG. 20 is a diagram showing a cutting determination method based on a stroke width change analysis.

【図21】ストローク管理テーブルの例を示す図であ
る。
FIG. 21 is a diagram illustrating an example of a stroke management table.

【図22】投影形状変化追跡による連結成分切断・分離
処理のフローを示す図である。
FIG. 22 is a diagram illustrating a flow of a connected component cutting / separating process by projection shape change tracking.

【図23】周辺分布形状解析による切断判定手法を示す
図である。
FIG. 23 is a diagram illustrating a cutting determination method based on marginal distribution shape analysis.

【図24】切断・分離処理後の新たな文字パタン候補の
連結成分の組み合わせ方を示す図である。
FIG. 24 is a diagram showing how to combine connected components of a new character pattern candidate after cutting / separation processing.

【図25】文字列読取装置のハードウェア構成を示す図
である。
FIG. 25 is a diagram illustrating a hardware configuration of a character string reading device.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 古賀 昌史 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 酒匂 裕 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 藤澤 浩道 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 Fターム(参考) 5B029 AA01 CC27 DD10 EE08 5B064 AA04 AB03 AB14 AB16 CA08 CA10 EA34  ────────────────────────────────────────────────── ─── Continuing on the front page (72) Inventor Masafumi Koga 1-280 Higashi-Koigakubo, Kokubunji-shi, Tokyo Inside the Central Research Laboratory, Hitachi, Ltd. (72) Inventor Yutaka Sakami 1-280 Higashi-Koigakubo, Kokubunji-shi, Tokyo Hitachi, Ltd. Central Research Laboratory (72) Inventor Hiromichi Fujisawa 1-280 Higashi-Koigakubo, Kokubunji-shi, Tokyo F-term in Central Research Laboratory, Hitachi, Ltd. 5B029 AA01 CC27 DD10 EE08 5B064 AA04 AB03 AB14 AB16 CA08 CA10 EA34

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】文字列の記載されている画像上より文字行
を抽出する文字行抽出処理と、文字行より文字パタン候
補を切出す文字パタン切出し処理と、切出された文字パ
タン候補を文字識別する文字識別処理と、文字識別結果
から単語の並びを抽出する文字列照合処理とを有する文
字列読取方法において、文字行画像から生成した文字パ
タンの候補に対して接触を含む可能性がある文字パタン
であるか否かを判定する接触文字判定処理と、上記判定
処理において接触したと判定した文字パタンに対して、
接触位置の推定を行う接触点推定処理と、推定した接触
点において文字パタンを切断・分離する文字パタン切断
・分離処理と、上記切断・分離処理において生成した部
分パタンから新たに文字パタン候補を生成する処理とを
有することを特徴とする文字列読取方法。
1. A character line extracting process for extracting a character line from an image on which a character string is described, a character pattern extracting process for extracting a character pattern candidate from the character line, and a character pattern extracting process for extracting the character pattern candidate In a character string reading method having character identification processing for identification and character string collation processing for extracting a sequence of words from the character identification result, there is a possibility that a character pattern candidate generated from a character line image may include a contact. A contact character determination process for determining whether or not a character pattern is present,
A contact point estimation process for estimating a contact position, a character pattern cutting / separation process for cutting / separating a character pattern at the estimated contact point, and a new character pattern candidate generated from the partial pattern generated in the above cutting / separation process And a character string reading method.
【請求項2】請求項1記載の文字列読取方法において、接
触部分を含む部分文字パタンの大小に関わらず、これを
構成要素とする文字パタン候補のサイズに基づき接触を
含む文字パタン候補か否かの判定をする接触文字判定処
理を有することを特徴とする文字列読取方法。
2. A character string reading method according to claim 1, wherein the character pattern candidate including a contact is determined based on the size of the character pattern candidate including the partial character pattern regardless of the size of the partial character pattern including the contact part. A character string reading method comprising a contact character determination process for determining whether a character string is a character string.
【請求項3】請求項1記載の文字列読取方法において、接
触文字判定処理において接触を含むと判定された文字パ
タン候補に対して、その構成要素である連結成分の中か
ら接触を含む連結成分を選択する処理と、選択した連結
成分を記憶し、同一の連結成分の切断・分離処理が重複
して行われないように切断・分離処理を制御する処理を
有することを特徴とする文字列読取方法。
3. The character string reading method according to claim 1, wherein a connected component including a contact is selected from the connected components as constituent elements of a character pattern candidate determined to include a contact in the contact character determination processing. A character string reading process comprising: a process of selecting a character string; and a process of storing the selected connected component and controlling the cutting / separating process so that the cutting / separating process of the same connected component is not performed repeatedly. Method.
【請求項4】請求項1記載の文字列読取方法において、接
触文字パタン画像の切断・分離処理と文字パタン候補の
生成処理を、接触文字があると判定される限り再帰的に
行うことを特徴とする文字列読取方法。
4. The character string reading method according to claim 1, wherein the processing of cutting / separating a contact character pattern image and the processing of generating a character pattern candidate are performed recursively as long as it is determined that there is a contact character. Character string reading method.
【請求項5】請求項1記載の文字列読取方法において、接
触した可能性があると判定された連結成分の切断・分離
処理によって新たに生成された文字パタン候補と、これ
に隣接する既存の文字パタン候補とを統合したパタンに
対して、前後の文字パタン候補との位置関係、そのサイズ
から文字パタン候補であるか否かを判定し、異なる文字
パタン候補に分離している文字に対する文字パタン候補
を生成し追加する処理とを有することを特徴とする文字
列読取方法。
5. A character string reading method according to claim 1, wherein a character pattern candidate newly generated by a cutting / separating process of a connected component determined to have a possibility of contact and an existing character pattern adjacent to the character pattern candidate are generated. For the pattern that is integrated with the character pattern candidate, it is determined whether or not the character pattern candidate is a character pattern candidate based on the positional relationship with the preceding and following character pattern candidates and its size. A process of generating and adding candidates.
【請求項6】請求項1記載の文字列読取方法において、連
結成分の切断・分離処理によって新たに生成された文字
パタン候補に対して、同じ文字パタン候補中の他の連結
成分との相対的位置関係から切断・分離処理を棄却する
処理とを有することを特徴とする文字列読取装置。
6. The character string reading method according to claim 1, wherein a character pattern candidate newly generated by the cutting / separating process of the connected component is compared with another connected component in the same character pattern candidate. Rejecting the cutting / separating process from the positional relationship.
【請求項7】a)文書上に記載された文字列を濃淡画像と
して読みとり、 b)上記濃淡画像の黒画素の連続した部分を連結成分とし
て切り出し、 c)上記連結成分を含む文字パタン候補が接触文字である
と判断された場合には、 d)上記文字パタンの中で上記連結成分の行方向の長
さが最大の連結成分を切断して2つの文字パタンを生成
し、 e)上記bからdを繰り返して得られた文字パタンに対して
文字認識を実行する 文字列読取方法。
7. A character string described in a document is read as a grayscale image, b) a continuous portion of black pixels of the grayscale image is cut out as a connected component, and c) a character pattern candidate including the connected component is If it is determined that the character is a contact character, d) cut the connected component having the maximum length in the row direction of the connected component in the character pattern to generate two character patterns; A character string reading method that performs character recognition on character patterns obtained by repeating steps d through d.
【請求項8】請求項7において、ステップcでは、上記文
字パタン候補のサイズまたはアスペクト比から接触文字
であるかを判断することを特徴とする文字列読取方法。
8. A character string reading method according to claim 7, wherein in step c, it is determined whether the character is a contact character based on the size or aspect ratio of the character pattern candidate.
【請求項9】文書上に記載された手書き文字列を濃淡画
像データに変換するスキャナと、上記濃淡画像の黒画素
の連続した部分であって、連結成分として切り出された
データを保持するメモリと、上記連結成分を含む文字パ
タン候補が接触文字である場合に上記文字パタンの中で
上記連結成分の行方向の長さが最大の連結成分を切断し
て生成された新たな文字パタンに対して文字認識を実行
する処理手段と、からなることを特徴とする文字列読取
装置。
9. A scanner for converting a handwritten character string written on a document into grayscale image data, and a memory for holding data which is a continuous portion of black pixels of the grayscale image and is cut out as a connected component. In the case where the character pattern candidate including the connected component is a contact character, a new character pattern generated by cutting the connected component having the maximum length in the line direction of the connected component in the character pattern is A character string reading device, comprising: processing means for performing character recognition.
【請求項10】郵便物に記載された手書き文字列を濃淡
画像データに変換するスキャナと、上記濃淡画像の黒画
素の連続した部分であって、連結成分として切り出され
たデータを保持するメモリと、上記連結成分を含む文字
パタン候補が接触文字である場合に上記文字パタンの中
で上記連結成分の行方向の長さが最大の連結成分を切断
して生成された新たな文字パタンに対して文字認識を実
行する処理手段と、認識された結果に基づいて郵便物を
区分することを特徴とする郵便区分機。
10. A scanner for converting a handwritten character string described in a postal matter into grayscale image data, and a memory for holding a continuous portion of black pixels of the grayscale image cut out as a connected component. In the case where the character pattern candidate including the connected component is a contact character, a new character pattern generated by cutting the connected component having the maximum length in the line direction of the connected component in the character pattern is A mail sorting machine characterized by processing means for executing character recognition and mail sorting based on the recognized result.
【請求項11】帳票に記載された手書き文字列を濃淡画
像データに変換するスキャナと、上記濃淡画像の黒画素
の連続した部分であって、連結成分として切り出された
データを保持するメモリと、上記連結成分を含む文字パ
タン候補が接触文字である場合に上記文字パタンの中で
上記連結成分の行方向の長さが最大の連結成分を切断し
て生成された新たな文字パタンに対して文字認識を実行
する処理手段と、からなることを特徴とする帳票読取装
置。
11. A scanner for converting a handwritten character string described in a form into gray-scale image data, a memory for holding a continuous portion of black pixels of the gray-scale image and cut out as a connected component, When the character pattern candidate including the connected component is a contact character, a character corresponding to a new character pattern generated by cutting the connected component having the maximum length in the line direction of the connected component in the character pattern And a processing unit for performing recognition.
JP11004951A 1999-01-12 1999-01-12 Reading method and device for character string Pending JP2000207491A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11004951A JP2000207491A (en) 1999-01-12 1999-01-12 Reading method and device for character string

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11004951A JP2000207491A (en) 1999-01-12 1999-01-12 Reading method and device for character string

Publications (1)

Publication Number Publication Date
JP2000207491A true JP2000207491A (en) 2000-07-28

Family

ID=11597893

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11004951A Pending JP2000207491A (en) 1999-01-12 1999-01-12 Reading method and device for character string

Country Status (1)

Country Link
JP (1) JP2000207491A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006059124A (en) * 2004-08-20 2006-03-02 Hitachi Omron Terminal Solutions Corp System and apparatus for recognizing character string in landscape
CN100530217C (en) * 2005-01-21 2009-08-19 日立欧姆龙金融系统有限公司 Word identifier
WO2017038952A1 (en) * 2015-09-04 2017-03-09 株式会社東芝 Character recognition device, character recognition method, and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006059124A (en) * 2004-08-20 2006-03-02 Hitachi Omron Terminal Solutions Corp System and apparatus for recognizing character string in landscape
JP4713107B2 (en) * 2004-08-20 2011-06-29 日立オムロンターミナルソリューションズ株式会社 Character string recognition method and device in landscape
CN100530217C (en) * 2005-01-21 2009-08-19 日立欧姆龙金融系统有限公司 Word identifier
WO2017038952A1 (en) * 2015-09-04 2017-03-09 株式会社東芝 Character recognition device, character recognition method, and program

Similar Documents

Publication Publication Date Title
US10936862B2 (en) System and method of character recognition using fully convolutional neural networks
US7519226B2 (en) Form search apparatus and method
KR100324847B1 (en) Address reader and mails separater, and character string recognition method
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5410611A (en) Method for identifying word bounding boxes in text
JP2973944B2 (en) Document processing apparatus and document processing method
JP2734386B2 (en) String reader
US6535619B1 (en) Address recognition apparatus and method
US6950555B2 (en) Holistic-analytical recognition of handwritten text
JP3345224B2 (en) Pattern extraction device, pattern re-recognition table creation device, and pattern recognition device
EP0385009A1 (en) Apparatus and method for use in image processing
US7283669B2 (en) Fine segmentation refinement for an optical character recognition system
Kennard et al. Separating lines of text in free-form handwritten historical documents
JP3485020B2 (en) Character recognition method and apparatus, and storage medium
EP3539051A1 (en) System and method of character recognition using fully convolutional neural networks
US20040146200A1 (en) Segmenting touching characters in an optical character recognition system to provide multiple segmentations
KR19980086524A (en) Pattern extraction device
JP2023511791A (en) text classification
Song et al. Recognition of merged characters based on forepart prediction, necessity-sufficiency matching, and character-adaptive masking
US9811726B2 (en) Chinese, Japanese, or Korean language detection
JP2000207491A (en) Reading method and device for character string
JP4176175B2 (en) Pattern recognition device
JP4810853B2 (en) Character image cutting device, character image cutting method and program
JP4117648B2 (en) Form, form processing method, form processing program, recording medium recording form processing program, and form processing apparatus
JP2827960B2 (en) Address line extraction device

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050223

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060123

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060425

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060510

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060623

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060705

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060728