JPH11224310A - Character recognizing device - Google Patents

Character recognizing device

Info

Publication number
JPH11224310A
JPH11224310A JP10038101A JP3810198A JPH11224310A JP H11224310 A JPH11224310 A JP H11224310A JP 10038101 A JP10038101 A JP 10038101A JP 3810198 A JP3810198 A JP 3810198A JP H11224310 A JPH11224310 A JP H11224310A
Authority
JP
Japan
Prior art keywords
segment
primary
character
flag
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10038101A
Other languages
Japanese (ja)
Inventor
Hiroshi Sasaki
佐々木  寛
Yoshinori Ookuma
好憲 大熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10038101A priority Critical patent/JPH11224310A/en
Publication of JPH11224310A publication Critical patent/JPH11224310A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To attain decrease in the number of times of arithmetic processing by limiting the kind of a secondary segment provided by combining primary segments. SOLUTION: A primary segment extracting part 105 provides plural primary segments by finding and dividing the segment candidate position of a character from the image of a character string to be a recognizing object. A certainty flag set part 106 finds out a position having the wide interval of primary segments, judges it as the boundary of characters and sets a certainty flag. While considering this certainty flag, a secondary segment preparing part determines the combination of primary segments, prepares the secondary segment and defines it as the object of character recognition.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、記入された文字の
イメージからその文字を認識して文字コード化するよう
な場合に使用される文字認識装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognizing device used for recognizing a character from an image of a written character and converting the character into a character code.

【0002】[0002]

【従来の技術】帳票上に記入された文字をスキャナで読
み取り、文字コード化する文字認識装置は、コンピュー
タにデータをエントリするような場合に広く活用されて
いる。この装置は、各文字のイメージを切り取ってその
特徴を抽出し、予め登録された特徴辞書と比較照合して
その認識を行う。活字を対象としていた従来の文字認識
装置では、活字文字の等間隔に並ぶ性質を利用して、入
力画像から一定間隔で文字を切り出していた。しかし、
手書き文字やプロポーショナルフォントのような文字が
対象となると、文字間隔や文字形状が大きく変化した
り、隣接文字と接触したりする。従って、上記のような
「一定間隔」で切り出す方法では、文字を切り出す位置
を誤る「切出し誤り」が多くなってしまうという問題が
ある。
2. Description of the Related Art A character recognizing device which reads a character written on a form by a scanner and converts the character into a character code is widely used when data is entered into a computer. This device cuts out the image of each character, extracts its feature, compares it with a previously registered feature dictionary, and recognizes it. In a conventional character recognition device for printing characters, characters are cut out at regular intervals from an input image by utilizing the property of printing characters at regular intervals. But,
When a character such as a handwritten character or a proportional font is targeted, the character spacing or the character shape changes greatly, or the character contacts adjacent characters. Therefore, in the above-described method of extracting characters at “fixed intervals”, there is a problem that “cutting errors” in which characters are extracted at incorrect positions are increased.

【0003】そこで、この問題の対処方法として、特開
平3−37782号公報に記載されたものが紹介されて
いる。この技術では、文字を一定間隔で切り出すのでは
なく、文字を構成する黒点の分布を求めたヒストグラム
を解析して、文字の端と思われる個所を調べて切出し候
補位置にしていく。この段階で、2つの切出し候補位置
に挟まれた部分が、文字の部分パタンであり、これを組
み合わせて文字候補を作成している。
[0003] To cope with this problem, a method described in Japanese Patent Laid-Open Publication No. 3-37782 is introduced. In this technique, a character is not cut out at regular intervals, but a histogram obtained from a distribution of black points constituting the character is analyzed, and a portion considered to be an end of the character is checked to be a cutout candidate position. At this stage, the portion sandwiched between the two extraction candidate positions is a character partial pattern, which is combined to create a character candidate.

【0004】[0004]

【発明が解決しようとする課題】ところで、上記のよう
な従来の技術には次のような解決すべき課題があった。
従来技術では、各切出し候補位置で分割して得た文字の
部分パタンを組み合わせて、新しい候補文字パタンを作
り、可能な限りの切出し方を考えるようにしている。し
かしながら、可能な全ての切出し候補位置を考えると、
認識処理すべき文字数に比例して計算量が膨大になると
いう問題がある。またこれにより、文字認識のための処
理時間も長くなってしまうという問題がある。
However, the above-mentioned prior art has the following problems to be solved.
In the related art, a new candidate character pattern is created by combining partial patterns of characters obtained by dividing at each extraction candidate position, and a method of extracting as much as possible is considered. However, considering all possible extraction candidate positions,
There is a problem that the amount of calculation becomes enormous in proportion to the number of characters to be recognized. In addition, this causes a problem that the processing time for character recognition becomes longer.

【0005】[0005]

【課題を解決するための手段】本発明は以上の点を解決
するため次の構成を採用する。 〈構成1〉入力画像中に並んだ文字列について、各文字
を構成する黒点の分布を表すヒストグラムを取得し、文
字の並んだ方向に対してほぼ垂直方向に向いた複数の切
出し候補位置を求め、この切出し候補位置を境に上記文
字列を複数に分割して1次セグメント群を得る1次セグ
メント抽出部と、互いに隣接する文字の境目にある1次
セグメントを、その他のセグメントと区別するために確
度フラグをセットする確度フラグセット部と、上記確度
フラグに着目して、文字の境目を挟む1次セグメントの
組合せを除外しながら、上記1次セグメント抽出部が抽
出した互いに隣接する1次セグメントを統合して、2次
セグメントを作成する2次セグメント作成部と、上記1
次セグメントまたは2次セグメントで囲まれる候補文字
画像を文字認識する文字認識部と、候補木を用いて文字
認識結果を評価する候補木選択部とを備えたことを特徴
とする文字認識装置。
The present invention employs the following structure to solve the above problems. <Structure 1> For a character string arranged in an input image, a histogram representing the distribution of black points constituting each character is obtained, and a plurality of extraction candidate positions oriented substantially perpendicular to the direction in which the characters are arranged are obtained. A primary segment extracting unit that divides the character string into a plurality of parts at the cutout candidate position to obtain a primary segment group, and distinguishes a primary segment at a boundary between mutually adjacent characters from other segments. A probability flag setting unit for setting a probability flag in the first segment and a primary segment extracted by the primary segment extraction unit while excluding a combination of primary segments sandwiching a character boundary by focusing on the accuracy flag. A secondary segment creation unit for creating a secondary segment by integrating
A character recognition device comprising: a character recognition unit that character-recognizes a candidate character image surrounded by a next segment or a secondary segment; and a candidate tree selection unit that evaluates a character recognition result using a candidate tree.

【0006】〈構成2〉構成1に記載の装置において、
上記確度フラグセット部は、上記第1次セグメントの全
てに対して、その1次セグメントと隣接する1次セグメ
ントとの間のスペース幅を計算し、そのスペース幅が予
め与えられた閾値以上の場合、当該セグメントに確度フ
ラグをセットして、そのセグメント間に文字の境界を挟
むという情報をいずれか一方の1次セグメントに付加す
ることを特徴とする文字認識装置。
<Structure 2> In the apparatus described in Structure 1,
The accuracy flag set unit calculates a space width between the primary segment and an adjacent primary segment for all of the primary segments, and when the space width is equal to or larger than a predetermined threshold value. A character recognition apparatus, wherein a certainty flag is set for the segment and information indicating that a character boundary is sandwiched between the segments is added to one of the primary segments.

【0007】〈構成3〉構成1に記載の装置において、
上記確度フラグセット部は、上記1次セグメントの全て
に対して、そのセグメントの形状を表す特徴量を求め
て、その特徴量が予め与えられた範囲にある場合、当該
セグメントに確度フラグを付加することを特徴とする文
字認識装置。
<Structure 3> In the device described in Structure 1,
The certainty flag setting unit obtains a feature amount representing the shape of the primary segment for all of the primary segments, and adds a certainty flag to the segment when the feature amount is within a predetermined range. A character recognition device characterized in that:

【0008】〈構成4〉構成1に記載の装置において、
上記確度フラグセット部は、上記1次セグメントの全て
に対して、一度文字認識を行い、文字の特定部分の図形
を認識する辞書と照合して、該当する図形と認識された
場合には、当該1次セグメントに確度フラグを付加する
ことを特徴とする文字認識装置。
<Structure 4> In the device described in Structure 1,
The accuracy flag set unit performs character recognition once for all of the primary segments, compares the character with a dictionary for recognizing a graphic of a specific part of the character, and if the corresponding graphic is recognized, A character recognition device, wherein a probability flag is added to a primary segment.

【0009】[0009]

【発明の実施の形態】以下、本発明の実施の形態を具体
例を用いて説明する。 《具体例1》 〈全体の構成〉図1は、具体例1の文字認識装置全体の
ブロック図である。この図の説明をする前に、まず、文
字のヒストグラム取得と切出し候補位置の検出の概念に
ついて説明をする。図2は、従来知られたヒストグラム
と文字認識方法の説明図である。図2(a)には、手書
きされた「八王子」という文字列について、各文字を構
成する黒点の分布を表すヒストグラムを取得し、その文
字の並んだ方向に対してほぼ垂直方向に向いた切出し候
補位置を求めた状態を示す。図の破線21、22、23
が切出し候補位置である。こうして、ヒストグラムの連
続性に基づいた基本パタン24〜27を抽出する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of the present invention will be described below using specific examples. << Specific Example 1 >><OverallConfiguration> FIG. 1 is a block diagram of the entire character recognition device of Specific Example 1. Before explaining this figure, first, the concept of obtaining a histogram of a character and detecting a cutout candidate position will be described. FIG. 2 is an explanatory diagram of a conventionally known histogram and character recognition method. In FIG. 2A, for a character string “Hachioji” handwritten, a histogram representing the distribution of black spots constituting each character is obtained, and the cutout is oriented substantially perpendicular to the direction in which the characters are arranged. This shows a state in which candidate positions have been obtained. Dashed lines 21, 22, 23 in the figure
Is the extraction candidate position. Thus, the basic patterns 24 to 27 based on the continuity of the histogram are extracted.

【0010】従来は、単独の基本パタンまたは連続する
複数個の基本パタンを図の(b)に示す要領で結合した
パタンを文字候補としてその評価値を求めていた。これ
では、図の(c)に示した候補木に示すように、最適な
文字の切出し候補位置を決定するまでに非常に多くの組
合せに基づく演算処理の繰り返しを必要とする。これで
は処理時間が長くなる。
Conventionally, a single basic pattern or a pattern obtained by combining a plurality of continuous basic patterns in the manner shown in FIG. 1B is used as a character candidate to determine the evaluation value. In this case, as shown in the candidate tree shown in FIG. 3C, it is necessary to repeat the arithmetic processing based on a very large number of combinations before determining the optimal character extraction candidate position. This increases the processing time.

【0011】本発明では、この図の(a)のようにして
文字の切出し候補位置を求め、上記基本パタンに相当す
る部分(本発明ではこれを1次セグメントと呼ぶ)を得
ると共に、切出し候補位置の確度という新たな概念を導
入する。これにより、1次セグメントを組み合わせて得
る2次セグメントの数を削減し、演算処理回数の減少を
図っている。
In the present invention, a candidate position for extracting a character is obtained as shown in FIG. 2A to obtain a portion corresponding to the basic pattern (this is called a primary segment in the present invention). Introduce a new concept of position accuracy. As a result, the number of secondary segments obtained by combining the primary segments is reduced, and the number of calculation processes is reduced.

【0012】再び図1に戻って、図の装置の構成を説明
する。図の装置は、全体の処理の制御を司る制御部10
0と、入力画像を格納する画像格納部101、文字の中
間情報である1次セグメントと2次セグメントを一時格
納する1次・2次セグメント情報格納部102、文字画
像とその認識結果である文字コードを一時格納するため
の文字情報格納部103、そして、1次セグメントと2
次セグメントとの組合せを候補木として格納する候補木
格納部104を備える。
Returning to FIG. 1, the configuration of the apparatus shown in the figure will be described. The apparatus shown in the figure has a control unit 10 which controls the entire processing.
0, an image storage unit 101 for storing an input image, a primary / secondary segment information storage unit 102 for temporarily storing primary and secondary segments as intermediate information of a character, a character image and a character as a recognition result thereof A character information storage unit 103 for temporarily storing a code;
A candidate tree storage unit 104 is provided for storing a combination with the next segment as a candidate tree.

【0013】また、画像格納部101から入力画像を読
み取り、1次セグメントを抽出し、1次・2次セグメン
ト情報格納部102に、当該1次セグメント情報を格納
するための、1次セグメント抽出部105と、1次・2
次セグメント情報格納部から、上記格納された1次セグ
メント情報を読み取り、確度フラグをセットする確度フ
ラグセット部106を備える。
A primary segment extraction unit for reading an input image from the image storage unit 101, extracting a primary segment, and storing the primary segment information in a primary / secondary segment information storage unit 102. 105, primary, 2
There is provided a certainty flag setting unit 106 for reading the stored primary segment information from the next segment information storage unit and setting a certainty flag.

【0014】さらに、1次・2次セグメント情報格納部
102から1次セグメント情報を読み取り、当該1次セ
グメントと当該1次セグメントに右隣接する他の1次セ
グメントとの間のスペース幅が予め用意された条件を満
足する場合は、当該1次セグメントと当該隣接1次セグ
メントとを統合し、2次セグメントにし、当該2次セグ
メントを1次・2次セグメント情報格納部に記録する2
次セグメント作成部107を備える。
Further, the primary segment information is read from the primary / secondary segment information storage unit 102, and a space width between the primary segment and another primary segment right adjacent to the primary segment is prepared in advance. If the set conditions are satisfied, the primary segment and the adjacent primary segment are integrated into a secondary segment, and the secondary segment is recorded in the primary / secondary segment information storage unit.
A next segment creation unit 107 is provided.

【0015】また、上記1次・2次セグメント情報格納
部102から1次セグメント情報と2次セグメント情報
を読み取り、対応する座標にある画像を、上記画像格納
部101から読み取り、当該画像をセグメントで囲われ
た文字パタンとして、文字情報格納部103に格納する
文字パタン切出し部108と、上記文字情報格納部10
3から上記切り出した文字パタンを文字認識し、認識結
果である文字コードの上位第K位までを文字情報格納部
に格納する文字認識部109を設ける。
Also, the primary and secondary segment information are read from the primary / secondary segment information storage unit 102, an image at the corresponding coordinates is read from the image storage unit 101, and the image is segmented. A character pattern cutout unit 108 to be stored in the character information storage unit 103 as an enclosed character pattern;
3 is provided with a character recognizing unit 109 for recognizing the character pattern extracted from the character pattern and storing up to the K-th character code as a recognition result in the character information storage unit.

【0016】このほかに、上記1次・2次セグメント情
報格納部102からセグメント情報を、上記文字情報格
納部103から文字情報を読み取り、文字切出しの組合
せ(以下候補木という)を作成し、候補木格納部に格納
する候補木作成部110と、上記候補木格納部から最良
の切出し・認識結果であるセグメントの組合せを出力す
る結果出力部111を設ける。
In addition, the segment information is read from the primary / secondary segment information storage unit 102 and the character information is read from the character information storage unit 103, and a combination of character extraction (hereinafter referred to as a candidate tree) is created. A candidate tree creation unit 110 to be stored in the tree storage unit, and a result output unit 111 that outputs the best combination of segments that are the result of extraction and recognition from the candidate tree storage unit are provided.

【0017】〈確度フラグセット部〉次に、確度フラグ
セット部106の構成について説明する。図3は、具体
例1の確度フラグセット部ブロック図である。確度フラ
グセット部106は、1次・2次セグメント情報格納部
102から1次セグメント情報を取得するためのセグメ
ントA取得部800とセグメントB取得部801と、上
記取得した1次セグメントAと1次セグメントBとの間
のスペース幅を計算するためのスペース幅計算部802
と、計算結果であるスペース幅値を一時的に格納するた
めのスペース幅格納部803を備える。
<Probability Flag Set Unit> Next, the configuration of the accuracy flag set unit 106 will be described. FIG. 3 is a block diagram of the certainty flag setting unit according to the first embodiment. The accuracy flag set unit 106 includes a segment A acquisition unit 800 and a segment B acquisition unit 801 for acquiring primary segment information from the primary / secondary segment information storage unit 102, and the acquired primary segment A and primary Space width calculation unit 802 for calculating the space width between segment B
And a space width storage unit 803 for temporarily storing a space width value as a calculation result.

【0018】また、確度フラグをセットするか否かの基
準となる閾値を格納するためのスペース幅閾値格納部8
05と、上記スペース幅格納部に格納されたスペース幅
値と上記スペース幅閾値格納部に格納された閾値を参照
し、確度フラグをセットするか否かを決定するためのフ
ラグセット判定部804と、確度フラグセット時に当該
セグメントに確度フラグをセットするためのセグメント
設定部806を備える。上記の各機能ブロックは、制御
部100と接続されている。
Further, a space width threshold value storage unit 8 for storing a threshold value as a reference for determining whether or not to set the accuracy flag.
A flag set determining unit 804 for determining whether or not to set an accuracy flag by referring to the space width value stored in the space width storage unit and the threshold value stored in the space width threshold value storage unit; And a segment setting unit 806 for setting a certainty flag in the segment when setting a certainty flag. Each of the above functional blocks is connected to the control unit 100.

【0019】〈2次セグメント作成部〉図4は、具体例
1の2次セグメント作成部のブロック図である。2次セ
グメントは、複数の隣り合う1次セグメントを1つに統
合してできるセグメントである。図の2次セグメントの
作成部は、1次・2次セグメント情報格納部102から
1次セグメントAの情報を取得するための1次セグメン
トA情報取得部1000と、同じく1次セグメントB情
報取得部1001と、その両セグメント情報を一時的に
格納しておくための1次セグメントA情報格納部100
2と1次セグメントB情報格納部1003を備える。
<Secondary Segment Creation Unit> FIG. 4 is a block diagram of the secondary segment creation unit according to the first embodiment. The secondary segment is a segment formed by integrating a plurality of adjacent primary segments into one. A primary segment A information acquiring unit 1000 for acquiring primary segment A information from the primary / secondary segment information storage unit 102, and a primary segment B information acquiring unit similarly 1001 and a primary segment A information storage unit 100 for temporarily storing both segment information.
2 and a primary segment B information storage unit 1003.

【0020】また、上記1次セグメントAと左端点を同
じくする統合セグメントを格納するための統合セグメン
ト情報格納部1004と、統合セグメントの右端点に確
度フラグがセットされているかを検査するための確度フ
ラグ検査部1005と、セグメントの統合の可能性判定
に使う距離閾値を、予め格納しておくための統合閾値条
件格納部1006と、該閾値格納部に格納されている閾
値と統合セグメントと1次セグメントBとの距離Dとに
基づいて統合可能性を判定するための統合可能性判定部
1007とを備える。
An integrated segment information storage unit 1004 for storing an integrated segment having the same left end point as that of the primary segment A, and an accuracy for checking whether an accuracy flag is set at the right end of the integrated segment. A flag inspection unit 1005, an integrated threshold condition storage unit 1006 for storing in advance a distance threshold used for determining the possibility of segment integration, a threshold stored in the threshold storage unit, an integrated segment, and a primary An integration possibility determination unit 1007 for determining integration possibility based on the distance D to the segment B.

【0021】さらに、上記統合可能性判定部1007の
結果に基づいて、統合セグメントと1次セグメントBを
統合して統合セグメントを作成し、該統合セグメントを
2次セグメントとして、1次・2次セグメント情報格納
部102に格納するためのセグメント統合部1008を
備える。
Further, based on the result of the integration possibility determination section 1007, the integrated segment and the primary segment B are integrated to create an integrated segment, and the integrated segment is defined as a secondary segment, and the primary and secondary segments A segment integration unit 1008 for storing the information in the information storage unit 102 is provided.

【0022】〈候補木作成部〉図5は、具体例1の候補
木作成部ブロック図である。図の候補木作成部110
は、候補木を作成するのに必要な節をキューとして格納
するための候補節キュー格納部1204と、候補木に追
加するために1次・2次セグメント情報格納部102か
ら1次セグメントあるいは2次セグメントの情報を取得
するための1次・2次セグメント情報取得部1200
と、上記1次・2次セグメント情報格納部102で取得
したセグメント情報を候補木に追加するための候補木追
加部1201を備える。
<Candidate Tree Creation Unit> FIG. 5 is a block diagram of the candidate tree creation unit according to the first embodiment. Figure candidate tree creation unit 110
Are stored in a candidate node queue storage unit 1204 for storing a node necessary for creating a candidate tree as a queue, and a primary segment or a secondary segment information stored in the primary / secondary segment information storage unit 102 for addition to the candidate tree. Primary / secondary segment information acquisition section 1200 for acquiring information on the next segment
And a candidate tree adding unit 1201 for adding the segment information acquired by the primary / secondary segment information storage unit 102 to the candidate tree.

【0023】また、上記候補木に追加する際に、親ノー
ドの評価値に上記1次・2次セグメントの評価値を加え
る計算をするための評価値計算部1205と、上記候補
木の節に相当するセグメント情報を候補節キュー格納部
に追加するキュー追加部1202と、逆に、キューから
情報を取得するためのキュー取得部1203を備える。
Also, when adding to the candidate tree, an evaluation value calculation unit 1205 for calculating the addition of the evaluation values of the primary and secondary segments to the evaluation value of the parent node, A queue adding unit 1202 for adding the corresponding segment information to the candidate clause queue storage unit, and conversely, a queue acquiring unit 1203 for acquiring information from the queue.

【0024】〈全体処理〉図6には、この装置全体の動
作フローチャートを示す。この動作は、図の開始の位置
から処理が始まり、一連の処理を行い、終了の位置で終
わる。 (1)ステップS1.始めに処理対象の画像を入力する。
ここで入力される画像は、文字が行一列に並んだ状態の
画像を指し、一般に「行画像」と言われる画像である。
この行画像を読み取り、図1に示す画像格納部101へ
格納することを行う。
<Overall Processing> FIG. 6 is a flowchart showing the operation of the entire apparatus. This operation starts from the start position in the figure, performs a series of processes, and ends at the end position. (1) Step S1. First, an image to be processed is input.
The image input here refers to an image in which characters are arranged in a line, and is an image generally called a “line image”.
This line image is read and stored in the image storage unit 101 shown in FIG.

【0025】(2)ステップS2.次に1次セグメント抽
出処理を行う。この1次セグメント抽出処理は、従来か
らよく知られるヒストグラムを利用する方法で容易に実
現が可能である。図7(a)には、1次セグメント抽出
の例説明図を示す。具体的には、この図7(a)に示す
ように、文字の並びに垂直の方向に黒点のヒストグラム
KV(以下、垂直方向ヒストグラム)を計算する。次
に、上記抽出した垂直方向ヒストグラムをその横軸に沿
って走査し、ある閾値以上の値が連続する範囲を抽出す
る。
(2) Step S2. Next, a primary segment extraction process is performed. This primary segment extraction processing can be easily realized by a method using a well-known histogram. FIG. 7A illustrates an example of primary segment extraction. Specifically, as shown in FIG. 7A, a black point histogram KV (hereinafter, a vertical direction histogram) is calculated in the vertical direction of the character sequence. Next, the extracted vertical direction histogram is scanned along the horizontal axis to extract a range in which values equal to or greater than a certain threshold value are continuous.

【0026】これにより、水平方向の第1次セグメント
の切出し候補位置が求められる。さらに、上記抽出した
水平方向の切出し点の組について、水平方向のヒストグ
ラムKH(以下、水平方向ヒストグラム)を計算し、垂
直方向の切出し候補位置を求める。例えば図の左端の1
次セグメントについては、図中に示した下向きと横向き
の矢印が切出し候補位置になる。次に当該1次セグメン
トの幅Wと高さHとその比率ρ(以下縦横比とする)を
計算し、この情報と共に、上記抽出された1次セグメン
トを図1に示した1次・2次セグメント情報格納部10
2に格納する。
As a result, a candidate position for cutting out the primary segment in the horizontal direction is obtained. Further, a horizontal direction histogram KH (hereinafter, horizontal direction histogram) is calculated for the extracted set of horizontal cutout points, and a vertical cutout candidate position is obtained. For example, 1 at the left end of the figure
For the next segment, the downward and sideward arrows shown in the figure are the extraction candidate positions. Next, the width W and height H of the primary segment and its ratio ρ (hereinafter referred to as aspect ratio) are calculated, and together with this information, the extracted primary segment is converted into the primary / secondary shown in FIG. Segment information storage unit 10
2 is stored.

【0027】(3)ステップS3.次に確度フラグセット
処理をする。図7(b)には、確度フラグのセット例説
明図を示す。その具体的な構成と処理方法については後
述することとし、ここでは確度フラグについて説明す
る。確度フラグは、文字の右端位置となる可能性を示す
度合いを表すものであり、1次セグメントに確度フラグ
がセットされれば、「該1次セグメントの右端点が文字
の右端点になる」ことを意味している。
(3) Step S3. Next, a certainty flag setting process is performed. FIG. 7B illustrates an example of setting the accuracy flag. The specific configuration and processing method will be described later, and here, the accuracy flag will be described. The accuracy flag indicates the degree of possibility that the character will be at the right end position of the character. If the accuracy flag is set in the primary segment, "the right end point of the primary segment becomes the right end point of the character" Means

【0028】換言すれば、確度フラグは、互いに隣接す
る文字の境目にある1次セグメントや2次セグメント
を、その他のセグメントと区別するための情報である。
この確度フラグを1次セグメント(1次セグメントが組
み合わされて2次セグメントになったときはその2次セ
グメント)に対してセットすることで、次のステップで
作成される2次セグメントの数を抑えることができる。
さらに、この2次セグメントの数を抑えることが、後述
する候補木の大きさも抑えることになり、全体として計
算量を抑えた処理を実現することができる。
In other words, the accuracy flag is information for distinguishing a primary segment or a secondary segment at a boundary between adjacent characters from other segments.
By setting this accuracy flag for the primary segment (or the secondary segment when the primary segment is combined into a secondary segment), the number of secondary segments created in the next step is suppressed. be able to.
Furthermore, reducing the number of secondary segments also reduces the size of the candidate tree described later, and can realize processing with a reduced amount of calculation as a whole.

【0029】なお、セグメントの確度フラグをセットす
れば、互いに隣接する2つの1次セグメント間に文字の
境界を挟むという情報が付加される。これは、隣接する
1次セグメントのうちのいずれか一方の1次セグメント
に付加すればよく、また、両方に付加しても差し支えな
い。またあるいは、そのほかの1次セグメントに、上記
境界に接したセグメントでないという情報を付加するよ
うにして、間接表示をしてもよい。
If the segment accuracy flag is set, information that a character boundary is sandwiched between two adjacent primary segments is added. This may be added to any one of the adjacent primary segments, or may be added to both. Alternatively, indirect display may be performed by adding information indicating that the segment does not touch the boundary to the other primary segments.

【0030】(4)ステップS4.次に2次セグメントの
作成処理を行う。図8には、2次セグメントの作成例説
明図を示す。具体的な構成と処理方法については後述す
ることとし、ここでは、簡単に処理の説明をする。上記
抽出した1次セグメント(以下1次セグメントAと呼
ぶ)を左端から走査し、隣接する他の1次セグメント
(以下1次セグメントBと呼ぶ)と統合し、新規セグメ
ントである2次セグメントを作成する。図8中の矩形枠
に囲まれた部分が2次セグメントである。このとき、当
該1次セグメントAに確度フラグがセットされている場
合は、2次セグメントを作成しない。この処理により、
作成する2次セグメントの数を抑えている。作成した2
次セグメントは、図1に示す1次・2次セグメント情報
格納部102に格納する。
(4) Step S4. Next, secondary segment creation processing is performed. FIG. 8 is a diagram illustrating an example of creating a secondary segment. The specific configuration and processing method will be described later, and the processing will be briefly described here. The extracted primary segment (hereinafter referred to as primary segment A) is scanned from the left end, and integrated with another adjacent primary segment (hereinafter referred to as primary segment B) to create a new secondary segment, a secondary segment. I do. The portion surrounded by the rectangular frame in FIG. 8 is the secondary segment. At this time, if the accuracy flag is set for the primary segment A, no secondary segment is created. With this process,
The number of secondary segments to be created is reduced. Created 2
The next segment is stored in the primary / secondary segment information storage unit 102 shown in FIG.

【0031】(5)ステップS5.次に文字パタン切出し
処理を行う。上記作成した1次セグメント、及び、2次
セグメントの座標情報から、セグメント枠で囲まれる領
域の画像を、当該セグメントの文字パタンとして抽出
し、これを図1に示す文字情報格納部103に格納す
る。
(5) Step S5. Next, character pattern cutout processing is performed. From the coordinate information of the primary segment and the secondary segment created as described above, an image of an area surrounded by a segment frame is extracted as a character pattern of the segment and stored in the character information storage unit 103 shown in FIG. .

【0032】(6)ステップS6.次に文字認識処理を行
う。この文字認識処理は、文字情報格納部103から文
字パタン情報を読み取り、そのパタンを文字として認識
を行う。認識の結果である文字コードの確信度Riは上
位K個(本具体例ではK=1としている)を、対応する
セグメントの文字情報として、再び文字情報格納部10
3に格納する。
(6) Step S6. Next, character recognition processing is performed. In this character recognition process, character pattern information is read from the character information storage unit 103, and the pattern is recognized as a character. As for the certainty factor Ri of the character code as a result of the recognition, the top K (K = 1 in this specific example) is again used as the character information of the corresponding segment, and the character information storage unit 10
3 is stored.

【0033】(7)ステップS7.次に候補木作成処理を
行う。図9には、比較例の候補木説明図を示す。また、
図10には、具体例1の候補木説明図を示す。具体的な
作成処理については、後述することとして、ここでは候
補木について説明する。候補木は、1次セグメント及び
2次セグメントの組合せからなる並びであり、上記入力
した文字列画像の複数の切出し方を表現している。図9
は確度フラグを使用しないときの従来方法を採用した候
補木を示し、図10は確度フラグを使用したときの具体
例1の候補木を示している。候補木の左端の黒丸点(●
印)から順に矢印を辿り、右端のセグメントまで達する
道筋が、入力画像の複数考えられる切出し方の中の1つ
である。
(7) Step S7. Next, candidate tree creation processing is performed. FIG. 9 shows a candidate tree explanatory diagram of the comparative example. Also,
FIG. 10 illustrates a candidate tree explanatory diagram of the first specific example. The specific creation processing will be described later, and here, the candidate tree will be described. The candidate tree is a row composed of a combination of a primary segment and a secondary segment, and expresses a plurality of cutout methods of the input character string image. FIG.
Shows a candidate tree adopting the conventional method when the certainty flag is not used, and FIG. 10 shows a candidate tree of the first specific example when the certainty flag is used. The black dot on the left end of the candidate tree (●
The path from the mark to the rightmost segment is one of a plurality of possible extraction methods of the input image.

【0034】図9や図10に示す候補木には左端に根が
あり、そこから右へ向かって枝が伸びているのがわか
る。つまり、図9の例の場合には、7本、図10の例の
場合には、4本分の切出し方が候補として挙がったこと
になる。また、各ノードに描いた2次セグメントの下の
文字と数値は、それぞれそのセグメントの認識結果と評
価値である。評価値は大きいほど良い評価であることを
意味する。なお、本具体例では、縦横比と認識結果を利
用した評価値となっている。
It can be seen that the candidate tree shown in FIGS. 9 and 10 has a root at the left end, and a branch extends from there to the right. In other words, in the case of the example of FIG. 9, seven pieces are cut out, and in the case of the example of FIG. 10, four pieces are cut out as candidates. The characters and numerical values below the secondary segment drawn on each node are the recognition result and the evaluation value of that segment, respectively. The larger the evaluation value, the better the evaluation. In this specific example, the evaluation value is an evaluation value using the aspect ratio and the recognition result.

【0035】(8)ステップS8.最後に結果出力処理を
行う。上記作成された候補木の中から、最大の評価値を
持つ枝を、最終結果として出力する。図10の具体例の
場合は、一番下の枝が最終結果であり、その認識結果は
“品川区”である。
(8) Step S8. Finally, a result output process is performed. The branch having the largest evaluation value is output as the final result from the created candidate trees. In the case of the specific example of FIG. 10, the bottom branch is the final result, and the recognition result is “Shinagawa-ku”.

【0036】〈確度フラグセット部〉ここでは、図6に
示した全体処理のステップS3で説明した確度フラグの
処理について説明する。図11に具体例1の確度フラグ
セット処理フローチャートを示す。これは、図7を参照
しながら説明する。 (1)ステップS11.先ず最左端の1次セグメントを1
次セグメントAとし、当該1次セグメントAの情報を取
得する。 (2)ステップS12.当該1次セグメントAの右隣に1
次セグメントが存在するか判断する。 (3)ステップS13.もし存在するならば、当該1次セ
グメントAの右隣にある1次セグメントを1次セグメン
トBとし、その情報を取得する。そうでなければ、「O
UT」に進み処理を終了する。
<Probability Flag Set Unit> Here, the process of the probability flag described in step S3 of the overall process shown in FIG. 6 will be described. FIG. 11 shows a flowchart of the accuracy flag setting process according to the first embodiment. This will be described with reference to FIG. (1) Step S11. First, set the leftmost primary segment to 1
As the next segment A, information on the primary segment A is obtained. (2) Step S12. 1 to the right of the primary segment A
Determine whether the next segment exists. (3) Step S13. If there is, the primary segment on the right of the primary segment A is set as the primary segment B, and the information is acquired. Otherwise, "O
UT "and the process ends.

【0037】(4)ステップS14.当該1次セグメント
Aと当該1次セグメントBの情報から、その間にあるス
ペース幅を計算し、これをspとする。図7(b)に
は、sp0〜sp3までを示した。 (5)ステップS15.上記計算し格納しておいたsp
と、予め用意しておいた閾値THの値を比較する。 (6)ステップS16.比較の結果、spが閾値以上の値
ならば、当該1次セグメントAに確度フラグをセットす
る。該確度フラグにより、当該1次セグメントAの右端
点は、必ず文字の右端点となる。比較の結果、spが閾
値未満の値ならば、何も処理しない。 (7)ステップS17.当該1次セグメントBを1次セグ
メントAとし、ステップS1へ戻る。これで、同様の処
理を更に右側のセグメントについて実行することにな
る。
(4) Step S14. From the information of the primary segment A and the primary segment B, the space width between them is calculated, and this is set to sp. FIG. 7B shows sp0 to sp3. (5) Step S15. Sp calculated and stored above
And the value of the threshold value TH prepared in advance. (6) Step S16. As a result of the comparison, if sp is equal to or larger than the threshold value, the accuracy flag is set in the primary segment A. By the accuracy flag, the right end point of the primary segment A is always the right end point of the character. As a result of the comparison, if sp is less than the threshold value, no processing is performed. (7) Step S17. The primary segment B is set as the primary segment A, and the process returns to step S1. Thus, the same processing is executed for the further right segment.

【0038】既に説明をした図7(b)において、下向
きの三角形により確度フラグをセットした位置を示す。
この例では2つの位置で確度フラグがセットされてい
る。なお、ステップS5で、用いた閾値THは、行高さ
の0.4倍とした。これは、経験的に求めた値であり、
これに限定されるものではない。
In FIG. 7B which has already been described, the position at which the accuracy flag is set is indicated by a downward triangle.
In this example, accuracy flags are set at two positions. Note that the threshold value TH used in step S5 was set to 0.4 times the row height. This is an empirically determined value,
It is not limited to this.

【0039】〈2次セグメント作成部〉図12に、具体
例1の2次セグメントの作成部フローチャートを示す。 (1)ステップS21.先ず、最左端の1次セグメントを
1次セグメントAとし、当該1次セグメントAの情報を
取得する。 (2)ステップS22.当該1次セグメントAを統合セグ
メントとし、図4の統合セグメント情報格納部1004
に格納する。 (3)ステップS23.当該統合セグメントの右隣に他の
1次セグメントBが存在するかを判断する。NOなら
ば、OUTへ進み、処理を終了する。 (4) ステップS24.YESならば、当該1次セグメン
トBの情報を取得する。
<Secondary Segment Creation Unit> FIG. 12 shows a flowchart of the creation unit of the secondary segment of the first embodiment. (1) Step S21. First, the leftmost primary segment is defined as primary segment A, and information on the primary segment A is acquired. (2) Step S22. The primary segment A is an integrated segment, and the integrated segment information storage unit 1004 in FIG.
To be stored. (3) Step S23. It is determined whether another primary segment B exists on the right of the integrated segment. If NO, proceed to OUT and end the process. (4) Step S24. If YES, the information of the primary segment B is obtained.

【0040】(5)ステップS25.当該統合セグメント
に確度フラグがセットされているかを判断する。 (6)ステップS30.YESならば、当該1次セグメン
トBを1次セグメントAとしてステップS22に戻る。 (7)ステップS26.NOならば、当該統合セグメント
と当該1次セグメントBとの距離Dを計算する。距離と
は、当該1次セグメントBの左端点のX座標から当該統
合セグメントの左端点のX座標の間の差である。なお、
縦書き文字列が対象の場合、当該1次セグメントBの上
端点のY座標から当該統合セグメントの上端点のY座標
の間の距離になる。
(5) Step S25. It is determined whether or not the accuracy flag is set for the integrated segment. (6) Step S30. If YES, the process returns to step S22 with the primary segment B as the primary segment A. (7) Step S26. If NO, the distance D between the integrated segment and the primary segment B is calculated. The distance is a difference between the X coordinate of the left end point of the primary segment B and the X coordinate of the left end point of the integrated segment. In addition,
In the case of a vertically written character string, the distance is the distance between the Y coordinate of the upper end point of the primary segment B and the Y coordinate of the upper end point of the integrated segment.

【0041】(8)ステップS27.上記計算した距離D
は、予め用意された閾値以下か判断する。 (9)ステップS28.YESならば、当該統合セグメン
トと当該1次セグメントBを統合し、新たに統合セグメ
ントとする。このとき、当該1次セグメントBにセット
されている確度フラグも該統合セグメントにセットされ
る。 (10)ステップS29.更に、該統合セグメントを2次セ
グメントとして、1次・2次セグメント情報格納部10
2へ格納し再びステップS23へ戻る。 (11)なお、ステップS27の判断の結果がNOならば、
ステップS30で当該1次セグメントBを1次セグメン
トAとし、ステップS22へ戻る。
(8) Step S27. Distance D calculated above
Is determined to be equal to or less than a prepared threshold. (9) Step S28. If YES, the integrated segment and the primary segment B are integrated to form a new integrated segment. At this time, the accuracy flag set in the primary segment B is also set in the integrated segment. (10) Step S29. Further, the integrated segment is set as a secondary segment, and the primary / secondary segment information storage unit 10 is used.
2 and return to step S23 again. (11) If the result of the determination in step S27 is NO,
In step S30, the primary segment B is set as the primary segment A, and the process returns to step S22.

【0042】既に説明をした図8には、2種類の2次セ
グメントの例を示した。図中、左がこの具体例で確度フ
ラグを利用して作成された2次セグメントであり、右が
確度フラグを使用せずに作成された2次セグメントの例
である。なお、上記ステップS26で用いた距離Dの閾
値THは、行高さの1.2倍とした。この数値は、経験
的に設定したものであり、これに限定されない。以上の
ように、確度フラグに着目して、文字の境目を挟む1次
セグメントの組合せを除外しながら、1次セグメント抽
出部が抽出した互いに隣接する1次セグメントを統合し
て、削減された数の2次セグメントを作成する。
FIG. 8 described above shows an example of two types of secondary segments. In the figure, the left is an example of the secondary segment created using the accuracy flag in this specific example, and the right is an example of the secondary segment created without using the accuracy flag. Note that the threshold value TH of the distance D used in step S26 was 1.2 times the row height. This numerical value is set empirically and is not limited to this. As described above, by paying attention to the accuracy flag, the primary segments that are adjacent to each other and extracted by the primary segment extraction unit are integrated while excluding the combination of the primary segments sandwiching the boundary of the character, and the number of reduced primary segments is reduced. Create a secondary segment of

【0043】〈候補木作成部〉次に、図6の全体処理の
ステップS7で簡単に説明した候補木の作成処理につい
て説明する。図13には、具体例1の候補木作成部フロ
ーチャートを示す。 (1)ステップS31.始めに、候補節キューQを空にす
る。これは、キューの初期化を意味する。 (2)ステップS32.次に、最左端に位置する「全ての
1次セグメント、あるいは、2次セグメント」の情報を
候補節キューQに追加する。また、同時に、全ての当該
最左端セグメントを、候補木の根ノードの子ノードとし
て、評価値を計算し、候補木に追加する。なお、評価値
の計算については、後で図14を参照しながら詳しく説
明をする。
<Candidate Tree Creation Unit> Next, the candidate tree creation processing briefly described in step S7 of the overall processing in FIG. 6 will be described. FIG. 13 shows a flowchart of the candidate tree creating unit according to the first embodiment. (1) Step S31. First, the candidate clause queue Q is emptied. This means initialization of the queue. (2) Step S32. Next, information on “all primary segments or secondary segments” located at the leftmost end is added to the candidate node queue Q. At the same time, evaluation values are calculated for all the leftmost segments as child nodes of the root node of the candidate tree, and are added to the candidate tree. The calculation of the evaluation value will be described later in detail with reference to FIG.

【0044】(3)ステップS33.候補節キューQは空
かどうかを判断する。YESならば、処理を終了するた
めにOUTへ進む。 (4)ステップS34.NOならば、候補節キューQの先
頭要素の1次セグメント、あるいは、2次セグメントの
情報を取得し、当該セグメントを親ノードPとする。
(3) Step S33. It is determined whether the candidate clause queue Q is empty. If YES, the process proceeds to OUT to end the processing. (4) Step S34. If NO, the primary node or the secondary segment information of the head element of the candidate clause queue Q is obtained, and the segment is set as the parent node P.

【0045】(5)ステップS35.親ノードPの右に隣
接する、全ての1次セグメント、あるいは2次セグメン
トが存在するかどうかを判断する。NOならば、ステッ
プS33へ戻る。 (6)ステップS36.YESならば、全ての当該右隣接
セグメントを、親ノードPの子ノードとして、評価値を
計算し、候補木に追加する。 (7)ステップS37.全ての当該右隣接セグメントを、
候補節キューQに追加する。その後ステップS33へ戻
る。
(5) Step S35. It is determined whether all primary segments or secondary segments adjacent to the right of the parent node P exist. If NO, the process returns to step S33. (6) Step S36. If YES, the evaluation value is calculated for all the right adjacent segments as child nodes of the parent node P and added to the candidate tree. (7) Step S37. All relevant right adjacent segments
It is added to the candidate clause queue Q. Thereafter, the process returns to step S33.

【0046】既に説明をした図10において、まず、左
端の根から木の作成を開始し、徐々に木を伸ばしてい
き、最終的に枝が4本の候補木となった。各葉の評価値
を、ノードの2次セグメント下の括弧中に数値で示し
た。この段階で2次セグメントの個数を抑えることで、
後段の候補木のサイズを抑えることができる。
In FIG. 10 which has already been described, a tree is first created from the root at the left end, and the tree is gradually extended, eventually becoming a candidate tree having four branches. The evaluation value of each leaf is shown numerically in parentheses below the secondary segment of the node. By reducing the number of secondary segments at this stage,
The size of the subsequent candidate tree can be reduced.

【0047】〈評価値の計算〉次に、具体例1における
評価値の計算方法について説明する。図14には、評価
値の計算例説明図を示す。まず、次のように評価値を定
義する。 1つのセグメントの評価値=正規化係数nと縦横比ρと
認識結果の確信度Rの積 候補木の根から1つの葉に至る枝の評価値=その枝を構
成するノードの全評価値の和
<Calculation of Evaluation Value> Next, a method of calculating the evaluation value in the specific example 1 will be described. FIG. 14 is a diagram illustrating an example of calculating an evaluation value. First, an evaluation value is defined as follows. Evaluation value of one segment = product of normalization coefficient n, aspect ratio ρ, and certainty factor R of recognition result Evaluation value of branch from root of candidate tree to one leaf = sum of all evaluation values of nodes constituting the branch

【0048】このとき、現在構成中の候補木の各枝の評
価値は、次の手順で容易に計算できる。 (1)ステップS41.始めに親ノードの評価値Vpを取
得する。 (2)ステップS42.追加する子ノード自身の評価値n
×ρ×Rの値を取得する。 (3)ステップS43.親ノードの評価値Vと子ノード自
身の評価値の和(Vp=Vp+n×ρ×R)を計算す
る。 こうして、図の矢印に沿って右に進むように見ていく
と、各ノードの評価値が順に累積された結果となる。
At this time, the evaluation value of each branch of the currently configured candidate tree can be easily calculated by the following procedure. (1) Step S41. First, the evaluation value Vp of the parent node is obtained. (2) Step S42. Evaluation value n of the child node itself to be added
Obtain the value of × ρ × R. (3) Step S43. The sum (Vp = Vp + n × ρ × R) of the evaluation value V of the parent node and the evaluation value of the child node itself is calculated. In this way, when viewed rightward along the arrow in the figure, a result is obtained in which the evaluation values of each node are sequentially accumulated.

【0049】〈具体例1の効果〉従来技術では、1次セ
グメントを組み合わせて2次セグメントを作成する際、
全ての組合せを考慮に入れるため、多くの2次セグメン
トが作られる仕組みとなっていた。更に、それが原因
で、後段で作成される候補木が大きくなり、計算量も膨
大となり、処理速度が低下した。
<Effect of Specific Example 1> In the prior art, when a secondary segment is created by combining primary segments,
Many secondary segments were created to take into account all combinations. Furthermore, due to this, the candidate tree created in the subsequent stage becomes large, the amount of calculation becomes enormous, and the processing speed decreases.

【0050】一方、この具体例に示した確度フラグを導
入すると、2次セグメントの個数を抑えることができる
ので、候補木のサイズを大幅に小さくすることができ、
計算量と処理速度の面で大幅な向上が見られる。また、
確度フラグに基づいて正解枝を確実に残すため、誤切出
しを大幅に減少でき、ひいては認識精度の大幅な向上を
図ることができる。特に、文字間隔を空けて記入された
文字列データでは、非常に大きな効果を示す。
On the other hand, when the accuracy flag shown in this specific example is introduced, the number of secondary segments can be suppressed, so that the size of the candidate tree can be greatly reduced,
Significant improvements are seen in terms of computational complexity and processing speed. Also,
Since the correct answer branch is reliably left based on the accuracy flag, erroneous extraction can be significantly reduced, and the recognition accuracy can be greatly improved. In particular, character string data written with a space between characters has a very large effect.

【0051】例えば図9の比較例と図10の具体例とを
比べてわかるように、確度フラグを使用していない候補
木よりも、確度フラグを使用した候補木のほうが、枝の
数が約半分に減少している。
For example, as can be seen by comparing the comparative example of FIG. 9 with the specific example of FIG. 10, the candidate tree using the certainty flag has a smaller number of branches than the candidate tree not using the certainty flag. It has been reduced by half.

【0052】《具体例2》 〈全体の構成〉具体例2の装置の全体構成は、図1に示
した具体例1と同様である。よって、ここでの説明を省
略する。ただし、この具体例2では、確度フラグセット
部の構成が異なる。
<< Specific Example 2 >><OverallConfiguration> The overall configuration of the device of the specific example 2 is the same as that of the specific example 1 shown in FIG. Therefore, the description here is omitted. However, in the specific example 2, the configuration of the accuracy flag setting unit is different.

【0053】〈確度フラグセット部の構成〉図15に
は、具体例2の確度フラグセット部のブロック図を示
す。図の確度フラグセット部106*は、1次・2次セ
グメント情報格納部102から、1次セグメントを取得
するための1次セグメントA取得部2000と、該取得
した1次セグメントAの幅・高さ・縦横比を計算するた
めのセグメントの幅・高さ・縦横比計算部2002と、
該計算した1次セグメントAの幅・高さ・縦横比を一時
的に格納するための1次セグメントAの幅・高さ・縦横
比格納部2003と、該計算した1次セグメントAの幅
・高さ・縦横比と比較するための閾値を格納しておくた
めのセグメントの高さ・幅・縦横比閾値格納部2004
を備える。
<Structure of Probability Flag Set Unit> FIG. 15 is a block diagram of the accuracy flag set unit according to the second embodiment. The accuracy flag set unit 106 * in the figure includes a primary segment A acquisition unit 2000 for acquiring a primary segment from the primary / secondary segment information storage unit 102, and a width / height of the acquired primary segment A. A width / height / aspect ratio calculating unit 2002 for calculating a height / aspect ratio;
A width / height / aspect ratio storage unit 2003 for temporarily storing the calculated width / height / aspect ratio of the primary segment A, and a width / height / width ratio of the calculated primary segment A Segment height / width / aspect ratio threshold storage unit 2004 for storing a threshold for comparison with the height / aspect ratio
Is provided.

【0054】また、上記計算した1次セグメントAの幅
・高さ・縦横比と、対応する閾値とを比較し、当該1次
セグメントAに確度フラグをセットするかどうかを判定
するためのフラグセット判定部2005と、上記判定の
結果、確度フラグを設定するための1次セグメントA設
定部2006を備える。さらに、確度フラグセット部
は、上記フラグセット判定部2005にて、フラグセッ
トされた1次セグメントAの左に隣接する他の1次セグ
メントを1次セグメントBとして取得するための1次セ
グメントB取得部2001と、上記取得した1次セグメ
ントBに確度フラグをセットするための1次セグメント
B設定部2007を備える。
A flag set for comparing the calculated width / height / aspect ratio of the primary segment A with a corresponding threshold value and determining whether or not to set the accuracy flag for the primary segment A A determination unit 2005 and a primary segment A setting unit 2006 for setting an accuracy flag as a result of the determination are provided. Further, the accuracy flag set unit obtains a primary segment B for obtaining, as the primary segment B, another primary segment adjacent to the left of the flag-set primary segment A in the flag set determination unit 2005. And a primary segment B setting unit 2007 for setting a certainty flag in the acquired primary segment B.

【0055】〈全体の処理〉全体の処理手順は、確度フ
ラグセット部106*の処理を除いて、具体例1と同じ
である。よって、確度フラグセット部の処理以外は、図
6を参照して説明をする。 (1)ステップS1.まず、処理対象となる画像を入力す
る。ここで入力される画像は、具体例1の場合と同様
に、文字が行一列に並んだ状態の画像を指し、一般に行
画像といわれる画像である。この行画像を読み取り、画
像格納部へ格納することを行う。
<Overall Processing> The overall processing procedure is the same as that of the first embodiment, except for the processing of the accuracy flag setting unit 106 *. Therefore, description will be made with reference to FIG. 6 except for the processing of the accuracy flag setting unit. (1) Step S1. First, an image to be processed is input. The image input here refers to an image in which characters are arranged in a line, as in the case of the specific example 1, and is an image generally called a line image. This line image is read and stored in the image storage unit.

【0056】(2)ステップS2.次に、1次セグメント
抽出の処理を行う。この1次セグメント抽出処理も、具
体例1で説明した方法と同様である。図16(a)に、
具体例2のデータに対する1次セグメント抽出の例説明
図を示した。図の「純一郎」という文字パタンの上に重
ねて描かれた矩形枠が1次セグメントである。また、抽
出した1次セグメントの幅Wと高さHとその比率ρ(以
下縦横比とする)を計算し、この情報と共に、上記抽出
された1次セグメントを1次・2次セグメント情報格納
部に格納する。この情報は、後段の処理で使用する情報
である。
(2) Step S2. Next, a primary segment extraction process is performed. This primary segment extraction process is the same as the method described in the first embodiment. In FIG. 16A,
An example explanatory diagram of the primary segment extraction for the data of the specific example 2 is shown. A rectangular frame drawn over the character pattern "Junichiro" in the figure is the primary segment. Also, the width W and height H of the extracted primary segment and its ratio ρ (hereinafter, referred to as aspect ratio) are calculated, and together with this information, the extracted primary segment is stored in a primary / secondary segment information storage unit. To be stored. This information is information used in the subsequent processing.

【0057】(3)ステップS3.次に、確度フラグセッ
トの処理をする。具体的な処理方法については後述す
る。 (4)ステップS4.次に、2次セグメントの作成処理を
行う。具体例2では、具体例1で説明した方法と同じ処
理を行う。図16(b)と(c)にその例を示した。
(3) Step S3. Next, the processing of the accuracy flag set is performed. A specific processing method will be described later. (4) Step S4. Next, a secondary segment creation process is performed. In the specific example 2, the same processing as the method described in the specific example 1 is performed. FIGS. 16B and 16C show examples.

【0058】また、図17には、確度フラグをセットす
る条件を示す。さらに、図18には、2次セグメントの
作成例を示した。図の例では、確度フラグが「一」の文
字の前後にセットされているため、図18(a)に示す
ような2つの2次セグメントが作成され、図18(b)
に示すような確度フラグを中間に含めた2次セグメント
は作成されない。
FIG. 17 shows conditions for setting the accuracy flag. FIG. 18 shows an example of creating a secondary segment. In the example of the figure, since the accuracy flag is set before and after the character of "1", two secondary segments as shown in FIG.
The secondary segment including the certainty flag in the middle is not created.

【0059】(5)ステップS5.次に、文字パタン切出
し処理を行う。上記作成した1次セグメント、及び、2
次セグメントの座標情報から、セグメント枠で囲まれる
領域の画像を、当該セグメントの文字パタンとして抽出
し、これを文字情報格納部に格納する。 (6)ステップS6.次に、文字認識処理を行う。この文
字認識処理は、文字情報格納部から文字パタン情報を読
み取り、そのパタンを文字として認識を行う。認識の結
果である文字コードの確信度Riは上位K個(本具体例
ではK=1としている)を、対応するセグメントの文字
情報として、文字情報格納部に格納する。
(5) Step S5. Next, a character pattern cutout process is performed. Primary segment created above, and 2
From the coordinate information of the next segment, an image of the area surrounded by the segment frame is extracted as a character pattern of the segment, and stored in the character information storage unit. (6) Step S6. Next, character recognition processing is performed. In this character recognition process, character pattern information is read from the character information storage unit, and the pattern is recognized as a character. As the certainty factor Ri of the character code as a result of the recognition, the upper K (K = 1 in this specific example) is stored in the character information storage unit as the character information of the corresponding segment.

【0060】(7)ステップS7.次に、候補木作成処理
を行う。具体的な作成処理は、具体例1と同じである。
図19には比較例の候補木、図20には具体例2の候補
木を示す。図19に示す候補木は、確度フラグを導入し
なかったときに作成される候補木であり、図20に示す
候補木は、確度フラグを導入したときに作成される候補
木である。この具体例2では、確度フラグを導入するこ
とで、候補木のサイズを4/9のサイズの抑えることに
成功している。この場合、当然処理速度も向上する。
(7) Step S7. Next, a candidate tree creation process is performed. The specific creation processing is the same as in the first embodiment.
FIG. 19 shows a candidate tree of the comparative example, and FIG. 20 shows a candidate tree of the specific example 2. The candidate tree shown in FIG. 19 is a candidate tree created when the probability flag is not introduced, and the candidate tree shown in FIG. 20 is a candidate tree created when the probability flag is introduced. In the specific example 2, by introducing the accuracy flag, the size of the candidate tree is successfully reduced to 4/9. In this case, the processing speed naturally increases.

【0061】(8)ステップS8.最後に、結果出力処理
を行う。候補木の中から最終結果を求める処理は、具体
例1と同じである。図20に示す例では、一番下の枝が
評価値最大なので、これが最終結果となっている。
(8) Step S8. Finally, a result output process is performed. The process of obtaining the final result from the candidate tree is the same as in the first embodiment. In the example shown in FIG. 20, since the lowest branch has the maximum evaluation value, this is the final result.

【0062】〈確度フラグセット部の処理〉図21は、
具体例2の確度フラグのセット部の処理手順を示すフロ
ーチャートである。 (1)ステップS41.まず、1次セグメントの情報を取
得する。 (2)ステップS42.次に、図17に示したように、当
該1次セグメントの幅Wと高さHと縦横比Rを計算す
る。これらを特徴量とする。
<Process of accuracy flag setting unit> FIG.
13 is a flowchart illustrating a processing procedure of a setting section of a certainty flag according to a second specific example. (1) Step S41. First, information on the primary segment is obtained. (2) Step S42. Next, as shown in FIG. 17, the width W, the height H, and the aspect ratio R of the primary segment are calculated. These are used as feature amounts.

【0063】(3)ステップS43.上記計算した特徴量
が、予め用意した閾値THの範囲内かどうかを判断す
る。図17に示した式を満足するかどうかの判断であ
る。例えばWがTH1とTH2の間になければ、確度フ
ラグはセットされない。HがTH3とTH4の間になけ
れば、確度フラグはセットされない。RがTH5とTH
6の間になければ、確度フラグはセットされない。3つ
全部の式を満足する場合に限り確度フラグをセットす
る。NOならば、何もしないでステップS47に進む。 (4)ステップS44.YESならば、当該1次セグメン
トに確度フラグをセットする。 (5)ステップS45.1次セグメントAの左側の1次セ
グメントBの情報を取得する。
(3) Step S43. It is determined whether the calculated feature amount is within a range of a threshold value TH prepared in advance. This is a determination as to whether or not the expression shown in FIG. 17 is satisfied. For example, if W is not between TH1 and TH2, the accuracy flag is not set. If H is not between TH3 and TH4, the accuracy flag is not set. R is TH5 and TH
If not, the accuracy flag is not set. The accuracy flag is set only when all three expressions are satisfied. If NO, the process proceeds to step S47 without doing anything. (4) Step S44. If YES, a probability flag is set in the primary segment. (5) Step S45. The information of the primary segment B on the left side of the primary segment A is obtained.

【0064】(6)ステップS46.1次セグメントBに
確度フラグをセットする。 (7)ステップS47.当該1次セグメントの右に他の1
次セグメントがあるかどうかを判断する。YESなら
ば、ステップS41へ戻り、NOならば、OUTへ進み
処理を終了する。
(6) Step S46. A probability flag is set in the primary segment B. (7) Step S47. Another one to the right of the primary segment
Determine if there is a next segment. If YES, the process returns to step S41, and if NO, the process proceeds to OUT and the process ends.

【0065】この具体例2では、図16に示す例では、
1次セグメントに対して、確度フラグをセットしてい
る。「一」の前後に確度フラグがセットされている理由
は、予め「一」という文字の特徴量(幅、高さ、縦横
比)の値の範囲を統計的に求めておき、図17の確度フ
ラグセットの条件にあるTH1からTH6の形で用意し
ておいたからである。このように、特徴量の閾値は、特
定の形状をした文字について、妥当な大きさや形状判断
をするための経験的な値として用意する。従って、特徴
量の閾値は、判定が可能な限り、何組用意されてもよ
い。
In the specific example 2, in the example shown in FIG.
The accuracy flag is set for the primary segment. The reason why the accuracy flag is set before and after “1” is that the range of the value of the characteristic amount (width, height, aspect ratio) of the character “1” is statistically obtained in advance, and the accuracy shown in FIG. This is because they are prepared in the form of TH1 to TH6 in the condition of the flag set. As described above, the threshold value of the feature amount is prepared as an empirical value for determining a proper size and shape of a character having a specific shape. Therefore, any number of sets of threshold values of the feature amount may be prepared as long as the determination is possible.

【0066】〈具体例2の効果〉予め確度フラグを設定
するための特徴量の閾値を用意することで、2次セグメ
ントの作成個数を抑えることができ、後段の候補木のサ
イズを抑えることができる。これにより、計算量と処理
速度、及び、処理時間を大幅に抑えることができ、従来
問題を解決することができる。特に、この具体例2で示
した確度フラグの計算方法では、横棒の形状をしている
文字(具体例に示した漢数字の一、英字のハイフォン)
等は、隣接文字と接近している場合でも、独立した一つ
の文字であると断定できるため、非常に大きな効果があ
る。この効果は、図19と図20で示したように、候補
木のサイズが確度フラグ未使用時に対して45%まで減
少していることからも理解できる。
<Effect of Specific Example 2> By preparing a threshold value of the feature amount for setting the accuracy flag in advance, the number of secondary segments to be created can be reduced, and the size of the subsequent candidate tree can be reduced. it can. As a result, the amount of calculation, the processing speed, and the processing time can be significantly reduced, and the conventional problem can be solved. In particular, in the calculation method of the accuracy flag shown in the specific example 2, the character having the shape of a horizontal bar (one of the kanji numerals shown in the specific example, an alphabetic hyphen)
Are very independent because they can be determined to be one independent character even when they are close to adjacent characters. This effect can also be understood from the fact that the size of the candidate tree is reduced to 45% of that when the accuracy flag is not used, as shown in FIGS. 19 and 20.

【0067】《具体例3》 〈全体の構成〉図22に、具体例3の装置全体のブロッ
ク図を示す。この具体例3の装置は、具体例1や2の装
置の構成とほぼ同じであるが、確度フラグセット部22
06と文字情報格納部2203の関係が異なっている。
この図を用いて、本具体例の構成を説明する。
<< Embodiment 3 >><OverallConfiguration> FIG. 22 is a block diagram of the entire apparatus of Embodiment 3. The device of the third embodiment is substantially the same as the configuration of the device of the first or second embodiment.
06 and the character information storage unit 2203 are different.
The configuration of this example will be described with reference to FIG.

【0068】この装置は、全体の処理の制御を司る制御
部2200と、入力画像を格納する画像格納部220
1、文字の中間情報である1次セグメントと2次セグメ
ントを一時格納する第1次・第2次セグメント情報格納
部2202、文字画像とその認識結果である文字コード
を一時格納するための文字情報格納部2203と、1次
セグメントと2次セグメントの組合せを候補木として格
納する候補木格納部2204とを備える。
This apparatus comprises a control unit 2200 for controlling the entire processing and an image storage unit 220 for storing the input image.
1. A primary / secondary segment information storage unit 2202 for temporarily storing primary and secondary segments as intermediate information of characters, character information for temporarily storing a character image and a character code as a recognition result thereof The storage unit includes a storage unit 2203 and a candidate tree storage unit 2204 that stores a combination of a primary segment and a secondary segment as a candidate tree.

【0069】また、画像格納部から入力画像を読み取
り、1次セグメントを抽出し、1次・2次セグメント情
報格納部に、当該1次セグメント情報を格納する第1次
セグメント抽出部2205と、1次・2次セグメント情
報格納部から、上記格納された1次セグメント情報を読
み取り確度フラグをセットする確度フラグセット部22
06と、具体例1と同じく1次・2次セグメント情報格
納部から1次セグメント情報を読み取り、当該1次セグ
メントと当該1次セグメントに隣接する他の1次セグメ
ントとの距離が予め用意された条件を満足する場合は、
当該1次セグメントと当該隣接1次セグメントとを統合
し、2次セグメントにし、当該2次セグメントを1次・
2次セグメント情報格納部に記録する第2次セグメント
作成部2207を備える。
A primary segment extraction unit 2205 that reads an input image from the image storage unit, extracts a primary segment, and stores the primary segment information in a primary / secondary segment information storage unit. A certainty flag setting unit 22 that reads the stored primary segment information from the next / secondary segment information storage unit and sets a certainty flag.
06, the primary segment information is read from the primary / secondary segment information storage unit as in the first embodiment, and the distance between the primary segment and another primary segment adjacent to the primary segment is prepared in advance. If you meet the conditions,
The primary segment and the adjacent primary segment are integrated into a secondary segment.
A secondary segment creation unit 2207 for recording in the secondary segment information storage unit is provided.

【0070】さらに、上記1次・2次セグメント情報格
納部から1次セグメント情報と2次セグメント情報を読
み取り、対応する座標にある画像を、上記画像格納部か
ら読み取り、当該切り出した画像をセグメントで囲われ
た文字パタンとして、文字情報格納部に格納する文字パ
タン切出し部2208と、上記文字情報格納部から上記
切り出した文字パタンを文字認識し、認識結果である文
字コードの上位第K位までを文字情報格納部に格納する
文字認識部2209とを備える。
Further, the primary segment information and the secondary segment information are read from the primary / secondary segment information storage unit, the image at the corresponding coordinates is read from the image storage unit, and the cut out image is segmented. As the enclosed character pattern, a character pattern cutout unit 2208 stored in the character information storage unit and the character pattern cut out from the character information storage unit are subjected to character recognition, and the uppermost K-th character code as a recognition result is displayed. A character recognition unit 2209 for storing the character information in the character information storage unit.

【0071】また、上記1次・2次セグメント情報格納
部からセグメント情報を、上記文字情報格納部から文字
情報を読み取り、文字切出しの組合せ(以下候補木とす
る)を作成し、これを候補木格納部に格納する候補木作
成部2210と、上記候補木格納部から最良の切出し・
認識結果であるセグメントの組合せを出力する結果出力
部2211を備える。
The segment information is read from the primary / secondary segment information storage unit, the character information is read from the character information storage unit, and a combination of character extraction (hereinafter referred to as a candidate tree) is created. A candidate tree creating unit 2210 to be stored in the storage unit;
A result output unit 2211 for outputting a combination of segments as a recognition result is provided.

【0072】〈確度フラグセット部〉図23に、具体例
3の確度フラグセット部のブロック図を示す。この図に
より、具体例3の確度フラグセット部の構成について説
明する。この確度フラグセット部は、1次・2次セグメ
ント情報格納部から1次セグメント情報を取得するため
の1次セグメント取得部2800と該1次セグメントに
対応する文字情報を取得するための文字情報取得部28
01と、該取得した1次セグメントの文字情報を一時的
に格納するためのセグメントの文字コード情報格納部2
802と確度フラグのセットできる文字コードを格納す
るための確度フラグのセットできる文字コード格納部2
803を備える。
<Accuracy Flag Set Unit> FIG. 23 is a block diagram of the accuracy flag set unit according to the third embodiment. With reference to this figure, the configuration of the accuracy flag setting unit of the third embodiment will be described. The certainty flag set unit includes a primary segment acquisition unit 2800 for acquiring primary segment information from the primary / secondary segment information storage unit and a character information acquisition unit for acquiring character information corresponding to the primary segment. Part 28
01, and a segment character code information storage unit 2 for temporarily storing the acquired primary segment character information.
802 and a character code storage unit 2 that can set a certainty flag for storing a character code that can set a certainty flag
803.

【0073】また、上記文字コードを比較し、確度フラ
グをセットするかどうかを判定するための確度フラグセ
ット判定部2804と、該判定部の結果に基づいてフラ
グを設定するための1次セグメント設定部2805を備
える。
Also, a certainty flag set determining unit 2804 for comparing the character codes and determining whether to set the certainty flag, and a primary segment setting for setting the flag based on the result of the determining unit. A section 2805 is provided.

【0074】〈全体の動作の説明〉具体例3における装
置の動作手順は、具体例1や具体例2とほぼ同じであ
る。異なる点は、2点あり、確度フラグセット部の処理
と、全体処理の中で認識処理を行う位置である。よっ
て、以下では、全体処理と確度フラグ処理について説明
をし、それ以外の処理については、具体例1と同じとす
る。
<Explanation of Overall Operation> The operation procedure of the apparatus in the embodiment 3 is almost the same as that of the embodiment 1 and the embodiment 2. There are two different points, that is, the processing of the accuracy flag setting unit and the position where the recognition processing is performed in the overall processing. Therefore, the entire process and the accuracy flag process will be described below, and the other processes will be the same as in the first embodiment.

【0075】図24は、具体例3の装置の全体処理フロ
ーチャートを示す。図の開始の位置から処理が始まり、
一連の処理を行い、終了の位置で終わる。 (1)ステップS51.先ず処理対象の画像を入力する。
ここで入力される画像は、具体例1や2と同様に、文字
が行一列に並んだ状態の画像を指し、一般に行画像とい
われる画像である。この行画像を読み取り、画像格納部
へ格納することを行う。 (2)ステップS52.次に、1次セグメント抽出処理を
行う。この1次セグメント抽出処理は、従来からよく知
られるヒストグラムを利用する方法で容易に実現が可能
である。
FIG. 24 is a flowchart showing the entire processing of the apparatus of the third embodiment. Processing starts at the start of the figure,
A series of processing is performed and ends at the end position. (1) Step S51. First, an image to be processed is input.
The image input here refers to an image in which characters are arranged in a line, as in the specific examples 1 and 2, and is an image generally called a line image. This line image is read and stored in the image storage unit. (2) Step S52. Next, a primary segment extraction process is performed. This primary segment extraction processing can be easily realized by a method using a well-known histogram.

【0076】図25(a)には、1次セグメント抽出の
例説明図を図示した。図のように、「めぐみ」というか
な文字の画像から、5つの1次セグメントが求められた
ことが判る。
FIG. 25A is a diagram for explaining an example of primary segment extraction. As shown in the figure, it can be seen from the image of the character “Megumi” that five primary segments have been obtained.

【0077】(3)ステップS53.次に、1次セグメン
トの文字パタンの切出し処理を行う。上記抽出された1
次セグメントの情報から、対応する座標の画像を切り出
し、文字パタンとし、これを文字情報格納部2203に
格納する。 (4)ステップS54.次に、1次セグメントの文字認識
処理を行う。上記抽出した1次セグメントの文字パタン
を文字認識部2209に渡して、文字認識を行う。K個
の認識結果の文字コードと確信度を文字情報格納部へ格
納する(本具体例ではK=1とした)。
(3) Step S53. Next, the character pattern of the primary segment is cut out. The extracted 1
From the information of the next segment, an image of the corresponding coordinates is cut out and used as a character pattern, which is stored in the character information storage unit 2203. (4) Step S54. Next, a character recognition process for the primary segment is performed. The character pattern of the extracted primary segment is passed to the character recognition unit 2209 to perform character recognition. The character codes and the degrees of certainty of the K recognition results are stored in the character information storage unit (K = 1 in this specific example).

【0078】図25(b)には、1次セグメント認識結
果の例説明図を示す。図のように、左から3番目の1次
セグメントの認識結果を、1位から5位まで(この1次
セグメントでは1位のみ)得る。
FIG. 25 (b) shows an example of the primary segment recognition result. As shown in the figure, the recognition result of the third primary segment from the left is obtained from the first to fifth places (only the first place in this primary segment).

【0079】(5)ステップS55.次に、確度フラグセ
ットの処理をする。この具体例では、具体例1、具体例
2とは異なり、確度フラグを認識結果を元にセットする
処理をしている。具体的な処理は後述する。
(5) Step S55. Next, the processing of the accuracy flag set is performed. In this specific example, unlike the specific examples 1 and 2, processing for setting the accuracy flag based on the recognition result is performed. Specific processing will be described later.

【0080】図26には、確度フラグのセットの例を示
した。この図に示すように、下向きの三角形で示した確
度フラグは、第3番目と第4番目の1次セグメントの間
にセットされている。 (6)ステップS56.次に、2次セグメントの作成処理
を行う。処理手順は、具体例1、具体例2と同じであ
る。
FIG. 26 shows an example of setting the accuracy flag. As shown in this figure, the accuracy flag indicated by a downward-pointing triangle is set between the third and fourth primary segments. (6) Step S56. Next, a secondary segment creation process is performed. The processing procedure is the same as in the first and second examples.

【0081】(7)ステップS57.次に、2次セグメン
トの文字パタンの切出し処理処理を行う。2次セグメン
トの座標情報から、セグメント枠で囲まれる領域の画像
を、当該セグメントの文字パタンとして抽出し、これを
文字情報格納部2203に格納する。 (8)ステップS58.次に、2次セグメントの文字認識
処理を行う。認識結果は、文字情報格納部2203に格
納する。 (9)ステップS59.次に、候補木作成処理を行う。処
理手順は、具体例1、具体例2と全く同じである。
(7) Step S57. Next, a process of extracting a character pattern of the secondary segment is performed. From the coordinate information of the secondary segment, an image of the area surrounded by the segment frame is extracted as a character pattern of the segment, and this is stored in the character information storage unit 2203. (8) Step S58. Next, a character recognition process for the secondary segment is performed. The recognition result is stored in the character information storage unit 2203. (9) Step S59. Next, a candidate tree creation process is performed. The processing procedure is exactly the same as the specific examples 1 and 2.

【0082】図27と図28に、候補木作成結果の例を
示した。図27は、確度フラグなしの場合の候補木作成
結果を示し、図28は、確度フラグありの場合の候補木
作成結果を示す。これらの例から判るように、確度フラ
グを導入すると候補木のサイズが10本から6本に少な
くなっている。 (10)ステップS60.最後に、結果出力処理を行う。上
記作成された候補木の中から、最大の評価値を持つ枝
を、最終結果として出力する。図28の例の場合は、下
から3番目の枝が最終結果であり、その認識結果は“め
ぐみ”である。
FIGS. 27 and 28 show examples of candidate tree creation results. FIG. 27 shows a candidate tree creation result without a certainty flag, and FIG. 28 shows a candidate tree creation result without a certainty flag. As can be seen from these examples, when the accuracy flag is introduced, the size of the candidate tree is reduced from ten to six. (10) Step S60. Finally, a result output process is performed. The branch having the largest evaluation value is output as the final result from the created candidate trees. In the case of the example of FIG. 28, the third branch from the bottom is the final result, and the recognition result is “Megumi”.

【0083】〈確度フラグセット部〉ここでは、具体例
3における確度フラグの処理について説明する。図29
は、具体例3の確度フラグセット部処理フローチャート
を示す。 (1)ステップS61.先ず、最左端の1次セグメントか
ら順に、その情報を取得する。 (2)ステップS62.当該1次セグメントの文字情報を
取得する。 (3)ステップS63.当該文字情報の文字コードと予め
用意しておいた確度フラグを持つ文字コードとを比較す
る。
<Probability Flag Setting Unit> The following describes the processing of the probability flag in the third embodiment. FIG.
9 shows a processing flowchart of the accuracy flag setting unit of the third embodiment. (1) Step S61. First, the information is acquired in order from the leftmost primary segment. (2) Step S62. The character information of the primary segment is obtained. (3) Step S63. The character code of the character information is compared with a character code having a certainty flag prepared in advance.

【0084】(4)ステップS64.上記比較の結果、同
一文字コードであるならば、当該1次セグメントに確度
フラグをセットする。それ以外の場合には、ステップS
65へ直接進む。 (5)ステップS65.当該1次セグメントの右に他の1
次セグメントが存在すればステップS61へ戻り、存在
しなければ、終了する。図26を見てわかるように、濁
点は文字の境界にあるはずだから、この右側に確度フラ
グがセットされている。
(4) Step S64. If the result of the comparison is that the character codes are the same, a probability flag is set in the primary segment. Otherwise, step S
Proceed directly to 65. (5) Step S65. Another one to the right of the primary segment
If the next segment exists, the process returns to step S61; otherwise, the process ends. As can be seen from FIG. 26, since the voiced dot should be on the boundary of the character, the accuracy flag is set on the right side.

【0085】〈具体例3の効果〉濁点のように、文字の
境界にくるはずの図形に対して、確度フラグがセットで
きるように、その図形を認識する辞書を用意すること
で、1次セグメントに確度フラグを容易にセットするこ
とができ、2次セグメントの作成個数を抑えることがで
きる。これにより、後段の処理に必要となる候補木のサ
イズを抑えられる。従って、計算量と処理速度、及び、
処理時間を抑えることができ、従来問題を解決すること
ができる。
<Effect of Specific Example 3> A dictionary for recognizing a figure which is supposed to be at a character boundary, such as a cloud point, so that the accuracy flag can be set, is prepared. Can be set easily, and the number of secondary segments created can be reduced. As a result, the size of the candidate tree required for the subsequent processing can be suppressed. Therefore, the amount of calculation and processing speed, and
The processing time can be reduced, and the conventional problem can be solved.

【0086】特に、具体例3に示した確度フラグは、必
ず確度フラグを付加する条件を満足することが予想でき
る、文字の特定部分の図形、例えば、「句読点」や「濁
点」、「半濁点」の特徴量を考慮して計算するものとす
れば効果的である。
In particular, the certainty flag shown in the specific example 3 is a figure of a specific part of a character, for example, "punctuation mark", "white mark", "semi-dark point", which can be expected to satisfy the condition for adding the certainty flag. It is effective if the calculation is performed in consideration of the feature amount of “.

【0087】〈利用形態〉 (1)以上の各具体例は、文字認識処理のために文字の画
像から文字を切り出す方法やその装置に広く利用でき
る。 (2)上記具体例1、2、3では、横書き文字を対象とし
て説明したが、縦書きや斜め方向に並べて記入された自
由な文字列に適用できる。 (3) 具体例1、2、3では、手書き文字を対象として説
明したが、活字による文字や記号の認識にも適用でき
る。
<Usage Modes> (1) Each of the above specific examples can be widely used in a method and an apparatus for cutting out characters from a character image for character recognition processing. (2) In the first, second, and third examples, the description has been made for horizontally written characters. However, the present invention can be applied to a free character string written vertically or in a diagonal direction. (3) In the first, second, and third examples, the description has been made for handwritten characters. However, the present invention can also be applied to recognition of characters and symbols using printed characters.

【0088】(4) 具体例1、2、3では、全ての例にお
いて候補木から最適な切出し方を選ぶために、種々の評
価値(例えば認識確信度)とそれを計算するための処理
(例えば認識処理)を採用した。しかし、切出しの確信
度を表すための確度フラグのセット方法とその利用に関
する部分が特徴であり、その他の処理、例えば、認識方
式や、認識結果の評価方法は、自由に変更して差し支え
ない。
(4) In Examples 1, 2, and 3, various evaluation values (for example, recognition certainty) and processing for calculating the evaluation values (for example, the recognition certainty factor) are selected in order to select the optimal extraction method from the candidate tree in all the examples. For example, recognition processing) was adopted. However, the method is characterized by a method of setting a certainty flag for representing the certainty of the extraction and its use, and other processes, for example, a recognition method and a method of evaluating a recognition result may be freely changed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】具体例1の文字認識装置全体のブロック図であ
る。
FIG. 1 is a block diagram of an entire character recognition device according to a first embodiment.

【図2】従来知られたヒストグラムと文字認識方法の説
明図である。
FIG. 2 is an explanatory diagram of a conventionally known histogram and a character recognition method.

【図3】具体例1の確度フラグセット部ブロック図であ
る。
FIG. 3 is a block diagram of a certainty flag setting unit according to a first specific example;

【図4】具体例1の2次セグメント作成部のブロック図
である。
FIG. 4 is a block diagram of a secondary segment creation unit according to the first embodiment.

【図5】具体例1の候補木作成部ブロック図である。FIG. 5 is a block diagram of a candidate tree creating unit according to a specific example 1.

【図6】この装置全体の動作フローチャートである。FIG. 6 is an operation flowchart of the entire apparatus.

【図7】(a)は、1次セグメント抽出の例説明図であ
る。(b)は、確度フラグのセット例説明図である。
FIG. 7A is an explanatory diagram of an example of primary segment extraction. (B) is an explanatory diagram of a set example of the accuracy flag.

【図8】2次セグメントの作成例説明図である。FIG. 8 is an explanatory diagram of a creation example of a secondary segment.

【図9】比較例の候補木説明図である。FIG. 9 is an explanatory diagram of a candidate tree of a comparative example.

【図10】具体例1の候補木説明図である。FIG. 10 is an explanatory diagram of a candidate tree of a specific example 1.

【図11】具体例1の確度フラグセット処理フローチャ
ートである。
FIG. 11 is a flowchart illustrating a certainty flag setting process according to the first specific example.

【図12】具体例1の2次セグメントの作成部フローチ
ャートである。
FIG. 12 is a flowchart of a secondary segment creation unit according to the first embodiment.

【図13】具体例1の候補木作成部フローチャートであ
る。
FIG. 13 is a flowchart of a candidate tree creating unit according to the first embodiment.

【図14】評価値の計算例説明図である。FIG. 14 is an explanatory diagram of a calculation example of an evaluation value.

【図15】具体例2の確度フラグセット部のブロック図
である。
FIG. 15 is a block diagram of a certainty flag setting unit according to the second embodiment.

【図16】1次セグメント抽出の例と確度フラグのセッ
ト例を示す説明図である。
FIG. 16 is an explanatory diagram showing an example of primary segment extraction and an example of setting a probability flag.

【図17】確度フラグセットの条件を示す説明図であ
る。
FIG. 17 is an explanatory diagram showing conditions of a certainty flag set.

【図18】2次セグメント作成例説明図である。FIG. 18 is an explanatory diagram of a secondary segment creation example.

【図19】比較例の候補木説明図である。FIG. 19 is an explanatory diagram of a candidate tree of a comparative example.

【図20】具体例2の候補木説明図である。FIG. 20 is an explanatory diagram of a candidate tree of a specific example 2.

【図21】具体例2の確度フラグのセット部の処理手順
を示すフローチャートである。
FIG. 21 is a flowchart illustrating a processing procedure of a certainty flag setting unit according to the second embodiment;

【図22】具体例3の装置全体のブロック図である。FIG. 22 is a block diagram of the entire apparatus of the third embodiment.

【図23】具体例3の確度フラグセット部のブロック図
である。
FIG. 23 is a block diagram of a certainty flag setting unit according to the third embodiment.

【図24】具体例3の装置の全体処理フローチャートで
ある。
FIG. 24 is an overall processing flowchart of an apparatus according to a third embodiment.

【図25】(a)は1次セグメント抽出の例説明図、
(b)は1次セグメント認識結果の例説明図である。
FIG. 25A is an explanatory diagram of an example of primary segment extraction,
(B) is an example explanatory view of a primary segment recognition result.

【図26】確度フラグのセットの例説明図である。FIG. 26 is an explanatory diagram of an example of setting of a probability flag.

【図27】確度フラグなしの場合の比較例候補木説明図
である。
FIG. 27 is an explanatory diagram of a comparative example candidate tree when there is no accuracy flag.

【図28】確度フラグありの場合の具体例3による候補
木説明図である。
FIG. 28 is an explanatory diagram of a candidate tree according to a specific example 3 when a probability flag is present.

【図29】具体例3の確度フラグセット部処理フローチ
ャートである。
FIG. 29 is a processing flowchart of a certainty flag setting unit according to the third embodiment.

【符号の説明】[Explanation of symbols]

100 制御部 101 画像格納部 102 1次・2次セグメント情報格納部 103 文字情報格納部 104 候補木格納部 105 1次セグメント抽出部 106 確度フラグセット部 107 2次セグメント作成部 108 文字パタン切出し部 109 文字認識部 110 候補木作成部 111 結果出力部 REFERENCE SIGNS LIST 100 control unit 101 image storage unit 102 primary / secondary segment information storage unit 103 character information storage unit 104 candidate tree storage unit 105 primary segment extraction unit 106 accuracy flag setting unit 107 secondary segment creation unit 108 character pattern extraction unit 109 Character recognition unit 110 Candidate tree creation unit 111 Result output unit

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 入力画像中に並んだ文字列について、各
文字を構成する黒点の分布を表すヒストグラムを取得
し、文字の並んだ方向に対してほぼ垂直方向に向いた複
数の切出し候補位置を求め、この切出し候補位置を境に
前記文字列を複数に分割して1次セグメント群を得る1
次セグメント抽出部と、 互いに隣接する文字の境目にある1次セグメントを、そ
の他のセグメントと区別するために確度フラグをセット
する確度フラグセット部と、 前記確度フラグに着目して、文字の境目を挟む1次セグ
メントの組合せを除外しながら、前記1次セグメント抽
出部が抽出した互いに隣接する1次セグメントを統合し
て、2次セグメントを作成する2次セグメント作成部
と、 前記1次セグメントまたは2次セグメントで囲まれる候
補文字画像を文字認識する文字認識部と、 候補木を用いて文字認識結果を評価する候補木選択部と
を備えたことを特徴とする文字認識装置。
1. For a character string arranged in an input image, a histogram representing the distribution of black points constituting each character is obtained, and a plurality of extraction candidate positions oriented substantially perpendicular to the direction in which the characters are arranged are obtained. To obtain a primary segment group by dividing the character string into a plurality of parts at the cut candidate position.
A next segment extraction unit, a certainty flag setting unit that sets a certainty flag to distinguish a primary segment at a boundary between adjacent characters from other segments, and a character boundary by focusing on the certainty flag. A secondary segment creation unit that creates a secondary segment by integrating adjacent primary segments extracted by the primary segment extraction unit while excluding a combination of sandwiched primary segments; A character recognition device, comprising: a character recognition unit for character recognition of a candidate character image surrounded by a next segment; and a candidate tree selection unit for evaluating a character recognition result using the candidate tree.
【請求項2】 請求項1に記載の装置において、 前記確度フラグセット部は、 前記第1次セグメントの全てに対して、その1次セグメ
ントと隣接する1次セグメントとの間のスペース幅を計
算し、そのスペース幅が予め与えられた閾値以上の場
合、当該セグメントに確度フラグをセットして、そのセ
グメント間に文字の境界を挟むという情報をいずれか一
方の1次セグメントに付加することを特徴とする文字認
識装置。
2. The apparatus according to claim 1, wherein the accuracy flag setting unit calculates a space width between the primary segment and an adjacent primary segment for all of the primary segments. If the space width is equal to or greater than a predetermined threshold, a certainty flag is set for the segment, and information that a character boundary is inserted between the segments is added to one of the primary segments. Character recognition device.
【請求項3】 請求項1に記載の装置において、 前記確度フラグセット部は、 前記1次セグメントの全てに対して、そのセグメントの
形状を表す特徴量を求めて、その特徴量が予め与えられ
た範囲にある場合、当該セグメントに確度フラグを付加
することを特徴とする文字認識装置。
3. The apparatus according to claim 1, wherein the accuracy flag setting unit obtains a characteristic amount representing a shape of the primary segment for all of the primary segments, and the characteristic amount is given in advance. A character recognition device that adds a certainty flag to the segment when the segment is within the specified range.
【請求項4】 請求項1に記載の装置において、 前記確度フラグセット部は、 前記1次セグメントの全てに対して、一度文字認識を行
い、文字の特定部分の図形を認識する辞書と照合して、
該当する図形と認識された場合には、当該1次セグメン
トに確度フラグを付加することを特徴とする文字認識装
置。
4. The apparatus according to claim 1, wherein the accuracy flag setting unit performs character recognition once for all of the primary segments, and compares the primary segment with a dictionary that recognizes a graphic of a specific part of the character. hand,
A character recognition device characterized by adding a certainty flag to the primary segment when it is recognized as a corresponding figure.
JP10038101A 1998-02-04 1998-02-04 Character recognizing device Pending JPH11224310A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10038101A JPH11224310A (en) 1998-02-04 1998-02-04 Character recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10038101A JPH11224310A (en) 1998-02-04 1998-02-04 Character recognizing device

Publications (1)

Publication Number Publication Date
JPH11224310A true JPH11224310A (en) 1999-08-17

Family

ID=12516092

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10038101A Pending JPH11224310A (en) 1998-02-04 1998-02-04 Character recognizing device

Country Status (1)

Country Link
JP (1) JPH11224310A (en)

Similar Documents

Publication Publication Date Title
US6466694B2 (en) Document image processing device and method thereof
JP3359095B2 (en) Image processing method and apparatus
KR100412317B1 (en) Character recognizing/correcting system
JPH07120385B2 (en) Optical reading method
JPH0713995A (en) Automatic determination device of feature of text
JPH0721320A (en) Automatic determination device of script
US5265171A (en) Optical character reading apparatus for performing spelling check
JPH1011531A (en) Slip reader
US6701022B2 (en) Pattern matching coding device and method thereof
JP2730665B2 (en) Character recognition apparatus and method
US8600175B2 (en) Apparatus and method of processing image including character string
US7680329B2 (en) Character recognition apparatus and character recognition method
US20020051574A1 (en) Character recognition method, program and recording medium
JPH08320914A (en) Table recognition method and device
JPH11224310A (en) Character recognizing device
JPH0333990A (en) Optical character recognition instrument and method using mask processing
US8432555B2 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
KR102673900B1 (en) Table data extraction system and the method of thereof
JPH10198761A (en) Character recognizing method and device therefor
JPH08161432A (en) Method and device for segmenting character
JP3710164B2 (en) Image processing apparatus and method
JP3100825B2 (en) Line recognition method
JP2993533B2 (en) Information processing device and character recognition device
JP2002269574A (en) Run length based connected component and contour tracking for enhancing performance of circled area extracting algorithm
JP2022051198A (en) Ocr processor, ocr processing method, and program