JPH10207981A - Document recognition method - Google Patents

Document recognition method

Info

Publication number
JPH10207981A
JPH10207981A JP9007642A JP764297A JPH10207981A JP H10207981 A JPH10207981 A JP H10207981A JP 9007642 A JP9007642 A JP 9007642A JP 764297 A JP764297 A JP 764297A JP H10207981 A JPH10207981 A JP H10207981A
Authority
JP
Japan
Prior art keywords
frame
item
entry
item name
logical layout
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9007642A
Other languages
Japanese (ja)
Inventor
Junko Komatsu
順子 小松
Goro Bessho
吾朗 別所
Gakuhei Riyuu
学平 劉
Yukihisa Uchiyama
幸央 内山
Fumihiro Hasegawa
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP9007642A priority Critical patent/JPH10207981A/en
Publication of JPH10207981A publication Critical patent/JPH10207981A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To process even documents somewhat different with respect to physical layouts in the case of documents of the same logical layout by using logical layout information to fix frame areas corresponding to item frames and entry frames on a document picture to be processed. SOLUTION: A form consists of a title 301 and plural item frames as frames surrounded with ruled lines, and item name frames 302 to 304 where item names are preliminarily printed and entry frames 305 to 307 where item information is to be written for individual document by manual operation or the like are provided as item frames. As shown by (b), the title 'XX application' of the form exists n the first row, and the item name frame 302 of 'applicant' and the entry frame 305 for 'name' are arranged under it in a line in order in the second row, and the item name frame 303 of 'address' and the entry frame 306 for 'address' are arranged under them in a line in order in entry frame 307 for 'telephone number' are arranged under them in a line in order in the fourth. Thus, the flexibility for difference in physical layout is improved.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、帳票または同様の
表形式の文書(これらを本明細書においては「帳票」と
総称する)の処理技術の分野に係り、特に、帳票上の記
入枠に記入された内容を認識する技術に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to the field of processing technology for forms or similar tabular documents (these documents are collectively referred to as "forms" in the present specification). It relates to the technology for recognizing the entered contents.

【0002】[0002]

【従来の技術】帳票に記入された内容を読み取る場合、
帳票のどの部分が認識すべき記入枠であるか同定する必
要がある。このような帳票認識に関しては従来から様々
な技術が知られているが、いずれの従来技術も予め用意
された帳票の物理レイアウト情報、より具体的には記入
枠の座標を利用して記入枠を抽出している(例えば特公
平7−109610号)。
2. Description of the Related Art When reading contents written on a form,
It is necessary to identify which part of the form is the entry frame to be recognized. Various techniques have been known for such form recognition. Conventionally, however, any of the conventional techniques uses the physical layout information of a form prepared in advance, more specifically, the coordinates of the form using the coordinates of the form. Extracted (for example, Japanese Patent Publication No. Hei 7-109610).

【0003】[0003]

【発明が解決しようとする課題】帳票の物理レイアウト
情報を利用する方法は、入力された帳票の画像の位置ず
れや変倍を精密に補正する必要があり、処理が複雑にな
り、高速処理が難しい。また、帳票の論理レイアウト
(枠の種類、枠の相対的位置関係、記入枠に記入される
内容の属性等)が同じでも、物理レイアウトが僅かでも
異なると対応できず、帳票の物理レイアウトの違いに対
する柔軟性がない。
The method of using the physical layout information of a form requires precise correction of the displacement and magnification of the image of the input form, which complicates the processing and increases the speed of the processing. difficult. Further, even if the logical layout of the form (frame type, relative positional relationship of the frame, the attribute of the content to be entered in the entry frame, etc.) is the same, even if the physical layout is slightly different, it is not possible to cope with the difference. There is no flexibility for

【0004】本発明の目的は、そのような従来技術の問
題点を解決できる帳票認識方法を提供することにある。
[0004] An object of the present invention is to provide a form recognition method that can solve such problems of the prior art.

【0005】[0005]

【課題を解決するための手段】本発明の骨子は、帳票の
項目名枠、記入枠のレイアウトをそれぞれの相対的位置
関係として定義した論理レイアウト情報を用意してお
き、入力された帳票画像より枠領域を抽出し、抽出さた
枠領域の相対的位置関係を論理レイアウト情報と照らし
合わせることにより、入力された帳票画像の項目名枠及
び記入枠に相当する枠領域を同定し、少なくとも記入枠
に相当する枠領域の文字認識を行うことである(請求項
1)。
The gist of the present invention is to prepare logical layout information in which the layout of the item name frame and the entry frame of a form is defined as a relative positional relationship between them, and based on the input form image. By extracting a frame region and comparing the relative positional relationship of the extracted frame region with the logical layout information, a frame region corresponding to the item name frame and the entry frame of the input form image is identified, and at least the entry frame (1) is to perform character recognition in a frame area corresponding to (1).

【0006】好ましくは、論理レイアウト情報には項目
名枠の項目名が含まれ、入力された帳票画像の項目名枠
に相当する枠領域を同定する際に、その枠領域の文字認
識を行い、その文字認識結果と論理レイアウト情報中の
対応した項目名枠の項目名との一致を調べる(請求項
2)。また、論理レイアウト情報には記入枠の記入内容
の属性も含まれ、入力された帳票画像の記入枠に相当す
る枠領域の文字認識に、論理レイアウト情報中の対応し
た記入枠の属性を利用する(請求項3)。
Preferably, the logical layout information includes the item name of the item name frame, and when identifying a frame region corresponding to the item name frame of the input form image, character recognition of the frame region is performed. A check is made to determine whether the character recognition result matches the item name of the corresponding item name box in the logical layout information (claim 2). The logical layout information also includes the attribute of the content of the entry frame, and the attribute of the corresponding entry frame in the logical layout information is used for character recognition of a frame area corresponding to the entry frame of the input form image. (Claim 3).

【0007】[0007]

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0008】図1及び図2はそれぞれ本発明の一実施例
による帳票認識装置の構成を示すブロック図及びその処
理の流れを示すフローチャートである。図3及び図4は
それぞれ帳票の例及びそれらの論理レイアウト情報の例
を示す図である。
FIGS. 1 and 2 are a block diagram showing the configuration of a form recognition apparatus according to an embodiment of the present invention and a flowchart showing the flow of the processing, respectively. 3 and 4 are diagrams respectively showing an example of a form and an example of their logical layout information.

【0009】図1において、101は帳票を2値画像と
して読み取って入力する画像入力部、102は入力され
た帳票の画像を格納するための画像メモリ、103は処
理に関連したデータを一時的に記憶するためのメモリ、
104は文字認識処理を行う文字認識部、109は文字
認識処理に利用される属性別の単語等の知識を保存して
いる属性別知識データベース、105は縦横の罫線の抽
出処理を行う罫線抽出部、106は罫線データより4辺
を罫線で囲まれた枠領域を抽出する枠領域抽出部、10
7は帳票の論理レイアウトに係わる処理を行う論理レイ
アウト処理部、108は各種帳票の論理レイアウト情報
を保存している論理レイアウト構造データベース、11
0は出力データを編集する出力データ編集部、111は
編集された出力データを出力する出力部、112は装置
全体の動作を制御する制御部である。
In FIG. 1, reference numeral 101 denotes an image input unit for reading and inputting a form as a binary image, 102 an image memory for storing an image of the input form, and 103 temporarily storing data relating to processing. Memory for storing,
104 is a character recognition unit for performing character recognition processing; 109 is an attribute-based knowledge database storing knowledge such as words for each attribute used in the character recognition processing; 105 is a ruled line extraction unit for performing vertical and horizontal ruled line extraction processing And 106, a frame region extracting unit for extracting a frame region surrounded by ruled lines on four sides from the ruled line data.
Reference numeral 7 denotes a logical layout processing unit for performing a process related to a logical layout of a form; 108, a logical layout structure database storing logical layout information of various forms;
0 is an output data editing unit that edits output data, 111 is an output unit that outputs edited output data, and 112 is a control unit that controls the operation of the entire apparatus.

【0010】なお、このような構成の帳票認識装置10
0は、一般的なコンピュータシステムを利用しソフトウ
エアにより実現することも可能であることは明らかであ
る。この場合、例えば、104,105,106,10
7,110等の機能部はプログラムとして記述され、そ
れらのプログラムは例えばハードディスク等の記録媒体
に保存され、必要に応じてシステムのメモリに読み込ま
れてCPUによって実行されることになろう。また、論
理レイアウト構造データベース108及び属性別知識デ
ータベース109はハードディスク等の記憶媒体に保存
されることになろう。
It should be noted that the form recognition apparatus 10 having such a configuration is used.
Obviously, 0 can be realized by software using a general computer system. In this case, for example, 104, 105, 106, 10
The functional units such as 7, 110 are described as programs, and these programs are stored in a recording medium such as a hard disk, read into a memory of the system as needed, and executed by the CPU. The logical layout structure database 108 and the attribute-specific knowledge database 109 will be stored in a storage medium such as a hard disk.

【0011】ここで、図3及び図4により帳票の論理レ
イアウト情報の定義方法について説明する。
Here, a method of defining logical layout information of a form will be described with reference to FIGS.

【0012】図3(a)に示す帳票は、タイトル301
と、罫線で囲まれた枠である複数の項目枠からなる。こ
れら項目枠として、項目名が予め印刷された項目名枠3
02,303,304と、個々の帳票毎に項目情報が手
書きにより若しくは機械的に記入される記入枠305,
306,307とがある。また、図示されていないが、
帳票の余白部分の特定の位置、例えば右下隅部分に、帳
票の種別を表す印(文字認識が可能な数字等)が予め印
刷されている。
The form shown in FIG. 3A has a title 301.
And a plurality of item frames, which are frames surrounded by ruled lines. As these item frames, an item name frame 3 in which item names are printed in advance
02, 303, 304, and entry frames 305, in which item information is entered by hand or mechanically for each form.
306 and 307. Although not shown,
At a specific position in the blank portion of the form, for example, at the lower right corner, a mark indicating the type of the form (a character or the like capable of character recognition) is printed in advance.

【0013】図3(b)は、この帳票について定義され
た論理レイアウト情報を、帳票の論理レイアウトとの対
比が容易なように模式的に表している。1行目のtytle
{xx申請書}は帳票のタイトルが「xx申請書」である
ことを表す。2行目から4行目のitem{申請者}、item
{住所}及びitem{電話}はそれぞれ項目名枠302,
303,304を表す。item{$xxxx}は記入枠を意味
し、{ }内の$に続くxxxxは記入枠に記入される情報
の属性を表している。この属性としては、name(人
名)、address(住所)、tel(電話番号)、number(番
号)、money(金額)があり、さらに図4(b)に見ら
れるcount(数量)、ignore(無視)がある。&で繋が
れた複数のitem{ }のそれぞれは、その記述順に左か
ら右へ一列に並んだ複数の項目枠のそれぞれを表してい
る。そして、帳票上で上にある項目枠列ほど先に、また
同じ項目枠列では左端の項目枠から順に、記述される。
FIG. 3B schematically shows the logical layout information defined for the form so that the logical layout information can be easily compared with the logical layout of the form. Tytle on the first line
{xx application form} indicates that the title of the form is “xx application form”. 2nd to 4th line item {applicant}, item
{Address} and item {Phone} are the item name box 302, respectively.
303 and 304 are shown. item {xxxx} means an entry frame, and xxxx following {} in {} represents an attribute of information to be entered in the entry frame. These attributes include name (personal name), address (address), tel (telephone number), number (number), money (money), and count (quantity) and ignore (ignore) shown in FIG. ). Each of the plurality of items {} connected by & represents each of the plurality of item frames arranged in a line from left to right in the order of description. The uppermost item frame row on the form is described first, and the same item frame row is described in order from the leftmost item frame.

【0014】したがって、図3(b)において、1行目
は帳票の「XX申請書」というタイトルがあることを意
味し、2行目はタイトルより下側に「申請者」という項
目名枠302と「人名」の記入枠305が横一列に順に
並んで存在することを意味し、3行目は、その下側に
「住所」という項目名枠303と「住所」の記入枠30
6が横一列に順に並んで存在することを意味し、4行目
は、その下側に「電話」という項目名枠304と「電話
番号」の記入枠307が横一列に順に並んで存在するこ
とを意味する。
Therefore, in FIG. 3B, the first line means that there is a title of “XX application form” on the form, and the second line has an item name box 302 of “applicant” below the title. And the entry boxes 305 of “personal names” are arranged in order in a horizontal line, and the third line is an item name box 303 of “address” and an entry box 30 of “address” below.
6 means that there is an order in the horizontal line, and the fourth line has an item name box 304 of “telephone” and an entry box 307 of “telephone number” in the lower line in order. Means that.

【0015】図4(a)に示す帳票は、タイトル401
と、項目名枠402〜406、それに各項目の記入枠を
持つ。帳票種別を表す番号等の印も例えば帳票の右下隅
部に印刷されている。この帳票の論理レイアウト情報は
図4(b)のように定義される。なお、図4(b)の7
行目からitem{$ignore}&item{$ignore}は、帳票
の最も下に位置する記入枠407,408を記述してお
り、属性はignoreであるから、そらの内容は無視してよ
い。
The form shown in FIG.
And item name boxes 402 to 406, and entry boxes for each item. A mark such as a number indicating the form type is also printed, for example, in the lower right corner of the form. The logical layout information of this form is defined as shown in FIG. It should be noted that 7 in FIG.
From the line, item {ignore} & item {ignore} describes the entry frames 407 and 408 located at the bottom of the form, and since the attribute is "ignore", the contents thereof can be ignored.

【0016】なお、本実施例で扱う帳票は、上に示した
帳票の例のように、タイトルが枠に囲まれておらず、左
上位置の項目枠は必ず項目名枠であるものとする。
It should be noted that the form handled in the present embodiment does not have a title surrounded by a frame as in the example of the form shown above, and the item frame at the upper left position is always an item name frame.

【0017】次に、本実施例の帳票認識装置100にお
ける処理の流れを、図2に示したフローチャートを参照
して説明する。
Next, the flow of processing in the form recognition apparatus 100 of this embodiment will be described with reference to the flowchart shown in FIG.

【0018】まず、画像入力部101によって帳票の画
像が入力され、これが画像メモリ102に格納される
(図2のステップ201)。なお、従来のように、帳票
画像の位置ずれや変倍の補正は行われない。これは、以
下の項目枠に対する処理が論理レイアウト情報にのみ基
づいて行われるため、多少の画像の位置ずれや変倍によ
る項目枠の物理レイアウトの違いがあっても問題になら
ないからである。
First, a form image is input by the image input unit 101 and stored in the image memory 102 (step 201 in FIG. 2). It should be noted that, unlike the related art, the correction of the position shift and the scaling of the form image is not performed. This is because the processing for the following item frames is performed based only on the logical layout information, so that there is no problem even if there is a slight displacement of the image or a difference in the physical layout of the item frames due to scaling.

【0019】帳票画像が入力されると、文字認識部10
4において、画像メモリ102内の帳票画像の右下隅部
より、帳票種別を表す番号等の文字画像を切り出して文
字認識する(ステップ203)。論理レイアウト処理部
107は、その認識結果より入力された帳票の種別を識
別し、論理レイアウト構造データベース108内の該当
帳票種別の論理レイアウト情報を選択する(ステップ2
05)。この選択された論理レイアウト情報が、入力さ
れた帳票の処理に利用される。この選択ができないと
き、つまり論理レイアウト情報が論理レイアウト構造デ
ータベース108に登録されていない種類の帳票の画像
が入力されたときには、異常と判断され(ステップ20
7)、制御部112においてユーザに対しエラーの警告
を出すなどして処理を異常終了させる。なお、ユーザが
帳票種別を指定し、指定された種別に従って論理レイア
ウト情報を選択するような方法を採用することも可能で
ある。
When the form image is input, the character recognition unit 10
In step 4, a character image such as a number indicating the form type is cut out from the lower right corner of the form image in the image memory 102 and character recognition is performed (step 203). The logical layout processing unit 107 identifies the type of the input form from the recognition result, and selects the logical layout information of the relevant form type in the logical layout structure database 108 (step 2).
05). The selected logical layout information is used for processing the input form. When this selection cannot be made, that is, when an image of a form of which the logical layout information is not registered in the logical layout structure database 108 is input, it is determined that there is an abnormality (step 20).
7) The control unit 112 abnormally terminates the process by issuing an error warning to the user. It is also possible to adopt a method in which the user specifies the form type and selects the logical layout information according to the specified type.

【0020】入力帳票の種別に対応する論理レイアウト
情報が正常に選択されると、入力帳票より枠領域を抽出
するため、まず罫線抽出罫線抽出部105において入力
帳票画像より横方向及び縦方向の罫線を抽出する(ステ
ップ209)。この罫線抽出は、例えば、入力帳票画像
より所定値以上の長さを持つ横方向及び縦方向の黒ラン
を検出し、抽出した黒ランの中で一定距離以内のものを
統合することによって行われる。そして、枠領域抽出部
107において、横方向と縦方向の罫線の論理和を求め
ることにより、罫線で囲まれた枠の領域を抽出する(ス
テップ211)。抽出された枠領域の座標、例えば対向
した2頂点の座標はメモリ103に保存される。
When the logical layout information corresponding to the type of the input form is normally selected, the ruled line extracting section 105 first extracts horizontal and vertical lines from the input form image in order to extract a frame area from the input form. Is extracted (step 209). This ruled line extraction is performed, for example, by detecting horizontal and vertical black runs having a length equal to or more than a predetermined value from an input form image and integrating extracted black runs within a certain distance. . Then, the frame region extracting unit 107 extracts the logical region of the ruled lines in the horizontal direction and the vertical direction, thereby extracting the region of the frame surrounded by the ruled lines (step 211). The coordinates of the extracted frame area, for example, the coordinates of two opposing vertices are stored in the memory 103.

【0021】このようにして枠領域が抽出されると、論
理レイアウト処理部107は、抽出された枠領域の中で
最も上側で最も左側に位置する一つの枠領域をカレント
枠領域とし、その座標を文字認識部104に指定し、そ
の枠領域の内部について文字認識を行わせる(ステップ
215)。論理レイアウト処理部107は、その認識結
果と、選択した論理レイアウト情報中の先頭のitem
{ }の{ }内の項目名との一致を調べる(ステップ2
15)。先頭の項目枠は必ず項目名枠であり、枠領域抽
出が正常ならば、この比較で一致がとれるはずである。
例えば、図3(a)の帳票の場合、カレント枠領域は項
目名枠302に対応し、認識結果は項目名「申請者」と
一致するはずである。一致がとれた場合にはステップ2
21以降の処理に進む。
When the frame area is extracted in this manner, the logical layout processing unit 107 sets one of the extracted frame areas located at the uppermost and leftmost as the current frame area, and sets its coordinates as the current frame area. Is designated to the character recognizing unit 104, and character recognition is performed inside the frame area (step 215). The logical layout processing unit 107 compares the recognition result with the first item in the selected logical layout information.
Check for a match with the item name in {} of {} (Step 2
15). The first item frame is always an item name frame, and if the frame area extraction is normal, it should be possible to obtain a match by this comparison.
For example, in the case of the form shown in FIG. 3A, the current frame area corresponds to the item name frame 302, and the recognition result should match the item name “applicant”. If a match is found, step 2
The process proceeds to 21 and subsequent processes.

【0022】もし、不一致の場合には、直ちにエラーと
して処理を以上終了させることも可能であるが、本実施
例では、この異常状態の復旧を試みるため、カレント枠
領域に隣接した枠領域の座標を文字認識部104に指定
し、その文字認識を行わせ(ステップ217)、認識結
果と先頭の項目名との一致を調べる(ステップ21
9)。一致がとれないときにはエラーと判断され、制御
部112により処理は異常終了させられる。しかし、ど
れかの隣接枠領域で一致がとれたときには、一致がとれ
た枠領域をカレント枠領域とし、ステップ221以降の
処理に進む。
If they do not match, it is possible to immediately terminate the processing as an error, but in this embodiment, in order to attempt to recover from this abnormal state, the coordinates of the frame area adjacent to the current frame area are Is designated to the character recognizing unit 104, and the character recognition is performed (step 217), and it is checked whether the recognition result matches the head item name (step 21).
9). If they do not match, it is determined that an error has occurred, and the control unit 112 abnormally ends the processing. However, when a match is found in any adjacent frame area, the matched frame area is set as the current frame area, and the process proceeds to step 221 and subsequent steps.

【0023】なお、最初の枠領域を、文字認識を行うこ
となく、その相対的位置関係のみに基づいて、つまり左
上位置にあるということだけで、先頭の項目名枠と同定
することも可能である。ただし、同定エラーの危険性は
増加する。このことは、他の項目名枠に関しても同様で
ある(後述のステップ229,231を省き、枠領域の
相対的位置関係と論理レイアウト情報に記述された相対
的位置関係との一致のみを根拠として、直ちに項目名枠
を同定することも可能である)。
Note that the first frame area can be identified as the first item name frame without character recognition based only on its relative positional relationship, that is, only at the upper left position. is there. However, the risk of identification errors increases. This is the same for other item name frames (steps 229 and 231 described later are omitted, and only the matching between the relative positional relationship of the frame area and the relative positional relationship described in the logical layout information is used as a basis. , It is also possible to identify the item name frame immediately).

【0024】このようにして先頭の項目名枠を確認でき
ると、論理レイアウト処理部107は、選択した論理レ
イアウト情報を参照し、カレント枠領域に対応した項目
枠の右隣に別の項目枠が存在するか調べる(ステップ2
21)。図3(a)の帳票の場合、図3(b)の2行目
にitem{申請者}の次に&で繋がれたitem{$name}が
あるから、右隣に項目枠(記入枠305)がある。この
場合、メモリ103内の枠領域の座標データを参照し、
その右隣の項目枠に対応した枠領域が存在するか調べる
(ステップ225)。その右隣の枠領域が存在しないと
きは、枠領域抽出が異常であるのでエラーと判断され処
理は異常終了させられる。
When the first item name frame can be confirmed in this way, the logical layout processing unit 107 refers to the selected logical layout information and sets another item frame to the right of the item frame corresponding to the current frame area. Check if it exists (Step 2
21). In the case of the form shown in FIG. 3A, since item {applicant} has an item {name} connected with & next to the item {applicant} in the second line of FIG. 305). In this case, referring to the coordinate data of the frame area in the memory 103,
It is checked whether a frame area corresponding to the item frame on the right side exists (step 225). If the frame area on the right side does not exist, the extraction of the frame area is abnormal, so it is determined that an error has occurred, and the processing is abnormally terminated.

【0025】その枠領域が存在する場合、その枠領域を
カレント枠領域とし、論理レイアウト情報中の対応した
項目枠の記述を参照し、その項目枠が項目名枠である
か、または記入枠か調べる(ステップ227)。記入枠
の場合、その属性とカレント枠領域の座標を文字認識部
104に指定し、文字認識を行わせる(ステップ23
5)。この際、与えられた属性に対応した属性別知識デ
ータベース109内の知識を利用し、認識結果の精度を
高める。図3(a)の帳票の場合、カレント枠領域は記
入枠305に対応し、論理レイアウト情報にはitem{$
name}と記述されているので、その内容の属性は「人
名」であるから、「人名」の知識を文字認識に利用する
ことになる。認識結果はメモリ103に保存される。
If the frame area exists, the frame area is set as the current frame area, and the description of the corresponding item frame in the logical layout information is referred to, to determine whether the item frame is an item name frame or an entry frame. Check (step 227). In the case of the entry frame, the attribute and the coordinates of the current frame area are designated to the character recognizing unit 104 to perform the character recognition (step 23).
5). At this time, the knowledge in the attribute-specific knowledge database 109 corresponding to the given attribute is used to improve the accuracy of the recognition result. In the case of the form shown in FIG. 3A, the current frame area corresponds to the entry frame 305, and the logical layout information includes item @
Since name @ is described, the attribute of the content is "person name", and the knowledge of "person name" is used for character recognition. The recognition result is stored in the memory 103.

【0026】ステップ235を終了した場合、論理レイ
アウト処理部107はステップ221に戻り、論理レイ
アウト情報を参照し、カレント枠領域に対応した項目枠
の右隣に項目枠があるか調べる。図3(a)の帳票の場
合、図3(b)の2行目のitem{$name}に&で繋がれ
た項目枠はない。そこで下側に項目枠があるか調べる
(ステップ203)。図3(b)の3行目にitem{住
所}とあるから、下側に「住所」という項目名枠303
があることが分かる。したがって、ステップ225で、
その項目名枠303に対応する枠領域があるか調べる
(ステップ225)。枠領域抽出が正常なら対応した枠
領域があるので、それをカレント枠領域とし、また、そ
れは項目名枠であるので、ステップ229に進む。この
ステップ229では、カレント枠領域の座標を文字認識
部104に指定し、文字認識を行わせる(ステップ22
9)。その認識結果と、当該項目名枠の項目名「住所」
との一致を調べる(ステップ231)。不一致ならばエ
ラーとして処理は異常終了させられるが、一致がとれた
ならばステップ221より処理を続ける。
When the step 235 is completed, the logical layout processing unit 107 returns to the step 221 and refers to the logical layout information to check whether there is an item frame on the right side of the item frame corresponding to the current frame area. In the case of the form shown in FIG. 3A, there is no item frame connected by & to item {name} on the second line in FIG. 3B. Then, it is checked whether there is an item frame below (step 203). Since item {address} is on the third line in FIG. 3B, an item name box 303 of “address” is shown below.
It turns out that there is. Therefore, in step 225,
It is checked whether there is a frame area corresponding to the item name frame 303 (step 225). If the frame area extraction is normal, there is a corresponding frame area, so that it is set as the current frame area, and since it is an item name frame, the flow proceeds to step 229. In this step 229, the coordinates of the current frame area are designated to the character recognizing unit 104, and character recognition is performed (step 22).
9). The recognition result and the item name “address” in the item name box
Is checked (step 231). If they do not match, the process is terminated abnormally as an error, but if they match, the process is continued from step 221.

【0027】図4(a)に示した帳票も同様に処理され
る。なお、記入枠407,408のような「無視」の属
性を持つ記入枠の場合、その文字認識を行っても無意味
であるため、ステップ235をスキップし、例えば認識
結果としてスペースコード等の特定のコードを出力す
る。
The form shown in FIG. 4A is similarly processed. In the case of an entry frame having an attribute of "ignore" such as the entry frames 407 and 408, it is meaningless to perform the character recognition. Therefore, the step 235 is skipped, and a space code or the like is specified as a recognition result. The code of is output.

【0028】このようにして最後の項目枠まで、図3
(a)の帳票では記入枠305まで、正常に処理された
ならば、出力データ編集部110において、メモり10
3に得られた認識結果より出力データを編集する(ステ
ップ237)。出力データの形式は、その利用目的に応
じて適宜に選ばれる。例えば、記入枠に記入された内容
だけが欲しいような場合ならば、帳票種別を表す情報
と、各記入枠の認識結果を順に並べたような形式の出力
データとすることができる。そして、編集された出力デ
ータは出力部111に出力される(ステップ239)。
In this manner, up to the last item frame, FIG.
In the form (a), if the processing is normally performed up to the entry box 305, the output data
The output data is edited based on the recognition result obtained in step 3 (step 237). The format of the output data is appropriately selected according to the purpose of use. For example, if only the contents entered in the entry boxes are desired, the output data can be output in a format in which information indicating the form type and the recognition results of the entry boxes are arranged in order. Then, the edited output data is output to the output unit 111 (step 239).

【0029】[0029]

【発明の効果】請求項1乃至3の各項記載の発明によれ
ば、帳票の項目名枠及び記入枠のレイアウトを相対的位
置関係で定義した論理レイアウト情報を利用して、処理
しようとする帳票画像上の項目枠及び記入枠に相当する
枠領域を同定するため、物理レイアウトの違いに対する
柔軟性が高く、論理レイアウトが同一であれば物理レイ
アウトが多少違った帳票も処理することが可能であり、
また、処理しようとする帳票画像の位置ずれや変倍の補
正処理が不要となり、処理を簡略化・高速化することが
できる。また、論理レイアウト情報は、物理レイアウト
情報に比べ作成が用意であるため、帳票のレイアウトの
変更や新規の帳票の追加にも容易に対応できる。請求項
2記載の発明によれば、項目名枠の同定エラーを回避
し、より確実な処理が可能である。請求項3記載の発明
によれば、記入枠の属性を利用することにより、その文
字認識精度を向上させることができる。
According to the first to third aspects of the present invention, the layout of the item name frame and the entry frame of the form is processed using the logical layout information defined by the relative positional relationship. Since a frame area corresponding to an item frame and an entry frame on a form image is identified, flexibility with respect to a difference in physical layout is high, and a form having a slightly different physical layout can be processed if the logical layout is the same. Yes,
In addition, it is not necessary to perform a process for correcting a position shift or scaling of a form image to be processed, and the process can be simplified and speeded up. Since the logical layout information is prepared more easily than the physical layout information, it can easily cope with a change in the layout of a form or the addition of a new form. According to the second aspect of the present invention, it is possible to avoid an identification error of the item name frame and perform more reliable processing. According to the third aspect of the present invention, the character recognition accuracy can be improved by using the attribute of the entry frame.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例による帳票認識装置の構成を
示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a form recognition device according to one embodiment of the present invention.

【図2】本発明の一実施例による帳票認識装置の処理の
流れを示すフローチャートである。
FIG. 2 is a flowchart showing a processing flow of a form recognition device according to an embodiment of the present invention.

【図3】帳票の例とその論理レイアウト情報を示す図で
ある。
FIG. 3 is a diagram showing an example of a form and its logical layout information.

【図4】帳票の他の例とその論理レイアウト情報を示す
図である。
FIG. 4 is a diagram showing another example of a form and its logical layout information.

【符号の説明】[Explanation of symbols]

101 画像入力部 102 画像メモリ 103 メモリ 104 文字認識部 105 罫線抽出部 106 枠領域抽出部 107 論理レイアウト処理部 108 論理レイアウト構造データベース 109 属性別知識データベース 110 出力データ編集部 111 出力部 112 制御部 301 帳票タイトル 302〜304 項目名枠 305〜307 記入枠 401 帳票タイトル 402〜406 項目名枠 407,408 「無視」属性の記入枠 101 Image Input Unit 102 Image Memory 103 Memory 104 Character Recognition Unit 105 Rule Line Extraction Unit 106 Frame Area Extraction Unit 107 Logical Layout Processing Unit 108 Logical Layout Structure Database 109 Attribute Knowledge Database 110 Output Data Editing Unit 111 Output Unit 112 Control Unit 301 Form Title 302-304 Item name frame 305-307 Entry frame 401 Form title 402-406 Item name frame 407, 408 Entry frame for "ignore" attribute

───────────────────────────────────────────────────── フロントページの続き (72)発明者 内山 幸央 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 長谷川 史裕 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Yukio Uchiyama 1-3-6 Nakamagome, Ota-ku, Tokyo Stock inside Ricoh Company (72) Inventor Fumihiro Hasegawa 1-3-6 Nakamagome, Ota-ku, Tokyo Stock Inside the company Ricoh

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 帳票の項目名枠及び記入枠のレイアウト
をそれぞれの相対的位置関係として定義した論理レイア
ウト情報を用意しておき、入力された帳票画像より枠領
域を抽出し、抽出さた枠領域の相対的位置関係を論理レ
イアウト情報と照らし合わせることにより、入力された
帳票画像の項目名枠及び記入枠に相当する枠領域を同定
し、少なくとも記入枠に相当する枠領域の文字認識を行
うことを特徴とする帳票認識方法。
1. A logical layout information which defines the layout of an item name frame and an entry frame of a form as a relative positional relationship is prepared, and a frame region is extracted from an input form image, and the extracted frame is extracted. By comparing the relative positional relationship between the regions with the logical layout information, a frame region corresponding to the item name frame and the entry frame of the input form image is identified, and at least character recognition of the frame region corresponding to the entry frame is performed. A form recognition method characterized in that:
【請求項2】 論理レイアウト情報には項目名枠の項目
名が含まれており、入力された帳票画像の項目名枠に相
当する枠領域を同定する際に、その枠領域の文字認識を
行い、その文字認識結果と論理レイアウト情報中の対応
した項目名枠の項目名との一致を調べることを特徴とす
る請求項1記載の帳票認識方法。
2. The logical layout information includes an item name of an item name frame. When identifying a frame region corresponding to the item name frame of the input form image, character recognition of the frame region is performed. 2. The form recognition method according to claim 1, wherein a match between the character recognition result and an item name of a corresponding item name box in the logical layout information is checked.
【請求項3】 論理レイアウト情報には記入枠の記入内
容の属性も含まれており、入力された帳票画像の記入枠
に相当する枠領域の文字認識に、論理レイアウト情報中
の対応した記入枠の属性を利用することを特徴とする請
求項1又は2記載の帳票認識方法。
3. The logical layout information also includes an attribute of the content of the entry frame, and the character recognition of the frame area corresponding to the entry frame of the input form image is performed by the corresponding entry frame in the logical layout information. 3. The form recognition method according to claim 1, wherein the attribute is used.
JP9007642A 1997-01-20 1997-01-20 Document recognition method Pending JPH10207981A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9007642A JPH10207981A (en) 1997-01-20 1997-01-20 Document recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9007642A JPH10207981A (en) 1997-01-20 1997-01-20 Document recognition method

Publications (1)

Publication Number Publication Date
JPH10207981A true JPH10207981A (en) 1998-08-07

Family

ID=11671491

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9007642A Pending JPH10207981A (en) 1997-01-20 1997-01-20 Document recognition method

Country Status (1)

Country Link
JP (1) JPH10207981A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008021068A (en) * 2006-07-12 2008-01-31 Hitachi Computer Peripherals Co Ltd Business form recognition apparatus and business form recognition program
JP2008262368A (en) * 2007-04-11 2008-10-30 Fuji Xerox Co Ltd Image processor and program
JP2011233178A (en) * 2011-08-26 2011-11-17 Fuji Xerox Co Ltd Image processing device and program
JP2012010295A (en) * 2010-06-28 2012-01-12 Fujitsu Ltd Mobile terminal device, schedule management method and schedule management program
JP2016071892A (en) * 2014-09-30 2016-05-09 キヤノンマーケティングジャパン株式会社 Document system, processing method thereof, and program
US9626738B2 (en) 2014-03-05 2017-04-18 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and storage medium

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008021068A (en) * 2006-07-12 2008-01-31 Hitachi Computer Peripherals Co Ltd Business form recognition apparatus and business form recognition program
JP4733577B2 (en) * 2006-07-12 2011-07-27 日立コンピュータ機器株式会社 Form recognition device and form recognition program
JP2008262368A (en) * 2007-04-11 2008-10-30 Fuji Xerox Co Ltd Image processor and program
JP2012010295A (en) * 2010-06-28 2012-01-12 Fujitsu Ltd Mobile terminal device, schedule management method and schedule management program
JP2011233178A (en) * 2011-08-26 2011-11-17 Fuji Xerox Co Ltd Image processing device and program
US9626738B2 (en) 2014-03-05 2017-04-18 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and storage medium
JP2016071892A (en) * 2014-09-30 2016-05-09 キヤノンマーケティングジャパン株式会社 Document system, processing method thereof, and program

Similar Documents

Publication Publication Date Title
JP4071328B2 (en) Document image processing apparatus and method
JP2004139484A (en) Form processing device, program for implementing it, and program for creating form format
JP3294995B2 (en) Form reader
JP4183527B2 (en) Form definition data creation method and form processing apparatus
US7680329B2 (en) Character recognition apparatus and character recognition method
JP2002203207A (en) Character recognizing method and program, and recording medium
JP4983464B2 (en) Form image processing apparatus and form image processing program
JPH10207981A (en) Document recognition method
JP2008282094A (en) Character recognition processing apparatus
JP4517822B2 (en) Image processing apparatus and program
JPH11328306A (en) Method and device for extracting logical element of document image, and record medium
JP2000029983A (en) Document reader device
JPH1063744A (en) Method and system for analyzing layout of document
JP2009087378A (en) Business form processor
JP4521377B2 (en) Form processing apparatus, program for executing the apparatus, and form format creation program
JP3817442B2 (en) Image recognition apparatus, image recognition method, program for realizing image recognition method, and recording medium for the program
JPH0728935A (en) Document image processor
JP4213558B2 (en) Document layout analysis program, computer-readable storage medium storing document layout analysis program, document layout analysis method, and document layout analysis apparatus
JP7037237B1 (en) Data processing equipment, data processing methods and programs
JP4221960B2 (en) Form identification device and identification method thereof
JPH0991385A (en) Character recognition dictionary adding method and terminal ocr device using same
JP3823005B2 (en) Bitmap font creation device and document restoration device
JP2002014981A (en) Document filing device
JP2606560B2 (en) Document image storage device
JP2682873B2 (en) Recognition device for tabular documents