JPH11120260A - Method and device for processing document image, and storage medium stored with document image processing program - Google Patents

Method and device for processing document image, and storage medium stored with document image processing program

Info

Publication number
JPH11120260A
JPH11120260A JP9280768A JP28076897A JPH11120260A JP H11120260 A JPH11120260 A JP H11120260A JP 9280768 A JP9280768 A JP 9280768A JP 28076897 A JP28076897 A JP 28076897A JP H11120260 A JPH11120260 A JP H11120260A
Authority
JP
Japan
Prior art keywords
ruled line
image
mark
horizontal ruled
horizontal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9280768A
Other languages
Japanese (ja)
Inventor
Kimitomo Kobayashi
公知 小林
Osamu Nakamura
修 中村
Akira Suzuki
章 鈴木
Hiroshi Sekiya
博 関谷
Kenji Ogura
健司 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP9280768A priority Critical patent/JPH11120260A/en
Publication of JPH11120260A publication Critical patent/JPH11120260A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide the method and device for document image processing which enable accurate image cutting whatever kind of segment is entered into an image entry field by making accurate tilt corrections of a document and eliminating an error in format discrimination even if a straight line similar to a ruled line used for the tilt correction and format discrimination is present in various drawings such as a map and a layout figure entered into the image entry field, and the storage medium where the document image processing program is stored. SOLUTION: When a document into which characters, ruled lines showing the image entry field, and a mark indicating the position of the image entry field are entered in a color that a facsimile or scanner can sense is inputted (S1), a document image is stored in a memory (S21), lateral ruled lines of the document image and the mark on the lateral ruled line or on the prolongation of the lateral ruled line are detected (S3), and a horizontal ruled line and a mark on the horizontal ruled line or its prolongation are detected in a document image after tilt correction is made (S4) by using the lateral ruled line where the mark is present or a lateral ruled line outside a vertical scanning range sandwiched between the prolongations of the lateral ruled lines to discriminate, the document by using a horizontal ruled line outside the vertical scanning range sandwiched between marks (S6).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、帳票イメージ処理
方法及び装置及び帳票イメージ処理プログラムを格納し
た記憶媒体に係り、特に、罫線で示されたイメージ記入
欄にどのようなイメージが記載されていても精度の高い
傾斜補正、帳票識別及びイメージ領域の切り出し処理を
可能とする帳票イメージ処理方法及び装置及び帳票イメ
ージ処理プログラムを格納した記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a form image processing method and apparatus, and a storage medium storing a form image processing program, and in particular, what kind of image is described in an image entry box indicated by a ruled line. The present invention also relates to a form image processing method and apparatus capable of performing highly accurate tilt correction, form identification, and image area cutout processing, and a storage medium storing a form image processing program.

【0002】[0002]

【従来の技術】従来、罫線を用いた帳票の読み取りシス
テムでは、長い罫線を用いて傾斜補正(特願平7−24
7644「イメージデータ入力処理法及びその装置」参
照)を行うと共に、長い罫線の相対位置や本数を用いて
複数種類の帳票イメージデータを識別し、(特願平7−
115924「帳票書式識別方法及び装置」参照)、文
字記入欄やイメージ記入欄の検出や切り出しを行ってい
る。
2. Description of the Related Art Conventionally, in a form reading system using ruled lines, inclination correction is performed using long ruled lines (Japanese Patent Application No. 7-24 / 1990).
7644 "Image data input processing method and its apparatus"), and a plurality of types of form image data are identified by using the relative positions and the number of long ruled lines.
115924 "Method and apparatus for identifying form format"), and detects and cuts out character entry fields and image entry fields.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、上記従
来の技術では、イメージ記入欄は小さな領域でサインや
簡易なイラスト等の記述に留めている。即ち、大きなイ
メージ記入欄を用いて長い線分に記載される地図や見取
り図等を記載すれば、イメージ記入欄に傾斜補正や書式
識別で用いる罫線と同様の直線が記載される場合があ
り、この直線の長さ及び傾斜によっては帳票の傾斜補正
が正しく行えない場合や、書式識別に誤りが生じ、イメ
ージ記入欄が正確に取り出せないという問題がある。
However, in the above-mentioned conventional technique, the image entry field is a small area where a sign or a simple illustration is described. That is, if a map or a sketch drawn on a long line segment is described using a large image entry column, a straight line similar to a ruled line used for inclination correction and format identification may be described in the image entry column. Depending on the length and inclination of the straight line, there is a problem that the inclination of the form cannot be corrected correctly, or an error occurs in the format identification, and the image entry column cannot be taken out correctly.

【0004】本発明は、上記の点に鑑みなされたもの
で、イメージ記入欄に記載された地図や見取り図等の各
種図面に傾斜補正及び書式識別で使用する罫線と同程度
の直線が存在しても、帳票の正確な傾斜補正を行うと共
に、書式識別誤りをなくし、イメージ記入欄にどのよう
な種類の線分が記載されても正確なイメージ切り出しを
可能とする帳票イメージ処理方法及び装置及び帳票イメ
ージ処理プログラムを格納した記憶媒体を提供すること
を目的とする。
SUMMARY OF THE INVENTION The present invention has been made in view of the above points, and includes various types of drawings, such as maps and floor plans, described in image entry columns, in which lines similar to ruled lines used for inclination correction and format identification exist. In addition, a form image processing method and apparatus and form that perform accurate inclination correction of a form, eliminate format identification errors, and enable accurate image cutout regardless of what kind of line segment is described in an image entry column. It is an object to provide a storage medium storing an image processing program.

【0005】[0005]

【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。本発明は、文字やイメージを
記載した帳票をファクシミリやスキャナで入力した文字
認識及びイメージ切り出しを行う帳票イメージ処理方法
において、帳票の文字及びイメージ記入欄を示す罫線と
該イメージ記入欄の位置を示すマークがファクシミリや
スキャナで感知できる色で記載した帳票が入力されると
(ステップ1)、入力された帳票の帳票イメージをメモ
リに格納し(ステップ2)、帳票イメージの横罫線の検
出と該横罫線上または、該横罫線の延長上にあるマーク
を検出し(ステップ3)、マークの存在する横罫線また
は、該横罫線の延長線で挟まれた副走査範囲以外の横罫
線を用いて傾斜補正を行い(ステップ4)、傾斜補正を
行った帳票イメージから、水平罫線の検出と該水平罫線
上または、該水平罫線の延長上にあるマークを検出し
(ステップ5)、マークで挟まれた副走査範囲以外の水
平罫線を用いて帳票の識別を行う(ステップ6)。
FIG. 1 is a diagram for explaining the principle of the present invention. The present invention relates to a form image processing method for recognizing a character or image input by a facsimile or scanner on a form on which a character or image is described, and showing a ruled line indicating a character and image entry field of the form and a position of the image entry field. When a form in which the mark is described in a color that can be detected by a facsimile or a scanner is input (step 1), the form image of the input form is stored in a memory (step 2), and a horizontal ruled line of the form image is detected and the horizontal line is detected. A mark on the ruled line or on an extension of the horizontal ruled line is detected (step 3), and inclination is performed using a horizontal ruled line on which the mark exists or a horizontal ruled line other than the sub-scanning area sandwiched by the extended lines of the horizontal ruled line. After the correction (step 4), the horizontal ruled line is detected and the mark on the horizontal ruled line or on the extension of the horizontal ruled line is detected from the form image on which the tilt correction has been performed. It detected (Step 5), and identifies the form by using the horizontal ruled lines other than the sub-scanning range between the mark (Step 6).

【0006】また、本発明は、傾斜補正を行った帳票イ
メージから垂直罫線の検出と、該垂直罫線上または、該
垂直罫線の延長線上にあるマークを検出し、該マークで
挟まれた主走査範囲以外の垂直罫線を用いて帳票の識別
を行う。また、本発明は、イメージ記入欄の位置を示す
マークを登録可能とする。図2は、本発明の原理構成図
である。
Further, the present invention detects a vertical ruled line from a form image on which tilt correction has been performed, detects a mark on the vertical ruled line or an extension of the vertical ruled line, and performs main scanning sandwiched between the marks. The form is identified using vertical ruled lines outside the range. Further, according to the present invention, a mark indicating the position of the image entry column can be registered. FIG. 2 is a diagram illustrating the principle of the present invention.

【0007】本発明は、文字やイメージを記載した帳票
をファクシミリやスキャナで入力した文字認識及びイメ
ージ切り出しを行う帳票イメージ処理装置であって、帳
票の文字及びイメージ記入欄を示す罫線と該イメージ記
入欄の位置を示すマークがファクシミリやスキャナで感
知できる色で記載した帳票を入力する帳票入力手段8
と、帳票入力手段8により入力された帳票の帳票イメー
ジを格納する帳票イメージ記憶手段1と、帳票イメージ
記憶手段1から帳票イメージを取得して、該帳票イメー
ジの横罫線の検出と、該横罫線上または、該横罫線の延
長上にあるマークを検出し、該マークの存在する横罫線
または、該横罫線の延長線で挟まれた副走査範囲以外の
横罫線を用いて傾斜補正を行う傾斜補正手段2と、傾斜
補正手段2により傾斜補正を行った帳票イメージから、
水平罫線の検出と、該水平罫線上または、該水平罫線の
延長線上にあるマークを検出し、該マークで挟まれた副
走査範囲以外の水平罫線を用いて帳票の識別する書式識
別手段3とを有する。
The present invention relates to a form image processing apparatus for recognizing a character and an image cut out by inputting a form on which a character or an image is described with a facsimile or a scanner. Form input means 8 for inputting a form in which a mark indicating a position of a column is described in a color which can be detected by a facsimile or a scanner.
A form image storage means 1 for storing a form image of the form inputted by the form input means 8, a form image obtained from the form image storage means 1, detection of a horizontal ruled line of the form image, A mark that detects a mark above or on an extension of the horizontal ruled line, and performs a tilt correction using a horizontal ruled line other than the sub-scanning range sandwiched between the horizontal ruled line where the mark exists or the extension of the horizontal ruled line. From the correction means 2 and the form image on which the tilt correction has been performed by the tilt correction means 2,
Format identification means 3 for detecting a horizontal ruled line, detecting a mark on the horizontal ruled line or an extension of the horizontal ruled line, and identifying a form using a horizontal ruled line other than the sub-scanning range sandwiched between the marks; Having.

【0008】上記の書式識別手段3は、傾斜補正を行っ
た帳票イメージから垂直罫線の検出と、該垂直罫線上ま
たは、該垂直罫線の延長線上にあるマークを検出し、該
マークで挟まれた主走査範囲以外の垂直罫線を用いて帳
票の識別を行う手段を含む。また、本発明の帳票イメー
ジ処理装置は、イメージ記入欄の位置を示すマークを登
録するマーク登録手段を更に有する。
The format identification means 3 detects a vertical ruled line from a form image on which the inclination has been corrected, detects a mark on the vertical ruled line or an extension of the vertical ruled line, and detects the mark between the marks. Means for identifying a form using a vertical ruled line other than the main scanning range is included. Further, the form image processing apparatus of the present invention further has a mark registration unit for registering a mark indicating the position of the image entry column.

【0009】本発明は、文字やイメージを記載した帳票
をファクシミリやスキャナで入力した文字認識及びイメ
ージ切り出しを行う帳票イメージ処理プログラムを格納
した記憶媒体であって、帳票の文字及びイメージ記入欄
を示す罫線と該イメージ記入欄の位置を示すマークがフ
ァクシミリやスキャナで感知できる色で記載した帳票を
入力させる帳票入力プロセスと、帳票入力プロセスによ
り入力された帳票の帳票イメージを格納する帳票イメー
ジ記憶プロセスと、帳票イメージ記憶プロセスから帳票
イメージを取得して、該帳票イメージの横罫線の検出
と、該横罫線上または、該横罫線の延長上にあるマーク
を検出し、該マークの存在する横罫線または、該横罫線
の延長線で挟まれた副走査範囲以外の横罫線を用いて傾
斜補正を行う傾斜補正プロセスと、傾斜補正プロセスに
より傾斜補正を行った帳票イメージから、水平罫線の検
出と、該水平罫線上または、該水平罫線の延長線上にあ
るマークを検出し、該マークで挟まれた副走査範囲以外
の水平罫線を用いて帳票の識別する書式識別プロセスと
を有する。
The present invention is a storage medium storing a form image processing program for recognizing characters and inputting a form containing characters and images by facsimile or scanner, and showing a character and image entry field of the form. A form input process for inputting a form in which a ruled line and a mark indicating the position of the image entry field are described in a color that can be detected by a facsimile or a scanner, and a form image storage process for storing a form image of the form input by the form input process. Acquiring a form image from a form image storage process, detecting a horizontal ruled line of the form image, detecting a mark on the horizontal ruled line or on an extension of the horizontal ruled line, and detecting a horizontal ruled line where the mark exists or A tilt correction that performs tilt correction using a horizontal ruled line other than the sub-scanning range sandwiched between extensions of the horizontal ruled line. A horizontal ruled line, and a mark on the horizontal ruled line or an extension of the horizontal ruled line is detected from the form image on which the tilt is corrected by the tilt correction process, and a sub-scanning range sandwiched between the marks is detected. And a form identification process for identifying a form using horizontal ruled lines other than the above.

【0010】また、書式識別プロセスは、傾斜補正を行
った帳票イメージから垂直罫線の検出と、該垂直罫線上
または、該垂直罫線の延長線上にあるマークを検出し、
該マークで挟まれた主走査範囲以外の垂直罫線を用いて
帳票の識別を行うプロセスを含む。また、イメージ記入
欄の位置を示すマークを登録するマーク登録プロセスを
更に有する。
In the format identification process, a vertical ruled line is detected from the form image on which the inclination has been corrected, and a mark on the vertical ruled line or an extension of the vertical ruled line is detected.
The process includes a process of identifying a form using a vertical ruled line other than the main scanning range sandwiched between the marks. The image processing apparatus further includes a mark registration process for registering a mark indicating the position of the image entry column.

【0011】上記のように、本発明は、まず、受信した
帳票イメージデータをメモリに格納する。そして、帳票
イメージデータに対して傾斜検出に用いる罫線を検出す
ると共に、罫線上または、罫線の延長上にあるマークを
検出する。そして、マークで挟まれた副走査範囲以外の
罫線を用いて傾斜補正を行う。次に、傾斜補正した帳票
イメージデータの水平・垂直の罫線を検出すると共に、
水平・垂直罫線上、または、水平・垂直罫線の延長上に
あるマークを検出する。そして、マークで挟まれた主走
査範囲及び副走査範囲以外の罫線の位置や本数を用いて
複数書式の識別を行う。書式識別後は、識別した書式に
記載された情報に基づいて、文字記入欄及びイメージ記
入欄を検出し、文字の切り出し及びイメージ切り出しを
行う。このようにするとこで、罫線を利用した帳票イメ
ージ記入欄に罫線と同様の線分を記載しても正確な傾斜
補正や、書式識別が可能となり、かつイメージ領域の切
り出しも可能となる。
As described above, the present invention first stores the received form image data in the memory. Then, a ruled line used for tilt detection is detected from the form image data, and a mark on the ruled line or an extension of the ruled line is detected. Then, inclination correction is performed using ruled lines outside the sub-scanning range sandwiched by the marks. Next, while detecting the horizontal and vertical ruled lines of the form image data whose inclination has been corrected,
Detects marks on horizontal / vertical ruled lines or on extensions of horizontal / vertical ruled lines. Then, identification of a plurality of formats is performed using the position and the number of ruled lines other than the main scanning range and the sub-scanning range sandwiched by the marks. After the format identification, the character entry column and the image entry column are detected based on the information described in the identified format, and characters are cut out and the image is cut out. In this way, even if a line segment similar to the ruled line is described in the form image entry field using the ruled line, accurate inclination correction and format identification can be performed, and the image area can be cut out.

【0012】このように、イメージ記入欄を示す罫線
上、または、罫線の延長上にマークを記載した帳票を用
いると共に、このマークを検出し、マークで挟まれた副
走査範囲の横罫線を除く、横罫線を用いた傾斜補正及び
マークで挟まれた主走査範囲に存在する縦罫線と副走査
範囲に存在する横罫線を除く罫線を用いた帳票の書式識
別を行うことを特徴とし、これにより、帳票識別NGや
文字・イメージの切り出し誤りを発生させることなく大
きな任意の図面等の記載を可能とする。
As described above, a form in which a mark is described on a ruled line indicating an image entry column or an extension of the ruled line is used, and this mark is detected, and a horizontal ruled line in a sub-scanning range sandwiched between the marks is removed. , Using a horizontal ruled line, and performing format identification of a form using a ruled line excluding a vertical ruled line existing in a main scanning range and a horizontal ruled line existing in a sub-scanning range sandwiched between marks. In addition, it is possible to describe a large arbitrary drawing or the like without generating a form identification NG or a character / image cutout error.

【0013】[0013]

【発明の実施の形態】図3は、本発明の帳票イメージ処
理装置の構成を示す。同図に示す帳票イメージ処理装置
は、受信した帳票イメージデータを保存するイメージメ
モリ部1、横罫線を用いて帳票イメージの傾斜補正を行
う傾斜補正部2、帳票イメージデータの水平・垂直罫線
を用いて登録してある複数書式の中から特定の書式を選
択する書式識別部3、イメージ記入欄の位置を示すマー
クを記憶しておくマーク記憶部4、選択した書式情報を
用いて文字記入欄の文字データ及びイメージ記入欄のイ
メージデータを切り出す文字・イメージ切り出し部5、
切り出した文字データを認識する文字認識部6、文字認
識結果及び切り出されたイメージデータを外部装置に併
せて編集する結果編集部7から構成される。
FIG. 3 shows the configuration of a form image processing apparatus according to the present invention. The form image processing apparatus shown in FIG. 1 uses an image memory unit 1 for storing received form image data, an inclination correction unit 2 for correcting the form image inclination using horizontal ruled lines, and horizontal and vertical ruled lines of the form image data. A format identification unit 3 for selecting a specific format from a plurality of registered formats, a mark storage unit 4 for storing a mark indicating the position of an image entry column, and a character entry column using the selected format information. A character / image cutout unit 5 for cutting out character data and image data in an image entry column,
It comprises a character recognition unit 6 for recognizing the cut-out character data, and a result editing unit 7 for editing the character recognition result and the cut-out image data together with an external device.

【0014】次に、上記の帳票イメージ処理装置の動作
を説明する。 1. 帳票イメージデータを受信すると、イメージメモ
リ部1に格納する。 2. 帳票イメージデータの格納を完了すると、イメー
ジメモリ部1は、傾斜補正部2に傾斜補正開始を指示す
る。 3. 傾斜補正開始の指示を受けた傾斜補正部2は、規
定の長さ以上の横罫線と傾斜を検出すると共に、検出さ
れた横罫線上にマークが存在するかどうか調べる。
Next, the operation of the form image processing apparatus will be described. 1. When the form image data is received, it is stored in the image memory unit 1. 2. When the storage of the form image data is completed, the image memory unit 1 instructs the tilt correction unit 2 to start tilt correction. 3. Receiving the instruction to start the inclination correction, the inclination correction unit 2 detects a horizontal ruled line having a length equal to or more than a specified length and an inclination, and checks whether a mark exists on the detected horizontal ruled line.

【0015】4. そして、検出した横罫線のうち、マ
ークの存在する横罫線で挟まれた副走査範囲の横罫線を
除いた横罫線の傾斜を用いて傾斜補正を行う。 5. 傾斜補正後の帳票イメージデータをイメージメモ
リ1に書き込む。 6. 傾斜補正が終わると傾斜補正部2は、書式識別部
3に書式識別開始を指示する。
4. Then, the inclination correction is performed using the inclination of the horizontal ruled line excluding the horizontal ruled line in the sub-scanning range sandwiched between the horizontal ruled lines where the marks are present, among the detected horizontal ruled lines. 5. The form image data after the inclination correction is written to the image memory 1. 6. When the inclination correction is completed, the inclination correction unit 2 instructs the format identification unit 3 to start format identification.

【0016】7. 書式識別開始の指示を受けた書式識
別部3は、イメージメモリ1の帳票イメージデータから
規定の長さ以上の水平・垂直罫線を検出する。 8. 検出した水平罫線上のマークの有無を調べ、マー
クの存在する横罫線で挟まれた副走査範囲の横罫線を除
いて複数の登録書式の罫線と比較する。 9. 登録書式の罫線と一致したものを帳票イメージデ
ータの書式として選択する。
[7] The format identification unit 3 that has received the instruction to start the format identification detects horizontal and vertical ruled lines of a specified length or more from the form image data in the image memory 1. 8. The presence / absence of a mark on the detected horizontal ruled line is checked and compared with the ruled lines of a plurality of registered formats except for the horizontal ruled line in the sub-scanning range sandwiched by the horizontal ruled lines where the mark exists. 9. A format that matches the ruled line of the registration format is selected as the format of the form image data.

【0017】10. 書式を選択すると書式識別部3
は、文字・イメージ切り出し部5へ文字及びイメージ切
り出しを指示する。 11. 文字及びイメージ切り出しの指示を受けた文字
・イメージ切り出し部分は、文字領域を文字認識部6
へ、イメージ記入欄の場合は、イメージ領域を結果編集
部7へ転送する。
10. When a format is selected, format identification unit 3
Instructs the character / image cutout unit 5 to cut out characters and images. 11. The character / image cut-out portion that has received the character / image cut-out instruction is set to a character region by the character
In the case of the image entry column, the image area is transferred to the result editing unit 7.

【0018】12. 文字領域を受信した文字認識部6
は、文字認識した結果の文字コードを結果編集部7へ転
送する。 13. イメージ領域と文字認識結果を取得した結果編
集部7は、これらを外部インタフェースに併せて編集
し、出力する。
[12] Character recognition unit 6 that received the character area
Transfers the character code resulting from the character recognition to the result editing unit 7. 13. The result editing unit 7, which has acquired the image area and the character recognition result, edits these together with the external interface and outputs them.

【0019】[0019]

【実施例】以下、図面と共に本発明の実施例を説明す
る。最初に傾斜補正部2による傾斜補正の方法について
説明する。図4は、本発明の一実施例の傾斜補正部にお
ける傾斜補正の方法を説明するための図である。
Embodiments of the present invention will be described below with reference to the drawings. First, a method of tilt correction by the tilt correction unit 2 will be described. FIG. 4 is a diagram for explaining a method of tilt correction in the tilt correction unit according to one embodiment of the present invention.

【0020】同図において、縦矢印は副走査方向を示
し、横矢印は主走査方向を示す。aは、イメージメモリ
1中の帳票イメージデータ、bは帳票有効領域、cは文
字記入欄、d〜hは規定の長さ以上の横線分検出走査座
標である。なお、帳票中の文字記入欄c及びイメージ記
入欄dの四隅を示すマークe〜hは、一辺がxの正方形
としてマーク記憶部4に記憶してあるものを傾斜補正部
2に読み込んであるものとする。
In FIG. 1, a vertical arrow indicates a sub-scanning direction, and a horizontal arrow indicates a main scanning direction. a is the form image data in the image memory 1, b is a form effective area, c is a character entry field, and d to h are horizontal line segment detection scanning coordinates of a specified length or more. The marks e to h indicating the four corners of the character entry column c and the image entry column d in the form are those which are stored in the mark storage unit 4 as squares with one side being x and read into the inclination correction unit 2. And

【0021】さらに、本実施例では、帳票イメージデー
タが傾斜0度で入力されたものとし、直線jは、イメー
ジ記入欄の横罫線と並行で、直線iは、イメージ記入欄
dの横罫線に対してβ度の傾斜で記載された場合につい
て説明する。次に、図4における動作を説明する。ま
ず、特願平7−247644「イメージデータ入力処理
方法及びその装置」で開示されているように、イメージ
メモリ1に対して走査する角度0から±α(許容傾斜角
|α|≧|β|)まで変化させながら各走査線上の黒画
素を計数する。これにより、規定の長さ以上の黒画素数
を得る走査線として、傾斜0で横線分走査線L1〜L
5、L7,L6が検出でき、傾斜β度で横線分検出走査
線L6が検出できる。次に、検出した横線分検出走査線
L1からL9上の一辺がxの正方形に類似した形状が2
個あるかどうかを調べる。そして、一辺がxの正方形に
類似した形状を2個検出した横線分検出走査線L5とL
8で挟まれる横線分検出走査線L6とL7は、イメージ
記入欄dに記載された直線と判定し、傾斜補正には使用
しない。
Further, in the present embodiment, it is assumed that the form image data is input at an inclination of 0 degree, and the straight line j is parallel to the horizontal ruled line of the image entry column, and the straight line i is the horizontal ruled line of the image entry column d. On the other hand, a description will be given of a case where the angle is described with an inclination of β degrees. Next, the operation in FIG. 4 will be described. First, as disclosed in Japanese Patent Application No. 7-247644, "Image Data Input Processing Method and Apparatus Thereof", an angle of scanning from 0 to ± α (allowable tilt angle | α | ≧ | β | ), While counting the number of black pixels on each scanning line. As a result, the horizontal line scanning lines L1 to L
5, L7, L6 can be detected, and the horizontal line segment detection scanning line L6 can be detected at an inclination β degrees. Next, a shape similar to a square whose one side on the detected horizontal line segment detection scanning lines L1 to L9 is x is 2
Check if there are any. Then, the horizontal line segment detection scanning lines L5 and L5 which have detected two shapes similar to a square with one side x.
The horizontal line detection scanning lines L6 and L7 sandwiched between 8 are determined to be straight lines described in the image entry column d, and are not used for inclination correction.

【0022】なお、複数のイメージ記入欄dがある場合
は、帳票の先頭からマークが検出された奇数番目の罫線
と偶数番目の罫線で挟まれた横線分検出走査線を傾斜補
正には使用しなければよい。このため、検出した横線分
検出走査線L1〜L5,L8,L9の傾斜と副走査座標
Y0〜Y4,Y7,Y8を用い、特願平7−24764
4「イメージデータ入力処理方法及びその装置」で開示
されているように、各罫線傾斜に従い、イメージデータ
を回転させることで傾斜補正ができる。この結果、イメ
ージ記入欄dに記載された規定の長さ以上ある直線iの
影響を受けないで傾斜補正を行うことができる。
When there are a plurality of image entry columns d, a horizontal line detection scanning line sandwiched between an odd-numbered ruled line and an even-numbered ruled line where a mark is detected from the top of the form is used for inclination correction. Good if not. For this reason, the inclinations of the detected horizontal line segment detection scanning lines L1 to L5, L8, and L9 and the sub-scanning coordinates Y0 to Y4, Y7, and Y8 are used, and the Japanese Patent Application No. Hei 7-24764 is used.
4 As disclosed in “Image Data Input Processing Method and Apparatus”, tilt correction can be performed by rotating image data according to each ruled line tilt. As a result, the inclination correction can be performed without being affected by the straight line i having the specified length or more described in the image entry column d.

【0023】なお、本実施例では、正方形に類似した形
状をイメージ記入欄dの四隅を示すマークとしたが、こ
の例に限定されることなく、他の形状を登録したおけ
ば、それを用いることもできる。また、本実施例は、イ
メージ記入欄dの罫線を示すマークを四隅としたが、横
罫線及び縦罫線の延長線上としてもよいし、マーク数も
2個存在することにしたが、各線分に対して1個存在す
るようにしてもよい。
In this embodiment, a shape similar to a square is used as a mark indicating the four corners of the image entry column d. However, the present invention is not limited to this example, and if another shape is registered, it is used. You can also. Further, in this embodiment, the marks indicating the ruled lines in the image entry column d are four corners, but may be on the extension of the horizontal ruled line and the vertical ruled line, and the number of marks is two. Alternatively, there may be one.

【0024】さらに、イメージ記入欄dの信頼性を向上
させるためには、2個のマーク間の距離または、位置を
比較して2罫線の対応をとることもできる。次に、書式
識別部3の動作について説明する。図5は、本発明の一
実施例の書式識別部における書式識別の方法を説明する
ための図である。
Further, in order to improve the reliability of the image entry field d, it is possible to compare the distance or the position between the two marks so as to correspond to two ruled lines. Next, the operation of the format identification unit 3 will be described. FIG. 5 is a diagram for explaining a format identification method in the format identification unit according to one embodiment of the present invention.

【0025】同図において、TH1は、黒画素分布の横
罫線閾値、B1〜B8は、主走査方向の黒画素分布、T
H2は、黒画素分布の縦罫線閾値、A1,A2は、副走
査方向の黒画素分布、S0〜S7は、主走査方向の黒画
素分布の黒画素分布B1〜B8の副走査位置、T0,T
1は副走査方向の黒画素分布A1,A2の主走査位置で
ある。
In the figure, TH1 is the horizontal ruled line threshold of the black pixel distribution, B1 to B8 are the black pixel distribution in the main scanning direction, T1
H2 is the vertical ruled line threshold of the black pixel distribution, A1 and A2 are the black pixel distributions in the sub-scanning direction, S0 to S7 are the sub-scanning positions of the black pixel distributions B1 to B8 in the main scanning direction, T0, T
Reference numeral 1 denotes a main scanning position of the black pixel distributions A1 and A2 in the sub-scanning direction.

【0026】なお、イメージ記入欄13の四隅を示すマ
ークe〜hは、一辺がxの正方形としてマーク記憶部4
に記憶してあるものを書式識別部3に読み込んであるも
のとする。次に、上記の図5における書式識別部3の動
作を説明する。まず、書式識別に必要な罫線を検出する
ため、主走査方向及び副走査方向に黒画素分布を取り、
横罫線の閾値TH1以上の黒画素分布B1〜B8と、副
走査位置S0〜S7を検出する。同様に、縦罫線閾値T
H2以上の黒画素分布A1,A2と、主走査位置T0,
T1を検出する。このとき、直線iは、傾斜しているた
めに検出されない。
The marks e to h indicating the four corners of the image entry field 13 are squares each having a side of x.
Is stored in the format identification unit 3. Next, the operation of the format identification unit 3 in FIG. 5 will be described. First, in order to detect ruled lines required for format identification, black pixel distributions are taken in the main scanning direction and the sub-scanning direction.
Black pixel distributions B1 to B8 equal to or larger than the threshold value TH1 of the horizontal ruled line and sub-scanning positions S0 to S7 are detected. Similarly, the vertical ruled line threshold T
H2 or more black pixel distributions A1, A2 and main scanning positions T0,
Detect T1. At this time, the straight line i is not detected because it is inclined.

【0027】次に、検出した黒画素分布B1〜B8の主
走査線上にある正方形のマークe〜hを図4で説明した
方法と同様の方法で検出する。これにより、本実施例で
は、副走査位置S4にマークe,fが、副走査位置S6
にマークg,hが検出できる。即ち、副走査位置S4と
S6がイメージ記入欄dの横罫線を示していることがわ
かる。そして、副走査位置S4とS6で挟まれた副走査
範囲にある黒画素分布B6は、イメージ記入欄d内の直
線jであることがわかるため、書式識別で用いる罫線情
報でないと判断できる。
Next, square marks e to h on the main scanning lines of the detected black pixel distributions B1 to B8 are detected by a method similar to the method described with reference to FIG. Accordingly, in the present embodiment, the marks e and f are set at the sub-scanning position S6 at the sub-scanning position S4.
Marks g and h can be detected. That is, it can be seen that the sub-scanning positions S4 and S6 indicate horizontal ruled lines in the image entry column d. Since the black pixel distribution B6 in the sub-scanning range sandwiched between the sub-scanning positions S4 and S6 is found to be a straight line j in the image entry column d, it can be determined that it is not ruled line information used for format identification.

【0028】なお、複数のイメージ記入欄dがある場合
は、帳票の先頭からマークが検出された奇数番目の罫線
と偶数番目の罫線で挟まれた横線分検出走査線を書式識
別に使用しなければよい。そした、予め登録してある書
式定義情報の罫線数と相対間隔を比較し、書式識別を行
う。本実施例では、横罫線7本で、これらがS1−S
0,S2−S1,S3−S2,S4−S3,S6−S
4,S7−S6の間隔で縦罫線は2本で、この間隔はT
1−T0であるため、この値に近い書式定義情報を探せ
ばよい。
When there are a plurality of image entry fields d, a horizontal line detection scanning line sandwiched between an odd-numbered ruled line and an even-numbered ruled line where a mark is detected from the top of the form must be used for format identification. I just need. Then, the number of ruled lines in the format definition information registered in advance is compared with the relative interval to identify the format. In the present embodiment, there are seven horizontal ruled lines, which are S1-S
0, S2-S1, S3-S2, S4-S3, S6-S
4, two vertical ruled lines at intervals of S7-S6, and this interval is T
Since 1−T0, format definition information close to this value may be searched for.

【0029】なお、本実施例では、正方形に類似した形
状をイメージ記入欄dの四隅を示すマークとしたが、他
の形状を登録しておけば、それを用いることもできる。
また、本実施例では、イメージ記入欄dの罫線を示すマ
ークは四隅としたが、横罫線の延長線上としてもよい
し、マーク数も各罫線上に2個存在することとしたが、
1個でも可能である。
In the present embodiment, a shape similar to a square is used as a mark indicating the four corners of the image entry column d. However, if another shape is registered, it can be used.
Further, in the present embodiment, the marks indicating the ruled lines in the image entry column d are four corners, but may be on an extension of the horizontal ruled line, and the number of marks is two on each ruled line.
One is possible.

【0030】さらに、イメージ記入欄dの信頼性を向上
させるためには2個のマーク間の距離または、位置も比
較して、2罫線の対応をとることもできる。さらに、書
式識別では、単純に罫線数、罫線間隔を登録してある複
数書式定義情報と比較して書式定義情報を判定したが、
帳票イメージの伸縮や、罫線情報の欠落を考慮した書式
識別を行うには、特願平7−115924「帳票書式識
別方法及び装置」に示すような方法を用いて書式識別を
行うのがよい。
Further, in order to improve the reliability of the image entry column d, the distance or the position between the two marks can be compared to obtain a correspondence between two ruled lines. Furthermore, in the format identification, the number of ruled lines and the ruled line interval are simply compared with a plurality of registered format definition information to determine the format definition information.
In order to perform format identification in consideration of expansion and contraction of a form image and lack of ruled line information, it is preferable to perform format identification using a method as disclosed in Japanese Patent Application No. 7-115924 “Form form identification method and apparatus”.

【0031】また、イメージ記入欄dに記載された直線
は、横線の場合を示したが、縦の直線が記載された場合
でも同様にマークe〜hで挟まれた主走査間の縦の直線
をもちいないで書式識別を行えばよい。次に、文字・イ
メージ切り出し部5における動作を説明する。図6は、
本発明の一実施例の文字・イメージ切り出し部における
文字・イメージ領域の切り出し方法を説明するための図
である。
The straight line described in the image entry column d is a horizontal line. However, even when a vertical straight line is described, a vertical straight line between main scans sandwiched by marks e to h is similarly used. It is sufficient to perform format identification without using. Next, the operation of the character / image cutout unit 5 will be described. FIG.
FIG. 4 is a diagram for explaining a method of extracting a character / image area in a character / image extraction unit according to one embodiment of the present invention.

【0032】同図(A)は、文字領域の切り出し方法を
説明した図であり、kは文字記入欄cを示す罫線の検出
領域、TH3は文字記入欄cを示す横罫線を検出するた
めの横罫線閾値、mは検出領域kにおける横罫線閾値T
H3以上の横罫線黒画素分布、TH4は文字記入欄cを
示す縦罫線を検出するための縦罫線閾値、pは検出領域
kにおける縦罫線閾値TH4以上の縦罫線黒画素分布、
nは文字記入欄cから切り出される文字領域、C0〜C
2は、黒画素分布mの副走査座標、D0〜D7は黒画素
分布pの副走査座標である。
FIG. 7A is a diagram for explaining a method of cutting out a character area, where k is a ruled line detection area indicating a character entry box c, and TH3 is a horizontal ruled line indicating a character entry box c. The horizontal ruled line threshold, m is the horizontal ruled line threshold T in the detection area k.
H3 or more, horizontal ruled line black pixel distribution, TH4 is a vertical ruled line threshold for detecting a vertical ruled line indicating the character entry column c, p is a vertical ruled line black pixel distribution in the detection area k, which is a vertical ruled line threshold TH4 or more,
n is a character area cut out from the character entry field c, C0 to C
2 is the sub-scanning coordinates of the black pixel distribution m, and D0 to D7 are the sub-scanning coordinates of the black pixel distribution p.

【0033】同図(B)は、イメージ領域の切り出し方
法を示す図であり、qはイメージ記入欄dを示す罫線の
検出領域、tは検出領域qにおける横罫線閾値TH5以
上の横罫線黒画素分布、TH6はメッセージ記入欄dの
縦罫線を検出するための縦罫線検出閾値、sは縦罫線閾
値TH6以上の縦罫線黒画素分布、rはイメージ記入欄
dから切り出されるイメージ領域、E0,E1は黒画素
分布tの副走査座標、F0,F1は黒画素分布sの主走
査座標である。
FIG. 7B is a diagram showing a method of cutting out the image area, where q is a ruled line detection area indicating the image entry field d, and t is a horizontal ruled line black pixel in the detection area q that is equal to or larger than the horizontal ruled line threshold TH5. Distribution, TH6 is a vertical ruled line detection threshold for detecting a vertical ruled line in the message entry field d, s is a vertical ruled line black pixel distribution equal to or greater than the vertical ruled line threshold TH6, r is an image area cut out from the image entry field d, E0, E1 Is the sub-scanning coordinates of the black pixel distribution t, and F0 and F1 are the main scanning coordinates of the black pixel distribution s.

【0034】次に、図6における動作を説明する。図6
(A)に示すように、文字記入欄cを検出するため、選
択した書式定義情報(第1番目(A)は、2行7列の文
字記入欄cで罫線座標S0,T0から一定の位置にある
検出領域c内に存在し、横罫線閾値TH3、縦罫線閾値
TH4で、第2番目(B)は、イメージ記入欄dで罫線
座標S0,T0から一定の位置にある検出領域q内に存
在し、横罫線閾値TH5、縦罫線閾値TH6が登録)に
記載された検出領域kの主走査方向及び副走査方向に黒
画素分布をとる。そして、横罫線閾値TH3以上の横罫
線黒画素分布mの副走査座標C0〜C2と、縦罫線閾値
TH4以上の縦罫線黒画素分布pの主走査座標D0〜D
7を得る。但し、このとき、横罫線閾値TH3は文字数
に、縦罫線閾値TH4は行数に比例した値で書式定義情
報に登録してある。このように、検出した副走査座標C
0〜C3と主走査座標D0〜D7で文字記入欄cの各文
字記入枠の角の座標が示される。そして、各文字記入枠
の角の座標より罫線幅を考慮した内側の領域を切り出す
ことで、文字領域nを切り出すことができる。
Next, the operation in FIG. 6 will be described. FIG.
As shown in (A), in order to detect the character entry column c, the selected format definition information (first (A) is a fixed position from the ruled line coordinates S0, T0 in the character entry column c of 2 rows and 7 columns. The second rule (B) exists in the detection area c located at a certain position from the ruled line coordinates S0, T0 in the image entry field d. There is a black pixel distribution in the main scanning direction and the sub-scanning direction of the detection area k which exists and is described in the horizontal ruled line threshold TH5 and the vertical ruled line threshold TH6. Then, the sub-scanning coordinates C0 to C2 of the horizontal ruled line black pixel distribution m equal to or more than the horizontal ruled line threshold TH3, and the main scanning coordinates D0 to D of the vertical ruled line black pixel distribution p equal to or more than the vertical ruled line threshold TH4.
Get 7. However, at this time, the horizontal ruled line threshold value TH3 is registered in the format definition information as a value proportional to the number of characters, and the vertical ruled line threshold value TH4 is registered in the format definition information. Thus, the detected sub-scanning coordinates C
0 to C3 and main scanning coordinates D0 to D7 indicate the coordinates of the corners of each character entry frame in the character entry box c. Then, the character area n can be cut out by cutting out the inner area in consideration of the ruled line width from the coordinates of the corners of each character entry frame.

【0035】次に、同図(B)に示すように、イメージ
記入欄dを検出するため、書式定義情報の2番目の検出
領域qに対して、主走査方向と副走査方向に黒画素分布
をとる。そして、横罫線閾値TH5以上の横罫線黒画素
分布tの副走査座標E0,E1と縦罫線閾値TH6以上
の縦罫線黒画素分布sの主走査座標F0〜F1を得る。
このように検出した副走査座標E0,E1と副走査座標
F0,F1でイメージ記入欄dの角の座標が示される。
そして、この角の座標より罫線幅を考慮した内側の領域
に対応するイメージ領域rをイメージモリ部1から切り
出すことで帳票イメージデータ10のイメージ領域rを
切り出すことができる。
Next, as shown in FIG. 3B, in order to detect the image entry field d, the black pixel distribution in the main scanning direction and the sub-scanning direction is performed for the second detection area q of the format definition information. Take. Then, the sub-scanning coordinates E0 and E1 of the horizontal ruled line black pixel distribution t having the horizontal ruled line threshold TH5 or more and the main scanning coordinates F0 to F1 of the vertical ruled line black pixel distribution s having the vertical ruled line threshold TH6 or more are obtained.
The coordinates of the corners of the image entry field d are indicated by the sub-scanning coordinates E0 and E1 and the sub-scanning coordinates F0 and F1 thus detected.
Then, the image area r of the form image data 10 can be cut out by cutting out the image area r corresponding to the inner area in consideration of the ruled line width from the corner coordinates from the image memory unit 1.

【0036】また、本発明は図3に示す構成をプログラ
ムとして構築し、当該処理装置に接続されるディスク装
置や、フロッピーディスク、CD−ROM等の可搬記憶
媒体に格納しておくことにより、汎用的に利用すること
が可能である。なお、本発明は、上記の実施例に限定さ
れることなく、特許請求の範囲内で種々変更・応用が可
能である。
In addition, the present invention constructs the configuration shown in FIG. 3 as a program and stores it in a portable storage medium such as a disk device connected to the processing device, a floppy disk, or a CD-ROM. It can be used for general purposes. It should be noted that the present invention is not limited to the above-described embodiment, but can be variously modified and applied within the scope of the claims.

【0037】[0037]

【発明の効果】上述のように、本発明によれば、罫線を
用いた帳票イメージ記入欄に傾斜補正及び書式識別で用
いる罫線と同程度の長さ、直線が記載されてもイメージ
記入欄内の直線を無視して処理をすることを可能とした
ことにより、記載イメージに影響されない傾斜補正及び
書式識別が可能となり、正確なイメージの切り出しが可
能となる。
As described above, according to the present invention, even if the same length and straight line as the ruled line used for inclination correction and format identification are described in the form image filled-in column using the ruled line, the image can be stored in the image filled-in column. , The inclination can be corrected and the format can be identified without being affected by the written image, and an accurate image can be cut out.

【0038】また、イメージ記入欄を示すマーク形状も
変更できるため、サービスによって類似形状の出にくい
形状を用いることができる。さらに、本発明は、イメー
ジ記入欄のない場合や、イメージ記入欄にマークのない
場合でも処理可能であり、従来の帳票処理と互換性を保
つことができる。
Further, since the shape of the mark indicating the image entry column can be changed, it is possible to use a shape that is unlikely to appear depending on the service. Further, the present invention can be processed even when there is no image entry column or when there is no mark in the image entry column, and can maintain compatibility with the conventional form processing.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の原理を説明するための図である。FIG. 1 is a diagram for explaining the principle of the present invention.

【図2】本発明の原理構成図である。FIG. 2 is a principle configuration diagram of the present invention.

【図3】本発明の帳票イメージ処理装置の構成図であ
る。
FIG. 3 is a configuration diagram of a form image processing apparatus of the present invention.

【図4】本発明の一実施例の傾斜補正部における傾斜補
正の方法を説明するための図である。
FIG. 4 is a diagram for explaining a method of tilt correction in a tilt correction unit according to one embodiment of the present invention.

【図5】本発明の一実施例の書式識別部における書式識
別の方法を説明するための図である。
FIG. 5 is a diagram for explaining a format identification method in a format identification unit according to one embodiment of the present invention.

【図6】本発明の一実施例の文字・イメージ切り出し部
における文字・イメージ領域の切り出し方法を説明する
ための図である。
FIG. 6 is a diagram for explaining a method of extracting a character / image area in a character / image extraction unit according to one embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 イメージメモリ部、帳票イメージ記憶手段 2 傾斜補正部、傾斜補正手段 3 書式識別部、書式識別手段 4 マーク記憶部 5 文字・イメージ切り出し部 6 文字認識部 7 結果編集部 8 帳票入力手段 DESCRIPTION OF SYMBOLS 1 Image memory part, form image storage means 2 Inclination correction part, inclination correction means 3 Format identification part, format identification means 4 Mark storage part 5 Character / image cutout part 6 Character recognition part 7 Result editing part 8 Form input means

───────────────────────────────────────────────────── フロントページの続き (72)発明者 関谷 博 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 小倉 健司 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 ──────────────────────────────────────────────────続 き Continuing on the front page (72) Hiroshi Sekiya, Inventor Hiroshi 3-chome, Nishishinjuku 3-chome, Shinjuku-ku, Tokyo Japan (72) Kenji Ogura, Inventor Kenji 3-192-1, Nishishinjuku, Shinjuku-ku, Tokyo No. Japan Telegraph and Telephone Corporation

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 文字やイメージを記載した帳票をファク
シミリやスキャナで入力した文字認識及びイメージ切り
出しを行う帳票イメージ処理方法において、 前記帳票の文字及びイメージ記入欄を示す罫線と該イメ
ージ記入欄の位置を示すマークがファクシミリやスキャ
ナで感知できる色で記載した帳票が入力されると、 入力された前記帳票の帳票イメージをメモリに格納し、 前記帳票イメージの横罫線の検出と該横罫線上または、
該横罫線の延長上にあるマークを検出し、 前記マークの存在する横罫線または、該横罫線の延長線
で挟まれた副走査範囲以外の横罫線を用いて傾斜補正を
行い、 前記傾斜補正を行った帳票イメージから、水平罫線の検
出と該水平罫線上または、該水平罫線の延長上にあるマ
ークを検出し、 前記マークで挟まれた副走査範囲以外の水平罫線を用い
て帳票の識別を行うことを特徴とする帳票イメージ処理
方法。
1. A form image processing method for recognizing a character and an image cut out by inputting a form on which a character or an image is described by a facsimile or a scanner, wherein a ruled line indicating a character and image entry field of the form and a position of the image entry field When a form in which the mark indicating is described in a color that can be detected by a facsimile or a scanner is input, the form image of the input form is stored in a memory, and the detection of the horizontal ruled line of the form image and the horizontal ruled line or
Detecting a mark on an extension of the horizontal ruled line, performing tilt correction using a horizontal ruled line in which the mark is present or a horizontal ruled line other than the sub-scanning range sandwiched between the extended lines of the horizontal ruled line; Detection of horizontal ruled lines and a mark on the horizontal ruled line or an extension of the horizontal ruled line from the image of the form, and identifying the form using horizontal ruled lines other than the sub-scanning range sandwiched between the marks. And a form image processing method.
【請求項2】 前記傾斜補正を行った帳票イメージから
垂直罫線の検出と、該垂直罫線上または、該垂直罫線の
延長線上にあるマークを検出し、該マークで挟まれた主
走査範囲以外の垂直罫線を用いて前記帳票の識別を行う
請求項1記載の帳票イメージ処理方法。
2. A vertical ruled line is detected from the form image on which the tilt correction has been performed, a mark on the vertical ruled line or an extension of the vertical ruled line is detected, and a mark other than the main scanning range sandwiched by the mark is detected. 2. The form image processing method according to claim 1, wherein the form is identified using a vertical ruled line.
【請求項3】 前記イメージ記入欄の位置を示すマーク
を登録可能とする請求項1記載の帳票イメージ処理方
法。
3. The form image processing method according to claim 1, wherein a mark indicating the position of the image entry field can be registered.
【請求項4】 文字やイメージを記載した帳票をファク
シミリやスキャナで入力した文字認識及びイメージ切り
出しを行う帳票イメージ処理装置であって、 前記帳票の文字及びイメージ記入欄を示す罫線と該イメ
ージ記入欄の位置を示すマークがファクシミリやスキャ
ナで感知できる色で記載した帳票を入力する帳票入力手
段と、 前記帳票入力手段により入力された前記帳票の帳票イメ
ージを格納する帳票イメージ記憶手段と、 前記帳票イメージ記憶手段から帳票イメージを取得し
て、該帳票イメージの横罫線の検出と、該横罫線上また
は、該横罫線の延長上にあるマークを検出し、該マーク
の存在する横罫線または、該横罫線の延長線で挟まれた
副走査範囲以外の横罫線を用いて傾斜補正を行う傾斜補
正手段と、 前記傾斜補正手段により前記傾斜補正を行った帳票イメ
ージから、水平罫線の検出と、該水平罫線上または、該
水平罫線の延長線上にあるマークを検出し、該マークで
挟まれた副走査範囲以外の水平罫線を用いて帳票の識別
する書式識別手段とを有することを特徴とする帳票イメ
ージ処理装置。
4. A form image processing apparatus for recognizing a character and an image cut out by inputting a form on which a character or an image is described by a facsimile or a scanner, and comprising a ruled line indicating a character and image entry field of the form and an image entry field Form input means for inputting a form in which a mark indicating the position of the form is described in a color that can be detected by a facsimile or a scanner, form image storage means for storing a form image of the form input by the form input means, and the form image The form image is acquired from the storage means, the horizontal ruled line of the form image is detected, and a mark on the horizontal ruled line or on an extension of the horizontal ruled line is detected, and the horizontal ruled line where the mark exists or the horizontal ruled line is detected. An inclination correction unit that performs inclination correction using a horizontal ruled line other than the sub-scanning range sandwiched by extension lines of the ruled line; From the form image subjected to the inclination correction, horizontal ruled lines are detected, and marks on the horizontal ruled lines or on extensions of the horizontal ruled lines are detected, and horizontal ruled lines other than the sub-scanning range sandwiched between the marks are used. A form identifying means for identifying the form.
【請求項5】 前記書式識別手段は、 前記傾斜補正を行った帳票イメージから垂直罫線の検出
と、該垂直罫線上または、該垂直罫線の延長線上にある
マークを検出し、該マークで挟まれた主走査範囲以外の
垂直罫線を用いて前記帳票の識別を行う手段を含む請求
項4記載の帳票イメージ処理装置。
5. The format identification means detects a vertical ruled line from a form image on which the tilt correction has been performed, detects a mark on the vertical ruled line or an extension of the vertical ruled line, and sandwiches the mark. 5. The form image processing apparatus according to claim 4, further comprising means for identifying the form using vertical ruled lines other than the main scanning range.
【請求項6】 前記イメージ記入欄の位置を示すマーク
を登録するマーク登録手段を更に有する請求項5記載の
帳票イメージ処理装置。
6. The form image processing apparatus according to claim 5, further comprising a mark registration unit for registering a mark indicating a position of the image entry column.
【請求項7】 文字やイメージを記載した帳票をファク
シミリやスキャナで入力した文字認識及びイメージ切り
出しを行う帳票イメージ処理プログラムを格納した記憶
媒体であって、 前記帳票の文字及びイメージ記入欄を示す罫線と該イメ
ージ記入欄の位置を示すマークがファクシミリやスキャ
ナで感知できる色で記載した帳票を入力させる帳票入力
プロセスと、 前記帳票入力プロセスにより入力された前記帳票の帳票
イメージを格納する帳票イメージ記憶プロセスと、 前記帳票イメージ記憶プロセスから帳票イメージを取得
して、該帳票イメージの横罫線の検出と、該横罫線上ま
たは、該横罫線の延長上にあるマークを検出し、該マー
クの存在する横罫線または、該横罫線の延長線で挟まれ
た副走査範囲以外の横罫線を用いて傾斜補正を行う傾斜
補正プロセスと、 前記傾斜補正プロセスにより前記傾斜補正を行った帳票
イメージから、水平罫線の検出と、該水平罫線上また
は、該水平罫線の延長線上にあるマークを検出し、該マ
ークで挟まれた副走査範囲以外の水平罫線を用いて帳票
の識別する書式識別プロセスとを有することを特徴とす
る帳票イメージ処理プログラムを格納した記憶媒体。
7. A storage medium storing a form image processing program for recognizing characters and inputting a form on which a character or image is described by a facsimile or a scanner, and a ruled line indicating a character and image entry field of the form And a form input process for inputting a form in which a mark indicating the position of the image entry field is described in a color that can be detected by a facsimile or a scanner, and a form image storing process for storing a form image of the form input by the form input process. Acquiring a form image from the form image storage process, detecting a horizontal ruled line of the form image, detecting a mark on the horizontal ruled line or an extension of the horizontal ruled line, Tilt correction is performed using a ruled line or a horizontal ruled line other than the sub-scanning range sandwiched by extensions of the horizontal ruled line. A horizontal ruled line, a mark on the horizontal ruled line or an extension of the horizontal ruled line is detected from the form image on which the tilt correction has been performed by the tilt correction process. A form identification process for identifying a form using horizontal ruled lines other than the specified sub-scanning range.
【請求項8】 前記書式識別プロセスは、 前記傾斜補正を行った帳票イメージから垂直罫線の検出
と、該垂直罫線上または、該垂直罫線の延長線上にある
マークを検出し、該マークで挟まれた主走査範囲以外の
垂直罫線を用いて前記帳票の識別を行うプロセスを含む
請求項7記載の帳票イメージ処理プログラムを格納した
記憶媒体。
8. The format identification process includes detecting a vertical ruled line from a form image on which the tilt correction has been performed, detecting a mark on the vertical ruled line or an extension of the vertical ruled line, and sandwiching the mark. 8. A storage medium storing a form image processing program according to claim 7, including a process of identifying the form using vertical ruled lines other than the main scanning range.
【請求項9】 前記イメージ記入欄の位置を示すマーク
を登録するマーク登録プロセスを更に有する請求項7記
載の帳票イメージ処理プログラムを格納した記憶媒体。
9. The storage medium storing the form image processing program according to claim 7, further comprising a mark registration process for registering a mark indicating a position of the image entry field.
JP9280768A 1997-10-14 1997-10-14 Method and device for processing document image, and storage medium stored with document image processing program Pending JPH11120260A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9280768A JPH11120260A (en) 1997-10-14 1997-10-14 Method and device for processing document image, and storage medium stored with document image processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9280768A JPH11120260A (en) 1997-10-14 1997-10-14 Method and device for processing document image, and storage medium stored with document image processing program

Publications (1)

Publication Number Publication Date
JPH11120260A true JPH11120260A (en) 1999-04-30

Family

ID=17629697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9280768A Pending JPH11120260A (en) 1997-10-14 1997-10-14 Method and device for processing document image, and storage medium stored with document image processing program

Country Status (1)

Country Link
JP (1) JPH11120260A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101834968A (en) * 2009-03-10 2010-09-15 佳能株式会社 Image processing equipment and image processing method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101834968A (en) * 2009-03-10 2010-09-15 佳能株式会社 Image processing equipment and image processing method

Similar Documents

Publication Publication Date Title
JP3278471B2 (en) Area division method
JPH1139428A (en) Direction correcting method for document video
JP2002056398A (en) Document image processing device, document image processing method, and storage medium
JP4983464B2 (en) Form image processing apparatus and form image processing program
JPH11120260A (en) Method and device for processing document image, and storage medium stored with document image processing program
JPH08329187A (en) Document reader
JPH0728935A (en) Document image processor
JPS6054082A (en) Optical character reader
JPH07230525A (en) Method for recognizing ruled line and method for processing table
JP3019897B2 (en) Line segmentation method
JPS63158676A (en) Area extracting device
JP4242962B2 (en) Character extractor
JP2902694B2 (en) Optical character reader
JP2824372B2 (en) Report recognition device
JPH10154191A (en) Business form identification method and device, and medium recording business form identification program
JPH09288714A (en) Method and device for recognizing table
JPS61198376A (en) Optical character reader
JPS63250787A (en) Method for segmentating character
JP3564987B2 (en) Optical character reader
JPH10124610A (en) Optical character reading device
JP2004013188A (en) Business form reading device, business form reading method and program therefor
JPH05314311A (en) Optical character reader
JPH10307887A (en) Document reading method and computer-readable recording medium storing document reading program
JPH03160582A (en) Method for separating ruled line and character in document picture data
JP2007079966A (en) Character recognition device