JP2011227542A - Form - Google Patents

Form Download PDF

Info

Publication number
JP2011227542A
JP2011227542A JP2010093825A JP2010093825A JP2011227542A JP 2011227542 A JP2011227542 A JP 2011227542A JP 2010093825 A JP2010093825 A JP 2010093825A JP 2010093825 A JP2010093825 A JP 2010093825A JP 2011227542 A JP2011227542 A JP 2011227542A
Authority
JP
Japan
Prior art keywords
symbol
processing
start symbol
region
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010093825A
Other languages
Japanese (ja)
Other versions
JP4798296B1 (en
Inventor
Mariko Takenouchi
磨理子 竹之内
Saki Takakura
穂 高倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2010093825A priority Critical patent/JP4798296B1/en
Priority to CN2011800191639A priority patent/CN102844770A/en
Priority to PCT/JP2011/002195 priority patent/WO2011129114A1/en
Application granted granted Critical
Publication of JP4798296B1 publication Critical patent/JP4798296B1/en
Publication of JP2011227542A publication Critical patent/JP2011227542A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Abstract

PROBLEM TO BE SOLVED: To provide a form processing apparatus capable of quickly and accurately specifying a mentioned position of each item in an input image to perform processing in each item even when a form image is input with an image input device such as a camera of which a form photographing state is unstable, and to provide a recording medium.SOLUTION: About a form in which a processing target area is held between a start symbol and an end symbol which express an existing direction and a height of the processing target area surrounded by a fixed unmentioned area, an area symbol detection part detects the start symbol and the end symbol from the input image, an area extraction part extracts the processing target area by using the positions, heights and directions of the start symbol and the end symbol, and a processing part extracts the start symbol and the end symbol of each item from the input image of the form and specifies the mentioned position of each item in the input image by processing contents mentioned in the processing target area in accordance with the sorts of the start symbol and the end symbol to perform processing in each item.

Description

本発明は、情報の項目の種類とその内容の記入位置が示された帳票と、内容が記入された後の帳票を画像入力して処理する帳票処理装置及び帳票処理方法に関するものである。   The present invention relates to a form that indicates the type of information item and the entry position of the contents, and a form processing apparatus and form processing method for processing images after inputting the contents.

従来の帳票処理装置である、記録媒体に記載されている文字や記号の読取、写真検出等を行うOCRやOMR、各種帳票リーダーでは、帳票に予め記載されているタイミングマークや罫線情報を利用して帳票画像全体の傾きや縮尺を検出し、予め登録されているレイアウト情報を用いて、各項目の入力画像内の記載位置を特定していた。図10(a)は、従来の帳票フォーマットの1例である。   Conventional form processing devices such as OCR, OMR, and various form readers that read characters and symbols written on recording media, detect photos, etc., use timing marks and ruled line information pre-written on forms. Thus, the inclination and scale of the entire form image are detected, and the description position in the input image of each item is specified using layout information registered in advance. FIG. 10A shows an example of a conventional form format.

特開平5−159099号公報Japanese Patent Laid-Open No. 5-159099

しかしながら、従来の帳票処理装置は、スキャナ入力等、入力画像の変形が一定の範囲に収まるものを想定していたため、カメラ等で帳票を撮影して画像入力すると、図10(b)に示すように、入力画像の大幅な回転や撮影俯角による画像の歪みが発生し、タイミングマークや罫線の抽出に失敗して項目領域を抽出できない場合があった。   However, since the conventional form processing apparatus assumes that the deformation of the input image is within a certain range, such as scanner input, when a form is photographed and input by a camera or the like, as shown in FIG. In addition, the image may be distorted due to a significant rotation of the input image or a shooting depression angle, and the extraction of timing marks and ruled lines may fail to extract item areas.

また、内容を記入する際に、入力した文字が罫線に接触した場合、入力画像において罫線と記入内容との区別が困難で、罫線の抽出に失敗する場合があった。   Further, when entering the content, if the input character touches the ruled line, it is difficult to distinguish the ruled line from the entered content in the input image, and the ruled line extraction may fail.

また、各項目内の記入位置が示されている場合、入力画像において記入位置を示す表記と記入内容との区別が困難で、記入内容の処理に失敗する場合があった。   Further, when the entry position in each item is shown, it is difficult to distinguish between the notation indicating the entry position and the entry content in the input image, and the entry content processing may fail.

本発明は、前記従来の課題を解決するもので、カメラ等の帳票撮影状態が不安定な画像入力装置で帳票画像を入力した場合でも、高速に精度良く、各項目の入力画像内の記載位置を特定し、各項目毎の処理を行うことができる帳票処理装置及び記録媒体を提供することを目的とする。   The present invention solves the above-mentioned conventional problems, and even when a form image is input by an image input device such as a camera whose image capturing state is unstable, the position of each item in the input image is accurately described at high speed. It is an object of the present invention to provide a form processing apparatus and a recording medium that can identify each item and perform processing for each item.

前記従来の課題を解決するために、本発明の帳票は、手書きされあるいは計算機で読み取られる帳票であって、前記帳票は、計算機で読み取られる際の読取り領域の高さと方向と開始位置を示す開始記号及び計算機で読み取られる際の読取り領域の終了位置を示す終了記号を有し、前記開始記号は該開始記号に対する前記読取り領域の方向および前記読取り領域の高さを示している。   In order to solve the above-described conventional problems, the form of the present invention is a form that is handwritten or read by a computer, and the form indicates the height and direction of the reading area and the start position when the form is read by the computer. A symbol and an end symbol indicating the end position of the reading area when read by the computer, the start symbol indicating the direction of the reading area relative to the starting symbol and the height of the reading area.

これにより、本構成によって、本帳票を読み取った計算機が、読み取った入力画像から項目の開始記号及び終了記号を抽出して各項目の入力画像内の記載位置を特定し、各項目毎の処理を行うことが出来る。   Thus, with this configuration, the computer that has read this form extracts the start symbol and end symbol of the item from the read input image, specifies the description position in the input image of each item, and performs the processing for each item. Can be done.

また、本発明の帳票は、処理対象領域が、開始記号と終了記号と罫線または不記載領域で囲まれている。   In the form of the present invention, the processing target area is surrounded by a start symbol, an end symbol, a ruled line, or a non-recording area.

これにより、 本帳票を読み取った計算機が、読み取った入力画像から項目の開始記号及び終了記号及び罫線を抽出して各項目の入力画像内の記載位置を特定し、各項目毎の処理を行うことが出来る。 As a result, the computer that has read this form extracts the start symbol, end symbol, and ruled line of the item from the read input image, specifies the description position in the input image of each item, and performs processing for each item. I can do it.

さらに、本発明の帳票は、記入シートと複写シートで構成され、複写シートが計算機によって読み取られる帳票であって、前記複写シートの開始記号あるいは終了記号が前記記入シートの開始記号あるいは終了記号より小さい。
これにより、記入シートを記入する際は、開始記号が大きいので文字などの記入がしやすく、複写シートを計算機読み取るときは、開始記号と文字の間が離れることになるので、計算機読み取りやすくなる。
Further, the form of the present invention is composed of an entry sheet and a copy sheet, and the copy sheet is read by a computer, and the start symbol or end symbol of the copy sheet is smaller than the start symbol or end symbol of the entry sheet. .
Thus, when filling in the entry sheet, the start symbol is large, so that it is easy to enter characters and the like. When the copy sheet is read by a computer, the start symbol and the character are separated from each other.

さらに、本発明の帳票は、記入シートと複写シートで構成され、複写シートが計算機によって読み取られる帳票であって、前記記入シートは前記開始記号あるいは前記終了記号を有する。
これにより、記入シートの開始記号あるいは終了記号の位置にあわせて記入することができる。
Further, the form of the present invention is composed of an entry sheet and a copy sheet, and the copy sheet is read by a computer, and the entry sheet has the start symbol or the end symbol.
Thereby, it can fill in according to the position of the start symbol or end symbol of an entry sheet.

さらに、本発明の帳票処理装置は、処理対象領域を含む画像を入力する画像入力部と、前記画像入力部で入力した入力画像から、開始記号及び終了記号及び必要に応じて罫線を検出する領域記号検出部と、前記領域記号検出部で検出した開始記号及び終了記号の位置と高さと方向と種類を用いて処理対象領域を抽出する領域抽出部と、前記領域抽出部で抽出した処理対象領域に記載されている内容を開始記号及び終了記号の種類に従って処理する処理部と、前記処理部で処理した結果を出力する出力部との構成を有している。   Furthermore, the form processing apparatus of the present invention includes an image input unit that inputs an image including a processing target region, and a region that detects a start symbol, an end symbol, and a ruled line as necessary from the input image input by the image input unit. A symbol detection unit, a region extraction unit that extracts a processing target region using the position, height, direction, and type of the start symbol and end symbol detected by the region symbol detection unit, and the processing target region extracted by the region extraction unit Is configured with a processing unit that processes the contents described in the above according to the type of the start symbol and the end symbol, and an output unit that outputs the result of processing by the processing unit.

この構成により、読み取った入力画像から項目の開始記号及び終了記号を抽出して各項目の入力画像内の記載位置を特定し、各項目毎の処理を行うことが出来る。   With this configuration, it is possible to extract the start symbol and end symbol of an item from the read input image, specify the description position in the input image of each item, and perform processing for each item.

さらに、本発明の帳票処理方法は、処理対象領域を含む画像を入力する画像入力ステップと、前記画像入力ステップで入力した入力画像から、開始記号及び終了記号及び必要に応じて罫線を検出する領域記号検出ステップと、前記領域記号検出ステップで検出した開始記号及び終了記号の位置と高さと方向と種類を用いて処理対象領域を抽出する領域抽出ステップと、前記領域抽出ステップで抽出した処理対象領域に記載されている内容を開始記号及び終了記号の種類に従って処理する処理ステップと、前記処理ステップで処理した結果を出力する出力ステップの構成を有している。   Further, the form processing method of the present invention includes an image input step for inputting an image including a processing target region, and a region for detecting a start symbol and an end symbol and, if necessary, a ruled line from the input image input in the image input step. A symbol detection step, a region extraction step for extracting a processing target region using the position, height, direction, and type of the start symbol and end symbol detected in the region symbol detection step, and the processing target region extracted in the region extraction step Are processed in accordance with the type of start symbol and end symbol, and an output step for outputting the result processed in the processing step.

この構成により、読み取った入力画像から項目の開始記号及び終了記号を抽出して各項目の入力画像内の記載位置を特定し、各項目毎の処理を行うことが出来る。   With this configuration, it is possible to extract the start symbol and end symbol of an item from the read input image, specify the description position in the input image of each item, and perform processing for each item.

さらに、本発明の帳票処理プログラムは、処理対象領域を含む画像を入力する画像入力ステップと、前記画像入力ステップで入力した入力画像から、開始記号及び終了記号及び必要に応じて罫線を検出する領域記号検出ステップと、前記領域記号検出ステップで検出した開始記号及び終了記号の位置と高さと方向と種類を用いて処理対象領域を抽出する領域抽出ステップと、前記領域抽出ステップで抽出した処理対象領域に記載されている内容を開始記号及び終了記号の種類に従って処理する処理ステップと、前記処理ステップで処理した結果を出力する出力ステップの構成を有している。   Further, the form processing program of the present invention includes an image input step for inputting an image including a processing target region, and a region for detecting a start symbol and an end symbol and, if necessary, a ruled line from the input image input in the image input step. A symbol detection step, a region extraction step for extracting a processing target region using the position, height, direction, and type of the start symbol and end symbol detected in the region symbol detection step, and the processing target region extracted in the region extraction step Are processed in accordance with the type of start symbol and end symbol, and an output step for outputting the result processed in the processing step.

この構成により、計算機に、読み取った入力画像から項目の開始記号及び終了記号を抽出して各項目の入力画像内の記載位置を特定し、各項目毎の処理を行わせることが出来る。   With this configuration, the computer can extract the start symbol and end symbol of the item from the read input image, specify the description position in the input image of each item, and perform processing for each item.

さらに、本発明の帳票処理媒体は、処理対象領域を含む画像を入力する画像入力ステップと、前記画像入力ステップで入力した入力画像から、開始記号及び終了記号及び必要に応じて罫線を検出する領域記号検出ステップと、前記領域記号検出ステップで検出した開始記号及び終了記号の位置と高さと方向と種類を用いて処理対象領域を抽出する領域抽出ステップと、前記領域抽出ステップで抽出した処理対象領域に記載されている内容を開始記号及び終了記号の種類に従って処理する処理ステップと、前記処理ステップで処理した結果を出力する出力ステップから構成されるプログラムを記録する構成を有している。   Furthermore, the form processing medium of the present invention includes an image input step for inputting an image including a processing target region, and a region for detecting a start symbol and an end symbol and, if necessary, a ruled line from the input image input in the image input step. A symbol detection step, a region extraction step for extracting a processing target region using the position, height, direction, and type of the start symbol and end symbol detected in the region symbol detection step, and the processing target region extracted in the region extraction step Is recorded in accordance with the type of start symbol and end symbol, and a program comprising an output step for outputting the result of processing in the processing step is recorded.

この構成により、計算機に、読み取った入力画像から項目の開始記号及び終了記号を抽出して各項目の入力画像内の記載位置を特定し、各項目毎の処理を行わせるプログラムを記録することが出来る。   With this configuration, it is possible to record a program that causes the computer to extract the start symbol and end symbol of an item from the read input image, identify the description position in the input image of each item, and perform processing for each item. I can do it.

本発明の帳票処理装置及び記録媒体によれば、項目の開始記号及び終了記号を抽出するだけで項目領域を特定でき、入力画像の変動に、高速に精度良く対応できる。   According to the form processing apparatus and the recording medium of the present invention, it is possible to specify an item area simply by extracting a start symbol and an end symbol of an item, and it is possible to cope with fluctuations in an input image at high speed and with high accuracy.

本発明の実施の形態1における帳票処理装置の構成図Configuration diagram of a form processing apparatus according to Embodiment 1 of the present invention 本発明の実施の形態1における帳票処理装置の制御概略図Control schematic diagram of form processing apparatus in Embodiment 1 of the present invention 本発明の実施の形態1における帳票の構成図Configuration diagram of a form according to the first embodiment of the present invention 本発明の実施の形態1における入力帳票画像の説明図Explanatory drawing of the input form image in Embodiment 1 of this invention 本発明の実施の形態1における領域記号検出部の説明図Explanatory drawing of the area | region symbol detection part in Embodiment 1 of this invention 本発明の実施の形態1における領域抽出部の説明図Explanatory drawing of the area | region extraction part in Embodiment 1 of this invention 本発明の実施の形態1における領域抽出部の説明図Explanatory drawing of the area | region extraction part in Embodiment 1 of this invention 本発明の実施の形態1における伝票を示す説明図Explanatory drawing which shows the slip in Embodiment 1 of this invention. 本発明の実施の形態1における伝票を示す説明図Explanatory drawing which shows the slip in Embodiment 1 of this invention. 従来の帳票処理装置及び記録媒体の説明図Explanatory drawing of conventional form processing apparatus and recording medium

以下本発明の実施の形態について、図面を参照しながら説明する。   Embodiments of the present invention will be described below with reference to the drawings.

(実施の形態1)
図1は、本発明の実施の形態1における帳票処理装置の構成図である。
(Embodiment 1)
FIG. 1 is a configuration diagram of a form processing apparatus according to Embodiment 1 of the present invention.

図1において、101は画像入力部であり、処理対象領域を含む画像を入力する。
102は領域記号検出部であり、画像入力部101で入力した入力画像から、開始記号及び終了記号及び必要に応じて罫線を検出する。
In FIG. 1, an image input unit 101 inputs an image including a processing target area.
An area symbol detection unit 102 detects a start symbol, an end symbol, and a ruled line as necessary from the input image input by the image input unit 101.

103は領域抽出部であり、領域記号検出部102で検出した開始記号及び終了記号の位置と高さと方向と種類を用いて処理対象領域を抽出する。104は処理部であり、領域抽出部103で抽出した処理対象領域に記載されている内容を開始記号及び終了記号の種類に従って処理する。105は出力部であり、処理部104で処理した結果を出力する。   Reference numeral 103 denotes a region extraction unit that extracts a processing target region using the position, height, direction, and type of the start symbol and end symbol detected by the region symbol detection unit 102. A processing unit 104 processes the contents described in the processing target area extracted by the area extracting unit 103 according to the type of start symbol and end symbol. Reference numeral 105 denotes an output unit that outputs a result processed by the processing unit 104.

なお、画像入力部、領域記号検出部、領域抽出部、処理部等の各機能ブロックは、典型的には集積回路であるLSIとして実現されてもよい。集積回路化の手法は、LSIに限るものではない。これらは、個別に1チップ化されてもよいし、一部又は全部を含むように1チップ化されてもよい。   Note that the functional blocks such as the image input unit, the region symbol detection unit, the region extraction unit, and the processing unit may be typically realized as an LSI that is an integrated circuit. The method of circuit integration is not limited to LSI. These may be individually made into one chip, or may be made into one chip so as to include a part or all of them.

図2は、本発明の実施の形態1における帳票処理装置の制御概略図である。画像入力ステップS101で、処理対象領域を含む画像を入力し、S102に進む。領域記号検出ス
テップS102で、入力画像から開始記号及び終了記号及び必要に応じて罫線を検出し、開始記号及び終了記号の位置と高さと方向と種類を検出し、S103に進む。
FIG. 2 is a control schematic diagram of the form processing apparatus according to Embodiment 1 of the present invention. In an image input step S101, an image including a processing target area is input, and the process proceeds to S102. In area symbol detection step S102, a start symbol, an end symbol, and a ruled line are detected from the input image, and the position, height, direction, and type of the start symbol and end symbol are detected, and the process proceeds to S103.

領域記号検証ステップS103で、開始記号及び終了記号及び罫線の形状や組合せや位置関係を検証し、不可であればS101に進み、可であればS104に進む。領域画像抽出ステップS104で、処理対象領域画像を抽出し、処理対象領域画像が変形していた場合はS105に進み、変形していない場合は項目に応じてS106,S107,S108に進む。   In region symbol verification step S103, the shape, combination, and positional relationship of the start symbol, the end symbol, and the ruled line are verified. If not, the process proceeds to S101, and if possible, the process proceeds to S104. In the region image extraction step S104, the processing target region image is extracted. If the processing target region image has been deformed, the process proceeds to S105, and if not, the process proceeds to S106, S107, S108 depending on the item.

領域画像補正ステップS105で、処理対象領域画像を補正し、項目に応じてS106,S107,S108に進む。   In the region image correction step S105, the processing target region image is corrected, and the process proceeds to S106, S107, and S108 depending on the item.

文字認識ステップS106は、処理対象領域画像に対して文字認識処理を行い、S109に進む。記号認識ステップS107は、処理対象領域画像に対して記号認識処理を行い、S109に進む。   In the character recognition step S106, a character recognition process is performed on the processing target area image, and the process proceeds to S109. In the symbol recognition step S107, a symbol recognition process is performed on the processing target region image, and the process proceeds to S109.

画像保存ステップS108は、処理対象領域画像を画像データに変換し、S109に進む。出力ステップS109で、文字認識ステップS106及び記号認識ステップS107及び画像保存ステップS108で処理した結果を出力する。
なお、各ステップは、コンピュータで実行可能なプラグラムで記述されてもよい。
In the image storage step S108, the processing target area image is converted into image data, and the process proceeds to S109. In the output step S109, the results processed in the character recognition step S106, the symbol recognition step S107, and the image storage step S108 are output.
Each step may be described by a program that can be executed by a computer.

図3は、本発明の実施の形態1における帳票の構成図である。記入シート(図3(a))と複写シート(図3(b))で構成され、以下の条件を満たす。
・処理対象領域は、開始記号と終了記号と罫線で囲まれている。
・開始記号及び終了記号が、一定の不記載領域(白または背景色)で囲まれている。
・開始記号及び終了記号は、処理対象領域の存在方向と高さを表現している。
・開始記号及び終了記号は、項目欄の処理内容毎に形状が異なる。
・記入シートには、処理対象領域内の記入位置が示され、複写シートには、記載されていない。
・開始記号及び終了記号及び記入位置と、罫線の間に一定の不記載領域を設ける。
・複写シートの開始記号及び終了記号が対応する記入シートの開始記号及び終了記号より小さい。
FIG. 3 is a configuration diagram of the form in the first embodiment of the present invention. It consists of an entry sheet (FIG. 3 (a)) and a copy sheet (FIG. 3 (b)) and satisfies the following conditions.
The processing target area is surrounded by a start symbol, an end symbol, and a ruled line.
-The start symbol and the end symbol are surrounded by a certain undescribed region (white or background color).
The start symbol and the end symbol express the existence direction and height of the processing target area.
-The shape of the start symbol and end symbol differs depending on the processing content in the item column.
-The entry sheet shows the entry position in the processing target area and is not described on the copy sheet.
-Provide a certain unrecorded area between the start symbol, end symbol, entry position, and ruled line.
-The copy sheet start and end symbols are smaller than the corresponding entry sheet start and end symbols.

伝票が添付された荷物等は、記入シートが依頼主に保管され、複写シートのみが添付された状態で、集配所で記載内容を読み取る。以下、図4に示す帳票Aの複写シートCの入力画像を例に、動作の詳細を説明する。画像入力部101で、複写シートCをカメラで撮影すると、図4に示すように傾きθ度、解像度Ddpiで画像入力される。   For packaged items with slips, the entry sheet is kept at the client, and the contents are read at the collection / delivery place with only the copy sheet attached. Hereinafter, the details of the operation will be described by taking the input image of the copy sheet C of the form A shown in FIG. 4 as an example. When the copy sheet C is photographed by the camera in the image input unit 101, the image is input with the inclination θ degree and the resolution Ddpi as shown in FIG.

領域記号検出部102では、入力画像の連結閉領域を抽出し、図5(a)に示すように、予め登録されている開始記号及び終了記号と形状照合を行い、入力画像内の全ての開始記号及び終了記号の位置と高さと方向と種類を検出する。検出結果を図5(b)に示す。   The region symbol detection unit 102 extracts a connected closed region of the input image, performs shape matching with the start symbol and end symbol registered in advance as shown in FIG. Detect the position, height, direction, and type of symbols and end symbols. The detection result is shown in FIG.

開始記号LS1,LS2,LS3と終了記号LE1,LE2,LE3が検出できた。複写シートでは、開始記号及び終了記号が記入シートより小さく表記されているので、連結閉領域として検出し易い。   The start symbols LS1, LS2, and LS3 and the end symbols LE1, LE2, and LE3 were detected. In the copy sheet, since the start symbol and the end symbol are written smaller than the entry sheet, it is easy to detect as a connected closed region.

領域抽出部103では、図6(a)に示すように、予め複写シートCの帳票レイアウトが登録されている。   In the area extraction unit 103, as shown in FIG. 6A, the form layout of the copy sheet C is registered in advance.

帳票レイアウトには、項目毎に、処理内容、開始終了記号の形状、処理領域のサイズ、
処理領域内の記入位置が登録されている。領域記号抽出部102で抽出された開始記号について、開始記号の方向と対になる終了記号を特定し、特定できなければ不可として、画像入力部102の処理に戻る。
In the form layout, for each item, the processing content, the shape of the start / end symbol, the size of the processing area,
The entry position in the processing area is registered. With respect to the start symbol extracted by the region symbol extraction unit 102, an end symbol that is paired with the direction of the start symbol is specified. If it cannot be specified, the process returns to the processing of the image input unit 102.

LS1とLE1,LS2とLE2,LS3とLE3が対であることが検証され、開始記号と終了記号の対がわかれば、開始記号と終了記号の位置と高さと方向から処理対象領域の位置を特定し、切り出す。図6(b)に開始終了記号対LS1とLE1の処理対象領域L1の位置特定結果を示す。   It is verified that LS1 and LE1, LS2 and LE2, LS3 and LE3 are a pair, and if the pair of start symbol and end symbol is known, the position of the processing target area is determined from the position, height and direction of the start symbol and end symbol. And cut out. FIG. 6B shows the result of specifying the position of the processing target area L1 of the start / end symbol pair LS1 and LE1.

次に、複写シートCが斜めに読み込まれたときの角度補正方法について述べる。処理対象領域画像の傾きθと解像度Dは、図7(a)(b)に示す式で求まる。図7(b)の8cmは、図6(a)の帳票レイアウトに格納されている郵便の領域サイズの横幅である。対の開始終了記号が検出できても、解像度が低すぎたり高すぎたりした場合は不可として、画像入力部102の処理に戻る。傾きθが値を持つ場合は、処理対象領域画像を回転補正する。図7(c)に抽出した処理対象領域画像を示す。 Next, an angle correction method when the copy sheet C is read obliquely will be described. The inclination θ and the resolution D of the processing target area image can be obtained by the expressions shown in FIGS. 8 cm in FIG. 7B is the horizontal width of the postal area size stored in the form layout in FIG. Even if the start / end symbol of the pair can be detected, if the resolution is too low or too high, it is impossible to return to the processing of the image input unit 102. When the slope θ has a value, the processing target area image is rotationally corrected. FIG. 7C shows the processing target area image extracted.

処理部104で、抽出した処理対象領域画像毎に、開始記号が示す項目に応じた処理を行う。図7(c)に示す処理対象領域画像L1は、図6(a)に示す帳票レイアウトから、郵便番号項目であるので、登録されている項目内の文字記載位置の情報を用いて、文字画像を切り出し文字認識する。 The processing unit 104 performs processing corresponding to the item indicated by the start symbol for each extracted processing target region image. Since the processing target region image L1 shown in FIG. 7C is a zip code item from the form layout shown in FIG. 6A, the character image is used by using the information on the character description position in the registered item. To recognize characters.

また、選択記号項目である場合は、登録されている項目内の記号記載位置の情報を用いて、選択された記号を識別する。出力部105は、これら処理部104の処理結果を出力する。 Further, in the case of a selected symbol item, the selected symbol is identified using information on the symbol description position in the registered item. The output unit 105 outputs the processing results of these processing units 104.

かかる構成によれば、帳票の処理対象領域に開始記号及び終了記号を表記し、帳票処理装置に領域記号検出部を設けることにより、帳票の入力画像から項目の開始記号及び終了記号を抽出して、各項目の入力画像内の記載位置を特定し、各項目毎の処理を行うので、カメラ等の帳票撮影状態が不安定な画像入力装置で帳票画像を入力した場合でも、高速に精度良く各項目毎の処理を行うことができる。   According to such a configuration, the start symbol and the end symbol are described in the processing target area of the form, and the start symbol and the end symbol of the item are extracted from the input image of the form by providing the area processing unit in the form processing apparatus. Since the position of each item in the input image is specified and processing is performed for each item, even when a form image is input with an image input device such as a camera where the form photographing state is unstable, each item is accurately processed at high speed. Processing for each item can be performed.

さらに、図8を用いて、記入シートと複写シートで開始記号などの大きさを変える効果について述べる。図8(a)は記入シートを示しており、開始記号などと共に、記入枠(実線)が印刷されている。   Further, the effect of changing the size of the start symbol or the like between the entry sheet and the copy sheet will be described with reference to FIG. FIG. 8A shows an entry sheet on which an entry frame (solid line) is printed together with a start symbol and the like.

また、図8(b)は複写シートを示している。複写シート(b)は記入シートの真下にあるので、記入シートの記入枠(実線)は複写シートでは点線の位置にあることになる。なお、実際には点線は印刷されていない。   FIG. 8B shows a copy sheet. Since the copy sheet (b) is directly below the entry sheet, the entry frame (solid line) of the entry sheet is at the position of the dotted line on the copy sheet. Actually, the dotted line is not printed.

記入シート(a)の文字記入枠(実線)にかかるように、「a」と記入された場合、複写シートには、図8(b)の位置に「a」が複写される。   When “a” is entered so as to cover the character entry frame (solid line) of the entry sheet (a), “a” is copied to the position of FIG. 8B on the copy sheet.

このとき、複写シートでは開始記号が記入シートの開始記号と比較して、小さくかつ記入枠と離れて印刷されているので、記入された文字が開始記号などにかかかることがない。このため、文字認識を容易に行うことが出来る。   At this time, in the copy sheet, the start symbol is smaller than the start symbol of the entry sheet and is printed away from the entry frame, so that the entered character does not cover the start symbol. For this reason, character recognition can be performed easily.

さらに、図9を用いて、記入シートと複写シートの開始記号の中の文字を印字する場合としない場合について述べる。図9では、記入シート(a)で示すように、開始記号には郵便のマークがあるが、複写シート(b)の方には印刷されていない。   Furthermore, the case where the character in the start symbol of an entry sheet and a copy sheet is printed is described with reference to FIG. In FIG. 9, as shown in the entry sheet (a), the start symbol has a postal mark, but is not printed on the copy sheet (b).

このため、記入シートに印字するときは、利用者が記入内容を把握することができ、複写シートを計算機で読み取るときは、記号がないので、開始記号を画像処理によって検出することが容易になる。   For this reason, when printing on an entry sheet, the user can grasp the contents of entry, and when reading a copy sheet with a computer, since there is no symbol, it is easy to detect the start symbol by image processing. .

なお、本実施の形態において、複写シートを処理対象としたが、記入シートを対象にしてもかまわない。記入シートを処理対象とし、記入シートを画像入力した場合、項目内の記入位置情報を用いて示された記入位置の画像を削除する処理を追加してもよい。   In the present embodiment, the copy sheet is the processing target, but the entry sheet may be the target. When the entry sheet is a processing target and the entry sheet is input as an image, a process of deleting the image at the entry position indicated by using the entry position information in the item may be added.

開始終了記号や罫線、記入位置を示す表記を、別色で印刷してもかまわない。
開始終了記号の形状は、これだけに限らない。開始終了記号は、処理対象領域の形状が複雑な場合に対応するため、処理対象領域の外周位置に複数配置してもよい。
The start / end symbols, ruled lines, and notation indicating the entry position may be printed in different colors.
The shape of the start / end symbol is not limited to this. A plurality of start / end symbols may be arranged at the outer peripheral position of the processing target region in order to cope with a case where the processing target region has a complicated shape.

本発明にかかる帳票、帳票処理装置、帳票処理方法は、
高速で高性能な画像処理機能を有し、画像処理手法等として有用である。
また、迅速な情報のデータ化機能を有し、情報のデータベース化手法等として有用である。
The form, form processing apparatus, and form processing method according to the present invention are:
It has a high-speed and high-performance image processing function and is useful as an image processing method.
In addition, it has a rapid information data conversion function, and is useful as a method for creating an information database.

101 画像入力部
102 領域記号検出部
103 領域抽出部
104 処理部
105 出力部
DESCRIPTION OF SYMBOLS 101 Image input part 102 Area | region symbol detection part 103 Area | region extraction part 104 Processing part 105 Output part

本発明の帳票は、記入シートと複写シートで構成され、複写シートが計算機で読み取られる帳票であって、前記記入シートおよび複写シートは、計算機で読み取られる際の読取り領域の高さと方向と開始位置を示す開始記号及び計算機で読み取られる際の読取り領域の終了位置を示す終了記号を有し、前記開始記号は該開始記号に対する前記読取り領域の方向および前記読取り領域の高さを示し、前記複写シートの開始記号あるいは終了記号が前記記入シートの開始記号あるいは終了記号より小さいことを特徴としている。 Form of the present invention is constituted by entry sheet and the copy sheet, a form in which a copy sheet is read by the computer, the entry sheet and the copy sheet, the height and direction of the reading area when read in calculation machine has a terminator indicating the end position of the reading area when read start symbol and computer indicating a start position, the start symbol is indicates the height direction and the reading region of the reading area with respect to the start symbol, The copy sheet start symbol or end symbol is smaller than the entry sheet start symbol or end symbol .

Claims (8)

手書きされあるいは計算機で読み取られる帳票であって、
前記帳票は、
計算機で読み取られる際の読取り領域の高さと方向と開始位置を示す開始記号及び計算機で読み取られる際の読取り領域の終了位置を示す終了記号を有し、
前記開始記号は該開始記号に対する前記読取り領域の方向および前記読取り領域の高さを示すことを特徴とする帳票。
A form that is handwritten or read by a computer,
The form is
Having a start symbol indicating the height and direction of the reading area when read by a computer and a start position and an end symbol indicating the end position of the reading area when read by a computer;
The form wherein the start symbol indicates a direction of the reading area with respect to the start symbol and a height of the reading area.
処理対象領域が、開始記号と終了記号と罫線または不記載領域で囲まれた請求項1記載の帳票。 The form according to claim 1, wherein the processing target area is surrounded by a start symbol, an end symbol, a ruled line, or an undescribed region. 記入シートと複写シートで構成され、複写シートが計算機によって読み取られる帳票であって、
前記複写シートの開始記号あるいは終了記号が前記記入シートの開始記号あるいは終了記号より小さいことを特徴とする請求項1記載の帳票。
A form composed of an entry sheet and a copy sheet, the copy sheet being read by a computer,
2. The form according to claim 1, wherein a start symbol or an end symbol of the copy sheet is smaller than a start symbol or an end symbol of the entry sheet.
記入シートと複写シートで構成され、複写シートが計算機によって読み取られる帳票であって、
前記記入シートは前記開始記号あるいは前記終了記号を有することを特徴とする請求項1記載の帳票。
A form composed of an entry sheet and a copy sheet, the copy sheet being read by a computer,
The form according to claim 1, wherein the entry sheet has the start symbol or the end symbol.
処理対象領域を含む画像を入力する画像入力部と、
前記画像入力部で入力した入力画像から、開始記号及び終了記号及び必要に応じて罫線を検出する領域記号検出部と、
前記領域記号検出部で検出した開始記号及び終了記号の位置と高さと方向と種類を用いて処理対象領域を抽出する領域抽出部と、
前記領域抽出部で抽出した処理対象領域に記載されている内容を開始記号及び終了記号の種類に従って処理する処理部と、
前記処理部で処理した結果を出力する出力部と、
を有する帳票処理装置。
An image input unit for inputting an image including the processing target area;
From the input image input in the image input unit, a region symbol detection unit that detects a start symbol and an end symbol and a ruled line as necessary,
A region extraction unit that extracts a processing target region using the position, height, direction, and type of the start symbol and end symbol detected by the region symbol detection unit;
A processing unit that processes the contents described in the processing target region extracted by the region extraction unit according to the type of start symbol and end symbol;
An output unit for outputting a result processed by the processing unit;
A form processing apparatus.
処理対象領域を含む画像を入力する画像入力ステップと、
前記画像入力ステップで入力した入力画像から、開始記号及び終了記号及び必要に応じて罫線を検出する領域記号検出ステップと、
前記領域記号検出ステップで検出した開始記号及び終了記号の位置と高さと方向と種類を用いて処理対象領域を抽出する領域抽出ステップと、
前記領域抽出ステップで抽出した処理対象領域に記載されている内容を開始記号及び終了記号の種類に従って処理する処理ステップと、
前記処理ステップで処理した結果を出力する出力ステップと、
を有する帳票処理方法。
An image input step for inputting an image including the processing target area;
From the input image input in the image input step, a region symbol detection step of detecting a start symbol and an end symbol and a ruled line as necessary,
A region extraction step for extracting a processing target region using the position, height, direction, and type of the start symbol and end symbol detected in the region symbol detection step;
A processing step of processing the contents described in the processing target region extracted in the region extraction step according to the type of start symbol and end symbol;
An output step for outputting a result processed in the processing step;
A form processing method comprising:
請求項6記載の帳票処理方法をコンピュータで実行可能に記述したことを特徴とするプログラム。   A program in which the form processing method according to claim 6 is described so as to be executable by a computer. 請求項6記載の帳票処理方法をコンピュータで実行可能に記述したプログラムを記録したことを特徴とする記録媒体。   A recording medium on which a program in which the form processing method according to claim 6 is described so as to be executable by a computer is recorded.
JP2010093825A 2010-04-15 2010-04-15 Form Active JP4798296B1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010093825A JP4798296B1 (en) 2010-04-15 2010-04-15 Form
CN2011800191639A CN102844770A (en) 2010-04-15 2011-04-13 Form, form processing device, form processing method, and recording medium
PCT/JP2011/002195 WO2011129114A1 (en) 2010-04-15 2011-04-13 Form, form processing device, form processing method, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010093825A JP4798296B1 (en) 2010-04-15 2010-04-15 Form

Publications (2)

Publication Number Publication Date
JP4798296B1 JP4798296B1 (en) 2011-10-19
JP2011227542A true JP2011227542A (en) 2011-11-10

Family

ID=44798496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010093825A Active JP4798296B1 (en) 2010-04-15 2010-04-15 Form

Country Status (3)

Country Link
JP (1) JP4798296B1 (en)
CN (1) CN102844770A (en)
WO (1) WO2011129114A1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6208094B2 (en) * 2014-08-26 2017-10-04 株式会社東芝 Information processing apparatus, information processing system, information processing method, and program thereof
JP6554193B1 (en) * 2018-01-30 2019-07-31 三菱電機インフォメーションシステムズ株式会社 Entry area extraction apparatus and entry area extraction program
JP7298227B2 (en) * 2019-03-20 2023-06-27 株式会社リコー Information processing device, information processing method, information processing program, and information processing system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0581473A (en) * 1991-03-19 1993-04-02 T A S Tsusho Kk Method for generating program
JP2006303645A (en) * 2005-04-15 2006-11-02 Sharp Corp Image processing apparatus

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03179583A (en) * 1989-12-08 1991-08-05 Nippon Telegr & Teleph Corp <Ntt> Character recognizing method
JP2824372B2 (en) * 1992-12-04 1998-11-11 英明 磯貝 Report recognition device
JPH07107222A (en) * 1993-10-01 1995-04-21 Canon Inc Facsimile mailing device
JP3634456B2 (en) * 1995-08-02 2005-03-30 大日本印刷株式会社 FAX-OCR copy form
JPH1011532A (en) * 1996-06-21 1998-01-16 Oki Electric Ind Co Ltd Optical character reading method
JP2002304597A (en) * 2001-04-04 2002-10-18 Sakana Ryutsu Net:Kk System for recognizing handwritten numeric information entered in container box
JP2007079943A (en) * 2005-09-14 2007-03-29 Toshiba Corp Character reading program, character reading method and character reader
KR20080055119A (en) * 2006-12-14 2008-06-19 삼성전자주식회사 Image forming apparatus and control method thereof
JP4453734B2 (en) * 2007-09-21 2010-04-21 ソニー株式会社 Image processing apparatus, image processing method, image processing program, and imaging apparatus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0581473A (en) * 1991-03-19 1993-04-02 T A S Tsusho Kk Method for generating program
JP2006303645A (en) * 2005-04-15 2006-11-02 Sharp Corp Image processing apparatus

Also Published As

Publication number Publication date
WO2011129114A1 (en) 2011-10-20
JP4798296B1 (en) 2011-10-19
CN102844770A (en) 2012-12-26

Similar Documents

Publication Publication Date Title
JP5084718B2 (en) Combination detection of position coding pattern and barcode
US7840092B2 (en) Medium processing method, copying apparatus, and data filing apparatus
US8213717B2 (en) Document processing apparatus, document processing method, recording medium and data signal
WO2011129113A1 (en) Form processing device, form processing method, and recording medium
TWI751426B (en) Image processing system, image processing method and program product
TWI725465B (en) Image processing system, image processing method and program product
WO2014086277A1 (en) Professional notebook convenient for electronization and method for automatically identifying page number thereof
CN104079730B (en) Document processing device, document processing and method and the multi-function printer including this device
JP5877335B2 (en) Form
JP4798296B1 (en) Form
US7983485B2 (en) System and method for identifying symbols for processing images
JP6578858B2 (en) Information processing apparatus and program
JP6035157B2 (en) Image processing apparatus, image processing method, and image processing program
JP2003305927A (en) Printer inspection system
JP2008282094A (en) Character recognition processing apparatus
JP6058042B2 (en) Image processing device
JP5878004B2 (en) Multiple document recognition system and multiple document recognition method
JP6540597B2 (en) INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND PROGRAM
JP2009223612A (en) Image recognition device and program
JP3959451B2 (en) Image reading system
JP5978830B2 (en) Printed material inspection device
JP4009314B2 (en) Form layout identification method and form layout identification system
US20240070930A1 (en) Information processing apparatus, non-transitory computer readable medium, and information processing method
JP7150809B2 (en) Document digitization architecture by multi-model deep learning, document image processing program
JP6743401B2 (en) Form design/read setting support device, form design/read setting support method, and optical character recognition system

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110718

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140812

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140812

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250