JP2013030040A - Information processing program, information processor, and character recognition method - Google Patents

Information processing program, information processor, and character recognition method Download PDF

Info

Publication number
JP2013030040A
JP2013030040A JP2011166451A JP2011166451A JP2013030040A JP 2013030040 A JP2013030040 A JP 2013030040A JP 2011166451 A JP2011166451 A JP 2011166451A JP 2011166451 A JP2011166451 A JP 2011166451A JP 2013030040 A JP2013030040 A JP 2013030040A
Authority
JP
Japan
Prior art keywords
keyword
information
area
identification information
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011166451A
Other languages
Japanese (ja)
Other versions
JP5566971B2 (en
Inventor
Masaaki Ozawa
昌昭 小澤
Shohei Hasegawa
将平 長谷川
Akira Takada
亮 高田
Hirotaka Inoue
博貴 井上
Kazuo Nakamura
一夫 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Priority to JP2011166451A priority Critical patent/JP5566971B2/en
Publication of JP2013030040A publication Critical patent/JP2013030040A/en
Application granted granted Critical
Publication of JP5566971B2 publication Critical patent/JP5566971B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To efficiently perform character recognition processing.SOLUTION: A detection section 1a detects identification information 2a showing that the layout of a form is changed from image information 2 obtained by imaging the form. When the detection section 1a detects the identification information 2a, a region specifying section 1b detects region identification information 2b for identifying a processing object region 3 for performing prescribed character recognition processing which is included in the image information 2 to specify the processing object region 3 on the basis of the region identification information 2b. A processing section 1c performs prescribed character recognition processing on the specified processing object region 3.

Description

本件は文字認識を行う情報処理プログラム、情報処理装置および文字認識方法に関する。   The present invention relates to an information processing program, an information processing apparatus, and a character recognition method for performing character recognition.

従来、紙面に記入された文字(あるいは文字列)の認識(文字認識)を行い、データとして取得する情報処理装置が利用されている。例えば、情報処理装置は次のようにして文字認識を行う。まず、紙面の記入面を撮像装置により撮像して、紙面の画像情報を取得する。次に、該紙面の画像情報に含まれる文字の画像情報を、予め定義された文字パターンと照合し、該文字パターンとの一致度に基づいて、文字の画像情報が何れの文字パターンに対応するか決定する。そして、決定した文字パターンに対応する文字コードを、該紙面に記入された文字のデータとして取得する。各文字につき、この処理を繰り返し行い、文字列のデータを取得する。   2. Description of the Related Art Conventionally, information processing apparatuses that perform recognition (character recognition) of characters (or character strings) entered on paper and acquire them as data have been used. For example, the information processing apparatus performs character recognition as follows. First, a paper entry surface is imaged by an imaging device to obtain image information on the paper surface. Next, the character image information included in the image information on the paper is compared with a predefined character pattern, and the character image information corresponds to any character pattern based on the degree of coincidence with the character pattern. To decide. Then, the character code corresponding to the determined character pattern is acquired as the character data entered on the page. This process is repeated for each character to obtain character string data.

文字認識では、紙面上に記入される文字列を所定のデータ項目に対応付けて取得することもある。例えば、金融機関で預金や出金などの取引に用いる帳票には、氏名、口座番号および取引金額などのデータ項目に対する文字列を、顧客に記入させる記入欄が設けられている。各記入欄は、帳票の種類ごとに定位置に配置される。この場合、データ項目に対応付けて記入欄の帳票上の位置(レイアウト)を予め定義しておけば、情報処理装置は帳票の画像情報に基づき、データ項目と文字列のデータとを対応付けて取得できる。このように、レイアウトの定義情報に基づいて、データ項目に対する文字列を抽出する文字認識の方法を、レイアウト認識による文字認識と呼ぶことがある。   In character recognition, a character string written on paper is sometimes obtained in association with a predetermined data item. For example, a form used for transactions such as deposits and withdrawals at a financial institution is provided with an entry field that allows a customer to enter character strings for data items such as name, account number, and transaction amount. Each entry field is arranged at a fixed position for each type of form. In this case, if the position (layout) of the entry field in the form is defined in advance in association with the data item, the information processing apparatus associates the data item with character string data based on the form image information. You can get it. As described above, a character recognition method for extracting a character string for a data item based on layout definition information may be referred to as character recognition by layout recognition.

ここで、帳票のレイアウトを変更することがある。その場合、レイアウト認識では、変更のたびにレイアウトの定義情報を更新するための作業負担が生じる。そこで、レイアウトの定義情報に依らずに記入された文字列とデータ項目との対応を判断して、レイアウト変更を容易にする文字認識の方法も考えられている。   Here, the form layout may be changed. In that case, in the layout recognition, a work load for updating the definition information of the layout every time a change occurs. Therefore, a method of character recognition that makes it easy to change the layout by determining the correspondence between the entered character string and the data item without depending on the layout definition information has been considered.

例えば、予め定義した項目名(「金額」や「振込金額」など)を示す文字列(キーワード)を帳票から抽出し、該キーワードの位置と記入された文字列との位置関係などに基づいて、該キーワードが示す項目名と記入された文字列とを対応付ける提案がある(例えば、特許文献1参照)。このように、項目名を示すキーワードを検出して、記入された文字列との対応を判断する文字認識の方法を、キーワード認識による文字認識と呼ぶことがある。   For example, a character string (keyword) indicating a predefined item name (such as “amount” or “transfer amount”) is extracted from a form, and based on the positional relationship between the position of the keyword and the entered character string, There is a proposal for associating an item name indicated by the keyword with a written character string (for example, see Patent Document 1). As described above, the character recognition method for detecting the keyword indicating the item name and determining the correspondence with the entered character string may be called character recognition by keyword recognition.

また、例えば、文字列を記入するフィールドが設けられた帳票上の、フィールドに対する所定位置に、項目に対応した識別コードを記載する提案がある(例えば、特許文献2参照)。この提案では、該識別コードを検出して該フィールドの項目を認識する。   In addition, for example, there is a proposal to describe an identification code corresponding to an item at a predetermined position with respect to a field on a form provided with a field for entering a character string (see, for example, Patent Document 2). In this proposal, the item of the field is recognized by detecting the identification code.

更に、例えば、項目ごとの文字列についての規定を含む構文ルール情報を定義しておく提案もある(例えば、特許文献3参照)。この提案では、認識した文字列を該構文ルール情報に基づいて解析し、認識した文字列と項目との対応付けを行う。   Further, for example, there is a proposal for defining syntax rule information including a rule for a character string for each item (see, for example, Patent Document 3). In this proposal, the recognized character string is analyzed based on the syntax rule information, and the recognized character string is associated with the item.

特開2010−3155号公報JP 2010-3155 A 特開2004−164376号公報JP 2004-164376 A 特開2004−199529号公報Japanese Patent Laid-Open No. 2004-199529

レイアウト変更後の帳票について所定の文字認識処理を行う際に、帳票上の領域全体を処理対象とすると処理効率が悪い場合がある。
例えば、帳票によっては、文字認識の対象としなくてもよい領域(例えば、事業者側で使用する欄や顧客に情報を伝えるためのお知らせ欄など)が含まれ得る。このような領域をも該文字認識処理の対象とすると、処理時間が余分にかかり、処理効率が悪い。
When a predetermined character recognition process is performed on a form after the layout is changed, processing efficiency may be poor if the entire area on the form is a processing target.
For example, depending on the form, an area that does not have to be a character recognition target (for example, a column used on the business side or a notification column for transmitting information to a customer) may be included. If such a region is also subject to character recognition processing, it takes extra processing time and processing efficiency is poor.

また、例えば、変更の非対象の領域は、既存の文字認識(例えば、レイアウト認識による文字認識)を行えばよい場合もある。その場合に、例えば変更の非対象の領域をも、上記特許文献1〜3に例示されるような文字認識処理の対象とすると、既存の文字認識で対応可能な領域を重複して処理することになる。すると、処理時間が余分にかかり、処理効率が悪い。   In addition, for example, there may be a case where existing character recognition (for example, character recognition by layout recognition) may be performed on a non-target area to be changed. In that case, for example, if a non-target area to be changed is also a target of character recognition processing as exemplified in Patent Documents 1 to 3, an area that can be handled by existing character recognition is overlapped. become. Then, it takes extra processing time and processing efficiency is poor.

そこで、帳票上のレイアウトが変更されたときに、所定の文字認識処理の対象領域を容易に指定可能として、該文字認識処理を効率的に行う仕組みをどのようにして実現するかが問題となる。   Therefore, when the layout on the form is changed, there is a problem of how to implement a mechanism for efficiently performing the character recognition process by making it possible to easily specify a target area for a predetermined character recognition process. .

本発明はこのような点に鑑みてなされたものであり、文字認識処理を効率的に行えるようにした情報処理プログラム、情報処理装置および文字認識方法を提供することを目的とする。   The present invention has been made in view of these points, and an object thereof is to provide an information processing program, an information processing apparatus, and a character recognition method capable of efficiently performing character recognition processing.

帳票を撮像して得られた画像情報から該帳票のレイアウトが変更された旨を示す識別情報を検出し、識別情報を検出すると、画像情報に含まれる、所定の文字認識処理を行う処理対象領域を識別するための領域識別情報を検出して、該領域識別情報に基づき処理対象領域を特定し、特定した処理対象領域に対して所定の文字認識処理を行う、処理をコンピュータに実行させる情報処理プログラムが提供される。   A processing target area for performing a predetermined character recognition process included in the image information when the identification information indicating that the layout of the form has been changed is detected from the image information obtained by capturing the form and the identification information is detected. Information processing for detecting a region identification information for identifying a region, specifying a processing target region based on the region identification information, performing a predetermined character recognition process on the specified processing target region, and causing a computer to execute the processing A program is provided.

また、検出部と領域特定部と処理部とを有する情報処理装置が提供される。検出部は、帳票を撮像して得られた画像情報から該帳票のレイアウトが変更された旨を示す識別情報を検出する。領域特定部は、識別情報を検出すると、画像情報に含まれる、所定の文字認識処理を行う処理対象領域を識別するための領域識別情報を検出して、該領域識別情報に基づき処理対象領域を特定する。処理部は、特定した処理対象領域に対して所定の文字認識処理を行う。   An information processing apparatus having a detection unit, a region specifying unit, and a processing unit is provided. The detection unit detects identification information indicating that the layout of the form has been changed from image information obtained by capturing the form. Upon detecting the identification information, the area specifying unit detects area identification information included in the image information for identifying a processing target area for performing a predetermined character recognition process, and determines the processing target area based on the area identification information. Identify. The processing unit performs a predetermined character recognition process on the specified processing target area.

また、情報処理装置が実行する文字認識方法が提供される。この文字認識方法では、帳票を撮像して得られた画像情報から該帳票のレイアウトが変更された旨を示す識別情報を検出すると、画像情報に含まれる、所定の文字認識処理を行う処理対象領域を識別するための領域識別情報を検出して、該領域識別情報に基づき処理対象領域を特定する。特定した処理対象領域に対して所定の文字認識処理を行う。   A character recognition method executed by the information processing apparatus is also provided. In this character recognition method, when identification information indicating that the layout of the form has been changed is detected from image information obtained by capturing the form, a processing target area for performing a predetermined character recognition process included in the image information The region identification information for identifying the region is detected, and the processing target region is specified based on the region identification information. A predetermined character recognition process is performed on the identified processing target area.

文字認識処理を効率的に行える。   Character recognition processing can be performed efficiently.

第1の実施の形態の情報処理装置を示す図である。It is a figure which shows the information processing apparatus of 1st Embodiment. 第2の実施の形態の情報処理システムを示す図である。It is a figure which shows the information processing system of 2nd Embodiment. 第2の実施の形態の帳票読取装置のハードウェアを示す図である。It is a figure which shows the hardware of the form reading apparatus of 2nd Embodiment. 第2の実施の形態の改訂前の帳票の例を示す図である。It is a figure which shows the example of the form before revision of 2nd Embodiment. 第2の実施の形態の改訂後の帳票の例を示す図である。It is a figure which shows the example of the form after revision of 2nd Embodiment. 第2の実施の形態の帳票読取装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the form reading apparatus of 2nd Embodiment. 第2の実施の形態のレイアウト定義テーブルの例を示す図である。It is a figure which shows the example of the layout definition table of 2nd Embodiment. 第2の実施の形態の帳票読取処理を示すフローチャートである。It is a flowchart which shows the form reading process of 2nd Embodiment. 第2の実施の形態のドロップアウト処理後の帳票画像の例を示す図である。It is a figure which shows the example of the form image after the dropout process of 2nd Embodiment. 第2の実施の形態のキーワード認識処理を示すフローチャートである。It is a flowchart which shows the keyword recognition process of 2nd Embodiment. 第2の実施の形態のキーワード認識対象領域の例を示す図である。It is a figure which shows the example of the keyword recognition object area | region of 2nd Embodiment. 第2の実施の形態の帳票IDの例を示す図である。It is a figure which shows the example of form ID of 2nd Embodiment. 第3の実施の形態の改訂後の帳票の例を示す図である。It is a figure which shows the example of the form after revision of 3rd Embodiment. 第3の実施の形態のキーワード認識処理を示すフローチャートである。It is a flowchart which shows the keyword recognition process of 3rd Embodiment. 第4の実施の形態の改訂前の帳票の例を示す図である。It is a figure which shows the example of the form before revision of 4th Embodiment. 第4の実施の形態の改訂後の帳票の例を示す図である。It is a figure which shows the example of the form after revision of 4th Embodiment. 第4の実施の形態の帳票読取処理を示すフローチャートである。It is a flowchart which shows the form reading process of 4th Embodiment. 第4の実施の形態のキーワード認識処理を示すフローチャートである。It is a flowchart which shows the keyword recognition process of 4th Embodiment. 第4の実施の形態の各文字認識の対象領域の第1の例を示す図である。It is a figure which shows the 1st example of the object area | region of each character recognition of 4th Embodiment. 第4の実施の形態の各文字認識の対象領域の第2の例を示す図である。It is a figure which shows the 2nd example of the object area | region of each character recognition of 4th Embodiment. 第5の実施の形態のキーワード認識対象領域の例を示す図である。It is a figure which shows the example of the keyword recognition object area | region of 5th Embodiment. 第5の実施の形態のデータ部の特定処理を示すフローチャートである。It is a flowchart which shows the specific process of the data part of 5th Embodiment. 第5の実施の形態のデータ部の特定方法の例を示す図である。It is a figure which shows the example of the identification method of the data part of 5th Embodiment. 第5の実施の形態のデータ部の特定方法の他の例を示す図である。It is a figure which shows the other example of the identification method of the data part of 5th Embodiment.

以下、本実施の形態を図面を参照して説明する。
[第1の実施の形態]
図1は、第1の実施の形態の情報処理装置を示す図である。情報処理装置1は、所定のレイアウトが施された帳票を撮像して得られた画像情報2に対して文字認識処理を行う。レイアウトとは、例えば帳票上の記入欄の配置である。
Hereinafter, the present embodiment will be described with reference to the drawings.
[First Embodiment]
FIG. 1 is a diagram illustrating the information processing apparatus according to the first embodiment. The information processing apparatus 1 performs a character recognition process on the image information 2 obtained by imaging a form having a predetermined layout. The layout is an arrangement of entry fields on a form, for example.

画像情報2には、識別情報2aおよび領域識別情報2bが含まれる。識別情報2aは、帳票上のレイアウトが変更された旨を示す情報である。領域識別情報2bは、所定の文字認識処理を行う処理対象領域3を識別するための情報である。識別情報2aおよび領域識別情報2bに対応する情報は、帳票上に予め印字される。   The image information 2 includes identification information 2a and area identification information 2b. The identification information 2a is information indicating that the layout on the form has been changed. The area identification information 2b is information for identifying the processing target area 3 for performing a predetermined character recognition process. Information corresponding to the identification information 2a and the area identification information 2b is printed in advance on the form.

情報処理装置1は、検出部1a、領域特定部1bおよび処理部1cを有する。
検出部1aは、画像情報2から帳票上のレイアウトが変更された旨を示す識別情報2aを検出する。例えば、識別情報2aは、画像情報2の所定位置に配置される。配置位置は、検出部1aに予め設定される。例えば、識別情報2aは、数値、文字、記号、図形およびこれらの組合せなどにより表される。どのような情報が識別情報2aに該当するかは、検出部1aに予め設定される。
The information processing apparatus 1 includes a detection unit 1a, a region specifying unit 1b, and a processing unit 1c.
The detection unit 1a detects identification information 2a indicating that the layout on the form has been changed from the image information 2. For example, the identification information 2a is arranged at a predetermined position of the image information 2. The arrangement position is preset in the detection unit 1a. For example, the identification information 2a is represented by numerical values, characters, symbols, figures, combinations thereof, and the like. What information corresponds to the identification information 2a is preset in the detection unit 1a.

領域特定部1bは、検出部1aが識別情報2aを検出すると、画像情報2から領域識別情報2bを検出する。領域特定部1bは、領域識別情報2bに基づき処理対象領域3を特定する。例えば、領域識別情報2bは、所定領域を囲う線として表される。この場合、領域特定部1bは、領域識別情報2bの内側の領域を処理対象領域3と特定できる。なお、領域識別情報2bの線の太さや線の種別(実線、点線および一点鎖線など)など、どのような線が領域識別情報2bに該当するかは、領域特定部1bに予め設定される。領域特定部1bで示される図形は、任意の多角形や多角形に限らない任意の図形としてもよい。   The area specifying unit 1b detects the area identification information 2b from the image information 2 when the detection unit 1a detects the identification information 2a. The area specifying unit 1b specifies the processing target area 3 based on the area identification information 2b. For example, the area identification information 2b is represented as a line surrounding a predetermined area. In this case, the area specifying unit 1b can specify the area inside the area identification information 2b as the process target area 3. Note that what type of line corresponds to the area identification information 2b, such as the thickness of the line of the area identification information 2b and the type of line (eg, solid line, dotted line, and alternate long and short dash line), is preset in the area specifying unit 1b. The figure shown by the area specifying unit 1b may be an arbitrary polygon or an arbitrary figure that is not limited to a polygon.

なお、領域識別情報2bは、所定領域を囲う線以外の方法で表すこともできる。例えば、数値、文字、記号、図形およびこれらの組合せなどを用いてもよい。その場合、例えば、領域特定部1bには、処理対象領域3が長方形で形成されることを予め設定する。その場合、領域特定部1bは、長方形の1対の対角に設けられた2つの領域識別情報を検出することで処理対象領域3を特定できる。処理対象領域3(領域識別情報で示される図形)は、長方形に限らず任意の多角形または図形としてもよい。例えば、多角形の頂点に対応する各位置に、領域識別情報を設けておけば、領域特定部1bは、領域識別情報により頂点を特定し、頂点で囲われる多角形を特定できる。なお、この場合も、どのような情報が領域識別情報に該当するかは、領域特定部1bに予め設定される。   Note that the area identification information 2b can also be expressed by a method other than the line surrounding the predetermined area. For example, numerical values, characters, symbols, figures, and combinations thereof may be used. In that case, for example, it is set in advance in the region specifying unit 1b that the processing target region 3 is formed in a rectangular shape. In that case, the region specifying unit 1b can specify the processing target region 3 by detecting two pieces of region identification information provided at a pair of diagonal corners. The processing target area 3 (a graphic indicated by the area identification information) is not limited to a rectangle, and may be an arbitrary polygon or graphic. For example, if region identification information is provided at each position corresponding to a vertex of a polygon, the region identification unit 1b can identify a vertex by the region identification information and identify a polygon surrounded by the vertex. Also in this case, what information corresponds to the region identification information is preset in the region specifying unit 1b.

ここで、検出部1a、領域特定部1bおよび処理部1cは、CPU(Central Processing Unit)およびRAM(Random Access Memory)を用いて実行されるプログラムとして実装してもよい。   Here, the detection unit 1a, the region specifying unit 1b, and the processing unit 1c may be implemented as programs that are executed using a CPU (Central Processing Unit) and a RAM (Random Access Memory).

情報処理装置1によれば、検出部1aにより、画像情報2から識別情報2aが検出される。すると、領域特定部1bにより、画像情報2に含まれる領域識別情報2bが検出され、領域識別情報2bに基づき処理対象領域3が特定される。処理部1cにより、処理対象領域3に対して所定の文字認識処理が行われる。   According to the information processing apparatus 1, the identification information 2 a is detected from the image information 2 by the detection unit 1 a. Then, the region identification information 1b included in the image information 2 is detected by the region identification unit 1b, and the processing target region 3 is identified based on the region identification information 2b. A predetermined character recognition process is performed on the processing target area 3 by the processing unit 1c.

これにより、文字認識処理を効率的に行える。具体的には、所定の文字認識処理を行う領域を処理対象領域3とし、それ以外の領域に対しては該所定の文字認識処理を行わない。すなわち、所定の文字認識処理が余計な領域に対して行われるのを抑止でき、余分な処理時間がかからずに済む。   Thereby, a character recognition process can be performed efficiently. Specifically, an area where a predetermined character recognition process is performed is set as a process target area 3, and the predetermined character recognition process is not performed for other areas. That is, it is possible to prevent the predetermined character recognition processing from being performed on an extra area, and an extra processing time is not required.

なお、図1の画像情報2では領域識別情報2bで1つの処理対象領域3を特定する場合を例示した。これに対し、複数の領域識別情報により、複数の処理対象領域を特定可能としてもよい。より具体的には、領域を囲う線として表される領域識別情報を複数設けて、複数の処理対象領域を特定可能としてもよい。あるいは、第1の処理対象領域の頂点位置に第1の領域識別情報を設けて該第1の処理対象領域を特定可能とし、第2の処理対象領域の頂点位置に、第1の領域識別情報とは異なる第2の領域識別情報を設けて該第2の処理対象領域を特定可能としてもよい。   In the image information 2 in FIG. 1, the case where one processing target area 3 is specified by the area identification information 2 b is illustrated. On the other hand, a plurality of process target areas may be specified by a plurality of area identification information. More specifically, a plurality of region identification information expressed as lines surrounding the region may be provided so that a plurality of processing target regions can be specified. Alternatively, the first area identification information is provided at the vertex position of the first processing target area so that the first processing target area can be specified, and the first area identification information is set at the vertex position of the second processing target area. Second region identification information different from that may be provided so that the second processing target region can be specified.

以下、金融機関の窓口などに設置され、顧客が記入した帳票の画像情報に対して文字認識処理を行う帳票読取装置に、情報処理装置1を適用する例を説明する。
[第2の実施の形態]
図2は、第2の実施の形態の情報処理システムを示す図である。この情報処理システムは、金融機関の窓口業務を支援する。この情報処理システムは、帳票読取装置100とサーバ装置200とを含む。帳票読取装置100およびサーバ装置200は、ネットワーク10を介して接続される。ネットワーク10は、該金融機関内に設けられたイントラネットである。帳票読取装置100とサーバ装置200とは、別個の拠点に設置されてもよい。ネットワーク10の経路内には、この情報処理システムのために敷設された専用線のネットワーク、インターネットおよび通信事業者のIP(Internet Protocol)網などを含んでもよい。インターネットやIP網を含む場合、VPN(Virtual Private Network)などを利用して通信のセキュリティが確保される。
Hereinafter, an example will be described in which the information processing apparatus 1 is applied to a form reading apparatus installed at a financial institution or the like and performing character recognition processing on image information of a form entered by a customer.
[Second Embodiment]
FIG. 2 illustrates an information processing system according to the second embodiment. This information processing system supports the window business of financial institutions. This information processing system includes a form reading device 100 and a server device 200. The form reading device 100 and the server device 200 are connected via the network 10. The network 10 is an intranet provided in the financial institution. The form reading device 100 and the server device 200 may be installed in separate bases. The route of the network 10 may include a dedicated line network laid for the information processing system, the Internet, and an IP (Internet Protocol) network of a communication carrier. When the Internet or IP network is included, communication security is ensured using a VPN (Virtual Private Network) or the like.

帳票読取装置100は、金融機関の窓口に設置される情報処理装置である。帳票読取装置100は、帳票を撮像して取得された帳票の画像情報(以下、帳票画像と呼ぶことがある)に対して文字認識処理を行い、顧客が帳票に記入した情報を取得してサーバ装置200に送信する。   The form reading apparatus 100 is an information processing apparatus installed at a financial institution window. The form reading device 100 performs character recognition processing on image information of a form (hereinafter, also referred to as a form image) acquired by imaging a form, acquires information entered in the form by a customer, and serves as a server To device 200.

帳票読取装置100が読み取る帳票の種別は、取引に応じて複数の種類が存在する。例えば、入金、出金および新規申込などの取引に応じた帳票が考えられる。帳票読取装置100は、既存のレイアウトの帳票に対する文字認識処理にレイアウト認識を用いるものとする。   There are a plurality of types of forms read by the form reading apparatus 100 depending on the transaction. For example, forms corresponding to transactions such as deposits, withdrawals and new applications can be considered. It is assumed that the form reading apparatus 100 uses layout recognition for character recognition processing for a form having an existing layout.

サーバ装置200は、顧客の口座情報を管理する情報処理装置である。サーバ装置200は、帳票読取装置100が読み取った帳票の情報を受信して、該情報に基づく取引の処理を実行する。例えば、現金の出金、現金による入金、ある口座から他の口座への預金の振替などの取引を確定するための処理である。   The server device 200 is an information processing device that manages customer account information. The server device 200 receives information on the form read by the form reading device 100 and executes a transaction process based on the information. For example, it is a process for confirming transactions such as cash withdrawal, cash deposit, transfer of deposits from one account to another.

なお、金融機関の窓口には、帳票読取装置100以外にも複数の帳票読取装置が設けられてもよい。
金融機関は、帳票のレイアウトを変更すること(以下、帳票の改訂ということもある)がある。例えば、新たなデータ項目の記入欄を追加したり、既存のデータ項目の記入欄を削減したりする場合が考えられる。レイアウト認識では、レイアウト変更に際して帳票のレイアウト定義情報を変更するための作業負担が生じる。そこで、帳票読取装置100は、改訂箇所につきキーワード認識による文字認識処理を行うことで、該レイアウト変更に容易に対応可能である。以下、この場合にキーワード認識による文字認識処理を効率的に行うための構成を説明する。
In addition to the form reading device 100, a plurality of form reading devices may be provided at the counter of the financial institution.
Financial institutions sometimes change the layout of forms (hereinafter, sometimes referred to as revision of forms). For example, it may be possible to add a new data item entry field or to reduce an existing data item entry field. In layout recognition, a work load for changing the layout definition information of a form occurs when the layout is changed. Therefore, the form reading apparatus 100 can easily cope with the layout change by performing character recognition processing by keyword recognition for the revised portion. Hereinafter, a configuration for efficiently performing character recognition processing by keyword recognition in this case will be described.

図3は、第2の実施の形態の帳票読取装置のハードウェアを示す図である。帳票読取装置100は、CPU101、ROM(Read Only Memory)102、RAM103、HDD(Hard Disk Drive)104、グラフィックインタフェース105、入力インタフェース106、スキャナインタフェース107、ディスクドライブ108および通信インタフェース109を有する。   FIG. 3 is a diagram illustrating hardware of the form reading apparatus according to the second embodiment. The form reading apparatus 100 includes a CPU 101, a ROM (Read Only Memory) 102, a RAM 103, an HDD (Hard Disk Drive) 104, a graphic interface 105, an input interface 106, a scanner interface 107, a disk drive 108, and a communication interface 109.

CPU101は、OS(Operating System)プログラムやアプリケーションプログラムを実行して、帳票読取装置100全体を制御する。
ROM102は、帳票読取装置100の起動時に実行されるBIOS(Basic Input / Output System)プログラムなどの所定のプログラムを記憶する。ROM102は、書き換え可能な不揮発性メモリであってもよい。
The CPU 101 executes an OS (Operating System) program and an application program to control the entire form reading apparatus 100.
The ROM 102 stores a predetermined program such as a BIOS (Basic Input / Output System) program executed when the form reading apparatus 100 is activated. The ROM 102 may be a rewritable nonvolatile memory.

RAM103は、CPU101が実行するOSプログラムやアプリケーションプログラムの少なくとも一部を一時的に記憶する。また、RAM103は、CPU101の処理に用いられるデータの少なくとも一部を一時的に記憶する。   The RAM 103 temporarily stores at least part of an OS program and application programs executed by the CPU 101. The RAM 103 temporarily stores at least a part of data used for the processing of the CPU 101.

HDD104は、OSプログラムやアプリケーションプログラムを記憶する。また、HDD104は、CPU101の処理に用いられるデータを記憶する。なお、HDD104に代えて(または、HDD104と併せて)、SSD(Solid State Drive)など他の種類の不揮発性の記憶装置を用いてもよい。   The HDD 104 stores an OS program and application programs. The HDD 104 stores data used for the processing of the CPU 101. Instead of the HDD 104 (or in combination with the HDD 104), other types of nonvolatile storage devices such as an SSD (Solid State Drive) may be used.

グラフィックインタフェース105は、モニタ11に接続される。グラフィックインタフェース105は、CPU101からの命令に従って、画像をモニタ11に表示させる。
入力インタフェース106は、キーボード12やマウス13などの入力デバイスに接続される。入力インタフェース106は、入力デバイスから送られる入力信号をCPU101に出力する。
The graphic interface 105 is connected to the monitor 11. The graphic interface 105 displays an image on the monitor 11 in accordance with a command from the CPU 101.
The input interface 106 is connected to input devices such as the keyboard 12 and the mouse 13. The input interface 106 outputs an input signal sent from the input device to the CPU 101.

スキャナインタフェース107は、イメージスキャナ14に接続される。イメージスキャナ14は、帳票を撮像して帳票画像を生成する撮像装置である。スキャナインタフェース107は、イメージスキャナ14から取得した帳票画像をCPU101、RAM103およびHDD104などに出力する。   The scanner interface 107 is connected to the image scanner 14. The image scanner 14 is an imaging device that captures a form and generates a form image. The scanner interface 107 outputs the form image acquired from the image scanner 14 to the CPU 101, the RAM 103, the HDD 104, and the like.

ディスクドライブ108は、記録媒体15に格納されたデータを読み取る読取装置である。記録媒体15には、例えば、帳票読取装置100に実行させるプログラムが記録されている。帳票読取装置100は、例えば、記録媒体15に記録されたプログラムを実行することで、後述するような機能を実現できる。すなわち、該プログラムはコンピュータ読み取り可能な記録媒体15に記録して配布可能である。   The disk drive 108 is a reading device that reads data stored in the recording medium 15. For example, a program to be executed by the form reading apparatus 100 is recorded on the recording medium 15. The form reading apparatus 100 can realize functions as described later by executing a program recorded in the recording medium 15, for example. That is, the program can be recorded on a computer-readable recording medium 15 and distributed.

記録媒体15としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリを使用できる。磁気記録装置には、HDD、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、CD(Compact Disc)、CD−R(Recordable)/RW(ReWritable)、DVD(Digital Versatile Disc)、DVD−R/RW/RAMなどがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。半導体メモリには、USB(Universal Serial Bus)メモリなどのフラッシュメモリがある。   As the recording medium 15, for example, a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory can be used. Examples of the magnetic recording device include an HDD, a flexible disk (FD), and a magnetic tape. Optical disks include CD (Compact Disc), CD-R (Recordable) / RW (ReWritable), DVD (Digital Versatile Disc), DVD-R / RW / RAM, and the like. Magneto-optical recording media include MO (Magneto-Optical disk). Semiconductor memory includes flash memory such as USB (Universal Serial Bus) memory.

通信インタフェース109は、ネットワーク10に接続される。通信インタフェース109は、ネットワーク10を介してサーバ装置200とデータ通信を行える。
帳票読取装置100は、文字認識により読み取った各データ項目の文字列データをサーバ装置200に送信する。
The communication interface 109 is connected to the network 10. The communication interface 109 can perform data communication with the server device 200 via the network 10.
The form reading device 100 transmits the character string data of each data item read by character recognition to the server device 200.

なお、サーバ装置200も帳票読取装置100と同様のハードウェア構成により実現できる。
図4は、第2の実施の形態の改訂前の帳票の例を示す図である。帳票300は、改訂前の(既存の)帳票を例示している。帳票300は、例えば、規格などによってそのレイアウトが定められているものである。なお、規格などによりレイアウトが定められた帳票を制定帳票と呼ぶこともある。帳票300には、帳票ID(IDentifier)310および記入欄群320,330が印字されている。
The server apparatus 200 can also be realized by the same hardware configuration as the form reading apparatus 100.
FIG. 4 is a diagram illustrating an example of a form before revision according to the second embodiment. The form 300 exemplifies the (existing) form before revision. The form 300 has a layout determined by, for example, a standard. A form whose layout is defined by a standard or the like may be called an enacted form. On the form 300, a form ID (IDentifier) 310 and entry column groups 320 and 330 are printed.

帳票ID310は、帳票の種別を識別するための識別情報である。帳票ID310として、“200100”が印字されている。帳票ID310の上4桁の数値“2001”は、帳票300が口座開設の申し込みを行ったり、自身の口座に入金する取引を行ったりするための帳票であることを示す。帳票ID310の下2桁の数値“00”は、帳票300が改訂されたものではないことを示す。ここで、以下では、帳票IDの下2桁の数値を、帳票IDの枝番と呼ぶことがある。   The form ID 310 is identification information for identifying the type of form. “200100” is printed as the form ID 310. The first four-digit numerical value “2001” of the form ID 310 indicates that the form 300 is a form for making an application for opening an account or performing a transaction for depositing into its own account. The last two digits “00” of the form ID 310 indicate that the form 300 has not been revised. Here, in the following, the last two digits of the form ID may be referred to as a branch number of the form ID.

記入欄群320,330は、顧客に記入させる複数の記入欄を印字した領域である。ここで、記入欄とは、該記入欄の見出し部分(例えば、“おところ”や“おなまえ”といった文字列が予め印字される部分)と顧客が筆記具を用いて文字列を記入する部分とを含む欄である。   The entry column groups 320 and 330 are areas in which a plurality of entry columns to be entered by the customer are printed. Here, the entry field is a heading part of the entry field (for example, a part in which a character string such as “place” or “name” is printed in advance) and a part in which a customer enters a character string using a writing instrument. It is a column containing.

記入欄群320は、記入欄321,322,323,324,325,326,327,328,329を含む。記入欄321は、申込日(例えば、年月日)を記入させるための欄である。記入欄322は、金融機関の店舗を識別するための番号(店番)を記入させるための欄である。記入欄323は、口座番号を記入させるための欄である。記入欄324は、郵便番号および住所を記入させるための欄である。記入欄325は、口座名義人の氏名を記入させるための欄である。記入欄326は、取引の金額を記入させるための欄である。記入欄327は、金融機関が提供する金融商品の種類を選択させるための欄である。記入欄328は、利用する通帳の種類を選択させるための欄である。記入欄329は、利用するキャッシュカードの種類を選択させるための欄である。   The entry column group 320 includes entry columns 321, 322, 323, 324, 325, 326, 327, 328, and 329. The entry column 321 is a column for entering an application date (for example, date). The entry column 322 is a column for entering a number (store number) for identifying a store of a financial institution. The entry column 323 is a column for entering an account number. The entry column 324 is a column for entering a zip code and an address. The entry column 325 is a column for entering the name of the account holder. The entry column 326 is a column for entering the transaction amount. The entry column 327 is a column for selecting the type of financial product provided by the financial institution. The entry column 328 is a column for selecting the type of passbook to be used. The entry column 329 is a column for selecting the type of cash card to be used.

記入欄群330は、記入欄331,332,333を含む。記入欄331は、口座名義人の電話番号を記入させるための欄である。記入欄332は、口座名義人の性別を選択させるための欄である。記入欄333は、口座名義人の生年月日を記入させるための欄である。   The entry field group 330 includes entry fields 331, 332, and 333. The entry column 331 is a column for entering the account holder's telephone number. The entry column 332 is a column for selecting the gender of the account holder. The entry column 333 is a column for entering the date of birth of the account holder.

記入欄群320,330の各欄の枠線および帳票300上の一部箇所には所定の色が付される。この色は、帳票300のカラーイメージ(カラーの帳票画像)を取得後、該イメージに所定のドロップアウト処理を行うことで、該イメージからドロップアウト(消去)可能な色である。このような色を、ドロップアウト色と呼ぶことがある。   A predetermined color is given to a frame line of each column of the entry column groups 320 and 330 and a part of the form 300. This color is a color that can be dropped out (erased) from the image by obtaining a color image (colored form image) of the form 300 and performing a predetermined dropout process on the image. Such a color may be referred to as a dropout color.

図5は、第2の実施の形態の改訂後の帳票の例を示す図である。帳票300aは、帳票300に対する改訂後の帳票を例示している。帳票300aには、帳票ID310a、記入欄群320a,330aおよび領域識別情報340が印字されている。   FIG. 5 is a diagram illustrating an example of a revised form according to the second embodiment. The form 300a exemplifies a revised form for the form 300. A form ID 310a, entry column groups 320a and 330a, and area identification information 340 are printed on the form 300a.

帳票ID310aは、帳票の種別を識別するための識別情報である。帳票ID310aとして、“200101”が印字されている。帳票ID310aの上4桁の数値“2001”は、帳票300aが口座開設の申し込みを行ったり、自身の口座に入金する取引を行ったりするための帳票であることを示す。帳票ID310aの下2桁の数値“01”は、帳票300aが改訂後の版数“01”の帳票であることを示す。すなわち、該下2桁の数値が“00”以外のとき、該帳票は、改訂後のものであることを示し、該数値が改訂後の版数を示している。   The form ID 310a is identification information for identifying the type of form. “200101” is printed as the form ID 310a. The first four-digit numerical value “2001” of the form ID 310a indicates that the form 300a is a form for making an application for opening an account or performing a transaction for depositing into its own account. The last two digits “01” of the form ID 310a indicate that the form 300a is a revised version “01”. That is, when the numerical value of the last two digits is other than “00”, it indicates that the form is the revised version, and the numeric value indicates the revised version number.

記入欄群320a,330aは、顧客に記入させる複数の記入欄を印字した領域である。
記入欄群320aは、記入欄321,322,323,324,325,326,327a,328a,329aを含む。帳票300と比較すると、記入欄327a,328a,329aが相違する。
The entry column groups 320a and 330a are areas in which a plurality of entry columns to be entered by the customer are printed.
The entry column group 320a includes entry columns 321, 322, 323, 324, 325, 326, 327a, 328a, and 329a. Compared with the form 300, entry fields 327a, 328a, and 329a are different.

記入欄327a,328a,329aは、記入欄327,328,329と同様の内容を記入させるための欄である。記入欄327a,328a,329aは、記入欄327,328,329に対して、新しい選択項目を追加している点が異なる。これにより、記入欄328a,329aは、その欄の占める領域が、図5の紙面に向かって下方に拡張されている。   The entry fields 327a, 328a, and 329a are fields for entering the same contents as the entry fields 327, 328, and 329. The entry fields 327a, 328a, and 329a differ from the entry fields 327, 328, and 329 in that new selection items are added. As a result, in the entry fields 328a and 329a, the area occupied by the fields is expanded downward toward the paper surface of FIG.

記入欄群330aは、記入欄331a,332a,333aを含む。記入欄331a,332a,333aは、記入欄331,332,333と同様の内容を記入させるための欄である。帳票300と比較すると、記入欄328a,329aの占める領域が拡張したことで、記入欄331a,332a,333aは図5の紙面に向かって下方に移動している。   The entry column group 330a includes entry columns 331a, 332a, and 333a. The entry fields 331a, 332a, 333a are fields for entering the same contents as the entry fields 331, 332, 333. Compared with the form 300, the areas occupied by the entry fields 328a and 329a are expanded, so that the entry fields 331a, 332a and 333a are moved downward toward the paper surface of FIG.

領域識別情報340は、記入欄群330aを囲う線であり、四角形の各辺を形成している。
記入欄群320a,330aの各欄の枠線および帳票300a上の一部箇所には、帳票300と同様にドロップアウト色が付される。領域識別情報340には、ドロップアウト色以外の色が付される。帳票読取装置100が領域識別情報340の検出処理を適切に行えるようにするためである(後述する)。
The area identification information 340 is a line surrounding the entry field group 330a and forms each side of a rectangle.
Similar to the form 300, dropout colors are given to the frame lines of the respective fields of the entry field groups 320a and 330a and a part of the form 300a. The region identification information 340 is assigned a color other than the dropout color. This is so that the form reading apparatus 100 can appropriately perform the detection processing of the area identification information 340 (described later).

図6は、第2の実施の形態の帳票読取装置の機能構成を示すブロック図である。帳票読取装置100は、記憶部110、帳票ID読取部120、文字認識処理部130および領域特定部140を有する。これらの各機能は、例えばCPU101が所定のプログラムを実行することにより、帳票読取装置100上に実現される。これらの各機能の全部または一部を専用のハードウェアで実装してもよい。   FIG. 6 is a block diagram illustrating a functional configuration of the form reading apparatus according to the second embodiment. The form reading apparatus 100 includes a storage unit 110, a form ID reading unit 120, a character recognition processing unit 130, and an area specifying unit 140. Each of these functions is realized on the form reading apparatus 100 by the CPU 101 executing a predetermined program, for example. All or some of these functions may be implemented by dedicated hardware.

記憶部110は、帳票のレイアウトを定義したレイアウト定義テーブルを記憶する。
帳票ID読取部120は、イメージスキャナ14から受信したカラーの帳票画像に含まれる帳票IDを読み取る。このとき、帳票ID読取部120は、該帳票画像に対してドロップアウト処理を行う。ドロップアウト色を何れの色とするかは、例えば、帳票IDに対応付けて記憶部110に予め設定される。また、帳票IDは、例えば、帳票上の所定の位置に印字される。よって、帳票ID読取部120に、その位置(例えば、帳票画像上の座標値)を予め設定しておけば、帳票ID読取部120は、帳票画像中の該座標位置から帳票IDを読み取れる。あるいは、帳票ID読取部120は、帳票IDのフォーマット(例えば、数値や桁数など)に基づいて、該フォーマットに合致する文字列を帳票IDとして読み取ってもよい。帳票ID読取部120は、帳票IDの読み取り結果を文字認識処理部130に出力する。
The storage unit 110 stores a layout definition table that defines the layout of a form.
The form ID reading unit 120 reads the form ID included in the color form image received from the image scanner 14. At this time, the form ID reading unit 120 performs a dropout process on the form image. Which color is used as the dropout color is preset in the storage unit 110 in association with the form ID, for example. The form ID is printed at a predetermined position on the form, for example. Therefore, if the position (for example, coordinate value on the form image) is set in advance in the form ID reading unit 120, the form ID reading unit 120 can read the form ID from the coordinate position in the form image. Alternatively, the form ID reading unit 120 may read a character string that matches the format as the form ID based on the format (for example, a numerical value or the number of digits) of the form ID. The form ID reading unit 120 outputs the result of reading the form ID to the character recognition processing unit 130.

なお、帳票ID読取部120は、イメージスキャナ14から受信した帳票画像および該帳票画像にドロップアウト処理を行った後の画像情報をRAM103上の所定の領域に格納する。以降の処理において、文字認識処理部130および領域特定部140は、RAM103上の該領域を参照して帳票画像(ドロップアウト処理後の画像情報を含む)に対する各部の処理を実行する。   The form ID reading unit 120 stores the form image received from the image scanner 14 and the image information after the dropout process is performed on the form image in a predetermined area on the RAM 103. In the subsequent processing, the character recognition processing unit 130 and the region specifying unit 140 refer to the region on the RAM 103 and execute processing of each unit for the form image (including image information after the dropout processing).

文字認識処理部130は、帳票に対してレイアウト認識による文字認識処理を実行する。文字認識処理部130は、帳票IDが改訂された旨を示している場合、該帳票画像に対してレイアウト認識およびキーワード認識による文字認識を行う。文字認識処理部130は、文字認識の結果をモニタ11に表示させる。オペレータに結果の正誤確認などを促すためである。オペレータは、読取結果(データ項目および文字列データの内容)が適正であれば、キーボード12やマウス13を操作して、該読取結果のサーバ装置200への送信を文字認識処理部130に指示できる。文字認識処理部130は、この指示を受け付けると、読取結果をサーバ装置200に送信して、取引に関する処理の実行を要求する。   The character recognition processing unit 130 executes character recognition processing by layout recognition on the form. When the form ID indicates that the form ID has been revised, the character recognition processing unit 130 performs character recognition by layout recognition and keyword recognition on the form image. The character recognition processing unit 130 displays the result of character recognition on the monitor 11. This is to prompt the operator to check the correctness of the result. If the reading result (data item and character string data contents) is appropriate, the operator can operate the keyboard 12 and the mouse 13 to instruct the character recognition processing unit 130 to transmit the reading result to the server device 200. . When the character recognition processing unit 130 receives this instruction, the character recognition processing unit 130 transmits the reading result to the server device 200 and requests execution of processing related to the transaction.

文字認識処理部130は、レイアウト認識処理部131およびキーワード認識処理部132を有する。
レイアウト認識処理部131は、帳票IDと、記憶部110に記憶されたレイアウト定義テーブルと、に基づいて、帳票画像に対するレイアウト認識処理(レイアウト認識による文字認識)を行う。
The character recognition processing unit 130 includes a layout recognition processing unit 131 and a keyword recognition processing unit 132.
The layout recognition processing unit 131 performs layout recognition processing (character recognition by layout recognition) on the form image based on the form ID and the layout definition table stored in the storage unit 110.

キーワード認識処理部132は、帳票IDと、記憶部110に記憶されたレイアウト定義テーブルと、に基づいて、帳票画像に対するキーワード認識処理(キーワード認識による文字認識処理)を行う。その際、キーワード認識処理部132は、帳票画像上の処理対象領域の特定を、領域特定部140に依頼する。   The keyword recognition processing unit 132 performs keyword recognition processing (character recognition processing by keyword recognition) on the form image based on the form ID and the layout definition table stored in the storage unit 110. At that time, the keyword recognition processing unit 132 requests the region specifying unit 140 to specify the processing target region on the form image.

領域特定部140は、キーワード認識処理部132の依頼に応じて、帳票画像から領域特定情報を読み取る。領域特定情報は、所定の太さおよび線の種別で帳票上に印字される。よって、領域特定部140にその太さおよび線の種別を予め設定しておけば、領域特定部140はその設定内容に基づいて、帳票画像から領域特定情報を読み取れる。   The area specifying unit 140 reads area specifying information from the form image in response to a request from the keyword recognition processing unit 132. The area specifying information is printed on the form with a predetermined thickness and line type. Therefore, if the thickness and line type are set in advance in the area specifying unit 140, the area specifying unit 140 can read the area specifying information from the form image based on the setting contents.

領域特定情報は、多角形の頂点などを示す情報としてもよい。その場合には、領域特定部140に、領域特定情報として認識すべき数値、文字、記号、図形およびこれらの組合せなどを予め設定しておけばよい。領域特定部140は、特定した領域を示す情報(例えば、該領域を示す座標値)をキーワード認識処理部132に出力する。   The area specifying information may be information indicating a vertex of the polygon. In that case, a numerical value, a character, a symbol, a figure, a combination thereof, and the like to be recognized as the area specifying information may be set in advance in the area specifying unit 140. The area specifying unit 140 outputs information indicating the specified area (for example, coordinate values indicating the area) to the keyword recognition processing unit 132.

図7は、第2の実施の形態のレイアウト定義テーブルの例を示す図である。レイアウト定義テーブル111は、記憶部110に記憶される。レイアウト定義テーブル111には、帳票ID、データ項目名、記入欄の座標、カテゴリおよび手活区分の項目を含む。各項目の横方向に並べられた情報同士が互いに関連付けられて、帳票上に記入される1つの内容を特定するための情報を示す。   FIG. 7 is a diagram illustrating an example of a layout definition table according to the second embodiment. The layout definition table 111 is stored in the storage unit 110. The layout definition table 111 includes items such as form ID, data item name, entry column coordinates, category, and manual activity classification. The information arranged in the horizontal direction of each item is associated with each other, and indicates information for specifying one content to be entered on the form.

帳票IDの項目には、帳票ID(枝番を除く)が設定される。データ項目名の項目には、データ項目名が設定される。
記入欄の座標の項目には、記入欄の座標値が設定される。ここで、1つの記入欄の座標値は、図4で示した帳票300を例にとると、該記入欄の図4の紙面に向かって左上側の座標値と、該記入欄の同右下側の座標と、を指定することで示される。座標値は、帳票300の図4の紙面に向かって左上の頂点を原点として、同右向き方向をx座標の正方向、同下向き方向をy座標の正方向と定義するものとする。ただし、これとは異なる座標系で記入欄の位置を表してもよい。
A form ID (excluding branch numbers) is set in the form ID item. The data item name is set in the data item name item.
The coordinate value of the entry field is set in the coordinate field of the entry field. Here, taking the form 300 shown in FIG. 4 as an example, the coordinate value of one entry column is the upper left coordinate value of the entry column in FIG. 4 and the lower right side of the entry column. This is indicated by specifying the coordinates of. The coordinate values are defined by defining the upper left vertex of the form 300 in FIG. 4 as the origin, the right direction as the positive direction of the x coordinate, and the downward direction as the positive direction of the y coordinate. However, the position of the entry field may be expressed in a different coordinate system.

カテゴリの項目には、記入欄に記入される文字列が数値、カタカナ、漢字および記号などのうち、何れの種類であるかが設定される。手活区分の項目には、該記入欄に記入される文字列が手書きのものであるか活字として印字されるものであるかを示す情報が設定される。   In the category item, it is set which type of character string to be entered in the entry field is numeric, katakana, kanji, or symbol. Information indicating whether the character string to be entered in the entry field is handwritten or printed as a type is set in the item of hand type.

例えば、レイアウト定義テーブル111には、帳票IDが“2001”、データ項目名が“申込日”、記入欄の座標が“S(35,20),E(60,30)”、カテゴリが“数値”、手活区分が“手書き”という情報が設定される。なお、記入欄の座標の設定につき“S”の文字は記入欄の左上側の座標値に付されるものである。同様に、“E”の文字は記入欄の右下側の座標値に付されるものである。   For example, in the layout definition table 111, the form ID is “2001”, the data item name is “application date”, the coordinates of the entry column are “S (35, 20), E (60, 30)”, and the category is “numeric value”. ", The information that the hand activity classification is" handwritten "is set. Note that the character “S” is assigned to the coordinate value on the upper left side of the entry field for setting the coordinates in the entry field. Similarly, the letter “E” is attached to the coordinate value on the lower right side of the entry field.

よって、このレコードは、帳票IDの上4桁が“2001”の帳票300の帳票画像につき、データ項目名“申込日”に対応する記入欄が帳票画像の(x,y)=(35,20)および(x,y)=(60,30)を対角にもつ長方形の領域であることを示す。また、この記入欄に記入される文字列が数値であり、該文字列が顧客により手書きで記入されるものであることを示す。更に、このレコードは、帳票IDの上4桁が“2001”の帳票300aの帳票画像についても、同様の記入欄が含まれ得ることを示している。   Therefore, in this record, the entry field corresponding to the data item name “application date” is the form image (x, y) = (35, 20) for the form image of the form 300 whose first four digits are “2001”. ) And (x, y) = (60, 30) indicates a rectangular region having diagonal lines. The character string entered in the entry field is a numerical value, and indicates that the character string is handwritten by the customer. Further, this record indicates that the same entry field can be included for the form image of the form 300a whose first four digits of the form ID are “2001”.

次に、以上の構成の帳票読取装置100の処理手順を説明する。
図8は、第2の実施の形態の帳票読取処理を示すフローチャートである。以下、図8に示す処理をステップ番号に沿って説明する。
Next, a processing procedure of the form reading apparatus 100 having the above configuration will be described.
FIG. 8 is a flowchart illustrating a form reading process according to the second embodiment. In the following, the process illustrated in FIG. 8 will be described in order of step number.

(ステップS11)帳票ID読取部120は、イメージスキャナ14から受信したカラーの帳票画像をRAM103上の所定領域に格納する。帳票ID読取部120は、該帳票画像に対してドロップアウト処理を行い、ドロップアウト処理後の帳票画像をRAM103上の他の所定領域に格納する。   (Step S <b> 11) The form ID reading unit 120 stores the color form image received from the image scanner 14 in a predetermined area on the RAM 103. The form ID reading unit 120 performs a dropout process on the form image, and stores the form image after the dropout process in another predetermined area on the RAM 103.

(ステップS12)帳票ID読取部120は、ドロップアウト処理後の帳票画像から帳票IDを認識する。例えば、帳票ID読取部120は、該帳票画像の所定位置から帳票IDを読み取れる。帳票ID読取部120は、読み取った帳票IDを文字認識処理部130に出力する。   (Step S12) The form ID reading unit 120 recognizes the form ID from the form image after the dropout process. For example, the form ID reading unit 120 can read the form ID from a predetermined position of the form image. The form ID reading unit 120 outputs the read form ID to the character recognition processing unit 130.

(ステップS13)文字認識処理部130は、レイアウト認識処理部131に処理を委譲し、レイアウト認識処理を実行させる。レイアウト認識処理部131は、帳票ID読取部120から取得した帳票IDに基づいて、記憶部110に記憶されたレイアウト定義テーブル111を参照し、ドロップアウト処理後の帳票画像に対してレイアウト認識による文字認識処理を行う。   (Step S <b> 13) The character recognition processing unit 130 delegates the processing to the layout recognition processing unit 131 and causes the layout recognition processing to be executed. The layout recognition processing unit 131 refers to the layout definition table 111 stored in the storage unit 110 on the basis of the form ID acquired from the form ID reading unit 120, and performs character recognition by layout recognition on the form image after the dropout process. Perform recognition processing.

(ステップS14)文字認識処理部130は、帳票ID読取部120から取得した帳票IDの下2桁が“01”以上であるか否かを判定する。“01”以上である場合(すなわち、改訂された帳票である場合)、処理をステップS15に進める。“01”以上でない場合(すなわち、改訂された帳票でない場合)、処理をステップS16に進める。   (Step S14) The character recognition processing unit 130 determines whether or not the last two digits of the form ID acquired from the form ID reading unit 120 is “01” or more. If it is “01” or more (that is, a revised form), the process proceeds to step S15. If it is not “01” or more (that is, if it is not a revised form), the process proceeds to step S16.

(ステップS15)文字認識処理部130は、キーワード認識処理部132に処理を委譲し、キーワード認識処理を実行させる。該キーワード認識処理については後述する。
(ステップS16)文字認識処理部130は、帳票画像に対する文字認識結果を出力し、モニタ11に該結果を表示させる。
(Step S15) The character recognition processing unit 130 delegates the processing to the keyword recognition processing unit 132 and causes the keyword recognition processing to be executed. The keyword recognition process will be described later.
(Step S16) The character recognition processing unit 130 outputs a character recognition result for the form image and causes the monitor 11 to display the result.

このように、文字認識処理部130は、ドロップアウト処理後の帳票画像に対してレイアウト認識処理を実行する。更に、文字認識処理部130は、帳票画像に含まれる帳票IDに応じて、キーワード認識処理の実行要否を判断する。文字認識処理部130は、改訂された帳票に対してキーワード認識処理を実行し、未改訂の帳票にはキーワード認識処理を実行しない。   As described above, the character recognition processing unit 130 executes the layout recognition process on the form image after the dropout process. Further, the character recognition processing unit 130 determines whether or not the keyword recognition process is necessary according to the form ID included in the form image. The character recognition processing unit 130 performs the keyword recognition process on the revised form, and does not execute the keyword recognition process on the unrevised form.

次に、ステップS11における、帳票300aに関する、ドロップアウト処理後の帳票画像を例示する。
図9は、第2の実施の形態のドロップアウト処理後の帳票画像の例を示す図である。帳票画像300bは、イメージスキャナ14が撮像した帳票画像に対してドロップアウト処理を行って得られた画像情報である。
Next, the form image after the dropout process related to the form 300a in step S11 is illustrated.
FIG. 9 is a diagram illustrating an example of a form image after the dropout process according to the second embodiment. The form image 300b is image information obtained by performing dropout processing on the form image captured by the image scanner 14.

帳票画像300bでは、ドロップアウト色で帳票300aに印字された枠線などが消去されている。顧客が枠線内に記入した文字列の色は、ドロップアウト色以外の色で記入されており、ドロップアウト対象にはならない(ドロップアウト処理によって消去されない)。領域識別情報340も同様である。   In the form image 300b, the frame line printed on the form 300a in the dropout color is deleted. The color of the character string entered by the customer in the frame line is entered in a color other than the dropout color and is not a dropout target (it is not erased by the dropout process). The same applies to the area identification information 340.

レイアウト認識処理部131は、レイアウト定義テーブル111を参照して、帳票画像300b(帳票IDの上4桁が“2001”)内の所定の座標に記入された文字列を、口座番号や氏名などのデータ項目に対応付けて取得できる。例えば、データ項目名“口座番号”のデータを帳票画像300bから抽出する場合、レイアウト認識処理部131は次の処理を行う。   The layout recognition processing unit 131 refers to the layout definition table 111 and uses a character string written at predetermined coordinates in the form image 300b (the first four digits of the form ID is “2001”) as an account number, a name, and the like. Can be acquired in association with data items. For example, when extracting the data of the data item name “account number” from the form image 300b, the layout recognition processing unit 131 performs the following processing.

レイアウト認識処理部131は、レイアウト定義テーブル111に基づき、“口座番号”に対応する枠323aを特定する。具体的には、帳票画像300bの座標(x,y)=(140,20)を図9の紙面に向かって左上頂点とし、座標(x,y)=(160,30)を同右下頂点とする長方形が枠323aである。なお、図9において点線で図示した枠323aの枠線は、帳票画像300bには含まれない。レイアウト認識処理部131は、枠323a内に記入された文字画像を取得する。レイアウト認識処理部131は、該文字画像と予め記憶部110に格納された文字パターンとの照合を行い、“9999999”の文字列を抽出する。このときレイアウト定義テーブル111によれば、この位置のデータのカテゴリが数値である。よって、レイアウト認識処理部131は、数値の文字パターンと、文字画像との照合を行えばよい。   The layout recognition processing unit 131 identifies a frame 323 a corresponding to “account number” based on the layout definition table 111. Specifically, the coordinates (x, y) = (140, 20) of the form image 300b are set as the upper left vertex toward the paper surface of FIG. 9, and the coordinates (x, y) = (160, 30) are set as the lower right vertex. A rectangle to be displayed is a frame 323a. Note that the frame line 323a illustrated by the dotted line in FIG. 9 is not included in the form image 300b. The layout recognition processing unit 131 obtains a character image entered in the frame 323a. The layout recognition processing unit 131 collates the character image with the character pattern stored in the storage unit 110 in advance, and extracts a character string “9999999”. At this time, according to the layout definition table 111, the category of the data at this position is a numerical value. Therefore, the layout recognition processing unit 131 only has to collate numerical character patterns with character images.

このようにして、レイアウト認識処理部131は、データ項目“口座番号”に対する文字列データ“9999999”を取得する。
また、領域識別情報340は、ドロップアウト色以外の色で印字されている。このため、領域識別情報340は、ドロップアウト対象にはならず、帳票画像300bに含まれる。帳票画像300bには、他の枠線はドロップアウト処理により消去されているので、領域特定部140は、領域識別情報340を容易に検出できる。
In this way, the layout recognition processing unit 131 acquires the character string data “9999999” for the data item “account number”.
The area identification information 340 is printed in a color other than the dropout color. Therefore, the area identification information 340 is not a dropout target and is included in the form image 300b. In the form image 300b, the other frame lines are erased by the dropout process, so that the area specifying unit 140 can easily detect the area identification information 340.

次に、図8のステップS15で説明したキーワード認識処理の手順を説明する。以下、RAM103上には次の情報が取得されているものとする。
(1)「帳票300aの帳票画像」
(2)「帳票300aの帳票画像」にドロップアウト処理を実行して得られた「帳票画像300b」
「帳票300aの帳票画像」という場合、帳票300aに含まれる全領域をカラーで取得した画像情報を示す。「帳票画像300b」という場合、「帳票300aの帳票画像」にドロップアウト処理を実行して得られた画像情報を示す。また、何れの帳票画像においても、領域識別情報340を同一の符号で指し示すものとする。
Next, the procedure of the keyword recognition process described in step S15 in FIG. 8 will be described. Hereinafter, it is assumed that the following information is acquired on the RAM 103.
(1) “Form image of form 300a”
(2) “Form image 300b” obtained by executing dropout processing on “Form image of form 300a”
The “form image of the form 300a” indicates image information obtained in color for all areas included in the form 300a. In the case of “form image 300b”, “form image of form 300a” indicates image information obtained by executing the dropout process. In any form image, the region identification information 340 is indicated by the same symbol.

図10は、第2の実施の形態のキーワード認識処理を示すフローチャートである。以下、図10に示す処理をステップ番号に沿って説明する。
(ステップS21)キーワード認識処理部132は、レイアウト認識処理部131によるレイアウト認識処理の結果をRAM103またはHDD104上の所定領域に退避させる。
FIG. 10 is a flowchart illustrating keyword recognition processing according to the second embodiment. In the following, the process illustrated in FIG. 10 will be described in order of step number.
(Step S21) The keyword recognition processing unit 132 saves the result of the layout recognition processing by the layout recognition processing unit 131 in a predetermined area on the RAM 103 or the HDD 104.

(ステップS22)キーワード認識処理部132は、キーワード認識処理の対象領域の特定を領域特定部140に依頼する。領域特定部140は、帳票画像300bから領域識別情報340を検出する。例えば、領域特定部140には、領域識別情報340に関する情報(形状の種類、線の太さ、実線・破線といった線の種別など)が予め設定される。ここで、形状の種類とは、矩形の枠線である、楕円形の枠線である、多角形の頂点に付された記号(その記号がどのようなものかを含む)である、などの情報である。領域特定部140は、該情報に基づき、帳票画像300bから領域識別情報340を検出できる。領域特定部140は、特定した処理対象領域を示す領域情報をキーワード認識処理部132に出力する。領域情報は、例えば、処理対象領域の各頂点の座標値である。領域特定部140は、処理対象領域を複数検出した場合には、複数の領域情報をキーワード認識処理部132に出力する。   (Step S22) The keyword recognition processing unit 132 requests the region specifying unit 140 to specify the target region for the keyword recognition processing. The area specifying unit 140 detects area identification information 340 from the form image 300b. For example, information related to the region identification information 340 (type of shape, line thickness, line type such as solid line / broken line, etc.) is preset in the region specifying unit 140. Here, the type of shape is a rectangular frame line, an elliptical frame line, a symbol attached to the vertex of a polygon (including what the symbol is), etc. Information. The area specifying unit 140 can detect the area identification information 340 from the form image 300b based on the information. The area specifying unit 140 outputs area information indicating the specified processing target area to the keyword recognition processing unit 132. The area information is, for example, the coordinate value of each vertex of the processing target area. When the region specifying unit 140 detects a plurality of processing target regions, the region specifying unit 140 outputs a plurality of region information to the keyword recognition processing unit 132.

(ステップS23)キーワード認識処理部132は、領域特定部140から取得した領域情報に基づき、そのうちの1つの未処理領域のカラーイメージを帳票300aの帳票画像から抽出する。例えば、キーワード認識処理部132は、領域識別情報340内の領域(処理対象領域)のカラーイメージを抽出する。   (Step S23) The keyword recognition processing unit 132 extracts a color image of one unprocessed area from the form image of the form 300a based on the area information acquired from the area specifying unit 140. For example, the keyword recognition processing unit 132 extracts a color image of an area (processing target area) in the area identification information 340.

(ステップS24)キーワード認識処理部132は、ステップS23でカラーイメージを取得した処理対象領域からキーワードを1つ抽出する。例えば、キーワード認識処理部132は、処理対象領域に含まれる枠線を検出して、該枠線で囲われる枠ごとにキーワードの抽出を試みる。例えば、キーワード認識処理部132は、記入欄331aに含まれるキーワード“電話番号”を抽出する。   (Step S24) The keyword recognition processing unit 132 extracts one keyword from the processing target area from which the color image has been acquired in Step S23. For example, the keyword recognition processing unit 132 detects a frame line included in the processing target region, and tries to extract a keyword for each frame surrounded by the frame line. For example, the keyword recognition processing unit 132 extracts the keyword “phone number” included in the entry field 331a.

(ステップS25)キーワード認識処理部132は、帳票300aの帳票IDおよび記憶部110に記憶されたレイアウト定義テーブル111を参照して、該キーワードが帳票300aに含まれ得るデータ項目名に一致するか否か判定する。一致する場合、処理をステップS26に進める。一致しない場合、該キーワードを破棄して、処理をステップS29に進める。例えば、キーワード認識処理部132は、キーワード“電話番号”が、帳票300aの帳票ID“200101”の上4桁“2001”に対応付けられて、レイアウト定義テーブル111に設定されていることを検知する。この場合、該キーワード“電話番号“が帳票300aに含まれ得るデータ項目名に一致すると判定する。また、該キーワードが存在するセルが見出し部分のセルである。ここで、セルは、ドロップアウト色の枠線で囲われた1つの枠を示す。   (Step S25) The keyword recognition processing unit 132 refers to the form ID of the form 300a and the layout definition table 111 stored in the storage unit 110, and determines whether or not the keyword matches a data item name that can be included in the form 300a. To determine. If they match, the process proceeds to step S26. If they do not match, the keyword is discarded and the process proceeds to step S29. For example, the keyword recognition processing unit 132 detects that the keyword “phone number” is set in the layout definition table 111 in association with the first four digits “2001” of the form ID “200101” of the form 300a. . In this case, it is determined that the keyword “phone number” matches the data item name that can be included in the form 300a. A cell in which the keyword exists is a heading cell. Here, the cell indicates one frame surrounded by a drop-out color frame line.

(ステップS26)キーワード認識処理部132は、該データ項目に対する記入欄の位置(データ部)を特定する。例えば、データ部の位置は、「キーワードが存在するセルの右側に隣接するセル」のようにキーワード認識処理部132に予め設定される。あるいは、キーワードや、帳票300a上の表構造に基づき、該キーワードに対応するデータ部を特定してもよい。キーワードとデータ部との対応付け方法としては、例えば、特開2010−3155号公報に記載された方法を用いることができる。   (Step S26) The keyword recognition processing unit 132 specifies the position (data part) of the entry field for the data item. For example, the position of the data part is set in advance in the keyword recognition processing unit 132 as “a cell adjacent to the right side of the cell in which the keyword exists”. Alternatively, the data portion corresponding to the keyword may be specified based on the keyword or the table structure on the form 300a. As a method for associating the keyword with the data portion, for example, a method described in JP 2010-3155 A can be used.

(ステップS27)キーワード認識処理部132は、データ部の特徴を解析し、データ部のイメージに対して枠線やノイズなどを除去し、文字認識に適したイメージに加工する。   (Step S <b> 27) The keyword recognition processing unit 132 analyzes the characteristics of the data part, removes frame lines, noise, and the like from the image of the data part, and processes the image into an image suitable for character recognition.

(ステップS28)キーワード認識処理部132は、データ部に記入された文字画像を取得する。キーワード認識処理部132は、該文字画像と予め記憶部110に格納された文字パターンとの照合を行い、該データ部に記入された文字列データを取得する。例えば、キーワード認識処理部132は、データ項目“電話番号”に対して文字列データ“000−0000−0000”を取得する。   (Step S <b> 28) The keyword recognition processing unit 132 acquires a character image entered in the data portion. The keyword recognition processing unit 132 collates the character image with a character pattern stored in the storage unit 110 in advance, and acquires character string data entered in the data unit. For example, the keyword recognition processing unit 132 acquires character string data “000-0000-0000” for the data item “phone number”.

(ステップS29)キーワード認識処理部132は、現在の処理対象領域内でキーワードを未抽出の箇所が存在するか否かを判定する。キーワード未抽出の箇所が存在する場合、処理をステップS24に進める。キーワード未抽出の箇所が存在しない場合、処理をステップS30に進める。   (Step S <b> 29) The keyword recognition processing unit 132 determines whether or not there is a portion where no keyword has been extracted in the current processing target area. If there is a keyword-unextracted portion, the process proceeds to step S24. If there is no keyword-unextracted portion, the process proceeds to step S30.

(ステップS30)キーワード認識処理部132は、現在の処理対象領域以外にも、未処理の処理対象領域が存在するか否かを判定する。未処理の処理対象領域が存在する場合、処理をステップS23に進める。全ての処理対象領域につき処理済の場合、処理をステップS31に進める。   (Step S30) The keyword recognition processing unit 132 determines whether there is an unprocessed processing target area other than the current processing target area. If there is an unprocessed processing target area, the process proceeds to step S23. If all the process target areas have been processed, the process proceeds to step S31.

(ステップS31)キーワード認識処理部132は、一時退避させたレイアウト認識処理の結果とキーワード認識の結果とをマージする。具体的には、レイアウト定義テーブル111に定義された帳票300aのデータ項目のうち、レイアウト認識処理では取得できなかったものを、キーワード認識処理で取得した内容で補完する。   (Step S31) The keyword recognition processing unit 132 merges the temporarily saved layout recognition result and the keyword recognition result. Specifically, among the data items of the form 300a defined in the layout definition table 111, those that could not be acquired by the layout recognition process are supplemented with the contents acquired by the keyword recognition process.

このようにして、キーワード認識処理部132は、帳票300aの変更された領域につき、キーワード認識による文字認識を行う。
図11は、第2の実施の形態のキーワード認識対象領域の例を示す図である。キーワード認識対象領域は、領域識別情報340の内側の領域である。該領域内には、キーワード351,352,353も示されている。
In this way, the keyword recognition processing unit 132 performs character recognition by keyword recognition for the changed area of the form 300a.
FIG. 11 is a diagram illustrating an example of a keyword recognition target area according to the second embodiment. The keyword recognition target area is an area inside the area identification information 340. In the area, keywords 351, 352, and 353 are also shown.

キーワード351は、文字列“電話番号”を示しており、記憶部110に記憶されたレイアウト定義テーブル111によれば、帳票300aの帳票画像内に含まれ得るデータ項目名“電話番号”に一致する。   The keyword 351 indicates the character string “telephone number”, and according to the layout definition table 111 stored in the storage unit 110, matches the data item name “telephone number” that can be included in the form image of the form 300a. .

キーワード352は、文字列“性別”を示しており、帳票300aの帳票画像内に含まれ得るデータ項目名“性別”に一致する。
キーワード353は、文字列“生年月日”を示しており、帳票300aの帳票画像内に含まれ得るデータ項目名“生年月日”に一致する。
The keyword 352 indicates the character string “sex” and matches the data item name “sex” that can be included in the form image of the form 300a.
The keyword 353 indicates the character string “date of birth” and matches the data item name “date of birth” that can be included in the form image of the form 300a.

キーワード認識処理部132は、キーワード351を検出すると、キーワード351が存在するセルの右側に隣接するセル351aをデータ部と特定する。そして、キーワード認識処理部132は、データ項目“電話番号”に対して文字列データ“000−0000−0000”を取得する。なお、キーワード351を含むセルおよびセル351aが図5で示した記入欄331aに対応する。   When the keyword recognition processing unit 132 detects the keyword 351, the keyword recognition processing unit 132 identifies the cell 351a adjacent to the right side of the cell in which the keyword 351 exists as the data unit. Then, the keyword recognition processing unit 132 acquires character string data “000-0000-0000” for the data item “phone number”. Note that the cell including the keyword 351 and the cell 351a correspond to the entry field 331a shown in FIG.

また、キーワード認識処理部132は、キーワード352を検出すると、キーワード352が存在するセルの右側に隣接するセル352aをデータ部と特定する。そして、キーワード認識処理部132は、データ項目“性別”に対して、“男”を選択していることを示す選択記号(チェックマーク)を取得する。このような選択記号も文字列データに含まれる。なお、キーワード352を含むセルおよびセル352aが図5で示した記入欄332aに対応する。   Further, when the keyword recognition processing unit 132 detects the keyword 352, the keyword recognition processing unit 132 identifies the cell 352a adjacent to the right side of the cell in which the keyword 352 exists as the data unit. Then, the keyword recognition processing unit 132 acquires a selection symbol (check mark) indicating that “male” is selected for the data item “sex”. Such a selection symbol is also included in the character string data. Note that the cell including the keyword 352 and the cell 352a correspond to the entry field 332a shown in FIG.

更に、キーワード認識処理部132は、キーワード353を検出するとキーワード353が存在するセルの右側に隣接するセル353aをデータ部と特定する。そして、キーワード認識処理部132は、データ項目“生年月日”に対して、文字列データ“1985”年“11”月“15”日を取得する。なお、キーワード353を含むセルおよびセル353aが図5で示した記入欄333aに対応する。   Furthermore, when the keyword recognition processing unit 132 detects the keyword 353, the cell 353a adjacent to the right side of the cell in which the keyword 353 exists is specified as the data unit. Then, the keyword recognition processing unit 132 acquires the character string data “1985” “11” month “15” day for the data item “birth date”. Note that the cell including the keyword 353 and the cell 353a correspond to the entry field 333a shown in FIG.

なお、該領域内には、“男”、“女”、“年”、“月”、“日”などの他の文字も含まれている。しかし、これらは何れもレイアウト定義テーブル111内で帳票300a内のデータ項目名として定義されていない。よって、キーワード認識処理部132は、これら他の文字に関しては、データ項目名とはみなさない。   The area includes other characters such as “male”, “female”, “year”, “month”, and “day”. However, none of these are defined as data item names in the form 300a in the layout definition table 111. Therefore, the keyword recognition processing unit 132 does not regard these other characters as data item names.

図12は、第2の実施の形態の帳票IDの例を示す図である。帳票ID310aの印字方法は、上記の方法に限られない。例えば、次のように印字してもよい。
図12(A)では、帳票ID310bが示されている。帳票ID310bは、帳票ID310と帳票ID310の下側に印字された枝番311との組み合せにより、帳票300aが改訂後のものであることを示している。枝番311は、“01”などの数値により表されている。
FIG. 12 is a diagram illustrating an example of a form ID according to the second embodiment. The printing method of the form ID 310a is not limited to the above method. For example, you may print as follows.
In FIG. 12A, a form ID 310b is shown. The form ID 310b indicates that the form 300a has been revised by a combination of the form ID 310 and the branch number 311 printed below the form ID 310. The branch number 311 is represented by a numerical value such as “01”.

図12(B)では、帳票ID310cが示されている。帳票ID310cは、帳票ID310と、帳票ID310の位置から紙面に向かって右下側に印字された枝番311aとの組み合わせにより、帳票300aが改訂後のものであることを示している。枝番311aは、“01”などの数値により表されている。   In FIG. 12B, a form ID 310c is shown. The form ID 310c indicates that the form 300a has been revised by a combination of the form ID 310 and the branch number 311a printed on the lower right side from the position of the form ID 310 toward the paper surface. The branch number 311a is represented by a numerical value such as “01”.

図12(A)(B)では、該帳票が改訂されていない場合には、枝番311,311aを“00”とするか、あるいは枝番311,311aを印字しないようにすることが考えられる。   In FIGS. 12A and 12B, when the form is not revised, it is conceivable that the branch numbers 311 and 311a are set to “00” or the branch numbers 311 and 311a are not printed. .

図12(C)では、帳票ID310dが示されている。帳票ID310dは、帳票ID310と、帳票ID310の位置から紙面に向かって右側に印字された枝番311bとの組み合わせにより、帳票300aが改訂後のものであることを示している。枝番311bは、“R”などの文字(または文字列)により表されている。   In FIG. 12C, a form ID 310d is shown. The form ID 310d indicates that the form 300a has been revised by a combination of the form ID 310 and the branch number 311b printed on the right side from the position of the form ID 310 toward the paper surface. The branch number 311b is represented by a character (or character string) such as “R”.

図12(C)では、該帳票が改訂されていない場合には、枝番311bを他の文字(または文字列)とするか、あるいは枝番311bを印字しないようにすることが考えられる。   In FIG. 12C, when the form is not revised, it is conceivable that the branch number 311b is set to another character (or character string) or the branch number 311b is not printed.

このように、帳票IDの表記方法には種々の方法を採れる。上記の例は、その一例であり、上記以外の位置、数値、記号および文字(または文字列)などで帳票IDを表記してもよい。何れの位置または数値などにより、帳票IDが表記されているかは、上述したように帳票ID読取部120に予め設定される。   As described above, various methods can be used for the form ID. The above example is one example, and the form ID may be expressed by a position, numerical value, symbol, character (or character string), etc. other than the above. Which position or numerical value indicates the form ID is preset in the form ID reading unit 120 as described above.

以上で説明したように、第2の実施の形態の帳票読取装置100によれば、文字認識処理を効率的に行える。具体的には、改訂後の帳票300aにつき、キーワード認識処理を行う領域を領域識別情報340に基づいて特定する。帳票読取装置100は、該領域に対してキーワード認識処理を行い、それ以外の領域に対してはキーワード認識処理を行わない。すなわち、余計な領域に対してキーワード認識処理が行われるのを抑止でき、余分な処理時間がかからずに済む。   As described above, according to the form reading apparatus 100 of the second embodiment, character recognition processing can be performed efficiently. Specifically, the area for performing the keyword recognition process is specified based on the area identification information 340 for the revised form 300a. The form reading apparatus 100 performs keyword recognition processing on the area and does not perform keyword recognition processing on the other areas. That is, it is possible to prevent the keyword recognition process from being performed on an extra area, and an extra processing time is not required.

また、キーワード認識処理を行わない領域に対しては、既存のレイアウト定義テーブル111に基づくレイアウト認識処理により、文字認識できる。よって、レイアウト認識と併用する場合に特に有効である。具体的には、レイアウト認識処理は、既定位置の情報を読み取るため、キーワード認識処理に比べて、処理時間は一般的に短い。したがって、帳票読取装置100のように、キーワード認識処理の対象領域を絞り込むことで、レイアウト認識による処理効率の良さを享受しながら、帳票のレイアウトを柔軟に変更可能となる。   In addition, a region that is not subjected to keyword recognition processing can be recognized by layout recognition processing based on the existing layout definition table 111. Therefore, it is particularly effective when used in combination with layout recognition. Specifically, since the layout recognition process reads information at a predetermined position, the processing time is generally shorter than the keyword recognition process. Therefore, by narrowing down the target area for keyword recognition processing as in the form reading device 100, the layout of the form can be flexibly changed while enjoying the good processing efficiency by layout recognition.

ここで、金融機関では、キャンペーン時などの短期間の間だけ一時的に、所定の帳票の一部箇所のレイアウトの変更を行いたい場合がある。具体的には、キャンペーンのお知らせ欄を広く確保して既存レイアウトの配置に影響を与える場合や、キャンペーン時のみ顧客へ記入を要求する記入欄を設ける場合などが考えられる。その場合、恒久的なレイアウト変更を行うケースに比べて、システム変更の作業負担や文字認識の処理効率に与える影響などをできるだけ抑えて、レイアウト変更に容易に対応できることが特に望まれる。帳票読取装置100によれば、上述のように改訂の対象となった一部箇所に絞ってキーワード認識処理が行われる。これにより、レイアウト定義の変更作業や文字認識の処理効率に与える影響を抑えた文字認識処理を実現できる。   Here, there is a case where a financial institution wants to change the layout of a part of a predetermined form temporarily only for a short period such as a campaign. Specifically, there may be a case where a wide campaign notification column is secured to affect the layout of an existing layout, or a case where a column for requesting a customer to fill in is provided only during the campaign. In that case, it is particularly desirable that the layout change can be easily handled by suppressing the influence of the system change on the work load and the processing efficiency of character recognition as much as possible as compared to the case of performing a permanent layout change. According to the form reading apparatus 100, the keyword recognition process is performed only on a part of the revision target as described above. As a result, it is possible to realize a character recognition process that suppresses the influence on the layout definition changing work and the character recognition processing efficiency.

[第3の実施の形態]
以下、第3の実施の形態を説明する。前述の第2の実施の形態との相違点を主に説明し、同様の事項の説明を省略する。
[Third Embodiment]
Hereinafter, a third embodiment will be described. Differences from the second embodiment will be mainly described, and description of similar matters will be omitted.

第2の実施の形態では、領域識別情報が帳票上に複数存在してもよいことを説明した。この場合、複数の領域識別情報で示される複数の処理対象領域内に、同一のデータ項目名(キーワード)が含まれることがある。このとき、同一のデータ項目名であっても、同一の用途であるとは限らない。例えば、1つの帳票で複数の取引に対応した帳票が利用されることがある。例えば、ある口座からの現金の出金と該口座から他口座への振替との2つの取引に対応可能な帳票が考えられる。より具体的には、(1)第1の口座番号で示される第1の口座からの現金の出金、および(2)該第1の口座から第2の口座番号で示される第2の口座への振替である。   In the second embodiment, it has been described that a plurality of area identification information may exist on a form. In this case, the same data item name (keyword) may be included in a plurality of processing target areas indicated by a plurality of area identification information. At this time, even the same data item name does not necessarily have the same use. For example, a form corresponding to a plurality of transactions may be used in one form. For example, a form that can handle two transactions, that is, cash withdrawal from an account and transfer from the account to another account, can be considered. More specifically, (1) withdrawing cash from a first account indicated by a first account number, and (2) a second account indicated by a second account number from the first account. It is a transfer to.

その場合、第1の口座番号と第2の口座番号が該帳票に記入され得るが、これらをキーワード認識で文字認識すると、何れの口座番号が出金元口座番号で、何れの口座番号が振替先口座番号であるか区別するのが困難な場合がある。具体的には、帳票上に印字されているキーワードが何れも“口座番号”である場合である。この場合、キーワードとレイアウト定義情報内のデータ項目名とを単に照合したとしても、各“口座番号”の用途を区別するのが困難となる。   In that case, the first account number and the second account number can be entered in the form, but when these characters are recognized by keyword recognition, which account number is the withdrawal source account number and which account number is transferred It may be difficult to distinguish whether it is a previous account number. Specifically, this is a case where all the keywords printed on the form are “account numbers”. In this case, even if the keyword is simply compared with the data item name in the layout definition information, it is difficult to distinguish the usage of each “account number”.

そこで、第3の実施の形態では、複数の処理対象領域内に同一のデータ項目名が含まれていたとしても、各データの用途を区別して文字列データを取得する機能を提供する。
ここで、第3の実施の形態の情報処理システムの構成は、図2で説明した第2の実施の形態の情報処理システムの構成と同様である。また、第3の実施の形態の帳票読取装置のハードウェアおよび機能構成は、図3,6で説明した第2の実施の形態の帳票読取装置100のハードウェアおよび機能構成と同様である。以下、第3の実施の形態の帳票読取装置も帳票読取装置100と同一の符号・名称を用いて各構成を指し示すものとする。
Therefore, in the third embodiment, even if the same data item name is included in a plurality of processing target areas, a function of acquiring character string data by distinguishing the use of each data is provided.
Here, the configuration of the information processing system of the third embodiment is the same as the configuration of the information processing system of the second embodiment described in FIG. Further, the hardware and functional configuration of the form reading apparatus according to the third embodiment is the same as the hardware and functional configuration of the form reading apparatus 100 according to the second embodiment described with reference to FIGS. Hereinafter, the form reading apparatus according to the third embodiment also indicates each component using the same reference numeral and name as the form reading apparatus 100.

図13は、第3の実施の形態の改訂後の帳票の例を示す図である。帳票400は、領域識別情報で示されるキーワード認識処理の対象領域が複数存在する場合を例示している。帳票400には、帳票ID410、記入欄群420、記入欄群430、領域識別情報441,442,443,444,460および記入欄群450が印字されている。   FIG. 13 is a diagram illustrating an example of a revised form according to the third embodiment. The form 400 exemplifies a case where there are a plurality of target areas for keyword recognition processing indicated by the area identification information. On the form 400, a form ID 410, an entry column group 420, an entry column group 430, area identification information 441, 442, 443, 444, 460 and an entry column group 450 are printed.

帳票ID410は、帳票の種別を識別するための識別情報である。帳票ID410として、“300101”が印字されている。帳票ID410の上4ケタの数値“3001”は、帳票400が現金の出金および口座間の振替の取引を行うための帳票であることを示す。帳票ID410の下2桁の数値“01”は、帳票400が改訂後の版数“01”の帳票であることを示す。   The form ID 410 is identification information for identifying the type of form. “300101” is printed as the form ID 410. A numerical value “3001” in the first four digits of the form ID 410 indicates that the form 400 is a form for performing cash withdrawal and transfer transactions between accounts. The last two digits “01” of the form ID 410 indicate that the form 400 is a revised version “01”.

記入欄群420,430,450は、顧客に入力させる複数の記入欄を印字した領域である。
記入欄群420は、記入欄421,422,423を含む。記入欄421は、申込日を記入させるための欄である。記入欄422は、口座名義人の氏名を記入させるための欄である。記入欄423は、届け印を押印させるための欄である。
The entry column groups 420, 430, and 450 are areas in which a plurality of entry columns to be input by the customer are printed.
The entry column group 420 includes entry columns 421, 422, and 423. The entry column 421 is a column for entering the application date. The entry column 422 is a column for entering the name of the account holder. The entry column 423 is a column for imprinting a delivery seal.

記入欄群430には、出金元口座の情報を記入するための記入欄が設けられている。記入欄群430は、記入欄431,432,433,434を含む。記入欄431は、店番を記入させるための欄である。記入欄432は、出金元口座の口座番号を記入させるための欄である。記入欄433は、出金元口座の預金科目を選択させるための欄である。記入欄434は、出金する金額を記入させるための欄である。   The entry column group 430 is provided with an entry column for entering information of the withdrawal source account. The entry field group 430 includes entry fields 431, 432, 433, and 434. The entry column 431 is a column for entering a store number. The entry column 432 is a column for entering the account number of the withdrawal source account. The entry column 433 is a column for selecting a deposit item of the withdrawal source account. The entry column 434 is a column for entering the amount to be withdrawn.

領域識別情報441,442,443,444は、記入欄群430を囲うカギ型の領域識別情報である。4つの領域識別情報441,442,443,444が1セットでキーワード認識のための1つの処理対象領域を示している。具体的には、領域識別情報441,442,443,444を頂点とした四角形で囲われる領域内が、該処理対象領域である。   The area identification information 441, 442, 443, 444 is key-type area identification information surrounding the entry field group 430. Four region identification information 441, 442, 443, and 444 indicate one processing target region for keyword recognition in one set. Specifically, an area surrounded by a rectangle having the area identification information 441, 442, 443, 444 as a vertex is the processing target area.

記入欄群450には、振替先口座の情報を記入するための記入欄が設けられている。記入欄群450は、記入欄451,452,453,454を含む。記入欄451は、振替先口座の預金科目を選択させるための欄である。記入欄452は、店番を記入させるための欄である。記入欄453は、振替先口座の口座番号を記入させるための欄である。記入欄454は、振替先口座の口座名義人を記入させるための欄である。   The entry field group 450 is provided with an entry field for entering information of the transfer destination account. The entry column group 450 includes entry columns 451, 452, 453, and 454. The entry column 451 is a column for selecting a deposit item of the transfer destination account. The entry column 452 is a column for entering a store number. The entry column 453 is a column for entering the account number of the transfer destination account. The entry column 454 is a column for entering the account holder of the transfer destination account.

領域識別情報460は、記入欄群450を囲う線であり、四角形の各辺を形成している。
記入欄群420,430,450の各欄の枠線および帳票400上の一部箇所には、ドロップアウト色が付される。領域識別情報441,442,443,444,460には、ドロップアウト色以外の色が付される。
The area identification information 460 is a line surrounding the entry column group 450 and forms each side of a rectangle.
Dropout colors are assigned to the frame lines of the fields of the entry field groups 420, 430, and 450 and a part of the form 400. The region identification information 441, 442, 443, 444, 460 is assigned a color other than the dropout color.

帳票400によれば、記入欄群420,430のみに記入することで、記入欄群430で指定した口座から現金を出金できる。更に、記入欄群450に振替先の口座を指定することで、記入欄群430で指定した口座から、記入欄群450で指定した口座への預金の振替を行える。   According to the form 400, cash can be withdrawn from the account designated in the entry field group 430 by filling in only the entry field groups 420 and 430. Furthermore, by designating the transfer destination account in the entry column group 450, the deposit can be transferred from the account designated in the entry column group 430 to the account designated in the entry column group 450.

このように、帳票400には、出金元口座用の記入欄群430に対しては、カギ型の領域識別情報441,442,443,444が予め印字される。また、帳票400には、振替先口座用の記入欄群450には、(カギ型とは異なる形状の)四角形の各辺を形成する線である領域識別情報460が予め印字される。   In this way, key-type area identification information 441, 442, 443, and 444 is preprinted on the form 400 for the entry column group 430 for the withdrawal source account. Further, in the form 400, the area identification information 460, which is a line forming each side of a quadrilateral (having a shape different from the key shape), is preprinted in the entry field group 450 for the transfer destination account.

次に、以上の構成の帳票読取装置100の処理手順を説明する。なお、第3の実施の形態の帳票読取処理の手順は、図8で説明した第2の実施の形態の帳票読取処理の手順と同様である。続いて、該帳票読取処理のステップS15で説明したキーワード認識処理の手順を説明する。以下、RAM103上には次の情報が取得されているものとする。   Next, a processing procedure of the form reading apparatus 100 having the above configuration will be described. Note that the procedure of the form reading process of the third embodiment is the same as the procedure of the form reading process of the second embodiment described with reference to FIG. Next, the procedure of the keyword recognition process described in step S15 of the form reading process will be described. Hereinafter, it is assumed that the following information is acquired on the RAM 103.

(1)「帳票400の帳票画像」
(2)「帳票400の帳票画像」にドロップアウト処理を実行して得られた「ドロップアウト処理後の帳票画像」
何れの帳票画像においても、領域識別情報441,442,443,444,460を同一の符号で指し示すものとする。
(1) “Form image of form 400”
(2) “Form image after dropout processing” obtained by executing dropout processing on “form image of form 400”
In any form image, the region identification information 441, 442, 443, 444, 460 is indicated by the same reference numeral.

図14は、第3の実施の形態のキーワード認識処理を示すフローチャートである。以下、図14に示す処理をステップ番号に沿って説明する。
(ステップS41)キーワード認識処理部132は、レイアウト認識処理部131によるレイアウト認識処理の結果をRAM103またはHDD104上の所定領域に退避させる。
FIG. 14 is a flowchart illustrating keyword recognition processing according to the third embodiment. In the following, the process illustrated in FIG. 14 will be described in order of step number.
(Step S41) The keyword recognition processing unit 132 saves the result of the layout recognition processing by the layout recognition processing unit 131 in a predetermined area on the RAM 103 or the HDD 104.

(ステップS42)キーワード認識処理部132は、キーワード認識処理の対象領域の特定を領域特定部140に依頼する。領域特定部140は、ドロップアウト処理後の帳票画像から領域識別情報441,442,443,444,460を検出する。例えば、領域特定部140には、領域識別情報441,442,443,444,460に関する情報(形状の種類、線の太さ、実線・破線といった線の種別など)が予め設定される。領域特定部140は、該情報に基づき、ドロップアウト処理後の帳票画像から領域識別情報441,442,443,444,460を検出できる。領域特定部140は、特定した処理対象領域を示す領域情報をキーワード認識処理部132に出力する。領域情報は、例えば、処理対象領域の各頂点の座標値である。また、領域特定部140は、領域情報と共に、検出した領域識別情報の種類(矩形かカギ型かなど)をキーワード認識処理部132に出力する。   (Step S42) The keyword recognition processing unit 132 requests the region specifying unit 140 to specify the target region for the keyword recognition processing. The area specifying unit 140 detects area identification information 441, 442, 443, 444, and 460 from the form image after the dropout process. For example, information related to the region identification information 441, 442, 443, 444, 460 (type of shape, line thickness, line type such as solid line / broken line, etc.) is preset in the region specifying unit 140. Based on this information, the area specifying unit 140 can detect the area identification information 441, 442, 443, 444, and 460 from the form image after the dropout process. The area specifying unit 140 outputs area information indicating the specified processing target area to the keyword recognition processing unit 132. The area information is, for example, the coordinate value of each vertex of the processing target area. In addition, the area specifying unit 140 outputs the type of detected area identification information (whether it is rectangular or keyed) together with the area information to the keyword recognition processing unit 132.

(ステップS43)キーワード認識処理部132は、領域特定部140から取得した領域情報に基づき、そのうちの1つの未処理領域のカラーイメージを帳票400の帳票画像から抽出する。例えば、キーワード認識処理部132は、領域識別情報441,442,443,444で囲われる領域内のカラーイメージを抽出する。   (Step S <b> 43) The keyword recognition processing unit 132 extracts a color image of one unprocessed area from the form image of the form 400 based on the area information acquired from the area specifying unit 140. For example, the keyword recognition processing unit 132 extracts a color image in an area surrounded by the area identification information 441, 442, 443, 444.

(ステップS44)キーワード認識処理部132は、ステップS43でカラーイメージを取得した処理対象領域からキーワードを1つ抽出する。例えば、キーワード認識処理部132は、処理対象領域に含まれる枠線を検出して、該枠線で囲われる枠ごとにキーワードの抽出を試みる。例えば、キーワード認識処理部132は、記入欄432に対して、キーワード“口座番号”を抽出する。   (Step S44) The keyword recognition processing unit 132 extracts one keyword from the processing target area from which the color image has been acquired in Step S43. For example, the keyword recognition processing unit 132 detects a frame line included in the processing target region, and tries to extract a keyword for each frame surrounded by the frame line. For example, the keyword recognition processing unit 132 extracts the keyword “account number” from the entry field 432.

(ステップS45)キーワード認識処理部132は、帳票400の帳票IDおよび記憶部110に記憶されたレイアウト定義テーブル111を参照して、該キーワードが帳票400に含まれ得るデータ項目名に一致するか否か判定する。一致する場合、処理をステップS46に進める。一致しない場合、該キーワードを破棄して、処理をステップS52に進める。例えば、キーワード“口座番号”は、帳票400に含まれ得るデータ項目名に一致するものとする。   (Step S 45) The keyword recognition processing unit 132 refers to the form ID of the form 400 and the layout definition table 111 stored in the storage unit 110, and determines whether or not the keyword matches a data item name that can be included in the form 400. To determine. If they match, the process proceeds to step S46. If they do not match, the keyword is discarded and the process proceeds to step S52. For example, it is assumed that the keyword “account number” matches a data item name that can be included in the form 400.

(ステップS46)キーワード認識処理部132は、該データ項目に対する記入欄の位置(データ部)を特定する。例えば、データ部の位置は、「キーワードが存在するセルの右側に隣接するセル」のようにキーワード認識処理部132に予め設定される。あるいは、キーワードや、帳票400上の表構造に基づき、該キーワードに対応するデータ部を特定してもよい。   (Step S46) The keyword recognition processing unit 132 specifies the position (data portion) of the entry field for the data item. For example, the position of the data part is set in advance in the keyword recognition processing unit 132 as “a cell adjacent to the right side of the cell in which the keyword exists”. Alternatively, based on the keyword and the table structure on the form 400, the data portion corresponding to the keyword may be specified.

(ステップS47)キーワード認識処理部132は、データ部の特徴を解析し、データ部のイメージに対して枠線やノイズなどを除去し、文字認識に適したイメージに加工する。   (Step S <b> 47) The keyword recognition processing unit 132 analyzes the characteristics of the data portion, removes frame lines and noise from the image of the data portion, and processes the image into an image suitable for character recognition.

(ステップS48)キーワード認識処理部132は、データ部に記入された文字画像を取得する。キーワード認識処理部132は、該文字画像と予め記憶部110に格納された文字パターンとの照合を行い、該データ部に記入された文字列データを取得する。例えば、キーワード認識処理部132は、キーワード“口座番号”に対して、文字列データ“9999999”を取得する。   (Step S48) The keyword recognition processing unit 132 acquires a character image written in the data portion. The keyword recognition processing unit 132 collates the character image with a character pattern stored in the storage unit 110 in advance, and acquires character string data entered in the data unit. For example, the keyword recognition processing unit 132 acquires character string data “9999999” for the keyword “account number”.

(ステップS49)キーワード認識処理部132は、現在の処理対象領域に対応する領域識別情報の種類を判定する。該領域識別情報の形状の種類が、カギ型の場合、処理をステップS50に進める。該領域識別情報の形状の種類が矩形の場合、処理をステップS51に進める。例えば、領域識別情報441,442,443,444で囲われた領域であれば、領域識別情報の種類は、「カギ型」となる。   (Step S49) The keyword recognition processing unit 132 determines the type of region identification information corresponding to the current processing target region. If the shape type of the area identification information is a key type, the process proceeds to step S50. If the shape type of the area identification information is rectangular, the process proceeds to step S51. For example, if the region is surrounded by the region identification information 441, 442, 443, 444, the type of the region identification information is “key type”.

(ステップS50)キーワード認識処理部132は、ステップS48で取得した文字列データを出金元のデータとして取得する。これにより、例えば、領域識別情報441,442,443,444で囲われた処理対象領域から取得した、“口座番号”“9999999”を出金元口座の口座番号として扱える。そして、処理をステップS52に進める。   (Step S50) The keyword recognition processing unit 132 acquires the character string data acquired in step S48 as the data of the withdrawal source. Thereby, for example, “account number” “9999999” acquired from the processing target area surrounded by the area identification information 441, 442, 443, 444 can be handled as the account number of the withdrawal source account. Then, the process proceeds to step S52.

(ステップS51)キーワード認識処理部132は、ステップS48で取得した文字列データを振替先のデータとして取得する。これにより、例えば、領域識別情報460で囲われた処理対象領域から取得した“口座番号”“8888888”を振替先口座の口座番号として扱える。そして、処理をステップS52に進める。   (Step S51) The keyword recognition processing unit 132 acquires the character string data acquired in step S48 as transfer destination data. Thereby, for example, “account number” “88888888” acquired from the processing target area surrounded by the area identification information 460 can be handled as the account number of the transfer destination account. Then, the process proceeds to step S52.

(ステップS52)キーワード認識処理部132は、現在の処理対象領域内でキーワードを未抽出の箇所が存在するか否かを判定する。キーワード未抽出の箇所が存在する場合、処理をステップS44に進める。キーワード未抽出の箇所が存在しない場合、処理をステップS53に進める。   (Step S <b> 52) The keyword recognition processing unit 132 determines whether or not there is a portion where no keyword has been extracted in the current processing target area. If there is a keyword-unextracted portion, the process proceeds to step S44. If there is no keyword-unextracted portion, the process proceeds to step S53.

(ステップS53)キーワード認識処理部132は、現在の処理対象領域以外にも、未処理の処理対象領域が存在するか否かを判定する。未処理の処理対象領域が存在する場合、処理をステップS43に進める。全ての処理対象領域につき処理済の場合、処理をステップS54に進める。   (Step S53) The keyword recognition processing unit 132 determines whether there is an unprocessed processing target area other than the current processing target area. If there is an unprocessed processing target area, the process proceeds to step S43. If all the process target areas have been processed, the process proceeds to step S54.

(ステップS54)キーワード認識処理部132は、一時退避させたレイアウト認識処理の結果とキーワード認識処理の結果とをマージする。具体的には、レイアウト定義テーブル111に定義された帳票400のデータ項目のうち、レイアウト認識処理では取得できなかったものを、キーワード認識処理で取得した内容で補完する。   (Step S54) The keyword recognition processing unit 132 merges the temporarily recognized layout recognition result and the keyword recognition processing result. Specifically, among the data items of the form 400 defined in the layout definition table 111, those that could not be acquired by the layout recognition process are complemented with the contents acquired by the keyword recognition process.

このように、キーワード認識処理部132は、領域識別情報の種類に応じて、認識した文字列データを区別する。何れの領域識別情報が、何れの取引に対応するかは、キーワード認識処理部132に予め設定される。ステップS49〜S51で例示した領域識別情報の種類と取引(データの用途)との対応付けは、一例であり、他にも種々の対応付けが考えられる。例えば、領域識別情報を区別する方法としては、次の内容が考えられる。   In this manner, the keyword recognition processing unit 132 distinguishes recognized character string data according to the type of region identification information. Which area identification information corresponds to which transaction is set in the keyword recognition processing unit 132 in advance. The association between the type of region identification information exemplified in steps S49 to S51 and the transaction (use of data) is an example, and various other associations are conceivable. For example, the following contents can be considered as a method for distinguishing the region identification information.

(A1)領域識別情報の線の種別(点線・破線・一点鎖線など)。
(A2)領域識別情報の形状(矩形・楕円形など)。
(A3)領域識別情報の線の太さ(太い・細いなど)。
(A1) Line type of area identification information (dotted line, broken line, one-dot chain line, etc.).
(A2) The shape of the area identification information (rectangle, ellipse, etc.).
(A3) Line thickness of area identification information (thick, thin, etc.).

(A4)領域識別情報の色(濃い・薄いなど)。
(A5)処理対象領域の頂点に配置させる領域識別情報の形状(カギ型など)。
上記(A1)〜(A5)の何れか1つに基づいて領域識別情報を区別してもよいし、(A1)〜(A5)を組み合わせて区別してもよい。更に、区別した各領域識別情報を以下に示す何れかの用途に対応付けることが考えられる。
(A4) Color of area identification information (dark, light, etc.).
(A5) The shape of the region identification information to be placed at the vertex of the processing target region (such as a key shape).
The area identification information may be distinguished based on any one of the above (A1) to (A5), or may be distinguished by combining (A1) to (A5). Further, it is conceivable that each identified area identification information is associated with one of the following uses.

(B1)現金や振替による入金をする場合の入金先口座に関する情報。
(B2)現金や振替による出金をする場合の出金元口座に関する情報。
キーワード認識処理部132は、領域識別情報を区別することで、文字列データが何れの取引に用いられるものであるか(すなわち、文字列データの用途)を区別できる。上記用途以外の用途に対応付けてもよい。
(B1) Information related to the deposit account when depositing by cash or transfer.
(B2) Information on the withdrawal source account when withdrawing money or transferring money.
The keyword recognition processing unit 132 can distinguish which transaction the character string data is used for (ie, use of the character string data) by distinguishing the region identification information. You may match with uses other than the said use.

このようにして、第3の実施の形態の帳票読取装置100は、複数の取引に対応可能な帳票において、複数の処理対象領域内に同一のデータ項目名が含まれても、各データ項目の用途を区別して文字列データを取得できる。   In this way, the form reading apparatus 100 according to the third embodiment is capable of handling each data item even if the same data item name is included in a plurality of processing target areas in a form that can handle a plurality of transactions. Character string data can be acquired by distinguishing usage.

これにより、レイアウト変更のあった帳票に対する文字認識処理を一層効率的に行うことが可能となる。
[第4の実施の形態]
以下、第4の実施の形態を説明する。前述の第2,第3の実施の形態との相違点を主に説明し、同様の事項の説明を省略する。
This makes it possible to more efficiently perform character recognition processing for a form whose layout has been changed.
[Fourth Embodiment]
Hereinafter, a fourth embodiment will be described. Differences from the second and third embodiments will be mainly described, and description of similar matters will be omitted.

第2,第3の実施の形態では、レイアウト認識処理を行った後に、キーワード認識処理の要否を判定するものとした。一方、キーワード認識処理の対象となる領域に対しては、レイアウト認識処理を行わなくてもよい。このようにすれば、処理効率の一層の効率化を図れる。そこで、第4の実施の形態では、キーワード認識処理の対象となる領域に対して、レイアウト認識処理を抑止する機能を提供する。   In the second and third embodiments, the necessity of the keyword recognition process is determined after the layout recognition process. On the other hand, the layout recognition process does not have to be performed on the area that is the target of the keyword recognition process. In this way, the processing efficiency can be further improved. Therefore, in the fourth embodiment, a function of suppressing the layout recognition process is provided for the area that is the target of the keyword recognition process.

ここで、第4の実施の形態の情報処理システムの構成は、図2で説明した第2の実施の形態の情報処理システムの構成と同様である。また、第4の実施の形態の帳票読取装置のハードウェアおよび機能構成は、図3,6で説明した第2の実施の形態の帳票読取装置100のハードウェアおよび機能構成と同様である。以下、第4の実施の形態の帳票読取装置も帳票読取装置100と同一の符号・名称を用いて各構成を指し示すものとする。   Here, the configuration of the information processing system of the fourth embodiment is the same as the configuration of the information processing system of the second embodiment described in FIG. The hardware and functional configuration of the form reading apparatus according to the fourth embodiment is the same as the hardware and functional configuration of the form reading apparatus 100 according to the second embodiment described with reference to FIGS. Hereinafter, the form reading apparatus according to the fourth embodiment also indicates each component using the same reference numerals and names as the form reading apparatus 100.

図15は、第4の実施の形態の改訂前の帳票の例を示す図である。帳票500は、改訂前の(既存の)帳票を例示している。帳票500には、帳票ID510および記入欄群520,530が印字されている。   FIG. 15 is a diagram illustrating an example of a form before revision according to the fourth embodiment. A form 500 illustrates an (existing) form before revision. A form ID 510 and entry column groups 520 and 530 are printed on the form 500.

帳票ID510は、帳票の種別を識別するための識別情報である。帳票ID510として、“100100”が印字されている。帳票ID510の上4桁の数値“1001”は、帳票500が口座に対して現金を入金する取引を行うための帳票であることを示す。帳票ID510の下2桁の数値“00”は、帳票500が改訂されたものではないことを示す。   The form ID 510 is identification information for identifying the type of form. “100100” is printed as the form ID 510. The first four-digit numerical value “1001” of the form ID 510 indicates that the form 500 is a form for performing a transaction for depositing cash into the account. The last two digits “00” of the form ID 510 indicate that the form 500 has not been revised.

記入欄群520は、顧客に記入させる複数の記入欄を印字した領域である。記入欄群520は、記入欄521,522,523,524,525,526を含む。記入欄521は、申込日を記入させるための欄である。記入欄522は、口座名義人の氏名を記入させるための欄である。記入欄523は、店番を記入させるための欄である。記入欄524は、口座番号を記入させるための欄である。記入欄525は、入金先口座の預金科目を選択させるための欄である。記入欄526は、入金する金額を記入させるための欄である。   The entry column group 520 is an area in which a plurality of entry columns to be entered by the customer are printed. The entry column group 520 includes entry columns 521, 522, 523, 524, 525, 526. The entry column 521 is a column for entering the application date. The entry column 522 is a column for entering the name of the account holder. The entry column 523 is a column for entering a store number. The entry column 524 is a column for entering an account number. The entry column 525 is a column for selecting a deposit item of the deposit destination account. The entry column 526 is a column for entering the amount to be deposited.

記入欄群530は、金融機関の職員が業務に用いる情報を記入する欄である。記入欄群530は、レイアウト認識処理の非対象領域である。
記入欄群520,530の各欄の枠線および帳票500上の一部箇所にはドロップアウト色が付される。
The entry column group 530 is a column for entering information used by the financial institution staff for business. The entry column group 530 is a non-target area for layout recognition processing.
Drop-out colors are assigned to the frame lines of each column of the entry column groups 520 and 530 and a part of the form 500.

図16は、第4の実施の形態の改訂後の帳票の例を示す図である。帳票500aは、帳票500に対する改訂後の帳票を例示している。帳票500aには、帳票ID510a、記入欄群520a,530a、通知欄540および領域識別情報550が印字されている。   FIG. 16 is a diagram illustrating an example of a revised form according to the fourth embodiment. The form 500a illustrates a revised form for the form 500. A form ID 510a, entry field groups 520a and 530a, a notification field 540, and area identification information 550 are printed on the form 500a.

帳票ID510aは、帳票の種別を識別するための識別情報である。帳票ID510aとして、“100101”が印字されている。帳票ID510aの上4桁の数値“1001”は、帳票500aが口座に対して現金を入金する取引を行うための帳票であることを示す。帳票ID510aの下2桁の数値“01”は、帳票500aが改訂後の版数“01”であることを示す。   The form ID 510a is identification information for identifying the type of form. “100101” is printed as the form ID 510a. The first four-digit numerical value “1001” of the form ID 510a indicates that the form 500a is a form for performing a transaction for depositing cash into the account. The last two digits “01” of the form ID 510a indicate that the form 500a is the revised version number “01”.

記入欄群520aは、顧客に入力させる複数の記入欄を印字した領域である。記入欄群520aは、記入欄521a,522a,523a,524a,525a,526aを含む。記入欄521aは、申込日を記入させるための欄である。記入欄522aは、口座名義人の氏名を記入させるための欄である。記入欄523aは、店番を記入させるための欄である。記入欄524aは、入金先口座の口座番号を記入させるための欄である。記入欄525aは、入金先口座の預金科目を選択させるための欄である。記入欄526aは、入金する金額を記入させるための欄である。   The entry column group 520a is an area in which a plurality of entry columns to be input by the customer are printed. The entry column group 520a includes entry columns 521a, 522a, 523a, 524a, 525a, and 526a. The entry column 521a is a column for entering the application date. The entry column 522a is a column for entering the name of the account holder. The entry column 523a is a column for entering a store number. The entry column 524a is a column for entering the account number of the deposit destination account. The entry column 525a is a column for selecting a deposit item of the deposit destination account. The entry column 526a is a column for entering the amount to be deposited.

記入欄群530aは、金融機関の職員が業務に用いる情報を記入する欄である。
通知欄540は、顧客に通知したいメッセージが印字される領域である。
記入欄群530aおよび通知欄540は、レイアウト認識処理の非対象領域である。
The entry column group 530a is a column for entering information used by the financial institution staff for business.
The notification column 540 is an area where a message to be notified to the customer is printed.
The entry column group 530a and the notification column 540 are non-target areas for layout recognition processing.

記入欄群520a,530a,通知欄540の各欄の枠線および帳票500a上の一部箇所には、ドロップアウト色が付される。領域識別情報550には、ドロップアウト色以外の色が付される。   Dropout colors are given to the frame lines of the fields of the entry field groups 520a and 530a and the notification field 540 and to some portions on the form 500a. The region identification information 550 is assigned a color other than the dropout color.

次に、以上の構成の帳票読取装置100の処理手順を説明する。
図17は、第4の実施の形態の帳票読取処理を示すフローチャートである。以下、図17に示す処理をステップ番号に沿って説明する。
Next, a processing procedure of the form reading apparatus 100 having the above configuration will be described.
FIG. 17 is a flowchart illustrating a form reading process according to the fourth embodiment. In the following, the process illustrated in FIG. 17 will be described in order of step number.

(ステップS61)帳票ID読取部120は、イメージスキャナ14から受信した帳票画像をRAM103上の所定領域に格納する。帳票ID読取部120は、該帳票画像に対してドロップアウト処理を行い、ドロップアウト処理後の帳票画像をRAM103上の他の所定領域に格納する。   (Step S 61) The form ID reading unit 120 stores the form image received from the image scanner 14 in a predetermined area on the RAM 103. The form ID reading unit 120 performs a dropout process on the form image, and stores the form image after the dropout process in another predetermined area on the RAM 103.

(ステップS62)帳票ID読取部120は、ドロップアウト処理後の帳票画像から帳票IDを認識する。帳票ID読取部120は、読み取った帳票IDを文字認識処理部130に出力する。   (Step S62) The form ID reading unit 120 recognizes the form ID from the form image after the dropout process. The form ID reading unit 120 outputs the read form ID to the character recognition processing unit 130.

(ステップS63)文字認識処理部130は、帳票ID読取部120から取得した帳票IDの下2桁が“01”以上であるか否かを判定する。“01”以上である場合(すなわち、改訂された帳票である場合)、処理をステップS65に進める。“01”以上でない場合(すなわち、改訂された帳票でない場合)、処理をステップS64に進める。   (Step S63) The character recognition processing unit 130 determines whether or not the last two digits of the form ID acquired from the form ID reading unit 120 is “01” or more. If it is “01” or more (that is, a revised form), the process proceeds to step S65. If it is not “01” or more (that is, not a revised form), the process proceeds to step S64.

(ステップS64)文字認識処理部130は、レイアウト認識処理部131に処理を委譲し、レイアウト認識処理を実行させる。レイアウト認識処理部131は、帳票ID読取部120から取得した帳票IDに基づいて、記憶部110に記憶されたレイアウト定義テーブル111を参照し、ドロップアウト処理後の帳票画像に対してレイアウト認識による文字認識処理を行う。   (Step S <b> 64) The character recognition processing unit 130 delegates the processing to the layout recognition processing unit 131 and causes the layout recognition processing to be executed. The layout recognition processing unit 131 refers to the layout definition table 111 stored in the storage unit 110 on the basis of the form ID acquired from the form ID reading unit 120, and performs character recognition by layout recognition on the form image after the dropout process. Perform recognition processing.

(ステップS65)文字認識処理部130は、キーワード認識処理部132に処理を委譲し、キーワード認識処理を実行させる。該キーワード認識処理については後述する。
(ステップS66)文字認識処理部130は、帳票画像に対する文字認識結果を出力し、モニタ11に該結果を表示させる。
(Step S <b> 65) The character recognition processing unit 130 delegates the processing to the keyword recognition processing unit 132 and causes the keyword recognition processing to be executed. The keyword recognition process will be described later.
(Step S66) The character recognition processing unit 130 outputs a character recognition result for the form image and causes the monitor 11 to display the result.

このように、文字認識処理部130は、レイアウト認識を行う前に帳票の改訂の有無を判断する。そして、ステップS65におけるキーワード認識処理を次のように行う。
なお、以下、RAM103上には次の情報が取得されているものとする。
As described above, the character recognition processing unit 130 determines whether the form is revised before performing layout recognition. Then, the keyword recognition process in step S65 is performed as follows.
Hereinafter, it is assumed that the following information is acquired on the RAM 103.

(1)「帳票500aの帳票画像」
(2)「帳票500aの帳票画像」にドロップアウト処理を実行して得られた「ドロップアウト処理後の帳票画像」
何れの帳票画像においても、領域識別情報550を同一の符号で指し示すものとする。
(1) “Form image of form 500a”
(2) “Form image after dropout processing” obtained by executing dropout processing on “form image of form 500a”
In any form image, the region identification information 550 is indicated by the same symbol.

図18は、第4の実施の形態のキーワード認識処理を示すフローチャートである。以下、図18に示す処理をステップ番号に沿って説明する。
(ステップS71)キーワード認識処理部132は、キーワード認識処理の対象領域の特定を領域特定部140に依頼する。領域特定部140は、ドロップアウト処理後の帳票画像から領域識別情報550を検出する。例えば、領域特定部140には、領域識別情報550に関する情報(形状の種類、線の太さ、実線・破線といった線の種別など)が予め設定される。領域特定部140は、該情報に基づき、ドロップアウト処理後の帳票画像から領域識別情報550を検出できる。領域特定部140は、特定した処理対象領域を示す領域情報をキーワード認識処理部132に出力する。領域情報は、例えば、処理対象領域の各頂点の座標値である。
FIG. 18 is a flowchart illustrating keyword recognition processing according to the fourth embodiment. In the following, the process illustrated in FIG. 18 will be described in order of step number.
(Step S71) The keyword recognition processing unit 132 requests the region specifying unit 140 to specify the target region for the keyword recognition processing. The area specifying unit 140 detects the area identification information 550 from the form image after the dropout process. For example, information related to the region identification information 550 (shape type, line thickness, line type such as solid line / broken line, etc.) is preset in the region specifying unit 140. Based on the information, the area specifying unit 140 can detect the area identification information 550 from the form image after the dropout process. The area specifying unit 140 outputs area information indicating the specified processing target area to the keyword recognition processing unit 132. The area information is, for example, the coordinate value of each vertex of the processing target area.

(ステップS72)キーワード認識処理部132は、領域特定部140から取得した領域情報と、記憶部110に記憶されたレイアウト定義テーブル111と、を参照して、レイアウト認識の対象領域が存在するか否かを判定する。存在する場合、処理をステップS73に進める。存在しない場合、処理をステップS75に進める。ここで、レイアウト認識の対象領域が存在するか否かは、例えば次のようにして判定できる。まず、キーワード認識処理部132は、領域情報に基づいて、キーワード認識の対象となっている領域を特定する。次に、キーワード認識処理部132は、レイアウト定義テーブル111に基づいて、帳票500のレイアウト認識の対象領域を特定する。そして、キーワード認識処理部132は、キーワード認識の対象領域とレイアウト認識の対象領域とを重ね合わせて、レイアウト認識の対象領域がキーワード認識の対象領域からはみ出すか否かを判断する。はみ出せば、レイアウト認識の対象領域が存在すると判断できる。はみ出さなければ、レイアウト認識の対象領域がキーワード認識の対象領域に包含されるので、レイアウト認識の対象領域が存在しないと判断できる。   (Step S <b> 72) The keyword recognition processing unit 132 refers to the region information acquired from the region specifying unit 140 and the layout definition table 111 stored in the storage unit 110 to determine whether or not there is a layout recognition target region. Determine whether. If it exists, the process proceeds to step S73. If not, the process proceeds to step S75. Here, whether or not a layout recognition target area exists can be determined as follows, for example. First, the keyword recognition processing unit 132 identifies a region that is a keyword recognition target based on the region information. Next, the keyword recognition processing unit 132 specifies a layout recognition target area of the form 500 based on the layout definition table 111. Then, the keyword recognition processing unit 132 superimposes the keyword recognition target area and the layout recognition target area, and determines whether or not the layout recognition target area protrudes from the keyword recognition target area. If it protrudes, it can be determined that there is a target area for layout recognition. If it does not protrude, the target area for layout recognition is included in the target area for keyword recognition, so that it can be determined that there is no target area for layout recognition.

(ステップS73)キーワード認識処理部132は、はみ出した領域を示す情報(例えば、該領域の頂点の座標値)をレイアウト認識処理部131に出力し、レイアウト認識処理を実行させる。レイアウト認識処理部131は、レイアウト定義テーブル111を参照して、該領域に含まれる記入欄につきレイアウト認識処理を実行し、キーワード認識処理部132にその結果を出力する。   (Step S73) The keyword recognition processing unit 132 outputs information indicating the protruding region (for example, the coordinate value of the vertex of the region) to the layout recognition processing unit 131, and causes the layout recognition processing to be executed. The layout recognition processing unit 131 refers to the layout definition table 111, executes layout recognition processing for the entry fields included in the area, and outputs the result to the keyword recognition processing unit 132.

(ステップS74)キーワード認識処理部132は、レイアウト認識処理部131によるレイアウト認識の処理結果をRAM103またはHDD104上の所定領域に退避させる。   (Step S <b> 74) The keyword recognition processing unit 132 saves the layout recognition processing result by the layout recognition processing unit 131 in a predetermined area on the RAM 103 or the HDD 104.

(ステップS75)キーワード認識処理部132は、領域特定部140から取得した領域情報に基づき、そのうちの1つの未処理領域のカラーイメージを帳票500aの帳票画像から抽出する。   (Step S75) The keyword recognition processing unit 132 extracts a color image of one unprocessed area from the form image of the form 500a based on the area information acquired from the area specifying unit 140.

(ステップS76)キーワード認識処理部132は、ステップS75でカラーイメージを取得した処理対象領域からキーワードを1つ抽出する。例えば、キーワード認識処理部132は、処理対象領域に含まれる枠線を検出して、該枠線で囲われる枠ごとにキーワードの抽出を試みる。   (Step S76) The keyword recognition processing unit 132 extracts one keyword from the processing target area from which the color image has been acquired in Step S75. For example, the keyword recognition processing unit 132 detects a frame line included in the processing target region, and tries to extract a keyword for each frame surrounded by the frame line.

(ステップS77)キーワード認識処理部132は、帳票500aの帳票IDおよびレイアウト定義テーブル111を参照して、該キーワードが帳票500aに含まれ得るデータ項目名に一致するか否か判定する。一致する場合、処理をステップS78に進める。一致しない場合、処理をステップS81に進める。   (Step S77) The keyword recognition processing unit 132 refers to the form ID of the form 500a and the layout definition table 111, and determines whether or not the keyword matches a data item name that can be included in the form 500a. If they match, the process proceeds to step S78. If not, the process proceeds to step S81.

(ステップS78)キーワード認識処理部132は、該データ項目に対する記入欄の位置(データ部)を特定する。例えば、データ部の位置は、「キーワードが存在するセルの右側に隣接するセル」のようにキーワード認識処理部132に予め設定される。あるいは、キーワードや、帳票500a上の表構造に基づき、該キーワードに対応するデータ部を特定してもよい。   (Step S78) The keyword recognition processing unit 132 specifies the position (data portion) of the entry field for the data item. For example, the position of the data part is set in advance in the keyword recognition processing unit 132 as “a cell adjacent to the right side of the cell in which the keyword exists”. Alternatively, based on the keyword and the table structure on the form 500a, the data portion corresponding to the keyword may be specified.

(ステップS79)キーワード認識処理部132は、データ部の特徴を解析し、データ部のイメージに対して枠線やノイズなどを除去し、文字認識に適したイメージに加工する。   (Step S79) The keyword recognition processing unit 132 analyzes the characteristics of the data portion, removes frame lines and noise from the image of the data portion, and processes the image into an image suitable for character recognition.

(ステップS80)キーワード認識処理部132は、データ部に記入された文字画像を取得する。キーワード認識処理部132は、該文字画像と予め記憶部110に格納された文字パターンとの照合を行い、該データ部に記入された文字列データを取得する。   (Step S80) The keyword recognition processing unit 132 acquires a character image entered in the data portion. The keyword recognition processing unit 132 collates the character image with a character pattern stored in the storage unit 110 in advance, and acquires character string data entered in the data unit.

(ステップS81)キーワード認識処理部132は、現在の処理対象領域内でキーワードを未抽出の箇所が存在するか否かを判定する。キーワード未抽出の箇所が存在する場合、処理をステップS76に進める。キーワード未抽出の箇所が存在しない場合、処理をステップS82に進める。   (Step S <b> 81) The keyword recognition processing unit 132 determines whether or not there is a portion where no keyword has been extracted in the current processing target area. If there is a keyword-unextracted portion, the process proceeds to step S76. If there is no keyword-unextracted portion, the process proceeds to step S82.

(ステップS82)キーワード認識処理部132は、現在の処理対象領域以外にも、未処理の処理対象領域が存在するか否かを判定する。未処理の処理対象領域が存在する場合、処理をステップS75に進める。全ての処理対象領域につき処理済の場合、処理をステップS83に進める。   (Step S82) The keyword recognition processing unit 132 determines whether there is an unprocessed processing target area other than the current processing target area. If there is an unprocessed processing target area, the process proceeds to step S75. If processing has been completed for all processing target areas, the process proceeds to step S83.

(ステップS83)キーワード認識処理部132は、一時退避させたレイアウト認識処理の結果とキーワード認識処理の結果とをマージする。具体的には、レイアウト定義テーブル111に定義された帳票500aのデータ項目のうち、レイアウト認識処理では取得できなかったものを、キーワード認識処理で取得した内容で補完する。   (Step S83) The keyword recognition processing unit 132 merges the temporarily saved layout recognition result and the keyword recognition result. Specifically, among the data items of the form 500a defined in the layout definition table 111, those that could not be acquired by the layout recognition process are complemented with the contents acquired by the keyword recognition process.

このように、レイアウト認識処理部131は、キーワード認識処理の対象外の領域に対して、レイアウト認識による文字認識を実行する。
図19は、第4の実施の形態の各文字認識の対象領域の第1の例を示す図である。図19(A)は、改訂前の帳票500を示している。図19(B)は、改訂後の帳票500aを示している。
In this way, the layout recognition processing unit 131 performs character recognition by layout recognition on an area that is not subject to keyword recognition processing.
FIG. 19 is a diagram illustrating a first example of target areas for character recognition according to the fourth embodiment. FIG. 19A shows a form 500 before revision. FIG. 19B shows a revised form 500a.

帳票500には、レイアウト認識対象領域560が含まれる。レイアウト認識対象領域560は、記入欄群520が占める領域と同一である。
帳票500aには、キーワード認識対象領域550aが含まれる。キーワード認識対象領域550aは、領域識別情報550で囲われる領域と同一である。ここで、帳票500aには、帳票500におけるレイアウト認識対象領域560の枠線も図示されている。帳票500aでは、キーワード認識対象領域550aにレイアウト認識対象領域560が包含されている。したがって、帳票読取装置100は、帳票500aの帳票画像に対してレイアウト認識処理を実行しない。帳票読取装置100は、帳票500aの帳票画像のうち、キーワード認識対象領域550aに対してキーワード認識処理を実行する。
The form 500 includes a layout recognition target area 560. The layout recognition target area 560 is the same as the area occupied by the entry column group 520.
The form 500a includes a keyword recognition target area 550a. The keyword recognition target area 550a is the same as the area surrounded by the area identification information 550. Here, the form 500 a also shows a frame line of the layout recognition target area 560 in the form 500. In the form 500a, the layout recognition target area 560 is included in the keyword recognition target area 550a. Therefore, the form reading apparatus 100 does not execute the layout recognition process on the form image of the form 500a. The form reading apparatus 100 executes keyword recognition processing on the keyword recognition target area 550a in the form image of the form 500a.

図20は、第4の実施の形態の各文字認識の対象領域の第2の例を示す図である。図20(A)は、改訂前の帳票600を示している。図20(B)は、帳票600に対する改訂後の帳票600aを示している。   FIG. 20 is a diagram illustrating a second example of target areas for character recognition according to the fourth embodiment. FIG. 20A shows a form 600 before revision. FIG. 20B shows a revised form 600 a for the form 600.

帳票600には、レイアウト認識対象領域610が含まれる。
帳票600aには、レイアウト認識対象領域610aおよびキーワード認識対象領域620が含まれる。ここで、レイアウト認識対象領域610aは、帳票600,600aを重ねたときに、レイアウト認識対象領域610から、キーワード認識対象領域620と重なる領域を除いた領域に等しい。帳票読取装置100は、レイアウト認識対象領域610のうち、キーワード認識対象領域620からはみ出るレイアウト認識対象領域610aに対してレイアウト認識を実行する。更に、帳票読取装置100は、キーワード認識対象領域620に対してキーワード認識を実行する。
The form 600 includes a layout recognition target area 610.
The form 600a includes a layout recognition target area 610a and a keyword recognition target area 620. Here, the layout recognition target area 610a is equal to the area obtained by excluding the area overlapping the keyword recognition target area 620 from the layout recognition target area 610 when the forms 600 and 600a are overlapped. The form reading apparatus 100 performs layout recognition on a layout recognition target area 610 a that protrudes from the keyword recognition target area 620 in the layout recognition target area 610. Further, the form reading apparatus 100 executes keyword recognition for the keyword recognition target area 620.

このように、第4の実施の形態の帳票読取装置100によれば、キーワード認識の処理対象領域と被らない領域に対してレイアウト認識を行う。これにより、文字認識を一層効率的に行える。   As described above, according to the form reading apparatus 100 of the fourth embodiment, layout recognition is performed on the keyword recognition processing target area and the non-covered area. Thereby, character recognition can be performed more efficiently.

なお、改訂後にキーワード認識対象領域が複数存在する場合も考えられる。この場合、該複数のキーワード認識対象領域と、改訂前のレイアウト認識対象領域と、の重複の有無を判断する。そして、改訂後の帳票につき、重複しない領域に対してレイアウト認識処理を行えばよい。   Note that there may be a case where a plurality of keyword recognition target areas exist after the revision. In this case, it is determined whether or not there is an overlap between the plurality of keyword recognition target areas and the layout recognition target area before revision. Then, the layout recognition process may be performed on the non-overlapping areas for the revised form.

[第5の実施の形態]
以下、第5の実施の形態を説明する。前述の第2〜第4の実施の形態との相違点を主に説明し、同様の事項の説明を省略する。
[Fifth Embodiment]
Hereinafter, a fifth embodiment will be described. Differences from the second to fourth embodiments will be mainly described, and description of similar matters will be omitted.

第2〜第4の実施の形態では、キーワード認識処理の際、検出したキーワードに対するデータ部の位置を、所定位置と特定したり、帳票の表構造などに基づいて特定したりすることを説明した。   In the second to fourth embodiments, in the keyword recognition process, the position of the data part with respect to the detected keyword is specified as a predetermined position, or specified based on the table structure of the form, etc. .

一方、該データ部を任意に配置して、より自由度の高いレイアウト変更に対応できることが望ましい。例えば、キーワードの存在するセルの下側のセルをデータ部に対応させる記入欄と、キーワードの存在するセルの右下側のセルをデータ部に対応させる記入欄と、を混在させたい場合が考えられる。また、このようにキーワードの存在するセルに対する任意の位置にデータ部を配置したときに、データ部を容易に特定できることが望ましい。例えば、帳票の表構造などを解析する場合には、該解析の処理による負荷が大きくなることもあるからである。   On the other hand, it is desirable that the data part can be arbitrarily arranged to cope with layout change with a higher degree of freedom. For example, you may want to mix an entry field that associates the lower cell of the cell in which the keyword exists with the data part and an entry field that associates the lower right cell of the cell in which the keyword exists with the data part. It is done. Further, it is desirable that the data part can be easily specified when the data part is arranged at an arbitrary position with respect to the cell in which the keyword exists. This is because, for example, when analyzing the table structure of a form, the load due to the analysis process may increase.

そこで、第5の実施の形態では、データ部を容易に特定可能としながら、より自由度の高いレイアウト変更に対応可能とするための機能を提供する。
ここで、第5の実施の形態の情報処理システムの構成は、図2で説明した第2の実施の形態の情報処理システムの構成と同様である。また、第5の実施の形態の帳票読取装置のハードウェアおよび機能構成は、図3,6で説明した第2の実施の形態の帳票読取装置100のハードウェアおよび機能構成と同様である。以下、第5の実施の形態の帳票読取装置も帳票読取装置100と同一の符号・名称を用いて各構成を指し示すものとする。
Therefore, in the fifth embodiment, a function is provided for making it possible to cope with a layout change with a higher degree of freedom while making it possible to easily specify the data portion.
Here, the configuration of the information processing system of the fifth embodiment is the same as the configuration of the information processing system of the second embodiment described in FIG. The hardware and functional configuration of the form reading apparatus according to the fifth embodiment is the same as the hardware and functional configuration of the form reading apparatus 100 according to the second embodiment described with reference to FIGS. Hereinafter, the form reading apparatus according to the fifth embodiment also indicates each component using the same reference numeral and name as the form reading apparatus 100.

図21は、第5の実施の形態のキーワード認識対象領域の例を示す図である。キーワード認識対象領域は、領域識別情報340の内側の領域である。該領域内には、記入欄331b,332b,333bが含まれる。記入欄331b,332b,333bは、図5で説明した記入欄331a,332a,333aにそれぞれ対応する。   FIG. 21 is a diagram illustrating an example of a keyword recognition target area according to the fifth embodiment. The keyword recognition target area is an area inside the area identification information 340. The area includes entry fields 331b, 332b, and 333b. The entry fields 331b, 332b, and 333b correspond to the entry fields 331a, 332a, and 333a described in FIG.

記入欄331bの見出し部分のセルには、キーワード351および支援情報351bが印字されている。
キーワード351は、文字列“電話番号”を示している。これは、該帳票の帳票画像内に含まれ得るデータ項目名に一致するものとする。支援情報351bは、キーワード351が存在するセルに対するデータ部の位置を示す記号である。支援情報351bは、数字“1”であり、キーワード351が存在するセルに隣接する、図21の紙面に向かって右側のセルがデータ部であることを示す。キーワード認識処理部132は、支援情報351bに基づいて、キーワード351に対するデータ部を特定できる。例えば、キーワード認識処理部132は、データ項目“電話番号”に対して右側に隣接するセルを参照し、文字列データ“000−0000−0000”を取得する。
A keyword 351 and support information 351b are printed in the cell of the heading portion of the entry field 331b.
The keyword 351 indicates the character string “phone number”. This corresponds to the data item name that can be included in the form image of the form. The support information 351b is a symbol indicating the position of the data part with respect to the cell in which the keyword 351 exists. The support information 351b is the number “1”, and indicates that the right cell toward the page of FIG. 21 adjacent to the cell in which the keyword 351 exists is the data part. The keyword recognition processing unit 132 can specify the data part for the keyword 351 based on the support information 351b. For example, the keyword recognition processing unit 132 refers to a cell adjacent to the right side with respect to the data item “phone number”, and acquires character string data “000-0000-0000”.

記入欄332bの見出し部分のセルには、キーワード352および支援情報352bが印字されている。
キーワード352は、文字列“性別”を示している。これは、該帳票の帳票画像内に含まれ得るデータ項目名に一致するものとする。支援情報352bは、キーワード352が存在するセルに対するデータ部の位置を示す記号である。支援情報352bは、数字“2”であり、キーワード352が存在するセルに隣接する、図21の紙面に向かって下側のセルがデータ部であることを示す。キーワード認識処理部132は、支援情報352bに基づいて、キーワード352に対するデータ部を特定できる。例えば、キーワード認識処理部132は、データ項目“性別”に対して下側に隣接するセルを参照し、“男”を選択していることを示す選択記号(チェックマーク)を取得する。
A keyword 352 and support information 352b are printed in the cell of the heading portion of the entry column 332b.
The keyword 352 indicates the character string “sex”. This corresponds to the data item name that can be included in the form image of the form. The support information 352b is a symbol indicating the position of the data part with respect to the cell in which the keyword 352 exists. The support information 352b is a number “2”, and indicates that the cell adjacent to the cell in which the keyword 352 exists and the lower cell toward the page of FIG. 21 is the data part. The keyword recognition processing unit 132 can specify the data part for the keyword 352 based on the support information 352b. For example, the keyword recognition processing unit 132 refers to a cell adjacent on the lower side with respect to the data item “sex”, and acquires a selection symbol (check mark) indicating that “male” is selected.

記入欄333bの見出し部分のセルには、キーワード353および支援情報353bが印字されている。
キーワード353は、文字列“生年月日”を示している。これは、該帳票の帳票画像内に含まれ得るデータ項目名に一致するものとする。支援情報353bの意味は、支援情報352bと同様である。キーワード認識処理部132は、支援情報353bに基づいて、キーワード353に対するデータ部を特定できる。これにより、キーワード認識処理部132は、データ項目“生年月日”に対して下側に隣接するセルを参照し、文字列データ“1985”年“11”月“15”日を取得する。
A keyword 353 and support information 353b are printed in the cell of the heading portion of the entry column 333b.
The keyword 353 indicates the character string “date of birth”. This corresponds to the data item name that can be included in the form image of the form. The meaning of the support information 353b is the same as that of the support information 352b. The keyword recognition processing unit 132 can specify the data part for the keyword 353 based on the support information 353b. Thereby, the keyword recognition processing unit 132 refers to the cell adjacent to the lower side with respect to the data item “birth date”, and acquires the character string data “1985” “11” month “15” day.

次に、以上の構成の帳票読取装置100の処理手順を説明する。なお、第5の実施の形態の帳票読取処理の手順は図8で説明した第2の実施の形態の帳票読取処理の手順と同様である。   Next, a processing procedure of the form reading apparatus 100 having the above configuration will be described. Note that the procedure of the form reading process of the fifth embodiment is the same as the procedure of the form reading process of the second embodiment described with reference to FIG.

また、第5の実施の形態のキーワード認識処理の手順は、図10で説明した第2の実施の形態のキーワード認識処理の手順と同様である。ただし、該キーワード認識処理のステップS26におけるデータ部を特定するための処理が異なる。以下では、このデータ部を特定するための処理の手順を説明する。   Further, the procedure of the keyword recognition process of the fifth embodiment is the same as the procedure of the keyword recognition process of the second embodiment described with reference to FIG. However, the process for specifying the data part in step S26 of the keyword recognition process is different. Below, the procedure of the process for specifying this data part is demonstrated.

図22は、第5の実施の形態のデータ部の特定処理を示すフローチャートである。以下、図22に示す処理をステップ番号に沿って説明する。
(ステップS91)キーワード認識処理部132は、抽出したキーワードの存在する付近に支援情報が存在するか否かを判定する。支援情報が存在する場合、処理をステップS92に進める。支援情報が存在しない場合、処理をステップS93に進める。ここで、キーワードの存在する付近に支援情報が存在するか否かは、例えば、次の方法により判断できる。具体的には、キーワード認識処理部132にキーワードに対する支援情報の相対的な位置と支援情報のフォーマットとを予め設定しておく。キーワード認識処理部132は、キーワードに対する所定位置に該フォーマットに合致する文字列等が印字されているかを判断することで、支援情報の存在の有無を判定する。
FIG. 22 is a flowchart illustrating the data portion specifying process according to the fifth embodiment. In the following, the process illustrated in FIG. 22 will be described in order of step number.
(Step S91) The keyword recognition processing unit 132 determines whether or not support information exists in the vicinity of the extracted keyword. If support information exists, the process proceeds to step S92. If support information does not exist, the process proceeds to step S93. Here, whether or not support information exists in the vicinity of the keyword can be determined by the following method, for example. More specifically, the relative position of the support information with respect to the keyword and the format of the support information are set in the keyword recognition processing unit 132 in advance. The keyword recognition processing unit 132 determines whether or not the support information exists by determining whether a character string or the like that matches the format is printed at a predetermined position with respect to the keyword.

(ステップS92)キーワード認識処理部132は、支援情報に応じた位置をデータ部と特定する。図21の例でいえば、支援情報351bに基づいて、キーワード351が存在するセルの右側に隣接するセルをデータ部と特定する。また、支援情報352bに基づいて、キーワード352が存在するセルの下側に隣接するセルをデータ部と特定する。何れの支援情報が、どのような位置を示すかは、キーワード認識処理部132に予め設定される。そして、処理を終了する。   (Step S92) The keyword recognition processing unit 132 specifies a position corresponding to the support information as a data unit. In the example of FIG. 21, based on the support information 351b, the cell adjacent to the right side of the cell in which the keyword 351 exists is specified as the data part. Further, based on the support information 352b, the cell adjacent to the lower side of the cell in which the keyword 352 exists is specified as the data part. Which support information indicates what position is set in the keyword recognition processing unit 132 in advance. Then, the process ends.

(ステップS93)キーワード認識処理部132は、デフォルトの方法により、抽出したキーワードに対するデータ部を特定する。例えば、キーワード認識処理部132は、所定位置のセル(例えば、「該キーワードが存在するセルの右側に隣接するセル」)をデータ部と特定する。あるいは、キーワードや、帳票上の表構造に基づき、該キーワードに対応するデータ部を特定してもよい。そして、処理を終了する。   (Step S93) The keyword recognition processing unit 132 specifies a data part for the extracted keyword by a default method. For example, the keyword recognition processing unit 132 specifies a cell at a predetermined position (for example, “a cell adjacent to the right side of the cell in which the keyword exists”) as the data unit. Alternatively, the data portion corresponding to the keyword may be specified based on the keyword or the table structure on the form. Then, the process ends.

このようにして、キーワード認識処理部132は、キーワードとともに印字された支援情報を読み取ることで、該キーワードに対するデータ部を効率的に特定できる。
なお、図21では、数値を支援情報とする場合を例示したが、他の文字(または文字列)、記号などを用いても構わない。
In this way, the keyword recognition processing unit 132 can efficiently identify the data part for the keyword by reading the support information printed together with the keyword.
21 illustrates the case where numerical values are used as support information, but other characters (or character strings), symbols, and the like may be used.

図23は、第5の実施の形態のデータ部の特定方法の例を示す図である。図23(A)は、記入欄700を例示している。記入欄700は、セル701,702を含む。セル701は、見出し部分のセルである。セル701には、キーワード“振込金額”と支援情報“○”(丸印)が印字されている。支援情報“○”は、セル701の右側に隣接するセル702が、該キーワードに対するデータ部のセルであることを示す。よって、キーワード認識処理部132は、記入欄700につき、支援情報“○”に基づいて、セル702を文字認識し、キーワード“振込金額”に対する文字列データ“¥11000”を取得する。   FIG. 23 is a diagram illustrating an example of a data part specifying method according to the fifth embodiment. FIG. 23A illustrates an entry field 700. The entry field 700 includes cells 701 and 702. A cell 701 is a heading cell. In the cell 701, a keyword “transfer amount” and support information “◯” (circle) are printed. The support information “◯” indicates that the cell 702 adjacent to the right side of the cell 701 is a cell of the data portion for the keyword. Therefore, the keyword recognition processing unit 132 performs character recognition on the cell 702 based on the support information “◯” for the entry field 700 and acquires character string data “¥ 11000” for the keyword “transfer amount”.

図23(B)は、記入欄710を例示している。記入欄710は、セル711,712を含む。セル711は、見出し部分のセルである。セル711には、キーワード“振込金額”と支援情報“△”(三角印)が印字されている。支援情報“△”は、セル711の右下側のセル712が、該キーワードに対するデータ部のセルであることを示す。よって、キーワード認識処理部132は、記入欄710につき、支援情報“△”に基づいて、セル712を文字認識し、キーワード“振込金額”に対する文字列データ“¥11000”を取得する。   FIG. 23B illustrates an entry field 710. The entry field 710 includes cells 711 and 712. A cell 711 is a heading cell. In the cell 711, the keyword “transfer amount” and support information “Δ” (triangle mark) are printed. The support information “Δ” indicates that the cell 712 on the lower right side of the cell 711 is a cell of the data portion for the keyword. Therefore, the keyword recognition processing unit 132 performs character recognition on the cell 712 for the entry field 710 based on the support information “Δ”, and acquires character string data “¥ 11000” for the keyword “transfer amount”.

図23(C)は、記入欄720を例示している。記入欄720は、セル721,722を含む。セル721は、見出し部分のセルである。セル721には、キーワード“振込金額”と支援情報“□”(四角印)が印字されている。支援情報“□”は、セル721の下側に隣接するセル722が、該キーワードに対するデータ部のセルであることを示す。よって、キーワード認識処理部132は、記入欄720につき、支援情報“□”に基づいて、セル722を文字認識し、キーワード“振込金額”対する文字列データ“¥11000”を取得する。   FIG. 23C illustrates an entry field 720. The entry field 720 includes cells 721 and 722. A cell 721 is a heading cell. In the cell 721, a keyword “transfer amount” and support information “□” (square mark) are printed. The support information “□” indicates that the cell 722 adjacent to the lower side of the cell 721 is a cell of the data portion for the keyword. Therefore, the keyword recognition processing unit 132 performs character recognition on the cell 722 for the entry field 720 based on the support information “□”, and acquires character string data “¥ 11000” for the keyword “transfer amount”.

以上は一例であり、支援情報には、種々の数値、文字(または文字列)、記号などを利用できる。また、キーワード認識処理部132は、枠線や枠内の領域、キーワードのフォーマットなどとして支援情報を検出し、データ部の位置を特定してもよい。次に、そのような支援情報の例を説明する。   The above is an example, and various numerical values, characters (or character strings), symbols, and the like can be used as the support information. Further, the keyword recognition processing unit 132 may detect support information as a frame line, a region within the frame, a keyword format, and the like, and specify the position of the data unit. Next, an example of such support information will be described.

図24は、第5の実施の形態のデータ部の特定方法の他の例を示す図である。図24(A)は、記入欄800を例示している。記入欄800は、セル801,802を含む。セル801は、見出し部分のセルである。そして、セル801の枠内には、該枠の中央からデータ部の方向に対応する一辺の側に、該一辺と平行な罫線が印字される。具体的には、セル801に対するデータ部のセルが該セル801の右側に隣接するセル802であるとき、セル801,802の境界に位置する枠線よりもセル801側(ただし、セル801の中央よりもセル802側)に、該枠線と平行な罫線801aが印字される。キーワード認識処理部132は、罫線801aを支援情報として検出する。そして、キーワード認識処理部132は、セル801内の罫線801aの位置に基づいて、セル802をデータ部として特定する。これにより、キーワード認識処理部132は、セル801内のキーワード“振込金額”に対して、セル802内の文字列データ“¥11000”を取得する。   FIG. 24 is a diagram illustrating another example of the data portion specifying method according to the fifth embodiment. FIG. 24A illustrates an entry field 800. The entry field 800 includes cells 801 and 802. A cell 801 is a heading cell. In the frame of the cell 801, a ruled line parallel to the one side is printed on one side corresponding to the direction of the data portion from the center of the frame. Specifically, when the cell of the data part for the cell 801 is a cell 802 adjacent to the right side of the cell 801, the cell 801 side (however, the center of the cell 801 is located at the border between the cells 801 and 802). A ruled line 801a parallel to the frame line is printed on the cell 802 side. The keyword recognition processing unit 132 detects the ruled line 801a as support information. Then, the keyword recognition processing unit 132 identifies the cell 802 as a data portion based on the position of the ruled line 801a in the cell 801. Thus, the keyword recognition processing unit 132 acquires the character string data “¥ 11000” in the cell 802 for the keyword “transfer amount” in the cell 801.

例えば、セル801の下側に隣接するセルをデータ部とする場合には、セル801の下側の枠線と平行な罫線がセル801内の下側に印字される。キーワード認識処理部132は、該罫線に基づいて、セル801の下側に隣接するセルをデータ部として特定できる。   For example, when a cell adjacent to the lower side of the cell 801 is used as the data portion, a ruled line parallel to the lower frame line of the cell 801 is printed on the lower side in the cell 801. The keyword recognition processing unit 132 can specify a cell adjacent to the lower side of the cell 801 as a data portion based on the ruled line.

図24(B)は、記入欄810を例示している。記入欄810は、セル811,812を含む。セル811は、見出し部分のセルである。セル812は、セル811内のキーワードに対応するデータ部のセルである。そして、セル811とセル812との境界線811aが他の枠線とは異なる太さで印字されている。キーワード認識処理部132は、太さの異なる境界線811aに基づいて、データ部の位置を特定する。具体的には、セル811の境界線811aの方向に隣接するセル812をデータ部として特定する。これにより、キーワード認識処理部132は、セル811内のキーワード“振込金額”に対して、セル812内の文字列データ“¥11000”を取得する。   FIG. 24B illustrates an entry field 810. The entry field 810 includes cells 811 and 812. A cell 811 is a heading cell. A cell 812 is a data portion cell corresponding to the keyword in the cell 811. A boundary line 811a between the cell 811 and the cell 812 is printed with a thickness different from that of the other frame lines. The keyword recognition processing unit 132 specifies the position of the data part based on the boundary line 811a having a different thickness. Specifically, the cell 812 adjacent in the direction of the boundary line 811a of the cell 811 is specified as the data portion. Accordingly, the keyword recognition processing unit 132 acquires the character string data “¥ 11000” in the cell 812 for the keyword “transfer amount” in the cell 811.

図24(C)は、記入欄820を例示している。記入欄820は、セル821,822を含む。セル821は、見出し部分のセルである。セル821内にはキーワードが横一列に並んだ文字列として“振込金額”と印字される。横一列に並んだ文字列は、セル811の右側に隣接するセルが該キーワードに対応するデータ部であることを示している。キーワード認識処理部132は、セル821内のキーワード“振込金額”を検出し、更に、該キーワードが横一列に並んでいることを検知する。すると、キーワード認識処理部132は、セル821の右側に隣接するセル822をデータ部として特定する。これにより、キーワード認識処理部132は、セル821内のキーワード“振込金額”に対して、セル822内の文字列データ“¥11000”を取得する。   FIG. 24C illustrates an entry field 820. The entry field 820 includes cells 821 and 822. A cell 821 is a heading cell. In the cell 821, “transfer amount” is printed as a character string in which keywords are arranged in a horizontal row. The character strings arranged in a horizontal row indicate that the cell adjacent to the right side of the cell 811 is a data portion corresponding to the keyword. The keyword recognition processing unit 132 detects the keyword “transfer amount” in the cell 821 and further detects that the keywords are arranged in a horizontal row. Then, the keyword recognition processing unit 132 specifies the cell 822 adjacent to the right side of the cell 821 as the data portion. Accordingly, the keyword recognition processing unit 132 acquires the character string data “¥ 11000” in the cell 822 for the keyword “transfer amount” in the cell 821.

例えば、セル821の下側に隣接するセルをデータ部とする場合には、セル821内のキーワードが縦一列に印字される。また、例えば、セル821の右下側のセルをデータ部とする場合には、セル821の左上から右下へ向かう斜めの一列に並んでキーワードが印字される。キーワード認識処理部132は、このようにキーワードに含まれる文字の並び方によって、該キーワードに対するデータ部のセルを特定する。   For example, when a cell adjacent to the lower side of the cell 821 is used as a data portion, the keywords in the cell 821 are printed in a vertical line. Further, for example, when the cell on the lower right side of the cell 821 is used as the data portion, the keywords are printed in a diagonal line from the upper left of the cell 821 to the lower right. The keyword recognition processing unit 132 specifies the cell of the data part for the keyword according to the arrangement of the characters included in the keyword.

図24(D)は、記入欄830を例示している。記入欄830は、セル831,832を含む。セル831は、見出し部分のセルである。セル832は、セル831内のキーワードに対応するデータ部のセルである。セル831の枠内には、所定の色が付されている。記入欄830では、この色によって、セル831に対するセル832の位置を示している。例えば、画像情報中、色は複数のパラメータで表現される。例えば、HSVによる色表現では、色相(hue)、彩度(saturation value)、明度(value)という3つのパラメータで色が表現される。その場合、各パラメータの何れか、あるいは複数のパラメータにより、セル831の上下左右の何れの側に隣接するセルがデータ部であるかを予め定義する。例えば、色相の範囲を4等分して、等分した各範囲を上下左右の何れかに割り当てることが考えられる。彩度や明度を用いる場合も同様である。   FIG. 24D illustrates the entry field 830. The entry field 830 includes cells 831 and 832. A cell 831 is a heading cell. Cell 832 is a cell of the data part corresponding to the keyword in cell 831. A predetermined color is given in the frame of the cell 831. In the entry field 830, the position of the cell 832 with respect to the cell 831 is indicated by this color. For example, in the image information, the color is expressed by a plurality of parameters. For example, in color representation by HSV, a color is represented by three parameters, hue (hue), saturation (saturation value), and lightness (value). In that case, it is defined in advance whether the cell adjacent to the upper, lower, left, or right side of the cell 831 is the data portion by any one of the parameters or a plurality of parameters. For example, it is conceivable to divide the hue range into four equal parts and assign each of the equally divided ranges to the top, bottom, left or right. The same applies when using saturation and lightness.

セル831内の色は、セル831の右側に隣接するセル832がセル831に対応するデータ部である旨、キーワード認識処理部132に予め設定される。キーワード認識処理部132は、セル831内の色を解析することで、セル831に対応するデータ部のセル832を特定する。これにより、キーワード認識処理部132は、セル831内のキーワード“振込金額”に対して、セル832内の文字列データ“¥11000”を取得する。   The color in the cell 831 is preset in the keyword recognition processing unit 132 to the effect that the cell 832 adjacent to the right side of the cell 831 is a data part corresponding to the cell 831. The keyword recognition processing unit 132 identifies the cell 832 of the data part corresponding to the cell 831 by analyzing the color in the cell 831. Accordingly, the keyword recognition processing unit 132 acquires the character string data “¥ 11000” in the cell 832 for the keyword “transfer amount” in the cell 831.

なお、画像が2値化されている場合には、ハッチングの種類や、ドットの密度などに応じてデータ部を特定してもよい。
以上のように、帳票読取装置100は、キーワードと共に印字された支援情報を検出して、データ部のセルを特定する。これにより、帳票に対して自由度の高いレイアウト変更が可能になる。加えて、キーワード認識処理において、キーワードに対するデータ部を容易に特定可能となる。
If the image is binarized, the data portion may be specified according to the type of hatching, the dot density, and the like.
As described above, the form reading device 100 detects the support information printed together with the keyword, and specifies the cell of the data part. Thereby, it is possible to change the layout with a high degree of freedom for the form. In addition, in the keyword recognition process, the data portion for the keyword can be easily specified.

1 情報処理装置
1a 検出部
1b 領域特定部
1c 処理部
2 画像情報
2a 識別情報
2b 領域識別情報
3 処理対象領域
DESCRIPTION OF SYMBOLS 1 Information processing apparatus 1a Detection part 1b Area | region specific part 1c Processing part 2 Image information 2a Identification information 2b Area identification information 3 Processing object area | region

Claims (7)

帳票を撮像して得られた画像情報から該帳票のレイアウトが変更された旨を示す識別情報を検出し、
前記識別情報を検出すると、前記画像情報に含まれる、所定の文字認識処理を行う処理対象領域を識別するための領域識別情報を検出して、該領域識別情報に基づき前記処理対象領域を特定し、
特定した前記処理対象領域に対して前記所定の文字認識処理を行う、
処理をコンピュータに実行させる情報処理プログラム。
Detecting identification information indicating that the layout of the form has been changed from image information obtained by imaging the form;
When the identification information is detected, area identification information included in the image information for identifying a processing target area for performing a predetermined character recognition process is detected, and the processing target area is specified based on the area identification information. ,
Performing the predetermined character recognition processing on the identified processing target area;
An information processing program that causes a computer to execute processing.
前記領域識別情報に応じて、前記所定の文字認識処理により取得したデータの用途を区別する、請求項1記載の情報処理プログラム。   The information processing program according to claim 1, wherein the use of the data acquired by the predetermined character recognition process is distinguished according to the area identification information. 前記識別情報を検出しない場合は前記画像情報の全領域に前記所定の文字認識処理以外の他の文字認識処理を行い、前記識別情報を検出した場合は前記処理対象領域以外の領域に前記他の文字認識処理を行う、請求項1または2記載の情報処理プログラム。   When the identification information is not detected, a character recognition process other than the predetermined character recognition process is performed on the entire area of the image information. When the identification information is detected, the other area is detected in an area other than the process target area. The information processing program according to claim 1, wherein character recognition processing is performed. 前記他の文字認識処理は、データ項目名と文字認識対象位置とを対応付けて定義したレイアウト定義情報を記憶する記憶部に記憶された前記レイアウト定義情報に基づいて、前記データ項目名と前記文字認識対象位置から抽出したデータとを対応付けて取得するレイアウト認識による文字認識処理である、請求項3記載の情報処理プログラム。   The other character recognition processing is performed based on the data item name and the character based on the layout definition information stored in a storage unit that stores layout definition information in which a data item name and a character recognition target position are defined in association with each other. The information processing program according to claim 3, which is a character recognition process by layout recognition that is acquired in association with data extracted from a recognition target position. 前記所定の文字認識処理は、所定のキーワードと前記画像情報内の該キーワードに対応するデータ部の位置を特定するための支援情報とを前記画像情報から検出し、該支援情報に基づき前記データ部を特定して、該データ部から前記キーワードに対応するデータを取得する処理である、請求項1乃至4の何れか一項に記載の情報処理プログラム。   The predetermined character recognition process detects a predetermined keyword and support information for specifying a position of a data portion corresponding to the keyword in the image information from the image information, and based on the support information, the data portion The information processing program according to any one of claims 1 to 4, which is a process of identifying the data and acquiring data corresponding to the keyword from the data portion. 帳票を撮像して得られた画像情報から該帳票のレイアウトが変更された旨を示す識別情報を検出する検出部と、
前記識別情報を検出すると、前記画像情報に含まれる、所定の文字認識処理を行う処理対象領域を識別するための領域識別情報を検出して、該領域識別情報に基づき前記処理対象領域を特定する領域特定部と、
特定した前記処理対象領域に対して前記所定の文字認識処理を行う処理部と、
を有する情報処理装置。
A detection unit that detects identification information indicating that the layout of the form has been changed from image information obtained by imaging the form;
When the identification information is detected, area identification information included in the image information for identifying a processing target area for performing a predetermined character recognition process is detected, and the processing target area is specified based on the area identification information. An area identification unit;
A processing unit that performs the predetermined character recognition processing on the identified processing target area;
An information processing apparatus.
情報処理装置が実行する文字認識方法であって、
帳票を撮像して得られた画像情報から該帳票のレイアウトが変更された旨を示す識別情報を検出すると、前記画像情報に含まれる、所定の文字認識処理を行う処理対象領域を識別するための領域識別情報を検出して、該領域識別情報に基づき前記処理対象領域を特定し、
特定した前記処理対象領域に対して前記所定の文字認識処理を行う、
文字認識方法。
A character recognition method executed by an information processing apparatus,
When identification information indicating that the layout of the form has been changed is detected from the image information obtained by imaging the form, the process includes a process for identifying a processing target area to be subjected to a predetermined character recognition process included in the image information. Detecting region identification information, specifying the processing target region based on the region identification information,
Performing the predetermined character recognition processing on the identified processing target area;
Character recognition method.
JP2011166451A 2011-07-29 2011-07-29 Information processing program, information processing apparatus, and character recognition method Active JP5566971B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011166451A JP5566971B2 (en) 2011-07-29 2011-07-29 Information processing program, information processing apparatus, and character recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011166451A JP5566971B2 (en) 2011-07-29 2011-07-29 Information processing program, information processing apparatus, and character recognition method

Publications (2)

Publication Number Publication Date
JP2013030040A true JP2013030040A (en) 2013-02-07
JP5566971B2 JP5566971B2 (en) 2014-08-06

Family

ID=47787015

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011166451A Active JP5566971B2 (en) 2011-07-29 2011-07-29 Information processing program, information processing apparatus, and character recognition method

Country Status (1)

Country Link
JP (1) JP5566971B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015130091A (en) * 2014-01-08 2015-07-16 大日本印刷株式会社 Management system and management program
JP2017062574A (en) * 2015-09-24 2017-03-30 富士通フロンテック株式会社 Document image determination program, document image determination method, and document image determination system
JP2020027598A (en) * 2018-12-27 2020-02-20 株式会社シグマクシス Character recognition device, character recognition method, and character recognition program
JP2020126326A (en) * 2019-02-01 2020-08-20 株式会社プリマジェスト Device, method, and program for identifying character string contained in business form

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10124615A (en) * 1996-10-24 1998-05-15 Ricoh Co Ltd Character recognizing device
JP2004164376A (en) * 2002-11-14 2004-06-10 Fujitsu Ltd Identification-code-attached form, form reading program, and form creation program
JP2004199529A (en) * 2002-12-20 2004-07-15 Fujitsu Ltd Business form recognition device and business form recognition method
JP2007233913A (en) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd Image processor and program
JP2010003155A (en) * 2008-06-20 2010-01-07 Fujitsu Frontech Ltd Form recognition apparatus, method, database generation apparatus, method, and program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10124615A (en) * 1996-10-24 1998-05-15 Ricoh Co Ltd Character recognizing device
JP2004164376A (en) * 2002-11-14 2004-06-10 Fujitsu Ltd Identification-code-attached form, form reading program, and form creation program
JP2004199529A (en) * 2002-12-20 2004-07-15 Fujitsu Ltd Business form recognition device and business form recognition method
JP2007233913A (en) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd Image processor and program
JP2010003155A (en) * 2008-06-20 2010-01-07 Fujitsu Frontech Ltd Form recognition apparatus, method, database generation apparatus, method, and program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
石川 和弘、外2名: ""OCR制限緩和技術"", 沖電気研究開発, vol. 65, no. 1, JPN6014024669, 1 January 1998 (1998-01-01), JP, pages 51 - 54, ISSN: 0002832846 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015130091A (en) * 2014-01-08 2015-07-16 大日本印刷株式会社 Management system and management program
JP2017062574A (en) * 2015-09-24 2017-03-30 富士通フロンテック株式会社 Document image determination program, document image determination method, and document image determination system
JP2020027598A (en) * 2018-12-27 2020-02-20 株式会社シグマクシス Character recognition device, character recognition method, and character recognition program
JP2020126326A (en) * 2019-02-01 2020-08-20 株式会社プリマジェスト Device, method, and program for identifying character string contained in business form
JP7329331B2 (en) 2019-02-01 2023-08-18 株式会社プリマジェスト Apparatus, method, and program for recognizing character strings contained in forms

Also Published As

Publication number Publication date
JP5566971B2 (en) 2014-08-06

Similar Documents

Publication Publication Date Title
EP3437019B1 (en) Optical character recognition in structured documents
US10572725B1 (en) Form image field extraction
EP3574449B1 (en) Structured text and pattern matching for data loss prevention in object-specific image domain
KR100847037B1 (en) Media storing a program to extract and classify annotation data, and apparatus and method for processing annotation data
US8693790B2 (en) Form template definition method and form template definition apparatus
JP4996940B2 (en) Form recognition device and program thereof
US9262679B2 (en) System and method for identification and separation of form and feature elements from handwritten and other user supplied elements
JP2018005462A (en) Recognition device and recognition method
CN107679442A (en) Method, apparatus, computer equipment and the storage medium of document Data Enter
JP5566971B2 (en) Information processing program, information processing apparatus, and character recognition method
CN103870823A (en) Character recognition device and method, character recognition program
CN106529381A (en) Information processing apparatus and information processing method
JP2018055256A (en) Information processing apparatus, information processing method, and program
JP5878004B2 (en) Multiple document recognition system and multiple document recognition method
TWM626292U (en) Business-oriented key item key-value identification system
JP4518212B2 (en) Image processing apparatus and program
JP2008310531A (en) Business form identification method, business form identification program and optical character reading system using the business form identification method
JP6682827B2 (en) Information processing apparatus and information processing program
JP2017010187A (en) Image processing device and image processing program
JP2004220340A (en) Business form format editing device and business form format editing program
JP7445364B2 (en) Image processing program, image processing method, and image processing device
TWI807467B (en) Key-item detection model building method, business-oriented key-value identification system and method
JP2019008559A (en) Information processing device and information processing method
JP2012248948A (en) Device and method for supporting slip check and program
JP6187307B2 (en) Image processing apparatus and image processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130906

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140617

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140618

R150 Certificate of patent or registration of utility model

Ref document number: 5566971

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250