JP2013030040A - Information processing program, information processor, and character recognition method - Google Patents
Information processing program, information processor, and character recognition method Download PDFInfo
- Publication number
- JP2013030040A JP2013030040A JP2011166451A JP2011166451A JP2013030040A JP 2013030040 A JP2013030040 A JP 2013030040A JP 2011166451 A JP2011166451 A JP 2011166451A JP 2011166451 A JP2011166451 A JP 2011166451A JP 2013030040 A JP2013030040 A JP 2013030040A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- information
- area
- identification information
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 185
- 230000010365 information processing Effects 0.000 title claims description 38
- 238000001514 detection method Methods 0.000 claims abstract description 14
- 238000003384 imaging method Methods 0.000 claims abstract description 8
- 230000008569 process Effects 0.000 claims description 149
- 238000010586 diagram Methods 0.000 description 18
- 230000008859 change Effects 0.000 description 11
- 239000000284 extract Substances 0.000 description 11
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000000151 deposition Methods 0.000 description 5
- 239000003086 colorant Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000012447 hatching Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
本件は文字認識を行う情報処理プログラム、情報処理装置および文字認識方法に関する。 The present invention relates to an information processing program, an information processing apparatus, and a character recognition method for performing character recognition.
従来、紙面に記入された文字(あるいは文字列)の認識(文字認識)を行い、データとして取得する情報処理装置が利用されている。例えば、情報処理装置は次のようにして文字認識を行う。まず、紙面の記入面を撮像装置により撮像して、紙面の画像情報を取得する。次に、該紙面の画像情報に含まれる文字の画像情報を、予め定義された文字パターンと照合し、該文字パターンとの一致度に基づいて、文字の画像情報が何れの文字パターンに対応するか決定する。そして、決定した文字パターンに対応する文字コードを、該紙面に記入された文字のデータとして取得する。各文字につき、この処理を繰り返し行い、文字列のデータを取得する。 2. Description of the Related Art Conventionally, information processing apparatuses that perform recognition (character recognition) of characters (or character strings) entered on paper and acquire them as data have been used. For example, the information processing apparatus performs character recognition as follows. First, a paper entry surface is imaged by an imaging device to obtain image information on the paper surface. Next, the character image information included in the image information on the paper is compared with a predefined character pattern, and the character image information corresponds to any character pattern based on the degree of coincidence with the character pattern. To decide. Then, the character code corresponding to the determined character pattern is acquired as the character data entered on the page. This process is repeated for each character to obtain character string data.
文字認識では、紙面上に記入される文字列を所定のデータ項目に対応付けて取得することもある。例えば、金融機関で預金や出金などの取引に用いる帳票には、氏名、口座番号および取引金額などのデータ項目に対する文字列を、顧客に記入させる記入欄が設けられている。各記入欄は、帳票の種類ごとに定位置に配置される。この場合、データ項目に対応付けて記入欄の帳票上の位置(レイアウト)を予め定義しておけば、情報処理装置は帳票の画像情報に基づき、データ項目と文字列のデータとを対応付けて取得できる。このように、レイアウトの定義情報に基づいて、データ項目に対する文字列を抽出する文字認識の方法を、レイアウト認識による文字認識と呼ぶことがある。 In character recognition, a character string written on paper is sometimes obtained in association with a predetermined data item. For example, a form used for transactions such as deposits and withdrawals at a financial institution is provided with an entry field that allows a customer to enter character strings for data items such as name, account number, and transaction amount. Each entry field is arranged at a fixed position for each type of form. In this case, if the position (layout) of the entry field in the form is defined in advance in association with the data item, the information processing apparatus associates the data item with character string data based on the form image information. You can get it. As described above, a character recognition method for extracting a character string for a data item based on layout definition information may be referred to as character recognition by layout recognition.
ここで、帳票のレイアウトを変更することがある。その場合、レイアウト認識では、変更のたびにレイアウトの定義情報を更新するための作業負担が生じる。そこで、レイアウトの定義情報に依らずに記入された文字列とデータ項目との対応を判断して、レイアウト変更を容易にする文字認識の方法も考えられている。 Here, the form layout may be changed. In that case, in the layout recognition, a work load for updating the definition information of the layout every time a change occurs. Therefore, a method of character recognition that makes it easy to change the layout by determining the correspondence between the entered character string and the data item without depending on the layout definition information has been considered.
例えば、予め定義した項目名(「金額」や「振込金額」など)を示す文字列(キーワード)を帳票から抽出し、該キーワードの位置と記入された文字列との位置関係などに基づいて、該キーワードが示す項目名と記入された文字列とを対応付ける提案がある(例えば、特許文献1参照)。このように、項目名を示すキーワードを検出して、記入された文字列との対応を判断する文字認識の方法を、キーワード認識による文字認識と呼ぶことがある。 For example, a character string (keyword) indicating a predefined item name (such as “amount” or “transfer amount”) is extracted from a form, and based on the positional relationship between the position of the keyword and the entered character string, There is a proposal for associating an item name indicated by the keyword with a written character string (for example, see Patent Document 1). As described above, the character recognition method for detecting the keyword indicating the item name and determining the correspondence with the entered character string may be called character recognition by keyword recognition.
また、例えば、文字列を記入するフィールドが設けられた帳票上の、フィールドに対する所定位置に、項目に対応した識別コードを記載する提案がある(例えば、特許文献2参照)。この提案では、該識別コードを検出して該フィールドの項目を認識する。 In addition, for example, there is a proposal to describe an identification code corresponding to an item at a predetermined position with respect to a field on a form provided with a field for entering a character string (see, for example, Patent Document 2). In this proposal, the item of the field is recognized by detecting the identification code.
更に、例えば、項目ごとの文字列についての規定を含む構文ルール情報を定義しておく提案もある(例えば、特許文献3参照)。この提案では、認識した文字列を該構文ルール情報に基づいて解析し、認識した文字列と項目との対応付けを行う。 Further, for example, there is a proposal for defining syntax rule information including a rule for a character string for each item (see, for example, Patent Document 3). In this proposal, the recognized character string is analyzed based on the syntax rule information, and the recognized character string is associated with the item.
レイアウト変更後の帳票について所定の文字認識処理を行う際に、帳票上の領域全体を処理対象とすると処理効率が悪い場合がある。
例えば、帳票によっては、文字認識の対象としなくてもよい領域(例えば、事業者側で使用する欄や顧客に情報を伝えるためのお知らせ欄など)が含まれ得る。このような領域をも該文字認識処理の対象とすると、処理時間が余分にかかり、処理効率が悪い。
When a predetermined character recognition process is performed on a form after the layout is changed, processing efficiency may be poor if the entire area on the form is a processing target.
For example, depending on the form, an area that does not have to be a character recognition target (for example, a column used on the business side or a notification column for transmitting information to a customer) may be included. If such a region is also subject to character recognition processing, it takes extra processing time and processing efficiency is poor.
また、例えば、変更の非対象の領域は、既存の文字認識(例えば、レイアウト認識による文字認識)を行えばよい場合もある。その場合に、例えば変更の非対象の領域をも、上記特許文献1〜3に例示されるような文字認識処理の対象とすると、既存の文字認識で対応可能な領域を重複して処理することになる。すると、処理時間が余分にかかり、処理効率が悪い。
In addition, for example, there may be a case where existing character recognition (for example, character recognition by layout recognition) may be performed on a non-target area to be changed. In that case, for example, if a non-target area to be changed is also a target of character recognition processing as exemplified in
そこで、帳票上のレイアウトが変更されたときに、所定の文字認識処理の対象領域を容易に指定可能として、該文字認識処理を効率的に行う仕組みをどのようにして実現するかが問題となる。 Therefore, when the layout on the form is changed, there is a problem of how to implement a mechanism for efficiently performing the character recognition process by making it possible to easily specify a target area for a predetermined character recognition process. .
本発明はこのような点に鑑みてなされたものであり、文字認識処理を効率的に行えるようにした情報処理プログラム、情報処理装置および文字認識方法を提供することを目的とする。 The present invention has been made in view of these points, and an object thereof is to provide an information processing program, an information processing apparatus, and a character recognition method capable of efficiently performing character recognition processing.
帳票を撮像して得られた画像情報から該帳票のレイアウトが変更された旨を示す識別情報を検出し、識別情報を検出すると、画像情報に含まれる、所定の文字認識処理を行う処理対象領域を識別するための領域識別情報を検出して、該領域識別情報に基づき処理対象領域を特定し、特定した処理対象領域に対して所定の文字認識処理を行う、処理をコンピュータに実行させる情報処理プログラムが提供される。 A processing target area for performing a predetermined character recognition process included in the image information when the identification information indicating that the layout of the form has been changed is detected from the image information obtained by capturing the form and the identification information is detected. Information processing for detecting a region identification information for identifying a region, specifying a processing target region based on the region identification information, performing a predetermined character recognition process on the specified processing target region, and causing a computer to execute the processing A program is provided.
また、検出部と領域特定部と処理部とを有する情報処理装置が提供される。検出部は、帳票を撮像して得られた画像情報から該帳票のレイアウトが変更された旨を示す識別情報を検出する。領域特定部は、識別情報を検出すると、画像情報に含まれる、所定の文字認識処理を行う処理対象領域を識別するための領域識別情報を検出して、該領域識別情報に基づき処理対象領域を特定する。処理部は、特定した処理対象領域に対して所定の文字認識処理を行う。 An information processing apparatus having a detection unit, a region specifying unit, and a processing unit is provided. The detection unit detects identification information indicating that the layout of the form has been changed from image information obtained by capturing the form. Upon detecting the identification information, the area specifying unit detects area identification information included in the image information for identifying a processing target area for performing a predetermined character recognition process, and determines the processing target area based on the area identification information. Identify. The processing unit performs a predetermined character recognition process on the specified processing target area.
また、情報処理装置が実行する文字認識方法が提供される。この文字認識方法では、帳票を撮像して得られた画像情報から該帳票のレイアウトが変更された旨を示す識別情報を検出すると、画像情報に含まれる、所定の文字認識処理を行う処理対象領域を識別するための領域識別情報を検出して、該領域識別情報に基づき処理対象領域を特定する。特定した処理対象領域に対して所定の文字認識処理を行う。 A character recognition method executed by the information processing apparatus is also provided. In this character recognition method, when identification information indicating that the layout of the form has been changed is detected from image information obtained by capturing the form, a processing target area for performing a predetermined character recognition process included in the image information The region identification information for identifying the region is detected, and the processing target region is specified based on the region identification information. A predetermined character recognition process is performed on the identified processing target area.
文字認識処理を効率的に行える。 Character recognition processing can be performed efficiently.
以下、本実施の形態を図面を参照して説明する。
[第1の実施の形態]
図1は、第1の実施の形態の情報処理装置を示す図である。情報処理装置1は、所定のレイアウトが施された帳票を撮像して得られた画像情報2に対して文字認識処理を行う。レイアウトとは、例えば帳票上の記入欄の配置である。
Hereinafter, the present embodiment will be described with reference to the drawings.
[First Embodiment]
FIG. 1 is a diagram illustrating the information processing apparatus according to the first embodiment. The
画像情報2には、識別情報2aおよび領域識別情報2bが含まれる。識別情報2aは、帳票上のレイアウトが変更された旨を示す情報である。領域識別情報2bは、所定の文字認識処理を行う処理対象領域3を識別するための情報である。識別情報2aおよび領域識別情報2bに対応する情報は、帳票上に予め印字される。
The
情報処理装置1は、検出部1a、領域特定部1bおよび処理部1cを有する。
検出部1aは、画像情報2から帳票上のレイアウトが変更された旨を示す識別情報2aを検出する。例えば、識別情報2aは、画像情報2の所定位置に配置される。配置位置は、検出部1aに予め設定される。例えば、識別情報2aは、数値、文字、記号、図形およびこれらの組合せなどにより表される。どのような情報が識別情報2aに該当するかは、検出部1aに予め設定される。
The
The
領域特定部1bは、検出部1aが識別情報2aを検出すると、画像情報2から領域識別情報2bを検出する。領域特定部1bは、領域識別情報2bに基づき処理対象領域3を特定する。例えば、領域識別情報2bは、所定領域を囲う線として表される。この場合、領域特定部1bは、領域識別情報2bの内側の領域を処理対象領域3と特定できる。なお、領域識別情報2bの線の太さや線の種別(実線、点線および一点鎖線など)など、どのような線が領域識別情報2bに該当するかは、領域特定部1bに予め設定される。領域特定部1bで示される図形は、任意の多角形や多角形に限らない任意の図形としてもよい。
The area specifying unit 1b detects the
なお、領域識別情報2bは、所定領域を囲う線以外の方法で表すこともできる。例えば、数値、文字、記号、図形およびこれらの組合せなどを用いてもよい。その場合、例えば、領域特定部1bには、処理対象領域3が長方形で形成されることを予め設定する。その場合、領域特定部1bは、長方形の1対の対角に設けられた2つの領域識別情報を検出することで処理対象領域3を特定できる。処理対象領域3(領域識別情報で示される図形)は、長方形に限らず任意の多角形または図形としてもよい。例えば、多角形の頂点に対応する各位置に、領域識別情報を設けておけば、領域特定部1bは、領域識別情報により頂点を特定し、頂点で囲われる多角形を特定できる。なお、この場合も、どのような情報が領域識別情報に該当するかは、領域特定部1bに予め設定される。
Note that the
ここで、検出部1a、領域特定部1bおよび処理部1cは、CPU(Central Processing Unit)およびRAM(Random Access Memory)を用いて実行されるプログラムとして実装してもよい。
Here, the
情報処理装置1によれば、検出部1aにより、画像情報2から識別情報2aが検出される。すると、領域特定部1bにより、画像情報2に含まれる領域識別情報2bが検出され、領域識別情報2bに基づき処理対象領域3が特定される。処理部1cにより、処理対象領域3に対して所定の文字認識処理が行われる。
According to the
これにより、文字認識処理を効率的に行える。具体的には、所定の文字認識処理を行う領域を処理対象領域3とし、それ以外の領域に対しては該所定の文字認識処理を行わない。すなわち、所定の文字認識処理が余計な領域に対して行われるのを抑止でき、余分な処理時間がかからずに済む。 Thereby, a character recognition process can be performed efficiently. Specifically, an area where a predetermined character recognition process is performed is set as a process target area 3, and the predetermined character recognition process is not performed for other areas. That is, it is possible to prevent the predetermined character recognition processing from being performed on an extra area, and an extra processing time is not required.
なお、図1の画像情報2では領域識別情報2bで1つの処理対象領域3を特定する場合を例示した。これに対し、複数の領域識別情報により、複数の処理対象領域を特定可能としてもよい。より具体的には、領域を囲う線として表される領域識別情報を複数設けて、複数の処理対象領域を特定可能としてもよい。あるいは、第1の処理対象領域の頂点位置に第1の領域識別情報を設けて該第1の処理対象領域を特定可能とし、第2の処理対象領域の頂点位置に、第1の領域識別情報とは異なる第2の領域識別情報を設けて該第2の処理対象領域を特定可能としてもよい。
In the
以下、金融機関の窓口などに設置され、顧客が記入した帳票の画像情報に対して文字認識処理を行う帳票読取装置に、情報処理装置1を適用する例を説明する。
[第2の実施の形態]
図2は、第2の実施の形態の情報処理システムを示す図である。この情報処理システムは、金融機関の窓口業務を支援する。この情報処理システムは、帳票読取装置100とサーバ装置200とを含む。帳票読取装置100およびサーバ装置200は、ネットワーク10を介して接続される。ネットワーク10は、該金融機関内に設けられたイントラネットである。帳票読取装置100とサーバ装置200とは、別個の拠点に設置されてもよい。ネットワーク10の経路内には、この情報処理システムのために敷設された専用線のネットワーク、インターネットおよび通信事業者のIP(Internet Protocol)網などを含んでもよい。インターネットやIP網を含む場合、VPN(Virtual Private Network)などを利用して通信のセキュリティが確保される。
Hereinafter, an example will be described in which the
[Second Embodiment]
FIG. 2 illustrates an information processing system according to the second embodiment. This information processing system supports the window business of financial institutions. This information processing system includes a
帳票読取装置100は、金融機関の窓口に設置される情報処理装置である。帳票読取装置100は、帳票を撮像して取得された帳票の画像情報(以下、帳票画像と呼ぶことがある)に対して文字認識処理を行い、顧客が帳票に記入した情報を取得してサーバ装置200に送信する。
The
帳票読取装置100が読み取る帳票の種別は、取引に応じて複数の種類が存在する。例えば、入金、出金および新規申込などの取引に応じた帳票が考えられる。帳票読取装置100は、既存のレイアウトの帳票に対する文字認識処理にレイアウト認識を用いるものとする。
There are a plurality of types of forms read by the
サーバ装置200は、顧客の口座情報を管理する情報処理装置である。サーバ装置200は、帳票読取装置100が読み取った帳票の情報を受信して、該情報に基づく取引の処理を実行する。例えば、現金の出金、現金による入金、ある口座から他の口座への預金の振替などの取引を確定するための処理である。
The
なお、金融機関の窓口には、帳票読取装置100以外にも複数の帳票読取装置が設けられてもよい。
金融機関は、帳票のレイアウトを変更すること(以下、帳票の改訂ということもある)がある。例えば、新たなデータ項目の記入欄を追加したり、既存のデータ項目の記入欄を削減したりする場合が考えられる。レイアウト認識では、レイアウト変更に際して帳票のレイアウト定義情報を変更するための作業負担が生じる。そこで、帳票読取装置100は、改訂箇所につきキーワード認識による文字認識処理を行うことで、該レイアウト変更に容易に対応可能である。以下、この場合にキーワード認識による文字認識処理を効率的に行うための構成を説明する。
In addition to the
Financial institutions sometimes change the layout of forms (hereinafter, sometimes referred to as revision of forms). For example, it may be possible to add a new data item entry field or to reduce an existing data item entry field. In layout recognition, a work load for changing the layout definition information of a form occurs when the layout is changed. Therefore, the
図3は、第2の実施の形態の帳票読取装置のハードウェアを示す図である。帳票読取装置100は、CPU101、ROM(Read Only Memory)102、RAM103、HDD(Hard Disk Drive)104、グラフィックインタフェース105、入力インタフェース106、スキャナインタフェース107、ディスクドライブ108および通信インタフェース109を有する。
FIG. 3 is a diagram illustrating hardware of the form reading apparatus according to the second embodiment. The
CPU101は、OS(Operating System)プログラムやアプリケーションプログラムを実行して、帳票読取装置100全体を制御する。
ROM102は、帳票読取装置100の起動時に実行されるBIOS(Basic Input / Output System)プログラムなどの所定のプログラムを記憶する。ROM102は、書き換え可能な不揮発性メモリであってもよい。
The
The
RAM103は、CPU101が実行するOSプログラムやアプリケーションプログラムの少なくとも一部を一時的に記憶する。また、RAM103は、CPU101の処理に用いられるデータの少なくとも一部を一時的に記憶する。
The
HDD104は、OSプログラムやアプリケーションプログラムを記憶する。また、HDD104は、CPU101の処理に用いられるデータを記憶する。なお、HDD104に代えて(または、HDD104と併せて)、SSD(Solid State Drive)など他の種類の不揮発性の記憶装置を用いてもよい。
The
グラフィックインタフェース105は、モニタ11に接続される。グラフィックインタフェース105は、CPU101からの命令に従って、画像をモニタ11に表示させる。
入力インタフェース106は、キーボード12やマウス13などの入力デバイスに接続される。入力インタフェース106は、入力デバイスから送られる入力信号をCPU101に出力する。
The
The
スキャナインタフェース107は、イメージスキャナ14に接続される。イメージスキャナ14は、帳票を撮像して帳票画像を生成する撮像装置である。スキャナインタフェース107は、イメージスキャナ14から取得した帳票画像をCPU101、RAM103およびHDD104などに出力する。
The
ディスクドライブ108は、記録媒体15に格納されたデータを読み取る読取装置である。記録媒体15には、例えば、帳票読取装置100に実行させるプログラムが記録されている。帳票読取装置100は、例えば、記録媒体15に記録されたプログラムを実行することで、後述するような機能を実現できる。すなわち、該プログラムはコンピュータ読み取り可能な記録媒体15に記録して配布可能である。
The
記録媒体15としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリを使用できる。磁気記録装置には、HDD、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、CD(Compact Disc)、CD−R(Recordable)/RW(ReWritable)、DVD(Digital Versatile Disc)、DVD−R/RW/RAMなどがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。半導体メモリには、USB(Universal Serial Bus)メモリなどのフラッシュメモリがある。 As the recording medium 15, for example, a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory can be used. Examples of the magnetic recording device include an HDD, a flexible disk (FD), and a magnetic tape. Optical disks include CD (Compact Disc), CD-R (Recordable) / RW (ReWritable), DVD (Digital Versatile Disc), DVD-R / RW / RAM, and the like. Magneto-optical recording media include MO (Magneto-Optical disk). Semiconductor memory includes flash memory such as USB (Universal Serial Bus) memory.
通信インタフェース109は、ネットワーク10に接続される。通信インタフェース109は、ネットワーク10を介してサーバ装置200とデータ通信を行える。
帳票読取装置100は、文字認識により読み取った各データ項目の文字列データをサーバ装置200に送信する。
The
The
なお、サーバ装置200も帳票読取装置100と同様のハードウェア構成により実現できる。
図4は、第2の実施の形態の改訂前の帳票の例を示す図である。帳票300は、改訂前の(既存の)帳票を例示している。帳票300は、例えば、規格などによってそのレイアウトが定められているものである。なお、規格などによりレイアウトが定められた帳票を制定帳票と呼ぶこともある。帳票300には、帳票ID(IDentifier)310および記入欄群320,330が印字されている。
The
FIG. 4 is a diagram illustrating an example of a form before revision according to the second embodiment. The
帳票ID310は、帳票の種別を識別するための識別情報である。帳票ID310として、“200100”が印字されている。帳票ID310の上4桁の数値“2001”は、帳票300が口座開設の申し込みを行ったり、自身の口座に入金する取引を行ったりするための帳票であることを示す。帳票ID310の下2桁の数値“00”は、帳票300が改訂されたものではないことを示す。ここで、以下では、帳票IDの下2桁の数値を、帳票IDの枝番と呼ぶことがある。
The
記入欄群320,330は、顧客に記入させる複数の記入欄を印字した領域である。ここで、記入欄とは、該記入欄の見出し部分(例えば、“おところ”や“おなまえ”といった文字列が予め印字される部分)と顧客が筆記具を用いて文字列を記入する部分とを含む欄である。
The
記入欄群320は、記入欄321,322,323,324,325,326,327,328,329を含む。記入欄321は、申込日(例えば、年月日)を記入させるための欄である。記入欄322は、金融機関の店舗を識別するための番号(店番)を記入させるための欄である。記入欄323は、口座番号を記入させるための欄である。記入欄324は、郵便番号および住所を記入させるための欄である。記入欄325は、口座名義人の氏名を記入させるための欄である。記入欄326は、取引の金額を記入させるための欄である。記入欄327は、金融機関が提供する金融商品の種類を選択させるための欄である。記入欄328は、利用する通帳の種類を選択させるための欄である。記入欄329は、利用するキャッシュカードの種類を選択させるための欄である。
The
記入欄群330は、記入欄331,332,333を含む。記入欄331は、口座名義人の電話番号を記入させるための欄である。記入欄332は、口座名義人の性別を選択させるための欄である。記入欄333は、口座名義人の生年月日を記入させるための欄である。
The
記入欄群320,330の各欄の枠線および帳票300上の一部箇所には所定の色が付される。この色は、帳票300のカラーイメージ(カラーの帳票画像)を取得後、該イメージに所定のドロップアウト処理を行うことで、該イメージからドロップアウト(消去)可能な色である。このような色を、ドロップアウト色と呼ぶことがある。
A predetermined color is given to a frame line of each column of the
図5は、第2の実施の形態の改訂後の帳票の例を示す図である。帳票300aは、帳票300に対する改訂後の帳票を例示している。帳票300aには、帳票ID310a、記入欄群320a,330aおよび領域識別情報340が印字されている。
FIG. 5 is a diagram illustrating an example of a revised form according to the second embodiment. The
帳票ID310aは、帳票の種別を識別するための識別情報である。帳票ID310aとして、“200101”が印字されている。帳票ID310aの上4桁の数値“2001”は、帳票300aが口座開設の申し込みを行ったり、自身の口座に入金する取引を行ったりするための帳票であることを示す。帳票ID310aの下2桁の数値“01”は、帳票300aが改訂後の版数“01”の帳票であることを示す。すなわち、該下2桁の数値が“00”以外のとき、該帳票は、改訂後のものであることを示し、該数値が改訂後の版数を示している。
The form ID 310a is identification information for identifying the type of form. “200101” is printed as the form ID 310a. The first four-digit numerical value “2001” of the form ID 310a indicates that the
記入欄群320a,330aは、顧客に記入させる複数の記入欄を印字した領域である。
記入欄群320aは、記入欄321,322,323,324,325,326,327a,328a,329aを含む。帳票300と比較すると、記入欄327a,328a,329aが相違する。
The
The entry column group 320a includes
記入欄327a,328a,329aは、記入欄327,328,329と同様の内容を記入させるための欄である。記入欄327a,328a,329aは、記入欄327,328,329に対して、新しい選択項目を追加している点が異なる。これにより、記入欄328a,329aは、その欄の占める領域が、図5の紙面に向かって下方に拡張されている。
The entry fields 327a, 328a, and 329a are fields for entering the same contents as the entry fields 327, 328, and 329. The entry fields 327a, 328a, and 329a differ from the entry fields 327, 328, and 329 in that new selection items are added. As a result, in the
記入欄群330aは、記入欄331a,332a,333aを含む。記入欄331a,332a,333aは、記入欄331,332,333と同様の内容を記入させるための欄である。帳票300と比較すると、記入欄328a,329aの占める領域が拡張したことで、記入欄331a,332a,333aは図5の紙面に向かって下方に移動している。
The
領域識別情報340は、記入欄群330aを囲う線であり、四角形の各辺を形成している。
記入欄群320a,330aの各欄の枠線および帳票300a上の一部箇所には、帳票300と同様にドロップアウト色が付される。領域識別情報340には、ドロップアウト色以外の色が付される。帳票読取装置100が領域識別情報340の検出処理を適切に行えるようにするためである(後述する)。
The
Similar to the
図6は、第2の実施の形態の帳票読取装置の機能構成を示すブロック図である。帳票読取装置100は、記憶部110、帳票ID読取部120、文字認識処理部130および領域特定部140を有する。これらの各機能は、例えばCPU101が所定のプログラムを実行することにより、帳票読取装置100上に実現される。これらの各機能の全部または一部を専用のハードウェアで実装してもよい。
FIG. 6 is a block diagram illustrating a functional configuration of the form reading apparatus according to the second embodiment. The
記憶部110は、帳票のレイアウトを定義したレイアウト定義テーブルを記憶する。
帳票ID読取部120は、イメージスキャナ14から受信したカラーの帳票画像に含まれる帳票IDを読み取る。このとき、帳票ID読取部120は、該帳票画像に対してドロップアウト処理を行う。ドロップアウト色を何れの色とするかは、例えば、帳票IDに対応付けて記憶部110に予め設定される。また、帳票IDは、例えば、帳票上の所定の位置に印字される。よって、帳票ID読取部120に、その位置(例えば、帳票画像上の座標値)を予め設定しておけば、帳票ID読取部120は、帳票画像中の該座標位置から帳票IDを読み取れる。あるいは、帳票ID読取部120は、帳票IDのフォーマット(例えば、数値や桁数など)に基づいて、該フォーマットに合致する文字列を帳票IDとして読み取ってもよい。帳票ID読取部120は、帳票IDの読み取り結果を文字認識処理部130に出力する。
The
The form
なお、帳票ID読取部120は、イメージスキャナ14から受信した帳票画像および該帳票画像にドロップアウト処理を行った後の画像情報をRAM103上の所定の領域に格納する。以降の処理において、文字認識処理部130および領域特定部140は、RAM103上の該領域を参照して帳票画像(ドロップアウト処理後の画像情報を含む)に対する各部の処理を実行する。
The form
文字認識処理部130は、帳票に対してレイアウト認識による文字認識処理を実行する。文字認識処理部130は、帳票IDが改訂された旨を示している場合、該帳票画像に対してレイアウト認識およびキーワード認識による文字認識を行う。文字認識処理部130は、文字認識の結果をモニタ11に表示させる。オペレータに結果の正誤確認などを促すためである。オペレータは、読取結果(データ項目および文字列データの内容)が適正であれば、キーボード12やマウス13を操作して、該読取結果のサーバ装置200への送信を文字認識処理部130に指示できる。文字認識処理部130は、この指示を受け付けると、読取結果をサーバ装置200に送信して、取引に関する処理の実行を要求する。
The character
文字認識処理部130は、レイアウト認識処理部131およびキーワード認識処理部132を有する。
レイアウト認識処理部131は、帳票IDと、記憶部110に記憶されたレイアウト定義テーブルと、に基づいて、帳票画像に対するレイアウト認識処理(レイアウト認識による文字認識)を行う。
The character
The layout
キーワード認識処理部132は、帳票IDと、記憶部110に記憶されたレイアウト定義テーブルと、に基づいて、帳票画像に対するキーワード認識処理(キーワード認識による文字認識処理)を行う。その際、キーワード認識処理部132は、帳票画像上の処理対象領域の特定を、領域特定部140に依頼する。
The keyword
領域特定部140は、キーワード認識処理部132の依頼に応じて、帳票画像から領域特定情報を読み取る。領域特定情報は、所定の太さおよび線の種別で帳票上に印字される。よって、領域特定部140にその太さおよび線の種別を予め設定しておけば、領域特定部140はその設定内容に基づいて、帳票画像から領域特定情報を読み取れる。
The
領域特定情報は、多角形の頂点などを示す情報としてもよい。その場合には、領域特定部140に、領域特定情報として認識すべき数値、文字、記号、図形およびこれらの組合せなどを予め設定しておけばよい。領域特定部140は、特定した領域を示す情報(例えば、該領域を示す座標値)をキーワード認識処理部132に出力する。
The area specifying information may be information indicating a vertex of the polygon. In that case, a numerical value, a character, a symbol, a figure, a combination thereof, and the like to be recognized as the area specifying information may be set in advance in the
図7は、第2の実施の形態のレイアウト定義テーブルの例を示す図である。レイアウト定義テーブル111は、記憶部110に記憶される。レイアウト定義テーブル111には、帳票ID、データ項目名、記入欄の座標、カテゴリおよび手活区分の項目を含む。各項目の横方向に並べられた情報同士が互いに関連付けられて、帳票上に記入される1つの内容を特定するための情報を示す。
FIG. 7 is a diagram illustrating an example of a layout definition table according to the second embodiment. The layout definition table 111 is stored in the
帳票IDの項目には、帳票ID(枝番を除く)が設定される。データ項目名の項目には、データ項目名が設定される。
記入欄の座標の項目には、記入欄の座標値が設定される。ここで、1つの記入欄の座標値は、図4で示した帳票300を例にとると、該記入欄の図4の紙面に向かって左上側の座標値と、該記入欄の同右下側の座標と、を指定することで示される。座標値は、帳票300の図4の紙面に向かって左上の頂点を原点として、同右向き方向をx座標の正方向、同下向き方向をy座標の正方向と定義するものとする。ただし、これとは異なる座標系で記入欄の位置を表してもよい。
A form ID (excluding branch numbers) is set in the form ID item. The data item name is set in the data item name item.
The coordinate value of the entry field is set in the coordinate field of the entry field. Here, taking the
カテゴリの項目には、記入欄に記入される文字列が数値、カタカナ、漢字および記号などのうち、何れの種類であるかが設定される。手活区分の項目には、該記入欄に記入される文字列が手書きのものであるか活字として印字されるものであるかを示す情報が設定される。 In the category item, it is set which type of character string to be entered in the entry field is numeric, katakana, kanji, or symbol. Information indicating whether the character string to be entered in the entry field is handwritten or printed as a type is set in the item of hand type.
例えば、レイアウト定義テーブル111には、帳票IDが“2001”、データ項目名が“申込日”、記入欄の座標が“S(35,20),E(60,30)”、カテゴリが“数値”、手活区分が“手書き”という情報が設定される。なお、記入欄の座標の設定につき“S”の文字は記入欄の左上側の座標値に付されるものである。同様に、“E”の文字は記入欄の右下側の座標値に付されるものである。 For example, in the layout definition table 111, the form ID is “2001”, the data item name is “application date”, the coordinates of the entry column are “S (35, 20), E (60, 30)”, and the category is “numeric value”. ", The information that the hand activity classification is" handwritten "is set. Note that the character “S” is assigned to the coordinate value on the upper left side of the entry field for setting the coordinates in the entry field. Similarly, the letter “E” is attached to the coordinate value on the lower right side of the entry field.
よって、このレコードは、帳票IDの上4桁が“2001”の帳票300の帳票画像につき、データ項目名“申込日”に対応する記入欄が帳票画像の(x,y)=(35,20)および(x,y)=(60,30)を対角にもつ長方形の領域であることを示す。また、この記入欄に記入される文字列が数値であり、該文字列が顧客により手書きで記入されるものであることを示す。更に、このレコードは、帳票IDの上4桁が“2001”の帳票300aの帳票画像についても、同様の記入欄が含まれ得ることを示している。
Therefore, in this record, the entry field corresponding to the data item name “application date” is the form image (x, y) = (35, 20) for the form image of the
次に、以上の構成の帳票読取装置100の処理手順を説明する。
図8は、第2の実施の形態の帳票読取処理を示すフローチャートである。以下、図8に示す処理をステップ番号に沿って説明する。
Next, a processing procedure of the
FIG. 8 is a flowchart illustrating a form reading process according to the second embodiment. In the following, the process illustrated in FIG. 8 will be described in order of step number.
(ステップS11)帳票ID読取部120は、イメージスキャナ14から受信したカラーの帳票画像をRAM103上の所定領域に格納する。帳票ID読取部120は、該帳票画像に対してドロップアウト処理を行い、ドロップアウト処理後の帳票画像をRAM103上の他の所定領域に格納する。
(Step S <b> 11) The form
(ステップS12)帳票ID読取部120は、ドロップアウト処理後の帳票画像から帳票IDを認識する。例えば、帳票ID読取部120は、該帳票画像の所定位置から帳票IDを読み取れる。帳票ID読取部120は、読み取った帳票IDを文字認識処理部130に出力する。
(Step S12) The form
(ステップS13)文字認識処理部130は、レイアウト認識処理部131に処理を委譲し、レイアウト認識処理を実行させる。レイアウト認識処理部131は、帳票ID読取部120から取得した帳票IDに基づいて、記憶部110に記憶されたレイアウト定義テーブル111を参照し、ドロップアウト処理後の帳票画像に対してレイアウト認識による文字認識処理を行う。
(Step S <b> 13) The character
(ステップS14)文字認識処理部130は、帳票ID読取部120から取得した帳票IDの下2桁が“01”以上であるか否かを判定する。“01”以上である場合(すなわち、改訂された帳票である場合)、処理をステップS15に進める。“01”以上でない場合(すなわち、改訂された帳票でない場合)、処理をステップS16に進める。
(Step S14) The character
(ステップS15)文字認識処理部130は、キーワード認識処理部132に処理を委譲し、キーワード認識処理を実行させる。該キーワード認識処理については後述する。
(ステップS16)文字認識処理部130は、帳票画像に対する文字認識結果を出力し、モニタ11に該結果を表示させる。
(Step S15) The character
(Step S16) The character
このように、文字認識処理部130は、ドロップアウト処理後の帳票画像に対してレイアウト認識処理を実行する。更に、文字認識処理部130は、帳票画像に含まれる帳票IDに応じて、キーワード認識処理の実行要否を判断する。文字認識処理部130は、改訂された帳票に対してキーワード認識処理を実行し、未改訂の帳票にはキーワード認識処理を実行しない。
As described above, the character
次に、ステップS11における、帳票300aに関する、ドロップアウト処理後の帳票画像を例示する。
図9は、第2の実施の形態のドロップアウト処理後の帳票画像の例を示す図である。帳票画像300bは、イメージスキャナ14が撮像した帳票画像に対してドロップアウト処理を行って得られた画像情報である。
Next, the form image after the dropout process related to the
FIG. 9 is a diagram illustrating an example of a form image after the dropout process according to the second embodiment. The form image 300b is image information obtained by performing dropout processing on the form image captured by the
帳票画像300bでは、ドロップアウト色で帳票300aに印字された枠線などが消去されている。顧客が枠線内に記入した文字列の色は、ドロップアウト色以外の色で記入されており、ドロップアウト対象にはならない(ドロップアウト処理によって消去されない)。領域識別情報340も同様である。
In the form image 300b, the frame line printed on the
レイアウト認識処理部131は、レイアウト定義テーブル111を参照して、帳票画像300b(帳票IDの上4桁が“2001”)内の所定の座標に記入された文字列を、口座番号や氏名などのデータ項目に対応付けて取得できる。例えば、データ項目名“口座番号”のデータを帳票画像300bから抽出する場合、レイアウト認識処理部131は次の処理を行う。
The layout
レイアウト認識処理部131は、レイアウト定義テーブル111に基づき、“口座番号”に対応する枠323aを特定する。具体的には、帳票画像300bの座標(x,y)=(140,20)を図9の紙面に向かって左上頂点とし、座標(x,y)=(160,30)を同右下頂点とする長方形が枠323aである。なお、図9において点線で図示した枠323aの枠線は、帳票画像300bには含まれない。レイアウト認識処理部131は、枠323a内に記入された文字画像を取得する。レイアウト認識処理部131は、該文字画像と予め記憶部110に格納された文字パターンとの照合を行い、“9999999”の文字列を抽出する。このときレイアウト定義テーブル111によれば、この位置のデータのカテゴリが数値である。よって、レイアウト認識処理部131は、数値の文字パターンと、文字画像との照合を行えばよい。
The layout
このようにして、レイアウト認識処理部131は、データ項目“口座番号”に対する文字列データ“9999999”を取得する。
また、領域識別情報340は、ドロップアウト色以外の色で印字されている。このため、領域識別情報340は、ドロップアウト対象にはならず、帳票画像300bに含まれる。帳票画像300bには、他の枠線はドロップアウト処理により消去されているので、領域特定部140は、領域識別情報340を容易に検出できる。
In this way, the layout
The
次に、図8のステップS15で説明したキーワード認識処理の手順を説明する。以下、RAM103上には次の情報が取得されているものとする。
(1)「帳票300aの帳票画像」
(2)「帳票300aの帳票画像」にドロップアウト処理を実行して得られた「帳票画像300b」
「帳票300aの帳票画像」という場合、帳票300aに含まれる全領域をカラーで取得した画像情報を示す。「帳票画像300b」という場合、「帳票300aの帳票画像」にドロップアウト処理を実行して得られた画像情報を示す。また、何れの帳票画像においても、領域識別情報340を同一の符号で指し示すものとする。
Next, the procedure of the keyword recognition process described in step S15 in FIG. 8 will be described. Hereinafter, it is assumed that the following information is acquired on the
(1) “Form image of
(2) “Form image 300b” obtained by executing dropout processing on “Form image of
The “form image of the
図10は、第2の実施の形態のキーワード認識処理を示すフローチャートである。以下、図10に示す処理をステップ番号に沿って説明する。
(ステップS21)キーワード認識処理部132は、レイアウト認識処理部131によるレイアウト認識処理の結果をRAM103またはHDD104上の所定領域に退避させる。
FIG. 10 is a flowchart illustrating keyword recognition processing according to the second embodiment. In the following, the process illustrated in FIG. 10 will be described in order of step number.
(Step S21) The keyword
(ステップS22)キーワード認識処理部132は、キーワード認識処理の対象領域の特定を領域特定部140に依頼する。領域特定部140は、帳票画像300bから領域識別情報340を検出する。例えば、領域特定部140には、領域識別情報340に関する情報(形状の種類、線の太さ、実線・破線といった線の種別など)が予め設定される。ここで、形状の種類とは、矩形の枠線である、楕円形の枠線である、多角形の頂点に付された記号(その記号がどのようなものかを含む)である、などの情報である。領域特定部140は、該情報に基づき、帳票画像300bから領域識別情報340を検出できる。領域特定部140は、特定した処理対象領域を示す領域情報をキーワード認識処理部132に出力する。領域情報は、例えば、処理対象領域の各頂点の座標値である。領域特定部140は、処理対象領域を複数検出した場合には、複数の領域情報をキーワード認識処理部132に出力する。
(Step S22) The keyword
(ステップS23)キーワード認識処理部132は、領域特定部140から取得した領域情報に基づき、そのうちの1つの未処理領域のカラーイメージを帳票300aの帳票画像から抽出する。例えば、キーワード認識処理部132は、領域識別情報340内の領域(処理対象領域)のカラーイメージを抽出する。
(Step S23) The keyword
(ステップS24)キーワード認識処理部132は、ステップS23でカラーイメージを取得した処理対象領域からキーワードを1つ抽出する。例えば、キーワード認識処理部132は、処理対象領域に含まれる枠線を検出して、該枠線で囲われる枠ごとにキーワードの抽出を試みる。例えば、キーワード認識処理部132は、記入欄331aに含まれるキーワード“電話番号”を抽出する。
(Step S24) The keyword
(ステップS25)キーワード認識処理部132は、帳票300aの帳票IDおよび記憶部110に記憶されたレイアウト定義テーブル111を参照して、該キーワードが帳票300aに含まれ得るデータ項目名に一致するか否か判定する。一致する場合、処理をステップS26に進める。一致しない場合、該キーワードを破棄して、処理をステップS29に進める。例えば、キーワード認識処理部132は、キーワード“電話番号”が、帳票300aの帳票ID“200101”の上4桁“2001”に対応付けられて、レイアウト定義テーブル111に設定されていることを検知する。この場合、該キーワード“電話番号“が帳票300aに含まれ得るデータ項目名に一致すると判定する。また、該キーワードが存在するセルが見出し部分のセルである。ここで、セルは、ドロップアウト色の枠線で囲われた1つの枠を示す。
(Step S25) The keyword
(ステップS26)キーワード認識処理部132は、該データ項目に対する記入欄の位置(データ部)を特定する。例えば、データ部の位置は、「キーワードが存在するセルの右側に隣接するセル」のようにキーワード認識処理部132に予め設定される。あるいは、キーワードや、帳票300a上の表構造に基づき、該キーワードに対応するデータ部を特定してもよい。キーワードとデータ部との対応付け方法としては、例えば、特開2010−3155号公報に記載された方法を用いることができる。
(Step S26) The keyword
(ステップS27)キーワード認識処理部132は、データ部の特徴を解析し、データ部のイメージに対して枠線やノイズなどを除去し、文字認識に適したイメージに加工する。
(Step S <b> 27) The keyword
(ステップS28)キーワード認識処理部132は、データ部に記入された文字画像を取得する。キーワード認識処理部132は、該文字画像と予め記憶部110に格納された文字パターンとの照合を行い、該データ部に記入された文字列データを取得する。例えば、キーワード認識処理部132は、データ項目“電話番号”に対して文字列データ“000−0000−0000”を取得する。
(Step S <b> 28) The keyword
(ステップS29)キーワード認識処理部132は、現在の処理対象領域内でキーワードを未抽出の箇所が存在するか否かを判定する。キーワード未抽出の箇所が存在する場合、処理をステップS24に進める。キーワード未抽出の箇所が存在しない場合、処理をステップS30に進める。
(Step S <b> 29) The keyword
(ステップS30)キーワード認識処理部132は、現在の処理対象領域以外にも、未処理の処理対象領域が存在するか否かを判定する。未処理の処理対象領域が存在する場合、処理をステップS23に進める。全ての処理対象領域につき処理済の場合、処理をステップS31に進める。
(Step S30) The keyword
(ステップS31)キーワード認識処理部132は、一時退避させたレイアウト認識処理の結果とキーワード認識の結果とをマージする。具体的には、レイアウト定義テーブル111に定義された帳票300aのデータ項目のうち、レイアウト認識処理では取得できなかったものを、キーワード認識処理で取得した内容で補完する。
(Step S31) The keyword
このようにして、キーワード認識処理部132は、帳票300aの変更された領域につき、キーワード認識による文字認識を行う。
図11は、第2の実施の形態のキーワード認識対象領域の例を示す図である。キーワード認識対象領域は、領域識別情報340の内側の領域である。該領域内には、キーワード351,352,353も示されている。
In this way, the keyword
FIG. 11 is a diagram illustrating an example of a keyword recognition target area according to the second embodiment. The keyword recognition target area is an area inside the
キーワード351は、文字列“電話番号”を示しており、記憶部110に記憶されたレイアウト定義テーブル111によれば、帳票300aの帳票画像内に含まれ得るデータ項目名“電話番号”に一致する。
The
キーワード352は、文字列“性別”を示しており、帳票300aの帳票画像内に含まれ得るデータ項目名“性別”に一致する。
キーワード353は、文字列“生年月日”を示しており、帳票300aの帳票画像内に含まれ得るデータ項目名“生年月日”に一致する。
The
The
キーワード認識処理部132は、キーワード351を検出すると、キーワード351が存在するセルの右側に隣接するセル351aをデータ部と特定する。そして、キーワード認識処理部132は、データ項目“電話番号”に対して文字列データ“000−0000−0000”を取得する。なお、キーワード351を含むセルおよびセル351aが図5で示した記入欄331aに対応する。
When the keyword
また、キーワード認識処理部132は、キーワード352を検出すると、キーワード352が存在するセルの右側に隣接するセル352aをデータ部と特定する。そして、キーワード認識処理部132は、データ項目“性別”に対して、“男”を選択していることを示す選択記号(チェックマーク)を取得する。このような選択記号も文字列データに含まれる。なお、キーワード352を含むセルおよびセル352aが図5で示した記入欄332aに対応する。
Further, when the keyword
更に、キーワード認識処理部132は、キーワード353を検出するとキーワード353が存在するセルの右側に隣接するセル353aをデータ部と特定する。そして、キーワード認識処理部132は、データ項目“生年月日”に対して、文字列データ“1985”年“11”月“15”日を取得する。なお、キーワード353を含むセルおよびセル353aが図5で示した記入欄333aに対応する。
Furthermore, when the keyword
なお、該領域内には、“男”、“女”、“年”、“月”、“日”などの他の文字も含まれている。しかし、これらは何れもレイアウト定義テーブル111内で帳票300a内のデータ項目名として定義されていない。よって、キーワード認識処理部132は、これら他の文字に関しては、データ項目名とはみなさない。
The area includes other characters such as “male”, “female”, “year”, “month”, and “day”. However, none of these are defined as data item names in the
図12は、第2の実施の形態の帳票IDの例を示す図である。帳票ID310aの印字方法は、上記の方法に限られない。例えば、次のように印字してもよい。
図12(A)では、帳票ID310bが示されている。帳票ID310bは、帳票ID310と帳票ID310の下側に印字された枝番311との組み合せにより、帳票300aが改訂後のものであることを示している。枝番311は、“01”などの数値により表されている。
FIG. 12 is a diagram illustrating an example of a form ID according to the second embodiment. The printing method of the form ID 310a is not limited to the above method. For example, you may print as follows.
In FIG. 12A, a
図12(B)では、帳票ID310cが示されている。帳票ID310cは、帳票ID310と、帳票ID310の位置から紙面に向かって右下側に印字された枝番311aとの組み合わせにより、帳票300aが改訂後のものであることを示している。枝番311aは、“01”などの数値により表されている。
In FIG. 12B, a
図12(A)(B)では、該帳票が改訂されていない場合には、枝番311,311aを“00”とするか、あるいは枝番311,311aを印字しないようにすることが考えられる。
In FIGS. 12A and 12B, when the form is not revised, it is conceivable that the
図12(C)では、帳票ID310dが示されている。帳票ID310dは、帳票ID310と、帳票ID310の位置から紙面に向かって右側に印字された枝番311bとの組み合わせにより、帳票300aが改訂後のものであることを示している。枝番311bは、“R”などの文字(または文字列)により表されている。
In FIG. 12C, a
図12(C)では、該帳票が改訂されていない場合には、枝番311bを他の文字(または文字列)とするか、あるいは枝番311bを印字しないようにすることが考えられる。
In FIG. 12C, when the form is not revised, it is conceivable that the
このように、帳票IDの表記方法には種々の方法を採れる。上記の例は、その一例であり、上記以外の位置、数値、記号および文字(または文字列)などで帳票IDを表記してもよい。何れの位置または数値などにより、帳票IDが表記されているかは、上述したように帳票ID読取部120に予め設定される。
As described above, various methods can be used for the form ID. The above example is one example, and the form ID may be expressed by a position, numerical value, symbol, character (or character string), etc. other than the above. Which position or numerical value indicates the form ID is preset in the form
以上で説明したように、第2の実施の形態の帳票読取装置100によれば、文字認識処理を効率的に行える。具体的には、改訂後の帳票300aにつき、キーワード認識処理を行う領域を領域識別情報340に基づいて特定する。帳票読取装置100は、該領域に対してキーワード認識処理を行い、それ以外の領域に対してはキーワード認識処理を行わない。すなわち、余計な領域に対してキーワード認識処理が行われるのを抑止でき、余分な処理時間がかからずに済む。
As described above, according to the
また、キーワード認識処理を行わない領域に対しては、既存のレイアウト定義テーブル111に基づくレイアウト認識処理により、文字認識できる。よって、レイアウト認識と併用する場合に特に有効である。具体的には、レイアウト認識処理は、既定位置の情報を読み取るため、キーワード認識処理に比べて、処理時間は一般的に短い。したがって、帳票読取装置100のように、キーワード認識処理の対象領域を絞り込むことで、レイアウト認識による処理効率の良さを享受しながら、帳票のレイアウトを柔軟に変更可能となる。
In addition, a region that is not subjected to keyword recognition processing can be recognized by layout recognition processing based on the existing layout definition table 111. Therefore, it is particularly effective when used in combination with layout recognition. Specifically, since the layout recognition process reads information at a predetermined position, the processing time is generally shorter than the keyword recognition process. Therefore, by narrowing down the target area for keyword recognition processing as in the
ここで、金融機関では、キャンペーン時などの短期間の間だけ一時的に、所定の帳票の一部箇所のレイアウトの変更を行いたい場合がある。具体的には、キャンペーンのお知らせ欄を広く確保して既存レイアウトの配置に影響を与える場合や、キャンペーン時のみ顧客へ記入を要求する記入欄を設ける場合などが考えられる。その場合、恒久的なレイアウト変更を行うケースに比べて、システム変更の作業負担や文字認識の処理効率に与える影響などをできるだけ抑えて、レイアウト変更に容易に対応できることが特に望まれる。帳票読取装置100によれば、上述のように改訂の対象となった一部箇所に絞ってキーワード認識処理が行われる。これにより、レイアウト定義の変更作業や文字認識の処理効率に与える影響を抑えた文字認識処理を実現できる。
Here, there is a case where a financial institution wants to change the layout of a part of a predetermined form temporarily only for a short period such as a campaign. Specifically, there may be a case where a wide campaign notification column is secured to affect the layout of an existing layout, or a case where a column for requesting a customer to fill in is provided only during the campaign. In that case, it is particularly desirable that the layout change can be easily handled by suppressing the influence of the system change on the work load and the processing efficiency of character recognition as much as possible as compared to the case of performing a permanent layout change. According to the
[第3の実施の形態]
以下、第3の実施の形態を説明する。前述の第2の実施の形態との相違点を主に説明し、同様の事項の説明を省略する。
[Third Embodiment]
Hereinafter, a third embodiment will be described. Differences from the second embodiment will be mainly described, and description of similar matters will be omitted.
第2の実施の形態では、領域識別情報が帳票上に複数存在してもよいことを説明した。この場合、複数の領域識別情報で示される複数の処理対象領域内に、同一のデータ項目名(キーワード)が含まれることがある。このとき、同一のデータ項目名であっても、同一の用途であるとは限らない。例えば、1つの帳票で複数の取引に対応した帳票が利用されることがある。例えば、ある口座からの現金の出金と該口座から他口座への振替との2つの取引に対応可能な帳票が考えられる。より具体的には、(1)第1の口座番号で示される第1の口座からの現金の出金、および(2)該第1の口座から第2の口座番号で示される第2の口座への振替である。 In the second embodiment, it has been described that a plurality of area identification information may exist on a form. In this case, the same data item name (keyword) may be included in a plurality of processing target areas indicated by a plurality of area identification information. At this time, even the same data item name does not necessarily have the same use. For example, a form corresponding to a plurality of transactions may be used in one form. For example, a form that can handle two transactions, that is, cash withdrawal from an account and transfer from the account to another account, can be considered. More specifically, (1) withdrawing cash from a first account indicated by a first account number, and (2) a second account indicated by a second account number from the first account. It is a transfer to.
その場合、第1の口座番号と第2の口座番号が該帳票に記入され得るが、これらをキーワード認識で文字認識すると、何れの口座番号が出金元口座番号で、何れの口座番号が振替先口座番号であるか区別するのが困難な場合がある。具体的には、帳票上に印字されているキーワードが何れも“口座番号”である場合である。この場合、キーワードとレイアウト定義情報内のデータ項目名とを単に照合したとしても、各“口座番号”の用途を区別するのが困難となる。 In that case, the first account number and the second account number can be entered in the form, but when these characters are recognized by keyword recognition, which account number is the withdrawal source account number and which account number is transferred It may be difficult to distinguish whether it is a previous account number. Specifically, this is a case where all the keywords printed on the form are “account numbers”. In this case, even if the keyword is simply compared with the data item name in the layout definition information, it is difficult to distinguish the usage of each “account number”.
そこで、第3の実施の形態では、複数の処理対象領域内に同一のデータ項目名が含まれていたとしても、各データの用途を区別して文字列データを取得する機能を提供する。
ここで、第3の実施の形態の情報処理システムの構成は、図2で説明した第2の実施の形態の情報処理システムの構成と同様である。また、第3の実施の形態の帳票読取装置のハードウェアおよび機能構成は、図3,6で説明した第2の実施の形態の帳票読取装置100のハードウェアおよび機能構成と同様である。以下、第3の実施の形態の帳票読取装置も帳票読取装置100と同一の符号・名称を用いて各構成を指し示すものとする。
Therefore, in the third embodiment, even if the same data item name is included in a plurality of processing target areas, a function of acquiring character string data by distinguishing the use of each data is provided.
Here, the configuration of the information processing system of the third embodiment is the same as the configuration of the information processing system of the second embodiment described in FIG. Further, the hardware and functional configuration of the form reading apparatus according to the third embodiment is the same as the hardware and functional configuration of the
図13は、第3の実施の形態の改訂後の帳票の例を示す図である。帳票400は、領域識別情報で示されるキーワード認識処理の対象領域が複数存在する場合を例示している。帳票400には、帳票ID410、記入欄群420、記入欄群430、領域識別情報441,442,443,444,460および記入欄群450が印字されている。
FIG. 13 is a diagram illustrating an example of a revised form according to the third embodiment. The
帳票ID410は、帳票の種別を識別するための識別情報である。帳票ID410として、“300101”が印字されている。帳票ID410の上4ケタの数値“3001”は、帳票400が現金の出金および口座間の振替の取引を行うための帳票であることを示す。帳票ID410の下2桁の数値“01”は、帳票400が改訂後の版数“01”の帳票であることを示す。
The
記入欄群420,430,450は、顧客に入力させる複数の記入欄を印字した領域である。
記入欄群420は、記入欄421,422,423を含む。記入欄421は、申込日を記入させるための欄である。記入欄422は、口座名義人の氏名を記入させるための欄である。記入欄423は、届け印を押印させるための欄である。
The
The
記入欄群430には、出金元口座の情報を記入するための記入欄が設けられている。記入欄群430は、記入欄431,432,433,434を含む。記入欄431は、店番を記入させるための欄である。記入欄432は、出金元口座の口座番号を記入させるための欄である。記入欄433は、出金元口座の預金科目を選択させるための欄である。記入欄434は、出金する金額を記入させるための欄である。
The
領域識別情報441,442,443,444は、記入欄群430を囲うカギ型の領域識別情報である。4つの領域識別情報441,442,443,444が1セットでキーワード認識のための1つの処理対象領域を示している。具体的には、領域識別情報441,442,443,444を頂点とした四角形で囲われる領域内が、該処理対象領域である。
The
記入欄群450には、振替先口座の情報を記入するための記入欄が設けられている。記入欄群450は、記入欄451,452,453,454を含む。記入欄451は、振替先口座の預金科目を選択させるための欄である。記入欄452は、店番を記入させるための欄である。記入欄453は、振替先口座の口座番号を記入させるための欄である。記入欄454は、振替先口座の口座名義人を記入させるための欄である。
The
領域識別情報460は、記入欄群450を囲う線であり、四角形の各辺を形成している。
記入欄群420,430,450の各欄の枠線および帳票400上の一部箇所には、ドロップアウト色が付される。領域識別情報441,442,443,444,460には、ドロップアウト色以外の色が付される。
The
Dropout colors are assigned to the frame lines of the fields of the
帳票400によれば、記入欄群420,430のみに記入することで、記入欄群430で指定した口座から現金を出金できる。更に、記入欄群450に振替先の口座を指定することで、記入欄群430で指定した口座から、記入欄群450で指定した口座への預金の振替を行える。
According to the
このように、帳票400には、出金元口座用の記入欄群430に対しては、カギ型の領域識別情報441,442,443,444が予め印字される。また、帳票400には、振替先口座用の記入欄群450には、(カギ型とは異なる形状の)四角形の各辺を形成する線である領域識別情報460が予め印字される。
In this way, key-type
次に、以上の構成の帳票読取装置100の処理手順を説明する。なお、第3の実施の形態の帳票読取処理の手順は、図8で説明した第2の実施の形態の帳票読取処理の手順と同様である。続いて、該帳票読取処理のステップS15で説明したキーワード認識処理の手順を説明する。以下、RAM103上には次の情報が取得されているものとする。
Next, a processing procedure of the
(1)「帳票400の帳票画像」
(2)「帳票400の帳票画像」にドロップアウト処理を実行して得られた「ドロップアウト処理後の帳票画像」
何れの帳票画像においても、領域識別情報441,442,443,444,460を同一の符号で指し示すものとする。
(1) “Form image of
(2) “Form image after dropout processing” obtained by executing dropout processing on “form image of
In any form image, the
図14は、第3の実施の形態のキーワード認識処理を示すフローチャートである。以下、図14に示す処理をステップ番号に沿って説明する。
(ステップS41)キーワード認識処理部132は、レイアウト認識処理部131によるレイアウト認識処理の結果をRAM103またはHDD104上の所定領域に退避させる。
FIG. 14 is a flowchart illustrating keyword recognition processing according to the third embodiment. In the following, the process illustrated in FIG. 14 will be described in order of step number.
(Step S41) The keyword
(ステップS42)キーワード認識処理部132は、キーワード認識処理の対象領域の特定を領域特定部140に依頼する。領域特定部140は、ドロップアウト処理後の帳票画像から領域識別情報441,442,443,444,460を検出する。例えば、領域特定部140には、領域識別情報441,442,443,444,460に関する情報(形状の種類、線の太さ、実線・破線といった線の種別など)が予め設定される。領域特定部140は、該情報に基づき、ドロップアウト処理後の帳票画像から領域識別情報441,442,443,444,460を検出できる。領域特定部140は、特定した処理対象領域を示す領域情報をキーワード認識処理部132に出力する。領域情報は、例えば、処理対象領域の各頂点の座標値である。また、領域特定部140は、領域情報と共に、検出した領域識別情報の種類(矩形かカギ型かなど)をキーワード認識処理部132に出力する。
(Step S42) The keyword
(ステップS43)キーワード認識処理部132は、領域特定部140から取得した領域情報に基づき、そのうちの1つの未処理領域のカラーイメージを帳票400の帳票画像から抽出する。例えば、キーワード認識処理部132は、領域識別情報441,442,443,444で囲われる領域内のカラーイメージを抽出する。
(Step S <b> 43) The keyword
(ステップS44)キーワード認識処理部132は、ステップS43でカラーイメージを取得した処理対象領域からキーワードを1つ抽出する。例えば、キーワード認識処理部132は、処理対象領域に含まれる枠線を検出して、該枠線で囲われる枠ごとにキーワードの抽出を試みる。例えば、キーワード認識処理部132は、記入欄432に対して、キーワード“口座番号”を抽出する。
(Step S44) The keyword
(ステップS45)キーワード認識処理部132は、帳票400の帳票IDおよび記憶部110に記憶されたレイアウト定義テーブル111を参照して、該キーワードが帳票400に含まれ得るデータ項目名に一致するか否か判定する。一致する場合、処理をステップS46に進める。一致しない場合、該キーワードを破棄して、処理をステップS52に進める。例えば、キーワード“口座番号”は、帳票400に含まれ得るデータ項目名に一致するものとする。
(Step S 45) The keyword
(ステップS46)キーワード認識処理部132は、該データ項目に対する記入欄の位置(データ部)を特定する。例えば、データ部の位置は、「キーワードが存在するセルの右側に隣接するセル」のようにキーワード認識処理部132に予め設定される。あるいは、キーワードや、帳票400上の表構造に基づき、該キーワードに対応するデータ部を特定してもよい。
(Step S46) The keyword
(ステップS47)キーワード認識処理部132は、データ部の特徴を解析し、データ部のイメージに対して枠線やノイズなどを除去し、文字認識に適したイメージに加工する。
(Step S <b> 47) The keyword
(ステップS48)キーワード認識処理部132は、データ部に記入された文字画像を取得する。キーワード認識処理部132は、該文字画像と予め記憶部110に格納された文字パターンとの照合を行い、該データ部に記入された文字列データを取得する。例えば、キーワード認識処理部132は、キーワード“口座番号”に対して、文字列データ“9999999”を取得する。
(Step S48) The keyword
(ステップS49)キーワード認識処理部132は、現在の処理対象領域に対応する領域識別情報の種類を判定する。該領域識別情報の形状の種類が、カギ型の場合、処理をステップS50に進める。該領域識別情報の形状の種類が矩形の場合、処理をステップS51に進める。例えば、領域識別情報441,442,443,444で囲われた領域であれば、領域識別情報の種類は、「カギ型」となる。
(Step S49) The keyword
(ステップS50)キーワード認識処理部132は、ステップS48で取得した文字列データを出金元のデータとして取得する。これにより、例えば、領域識別情報441,442,443,444で囲われた処理対象領域から取得した、“口座番号”“9999999”を出金元口座の口座番号として扱える。そして、処理をステップS52に進める。
(Step S50) The keyword
(ステップS51)キーワード認識処理部132は、ステップS48で取得した文字列データを振替先のデータとして取得する。これにより、例えば、領域識別情報460で囲われた処理対象領域から取得した“口座番号”“8888888”を振替先口座の口座番号として扱える。そして、処理をステップS52に進める。
(Step S51) The keyword
(ステップS52)キーワード認識処理部132は、現在の処理対象領域内でキーワードを未抽出の箇所が存在するか否かを判定する。キーワード未抽出の箇所が存在する場合、処理をステップS44に進める。キーワード未抽出の箇所が存在しない場合、処理をステップS53に進める。
(Step S <b> 52) The keyword
(ステップS53)キーワード認識処理部132は、現在の処理対象領域以外にも、未処理の処理対象領域が存在するか否かを判定する。未処理の処理対象領域が存在する場合、処理をステップS43に進める。全ての処理対象領域につき処理済の場合、処理をステップS54に進める。
(Step S53) The keyword
(ステップS54)キーワード認識処理部132は、一時退避させたレイアウト認識処理の結果とキーワード認識処理の結果とをマージする。具体的には、レイアウト定義テーブル111に定義された帳票400のデータ項目のうち、レイアウト認識処理では取得できなかったものを、キーワード認識処理で取得した内容で補完する。
(Step S54) The keyword
このように、キーワード認識処理部132は、領域識別情報の種類に応じて、認識した文字列データを区別する。何れの領域識別情報が、何れの取引に対応するかは、キーワード認識処理部132に予め設定される。ステップS49〜S51で例示した領域識別情報の種類と取引(データの用途)との対応付けは、一例であり、他にも種々の対応付けが考えられる。例えば、領域識別情報を区別する方法としては、次の内容が考えられる。
In this manner, the keyword
(A1)領域識別情報の線の種別(点線・破線・一点鎖線など)。
(A2)領域識別情報の形状(矩形・楕円形など)。
(A3)領域識別情報の線の太さ(太い・細いなど)。
(A1) Line type of area identification information (dotted line, broken line, one-dot chain line, etc.).
(A2) The shape of the area identification information (rectangle, ellipse, etc.).
(A3) Line thickness of area identification information (thick, thin, etc.).
(A4)領域識別情報の色(濃い・薄いなど)。
(A5)処理対象領域の頂点に配置させる領域識別情報の形状(カギ型など)。
上記(A1)〜(A5)の何れか1つに基づいて領域識別情報を区別してもよいし、(A1)〜(A5)を組み合わせて区別してもよい。更に、区別した各領域識別情報を以下に示す何れかの用途に対応付けることが考えられる。
(A4) Color of area identification information (dark, light, etc.).
(A5) The shape of the region identification information to be placed at the vertex of the processing target region (such as a key shape).
The area identification information may be distinguished based on any one of the above (A1) to (A5), or may be distinguished by combining (A1) to (A5). Further, it is conceivable that each identified area identification information is associated with one of the following uses.
(B1)現金や振替による入金をする場合の入金先口座に関する情報。
(B2)現金や振替による出金をする場合の出金元口座に関する情報。
キーワード認識処理部132は、領域識別情報を区別することで、文字列データが何れの取引に用いられるものであるか(すなわち、文字列データの用途)を区別できる。上記用途以外の用途に対応付けてもよい。
(B1) Information related to the deposit account when depositing by cash or transfer.
(B2) Information on the withdrawal source account when withdrawing money or transferring money.
The keyword
このようにして、第3の実施の形態の帳票読取装置100は、複数の取引に対応可能な帳票において、複数の処理対象領域内に同一のデータ項目名が含まれても、各データ項目の用途を区別して文字列データを取得できる。
In this way, the
これにより、レイアウト変更のあった帳票に対する文字認識処理を一層効率的に行うことが可能となる。
[第4の実施の形態]
以下、第4の実施の形態を説明する。前述の第2,第3の実施の形態との相違点を主に説明し、同様の事項の説明を省略する。
This makes it possible to more efficiently perform character recognition processing for a form whose layout has been changed.
[Fourth Embodiment]
Hereinafter, a fourth embodiment will be described. Differences from the second and third embodiments will be mainly described, and description of similar matters will be omitted.
第2,第3の実施の形態では、レイアウト認識処理を行った後に、キーワード認識処理の要否を判定するものとした。一方、キーワード認識処理の対象となる領域に対しては、レイアウト認識処理を行わなくてもよい。このようにすれば、処理効率の一層の効率化を図れる。そこで、第4の実施の形態では、キーワード認識処理の対象となる領域に対して、レイアウト認識処理を抑止する機能を提供する。 In the second and third embodiments, the necessity of the keyword recognition process is determined after the layout recognition process. On the other hand, the layout recognition process does not have to be performed on the area that is the target of the keyword recognition process. In this way, the processing efficiency can be further improved. Therefore, in the fourth embodiment, a function of suppressing the layout recognition process is provided for the area that is the target of the keyword recognition process.
ここで、第4の実施の形態の情報処理システムの構成は、図2で説明した第2の実施の形態の情報処理システムの構成と同様である。また、第4の実施の形態の帳票読取装置のハードウェアおよび機能構成は、図3,6で説明した第2の実施の形態の帳票読取装置100のハードウェアおよび機能構成と同様である。以下、第4の実施の形態の帳票読取装置も帳票読取装置100と同一の符号・名称を用いて各構成を指し示すものとする。
Here, the configuration of the information processing system of the fourth embodiment is the same as the configuration of the information processing system of the second embodiment described in FIG. The hardware and functional configuration of the form reading apparatus according to the fourth embodiment is the same as the hardware and functional configuration of the
図15は、第4の実施の形態の改訂前の帳票の例を示す図である。帳票500は、改訂前の(既存の)帳票を例示している。帳票500には、帳票ID510および記入欄群520,530が印字されている。
FIG. 15 is a diagram illustrating an example of a form before revision according to the fourth embodiment. A
帳票ID510は、帳票の種別を識別するための識別情報である。帳票ID510として、“100100”が印字されている。帳票ID510の上4桁の数値“1001”は、帳票500が口座に対して現金を入金する取引を行うための帳票であることを示す。帳票ID510の下2桁の数値“00”は、帳票500が改訂されたものではないことを示す。
The
記入欄群520は、顧客に記入させる複数の記入欄を印字した領域である。記入欄群520は、記入欄521,522,523,524,525,526を含む。記入欄521は、申込日を記入させるための欄である。記入欄522は、口座名義人の氏名を記入させるための欄である。記入欄523は、店番を記入させるための欄である。記入欄524は、口座番号を記入させるための欄である。記入欄525は、入金先口座の預金科目を選択させるための欄である。記入欄526は、入金する金額を記入させるための欄である。
The
記入欄群530は、金融機関の職員が業務に用いる情報を記入する欄である。記入欄群530は、レイアウト認識処理の非対象領域である。
記入欄群520,530の各欄の枠線および帳票500上の一部箇所にはドロップアウト色が付される。
The
Drop-out colors are assigned to the frame lines of each column of the
図16は、第4の実施の形態の改訂後の帳票の例を示す図である。帳票500aは、帳票500に対する改訂後の帳票を例示している。帳票500aには、帳票ID510a、記入欄群520a,530a、通知欄540および領域識別情報550が印字されている。
FIG. 16 is a diagram illustrating an example of a revised form according to the fourth embodiment. The
帳票ID510aは、帳票の種別を識別するための識別情報である。帳票ID510aとして、“100101”が印字されている。帳票ID510aの上4桁の数値“1001”は、帳票500aが口座に対して現金を入金する取引を行うための帳票であることを示す。帳票ID510aの下2桁の数値“01”は、帳票500aが改訂後の版数“01”であることを示す。
The
記入欄群520aは、顧客に入力させる複数の記入欄を印字した領域である。記入欄群520aは、記入欄521a,522a,523a,524a,525a,526aを含む。記入欄521aは、申込日を記入させるための欄である。記入欄522aは、口座名義人の氏名を記入させるための欄である。記入欄523aは、店番を記入させるための欄である。記入欄524aは、入金先口座の口座番号を記入させるための欄である。記入欄525aは、入金先口座の預金科目を選択させるための欄である。記入欄526aは、入金する金額を記入させるための欄である。
The
記入欄群530aは、金融機関の職員が業務に用いる情報を記入する欄である。
通知欄540は、顧客に通知したいメッセージが印字される領域である。
記入欄群530aおよび通知欄540は、レイアウト認識処理の非対象領域である。
The entry column group 530a is a column for entering information used by the financial institution staff for business.
The
The entry column group 530a and the
記入欄群520a,530a,通知欄540の各欄の枠線および帳票500a上の一部箇所には、ドロップアウト色が付される。領域識別情報550には、ドロップアウト色以外の色が付される。
Dropout colors are given to the frame lines of the fields of the
次に、以上の構成の帳票読取装置100の処理手順を説明する。
図17は、第4の実施の形態の帳票読取処理を示すフローチャートである。以下、図17に示す処理をステップ番号に沿って説明する。
Next, a processing procedure of the
FIG. 17 is a flowchart illustrating a form reading process according to the fourth embodiment. In the following, the process illustrated in FIG. 17 will be described in order of step number.
(ステップS61)帳票ID読取部120は、イメージスキャナ14から受信した帳票画像をRAM103上の所定領域に格納する。帳票ID読取部120は、該帳票画像に対してドロップアウト処理を行い、ドロップアウト処理後の帳票画像をRAM103上の他の所定領域に格納する。
(Step S 61) The form
(ステップS62)帳票ID読取部120は、ドロップアウト処理後の帳票画像から帳票IDを認識する。帳票ID読取部120は、読み取った帳票IDを文字認識処理部130に出力する。
(Step S62) The form
(ステップS63)文字認識処理部130は、帳票ID読取部120から取得した帳票IDの下2桁が“01”以上であるか否かを判定する。“01”以上である場合(すなわち、改訂された帳票である場合)、処理をステップS65に進める。“01”以上でない場合(すなわち、改訂された帳票でない場合)、処理をステップS64に進める。
(Step S63) The character
(ステップS64)文字認識処理部130は、レイアウト認識処理部131に処理を委譲し、レイアウト認識処理を実行させる。レイアウト認識処理部131は、帳票ID読取部120から取得した帳票IDに基づいて、記憶部110に記憶されたレイアウト定義テーブル111を参照し、ドロップアウト処理後の帳票画像に対してレイアウト認識による文字認識処理を行う。
(Step S <b> 64) The character
(ステップS65)文字認識処理部130は、キーワード認識処理部132に処理を委譲し、キーワード認識処理を実行させる。該キーワード認識処理については後述する。
(ステップS66)文字認識処理部130は、帳票画像に対する文字認識結果を出力し、モニタ11に該結果を表示させる。
(Step S <b> 65) The character
(Step S66) The character
このように、文字認識処理部130は、レイアウト認識を行う前に帳票の改訂の有無を判断する。そして、ステップS65におけるキーワード認識処理を次のように行う。
なお、以下、RAM103上には次の情報が取得されているものとする。
As described above, the character
Hereinafter, it is assumed that the following information is acquired on the
(1)「帳票500aの帳票画像」
(2)「帳票500aの帳票画像」にドロップアウト処理を実行して得られた「ドロップアウト処理後の帳票画像」
何れの帳票画像においても、領域識別情報550を同一の符号で指し示すものとする。
(1) “Form image of
(2) “Form image after dropout processing” obtained by executing dropout processing on “form image of
In any form image, the
図18は、第4の実施の形態のキーワード認識処理を示すフローチャートである。以下、図18に示す処理をステップ番号に沿って説明する。
(ステップS71)キーワード認識処理部132は、キーワード認識処理の対象領域の特定を領域特定部140に依頼する。領域特定部140は、ドロップアウト処理後の帳票画像から領域識別情報550を検出する。例えば、領域特定部140には、領域識別情報550に関する情報(形状の種類、線の太さ、実線・破線といった線の種別など)が予め設定される。領域特定部140は、該情報に基づき、ドロップアウト処理後の帳票画像から領域識別情報550を検出できる。領域特定部140は、特定した処理対象領域を示す領域情報をキーワード認識処理部132に出力する。領域情報は、例えば、処理対象領域の各頂点の座標値である。
FIG. 18 is a flowchart illustrating keyword recognition processing according to the fourth embodiment. In the following, the process illustrated in FIG. 18 will be described in order of step number.
(Step S71) The keyword
(ステップS72)キーワード認識処理部132は、領域特定部140から取得した領域情報と、記憶部110に記憶されたレイアウト定義テーブル111と、を参照して、レイアウト認識の対象領域が存在するか否かを判定する。存在する場合、処理をステップS73に進める。存在しない場合、処理をステップS75に進める。ここで、レイアウト認識の対象領域が存在するか否かは、例えば次のようにして判定できる。まず、キーワード認識処理部132は、領域情報に基づいて、キーワード認識の対象となっている領域を特定する。次に、キーワード認識処理部132は、レイアウト定義テーブル111に基づいて、帳票500のレイアウト認識の対象領域を特定する。そして、キーワード認識処理部132は、キーワード認識の対象領域とレイアウト認識の対象領域とを重ね合わせて、レイアウト認識の対象領域がキーワード認識の対象領域からはみ出すか否かを判断する。はみ出せば、レイアウト認識の対象領域が存在すると判断できる。はみ出さなければ、レイアウト認識の対象領域がキーワード認識の対象領域に包含されるので、レイアウト認識の対象領域が存在しないと判断できる。
(Step S <b> 72) The keyword
(ステップS73)キーワード認識処理部132は、はみ出した領域を示す情報(例えば、該領域の頂点の座標値)をレイアウト認識処理部131に出力し、レイアウト認識処理を実行させる。レイアウト認識処理部131は、レイアウト定義テーブル111を参照して、該領域に含まれる記入欄につきレイアウト認識処理を実行し、キーワード認識処理部132にその結果を出力する。
(Step S73) The keyword
(ステップS74)キーワード認識処理部132は、レイアウト認識処理部131によるレイアウト認識の処理結果をRAM103またはHDD104上の所定領域に退避させる。
(Step S <b> 74) The keyword
(ステップS75)キーワード認識処理部132は、領域特定部140から取得した領域情報に基づき、そのうちの1つの未処理領域のカラーイメージを帳票500aの帳票画像から抽出する。
(Step S75) The keyword
(ステップS76)キーワード認識処理部132は、ステップS75でカラーイメージを取得した処理対象領域からキーワードを1つ抽出する。例えば、キーワード認識処理部132は、処理対象領域に含まれる枠線を検出して、該枠線で囲われる枠ごとにキーワードの抽出を試みる。
(Step S76) The keyword
(ステップS77)キーワード認識処理部132は、帳票500aの帳票IDおよびレイアウト定義テーブル111を参照して、該キーワードが帳票500aに含まれ得るデータ項目名に一致するか否か判定する。一致する場合、処理をステップS78に進める。一致しない場合、処理をステップS81に進める。
(Step S77) The keyword
(ステップS78)キーワード認識処理部132は、該データ項目に対する記入欄の位置(データ部)を特定する。例えば、データ部の位置は、「キーワードが存在するセルの右側に隣接するセル」のようにキーワード認識処理部132に予め設定される。あるいは、キーワードや、帳票500a上の表構造に基づき、該キーワードに対応するデータ部を特定してもよい。
(Step S78) The keyword
(ステップS79)キーワード認識処理部132は、データ部の特徴を解析し、データ部のイメージに対して枠線やノイズなどを除去し、文字認識に適したイメージに加工する。
(Step S79) The keyword
(ステップS80)キーワード認識処理部132は、データ部に記入された文字画像を取得する。キーワード認識処理部132は、該文字画像と予め記憶部110に格納された文字パターンとの照合を行い、該データ部に記入された文字列データを取得する。
(Step S80) The keyword
(ステップS81)キーワード認識処理部132は、現在の処理対象領域内でキーワードを未抽出の箇所が存在するか否かを判定する。キーワード未抽出の箇所が存在する場合、処理をステップS76に進める。キーワード未抽出の箇所が存在しない場合、処理をステップS82に進める。
(Step S <b> 81) The keyword
(ステップS82)キーワード認識処理部132は、現在の処理対象領域以外にも、未処理の処理対象領域が存在するか否かを判定する。未処理の処理対象領域が存在する場合、処理をステップS75に進める。全ての処理対象領域につき処理済の場合、処理をステップS83に進める。
(Step S82) The keyword
(ステップS83)キーワード認識処理部132は、一時退避させたレイアウト認識処理の結果とキーワード認識処理の結果とをマージする。具体的には、レイアウト定義テーブル111に定義された帳票500aのデータ項目のうち、レイアウト認識処理では取得できなかったものを、キーワード認識処理で取得した内容で補完する。
(Step S83) The keyword
このように、レイアウト認識処理部131は、キーワード認識処理の対象外の領域に対して、レイアウト認識による文字認識を実行する。
図19は、第4の実施の形態の各文字認識の対象領域の第1の例を示す図である。図19(A)は、改訂前の帳票500を示している。図19(B)は、改訂後の帳票500aを示している。
In this way, the layout
FIG. 19 is a diagram illustrating a first example of target areas for character recognition according to the fourth embodiment. FIG. 19A shows a
帳票500には、レイアウト認識対象領域560が含まれる。レイアウト認識対象領域560は、記入欄群520が占める領域と同一である。
帳票500aには、キーワード認識対象領域550aが含まれる。キーワード認識対象領域550aは、領域識別情報550で囲われる領域と同一である。ここで、帳票500aには、帳票500におけるレイアウト認識対象領域560の枠線も図示されている。帳票500aでは、キーワード認識対象領域550aにレイアウト認識対象領域560が包含されている。したがって、帳票読取装置100は、帳票500aの帳票画像に対してレイアウト認識処理を実行しない。帳票読取装置100は、帳票500aの帳票画像のうち、キーワード認識対象領域550aに対してキーワード認識処理を実行する。
The
The
図20は、第4の実施の形態の各文字認識の対象領域の第2の例を示す図である。図20(A)は、改訂前の帳票600を示している。図20(B)は、帳票600に対する改訂後の帳票600aを示している。
FIG. 20 is a diagram illustrating a second example of target areas for character recognition according to the fourth embodiment. FIG. 20A shows a
帳票600には、レイアウト認識対象領域610が含まれる。
帳票600aには、レイアウト認識対象領域610aおよびキーワード認識対象領域620が含まれる。ここで、レイアウト認識対象領域610aは、帳票600,600aを重ねたときに、レイアウト認識対象領域610から、キーワード認識対象領域620と重なる領域を除いた領域に等しい。帳票読取装置100は、レイアウト認識対象領域610のうち、キーワード認識対象領域620からはみ出るレイアウト認識対象領域610aに対してレイアウト認識を実行する。更に、帳票読取装置100は、キーワード認識対象領域620に対してキーワード認識を実行する。
The
The
このように、第4の実施の形態の帳票読取装置100によれば、キーワード認識の処理対象領域と被らない領域に対してレイアウト認識を行う。これにより、文字認識を一層効率的に行える。
As described above, according to the
なお、改訂後にキーワード認識対象領域が複数存在する場合も考えられる。この場合、該複数のキーワード認識対象領域と、改訂前のレイアウト認識対象領域と、の重複の有無を判断する。そして、改訂後の帳票につき、重複しない領域に対してレイアウト認識処理を行えばよい。 Note that there may be a case where a plurality of keyword recognition target areas exist after the revision. In this case, it is determined whether or not there is an overlap between the plurality of keyword recognition target areas and the layout recognition target area before revision. Then, the layout recognition process may be performed on the non-overlapping areas for the revised form.
[第5の実施の形態]
以下、第5の実施の形態を説明する。前述の第2〜第4の実施の形態との相違点を主に説明し、同様の事項の説明を省略する。
[Fifth Embodiment]
Hereinafter, a fifth embodiment will be described. Differences from the second to fourth embodiments will be mainly described, and description of similar matters will be omitted.
第2〜第4の実施の形態では、キーワード認識処理の際、検出したキーワードに対するデータ部の位置を、所定位置と特定したり、帳票の表構造などに基づいて特定したりすることを説明した。 In the second to fourth embodiments, in the keyword recognition process, the position of the data part with respect to the detected keyword is specified as a predetermined position, or specified based on the table structure of the form, etc. .
一方、該データ部を任意に配置して、より自由度の高いレイアウト変更に対応できることが望ましい。例えば、キーワードの存在するセルの下側のセルをデータ部に対応させる記入欄と、キーワードの存在するセルの右下側のセルをデータ部に対応させる記入欄と、を混在させたい場合が考えられる。また、このようにキーワードの存在するセルに対する任意の位置にデータ部を配置したときに、データ部を容易に特定できることが望ましい。例えば、帳票の表構造などを解析する場合には、該解析の処理による負荷が大きくなることもあるからである。 On the other hand, it is desirable that the data part can be arbitrarily arranged to cope with layout change with a higher degree of freedom. For example, you may want to mix an entry field that associates the lower cell of the cell in which the keyword exists with the data part and an entry field that associates the lower right cell of the cell in which the keyword exists with the data part. It is done. Further, it is desirable that the data part can be easily specified when the data part is arranged at an arbitrary position with respect to the cell in which the keyword exists. This is because, for example, when analyzing the table structure of a form, the load due to the analysis process may increase.
そこで、第5の実施の形態では、データ部を容易に特定可能としながら、より自由度の高いレイアウト変更に対応可能とするための機能を提供する。
ここで、第5の実施の形態の情報処理システムの構成は、図2で説明した第2の実施の形態の情報処理システムの構成と同様である。また、第5の実施の形態の帳票読取装置のハードウェアおよび機能構成は、図3,6で説明した第2の実施の形態の帳票読取装置100のハードウェアおよび機能構成と同様である。以下、第5の実施の形態の帳票読取装置も帳票読取装置100と同一の符号・名称を用いて各構成を指し示すものとする。
Therefore, in the fifth embodiment, a function is provided for making it possible to cope with a layout change with a higher degree of freedom while making it possible to easily specify the data portion.
Here, the configuration of the information processing system of the fifth embodiment is the same as the configuration of the information processing system of the second embodiment described in FIG. The hardware and functional configuration of the form reading apparatus according to the fifth embodiment is the same as the hardware and functional configuration of the
図21は、第5の実施の形態のキーワード認識対象領域の例を示す図である。キーワード認識対象領域は、領域識別情報340の内側の領域である。該領域内には、記入欄331b,332b,333bが含まれる。記入欄331b,332b,333bは、図5で説明した記入欄331a,332a,333aにそれぞれ対応する。
FIG. 21 is a diagram illustrating an example of a keyword recognition target area according to the fifth embodiment. The keyword recognition target area is an area inside the
記入欄331bの見出し部分のセルには、キーワード351および支援情報351bが印字されている。
キーワード351は、文字列“電話番号”を示している。これは、該帳票の帳票画像内に含まれ得るデータ項目名に一致するものとする。支援情報351bは、キーワード351が存在するセルに対するデータ部の位置を示す記号である。支援情報351bは、数字“1”であり、キーワード351が存在するセルに隣接する、図21の紙面に向かって右側のセルがデータ部であることを示す。キーワード認識処理部132は、支援情報351bに基づいて、キーワード351に対するデータ部を特定できる。例えば、キーワード認識処理部132は、データ項目“電話番号”に対して右側に隣接するセルを参照し、文字列データ“000−0000−0000”を取得する。
A
The
記入欄332bの見出し部分のセルには、キーワード352および支援情報352bが印字されている。
キーワード352は、文字列“性別”を示している。これは、該帳票の帳票画像内に含まれ得るデータ項目名に一致するものとする。支援情報352bは、キーワード352が存在するセルに対するデータ部の位置を示す記号である。支援情報352bは、数字“2”であり、キーワード352が存在するセルに隣接する、図21の紙面に向かって下側のセルがデータ部であることを示す。キーワード認識処理部132は、支援情報352bに基づいて、キーワード352に対するデータ部を特定できる。例えば、キーワード認識処理部132は、データ項目“性別”に対して下側に隣接するセルを参照し、“男”を選択していることを示す選択記号(チェックマーク)を取得する。
A
The
記入欄333bの見出し部分のセルには、キーワード353および支援情報353bが印字されている。
キーワード353は、文字列“生年月日”を示している。これは、該帳票の帳票画像内に含まれ得るデータ項目名に一致するものとする。支援情報353bの意味は、支援情報352bと同様である。キーワード認識処理部132は、支援情報353bに基づいて、キーワード353に対するデータ部を特定できる。これにより、キーワード認識処理部132は、データ項目“生年月日”に対して下側に隣接するセルを参照し、文字列データ“1985”年“11”月“15”日を取得する。
A
The
次に、以上の構成の帳票読取装置100の処理手順を説明する。なお、第5の実施の形態の帳票読取処理の手順は図8で説明した第2の実施の形態の帳票読取処理の手順と同様である。
Next, a processing procedure of the
また、第5の実施の形態のキーワード認識処理の手順は、図10で説明した第2の実施の形態のキーワード認識処理の手順と同様である。ただし、該キーワード認識処理のステップS26におけるデータ部を特定するための処理が異なる。以下では、このデータ部を特定するための処理の手順を説明する。 Further, the procedure of the keyword recognition process of the fifth embodiment is the same as the procedure of the keyword recognition process of the second embodiment described with reference to FIG. However, the process for specifying the data part in step S26 of the keyword recognition process is different. Below, the procedure of the process for specifying this data part is demonstrated.
図22は、第5の実施の形態のデータ部の特定処理を示すフローチャートである。以下、図22に示す処理をステップ番号に沿って説明する。
(ステップS91)キーワード認識処理部132は、抽出したキーワードの存在する付近に支援情報が存在するか否かを判定する。支援情報が存在する場合、処理をステップS92に進める。支援情報が存在しない場合、処理をステップS93に進める。ここで、キーワードの存在する付近に支援情報が存在するか否かは、例えば、次の方法により判断できる。具体的には、キーワード認識処理部132にキーワードに対する支援情報の相対的な位置と支援情報のフォーマットとを予め設定しておく。キーワード認識処理部132は、キーワードに対する所定位置に該フォーマットに合致する文字列等が印字されているかを判断することで、支援情報の存在の有無を判定する。
FIG. 22 is a flowchart illustrating the data portion specifying process according to the fifth embodiment. In the following, the process illustrated in FIG. 22 will be described in order of step number.
(Step S91) The keyword
(ステップS92)キーワード認識処理部132は、支援情報に応じた位置をデータ部と特定する。図21の例でいえば、支援情報351bに基づいて、キーワード351が存在するセルの右側に隣接するセルをデータ部と特定する。また、支援情報352bに基づいて、キーワード352が存在するセルの下側に隣接するセルをデータ部と特定する。何れの支援情報が、どのような位置を示すかは、キーワード認識処理部132に予め設定される。そして、処理を終了する。
(Step S92) The keyword
(ステップS93)キーワード認識処理部132は、デフォルトの方法により、抽出したキーワードに対するデータ部を特定する。例えば、キーワード認識処理部132は、所定位置のセル(例えば、「該キーワードが存在するセルの右側に隣接するセル」)をデータ部と特定する。あるいは、キーワードや、帳票上の表構造に基づき、該キーワードに対応するデータ部を特定してもよい。そして、処理を終了する。
(Step S93) The keyword
このようにして、キーワード認識処理部132は、キーワードとともに印字された支援情報を読み取ることで、該キーワードに対するデータ部を効率的に特定できる。
なお、図21では、数値を支援情報とする場合を例示したが、他の文字(または文字列)、記号などを用いても構わない。
In this way, the keyword
21 illustrates the case where numerical values are used as support information, but other characters (or character strings), symbols, and the like may be used.
図23は、第5の実施の形態のデータ部の特定方法の例を示す図である。図23(A)は、記入欄700を例示している。記入欄700は、セル701,702を含む。セル701は、見出し部分のセルである。セル701には、キーワード“振込金額”と支援情報“○”(丸印)が印字されている。支援情報“○”は、セル701の右側に隣接するセル702が、該キーワードに対するデータ部のセルであることを示す。よって、キーワード認識処理部132は、記入欄700につき、支援情報“○”に基づいて、セル702を文字認識し、キーワード“振込金額”に対する文字列データ“¥11000”を取得する。
FIG. 23 is a diagram illustrating an example of a data part specifying method according to the fifth embodiment. FIG. 23A illustrates an
図23(B)は、記入欄710を例示している。記入欄710は、セル711,712を含む。セル711は、見出し部分のセルである。セル711には、キーワード“振込金額”と支援情報“△”(三角印)が印字されている。支援情報“△”は、セル711の右下側のセル712が、該キーワードに対するデータ部のセルであることを示す。よって、キーワード認識処理部132は、記入欄710につき、支援情報“△”に基づいて、セル712を文字認識し、キーワード“振込金額”に対する文字列データ“¥11000”を取得する。
FIG. 23B illustrates an
図23(C)は、記入欄720を例示している。記入欄720は、セル721,722を含む。セル721は、見出し部分のセルである。セル721には、キーワード“振込金額”と支援情報“□”(四角印)が印字されている。支援情報“□”は、セル721の下側に隣接するセル722が、該キーワードに対するデータ部のセルであることを示す。よって、キーワード認識処理部132は、記入欄720につき、支援情報“□”に基づいて、セル722を文字認識し、キーワード“振込金額”対する文字列データ“¥11000”を取得する。
FIG. 23C illustrates an
以上は一例であり、支援情報には、種々の数値、文字(または文字列)、記号などを利用できる。また、キーワード認識処理部132は、枠線や枠内の領域、キーワードのフォーマットなどとして支援情報を検出し、データ部の位置を特定してもよい。次に、そのような支援情報の例を説明する。
The above is an example, and various numerical values, characters (or character strings), symbols, and the like can be used as the support information. Further, the keyword
図24は、第5の実施の形態のデータ部の特定方法の他の例を示す図である。図24(A)は、記入欄800を例示している。記入欄800は、セル801,802を含む。セル801は、見出し部分のセルである。そして、セル801の枠内には、該枠の中央からデータ部の方向に対応する一辺の側に、該一辺と平行な罫線が印字される。具体的には、セル801に対するデータ部のセルが該セル801の右側に隣接するセル802であるとき、セル801,802の境界に位置する枠線よりもセル801側(ただし、セル801の中央よりもセル802側)に、該枠線と平行な罫線801aが印字される。キーワード認識処理部132は、罫線801aを支援情報として検出する。そして、キーワード認識処理部132は、セル801内の罫線801aの位置に基づいて、セル802をデータ部として特定する。これにより、キーワード認識処理部132は、セル801内のキーワード“振込金額”に対して、セル802内の文字列データ“¥11000”を取得する。
FIG. 24 is a diagram illustrating another example of the data portion specifying method according to the fifth embodiment. FIG. 24A illustrates an
例えば、セル801の下側に隣接するセルをデータ部とする場合には、セル801の下側の枠線と平行な罫線がセル801内の下側に印字される。キーワード認識処理部132は、該罫線に基づいて、セル801の下側に隣接するセルをデータ部として特定できる。
For example, when a cell adjacent to the lower side of the
図24(B)は、記入欄810を例示している。記入欄810は、セル811,812を含む。セル811は、見出し部分のセルである。セル812は、セル811内のキーワードに対応するデータ部のセルである。そして、セル811とセル812との境界線811aが他の枠線とは異なる太さで印字されている。キーワード認識処理部132は、太さの異なる境界線811aに基づいて、データ部の位置を特定する。具体的には、セル811の境界線811aの方向に隣接するセル812をデータ部として特定する。これにより、キーワード認識処理部132は、セル811内のキーワード“振込金額”に対して、セル812内の文字列データ“¥11000”を取得する。
FIG. 24B illustrates an
図24(C)は、記入欄820を例示している。記入欄820は、セル821,822を含む。セル821は、見出し部分のセルである。セル821内にはキーワードが横一列に並んだ文字列として“振込金額”と印字される。横一列に並んだ文字列は、セル811の右側に隣接するセルが該キーワードに対応するデータ部であることを示している。キーワード認識処理部132は、セル821内のキーワード“振込金額”を検出し、更に、該キーワードが横一列に並んでいることを検知する。すると、キーワード認識処理部132は、セル821の右側に隣接するセル822をデータ部として特定する。これにより、キーワード認識処理部132は、セル821内のキーワード“振込金額”に対して、セル822内の文字列データ“¥11000”を取得する。
FIG. 24C illustrates an
例えば、セル821の下側に隣接するセルをデータ部とする場合には、セル821内のキーワードが縦一列に印字される。また、例えば、セル821の右下側のセルをデータ部とする場合には、セル821の左上から右下へ向かう斜めの一列に並んでキーワードが印字される。キーワード認識処理部132は、このようにキーワードに含まれる文字の並び方によって、該キーワードに対するデータ部のセルを特定する。
For example, when a cell adjacent to the lower side of the
図24(D)は、記入欄830を例示している。記入欄830は、セル831,832を含む。セル831は、見出し部分のセルである。セル832は、セル831内のキーワードに対応するデータ部のセルである。セル831の枠内には、所定の色が付されている。記入欄830では、この色によって、セル831に対するセル832の位置を示している。例えば、画像情報中、色は複数のパラメータで表現される。例えば、HSVによる色表現では、色相(hue)、彩度(saturation value)、明度(value)という3つのパラメータで色が表現される。その場合、各パラメータの何れか、あるいは複数のパラメータにより、セル831の上下左右の何れの側に隣接するセルがデータ部であるかを予め定義する。例えば、色相の範囲を4等分して、等分した各範囲を上下左右の何れかに割り当てることが考えられる。彩度や明度を用いる場合も同様である。
FIG. 24D illustrates the
セル831内の色は、セル831の右側に隣接するセル832がセル831に対応するデータ部である旨、キーワード認識処理部132に予め設定される。キーワード認識処理部132は、セル831内の色を解析することで、セル831に対応するデータ部のセル832を特定する。これにより、キーワード認識処理部132は、セル831内のキーワード“振込金額”に対して、セル832内の文字列データ“¥11000”を取得する。
The color in the
なお、画像が2値化されている場合には、ハッチングの種類や、ドットの密度などに応じてデータ部を特定してもよい。
以上のように、帳票読取装置100は、キーワードと共に印字された支援情報を検出して、データ部のセルを特定する。これにより、帳票に対して自由度の高いレイアウト変更が可能になる。加えて、キーワード認識処理において、キーワードに対するデータ部を容易に特定可能となる。
If the image is binarized, the data portion may be specified according to the type of hatching, the dot density, and the like.
As described above, the
1 情報処理装置
1a 検出部
1b 領域特定部
1c 処理部
2 画像情報
2a 識別情報
2b 領域識別情報
3 処理対象領域
DESCRIPTION OF
Claims (7)
前記識別情報を検出すると、前記画像情報に含まれる、所定の文字認識処理を行う処理対象領域を識別するための領域識別情報を検出して、該領域識別情報に基づき前記処理対象領域を特定し、
特定した前記処理対象領域に対して前記所定の文字認識処理を行う、
処理をコンピュータに実行させる情報処理プログラム。 Detecting identification information indicating that the layout of the form has been changed from image information obtained by imaging the form;
When the identification information is detected, area identification information included in the image information for identifying a processing target area for performing a predetermined character recognition process is detected, and the processing target area is specified based on the area identification information. ,
Performing the predetermined character recognition processing on the identified processing target area;
An information processing program that causes a computer to execute processing.
前記識別情報を検出すると、前記画像情報に含まれる、所定の文字認識処理を行う処理対象領域を識別するための領域識別情報を検出して、該領域識別情報に基づき前記処理対象領域を特定する領域特定部と、
特定した前記処理対象領域に対して前記所定の文字認識処理を行う処理部と、
を有する情報処理装置。 A detection unit that detects identification information indicating that the layout of the form has been changed from image information obtained by imaging the form;
When the identification information is detected, area identification information included in the image information for identifying a processing target area for performing a predetermined character recognition process is detected, and the processing target area is specified based on the area identification information. An area identification unit;
A processing unit that performs the predetermined character recognition processing on the identified processing target area;
An information processing apparatus.
帳票を撮像して得られた画像情報から該帳票のレイアウトが変更された旨を示す識別情報を検出すると、前記画像情報に含まれる、所定の文字認識処理を行う処理対象領域を識別するための領域識別情報を検出して、該領域識別情報に基づき前記処理対象領域を特定し、
特定した前記処理対象領域に対して前記所定の文字認識処理を行う、
文字認識方法。 A character recognition method executed by an information processing apparatus,
When identification information indicating that the layout of the form has been changed is detected from the image information obtained by imaging the form, the process includes a process for identifying a processing target area to be subjected to a predetermined character recognition process included in the image information. Detecting region identification information, specifying the processing target region based on the region identification information,
Performing the predetermined character recognition processing on the identified processing target area;
Character recognition method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011166451A JP5566971B2 (en) | 2011-07-29 | 2011-07-29 | Information processing program, information processing apparatus, and character recognition method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011166451A JP5566971B2 (en) | 2011-07-29 | 2011-07-29 | Information processing program, information processing apparatus, and character recognition method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013030040A true JP2013030040A (en) | 2013-02-07 |
JP5566971B2 JP5566971B2 (en) | 2014-08-06 |
Family
ID=47787015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011166451A Active JP5566971B2 (en) | 2011-07-29 | 2011-07-29 | Information processing program, information processing apparatus, and character recognition method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5566971B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015130091A (en) * | 2014-01-08 | 2015-07-16 | 大日本印刷株式会社 | Management system and management program |
JP2017062574A (en) * | 2015-09-24 | 2017-03-30 | 富士通フロンテック株式会社 | Document image determination program, document image determination method, and document image determination system |
JP2020027598A (en) * | 2018-12-27 | 2020-02-20 | 株式会社シグマクシス | Character recognition device, character recognition method, and character recognition program |
JP2020126326A (en) * | 2019-02-01 | 2020-08-20 | 株式会社プリマジェスト | Device, method, and program for identifying character string contained in business form |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10124615A (en) * | 1996-10-24 | 1998-05-15 | Ricoh Co Ltd | Character recognizing device |
JP2004164376A (en) * | 2002-11-14 | 2004-06-10 | Fujitsu Ltd | Identification-code-attached form, form reading program, and form creation program |
JP2004199529A (en) * | 2002-12-20 | 2004-07-15 | Fujitsu Ltd | Business form recognition device and business form recognition method |
JP2007233913A (en) * | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | Image processor and program |
JP2010003155A (en) * | 2008-06-20 | 2010-01-07 | Fujitsu Frontech Ltd | Form recognition apparatus, method, database generation apparatus, method, and program |
-
2011
- 2011-07-29 JP JP2011166451A patent/JP5566971B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10124615A (en) * | 1996-10-24 | 1998-05-15 | Ricoh Co Ltd | Character recognizing device |
JP2004164376A (en) * | 2002-11-14 | 2004-06-10 | Fujitsu Ltd | Identification-code-attached form, form reading program, and form creation program |
JP2004199529A (en) * | 2002-12-20 | 2004-07-15 | Fujitsu Ltd | Business form recognition device and business form recognition method |
JP2007233913A (en) * | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | Image processor and program |
JP2010003155A (en) * | 2008-06-20 | 2010-01-07 | Fujitsu Frontech Ltd | Form recognition apparatus, method, database generation apparatus, method, and program |
Non-Patent Citations (1)
Title |
---|
石川 和弘、外2名: ""OCR制限緩和技術"", 沖電気研究開発, vol. 65, no. 1, JPN6014024669, 1 January 1998 (1998-01-01), JP, pages 51 - 54, ISSN: 0002832846 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015130091A (en) * | 2014-01-08 | 2015-07-16 | 大日本印刷株式会社 | Management system and management program |
JP2017062574A (en) * | 2015-09-24 | 2017-03-30 | 富士通フロンテック株式会社 | Document image determination program, document image determination method, and document image determination system |
JP2020027598A (en) * | 2018-12-27 | 2020-02-20 | 株式会社シグマクシス | Character recognition device, character recognition method, and character recognition program |
JP2020126326A (en) * | 2019-02-01 | 2020-08-20 | 株式会社プリマジェスト | Device, method, and program for identifying character string contained in business form |
JP7329331B2 (en) | 2019-02-01 | 2023-08-18 | 株式会社プリマジェスト | Apparatus, method, and program for recognizing character strings contained in forms |
Also Published As
Publication number | Publication date |
---|---|
JP5566971B2 (en) | 2014-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3437019B1 (en) | Optical character recognition in structured documents | |
US10572725B1 (en) | Form image field extraction | |
EP3574449B1 (en) | Structured text and pattern matching for data loss prevention in object-specific image domain | |
KR100847037B1 (en) | Media storing a program to extract and classify annotation data, and apparatus and method for processing annotation data | |
US8693790B2 (en) | Form template definition method and form template definition apparatus | |
JP4996940B2 (en) | Form recognition device and program thereof | |
US9262679B2 (en) | System and method for identification and separation of form and feature elements from handwritten and other user supplied elements | |
JP2018005462A (en) | Recognition device and recognition method | |
CN107679442A (en) | Method, apparatus, computer equipment and the storage medium of document Data Enter | |
JP5566971B2 (en) | Information processing program, information processing apparatus, and character recognition method | |
CN103870823A (en) | Character recognition device and method, character recognition program | |
CN106529381A (en) | Information processing apparatus and information processing method | |
JP2018055256A (en) | Information processing apparatus, information processing method, and program | |
JP5878004B2 (en) | Multiple document recognition system and multiple document recognition method | |
TWM626292U (en) | Business-oriented key item key-value identification system | |
JP4518212B2 (en) | Image processing apparatus and program | |
JP2008310531A (en) | Business form identification method, business form identification program and optical character reading system using the business form identification method | |
JP6682827B2 (en) | Information processing apparatus and information processing program | |
JP2017010187A (en) | Image processing device and image processing program | |
JP2004220340A (en) | Business form format editing device and business form format editing program | |
JP7445364B2 (en) | Image processing program, image processing method, and image processing device | |
TWI807467B (en) | Key-item detection model building method, business-oriented key-value identification system and method | |
JP2019008559A (en) | Information processing device and information processing method | |
JP2012248948A (en) | Device and method for supporting slip check and program | |
JP6187307B2 (en) | Image processing apparatus and image processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130906 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140606 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140617 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140618 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5566971 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |