JP2015176410A - Information processor, document reading method, and program - Google Patents
Information processor, document reading method, and program Download PDFInfo
- Publication number
- JP2015176410A JP2015176410A JP2014053081A JP2014053081A JP2015176410A JP 2015176410 A JP2015176410 A JP 2015176410A JP 2014053081 A JP2014053081 A JP 2014053081A JP 2014053081 A JP2014053081 A JP 2014053081A JP 2015176410 A JP2015176410 A JP 2015176410A
- Authority
- JP
- Japan
- Prior art keywords
- item
- information
- unit
- reading
- entry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 36
- 238000000605 extraction Methods 0.000 claims abstract description 64
- 230000010365 information processing Effects 0.000 claims description 34
- 230000008569 process Effects 0.000 claims description 23
- 238000012937 correction Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 9
- 238000012545 processing Methods 0.000 description 28
- 230000008859 change Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000012015 optical character recognition Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 2
- 241001481828 Glyptocephalus cynoglossus Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
Description
本発明は、情報処理装置、帳票読取方法、及びプログラムに関する。 The present invention relates to an information processing apparatus, a form reading method, and a program.
近年、活字で表された項目に対して手書きで文字が記入された帳票をスキャナで読み取り、OCR(Optical Character Recognition)処理を行うことにより、入力情報を文字コードに変換したデジタルデータを生成する技術が普及している。例えば、複数の会社から帳票を譲り受ける債権回収会社(サービサー)等では、譲り受けた帳票に関する処理を行うため、異なる種類の帳票を読み取り、各々のデジタルデータを生成する必要がある。 2. Description of the Related Art In recent years, a technique for generating digital data in which input information is converted into a character code by reading a form in which handwritten characters are entered with respect to an item represented by type by a scanner and performing OCR (Optical Character Recognition) processing. Is popular. For example, a credit collection company (servicer) that receives forms from a plurality of companies needs to read different types of forms and generate respective digital data in order to perform processing related to the received forms.
特許文献1には、「帳票画像に含まれ、線分に囲まれた領域である枠に存在する文字行を抽出して、抽出した文字行を文字認識する帳票処理システムにおいて、前記帳票処理システムは、前記文字行を抽出する対象となる複数の抽出対象枠に対応する文字列と、前記複数の抽出対象枠の配置関係と、を対応付けた枠構造辞書データを記憶し、前記帳票画像から枠を抽出枠として抽出する枠抽出部と、前記枠構造辞書データを参照し、前記枠抽出部によって抽出された前記抽出枠を前記抽出対象枠に対応付けた照合結果を算出する枠照合部と、前記枠照合部によって算出された照合結果に対して、前記抽出対象枠に対応付けられた抽出枠に存在する文字行を抽出する文字行抽出部と、前記枠照合部によって算出された各照合結果に対して、前記文字行抽出部によって抽出された文字行が抽出された抽出枠に対応する前記抽出対象枠の文字列に対する当該文字行の類似度を示す枠スコアを算出し、各照合結果に含まれる前記抽出対象枠に対応付けられた枠の枠スコアに基づいて、各照合結果のスコアである照合結果スコアを算出するスコア算出部と、前記スコア算出部によって算出された照合結果スコアに基づいて、前記枠照合部によって算出された照合結果のうち、一の照合結果を抽出照合結果とすることを特徴とする」帳票処理システムが開示されている。 Japanese Patent Laid-Open No. 2004-133830 describes that in a form processing system that extracts a character line that is included in a form image and exists in a frame that is an area surrounded by a line segment and recognizes the extracted character line, the form processing system Stores frame structure dictionary data in which character strings corresponding to a plurality of extraction target frames from which the character line is to be extracted and the arrangement relationship of the plurality of extraction target frames are associated with each other, from the form image A frame extracting unit that extracts a frame as an extraction frame; a frame matching unit that refers to the frame structure dictionary data and calculates a matching result in which the extracted frame extracted by the frame extracting unit is associated with the extraction target frame; A character line extraction unit that extracts a character line existing in the extraction frame associated with the extraction target frame with respect to the collation result calculated by the frame collation unit; and each collation calculated by the frame collation unit For the results, The extraction target included in each matching result is calculated by calculating a frame score indicating the similarity of the character line to the character string of the extraction target frame corresponding to the extraction frame from which the character line extracted by the character line extraction unit is extracted. A score calculation unit that calculates a matching result score that is a score of each matching result based on the frame score of the frame associated with the frame, and the frame matching based on the matching result score calculated by the score calculating unit A form processing system is disclosed in which one collation result among the collation results calculated by the section is used as an extraction collation result.
従来技術では、帳票からデジタルデータを生成する際には、予め帳票の書式を登録する必要がある。そのため、異なる複数の書式の帳票を取り扱うサービサーにおいては、各々の帳票について事前に書式を登録しなければならず、煩雑である。また、書式毎に帳票を仕分けしてからスキャナでの読取処理を行う必要があり、利便性に欠ける。 In the prior art, when generating digital data from a form, it is necessary to register the form format in advance. For this reason, in a servicer that handles forms of a plurality of different formats, it is necessary to register a format for each form in advance, which is complicated. In addition, it is necessary to sort the forms for each format and then perform reading processing with a scanner, which is not convenient.
特許文献1に開示された技術では、読取枠の位置と項目の文字列とを対応付けた枠構造辞書データを書式として予め記憶しておかねばならない。
In the technique disclosed in
本発明は、上記の点に鑑みてなされたものであって、項目及び該項目に対する記入事項を含む帳票から効率的に記載情報の抽出を行うことのできる技術の提供を目的とする。 The present invention has been made in view of the above points, and it is an object of the present invention to provide a technique capable of efficiently extracting description information from a form including items and entries for the items.
本願は、上記課題を解決する手段を複数含んでいるが、その例を挙げるならば、以下の通りである。 The present application includes a plurality of means for solving the above-described problems, and examples thereof are as follows.
上記課題を解決するため、本発明に係る情報処理装置は、帳票に含まれる項目の候補である項目候補に関する項目情報を記憶する記憶部と、帳票を読み取る読取部と、前記読取部により読み取られた帳票から記載情報を抽出する記載情報抽出部と、前記記載情報から、前記項目候補と対応する前記項目を抽出する項目抽出部と、前記読取部による前記記載情報の読取順序に基づいて、前記項目に対する記入事項を前記記載情報から特定する記入事項特定部と、前記項目と、該項目に対する前記記入事項とを関連付けた顧客情報を生成する顧客情報生成部と、を備えることを特徴とすることを特徴とする。 In order to solve the above problems, an information processing apparatus according to the present invention is read by a storage unit that stores item information related to item candidates that are candidates for items included in a form, a reading unit that reads a form, and the reading unit. A description information extraction unit for extracting description information from the form, an item extraction unit for extracting the item corresponding to the item candidate from the description information, and a reading order of the description information by the reading unit, An entry specifying unit that specifies an entry for an item from the description information, and a customer information generation unit that generates customer information in which the item is associated with the entry for the item. It is characterized by.
また、上記課題を解決するため、前記項目情報は、前記項目候補と、該項目に対する前記記入事項の属性とを関連付けており、前記記入事項特定部は、前記読取順序と、前記項目抽出部により抽出された前記項目と前記項目情報において関連付けられた前記属性と、に基づいて、前記項目に対する前記記入事項を特定することを特徴としてもよい。 In order to solve the above-mentioned problem, the item information associates the item candidate with the attribute of the entry for the item, and the entry specifying unit is configured by the reading order and the item extraction unit. The entry for the item may be specified based on the extracted item and the attribute associated with the item information.
また、上記課題を解決するため、本発明に係る情報処理装置は、前記読取部により読み取られた帳票と対応する帳票候補が前記記憶部に記憶されているか否かを判定する候補帳票特定部を備え、前記記憶部には、前記項目に対し、該項目の記載順序と、該項目への前記記入事項の前記記載順序とを関連付けた帳票情報が前記帳票候補として前記帳票毎に記憶され、前記記載情報抽出部は、前記候補帳票特定部が前記項目抽出部により抽出された前記項目と該項目の読取順序とを用いて前記帳票情報を参照し、該読取順序と前記項目の前記記載順序とが対応する前記帳票情報が前記記憶部に記憶されていると判定した場合に、前記帳票情報における前記記入事項の前記記載順序と対応する前記読取順序で読み取られた前記記載情報を前記記入事項として特定し、前記顧客情報生成部は、前記帳票情報を用いて前記項目と前記記入事項とを関連付けることを特徴としてもよい。 In order to solve the above-described problem, the information processing apparatus according to the present invention includes a candidate form specifying unit that determines whether a form candidate corresponding to the form read by the reading unit is stored in the storage unit. The storage unit stores, for each item, form information that associates the description order of the items with the description order of the items to be entered in the storage unit as the form candidate, The description information extraction unit refers to the form information using the item extracted by the item extraction unit and the reading order of the item, and the reading order and the description order of the items. If it is determined that the form information corresponding to is stored in the storage unit, the entry information read in the reading order corresponding to the entry order of the entries in the form information is the entry. Was identified as the customer information generation unit may be characterized by associating with said items and the entry item by using the form information.
また、上記課題を解決するため、本発明に係る情報処理装置は、前記候補帳票特定部により、前記読取順序と前記記載順序とが対応する前記帳票が前記帳票情報に含まれると判定されない帳票について、前記項目抽出部により抽出された前記項目と、該項目の記載順序と、を用いて仮帳票を生成する仮帳票生成部を備え、前記記憶部には、前記帳票候補として前記仮帳票が記憶され、前記候補帳票特定部は、前記帳票の前記読取順序と前記記載順序とが対応する前記仮帳票が前記記憶部に記憶されているか否かを判定し、前記記入事項特定部は、前記候補帳票特定部により前記仮帳票が記憶されていると判定された場合に、前記仮帳票に含まれる前記記載順序を用いて前記記入事項を特定することを特徴としてもよい。 In order to solve the above problem, the information processing apparatus according to the present invention relates to a form for which the candidate form specifying unit does not determine that the form information corresponding to the reading order and the description order is included in the form information. A temporary form generation unit that generates a temporary form using the items extracted by the item extraction unit and the description order of the items, and the storage unit stores the temporary form as the form candidate The candidate form specifying unit determines whether or not the temporary form corresponding to the reading order and the description order of the form is stored in the storage unit, and the entry specifying unit When it is determined that the temporary form is stored by the form specifying unit, the entry items may be specified using the description order included in the temporary form.
また、上記課題を解決するため、本発明に係る本発明に係る情報処理装置は、前記記載情報のうち、前記項目に対する前記記入事項が前記記入事項特定部により特定されない場合、又は前記項目とも前記記入事項とも特定されない前記記載情報が存在する場合に、エラー判定を行うエラー判定部と、前記エラー判定部によりエラー判定がされた場合に、帳票修正画面を表示する表示部とを備え、前記帳票修正画面は、前記記載情報に対する前記項目又は前記記入事項の指定を受け付けることを特徴としてもよい。 In order to solve the above problem, the information processing apparatus according to the present invention according to the present invention includes a case in which the entry for the item is not specified by the entry specifying unit in the written information, An error determination unit that performs an error determination when there is the description information that is not specified as an entry, and a display unit that displays a form correction screen when the error determination is performed by the error determination unit; The correction screen may receive the designation of the item or the entry for the description information.
また、上記課題を解決するため、本発明に係る帳票読取方法は、制御部を備える情報処理装置を用いた帳票読取方法であって、前記制御部は、帳票に含まれる項目の候補である項目候補に関する項目情報を記憶する記憶部と、帳票を読み取る読取ステップと、前記読取ステップにおいて読み取られた帳票から記載情報を抽出する記載情報抽出ステップと、前記記憶部に記憶された前記帳票に含まれる項目の候補である項目候補と対応する前記項目を前記記載情報から抽出する項目抽出ステップと、前記読取ステップにおける前記記載情報の読取順序に基づいて、前記項目に対する記入事項を前記記載情報から特定する記入事項特定ステップと、前記項目と、該項目に対する前記記入事項とを関連付けた顧客情報を生成する顧客情報生成ステップと、を備えることを特徴とする。 In order to solve the above-described problem, a form reading method according to the present invention is a form reading method using an information processing apparatus including a control unit, and the control unit is an item candidate for an item included in the form. Included in the storage unit that stores item information related to candidates, a reading step of reading a form, a description information extracting step of extracting description information from the form read in the reading step, and the form stored in the storage unit An item extraction step for extracting the item corresponding to the item candidate that is an item candidate from the description information, and an entry for the item is specified from the description information based on the reading order of the description information in the reading step. A customer information generation step for generating customer information in which an entry specifying step, the item, and the entry for the item are associated with each other. Characterized in that it comprises a and.
また、上記課題を解決するため、本発明に係るプログラムは、コンピューターに、帳票読取処理を行うステップを実行させるプログラムであって、前記コンピューターを、制御手段として機能させ、前記制御手段に対して、帳票に含まれる項目の候補である項目候補に関する項目情報を記憶する記憶部と、帳票を読み取る読取ステップと、前記読取ステップにおいて読み取られた帳票から記載情報を抽出する記載情報抽出ステップと、前記記憶部に記憶された前記帳票に含まれる項目の候補である項目候補と対応する前記項目を前記記載情報から抽出する項目抽出ステップと、前記読取ステップにおける前記記載情報の読取順序に基づいて、前記項目に対する記入事項を前記記載情報から特定する記入事項特定ステップと、前記項目と、該項目に対する前記記入事項とを関連付けた顧客情報を生成する顧客情報生成ステップと、を実行させることを特徴とする。 In order to solve the above problem, a program according to the present invention is a program that causes a computer to execute a step of performing a form reading process, causing the computer to function as a control unit, and A storage unit that stores item information regarding item candidates that are candidates for items included in the form, a reading step of reading the form, a description information extracting step of extracting description information from the form read in the reading step, and the storage An item extraction step for extracting the item corresponding to an item candidate that is a candidate for an item included in the form stored in a section from the description information, and the item based on the reading order of the description information in the reading step. An entry specifying step for specifying an entry for the item from the written information, the item, and the item Characterized in that to execute, and customer information generating step of generating a customer information associated with said entry item for.
本発明によれば、項目及び該項目に対する記入事項を含む帳票から効率的に記載情報の抽出を行うことのできる技術を提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the technique which can extract description information efficiently from the form containing the item and the entry item with respect to this item can be provided.
上記した以外の課題、構成、及び効果は、以下の実施形態の説明により明らかにされる。 Problems, configurations, and effects other than those described above will be clarified by the following description of embodiments.
以下、図面に基づいて本発明の実施形態の例を説明する。図1は、情報処理装置10の機能ブロック図である。 Hereinafter, examples of embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a functional block diagram of the information processing apparatus 10.
情報処理装置10は、PC(Personal Computer)や、PDA(Personal Digital Assistant)、又はスマートフォン等の端末装置である。また、情報処理装置10は、一般的なスキャナ機能を備えた複合機等であってもよい。 The information processing apparatus 10 is a terminal device such as a PC (Personal Computer), a PDA (Personal Digital Assistant), or a smartphone. Further, the information processing apparatus 10 may be a multi-function machine or the like having a general scanner function.
情報処理装置10は、制御部110と、記憶部120とを備える。制御部110は、情報処理装置10が備える入力I/Fに対して接続されたスキャナに読み取られた各帳票から、記載情報を抽出し、顧客マスタを生成する処理を制御する。記憶部120は、制御部110が行う処理に必要なデータを記憶する。
The information processing apparatus 10 includes a
制御部110は、読取部111と、記載情報抽出部112と、項目抽出部113と、記入事項特定部114と、顧客情報生成部115と、候補帳票特定部116と、仮帳票生成部117と、エラー判定部118と、表示部119とを備える。
The
読取部111は、スキャナにより読み取られた帳票の画像データ(主にラスターデータ)を取得する。帳票には、直交する直線により表される枠内に、ユーザーへの記入を求める内容を示す項目か、又はユーザーが記入した記入事項が含まれている。以下、項目及び記入事項の総称が記載情報であるとして説明する。 The reading unit 111 acquires image data (mainly raster data) of a form read by the scanner. The form includes an item indicating the content requested to be entered by the user or an entry entered by the user within a frame represented by an orthogonal straight line. In the following description, it is assumed that the general term of items and entries is written information.
また、読取部111は、読み取った画像データを記憶部120の図示しない領域に記憶させる。
Further, the reading unit 111 stores the read image data in an area (not shown) of the
記載情報抽出部112は、取得した画像データに対してOCR処理を行い、帳票が有する記載情報の文字データを取得する。OCR処理については公知の手段を用いるため、詳細については説明を省略する。
The description
また、記載情報抽出部112は、帳票に記載された枠を特定する。枠の特定には公知の方法が用いられる。例えば、特開2013-105344に記載された方法を用いる。記載情報抽出部112は、帳票が有する枠ごとに、枠内に記載された記載情報の文字データを取得する。記載情報抽出部112は、取得した文字データに対して、読取部111による読取順序に応じた番号を採番する。
Further, the description
項目抽出部113は、項目の候補が記録された項目DB121を用いて、記載情報から項目を抽出する。
The
記入事項特定部114は、記載情報に対して採番された番号を用いて、ユーザーにより記入された記入事項を特定する。特定される記入事項は、手書きのものであってもよいし、印字された活字であってもよい。記入事項の特定方法に関しては、後に詳述する。
The
顧客情報生成部115は、帳票から抽出された項目と記入事項とを関連付けた顧客情報として、顧客マスタDBを生成する。
The customer
候補帳票特定部116は、予め記憶部120に記憶された帳票情報である帳票DB122を用いて、読取部111により読み取られた帳票が帳票DB122に記憶された書式の帳票であるか否かを判定する。また、候補帳票特定部116は、読取部111により読み取られた帳票が仮登録記憶領域に記憶された仮帳票と共通する書式であるか否かを判定する。
The candidate
仮帳票生成部117は、読取部111により読み取られた帳票が帳票DB122に記憶された書式の帳票でない場合に、項目と該項目の読取順序とを関連付けた仮帳票を生成する。
When the form read by the reading unit 111 is not a form having the format stored in the
エラー判定部118は、読取部111により読み取られた帳票にエラーがあるか否かを判定する。エラー判定部118は、エラーがあると判定した場合にエラーの内容を分類して記憶部120に記憶させる。エラーは、例えば読み取りが困難な文字を含む場合に「1」が、項目に対して記入事項が特定されない場合に「2」が、記入事項に対して項目が特定されない場合に「3」が、各記載情報に対して関連付けられる。
The error determination unit 118 determines whether there is an error in the form read by the reading unit 111. If the error determination unit 118 determines that there is an error, the error determination unit 118 classifies the contents of the error and causes the
表示部119は、表示装置に対して画面を表示させる。表示部119は、例えばエラーがあると判定された記入事項を含む帳票に関して、後述する帳票修正画面を表示させる。
The
記憶部120は、項目DB121と、帳票DB122と、顧客マスタDB123と、仮登録記憶領域124とを記憶している。
The
項目DB121は、項目の候補に関する情報である。項目DBは、項目の内容である文字列を含む項目内容に対して、該項目と対応して記入される記入事項の属性等が関連付けられている。項目DB121に基づいて、項目に対応する記入事項が特定される。
The
帳票DB122には、帳票の書式に関する情報が格納される。帳票DB122には、帳票の書式毎に、帳票の名称や、帳票に含まれる項目の識別子や、該項目と対応する記入事項の読取順序を示す読取識別子等が含まれる。
The
顧客マスタDB123には、読み取られた帳票毎に、項目を特定する項目識別子や、該項目に対して入力された記入事項である入力文字列等が格納される。
The
仮登録記憶領域124には、仮帳票生成部117により生成された仮帳票が格納される。
The temporary
本実施形態では、読み取った帳票から顧客情報を生成する。その際、読み取った帳票と対応する書式が帳票DB122に存在する場合には、帳票DB122に基づいて顧客マスタDBを生成する。対応する書式が帳票DB122に存在しない場合には、読み取った帳票と対応する書式に基づく仮帳票が仮登録記憶領域124に存在するか否かを判定し、仮登録記憶領域124に対応する仮帳票が存在する場合には、該仮帳票の書式に応じて顧客情報を生成する。読み取った帳票と対応する仮帳票が仮登録記憶領域124に存在しない場合は、読み取った帳票に基づいて仮帳票を生成し、仮帳票記憶領域124に格納する。これにより、予め帳票DB122に書式が登録されていない帳票が読み取られた場合であっても、効率的に顧客情報を生成させることができるため、帳票の読み取りから顧客情報の生成までの処理が効率化できる。
In the present embodiment, customer information is generated from the read form. At this time, if a format corresponding to the read form exists in the
次に、記憶部120に記憶される各情報について説明する。
Next, each piece of information stored in the
図2は、項目DB121の一例を示す図である。項目DB121は、項目毎に、項目識別子121aと、項目内容121bと、桁数121cと、属性121dと、種別121eとを格納している。
FIG. 2 is a diagram illustrating an example of the
項目識別子121aは、各項目内容121bに対して一意に付与された識別情報である。項目内容121bは、項目の内容を示す文字列である。桁数121cは、該項目に対して入力される記入事項の半角の桁数の上限を示す値である。 The item identifier 121a is identification information uniquely assigned to each item content 121b. The item content 121b is a character string indicating the content of the item. The number of digits 121c is a value indicating the upper limit of the number of single-byte digits of the entry entered for the item.
属性121dは、該項目に対して入力される記入事項の属性である。図2に示す属性121dには、「C」、「N」、「S」が表示されているが、「C」は全角文字、「N」は半角文字、「S」は選択肢を意味している。
The
種別121eは、項目の種別を特定する情報である。図2に示す種別121eは、「aa」が「顧客氏名」に関する種別であり、「ab」が「自宅住所」に関する種別であり、「ac」が「自宅電話番号」に関する種別である。 The type 121e is information that identifies the type of item. In the type 121e shown in FIG. 2, “aa” is a type related to “customer name”, “ab” is a type related to “home address”, and “ac” is a type related to “home phone number”.
例えば、図2に示す項目DB121の最上段のレコードは、項目識別子121aが「00001」であり、項目内容121bが「フリガナ」であり、該項目に対して入力される記入事項の桁数の上限が桁数121cの「48」桁であり、記入事項の属性121dが「C」、つまり全角文字であることを示す。また、該項目の種別121eは「aa」、つまり「顧客氏名」である。
For example, the uppermost record of the
図3は、帳票DB122の一例を示す図である。帳票DB122は、帳票種別識別子122a毎に、帳票名122bと、項目識別子122cと、入力欄読取識別子122dと、入力必須フラグ122eとを関連付けて格納している。
FIG. 3 is a diagram illustrating an example of the
帳票種別識別子122aは、帳票の書式を特定する識別情報である。帳票名122bは、帳票の名称を示す文字列である。項目識別子122cは、帳票に含まれる項目を特定する識別情報であって、項目DB121の項目識別子121aと対応する。帳票種別識別子122aにより特定される帳票が複数の項目を有する場合には、帳票種別識別子122aに対して複数の項目識別子122cが関連付けられる。各項目識別子122cは項目の記載順序に応じて帳票種別識別子122aに関連付けられている。図3に示す各項目識別子122cは、上方から下方につれて記載順序が後になるよう記録されている。
The form type identifier 122a is identification information that identifies the form format. The form name 122b is a character string indicating the name of the form. The item identifier 122c is identification information that identifies an item included in the form, and corresponds to the item identifier 121a of the
なお、読取部111が帳票を読み取る際は、例えば帳票を水平方向に左から右へ向かって走査し、その後読み取りヘッドを左下方向に移動させ、さらに水平方向に左から右へ向かって走査する。そのため、各項目識別子122cは、帳票に記載されている状態において左上から右下に向かうにつれて記載順序が後であるとして定義される。以下、記載順序及び読取順序について、同様の定義を用いて説明する。付言すれば、本実施形態は、該読取順序及び記載順序に限定されるものではなく、記載情報の記載順序又は読取順序が共通の法則により定義されるものであればよい。 When the reading unit 111 reads a form, for example, the form is scanned in the horizontal direction from left to right, and then the reading head is moved in the lower left direction and further scanned in the horizontal direction from left to right. Therefore, each item identifier 122c is defined as having a description order later from the upper left to the lower right in the state described in the form. Hereinafter, the description order and the reading order will be described using the same definition. In other words, the present embodiment is not limited to the reading order and the description order, as long as the description order or the reading order of the description information is defined by a common rule.
入力欄読取識別子122dは、項目識別子122cにより特定される項目に対して入力される記入事項の読取順序を特定する識別情報である。前述したように、読取部111により読み取られた記載情報には、読取順序に応じた番号が採番されている。入力欄読取識別子122dは、記入事項に対して採番された番号である。 The input column reading identifier 122d is identification information that specifies the reading order of the entries input for the item specified by the item identifier 122c. As described above, the description information read by the reading unit 111 is numbered according to the reading order. The input field reading identifier 122d is a number assigned to the entry.
入力必須フラグ122eは、項目識別子122cにより特定される項目に対する記入事項の存在が必須であるか否かを示すフラグである。例えば、図3に示す入力必須フラグ122eは、「0」が入力が必須でないことを示し、「1」が入力が必須であることを示している。 The input mandatory flag 122e is a flag indicating whether or not the entry for the item specified by the item identifier 122c is essential. For example, in the input mandatory flag 122e shown in FIG. 3, “0” indicates that the input is not essential, and “1” indicates that the input is essential.
例えば、図3に示す帳票DB122は、帳票種別識別子122aが「AA-AAA」により特定される書式の帳票について、帳票名122bが「お振込み申請書」であり、項目識別子122cが「00001」、「00003」、「00001」、「00007」等である項目を含むことを示している。
該帳票は、これらの項目識別子122cを、「00001」、「00003」、「00001」、「00007」の記載順序で含んでいる。なお、項目識別子が「00001」である項目は、図2の項目DB121によれば項目内容121bが「フリガナ」である。項目識別子が「00003」である項目は、項目内容121bが「氏名」である。
For example, in the
The form includes these item identifiers 122c in the order of “00001”, “00003”, “00001”, and “00007”. It should be noted that the item whose item identifier is “00001” has the item content 121b “reading” according to the
帳票DB122の最上段のレコードは、項目識別子122cが「00001」、つまり項目内容が「フリガナ」である項目に対して入力された記入事項が、入力欄読取識別子122dが「002」により特定される読取順序で読み取られた記載情報であることを示している。また、該記入事項は、入力必須フラグ122eが「1」、つまり入力が必須であることを示している。
In the uppermost record of the
図4は、顧客マスタDB123の一例を示す図である。顧客マスタDB123は、帳票識別子123a毎に、帳票種別識別子123bと、項目識別子123cと、項目種別123dと、入力文字列123eと、エラー情報123fとを関連付けて格納している。
FIG. 4 is a diagram illustrating an example of the
帳票識別子123aは、読み取った帳票に対して一意に付与された識別情報である。帳票種別識別子123bは、帳票識別子123aによって特定される帳票が、帳票DB122に記憶された書式と対応する場合の、書式を特定する識別情報であって、帳票DB122の帳票種別識別子122aと対応する。対応する書式が帳票DB122に存在しない場合には、帳票種別識別子123bには何も格納されない。
The form identifier 123a is identification information uniquely assigned to the read form. The form type identifier 123b is identification information for specifying a format when the form specified by the form identifier 123a corresponds to the format stored in the
項目識別子123cは、帳票に含まれる項目を特定する識別情報であって、項目DB121の項目識別子121aと対応する。項目種別123dは、項目の種別を特定する情報である。項目種別123dは、項目DB121の種別121eと対応するものである。項目種別123dは、種別を特定する記号であってもよいし、種別を示す文字列であってもよい。
The item identifier 123c is identification information that identifies an item included in the form, and corresponds to the item identifier 121a of the
入力文字列123eは、項目識別子123cによって特定される項目に対して入力された記入事項を示す文字列である。エラー情報123fは、項目識別子123cにより特定される項目又は入力文字列123eに対してエラー判定がなされた場合の、エラーの分類を特定する情報である。
The input character string 123e is a character string indicating an entry entered for the item specified by the item identifier 123c. The
上述した通り、エラー情報123fが「1」である場合は、読取が困難な文字を含む場合である。従って、図4に示す顧客マスタDB123では、項目識別子123cが「00007」、つまり項目DB121によれば項目内容121bが「現住所」である項目に対して、入力文字列123eが「東京都品川区大崎・・・」であるが、該項目と関連するエラー情報123fが「1」であるため、項目又は記載事項に読取が困難な文字が含まれることを示している。
As described above, when the
また、エラー情報123fが「2」である場合は、項目に対して記入事項が特定されないことを示す。図4の顧客マスタDB123では、項目識別子123cが「01025」である項目に対して入力文字列123eが空であり、エラー情報123fに「2」が関連付けられている。これは、本項目に対して記入事項の存在が必須であるにも関わらず、記入事項を特定することができないことを示している。
Further, when the
また、エラー情報123fが「3」である場合は、記入事項に対して項目が特定されないことを示す。図4の顧客マスタDB123では、入力文字列123eが「3/1 12:00」に対してエラー情報123fに「3」が関連付けられている。これは、本記入事項に対して項目が特定されていないことを示す。
Further, when the
図5は、情報処理装置10のハードウェア構成例を示す図である。情報処理装置10は、CPU(Central Processing Unit)130と、メモリ131と、ネットワークI/F(Interface)132と、補助記憶装置133と、入力I/F134と、出力I/F135とを備え、各構成要素はバスにより接続されている。
FIG. 5 is a diagram illustrating a hardware configuration example of the information processing apparatus 10. The information processing apparatus 10 includes a CPU (Central Processing Unit) 130, a
CPU130は中央演算装置であり、メモリ131又は補助記憶装置133に記録されたプログラムに従って処理を実行する。情報処理装置10では、メモリ131又は補助記憶装置133上に読み出されたプログラムに従って動作するCPU130により処理が行われる。制御部110を構成する各処理部は、CPU130がプログラムを実行することにより各々の機能を実現する。
The
メモリ131は、RAM(Random Access Memory)又はフラッシュメモリ等の記憶装置であり、プログラムやデータが一時的に読み出される記憶エリアとして機能する。ネットワークI/F132は、情報処理装置10をネットワークに接続するためのインターフェイスである。補助記憶装置133は、例えばHDD(Hard Disk Drive)や、CD-R(Compact Disc- Recordable)、DVD-RAM(Digital Versatile Disk-Random Access Memory)等の書き込み及び読み出し可能な記憶メディア及び記憶メディア駆動装置等である。記憶部120は、メモリ131又は補助記憶装置133によりその機能が実現される。また、記憶部120は、ネットワークI/F132を介して接続される記憶装置によってその機能が実現されてもよい。
The
入力I/F134は、システム管理者からの入力操作を受け付けるためのインターフェイスであり、例えばタッチパネル、キーボード、マウス、マイク等からの入力を受け付ける。出力I/F135は、LCD(Liquid Crystal Display)等の表示装置等に対して情報を出力するためのインターフェイスである。
The input I /
情報処理装置10の入力I/F134は、スキャナ20と接続されており、スキャナ20によって読み取られた画像データは入力I/F134を介して制御部110によって取得される。なお、スキャナ20は出力I/F135と接続されていてもよい。また、情報処理装置10が内部にスキャナを有するものであってもよい。
An input I /
なお、情報処理装置10の各構成要素の処理は、1つのハードウェアで実行されてもよいし、複数のハードウェアで実行されてもよい。また、情報処理装置10の各構成要素の処理は、1つのプログラムで実現されてもよいし、複数のプログラムで実現されてもよい。 Note that the processing of each component of the information processing apparatus 10 may be executed by one hardware or a plurality of hardware. Further, the processing of each component of the information processing apparatus 10 may be realized by a single program or may be realized by a plurality of programs.
図6は、帳票読取処理の流れを示すフローチャート(その1)である。例えば入力装置を介した、処理の開始指示を受け付けると、本フローチャートの処理が開始される。本処理によって、1枚の帳票が読み取られる。なお、書式の異同に関わらず、例えば100枚の帳票を読み取る場合には、本処理を枚数分繰り返せばよい。 FIG. 6 is a flowchart (part 1) showing the flow of the form reading process. For example, when a process start instruction is received via the input device, the process of this flowchart is started. By this processing, one form is read. Regardless of the format, for example, when 100 forms are read, this process may be repeated for the number of sheets.
まず、読取部111が、帳票を読み取る(ステップS11)。読取部111は、スキャナ20により読み取られた帳票の画像データを取得する。読取部111は、画像データを記憶部120内の図示しない領域に記憶させる。
First, the reading unit 111 reads a form (step S11). The reading unit 111 acquires image data of a form read by the
次に、記載情報抽出部112が、OCR処理を行う(ステップS12)。記載情報抽出部112は、帳票が有する枠ごとに、枠内に記載された記載情報の文字データを取得する。
Next, the written
図8は、帳票の一例である。該帳票では、左最上段の枠に「フリガナ」、該枠の右に「サトウ イチロウ」、さらに右の枠に「性別」が表示されている。記載情報抽出部112は、左上から右下への読取順序に応じて、枠内に記載された記載情報を抽出する。なお、帳票のタイトルである「お客様情報登録申込書」が枠で囲われている場合には、タイトルも記載情報として抽出される。
FIG. 8 is an example of a form. In the form, “Furigana” is displayed in the upper left frame, “Sweet Witch” is displayed to the right of the frame, and “Gender” is displayed in the right frame. The description
図9は、記載情報抽出部112により抽出された記載情報の一例を示す図である。図9に示す記載情報の一例は、図8に示す帳票から抽出されたものである。記載情報抽出部112は、抽出した記載情報の読取順序に応じて読取識別子を付する。
FIG. 9 is a diagram illustrating an example of description information extracted by the description
説明を図6に戻す。次に、記載情報抽出部112は、タイトルを特定する(ステップS13)。記載情報抽出部112は、予め指定された領域に存在する文字データを、帳票のタイトルであるとして特定する。例えば、記載情報抽出部112は、読み取った帳票の上部中央の領域に記載された文字を、タイトルとして特定する。又は、記載情報抽出部112は、ステップS12で取得した記載情報のうち、他の記載情報よりも大きい文字で記載された記載情報を、タイトルとして特定する。なお、ステップS12において、タイトルに対して読取識別子を付していた場合には、該読取識別子を削除し、新たにタイトル以外の記載情報に対して読取識別子を付する。
Returning to FIG. Next, the written
次に、項目抽出部113は、記載情報から項目を抽出する(ステップS14)。具体的には、項目抽出部113はステップS12で抽出された記載情報を用いて項目DB121を参照し、各々の記載情報と対応する項目内容121bが存在する場合に、項目内容121bと関連付けられた項目識別子121aを特定することで、項目を抽出する。項目抽出部113は、抽出した項目に対し、特定した項目識別子を関連付ける。
Next, the
例えば、図9に示す記載情報において、読取識別子が「001」と関連付けられた記載情報の「フリガナ」は、項目DB121において項目識別子121aが「00001」と対応している。そのため、項目抽出部113はこの記載情報に対して、項目識別子として「00001」を関連付ける。同様に、読取識別子が「003」である記載情報「性別」に対しては、項目識別子として「00013」を関連付け、読取識別子が「004」である記載情報「お名前」に対しては、項目識別子として「00002」を関連付ける。
For example, in the description information shown in FIG. 9, “reading” of the description information associated with the reading identifier “001” corresponds to the item identifier 121 a “00001” in the
次に、項目抽出部113は、ステップS14において項目として抽出されない記載情報に対して、属性を関連付ける(ステップS15)。具体的には、項目抽出部113は、項目として抽出されない記載情報について、所定数以上の英数字が含まれる場合に属性を「N」とし、記載情報が選択肢であると判断する場合に属性を「S」とし、記載情報がそれ以外である場合に属性を「C」として、各々の記載情報に関連付ける。例えば項目抽出部113は、記載情報に英数字が6以上含まれる場合に、属性を「N」と特定する。選択肢については後述する。
Next, the
図10は、項目識別子及び属性が関連付けられた記載情報の一例を示す図である。読取識別子が「002」で特定される記載情報である「サトウ イチロウ」については、項目識別子が関連付けられていない。項目抽出部113は、該記載情報に対して属性「C」を関連付ける。項目抽出部113は、読取識別子が「012」で特定される記載情報である「1962年7月1日」について、数字が6つ含まれるため、属性「N」を関連付ける。
FIG. 10 is a diagram illustrating an example of description information in which item identifiers and attributes are associated. An item identifier is not associated with “Satoichiro”, which is the description information identified by the reading identifier “002”. The
図11は、記載情報としての選択肢の一例を示す図である。図11(a)は、各々の選択肢に「アルファベット+“.”」が付されている。図11(b)は、各々の選択肢に対してチェックボックスが表示されている。記憶部120の図示しない領域には、選択肢を示す複数のパターンが予め記憶されており、項目抽出部113は記載情報が選択肢のパターンに当てはまる場合に、属性「S」を関連付ける。
FIG. 11 is a diagram illustrating an example of options as description information. In FIG. 11A, “alphabet +“. ”” Is added to each option. In FIG. 11B, a check box is displayed for each option. In an area (not shown) of the
選択肢のパターンには、上述の「連続するアルファベット+“.”」、「複数のチェックボックス」の他、「連続する複数の数字+“.”」、「連続する複数のかな文字“.”」等がある。図10において、読取識別子が「006」で特定される読取情報の「1.男 2.女」(「1」は丸で囲われている)については、項目抽出部113は「連続する複数の数字+“.”」であると判断し、属性「S」を付与する。
In addition to the above-mentioned “continuous alphabet +“. ”” And “multiple check boxes”, the selection pattern includes “continuous multiple numbers +“. ””, “Continuous multiple kana characters“. ””. Etc. In FIG. 10, for the read information “1. male 2. female” (“1” is circled) specified by the read identifier “006”, the
なお、項目抽出部113は、記載情報の属性が選択肢であると判断した場合、どの選択肢が選択されているかを判断し、選択された肢で記載情報を上書きしてもよい。これにより、選択された肢を用いて顧客データDBを生成することができる。
When the
説明を図6に戻す。次に、候補帳票特定部116は、読み取った帳票に含まれるタイトルと、項目識別子と、各項目識別子の順序とを用いて帳票DBを参照し、タイトルと、項目識別子と、各項目識別子の順序とが一致するデータが帳票DB122内にあるか否かを判定する(ステップS16)。具体的には、候補帳票特定部116は、ステップS13で特定したタイトルと、ステップS14で抽出した項目の項目識別子とを用いて、項目DB121を参照する。候補帳票特定部116は、特定したタイトルと対応する帳票名122bと関連付けられた項目識別子122cが、抽出した項目識別子と対応するか否かを判定する。
Returning to FIG. Next, the candidate
前述したように、帳票DB122の項目識別子122cは、帳票に対する記載順序に応じて格納されている。候補帳票特定部116は、さらにステップS14で抽出した項目の項目識別子に対して付された読取識別子を用いて読取順序を特定し、該読取順序と帳票DB122における各項目識別子122cの記載順序とが対応するデータが帳票DB122内にあるか否かを判定する。
As described above, the item identifier 122c of the
候補帳票特定部116が、読み取った帳票に含まれるタイトルと、項目識別子と、各項目識別子の順序とが一致するデータが帳票DB122内にあると判定した場合(ステップS16で「YES」の場合)、記入事項特定部114は、各項目に対する入力必須フラグと記載事項とを特定する(ステップS17)。具体的には、記入事項特定部114は、ステップS16において読み取った帳票に含まれるタイトルと、項目識別子と、各項目識別子の順序とが一致すると判定した帳票DB122内のデータを参照する。記入事項特定部114は、ステップS14で抽出された項目の項目識別子の各々と、帳票DB122において対応する項目識別子122cを特定する。記入事項特定部114は、特定した項目識別子122cと関連付けられた入力欄読取識別子122dと、入力必須フラグ122eとを特定する。
When the candidate
記入事項特定部114は、特定した各々の入力欄読取識別子122dと、ステップS12で記載情報に対して付した読取識別子とが対応する記載情報を、各項目に対する記入事項として特定する。記入事項特定部114は、抽出された各項目識別子と、これに対する記入事項と、入力必須フラグとを関連付ける。
The
次に、エラー判定部118は、(1)項目識別子と関連する記入事項がない、(2)記入事項と関連する項目識別子がない、(3)記載情報に所定のエラーがある、の少なくとも1つに該当する場合に記載情報に対してエラー情報を関連付ける(ステップS18)。具体的には、エラー判定部118は、ステップS17で特定した入力必須フラグが、入力必須であることを示す項目に対して、同ステップで記入事項が関連付けられていない場合に、項目識別子と関連する記入事項がないことを示すエラー情報を、項目識別子に対して関連付ける。 Next, the error determination unit 118 has at least one of (1) no entry related to the item identifier, (2) no item identifier related to the entry, and (3) a predetermined error in the written information. If this is the case, error information is associated with the written information (step S18). Specifically, the error determination unit 118 associates the item identifier with the item identifier when the input mandatory flag identified in step S17 is not associated with the item indicating that the input is mandatory in the same step. Error information indicating that there is no entry to be associated is associated with the item identifier.
また、エラー判定部118は、ステップS14で項目として抽出されていない記載情報であって、ステップS17において項目識別子と関連付けられなかった記載情報に対して、記入事項と関連する項目識別子がないことを示すエラー情報を関連付ける。なお、換言すれば、項目として抽出されていない記載情報であって、項目識別子と関連付けられなかった記載情報は、項目とも記入事項とも特定されない記載情報であると云える。 In addition, the error determination unit 118 confirms that there is no item identifier associated with the entry for the description information that is not extracted as an item in step S14 and is not associated with the item identifier in step S17. Associate the error information shown. In other words, it can be said that the description information that is not extracted as an item and that is not associated with the item identifier is description information that is not specified as an item or an entry.
また、エラー判定部118は、記入事項に所定のエラーがある場合に、その旨を示すエラー情報を記載情報に対して関連付ける。所定のエラーとは、例えば記載情報が読取困難である文字を含む場合である。また例えば、エラー判定部118は、項目に対して付された項目識別子と、該項目に対して関連付けられた記入事項とを用いて項目DB121を参照し、対応する項目識別子121aと関連付けられた桁数121cを記入事項が超える場合、又は属性121dが記入事項の属性と異なる場合に、その旨を示すエラー情報を記載情報に関連付けてもよい。
In addition, when there is a predetermined error in the entry, the error determination unit 118 associates error information indicating that with the description information. The predetermined error is, for example, a case where written information includes characters that are difficult to read. For example, the error determination unit 118 refers to the
次に、顧客情報生成部115は、各項目識別子と入力情報とを対応させて顧客マスタDB123を作成する(ステップS19)。具体的には、顧客情報生成部115は、帳票に対して帳票識別子123aを付し、ステップS16において書式が対応すると判定された帳票DB122の帳票種別識別子122aを帳票種別識別子123bとして関連付ける。顧客情報生成部115は、ステップS14で抽出した項目の項目識別子を、項目識別子123cとして読取順序に応じて帳票識別子123aに関連付ける。
Next, the customer
また、顧客情報生成部115は、各々の項目識別子123cと項目DB121において対応する項目識別子121aを参照し、該項目識別子121aと関連する種別121eを特定する。顧客情報生成部115は、特定した種別121eを項目種別123dとして項目識別子123cに関連付ける。なお、項目種別123dは、項目の種別を示す文字列であってもよい点については、上述の通りである。
Further, the customer
また、顧客情報生成部115は、各々の項目識別子123cに対して、ステップS17で関連付けた記入事項を入力文字列123eとして関連付ける。
Further, the customer
また、項目として抽出されず、さらに項目識別子と関連付けられなかった記載情報を入力文字列123dに格納する。各項目識別子123c、又は入力文字列123eにより特定される記載情報に対して、ステップS18でエラー情報が関連付けられている場合には、関連付けられたエラー情報をエラー情報123fに格納し、顧客マスタDB123を生成する。なお、エラー情報は1つの記載情報に対して複数関連付けられてもよい。顧客情報生成部115は、その後本フローチャートの処理を終了する。
Also, the description information that is not extracted as an item and is not associated with the item identifier is stored in the
ステップS16において、候補帳票特定部116が、読み取った帳票に含まれるタイトルと、項目識別子と、各項目識別子の順序とが一致するデータが帳票DB122内にあると判定しない場合(ステップS16で「NO」の場合)、候補帳票特定部116は、処理をステップS20に進める。
In step S16, the candidate
図7は、帳票読取処理の流れを示すフローチャート(その2)である。 FIG. 7 is a flowchart (part 2) showing the flow of the form reading process.
次に、候補帳票特定部116は、読み取った帳票に含まれるタイトルと、各項目識別子と、各項目識別子の順序とが一致する仮帳票のデータが仮登録記憶領域124内にあるか否かを判定する(ステップS20)。
Next, the candidate
仮帳票記憶領域には、本処理開始前に読み取られた帳票であって、帳票のタイトル、帳票に含まれる項目、又は項目の記載順序が帳票DB122内のデータと異なる帳票に関するデータが格納されている。仮帳票記憶領域には、帳票毎に、帳票のタイトルと関連付けられて、帳票に含まれる項目、及び項目の記載順序を含む記載情報が格納されている。
In the temporary form storage area, data relating to forms that have been read before the start of the process and whose form title, items included in the form, or the order in which items are described differs from the data in the
候補帳票特定部116は、ステップS13で特定したタイトルと、ステップS14で抽出した項目の項目識別子とを用いて、仮帳票記憶領域を参照する。候補帳票特定部116は、特定したタイトルと、抽出した項目とが一致する仮帳票記憶領域内のデータを特定する。また、候補帳票特定部116は、ステップS14で抽出した項目の項目識別子に対して付された読取識別子を用いて読取順序を特定し、仮帳票記憶領域内で特定したデータを参照する。候補帳票特定部116は、特定したデータの内、項目の読取順序が記載順序と一致するデータがあるか否かを判定する。
The candidate
候補帳票特定部116が、帳票に含まれるタイトルと、各項目識別子と、各項目識別子の順序とが一致するデータが仮登録記憶領域124内にあると判定した場合(ステップS20で「YES」の場合)、記入事項特定部114は、各項目に対する記入事項を特定する(ステップS21)。
When the candidate
記入事項特定部114による記入事項の特定について、図10の記載情報を用いて説明する。まず、記入事項特定部114は、項目識別子が関連付けられた記載情報のうち、最も読取識別子が若い記載情報を特定する。記入事項特定部114は、該記載情報と関連付けられた項目識別子を用いて項目DB121を参照し、該項目識別子と対応する項目識別子121aと関連付けられた属性121dを特定する。次に、記入事項特定部114は、特定した記載情報よりも記載順序が後である記載情報であって、項目識別子が関連付けられていない記載情報を、特定した記載情報に近い順に特定する。記入事項特定部114は、特定した記載情報が属性121dと適合する場合に、該記載情報を項目識別子に対する記入事項であるとして特定する。
Identification of the entry by the
なお、記入事項特定部114は、項目DBにおいて項目識別子121aと関連付けられた桁数121cをさらに用いて、対応する記入事項を特定してもよい。具体的には、記入事項特定部114は、属性が適合すると判断された記載情報が、項目と関連する桁数121cを超える場合には、記載情報が該項目に対応するものでないと判断する。
The
記入事項特定部114は、項目識別子が関連付けられた記載情報の全てに対して、読取順序が若い順から上記の処理を繰り返す。
The
図10では、項目識別子が関連付けられた記載情報であって、最も読取識別子が若い記載情報は、読取識別子が「001」に係る記載情報である。該記載情報は、項目識別子が「00001」に係る項目と関連付けられている。記入事項特定部114は、項目識別子として「00001」を用いて項目DB121を参照し、該項目識別子121aと関連付けられた属性121dとして「C」を特定する。なお、属性「C」は、全角文字を示す。
In FIG. 10, the description information associated with the item identifier and having the smallest reading identifier is the description information relating to the reading identifier “001”. The described information is associated with an item having an item identifier “00001”. The
次に、記入事項特定部114は、読取識別子「001」に係る記載情報よりも後の記載情報であって、項目識別子が関連付けられていない記載情報のうち、最も読取識別子「001」に近い読取順序の記載情報を特定する。従って、記入事項特定部114は、読取識別子「002」に係る記載情報を特定する。読取識別子「002」は、記載情報「サトウ イチロウ」と関連付けられている。記入事項特定部114は、記載情報「サトウ イチロウ」が属性「C」と適合するか否かを判定する。「サトウ イチロウ」は全角文字で記載されているため、属性「C」と適合すると判定される。記入事項特定部114は、読取識別子「002」に係る記載情報が、読取識別子「001」に係る項目に対する記入事項として特定する。
Next, the
次に、記入事項特定部114は、項目識別子が関連付けられた記載情報であって、読取識別子「001」の次に読取順序が若い記載情報として、読取識別子「003」に係る記載情報を特定する。読取識別子「003」に係る記載情報は、項目識別子「00013」と関連付けられており、該項目と項目DB121において関連付けられた属性は「S」である。
Next, the
記入事項特定部114は、読取識別子「003」に係る記載情報よりも読取順序が後である記載情報であって、項目識別子が関連付けられていない記載情報のうち、最も読取順序が若い記載情報として、読取識別子「005」に係る記載情報を特定する。読取識別子「005」は記載情報「佐藤一郎」と関連しているが、記載情報「佐藤一郎」の属性は全角文字である「C」であって、項目識別子と関連付けられている属性「S」ではない。
The
次に、記入事項特定部114は、次に読取順序が若い記載情報である、読取識別子「006」と関連付けられた記載情報を特定する。該記載情報は、選択肢であるため、属性「S」と適合する。従って、記入事項特定部114は、読取識別子「006」に係る記載情報が、読取識別子「003」に係る項目に対する記入事項として特定する。
Next, the
上述の処理に従って、図10に係る記載情報に含まれる項目の各々について、記入事項を特定した結果、図10右側に示す矢印によって現される対応関係を得る。 As a result of specifying the entry items for each of the items included in the description information according to FIG. 10 according to the above-described processing, the correspondence relationship indicated by the arrow shown on the right side of FIG.
次に、候補帳票特定部116は、各項目と各記入事項とが1対1であるか否かを判定する(ステップS22)。具体的には、候補帳票特定部116は、記載情報のうち、項目識別子と関連付けられず、かつステップS21において記入事項として項目識別子と関連付けられない記載情報がない場合に、各項目と各記入事項とが1対1であると判定する。
Next, the candidate
候補帳票特定部116が、各項目と各記入事項とが1対1であると判定した場合(ステップS22で「YES」の場合)、エラー判定部118は、記載情報に所定のエラーがある場合に、その旨を示すエラー情報を記載情報に関連付ける(ステップS23)。上述したように、所定のエラーとは、例えば読取部111が読取不能であった文字が記載情報に含まれる場合等である。
When the candidate
次に、顧客情報生成部115は、本処理において読み取った帳票について、各項目識別子と入力情報とを対応させて顧客マスタDB123を作成する(ステップS24)。本ステップによる処理の対象となる帳票は、帳票DB122に予め定められた書式に則ったものでないものの、本処理開始前に読み取られた帳票と書式が共通し、かつ各項目と記入事項とが過不足なく対応する帳票である。本ステップでは、本処理において読み取られた帳票について、顧客マスタDB123を生成する。
Next, the customer
具体的には、顧客情報生成部115は、帳票に対して帳票識別子123aを付し、ステップS14で抽出した項目の項目識別子を、項目識別子123cとして記載順序に応じて帳票識別子123aに関連付ける。また、顧客情報生成部115は、各々の項目識別子123cと項目DB121において対応する項目識別子121aを参照し、該項目識別子121aと関連する種別121eを特定し、項目種別として項目識別子123cに関連付ける。また、顧客情報生成部115は、各々の項目識別子123cに対して、ステップS21で関連付けた記入事項を入力文字列123eとして関連付ける。また、ステップS23において記載情報にエラー情報が関連付けられた場合には、該記載情報にエラー情報123fを関連付ける。
Specifically, the customer
次に、顧客情報生成部115は、仮帳票の各項目と記入事項とが1対1である場合に、各項目識別子と入力情報とを対応させて、顧客マスタDBを作成するとともに、仮帳票を仮登録記憶領域124から削除する(ステップS25)。具体的には、顧客情報生成部115は、ステップS20において、読み取った帳票に含まれるタイトルと、各項目識別子と、各項目識別子の順序とが一致すると判定された仮登録記憶領域124内のデータ(仮帳票)を用いて、顧客マスタDBを生成する。仮登録記憶領域124内には、例えば図10に示す記載情報が、帳票のタイトルと関連付けられて格納されている。顧客情報生成部115は、仮登録記憶領域124内の仮帳票に対して帳票識別子123aを付し、項目識別子123cと、項目種別123dと、入力文字列123eとを関連付ける。ステップS23において記載情報にエラー情報が関連付けられた場合には、該記載情報にエラー情報123fを関連付ける。
Next, the customer
また、顧客情報生成部115は、該仮帳票のデータを仮登録記憶領域124から削除する。その後、顧客情報生成部115は、本フローチャートの処理を終了する。
Further, the customer
ステップS22において、候補帳票特定部116が、各項目と各記入事項とが1対1であると判定しない場合(ステップS22で「NO」の場合)、エラー判定部118は、(1)項目識別子と関連する記入事項がない、(2)記入事項と関連する項目識別子がない、(3)記載情報に所定のエラーがある、の少なくともいずれか1つに該当する場合に、エラー情報を関連付ける(ステップS26)。具体的には、エラー判定部118は、ステップS14で抽出した項目に対してステップS21で記入事項が特定されない場合に、項目識別子と関連する記入事項がないことを示すエラー情報を、項目識別子に対して関連付ける。
In step S22, when the candidate
また、エラー判定部118は、ステップS14で項目として抽出されていない記載情報であって、ステップS21において項目識別子と関連付けられなかった記載情報に対して、記入事項と関連する項目識別子がないことを示すエラー情報を関連付ける。また、エラー判定部118は、記入事項に所定のエラーがある場合に、その旨を示すエラー情報を記載情報に対して関連付ける。 Further, the error determination unit 118 confirms that there is no item identifier associated with the entry for the description information that is not extracted as an item in step S14 and is not associated with the item identifier in step S21. Associate the error information shown. In addition, when there is a predetermined error in the entry, the error determination unit 118 associates error information indicating that with the description information.
次に、仮帳票生成部117は、各項目識別子と入力情報とを対応させた仮帳票と、帳票の画像データとを仮登録記憶領域124に記憶させる(ステップS27)。具体的には、仮帳票生成部117は、ステップS12で取得した記載情報に対して、読取識別子と、ステップS14で抽出した項目識別子と、ステップS21で特定した記入事項の読取識別子とを関連付けて、ステップS13で特定したタイトルと対応させて仮帳票を生成し、仮登録記憶領域124に記憶させる。仮帳票は、例えば図10に示す記載情報である。
Next, the temporary
また、仮帳票生成部117は、ステップS11において読取部111に読み取られた画像データを記憶部120から読み出し、仮帳票と関連付ける。その後、仮帳票生成部117は、本フローチャートの処理を終了する。
Further, the temporary
ステップS20において、候補帳票特定部116が、帳票に含まれるタイトルと、各項目識別子と、各項目識別子の順序とが一致するデータが仮登録記憶領域124内にあると判定しない場合(ステップS20で「NO」の場合)、記入事項特定部114は、各項目に対する記入事項を特定する(ステップS28)。ステップS28で行われる処理は、ステップS21で行われる処理と同様であるため、説明を省略する。
In step S20, the candidate
次に、エラー判定部118は、ステップS12で取得した記載情報について、(1)項目識別子と関連する記入事項がない、(2)記入事項と関連する項目識別子がない、(3)記載情報に所定のエラーがある、の少なくともいずれか1つに該当する場合にエラー情報を関連付ける(ステップS29)。ステップS29からステップS30において行われる処理は、ステップS26からステップS27で行われる処理と同様であるため、説明を省略する。 Next, the error determination unit 118 (1) there is no entry related to the item identifier, (2) there is no item identifier related to the entry, (3) the description information acquired in step S12. When at least one of the predetermined errors is found, error information is associated (step S29). The processing performed from step S29 to step S30 is the same as the processing performed from step S26 to step S27, and thus description thereof is omitted.
本実施形態により、読み取った帳票が帳票DB122に予め記憶された書式と対応する場合は、該書式に則って顧客マスタDB123を生成する。帳票DB122と対応しない場合には、本処理よりも前に読み取った帳票の書式に関する情報が格納された仮登録記憶領域124を参照し、該記憶領域内の仮帳票の書式と対応する場合であって、項目と該項目に対する記入事項との対が特定される場合には、これらを用いて顧客マスタDB123を生成する。これにより、取り扱う帳票の書式を予め登録する必要がなく、効率的に記載情報の抽出を行うことができる。
According to the present embodiment, when the read form corresponds to the format stored in advance in the
また、本処理を帳票の数の分だけ繰り返すことにより、種類の異なる帳票に関する顧客マスタDBを好適に作成することができる。特に、種類の異なる帳票を扱うサービサーにあっては、帳票を種類毎に仕分けする必要がなく、作業効率が向上する。 Further, by repeating this process for the number of forms, a customer master DB relating to different types of forms can be suitably created. In particular, in a servicer that handles forms of different types, it is not necessary to sort the forms for each type, and work efficiency is improved.
また、項目に対する記入事項が不明な場合等、そのまま顧客マスタDB123を生成すると正確性に問題が生じると考えられる場合には、エラー情報を添付することで、後述する帳票修正画面140を用いた修正を促すことができ、適切に顧客マスタDB123を生成することができる。
In addition, when it is considered that there is a problem in accuracy if the
なお、本実施形態では、ステップS21において、各項目識別子を用いて項目DB121を参照し、項目識別子121aと関連付けられた属性121d(及び桁数121c)を用いて記入事項を特定した。しかしながら、項目に対する記入事項が記載順序に基づいて特定可能であれば、必ずしも属性121d及び桁数121cを用いる必要はない。属性121d及び桁数121cを参照する処理を省くことで、本情報処理装置10に係る負荷を軽減することができる。
In this embodiment, in step S21, the
図12は、帳票修正画面140の一例を示す図である。仮登録記憶領域124に記憶された帳票については、本画面で内容を修正することができる。表示部119は、例えば入力装置を介した入力に基づいて、仮登録記憶領域124に記憶された帳票の選択を受け付けることにより、本画面を表示装置に対して表示させる。なお、表示部119は、所定のエラー情報を含む帳票が仮登録記憶領域124に記憶される場合に、自動的に本画面を表示させてもよい。本画面は、帳票毎に表示される。
FIG. 12 is a diagram illustrating an example of the form correction screen 140. The contents of the form stored in the temporary
帳票修正画面140は、記載情報選択領域141と、文字列変更ボタン142と、対応変更ボタン143と、顧客情報生成ボタン144とを含む。また、帳票修正画面140は、該帳票に含まれる記載事項が、(1)項目識別子と関連する記入事項がない、又は(2)記入事項と関連する項目識別子がない、のいずれかであることを示すエラー情報と関連付けられている場合に、項目と記入事項とが対応していない旨を表示する領域を含むものであってもよい。
The form correction screen 140 includes a description
記載情報選択領域141には、帳票に含まれる記載情報が選択可能に表示される。文字列変更ボタン142は、記載情報に含まれる文字列の変更を受け付けるためのボタンである。記載情報選択領域141に表示された記載情報が選択され、文字列変更ボタン142の入力を受け付けると、記載情報中の文字列の変更に関する入力を受け付ける画面に表示画面が遷移する。例えば記載情報抽出部112により抽出された記入事項に係る文字列を変更する場合に、この操作がなされる。
In the description
対応変更ボタン143は、記載情報の追加や変更を受け付けるためのボタンである。記載情報選択領域141に表示された記載情報が選択され、対応変更ボタン143の入力を受け付けると、記載情報の追加と、項目及び記入事項の対応関係に関する入力を受け付ける画面に表示画面が遷移する。例えば、記載情報抽出部112によって抽出されなかった記載情報を追加する場合や、項目抽出部113によって抽出された項目に対して記入事項を対応付ける場合等に、この操作がなされる。
The
顧客情報生成ボタン144は、本帳票に基づいた顧客マスタDB123の生成指示を受け付けるためのボタンである。顧客情報生成ボタン144が入力されると、本帳票に基づいて顧客マスタDB123が生成される。
The customer information generation button 144 is a button for receiving a generation instruction of the
本表示画面によって、エラー判定部118によりエラー判定がなされた記載情報について、エラーの修正を行うことができる。仮登録記憶領域124に記憶された帳票であっても、本画面に基づいた操作を行うことにより、適切な修正を受け付けた後に、顧客マスタDB123を生成することができる。これにより、読み取られた帳票に基づく適切な顧客マスタDB123の生成が担保される。
With this display screen, it is possible to correct the error for the description information for which the error determination unit 118 has determined the error. Even for the forms stored in the temporary
なお、本表示画面による操作を行うにあたり、仮帳票と関連付けて記憶部120に記憶された画像データを本表示画面と併せて表示してもよい。これにより、読み取った画像と本表示画面とを照合することができ、効率性が向上する。
Note that when performing an operation on the main display screen, the image data stored in the
以上、本発明に係る各実施形態の説明を行ってきたが、本発明は、上記した実施形態の一例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施形態の一例は、本発明を分かり易くするために詳細に説明したものであり、本発明は、ここで説明した全ての構成を備えるものに限定されない。また、ある実施形態の一例の構成の一部を他の一例の構成に置き換えることが可能である。また、ある実施形態の一例の構成に他の一例の構成を加えることも可能である。また、各実施形態の一例の構成の一部について、他の構成の追加・削除・置換をすることもできる。また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、図中の制御線や情報線は、説明上必要と考えられるものを示しており、全てを示しているとは限らない。ほとんど全ての構成が相互に接続されていると考えてもよい。 As mentioned above, although each embodiment which concerns on this invention has been demonstrated, this invention is not limited to an example of above-described embodiment, Various modifications are included. For example, the above-described exemplary embodiment has been described in detail for easy understanding of the present invention, and the present invention is not limited to the one having all the configurations described here. A part of the configuration of an example of an embodiment can be replaced with the configuration of another example. Moreover, it is also possible to add the structure of another example to the structure of an example of a certain embodiment. In addition, for a part of the configuration of an example of each embodiment, another configuration can be added, deleted, or replaced. Each of the above-described configurations, functions, processing units, processing means, and the like may be realized by hardware by designing a part or all of them with, for example, an integrated circuit. In addition, the control lines and information lines in the figure indicate what is considered necessary for the description, and do not necessarily indicate all of them. It can be considered that almost all configurations are connected to each other.
また、上記の情報処理装置10の機能構成は、理解を容易にするために、主な処理内容に応じて分類したものである。構成要素の分類の仕方や名称によって、本願発明が制限されることはない。情報処理装置10の構成は、処理内容に応じて、さらに多くの構成要素に分類することもできる。また、1つの構成要素がさらに多くの処理を実行するように分類することもできる。 In addition, the functional configuration of the information processing apparatus 10 is classified according to main processing contents in order to facilitate understanding. The present invention is not limited by the way of classification and names of the constituent elements. The configuration of the information processing apparatus 10 can be classified into more components depending on the processing content. Moreover, it can also classify | categorize so that one component may perform more processes.
10:情報処理装置、20:スキャナ、110:制御部、111:読取部、112:記載情報抽出部、113:項目抽出部、114:記入事項特定部、115:顧客情報生成部、116:候補帳票特定部、117:仮帳票生成部、118:エラー判定部、119:表示部、120:記憶部、121:項目DB、122:帳票DB、123:顧客マスタDB、124:仮登録記憶領域、130:CPU、131:メモリ、132:ネットワークI/F、133:補助記憶装置、134:入力I/F、135:出力I/F、140:帳票修正画面、141:記載情報選択領域、142:文字列変更ボタン、143:対応変更ボタン、144:顧客情報生成ボタン 10: Information processing device, 20: Scanner, 110: Control unit, 111: Reading unit, 112: Description information extraction unit, 113: Item extraction unit, 114: Item specification unit, 115: Customer information generation unit, 116: Candidate Form specifying unit, 117: provisional form generation unit, 118: error determination unit, 119: display unit, 120: storage unit, 121: item DB, 122: form DB, 123: customer master DB, 124: temporary registration storage area, 130: CPU, 131: Memory, 132: Network I / F, 133: Auxiliary storage device, 134: Input I / F, 135: Output I / F, 140: Form correction screen, 141: Description information selection area, 142: Character string change button, 143: correspondence change button, 144: customer information generation button
Claims (7)
帳票を読み取る読取部と、
前記読取部により読み取られた帳票から記載情報を抽出する記載情報抽出部と、
前記記載情報から、前記項目候補と対応する前記項目を抽出する項目抽出部と、
前記読取部による前記記載情報の読取順序に基づいて、前記項目に対する記入事項を前記記載情報から特定する記入事項特定部と、
前記項目と、該項目に対する前記記入事項とを関連付けた顧客情報を生成する顧客情報生成部と、
を備えることを特徴とする情報処理装置。
A storage unit that stores item information related to item candidates that are candidates for items included in the form;
A reading unit for reading a form;
A description information extraction unit that extracts description information from the form read by the reading unit;
An item extraction unit for extracting the item corresponding to the item candidate from the description information;
Based on the reading order of the description information by the reading unit, an entry specifying unit for specifying an entry for the item from the description information;
A customer information generating unit that generates customer information in which the item and the entry for the item are associated;
An information processing apparatus comprising:
前記項目情報は、前記項目候補と、該項目に対する前記記入事項の属性とを関連付けており、
前記記入事項特定部は、前記読取順序と、前記項目抽出部により抽出された前記項目と前記項目情報において関連付けられた前記属性と、に基づいて、前記項目に対する前記記入事項を特定することを特徴とする情報処理装置。
The information processing apparatus according to claim 1,
The item information associates the item candidate with the attribute of the entry for the item,
The entry specifying unit specifies the entry for the item based on the reading order, the item extracted by the item extracting unit, and the attribute associated with the item information. Information processing apparatus.
前記読取部により読み取られた帳票と対応する帳票候補が前記記憶部に記憶されているか否かを判定する候補帳票特定部を備え、
前記記憶部には、前記項目に対し、該項目の記載順序と、該項目への前記記入事項の前記記載順序とを関連付けた帳票情報が前記帳票候補として前記帳票毎に記憶され、
前記記載情報抽出部は、
前記候補帳票特定部が前記項目抽出部により抽出された前記項目と該項目の読取順序とを用いて前記帳票情報を参照し、該読取順序と前記項目の前記記載順序とが対応する前記帳票情報が前記記憶部に記憶されていると判定した場合に、前記帳票情報における前記記入事項の前記記載順序と対応する前記読取順序で読み取られた前記記載情報を前記記入事項として特定し、
前記顧客情報生成部は、前記帳票情報を用いて前記項目と前記記入事項とを関連付けることを特徴とする情報処理装置。
An information processing apparatus according to claim 2,
A candidate form specifying unit that determines whether a form candidate corresponding to the form read by the reading unit is stored in the storage unit;
The storage unit stores, for each of the forms, form information that associates the description order of the items with the description order of the entries in the items for each item as the form candidate,
The described information extraction unit
The candidate form specifying unit refers to the form information using the items extracted by the item extracting unit and the reading order of the items, and the form information corresponding to the reading order and the description order of the items Is determined to be stored in the storage unit, the description information read in the reading order corresponding to the description order of the entries in the form information is specified as the entry,
The information processing apparatus, wherein the customer information generation unit associates the item with the entry using the form information.
前記候補帳票特定部により、前記読取順序と前記記載順序とが対応する前記帳票が前記帳票情報に含まれると判定されない帳票について、前記項目抽出部により抽出された前記項目と、該項目の記載順序と、を用いて仮帳票を生成する仮帳票生成部を備え、
前記記憶部には、前記帳票候補として前記仮帳票が記憶され、
前記候補帳票特定部は、前記帳票の前記読取順序と前記記載順序とが対応する前記仮帳票が前記記憶部に記憶されているか否かを判定し、
前記記入事項特定部は、前記候補帳票特定部により前記仮帳票が記憶されていると判定された場合に、前記仮帳票に含まれる前記記載順序を用いて前記記入事項を特定することを特徴とする情報処理装置。
The information processing apparatus according to claim 3,
The items extracted by the item extraction unit and the description order of the items for the forms that are not determined to be included in the form information by the candidate form specifying unit, the forms corresponding to the reading order and the description order. And a temporary form generation unit that generates a temporary form using
The storage unit stores the temporary form as the form candidate,
The candidate form specifying unit determines whether or not the temporary form corresponding to the reading order and the description order of the form is stored in the storage unit,
The entry specifying unit specifies the entry using the description order included in the temporary form when the candidate form specifying unit determines that the temporary form is stored. Information processing apparatus.
前記記載情報のうち、前記項目に対する前記記入事項が前記記入事項特定部により特定されない場合、又は前記項目とも前記記入事項とも特定されない前記記載情報が存在する場合に、エラー判定を行うエラー判定部と、
前記エラー判定部によりエラー判定がされた場合に、帳票修正画面を表示する表示部とを備え、
前記帳票修正画面は、前記記載情報に対する前記項目又は前記記入事項の指定を受け付けることを特徴とする情報処理装置。
An information processing apparatus according to any one of claims 1 to 4,
Among the description information, when the entry for the item is not specified by the entry specification unit, or when there is the description information that is neither specified by the item nor the entry, an error determination unit that performs error determination; ,
A display unit that displays a form correction screen when an error is determined by the error determination unit;
The information processing apparatus, wherein the form correction screen accepts designation of the item or the entry for the description information.
前記制御部は、
帳票に含まれる項目の候補である項目候補に関する項目情報を記憶する記憶部と、
帳票を読み取る読取ステップと、
前記読取ステップにおいて読み取られた帳票から記載情報を抽出する記載情報抽出ステップと、
前記記憶部に記憶された前記帳票に含まれる項目の候補である項目候補と対応する前記項目を前記記載情報から抽出する項目抽出ステップと、
前記読取ステップにおける前記記載情報の読取順序に基づいて、前記項目に対する記入事項を前記記載情報から特定する記入事項特定ステップと、
前記項目と、該項目に対する前記記入事項とを関連付けた顧客情報を生成する顧客情報生成ステップと、
を備えることを特徴とする帳票読取方法。
A form reading method using an information processing apparatus including a control unit,
The controller is
A storage unit that stores item information related to item candidates that are candidates for items included in the form;
A reading step for reading a form;
A description information extraction step of extracting description information from the form read in the reading step;
An item extraction step of extracting the item corresponding to an item candidate that is a candidate for an item included in the form stored in the storage unit from the description information;
Based on the reading order of the description information in the reading step, an entry specification step for specifying an entry for the item from the description information;
A customer information generating step for generating customer information in which the item and the entry for the item are associated;
A form reading method comprising:
前記コンピューターを、制御手段として機能させ、
前記制御手段に対して、
帳票に含まれる項目の候補である項目候補に関する項目情報を記憶する記憶部と、
帳票を読み取る読取ステップと、
前記読取ステップにおいて読み取られた帳票から記載情報を抽出する記載情報抽出ステップと、
前記記憶部に記憶された前記帳票に含まれる項目の候補である項目候補と対応する前記項目を前記記載情報から抽出する項目抽出ステップと、
前記読取ステップにおける前記記載情報の読取順序に基づいて、前記項目に対する記入事項を前記記載情報から特定する記入事項特定ステップと、
前記項目と、該項目に対する前記記入事項とを関連付けた顧客情報を生成する顧客情報生成ステップと、
を実行させることを特徴とするプログラム。 A program for causing a computer to execute a step of performing a form reading process,
Causing the computer to function as control means;
For the control means,
A storage unit that stores item information related to item candidates that are candidates for items included in the form;
A reading step for reading a form;
A description information extraction step of extracting description information from the form read in the reading step;
An item extraction step of extracting the item corresponding to an item candidate that is a candidate for an item included in the form stored in the storage unit from the description information;
Based on the reading order of the description information in the reading step, an entry specification step for specifying an entry for the item from the description information;
A customer information generating step for generating customer information in which the item and the entry for the item are associated;
A program characterized by having executed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014053081A JP6541936B2 (en) | 2014-03-17 | 2014-03-17 | Information processing apparatus, form reading method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014053081A JP6541936B2 (en) | 2014-03-17 | 2014-03-17 | Information processing apparatus, form reading method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015176410A true JP2015176410A (en) | 2015-10-05 |
JP6541936B2 JP6541936B2 (en) | 2019-07-10 |
Family
ID=54255535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014053081A Expired - Fee Related JP6541936B2 (en) | 2014-03-17 | 2014-03-17 | Information processing apparatus, form reading method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6541936B2 (en) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02139686A (en) * | 1988-11-21 | 1990-05-29 | Fuji Electric Co Ltd | Character reading method |
US5237628A (en) * | 1991-06-03 | 1993-08-17 | Nynex Corporation | System and method for automatic optical data entry |
JPH11353411A (en) * | 1998-06-08 | 1999-12-24 | Oki Electric Ind Co Ltd | Character recognizing device |
JP2000029983A (en) * | 1998-07-10 | 2000-01-28 | Oki Electric Ind Co Ltd | Document reader device |
JP2003296586A (en) * | 2002-03-29 | 2003-10-17 | Hitachi Kokusai Electric Inc | Image processing system |
JP2007087021A (en) * | 2005-09-21 | 2007-04-05 | Fujitsu Ltd | Electronic documentation device for paper document, electronic documentation method for paper document, and electronic documentation program for paper document |
JP2008204226A (en) * | 2007-02-21 | 2008-09-04 | Hitachi Computer Peripherals Co Ltd | Form recognition device and its program |
JP2008299748A (en) * | 2007-06-01 | 2008-12-11 | Oki Electric Ind Co Ltd | Ocr document registration system |
JP2009223391A (en) * | 2008-03-13 | 2009-10-01 | Fuji Xerox Co Ltd | Image processor and image processing program |
JP2011248609A (en) * | 2010-05-26 | 2011-12-08 | Hitachi Omron Terminal Solutions Corp | Form recognition device and form recognition method |
JP2013218364A (en) * | 2012-04-04 | 2013-10-24 | Canon Inc | Image processing system |
-
2014
- 2014-03-17 JP JP2014053081A patent/JP6541936B2/en not_active Expired - Fee Related
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02139686A (en) * | 1988-11-21 | 1990-05-29 | Fuji Electric Co Ltd | Character reading method |
US5237628A (en) * | 1991-06-03 | 1993-08-17 | Nynex Corporation | System and method for automatic optical data entry |
JPH11353411A (en) * | 1998-06-08 | 1999-12-24 | Oki Electric Ind Co Ltd | Character recognizing device |
JP2000029983A (en) * | 1998-07-10 | 2000-01-28 | Oki Electric Ind Co Ltd | Document reader device |
JP2003296586A (en) * | 2002-03-29 | 2003-10-17 | Hitachi Kokusai Electric Inc | Image processing system |
JP2007087021A (en) * | 2005-09-21 | 2007-04-05 | Fujitsu Ltd | Electronic documentation device for paper document, electronic documentation method for paper document, and electronic documentation program for paper document |
JP2008204226A (en) * | 2007-02-21 | 2008-09-04 | Hitachi Computer Peripherals Co Ltd | Form recognition device and its program |
JP2008299748A (en) * | 2007-06-01 | 2008-12-11 | Oki Electric Ind Co Ltd | Ocr document registration system |
JP2009223391A (en) * | 2008-03-13 | 2009-10-01 | Fuji Xerox Co Ltd | Image processor and image processing program |
JP2011248609A (en) * | 2010-05-26 | 2011-12-08 | Hitachi Omron Terminal Solutions Corp | Form recognition device and form recognition method |
JP2013218364A (en) * | 2012-04-04 | 2013-10-24 | Canon Inc | Image processing system |
Also Published As
Publication number | Publication date |
---|---|
JP6541936B2 (en) | 2019-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
JP4366108B2 (en) | Document search apparatus, document search method, and computer program | |
JP6938228B2 (en) | Calculator, document identification method, and system | |
JP6881990B2 (en) | Image processing device, its control method, and program | |
CN109961069B (en) | Image processing apparatus and storage medium | |
US20060045340A1 (en) | Character recognition apparatus and character recognition method | |
US11315351B2 (en) | Information processing device, information processing method, and information processing program | |
JP6541936B2 (en) | Information processing apparatus, form reading method, and program | |
JP2002342343A (en) | Document managing system | |
JP2011065322A (en) | Character recognition system and character recognition program, and voice recognition system and voice recognition program | |
JP2020087112A (en) | Document processing apparatus and document processing method | |
JP2006323517A (en) | Text classification device and program | |
JP6707112B2 (en) | User information input support system | |
JP5752073B2 (en) | Data correction device | |
JP6397084B2 (en) | User information input support system | |
JP2020123233A (en) | Information processing apparatus and program | |
JP2021033743A (en) | Information processing apparatus, document identification method, and information processing system | |
WO2023132341A1 (en) | Drawing search device, drawing database construction device, drawing search system, drawing search method, and recording medium | |
JP2020047031A (en) | Document retrieval device, document retrieval system and program | |
US20220207900A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP2019191759A (en) | Editing support program and editing support method and editing support device | |
US20230083959A1 (en) | Information processing apparatus, information processing method, storage medium, and learning apparatus | |
JP5272664B2 (en) | Information processing apparatus, image search method, and program | |
JP4922030B2 (en) | Character string search apparatus, method and program | |
JP2011100332A (en) | Attribute analysis method by full name, program, and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180409 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190612 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6541936 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |