JP6786658B2 - Document reading system - Google Patents

Document reading system Download PDF

Info

Publication number
JP6786658B2
JP6786658B2 JP2019083938A JP2019083938A JP6786658B2 JP 6786658 B2 JP6786658 B2 JP 6786658B2 JP 2019083938 A JP2019083938 A JP 2019083938A JP 2019083938 A JP2019083938 A JP 2019083938A JP 6786658 B2 JP6786658 B2 JP 6786658B2
Authority
JP
Japan
Prior art keywords
document
recognition engine
image data
character
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019083938A
Other languages
Japanese (ja)
Other versions
JP2020181369A (en
Inventor
祐次 田中
祐次 田中
伸司 樽井
伸司 樽井
孝一 平野
孝一 平野
田中 薫
薫 田中
一貴 於保
一貴 於保
里菜子 武笠
里菜子 武笠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Digital Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Digital Solutions Corp filed Critical Toshiba Corp
Priority to JP2019083938A priority Critical patent/JP6786658B2/en
Publication of JP2020181369A publication Critical patent/JP2020181369A/en
Application granted granted Critical
Publication of JP6786658B2 publication Critical patent/JP6786658B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明の実施形態は、申請書等の複数枚の書類を一括して読み取り、コンピュータが利用可能な文字コードに変換する技術に関する。 An embodiment of the present invention relates to a technique for collectively reading a plurality of documents such as an application form and converting them into a character code that can be used by a computer.

OCR(Optical Character Recognition/Reader)などの文字認識技術は、書類等の電子化ツールとして活用されている。 Character recognition technology such as OCR (Optical Character Recognition / Reader) is utilized as a tool for digitizing documents and the like.

特開2002‐269253号公報Japanese Unexamined Patent Publication No. 2002-269253

書類種別の異なる複数枚の書類を読み取り、読み取られた書類種別に適した文字認識エンジンをそれぞれ割り当ててコンピュータが利用可能な文字コードに変換する書類読取システムを提供する。 Provided is a document reading system that reads a plurality of documents having different document types, assigns a character recognition engine suitable for the read document type, and converts them into character codes that can be used by a computer.

実施形態の書類読取システムは、書類種別の異なる複数枚の書類のイメージデータを生成する画像生成装置と、前記イメージデータに対する文字認識処理を行う管理装置と、を備える。前記管理装置は、前記文字認識処理するための文字認識エンジンを複数登録するとともに、前記各文字認識エンジンに対して1つ又は複数の書類種別を関連付けるマスタ制御部と、前記イメージデータの書類種別を判別して、判別された書類種別に関連付けられた前記文字認識エンジンを前記各イメージデータに割り当てる認識エンジン割り当て制御部と、前記イメージデータ毎に、割り当てられた前記文字認識エンジンを用いて文字認識処理を行う認識処理部と、を有する。前記文字認識エンジンは、OCR帳票認識エンジン、定型帳票認識エンジン、非定型帳票認識エンジン、本人確認書類認識エンジンを含むことができ、前記認識エンジン割り当て制御部は、以下の処理を行う。認識精度を高める対策が施された書類又は/及び紙面に印字される帳票IDで紐付くテンプレート定義が適用された書類の前記イメージデータを前記OCR帳票認識エンジンに割り当て、前記OCR帳票認識エンジンに仕分けされなかった書類であって、書類のタイトル別に事前登録された文字認識テンプレートが存在する書類の前記イメージデータを前記定型帳票認識エンジンに割り当て、前記OCR帳票認識エンジン及び前記定型帳票認識エンジンに仕分けされなかった書類であって、書類内の1つ又は複数の項目又はキーワード別に事前登録された文字認識テンプレートが存在する書類の前記イメージデータを、前記非定型帳票認識エンジンに割り当て、前記OCR帳票認識エンジン、前記定型帳票認識エンジン及び前記非定型帳票認識エンジンに仕分けされなかった書類であって、本人確認書類の特性情報を含む書類のイメージデータを前記本人確認書類認識エンジンに割り当てる。 The document reading system of the embodiment includes an image generation device that generates image data of a plurality of documents having different document types, and a management device that performs character recognition processing on the image data. The management device registers a plurality of character recognition engines for the character recognition process, and registers one or a plurality of document types with each character recognition engine, and a master control unit associating the document types with the image data. Character recognition processing using the recognition engine allocation control unit that discriminates and assigns the character recognition engine associated with the determined document type to each image data, and the character recognition engine assigned to each image data. It has a recognition processing unit for performing the above. The character recognition engine can include an OCR form recognition engine, a standard form recognition engine, an atypical form recognition engine, and an identity verification document recognition engine, and the recognition engine allocation control unit performs the following processing. The image data of a document to which measures for improving recognition accuracy are applied and / or a document to which a template definition linked with a form ID printed on paper is applied is assigned to the OCR form recognition engine and sorted to the OCR form recognition engine. The image data of a document that has not been created and has a character recognition template pre-registered for each document title is assigned to the standard form recognition engine and sorted into the OCR form recognition engine and the standard form recognition engine. The image data of a document that does not exist and has a character recognition template pre-registered for each item or keyword in the document is assigned to the atypical form recognition engine, and the OCR form recognition engine is used. , Documents that are not sorted by the standard form recognition engine and the non-standard form recognition engine and include the characteristic information of the identity verification document are assigned to the identity verification document recognition engine.

第1実施形態の書類読取システムの概略説明図である。It is the schematic explanatory drawing of the document reading system of 1st Embodiment. 第1実施形態の書類読取システムの書類種別判別及び認識エンジン選択の各処理を説明するための図である。It is a figure for demonstrating each process of document type determination and recognition engine selection of the document reading system of 1st Embodiment. 第1実施形態の書類読取システムを構成する書類読取管理装置の構成ブロック図である。It is a block diagram of the document reading management apparatus which comprises the document reading system of 1st Embodiment. 第1実施形態において、1つの書類内に書類種別の異なる複数の領域が混在して構成されている場合における認識エンジンの割り当て処理を説明するための図である。In the first embodiment, it is a figure for demonstrating the allocation process of the recognition engine in the case where a plurality of areas having different document types are mixed in one document. 第1実施形態の複数の異なる申請者の各書類を一括して読み取る一括読取処理の説明図である。It is explanatory drawing of the batch reading process which collectively reads each document of a plurality of different applicants of 1st Embodiment. 第1実施形態の書類読取システムの処理フローを示す図である。It is a figure which shows the processing flow of the document reading system of 1st Embodiment. 第1実施形態の書類読取システムのOCR処理の詳細フローを示す図である。It is a figure which shows the detailed flow of the OCR process of the document reading system of 1st Embodiment. 第1実施形態の書類読取システムを適用したワークフローの一例を示す図である。It is a figure which shows an example of the workflow which applied the document reading system of 1st Embodiment. 図8に続くワークフローの一例を示す図である。It is a figure which shows an example of the workflow following FIG. 図9に続くワークフローの一例を示す図である。It is a figure which shows an example of the workflow following FIG. 第1実施形態の書類(帳票)の一例を示す図である。It is a figure which shows an example of the document (form) of 1st Embodiment. 第1実施形態の書類(帳票)の一例を示す図である。It is a figure which shows an example of the document (form) of 1st Embodiment. 第1実施形態の書類(帳票)の一例を示す図である。It is a figure which shows an example of the document (form) of 1st Embodiment.

以下、実施形態につき、図面を参照して説明する。 Hereinafter, embodiments will be described with reference to the drawings.

(第1実施形態)
図1は、第1実施形態に係る書類読取管理装置(以下、管理装置という)100が適用された書類読取システムの概略説明図である。本システムは、申告書や申請書などの紙媒体の書類をOCR処理(文字認識処理)で電子化する。
(First Embodiment)
FIG. 1 is a schematic explanatory view of a document reading system to which the document reading management device (hereinafter, referred to as a management device) 100 according to the first embodiment is applied. This system digitizes paper-based documents such as tax returns and applications by OCR processing (character recognition processing).

例えば、申請者(申告者又は提出者)は、申請書類(申告書類、申込書類などの提出書類)を提出する。その際、申請者(提出者)は、申請書類(提出書類)を所定の窓口に持参したり、配送業者に依頼して所定の発送手段で提出したりすることができる。申請書類を受け取る場所には、画像生成装置200が設けられ、画像生成装置200によってイメージデータ化された申請書類が、管理装置100に入力されて文字コード化(テキスト化)される。 For example, the applicant (filer or submitter) submits application documents (submission documents such as declaration documents and application documents). At that time, the applicant (submitter) can bring the application documents (submission documents) to a predetermined window, or request a delivery company to submit them by a predetermined shipping means. An image generation device 200 is provided at a place where the application documents are received, and the application documents converted into image data by the image generation device 200 are input to the management device 100 and converted into character codes (text).

画像生成装置200は、紙媒体の書類をスキャニングしてイメージデータ(画像データ)を生成するスキャナーである。画像生成装置200は、複数枚の書類を一括して読み取ることができ、セットされた書類の束を順次1枚1枚スキャニングして、それぞれのイメージデータを生成する。イメージデータのデータ形式は任意であり、JPEG、GIF、PNG、TIFF、BMPなど、様々な形式を適宜採用することができる。また、スキャニングされたイメージデータは、PDF形式で複数のイメージデータがページ区切りで1ファイルに集約されるものであってもよい。 The image generation device 200 is a scanner that scans a document on a paper medium to generate image data (image data). The image generation device 200 can read a plurality of documents at once, scans a bundle of set documents one by one, and generates image data for each. The data format of the image data is arbitrary, and various formats such as JPEG, GIF, PNG, TIFF, and BMP can be appropriately adopted. Further, the scanned image data may be a PDF format in which a plurality of image data are aggregated into one file at page breaks.

なお、画像生成装置200は、例えば、ソータ機能を備えたスキャン装置や、スキャナー機能が搭載されたプリンタや複合機であってもよい。また、カメラ等の撮像装置又は撮像装置を備える端末(デスクトップPCやノートPC、タブレット端末やスマートフォン)も、画像生成装置200として適用することもできる。 The image generation device 200 may be, for example, a scanning device having a sorter function, a printer or a multifunction device equipped with a scanner function. Further, an image pickup device such as a camera or a terminal (desktop PC, notebook PC, tablet terminal, smartphone) provided with the image pickup device can also be applied as the image generation device 200.

書類は、例えば、確定申告、医療費や手当の申請、保険申込、保険支払い請求、住宅ローン申込、金融商品取引の申込など、申告や申請、請求等において使用される紙媒体である。これらの書類は、後述する所定の書類種別に分類することができる。なお、書類には、印字又は手書きの書面や複写物などが含まれる。 Documents are paper media used in filing, applications, claims, etc., such as tax returns, medical expenses and allowance applications, insurance applications, insurance payment claims, mortgage applications, and financial product transaction applications. These documents can be classified into predetermined document types described later. Documents include printed or handwritten documents and copies.

書類種別は、後述する認識エンジンと関連付けられ、1つの書類種別が、1つの認識エンジン又は複数の認識エンジンと紐付けることができる。一方で、1つの認識エンジンは、1つ又は複数の書類種別と紐付くことができる。本実施形態の書類種別は、認識エンジンの振り分け条件として利用され、所定の書類種別の書類が、所定の認識エンジンに振り分けられるように制御するための情報である。 The document type is associated with a recognition engine described later, and one document type can be associated with one recognition engine or a plurality of recognition engines. On the other hand, one recognition engine can be associated with one or more document types. The document type of the present embodiment is used as a distribution condition of the recognition engine, and is information for controlling so that the document of the predetermined document type is distributed to the predetermined recognition engine.

本実施形態において取り扱う書類は、申請単位での1枚又は複数枚の書類である。例えば、1つの申請では、申請書、計算書、内訳書、本人確認書類などの添付書類、証明書などをセットにした申請書類一式を提出することがある。この場合、申請書類一式の中に、書類種別の異なる書類が複数存在する。このため、申請単位別又は申請者別の申請書類は、異なる書類種別の書類が複数枚含まれている書類群(書類の束)とすることができる。 The documents handled in this embodiment are one or more documents for each application. For example, in one application, a set of application documents including an application form, a statement of accounts, a breakdown, attached documents such as identity verification documents, and a certificate may be submitted. In this case, there are a plurality of documents having different document types in the application document set. Therefore, the application documents for each application unit or each applicant can be a document group (bundle of documents) containing a plurality of documents of different document types.

一方で、例えば、保険の申込書であっても、生命保険、自動車保険、傷害保険などの保険の種別によって申込書が異なったり、保険会社で申込書が異なったりもする。地方公共団体や行政機関に提出する書類においても同様である。このため、画像生成装置200にセットされる書類群は、この場合においても、申請単位又は申請者単位で異なる書類種別の書類が複数枚含まれている書類群となる。また、1枚の申込書で提出書類が完結する場合もある。この場合、1枚ずつ申請者が異なり、かつ書類種別の異なる複数枚の書類群が、画像生成装置200にセットされる。 On the other hand, for example, even if it is an insurance application form, the application form may differ depending on the type of insurance such as life insurance, automobile insurance, accident insurance, etc., or the application form may differ depending on the insurance company. The same applies to documents submitted to local governments and government agencies. Therefore, the document group set in the image generation device 200 is also a document group including a plurality of documents of different document types for each application unit or each applicant. In addition, the submitted documents may be completed with one application form. In this case, a plurality of document groups having different applicants and different document types are set in the image generator 200.

このように本実施形態の画像生成装置200は、異なる書類種別の書類が複数枚含まれている書類の束がセットされ、一括した連続スキャニングで各イメージファイルを順次生成する。書類の束は、異なる書類種別の書類が複数枚含まれる1人の申請者が提出する書類一式であってもよく、括りとしては同じ申込書であるがそれぞれ書類種別が異なる複数枚の書類群であってもよい。 As described above, the image generation device 200 of the present embodiment sets a bundle of documents including a plurality of documents of different document types, and sequentially generates each image file by batch continuous scanning. A bundle of documents may be a set of documents submitted by one applicant containing multiple documents of different document types, and a group of multiple documents of the same application form but with different document types. It may be.

画像生成装置200は、書類を取り扱う店舗や拠点に設けられる。画像生成装置200によって生成された書類のイメージデータは、IP網や専用網などのネットワークを介して管理装置100に伝送されたり(ネットワーク接続方式)、管理装置100に対してケーブル等で画像生成装置200を直接接続して伝送したり(ローカル接続方式)することができる。また、画像生成装置200は、利用者端末300とローカル接続することができ、この場合、利用者端末300を通じ、画像生成装置200によって生成されたイメージデータを、管理装置100に伝送するように構成することができる。 The image generator 200 is provided at a store or a base that handles documents. The image data of the document generated by the image generator 200 is transmitted to the management device 100 via a network such as an IP network or a dedicated network (network connection method), or the image generation device is connected to the management device 100 by a cable or the like. The 200 can be directly connected and transmitted (local connection method). Further, the image generation device 200 can be locally connected to the user terminal 300, and in this case, the image data generated by the image generation device 200 is transmitted to the management device 100 through the user terminal 300. can do.

図2は、本実施形態の書類読取システムの書類種別判別及び認識エンジン選択の各処理を説明するための図である。本実施形態では、取り扱う書類の種別と、各書類種別に適した認識エンジン(OCR処理モジュール)とが登録可能にされる。そして、書類の各イメージデータに対して書類種別判定を行い、当該書類に対してOCR処理を行うための認識エンジンを割り当てる。すなわち、認識特性の異なる複数の認識エンジン別にOCR処理対象の書類を予め設定し、認識特性に適合する認識エンジンに、書類の振り分け処理を行う。 FIG. 2 is a diagram for explaining each process of document type determination and recognition engine selection of the document reading system of the present embodiment. In the present embodiment, the types of documents to be handled and the recognition engine (OCR processing module) suitable for each document type can be registered. Then, the document type is determined for each image data of the document, and a recognition engine for performing OCR processing is assigned to the document. That is, the documents to be OCR processed are set in advance for each of a plurality of recognition engines having different recognition characteristics, and the documents are sorted to the recognition engines that match the recognition characteristics.

本実施形態では、書類の各イメージデータ毎に、認識エンジンが割り当てられ、イメージデータ単位(ページ単位)で、認識エンジンによるOCR処理が行われる。なお、複数枚の書類の内、同じ認識エンジンが割り当てられる書類が存在したり、全ての書類に異なる認識エンジンが割り当てられたりすることもある。もちろん、予め書類種別に応じて手作業で書類を仕分けし、仕分け単位で電子化を行う場合は、仕分け単位で読み込み、複数の各書類に同じ認識エンジンが割り当てられることになる。 In the present embodiment, a recognition engine is assigned to each image data of the document, and OCR processing by the recognition engine is performed in units of image data (page units). In addition, among a plurality of documents, there may be a document to which the same recognition engine is assigned, or a different recognition engine may be assigned to all the documents. Of course, when documents are manually sorted according to the document type in advance and digitized in the sorting unit, the documents are read in the sorting unit and the same recognition engine is assigned to each of a plurality of documents.

ここで、OCR処理について説明する。OCR処理は、文字が記載された紙媒体の書類をイメージデータ(画像データ)化し、イメージデータ内の文字を認識して文字コード情報を生成する処理であり、大きく2つの処理に分けることができる。第1は、イメージデータ内のレイアウト解析を行い、レイアウト解析で抽出した文字領域を抽出し、文字領域内の文字を1文字ずつ分解する文字抽出解析処理である。第2は、文字抽出解析処理によって得られた1文字ずつのイメージデータが何の文字かを認識する認識処理である。なお、文字領域内の文字列を1文字ずつに分解せずに文字認識することもできる。 Here, the OCR process will be described. The OCR process is a process of converting a paper document on which characters are written into image data (image data), recognizing the characters in the image data and generating character code information, and can be roughly divided into two processes. .. The first is a character extraction analysis process in which layout analysis is performed in the image data, the character area extracted by the layout analysis is extracted, and the characters in the character area are decomposed character by character. The second is a recognition process for recognizing what character the image data of each character obtained by the character extraction analysis process is. It is also possible to recognize characters without decomposing the character strings in the character area into characters one by one.

認識処理は、例えば、文字イメージを一定の大きさに拡大/縮小する正規化処理、文字イメージの特徴(縦、横、斜めの線、各線の長さ、線同士の位置関係などの特徴量)抽出処理、文字イメージの特徴量に合致する文字コードを検索するマッチング処理、マッチング処理で抽出された各文字コード又は/及びその文字列に対する辞書(単語辞書など)を用いた自動訂正処理、の各処理が含まれる。これらの処理を経て、書類内の文字が文字コード化された出力される。文字コード化された情報、すなわち、文字テキスト情報は、所定のファイル形式(txt、csv,xml,docx、xlsxなど)で書類毎に出力することができる。 The recognition process includes, for example, normalization processing for enlarging / reducing a character image to a certain size, and features of a character image (features such as vertical, horizontal, and diagonal lines, length of each line, and positional relationship between lines). Each of extraction processing, matching processing for searching for a character code that matches the feature amount of a character image, and automatic correction processing using a dictionary (word dictionary, etc.) for each character code and / or its character string extracted by the matching processing. Processing is included. Through these processes, the characters in the document are output as character codes. Character-encoded information, that is, character text information can be output for each document in a predetermined file format (txt, csv, xml, docx, xlsx, etc.).

本実施形態の認識エンジンは、文字抽出解析処理及び認識処理の各アルゴリズムを含むプログラムモジュールであり、各書類の特性に応じて文字抽出解析処理又は/及び認識処理がチューニングされた複数の認識エンジンが登録される。 The recognition engine of this embodiment is a program module including each algorithm of character extraction analysis processing and recognition processing, and a plurality of recognition engines whose character extraction analysis processing and / and recognition processing are tuned according to the characteristics of each document. be registered.

図2の例において、OCR帳票認識エンジンは、OCR帳票と呼ばれるOCR処理を前提に作成された書類を対象に文字認識処理を行う。OCR帳票は、OCR処理の文字抽出解析処理において、文字を抽出し易いように工夫された帳票であり、例えば、記入枠や印字ガイド枠をドロップアウトカラー(人の目には見えるがスキャナーで読み取ったときに画像として現れない色)で印刷したり、3点マークなどのベリファイマークを付して、マークされている3点で天地と傾きを検出し易くしたり、リファレンスマークを付して帳票内の文字行位置を正確に検出できるようにしたり、文字枠や余白域を設けたりして、文字抽出精度(文字認識精度)を高める対策が施された帳票である。 In the example of FIG. 2, the OCR form recognition engine performs character recognition processing on a document called an OCR form, which is created on the premise of OCR processing. The OCR form is a form devised so that characters can be easily extracted in the character extraction analysis process of the OCR process. For example, the entry frame and the print guide frame are read by a dropout color (visible to the human eye but read by a scanner). You can print it in a color that does not appear as an image when you use it), add a verify mark such as a 3-point mark to make it easier to detect the top and bottom and tilt at the 3 marked points, or add a reference mark to the form. It is a form with measures to improve the character extraction accuracy (character recognition accuracy) by making it possible to accurately detect the character line position inside and by providing a character frame and margins.

また、OCR帳票は、OCR処理を前提に作成された書類であることから、上述した文字認識精度を高める対策の如何にかかわらず、文字が記入される紙面上の位置をテンプレートとして予め定義し、テンプレートで規定され位置を文字認識(文字抽出解析)するように構成することもできる。この場合、テンプレート定義情報の識別子である帳票IDを紙面上に印字、又は記入することで、イメージデータ化された書類の帳票IDを識別して該当するテンプレートを用いたOCR処理を行うように構成することができる。従って、OCR帳票認識エンジンに文字認識対象として仕分される書類は、認識精度を高める対策が施された書類又は/及び紙面に印字される帳票IDで紐付くテンプレート定義が適用された書類である。なお、認識精度を高める対策が施された書類がさらにテンプレートを用いたOCR処理を行うように構成することもできる。 In addition, since the OCR form is a document created on the premise of OCR processing, the position on the paper on which the characters are written is defined in advance as a template regardless of the above-mentioned measures for improving the character recognition accuracy. It can also be configured to perform character recognition (character extraction analysis) of the position specified by the template. In this case, by printing or writing the form ID, which is an identifier of the template definition information, on the paper, the form ID of the document converted into image data is identified and OCR processing is performed using the corresponding template. can do. Therefore, the documents sorted by the OCR form recognition engine as the character recognition target are the documents for which measures for improving the recognition accuracy are taken and / and the documents to which the template definition associated with the form ID printed on the paper is applied. It should be noted that a document to which measures for improving recognition accuracy can be further configured to perform OCR processing using a template.

したがって、OCR帳票認識エンジンに仕分けされる書類は、3点マーク等の文字抽出精度(文字認識精度)を高める対策があるか、帳票IDがあるかなどを判別することによって選定(振り分け)することができる。つまり、OCR帳票認識エンジンに対応する書類種別は、3点マーク等の文字抽出精度を高める対策が存在したり、帳票IDなど帳票を特定できる識別子が存在する書類となる。 Therefore, the documents sorted by the OCR form recognition engine should be selected (sorted) by determining whether there is a measure to improve the character extraction accuracy (character recognition accuracy) such as the 3-point mark, or whether there is a form ID. Can be done. That is, the document type corresponding to the OCR form recognition engine is a document in which a measure for improving the character extraction accuracy such as a 3-point mark exists or an identifier such as a form ID that can identify a form exists.

次に、定型帳票認識エンジンは、書類のタイトルや特定キーワードなどで識別可能な定型帳票別に、文字が記入される紙面上の位置をテンプレートとして予め定義し、テンプレートで規定され位置を定型的に文字認識(文字抽出解析)する認識処理を行う。定型帳票認識エンジンは、OCR帳票以外の書類を対象に、書類のタイトルをキーに、事前登録された文字認識テンプレートを検索して、該当する文字認識テンプレートを用いたOCR処理を行う。したがって、定型帳票認識エンジンに仕分けされる書類(タイトル別テンプレート帳票)は、OCR帳票認識エンジンに仕分けされなかった書類であって、書類のタイトル別に事前登録された文字認識テンプレートが存在する書類であるかを判別することによって選定(振り分け)することができる。書類のタイトルとは、例えば、〇〇届出書、〇〇申請書などのタイトル名、表題や見出しである。定型帳票認識エンジンに対応する書類種別は、書類のタイトル別に事前登録された文字認識テンプレートが存在する書類となる。 Next, the standard form recognition engine defines in advance the position on the paper on which characters are entered as a template for each standard form that can be identified by the title of the document or a specific keyword, and the position defined by the template is standardized. Performs recognition processing for recognition (character extraction analysis). The standard form recognition engine searches for a pre-registered character recognition template using the title of the document as a key for documents other than the OCR form, and performs OCR processing using the corresponding character recognition template. Therefore, the documents sorted by the standard form recognition engine (template forms by title) are documents that are not sorted by the OCR form recognition engine and have character recognition templates pre-registered for each document title. It can be selected (sorted) by determining whether or not. The title of the document is, for example, the title name, title or heading of the XX notification form, XX application form, or the like. The document type corresponding to the standard form recognition engine is a document in which a character recognition template pre-registered for each document title exists.

非定型帳票認識エンジンは、OCR帳票及びタイトル別テンプレート帳票以外の書類を対象に、書類内から事前に登録した1つまたは複数の見出し語(キーワード)を見つけ、その近辺の文字列を自動的に抽出するキーワードサーチ形OCR処理を行う。したがって、非定型帳票認識エンジンに仕分けされる書類(項目別テンプレート帳票)は、OCR帳票及びタイトル別テンプレート帳票に仕分けされなかった書類であって、書類内の特定の項目(キーワード)別に事前登録された文字認識テンプレートが存在する書類であるかを判別することによって選定(振り分け)することができる。非定型帳票認識エンジンに対応する書類種別は、書類内の特定の項目(キーワード)別に事前登録された文字認識テンプレートが存在する書類となる。 The atypical form recognition engine finds one or more pre-registered headwords (keywords) in documents other than OCR forms and template forms by title, and automatically finds the character strings in the vicinity. Perform keyword search type OCR processing to be extracted. Therefore, the documents sorted by the atypical form recognition engine (template forms by item) are documents that are not sorted into OCR form and template form by title, and are pre-registered for each specific item (keyword) in the document. It can be selected (sorted) by determining whether or not the document has the character recognition template. The document type corresponding to the atypical form recognition engine is a document in which a character recognition template pre-registered for each specific item (keyword) in the document exists.

本人確認書類認識エンジンは、OCR帳票、タイトル別テンプレート帳票及び項目別テンプレート帳票以外の書類を対象に、本人確認書類の特性情報をキーに、適合する認識ライブラリを検索し、OCR処理を行う。本人確認書類は、免許証、マイナンバーカード、健康保険証、住民証、在留カードなどの複数の種別を含み、本人確認書類種別それぞれに認識ライブラリが予め登録されている。 The identity verification document recognition engine searches for a matching recognition library using the characteristic information of the identity verification document as a key for documents other than the OCR form, the template form by title, and the template form by item, and performs OCR processing. Identity verification documents include multiple types such as driver's license, My Number card, health insurance card, resident ID, and residence card, and a recognition library is registered in advance for each type of identity verification document.

まず、特性情報としてタイトルや項目を登録しておくことで、どの本人確認書類かを判別することができる。そして、どの本人確認書類かを判別した後、対応する認識ライブラリを用いて、OCR処理を行う。認識ライブラリとは、上述した文字抽出解析処理又は/及び認識処理で使用される情報や処理を、本人確認書類種別(特性情報)ごとにチューニングしたものであり、例えば、運転免許証の場合、都道府県ごとの公安委員会によってフォント(半角、2/3角、全角など)が異なるため、これらのフォントに対応した認識ライブラリが登録される。マイナンバーカード、健康保険証、住民証、在留カードにおいても同様である。また、本人確認書類の種別毎にテンプレートを定義・登録しておき、対応するテンプレートを含む認識ライブラリを登録してOCR処理を行うように構成することもできる。 First, by registering titles and items as characteristic information, it is possible to determine which identity verification document is used. Then, after determining which identity verification document, the OCR process is performed using the corresponding recognition library. The recognition library is a tuning of the information and processing used in the above-mentioned character extraction analysis processing and / and recognition processing for each type of identity verification document (characteristic information). For example, in the case of a driver's license, the capital Since fonts (half-width, two-thirds, full-width, etc.) differ depending on the public safety committee of each prefecture, recognition libraries corresponding to these fonts are registered. The same applies to My Number Card, Health Insurance Card, Resident Card, and Residence Card. It is also possible to define and register a template for each type of identity verification document, and register a recognition library including the corresponding template to perform OCR processing.

本人確認書類認識エンジンに仕分けされる書類(書類種別)は、本人確認書類の特性情報を含む書類であって、特性情報別に事前登録された認識ライブラリが存在する書類であるかを判別することによって選定(振り分け)することができる。 Documents (document type) sorted by the identity verification document recognition engine are documents that include the characteristic information of the identity verification document, and by determining whether the document has a recognition library pre-registered for each characteristic information. Can be selected (sorted).

なお、各認識エンジンに仕分けされる書類の選定(振り分け)手法としては、書類(帳票)のサイズ(縦/横)を適用することもできる。例えば、特定の大きさを有する書類は、OCR帳票であると一義的に判定することが可能である場合は、図2に示す対象書類判別条件として書類の縦横のサイズを登録しておき、イメージデータ化された書類のサイズと比較して、対応する認識エンジンを割り当てるように構成することもできる。 As a method for selecting (sorting) documents to be sorted by each recognition engine, the size (vertical / horizontal) of documents (forms) can also be applied. For example, if it is possible to uniquely determine that a document having a specific size is an OCR form, the vertical and horizontal sizes of the document are registered as the target document discrimination condition shown in FIG. It can also be configured to assign a corresponding recognition engine relative to the size of the digitized document.

図3は、管理装置100の構成ブロック図である。管理装置100は、通信装置110、制御装置120及び記憶装置130を含んで構成されている。通信装置110は、利用者端末300との間の無線又は有線のネットワークを介したデータ通信制御を行う。記憶装置130は、利用者端末300又は画像生成装置200から送信される申請書類のイメージデータ及び認識処理後の文字コードデータを、申請者別に記憶する記憶領域である。なお、上述のように、管理装置100は、利用者端末300を介さずに画像生成装置200と直接接続されるように構成することもできる。 FIG. 3 is a block diagram of the management device 100. The management device 100 includes a communication device 110, a control device 120, and a storage device 130. The communication device 110 controls data communication with the user terminal 300 via a wireless or wired network. The storage device 130 is a storage area for storing image data of application documents and character code data after recognition processing transmitted from the user terminal 300 or the image generation device 200 for each applicant. As described above, the management device 100 can be configured to be directly connected to the image generation device 200 without going through the user terminal 300.

制御装置120は、マスタ制御部121、認識エンジン割り当て制御部122、認識処理部123、認識結果制御部124及びデータ制御部125を含んでいる。 The control device 120 includes a master control unit 121, a recognition engine allocation control unit 122, a recognition processing unit 123, a recognition result control unit 124, and a data control unit 125.

マスタ制御部121は、認識エンジンの登録制御、認識エンジンに対応する書類種別の登録制御、各認識エンジンで使用するテンプレートの登録制御を行う。各登録制御では、新規登録、編集、更新、削除を所定の画面を通じ、管理者端末400を介して操作可能に制御する。なお、管理装置100に対する各種情報の登録操作などは、便宜上、管理者端末400を介して行う態様を例示しているが、例えば、利用者端末300を管理者端末400として構成することも可能である。 The master control unit 121 performs registration control of the recognition engine, registration control of the document type corresponding to the recognition engine, and registration control of the template used by each recognition engine. In each registration control, new registration, editing, updating, and deletion are controlled so as to be operable via the administrator terminal 400 through a predetermined screen. For convenience, the mode in which various information registration operations to the management device 100 are performed via the administrator terminal 400 is illustrated, but for example, the user terminal 300 can be configured as the administrator terminal 400. is there.

認識エンジンの登録制御では、例えば、図2に示すような認識エンジンマスタ情報を登録する画面が提供され、管理者端末400から、認識エンジンのOCR処理モジュールや認識ライブラリをアップロードしたり、既にアップロードされているOCR処理モジュールや認識ライブラリに対する更新や削除の操作、各認識エンジンと書類種別との関連付けに関する情報(例えば、対象書類判別条件(振り分け条件))の登録、更新、削除の操作、を行えるように制御する。 In the recognition engine registration control, for example, a screen for registering the recognition engine master information as shown in FIG. 2 is provided, and the recognition engine OCR processing module and the recognition library are uploaded or already uploaded from the administrator terminal 400. To be able to perform operations such as updating and deleting the OCR processing module and recognition library, and registering, updating, and deleting information related to the association between each recognition engine and the document type (for example, target document discrimination condition (sorting condition)). To control.

認識エンジンに対する書類種別の登録制御は、各認識エンジンと関連付けられる書類種別(OCR帳票、定型、非定型、本人確認、フリーフォーマット)の登録、更新、削除の操作を行えるように制御する。登録された書類種別は、認識エンジンの登録制御において、リスト表示され選択可能に制御することができる。 The document type registration control for the recognition engine is controlled so that the document types (OCR form, fixed form, atypical, identity verification, free format) associated with each recognition engine can be registered, updated, and deleted. The registered document types can be displayed in a list and can be selected and controlled in the registration control of the recognition engine.

各認識エンジンで使用されるテンプレートの登録制御は、画面に、取り込まれたイメージデータを表示させつつ、表示されたイメージデータの文字記載位置に文字認識領域を設定するレイヤー作成制御を行うものである。テンプレートとは、書類の文字記載位置に合わせて複数の文字認識領域が設定され、各文字認識領域の位置情報(領域1つずつの開始位置座標と終了位置座標のセット)を有する情報である。 The template registration control used by each recognition engine is to perform layer creation control to set the character recognition area at the character description position of the displayed image data while displaying the captured image data on the screen. .. The template is information in which a plurality of character recognition areas are set according to the character description position of the document and has position information (a set of start position coordinates and end position coordinates of each area) of each character recognition area.

なお、テンプレートの登録制御では、各認識エンジンとの関連付け操作も含まれる。例えば、OCR帳票認識エンジンとテンプレートとの関連付け、定型帳票認識エンジンでは、書類のタイトル名とテンプレートとの関連付け、非定型帳票認識エンジンでは、書類内の1つ又は複数の項目名(キーワード)とテンプレートとの関連付けを、行うことができように制御する。 The template registration control also includes an operation of associating with each recognition engine. For example, the OCR form recognition engine associates a template, the standard form recognition engine associates a document title name with a template, and the atypical form recognition engine associates one or more item names (keywords) in a document with a template. Control the association with and so that it can be done.

認識エンジン割り当て制御部122は、複数の書類別に1イメージデータ(1ページ)ずつ認識エンジン振り分け処理を行うと共に、後述するページ分割処理を行う(図4参照)。認識処理部123は、認識エンジン割り当て制御部122によって割り当てられた各認識エンジンを用いてページ毎にOCR処理を行い、認識結果(文字コード)を出力する。認識結果制御部124は、OCR処理対象のイメージデータと認識結果である文字コードとを関連付けて記憶装置130に記憶する。このとき、申請者の氏名や申請者のIDコードなど、書類内から抽出された申請者を一意に識別可能な申請者識別情報を用いて、イメージデータとその文字コードの対応関係を申請者別に区分けして記憶装置130に記憶することができる。 The recognition engine allocation control unit 122 performs recognition engine distribution processing for each image data (one page) for each of a plurality of documents, and also performs page division processing described later (see FIG. 4). The recognition processing unit 123 performs OCR processing for each page using each recognition engine assigned by the recognition engine allocation control unit 122, and outputs a recognition result (character code). The recognition result control unit 124 stores the image data to be OCR processed and the character code which is the recognition result in the storage device 130 in association with each other. At this time, using the applicant identification information that can uniquely identify the applicant extracted from the document, such as the applicant's name and the applicant's ID code, the correspondence between the image data and its character code is determined for each applicant. It can be divided and stored in the storage device 130.

データ制御部125は、OCR処理後の文字コードを利用した申請者検索や、文字コードのデータ修正、削除などのイメージデータに対する文字コードの編集作業、イメージデータの並び順の訂正など、イメージデータ及び文字コードに対する編集機能を所定の画面を通じて提供する。利用者端末300からの要求に基づいて各種操作制御を可能にする。 The data control unit 125 performs an applicant search using the character code after OCR processing, character code editing work for the image data such as data correction and deletion of the character code, correction of the order of the image data, and the like. The editing function for the character code is provided through a predetermined screen. Various operation controls are enabled based on the request from the user terminal 300.

書類は、例えば、1つのイメージデータ内(1ページ内)に、OCR帳票認識エンジンが文字認識対象とする書類種別を有する領域と、定型帳票認識エンジンが文字認識対象とする書類種別を有する領域とが混在して構成されている場合(複数の区分けされた領域が存在する場合)がある。図4は、このように1つの書類内にOCR帳票認識エンジンが文字認識対象とする書類種別を有する領域と定型帳票認識エンジンが文字認識対象とする書類種別を有する領域とが混在して構成されている場合における認識エンジンの割り当て処理を説明するための図である。図4に示すように、例えば、OCR帳票認識エンジンが文字認識対象とする書類種別の判別処理と定型帳票認識エンジンが文字認識対象とする書類種別の判別処理の両処理を行い、どちらの書類種別にも該当する場合には、OCR帳票認識エンジンが文字認識対象とする書類種別を有する領域と定型帳票認識エンジンが文字認識対象とする書類種別を有する領域とを識別して、その識別した各領域の位置情報(座標情報)を取得する。そして、OCR帳票認識エンジンが文字認識対象とする領域の位置情報(座標情報)を付帯したイメージデータにOCR帳票認識エンジンを割り当てる。一方、定型帳票認識エンジンが文字認識対象とする領域の位置情報(座標情報)を付帯したイメージデータに定型帳票認識エンジンを割り当てる。OCR帳票エンジンは、このように割り当てられたイメージデータの中からその付帯している位置情報(座標情報)で指定される領域に対して文字認識処理をする。一方、定型帳票認識エンジンは、このように割り当てられたイメージデータの中からその付帯している位置情報(座標情報)で指定される領域に対して文字認識処理をする。 Documents include, for example, an area having a document type to be recognized by the OCR form recognition engine and an area having a document type to be recognized by the standard form recognition engine in one image data (within one page). May be mixed (when there are multiple divided areas). In this way, FIG. 4 is composed of a mixture of an area having a document type to be recognized by the OCR form recognition engine and an area having a document type to be recognized by the standard form recognition engine in one document. It is a figure for demonstrating the allocation process of the recognition engine in the case of. As shown in FIG. 4, for example, the OCR form recognition engine performs both processing for discriminating the document type to be character-recognized and the standard form recognition engine performs both processing for discriminating the document type to be character-recognized, and which document type is used. If the above also applies, the OCR form recognition engine identifies an area having a document type to be recognized as a character and an area having a document type to be recognized by a standard form recognition engine, and each identified area is identified. Acquires the position information (coordinate information) of. Then, the OCR form recognition engine is assigned to the image data to which the position information (coordinate information) of the area to be recognized by the OCR form recognition engine is attached. On the other hand, the standard form recognition engine is assigned to the image data with the position information (coordinate information) of the area to be recognized by the standard form recognition engine. The OCR form engine performs character recognition processing on the area specified by the incidental position information (coordinate information) from the image data allocated in this way. On the other hand, the standard form recognition engine performs character recognition processing on the area specified by the incidental position information (coordinate information) from the image data allocated in this way.

なお、1つの書類内に複数の書類種別が存在するか否かの判定処理の別の手法としては、例えば、予めOCR帳票内に、OCR帳票領域以外の定型又は非定型の記載領域が存在するとわかっていることもあるので、この場合は、帳票ID別に、定型又は非定型の記載領域が存在すること及びその記載領域の位置を予め登録しておき、認識エンジン割り当て処理の際の事前処理として分割処理を行うように構成することもできる。 As another method of determining whether or not there are a plurality of document types in one document, for example, if a standard or atypical description area other than the OCR form area exists in the OCR form in advance. Since it may be known, in this case, the existence of a standard or non-standard description area and the position of the description area are registered in advance for each form ID, and as a pre-processing in the recognition engine allocation process. It can also be configured to perform the division process.

一方で、図4に示したような処理を用いることで、例えば、複数枚(複数種類)の書類が1つのイメージデータに含まれる態様であっても、各書類毎にそれぞれの書類の座標位置を定義する処理を行い、適切な認識エンジンを割り当て、座標位置の範囲内を文字認識するように構成することも可能である。 On the other hand, by using the processing as shown in FIG. 4, for example, even if a plurality of sheets (multiple types) of documents are included in one image data, the coordinate position of each document is obtained for each document. It is also possible to perform the process of defining, assign an appropriate recognition engine, and configure it to recognize characters within the range of coordinate positions.

このように、認識特性に適合する認識エンジンに合わせて、1つのイメージデータを複数の認識エンジンでOCR処理が行われるようにしている。これにより、精度向上、スピードの向上を行うことができる。 In this way, one image data is subjected to OCR processing by a plurality of recognition engines according to the recognition engine that matches the recognition characteristics. As a result, accuracy and speed can be improved.

図5は、本実施形態の複数の異なる申請者の各書類を一括して読み取る一括読取処理の説明図である。画像生成装置200でのイメージスキャニングの際、1人の申請者の書類一式(書類の束)を、その都度セットしてスキャニングすると手間が増加する。このため、複数の申請者の各書類の束を、所定数重ねて画像生成装置200にセットし、一括して取り込むこともできる。この場合、複数の各申請者のイメージデータを区分けするために、例えば、申請者Aの書類の束と申請者Bの書類の束との間に、所定の仕切り紙を挿入すする。一括取り込み後、仕切り紙を手掛かりに、申請者別にイメージデータを区分けして保存することができる。また、仕切り紙を使わずに、書類の束の書類の並び順が決まっている場合、1ページ目に来る書類を目印に、一括取り込み後に、申請者別にイメージデータを区分けして保存することができる。 FIG. 5 is an explanatory diagram of a batch reading process for collectively reading each document of a plurality of different applicants of the present embodiment. At the time of image scanning with the image generator 200, if a set of documents (a bundle of documents) of one applicant is set and scanned each time, the time and effort increases. Therefore, a bundle of documents of a plurality of applicants can be stacked in a predetermined number and set in the image generation device 200, and can be collectively captured. In this case, in order to separate the image data of each of the plurality of applicants, for example, a predetermined partition paper is inserted between the bundle of documents of applicant A and the bundle of documents of applicant B. After batch import, image data can be sorted and saved for each applicant using the partition paper as a clue. In addition, if the order of the documents in a bundle of documents is decided without using a partition paper, the image data can be sorted and saved for each applicant after batch importing using the documents that come to the first page as a mark. it can.

図6は、本実施形態の書類読取システムの処理フローを示す図である。以下の説明では、異なる書類種別の書類が複数枚存在する申請者別の申請書類一式が、画像生成装置200で一括して読み取られる態様を例示している。 FIG. 6 is a diagram showing a processing flow of the document reading system of the present embodiment. In the following description, a mode in which a set of application documents for each applicant, in which a plurality of documents of different document types exist, is collectively read by the image generator 200 is illustrated.

図6に示すように、画像生成装置200に申請者の申請書類をセットしてスキャニングし、イメージデータを生成する(S201)。生成されたイメージデータは、利用者端末300に出力される(S202)。利用者端末300では、画像生成装置200から出力された申請書類を構成する複数のイメージデータ(複数ページのイメージデータ)を表示する(S301)。 As shown in FIG. 6, the application documents of the applicant are set in the image generator 200 and scanned to generate image data (S201). The generated image data is output to the user terminal 300 (S202). The user terminal 300 displays a plurality of image data (image data of a plurality of pages) constituting the application documents output from the image generation device 200 (S301).

ユーザは、利用者端末300を通じて、画像生成装置200から出力された複数のイメージデータを確認することができ、さらに、複数のイメージデータのうち、不要と判断されるイメージデータの削除やイメージデータの順序を並び替える操作(順序変更操作)を行うことができる(S302)。画像生成装置200は、申請書類をスキャニングした順番で、イメージデータを順序立てて利用者端末300に出力することができ、利用者端末300において、複数のイメージデータは、スキャニングされた順序情報が保持されている。 The user can check a plurality of image data output from the image generator 200 through the user terminal 300, and further delete the image data determined to be unnecessary or delete the image data among the plurality of image data. An operation of rearranging the order (order change operation) can be performed (S302). The image generation device 200 can output image data to the user terminal 300 in order in the order in which the application documents are scanned. In the user terminal 300, the plurality of image data are retained by the scanned order information. Has been done.

ユーザは、画像生成装置200から出力された複数のイメージデータに対する確認や編集を行った後、申請者毎にイメージデータを区分してローカル保存する(S303)。このとき、利用者端末300がタイムスタンプ機能を備えている場合、受付日付確定のために、タイムスタンプ(例えば、時刻認証局から発行される時刻情報とイメージデータから生成されるハッシュ値との組み合わせ)の取得処理を行い、申請者別に区分けされる複数の各イメージデータに、タイムスタンプ情報を付与するように構成することができる。 After confirming and editing the plurality of image data output from the image generator 200, the user divides the image data for each applicant and saves it locally (S303). At this time, if the user terminal 300 has a time stamp function, a time stamp (for example, a combination of time information issued by a time certification authority and a hash value generated from image data) is used to determine the reception date. ) Is performed, and the time stamp information can be added to each of the plurality of image data classified by the applicant.

利用者端末300は、ローカル保存された申請書類のイメージデータを、管理装置100に送信する(S304)。送信するタイミングは任意である。 The user terminal 300 transmits the image data of the application documents stored locally to the management device 100 (S304). The timing of transmission is arbitrary.

管理装置100では、管理者端末400を通じ、事前に認識エンジン登録処理(S101)及びテンプレート登録処理(S102)などを行う。なお、これらの処理については、上述しているので省略する。次に、管理装置100は、利用者端末300からイメージデータを受信して記憶装置130に記憶する受付処理を行う(S103)。 The management device 100 performs the recognition engine registration process (S101), the template registration process (S102), and the like in advance through the administrator terminal 400. Since these processes have been described above, they will be omitted. Next, the management device 100 receives the image data from the user terminal 300 and performs a reception process of storing the image data in the storage device 130 (S103).

管理装置100は、リアルタイムに又は任意のタイミングでOCR処理を行う。OCR処理は、ステップS104からS107の各処理を含んで構成されている。まず、申請者別に申請書類を構成する複数のイメージデータを抽出し、ページ単位、すなわち、スキャニングの順番でイメージデータを順に、書類種別識別処理(S104)、識別された書類種別に応じた認識エンジンへの振り分け処理(S105)、振り分け処理によって割り当てられた認識エンジンを用いたOCR処理(S106)、及び認識結果(文字コード)とイメージデータとを関連付けて保存する処理(S107)を行う。ステップS104からS107の処理をページ数(イメージデータ数)分繰り返し行い、申請処理を構成する各イメージデータそれぞれの文字コードを生成して保存する。 The management device 100 performs OCR processing in real time or at an arbitrary timing. The OCR process is configured to include the processes of steps S104 to S107. First, a plurality of image data constituting the application documents are extracted for each applicant, and the image data are sorted page by page, that is, in the order of scanning, the document type identification process (S104), and the recognition engine according to the identified document type. The distribution process (S105), the OCR process (S106) using the recognition engine assigned by the distribution process, and the process (S107) of associating the recognition result (character code) with the image data and saving the image data are performed. The processes of steps S104 to S107 are repeated for the number of pages (the number of image data) to generate and save the character code of each image data constituting the application process.

管理装置100は、OCR処理後の文字コードに対して編集機能を提供する。管理者端末400に、イメージデータと文字認識結果とを含む画面を表示させ、文字認識結果に対する入力、編集、削除を行えるように制御する(S401,S108)。管理装置100は、編集結果を反映する処理を行う(S109)。 The management device 100 provides an editing function for the character code after the OCR process. The administrator terminal 400 is displayed with a screen including the image data and the character recognition result, and is controlled so that the character recognition result can be input, edited, and deleted (S401, S108). The management device 100 performs a process of reflecting the editing result (S109).

ユーザは、利用者端末300から、申請書類の検索を行うことができ、管理装置100は、検索機能を提供する。例えば、申請者から問合せがあったとき、利用者端末300から申請者の氏名、住所などを検索クエリとして入力して管理装置100に送信する(S305)。管理装置100(データ制御部125)は、受信した検索クエリを用いて格納されている文字コード情報を検索する(S110)。検索の結果、ヒットした文字コード情報に対応するイメージデータを含む申請書類のイメージデータ群を抽出して、検索結果として利用者端末300に送信する(S111)。なお、検索結果としては、イメージデータと共に文字コード情報も出力するように構成してもよい。 The user can search for application documents from the user terminal 300, and the management device 100 provides a search function. For example, when there is an inquiry from the applicant, the name, address, etc. of the applicant are input from the user terminal 300 as a search query and transmitted to the management device 100 (S305). The management device 100 (data control unit 125) searches for the stored character code information using the received search query (S110). As a result of the search, the image data group of the application document including the image data corresponding to the hit character code information is extracted and transmitted to the user terminal 300 as the search result (S111). As the search result, the character code information may be output together with the image data.

図7は、本実施形態の書類読取システムのOCR処理の詳細フローを示す図であり、図6におけるステップS104からS107の各処理で構成されるOCR処理の詳細フローである。 FIG. 7 is a diagram showing a detailed flow of OCR processing of the document reading system of the present embodiment, and is a detailed flow of OCR processing composed of each processing of steps S104 to S107 in FIG.

認識エンジン割り当て制御部122は、利用者端末300から受け付けた申請者別の申請書類のイメージデータを記憶装置130から抽出し、先頭のイメージデータを読み込み、書類種別判別処理を行う。まず、認識エンジン割り当て制御部122は、イメージデータ中に3点マークなどのOCR帳票と判別可能な情報を抽出する処理を行う(S104A)。OCR帳票と判別可能な情報を抽出することができた場合(S104AのYES)、認識エンジン割り当て制御部122は、当該イメージデータをOCR帳票認識エンジンに振り分ける(当該イメージデータにOCR帳票認識エンジンを割り当てる、S105A)。 The recognition engine allocation control unit 122 extracts the image data of the application documents for each applicant received from the user terminal 300 from the storage device 130, reads the first image data, and performs the document type determination process. First, the recognition engine allocation control unit 122 performs a process of extracting information that can be distinguished from an OCR form such as a three-point mark from the image data (S104A). When the information that can be distinguished from the OCR form can be extracted (YES in S104A), the recognition engine allocation control unit 122 distributes the image data to the OCR form recognition engine (assigns the OCR form recognition engine to the image data). , S105A).

また、ステップS104Aにおいて、OCR帳票と判別可能な情報を抽出できなかった場合(S104AのNO)、タイトル別テンプレート帳票と判別可能な情報を抽出する処理を行う(S104B)。タイトル別テンプレート帳票と判別可能な情報を抽出することができた場合(S104BのYES)、認識エンジン割り当て制御部122は、当該イメージデータを定型帳票認識エンジンに振り分ける(当該イメージデータに定型帳票認識エンジンを割り当てる、S105B)。 Further, in step S104A, when the information distinguishable from the OCR form cannot be extracted (NO in S104A), the process of extracting the information distinguishable from the template form by title is performed (S104B). When the information that can be distinguished from the template form for each title can be extracted (YES in S104B), the recognition engine allocation control unit 122 distributes the image data to the standard form recognition engine (the standard form recognition engine for the image data). Is assigned, S105B).

続いて、ステップS104Bにおいて、タイトル別テンプレート帳票と判別可能な情報を抽出できなかった場合(S104BのNO)、項目(キーワード)別テンプレート帳票と判別可能な情報を抽出する処理を行う(S104C)。項目別テンプレート帳票と判別可能な情報を抽出することができた場合(S104CのYES)、認識エンジン割り当て制御部122は、当該イメージデータを非定型帳票認識エンジンに振り分ける(当該イメージデータに非定型帳票認識エンジンを割り当てる、S105C)。 Subsequently, in step S104B, when the information that can be distinguished from the template form by title cannot be extracted (NO in S104B), the process of extracting the information that can be distinguished from the template form by item (keyword) is performed (S104C). When the information that can be distinguished from the item-specific template form can be extracted (YES in S104C), the recognition engine allocation control unit 122 distributes the image data to the atypical form recognition engine (atypical form to the image data). Assign a recognition engine, S105C).

さらに、ステップS104Cにおいて、項目別テンプレート帳票と判別可能な情報を抽出できなかった場合(S104CのNO)、本人確認書類と判別可能な情報を抽出する処理を行う(S104D)。本人確認書類と判別可能な情報を抽出することができた場合(S104DのYES)、認識エンジン割り当て制御部122は、当該イメージデータを本人確認書類認識エンジンに振り分ける(当該イメージデータに本人確認書類認識エンジンを割り当てる、S105D)。 Further, in step S104C, when the information that can be distinguished from the itemized template form cannot be extracted (NO in S104C), the process of extracting the information that can be distinguished from the identity verification document is performed (S104D). When the information that can be distinguished from the identity verification document can be extracted (YES in S104D), the recognition engine allocation control unit 122 distributes the image data to the identity verification document recognition engine (identification document recognition to the image data). Assign an engine, S105D).

上記ステップS104A〜104D及びステップS105AからS105Dを経て認識エンジンの割り当てができたイメージデータに対して、認識処理部123は、割り当てられた認識エンジンを用いたOCR処理を行う(S106)。そして、認識結果制御部124は、OCR処理によって得られた認識結果(文字コード)とイメージデータとの関連付けを行い、認識結果を記憶装置130に保存する(S107)。これらの処理を、申請書類を構成する全てのイメージデータに対して繰り返し行い(S1108)、処理を終了する。 The recognition processing unit 123 performs OCR processing using the assigned recognition engine on the image data to which the recognition engine can be assigned through the steps S104A to 104D and steps S105A to S105D (S106). Then, the recognition result control unit 124 associates the recognition result (character code) obtained by the OCR process with the image data, and stores the recognition result in the storage device 130 (S107). These processes are repeated for all the image data constituting the application document (S1108), and the process is completed.

なお、ステップS104A〜104Dの処理順序は、適宜変更することが可能である。また、認識エンジン割り当て制御部122は、OCR帳票と判別可能な情報、タイトル別テンプレート帳票と判別可能な情報、項目別テンプレート帳票と判別可能な情報、本人確認書類と判別可能な情報を抽出する処理において、例えば、簡易なOCR処理を実行して、3点マーク、タイトル、項目、本人確認書類の特性情報などの情報をイメージデータ内から抽出することができる(書類種別判別のための事前OCR処理)。 The processing order of steps S104A to 104D can be changed as appropriate. Further, the recognition engine allocation control unit 122 extracts information that can be identified as an OCR form, information that can be identified as a template form by title, information that can be identified as a template form by item, and information that can be identified as an identity verification document. In, for example, a simple OCR process can be executed to extract information such as a three-point mark, a title, an item, and characteristic information of an identity verification document from the image data (preliminary OCR process for determining the document type). ).

一方で、ステップS104A〜104Dを経て、認識エンジンを割り当てることができなかった書類(イメージデータ)に対しては(S104DのNO)、読取エラーによる手動設定処理に移行する(S1101)。 On the other hand, through steps S104A to 104D, for the document (image data) to which the recognition engine could not be assigned (NO in S104D), the process proceeds to the manual setting process due to a reading error (S1101).

具体的には、認識エンジン割り当て制御部122は、読取エラーとなったイメージデータを管理者端末400の画面に表示させ、認識エンジンを手動で選択可能に制御することができる(S1102)。また、認識エンジンと書類種別の対応関係の作成・修正を可能に制御することができる(S1103)。例えば、読取エラーとなったイメージデータのタイトルや項目と認識エンジンとの対応関係を作成して登録することができる。これにより、今後、読取エラーとなったイメージデータに対して認識エンジンを自動的に割り当てることができる。あるいは、読取エラーとなったイメージデータを管理者端末400の画面に表示し、この画面表示されたイメージデータに対して、文字認識対象領域(読取個所)を指でなぞって指定する方法などもある。この指定方法はフリーフォームOCR処理(フリーフォーム文字認識処理)に対応する。 Specifically, the recognition engine allocation control unit 122 can display the image data in which the reading error has occurred on the screen of the administrator terminal 400 and control the recognition engine so that it can be manually selected (S1102). In addition, it is possible to control the creation / correction of the correspondence between the recognition engine and the document type (S1103). For example, it is possible to create and register the correspondence between the title or item of the image data in which the reading error has occurred and the recognition engine. As a result, the recognition engine can be automatically assigned to the image data in which a reading error has occurred in the future. Alternatively, there is also a method of displaying the image data in which a reading error has occurred on the screen of the administrator terminal 400 and specifying the character recognition target area (reading location) by tracing the image data displayed on the screen with a finger. .. This specification method corresponds to free-form OCR processing (free-form character recognition processing).

また、認識エンジン割り当て制御部122は、読取エラーとなったイメージデータを管理者端末400の画面に表示させ、テンプレートの修正・新規作成の各種制御を行うことができる(S1104)。例えば、読取エラーとなったイメージデータに対して新たにテンプレートを登録し、登録したテンプレート(タイトルや項目を含む)と認識エンジンとを関連付け可能に制御する。このように構成することで、認識エンジンの割り当て可能なテンプレートを拡張することができ、今後、読取エラーとなったイメージデータに対して認識エンジンを自動的に割り当てることができる。 Further, the recognition engine allocation control unit 122 can display the image data in which the reading error has occurred on the screen of the administrator terminal 400, and can perform various controls for modifying and newly creating the template (S1104). For example, a new template is registered for the image data in which a reading error occurs, and the registered template (including titles and items) is controlled so as to be associated with the recognition engine. With this configuration, the template to which the recognition engine can be assigned can be expanded, and the recognition engine can be automatically assigned to the image data in which a reading error has occurred in the future.

これらのステップS1102、S1103、S1104の各処理によって認識エンジンの割り当てが完了すると、認識エンジンマスタ情報を更新し、認識エンジン、書類種別、テンプレートの各対応関係を学習する(S1107)。そして、ステップS106に進み、認識エンジン割り当て制御部122は、手動で割り当てられた認識エンジンを用いたOCR処理を実行する。なお、ステップS1102からS1104、及びS1107の各処理は、マスタ制御部121によって遂行される。 When the recognition engine allocation is completed by each of the processes of steps S1102, S1103, and S1104, the recognition engine master information is updated and the correspondence between the recognition engine, the document type, and the template is learned (S1107). Then, the process proceeds to step S106, and the recognition engine allocation control unit 122 executes the OCR process using the manually assigned recognition engine. The processes of steps S1102 to S1104 and S1107 are executed by the master control unit 121.

また、読取エラーによる手動設定処理では、ステップS1105及びS1106の処理を含むように構成することができる。ステップS1105は、読取エラーのイメージデータに対してOCR処理を行わずに、イメージデータをそのまま保存するOCR処理スキップ処理である。ステップS1106は、読取エラーのイメージデータを削除するOCR処理スキップである。ステップS1106の場合、申請書類を構成する複数のイメージデータの中から読取エラーのイメージデータ自体を削除する処理となる。 Further, the manual setting process due to a reading error can be configured to include the processes of steps S1105 and S1106. Step S1105 is an OCR process skip process that saves the image data as it is without performing the OCR process on the image data of the reading error. Step S1106 is an OCR processing skip for deleting the image data of the reading error. In the case of step S1106, the process is to delete the image data itself of the reading error from the plurality of image data constituting the application document.

図8は、本実施形態の書類読取システムを適用したワークフローの一例を示す図である。図9は、図8に続くワークフロー、図10は、図9に続くワークフローの一例を示す図である。本ワークフローの例は、例えば、1つ又は複数の申請受付所(店舗や役所など窓口)と、処理センターとを含み、処理センターに管理装置100が設置されている。 FIG. 8 is a diagram showing an example of a workflow to which the document reading system of the present embodiment is applied. 9 is a diagram showing an example of the workflow following FIG. 8, and FIG. 10 is a diagram showing an example of the workflow following FIG. An example of this workflow includes, for example, one or more application reception offices (windows such as stores and government offices) and a processing center, and the management device 100 is installed in the processing center.

申請受付所には、画像生成装置200と利用者端末300とが設置されており、利用者端末300が専用網やIP網を介したネットワークで、処理センターの管理装置100と接続されている。また、処理センターにも画像生成装置200と利用者端末300が設けられ、処理センターの利用者端末300は、管理装置100と接続される。また、処理センターには、管理者端末400が設けられており、管理装置100と接続される。 An image generation device 200 and a user terminal 300 are installed at the application reception office, and the user terminal 300 is connected to the management device 100 of the processing center by a network via a dedicated network or an IP network. The processing center is also provided with an image generation device 200 and a user terminal 300, and the user terminal 300 of the processing center is connected to the management device 100. Further, the processing center is provided with an administrator terminal 400, which is connected to the management device 100.

まず、申請受付所では、申請者が持参した申請書類一式を、画像生成装置200でスキャニングする。そして、利用者端末300において、ユーザは、生成された申請書類一式の各イメージデータを確認したり、不要なイメージデータを削除したり、スキャニング順序で並ぶイメージデータの順番を入れ替えたりすることができる。そして、申請者別に申請書類一式のイメージデータ群を利用者端末300の記憶装置に保存すると共に、任意のタイミングで管理装置100に送信する。 First, at the application reception office, the set of application documents brought by the applicant is scanned by the image generator 200. Then, on the user terminal 300, the user can check each image data of the generated application document set, delete unnecessary image data, and change the order of the image data arranged in the scanning order. .. Then, the image data group of the application document set for each applicant is stored in the storage device of the user terminal 300 and transmitted to the management device 100 at an arbitrary timing.

一方で、処理センターには、申請者から発送された申請書類が物理的に搬送される。処理センターのユーザは、搬送された各申請書類を画像生成装置200にセットしてイメージデータの生成処理を行う。処理センターにおいても利用者端末300で、生成された申請書類一式の各イメージデータを確認したり、不要なイメージデータを削除したり、スキャニング順序で並ぶイメージデータの順番を入れ替えたりすることができる。申請者別の申請書類一式のイメージデータ群は、申請受付所同様に、任意のタイミングで管理装置100に送信したり、利用者端末300の記憶装置に保存せずに、直接管理装置100の記憶装置130に記憶したりすることができる。なお、図8の例において、一点鎖線で示すように、ワークフローとしては、申請受付所でイメージデータの生成及び管理装置100への伝送を行わずに、受け付けた紙媒体の申請書類一式を、処理センターの搬送することも可能である。 On the other hand, the application documents sent by the applicant are physically transported to the processing center. The user of the processing center sets each of the transported application documents in the image generation device 200 and performs image data generation processing. Also in the processing center, the user terminal 300 can check each image data of the generated application document set, delete unnecessary image data, and change the order of the image data arranged in the scanning order. Similar to the application reception office, the image data group of the application document set for each applicant is directly stored in the management device 100 without being transmitted to the management device 100 at an arbitrary timing or stored in the storage device of the user terminal 300. It can be stored in the device 130. In the example of FIG. 8, as shown by the alternate long and short dash line, as a workflow, the application document set of the received paper medium is processed without generating the image data and transmitting it to the management device 100 at the application reception office. It is also possible to transport the center.

図9に示すように処理センターの管理装置100は、主に図7に示したOCR処理(書類読取処理)を行い、文字コード情報とイメージデータとを関連付けて保存する。その他詳細なワークフローは、上述の通りであるため省略する。 As shown in FIG. 9, the management device 100 of the processing center mainly performs the OCR process (document reading process) shown in FIG. 7, and stores the character code information and the image data in association with each other. Other detailed workflows are as described above and will be omitted.

そして、図10において、申請受付所では、利用者端末300を通じて管理装置100にアクセスして、申請書類の検索を行うことができる。処理センターにおいても同様である。また、処理センターでは、管理者端末400を通じた文字コード情報の編集処理を行うことができる。 Then, in FIG. 10, the application reception office can access the management device 100 through the user terminal 300 and search for application documents. The same applies to the processing center. In addition, the processing center can edit the character code information through the administrator terminal 400.

このように本実施形態の書類読取システムは、申請受付所と処理センターとを含むワークフローにおいて紙媒体の電子化における作業手間を大幅に削減できる。すなわち、本実施形態の書類読取システムは、書類群に含まれる複数種別の書類に対して認識エンジンを自動的に割り当ててOCR処理を行うため、画像生成装置200でスキャニングする際の書類仕分け作業などの手間が不要となる。従来は、認識エンジンに応じて書類種別毎にそれぞれ仕分け作業を行ってOCR処理をしなければならなかったため、非常に手間及びコストがかかっていた。しかしながら、本実施形態では、書類一式を構成する複数の書類の種別をそれぞれ判別し、自動的に最適な認識エンジンを振り分けるため、高い精度による文字認識処理を実現させつつ、作業手間を低減させることができる。 As described above, the document reading system of the present embodiment can significantly reduce the work labor in digitizing the paper medium in the workflow including the application reception office and the processing center. That is, since the document reading system of the present embodiment automatically assigns a recognition engine to a plurality of types of documents included in the document group and performs OCR processing, document sorting work when scanning with the image generator 200, etc. No need for trouble. In the past, it was necessary to perform OCR processing by performing sorting work for each document type according to the recognition engine, which was very laborious and costly. However, in the present embodiment, since the types of a plurality of documents constituting the set of documents are discriminated and the optimum recognition engine is automatically sorted, the work effort is reduced while realizing the character recognition processing with high accuracy. Can be done.

また、従来の書類種別毎の選別手作業は、逆に言うと、認識エンジンに適合しない書類種別は、電子化されていなかった。このため、電子されていない書類は、書類一式とは紐付かない情報となり、わざわざ紙媒体で保管していたので、電子化されていない書類が必要なときに、物理的に探す必要があり、非常に手間であった。これに対して本実施形態では、文字コード化されない書類もイメージデータでそのまま保管し、文字コード化された別のイメージファイルと共に関連付けられて保存される。このため、申請者をキーに書類一式の中から所望の書類を容易に抽出することが可能となり、作業手間低減を実現することができる。 Further, in the conventional manual sorting for each document type, conversely, the document types that do not match the recognition engine have not been digitized. For this reason, non-digitized documents are information that is not linked to a set of documents, and since they were purposely stored on paper media, it is necessary to physically search for non-digitized documents when needed, which is extremely difficult. It was a hassle. On the other hand, in the present embodiment, the document that is not character-coded is also stored as it is as image data, and is associated and saved together with another image file that is character-coded. Therefore, it is possible to easily extract a desired document from a set of documents using the applicant as a key, and it is possible to reduce work labor.

特に本実施形態は、1書面が1イメージデータ(1ページ)単位で書類種別を判別して認識エンジンを割り当てるので、OCR処理自体の複雑化を抑制しつつ、高精度の文字認識処理が実現される。つまり、1書面に複数の認識エンジンを割り当てると、1書面内に含まれる各認識エンジン別の領域判別などが必要となり処理が複雑化する。しかしながら、本実施形態では、認識エンジンの処理性能を最大化することができ、ページ単位での認識エンジンの振り分け制御により、人手の手間を低減させつつ、高精度読取を実現することができる。 In particular, in this embodiment, since one document discriminates the document type in units of one image data (one page) and assigns a recognition engine, high-precision character recognition processing is realized while suppressing the complexity of the OCR processing itself. To. That is, if a plurality of recognition engines are assigned to one document, it is necessary to discriminate the area for each recognition engine included in one document, which complicates the process. However, in the present embodiment, the processing performance of the recognition engine can be maximized, and high-precision reading can be realized while reducing human labor by controlling the distribution of the recognition engine on a page-by-page basis.

図11から図13は、本実施形態の書類(帳票)の一例を示す図である。図11には、3点マーク及び帳票IDを含む3点帳票例と、タイトル別帳票例と、が示されている。また、図12には、項目別(特定キーワード)帳票例と、本人確認帳票例とが示されている。図13には、フリーフォーマット帳票例が示されている。 11 to 13 are diagrams showing an example of a document (form) of the present embodiment. FIG. 11 shows an example of a three-point form including a three-point mark and a form ID, and an example of a form by title. Further, FIG. 12 shows an example of an item-specific (specific keyword) form and an example of an identity verification form. FIG. 13 shows an example of a free format form.

例えば、申請書類一式の書類の束は、申請単位(又は申請者単位)で、図11の3点帳票又は図12の特定キーワード帳票の申込書と、図12の本人確認帳票との組み合わせなどを含むことができる。また、図11のタイトル識別帳票や図13のフリーフォーマット帳票を、所定の申請書の添付書類として、申請書類一式の書類の束の中に含めることができる。 For example, a bundle of application documents is a combination of the application form of the three-point form shown in FIG. 11 or the specific keyword form shown in FIG. 12 and the identity verification form shown in FIG. 12 in application units (or applicant units). Can include. Further, the title identification form of FIG. 11 and the free-form form of FIG. 13 can be included in a bundle of documents of a set of application documents as attachments to a predetermined application form.

以上、本実施形態について説明したが、書類読取管理装置100の各機能は、必要に応じて複数の装置に分散して構成することができる。また、上記書類読取管理装置100を構成する各機能は、プログラムによって実現可能であり、各機能を実現するために予め用意されたコンピュータプログラムが補助記憶装置に格納され、CPU等の制御部が補助記憶装置に格納されたプログラムを主記憶装置に読み出し、主記憶装置に読み出された該プログラムを制御部が実行することで、各部の機能を動作させることができる。 Although the present embodiment has been described above, each function of the document reading management device 100 can be distributed and configured in a plurality of devices as needed. Further, each function constituting the document reading management device 100 can be realized by a program, a computer program prepared in advance for realizing each function is stored in the auxiliary storage device, and a control unit such as a CPU assists. The functions of each unit can be operated by reading the program stored in the storage device into the main storage device and executing the program read into the main storage device by the control unit.

また、上記プログラムは、コンピュータ読取可能な記録媒体に記録された状態で、コンピュータに提供することも可能である。コンピュータ読取可能な記録媒体としては、CD−ROM等の光ディスク、DVD−ROM等の相変化型光ディスク、MO(Magnet Optical)やMD(Mini Disk)などの光磁気ディスク、フロッピー(登録商標)ディスクやリムーバブルハードディスクなどの磁気ディスク、コンパクトフラッシュ(登録商標)、スマートメディア、SDメモリカード、メモリスティック等のメモリカードが挙げられる。また、本発明の目的のために特別に設計されて構成された集積回路(ICチップ等)等のハードウェア装置も記録媒体として含まれる。 Further, the above program can be provided to a computer in a state of being recorded on a computer-readable recording medium. Computer-readable recording media include optical discs such as CD-ROMs, phase-changing optical discs such as DVD-ROMs, magneto-optical disks such as MO (Magnet Optical) and MD (Mini Disk), floppy (registered trademark) disks, and the like. Examples include magnetic disks such as removable hard disks, compact flash (registered trademarks), smart media, SD memory cards, and memory cards such as memory sticks. In addition, a hardware device such as an integrated circuit (IC chip or the like) specially designed and configured for the purpose of the present invention is also included as a recording medium.

なお、本発明の実施形態を説明したが、当該実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 Although the embodiments of the present invention have been described, the embodiments are presented as examples and are not intended to limit the scope of the invention. This novel embodiment can be implemented in various other embodiments, and various omissions, replacements, and changes can be made without departing from the gist of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are also included in the scope of the invention described in the claims and the equivalent scope thereof.

100 書類読取管理装置
110 通信装置
120 制御装置
121 マスタ制御部
122 認識エンジン割り当て制御部
123 認識処理部
124 認識結果制御部
125 データ制御部
130 記憶装置
100 Document reading management device 110 Communication device 120 Control device 121 Master control unit 122 Recognition engine allocation control unit 123 Recognition processing unit 124 Recognition result control unit 125 Data control unit 130 Storage device

Claims (6)

書類種別の異なる複数枚の書類のイメージデータを生成する画像生成装置と、前記イメージデータに対する文字認識処理を行う管理装置と、を備える書類読取システムであって、
前記管理装置は、
前記文字認識処理するための文字認識エンジンを複数登録するとともに、前記文字認識エンジンに対して1つ又は複数の書類種別を関連付けるマスタ制御部と、
前記イメージデータの書類種別を判別して、判別された書類種別に関連付けられた前記文字認識エンジンを前記イメージデータに割り当てる認識エンジン割り当て制御部と、
前記イメージデータ毎に、割り当てられた前記文字認識エンジンを用いて文字認識処理を行う認識処理部と、を有し、
前記文字認識エンジンは、OCR帳票認識エンジン、定型帳票認識エンジン、非定型帳票認識エンジン、本人確認書類認識エンジンを含み、
前記認識エンジン割り当て制御部は、
認識精度を高める対策が施された書類又は/及び紙面に印字される帳票IDで紐付くテンプレート定義が適用された書類の前記イメージデータを前記OCR帳票認識エンジンに割り当て、
前記OCR帳票認識エンジンに仕分けされなかった書類であって、書類のタイトル別に事前登録された文字認識テンプレートが存在する書類の前記イメージデータを前記定型帳票認識エンジンに割り当て、
前記OCR帳票認識エンジン及び前記定型帳票認識エンジンに仕分けされなかった書類であって、書類内の1つ又は複数の項目又はキーワード別に事前登録された文字認識テンプレートが存在する書類の前記イメージデータを、前記非定型帳票認識エンジンに割り当て、
前記OCR帳票認識エンジン、前記定型帳票認識エンジン及び前記非定型帳票認識エンジンに仕分けされなかった書類であって、本人確認書類の特性情報を含む書類のイメージデータを前記本人確認書類認識エンジンに割り当てる、
ことを特徴とする書類読取システム。
A document reading system including an image generator that generates image data of a plurality of documents having different document types and a management device that performs character recognition processing on the image data.
The management device is
A master control unit that registers a plurality of character recognition engines for character recognition processing and associates one or more document types with the character recognition engine.
A recognition engine allocation control unit that determines the document type of the image data and assigns the character recognition engine associated with the determined document type to the image data.
Wherein each image data, possess a recognition processing unit that performs a character recognition process using the character recognition engine assigned, and
The character recognition engine includes an OCR form recognition engine, a standard form recognition engine, an atypical form recognition engine, and an identity verification document recognition engine.
The recognition engine allocation control unit
Allocate the image data of the document to which the template definition associated with the form ID printed on the paper and / or the document to improve the recognition accuracy is applied to the OCR form recognition engine.
The image data of a document that is not sorted by the OCR form recognition engine and has a character recognition template pre-registered for each document title is assigned to the standard form recognition engine.
The image data of a document that is not sorted by the OCR form recognition engine and the standard form recognition engine and has a character recognition template pre-registered for one or more items or keywords in the document. Assigned to the atypical form recognition engine,
Documents that are not sorted by the OCR form recognition engine, the standard form recognition engine, and the non-standard form recognition engine, and which include the characteristic information of the identity verification document, are assigned to the identity verification document recognition engine.
A document reading system characterized by this.
前記画像生成装置は、提出書類単位又は書類提出者別に書類種別の異なる複数枚の書類で構成された提出書類一式のイメージデータ群を生成し、
前記認識エンジン割り当て制御部は、提出書類単位又は書類提出者別の前記イメージデータ群の各イメージデータの書類種別を判別して、判別された書類種別に関連付けられた前記文字認識エンジンを前記提出書類一式の各イメージデータに割り当てることを特徴とする請求項1に記載の書類読取システム。
The image generator generates an image data group of a set of submitted documents composed of a plurality of documents having different document types for each submitted document or for each document submitter.
The recognition engine allocation control unit determines the document type of each image data of the image data group for each submitted document or for each document submitter, and uses the character recognition engine associated with the determined document type as the submitted document. The document reading system according to claim 1, wherein the document reading system is assigned to each set of image data.
前記認識エンジン割り当て制御部は、1つの前記イメージデータ内に、複数の書類種別に対応する領域が存在するか否かを判別し、複数の書類種別に対応する領域が存在すると判別された場合に、前記複数の書類種別に対応する各領域の位置情報を取得し、前記イメージデータと前記取得した位置情報とに前記判別された書類種別に関連付けられた前記文字認識エンジンを割り当てることを特徴とする請求項1又は2に記載の書類読取システム。 The recognition engine allocation control unit determines whether or not there are areas corresponding to a plurality of document types in one image data, and when it is determined that there are areas corresponding to a plurality of document types. It is characterized in that the position information of each area corresponding to the plurality of document types is acquired, and the character recognition engine associated with the determined document type is assigned to the image data and the acquired position information. The document reading system according to claim 1 or 2. 前記認識エンジン割り当て制御部は、前記OCR帳票認識エンジン、前記定型帳票認識エンジン、前記非定型帳票認識エンジン、及び前記本人確認書類認識エンジンに振り分けることができなかった読取エラーのイメージデータに対し、
(a)読取エラーとなったイメージデータに対して、前記認識エンジンのいずれかを選択
する選択処理、
(b)読取エラーとなったイメージデータに対して、前記文字認識処理を行わずに、当該イメージデータをそのまま保存する第1スキップ処理、
(c)前記文字認識処理を行わずに、読取エラーとなったイメージデータを削除する第2スキップ処理、
の少なくとも1つを遂行し、
前記マスタ制御部は、
(d)読取エラーとなったイメージデータに対して、前記認識エンジンと書類種別の対応関係の新規作成及び編集する第1マスタ処理、
(e)読取エラーとなったイメージデータに対して、前記文字認識テンプレートの新規作成及び編集する第2マスタ処理、
(f)読取エラーとなったイメージデータに対して、文字認識対象領域を指定する第3マスタ処理、
の少なくとも1つを遂行する、ことを特徴とする請求項に記載の書類読取システム。
The recognition engine allocation control unit receives image data of a reading error that could not be distributed to the OCR form recognition engine, the standard form recognition engine, the non-standard form recognition engine, and the identity verification document recognition engine.
(A) Selection process for selecting one of the recognition engines for image data that has a reading error.
(B) The first skip process of saving the image data as it is without performing the character recognition process for the image data in which a reading error occurs.
(C) A second skip process for deleting image data that has a reading error without performing the character recognition process.
Perform at least one of
The master control unit
(D) First master processing for newly creating and editing the correspondence between the recognition engine and the document type for the image data in which a reading error has occurred.
(E) Second master processing for newly creating and editing the character recognition template for the image data in which a reading error has occurred.
(F) Third master processing for designating a character recognition target area for image data that has a reading error,
Document reading system according to claim 1 performs at least one of, it characterized that.
書類種別の異なる複数枚の書類のイメージデータに対する文字認識処理を行う書類読取管理装置であって、
前記文字認識処理するための文字認識エンジンを複数登録するとともに、前記文字認識エンジンに対して1つ又は複数の書類種別を関連付けるマスタ制御部と、
前記イメージデータの書類種別を判別して、判別された書類種別に関連付けられた前記文字認識エンジンを前記イメージデータに割り当てる認識エンジン割り当て制御部と、
前記イメージデータ毎に、割り当てられた前記文字認識エンジンを用いて文字認識処理を行う認識処理部と、を有し、
前記文字認識エンジンは、OCR帳票認識エンジン、定型帳票認識エンジン、非定型帳票認識エンジン、本人確認書類認識エンジンを含み、
前記認識エンジン割り当て制御部は、
認識精度を高める対策が施された書類又は/及び紙面に印字される帳票IDで紐付くテンプレート定義が適用された書類の前記イメージデータを前記OCR帳票認識エンジンに割り当て、
前記OCR帳票認識エンジンに仕分けされなかった書類であって、書類のタイトル別に事前登録された文字認識テンプレートが存在する書類の前記イメージデータを前記定型帳票認識エンジンに割り当て、
前記OCR帳票認識エンジン及び前記定型帳票認識エンジンに仕分けされなかった書類であって、書類内の1つ又は複数の項目又はキーワード別に事前登録された文字認識テンプレートが存在する書類の前記イメージデータを、前記非定型帳票認識エンジンに割り当て、
前記OCR帳票認識エンジン、前記定型帳票認識エンジン及び前記非定型帳票認識エンジンに仕分けされなかった書類であって、本人確認書類の特性情報を含む書類のイメージデータを前記本人確認書類認識エンジンに割り当てる、
ことを特徴とする書類読取管理装置。
A document reading management device that performs character recognition processing for image data of multiple documents with different document types.
A master control unit that registers a plurality of character recognition engines for character recognition processing and associates one or more document types with the character recognition engine.
A recognition engine allocation control unit that determines the document type of the image data and assigns the character recognition engine associated with the determined document type to the image data.
Each image data has a recognition processing unit that performs character recognition processing using the assigned character recognition engine .
The character recognition engine includes an OCR form recognition engine, a standard form recognition engine, an atypical form recognition engine, and an identity verification document recognition engine.
The recognition engine allocation control unit
Allocate the image data of the document to which the template definition associated with the form ID printed on the paper and / or the document to improve the recognition accuracy is applied to the OCR form recognition engine.
The image data of a document that is not sorted by the OCR form recognition engine and has a character recognition template pre-registered for each document title is assigned to the standard form recognition engine.
The image data of a document that is not sorted by the OCR form recognition engine and the standard form recognition engine and has a character recognition template pre-registered for one or more items or keywords in the document. Assigned to the atypical form recognition engine,
Documents that are not sorted by the OCR form recognition engine, the standard form recognition engine, and the non-standard form recognition engine, and which include the characteristic information of the identity verification document, are assigned to the identity verification document recognition engine.
A document reading management device characterized by this.
書類種別の異なる複数枚の書類のイメージデータに対する文字認識処理を行うコンピュータによって実行されるプログラムであって、前記コンピュータに、
前記文字認識処理するための文字認識エンジンを複数登録するとともに、前記文字認識エンジンに対して1つ又は複数の書類種別を関連付ける第1機能と、
前記イメージデータの書類種別を判別して、判別された書類種別に関連付けられた前記文字認識エンジンを前記イメージデータに割り当てる第2機能と、
前記イメージデータ毎に、割り当てられた前記文字認識エンジンを用いて文字認識処理を行う第3機能と、を実現させ、
前記文字認識エンジンは、OCR帳票認識エンジン、定型帳票認識エンジン、非定型帳票認識エンジン、本人確認書類認識エンジンを含み、
前記第2機能は、
認識精度を高める対策が施された書類又は/及び紙面に印字される帳票IDで紐付くテンプレート定義が適用された書類の前記イメージデータを前記OCR帳票認識エンジンに割り当て、
前記OCR帳票認識エンジンに仕分けされなかった書類であって、書類のタイトル別に事前登録された文字認識テンプレートが存在する書類の前記イメージデータを前記定型帳票認識エンジンに割り当て、
前記OCR帳票認識エンジン及び前記定型帳票認識エンジンに仕分けされなかった書類であって、書類内の1つ又は複数の項目又はキーワード別に事前登録された文字認識テンプレートが存在する書類の前記イメージデータを、前記非定型帳票認識エンジンに割り当て、
前記OCR帳票認識エンジン、前記定型帳票認識エンジン及び前記非定型帳票認識エンジンに仕分けされなかった書類であって、本人確認書類の特性情報を含む書類のイメージデータを前記本人確認書類認識エンジンに割り当てる、
ことを特徴とするプログラム。
A program executed by a computer that performs character recognition processing on image data of a plurality of documents having different document types.
A first function of registering a plurality of character recognition engines for character recognition processing and associating one or more document types with the character recognition engine, and
A second function of determining the document type of the image data and assigning the character recognition engine associated with the determined document type to the image data.
For each of the image data, a third function of performing character recognition processing using the assigned character recognition engine is realized .
The character recognition engine includes an OCR form recognition engine, a standard form recognition engine, an atypical form recognition engine, and an identity verification document recognition engine.
The second function is
Allocate the image data of the document to which the template definition associated with the form ID printed on the paper and / or the document to improve the recognition accuracy is applied to the OCR form recognition engine.
The image data of a document that is not sorted by the OCR form recognition engine and has a character recognition template pre-registered for each document title is assigned to the standard form recognition engine.
The image data of a document that is not sorted by the OCR form recognition engine and the standard form recognition engine and has a character recognition template pre-registered for one or more items or keywords in the document. Assigned to the atypical form recognition engine,
Documents that are not sorted by the OCR form recognition engine, the standard form recognition engine, and the non-standard form recognition engine, and which include the characteristic information of the identity verification document, are assigned to the identity verification document recognition engine.
A program characterized by that .
JP2019083938A 2019-04-25 2019-04-25 Document reading system Active JP6786658B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019083938A JP6786658B2 (en) 2019-04-25 2019-04-25 Document reading system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019083938A JP6786658B2 (en) 2019-04-25 2019-04-25 Document reading system

Publications (2)

Publication Number Publication Date
JP2020181369A JP2020181369A (en) 2020-11-05
JP6786658B2 true JP6786658B2 (en) 2020-11-18

Family

ID=73024720

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019083938A Active JP6786658B2 (en) 2019-04-25 2019-04-25 Document reading system

Country Status (1)

Country Link
JP (1) JP6786658B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102282025B1 (en) * 2021-02-08 2021-07-28 로지스원 주식회사 Method for automatically sorting documents and extracting characters by using computer
WO2023032802A1 (en) * 2021-09-01 2023-03-09 株式会社KPMG Ignition Tokyo Annotation assistance device, annotation assistance method, and annotation assistance program
JP7345897B2 (en) * 2021-11-30 2023-09-19 政志 松本 Data storage device, data storage method, and data storage program

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10320488A (en) * 1997-05-21 1998-12-04 Hitachi Ltd Method and device for entering data
JPH11203412A (en) * 1998-01-16 1999-07-30 Toshiba Corp Method and device for processing document image and computer readable record medium storing document image processing program
JP2000132627A (en) * 1998-10-28 2000-05-12 Oki Electric Ind Co Ltd Ocr system
JP2000251012A (en) * 1999-03-01 2000-09-14 Hitachi Ltd Method and system for document processing
JP4046888B2 (en) * 1999-04-27 2008-02-13 沖電気工業株式会社 Media reading system
JP6476877B2 (en) * 2015-01-14 2019-03-06 富士ゼロックス株式会社 Information processing apparatus, system and program
JP2018101327A (en) * 2016-12-21 2018-06-28 大日本印刷株式会社 Data registering apparatus and data registering method

Also Published As

Publication number Publication date
JP2020181369A (en) 2020-11-05

Similar Documents

Publication Publication Date Title
JP4533273B2 (en) Image processing apparatus, image processing method, and program
US9002838B2 (en) Distributed capture system for use with a legacy enterprise content management system
JP6786658B2 (en) Document reading system
EP1727054A2 (en) Digitized document archiving system
US11361572B2 (en) Information processing apparatus and non-transitory computer readable medium
US9390089B2 (en) Distributed capture system for use with a legacy enterprise content management system
JPH03161873A (en) Electronic filing device having data base constructing function
JP2006065524A (en) Document processing apparatus and method
EP2884425B1 (en) Method and system of extracting structured data from a document
US20230273952A1 (en) Image processing apparatus, image processing method, and storage medium
US11657367B2 (en) Workflow support apparatus, workflow support system, and non-transitory computer readable medium storing program
US8712155B2 (en) Device for identifying types of document files
JP2007164466A (en) Duplicate type continuous form creation management system
JP4811133B2 (en) Image forming apparatus and image processing apparatus
CN112541498A (en) Information processing apparatus and recording medium
JP2008165386A (en) Document management device, document management method and document management program
US9152885B2 (en) Image processing apparatus that groups objects within image
JP2021056722A (en) Information processing device and program
JP7271987B2 (en) Information processing device and program
JP2022034204A (en) Print order determination device, image forming apparatus, and server device
US8223367B2 (en) Document processing apparatus and method for creating an image of information identifying a document
JP7533044B2 (en) Programs and Devices
US20110135162A1 (en) Image processing apparatus, image processing method and recording medium
JP5436040B2 (en) Image input / output device and monitoring system
JP2001101213A (en) Information processor, document managing device, information processing sysetm, information managing method and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190425

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201028

R150 Certificate of patent or registration of utility model

Ref document number: 6786658

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150