JP6634764B2 - Information identification program, information identification method, and image reading device - Google Patents

Information identification program, information identification method, and image reading device Download PDF

Info

Publication number
JP6634764B2
JP6634764B2 JP2015192165A JP2015192165A JP6634764B2 JP 6634764 B2 JP6634764 B2 JP 6634764B2 JP 2015192165 A JP2015192165 A JP 2015192165A JP 2015192165 A JP2015192165 A JP 2015192165A JP 6634764 B2 JP6634764 B2 JP 6634764B2
Authority
JP
Japan
Prior art keywords
data
area
image
character string
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015192165A
Other languages
Japanese (ja)
Other versions
JP2017068507A (en
Inventor
雅幸 原
雅幸 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2015192165A priority Critical patent/JP6634764B2/en
Publication of JP2017068507A publication Critical patent/JP2017068507A/en
Application granted granted Critical
Publication of JP6634764B2 publication Critical patent/JP6634764B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、情報識別プログラム、情報識別方法、及び画像読取装置に関する。   The present invention relates to an information identification program, an information identification method, and an image reading device.

従来、紙媒体の帳票のデータを収集するプログラムが知られている。特許文献1に開示されたプログラムは、複数の帳票の画像情報から、帳票に予め記載されている固定文字とユーザが帳票に記入した記入文字とを識別するステップを備える。固定文字と記入文字との識別は、同種の複数の帳票に亘って同じ位置から抽出される文字列を比較した比較結果、固定文字及び記入文字であることを評価する情報を蓄積した学習結果、及び作業者によって入力された補足データ等に基づいて行われている。また、固定文字と記入文字との識別結果に応じて、固定文字に基づく非記入領域と、記入文字に基づく記入領域とが識別されるステップを備える。また、非記入領域と記入領域との識別結果に応じて帳票を電子データ化した帳票テンプレートを生成するステップを備える。   2. Description of the Related Art Conventionally, there has been known a program for collecting data of a paper form. The program disclosed in Patent Literature 1 includes a step of identifying, from image information of a plurality of forms, fixed characters written in the form in advance and characters entered in the form by the user. The discrimination between the fixed character and the input character is based on a comparison result of comparing character strings extracted from the same position over a plurality of forms of the same type, a learning result storing information for evaluating the fixed character and the input character, And based on supplementary data and the like input by the operator. The method further includes a step of identifying a non-entry area based on the fixed character and an entry area based on the entered character according to the identification result of the fixed character and the entered character. In addition, the method includes a step of generating a form template in which the form is converted into electronic data in accordance with the result of identifying the non-entry area and the entry area.

特開2015−5100号公報JP-A-2015-5100

しかしながら、帳票によっては、常にユーザによって文字が記入される領域に加えて、ユーザによって文字が記入される場合と記入されない場合とがある領域を含むものもある。このようなユーザの任意で記入される領域を有する帳票については、上記のプログラムを用いても、領域の種類を正確に識別できない可能性がある。   However, some forms include, in addition to the area where characters are always written by the user, an area where characters may or may not be written by the user. Regarding such a form having an area to be filled in arbitrarily by the user, there is a possibility that the type of the area cannot be accurately identified even by using the above program.

本発明は、帳票に設けられている領域の種類を適切に識別し、領域の種類に応じた処理を実行できる情報識別プログラム、情報識別方法、及び画像読取装置を提供することを目的とする。   An object of the present invention is to provide an information identification program, an information identification method, and an image reading device that can appropriately identify the type of an area provided in a form and execute processing according to the type of the area.

本明細書に例示する第一態様に係る情報識別プログラムは、情報識別装置を構成するコンピュータによって実行される情報識別プログラムであって、前記コンピュータに、手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する第一取得ステップと、前記読取データに基づいて前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データを取得する第二取得ステップと、前記読取データにおいて第一画素値に対応する輪郭で囲まれた第一領域を特定する第一領域特定ステップと、前記第一領域の画像を示す第一領域データを前記読取データから取得する第三取得ステップと、前記帳票画像データにおいて前記第一領域に対応する帳票第一領域を特定する帳票第一領域特定ステップと、前記帳票第一領域の画像を示す帳票第一データを前記帳票画像データから取得する第四取得ステップと、前記第一領域データと、前記帳票第一データとが異なるかを判断する第一判断ステップと、前記第一領域データと前記帳票第一データとが異なると判断された場合、前記第一領域に含まれる第一文字列を少なくとも含む文字列を示す文字列データを文字認識処理に基づいて取得する一方、前記第一領域データと前記帳票第一データとが異ならないと判断された場合、前記文字列データを取得しない第一実行ステップとを実行させる。 An information identification program according to a first aspect exemplified in the present specification is an information identification program executed by a computer constituting an information identification device, and is a form in which characters including handwritten characters are written on the computer. A first acquisition step of acquiring read data indicating an image obtained by reading an entry form; and a form image showing an image of the form without a handwritten character, the form corresponding to the entry form based on the read data. A second obtaining step of obtaining data, a first area specifying step of specifying a first area surrounded by a contour corresponding to a first pixel value in the read data, and a first area showing an image of the first area A third obtaining step of obtaining data from the read data; and specifying a form first area corresponding to the first area in the form image data. A form first area specifying step, a fourth obtaining step of obtaining form first data indicating an image of the form first area from the form image data, the first area data and the form first data are different A first determination step of determining whether the first area data is different from the form first data, and character string data indicating a character string including at least a first character string included in the first area Is acquired based on the character recognition processing, and if it is determined that the first area data is not different from the form first data, a first execution step of not acquiring the character string data is executed.

本明細書に例示する第一態様に係る情報識別プログラムによれば、読取データに基づいて判定された帳票の種別に応じた帳票画像データが取得される。また、読取データから第一画素値に対応する輪郭で囲まれた第一領域が特定され、第一領域データが取得される。第一領域データと、帳票画像データのうち第一領域に対応する帳票第一データとが異なる場合には、第一領域データに対応する第一文字列データを含む文字列データが読取データから取得される。一方、第一領域データと帳票第一データとが異ならない場合には、文字列データが取得されず、第一領域データを表示する指示が出力される。例えば、帳票において必ず記入することが求められる領域を、本発明に係る第一領域に適用すると、第一領域に手書き文字等が記入され、第一領域データと帳票第一データとが異なる場合には、読取データから第一文字列データを含む文字列データが取得される。一方、第一領域に手書き文字等が記入されず、第一領域データと帳票第一データとが異ならない場合には、読取データから文字列データが取得されない。従って、本発明の第一態様に係る情報識別プログラムは、帳票に設けられている領域の種類を適切に識別し、領域の種類に応じた処理を実行できる。 According to the information identification program according to the first aspect exemplified in this specification, form image data corresponding to a form type determined based on read data is obtained. Further, a first area surrounded by an outline corresponding to the first pixel value is specified from the read data, and first area data is obtained. If the first area data is different from the form first data corresponding to the first area in the form image data, character string data including the first character string data corresponding to the first area data is obtained from the read data. You. On the other hand, if the first area data does not differ from the form first data, the character string data is not obtained, and an instruction to display the first area data is output. For example, when an area that is required to be filled out in a form is applied to the first area according to the present invention, handwritten characters or the like are written in the first area, and the first area data and the form first data are different. Acquires character string data including first character string data from the read data. On the other hand, if no handwritten characters or the like are written in the first area and the first area data and the form first data are not different, character string data is not obtained from the read data. Therefore, the information identification program according to the first aspect of the present invention can appropriately identify the type of the area provided in the form, and execute a process according to the type of the area.

本明細書に例示する第二態様に係る情報識別方法は、情報識別装置を構成するコンピュータが実行可能な方法であって、手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する第一取得ステップと、前記読取データに基づいて前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データを取得する第二取得ステップと、前記読取データにおいて第一画素値に対応する輪郭で囲まれた第一領域を特定する第一領域特定ステップと、前記第一領域の画像を示す第一領域データを前記読取データから取得する第三取得ステップと、前記帳票画像データにおいて前記第一領域に対応する帳票第一領域を特定する帳票第一領域特定ステップと、前記帳票第一領域の画像を示す帳票第一データを前記帳票画像データから取得する第四取得ステップと、前記第一領域データと、前記帳票第一データとが異なるかを判断する第一判断ステップと、前記第一領域データと前記帳票第一データとが異なると判断された場合、前記第一領域に含まれる第一文字列を少なくとも含む文字列を示す文字列データを文字認識処理に基づいて取得する一方、前記第一領域データと前記帳票第一データとが異ならないと判断された場合、前記文字列データを取得しない第一実行ステップとを備えている。 The information identification method according to the second aspect exemplified in this specification is a method that can be executed by a computer constituting the information identification device, and is an image obtained by reading an entry form, which is a form in which characters including handwritten characters are entered. A first acquisition step of acquiring read data indicating a form, and a second form of acquiring form image data indicating an image of a form in which a handwritten character is not entered, the form corresponding to the entry form based on the read data. An obtaining step, a first area specifying step of specifying a first area surrounded by a contour corresponding to a first pixel value in the read data, and a first area data indicating an image of the first area from the read data. A third obtaining step of obtaining, a form first area specifying step of specifying a form first area corresponding to the first area in the form image data, A fourth acquisition step of acquiring form first data indicating an image from the form image data; a first determination step of determining whether the first area data is different from the first form data; and the first area When it is determined that the data and the form first data are different, while obtaining character string data indicating a character string including at least the first character string included in the first area based on a character recognition process, A first execution step of not acquiring the character string data when it is determined that the area data and the form first data are not different.

本明細書に例示する第二態様に係る情報識別方法に倣って、情報識別装置のコンピュータが情報を識別することで、第一態様と同様の効果を奏することができる。 By following the information identification method according to the second aspect exemplified in the present specification, the computer of the information identification device identifies information, thereby achieving the same effect as in the first aspect.

本明細書に例示する第二態様に係る画像読取装置は、帳票の画像を読み取る読取部と、前記読取部によって読み取られた、手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する第一取得手段と、前記読取データに基づいて前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データを取得する第二取得手段と、前記読取データにおいて第一画素値に対応する輪郭で囲まれた第一領域を特定する第一領域特定手段と、前記第一領域の画像を示す第一領域データを前記読取データから取得する第三取得手段と、前記帳票画像データにおいて前記第一領域に対応する帳票第一領域を特定する帳票第一領域特定手段と、前記帳票第一領域の画像を示す帳票第一データを前記帳票画像データから取得する第四取得手段と、前記第一領域データと、前記帳票第一データとが異なるかを判断する第一判断手段と、前記第一領域データと前記帳票第一データとが異なると判断された場合、前記第一領域に含まれる第一文字列を少なくとも含む文字列を示す文字列データを文字認識処理に基づいて取得する一方、前記第一領域データと前記帳票第一データとが異ならないと判断された場合、前記文字列データを取得しない第一実行手段とを備えている。 An image reading device according to a second aspect exemplified in the present specification reads a reading section that reads an image of a form and an entry form that is a form filled with characters including handwritten characters, which is read by the reading section. First obtaining means for obtaining read data indicating an image, and second obtaining means for obtaining form image data indicating an image of a form in which handwritten characters are not entered, the form corresponding to the entry form based on the read data. Two obtaining means, first area specifying means for specifying a first area surrounded by a contour corresponding to a first pixel value in the read data, and first area data indicating an image of the first area in the read data. A first obtaining means for obtaining a form first area corresponding to the first area in the form image data, and a first form indicating an image of the first form area. Fourth acquisition means for acquiring data from the form image data, first area data, first determination means for determining whether the form first data is different, and the first area data and the form When it is determined that the first data is different from the first data, the character string data indicating a character string including at least the first character string included in the first area is obtained based on a character recognition process, while the first area data and the form A first execution unit that does not acquire the character string data when it is determined that the character string data is not different from the first data.

本明細書に例示する第三態様に係る画像読取装置を用いることで、第一態様と同様の効果を奏することができる。 By using the image reading device according to the third embodiment exemplified in the present specification, the same effect as in the first embodiment can be obtained.

情報識別システム4の全体構造図である。1 is an overall structural diagram of an information identification system 4. FIG. 未記入帳票100の具体例である。This is a specific example of an unfilled form 100. 記入帳票101の具体例である。It is a specific example of an entry form 101. 登録帳票DBのうち医療保険用登録帳票DB60のデータ構成を示す図である。It is a figure which shows the data structure of the registration form DB60 for medical insurances in a registration form DB. 設定テーブルのうち医療保険用設定テーブル70のデータ構成を示す図である。FIG. 6 is a diagram showing a data configuration of a medical insurance setting table 70 in the setting table. 情報識別処理を示すフローチャートである。It is a flowchart which shows an information identification process. 帳票種別判定処理を示すフローチャートである。It is a flowchart which shows a report type determination process. ユーザ判定処理を示すフローチャートである。It is a flowchart which shows a user determination process. 事前記入領域判定処理を示すフローチャートである。It is a flowchart which shows a pre-entry area determination process. 必須記入領域を示すフローチャートである。It is a flowchart which shows a required entry area. 任意記入領域を示すフローチャートである。It is a flowchart which shows an arbitrary entry area. 領域判定処理を示すフローチャートである。It is a flowchart which shows an area determination process. 該当種別なしエラー表示81の具体例である。It is a specific example of the error display 81 without a corresponding type. 記入帳票読取エラー表示82の具体例である。It is a specific example of the entry form reading error display 82. 読取結果表示200の具体例である。It is a specific example of the reading result display 200. 読取結果表示300の具体例である。7 is a specific example of a reading result display 300.

本発明の実施形態について、図面を参照して説明する。まず、図1を参照して、情報識別システム4のシステム構成を説明する。情報識別システム4は、情報識別装置1、画像読取装置(以下、「スキャナ」という)2、及び管理サーバ3を含む。情報識別装置1は、インターネット、LAN、その他の専用回線等を含むネットワーク9を介して、管理サーバ3とデータ及びコマンドを送受信可能である。   An embodiment of the present invention will be described with reference to the drawings. First, the system configuration of the information identification system 4 will be described with reference to FIG. The information identification system 4 includes an information identification device 1, an image reading device (hereinafter, referred to as “scanner”) 2, and a management server 3. The information identification device 1 can transmit and receive data and commands to and from the management server 3 via a network 9 including the Internet, a LAN, and other dedicated lines.

情報識別装置1の構成について説明する。情報識別装置1には、手書き文字を含む文字の記入された帳票に記載された内容に対応する画像データが入力される。情報識別装置1は、入力された画像データから、帳票に設けられている各種の記入欄の種類を識別する。情報識別装置1は、識別結果に応じた処理を実行する。帳票は、例えば紙媒体であり、各種の保険の契約申込書、携帯電話の契約申込書、行政手続きにおける各種の申請書等である。本実施形態において、帳票は各種の保険の契約申込書である。情報識別装置1は、情報識別専用の装置であってもよいし、所謂パーソナルコンピュータ(PC)等の汎用型の装置に、専用のアプリケーションをインストールしたものであってもよい。本実施形態では、汎用型のPCによる情報識別装置1を例示する。図1に示すように、情報識別装置1は、情報識別装置1の制御を司るコントローラであるCPU10を備えている。CPU10は、ROM11、RAM12、ハードディスクドライブ(以下、「HDD」という。)13、及び入出力インターフェース(以下、「入出力I/F」という。)14と、データバスを介して電気的に接続する。ROM11は、情報識別装置1を動作させるためのBIOS等のプログラム、及び初期値等を記憶している。RAM12は、CPU10による演算処理で得られた演算結果等、各種のデータを一時的に記憶する。   The configuration of the information identification device 1 will be described. Image data corresponding to the content described in a form in which characters including handwritten characters are entered is input to the information identification device 1. The information identification device 1 identifies the types of various entry fields provided in the form from the input image data. The information identification device 1 executes a process according to the identification result. The form is, for example, a paper medium, and includes various insurance contract application forms, mobile telephone contract application forms, various application forms in administrative procedures, and the like. In the present embodiment, the forms are various insurance contract application forms. The information identification device 1 may be a device dedicated to information identification, or a device in which a dedicated application is installed in a general-purpose device such as a so-called personal computer (PC). In the present embodiment, an information identification device 1 using a general-purpose PC will be exemplified. As shown in FIG. 1, the information identification device 1 includes a CPU 10 that is a controller that controls the information identification device 1. The CPU 10 is electrically connected to a ROM 11, a RAM 12, a hard disk drive (hereinafter, referred to as "HDD") 13, and an input / output interface (hereinafter, referred to as "input / output I / F") 14 via a data bus. . The ROM 11 stores a program such as a BIOS for operating the information identification device 1 and initial values. The RAM 12 temporarily stores various data such as a calculation result obtained by a calculation process by the CPU 10.

HDD13は、不揮発性の記憶装置である。本実施形態において、HDD13は、CPU10に後述の情報識別処理(図6参照)を実行させるプログラムを記憶する。HDD13は、非一時的な記憶媒体の一例である。非一時的な記憶媒体は、情報を記憶する期間に関わらず、情報を記憶可能な記憶媒体であればよい。非一時的な記憶媒体は、一時的な記憶媒体(例えば、伝送される信号)を含まなくてもよい。本実施形態における記憶装置はHDD13であるが、記憶装置は、情報を記憶する時間の長さに関わらずデータを保持できる、他の非一時的な記憶媒体、例えば、フラッシュメモリ、RAM等で構成されてもよい。   The HDD 13 is a nonvolatile storage device. In the present embodiment, the HDD 13 stores a program that causes the CPU 10 to execute an information identification process (see FIG. 6) described later. The HDD 13 is an example of a non-transitory storage medium. The non-transitory storage medium may be any storage medium that can store information regardless of the period in which the information is stored. Non-transitory storage media may not include temporary storage media (eg, transmitted signals). The storage device in the present embodiment is the HDD 13, but the storage device is configured by another non-temporary storage medium, such as a flash memory or a RAM, which can hold data regardless of the length of time for storing information. May be done.

入出力I/F14は、データの受け渡しの仲介を行う。入出力I/F14には、外部通信インターフェース(以下、「外部通信I/F」という。)15と、画像を表示する表示部16と、キーボード及びマウス等の操作部17と、汎用の画像読取装置であるスキャナ2とが電気的に接続されている。外部通信I/F15は、情報識別装置1をネットワーク9に接続する。外部通信I/F15は、例えば、イーサネット(登録商標)等の標準規格に適合する、インターフェース回路である。なお、外部通信I/F15には、情報識別装置1の外部において画像を表示する外部表示部19が接続可能である。外部表示部19は、ネットワーク9を介した接続が可能なモニタであってもよいし、ネットワーク9及び外部通信I/F15を介して情報識別装置1に接続するスマートフォンやタブレットPCのディスプレイであってもよい。   The input / output I / F 14 mediates data transfer. The input / output I / F 14 includes an external communication interface (hereinafter referred to as “external communication I / F”) 15, a display unit 16 for displaying an image, an operation unit 17 such as a keyboard and a mouse, and a general-purpose image reading unit. The scanner 2 as an apparatus is electrically connected. The external communication I / F 15 connects the information identification device 1 to the network 9. The external communication I / F 15 is, for example, an interface circuit conforming to a standard such as Ethernet (registered trademark). Note that an external display unit 19 that displays an image outside the information identification device 1 can be connected to the external communication I / F 15. The external display unit 19 may be a monitor connectable via the network 9 or a display of a smartphone or a tablet PC connected to the information identification device 1 via the network 9 and the external communication I / F 15. Is also good.

情報認識処理(図6参照)は、各種保険の申込書から読み取られた読取データに基づいて、申込書に設けられている記入領域の種類に応じて、申込書に記入された文字列のデータの管理を行うソフトウェアの処理の一部である。入出力I/F14は、情報識別装置1とスキャナ2等の外部機器とを接続するための、所定の規格(例えば、Universal Serial Bus (USB))に適合したインターフェース素子である。CPU10は、入出力I/F14を介して、スキャナ2等の外部機器とのデータの送受信を行う。   The information recognition process (see FIG. 6) is based on the read data read from the various insurance applications and, based on the type of entry area provided in the application, data of a character string written in the application. Is part of the software processing that manages The input / output I / F 14 is an interface element conforming to a predetermined standard (for example, Universal Serial Bus (USB)) for connecting the information identification device 1 and an external device such as the scanner 2. The CPU 10 transmits and receives data to and from an external device such as the scanner 2 via the input / output I / F 14.

スキャナ2の構成について説明する。スキャナ2は、シートフィードスキャナ、又は、フラットベッドスキャナである。スキャナ2は、後述する記入帳票101等の画像を撮像する読取動作を行い、画像データを形成して、情報識別装置1に送信する。なお、スキャナ2は、記入帳票101の読取専用のスキャナであってもよいし、汎用のスキャナであってもよい。   The configuration of the scanner 2 will be described. The scanner 2 is a sheet feed scanner or a flatbed scanner. The scanner 2 performs a reading operation of capturing an image of an entry form 101 and the like described later, forms image data, and transmits the image data to the information identification device 1. The scanner 2 may be a read-only scanner for the entry form 101 or a general-purpose scanner.

スキャナ2は、スキャナ2の制御を司るコントローラであるCPU20を備えている。CPU20は、ROM21、RAM22、入出力インターフェース(以下、「入出力I/F」という。)24、読取部26、表示部27及び操作部28と、データバスを介して電気的に接続する。ROM21は、スキャナ2を動作させるためのOS等のプログラム、及び初期値等を記憶している。RAM22は、CPU20による演算処理で得られた演算結果等、各種のデータを一時的に記憶する。特に、RAM22は、記入帳票101の画像の画像データを記憶する記憶領域を少なくとも確保している。入出力I/F24は、データの受け渡しの仲介を行う。入出力I/F24には、外部通信I/F25が電気的に接続されている。外部通信I/F25は、スキャナ2をネットワーク9に接続する。スキャナ2は、ネットワーク9及び外部通信I/F25を介して情報識別装置1と接続してもよい。なお、外部通信I/F25には、スキャナ2の外部において画像を表示する外部表示部29が接続可能である。外部表示部29は、例えば、ネットワーク9及び外部通信I/F25を介してスキャナ2に接続するスマートフォンやタブレットPCのディスプレイである。   The scanner 2 includes a CPU 20 which is a controller that controls the scanner 2. The CPU 20 is electrically connected to a ROM 21, a RAM 22, an input / output interface (hereinafter, referred to as “input / output I / F”) 24, a reading unit 26, a display unit 27, and an operation unit 28 via a data bus. The ROM 21 stores a program such as an OS for operating the scanner 2, an initial value, and the like. The RAM 22 temporarily stores various data such as a calculation result obtained by a calculation process by the CPU 20. In particular, the RAM 22 secures at least a storage area for storing image data of the image of the entry form 101. The input / output I / F 24 mediates data transfer. An external communication I / F 25 is electrically connected to the input / output I / F 24. The external communication I / F 25 connects the scanner 2 to the network 9. The scanner 2 may be connected to the information identification device 1 via the network 9 and the external communication I / F 25. Note that an external display unit 29 that displays an image outside the scanner 2 can be connected to the external communication I / F 25. The external display unit 29 is, for example, a display of a smartphone or a tablet PC connected to the scanner 2 via the network 9 and the external communication I / F 25.

読取部26は、周知の接触型イメージセンサを備える。読取部26は、記入帳票101の画像を読み取る。読取部26は、読み取ったアナログの画像をデジタルの画像データに変換する。画像データは情報識別装置1の転送指令に応じて、入出力I/F24又は外部通信I/F25を介して情報識別装置1に転送される。表示部27は、スキャナ2に備えられた画像を表示する表示画面である。操作部28はスキャナ2の各種動作の操作を行うための操作ボタン等である。スキャナ2は、操作部28を介して、又は情報識別装置1から記入帳票101の画像の読み取り指示が入力されることに応じて、記入帳票101の画像の読取動作を行う。   The reading unit 26 includes a well-known contact-type image sensor. The reading unit 26 reads an image of the entry form 101. The reading unit 26 converts the read analog image into digital image data. The image data is transferred to the information identification device 1 via the input / output I / F 24 or the external communication I / F 25 according to the transfer command of the information identification device 1. The display unit 27 is a display screen that displays an image provided on the scanner 2. The operation unit 28 includes operation buttons for performing various operations of the scanner 2. The scanner 2 performs an operation of reading the image of the entry form 101 via the operation unit 28 or in response to an instruction to read the image of the entry form 101 being input from the information identification device 1.

管理サーバ3の構成について説明する。管理サーバ3は、ハードウェアとしては汎用のサーバであってもよい。管理サーバ3は、管理サーバ3の制御を司るCPU30を備えている。CPU30は、ROM31、RAM32、HDD33、及び入出力I/F34と、データバスを介して電気的に接続する。ROM11は、管理サーバ3を動作させるためのBIOS等のプログラム、及び初期値等を記憶している。RAM32は、CPU30による演算処理で得られた演算結果等、各種のデータを一時的に記憶する。本実施形態において、HDD33は、各種情報を管理するためのデータベース(以下、「DB」という。)として、登録帳票DB及び帳票種別設定テーブルを記憶する。登録帳票DBは、例えば、後述の医療保険用登録帳票DB60(図4参照)である。帳票種別設定テーブルは、例えば、後述の医療保険用設定テーブル70(図5参照)である。入出力I/F34には、外部通信I/F35が接続されている。外部通信I/F35は、管理サーバ3をネットワーク9に接続する。外部通信I/F35は、例えば、イーサネット(登録商標)等の標準規格に適合する、インターフェース回路である。   The configuration of the management server 3 will be described. The management server 3 may be a general-purpose server as hardware. The management server 3 includes a CPU 30 that controls the management server 3. The CPU 30 is electrically connected to the ROM 31, the RAM 32, the HDD 33, and the input / output I / F 34 via a data bus. The ROM 11 stores programs such as BIOS for operating the management server 3 and initial values. The RAM 32 temporarily stores various data such as a calculation result obtained by the calculation processing by the CPU 30. In the present embodiment, the HDD 33 stores a registration form DB and a form type setting table as a database (hereinafter, referred to as “DB”) for managing various information. The registration form DB is, for example, a medical insurance registration form DB 60 described later (see FIG. 4). The form type setting table is, for example, a medical insurance setting table 70 (see FIG. 5) described later. An external communication I / F 35 is connected to the input / output I / F 34. The external communication I / F 35 connects the management server 3 to the network 9. The external communication I / F 35 is, for example, an interface circuit conforming to a standard such as Ethernet (registered trademark).

図2及び図3を参照して、未記入帳票100及び記入帳票101について説明する。未記入帳票100は、保険会社等から保険契約申込者(以下、ユーザと言う。)に対して配布される各種の保険の契約申込書である。未記入帳票100には、ユーザによって手書き文字等が未だ記入されていない。記入帳票101は、未記入帳票100に対してユーザが必要事項を記入した後の状態の帳票である。なお、未記入帳票100及び記入帳票101を特に区別しない場合、又は総称する場合、単に「帳票」という。   The blank form 100 and the filled form 101 will be described with reference to FIGS. The blank form 100 is an application form for various insurance contracts distributed from an insurance company or the like to an insurance contract applicant (hereinafter, referred to as a user). The blank form 100 has not yet been filled with handwritten characters or the like by the user. The filled-out form 101 is a form in a state after the user has filled in the required form on the unfilled form 100. In the case where the blank form 100 and the completed form 101 are not particularly distinguished or are collectively referred to, they are simply referred to as “forms”.

帳票は、帳票種別表示欄110、日付記入欄120、ユーザID欄130、事前記入欄140、第一任意記入欄150および第二任意記入欄160を主に備える。帳票は、これら以外の各種の記入欄を備えてよいが、本実施形態では説明を省略する。帳票種別表示欄110は、印刷等によって、予め文字列が記載されている欄である。予め記載された文字列は、各種の保険契約申込書のうち、帳票がいずれの種別の保険契約を申し込むためのものであるかを示す。例えば、保険契約の種別は、医療保険、自動車保険、火災保険、地震保険等が例示される。保険契約種類毎の帳票の種別を、以下では帳票種別という。即ち、帳票種別表示欄110は、帳票がいずれの帳票種別であるのかを示す欄である。図3に示す未記入帳票100の帳票種別表示欄110には、医療保険の契約申込書であることを示す「医療保険契約申込書」の文字が、帳票種別として印刷されている。帳票種別表示欄110は、帳票において左上部に設けられている。本実施形態において、帳票に帳票種別表示欄110が設けられる位置は、帳票の種別を問わず同じ位置とされている。   The form mainly includes a form type display section 110, a date entry section 120, a user ID section 130, a pre-entry section 140, a first optional entry section 150, and a second optional entry section 160. The form may include various entry fields other than these, but the description is omitted in the present embodiment. The form type display column 110 is a column in which a character string is described in advance by printing or the like. The character string described in advance indicates which type of insurance contract is to be applied for among the various insurance contract application forms. For example, the types of insurance contracts include medical insurance, car insurance, fire insurance, earthquake insurance, and the like. The form type for each insurance contract type is hereinafter referred to as a form type. That is, the form type display field 110 is a field indicating which form type the form is. In the form type display field 110 of the blank form 100 shown in FIG. 3, “Medical insurance contract application form” indicating that it is a medical insurance contract application form is printed as a form type. The form type display field 110 is provided at the upper left of the form. In the present embodiment, the position where the form type display column 110 is provided in the form is the same position regardless of the form type.

日付記入欄120は、帳票において帳票種別表示欄110の下方に設けられている。日付記入欄120は、保険契約の申し込みにあたり、ユーザが申込年月日を記入する欄である。図2に示すように、未記入帳票100において日付記入欄120には日付が記入されておらず、空欄となっている。本実施形態において、日付記入欄120に申込年月日の記入がない場合には、帳票の他の欄に記入がされていても、保険契約が締結されないこととなっている。即ち、日付記入欄120は、帳票においてユーザが必ず記載すべき欄である。このため、以下では、日付記入欄120のことを「必須記入欄」ともいう。図3に示すように、記入帳票101の日付記入欄120には、ユーザによって、手書きで「2015」年「8」月「2」日と記入されている。日付記入欄120の外周部が太目の赤色の直線で縁取られることで、帳票に日付記入欄120の輪郭を示す赤色の矩形が形成されている。この矩形を第一矩形121という。   The date entry field 120 is provided below the form type display field 110 in the form. The date entry column 120 is a column where the user enters an application date when applying for an insurance contract. As shown in FIG. 2, the date is not entered in the date entry column 120 in the blank form 100, and is blank. In the present embodiment, if the date of application is not entered in the date entry field 120, the insurance contract is not concluded even if the entry is made in other fields of the form. That is, the date entry column 120 is a column that the user must enter in the form. For this reason, hereinafter, the date entry field 120 is also referred to as an “essential entry field”. As shown in FIG. 3, the date entry field 120 of the entry form 101 is handwritten by the user as "2015", "8" month, "2" day. The outer periphery of the date entry field 120 is bordered by a thick red line, so that a red rectangle indicating the outline of the date entry field 120 is formed on the form. This rectangle is called a first rectangle 121.

ユーザID欄130は、帳票において日付記入欄120の右方に設けられている。ユーザID欄130は、ユーザIDが、保険会社等の帳票の管理者の用いるプリンター等によって印字される欄である。ユーザIDは、保険契約をしようとするユーザを示す契約者コード等であり、本実施形態では、帳票の管理者が帳票のユーザを特定するためにユーザ毎に付している文字列である。本実施形態の一例では、ユーザIDは図3及び図4に示す「AABBCC1234」である。   The user ID column 130 is provided to the right of the date entry column 120 in the form. The user ID column 130 is a column in which the user ID is printed by a printer or the like used by a manager of a form such as an insurance company. The user ID is a contractor code or the like indicating a user who intends to make an insurance contract. In the present embodiment, the user ID is a character string assigned to each user in order to identify the user of the form. In one example of the present embodiment, the user ID is "AABBCC1234" shown in FIGS.

事前記入欄140は、帳票において日付記入欄120及びユーザID欄130の下方に設けられている。事前記入欄140は、ユーザ固有の情報のうち管理者が把握している情報を、ユーザに帳票が配布されるよりも前に管理者が記入するための欄である。ユーザに配布された時点の未記入帳票100において、事前記入欄140には既にユーザ自身の本人情報が記入されている。本実施形態の例では、ユーザである「山田太郎」が「AABBCC1234」のユーザIDに関連付けて、予め医療保険用登録帳票DBに登録がなされている。管理者は、管理者の用いるプリンター等によって、医療保険用登録帳票DB60に登録されているユーザの情報を事前記入欄140に予め印字した未記入帳票100を作成する。管理者は、作成した未記入帳票100をユーザに配布する。具体的には、図2に示すように、事前記入欄140のうち、医療保険用登録帳票DB60に登録されているユーザの情報であるユーザの氏名を示す「ヤマダ タロウ」、「山田 太郎」、ユーザの性別、生年月日、住所及び電話番号が予め印字された未記入帳票100が、ユーザに配布される。事前記入欄140の外周部が太目の緑色の直線で縁取られることで、帳票に事前記入欄140の輪郭を示す緑色の矩形が形成されている。この矩形を第二矩形141という。   The preliminary entry field 140 is provided below the date entry field 120 and the user ID field 130 in the form. The pre-entry column 140 is a column for the administrator to enter information known by the administrator among the user-specific information before the form is distributed to the user. In the blank form 100 at the time of distribution to the user, the user's own personal information has already been filled in the pre-filled column 140. In the example of the present embodiment, the user “Taro Yamada” is registered in the medical insurance registration form DB in advance in association with the user ID of “AABBCC1234”. The administrator creates an unfilled form 100 in which the information of the user registered in the medical insurance registration form DB 60 is pre-printed in the pre-filled column 140 by a printer or the like used by the administrator. The administrator distributes the created blank form 100 to the user. Specifically, as shown in FIG. 2, “Yamada Taro”, “Taro Yamada”, which indicates the name of the user, which is information of the user registered in the medical insurance registration form DB 60, in the pre-entry field 140, A blank form 100 on which the user's gender, date of birth, address and telephone number are printed in advance is distributed to the user. A green rectangle indicating the outline of the pre-entry column 140 is formed on the form by bordering the outer peripheral portion of the pre-entry column 140 with a thick green straight line. This rectangle is called a second rectangle 141.

事前記入欄140には、契約の申し込みに必要な申込印を押印するための領域、住所及び電話番号に変更が生じている場合にチェックを記入するためのチェックボックス領域、また、変更後の住所及び電話番号を記入するための領域が設けられている。ユーザは、配布された未記入帳票100のこれらの領域に対して、押印し、また、必要に応じた事項を記入する。図3に示す記入帳票101は、事前記入欄140に申込印が押印され、事前記入欄140に予め印字されていた住所に変更が生じているとしてチェックボックス領域にチェックがなされ、変更後の住所がユーザによって手書きで記入された状態を示している。   In the pre-filled column 140, an area for stamping an application seal required for applying for a contract, a check box area for entering a check when an address and a telephone number are changed, and an address after the change And an area for entering a telephone number. The user seals these areas of the distributed blank form 100 and fills in the necessary items. In the entry form 101 shown in FIG. 3, an application seal is stamped in the pre-entry column 140, a check is made in the check box area assuming that the address previously printed in the pre-entry column 140 has been changed, and the post-change address is checked. Indicates that the user has filled in the information by hand.

第一任意記入欄150は、帳票において事前記入欄140の下方に設けられている。第一任意記入欄150は、ユーザの配偶者についての氏名等の情報を記入するために設けられている。例えば、ユーザに配偶者があり、配偶者についても同じ帳票を用いて保険の契約を行う場合、ユーザは、第一任意記入欄150に契約に必要な配偶者の情報を手書きで記入する。一方、ユーザに配偶者がない場合、又は配偶者があるが配偶者について保険の契約申込を行わない場合には、ユーザは第一任意記入欄150に記入する必要がない。このように、第一任意記入欄150には、ユーザの必要に応じて、手書き文字が記入される場合と記入されない場合とがある。このため、図2に示すように、未記入帳票100においては、第一任意記入欄150は空欄にされている。また、図3は、ユーザの配偶者の氏名、性別を示す囲み及び生年月日が手書きで記入され、申込印の押印された記入帳票101を示している。第一任意記入欄150の外周部が太目の青色の直線で縁取られることで、帳票に第一任意記入欄150の輪郭を示す青色の矩形が形成されている。この矩形を第三矩形151という。   The first optional entry column 150 is provided below the pre-entry column 140 in the form. The first optional entry column 150 is provided for entering information such as the name of the user's spouse. For example, if the user has a spouse and the insurance contract is to be made for the spouse using the same form, the user writes the spouse information necessary for the contract in the first optional entry column 150 by hand. On the other hand, when the user has no spouse, or when there is a spouse but does not apply for insurance for the spouse, the user does not need to fill out the first optional entry field 150. Thus, the first optional entry field 150 may or may not be filled with handwritten characters as required by the user. For this reason, as shown in FIG. 2, in the blank form 100, the first optional entry column 150 is left blank. FIG. 3 shows an entry form 101 in which a user's spouse's spouse's name, gender box, and date of birth are filled in by hand and an application seal is stamped. The outer periphery of the first optional entry column 150 is bordered by a thick blue straight line, so that a blue rectangle indicating the outline of the first optional entry column 150 is formed on the form. This rectangle is referred to as a third rectangle 151.

第二任意記入欄160は、帳票において第一任意記入欄150の下方に設けられている。第二任意記入欄160は、ユーザの子についての氏名等の情報を記入するために設けられている。例えば、ユーザに子があり、子についても同じ帳票を用いて保険の契約を行う場合、ユーザは、第二任意記入欄160に契約に必要な子の情報を手書きで記入する。一方、ユーザに子がない場合、又は子があるが子について保険の契約申込を行わない場合には、ユーザは第二任意記入欄160に記入する必要がない。このように、第二任意記入欄160は、第一任意記入欄150と同様に、ユーザの必要に応じて、手書き文字が記入される場合と記入されない場合とがある。このため、図2に示すように、未記入帳票100においては、第二任意記入欄160は空欄にされている。図3は、ユーザの子についての保険契約を行わないため、子についての情報が記入されず第二任意記入欄160が空欄になっている記入帳票101を示している。第二任意記入欄160の外周部が太目の水色(淡い青色)の直線で縁取られることで、帳票に第二任意記入欄160の輪郭を示す水色の矩形が形成されている。この矩形を第四矩形161という。なお、以下では、第一任意記入欄150及び第二任意記入欄160を総称する場合、単に「任意記入欄」ともいう。   The second optional entry field 160 is provided below the first optional entry field 150 in the form. The second optional entry field 160 is provided for entering information such as the name of the user's child. For example, when the user has a child and makes an insurance contract using the same form for the child, the user writes the child information necessary for the contract in the second optional entry field 160 by hand. On the other hand, when the user does not have a child, or when the user has a child but does not apply for an insurance contract for the child, the user need not fill in the second optional entry field 160. As described above, similarly to the first optional entry column 150, the second optional entry column 160 may or may not include a handwritten character as required by the user. For this reason, as shown in FIG. 2, in the blank form 100, the second optional entry field 160 is left blank. FIG. 3 shows the entry form 101 in which no insurance contract is made for the child of the user, and no information about the child is entered and the second optional entry column 160 is blank. The outer periphery of the second optional entry field 160 is bordered by a bold light blue (light blue) straight line, so that a light blue rectangle indicating the outline of the second optional entry field 160 is formed on the form. This rectangle is called a fourth rectangle 161. In the following, when the first optional entry column 150 and the second optional entry column 160 are collectively referred to, they are also simply referred to as “optional entry columns”.

このように、各種の帳票には、本実施形態の必須記入欄のようにユーザによって必ず記入されるべき記入欄と、任意記入欄のように、ユーザによって記入される場合とされない場合とがある記入欄とが混在することがある。また、本実施形態の事前記入欄140のように、ユーザに配布される帳票に予め記入事項のある記入欄が帳票に含まれることもある。このような記入の必要度の異なる複数種類の記入欄を含む帳票において、記入欄の種類毎に異なる色を用いた矩形で記入欄の輪郭を囲むことで、帳票に記入態様の必要度の異なる記入欄が複数含まれていることがユーザに視覚的に伝わりやすくなる。   As described above, in various forms, there is a case where the user must fill in the form, such as an essential form of the present embodiment, and a case where the form is not filled in by the user, such as an optional form. There are cases where the entry column is mixed. Further, there may be a case where a form to be distributed to the user includes a pre-filled item, such as a pre-filled column 140 of the present embodiment. In a form including a plurality of types of entry fields with different necessity of entry, by enclosing the outline of the entry field with a rectangle using a different color for each type of entry field, the necessity of the form of entry in the form is different. It becomes easier for the user to visually recognize that a plurality of entry fields are included.

HDD33に記憶されている登録帳票DBについて説明する。登録帳票DBには、複数の契約申込者の本人情報である氏名、性別、住所、電話番号等の情報が、契約申込者のそれぞれに対して付与されているユーザIDに関連付けられて、帳票種別毎に登録されている。   The registration form DB stored in the HDD 33 will be described. In the registration form DB, information such as the name, gender, address, telephone number, etc., which is the personal information of a plurality of contract applicants, is associated with the user ID assigned to each of the contract applicants, It is registered for each.

図4に示すは、登録帳票DBに登録されている各種の保険契約の種別のうち、医療保険の帳票種別についての契約申込者についての情報及び契約申込書である帳票の情報を管理するDBである。なお、図4では、医療保険用登録帳票DB60全体のうち、ユーザID「AABBCC1234」に関連付けて登録されている最小単位のデータについて例示している。   FIG. 4 shows a DB that manages information on a contract applicant for a medical insurance form type and information on a form that is a contract application form among various types of insurance contracts registered in the registration form DB. is there. FIG. 4 illustrates the minimum unit data registered in association with the user ID “AABBCC1234” in the entire medical insurance registration form DB 60.

医療保険用登録帳票DB60は、「帳票管理情報」欄、「本人情報」欄、「配偶者情報」欄及び「お子様情報」欄の各欄に登録項目を分類して情報を管理している。帳票管理情報欄には、「ユーザID」「登録日」「申込日」「登録帳票画像データ」の登録項目が含まれる。「登録日」には、管理者によってユーザID及びユーザIDに関連付けられている情報が医療保険用登録帳票DB60に登録された日付が登録される。「申込日」には、記入帳票101の日付記入欄120に記入された日付を示す文字列が、後述の情報識別処理の実行によって取得された場合に、取得された文字列に基づく日付が「申込日」として登録される。「登録帳票画像データ」には、ユーザIDに対応する未記入帳票100全体の画像を示す画像データが登録される。本実施形態では、画像データはJPEG形式であるが、画像データの形式はGIF形式等の他の形式であってもよい。   The medical insurance registration form DB 60 manages information by classifying registration items into columns of a “form management information” column, a “identity information” column, a “spouse information” column, and a “child information” column. The form management information column includes registration items of “user ID”, “registration date”, “application date”, and “registered form image data”. In the “registration date”, the date at which the administrator has registered the user ID and the information associated with the user ID in the medical insurance registration form DB 60 is registered. In the “application date”, when a character string indicating the date entered in the date entry field 120 of the entry form 101 is acquired by executing the information identification process described later, the date based on the acquired character string is “ Application date. " In the “registered form image data”, image data indicating an image of the entire blank form 100 corresponding to the user ID is registered. In the present embodiment, the image data is in the JPEG format, but the format of the image data may be another format such as a GIF format.

本人情報欄に含まれる各登録項目には、契約申込者の氏名、性別、住所、電話番号を示す情報が、ユーザIDに対応づけられて予め登録される。本人情報欄の登録内容は、未記入帳票100の事前記入欄140に予め印字される内容である。   In each registration item included in the principal information column, information indicating the name, gender, address, and telephone number of the contract applicant is registered in advance in association with the user ID. The registered contents in the personal information column are contents to be printed in advance in the pre-filled column 140 of the blank form 100.

配偶者情報欄に含まれる各登録項目には、記入帳票101の第一任意記入欄150に記入された内容を示す文字列等が後述の情報識別処理の実行によって取得された場合に、取得された文字列等に基づく各内容が登録される。お子様情報欄には、記入帳票101の第二任意記入欄160に記入された内容を示す文字列等が後述の情報識別処理の実行によって取得された場合に、取得された文字列等に基づく各内容が登録される。従って、配偶者情報欄及びお子様情報欄は、医療保険用登録帳票DB60の登録日において、また、医療保険用登録帳票DB60に基づいて未記入帳票100が作成される時点においては登録内容が存在しないので、空欄にされている。図4において、登録項目に対応する登録内容が存在しないことを、「−」と示している。   Each of the registration items included in the spouse information column is acquired when a character string or the like indicating the content entered in the first optional entry column 150 of the entry form 101 is acquired by executing the information identification process described later. Each content based on the entered character string is registered. In the child information column, when a character string or the like indicating the content entered in the second optional entry column 160 of the entry form 101 is acquired by executing the information identification process described later, each character string based on the acquired character string and the like is displayed. The contents are registered. Therefore, the spouse information section and the child information section have no registration contents at the registration date of the medical insurance registration form DB 60 and at the time when the blank form 100 is created based on the medical insurance registration form DB 60. So it is blank. In FIG. 4, "-" indicates that there is no registered content corresponding to the registered item.

図5を参照して、HDD33に記憶されている医療保険用設定テーブル70について説明する。医療保険用設定テーブル70は、管理者が取り扱う複数種別の保険契約申込書に対応する帳票のうち、医療保険契約申込書についての設定情報を格納している。図示しないが、HDD33には、医療保険用設定テーブル70以外の様々な帳票種別に対応する帳票の設定情報を格納する設定テーブルが複数記憶されている。設定情報とは、帳票種別表示欄110、日付記入欄120、事前記入欄140、第一任意記入欄150および第二任意記入欄160のそれぞれの帳票における配置等を示す情報である。   The medical insurance setting table 70 stored in the HDD 33 will be described with reference to FIG. The medical insurance setting table 70 stores setting information on a medical insurance contract application form among forms corresponding to a plurality of types of insurance contract applications handled by the administrator. Although not shown, the HDD 33 stores a plurality of setting tables for storing form setting information corresponding to various form types other than the medical insurance setting table 70. The setting information is information indicating the arrangement of each of the form type display section 110, date entry section 120, pre-entry section 140, first optional entry section 150, and second optional entry section 160 in the form.

医療保険用設定テーブル70は、「種別領域」欄、「ID領域」欄、「事前記入領域」欄、「必須記入領域」欄、「第一任意領域」欄、「第二任意領域」の各欄に設定情報を分類して格納している。種別領域欄は、帳票における帳票種別表示欄110について、「座標位置」、「領域範囲」及び「種別領域データ」の各情報を格納している。座標位置である(x0,y0)は、帳票を読み取った読取データにおいて帳票種別表示欄110の最も左上の部分が帳票において配置される位置を、帳票の左上角の位置をx−y座標の原点(0,0)として座標表示したものである。領域範囲は、後述の帳票種別判定処理(図7参照)において、読取データから帳票種別表示欄110に対応する画像データを抽出するために用いられる情報である。領域範囲は、(x0,y0)を原点とした抽出領域の幅及び高さをドット数(画素数)で表示したものである。座標位置(x0,y0)に基づく領域範囲「25×80」は、帳票において帳票種別表示欄110が占める位置及び領域よりもひとまわり広くなるように設定されている。登録種別領域データは、未記入帳票100に事前記入欄140に対応する内容が印字される前の状態の帳票における帳票種別表示欄110を示す画像データを、パターンマッチングのためのテンプレートとして記憶する。登録種別領域データのデータ形式はJPEG形式をはじめ、パターンマッチングが可能ないずれの形式であってもよい。図5では登録種別領域データとして「iryohoken.jpg」のファイル名による一つの画像データが示されている。「iryohoken.jpg」は、医療保険の契約申込書を示す帳票種別に対応付けられた画像データである。登録種別領域データは、この他、様々な帳票種別に対応する帳票種別表示欄110を示す画像データを含む。また、他の帳票種別についての設定テーブルのそれぞれにも、上記の「種別領域」欄と同様の欄が設けられている。   The medical insurance setting table 70 includes a “type area” field, an “ID area” field, a “pre-fill area” field, a “required data area” field, a “first optional area” field, and a “second optional area”. In the column, the setting information is classified and stored. The type area column stores information on “coordinate position”, “area range”, and “type area data” for the form type display field 110 in the form. The coordinate position (x0, y0) is a position where the upper left portion of the form type display column 110 is arranged in the form in the read data obtained by reading the form, the position of the upper left corner of the form is the origin of the xy coordinates. The coordinates are displayed as (0, 0). The area range is information used for extracting image data corresponding to the form type display column 110 from the read data in a form type determination process (see FIG. 7) described later. The region range indicates the width and height of the extraction region with the origin at (x0, y0) in terms of the number of dots (number of pixels). The area range “25 × 80” based on the coordinate position (x0, y0) is set to be slightly larger than the position and area occupied by the form type display field 110 in the form. The registration type area data stores, as a template for pattern matching, image data indicating the form type display field 110 in the form before the content corresponding to the pre-filled field 140 is printed on the blank form 100. The data format of the registration type area data may be any format that allows pattern matching, including the JPEG format. FIG. 5 shows one piece of image data having a file name of “iryohoken.jpg” as the registration type area data. “Iryohoken.jpg” is image data associated with a form type indicating a medical insurance contract application form. The registration type area data also includes image data indicating a form type display column 110 corresponding to various form types. In each of the setting tables for the other form types, a column similar to the “type region” column is provided.

「ID領域」欄は、帳票におけるユーザID欄130について、「座標位置」及び「領域範囲」の各情報を格納している。座標位置である(x1,y1)は、読取データにおいてユーザID欄130の最も左上の部分が帳票において配置される位置を、前述の原点(0,0)に対して表示したものである。領域範囲は、後述のユーザID判定処理(図8参照)において、読取データからユーザIDを判定するために用いられる情報である。領域範囲は、(x1,y1)を原点とした領域の高さ及び幅をドット数で表示したものである。   The “ID area” field stores information on “coordinate position” and “area range” for the user ID field 130 in the form. The coordinate position (x1, y1) indicates the position where the upper left portion of the user ID column 130 in the read data is arranged in the form with respect to the origin (0, 0). The area range is information used for determining a user ID from read data in a user ID determination process (see FIG. 8) described later. The area range indicates the height and width of the area with the origin at (x1, y1) in terms of the number of dots.

事前記入領域欄は、帳票における事前記入欄140について、「座標位置」、「領域範囲」、「第一画素値」及び「第一閾値」の各情報を格納している。座標位置である(x2,y2)は、読取データにおいて事前記入欄140の最も左上の部分が帳票において配置される位置を、前述の原点(0,0)に対して表示したものである。領域範囲は、後述の領域判定処理(図12参照)において、読取データから事前記入欄140に対応する第二矩形141を特定するために用いられる情報である。領域範囲は、(x2,y2)を原点とした領域の高さ及び幅をドット数で表示したものである。座標位置(x2,y2)に基づく領域範囲「100×200」は、帳票において第二矩形141が占める位置及び領域よりもひとまわり広くなるように設定されている。第一画素値は、帳票に設けられている第二矩形141の緑色を示す値を各色256階調のRGB形式で示したものである。第一閾値は、領域判定処理において第二矩形141を特定する際に、第一画素値とみなす範囲を定義するものである。本実施形態において、第一閾値の「±5」は、第一画素値に定義されている画素値に対して前後5段階の範囲に含まれる画素値の色を第一画素値の色と同一色とみなすことを定義している。   The pre-filled area field stores information on “coordinate position”, “area range”, “first pixel value”, and “first threshold” for the pre-filled area 140 in the form. The coordinate position (x2, y2) indicates the position where the upper left portion of the pre-entry field 140 in the read data is arranged in the form with respect to the origin (0, 0). The area range is information used for specifying the second rectangle 141 corresponding to the pre-entry column 140 from the read data in the area determination process (see FIG. 12) described later. The area range is obtained by displaying the height and width of the area with the origin at (x2, y2) by the number of dots. The area range “100 × 200” based on the coordinate position (x2, y2) is set to be slightly larger than the position and area occupied by the second rectangle 141 in the form. The first pixel value is a value indicating the green color of the second rectangle 141 provided in the form in the RGB format with 256 gradations for each color. The first threshold value defines a range to be regarded as a first pixel value when the second rectangle 141 is specified in the area determination processing. In the present embodiment, the first threshold “± 5” is the same as the color of the pixel value included in the range of five steps before and after the pixel value defined as the first pixel value. Defines what to consider as color.

必須記入領域欄は、事前記入領域欄と同様に、帳票における日付記入欄120について、「座標位置」、「領域範囲」、「第二画素値」及び「第二閾値」の各情報を格納している。座標位置(x3,y3)に基づく領域範囲「30×130」は、帳票において第一矩形121が占める位置及び領域よりもひとまわり広くなるように設定されている。第二画素値は、帳票に設けられている第一矩形121の赤色を示す値を各色256階調のRGB形式で示したものである。   The mandatory entry area column stores information on “coordinate position”, “area range”, “second pixel value”, and “second threshold” for the date entry field 120 in the form, similarly to the pre-entry area field. ing. The area range “30 × 130” based on the coordinate position (x3, y3) is set to be slightly larger than the position and area occupied by the first rectangle 121 in the form. The second pixel value is a value indicating the red color of the first rectangle 121 provided on the form in the RGB format of 256 gradations for each color.

第一任意領域欄も同様に、帳票における第一任意記入欄150について、「座標位置」、「領域範囲」、「第三画素値」及び「第三閾値」の各情報を格納している。第二任意領域欄も同様に、帳票における第二任意記入欄160について、「座標位置」、「領域範囲」、「第四画素値」及び「第四閾値」の各情報を格納している。座標位置(x4,y4)に基づく領域範囲「50×200」は、帳票において第三矩形151が占める位置及び領域よりもひとまわり広くなるように設定されている。座標位置(x5,y5)に基づく領域範囲「150×200」は、帳票において第四矩形161が占める位置及び領域よりもひとまわり広くなるように設定されている。なお、第三画素値は、第一画素値及び第二画素値とは異なる色を示す画素値であり、帳票に設けられている第三矩形151の青色を示す値を各色256階調のRGB形式で示したものである。第四画素値は、第一画素値、第二画素値及び第三画素値とは異なる色を示す画素値であり、帳票に設けられている第四矩形161の水色を示す値を各色256階調のRGB形式で示したものである。第二閾値、第三閾値及び第四閾値も、第一閾値と同様に対応する画素値に対して前後5段階の範囲に含まれる画素値の色を同一色とみなすことを定義している。なお、第一画素値、第二画素値、第三画素値及び第四画素値は、RGB形式以外の色空間(例えば、輝度と色差を用いたYCbCr形式、色相、彩度及び明度を用いたHSV形式等)で定義されてもよい。   Similarly, the first arbitrary area column stores information on “coordinate position”, “area range”, “third pixel value”, and “third threshold” for the first arbitrary entry field 150 in the form. Similarly, the second arbitrary area column stores information on “coordinate position”, “area range”, “fourth pixel value”, and “fourth threshold” for the second arbitrary entry field 160 in the form. The area range “50 × 200” based on the coordinate position (x4, y4) is set to be slightly larger than the position and area occupied by the third rectangle 151 in the form. The area range “150 × 200” based on the coordinate position (x5, y5) is set to be slightly larger than the position and area occupied by the fourth rectangle 161 in the form. Note that the third pixel value is a pixel value indicating a color different from the first pixel value and the second pixel value, and the value indicating blue of the third rectangle 151 provided on the form is RGB gradation of 256 gradations for each color. It is shown in the format. The fourth pixel value is a pixel value indicating a color different from the first pixel value, the second pixel value, and the third pixel value. The value indicating the light blue color of the fourth rectangle 161 provided in the form is 256 floors for each color It is shown in RGB format. Similarly to the first threshold value, the second threshold value, the third threshold value, and the fourth threshold value also define that the color of the pixel value included in the range of five steps before and after the corresponding pixel value is regarded as the same color. Note that the first pixel value, the second pixel value, the third pixel value, and the fourth pixel value are expressed in a color space other than the RGB format (for example, a YCbCr format using luminance and color difference, a hue, HSV format).

図6から図16を参照して、本実施形態における情報識別処理について説明する。情報識別処理は、記入帳票101の画像がスキャナ2によって読み取られた読取データに基づいて、帳票に設けられている各領域を識別し、識別結果に応じた読取結果データを取得する処理である。   The information identification processing according to the present embodiment will be described with reference to FIGS. The information identification process is a process of identifying each area provided in the form based on the read data obtained by reading the image of the entry form 101 by the scanner 2, and acquiring the read result data according to the identification result.

情報識別処理の開始に先立って、管理者は、保険契約の種別毎に、医療保険用登録帳票DB60を含む登録帳票DBを準備する。また管理者は、ユーザが契約を所望する種別の保険契約に対応する登録帳票DBに、ユーザIDと本人情報等を関連付けて登録する。そして管理者は、登録帳票DBに登録された登録内容に基づいて、ユーザID欄130にユーザIDが、事前記入欄140に本人情報が、それぞれ印字された未記入帳票100を作成する。なお、未記入帳票100は、プリンター等によって紙媒体等に印刷されることで作成されるのに限られない。例えば、登録帳票DBに登録された登録内容がファイルに出力されることで、画像ファイルとして未記入帳票100が生成されてもよい。管理者は、作成した未記入帳票100の画像を示す画像データを、スキャナ2等を用いることで得て、得た画像データを帳票種別及びユーザIDに対応付けて、登録帳票DBに登録帳票画像データとして登録する。以下では、医療保険の契約を所望するユーザに管理者が未記入帳票100を配布したとする。ユーザは、配布された未記入帳票100に必要事項を記入した記入帳票101を管理者に提出したとする。情報識別処理において、この記入帳票101に関する処理が行われるとする。   Prior to the start of the information identification process, the administrator prepares a registration form DB including the medical insurance registration form DB 60 for each type of insurance contract. Further, the administrator associates the user ID with the personal information and registers it in the registration form DB corresponding to the type of insurance contract for which the user desires the contract. Then, based on the registration contents registered in the registration form DB, the administrator creates an unfilled form 100 in which the user ID is printed in the user ID column 130 and the personal information is printed in the pre-entry column 140, respectively. The blank form 100 is not limited to be created by being printed on a paper medium or the like by a printer or the like. For example, an unfilled form 100 may be generated as an image file by outputting the registered contents registered in the registration form DB to a file. The administrator obtains image data representing the image of the created blank form 100 by using the scanner 2 or the like, associates the obtained image data with the form type and the user ID, and registers the registered form image in the registration form DB. Register as data. In the following, it is assumed that the administrator has distributed the blank form 100 to a user who desires a medical insurance contract. It is assumed that the user has submitted a filled-out form 101 in which necessary items are filled in the distributed blank form 100 to the administrator. It is assumed that a process related to the entry form 101 is performed in the information identification process.

図6に示すように、情報識別処理が開始されると、CPU10は、記入帳票101の画像を読み取る指示を、入出力I/F14を介してスキャナ2に送信する(S11)。指示を受信したスキャナ2は、記入帳票101を読取部26において読み取り、読み取った画像のデータである読取データを生成し、情報識別装置1に送信する。CPU10は、スキャナ2から送信された読取データを、入出力I/F14を介して取得する(S12)。なお、未記入帳票100が画像ファイルとして生成されている場合には、CPU10は、S11の処理を行わなくてもよい。この場合、CPU10は、S12の処理において未記入帳票100に基づく画像ファイルを取得してもよい。その後CPU10は、帳票種別判定処理(S13)、ユーザ判定処理(S14)、事前記入領域判定処理(S15)、必須記入領域判定処理(S16)、任意記入領域判定処理(S18)を順に実行する。   As shown in FIG. 6, when the information identification process is started, the CPU 10 transmits an instruction to read the image of the entry form 101 to the scanner 2 via the input / output I / F 14 (S11). The scanner 2 that has received the instruction reads the entry form 101 in the reading unit 26, generates read data that is data of the read image, and transmits the read data to the information identification device 1. The CPU 10 acquires the read data transmitted from the scanner 2 via the input / output I / F 14 (S12). If the blank form 100 is generated as an image file, the CPU 10 does not need to perform the process of S11. In this case, the CPU 10 may acquire an image file based on the blank form 100 in the process of S12. Thereafter, the CPU 10 sequentially executes a form type determination process (S13), a user determination process (S14), a pre-filled area determination process (S15), a required entry area determination process (S16), and an optional entry area determination process (S18).

図7を参照して、帳票種別判定処理(S13、図6参照)について説明する。帳票種別判定処理は、記入帳票101の帳票種別を、読取データに基づいて判定するための処理である。帳票種別判定処理が開始されると、CPU10は、読取データがカラー画像データであるか否かを判断する(S31)。この判断には、読取画像データの示す彩度の大きさ及び分布等を用いた周知の判断手法を用いてよい。本実施形態において、管理者がユーザに配布する正規の帳票は、赤色の矩形で囲まれた日付記入欄120、緑色の矩形で囲まれた事前記入欄140、青色の矩形で囲まれた第一任意記入欄150及び水色の矩形で囲まれた第二任意記入欄160等を含む。読取画像データがカラー画像データでない場合、ユーザは、管理者から正規に配布された帳票以外の帳票を用いていることがあるので、これを排除するためにS31の処理が設けられている。   The form type determination process (S13, see FIG. 6) will be described with reference to FIG. The form type determination process is a process for determining the form type of the entry form 101 based on the read data. When the form type determination process is started, the CPU 10 determines whether the read data is color image data (S31). For this determination, a known determination method using the magnitude and distribution of the saturation indicated by the read image data may be used. In the present embodiment, the regular form distributed to the user by the administrator is a date entry box 120 surrounded by a red rectangle, a pre-entry box 140 surrounded by a green rectangle, and a first box surrounded by a blue rectangle. An optional entry field 150 and a second optional entry field 160 surrounded by a light blue rectangle are included. If the read image data is not color image data, the user may use a form other than the form normally distributed by the administrator, and the process of S31 is provided to eliminate this.

CPU10は、読取データがカラー画像データの場合(S31:YES)、読取データから帳票種別領域データを抽出する(S32)。帳票種別領域データは、読取データにおいて記入帳票101の帳票種別表示欄110に対応する部分の画像データである。本実施形態では、管理者の取り扱う帳票において、帳票に帳票種別表示欄110の設けられる位置及び領域範囲が、帳票種別を通じて同じくされている。CPU10は、HDD33に記憶されている医療保険用設定テーブル70をはじめとするいずれかの設定テーブルを参照する。CPU10は、読取データから、参照した設定テーブルの種別領域欄に定義されている座標位置及び座標範囲に該当する部分の画像データを、帳票種別領域データとして抽出する。   If the read data is color image data (S31: YES), the CPU 10 extracts form type area data from the read data (S32). The form type area data is image data of a portion corresponding to the form type display field 110 of the entry form 101 in the read data. In the present embodiment, in a form handled by the administrator, the position and area range where the form type display column 110 is provided in the form are the same through the form type. The CPU 10 refers to one of the setting tables including the medical insurance setting table 70 stored in the HDD 33. The CPU 10 extracts, from the read data, image data of a portion corresponding to a coordinate position and a coordinate range defined in the type area column of the referred setting table as form type area data.

CPU10は、抽出された帳票種別領域データと、前述の設定テーブル種別領域欄に格納されている登録種別領域データとを比較する(S33)。この処理において、CPU10は、HDD33に記憶されている設定テーブルを参照して登録種別領域データを取得し、取得した登録種別領域データに対して、抽出した帳票種別領域データのテンプレートマッチングを行う。   The CPU 10 compares the extracted form type area data with the registration type area data stored in the above-described setting table type area column (S33). In this process, the CPU 10 acquires the registration type area data with reference to the setting table stored in the HDD 33, and performs template matching of the extracted form type area data on the acquired registration type area data.

CPU10は、登録種別領域データに帳票種別領域データと一致するものがあるかを判断する(S34)。登録種別領域データに帳票種別領域データと一致するものがある場合(S34:YES)、CPU10は、一致した登録種別領域データに対応付けられている帳票種別を、記入帳票101の帳票種別と判定する(S35)。CPU10は、帳票種別の判定結果を、RAM12に記憶する。本実施形態の例では、「医療保険用」の帳票種別と判定した旨がRAM12に記憶されたとする。CPU10は、処理を情報識別処理(図6参照)へ戻す   The CPU 10 determines whether there is any registered type area data that matches the form type area data (S34). If there is any registered type area data that matches the form type area data (S34: YES), the CPU 10 determines the form type associated with the matched registered type area data as the form type of the entry form 101. (S35). The CPU 10 stores the determination result of the form type in the RAM 12. In the example of the present embodiment, it is assumed that the determination that the form type is “for medical insurance” is stored in the RAM 12. The CPU 10 returns the processing to the information identification processing (see FIG. 6).

一方、読取データがカラー画像データでない場合(S31:NO)、又は登録種別領域データに帳票種別領域データと一致するものがない場合(S34:NO)、CPU10は、該当種別なしエラー表示81(図13参照)を出力する指示を、入出力I/F14を介して表示部16に送信する(S36)。該当種別なしエラー表示81は、記入帳票101が正規の帳票でないこと、また記入帳票101に設けられている帳票種別表示欄110に示される帳票種別が情報識別処理に対応するものでないことを作業者に示すために表示される画像である。該当種別なしエラー表示81を示す画像データは、HDD33に記憶されている。表示部16は、S36の処理による指示に応じて該当種別なしエラー表示81を表示する。CPU10は、処理をS29(図6参照)の判断へ移行する。   On the other hand, if the read data is not color image data (S31: NO), or if there is no registration type area data that matches the form type area data (S34: NO), the CPU 10 displays the corresponding typeless error display 81 (FIG. 13) is transmitted to the display unit 16 via the input / output I / F 14 (S36). The error display 81 with no corresponding type indicates that the entry form 101 is not a regular form, and that the form type indicated in the form type display column 110 provided in the entry form 101 does not correspond to the information identification processing. Is an image displayed to be shown in FIG. The image data indicating the error display 81 without the corresponding type is stored in the HDD 33. The display unit 16 displays the no-type error display 81 in accordance with the instruction in the processing of S36. The CPU 10 shifts the processing to the determination of S29 (see FIG. 6).

図8を参照して、ユーザ判定処理(S14、図6参照)について説明する。ユーザ判定処理は、読取データに基づいて記入帳票101のユーザを判定するための処理である。ユーザ判定処理が開始されると、CPU10は、読取データからユーザID領域データを抽出する(S41)。ユーザID領域データは、読取データにおいて記入帳票101のユーザID欄130に対応する部分の画像データである。この処理において、CPU10は、RAM12に記憶されている帳票種別の判定結果を参照して、読取データの帳票種別が「医療保険用」であること示す情報を取得する。CPU10は、HDD33に記憶されている設定テーブルのうち、取得した帳票種別に対応する医療保険用設定テーブルを参照する。CPU10は、読取データから、医療保険用設定テーブル70のID領域欄に定義されている座標位置及び座標範囲に該当する部分の画像データを、ユーザID領域データとして抽出する。CPU10は、抽出したユーザID領域データをRAM12に記憶する。   The user determination processing (S14, see FIG. 6) will be described with reference to FIG. The user determination process is a process for determining the user of the entry form 101 based on the read data. When the user determination process is started, the CPU 10 extracts user ID area data from the read data (S41). The user ID area data is image data of a portion corresponding to the user ID column 130 of the entry form 101 in the read data. In this process, the CPU 10 refers to the determination result of the form type stored in the RAM 12 and acquires information indicating that the form type of the read data is “for medical insurance”. The CPU 10 refers to the medical insurance setting table corresponding to the acquired form type among the setting tables stored in the HDD 33. The CPU 10 extracts, from the read data, image data of a portion corresponding to the coordinate position and the coordinate range defined in the ID area column of the medical insurance setting table 70 as user ID area data. The CPU 10 stores the extracted user ID area data in the RAM 12.

CPU10は、抽出されたユーザID領域データに対して文字認識処理を実行する(S42)。本実施形態では、文字認識処理として、文字の輪郭に対応する特徴を画像から抽出し、文字の標準パターンとの比較を行う公知のOCR処理が採用される。CPU10は、OCR処理を実行することによって、RAM12に記憶されたユーザID領域データから文字を抽出する。OCR処理においては、周知のエッジ検出技術等の特徴抽出ステップと、抽出した特徴を文字のテンプレートと比較するマッチングステップとを含む、周知のライブラリを利用可能である。CPU10は、抽出された文字を分析して、ユーザID欄130に印字されている文字を特定する。CPU10は、特定したユーザID欄130に印字されている文字列を示す文字列データであるID文字列データを生成し、RAM12に記憶する。   The CPU 10 performs a character recognition process on the extracted user ID area data (S42). In the present embodiment, as a character recognition process, a known OCR process for extracting a feature corresponding to a contour of a character from an image and comparing the extracted feature with a standard pattern of the character is employed. The CPU 10 extracts characters from the user ID area data stored in the RAM 12 by executing the OCR process. In the OCR process, a known library including a feature extraction step such as a known edge detection technique and a matching step of comparing the extracted feature with a character template can be used. The CPU 10 analyzes the extracted characters and specifies the characters printed in the user ID column 130. The CPU 10 generates ID character string data that is character string data indicating a character string printed in the specified user ID column 130 and stores the ID character string data in the RAM 12.

CPU10は、HDD33に記憶されている登録帳票DBのうち、S35(図7参照)の処理で判定した帳票種別の登録帳票DBを参照する(S43)。本実施形態の例では、RAM12に「医療保険用」の帳票種別が記憶されているので、CPU10はこれに応じて医療保険用登録帳票DB60を参照したとする。CPU10は、参照した登録帳票DBに登録されている複数のユーザIDである登録ユーザIDと、RAM12に記憶されているID文字列データとを比較する(S45)。   The CPU 10 refers to the registered form DB of the form type determined in the process of S35 (see FIG. 7) among the registered form DBs stored in the HDD 33 (S43). In the example of the present embodiment, since the form of “for medical insurance” is stored in the RAM 12, it is assumed that the CPU 10 refers to the medical insurance registration form DB 60 accordingly. The CPU 10 compares the registered user ID, which is a plurality of user IDs registered in the referred registration form DB, with ID character string data stored in the RAM 12 (S45).

CPU10は、登録ユーザIDにID文字列データの示す文字列と一致する文字列があるかを判断する(S46)。登録ユーザIDにID文字列データの示す文字列と一致する文字列がない場合(S46:NO)、CPU10は、ID文字列データの示す文字列に該当する登録ユーザIDがないことを示す該当IDなしエラー表示(図示せず)を出力する指示を、入出力I/F14を介して表示部16に送信する(S47)。該当IDなしエラー表示は、例えば、「該当する登録ユーザIDが存在しません」等のメッセージを表記する画像である。表示部16は、S47の指示に応じて該当IDなしエラー表示を表示する。   The CPU 10 determines whether the registered user ID has a character string that matches the character string indicated by the ID character string data (S46). If there is no character string that matches the character string indicated by the ID character string data in the registered user ID (S46: NO), the CPU 10 determines that there is no registered user ID corresponding to the character string indicated by the ID character string data. An instruction to output a no-error display (not shown) is transmitted to the display unit 16 via the input / output I / F 14 (S47). The error display without the corresponding ID is, for example, an image indicating a message such as “the corresponding registered user ID does not exist”. The display unit 16 displays an error display without a corresponding ID according to the instruction in S47.

CPU10は、直接入力表示(図示せず)を出力する指示を、入出力I/F14を介して表示部16に送信する(S48)。直接入力表示は、例えば作業者に操作部17を用いて記入帳票101のユーザID欄130に記載されているユーザIDを入力することを促すための画面である。この処理は、記入帳票101印字されているユーザIDの印字濃度が低い等、読取データからID文字列データが正しく生成されていないときに、ID文字列データを取得するために行われる。表示部16は、S48の指示に応じて直接入力表示を表示する。   The CPU 10 transmits an instruction to output a direct input display (not shown) to the display unit 16 via the input / output I / F 14 (S48). The direct input display is, for example, a screen for urging a worker to input a user ID described in the user ID column 130 of the entry form 101 using the operation unit 17. This process is performed to acquire ID character string data when ID character string data is not correctly generated from read data, for example, when the print density of the user ID printed on the entry form 101 is low. The display unit 16 displays a direct input display according to the instruction in S48.

CPU10は、操作部17を介して入力されたID文字列データを取得する(S49)。その後、CPU10は、登録ユーザIDにID文字列データの示す文字列と一致する文字列があると判断されるまで(S46:YES)、S43からS47の処理を繰り返す。なお、S43からS47の処理が所定回数以上繰り返された場合に、CPU10は、処理をS29(図6参照)の判断へ移行させてもよい。   The CPU 10 acquires the ID character string data input via the operation unit 17 (S49). Thereafter, the CPU 10 repeats the processing from S43 to S47 until it is determined that the registered user ID has a character string that matches the character string indicated by the ID character string data (S46: YES). When the processing from S43 to S47 is repeated a predetermined number of times or more, the CPU 10 may shift the processing to the determination at S29 (see FIG. 6).

登録ユーザIDにID文字列データの示す文字列と一致する文字列があった場合(S46:YES)、CPU10は、ID文字列データの示す文字列と一致する登録ユーザIDを、読取データに対応するユーザIDとして取得する(S50)。CPU10は、取得したユーザIDを示すデータをRAM12に記憶する。CPU10は、処理を情報識別処理(図6参照)へ戻す。本実施形態の例では、記入帳票101のユーザID欄130に印字されている「AABBCC1234」文字列を示すユーザIDがRAM12に記憶されたとする。   If the registered user ID includes a character string that matches the character string indicated by the ID character string data (S46: YES), the CPU 10 assigns the registered user ID that matches the character string indicated by the ID character string data to the read data. The user ID is obtained as the user ID (S50). The CPU 10 stores data indicating the acquired user ID in the RAM 12. The CPU 10 returns the processing to the information identification processing (see FIG. 6). In the example of the present embodiment, it is assumed that the user ID indicating the character string “AABBCC1234” printed in the user ID column 130 of the entry form 101 is stored in the RAM 12.

図9を参照して、事前記入判定処理(S15、図6参照)について説明する。事前記入判定処理では、読取データに事前記入欄140に相当する第一領域が含まれるかが判定される。また、読取データに第一領域が含まれる場合には、第一領域の画像を示す第一領域データを取得し、取得した第一領域データの内容に応じた処理が行われる。図9に示すように、事前記入領域判定処理が開始されると、CPU10は、HDD33に記憶されている設定テーブルのうち、S35(図7参照)の処理で判定した帳票種別の設定テーブルを参照する(S51)。本実施形態の例では、S35の処理によって、RAM12に帳票種別が「医療保険用」である旨が記憶されているので、CPU10はこれに応じて医療保険用設定テーブル70を参照したとする。CPU10は、設定テーブルの事前記入領域欄から第一画素値及び第一閾値を取得する(S52)。ここで取得した第一画素値及び第一閾値を、事前記入領域判定処理における設定画素値及び設定閾値ともいう。   The pre-entry determination process (S15, see FIG. 6) will be described with reference to FIG. In the pre-entry determination process, it is determined whether the read data includes the first area corresponding to the pre-entry column 140. If the read data includes the first area, first area data indicating an image of the first area is acquired, and a process is performed according to the content of the acquired first area data. As shown in FIG. 9, when the pre-entry area determination processing is started, the CPU 10 refers to the setting table of the form type determined in the processing of S35 (see FIG. 7) among the setting tables stored in the HDD 33. (S51). In the example of the present embodiment, since the form type is “for medical insurance” is stored in the RAM 12 by the processing of S35, it is assumed that the CPU 10 refers to the medical insurance setting table 70 accordingly. The CPU 10 acquires the first pixel value and the first threshold value from the pre-filled area column of the setting table (S52). The first pixel value and the first threshold acquired here are also referred to as a set pixel value and a set threshold in the pre-filled area determination processing.

CPU10は、領域判定処理を実行する(S53)。図12を参照して、領域判定処理(S53、図9参照)について説明する。領域判定処理は、事前記入領域判定処理における設定画素値及び設定閾値に基づいて、読取データに設定画素値に対応する色で囲まれた領域が含まれているかを判定する処理である。なお、領域判定処理は、後述する必須記入領域判定処理(図10参照)及び任意記入領域判定処理(図11参照)においても実行される。この場合、必須記入領域判定処理における設定画素値及び設定閾値、又は任意記入領域判定処理における設定画素値及び設定閾値に基づいて、設定画素値に対応する色で囲まれた領域が含まれているかが判定される。   The CPU 10 executes an area determination process (S53). The area determination process (S53, see FIG. 9) will be described with reference to FIG. The region determination process is a process of determining whether the read data includes a region surrounded by a color corresponding to the set pixel value, based on the set pixel value and the set threshold in the pre-filled region determination process. Note that the area determination processing is also executed in an essential entry area determination processing (see FIG. 10) and an optional entry area determination processing (see FIG. 11) described later. In this case, based on the set pixel value and the set threshold in the essential entry area determination processing, or the set pixel value and the set threshold in the optional entry area determination processing, whether an area surrounded by the color corresponding to the set pixel value is included. Is determined.

図12に示すように、領域判定処理が開始されると、CPU10は、検索領域範囲を設定する(S111)。検索領域範囲は、前述したように、設定画素値に対応する画素値を有する画素の座標位置を、読取データにおいて検索する領域の範囲である。具体的には、CPU10は、HDD33に記憶されている設定テーブルのうち、S35(図7参照)の処理で判定した帳票種別の設定テーブルを参照し、設定画素値に対応する座標位置及び領域範囲を取得する。本実施形態の例では、医療保険用設定テーブル70が参照され、医療保険用設定テーブル70の事前記入領域欄において設定画素値である第一画素値に対応付けられている座標位置(x2,y2)、及び座標位置を原点とした領域範囲「100×200」が取得されたとする。CPU10は、取得された座標位置に基づく領域範囲を検索領域範囲に設定する。   As shown in FIG. 12, when the area determination process is started, the CPU 10 sets a search area range (S111). As described above, the search area range is an area range in which the coordinate position of a pixel having a pixel value corresponding to the set pixel value is searched in the read data. Specifically, the CPU 10 refers to the setting table of the form type determined in the process of S35 (see FIG. 7) among the setting tables stored in the HDD 33, and determines the coordinate position and the area range corresponding to the set pixel value. To get. In the example of the present embodiment, the medical insurance setting table 70 is referred to, and the coordinate position (x2, y2) associated with the first pixel value that is the set pixel value in the pre-filled area field of the medical insurance setting table 70 is referred to. ), And an area range “100 × 200” with the coordinate position as the origin is assumed to be acquired. The CPU 10 sets an area range based on the acquired coordinate position as a search area range.

CPU10は、読取データのうち検索領域範囲にある座標位置を示す画素のそれぞれについて、設定画素値に対応する画素値を有するかを判定する。設定画素値に対応する画素値とは、設定画素値に対して設定閾値の範囲内の画素値である。ここでは、0≦R≦5,250≦G≦255,0≦B≦5の各範囲内にある画素値が、設定画素値に対応する。本実施形態では、読取データのうち検索領域範囲にある座標位置を示す画素のそれぞれについて、第一画素値に対して第一閾値の範囲内の画素値を有するかが繰り返し判定される。そして、CPU10は、設定画素値に対応する画素値を有すると判定された画素について、各画素の座標位置を取得する(S112)。CPU10は、取得された座標位置をRAM12に記憶する。   The CPU 10 determines whether each of the pixels indicating the coordinate positions in the search area range in the read data has a pixel value corresponding to the set pixel value. The pixel value corresponding to the set pixel value is a pixel value within a set threshold value range for the set pixel value. Here, the pixel values within the respective ranges of 0 ≦ R ≦ 5, 250 ≦ G ≦ 255, and 0 ≦ B ≦ 5 correspond to the set pixel values. In the present embodiment, it is repeatedly determined whether or not each of the pixels indicating the coordinate position in the search area range in the read data has a pixel value within the range of the first threshold with respect to the first pixel value. Then, for the pixel determined to have the pixel value corresponding to the set pixel value, the CPU 10 acquires the coordinate position of each pixel (S112). The CPU 10 stores the acquired coordinate position in the RAM 12.

CPU10は、S112の処理において取得された複数の座標位置を、最小二乗法等の周知の直線近似法を用いて近似することで、近似直線を算出する(S113)。本実施形態の例では、読取データの検索領域範囲において、記入帳票101に設けられている事前記入欄140を縁取る緑色の第二矩形141の各辺に対応する近似直線が算出される。この処理において、例えば、CPU10は、K平均法を用いて、S112で取得された画素をクラスタにそれぞれ割り当てる。矩形の四辺に対応する近似直線の算出を想定しているので、クラスタ数は「4」に設定される。各クラスタに対して直線近似法を用いて近似することで、第二矩形141の各辺に対応する近似直線が算出される。なお、設定されるクラスタ数は、事前記入領域の数に応じて、適宜調整されてもよい。   The CPU 10 calculates an approximate straight line by approximating the plurality of coordinate positions acquired in the process of S112 using a known linear approximation method such as a least squares method (S113). In the example of the present embodiment, an approximate straight line corresponding to each side of the green second rectangle 141 bordering the pre-entry column 140 provided in the entry form 101 is calculated in the range of the read data search area. In this process, for example, the CPU 10 assigns each of the pixels acquired in S112 to a cluster using the K-means method. Since the calculation of approximate straight lines corresponding to the four sides of the rectangle is assumed, the number of clusters is set to “4”. By approximating each cluster using the straight line approximation method, an approximate straight line corresponding to each side of the second rectangle 141 is calculated. Note that the number of clusters to be set may be appropriately adjusted according to the number of pre-filled areas.

CPU10は、HDD33に記憶されている登録帳票DBから、帳票種別及びユーザIDに応じた登録帳票画像データを取得する(S115)。具体的には、CPU10は、HDD33に記憶されている登録帳票DBのうち、S35(図7参照)の処理で判定した帳票種別の登録帳票DBを参照し、参照した種別の登録帳票DBから、S50(図8参照)の処理で取得したユーザIDに対応する登録帳票画像データを取得する。本実施形態の例では、S35の処理によって、RAM12に「医療保険用」の帳票種別が記憶されており、S50の処理によって、RAM12に「AABBCC1234」の文字列を示すユーザIDが記憶されている。従って、登録帳票DBのうち図4に示す医療保険用登録帳票DB60が参照され、ユーザID「AABBCC1234」に対応付けられている登録帳票画像データ「AABBCC1234_0.jpg」が取得されたとする。   The CPU 10 acquires the registered form image data corresponding to the form type and the user ID from the registered form DB stored in the HDD 33 (S115). Specifically, the CPU 10 refers to the registered form DB of the form type determined in the process of S35 (see FIG. 7) among the registered form DBs stored in the HDD 33, and from the registered form DB of the referred type, The registration form image data corresponding to the user ID obtained in the process of S50 (see FIG. 8) is obtained. In the example of the present embodiment, the form of “medical insurance” is stored in the RAM 12 by the processing of S35, and the user ID indicating the character string of “AABBCC1234” is stored in the RAM 12 by the processing of S50. . Therefore, it is assumed that the medical insurance registration form DB 60 shown in FIG. 4 in the registration form DB is referred to, and the registration form image data “AABBCC1234 — 0.jpg” associated with the user ID “AABBCC1234” is obtained.

CPU10は、S113の処理において算出された近似直線のなす形状と、S115の処理で取得された登録帳票画像データにおいて、設定画素値に対応する画素値を有する画素によって構成される矩形の形状とを比較する(S116)。事前記入領域判定処理(図9参照)において領域判定処理が実行される場合、設定画素値は設定テーブルの事前記入領域に定義されている第一画素値である。本実施形態において、医療保険用設定テーブル70の事前記入領域に定義されている第一画素値は、記入帳票101に設けられている第二矩形141が示す色に対応する緑色を示す画素値である。CPU10は、登録帳票画像データに含まれている、設定画素値である第一画素値の画素の集合によって示される図形の形状を特定する。第一画素値の画素の集合によって示される図形の形状の特定において、CPU10は、登録帳票画像データに、S111の処理と同様に所定の検索領域を設定する。CPU10は、S112の処理と同様に、検索領域における設定画素値に対応する画素値を有すると判定された画素について、各画素の座標位置を取得する。そして、CPU10は、S113の処理と同様に、取得された複数の座標位置に基づいて、近似直線を算出する。この場合、登録帳票画像データに含まれている第二矩形141の形状が特定される。そして、CPU10は、特定された第二矩形141の形状と、読取データに基づく近似直線のなす形状とを比較する。   The CPU 10 determines the shape of the approximate straight line calculated in the processing of S113 and the rectangular shape formed by the pixels having the pixel values corresponding to the set pixel values in the registered form image data acquired in the processing of S115. A comparison is made (S116). When the area determination processing is performed in the pre-fill area determination processing (see FIG. 9), the set pixel value is the first pixel value defined in the pre-fill area of the setting table. In the present embodiment, the first pixel value defined in the pre-filled area of the medical insurance setting table 70 is a pixel value indicating green corresponding to the color indicated by the second rectangle 141 provided in the entry form 101. is there. The CPU 10 specifies the shape of the graphic indicated by the set of pixels having the first pixel value, which is the set pixel value, included in the registered form image data. In specifying the shape of the graphic represented by the set of pixels having the first pixel value, the CPU 10 sets a predetermined search area in the registered form image data in the same manner as in the process of S111. As in the process of S112, the CPU 10 obtains the coordinate position of each pixel for a pixel determined to have a pixel value corresponding to the set pixel value in the search area. Then, similarly to the processing of S113, the CPU 10 calculates an approximate straight line based on the acquired plurality of coordinate positions. In this case, the shape of the second rectangle 141 included in the registered form image data is specified. Then, the CPU 10 compares the shape of the specified second rectangle 141 with the shape formed by the approximate straight line based on the read data.

CPU10は、特定された第二矩形141の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内であるか否かを判断する(S117)。特定された第二矩形141の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内でない場合(S117:NO)、CPU10は、処理を事前記入領域判定処理(図9参照)に戻す。一方、特定された第二矩形141の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内である場合(S117:YES)、CPU10は、読取データに基づく近似直線のなす形状で囲まれている領域を設定画素値に対応する領域と特定する(S118)。この場合、設定画素値を第一画素値として特定された領域を、以下、第一領域とする。CPU10は、第一領域の読取データにおける位置及び大きさを示す座標値等の情報をRAM12に記憶する。CPU10は、処理を事前記入領域判定処理(図9参照)に戻す。なお、領域判定処理が必須記入領域判定処理又は任意記入領域判定処理において実行されていた場合には、CPU10は、処理を必須記入領域判定処理又は任意記入領域判定処理に戻す。   The CPU 10 determines whether or not the shape of the specified second rectangle 141 and the shape formed by the approximate straight line based on the read data are within a predetermined same range (S117). If the shape of the specified second rectangle 141 and the shape formed by the approximate straight line based on the read data are not within the same predetermined range (S117: NO), the CPU 10 executes the pre-entry area determination processing (see FIG. 9). Return to On the other hand, when the shape of the specified second rectangle 141 and the shape of the approximate straight line based on the read data are within a predetermined same range (S117: YES), the CPU 10 determines the shape of the approximate straight line based on the read data. The region surrounded by is specified as a region corresponding to the set pixel value (S118). In this case, an area in which the set pixel value is specified as the first pixel value is hereinafter referred to as a first area. The CPU 10 stores information such as coordinate values indicating the position and size of the first area in the read data in the RAM 12. The CPU 10 returns the processing to the pre-entry area determination processing (see FIG. 9). If the area determination processing has been executed in the required entry area determination processing or the optional entry area determination processing, the CPU 10 returns the processing to the essential entry area determination processing or the optional entry area determination processing.

図9の説明に戻る。CPU10は、領域判定処理において第一画素値に対応する第一領域が特定されているかを判断する(S54)。この処理において、CPU10は、第一領域の読取データにおける位置及び大きさを示す座標値等の情報がRAM12に記憶されている場合に、領域判定処理において第一領域が特定されていると判断する。領域判定処理において第一領域が特定されていない場合(S54:NO)、CPU10は処理を情報識別処理(図6参照)へ戻す。なお、この処理は、帳票に事前記入欄140が設けられず、第一領域が特定されないことがあることを考慮したものである。   Returning to the description of FIG. The CPU 10 determines whether the first region corresponding to the first pixel value has been specified in the region determination processing (S54). In this process, the CPU 10 determines that the first area is specified in the area determination processing when information such as coordinate values indicating the position and size of the first area in the read data is stored in the RAM 12. . If the first area is not specified in the area determination processing (S54: NO), the CPU 10 returns the processing to the information identification processing (see FIG. 6). This process takes into account that the form may not have the pre-filled column 140 and the first area may not be specified.

領域判定処理において第一領域が特定されている場合(S54:YES)、CPU10は、第一領域の画像を示す第一領域データを、RAM12に記憶されている第一領域の座標値等の情報に基づいて読取データから取得する(S55)。第一領域データは、記入帳票101における事前記入欄140の画像に対応する。   If the first area is specified in the area determination processing (S54: YES), the CPU 10 stores the first area data indicating the image of the first area in the information such as the coordinate values of the first area stored in the RAM 12. (S55). The first area data corresponds to the image of the pre-entry field 140 in the entry form 101.

CPU10は、登録帳票画像データにおいて、設定画素値である第一画素値の画素の集合によって示される図形で囲まれている領域の位置及び大きさを特定する(S56)。この場合、CPU10は、第一画素値に対応する第二矩形141によって囲まれる領域の登録帳票画像データにおける位置及び大きさを示す座標値等の情報をRAM12に記憶する。CPU10は、第二矩形141によって囲まれる領域の画像を示す登録第一領域データを、RAM12に記憶されている座標値等の情報に基づいて登録帳票画像データから取得する(S58)。登録第一領域データは、未記入帳票100における事前記入欄140の画像に対応する。   The CPU 10 specifies the position and the size of the area surrounded by the graphic indicated by the set of pixels of the first pixel value that is the set pixel value in the registered form image data (S56). In this case, the CPU 10 stores in the RAM 12 information such as coordinate values indicating the position and size of the area surrounded by the second rectangle 141 corresponding to the first pixel value in the registered form image data. The CPU 10 acquires the registered first area data indicating the image of the area surrounded by the second rectangle 141 from the registered form image data based on information such as coordinate values stored in the RAM 12 (S58). The registered first area data corresponds to the image of the pre-filled column 140 in the blank form 100.

CPU10は、第一領域データと登録第一領域データとを比較する(S59)。この比較において、CPU10は、例えば、第一領域データを構成する各画素について色の要素(階調、色相)を分析する。そして、CPU10は、各画素について分析した結果である、第一領域データの色の要素を横軸とするヒストグラムを取得する。また、CPU10は、登録第一領域データについても、登録第一領域データの色の要素を横軸とするヒストグラムを取得する。CPU10は、取得した各ヒストグラムを比較する。第一領域データのヒストグラムは、未記入帳票100の事前記入欄140に印刷及び印字されている内容に対応する。登録第一領域データのヒストグラムは、記入帳票101の事前記入欄140印刷及び印字されている内容に加え、ユーザによって手書き文字等が記入されている場合には、記入されている手書き文字等の内容が加味された内容に対応する。   The CPU 10 compares the first area data with the registered first area data (S59). In this comparison, the CPU 10 analyzes, for example, color elements (gradations and hues) for each pixel constituting the first area data. Then, the CPU 10 obtains a histogram having the color element of the first area data as a horizontal axis, which is a result of analyzing each pixel. The CPU 10 also obtains a histogram having the color element of the registered first area data as the horizontal axis, for the registered first area data. The CPU 10 compares the obtained histograms. The histogram of the first area data corresponds to the content printed and printed in the pre-filled column 140 of the blank form 100. The histogram of the registered first area data includes, in addition to the contents printed and printed in the pre-entry field 140 of the entry form 101, the contents of the entered handwritten characters and the like when the user has entered handwritten characters and the like. Corresponds to the content in which.

CPU10は、第一領域データと登録第一領域データとに差分があるかを判断する(S61)。この判断は、例えば、第一領域データのヒストグラムと登録第一領域データのヒストグラムとを対比した結果、各ヒストグラム間に差分があるかによって判断される。即ち、S61の処理によって、未記入帳票100の事前記入欄140に対して、記入帳票101の事前記入欄140においてユーザによって手書き文字等が記入されたかが判断される。本実施形態の例では、図2に示す未記入帳票100の事前記入欄140には、予め管理者によって医療保険用登録帳票DB60におけるユーザID「AABBCC1234」に関連付けられて登録されている内容に応じて印字された内容が示されている。図3に示す記入帳票101の事前記入欄140には、事前記入欄140に予め印字されている内容に加えて、住所変更内容が手書きで記入され、ユーザの申込印が押印されている。この場合、第一領域データのヒストグラムと登録第一領域データのヒストグラムとの間には差分が生ずる。   The CPU 10 determines whether there is a difference between the first area data and the registered first area data (S61). This determination is made, for example, by comparing the histogram of the first area data with the histogram of the registered first area data and determining whether there is a difference between the histograms. That is, by the process of S61, it is determined whether the user has entered handwritten characters or the like in the pre-entry column 140 of the entry form 101 with respect to the pre-entry column 140 of the non-entry form 100. In the example of the present embodiment, the pre-entry field 140 of the unfilled form 100 shown in FIG. 2 corresponds to the content registered in advance by the administrator in association with the user ID “AABBCC1234” in the medical insurance registration form DB 60. The printed content is shown. In the pre-entry column 140 of the entry form 101 shown in FIG. 3, in addition to the content pre-printed in the pre-entry column 140, the address change content is entered by hand, and the user's application seal is stamped. In this case, a difference occurs between the histogram of the first area data and the histogram of the registered first area data.

第一領域データと登録第一領域データとに差分がある場合(S61:YES)、CPU10は、第一領域データを、後述するS21(図6参照)の処理における文字認識処理の実行対象とすることを決定する(S62)。CPU10は、第一領域データを文字認識処理の実行対象とする旨をRAM12に記憶する。CPU10は、処理を情報識別処理(図6参照)に戻す。   When there is a difference between the first area data and the registered first area data (S61: YES), the CPU 10 sets the first area data as an execution target of the character recognition processing in the processing of S21 (see FIG. 6) described later. It is determined (S62). The CPU 10 stores in the RAM 12 that the first area data is to be subjected to the character recognition processing. The CPU 10 returns the processing to the information identification processing (see FIG. 6).

一方、第一領域データと登録第一領域データとに差分がない場合(S61:NO)、CPU10は、第一領域を輝度変更表示対象に決定する(S63)。CPU10は、第一領域データの全体が示す輝度値の平均値を第一領域データから取得する。CPU10は、取得した輝度値の平均値を、第一領域を輝度変更表示対象に決定した旨に関連付けてRAM12に記憶する。CPU10は、処理を情報識別処理(図6参照)に戻す。   On the other hand, when there is no difference between the first area data and the registered first area data (S61: NO), the CPU 10 determines the first area as the brightness change display target (S63). The CPU 10 acquires, from the first area data, the average value of the luminance values indicated by the entire first area data. The CPU 10 stores the average value of the acquired luminance values in the RAM 12 in association with the fact that the first area has been determined as the luminance change display target. The CPU 10 returns the processing to the information identification processing (see FIG. 6).

図10を参照して、必須記入判定処理(S16、図6参照)について説明する。必須記入判定処理では、読取データに日付記入欄120に相当する第二領域が含まれるかが判定される。また、読取データに第二領域が含まれる場合には、第二領域の画像を示す第二領域データを取得し、取得した第二領域データの内容に応じた処理が行われる。図10に示すように、必須記入領域判定処理が開始されると、CPU10は、HDD33に記憶されている設定テーブルのうち、S35(図7参照)の処理で判定した帳票種別の設定テーブルを参照する(S71)。CPU10は、設定テーブルの必須記入領域欄から第二画素値及び第二閾値を取得する(S72)。本実施形態の例では、医療保険用設定テーブル70の参照に応じて、赤色を示す第二画素値及び第二閾値が取得されたとする。ここで取得した第二画素値及び第二閾値を、必須記入領域判定処理における設定画素値及び設定閾値ともいう。   The required entry determination process (S16, see FIG. 6) will be described with reference to FIG. In the required entry determination processing, it is determined whether the read data includes the second area corresponding to the date entry field 120. If the second area is included in the read data, second area data indicating an image of the second area is acquired, and a process according to the content of the acquired second area data is performed. As shown in FIG. 10, when the essential entry area determination processing is started, the CPU 10 refers to the setting table of the form type determined in the processing of S35 (see FIG. 7) among the setting tables stored in the HDD 33. (S71). The CPU 10 acquires the second pixel value and the second threshold from the required entry area column of the setting table (S72). In the example of the present embodiment, it is assumed that the second pixel value indicating red and the second threshold value have been acquired according to the reference to the medical insurance setting table 70. The second pixel value and the second threshold acquired here are also referred to as a set pixel value and a set threshold in the essential entry area determination processing.

CPU10は、必須記入領域判定処理における設定画素値及び設定閾値に基づいて、前述の領域判定処理(図12参照)を実行する(S73)。領域判定処理では、第二画素値に対応する画素値を有する画素の座標位置を、読取データにおいて検索する検索領域範囲が、設定テーブルに基づいて設定される(S111)。そして、検索領域範囲にある第二画素値に対応する画素値を有する画素の座標位置が取得される(S112)。取得された座標位置から近似直線が算出される(S113)。登録帳票DBから、帳票種別及びユーザIDに応じた登録帳票画像データが取得される(S115)。近似直線のなす形状と、登録帳票画像データにおいて第二画素値に対応する画素値を有する画素によって構成される矩形の形状とが比較される(S116)。登録帳票画像データにおいて第二画素値に対応する画素値を有する画素によって構成される矩形は、帳票に設けられている第一矩形121の形状に対応する。登録帳票画像データにおける第二矩形141の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内であるか否かが判断される(S117)。登録帳票画像データにおける第二矩形141の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内である場合には(S117:YES)、近似直線のなす形状で囲まれている領域が第二画素値に対応する第二領域と特定される(S118)。   The CPU 10 executes the above-described area determination processing (see FIG. 12) based on the set pixel value and the set threshold in the essential entry area determination processing (S73). In the area determination processing, a search area range for searching the coordinate position of a pixel having a pixel value corresponding to the second pixel value in the read data is set based on the setting table (S111). Then, the coordinate position of the pixel having the pixel value corresponding to the second pixel value in the search area range is obtained (S112). An approximate straight line is calculated from the acquired coordinate positions (S113). Registered form image data corresponding to the form type and user ID is acquired from the registered form DB (S115). A shape formed by the approximate straight line is compared with a rectangular shape formed by pixels having a pixel value corresponding to the second pixel value in the registered form image data (S116). A rectangle formed by pixels having a pixel value corresponding to the second pixel value in the registered form image data corresponds to the shape of the first rectangle 121 provided in the form. It is determined whether the shape of the second rectangle 141 in the registered form image data and the shape formed by the approximate straight line based on the read data are within a predetermined same range (S117). When the shape of the second rectangle 141 in the registered form image data and the shape of the approximate straight line based on the read data are within a predetermined same range (S117: YES), the shape is surrounded by the shape of the approximate straight line. The region is specified as a second region corresponding to the second pixel value (S118).

CPU10は、領域判定処理において第二領域が特定されているかを判断する(S74)。CPU10は、第二領域の読取データにおける位置及び大きさを示す座標値等の情報がRAM12に記憶されている場合に、第二領域が特定されていると判断する。   The CPU 10 determines whether the second area has been specified in the area determination processing (S74). The CPU 10 determines that the second area is specified when information such as a coordinate value indicating the position and size of the second area in the read data is stored in the RAM 12.

領域判定処理において第二画素値に対応する領域が特定されていない場合(S74:NO)、CPU10は、記入帳票読取エラー表示82(図14参照)を出力する指示を、入出力I/F14を介して表示部16に送信する(S84)。日付記入欄120は帳票において必須記入欄であることから、帳票に必ず存在することが想定される。しかし、読取データが適切に取得できていないことによって、領域判定処理において日付記入欄120に対応する第二領域が特定されていない場合がある。記入帳票読取エラー表示82は、記入帳票101を読取部26において再度読み取らせ、読取データを新たに取得することを作業者に促すために表示される画像である。本実施形態の例では、記入帳票読取エラー表示82は、「帳票をもう一度スキャンしてください」のメッセージを表示することで、作業者に記入帳票101の読取作業を促す。記入帳票読取エラー表示82を示す画像データは、HDD33に記憶されている。表示部16は、S74の処理による指示に応じて該当種別なしエラー表示81を表示する。   If the area corresponding to the second pixel value has not been specified in the area determination processing (S74: NO), the CPU 10 sends an instruction to output the entry form reading error display 82 (see FIG. 14) to the input / output I / F 14 It is transmitted to the display unit 16 via the display (S84). Since the date entry field 120 is a mandatory entry field in the form, it is assumed that the date entry field 120 always exists in the form. However, the second area corresponding to the date entry field 120 may not be specified in the area determination processing because the read data has not been properly acquired. The entry form reading error display 82 is an image displayed to prompt the operator to read the entry form 101 again in the reading unit 26 and newly acquire read data. In the example of the present embodiment, the form reading error display 82 prompts the operator to read the form 101 by displaying a message “Please scan the form again”. Image data indicating the form reading error display 82 is stored in the HDD 33. The display unit 16 displays the no-type error display 81 according to the instruction in the processing of S74.

CPU10は、操作部17を介して、記入帳票101を読取部26において読み取らせるための指示が入力されたかを判断する(S85)。記入帳票101を読取部26において読み取らせるための指示が入力された場合(S85:YES)、CPU10は、処理をS11(図6参照)へ戻す。記入帳票101を読取部26において読み取らせるための指示が入力されない場合(S85:NO)、CPU10は、処理をS29(図6参照)の判断へ移行する。   The CPU 10 determines whether an instruction to read the entry form 101 in the reading unit 26 has been input via the operation unit 17 (S85). When an instruction to read the entry form 101 in the reading unit 26 is input (S85: YES), the CPU 10 returns the processing to S11 (see FIG. 6). When an instruction to read the entry form 101 in the reading unit 26 is not input (S85: NO), the CPU 10 shifts the processing to the determination of S29 (see FIG. 6).

領域判定処理において第二画素値に対応する領域が特定されている場合(S74:YES)、CPU10は、第二領域の画像を示す第二領域データを、RAM12に記憶されている第二領域の座標値等の情報に基づいて読取データから取得する(S75)。第二領域データは、記入帳票101における日付記入欄120の画像に対応する。   If the area corresponding to the second pixel value has been specified in the area determination process (S74: YES), the CPU 10 stores the second area data indicating the image of the second area in the second area stored in the RAM 12. It is obtained from the read data based on information such as coordinate values (S75). The second area data corresponds to the image of the date entry field 120 in the entry form 101.

CPU10は、登録帳票画像データにおいて、設定画素値である第二画素値の画素の集合によって示される図形で囲まれている領域の位置及び大きさを特定する(S76)。この場合、CPU10は、登録帳票画像データにおいて、第一矩形121によって囲まれる領域の登録帳票画像データにおける位置及び大きさを示す座標値等の情報をRAM12に記憶する。CPU10は、第一矩形121によって囲まれる領域の画像を示す登録第二領域データを、RAM12に記憶されている座標値等の情報に基づいて登録帳票画像データから取得する(S78)。登録第一領域データは、未記入帳票100における日付記入欄120の画像に対応する。   The CPU 10 specifies the position and the size of the area surrounded by the graphic indicated by the set of pixels of the second pixel value that is the set pixel value in the registered form image data (S76). In this case, the CPU 10 stores information such as coordinate values indicating the position and size of the area surrounded by the first rectangle 121 in the registered form image data in the registered form image data. The CPU 10 acquires registered second area data indicating an image of an area surrounded by the first rectangle 121 from the registered form image data based on information such as coordinate values stored in the RAM 12 (S78). The registered first area data corresponds to the image of the date entry field 120 in the blank form 100.

CPU10は、第二領域データと登録第二領域データとを比較する(S79)。この処理において、CPU10は、例えば、第二領域データ及び登録第二領域データの色の要素に関するヒストグラムをそれぞれ取得する。CPU10は、各ヒストグラムを比較する。   The CPU 10 compares the second area data with the registered second area data (S79). In this process, the CPU 10 acquires, for example, histograms on the color elements of the second area data and the registered second area data, respectively. The CPU 10 compares each histogram.

CPU10は、第一領域データと登録第一領域データとに差分があるかを判断する(S81)。この判断は、例えば、各ヒストグラム間に差分があるかによって判断される。即ち、S81の処理によって、未記入帳票100の日付記入欄120に対して、記入帳票101の日付記入欄120においてユーザによって手書き文字等が記入されたかが判断される。本実施形態の例では、図2に示す未記入帳票100の日付記入欄120は空欄であるが、図3に示す記入帳票101の日付記入欄120には「2015」「8」「2」の数字に基づく日付が、手書きで記入されている。この場合、第二領域データのヒストグラムと登録第二領域データのヒストグラムとの間には差分が生ずる。   The CPU 10 determines whether there is a difference between the first area data and the registered first area data (S81). This determination is made, for example, based on whether there is a difference between the histograms. That is, by the process of S81, it is determined whether the user has entered handwritten characters or the like in the date entry field 120 of the entry form 101 with respect to the date entry field 120 of the blank entry form 100. In the example of the present embodiment, the date entry field 120 of the blank form 100 shown in FIG. 2 is blank, but the date entry field 120 of the entry form 101 shown in FIG. 3 contains “2015”, “8”, and “2”. Dates based on numbers are entered by hand. In this case, a difference occurs between the histogram of the second area data and the histogram of the registered second area data.

第二領域データと登録第二領域データとに差分がある場合(S81:YES)、CPU10は、第二領域データを、後述するS21(図6参照)の処理における文字認識処理の実行対象とすることを決定する(S82)。CPU10は、第二領域データを文字認識処理の実行対象とする旨をRAM12に記憶する。CPU10は、処理を情報識別処理(図6参照)に戻す。   When there is a difference between the second area data and the registered second area data (S81: YES), the CPU 10 sets the second area data as an execution target of a character recognition process in a process of S21 (see FIG. 6) described later. It is determined (S82). The CPU 10 stores in the RAM 12 that the second area data is to be subjected to the character recognition processing. The CPU 10 returns the processing to the information identification processing (see FIG. 6).

一方、第二領域データと登録第二領域データとに差分がない場合(S81:NO)、CPU10は、必須記入欄未記入エラー表示83(図16参照)を出力する指示を、RAM12に記憶する(S83)。必須記入欄未記入エラー表示83は、後述する読取結果表示において、第二領域データと登録第二領域データとに差分がなかったこと、即ち、日付記入欄120に必要な記入がされていないことを、第二領域に関連付けて作業者に示すために表示される画像である。CPU10は、処理を情報識別処理(図6参照)に戻す。   On the other hand, when there is no difference between the second area data and the registered second area data (S81: NO), the CPU 10 stores in the RAM 12 an instruction to output the error display 83 (see FIG. 16) in the required entry field. (S83). The error display 83 in the mandatory entry column blank field indicates that there is no difference between the second area data and the registered second area data in the read result display described later, that is, the necessary entry is not made in the date entry box 120. Is an image displayed for indicating to the operator in association with the second area. The CPU 10 returns the processing to the information identification processing (see FIG. 6).

図11を参照して、任意記入判定処理(S18、図6参照)について説明する。任意記入判定処理では、読取データに任意記入欄に相当する領域が含まれるかが判定される。また、読取データに任意記入欄に相当する領域が含まれる場合には、任意記入欄に相当する領域の画像を示す対応領域データを取得し、取得した対応領域データの内容に応じた処理が行われる。図11に示すように、任意記入領域判定処理が開始されると、CPU10は、HDD33に記憶されている設定テーブルのうち、S35(図7参照)の処理で判定した帳票種別の設定テーブルを参照する(S91)。CPU10は、設定テーブルの任意記入欄に対応する第一任意領域欄及び第二任意領域欄のうち、上位の欄に設定されている第一任意領域欄から、設定画素値及び設定閾値として第三画素値及び第三閾値を取得する(S92)。本実施形態の例では、医療保険用設定テーブル70の参照に応じて、青色を示す第三画素値及び第三閾値が取得されたとする。   The optional entry determination process (S18, see FIG. 6) will be described with reference to FIG. In the optional entry determination process, it is determined whether the read data includes an area corresponding to the optional entry column. If the read data includes an area corresponding to the optional entry field, corresponding area data indicating an image of the area corresponding to the optional entry field is acquired, and a process corresponding to the content of the acquired corresponding area data is performed. Is As shown in FIG. 11, when the arbitrary entry area determination processing is started, the CPU 10 refers to the setting table of the form type determined in the processing of S35 (see FIG. 7) among the setting tables stored in the HDD 33. (S91). The CPU 10 sets a third pixel as a setting pixel value and a setting threshold from a first arbitrary area column set in a higher-order column of the first arbitrary area column and the second arbitrary area column corresponding to the arbitrary entry column of the setting table. The pixel value and the third threshold are obtained (S92). In the example of the present embodiment, it is assumed that the third pixel value and the third threshold value indicating blue have been acquired according to the reference to the medical insurance setting table 70.

CPU10は、設定画素値及び設定閾値に基づいて、前述の領域判定処理(図12参照)を実行する(S93)。領域判定処理では、第三画素値に対応する画素値を有する画素の座標位置を、読取データにおいて検索する検索領域範囲が、設定テーブルに基づいて設定される(S111)。そして、検索領域範囲にある第三画素値に対応する画素値を有する画素の座標位置が取得される(S112)。取得された座標位置から近似直線が算出される(S113)。登録帳票DBから、帳票種別及びユーザIDに応じた登録帳票画像データが取得される(S115)。近似直線のなす形状と、登録帳票画像データにおいて第三画素値に対応する画素値を有する画素によって構成される矩形の形状とが比較される(S116)。登録帳票画像データにおいて第三画素値に対応する画素値を有する画素によって構成される矩形は、帳票に設けられている第三矩形151の形状に対応する。登録帳票画像データにおける第三矩形151の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内であるか否かが判断される(S117)。登録帳票画像データにおける第三矩形151の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内である場合には(S117:YES)、近似直線のなす形状で囲まれている領域が第三画素値に対応する第三領域と特定される(S118)。   The CPU 10 executes the above-described region determination processing (see FIG. 12) based on the set pixel value and the set threshold (S93). In the area determination processing, a search area range for searching for the coordinate position of a pixel having a pixel value corresponding to the third pixel value in the read data is set based on the setting table (S111). Then, a coordinate position of a pixel having a pixel value corresponding to the third pixel value in the search area range is obtained (S112). An approximate straight line is calculated from the acquired coordinate positions (S113). Registered form image data corresponding to the form type and user ID is acquired from the registered form DB (S115). The shape formed by the approximate straight line is compared with the rectangular shape formed by pixels having a pixel value corresponding to the third pixel value in the registered form image data (S116). A rectangle formed by pixels having a pixel value corresponding to the third pixel value in the registered form image data corresponds to the shape of the third rectangle 151 provided in the form. It is determined whether the shape of the third rectangle 151 in the registered form image data and the shape formed by the approximate straight line based on the read data are within the same predetermined range (S117). When the shape of the third rectangle 151 in the registered form image data and the shape formed by the approximate straight line based on the read data are within a predetermined same range (S117: YES), it is surrounded by the shape formed by the approximate straight line. The region is specified as a third region corresponding to the third pixel value (S118).

CPU10は、領域判定処理において第三領域が特定されているかを判断する(S94)。CPU10は、第三領域の読取データにおける位置及び大きさを示す座標値等の情報がRAM12に記憶されている場合に、第三領域が特定されていると判断する。領域判定処理において第三画素値に対応する領域が特定されていない場合(S94:NO)、CPU10は処理を情報識別処理(図6参照)へ戻す。なお、この処理は、帳票に任意記入が設けられず、第三領域が特定されないことがあることを考慮したものである。   The CPU 10 determines whether the third region has been specified in the region determination process (S94). The CPU 10 determines that the third area is specified when information such as a coordinate value indicating the position and size of the third area in the read data is stored in the RAM 12. If the area corresponding to the third pixel value has not been specified in the area determination processing (S94: NO), the CPU 10 returns the processing to the information identification processing (see FIG. 6). This process takes into account that an optional entry is not provided in the form and the third area may not be specified.

領域判定処理において第三画素値に対応する領域が特定されている場合(S94:YES)、CPU10は、第三領域の画像を示す第三領域データを、RAM12に記憶されている第三領域の座標値等の情報に基づいて読取データから取得する(S95)。第三領域データは、記入帳票101における第一任意記入欄150の画像に対応する。   If the area corresponding to the third pixel value has been specified in the area determination processing (S94: YES), the CPU 10 stores the third area data indicating the image of the third area in the third area stored in the RAM 12. It is obtained from the read data based on information such as coordinate values (S95). The third area data corresponds to the image of the first optional entry column 150 in the entry form 101.

CPU10は、第三画素値に基づいて、登録帳票画像データにおいて、設定画素値である第三画素値の画素の集合によって示される図形で囲まれている領域の位置及び大きさを特定する(S96)。この場合、CPU10は、第三画素値に対応する第三矩形151によって囲まれる領域の登録帳票画像データにおける位置及び大きさを示す座標値等の情報をRAM12に記憶する。CPU10は、第三矩形151によって囲まれる領域の画像を示す登録第三領域データを、RAM12に記憶されている座標値等の情報に基づいて登録帳票画像データから取得する(S98)。登録第三領域データは、未記入帳票100における第一任意記入欄150の画像に対応する。   Based on the third pixel value, the CPU 10 specifies the position and the size of the area surrounded by the graphic indicated by the set of pixels of the third pixel value that is the set pixel value in the registered form image data (S96). ). In this case, the CPU 10 stores information such as coordinate values indicating the position and size of the area surrounded by the third rectangle 151 corresponding to the third pixel value in the registered form image data in the RAM 12. The CPU 10 acquires registered third area data indicating an image of an area surrounded by the third rectangle 151 from the registered form image data based on information such as coordinate values stored in the RAM 12 (S98). The registered third area data corresponds to the image of the first optional entry column 150 in the blank form 100.

CPU10は、第三領域データと登録第三領域データとを比較する(S99)。この処理において、CPU10は、例えば、第三領域データ及び登録第三領域データの色の要素に関するヒストグラムをそれぞれ取得する。CPU10は、各ヒストグラムを比較する。   The CPU 10 compares the third area data with the registered third area data (S99). In this process, the CPU 10 acquires, for example, histograms on the color elements of the third area data and the registered third area data, respectively. The CPU 10 compares each histogram.

CPU10は、第三領域データと登録第三領域データとに差分があるかを判断する(S101)。この判断は、例えば、各ヒストグラム間に差分があるかによって判断される。即ち、S101の処理によって、未記入帳票100の第一任意記入欄150に対して、記入帳票101の第一任意記入欄150においてユーザによって手書き文字等が記入されたかが判断される。本実施形態の例では、図2に示す未記入帳票100の第一任意記入欄150は空欄であるが、図3に示す記入帳票101の第一任意記入欄150には、ユーザの配偶者についての氏名等を示す文字列が、手書きで記入されている。この場合、第三領域データのヒストグラムと登録第三領域データのヒストグラムとの間には差分が生ずる。   The CPU 10 determines whether there is a difference between the third area data and the registered third area data (S101). This determination is made, for example, based on whether there is a difference between the histograms. That is, by the process of S101, it is determined whether the user has entered handwritten characters or the like in the first optional entry field 150 of the filled-out form 101 with respect to the first optional entry field 150 of the unfilled form 100. In the example of the present embodiment, the first optional entry column 150 of the blank form 100 shown in FIG. 2 is blank, but the first optional entry column 150 of the entry form 101 shown in FIG. Is written in handwriting. In this case, a difference occurs between the histogram of the third area data and the histogram of the registered third area data.

第三領域データと登録第三領域データとに差分がある場合(S101:YES)、CPU10は、第三領域データを、後述するS21(図6参照)の処理における文字認識処理の実行対象とすることを決定する(S102)。CPU10は、第三領域データを文字認識処理の実行対象とする旨をRAM12に記憶する。一方、第三領域データと登録第三領域データとに差分がない場合(S101:NO)、CPU10は、第三領域を輝度変更表示対象に決定する(S103)。CPU10は、第三領域データの全体が示す輝度値の平均値を第三領域データから取得する。CPU10は、取得した輝度値の平均値を、第三領域を輝度変更表示対象に決定した旨に関連付けてRAM12に記憶する。   When there is a difference between the third area data and the registered third area data (S101: YES), the CPU 10 sets the third area data as an execution target of a character recognition process in a process of S21 (see FIG. 6) described later. It is determined (S102). The CPU 10 stores in the RAM 12 that the third area data is to be subjected to the character recognition processing. On the other hand, when there is no difference between the third area data and the registered third area data (S101: NO), the CPU 10 determines the third area as a luminance change display target (S103). The CPU 10 acquires, from the third area data, the average value of the luminance values indicated by the entire third area data. The CPU 10 stores the average value of the acquired luminance values in the RAM 12 in association with the fact that the third area has been determined as the luminance change display target.

本実施形態において、帳票の任意記入欄に含まれる欄として、帳票において輪郭の色の異なる第一任意記入欄150及び第二任意記入欄160の二つの欄があるので、任意記入領域判定処理で扱う設定画素値及び設定閾値も二種類となる。CPU10は、領域判定処理(S93)をまだ行っていない他の設定画素値があるかを判断する(S104)。CPU10は、HDD33に記憶されている設定テーブルの任意記入欄に対応する欄を参照し、第三画素値及び第三閾値に対応する欄よりも下位の欄に設定されている欄がある場合に、領域判定処理をまだ行っていない他の設定画素値があると判断する。本実施形態の例では、医療保険用設定テーブル70において第一任意領域欄の下位に第二任意領域欄が設定されているので、領域判定処理をまだ行っていない他の設定画素値があると判断されたとする。   In the present embodiment, there are two columns included in the optional entry column of the form, a first optional entry column 150 and a second optional entry column 160 having different outline colors in the report. There are two types of setting pixel values and setting thresholds to be handled. The CPU 10 determines whether there is another set pixel value for which the area determination processing (S93) has not been performed yet (S104). The CPU 10 refers to the column corresponding to the arbitrary entry column of the setting table stored in the HDD 33, and if there is a column set in a column lower than the column corresponding to the third pixel value and the third threshold, It is determined that there is another set pixel value for which the area determination processing has not been performed yet. In the example of the present embodiment, since the second optional area column is set below the first optional area column in the medical insurance setting table 70, if there is another set pixel value for which the area determination processing has not been performed yet. Assume that it is determined.

領域判定処理をまだ行っていない他の設定画素値があると判断された場合(S104:YES)、CPU10は、他の設定画素値及び他の設定閾値を設定テーブルから取得する(S105)。本実施形態の例では、医療保険用設定テーブル70の第二任意領域欄から、設定画素値及び設定閾値として第四画素値及び第四閾値が取得される。以降、CPU10は、第四画素値及び第四閾値に基づいて、S93からS104の処理を実行する。本実施形態の例では、図2に示す未記入帳票100の第二任意記入欄160及び図3に示す記入帳票101の第二任意記入欄160の双方が空欄とされているので、S103の処理によって、第四画素値に対応する第四領域が、輝度変更表示対象に決定されたとする。   When it is determined that there is another set pixel value for which the area determination process has not been performed yet (S104: YES), the CPU 10 acquires another set pixel value and another set threshold from the setting table (S105). In the example of the present embodiment, a fourth pixel value and a fourth threshold are acquired as the set pixel value and the set threshold from the second arbitrary area column of the medical insurance setting table 70. Thereafter, the CPU 10 executes the processing from S93 to S104 based on the fourth pixel value and the fourth threshold value. In the example of the present embodiment, both the second optional entry field 160 of the unfilled form 100 shown in FIG. 2 and the second optional entry field 160 of the entry form 101 shown in FIG. As a result, it is assumed that the fourth area corresponding to the fourth pixel value is determined as the luminance change display target.

その後、領域判定処理をまだ行っていない他の設定画素値があると判断された場合(S104:NO)、CPU10は、処理を情報識別処理(図6参照)へ戻す。   Thereafter, when it is determined that there is another set pixel value for which the area determination processing has not been performed yet (S104: NO), the CPU 10 returns the processing to the information identification processing (see FIG. 6).

図6の説明に戻る。CPU10は、記入帳票101の必須記入欄が未記入であるかを判断する(S19)。本実施形態では、S83(図10参照)の処理によって必須記入欄未記入エラー表示83(図16参照)を出力する指示がRAM12に記憶されている場合に、日付記入欄120が未記入であると判断される。CPU10は、必須記入欄が未記入でない場合(S19:YES)、S62(図9参照)、S82(図10参照)及びS102(図11参照)の各処理において文字認識処理の実行対象とされた第一領域データ、第二領域データ及び第三領域データのそれぞれについて、文字認識処理を実行する(S21)。本実施形態では、文字認識処理は、前述のOCR処理である。CPU10は、文字認識処理の実行対象とされた第一領域データ、第二領域データ及び第三領域データから、文字認識処理の実行結果である第一文字列データ、第二文字列データ及び第三文字列データを取得する(S22)。これらの文字列データは、後述のS26の処理において、登録帳票DBに登録するために取得される。このため、これらの文字列データを、登録文字列データともいう。S22の処理は、必須記入欄が未記入でないことに応じて行われることから、登録文字列データは、少なくとも第二文字列データを含む。なお、第一文字列データ、第二文字列データ及び第三文字列データのそれぞれは、記入帳票101の事前記入欄140、日付記入欄120及び任意記入欄のそれぞれに含まれる文字列を示す文字列データに相当する。CPU10は、取得された登録文字列データをRAM12に記憶する。   Returning to the description of FIG. The CPU 10 determines whether or not a required entry column of the entry form 101 is not entered (S19). In the present embodiment, when an instruction to output the error display 83 (see FIG. 16) in the required entry field is not stored in the RAM 12 by the process of S83 (see FIG. 10), the date entry field 120 is not entered. Is determined. If the required entry field is not blank (S19: YES), the CPU 10 is set as a character recognition processing execution target in each of S62 (see FIG. 9), S82 (see FIG. 10), and S102 (see FIG. 11). Character recognition processing is executed for each of the first area data, the second area data, and the third area data (S21). In the present embodiment, the character recognition processing is the above-described OCR processing. The CPU 10 converts the first character string data, the second character string data, and the third character, which are the execution results of the character recognition processing, from the first area data, the second area data, and the third area data for which the character recognition processing is performed. Column data is acquired (S22). These character string data are acquired for registration in the registration form DB in the processing of S26 described later. For this reason, these character string data are also referred to as registered character string data. Since the processing of S22 is performed according to the fact that the required entry field is not blank, the registered character string data includes at least the second character string data. Each of the first character string data, the second character string data, and the third character string data is a character string indicating a character string included in each of the pre-entry column 140, the date entry column 120, and the optional entry column of the entry form 101. Equivalent to data. CPU 10 stores the acquired registered character string data in RAM 12.

CPU10は、記入帳票101がスキャナ2の読取部26において読み取られた結果を示す、読取結果表示を示す読取結果データを生成する(S23)。読取結果表示は、記入帳票101がスキャナ2の読取部26において正しく読み取られたかを作業者に確認させるために表示部16に表示される画像である。読取結果データは、S12で取得された読取データに基づいて生成される。   The CPU 10 generates read result data indicating a read result display, which indicates a result of reading the entry form 101 by the reading unit 26 of the scanner 2 (S23). The reading result display is an image displayed on the display unit 16 to allow the operator to confirm whether the entry form 101 has been correctly read by the reading unit 26 of the scanner 2. The read result data is generated based on the read data acquired in S12.

読取データにおける事前記入欄140に相当する第一領域及び任意記入欄に相当する第三領域及び第四領域は、S63(図9参照)及びS103(図11参照)の処理によって、輝度変更表示対象に決定されていることがある。CPU10は、読取結果データを生成する際にRAM12に記憶されている情報を参照する。RAM12にいずれかの領域が輝度変更表示対象に決定されている旨の情報が記憶されていれば、CPU10は、輝度変更表示対象に決定されている領域が、輝度変更表示対象に決定されている旨を示す情報に関連付けられた輝度値よりも低い輝度値で表示されるように、読取データを加工する。これにより、例えば、輝度変更対象に決定されている領域については、読取結果表示においてグレー色で表示されるグレーアウト表示がされる。本実施形態の例では、第四領域が輝度変更対象に決定されているとする。第一領域、第三領域及び第四領域が輝度変更対象に決定されるのは、第一領域、第三領域及び第四領域に相当する記入帳票101の事前記入欄140及び任意記入欄に手書き文字等の記入がされなかった場合である。このような場合に、輝度変更対象に決定されている領域をグレーアウト表示によって作業者に視認し難くすることで、グレーアウト表示がされている領域については注視する必要のないことが作業者に示される。この他、CPU10は、読取結果表示の確認を促すための表示202(図15参照)を付して、読取結果データを生成する。   The first area corresponding to the pre-entry field 140 and the third area and the fourth area corresponding to the optional entry field in the read data are subjected to the brightness change display target by the processing of S63 (see FIG. 9) and S103 (see FIG. 11). May have been determined. The CPU 10 refers to information stored in the RAM 12 when generating read result data. If information indicating that any area is determined to be the luminance change display target is stored in the RAM 12, the CPU 10 determines that the area determined to be the luminance change display target is determined to be the luminance change display target. The read data is processed so as to be displayed at a luminance value lower than the luminance value associated with the information indicating the fact. As a result, for example, a gray-out display of a region determined to be a luminance change target is displayed in gray in the read result display. In the example of the present embodiment, it is assumed that the fourth area is determined as a luminance change target. The first area, the third area, and the fourth area are determined as the brightness change targets because the first area, the third area, and the fourth area correspond to the first area, the third area, and the fourth area. This is the case where no characters or the like have been entered. In such a case, by making it difficult for the operator to visually recognize the area determined as the luminance change target by gray-out display, it is indicated to the worker that it is not necessary to pay attention to the gray-out display area. . In addition, the CPU 10 generates read result data with a display 202 (see FIG. 15) for urging confirmation of the read result display.

CPU10は、S23の処理で生成された読取結果データに基づく読取結果表示を出力する指示を、入出力I/F14を介して表示部16に送信する(S24)。図15は、本実施形態の例による読取結果表示200を示す。読取結果表示200は、読取データに基づく画像の表示される結果表示201と、前述の表示202とを含む。結果表示201のうち、読取データの第一領域、第二領域及び第三領域に相当する事前記入欄140、日付記入欄120及び第一任意記入欄150については、読取結果を作業者が視認できる態様で表示される。結果表示201のうち、読取データの第四領域に対応する第二任意記入欄160については、輝度変更対象に決定されているので、輝度が低減されてグレーアウト表示される。   The CPU 10 transmits an instruction to output a reading result display based on the reading result data generated in the process of S23 to the display unit 16 via the input / output I / F 14 (S24). FIG. 15 shows a read result display 200 according to the example of the present embodiment. The reading result display 200 includes a result display 201 in which an image based on the read data is displayed, and the above-described display 202. In the result display 201, the operator can visually recognize the read result in the pre-entry column 140, the date entry column 120, and the first optional entry column 150 corresponding to the first, second, and third regions of the read data. It is displayed in a manner. In the result display 201, the second arbitrary entry field 160 corresponding to the fourth area of the read data is determined to be a luminance change target, so that the luminance is reduced and grayed out.

読取結果表示を表示部16にて確認した作業者は、操作部17を介してCPU10に指示を入力できる。CPU10は、S22の処理で取得された第一文字列データ、第二文字列データ及び第三文字列データのそれぞれを、登録帳票DBに登録する指示が操作部17を介して入力されたかを判断する(S25)。   The operator who has confirmed the reading result display on the display unit 16 can input an instruction to the CPU 10 via the operation unit 17. The CPU 10 determines whether an instruction to register each of the first character string data, the second character string data, and the third character string data acquired in the process of S22 in the registration form DB has been input through the operation unit 17. (S25).

登録帳票DBに登録する旨の所定の指示が入力されている場合(S25:YES)、CPU10は、S22の処理で取得した登録文字列データを、登録帳票DBのうちS13の処理で判定された帳票種別に対応する登録帳票DBに、S14の処理で判定されたユーザIDに対応付けて登録する(S26)。本実施形態の例では、第一文字列データは、医療保険用登録帳票DB70の本人情報欄の各項目に登録される。第二文字列データは、医療保険用登録帳票DB70の帳票管理情報欄における申込日の項目に登録される。第三文字列データは、医療保険用登録帳票DB70の配偶者情報の各項目に登録される。このとき、第一文字列データに、手書き文字によって追記された、変更後の住所等を示す文字列に対応する文字列データが含まれる場合、本人情報欄に登録されている情報が、追記された文字列に対応する文字列データに更新されて登録されてもよい。CPU10は、処理をS29の判断へ移行する。   When a predetermined instruction to register in the registration form DB is input (S25: YES), the CPU 10 determines the registration character string data acquired in the processing of S22 in the processing of S13 in the registration form DB. A registration is made in the registration form DB corresponding to the form type in association with the user ID determined in the processing of S14 (S26). In the example of the present embodiment, the first character string data is registered in each item of the personal information column of the medical insurance registration form DB 70. The second character string data is registered as an application date item in the form management information column of the medical insurance registration form DB 70. The third character string data is registered in each item of spouse information in the medical insurance registration form DB 70. At this time, if the first character string data includes character string data corresponding to a character string indicating a post-change address or the like added by handwritten characters, the information registered in the personal information column is added. The character string data corresponding to the character string may be updated and registered. The CPU 10 shifts the processing to the determination of S29.

一方、CPU10は、必須記入欄が未記入である場合(S19:NO)、読取結果データを生成する(S27)。この処理で生成される読取結果データは、S23の処理で生成される読取結果データと同様に、読取データに基づいて、また、表示202の付されたものとして生成される。また、輝度変更表示対象に決定されている領域があれば、CPU10は、輝度変更表示対象に決定されている領域が、輝度変更表示対象に決定されている旨を示す情報に関連付けられた輝度値よりも低い輝度値で表示されるように、読取データを加工する。また、CPU10は、読取結果データを生成する際にRAM12に記憶されている情報をさらに参照する。RAM12に必須記入欄未記入エラー表示83(図16参照)を出力する指示が記憶されていれば、必須記入欄未記入エラー表示83の付された読取結果表示となるように、読取結果データを生成する。   On the other hand, when the required entry column is not entered (S19: NO), the CPU 10 generates read result data (S27). The read result data generated in this process is generated based on the read data and as a display 202 as in the case of the read result data generated in the process of S23. If there is an area determined to be a luminance change display target, the CPU 10 determines that the area determined to be a luminance change display target is a luminance value associated with information indicating that the area is determined to be a luminance change display target. The read data is processed so as to be displayed with a lower luminance value. Further, the CPU 10 further refers to the information stored in the RAM 12 when generating the reading result data. If the RAM 12 stores an instruction to output the required entry field blank entry error display 83 (see FIG. 16), the read result data is displayed so that the required entry field blank entry error display 83 is attached. Generate.

CPU10は、S27の処理で生成された読取結果データに基づく読取結果表示を出力する指示を、入出力I/F14を介して表示部16に送信する(S28)。図16は、必須記入欄未記入エラー表示83の付された読取結果表示300を示す。読取結果表示300は、読取データに基づく画像の表示される結果表示301と、前述の表示202とを含む。本実施形態において、図3に示す記入帳票101の日付記入欄120が空欄のままにされた場合に、このような読取結果表示300が表示部16に表示される。本実施形態の必須記入欄未記入エラー表示83は、日付記入欄120から引き出された吹き出しを有する図形枠に所定のメッセージが表記されており、結果表示301よりも前面に表示される、所謂ポップアップ表示として設けられている。これにより、必須記入欄未記入エラー表示83は、日付記入欄120に必要な記入がされていないことを作業者にわかりやすく示すことができる。   The CPU 10 transmits an instruction to output a reading result display based on the reading result data generated in the process of S27 to the display unit 16 via the input / output I / F 14 (S28). FIG. 16 shows a read result display 300 to which an error display 83 for an incomplete entry column not yet entered is added. The reading result display 300 includes a result display 301 in which an image based on the read data is displayed, and the above-described display 202. In the present embodiment, such a read result display 300 is displayed on the display unit 16 when the date entry field 120 of the entry form 101 shown in FIG. In the present embodiment, a required message is displayed in a figure frame having a balloon drawn from the date entry field 120, and a predetermined message is written in the required entry field unfilled error display 83. It is provided as a display. As a result, the required entry column non-entry error display 83 can easily indicate to the operator that the necessary entry has not been made in the date entry column 120.

この場合、日付記入欄120に必要事項が記入されていないので、S21のような文字認識処理は行われず、S26のような文字列データの登録投票DBへの登録処理も行われない。CPU10は、処理をS29の判断へ移行する。   In this case, since the necessary items are not entered in the date entry field 120, the character recognition processing as in S21 is not performed, and the registration processing of the character string data in the registration voting DB as in S26 is not performed. The CPU 10 shifts the processing to the determination of S29.

CPU10は、情報識別処理を終了するかを判断する(S29)。例えば、操作部17を介して情報識別処理を終了する指示が入力されている場合、CPU10は、情報識別処理を終了すると判断し(S29:YES)、情報識別処理を終了する。例えば、操作部17を介して、次の帳票について情報識別処理を実行するための指示が操作部17を介して入力されている場合、CPU10は、情報識別処理を終了せず(S29:NO)、処理をS11へ戻す。   The CPU 10 determines whether to end the information identification processing (S29). For example, when an instruction to end the information identification processing is input via the operation unit 17, the CPU 10 determines that the information identification processing is to be ended (S29: YES), and ends the information identification processing. For example, when an instruction to execute the information identification process for the next form is input via the operation unit 17 via the operation unit 17, the CPU 10 does not end the information identification process (S29: NO). The process returns to S11.

以上説明したように、CPU10は、S11の処理によって記入帳票101の画像を読み取った読取データに基づいて、記入帳票の帳票種別を判定する(S13)。CPU10は、S13の処理によって判定された帳票種別に応じた登録帳票DBから、ユーザIDに応じた登録帳票画像データを取得する(S115)。また、CPU10は、必須記入領域判定処理(S16)において実行される領域判定処理(S73)において、読取データにおいて第二画素値に対応する画素値を有する画素の座標位置に基づく近似直線のなす形状で囲まれている領域を、日付記入欄120に対応する第二領域と特定する(S118)。CPU10は、第二領域の画像を示す第二領域データを、読取データから取得する(S75)。第二領域データは、記入帳票101における日付記入欄120の画像に対応する。CPU10は、日付記入欄120の輪郭を示す第一矩形121の色に対応する第二画素値に基づいて、登録帳票画像データにおいて、第一矩形121で囲まれている領域の位置及び大きさを特定する(S76)。CPU10は、特定された領域の画像を示す登録第二領域データを、登録帳票画像データから取得する(S78)。登録第一領域データは、未記入帳票100における日付記入欄120の画像に対応する。CPU10は、第二領域データと登録第二領域データとを比較し(S79)、第二領域データと登録第二領域データとに差分がある場合(S81:YES)、第二領域データに対する文字認識処理の実行結果である第二文字列データを含む登録文字列データを取得する(S22)。一方、第二領域データと登録第二領域データとに差分がない場合(S81:NO)、文字認識処理を行うことなく、読取結果データを生成し(S27)、生成された読取結果データに基づく読取結果表示を出力する指示を表示部16に送信する(S28)。即ち、記入帳票101において、必須記入欄である日付記入欄120に手書き文字等で記入されている場合には、日付記入欄120に記入された文字列に対応する第二文字列データを少なくとも含む登録文字列データが取得される。一方、日付記入欄120に記入がない場合には、登録文字列データが取得されない。例えば、日付記入欄120の位置を登録帳票画像データに関連付けて予め記憶することで、色に基づいて第矩形121を特定すること無く、登録文字列データを取得する構成が考えられる。この場合、例えば、読取データから日付記入欄120の位置を特定するためには、原稿のエッジや角等の、基準となる位置を特定することが必要となる。しかし、原稿のエッジや角は、例えば、原稿の背景色と、読取部26に設けられた背景部材の色とが類似している場合、検出精度が落ちる可能性がある。本実施形態では、色に基づいて第矩形121を特定することで、原稿の背景色や背景部材の色に左右されること無く、精度良く登録文字列データを取得することができる。このように、CPU10は、帳票に設けられている複数の記入欄の種類を識別し、記入欄の種類に応じた処理を実行できる。 As described above, the CPU 10 determines the form type of the entry form based on the read data obtained by reading the image of the entry form 101 in the processing of S11 (S13). The CPU 10 acquires the registered form image data corresponding to the user ID from the registered form DB corresponding to the form type determined by the processing of S13 (S115). In the area determination processing (S73) executed in the essential entry area determination processing (S16), the CPU 10 determines the shape of the approximate straight line based on the coordinate position of the pixel having the pixel value corresponding to the second pixel value in the read data. The area enclosed by is specified as the second area corresponding to the date entry field 120 (S118). The CPU 10 acquires the second area data indicating the image of the second area from the read data (S75). The second area data corresponds to the image of the date entry field 120 in the entry form 101. The CPU 10 determines the position and size of the area enclosed by the first rectangle 121 in the registered form image data based on the second pixel value corresponding to the color of the first rectangle 121 indicating the outline of the date entry field 120. It is specified (S76). The CPU 10 acquires the registered second area data indicating the image of the specified area from the registered form image data (S78). The registered first area data corresponds to the image of the date entry field 120 in the blank form 100. The CPU 10 compares the second area data with the registered second area data (S79), and if there is a difference between the second area data and the registered second area data (S81: YES), character recognition for the second area data is performed. The registered character string data including the second character string data as the execution result of the processing is acquired (S22). On the other hand, if there is no difference between the second area data and the registered second area data (S81: NO), the CPU generates the read result data without performing the character recognition process (S27), and based on the generated read result data. An instruction to output a reading result display is transmitted to the display unit 16 (S28). That is, in the entry form 101, when the date entry field 120, which is a required entry field, is entered with handwritten characters or the like, at least the second character string data corresponding to the character string entered in the date entry field 120 is included. The registered character string data is obtained. On the other hand, if there is no entry in the date entry field 120, the registered character string data is not obtained. For example, a configuration is conceivable in which the position of the date entry field 120 is stored in advance in association with the registered form image data, so that the registered character string data is acquired without specifying the first rectangle 121 based on the color. In this case, for example, in order to specify the position of the date entry field 120 from the read data, it is necessary to specify a reference position such as an edge or a corner of the document. However, for example, when the background color of the document is similar to the color of the background member provided in the reading unit 26, the detection accuracy of the edge or corner of the document may be reduced. In the present embodiment, by specifying the first rectangle 121 based on the color, the registered character string data can be acquired with high accuracy without being affected by the background color of the document or the color of the background member. As described above, the CPU 10 can identify the types of the plurality of entry columns provided in the form, and execute a process according to the type of the entry columns.

S22の処理で第二文字列データを含む登録文字列データが取得された場合、CPU10は、読取結果データを生成する(S23)。CPU10は、生成された読取結果データに基づく読取結果表示を出力する指示を、表示部16に送信する(S24)。このため、作業者は、記入帳票101がスキャナ2の読取部26において正しく読み取られたかを、読取結果表示によって確認できる。また、読取結果表示が表示部16に表示されることに応じて、登録帳票DBに登録する指示が操作部17を介して入力された場合(S25:YES)、CPU10は、S22の処理で取得した登録文字列データを、登録帳票DBのうちS13の処理で判定された帳票種別に対応する登録帳票DBに登録する(S26)。これにより、登録文字列データの管理が登録帳票DBにおいて適切に行われる。   When the registered character string data including the second character string data is obtained in the processing of S22, the CPU 10 generates read result data (S23). The CPU 10 transmits an instruction to output a reading result display based on the generated reading result data to the display unit 16 (S24). Therefore, the operator can confirm whether the entry form 101 has been correctly read by the reading unit 26 of the scanner 2 by displaying the reading result. If the instruction to register in the registration form DB is input via the operation unit 17 in response to the reading result display being displayed on the display unit 16 (S25: YES), the CPU 10 acquires the instruction in the processing of S22. The registered character string data is registered in the registration form DB corresponding to the form type determined in the process of S13 in the registration form DB (S26). Thereby, management of the registered character string data is appropriately performed in the registered form DB.

CPU10は、第二領域データと登録第二領域データとに差分がない場合(S81:NO)、CPU10は、必須記入欄未記入エラー表示83を出力する指示を、RAM12に記憶する(S83)。CPU10は、この指示の記憶に応じて、必須記入欄未記入エラー表示83の付された読取結果表示を示す読取結果データを生成する(S27)。CPU10は、必須記入欄未記入エラー表示83の付された読取結果表示を出力する指示を表示部16に送信する(S28)。従って、必須記入欄未記入エラー表示83の付された読取結果表示が表示部16に表示されることで、記入帳票101の必須記入欄に手書き文字が記入されていないことが、作業者に喚起される。   If there is no difference between the second area data and the registered second area data (S81: NO), the CPU 10 stores an instruction to output the error display 83 for the required entry field blank entry in the RAM 12 (S83). In response to the storage of this instruction, the CPU 10 generates read result data indicating a read result display with an error display 83 indicating that the required entry field has not been entered (S27). The CPU 10 transmits to the display unit 16 an instruction to output a reading result display with the required entry field unfilled error display 83 (S28). Accordingly, by displaying the reading result display with the error display 83 indicating that the required entry field has not been entered on the display unit 16, it is evident to the operator that handwritten characters are not entered in the mandatory entry field of the entry form 101. Is done.

CPU10は、任意記入領域判定処理(S18)において実行される領域判定処理(S93)において、読取データにおいて第三画素値に対応する画素値を有する画素の座標位置に基づく近似直線のなす形状で囲まれている領域を、任意記入欄に対応する第三領域と特定する(S118)。CPU10は、第三領域の画像を示す第三領域データを、読取データから取得する(S95)。第三領域データは、記入帳票101における第一任意記入欄150の画像に対応する。CPU10は、第一任意記入欄150の輪郭を示す第三矩形151の色に対応する第三画素値に基づいて、登録帳票画像データにおいて、第三矩形151で囲まれている領域の位置及び大きさを特定する(S96)。CPU10は、特定された領域の画像を示す登録第三領域データを、登録帳票画像データから取得する(S98)。登録第三領域データは、未記入帳票100における第一任意記入欄150の画像に対応する。CPU10は、第三領域データと登録第三領域データとを比較し(S99)、第三領域データと登録第三領域データとに差分がある場合(S101:YES)、第三領域データに対する文字認識処理の実行結果である第三文字列データを含む登録文字列データを取得する(S22)。一方、第三領域データと登録第三領域データとに差分がない場合(S101:NO)、CPU10は、第三領域を輝度変更表示対象に決定する(S103)。即ち、記入帳票101において、任意記入欄に手書き文字等が記入されている場合には、任意記入欄に記入された文字列に対応する文字列データを含む登録文字列データが取得される。一方、任意記入欄に記入がない場合には、任意記入欄に対応する領域がグレーアウト表示されるように生成された読取結果データに基づく読取結果表示を出力する指示が表示部16に送信される。この場合、任意記入欄に対応する領域がグレーアウト表示されている場合には、任意記入欄に手書き文字等が記入されておらず、読取結果表示における詳細な確認が不要である旨が作業者に示される。このように、CPU10は、帳票に設けられている複数の記入欄の種類を識別し、記入欄の種類に応じた処理を実行できる。   In the area determination processing (S93) executed in the optional entry area determination processing (S18), the CPU 10 surrounds the read data with a shape formed by an approximate straight line based on the coordinate position of the pixel having the pixel value corresponding to the third pixel value. The specified area is specified as a third area corresponding to the optional entry column (S118). The CPU 10 acquires third area data indicating an image of the third area from the read data (S95). The third area data corresponds to the image of the first optional entry column 150 in the entry form 101. The CPU 10 determines the position and size of the area enclosed by the third rectangle 151 in the registered form image data based on the third pixel value corresponding to the color of the third rectangle 151 indicating the outline of the first arbitrary entry field 150. Is determined (S96). The CPU 10 acquires the registered third area data indicating the image of the specified area from the registered form image data (S98). The registered third area data corresponds to the image of the first optional entry column 150 in the blank form 100. The CPU 10 compares the third area data with the registered third area data (S99). If there is a difference between the third area data and the registered third area data (S101: YES), character recognition for the third area data is performed. The registered character string data including the third character string data, which is the execution result of the process, is acquired (S22). On the other hand, when there is no difference between the third area data and the registered third area data (S101: NO), the CPU 10 determines the third area as a luminance change display target (S103). That is, when handwritten characters or the like are entered in the optional entry column in the entry form 101, registered character string data including character string data corresponding to the character string entered in the optional entry column is obtained. On the other hand, when there is no entry in the optional entry column, an instruction to output a read result display based on the read result data generated so that the area corresponding to the optional entry column is grayed out is transmitted to the display unit 16. . In this case, if the area corresponding to the optional entry field is grayed out, the operator is informed that no handwritten characters or the like are entered in the optional entry field, and that detailed confirmation in the reading result display is unnecessary. Is shown. As described above, the CPU 10 can identify the types of the plurality of entry columns provided in the form, and execute a process according to the type of the entry columns.

CPU10は、記入帳票101のユーザID欄130に対応するユーザID領域データを、読取データから抽出する(S41)。CPU10は、ユーザID領域データからID文字列データを生成し、ID文字列データと登録帳票DBに登録されている登録ユーザIDとを比較する(S45)。CPU10は、ID文字列データの示す文字列と一致する登録ユーザIDを、読取データに対応するユーザIDとして取得する(S50)。CPU10は、このようにして取得されたユーザIDに関連付けて、帳票種別に対応する登録帳票DBに登録文字列データを登録する(S26)。従って、登録文字列データが、帳票種別及びユーザIDに関連付けられて適切に管理される。   The CPU 10 extracts the user ID area data corresponding to the user ID column 130 of the entry form 101 from the read data (S41). The CPU 10 generates ID character string data from the user ID area data, and compares the ID character string data with a registered user ID registered in the registration form DB (S45). The CPU 10 acquires a registered user ID that matches the character string indicated by the ID character string data as a user ID corresponding to the read data (S50). The CPU 10 registers the registered character string data in the registration form DB corresponding to the form type in association with the user ID thus obtained (S26). Therefore, the registered character string data is appropriately managed in association with the form type and the user ID.

CPU10は、領域判定処理において第二画素値に対応する領域が特定されていない場合(S74:NO)、記入帳票読取エラー表示82を出力する指示を表示部16に送信する(S84)。この場合、記入帳票読取エラー表示82が表示部16に表示され、領域判定処理において日付記入欄120に対応する第二領域が特定されていないことが作業者に報知される。   When the area corresponding to the second pixel value has not been specified in the area determination processing (S74: NO), the CPU 10 transmits an instruction to output the entry form reading error display 82 to the display unit 16 (S84). In this case, the entry form reading error display 82 is displayed on the display unit 16, and the operator is notified that the second area corresponding to the date entry field 120 has not been specified in the area determination processing.

上記実施形態において、S12の処理が、本発明の「第一取得ステップ」に相当する。S115の処理が、本発明の「第二取得ステップ」に相当する。必須記入領域判定処理において実行される領域判定処理におけるS118の処理が、本発明の「第一領域特定ステップ」に相当する。S75の処理が、本発明の「第三取得ステップ」に相当する。S76の処理が、本発明の「帳票第一領域特定ステップ」に相当する。S78の処理が、本発明の「第四取得ステップ」に相当する。S81の処理が、本発明の「第一判断ステップ」に相当する。S22及びS28の処理が、本発明の「第一実行ステップ」に相当する。   In the above embodiment, the process of S12 corresponds to the “first acquisition step” of the present invention. The process of S115 corresponds to a “second acquisition step” of the present invention. The processing of S118 in the area determination processing executed in the essential entry area determination processing corresponds to the “first area specifying step” of the present invention. The process of S75 corresponds to a “third acquisition step” of the present invention. The process of S76 corresponds to the “form first area specifying step” of the present invention. The process of S78 corresponds to a “fourth acquisition step” of the present invention. The process of S81 corresponds to a “first determination step” of the present invention. The processing of S22 and S28 corresponds to the “first execution step” of the present invention.

S23及びS27の処理が、本発明の「生成ステップ」に相当する。S24の処理が、本発明の「第一出力ステップ」に相当する。S26の処理が、本発明の「記憶ステップ」に相当する。HDD33が、本発明の「記憶手段」に相当する。S83及びS28の処理が、本発明の「第二出力ステップ」に相当する。任意記入領域判定処理において実行される領域判定処理におけるS118の処理が、本発明の「第二領域特定ステップ」に相当する。S95の処理が、本発明の「第五取得ステップ」に相当する。S96の処理が、本発明の「帳票第二領域特定ステップ」に相当する。S98の処理が、本発明の「第六取得ステップ」に相当する。S101の処理が、本発明の「第二判断取得ステップ」に相当する。S11、S24、S28及びS103の処理が、本発明の「第二実行ステップ」に相当する。S46の処理が、本発明の「判定ステップ」に相当する。S50の処理が、本発明の「第七取得ステップ」に相当する。S84の処理が、本発明の「第三出力ステップ」に相当する。   The processing of S23 and S27 corresponds to the “generation step” of the present invention. The process of S24 corresponds to a “first output step” of the present invention. The process of S26 corresponds to a “storage step” of the present invention. The HDD 33 corresponds to a “storage unit” of the present invention. The processing of S83 and S28 corresponds to the “second output step” of the present invention. The processing of S118 in the area determination processing executed in the arbitrary entry area determination processing corresponds to a “second area specifying step” of the present invention. The process of S95 corresponds to a “fifth acquisition step” of the present invention. The process of S96 corresponds to the “form second area specifying step” of the present invention. The process of S98 corresponds to a “sixth acquisition step” of the present invention. The process of S101 corresponds to a “second determination acquisition step” of the present invention. The processing of S11, S24, S28 and S103 corresponds to the "second execution step" of the present invention. The process of S46 corresponds to a “determination step” of the present invention. The process of S50 corresponds to a “seventh acquisition step” of the present invention. The process of S84 corresponds to the “third output step” of the present invention.

読取部26が、本発明の「読取部」に相当する。S12の処理を実行するCPU10が、本発明の「第一取得手段」として機能する。S35の処理を実行するCPU10が、本発明の「第一判定手段」として機能する。S115の処理を実行するCPU10が、本発明の「第二取得手段」として機能する。必須記入領域判定処理において実行される領域判定処理におけるS118の処理を実行するCPU10が、本発明の「第一領域特定手段」として機能する。S75の処理を実行するCPU10が、本発明の「第三取得手段」として機能する。S76の処理を実行するCPU10が、本発明の「帳票第一領域特定手段」として機能する。S78の処理を実行するCPU10が、本発明の「第四取得手段」として機能する。S81の処理を実行するCPU10が、本発明の「第一判断手段」として機能する。S22及びS28の処理を実行するCPU10が、本発明の「第一実行手段」として機能する。   The reading unit 26 corresponds to the “reading unit” of the present invention. The CPU 10 executing the processing in S12 functions as the “first acquisition unit” of the present invention. The CPU 10 executing the process in S35 functions as the “first determination unit” of the present invention. The CPU 10 that executes the process of S115 functions as a “second acquisition unit” of the present invention. The CPU 10 executing the processing of S118 in the area determination processing executed in the essential entry area determination processing functions as “first area specifying means” of the present invention. The CPU 10 executing the processing in S75 functions as the “third acquisition unit” of the present invention. The CPU 10 executing the processing in S76 functions as the “form first area specifying unit” of the present invention. The CPU 10 executing the process of S78 functions as the “fourth obtaining unit” of the present invention. The CPU 10 executing the process of S81 functions as the “first determining unit” of the present invention. The CPU 10 executing the processes of S22 and S28 functions as the “first execution unit” of the present invention.

なお、本発明は上記の実施形態に限定されるものではなく、種々の変更が可能である。上記実施形態では、S24、S28、S36、S47、S48、S83、S84の各処理において、CPU10は、各処理に応じたデータに基づく表示等の画像を出力する指示を表示部16に送信している。CPU10は、これらの一部又は全部の出力指示を、外部表示部19に送信してもよい。また、CPU10が送信したこれらの一部又は全部の出力指示がスキャナ2に送信されてもよい。この場合、出力指示を受信したスキャナ2のCPU20が、入出力I/F24を介して、表示部27又は外部表示部29に各処理に応じたデータに基づく表示等の画像を出力する指示を送信してもよい。   Note that the present invention is not limited to the above embodiment, and various modifications are possible. In the above embodiment, in each process of S24, S28, S36, S47, S48, S83, and S84, the CPU 10 transmits to the display unit 16 an instruction to output an image such as a display based on data according to each process. I have. The CPU 10 may transmit some or all of these output instructions to the external display unit 19. Further, some or all of these output instructions transmitted by the CPU 10 may be transmitted to the scanner 2. In this case, the CPU 20 of the scanner 2 that has received the output instruction transmits an instruction to output an image such as a display based on data corresponding to each process to the display unit 27 or the external display unit 29 via the input / output I / F 24. May be.

また、スキャナ2が情報識別装置1として機能し、スキャナ2のCPU20が情報識別処理を実行する構成であってもよい。この場合、S24、S28、S36、S47、S48、S83、S84の各処理における出力指示が、CPU20によって表示部27、又は外部通信I/F25を介して外部表示部29に送信されてもよい。この場合、スキャナ2が、本発明の「画像読取装置」に相当する。S23及びS27の処理を実行するCPU10が、本発明の「生成手段」として機能する。外部通信I/F25が、本発明の「通信部」に相当する。この他、管理サーバ3が情報識別装置1として機能してもよい。   Further, the scanner 2 may function as the information identification device 1 and the CPU 20 of the scanner 2 may execute the information identification process. In this case, the output instruction in each processing of S24, S28, S36, S47, S48, S83, and S84 may be transmitted by the CPU 20 to the display unit 27 or the external display unit 29 via the external communication I / F 25. In this case, the scanner 2 corresponds to the “image reading device” of the present invention. The CPU 10 that executes the processes of S23 and S27 functions as the “generation unit” of the present invention. The external communication I / F 25 corresponds to a “communication unit” of the present invention. In addition, the management server 3 may function as the information identification device 1.

S63、S103の処理で輝度変更対象に決定された各領域については、S23及びS27の処理において、各領域データの取得時の輝度よりも低い輝度で表示されるように読み取り結果データが生成されるが、これに限られない。例えば、輝度変更対象に決定された各領域が、各領域データの取得時の輝度よりも高い輝度で表示されるように読み取り結果データが生成されてもよい。この場合であっても、輝度変更対象に決定されている領域を作業者に視認し難くなり、対応する領域を注視する必要のないことが作業者に示される。   For each of the regions determined to be the luminance change target in the processes of S63 and S103, the read result data is generated in the processes of S23 and S27 so as to be displayed at a luminance lower than the luminance at the time of acquisition of each region data. However, it is not limited to this. For example, the read result data may be generated such that each area determined to be a brightness change target is displayed with a higher brightness than the brightness at the time of obtaining each area data. Even in this case, it becomes difficult for the operator to visually recognize the area determined as the luminance change target, and the operator is informed that it is not necessary to watch the corresponding area.

S84の処理が行われる場合において、読取データが適切に取得できていない理由は様々である。記入帳票読取エラー表示82は、日付記入欄120に対応する領域が特定されていないことを端的に表示する「日付記入欄を認識できません」等の表示内容であってもよい。また、記入帳票読取エラー表示82は、読取データが適切に取得できていない理由を作業者に具体的に報知する「帳票のスキャンエラーです」、「スキャナとPCとの接続状態を確認してください」等のメッセージを表示するものであってもよい。このように、記入帳票読取エラー表示82は、日付記入欄120に対応する領域が特定されていないことを報知する様々なメッセージ表示を含んでもよい。   When the process of S84 is performed, there are various reasons why the read data has not been properly acquired. The entry form reading error display 82 may have a display content such as “The date entry column cannot be recognized” that simply indicates that the area corresponding to the date entry column 120 has not been specified. In addition, the form reading error display 82 is used to specifically notify the operator of the reason why the read data has not been properly acquired. "Form scanning error", "Check the connection status between the scanner and the PC" , Etc. may be displayed. As described above, the entry form reading error display 82 may include various message displays notifying that the area corresponding to the date entry column 120 has not been specified.

上記実施形態において、必須記入欄未記入エラー表示83は所定のポップアップ表示によって構成されているが、これに限られない。必須記入欄未記入エラー表示83は、読取結果表示300において、必須記入欄に対応する第二領域に関連付けて表示され、作業者に必須記入欄に必要な記入がされていないことを報知する様々な態様の表示を含んでもよい。   In the above-described embodiment, the error display 83 without the required entry field is configured by a predetermined pop-up display, but is not limited thereto. The required entry blank error display 83 is displayed in the reading result display 300 in association with the second area corresponding to the mandatory entry, and informs the operator that the necessary entry is not entered. May be displayed.

上記実施形態では、S21、S42の処理において文字認識処理が実行されるが、文字認識処理は必ずしも情報識別装置1において行われなくてもよい。例えば、情報識別装置1にネットワークを介して接続する管理サーバ3及びその他の外部装置において、文字認識対象について文字認識処理が実行されて情報識別装置1が文字認識結果を受信して、以降の情報識別処理を行う構成であってもよい。   In the above embodiment, the character recognition processing is executed in the processing of S21 and S42, but the character recognition processing does not necessarily have to be performed in the information identification device 1. For example, in the management server 3 and other external devices connected to the information identification device 1 via a network, a character recognition process is executed for a character recognition target, and the information identification device 1 receives a character recognition result, A configuration for performing an identification process may be used.

CPU10は、HDD13に記憶されたプログラムをRAM12上で展開することで、情報識別処理を実行するプロセッサとして機能する。CPU10として、汎用的なプロセッサが用いられてもよい。マイクロコンピュータ、ASIC、FPGA等が、CPU10の代わりにプロセッサとして用いられてもよい。スキャナ2が情報識別装置1として機能する場合には、CPU20は、ROM21に記憶されたプログラムをRAM22上で展開することで、情報識別処理を実行するプロセッサとして機能する。管理サーバ3が情報識別装置1として機能する場合には、CPU30は、HDD33に記憶されたプログラムをRAM32上で展開することで、情報識別処理を実行するプロセッサとして機能する。上記と同様に、マイクロコンピュータ、ASIC、FPGA等が、CPU30の代わりにプロセッサとして用いられてもよい。   The CPU 10 functions as a processor that executes information identification processing by expanding the program stored in the HDD 13 on the RAM 12. A general-purpose processor may be used as the CPU 10. A microcomputer, ASIC, FPGA, or the like may be used as the processor instead of the CPU 10. When the scanner 2 functions as the information identification device 1, the CPU 20 functions as a processor that executes information identification processing by expanding a program stored in the ROM 21 on the RAM 22. When the management server 3 functions as the information identification device 1, the CPU 30 functions as a processor that executes information identification processing by expanding a program stored in the HDD 33 on the RAM 32. As described above, a microcomputer, an ASIC, an FPGA, or the like may be used as a processor instead of the CPU 30.

情報特定処理は、複数の電子機器(つまり、複数のCPU)によって分散処理されてもよい。例えば、情報特定処理の一部が、ネットワーク9に接続した管理サーバ3等の他のサーバで実行されてもよい。プログラムは、例えば、ネットワーク9に接続した管理サーバ3等の他のサーバからダウンロードされて、情報識別装置1のHDD13に記憶されてもよい。   The information specifying process may be distributed by a plurality of electronic devices (that is, a plurality of CPUs). For example, a part of the information specifying process may be executed by another server such as the management server 3 connected to the network 9. The program may be downloaded from another server such as the management server 3 connected to the network 9 and stored in the HDD 13 of the information identification device 1.

1 情報識別装置
2 スキャナ
3 管理サーバ
9 ネットワーク
10,20,30 CPU
13,33 HDD
16,27 表示部
19,29 外部表示部
21 ROM
26 読取部
82 記入帳票読取エラー表示
83 必須記入欄未記入エラー表示
101 記入帳票
200,300 読取結果表示
DESCRIPTION OF SYMBOLS 1 Information identification device 2 Scanner 3 Management server 9 Network 10, 20, 30 CPU
13,33 HDD
16, 27 display unit 19, 29 external display unit 21 ROM
26 Reading unit 82 Filled form read error display 83 Required form blank error display 101 Filled forms 200, 300 Read result display

Claims (11)

情報識別装置を構成するコンピュータによって実行される情報識別プログラムであって、
前記コンピュータに、
手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する第一取得ステップと、
前記読取データに基づいて前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データを取得する第二取得ステップと、
前記読取データにおいて第一画素値に対応する輪郭で囲まれた第一領域を特定する第一領域特定ステップと、
前記第一領域の画像を示す第一領域データを前記読取データから取得する第三取得ステップと、
前記帳票画像データにおいて前記第一領域に対応する帳票第一領域を特定する帳票第一領域特定ステップと、
前記帳票第一領域の画像を示す帳票第一データを前記帳票画像データから取得する第四取得ステップと、
前記第一領域データと、前記帳票第一データとが異なるかを判断する第一判断ステップと、
前記第一領域データと前記帳票第一データとが異なると判断された場合、前記第一領域に含まれる第一文字列を少なくとも含む文字列を示す文字列データを文字認識処理に基づいて取得する一方、前記第一領域データと前記帳票第一データとが異ならないと判断された場合、前記文字列データを取得しない第一実行ステップと
前記読取データにおいて前記第一画素値とは異なる第二画素値に対応する輪郭で囲まれた第二領域を特定する第二領域特定ステップと、
前記第二領域の画像を示す第二領域データを前記読取データから取得する第五取得ステップと、
前記帳票画像データにおいて前記第二領域に対応する帳票第二領域を特定する帳票第二領域特定ステップと、
前記帳票第二領域の画像を示す帳票第二データを前記帳票画像データから取得する第六取得ステップと、
前記第二領域データと、前記帳票第二データとが異なるかを判断する第二判断ステップと、
前記第二領域データと前記帳票第二データとが異なると判断された場合、前記第二領域に含まれる第二文字列を少なくとも含む文字列を示す前記文字列データを文字認識処理に基づいて取得する一方、前記第二領域データと前記帳票第二データとが異ならないと判断された場合、前記第五取得ステップにおいて取得された前記第二領域データの示す輝度と異なる輝度で前記第二領域データを表示する指示を出力する第二実行ステップと
を実行させることを特徴とする情報識別プログラム。
An information identification program executed by a computer constituting the information identification device,
On the computer,
A first acquisition step of acquiring read data indicating an image obtained by reading an entry form, which is a form filled with characters including handwritten characters,
A second acquisition step of acquiring a form image data indicating an image of a form in which the form based on the read data is not filled with handwritten characters based on the read form,
A first area specifying step of specifying a first area surrounded by a contour corresponding to a first pixel value in the read data;
A third acquisition step of acquiring first area data indicating an image of the first area from the read data,
A form first area specifying step of specifying a form first area corresponding to the first area in the form image data,
A fourth acquisition step of acquiring form first data indicating an image of the form first region from the form image data,
The first area data, a first determination step of determining whether the form first data is different,
When it is determined that the first area data and the form first data are different, the character string data indicating a character string including at least the first character string included in the first area is obtained based on a character recognition process. If it is determined that the first area data and the form first data are not different, a first execution step of not acquiring the character string data ,
A second area specifying step of specifying a second area surrounded by a contour corresponding to a second pixel value different from the first pixel value in the read data,
A fifth acquisition step of acquiring second area data indicating an image of the second area from the read data,
A form second area specifying step of specifying a form second area corresponding to the second area in the form image data,
A sixth acquisition step of acquiring form second data indicating an image of the form second area from the form image data,
The second area data, a second determination step of determining whether the form second data is different,
When it is determined that the second area data is different from the form second data, the character string data indicating a character string including at least a second character string included in the second area is obtained based on a character recognition process. On the other hand, if it is determined that the second area data and the form second data are not different, the second area data with a brightness different from the brightness indicated by the second area data obtained in the fifth obtaining step And a second execution step of outputting an instruction to display the information.
前記コンピュータに、
前記記入帳票の読取結果を示すデータであって、少なくとも前記第一領域データを含む読取結果データを生成する生成ステップと、
前記第一実行ステップにおいて前記文字列データが取得された場合、前記読取結果データを表示する指示を出力する第一出力ステップと、
前記読取結果データを表示する指示が出力されたことに応じて所定の指示を受信した場合、前記文字列データを記憶手段に記憶させる記憶ステップと
を実行させることを特徴とする請求項1に記載の情報識別プログラム。
On the computer,
A generation step of generating read result data that is data indicating a read result of the entry form and includes at least the first area data;
When the character string data is obtained in the first execution step, a first output step of outputting an instruction to display the read result data,
And a storage step of storing the character string data in a storage unit when a predetermined instruction is received in response to an instruction to display the read result data being output. Information identification program.
前記生成ステップは、
前記第一領域データと前記帳票第一データとが異ならないと判断された場合、前記第一領域に関する所定の通知を行う情報を前記第一領域データに対応付けた前記読取結果データを生成することを特徴とする請求項に記載の情報識別プログラム。
The generating step includes:
When it is determined that the first area data is not different from the form first data, generating the read result data in which information for performing a predetermined notification regarding the first area is associated with the first area data. The information identification program according to claim 2 , wherein:
前記コンピュータに、
前記読取データに基づいて前記記入帳票のユーザを判定する判定ステップと、
前記判定ステップにおける判定結果に応じたユーザを特定するユーザ特定情報を取得する第七取得ステップを実行させ、
前記記憶ステップは、
前記文字列データを前記ユーザ特定情報に関連付けて前記記憶手段に記憶させることを特徴とする請求項に記載の情報識別プログラム。
On the computer,
A determination step of determining a user of the entry form based on the read data;
A seventh acquisition step of acquiring user identification information for identifying a user according to the determination result in the determination step is executed,
The storing step includes:
The information identification program according to claim 2 , wherein the character string data is stored in the storage unit in association with the user identification information.
前記コンピュータに、
前記第一領域特定ステップにおいて前記第一領域が特定されない場合、前記第一領域が特定されていないことに基づく報知を実行する指示を出力する第三出力ステップを実行させることを特徴とする請求項1からのいずれかに記載の情報識別プログラム。
On the computer,
If the first area is not specified in the first area specifying step, a third output step of outputting an instruction to execute notification based on the fact that the first area is not specified is executed. The information identification program according to any one of 1 to 4 .
情報識別装置を構成するコンピュータによって実行される情報識別プログラムであって、
前記コンピュータに、
手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する読取データ取得ステップと、
前記読取データに基づいて前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データを取得する帳票画像データ取得ステップと、
前記読取データにおいて特定の画素値である特定画素値に対応する輪郭で囲まれた特定領域を特定する特定領域特定ステップと、
前記特定領域の画像を示す特定領域データを前記読取データから取得する特定領域データ取得ステップと、
前記帳票画像データにおいて前記特定領域に対応する帳票特定領域を特定する帳票特定領域特定ステップと、
前記帳票特定領域の画像を示す帳票特定データを前記帳票画像データから取得する帳票特定データ取得ステップと、
前記特定領域データと、前記帳票特定データとが異なるかを判断する判断ステップと、
前記特定領域データと前記帳票特定データとが異なると判断された場合、前記特定領域に含まれる特定文字列を少なくとも含む文字列を示す文字列データを文字認識処理に基づいて取得する一方、前記特定領域データと前記帳票特定データとが異ならないと判断された場合、前記特定領域データ取得ステップにおいて取得された前記特定領域データの示す態様と異なる態様で前記特定領域データを表示する指示を出力する実行ステップと
を実行させることを特徴とする情報識別プログラム。
An information identification program executed by a computer constituting the information identification device,
On the computer,
A read data obtaining step of obtaining read data indicating an image obtained by reading an entry form, which is a form filled with characters including handwritten characters,
A form image data acquisition step of acquiring form image data indicating an image of a form in which the form is not filled in with handwritten characters, based on the read data,
A specific area specifying step of specifying a specific area surrounded by an outline corresponding to a specific pixel value that is a specific pixel value in the read data;
A specific area data obtaining step of obtaining specific area data indicating an image of the specific area from the read data,
A form specific area specifying step of specifying a form specific area corresponding to the specific area in the form image data;
A form identification data acquisition step of acquiring form identification data indicating an image of the form identification area from the form image data;
A determination step of determining whether the specific area data is different from the form specification data;
When it is determined that the specific area data and the form specific data are different, while obtaining character string data indicating a character string including at least a specific character string included in the specific area based on a character recognition process, When it is determined that the area data and the form identification data are not different, execution of outputting an instruction to display the specific area data in a mode different from the mode indicated by the specific area data obtained in the specific area data obtaining step And an information identifying program for executing the steps .
前記実行ステップは、前記特定領域データの示す色空間を定義する色空間定義情報を加工した情報を用いることで、前記特定領域データの示す態様と異なる態様で前記特定領域データを表示する指示を出力することを特徴とする請求項6に記載の情報識別プログラム。  The execution step outputs an instruction to display the specific area data in a mode different from the mode indicated by the specific area data by using information obtained by processing color space definition information defining a color space indicated by the specific area data. The information identification program according to claim 6, wherein: 情報識別装置を構成するコンピュータが実行可能な方法であって、
手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する第一取得ステップと、
前記読取データに基づいて前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データを取得する第二取得ステップと、
前記読取データにおいて第一画素値に対応する輪郭で囲まれた第一領域を特定する第一領域特定ステップと、
前記第一領域の画像を示す第一領域データを前記読取データから取得する第三取得ステップと、
前記帳票画像データにおいて前記第一領域に対応する帳票第一領域を特定する帳票第一領域特定ステップと、
前記帳票第一領域の画像を示す帳票第一データを前記帳票画像データから取得する第四取得ステップと、
前記第一領域データと、前記帳票第一データとが異なるかを判断する第一判断ステップと、
前記第一領域データと前記帳票第一データとが異なると判断された場合、前記第一領域に含まれる第一文字列を少なくとも含む文字列を示す文字列データを文字認識処理に基づいて取得する一方、前記第一領域データと前記帳票第一データとが異ならないと判断された場合、前記文字列データを取得しない第一実行ステップと
前記読取データにおいて前記第一画素値とは異なる第二画素値に対応する輪郭で囲まれた第二領域を特定する第二領域特定ステップと、
前記第二領域の画像を示す第二領域データを前記読取データから取得する第五取得ステップと、
前記帳票画像データにおいて前記第二領域に対応する帳票第二領域を特定する帳票第二領域特定ステップと、
前記帳票第二領域の画像を示す帳票第二データを前記帳票画像データから取得する第六取得ステップと、
前記第二領域データと、前記帳票第二データとが異なるかを判断する第二判断ステップと、
前記第二領域データと前記帳票第二データとが異なると判断された場合、前記第二領域に含まれる第二文字列を少なくとも含む文字列を示す前記文字列データを文字認識処理に基づいて取得する一方、前記第二領域データと前記帳票第二データとが異ならないと判断された場合、前記第五取得ステップにおいて取得された前記第二領域データの示す輝度と異なる輝度で前記第二領域データを表示する指示を出力する第二実行ステップと
を備えたことを特徴とする情報識別方法。
A computer-executable method for configuring an information identification device,
A first acquisition step of acquiring read data indicating an image obtained by reading an entry form, which is a form filled with characters including handwritten characters,
A second acquisition step of acquiring a form image data indicating an image of a form in which the form based on the read data is not filled with handwritten characters based on the read form,
A first area specifying step of specifying a first area surrounded by a contour corresponding to a first pixel value in the read data;
A third acquisition step of acquiring first area data indicating an image of the first area from the read data,
A form first area specifying step of specifying a form first area corresponding to the first area in the form image data,
A fourth acquisition step of acquiring form first data indicating an image of the form first region from the form image data,
The first area data, a first determination step of determining whether the form first data is different,
When it is determined that the first area data and the form first data are different, the character string data indicating a character string including at least the first character string included in the first area is obtained based on a character recognition process. If it is determined that the first area data and the form first data are not different, a first execution step of not acquiring the character string data ,
A second area specifying step of specifying a second area surrounded by a contour corresponding to a second pixel value different from the first pixel value in the read data,
A fifth acquisition step of acquiring second area data indicating an image of the second area from the read data,
A form second area specifying step of specifying a form second area corresponding to the second area in the form image data,
A sixth acquisition step of acquiring form second data indicating an image of the form second area from the form image data,
The second area data, a second determination step of determining whether the form second data is different,
When it is determined that the second area data is different from the form second data, the character string data indicating a character string including at least a second character string included in the second area is obtained based on a character recognition process. On the other hand, if it is determined that the second area data and the form second data are not different, the second area data with a brightness different from the brightness indicated by the second area data obtained in the fifth obtaining step And a second execution step of outputting an instruction to display the information.
情報識別装置を構成するコンピュータが実行可能な方法であって、  A computer-executable method for configuring an information identification device,
手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する読取データ取得ステップと、  A read data acquisition step of acquiring read data indicating an image obtained by reading an entry form, which is a form in which characters including handwritten characters have been entered,
前記読取データに基づいて前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データを取得する帳票画像データ取得ステップと、  A form image data acquisition step of acquiring form image data indicating an image of a form in which handwritten characters are not entered, which is a form corresponding to the filled-in form based on the read data,
前記読取データにおいて特定の画素値である特定画素値に対応する輪郭で囲まれた特定領域を特定する特定領域特定ステップと、  A specific area specifying step of specifying a specific area surrounded by an outline corresponding to a specific pixel value that is a specific pixel value in the read data;
前記特定領域の画像を示す特定領域データを前記読取データから取得する特定領域データ取得ステップと、  A specific area data obtaining step of obtaining specific area data indicating an image of the specific area from the read data,
前記帳票画像データにおいて前記特定領域に対応する帳票特定領域を特定する帳票特定領域特定ステップと、  A form specific area specifying step of specifying a form specific area corresponding to the specific area in the form image data;
前記帳票特定領域の画像を示す帳票特定データを前記帳票画像データから取得する帳票特定データ取得ステップと、  A form identification data acquisition step of acquiring form identification data indicating an image of the form identification area from the form image data;
前記特定領域データと、前記帳票特定データとが異なるかを判断する判断ステップと、  A determination step of determining whether the specific area data is different from the form specification data;
前記特定領域データと前記帳票特定データとが異なると判断された場合、前記特定領域に含まれる特定文字列を少なくとも含む文字列を示す文字列データを文字認識処理に基づいて取得する一方、前記特定領域データと前記帳票特定データとが異ならないと判断された場合、前記特定領域データ取得ステップにおいて取得された前記特定領域データの示す態様と異なる態様で前記特定領域データを表示する指示を出力する実行ステップと  When it is determined that the specific area data is different from the form specific data, the character string data indicating a character string including at least the specific character string included in the specific area is obtained based on a character recognition process, When it is determined that the area data and the form identification data are not different, execution of outputting an instruction to display the specific area data in a mode different from the mode indicated by the specific area data acquired in the specific area data obtaining step Steps and
を備えたことを特徴とする情報識別方法。  An information identification method, comprising:
帳票の画像を読み取る読取部と、
前記読取部によって読み取られた、手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する第一取得手段と、
前記読取データに基づいて前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データを取得する第二取得手段と、
前記読取データにおいて第一画素値に対応する輪郭で囲まれた第一領域を特定する第一領域特定手段と、
前記第一領域の画像を示す第一領域データを前記読取データから取得する第三取得手段と、
前記帳票画像データにおいて前記第一領域に対応する帳票第一領域を特定する帳票第一領域特定手段と、
前記帳票第一領域の画像を示す帳票第一データを前記帳票画像データから取得する第四取得手段と、
前記第一領域データと、前記帳票第一データとが異なるかを判断する第一判断手段と、
前記第一領域データと前記帳票第一データとが異なると判断された場合、前記第一領域に含まれる第一文字列を少なくとも含む文字列を示す文字列データを文字認識処理に基づいて取得する一方、前記第一領域データと前記帳票第一データとが異ならないと判断された場合、前記文字列データを取得しない第一実行手段と
前記読取データにおいて前記第一画素値とは異なる第二画素値に対応する輪郭で囲まれた第二領域を特定する第二領域特定手段と、
前記第二領域の画像を示す第二領域データを前記読取データから取得する第五取得手段と、
前記帳票画像データにおいて前記第二領域に対応する帳票第二領域を特定する帳票第二領域特定手段と、
前記帳票第二領域の画像を示す帳票第二データを前記帳票画像データから取得する第六取得手段と、
前記第二領域データと、前記帳票第二データとが異なるかを判断する第二判断手段と、
前記第二領域データと前記帳票第二データとが異なると判断された場合、前記第二領域に含まれる第二文字列を少なくとも含む文字列を示す前記文字列データを文字認識処理に基づいて取得する一方、前記第二領域データと前記帳票第二データとが異ならないと判断された場合、前記第五取得手段によって取得された前記第二領域データの示す輝度と異なる輝度で前記第二領域データを表示する指示を出力する第二実行手段と
を備えたことを特徴とする画像読取装置。
A reading unit that reads an image of a form,
First acquisition means for acquiring read data indicating an image obtained by reading an entry form, which is a form filled with characters including handwritten characters, read by the reading unit,
A second acquisition unit that acquires form image data indicating an image of a form in which a form corresponding to the entry form based on the read data and in which handwritten characters have not been entered,
First area specifying means for specifying a first area surrounded by a contour corresponding to a first pixel value in the read data,
Third acquisition means for acquiring first area data indicating the image of the first area from the read data,
A form first area specifying means for specifying a form first area corresponding to the first area in the form image data,
Fourth acquisition means for acquiring form first data indicating an image of the form first region from the form image data,
The first area data, the first determination means to determine whether the form first data is different,
When it is determined that the first area data and the form first data are different, the character string data indicating a character string including at least the first character string included in the first area is obtained based on a character recognition process. If it is determined that the first area data and the form first data are not different, first execution means that does not acquire the character string data ,
A second area specifying means for specifying a second area surrounded by a contour corresponding to a second pixel value different from the first pixel value in the read data,
Fifth acquisition means for acquiring second area data indicating the image of the second area from the read data,
A form second area specifying means for specifying a form second area corresponding to the second area in the form image data,
Sixth acquisition means for acquiring form second data indicating an image of the form second area from the form image data,
The second area data, a second determination means for determining whether the form second data is different,
When it is determined that the second area data is different from the form second data, the character string data indicating a character string including at least a second character string included in the second area is obtained based on a character recognition process. On the other hand, when it is determined that the second area data is not different from the form second data, the second area data is displayed at a brightness different from the brightness indicated by the second area data acquired by the fifth acquisition unit. An image reading apparatus comprising: a second execution unit that outputs an instruction to display a message .
帳票の画像を読み取る読取部と、
前記読取部によって読み取られた、手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する読取データ取得手段と、
前記読取データに基づいて前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データを取得する帳票画像データ取得手段と、
前記読取データにおいて特定の画素値である特定画素値に対応する輪郭で囲まれた特定領域を特定する特定領域特定手段と、
前記特定領域の画像を示す特定領域データを前記読取データから取得する特定領域データ取得手段と、
前記帳票画像データにおいて前記特定領域に対応する帳票特定領域を特定する帳票特定領域特定手段と、
前記帳票特定領域の画像を示す帳票特定データを前記帳票画像データから取得する帳票特定データ取得手段と、
前記特定領域データと、前記帳票特定データとが異なるかを判断する判断手段と、
前記特定領域データと前記帳票特定データとが異なると判断された場合、前記特定領域に含まれる特定文字列を少なくとも含む文字列を示す文字列データを文字認識処理に基づいて取得する一方、前記特定領域データと前記帳票特定データとが異ならないと判断された場合、前記特定領域データ取得手段によって取得された前記特定領域データの示す態様と異なる態様で前記特定領域データを表示する指示を出力する実行手段と
を備えたことを特徴とする画像読取装置。
A reading unit that reads an image of a form,
Read data acquisition means for acquiring read data indicating an image obtained by reading an entry form, which is a form filled with characters including handwritten characters, read by the reading unit,
A form corresponding to the form based on the read data, a form image data acquisition means for acquiring form image data indicating an image of the form in which handwritten characters are not entered,
A specific area specifying unit that specifies a specific area surrounded by an outline corresponding to a specific pixel value that is a specific pixel value in the read data;
A specific area data acquisition unit that acquires specific area data indicating the image of the specific area from the read data;
A form specific area specifying means for specifying a form specific area corresponding to the specific area in the form image data;
Form specification data acquisition means for obtaining form specification data indicating an image of the form specification area from the form image data,
Determining means for determining whether the specific area data is different from the form specific data,
When it is determined that the specific area data and the form specific data are different, while obtaining character string data indicating a character string including at least a specific character string included in the specific area based on a character recognition process, When it is determined that the area data and the form identification data are not different, execution of outputting an instruction to display the specific area data in a mode different from the mode indicated by the specific area data obtained by the specific area data obtaining means image reading apparatus characterized by comprising a means.
JP2015192165A 2015-09-29 2015-09-29 Information identification program, information identification method, and image reading device Active JP6634764B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015192165A JP6634764B2 (en) 2015-09-29 2015-09-29 Information identification program, information identification method, and image reading device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015192165A JP6634764B2 (en) 2015-09-29 2015-09-29 Information identification program, information identification method, and image reading device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019226976A Division JP6885449B2 (en) 2019-12-17 2019-12-17 Information identification program, information identification method, and image reader

Publications (2)

Publication Number Publication Date
JP2017068507A JP2017068507A (en) 2017-04-06
JP6634764B2 true JP6634764B2 (en) 2020-01-22

Family

ID=58492490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015192165A Active JP6634764B2 (en) 2015-09-29 2015-09-29 Information identification program, information identification method, and image reading device

Country Status (1)

Country Link
JP (1) JP6634764B2 (en)

Also Published As

Publication number Publication date
JP2017068507A (en) 2017-04-06

Similar Documents

Publication Publication Date Title
US10049291B2 (en) Image-processing apparatus, image-processing method, and computer program product
JP5616308B2 (en) Document modification detection method by character comparison using character shape feature
US11574489B2 (en) Image processing system, image processing method, and storage medium
JP2007279828A (en) Business form processor, business form format preparation device, business form, program for processing business form and program for preparing business form format
US9558433B2 (en) Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data
CN107133615B (en) Information processing apparatus, information processing method, and computer program
EP2126720B1 (en) A method for aligning a modified document and an original document for comparison and difference highlighting
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
US11360715B2 (en) Printer and non-transitory computer readable storage medium with shared review function
CN104778199A (en) Image processing apparatus and image processing method
JP6885449B2 (en) Information identification program, information identification method, and image reader
JP2019046225A (en) Recognition device, recognition program, and recognition method
JP6634764B2 (en) Information identification program, information identification method, and image reading device
JP5089524B2 (en) Document processing apparatus, document processing system, document processing method, and document processing program
US8990681B2 (en) Method for aligning a modified document and an original document for comparison and difference highlighting
JP2006229874A (en) Information processor, information processing method, information processing program, computer readable recording medium and information processing system
JP4741363B2 (en) Image processing apparatus, image processing method, and image processing program
JP2019101647A (en) Information processing device, control method therefor, and program
US20210067641A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2007058819A (en) Index information generation device
JP2007299321A (en) Information processor, information processing method, information processing program and information storage medium
CN116311315A (en) Method, apparatus and storage medium for extracting text content in PDF file
JP2017091379A (en) Information processing device, and processing method and program thereof
TW202406323A (en) Method for document comparison and system thereof
TWM634167U (en) Document matching system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180921

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191202

R150 Certificate of patent or registration of utility model

Ref document number: 6634764

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150