JP6928401B1 - Information processing equipment, information processing methods and information processing programs - Google Patents

Information processing equipment, information processing methods and information processing programs Download PDF

Info

Publication number
JP6928401B1
JP6928401B1 JP2020132195A JP2020132195A JP6928401B1 JP 6928401 B1 JP6928401 B1 JP 6928401B1 JP 2020132195 A JP2020132195 A JP 2020132195A JP 2020132195 A JP2020132195 A JP 2020132195A JP 6928401 B1 JP6928401 B1 JP 6928401B1
Authority
JP
Japan
Prior art keywords
information
image data
character
item
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020132195A
Other languages
Japanese (ja)
Other versions
JP2022029077A (en
Inventor
正三 中島
正三 中島
Original Assignee
株式会社ダブルスタンダード
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ダブルスタンダード filed Critical 株式会社ダブルスタンダード
Priority to JP2020132195A priority Critical patent/JP6928401B1/en
Application granted granted Critical
Publication of JP6928401B1 publication Critical patent/JP6928401B1/en
Publication of JP2022029077A publication Critical patent/JP2022029077A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】認識率を向上できる情報処理装置、情報処理方法及び情報処理プログラムを提供すること。【解決手段】本発明に係る情報処理装置は、入力された書類の画像データを2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する補正部と、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部と、を備える。【選択図】図1PROBLEM TO BE SOLVED: To provide an information processing device, an information processing method and an information processing program capable of improving a recognition rate. An information processing apparatus according to the present invention has a correction unit that corrects an input document image data by two or more correction patterns and generates two or more corrected image data corresponding to each correction pattern. It is provided with an OCR processing unit that reads information described in two or more corrected image data and converts the read information into text. [Selection diagram] Fig. 1

Description

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.

従来、OCR(Optical Character Recognition)と呼ばれる画像に含まれる文字を認識する技術が用いられている。画像中の文字の記載箇所や大きさが統一されている場合、OCRによって高い精度で文字を認識し、画像から文字情報を抽出することができる(例えば、特許文献1参照)。 Conventionally, a technique called OCR (Optical Character Recognition) for recognizing characters contained in an image has been used. When the description location and size of the characters in the image are unified, the characters can be recognized with high accuracy by OCR and the character information can be extracted from the image (see, for example, Patent Document 1).

画像中の文字の記載箇所や大きさが統一されている場合、従来のOCR技術によって高い精度で画像から文字情報を抽出することができる。しかしながら、取得する項目が複数ある場合や背景色に違いがある場合、従来のOCR技術では文字を適切に認識することが難しい。 When the description location and size of the characters in the image are unified, the character information can be extracted from the image with high accuracy by the conventional OCR technology. However, when there are a plurality of items to be acquired or when there is a difference in the background color, it is difficult to properly recognize the characters by the conventional OCR technique.

特開2016−126356号公報Japanese Unexamined Patent Publication No. 2016-126356

本発明は、上記課題に鑑みてなされたものであり、認識率を向上できる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。 The present invention has been made in view of the above problems, and an object of the present invention is to provide an information processing device, an information processing method, and an information processing program capable of improving the recognition rate.

上記課題を解決するため、本発明の情報処理装置は、入力された書類の画像データを2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する補正部と、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部と、を備える。 In order to solve the above problems, the information processing apparatus of the present invention corrects the image data of the input document by two or more correction patterns, and generates two or more corrected image data corresponding to each correction pattern. It is provided with a unit and an OCR processing unit that reads information described in two or more corrected image data and converts the read information into text.

本発明によれば、認識率を向上できる情報処理装置、情報処理方法及び情報処理プログラムを提供することができる。 According to the present invention, it is possible to provide an information processing device, an information processing method, and an information processing program capable of improving the recognition rate.

実施形態に係る情報処理システムの概略構成の一例を示す図である。It is a figure which shows an example of the schematic structure of the information processing system which concerns on embodiment. 実施形態に係るサーバのハード構成の一例を示す図である。It is a figure which shows an example of the hardware configuration of the server which concerns on embodiment. 実施形態に係るサーバの記憶装置に記憶されているデータベースの一例を示す図である。It is a figure which shows an example of the database stored in the storage device of the server which concerns on embodiment. データベースに記憶されている情報の一例を示す図である。It is a figure which shows an example of the information stored in a database. 実施形態に係るサーバの機能構成の一例を示す図である。It is a figure which shows an example of the functional structure of the server which concerns on embodiment. 実施形態に係るユーザ端末のハード構成及び機能構成の一例を示す図である。It is a figure which shows an example of the hardware configuration and the functional configuration of the user terminal which concerns on embodiment. 実施形態に係るサーバの文字認識処理の一例を示すフローチャートである。It is a flowchart which shows an example of the character recognition processing of the server which concerns on embodiment. 実施形態に係るサーバのOCR処理部による文字認識の一例を示す図である。It is a figure which shows an example of character recognition by the OCR processing part of the server which concerns on embodiment.

以下、本発明の実施形態を図面に基づいて説明する。なお、本実施形態では、文書としてマイナンバーカードを例に実施形態を説明するが、本発明は、マイナンバーカードのほか、マイナンバー通知カード等のマイナンバーを記載した書類、運転免許の他、パスポート(旅券)、住民基本台帳カード、在留カード、住民票などの書類にも利用することができる。また、本実施形態において、テキストには、文字、記号、数値などが含まれる。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the present embodiment, the embodiment will be described by taking the My Number card as an example as a document. However, in the present invention, in addition to the My Number card, a document describing the My Number such as a My Number notification card, a driver's license, and a passport ( It can also be used for documents such as passports), basic resident register cards, residence cards, and resident cards. Further, in the present embodiment, the text includes characters, symbols, numerical values, and the like.

[実施形態]
図1は、実施形態に係る情報処理システム1の概要構成の一例を示す図である。情報処理システム1は、サーバ2及びユーザ端末3がネットワーク4を介して接続された構成を有する。なお、情報処理システム1が具備するサーバ2、ユーザ端末3の数は任意である。また、ネットワーク4をどのような通信網で構成するかは任意である。
[Embodiment]
FIG. 1 is a diagram showing an example of an outline configuration of the information processing system 1 according to the embodiment. The information processing system 1 has a configuration in which a server 2 and a user terminal 3 are connected via a network 4. The number of servers 2 and user terminals 3 included in the information processing system 1 is arbitrary. Further, what kind of communication network the network 4 is configured with is arbitrary.

図2は、本実施形態に係るサーバ2(情報処理装置)のハード構成の一例を示す図である。図2に示すように、サーバ2は、通信IF200A、記憶装置200B及びCPU200Cがバスを介して接続された構成を備える。 FIG. 2 is a diagram showing an example of a hardware configuration of the server 2 (information processing device) according to the present embodiment. As shown in FIG. 2, the server 2 includes a configuration in which a communication IF 200A, a storage device 200B, and a CPU 200C are connected via a bus.

通信IF200Aは、外部端末と通信するためのインターフェースである。 The communication IF200A is an interface for communicating with an external terminal.

記憶装置200Bは、例えば、HDDや半導体記憶装置である。記憶装置200Bには、サーバ2で利用する情報処理プログラムや各種データベースが記憶されている。なお、本実施形態では、情報処理プログラムや各種データベースは、サーバ2の記憶装置200Bに記憶されているが、USBメモリなどの外部記憶装置やネットワークを介して接続された外部サーバに記憶し、必要に応じて参照やダウンロード可能に構成されていてもよい。 The storage device 200B is, for example, an HDD or a semiconductor storage device. The information processing program and various databases used by the server 2 are stored in the storage device 200B. In the present embodiment, the information processing program and various databases are stored in the storage device 200B of the server 2, but are stored in an external storage device such as a USB memory or an external server connected via a network, and are required. It may be configured to be referenceable or downloadable depending on the situation.

図3は、サーバ2の記憶装置200Bに記憶されているデータベースの一例を示す図である。図3に示すように、記憶装置200Bには、補正パタンデータベース1(以下、補正パタンDB1ともいう)、識別用データベース2(以下、識別用DB2ともいう)、項目マスタデータベース3(以下、項目マスタDB3ともいう)、表記変更用データベース4(以下、表記変更用DB4ともいう)が記憶されている。 FIG. 3 is a diagram showing an example of a database stored in the storage device 200B of the server 2. As shown in FIG. 3, the storage device 200B includes a correction pattern database 1 (hereinafter, also referred to as a correction pattern DB1), an identification database 2 (hereinafter, also referred to as an identification DB2), and an item master database 3 (hereinafter, also referred to as an item master). A database 4 for notation change (hereinafter, also referred to as DB4 for notation change) is stored.

(補正パタンDB1)
補正パタンDB1は、マイナンバーカードの画像データを補正するための補正パタンが2以上記憶されている。図4(a)は、補正パタンDB1に記憶されている情報の一例を示す図である。図4(a)に示すように、2以上の補正パタンは、それぞれ1以上の補正フィルタを組み合わせて構成されている。例えば、補正パタン1は、補正フィルタ1及び3を組み合わせて構成される。また、補正パタン2は、補正フィルタ1、2及び4を組み合わせて構成される。また、補正パタン3は、補正フィルタ1、2及び3を組み合わせて構成される。また、補正パタン4は、補正フィルタ1、3及び5を組み合わせて構成される。また、補正パタン5は、補正フィルタ1及び4を組み合わせて構成される。なお、各補正パタンに含まれる補正フィルタの数は任意である。
(Correction pattern DB1)
The correction pattern DB1 stores two or more correction patterns for correcting the image data of the My Number card. FIG. 4A is a diagram showing an example of information stored in the correction pattern DB1. As shown in FIG. 4A, each of the two or more correction patterns is configured by combining one or more correction filters. For example, the correction pattern 1 is configured by combining the correction filters 1 and 3. Further, the correction pattern 2 is configured by combining correction filters 1, 2 and 4. Further, the correction pattern 3 is configured by combining correction filters 1, 2 and 3. Further, the correction pattern 4 is configured by combining correction filters 1, 3 and 5. Further, the correction pattern 5 is configured by combining the correction filters 1 and 4. The number of correction filters included in each correction pattern is arbitrary.

また、補正フィルタ1〜補正フィルタ5には、例えば、画像データに含まれるマイナンバーカードの輪郭を強調させるフィルタ、画像データの色調を変化させる2以上のフィルタが少なくとも含まれる。また、その他、補正フィルタ1〜補正フィルタ5には、遠近法ワープ(台形補正)、明るさ補正、コントラスト補正、ガウス補正、ぼかし補正、色調補正などのフィルタが含まれる。なお、図4(a)に示す各補正パタンの補正フィルタの組み合わせはあくまで一例であり、各補正パタンをどのような補正フィルタで構成するかは任意である。また、補正フィルタは、補正フィルタ1〜補正フィルタ5の5つに限られない。 Further, the correction filter 1 to the correction filter 5 include, for example, at least a filter that emphasizes the outline of the My Number card included in the image data and two or more filters that change the color tone of the image data. In addition, the correction filters 1 to 5 include filters such as perspective warp (trapezoidal correction), brightness correction, contrast correction, gauss correction, blur correction, and color tone correction. The combination of the correction filters of each correction pattern shown in FIG. 4A is only an example, and it is arbitrary what kind of correction filter is configured for each correction pattern. Further, the correction filter is not limited to the five correction filters 1 to 5.

(識別用DB2)
識別用DB2には、マイナンバーカードを識別するための情報が記憶されている。図4(b)は、識別用DB2に記憶されている情報の一例を示す図である。図4(b)に示すように、識別用DB2には、マイナンバーカードを識別するための情報、例えば、マイナンバーカードに特有のパタンマッチ用データ(画像データや特徴点データ(例えば、印章の画像データや特徴点データなど))やキーワード(KW)が記憶されている。なお、図4(b)に示すパタンマッチ用データやキーワードはあくまで一例であり、マイナンバーカードを識別するための情報として、どのようなパタンマッチ用データやキーワードとするかは任意である。後述の識別部207は、識別用DB2を参照し、画像データにパタンマッチ用データやキーワードが含まれているが否かに基づいて、画像データがマイナンバーカードの画像データであることを識別する。2以上のパタンマッチ用データやキーワードを利用することで画像データがマイナンバーカードの画像データであることを識別する精度の向上が期待できる。
(Identification DB2)
Information for identifying the My Number card is stored in the identification DB 2. FIG. 4B is a diagram showing an example of information stored in the identification DB 2. As shown in FIG. 4B, the identification DB 2 contains information for identifying the My Number card, for example, pattern matching data (image data or feature point data (for example, image data of a seal)) peculiar to the My Number card. And feature point data)) and keywords (KW) are stored. The pattern matching data and keywords shown in FIG. 4B are merely examples, and what kind of pattern matching data and keywords should be used as information for identifying the Individual Number Card is arbitrary. The identification unit 207, which will be described later, refers to the identification DB 2 and identifies that the image data is the image data of the Individual Number Card based on whether or not the image data includes pattern matching data or keywords. By using two or more pattern matching data and keywords, it can be expected to improve the accuracy of identifying that the image data is the image data of My Number Card.

(項目マスタDB3)
項目マスタDB3には、取得する項目と該項目の位置の情報(正規の書式レイアウト情報ともいう)とが記憶されている。本実施形態では、項目マスタDB3には、マイナンバーカードから取得する項目と該項目の位置の情報が記憶されている。マイナンバーカードは、所定の書式に沿って作成されている。このため、マイナンバーカードの書式レイアウトは決まっている。書式レイアウト情報は、マイナンバーカードのどの項目がどの位置(領域)に配置されているかを示す情報である。図4(c)は、項目マスタDB3に記憶されている情報の一例を示す図である。図4(c)に示すように、項目マスタDB3には、マイナンバーカードから取得する項目及び位置の情報が記憶されている。なお、位置の情報は、マイナンバーカードの左上をゼロ点としたXY座標により表され、マイナンバーカードに向かって横方向がX軸(右方向が正)、縦方向がY軸(下方向が正)となっている。なお、座標を表す数値に画素数を利用してもよい。また、マイナンバーカードのどの位置をゼロ点とするかは任意である。また、座標を表す数値に画素数以外の数値を利用してもよい。さらに、マイナンバーカードからどのような項目の情報を取得するかは任意である。
(Item master DB3)
The item master DB 3 stores the item to be acquired and information on the position of the item (also referred to as regular format layout information). In the present embodiment, the item master DB 3 stores the item acquired from the My Number card and the information on the position of the item. My number card is created according to a predetermined format. For this reason, the format layout of My Number Card is fixed. The format layout information is information indicating which item of the Individual Number Card is arranged in which position (area). FIG. 4C is a diagram showing an example of information stored in the item master DB 3. As shown in FIG. 4C, the item master DB 3 stores information on items and positions acquired from the Individual Number Card. The position information is represented by XY coordinates with the upper left of the My Number card as the zero point, and the horizontal direction is the X axis (right direction is positive) and the vertical direction is the Y axis (down direction is positive) toward the My Number card. It has become. The number of pixels may be used as a numerical value representing the coordinates. In addition, which position of the My Number card is set as the zero point is arbitrary. Further, a numerical value other than the number of pixels may be used as the numerical value representing the coordinates. Furthermore, what kind of item information is acquired from My Number Card is arbitrary.

(表記変更用DB4)
表記変更用DB4には、サーバ2が取得したマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更するための情報が記憶されている。具体的には、表記変更用DB4には、ロジック処理用の情報及び第1,第2マスタ処理用の情報が記憶されている。
(DB4 for notation change)
The notation change DB 4 stores information for changing the notation of the information described in the image data of the My Number card acquired by the server 2 to a predetermined notation. Specifically, the notation change DB 4 stores information for logic processing and information for first and second master processing.

ロジック処理用の情報は、表記を変更する対象(以下、処理摘要対象ともいう)であるマイナンバーカードの画像データに記載された情報と、該情報の表記を変更する処理ルールとを関連付けた情報である。ロジック処理用の情報は、処理摘要対象と、該処理摘要対象に対する処理ルールとを取得する項目ごとに対応付けた情報であり、該ロジック処理用の情報を参照することで、表記を所定の統一された表記に変更することができる。 The information for logic processing is information that associates the information described in the image data of the Individual Number Card, which is the target for changing the notation (hereinafter, also referred to as the processing description target), with the processing rule for changing the notation of the information. be. The information for logic processing is information associated with each item for acquiring the processing description target and the processing rule for the processing description target, and by referring to the information for logic processing, the notation is unified as a predetermined value. It can be changed to the written notation.

第1マスタ処理用の情報は、処理摘要対象であるマイナンバーカードの画像データに記載された情報と、該情報の辞書データによる上書き処理内容とを取得する項目ごとに関連付けた情報である。第1マスタ処理用の情報には、処理摘要対象に辞書データによる上書き処理内容のパタンが種々含まれている。このように、第1マスタ処理用の情報は、誤記となる表記(例えば、変換ミスによる誤記など予め想定される誤記)と、該誤記に対する正しい表記とが取得する項目ごとに対応付けられた情報であり、該第1マスタ処理用の情報を参照することで、誤記を正しい表記に修正することができる。 The information for the first master processing is information associated with each item for acquiring the information described in the image data of the My Number card, which is the processing description target, and the content of the overwriting processing by the dictionary data of the information. The information for the first master processing includes various patterns of overwrite processing contents by dictionary data in the processing description target. In this way, the information for the first master processing is the information associated with each item acquired by the notation that is an error (for example, an error that is assumed in advance such as an error due to a conversion error) and the correct notation for the error. By referring to the information for the first master processing, the typographical error can be corrected to the correct notation.

また、第2マスタ処理用の情報は、マイナンバーカードの画像データに記載された情報に含まれる不要な文字データを削除するための情報である。具体的には、第2マスタ処理用の情報は、マイナンバーカードの画像データに記載された情報と、該情報に含まれる文字の情報である。このように、第2マスタ処理用の情報は、マイナンバーカードの画像データに記載された情報と、該情報に含まれる文字の情報とが取得する項目ごとに対応付けられた情報であり、該第2マスタ処理用の情報を参照することで、該マイナンバーカードの画像データに記載された情報に含まれる文字以外の不要な文字データを認識して、該不要な文字データを削除することができる。 Further, the information for the second master processing is information for deleting unnecessary character data included in the information described in the image data of the My Number card. Specifically, the information for the second master processing is the information described in the image data of the My Number card and the character information included in the information. As described above, the information for the second master processing is the information described in the image data of the My Number card and the information of the characters included in the information associated with each item to be acquired. By referring to the information for 2 master processing, it is possible to recognize unnecessary character data other than the characters included in the information described in the image data of the My Number card and delete the unnecessary character data.

CPU200Cは、サーバ2を制御し、図示しないROM(Read Only Memory)及びRAM(Random Access Memory)を備えている。 The CPU 200C controls the server 2 and includes a ROM (Read Only Memory) and a RAM (Random Access Memory) (not shown).

図5に示すように、サーバ2は、受信部201、送信部202、記憶装置制御部203、補正部204、除去部205、OCR処理部206、識別部207、取得部208、表記変更部209などの機能を有する。なお、図5に示す機能は、サーバ2のROM(不図示)に記憶された情報処理プログラムをCPU200Cが実行することにより実現される。 As shown in FIG. 5, the server 2 includes a receiving unit 201, a transmitting unit 202, a storage device control unit 203, a correction unit 204, a removing unit 205, an OCR processing unit 206, an identification unit 207, an acquisition unit 208, and a notation changing unit 209. It has functions such as. The function shown in FIG. 5 is realized by the CPU 200C executing an information processing program stored in the ROM (not shown) of the server 2.

受信部201は、外部から送信される情報、例えば、画像データの情報を受信する。 The receiving unit 201 receives information transmitted from the outside, for example, image data information.

送信部202は、情報を外部へ送信する。 The transmission unit 202 transmits information to the outside.

記憶装置制御部203は、記憶装置200Bを制御する。具体的には、記憶装置制御部203は、記憶装置200Bを制御して情報の書き込みや読み出しを行う。 The storage device control unit 203 controls the storage device 200B. Specifically, the storage device control unit 203 controls the storage device 200B to write and read information.

補正部204は、入力されたマイナンバーカードの画像データを補正パタンDB1に記憶されている2以上の補正パタン(各補正パタンには、各々1以上の異なる補正フィルタが含まれている)により補正し、各補正パタンに対応する2以上の補正後の画像データを生成する。具体的には、補正部204は、画像データを補正パタン1で補正した補正後画像データ1を生成する。また、補正部204は、画像データを補正パタン2で補正した補正後画像データ2を生成する。また、補正部204は、画像データを補正パタン3で補正した補正後画像データ3を生成する。また、補正部204は、画像データを補正パタン4で補正した補正後画像データ4を生成する。また、補正部204は、画像データを補正パタン5で補正した補正後画像データ5を生成する。 The correction unit 204 corrects the input image data of the My Number card by two or more correction patterns stored in the correction pattern DB1 (each correction pattern includes one or more different correction filters). , Generates two or more corrected image data corresponding to each correction pattern. Specifically, the correction unit 204 generates the corrected image data 1 in which the image data is corrected by the correction pattern 1. Further, the correction unit 204 generates the corrected image data 2 in which the image data is corrected by the correction pattern 2. Further, the correction unit 204 generates the corrected image data 3 in which the image data is corrected by the correction pattern 3. Further, the correction unit 204 generates the corrected image data 4 in which the image data is corrected by the correction pattern 4. Further, the correction unit 204 generates the corrected image data 5 in which the image data is corrected by the correction pattern 5.

除去部205は、項目マスタDB3に記憶された正規の書式レイアウト情報に基づいて、マイナンバーカードから取得する項目が配置された第1領域以外の第2領域を画像データから除去する。 The removal unit 205 removes the second area other than the first area in which the items to be acquired from the My Number card are arranged from the image data based on the regular format layout information stored in the item master DB3.

OCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化する。具体的には、OCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を所定の項目ごとに読み取り、各補正パタンに対応する2以上の補正後の画像データをテキスト化した各項目の情報のうち、最も多いものを各項目の正式なテキスト化された情報として選択する。 The OCR processing unit 206 reads the information described in the two or more corrected image data based on the regular format layout information of the My Number card, and converts the read information into text. Specifically, the OCR processing unit 206 reads the information described in the image data after two or more corrections for each predetermined item based on the regular format layout information of the My Number card, and corresponds to each correction pattern2. Among the information of each item in which the above corrected image data is converted into text, the most abundant information is selected as the formal textual information of each item.

識別部207は、識別用DB2を参照し、マイナンバーカードの画像データを識別する。具体的には、識別部207は、識別用DB2を参照し、パタンマッチ用データやキーワードが存在するか否かに応じて、画像データがマイナンバーカードの画像データであることを識別する。なお、上述したように、識別部207は、2以上のパタンマッチ用データやキーワードを利用して、画像データがマイナンバーカードの画像データであるかを識別してもよい。2以上のパタンマッチ用データやキーワードを利用することで画像データがマイナンバーカードの画像データであることを識別する精度の向上が期待できる。 The identification unit 207 refers to the identification DB 2 and identifies the image data of the My Number card. Specifically, the identification unit 207 refers to the identification DB 2 and identifies that the image data is the image data of the My Number card depending on whether or not the pattern matching data or the keyword exists. As described above, the identification unit 207 may identify whether the image data is the image data of the Individual Number Card by using two or more pattern matching data or keywords. By using two or more pattern matching data and keywords, it can be expected to improve the accuracy of identifying that the image data is the image data of My Number Card.

取得部208は、項目マスタDB3を参照し、項目に対応する文字を、項目ごとに取得する。例えば、取得部208は、OCR処理部206がテキスト化した項目の第1側(本実施形態では右側)に存在する次の項目(次項目)までの文字又は改行までの文字を項目に対応する文字として取得する。また、取得部208は、項目の第1側(本実施形態では右側)の所定範囲内に文字(項目を構成する文字を除く)が存在しない場合、項目の第1側とは異なる第2側(本実施形態では下側)に存在する次の項目(次項目)までの文字又は改行までの文字を、項目に対応する文字をマイナンバーカードの画像データに記載された情報として取得する。なお、取得部208が文字を取得する範囲(どこからどこまで)を画素数に基いて決めておくようにしてもよい。この場合、項目ごとに文字を取得する範囲を定めておくとよい。 The acquisition unit 208 refers to the item master DB3 and acquires the character corresponding to the item for each item. For example, the acquisition unit 208 corresponds to the character up to the next item (next item) or the character up to the line feed existing on the first side (right side in this embodiment) of the item converted into text by the OCR processing unit 206. Get as a character. Further, when the character (excluding the character constituting the item) does not exist within the predetermined range of the first side (right side in this embodiment) of the item, the acquisition unit 208 has a second side different from the first side of the item. The characters up to the next item (next item) or the characters up to the line feed existing in (lower side in this embodiment) are acquired as the information described in the image data of the My Number card. The range (from where to where) for the acquisition unit 208 to acquire characters may be determined based on the number of pixels. In this case, it is advisable to define the range for acquiring characters for each item.

表記変更部209は、取得部208で取得されたマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更する。具体的には、表記変更部209は、表記変更用DB4を参照し、表記変更用DB4に記憶されているロジック処理用の情報に基づいて、取得部208で取得されたマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更する。また、表記変更部209は、表記変更用DB4を参照し、表記変更用DB4に記憶されている第1,第2マスタ処理用の情報に基づいて、誤記を正しい表記に修正したり、不要な文字データを認識して、該不要な文字データを削除する。 The notation change unit 209 changes the notation of the information described in the image data of the My Number card acquired by the acquisition unit 208 to a predetermined notation. Specifically, the notation change unit 209 refers to the notation change DB 4, and based on the logic processing information stored in the notation change DB 4, the image data of the My Number card acquired by the acquisition unit 208 is used. Change the notation of the described information to the prescribed notation. Further, the notation change unit 209 refers to the notation change DB4 and corrects the erroneous notation to the correct notation based on the information for the first and second master processing stored in the notation change DB4, or is unnecessary. The character data is recognized and the unnecessary character data is deleted.

(ユーザ端末3)
図6は、実施形態に係るユーザ端末3のハード構成及び機能構成の一例を示す図である。図6(a)は、ユーザ端末3のハード構成の一例を示す図、図6(b)は、ユーザ端末3の機能構成の一例を示す図である。ユーザ端末3は、PC(Personal Computer)や携帯端末(例えば、タブレット端末)などである。図6(a)に示すように、ユーザ端末3は、通信IF300A、記憶装置300B、入力装置300C、表示装置300D、CPU300Eなどを備える。
(User terminal 3)
FIG. 6 is a diagram showing an example of a hardware configuration and a functional configuration of the user terminal 3 according to the embodiment. FIG. 6A is a diagram showing an example of the hardware configuration of the user terminal 3, and FIG. 6B is a diagram showing an example of the functional configuration of the user terminal 3. The user terminal 3 is a PC (Personal Computer), a mobile terminal (for example, a tablet terminal), or the like. As shown in FIG. 6A, the user terminal 3 includes a communication IF 300A, a storage device 300B, an input device 300C, a display device 300D, a CPU 300E, and the like.

通信IF300Aは、他の装置(実施形態では、サーバ2)と通信するためのインターフェースである。 The communication IF 300A is an interface for communicating with another device (server 2 in the embodiment).

記憶装置300Bは、例えば、HDD(Hard Disk Drive)や半導体記憶装置(SSD(Solid State Drive))である。記憶装置300Bには、ユーザ端末3の識別子(ID)及び情報処理プログラムなどが記憶されている。なお、識別子は、サーバ2がユーザ端末3に対して新たに付与してもよいし、IP(Internet Protocol)アドレス、MAC(Media Access Control)アドレスなどを利用してもよい。 The storage device 300B is, for example, an HDD (Hard Disk Drive) or a semiconductor storage device (SSD (Solid State Drive)). The storage device 300B stores an identifier (ID) of the user terminal 3, an information processing program, and the like. The identifier may be newly assigned by the server 2 to the user terminal 3, or may use an IP (Internet Protocol) address, a MAC (Media Access Control) address, or the like.

入力装置300Cは、例えば、キーボード、タッチパネルなどであり、入力装置300Cを操作して、情報処理システム1の利用に必要な情報(例えば、マイナンバーカードの画像データ)を入力することができる。 The input device 300C is, for example, a keyboard, a touch panel, or the like, and the input device 300C can be operated to input information (for example, image data of a My Number card) necessary for using the information processing system 1.

表示装置300Dは、例えば、液晶モニタや有機ELモニタなどである。表示装置300Dは、情報処理システム1の利用に必要な画面(例えば、マイナンバーカードの画像データを入力するための画面など)を表示する。 The display device 300D is, for example, a liquid crystal monitor or an organic EL monitor. The display device 300D displays a screen (for example, a screen for inputting image data of the My Number card) necessary for using the information processing system 1.

CPU300Eは、ユーザ端末3を制御するものであり、図示しないROM及びRAMを備えている。 The CPU 300E controls the user terminal 3 and includes a ROM and a RAM (not shown).

図6(b)に示すように、ユーザ端末3は、受信部301、送信部302、記憶装置制御部303、操作受付部304、表示装置制御部305などの機能を有する。なお、図6(b)に示す機能は、CPU300Eが、記憶装置300Bに記憶されている情報処理プログラムを実行することで実現される。 As shown in FIG. 6B, the user terminal 3 has functions such as a receiving unit 301, a transmitting unit 302, a storage device control unit 303, an operation receiving unit 304, and a display device control unit 305. The function shown in FIG. 6B is realized by the CPU 300E executing an information processing program stored in the storage device 300B.

受信部301は、サーバ2から送信される情報を受信する。 The receiving unit 301 receives the information transmitted from the server 2.

送信部302は、入力装置300Cを利用して入力された情報に識別子を付与してサーバ2へ送信する。ユーザ端末3から送信される情報に識別子を付与することでサーバ2は、受信した情報がどのユーザ端末3から送信されたものであるかを認識できる。 The transmission unit 302 assigns an identifier to the information input using the input device 300C and transmits the information to the server 2. By assigning an identifier to the information transmitted from the user terminal 3, the server 2 can recognize which user terminal 3 the received information is transmitted from.

記憶装置制御部303は、記憶装置300Bを制御する。具体的には、記憶装置制御部303は、記憶装置300Bを制御して情報の書き込みや読み出しを行う。 The storage device control unit 303 controls the storage device 300B. Specifically, the storage device control unit 303 controls the storage device 300B to write and read information.

操作受付部304は、入力装置300Cでの入力操作を受け付ける。例えば、マイナンバーカードの画像データの入力操作を受け付ける。 The operation reception unit 304 receives an input operation on the input device 300C. For example, it accepts an input operation of image data of My Number Card.

表示装置制御部305は、表示装置300Dを制御する。具体的には、表示装置制御部305は、表示装置300Dを制御して実施形態に係る情報処理システム1の利用に必要な画面(例えば、マイナンバーカードの画像データを入力するための画面など)を表示させる。 The display device control unit 305 controls the display device 300D. Specifically, the display device control unit 305 controls the display device 300D to display a screen (for example, a screen for inputting image data of the Individual Number Card) necessary for using the information processing system 1 according to the embodiment. Display it.

(情報処理方法)
図7は、実施形態に係るサーバの文字認識処理の一例を示すフローチャートである。
(Information processing method)
FIG. 7 is a flowchart showing an example of the character recognition process of the server according to the embodiment.

(ステップS101)
サーバ2の補正部204は、補正パタンDB1を参照し、文書の画像データを補正する。具体的には、補正部204は、マイナンバーカードの画像データを、補正パタンDB1に記憶されている2以上の補正パタン(各補正パタンには、各々1以上の異なる補正が含まれている)により補正し、各補正パタンに対応する2以上の補正後の画像を生成する。
(Step S101)
The correction unit 204 of the server 2 refers to the correction pattern DB1 and corrects the image data of the document. Specifically, the correction unit 204 uses two or more correction patterns stored in the correction pattern DB1 (each correction pattern includes one or more different corrections) to input the image data of the Individual Number Card. It is corrected and two or more corrected images corresponding to each correction pattern are generated.

(ステップS102)
サーバ2のOCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化する。具体的には、OCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を所定の項目ごとに読み取り、各補正パタンに対応する2以上の補正後の画像データをテキスト化した各項目の情報のうち、最も多いものを各項目の正式なテキスト化された情報として選択する。
(Step S102)
The OCR processing unit 206 of the server 2 reads the information described in the two or more corrected image data based on the regular format layout information of the My Number card, and converts the read information into text. Specifically, the OCR processing unit 206 reads the information described in the image data after two or more corrections for each predetermined item based on the regular format layout information of the My Number card, and corresponds to each correction pattern2. Among the information of each item in which the above corrected image data is converted into text, the most abundant information is selected as the formal textual information of each item.

図8は、OCR処理部206による文字認識の一例を示す図である。図8に示すように、OCR処理部206は、補正部204で生成された各補正パタンに対応する2以上の補正後の画像から文字を認識する。図8に示す例では、補正パタン1、3及び5では、認識結果が「山田太郎」となっている。また、補正パタン2では、認識結果が「山田大郎」となっている。また、補正パタン3では、認識結果が「認識不可」、すなわち文字を認識することができなかったとなっている。OCR処理部206は、2以上の補正後の画像データから認識した文字のうち最も多いもの、図8に示す例では「山田太郎」を選択し、認識した文字として決定する。なお、認識した文字のうち最も多いものがない場合(例えば、補正パタン1〜5の判定結果がそれぞれ2、2、2、2、1の場合)は、再度、ステップS102の処理を行ってもよいし、補正パタンを変更してステップS102の処理を行ってもよい、また、読み取れなったとして報知(エラーを出力)するようにしてもよい。 FIG. 8 is a diagram showing an example of character recognition by the OCR processing unit 206. As shown in FIG. 8, the OCR processing unit 206 recognizes characters from two or more corrected images corresponding to each correction pattern generated by the correction unit 204. In the example shown in FIG. 8, in the correction patterns 1, 3 and 5, the recognition result is “Taro Yamada”. Further, in the correction pattern 2, the recognition result is "Taro Yamada". Further, in the correction pattern 3, the recognition result is "unrecognizable", that is, the character cannot be recognized. The OCR processing unit 206 selects the most recognized characters from the two or more corrected image data, "Taro Yamada" in the example shown in FIG. 8, and determines the recognized characters. If there is no recognized character with the largest number (for example, when the determination results of the correction patterns 1 to 5 are 2, 2, 2, 2, and 1, respectively), the process of step S102 may be performed again. Alternatively, the correction pattern may be changed to perform the process of step S102, or a notification (an error may be output) may be given as if the characters could not be read.

(ステップS103)
サーバ2の識別部207は、識別用DB2を参照し、画像データを識別する。具体的には、識別部207は、識別用DB2を参照し、OCR処理部206で認識された文字に、パタンマッチ用データやキーワードが存在するか否かを判定する。OCR処理部206で認識された文字に、パタンマッチ用データ又はキーワードのいずれか一つが含まれている場合、識別部207は、画像データがマイナンバーカードの画像であることを識別する。
(Step S103)
The identification unit 207 of the server 2 refers to the identification DB 2 and identifies the image data. Specifically, the identification unit 207 refers to the identification DB 2 and determines whether or not pattern matching data or keywords exist in the characters recognized by the OCR processing unit 206. When the characters recognized by the OCR processing unit 206 include any one of the pattern matching data or the keyword, the identification unit 207 identifies that the image data is an image of the My Number card.

(ステップS104)
サーバ2の取得部208は、項目マスタDB3を参照し、項目に対応する文字を、項目ごとに取得する。例えば、取得部208は、OCR処理部206がテキスト化した項目の第1側(本実施形態では右側)に存在する次の項目(次項目)までの文字又は改行までの文字を項目に対応する文字として取得する。また、取得部208は、項目の第1側(本実施形態では右側)の所定範囲内に文字(項目を構成する文字を除く)が存在しない場合、項目の第1側とは異なる第2側(本実施形態では下側)に存在する次の項目(次項目)までの文字又は改行までの文字を、項目に対応する文字をマイナンバーカードの画像データに記載された情報として取得する。なお、取得部208が文字を取得する範囲(どこからどこまで)を画素数に基いて決めておくようにしてもよい。この場合、項目ごとに文字を取得する範囲を定めておくとよい。
(Step S104)
The acquisition unit 208 of the server 2 refers to the item master DB 3 and acquires the character corresponding to the item for each item. For example, the acquisition unit 208 corresponds to the character up to the next item (next item) or the character up to the line feed existing on the first side (right side in this embodiment) of the item converted into text by the OCR processing unit 206. Get as a character. Further, when the character (excluding the character constituting the item) does not exist within the predetermined range of the first side (right side in this embodiment) of the item, the acquisition unit 208 has a second side different from the first side of the item. The characters up to the next item (next item) or the characters up to the line feed existing in (lower side in this embodiment) are acquired as the information described in the image data of the My Number card. The range (from where to where) for the acquisition unit 208 to acquire characters may be determined based on the number of pixels. In this case, it is advisable to define the range for acquiring characters for each item.

(ステップS105)
表記変更部209は、取得部208で取得されたマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更する。具体的には、表記変更部209は、表記変更用DB4を参照し、表記変更用DB4に記憶されているロジック処理用の情報及び第1,第2マスタ処理用の情報に基づいて、取得部208で取得されたマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更する。また、表記変更部209は、表記変更用DB4を参照し、表記変更用DB4に記憶されている第1,第2マスタ処理用の情報に基づいて、誤記を正しい表記に修正したり、不要な文字データを認識して、該不要な文字データを削除する。
(Step S105)
The notation changing unit 209 changes the notation of the information described in the image data of the My Number card acquired by the acquisition unit 208 to a predetermined notation. Specifically, the notation change unit 209 refers to the notation change DB 4, and is an acquisition unit based on the information for logic processing and the information for the first and second master processes stored in the notation change DB 4. The notation of the information described in the image data of the My Number card acquired in 208 is changed to a predetermined notation. Further, the notation change unit 209 refers to the notation change DB4 and corrects the typographical error to the correct notation based on the information for the first and second master processing stored in the notation change DB4, or is unnecessary. The character data is recognized and the unnecessary character data is deleted.

以上のように、本実施形態に係るサーバ2(情報処理装置)は、入力された書類(マイナンバーカード)の画像データを2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する補正部204と、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部206とを備える。このように2以上の補正パタンにより画像データを補正し、補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するので文字の読み取り精度が向上することが期待できる。 As described above, the server 2 (information processing device) according to the present embodiment corrects the image data of the input document (My Number Card) by two or more correction patterns, and two or more corrections corresponding to each correction pattern. It includes a correction unit 204 that generates later image data, and an OCR processing unit 206 that reads information described in two or more corrected image data and converts the read information into text. In this way, the image data is corrected by two or more correction patterns, the information described in the corrected image data is read, and the read information is converted into text, so that the reading accuracy of characters can be expected to be improved.

また、本実施形態では、補正パタンには、画像データに含まれるマイナンバーカードの輪郭を強調させるフィルタが含まれる。このため、画像データに含まれるマイナンバーカードの位置を認識することができ、項目の読み取り位置をより正確に認識することが期待できる。 Further, in the present embodiment, the correction pattern includes a filter that emphasizes the outline of the My Number card included in the image data. Therefore, the position of the My Number card included in the image data can be recognized, and it can be expected that the reading position of the item can be recognized more accurately.

また、本実施形態では、補正パタンには、画像データの色調を変化させる2以上のフィルタが含まれる。このため、背景色の異なる領域が存在する場合にも文字の認識精度が向上することが期待できる。 Further, in the present embodiment, the correction pattern includes two or more filters that change the color tone of the image data. Therefore, it can be expected that the character recognition accuracy will be improved even when regions having different background colors exist.

また、本実施形態に係るサーバ2は、OCR処理部206で読み取る情報が記載された第1領域以外の第2領域を画像データから除去する除去部207を備える。このように不要領域を除去した後にテキスト化するため読み取り精度が向上することが期待できる。 Further, the server 2 according to the present embodiment includes a removing unit 207 that removes a second area other than the first area in which the information read by the OCR processing unit 206 is described from the image data. It is expected that the reading accuracy will be improved because the text is converted after removing the unnecessary area in this way.

また、本実施形態に係るサーバ2のOCR処理部206は、2以上の補正後の画像データに記載された情報を所定の項目ごとに読み取り、各補正パタンに対応する2以上の補正後の画像データをテキスト化した各項目の情報のうち、最も多いものを各項目の正式なテキスト化された情報として選択する。このように2以上の補正パタンによる補正された2以上のデータから多数決方式により、各項目の正式なテキスト化された情報として選択するので読み取り精度が向上することが期待できる。 Further, the OCR processing unit 206 of the server 2 according to the present embodiment reads the information described in the two or more corrected image data for each predetermined item, and the two or more corrected images corresponding to each correction pattern. Of the information of each item in which the data is converted into text, the most information is selected as the official textual information of each item. Since the data corrected by the correction pattern of 2 or more is selected as the formal textual information of each item by the majority voting method, the reading accuracy can be expected to be improved.

また、本実施形態に係るサーバ2は、画像データに記載された情報と、該情報の表記を変更する処理ルールとを関連付けた情報を参照し、処理ルールに基づいて、テキスト化された情報の表記を所定の表記に変更する表記変更部209を備える。このようにテキスト化された情報の表記を所定の表記に変更するのでより正確に文字を認識することが期待できる。 Further, the server 2 according to the present embodiment refers to the information in which the information described in the image data is associated with the processing rule for changing the notation of the information, and the information converted into text based on the processing rule. A notation changing unit 209 for changing the notation to a predetermined notation is provided. Since the notation of the information converted into text is changed to a predetermined notation, it can be expected that the characters are recognized more accurately.

また、本実施形態に係るサーバ2の表記変更部209は、画像データに記載された情報と、該情報の辞書データによる上書き処理内容とを関連付けた情報を参照し、処理内容に基づいて、テキスト化された情報の表記を所定の表記に変更する。このようにテキスト化された情報の表記を所定の表記に変更するのでより正確に文字を認識することが期待できる。 Further, the notation changing unit 209 of the server 2 according to the present embodiment refers to the information in which the information described in the image data and the overwriting processing content by the dictionary data of the information are associated with each other, and text based on the processing content. Change the notation of the converted information to the specified notation. Since the notation of the information converted into text is changed to a predetermined notation, it can be expected that the characters are recognized more accurately.

また、本実施形態の補正パタンは、各々1以上の異なる補正フィルタが含まれる。このように、各補正パタンには、1以上の異なる補正フィルタが含まれるため種々のフィルタで画像データを処理することになり、より正確に文字を認識することが期待できる。 Further, the correction pattern of the present embodiment includes one or more different correction filters. As described above, since each correction pattern includes one or more different correction filters, the image data is processed by various filters, and it can be expected that the characters are recognized more accurately.

また、本実施形態に係るサーバ2のOCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化する。このように、マイナンバーカードの正規の書式レイアウト情報に基づいて情報を読み取るので、より正確に文字を認識することが期待できる。 Further, the OCR processing unit 206 of the server 2 according to the present embodiment reads the information described in the two or more corrected image data based on the regular format layout information of the My Number card, and converts the read information into text. .. In this way, since the information is read based on the regular format layout information of the Individual Number Card, it can be expected that the characters will be recognized more accurately.

[実施形態の変形例1]
上記実施形態では、識別部207は、識別用DB2を参照し、OCR処理部206で認識された文字に、マイナンバーカードに特有のパタンマッチ用データやキーワードが存在するか否かを判定し、書類の画像データをマイナンバーカードの画像データであると識別している。
[Modification 1 of the embodiment]
In the above embodiment, the identification unit 207 refers to the identification DB 2 and determines whether or not the characters recognized by the OCR processing unit 206 have pattern matching data or keywords peculiar to the My Number card, and documents. The image data of is identified as the image data of My Number Card.

しかしながら、識別用DB2に、マイナンバーカードに含まれていてはいけないパタンマッチ用データ(画像データや特徴点データ(例えば、印章の画像データや特徴点データなど))やキーワード(KW)を記憶し、OCR処理部206で認識された文字に、該含まれていてはいけないパタンマッチ用データやキーワードが含まれている場合、画像データをマイナンバーカードの画像データでないと識別するようにしてもよい。 However, the identification DB2 stores pattern match data (image data, feature point data (for example, seal image data, feature point data, etc.)) and keywords (KW) that should not be included in the My Number card. When the characters recognized by the OCR processing unit 206 include pattern matching data or keywords that should not be included, the image data may be identified as not the image data of the My Number card.

[実施形態の変形例2]
また、上記実施形態において、書類の種別に応じて異なる処理を行うようにしてもよい。例えば、書類の種別に応じた補正パタンを補正パタンDB1に記憶し、補正部204は、書類の種別に応じた補正パタンにより書類の画像データを補正するようにしてもよい。また、書類の種別だけでなく、書類の種別及び書類の項目ごとに補正パタンを補正パタンDB1に記憶し、補正部204は、書類の種別及び書類の項目に応じた補正パタンにより書類の画像データを項目ごとに補正するようにしてもよい。例えば、書類がマイナンバーカードの場合、氏名や住所の項目の背景色は「ピンク」、転入など備考の項目の背景色は「ブルー」、マイナンバーの項目の背景色は「グレー」となっているが、このようなは池色を考慮した補正パタンを準備し、書類の種別及び書類の項目に応じた補正パタンにより書類の画像データを項目ごとに補正するようにしてもよい。
[Modification 2 of the embodiment]
Further, in the above embodiment, different processing may be performed depending on the type of document. For example, the correction pattern according to the type of the document may be stored in the correction pattern DB1, and the correction unit 204 may correct the image data of the document by the correction pattern according to the type of the document. Further, not only the document type but also the correction pattern for each document type and document item is stored in the correction pattern DB1, and the correction unit 204 uses the correction pattern according to the document type and the document item to obtain the image data of the document. May be corrected for each item. For example, if the document is an Individual Number Card, the background color of the name and address items is "pink", the background color of the remarks items such as transference is "blue", and the background color of the My Number item is "gray". However, in such a case, a correction pattern considering the color of the pond may be prepared, and the image data of the document may be corrected for each item by the correction pattern according to the type of the document and the item of the document.

1 情報処理システム
2 サーバ(情報処理装置)
200A 通信IF
200B 記憶装置
200C CPU
201 受信部
202 送信部
203 記憶装置制御部
204 補正部
205 除去部
206 OCR処理部
207 識別部
208 取得部
209 表記変更部
3 ユーザ端末
300A 通信IF
300B 記憶装置
300C 入力装置
300D 表示装置
300E CPU
301 受信部
302 送信部
303 記憶装置制御部
304 操作受付部
305 表示装置制御部
4 ネットワーク
DB1 補正パタンデータベース
DB2 識別用データベース
DB3 項目マスタデータベース
DB4 表記変更用データベース
1 Information processing system 2 Server (information processing device)
200A communication IF
200B storage device 200C CPU
201 Reception unit 202 Transmission unit 203 Storage device control unit 204 Correction unit 205 Removal unit 206 OCR processing unit 207 Identification unit 208 Acquisition unit 209 Notation change unit 3 User terminal 300A Communication IF
300B storage device 300C input device 300D display device 300E CPU
301 Reception unit 302 Transmission unit 303 Storage device control unit 304 Operation reception unit 305 Display device control unit 4 Network DB1 Correction pattern database DB2 Identification database DB3 Item master database DB4 Notation change database

Claims (4)

入力された書類の画像データを各々異なる補正フィルタの組み合わせで構成された2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する補正部と、
前記2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部と、
誤記となる表記と、該誤記に対する正しい表記とが対応付けられた情報を参照し、前記テキスト化された情報に誤記が含まれる場合、該誤記を前記正しい表記に変更する表記変更部と、を備え
前記表記変更部は、
前記書類の画像データに記載された情報と、該情報に含まれる文字の情報とが対応付けられた情報を参照し、書類の画像データに記載された情報に不要な文字が含まれる場合、該不要な文字データを削除する、
ことを特徴とする情報処理装置。
A correction unit that corrects the image data of the input document by two or more correction patterns composed of a combination of different correction filters, and generates two or more corrected image data corresponding to each correction pattern.
An OCR processing unit that reads the information described in the two or more corrected image data and converts the read information into text.
Referencing the information associated with the notation that is an error and the correct notation for the error, and if the textualized information contains an error, the notation change part that changes the error to the correct notation. Prepare
The notation change part
Referencing the information in which the information described in the image data of the document and the information of the characters included in the information are associated with each other, and when the information described in the image data of the document contains unnecessary characters, the said. Delete unnecessary character data,
An information processing device characterized by this.
前記OCR処理部は、
前記書類の正規の書式レイアウト情報に基づき、前記2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化する、
ことを特徴とする請求項に記載の情報処理装置。
The OCR processing unit
Based on the regular format layout information of the document, the information described in the two or more corrected image data is read, and the read information is converted into text.
The information processing apparatus according to claim 1.
前記OCR処理部がテキスト化した情報から、項目に対応する文字を項目ごとに取得する取得部を備え、
前記取得部は、
前記OCR処理部がテキスト化した所定項目の第1側に存在する次項目までの文字又は改行までの文字を前記所定項目に対応する文字として取得し、前記所定項目の第1側の所定範囲内に文字が存在しない場合、前記所定項目の第1側とは異なる第2側に存在する次項目までの文字又は改行までの文字を、前記画像データに記載された前記所定項目に対応する情報として取得する、
ことを特徴とする請求項に記載の情報処理装置。
It is provided with an acquisition unit that acquires characters corresponding to items for each item from the information converted into text by the OCR processing unit.
The acquisition unit
The character up to the next item or the character up to the line feed existing on the first side of the predetermined item converted into text by the OCR processing unit is acquired as the character corresponding to the predetermined item, and is within the predetermined range on the first side of the predetermined item. If the character does not exist in, the character up to the next item or the character up to the line feed existing on the second side different from the first side of the predetermined item is used as the information corresponding to the predetermined item described in the image data. get,
The information processing apparatus according to claim 2.
入力された書類の画像データを各々異なる補正フィルタの組み合わせで構成された2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する補正部と、
前記2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部と、
前記OCR処理部がテキスト化した情報から、項目に対応する文字を項目ごとに取得する取得部と、を備え、
前記OCR処理部は、
前記書類の正規の書式レイアウト情報に基づき、前記2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化し、
前記取得部は、
前記OCR処理部がテキスト化した所定項目の第1側に存在する次項目までの文字又は改行までの文字を前記所定項目に対応する文字として取得し、前記所定項目の第1側の所定範囲内に文字が存在しない場合、前記所定項目の第1側とは異なる第2側に存在する次項目までの文字又は改行までの文字を、前記画像データに記載された前記所定項目に対応する情報として取得する、
ことを特徴とする情報処理装置。
A correction unit that corrects the image data of the input document by two or more correction patterns composed of a combination of different correction filters, and generates two or more corrected image data corresponding to each correction pattern.
An OCR processing unit that reads the information described in the two or more corrected image data and converts the read information into text.
It is provided with an acquisition unit that acquires characters corresponding to items for each item from the information converted into text by the OCR processing unit.
The OCR processing unit
Based on the regular format layout information of the document, the information described in the two or more corrected image data is read, and the read information is converted into text.
The acquisition unit
The character up to the next item or the character up to the line feed existing on the first side of the predetermined item converted into text by the OCR processing unit is acquired as the character corresponding to the predetermined item, and is within the predetermined range on the first side of the predetermined item. If the character does not exist in, the character up to the next item or the character up to the line feed existing on the second side different from the first side of the predetermined item is used as the information corresponding to the predetermined item described in the image data. get,
An information processing device characterized by this.
JP2020132195A 2020-08-04 2020-08-04 Information processing equipment, information processing methods and information processing programs Active JP6928401B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020132195A JP6928401B1 (en) 2020-08-04 2020-08-04 Information processing equipment, information processing methods and information processing programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020132195A JP6928401B1 (en) 2020-08-04 2020-08-04 Information processing equipment, information processing methods and information processing programs

Publications (2)

Publication Number Publication Date
JP6928401B1 true JP6928401B1 (en) 2021-09-01
JP2022029077A JP2022029077A (en) 2022-02-17

Family

ID=77456301

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020132195A Active JP6928401B1 (en) 2020-08-04 2020-08-04 Information processing equipment, information processing methods and information processing programs

Country Status (1)

Country Link
JP (1) JP6928401B1 (en)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62212871A (en) * 1986-03-14 1987-09-18 Fujitsu Ltd Sentence reading correcting device
JPH10261045A (en) * 1997-03-17 1998-09-29 Oki Electric Ind Co Ltd Optical character reader
JPH11353417A (en) * 1998-06-08 1999-12-24 Oki Electric Ind Co Ltd Optical character reader
JP2000259765A (en) * 1999-03-09 2000-09-22 Sumitomo Electric Ind Ltd Character recognition device
JP5312701B1 (en) * 2013-02-08 2013-10-09 三三株式会社 Business card management server, business card image acquisition device, business card management method, business card image acquisition method, and program
JP2017091383A (en) * 2015-11-13 2017-05-25 京セラドキュメントソリューションズ株式会社 Image forming apparatus, image forming method, and image forming program
JP7149721B2 (en) * 2018-03-26 2022-10-07 株式会社Pfu Information processing device, character recognition engine optimization method and program
JP2020009323A (en) * 2018-07-11 2020-01-16 ネオス株式会社 Delivery customer management system
JP2020095374A (en) * 2018-12-11 2020-06-18 沖電気工業株式会社 Character recognition system, character recognition device, program and character recognition method

Also Published As

Publication number Publication date
JP2022029077A (en) 2022-02-17

Similar Documents

Publication Publication Date Title
US7623710B2 (en) Document content and structure conversion
KR101027851B1 (en) Image-based document indexing and retrieval
US11562588B2 (en) Enhanced supervised form understanding
JP4461769B2 (en) Document retrieval / browsing technique and document retrieval / browsing device
US8131081B2 (en) Image processing apparatus, and computer program product
US7565013B2 (en) Character recognition method, method of processing correction history of character data, and character recognition system
CN113011144B (en) Form information acquisition method, device and server
CN111753717B (en) Method, device, equipment and medium for extracting structured information of text
CN109753968A (en) Generation method, device, equipment and the medium of character recognition model
US11468655B2 (en) Method and apparatus for extracting information, device and storage medium
US20200175300A1 (en) Method and system for optical character recognition of series of images
US11727701B2 (en) Techniques to determine document recognition errors
JP6928401B1 (en) Information processing equipment, information processing methods and information processing programs
US10691884B2 (en) System and method for cheque image data masking using data file and template cheque image
KR20220149028A (en) Method for generating table information based on the image
JP2000322417A (en) Device and method for filing image and storage medium
CN106062781A (en) Image resolution modification
CN111079771B (en) Method, system, terminal equipment and storage medium for extracting characteristics of click-to-read image
JP2012190357A (en) Image processing device, image processing method and program
JP6899603B1 (en) Information processing equipment, information processing methods and information processing programs
US20220383023A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method
JP4294456B2 (en) Specific character string search device, specific character string search method, specific character string search program, and recording medium
JP2001188640A (en) Technology for translating non-text display generation data expressing indicator into text variables
JP2015138396A (en) Image processor and image processing program
JP2022054812A (en) Information processing apparatus and computer program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210218

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210218

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210406

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210720

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210730

R150 Certificate of patent or registration of utility model

Ref document number: 6928401

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350