JP6928401B1 - Information processing equipment, information processing methods and information processing programs - Google Patents
Information processing equipment, information processing methods and information processing programs Download PDFInfo
- Publication number
- JP6928401B1 JP6928401B1 JP2020132195A JP2020132195A JP6928401B1 JP 6928401 B1 JP6928401 B1 JP 6928401B1 JP 2020132195 A JP2020132195 A JP 2020132195A JP 2020132195 A JP2020132195 A JP 2020132195A JP 6928401 B1 JP6928401 B1 JP 6928401B1
- Authority
- JP
- Japan
- Prior art keywords
- information
- image data
- character
- item
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
【課題】認識率を向上できる情報処理装置、情報処理方法及び情報処理プログラムを提供すること。【解決手段】本発明に係る情報処理装置は、入力された書類の画像データを2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する補正部と、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部と、を備える。【選択図】図1PROBLEM TO BE SOLVED: To provide an information processing device, an information processing method and an information processing program capable of improving a recognition rate. An information processing apparatus according to the present invention has a correction unit that corrects an input document image data by two or more correction patterns and generates two or more corrected image data corresponding to each correction pattern. It is provided with an OCR processing unit that reads information described in two or more corrected image data and converts the read information into text. [Selection diagram] Fig. 1
Description
本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.
従来、OCR(Optical Character Recognition)と呼ばれる画像に含まれる文字を認識する技術が用いられている。画像中の文字の記載箇所や大きさが統一されている場合、OCRによって高い精度で文字を認識し、画像から文字情報を抽出することができる(例えば、特許文献1参照)。 Conventionally, a technique called OCR (Optical Character Recognition) for recognizing characters contained in an image has been used. When the description location and size of the characters in the image are unified, the characters can be recognized with high accuracy by OCR and the character information can be extracted from the image (see, for example, Patent Document 1).
画像中の文字の記載箇所や大きさが統一されている場合、従来のOCR技術によって高い精度で画像から文字情報を抽出することができる。しかしながら、取得する項目が複数ある場合や背景色に違いがある場合、従来のOCR技術では文字を適切に認識することが難しい。 When the description location and size of the characters in the image are unified, the character information can be extracted from the image with high accuracy by the conventional OCR technology. However, when there are a plurality of items to be acquired or when there is a difference in the background color, it is difficult to properly recognize the characters by the conventional OCR technique.
本発明は、上記課題に鑑みてなされたものであり、認識率を向上できる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。 The present invention has been made in view of the above problems, and an object of the present invention is to provide an information processing device, an information processing method, and an information processing program capable of improving the recognition rate.
上記課題を解決するため、本発明の情報処理装置は、入力された書類の画像データを2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する補正部と、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部と、を備える。 In order to solve the above problems, the information processing apparatus of the present invention corrects the image data of the input document by two or more correction patterns, and generates two or more corrected image data corresponding to each correction pattern. It is provided with a unit and an OCR processing unit that reads information described in two or more corrected image data and converts the read information into text.
本発明によれば、認識率を向上できる情報処理装置、情報処理方法及び情報処理プログラムを提供することができる。 According to the present invention, it is possible to provide an information processing device, an information processing method, and an information processing program capable of improving the recognition rate.
以下、本発明の実施形態を図面に基づいて説明する。なお、本実施形態では、文書としてマイナンバーカードを例に実施形態を説明するが、本発明は、マイナンバーカードのほか、マイナンバー通知カード等のマイナンバーを記載した書類、運転免許の他、パスポート(旅券)、住民基本台帳カード、在留カード、住民票などの書類にも利用することができる。また、本実施形態において、テキストには、文字、記号、数値などが含まれる。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the present embodiment, the embodiment will be described by taking the My Number card as an example as a document. However, in the present invention, in addition to the My Number card, a document describing the My Number such as a My Number notification card, a driver's license, and a passport ( It can also be used for documents such as passports), basic resident register cards, residence cards, and resident cards. Further, in the present embodiment, the text includes characters, symbols, numerical values, and the like.
[実施形態]
図1は、実施形態に係る情報処理システム1の概要構成の一例を示す図である。情報処理システム1は、サーバ2及びユーザ端末3がネットワーク4を介して接続された構成を有する。なお、情報処理システム1が具備するサーバ2、ユーザ端末3の数は任意である。また、ネットワーク4をどのような通信網で構成するかは任意である。
[Embodiment]
FIG. 1 is a diagram showing an example of an outline configuration of the
図2は、本実施形態に係るサーバ2(情報処理装置)のハード構成の一例を示す図である。図2に示すように、サーバ2は、通信IF200A、記憶装置200B及びCPU200Cがバスを介して接続された構成を備える。
FIG. 2 is a diagram showing an example of a hardware configuration of the server 2 (information processing device) according to the present embodiment. As shown in FIG. 2, the
通信IF200Aは、外部端末と通信するためのインターフェースである。 The communication IF200A is an interface for communicating with an external terminal.
記憶装置200Bは、例えば、HDDや半導体記憶装置である。記憶装置200Bには、サーバ2で利用する情報処理プログラムや各種データベースが記憶されている。なお、本実施形態では、情報処理プログラムや各種データベースは、サーバ2の記憶装置200Bに記憶されているが、USBメモリなどの外部記憶装置やネットワークを介して接続された外部サーバに記憶し、必要に応じて参照やダウンロード可能に構成されていてもよい。
The
図3は、サーバ2の記憶装置200Bに記憶されているデータベースの一例を示す図である。図3に示すように、記憶装置200Bには、補正パタンデータベース1(以下、補正パタンDB1ともいう)、識別用データベース2(以下、識別用DB2ともいう)、項目マスタデータベース3(以下、項目マスタDB3ともいう)、表記変更用データベース4(以下、表記変更用DB4ともいう)が記憶されている。
FIG. 3 is a diagram showing an example of a database stored in the
(補正パタンDB1)
補正パタンDB1は、マイナンバーカードの画像データを補正するための補正パタンが2以上記憶されている。図4(a)は、補正パタンDB1に記憶されている情報の一例を示す図である。図4(a)に示すように、2以上の補正パタンは、それぞれ1以上の補正フィルタを組み合わせて構成されている。例えば、補正パタン1は、補正フィルタ1及び3を組み合わせて構成される。また、補正パタン2は、補正フィルタ1、2及び4を組み合わせて構成される。また、補正パタン3は、補正フィルタ1、2及び3を組み合わせて構成される。また、補正パタン4は、補正フィルタ1、3及び5を組み合わせて構成される。また、補正パタン5は、補正フィルタ1及び4を組み合わせて構成される。なお、各補正パタンに含まれる補正フィルタの数は任意である。
(Correction pattern DB1)
The correction pattern DB1 stores two or more correction patterns for correcting the image data of the My Number card. FIG. 4A is a diagram showing an example of information stored in the correction pattern DB1. As shown in FIG. 4A, each of the two or more correction patterns is configured by combining one or more correction filters. For example, the
また、補正フィルタ1〜補正フィルタ5には、例えば、画像データに含まれるマイナンバーカードの輪郭を強調させるフィルタ、画像データの色調を変化させる2以上のフィルタが少なくとも含まれる。また、その他、補正フィルタ1〜補正フィルタ5には、遠近法ワープ(台形補正)、明るさ補正、コントラスト補正、ガウス補正、ぼかし補正、色調補正などのフィルタが含まれる。なお、図4(a)に示す各補正パタンの補正フィルタの組み合わせはあくまで一例であり、各補正パタンをどのような補正フィルタで構成するかは任意である。また、補正フィルタは、補正フィルタ1〜補正フィルタ5の5つに限られない。
Further, the
(識別用DB2)
識別用DB2には、マイナンバーカードを識別するための情報が記憶されている。図4(b)は、識別用DB2に記憶されている情報の一例を示す図である。図4(b)に示すように、識別用DB2には、マイナンバーカードを識別するための情報、例えば、マイナンバーカードに特有のパタンマッチ用データ(画像データや特徴点データ(例えば、印章の画像データや特徴点データなど))やキーワード(KW)が記憶されている。なお、図4(b)に示すパタンマッチ用データやキーワードはあくまで一例であり、マイナンバーカードを識別するための情報として、どのようなパタンマッチ用データやキーワードとするかは任意である。後述の識別部207は、識別用DB2を参照し、画像データにパタンマッチ用データやキーワードが含まれているが否かに基づいて、画像データがマイナンバーカードの画像データであることを識別する。2以上のパタンマッチ用データやキーワードを利用することで画像データがマイナンバーカードの画像データであることを識別する精度の向上が期待できる。
(Identification DB2)
Information for identifying the My Number card is stored in the
(項目マスタDB3)
項目マスタDB3には、取得する項目と該項目の位置の情報(正規の書式レイアウト情報ともいう)とが記憶されている。本実施形態では、項目マスタDB3には、マイナンバーカードから取得する項目と該項目の位置の情報が記憶されている。マイナンバーカードは、所定の書式に沿って作成されている。このため、マイナンバーカードの書式レイアウトは決まっている。書式レイアウト情報は、マイナンバーカードのどの項目がどの位置(領域)に配置されているかを示す情報である。図4(c)は、項目マスタDB3に記憶されている情報の一例を示す図である。図4(c)に示すように、項目マスタDB3には、マイナンバーカードから取得する項目及び位置の情報が記憶されている。なお、位置の情報は、マイナンバーカードの左上をゼロ点としたXY座標により表され、マイナンバーカードに向かって横方向がX軸(右方向が正)、縦方向がY軸(下方向が正)となっている。なお、座標を表す数値に画素数を利用してもよい。また、マイナンバーカードのどの位置をゼロ点とするかは任意である。また、座標を表す数値に画素数以外の数値を利用してもよい。さらに、マイナンバーカードからどのような項目の情報を取得するかは任意である。
(Item master DB3)
The
(表記変更用DB4)
表記変更用DB4には、サーバ2が取得したマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更するための情報が記憶されている。具体的には、表記変更用DB4には、ロジック処理用の情報及び第1,第2マスタ処理用の情報が記憶されている。
(DB4 for notation change)
The
ロジック処理用の情報は、表記を変更する対象(以下、処理摘要対象ともいう)であるマイナンバーカードの画像データに記載された情報と、該情報の表記を変更する処理ルールとを関連付けた情報である。ロジック処理用の情報は、処理摘要対象と、該処理摘要対象に対する処理ルールとを取得する項目ごとに対応付けた情報であり、該ロジック処理用の情報を参照することで、表記を所定の統一された表記に変更することができる。 The information for logic processing is information that associates the information described in the image data of the Individual Number Card, which is the target for changing the notation (hereinafter, also referred to as the processing description target), with the processing rule for changing the notation of the information. be. The information for logic processing is information associated with each item for acquiring the processing description target and the processing rule for the processing description target, and by referring to the information for logic processing, the notation is unified as a predetermined value. It can be changed to the written notation.
第1マスタ処理用の情報は、処理摘要対象であるマイナンバーカードの画像データに記載された情報と、該情報の辞書データによる上書き処理内容とを取得する項目ごとに関連付けた情報である。第1マスタ処理用の情報には、処理摘要対象に辞書データによる上書き処理内容のパタンが種々含まれている。このように、第1マスタ処理用の情報は、誤記となる表記(例えば、変換ミスによる誤記など予め想定される誤記)と、該誤記に対する正しい表記とが取得する項目ごとに対応付けられた情報であり、該第1マスタ処理用の情報を参照することで、誤記を正しい表記に修正することができる。 The information for the first master processing is information associated with each item for acquiring the information described in the image data of the My Number card, which is the processing description target, and the content of the overwriting processing by the dictionary data of the information. The information for the first master processing includes various patterns of overwrite processing contents by dictionary data in the processing description target. In this way, the information for the first master processing is the information associated with each item acquired by the notation that is an error (for example, an error that is assumed in advance such as an error due to a conversion error) and the correct notation for the error. By referring to the information for the first master processing, the typographical error can be corrected to the correct notation.
また、第2マスタ処理用の情報は、マイナンバーカードの画像データに記載された情報に含まれる不要な文字データを削除するための情報である。具体的には、第2マスタ処理用の情報は、マイナンバーカードの画像データに記載された情報と、該情報に含まれる文字の情報である。このように、第2マスタ処理用の情報は、マイナンバーカードの画像データに記載された情報と、該情報に含まれる文字の情報とが取得する項目ごとに対応付けられた情報であり、該第2マスタ処理用の情報を参照することで、該マイナンバーカードの画像データに記載された情報に含まれる文字以外の不要な文字データを認識して、該不要な文字データを削除することができる。 Further, the information for the second master processing is information for deleting unnecessary character data included in the information described in the image data of the My Number card. Specifically, the information for the second master processing is the information described in the image data of the My Number card and the character information included in the information. As described above, the information for the second master processing is the information described in the image data of the My Number card and the information of the characters included in the information associated with each item to be acquired. By referring to the information for 2 master processing, it is possible to recognize unnecessary character data other than the characters included in the information described in the image data of the My Number card and delete the unnecessary character data.
CPU200Cは、サーバ2を制御し、図示しないROM(Read Only Memory)及びRAM(Random Access Memory)を備えている。
The
図5に示すように、サーバ2は、受信部201、送信部202、記憶装置制御部203、補正部204、除去部205、OCR処理部206、識別部207、取得部208、表記変更部209などの機能を有する。なお、図5に示す機能は、サーバ2のROM(不図示)に記憶された情報処理プログラムをCPU200Cが実行することにより実現される。
As shown in FIG. 5, the
受信部201は、外部から送信される情報、例えば、画像データの情報を受信する。
The receiving
送信部202は、情報を外部へ送信する。
The
記憶装置制御部203は、記憶装置200Bを制御する。具体的には、記憶装置制御部203は、記憶装置200Bを制御して情報の書き込みや読み出しを行う。
The storage
補正部204は、入力されたマイナンバーカードの画像データを補正パタンDB1に記憶されている2以上の補正パタン(各補正パタンには、各々1以上の異なる補正フィルタが含まれている)により補正し、各補正パタンに対応する2以上の補正後の画像データを生成する。具体的には、補正部204は、画像データを補正パタン1で補正した補正後画像データ1を生成する。また、補正部204は、画像データを補正パタン2で補正した補正後画像データ2を生成する。また、補正部204は、画像データを補正パタン3で補正した補正後画像データ3を生成する。また、補正部204は、画像データを補正パタン4で補正した補正後画像データ4を生成する。また、補正部204は、画像データを補正パタン5で補正した補正後画像データ5を生成する。
The
除去部205は、項目マスタDB3に記憶された正規の書式レイアウト情報に基づいて、マイナンバーカードから取得する項目が配置された第1領域以外の第2領域を画像データから除去する。
The
OCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化する。具体的には、OCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を所定の項目ごとに読み取り、各補正パタンに対応する2以上の補正後の画像データをテキスト化した各項目の情報のうち、最も多いものを各項目の正式なテキスト化された情報として選択する。
The
識別部207は、識別用DB2を参照し、マイナンバーカードの画像データを識別する。具体的には、識別部207は、識別用DB2を参照し、パタンマッチ用データやキーワードが存在するか否かに応じて、画像データがマイナンバーカードの画像データであることを識別する。なお、上述したように、識別部207は、2以上のパタンマッチ用データやキーワードを利用して、画像データがマイナンバーカードの画像データであるかを識別してもよい。2以上のパタンマッチ用データやキーワードを利用することで画像データがマイナンバーカードの画像データであることを識別する精度の向上が期待できる。
The
取得部208は、項目マスタDB3を参照し、項目に対応する文字を、項目ごとに取得する。例えば、取得部208は、OCR処理部206がテキスト化した項目の第1側(本実施形態では右側)に存在する次の項目(次項目)までの文字又は改行までの文字を項目に対応する文字として取得する。また、取得部208は、項目の第1側(本実施形態では右側)の所定範囲内に文字(項目を構成する文字を除く)が存在しない場合、項目の第1側とは異なる第2側(本実施形態では下側)に存在する次の項目(次項目)までの文字又は改行までの文字を、項目に対応する文字をマイナンバーカードの画像データに記載された情報として取得する。なお、取得部208が文字を取得する範囲(どこからどこまで)を画素数に基いて決めておくようにしてもよい。この場合、項目ごとに文字を取得する範囲を定めておくとよい。
The
表記変更部209は、取得部208で取得されたマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更する。具体的には、表記変更部209は、表記変更用DB4を参照し、表記変更用DB4に記憶されているロジック処理用の情報に基づいて、取得部208で取得されたマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更する。また、表記変更部209は、表記変更用DB4を参照し、表記変更用DB4に記憶されている第1,第2マスタ処理用の情報に基づいて、誤記を正しい表記に修正したり、不要な文字データを認識して、該不要な文字データを削除する。
The
(ユーザ端末3)
図6は、実施形態に係るユーザ端末3のハード構成及び機能構成の一例を示す図である。図6(a)は、ユーザ端末3のハード構成の一例を示す図、図6(b)は、ユーザ端末3の機能構成の一例を示す図である。ユーザ端末3は、PC(Personal Computer)や携帯端末(例えば、タブレット端末)などである。図6(a)に示すように、ユーザ端末3は、通信IF300A、記憶装置300B、入力装置300C、表示装置300D、CPU300Eなどを備える。
(User terminal 3)
FIG. 6 is a diagram showing an example of a hardware configuration and a functional configuration of the
通信IF300Aは、他の装置(実施形態では、サーバ2)と通信するためのインターフェースである。
The communication IF 300A is an interface for communicating with another device (
記憶装置300Bは、例えば、HDD(Hard Disk Drive)や半導体記憶装置(SSD(Solid State Drive))である。記憶装置300Bには、ユーザ端末3の識別子(ID)及び情報処理プログラムなどが記憶されている。なお、識別子は、サーバ2がユーザ端末3に対して新たに付与してもよいし、IP(Internet Protocol)アドレス、MAC(Media Access Control)アドレスなどを利用してもよい。
The storage device 300B is, for example, an HDD (Hard Disk Drive) or a semiconductor storage device (SSD (Solid State Drive)). The storage device 300B stores an identifier (ID) of the
入力装置300Cは、例えば、キーボード、タッチパネルなどであり、入力装置300Cを操作して、情報処理システム1の利用に必要な情報(例えば、マイナンバーカードの画像データ)を入力することができる。
The input device 300C is, for example, a keyboard, a touch panel, or the like, and the input device 300C can be operated to input information (for example, image data of a My Number card) necessary for using the
表示装置300Dは、例えば、液晶モニタや有機ELモニタなどである。表示装置300Dは、情報処理システム1の利用に必要な画面(例えば、マイナンバーカードの画像データを入力するための画面など)を表示する。
The
CPU300Eは、ユーザ端末3を制御するものであり、図示しないROM及びRAMを備えている。
The
図6(b)に示すように、ユーザ端末3は、受信部301、送信部302、記憶装置制御部303、操作受付部304、表示装置制御部305などの機能を有する。なお、図6(b)に示す機能は、CPU300Eが、記憶装置300Bに記憶されている情報処理プログラムを実行することで実現される。
As shown in FIG. 6B, the
受信部301は、サーバ2から送信される情報を受信する。
The receiving
送信部302は、入力装置300Cを利用して入力された情報に識別子を付与してサーバ2へ送信する。ユーザ端末3から送信される情報に識別子を付与することでサーバ2は、受信した情報がどのユーザ端末3から送信されたものであるかを認識できる。
The
記憶装置制御部303は、記憶装置300Bを制御する。具体的には、記憶装置制御部303は、記憶装置300Bを制御して情報の書き込みや読み出しを行う。
The storage
操作受付部304は、入力装置300Cでの入力操作を受け付ける。例えば、マイナンバーカードの画像データの入力操作を受け付ける。
The
表示装置制御部305は、表示装置300Dを制御する。具体的には、表示装置制御部305は、表示装置300Dを制御して実施形態に係る情報処理システム1の利用に必要な画面(例えば、マイナンバーカードの画像データを入力するための画面など)を表示させる。
The display
(情報処理方法)
図7は、実施形態に係るサーバの文字認識処理の一例を示すフローチャートである。
(Information processing method)
FIG. 7 is a flowchart showing an example of the character recognition process of the server according to the embodiment.
(ステップS101)
サーバ2の補正部204は、補正パタンDB1を参照し、文書の画像データを補正する。具体的には、補正部204は、マイナンバーカードの画像データを、補正パタンDB1に記憶されている2以上の補正パタン(各補正パタンには、各々1以上の異なる補正が含まれている)により補正し、各補正パタンに対応する2以上の補正後の画像を生成する。
(Step S101)
The
(ステップS102)
サーバ2のOCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化する。具体的には、OCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を所定の項目ごとに読み取り、各補正パタンに対応する2以上の補正後の画像データをテキスト化した各項目の情報のうち、最も多いものを各項目の正式なテキスト化された情報として選択する。
(Step S102)
The
図8は、OCR処理部206による文字認識の一例を示す図である。図8に示すように、OCR処理部206は、補正部204で生成された各補正パタンに対応する2以上の補正後の画像から文字を認識する。図8に示す例では、補正パタン1、3及び5では、認識結果が「山田太郎」となっている。また、補正パタン2では、認識結果が「山田大郎」となっている。また、補正パタン3では、認識結果が「認識不可」、すなわち文字を認識することができなかったとなっている。OCR処理部206は、2以上の補正後の画像データから認識した文字のうち最も多いもの、図8に示す例では「山田太郎」を選択し、認識した文字として決定する。なお、認識した文字のうち最も多いものがない場合(例えば、補正パタン1〜5の判定結果がそれぞれ2、2、2、2、1の場合)は、再度、ステップS102の処理を行ってもよいし、補正パタンを変更してステップS102の処理を行ってもよい、また、読み取れなったとして報知(エラーを出力)するようにしてもよい。
FIG. 8 is a diagram showing an example of character recognition by the
(ステップS103)
サーバ2の識別部207は、識別用DB2を参照し、画像データを識別する。具体的には、識別部207は、識別用DB2を参照し、OCR処理部206で認識された文字に、パタンマッチ用データやキーワードが存在するか否かを判定する。OCR処理部206で認識された文字に、パタンマッチ用データ又はキーワードのいずれか一つが含まれている場合、識別部207は、画像データがマイナンバーカードの画像であることを識別する。
(Step S103)
The
(ステップS104)
サーバ2の取得部208は、項目マスタDB3を参照し、項目に対応する文字を、項目ごとに取得する。例えば、取得部208は、OCR処理部206がテキスト化した項目の第1側(本実施形態では右側)に存在する次の項目(次項目)までの文字又は改行までの文字を項目に対応する文字として取得する。また、取得部208は、項目の第1側(本実施形態では右側)の所定範囲内に文字(項目を構成する文字を除く)が存在しない場合、項目の第1側とは異なる第2側(本実施形態では下側)に存在する次の項目(次項目)までの文字又は改行までの文字を、項目に対応する文字をマイナンバーカードの画像データに記載された情報として取得する。なお、取得部208が文字を取得する範囲(どこからどこまで)を画素数に基いて決めておくようにしてもよい。この場合、項目ごとに文字を取得する範囲を定めておくとよい。
(Step S104)
The
(ステップS105)
表記変更部209は、取得部208で取得されたマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更する。具体的には、表記変更部209は、表記変更用DB4を参照し、表記変更用DB4に記憶されているロジック処理用の情報及び第1,第2マスタ処理用の情報に基づいて、取得部208で取得されたマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更する。また、表記変更部209は、表記変更用DB4を参照し、表記変更用DB4に記憶されている第1,第2マスタ処理用の情報に基づいて、誤記を正しい表記に修正したり、不要な文字データを認識して、該不要な文字データを削除する。
(Step S105)
The
以上のように、本実施形態に係るサーバ2(情報処理装置)は、入力された書類(マイナンバーカード)の画像データを2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する補正部204と、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部206とを備える。このように2以上の補正パタンにより画像データを補正し、補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するので文字の読み取り精度が向上することが期待できる。
As described above, the server 2 (information processing device) according to the present embodiment corrects the image data of the input document (My Number Card) by two or more correction patterns, and two or more corrections corresponding to each correction pattern. It includes a
また、本実施形態では、補正パタンには、画像データに含まれるマイナンバーカードの輪郭を強調させるフィルタが含まれる。このため、画像データに含まれるマイナンバーカードの位置を認識することができ、項目の読み取り位置をより正確に認識することが期待できる。 Further, in the present embodiment, the correction pattern includes a filter that emphasizes the outline of the My Number card included in the image data. Therefore, the position of the My Number card included in the image data can be recognized, and it can be expected that the reading position of the item can be recognized more accurately.
また、本実施形態では、補正パタンには、画像データの色調を変化させる2以上のフィルタが含まれる。このため、背景色の異なる領域が存在する場合にも文字の認識精度が向上することが期待できる。 Further, in the present embodiment, the correction pattern includes two or more filters that change the color tone of the image data. Therefore, it can be expected that the character recognition accuracy will be improved even when regions having different background colors exist.
また、本実施形態に係るサーバ2は、OCR処理部206で読み取る情報が記載された第1領域以外の第2領域を画像データから除去する除去部207を備える。このように不要領域を除去した後にテキスト化するため読み取り精度が向上することが期待できる。
Further, the
また、本実施形態に係るサーバ2のOCR処理部206は、2以上の補正後の画像データに記載された情報を所定の項目ごとに読み取り、各補正パタンに対応する2以上の補正後の画像データをテキスト化した各項目の情報のうち、最も多いものを各項目の正式なテキスト化された情報として選択する。このように2以上の補正パタンによる補正された2以上のデータから多数決方式により、各項目の正式なテキスト化された情報として選択するので読み取り精度が向上することが期待できる。
Further, the
また、本実施形態に係るサーバ2は、画像データに記載された情報と、該情報の表記を変更する処理ルールとを関連付けた情報を参照し、処理ルールに基づいて、テキスト化された情報の表記を所定の表記に変更する表記変更部209を備える。このようにテキスト化された情報の表記を所定の表記に変更するのでより正確に文字を認識することが期待できる。
Further, the
また、本実施形態に係るサーバ2の表記変更部209は、画像データに記載された情報と、該情報の辞書データによる上書き処理内容とを関連付けた情報を参照し、処理内容に基づいて、テキスト化された情報の表記を所定の表記に変更する。このようにテキスト化された情報の表記を所定の表記に変更するのでより正確に文字を認識することが期待できる。
Further, the
また、本実施形態の補正パタンは、各々1以上の異なる補正フィルタが含まれる。このように、各補正パタンには、1以上の異なる補正フィルタが含まれるため種々のフィルタで画像データを処理することになり、より正確に文字を認識することが期待できる。 Further, the correction pattern of the present embodiment includes one or more different correction filters. As described above, since each correction pattern includes one or more different correction filters, the image data is processed by various filters, and it can be expected that the characters are recognized more accurately.
また、本実施形態に係るサーバ2のOCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化する。このように、マイナンバーカードの正規の書式レイアウト情報に基づいて情報を読み取るので、より正確に文字を認識することが期待できる。
Further, the
[実施形態の変形例1]
上記実施形態では、識別部207は、識別用DB2を参照し、OCR処理部206で認識された文字に、マイナンバーカードに特有のパタンマッチ用データやキーワードが存在するか否かを判定し、書類の画像データをマイナンバーカードの画像データであると識別している。
[
In the above embodiment, the
しかしながら、識別用DB2に、マイナンバーカードに含まれていてはいけないパタンマッチ用データ(画像データや特徴点データ(例えば、印章の画像データや特徴点データなど))やキーワード(KW)を記憶し、OCR処理部206で認識された文字に、該含まれていてはいけないパタンマッチ用データやキーワードが含まれている場合、画像データをマイナンバーカードの画像データでないと識別するようにしてもよい。
However, the identification DB2 stores pattern match data (image data, feature point data (for example, seal image data, feature point data, etc.)) and keywords (KW) that should not be included in the My Number card. When the characters recognized by the
[実施形態の変形例2]
また、上記実施形態において、書類の種別に応じて異なる処理を行うようにしてもよい。例えば、書類の種別に応じた補正パタンを補正パタンDB1に記憶し、補正部204は、書類の種別に応じた補正パタンにより書類の画像データを補正するようにしてもよい。また、書類の種別だけでなく、書類の種別及び書類の項目ごとに補正パタンを補正パタンDB1に記憶し、補正部204は、書類の種別及び書類の項目に応じた補正パタンにより書類の画像データを項目ごとに補正するようにしてもよい。例えば、書類がマイナンバーカードの場合、氏名や住所の項目の背景色は「ピンク」、転入など備考の項目の背景色は「ブルー」、マイナンバーの項目の背景色は「グレー」となっているが、このようなは池色を考慮した補正パタンを準備し、書類の種別及び書類の項目に応じた補正パタンにより書類の画像データを項目ごとに補正するようにしてもよい。
[
Further, in the above embodiment, different processing may be performed depending on the type of document. For example, the correction pattern according to the type of the document may be stored in the correction pattern DB1, and the
1 情報処理システム
2 サーバ(情報処理装置)
200A 通信IF
200B 記憶装置
200C CPU
201 受信部
202 送信部
203 記憶装置制御部
204 補正部
205 除去部
206 OCR処理部
207 識別部
208 取得部
209 表記変更部
3 ユーザ端末
300A 通信IF
300B 記憶装置
300C 入力装置
300D 表示装置
300E CPU
301 受信部
302 送信部
303 記憶装置制御部
304 操作受付部
305 表示装置制御部
4 ネットワーク
DB1 補正パタンデータベース
DB2 識別用データベース
DB3 項目マスタデータベース
DB4 表記変更用データベース
1
200A communication IF
300B storage device
Claims (4)
前記2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部と、
誤記となる表記と、該誤記に対する正しい表記とが対応付けられた情報を参照し、前記テキスト化された情報に誤記が含まれる場合、該誤記を前記正しい表記に変更する表記変更部と、を備え
前記表記変更部は、
前記書類の画像データに記載された情報と、該情報に含まれる文字の情報とが対応付けられた情報を参照し、書類の画像データに記載された情報に不要な文字が含まれる場合、該不要な文字データを削除する、
ことを特徴とする情報処理装置。 A correction unit that corrects the image data of the input document by two or more correction patterns composed of a combination of different correction filters, and generates two or more corrected image data corresponding to each correction pattern.
An OCR processing unit that reads the information described in the two or more corrected image data and converts the read information into text.
Referencing the information associated with the notation that is an error and the correct notation for the error, and if the textualized information contains an error, the notation change part that changes the error to the correct notation. Prepare
The notation change part
Referencing the information in which the information described in the image data of the document and the information of the characters included in the information are associated with each other, and when the information described in the image data of the document contains unnecessary characters, the said. Delete unnecessary character data,
An information processing device characterized by this.
前記書類の正規の書式レイアウト情報に基づき、前記2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化する、
ことを特徴とする請求項1に記載の情報処理装置。 The OCR processing unit
Based on the regular format layout information of the document, the information described in the two or more corrected image data is read, and the read information is converted into text.
The information processing apparatus according to claim 1.
前記取得部は、
前記OCR処理部がテキスト化した所定項目の第1側に存在する次項目までの文字又は改行までの文字を前記所定項目に対応する文字として取得し、前記所定項目の第1側の所定範囲内に文字が存在しない場合、前記所定項目の第1側とは異なる第2側に存在する次項目までの文字又は改行までの文字を、前記画像データに記載された前記所定項目に対応する情報として取得する、
ことを特徴とする請求項2に記載の情報処理装置。 It is provided with an acquisition unit that acquires characters corresponding to items for each item from the information converted into text by the OCR processing unit.
The acquisition unit
The character up to the next item or the character up to the line feed existing on the first side of the predetermined item converted into text by the OCR processing unit is acquired as the character corresponding to the predetermined item, and is within the predetermined range on the first side of the predetermined item. If the character does not exist in, the character up to the next item or the character up to the line feed existing on the second side different from the first side of the predetermined item is used as the information corresponding to the predetermined item described in the image data. get,
The information processing apparatus according to claim 2.
前記2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部と、
前記OCR処理部がテキスト化した情報から、項目に対応する文字を項目ごとに取得する取得部と、を備え、
前記OCR処理部は、
前記書類の正規の書式レイアウト情報に基づき、前記2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化し、
前記取得部は、
前記OCR処理部がテキスト化した所定項目の第1側に存在する次項目までの文字又は改行までの文字を前記所定項目に対応する文字として取得し、前記所定項目の第1側の所定範囲内に文字が存在しない場合、前記所定項目の第1側とは異なる第2側に存在する次項目までの文字又は改行までの文字を、前記画像データに記載された前記所定項目に対応する情報として取得する、
ことを特徴とする情報処理装置。 A correction unit that corrects the image data of the input document by two or more correction patterns composed of a combination of different correction filters, and generates two or more corrected image data corresponding to each correction pattern.
An OCR processing unit that reads the information described in the two or more corrected image data and converts the read information into text.
It is provided with an acquisition unit that acquires characters corresponding to items for each item from the information converted into text by the OCR processing unit.
The OCR processing unit
Based on the regular format layout information of the document, the information described in the two or more corrected image data is read, and the read information is converted into text.
The acquisition unit
The character up to the next item or the character up to the line feed existing on the first side of the predetermined item converted into text by the OCR processing unit is acquired as the character corresponding to the predetermined item, and is within the predetermined range on the first side of the predetermined item. If the character does not exist in, the character up to the next item or the character up to the line feed existing on the second side different from the first side of the predetermined item is used as the information corresponding to the predetermined item described in the image data. get,
An information processing device characterized by this.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020132195A JP6928401B1 (en) | 2020-08-04 | 2020-08-04 | Information processing equipment, information processing methods and information processing programs |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020132195A JP6928401B1 (en) | 2020-08-04 | 2020-08-04 | Information processing equipment, information processing methods and information processing programs |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6928401B1 true JP6928401B1 (en) | 2021-09-01 |
JP2022029077A JP2022029077A (en) | 2022-02-17 |
Family
ID=77456301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020132195A Active JP6928401B1 (en) | 2020-08-04 | 2020-08-04 | Information processing equipment, information processing methods and information processing programs |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6928401B1 (en) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62212871A (en) * | 1986-03-14 | 1987-09-18 | Fujitsu Ltd | Sentence reading correcting device |
JPH10261045A (en) * | 1997-03-17 | 1998-09-29 | Oki Electric Ind Co Ltd | Optical character reader |
JPH11353417A (en) * | 1998-06-08 | 1999-12-24 | Oki Electric Ind Co Ltd | Optical character reader |
JP2000259765A (en) * | 1999-03-09 | 2000-09-22 | Sumitomo Electric Ind Ltd | Character recognition device |
JP5312701B1 (en) * | 2013-02-08 | 2013-10-09 | 三三株式会社 | Business card management server, business card image acquisition device, business card management method, business card image acquisition method, and program |
JP2017091383A (en) * | 2015-11-13 | 2017-05-25 | 京セラドキュメントソリューションズ株式会社 | Image forming apparatus, image forming method, and image forming program |
JP7149721B2 (en) * | 2018-03-26 | 2022-10-07 | 株式会社Pfu | Information processing device, character recognition engine optimization method and program |
JP2020009323A (en) * | 2018-07-11 | 2020-01-16 | ネオス株式会社 | Delivery customer management system |
JP2020095374A (en) * | 2018-12-11 | 2020-06-18 | 沖電気工業株式会社 | Character recognition system, character recognition device, program and character recognition method |
-
2020
- 2020-08-04 JP JP2020132195A patent/JP6928401B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2022029077A (en) | 2022-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7623710B2 (en) | Document content and structure conversion | |
KR101027851B1 (en) | Image-based document indexing and retrieval | |
US11562588B2 (en) | Enhanced supervised form understanding | |
JP4461769B2 (en) | Document retrieval / browsing technique and document retrieval / browsing device | |
US8131081B2 (en) | Image processing apparatus, and computer program product | |
US7565013B2 (en) | Character recognition method, method of processing correction history of character data, and character recognition system | |
CN113011144B (en) | Form information acquisition method, device and server | |
CN111753717B (en) | Method, device, equipment and medium for extracting structured information of text | |
CN109753968A (en) | Generation method, device, equipment and the medium of character recognition model | |
US11468655B2 (en) | Method and apparatus for extracting information, device and storage medium | |
US20200175300A1 (en) | Method and system for optical character recognition of series of images | |
US11727701B2 (en) | Techniques to determine document recognition errors | |
JP6928401B1 (en) | Information processing equipment, information processing methods and information processing programs | |
US10691884B2 (en) | System and method for cheque image data masking using data file and template cheque image | |
KR20220149028A (en) | Method for generating table information based on the image | |
JP2000322417A (en) | Device and method for filing image and storage medium | |
CN106062781A (en) | Image resolution modification | |
CN111079771B (en) | Method, system, terminal equipment and storage medium for extracting characteristics of click-to-read image | |
JP2012190357A (en) | Image processing device, image processing method and program | |
JP6899603B1 (en) | Information processing equipment, information processing methods and information processing programs | |
US20220383023A1 (en) | Information processing apparatus, non-transitory computer readable medium storing program, and information processing method | |
JP4294456B2 (en) | Specific character string search device, specific character string search method, specific character string search program, and recording medium | |
JP2001188640A (en) | Technology for translating non-text display generation data expressing indicator into text variables | |
JP2015138396A (en) | Image processor and image processing program | |
JP2022054812A (en) | Information processing apparatus and computer program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210218 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210218 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20210406 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210629 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210702 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210720 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210730 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6928401 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |