JP2022029077A - 情報処理装置、情報処理方法及び情報処理プログラム - Google Patents

情報処理装置、情報処理方法及び情報処理プログラム Download PDF

Info

Publication number
JP2022029077A
JP2022029077A JP2020132195A JP2020132195A JP2022029077A JP 2022029077 A JP2022029077 A JP 2022029077A JP 2020132195 A JP2020132195 A JP 2020132195A JP 2020132195 A JP2020132195 A JP 2020132195A JP 2022029077 A JP2022029077 A JP 2022029077A
Authority
JP
Japan
Prior art keywords
information
image data
correction
unit
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020132195A
Other languages
English (en)
Other versions
JP6928401B1 (ja
Inventor
正三 中島
Shozo Nakajima
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Double Standard Inc
Original Assignee
Double Standard Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Double Standard Inc filed Critical Double Standard Inc
Priority to JP2020132195A priority Critical patent/JP6928401B1/ja
Application granted granted Critical
Publication of JP6928401B1 publication Critical patent/JP6928401B1/ja
Publication of JP2022029077A publication Critical patent/JP2022029077A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】認識率を向上できる情報処理装置、情報処理方法及び情報処理プログラムを提供すること。【解決手段】本発明に係る情報処理装置は、入力された書類の画像データを2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する補正部と、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部と、を備える。【選択図】図1

Description

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。
従来、OCR(Optical Character Recognition)と呼ばれる画像に含まれる文字を認識する技術が用いられている。画像中の文字の記載箇所や大きさが統一されている場合、OCRによって高い精度で文字を認識し、画像から文字情報を抽出することができる(例えば、特許文献1参照)。
画像中の文字の記載箇所や大きさが統一されている場合、従来のOCR技術によって高い精度で画像から文字情報を抽出することができる。しかしながら、取得する項目が複数ある場合や背景色に違いがある場合、従来のOCR技術では文字を適切に認識することが難しい。
特開2016-126356号公報
本発明は、上記課題に鑑みてなされたものであり、認識率を向上できる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。
上記課題を解決するため、本発明の情報処理装置は、入力された書類の画像データを2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する補正部と、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部と、を備える。
本発明によれば、認識率を向上できる情報処理装置、情報処理方法及び情報処理プログラムを提供することができる。
実施形態に係る情報処理システムの概略構成の一例を示す図である。 実施形態に係るサーバのハード構成の一例を示す図である。 実施形態に係るサーバの記憶装置に記憶されているデータベースの一例を示す図である。 データベースに記憶されている情報の一例を示す図である。 実施形態に係るサーバの機能構成の一例を示す図である。 実施形態に係るユーザ端末のハード構成及び機能構成の一例を示す図である。 実施形態に係るサーバの文字認識処理の一例を示すフローチャートである。 実施形態に係るサーバのOCR処理部による文字認識の一例を示す図である。
以下、本発明の実施形態を図面に基づいて説明する。なお、本実施形態では、文書としてマイナンバーカードを例に実施形態を説明するが、本発明は、マイナンバーカードのほか、マイナンバー通知カード等のマイナンバーを記載した書類、運転免許の他、パスポート(旅券)、住民基本台帳カード、在留カード、住民票などの書類にも利用することができる。また、本実施形態において、テキストには、文字、記号、数値などが含まれる。
[実施形態]
図1は、実施形態に係る情報処理システム1の概要構成の一例を示す図である。情報処理システム1は、サーバ2及びユーザ端末3がネットワーク4を介して接続された構成を有する。なお、情報処理システム1が具備するサーバ2、ユーザ端末3の数は任意である。また、ネットワーク4をどのような通信網で構成するかは任意である。
図2は、本実施形態に係るサーバ2(情報処理装置)のハード構成の一例を示す図である。図2に示すように、サーバ2は、通信IF200A、記憶装置200B及びCPU200Cがバスを介して接続された構成を備える。
通信IF200Aは、外部端末と通信するためのインターフェースである。
記憶装置200Bは、例えば、HDDや半導体記憶装置である。記憶装置200Bには、サーバ2で利用する情報処理プログラムや各種データベースが記憶されている。なお、本実施形態では、情報処理プログラムや各種データベースは、サーバ2の記憶装置200Bに記憶されているが、USBメモリなどの外部記憶装置やネットワークを介して接続された外部サーバに記憶し、必要に応じて参照やダウンロード可能に構成されていてもよい。
図3は、サーバ2の記憶装置200Bに記憶されているデータベースの一例を示す図である。図3に示すように、記憶装置200Bには、補正パタンデータベース1(以下、補正パタンDB1ともいう)、識別用データベース2(以下、識別用DB2ともいう)、項目マスタデータベース3(以下、項目マスタDB3ともいう)、表記変更用データベース4(以下、表記変更用DB4ともいう)が記憶されている。
(補正パタンDB1)
補正パタンDB1は、マイナンバーカードの画像データを補正するための補正パタンが2以上記憶されている。図4(a)は、補正パタンDB1に記憶されている情報の一例を示す図である。図4(a)に示すように、2以上の補正パタンは、それぞれ1以上の補正フィルタを組み合わせて構成されている。例えば、補正パタン1は、補正フィルタ1及び3を組み合わせて構成される。また、補正パタン2は、補正フィルタ1、2及び4を組み合わせて構成される。また、補正パタン3は、補正フィルタ1、2及び3を組み合わせて構成される。また、補正パタン4は、補正フィルタ1、3及び5を組み合わせて構成される。また、補正パタン5は、補正フィルタ1及び4を組み合わせて構成される。なお、各補正パタンに含まれる補正フィルタの数は任意である。
また、補正フィルタ1~補正フィルタ5には、例えば、画像データに含まれるマイナンバーカードの輪郭を強調させるフィルタ、画像データの色調を変化させる2以上のフィルタが少なくとも含まれる。また、その他、補正フィルタ1~補正フィルタ5には、遠近法ワープ(台形補正)、明るさ補正、コントラスト補正、ガウス補正、ぼかし補正、色調補正などのフィルタが含まれる。なお、図4(a)に示す各補正パタンの補正フィルタの組み合わせはあくまで一例であり、各補正パタンをどのような補正フィルタで構成するかは任意である。また、補正フィルタは、補正フィルタ1~補正フィルタ5の5つに限られない。
(識別用DB2)
識別用DB2には、マイナンバーカードを識別するための情報が記憶されている。図4(b)は、識別用DB2に記憶されている情報の一例を示す図である。図4(b)に示すように、識別用DB2には、マイナンバーカードを識別するための情報、例えば、マイナンバーカードに特有のパタンマッチ用データ(画像データや特徴点データ(例えば、印章の画像データや特徴点データなど))やキーワード(KW)が記憶されている。なお、図4(b)に示すパタンマッチ用データやキーワードはあくまで一例であり、マイナンバーカードを識別するための情報として、どのようなパタンマッチ用データやキーワードとするかは任意である。後述の識別部207は、識別用DB2を参照し、画像データにパタンマッチ用データやキーワードが含まれているが否かに基づいて、画像データがマイナンバーカードの画像データであることを識別する。2以上のパタンマッチ用データやキーワードを利用することで画像データがマイナンバーカードの画像データであることを識別する精度の向上が期待できる。
(項目マスタDB3)
項目マスタDB3には、取得する項目と該項目の位置の情報(正規の書式レイアウト情報ともいう)とが記憶されている。本実施形態では、項目マスタDB3には、マイナンバーカードから取得する項目と該項目の位置の情報が記憶されている。マイナンバーカードは、所定の書式に沿って作成されている。このため、マイナンバーカードの書式レイアウトは決まっている。書式レイアウト情報は、マイナンバーカードのどの項目がどの位置(領域)に配置されているかを示す情報である。図4(c)は、項目マスタDB3に記憶されている情報の一例を示す図である。図4(c)に示すように、項目マスタDB3には、マイナンバーカードから取得する項目及び位置の情報が記憶されている。なお、位置の情報は、マイナンバーカードの左上をゼロ点としたXY座標により表され、マイナンバーカードに向かって横方向がX軸(右方向が正)、縦方向がY軸(下方向が正)となっている。なお、座標を表す数値に画素数を利用してもよい。また、マイナンバーカードのどの位置をゼロ点とするかは任意である。また、座標を表す数値に画素数以外の数値を利用してもよい。さらに、マイナンバーカードからどのような項目の情報を取得するかは任意である。
(表記変更用DB4)
表記変更用DB4には、サーバ2が取得したマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更するための情報が記憶されている。具体的には、表記変更用DB4には、ロジック処理用の情報及び第1,第2マスタ処理用の情報が記憶されている。
ロジック処理用の情報は、表記を変更する対象(以下、処理摘要対象ともいう)であるマイナンバーカードの画像データに記載された情報と、該情報の表記を変更する処理ルールとを関連付けた情報である。ロジック処理用の情報は、処理摘要対象と、該処理摘要対象に対する処理ルールとを取得する項目ごとに対応付けた情報であり、該ロジック処理用の情報を参照することで、表記を所定の統一された表記に変更することができる。
第1マスタ処理用の情報は、処理摘要対象であるマイナンバーカードの画像データに記載された情報と、該情報の辞書データによる上書き処理内容とを取得する項目ごとに関連付けた情報である。第1マスタ処理用の情報には、処理摘要対象に辞書データによる上書き処理内容のパタンが種々含まれている。このように、第1マスタ処理用の情報は、誤記となる表記(例えば、変換ミスによる誤記など予め想定される誤記)と、該誤記に対する正しい表記とが取得する項目ごとに対応付けられた情報であり、該第1マスタ処理用の情報を参照することで、誤記を正しい表記に修正することができる。
また、第2マスタ処理用の情報は、マイナンバーカードの画像データに記載された情報に含まれる不要な文字データを削除するための情報である。具体的には、第2マスタ処理用の情報は、マイナンバーカードの画像データに記載された情報と、該情報に含まれる文字の情報である。このように、第2マスタ処理用の情報は、マイナンバーカードの画像データに記載された情報と、該情報に含まれる文字の情報とが取得する項目ごとに対応付けられた情報であり、該第2マスタ処理用の情報を参照することで、該マイナンバーカードの画像データに記載された情報に含まれる文字以外の不要な文字データを認識して、該不要な文字データを削除することができる。
CPU200Cは、サーバ2を制御し、図示しないROM(Read Only Memory)及びRAM(Random Access Memory)を備えている。
図5に示すように、サーバ2は、受信部201、送信部202、記憶装置制御部203、補正部204、除去部205、OCR処理部206、識別部207、取得部208、表記変更部209などの機能を有する。なお、図5に示す機能は、サーバ2のROM(不図示)に記憶された情報処理プログラムをCPU200Cが実行することにより実現される。
受信部201は、外部から送信される情報、例えば、画像データの情報を受信する。
送信部202は、情報を外部へ送信する。
記憶装置制御部203は、記憶装置200Bを制御する。具体的には、記憶装置制御部203は、記憶装置200Bを制御して情報の書き込みや読み出しを行う。
補正部204は、入力されたマイナンバーカードの画像データを補正パタンDB1に記憶されている2以上の補正パタン(各補正パタンには、各々1以上の異なる補正フィルタが含まれている)により補正し、各補正パタンに対応する2以上の補正後の画像データを生成する。具体的には、補正部204は、画像データを補正パタン1で補正した補正後画像データ1を生成する。また、補正部204は、画像データを補正パタン2で補正した補正後画像データ2を生成する。また、補正部204は、画像データを補正パタン3で補正した補正後画像データ3を生成する。また、補正部204は、画像データを補正パタン4で補正した補正後画像データ4を生成する。また、補正部204は、画像データを補正パタン5で補正した補正後画像データ5を生成する。
除去部205は、項目マスタDB3に記憶された正規の書式レイアウト情報に基づいて、マイナンバーカードから取得する項目が配置された第1領域以外の第2領域を画像データから除去する。
OCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化する。具体的には、OCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を所定の項目ごとに読み取り、各補正パタンに対応する2以上の補正後の画像データをテキスト化した各項目の情報のうち、最も多いものを各項目の正式なテキスト化された情報として選択する。
識別部207は、識別用DB2を参照し、マイナンバーカードの画像データを識別する。具体的には、識別部207は、識別用DB2を参照し、パタンマッチ用データやキーワードが存在するか否かに応じて、画像データがマイナンバーカードの画像データであることを識別する。なお、上述したように、識別部207は、2以上のパタンマッチ用データやキーワードを利用して、画像データがマイナンバーカードの画像データであるかを識別してもよい。2以上のパタンマッチ用データやキーワードを利用することで画像データがマイナンバーカードの画像データであることを識別する精度の向上が期待できる。
取得部208は、項目マスタDB3を参照し、項目に対応する文字を、項目ごとに取得する。例えば、取得部208は、OCR処理部206がテキスト化した項目の第1側(本実施形態では右側)に存在する次の項目(次項目)までの文字又は改行までの文字を項目に対応する文字として取得する。また、取得部208は、項目の第1側(本実施形態では右側)の所定範囲内に文字(項目を構成する文字を除く)が存在しない場合、項目の第1側とは異なる第2側(本実施形態では下側)に存在する次の項目(次項目)までの文字又は改行までの文字を、項目に対応する文字をマイナンバーカードの画像データに記載された情報として取得する。なお、取得部208が文字を取得する範囲(どこからどこまで)を画素数に基いて決めておくようにしてもよい。この場合、項目ごとに文字を取得する範囲を定めておくとよい。
表記変更部209は、取得部208で取得されたマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更する。具体的には、表記変更部209は、表記変更用DB4を参照し、表記変更用DB4に記憶されているロジック処理用の情報に基づいて、取得部208で取得されたマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更する。また、表記変更部209は、表記変更用DB4を参照し、表記変更用DB4に記憶されている第1,第2マスタ処理用の情報に基づいて、誤記を正しい表記に修正したり、不要な文字データを認識して、該不要な文字データを削除する。
(ユーザ端末3)
図6は、実施形態に係るユーザ端末3のハード構成及び機能構成の一例を示す図である。図6(a)は、ユーザ端末3のハード構成の一例を示す図、図6(b)は、ユーザ端末3の機能構成の一例を示す図である。ユーザ端末3は、PC(Personal Computer)や携帯端末(例えば、タブレット端末)などである。図6(a)に示すように、ユーザ端末3は、通信IF300A、記憶装置300B、入力装置300C、表示装置300D、CPU300Eなどを備える。
通信IF300Aは、他の装置(実施形態では、サーバ2)と通信するためのインターフェースである。
記憶装置300Bは、例えば、HDD(Hard Disk Drive)や半導体記憶装置(SSD(Solid State Drive))である。記憶装置300Bには、ユーザ端末3の識別子(ID)及び情報処理プログラムなどが記憶されている。なお、識別子は、サーバ2がユーザ端末3に対して新たに付与してもよいし、IP(Internet Protocol)アドレス、MAC(Media Access Control)アドレスなどを利用してもよい。
入力装置300Cは、例えば、キーボード、タッチパネルなどであり、入力装置300Cを操作して、情報処理システム1の利用に必要な情報(例えば、マイナンバーカードの画像データ)を入力することができる。
表示装置300Dは、例えば、液晶モニタや有機ELモニタなどである。表示装置300Dは、情報処理システム1の利用に必要な画面(例えば、マイナンバーカードの画像データを入力するための画面など)を表示する。
CPU300Eは、ユーザ端末3を制御するものであり、図示しないROM及びRAMを備えている。
図6(b)に示すように、ユーザ端末3は、受信部301、送信部302、記憶装置制御部303、操作受付部304、表示装置制御部305などの機能を有する。なお、図6(b)に示す機能は、CPU300Eが、記憶装置300Bに記憶されている情報処理プログラムを実行することで実現される。
受信部301は、サーバ2から送信される情報を受信する。
送信部302は、入力装置300Cを利用して入力された情報に識別子を付与してサーバ2へ送信する。ユーザ端末3から送信される情報に識別子を付与することでサーバ2は、受信した情報がどのユーザ端末3から送信されたものであるかを認識できる。
記憶装置制御部303は、記憶装置300Bを制御する。具体的には、記憶装置制御部303は、記憶装置300Bを制御して情報の書き込みや読み出しを行う。
操作受付部304は、入力装置300Cでの入力操作を受け付ける。例えば、マイナンバーカードの画像データの入力操作を受け付ける。
表示装置制御部305は、表示装置300Dを制御する。具体的には、表示装置制御部305は、表示装置300Dを制御して実施形態に係る情報処理システム1の利用に必要な画面(例えば、マイナンバーカードの画像データを入力するための画面など)を表示させる。
(情報処理方法)
図7は、実施形態に係るサーバの文字認識処理の一例を示すフローチャートである。
(ステップS101)
サーバ2の補正部204は、補正パタンDB1を参照し、文書の画像データを補正する。具体的には、補正部204は、マイナンバーカードの画像データを、補正パタンDB1に記憶されている2以上の補正パタン(各補正パタンには、各々1以上の異なる補正が含まれている)により補正し、各補正パタンに対応する2以上の補正後の画像を生成する。
(ステップS102)
サーバ2のOCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化する。具体的には、OCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を所定の項目ごとに読み取り、各補正パタンに対応する2以上の補正後の画像データをテキスト化した各項目の情報のうち、最も多いものを各項目の正式なテキスト化された情報として選択する。
図8は、OCR処理部206による文字認識の一例を示す図である。図8に示すように、OCR処理部206は、補正部204で生成された各補正パタンに対応する2以上の補正後の画像から文字を認識する。図8に示す例では、補正パタン1、3及び5では、認識結果が「山田太郎」となっている。また、補正パタン2では、認識結果が「山田大郎」となっている。また、補正パタン3では、認識結果が「認識不可」、すなわち文字を認識することができなかったとなっている。OCR処理部206は、2以上の補正後の画像データから認識した文字のうち最も多いもの、図8に示す例では「山田太郎」を選択し、認識した文字として決定する。なお、認識した文字のうち最も多いものがない場合(例えば、補正パタン1~5の判定結果がそれぞれ2、2、2、2、1の場合)は、再度、ステップS102の処理を行ってもよいし、補正パタンを変更してステップS102の処理を行ってもよい、また、読み取れなったとして報知(エラーを出力)するようにしてもよい。
(ステップS103)
サーバ2の識別部207は、識別用DB2を参照し、画像データを識別する。具体的には、識別部207は、識別用DB2を参照し、OCR処理部206で認識された文字に、パタンマッチ用データやキーワードが存在するか否かを判定する。OCR処理部206で認識された文字に、パタンマッチ用データ又はキーワードのいずれか一つが含まれている場合、識別部207は、画像データがマイナンバーカードの画像であることを識別する。
(ステップS104)
サーバ2の取得部208は、項目マスタDB3を参照し、項目に対応する文字を、項目ごとに取得する。例えば、取得部208は、OCR処理部206がテキスト化した項目の第1側(本実施形態では右側)に存在する次の項目(次項目)までの文字又は改行までの文字を項目に対応する文字として取得する。また、取得部208は、項目の第1側(本実施形態では右側)の所定範囲内に文字(項目を構成する文字を除く)が存在しない場合、項目の第1側とは異なる第2側(本実施形態では下側)に存在する次の項目(次項目)までの文字又は改行までの文字を、項目に対応する文字をマイナンバーカードの画像データに記載された情報として取得する。なお、取得部208が文字を取得する範囲(どこからどこまで)を画素数に基いて決めておくようにしてもよい。この場合、項目ごとに文字を取得する範囲を定めておくとよい。
(ステップS105)
表記変更部209は、取得部208で取得されたマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更する。具体的には、表記変更部209は、表記変更用DB4を参照し、表記変更用DB4に記憶されているロジック処理用の情報及び第1,第2マスタ処理用の情報に基づいて、取得部208で取得されたマイナンバーカードの画像データに記載された情報の表記を所定の表記に変更する。また、表記変更部209は、表記変更用DB4を参照し、表記変更用DB4に記憶されている第1,第2マスタ処理用の情報に基づいて、誤記を正しい表記に修正したり、不要な文字データを認識して、該不要な文字データを削除する。
以上のように、本実施形態に係るサーバ2(情報処理装置)は、入力された書類(マイナンバーカード)の画像データを2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する補正部204と、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部206とを備える。このように2以上の補正パタンにより画像データを補正し、補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するので文字の読み取り精度が向上することが期待できる。
また、本実施形態では、補正パタンには、画像データに含まれるマイナンバーカードの輪郭を強調させるフィルタが含まれる。このため、画像データに含まれるマイナンバーカードの位置を認識することができ、項目の読み取り位置をより正確に認識することが期待できる。
また、本実施形態では、補正パタンには、画像データの色調を変化させる2以上のフィルタが含まれる。このため、背景色の異なる領域が存在する場合にも文字の認識精度が向上することが期待できる。
また、本実施形態に係るサーバ2は、OCR処理部206で読み取る情報が記載された第1領域以外の第2領域を画像データから除去する除去部207を備える。このように不要領域を除去した後にテキスト化するため読み取り精度が向上することが期待できる。
また、本実施形態に係るサーバ2のOCR処理部206は、2以上の補正後の画像データに記載された情報を所定の項目ごとに読み取り、各補正パタンに対応する2以上の補正後の画像データをテキスト化した各項目の情報のうち、最も多いものを各項目の正式なテキスト化された情報として選択する。このように2以上の補正パタンによる補正された2以上のデータから多数決方式により、各項目の正式なテキスト化された情報として選択するので読み取り精度が向上することが期待できる。
また、本実施形態に係るサーバ2は、画像データに記載された情報と、該情報の表記を変更する処理ルールとを関連付けた情報を参照し、処理ルールに基づいて、テキスト化された情報の表記を所定の表記に変更する表記変更部209を備える。このようにテキスト化された情報の表記を所定の表記に変更するのでより正確に文字を認識することが期待できる。
また、本実施形態に係るサーバ2の表記変更部209は、画像データに記載された情報と、該情報の辞書データによる上書き処理内容とを関連付けた情報を参照し、処理内容に基づいて、テキスト化された情報の表記を所定の表記に変更する。このようにテキスト化された情報の表記を所定の表記に変更するのでより正確に文字を認識することが期待できる。
また、本実施形態の補正パタンは、各々1以上の異なる補正フィルタが含まれる。このように、各補正パタンには、1以上の異なる補正フィルタが含まれるため種々のフィルタで画像データを処理することになり、より正確に文字を認識することが期待できる。
また、本実施形態に係るサーバ2のOCR処理部206は、マイナンバーカードの正規の書式レイアウト情報に基づき、2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化する。このように、マイナンバーカードの正規の書式レイアウト情報に基づいて情報を読み取るので、より正確に文字を認識することが期待できる。
[実施形態の変形例1]
上記実施形態では、識別部207は、識別用DB2を参照し、OCR処理部206で認識された文字に、マイナンバーカードに特有のパタンマッチ用データやキーワードが存在するか否かを判定し、書類の画像データをマイナンバーカードの画像データであると識別している。
しかしながら、識別用DB2に、マイナンバーカードに含まれていてはいけないパタンマッチ用データ(画像データや特徴点データ(例えば、印章の画像データや特徴点データなど))やキーワード(KW)を記憶し、OCR処理部206で認識された文字に、該含まれていてはいけないパタンマッチ用データやキーワードが含まれている場合、画像データをマイナンバーカードの画像データでないと識別するようにしてもよい。
[実施形態の変形例2]
また、上記実施形態において、書類の種別に応じて異なる処理を行うようにしてもよい。例えば、書類の種別に応じた補正パタンを補正パタンDB1に記憶し、補正部204は、書類の種別に応じた補正パタンにより書類の画像データを補正するようにしてもよい。また、書類の種別だけでなく、書類の種別及び書類の項目ごとに補正パタンを補正パタンDB1に記憶し、補正部204は、書類の種別及び書類の項目に応じた補正パタンにより書類の画像データを項目ごとに補正するようにしてもよい。例えば、書類がマイナンバーカードの場合、氏名や住所の項目の背景色は「ピンク」、転入など備考の項目の背景色は「ブルー」、マイナンバーの項目の背景色は「グレー」となっているが、このようなは池色を考慮した補正パタンを準備し、書類の種別及び書類の項目に応じた補正パタンにより書類の画像データを項目ごとに補正するようにしてもよい。
1 情報処理システム
2 サーバ(情報処理装置)
200A 通信IF
200B 記憶装置
200C CPU
201 受信部
202 送信部
203 記憶装置制御部
204 補正部
205 除去部
206 OCR処理部
207 識別部
208 取得部
209 表記変更部
3 ユーザ端末
300A 通信IF
300B 記憶装置
300C 入力装置
300D 表示装置
300E CPU
301 受信部
302 送信部
303 記憶装置制御部
304 操作受付部
305 表示装置制御部
4 ネットワーク
DB1 補正パタンデータベース
DB2 識別用データベース
DB3 項目マスタデータベース
DB4 表記変更用データベース

Claims (11)

  1. 入力された書類の画像データを2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する補正部と、
    前記2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部と、
    を備えることを特徴とする情報処理装置。
  2. 前記補正パタンには、
    前記画像データに含まれる前記書類の輪郭を強調させるフィルタが含まれる、
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記補正パタンには、
    前記画像データの色調を変化させる2以上のフィルタが含まれる、
    ことを特徴とする請求項1又は請求項2に記載の情報処理装置。
  4. 前記OCR処理部で読み取る情報が記載された第1領域以外の第2領域を前記画像データから除去する除去部を備える、
    ことを特徴とする請求項1乃至請求項3のいずれかに記載の情報処理装置。
  5. 前記OCR処理部は、
    前記2以上の補正後の画像データに記載された情報を所定の項目ごとに読み取り、
    各補正パタンに対応する2以上の補正後の画像データをテキスト化した各項目の情報のうち、最も多いものを各項目の正式なテキスト化された情報として選択する、
    ことを特徴とする請求項1乃至請求項4のいずれかに記載の情報処理装置。
  6. 前記画像データに記載された情報と、該情報の表記を変更する処理ルールとを関連付けた情報を参照し、前記処理ルールに基づいて、前記テキスト化された情報の表記を前記所定の表記に変更する表記変更部を備える、
    ことを特徴とする請求項1に記載の情報処理装置。
  7. 前記表記変更部は、
    前記画像データに記載された情報と、該情報の辞書データによる上書き処理内容とを関連付けた情報を参照し、前記処理内容に基づいて、前記テキスト化された情報の表記を前記所定の表記に変更する、
    ことを特徴とする請求項6に記載の情報処理装置。
  8. 前記補正パタンは、
    各々1以上の異なる補正フィルタが含まれる
    ことを特徴とする請求項1乃至請求項7のいずれかに記載の情報処理装置。
  9. 前記OCR処理部は、
    前記書類の正規の書式レイアウト情報に基づき、前記2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化する、
    ことを特徴とする請求項1乃至請求項8のいずれかに記載の情報処理装置。
  10. 補正部が、入力された書類の画像データを2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する工程と、
    OCR処理部が、前記2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化する工程と、
    を有することを特徴とする情報処理方法。
  11. コンピュータを、
    入力された書類の画像データを2以上の補正パタンにより補正し、各補正パタンに対応する2以上の補正後の画像データを生成する補正部、
    前記2以上の補正後の画像データに記載された情報を読み取り、読み取った情報をテキスト化するOCR処理部、
    として機能させることを特徴とする情報処理プログラム。

JP2020132195A 2020-08-04 2020-08-04 情報処理装置、情報処理方法及び情報処理プログラム Active JP6928401B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020132195A JP6928401B1 (ja) 2020-08-04 2020-08-04 情報処理装置、情報処理方法及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020132195A JP6928401B1 (ja) 2020-08-04 2020-08-04 情報処理装置、情報処理方法及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP6928401B1 JP6928401B1 (ja) 2021-09-01
JP2022029077A true JP2022029077A (ja) 2022-02-17

Family

ID=77456301

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020132195A Active JP6928401B1 (ja) 2020-08-04 2020-08-04 情報処理装置、情報処理方法及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP6928401B1 (ja)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62212871A (ja) * 1986-03-14 1987-09-18 Fujitsu Ltd 文章読み上げ校正装置
JPH10261045A (ja) * 1997-03-17 1998-09-29 Oki Electric Ind Co Ltd 光学式文字読取装置
JPH11353417A (ja) * 1998-06-08 1999-12-24 Oki Electric Ind Co Ltd 光学式文字読取装置
JP2000259765A (ja) * 1999-03-09 2000-09-22 Sumitomo Electric Ind Ltd 文字認識装置
JP2014153939A (ja) * 2013-02-08 2014-08-25 Sansan Inc 名刺管理サーバ、名刺画像取得装置、名刺管理方法、名刺画像取得方法、およびプログラム
JP2017091383A (ja) * 2015-11-13 2017-05-25 京セラドキュメントソリューションズ株式会社 画像形成装置、画像形成方法及び画像形成プログラム
JP2019169026A (ja) * 2018-03-26 2019-10-03 株式会社Pfu 情報処理装置、文字認識エンジン最適化方法及びプログラム
JP2020009323A (ja) * 2018-07-11 2020-01-16 ネオス株式会社 配達顧客管理システム
JP2020095374A (ja) * 2018-12-11 2020-06-18 沖電気工業株式会社 文字認識システム、文字認識装置、プログラム及び文字認識方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62212871A (ja) * 1986-03-14 1987-09-18 Fujitsu Ltd 文章読み上げ校正装置
JPH10261045A (ja) * 1997-03-17 1998-09-29 Oki Electric Ind Co Ltd 光学式文字読取装置
JPH11353417A (ja) * 1998-06-08 1999-12-24 Oki Electric Ind Co Ltd 光学式文字読取装置
JP2000259765A (ja) * 1999-03-09 2000-09-22 Sumitomo Electric Ind Ltd 文字認識装置
JP2014153939A (ja) * 2013-02-08 2014-08-25 Sansan Inc 名刺管理サーバ、名刺画像取得装置、名刺管理方法、名刺画像取得方法、およびプログラム
JP2017091383A (ja) * 2015-11-13 2017-05-25 京セラドキュメントソリューションズ株式会社 画像形成装置、画像形成方法及び画像形成プログラム
JP2019169026A (ja) * 2018-03-26 2019-10-03 株式会社Pfu 情報処理装置、文字認識エンジン最適化方法及びプログラム
JP2020009323A (ja) * 2018-07-11 2020-01-16 ネオス株式会社 配達顧客管理システム
JP2020095374A (ja) * 2018-12-11 2020-06-18 沖電気工業株式会社 文字認識システム、文字認識装置、プログラム及び文字認識方法

Also Published As

Publication number Publication date
JP6928401B1 (ja) 2021-09-01

Similar Documents

Publication Publication Date Title
US7623710B2 (en) Document content and structure conversion
KR101027851B1 (ko) 이미지-기반 문서 인덱싱 및 검색
US8131081B2 (en) Image processing apparatus, and computer program product
JP4461769B2 (ja) 文書検索・閲覧手法及び文書検索・閲覧装置
CN113011144B (zh) 表单信息的获取方法、装置和服务器
CN111753717B (zh) 用于提取文本的结构化信息的方法、装置、设备及介质
CN109753968A (zh) 字符识别模型的生成方法、装置、设备及介质
US11023764B2 (en) Method and system for optical character recognition of series of images
CN106648569B (zh) 目标序列化实现方法和装置
US11727701B2 (en) Techniques to determine document recognition errors
KR20210128907A (ko) 정보 추출 방법, 장치, 기기 및 저장 매체
CN114495146A (zh) 图像文本检测方法、装置、计算机设备及存储介质
JP6928401B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
KR20220149028A (ko) 이미지 기반 테이블 정보 생성 방법
CN105096239A (zh) 图像配准方法及其装置以及图像拼接方法及其装置
CN101261684B (zh) 图像处理方法、图像处理装置及图像形成装置
CN111079771B (zh) 点读图像的特征提取方法、系统、终端设备及存储介质
CN112101356A (zh) 一种图片中特定文本的定位方法、装置及存储介质
JP2012190357A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2021018520A (ja) 情報処理装置、情報処理方法及びプログラム
US20210319273A1 (en) Information processing apparatus, non-transitory computer readable medium, and character recognition system
US20220383023A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method
US20210056301A1 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JP4294456B2 (ja) 特定キャラクタ列検索装置、特定キャラクタ列検索方法、特定キャラクタ列検索プログラム、および記録媒体
AU2021412659A9 (en) Architecture for digitalizing documents using multi-model deep learning, and document image processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210218

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210218

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210406

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210720

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210730

R150 Certificate of patent or registration of utility model

Ref document number: 6928401

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350