JP7197042B1 - 教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム - Google Patents

教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム Download PDF

Info

Publication number
JP7197042B1
JP7197042B1 JP2022044268A JP2022044268A JP7197042B1 JP 7197042 B1 JP7197042 B1 JP 7197042B1 JP 2022044268 A JP2022044268 A JP 2022044268A JP 2022044268 A JP2022044268 A JP 2022044268A JP 7197042 B1 JP7197042 B1 JP 7197042B1
Authority
JP
Japan
Prior art keywords
data
image data
document
simulated
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022044268A
Other languages
English (en)
Other versions
JP2023137859A (ja
Inventor
広宣 渡邊
慧人 後上
なな 森山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toppan Inc
Original Assignee
Toppan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toppan Inc filed Critical Toppan Inc
Priority to JP2022044268A priority Critical patent/JP7197042B1/ja
Application granted granted Critical
Publication of JP7197042B1 publication Critical patent/JP7197042B1/ja
Publication of JP2023137859A publication Critical patent/JP2023137859A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)

Abstract

【課題】本開示は、申請用書類に関する教師データの生成を効率的且つ簡便に生成する行うことができ、審査効率を向上させることができる教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラムを提供することを目的とする。【解決手段】教師データ自動生成装置(情報処理装置100)は、機械学習に用いられる教師データを自動で生成する教師データ自動生成装置であって、申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データ7および、申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リスト410を記憶する生成用データ記憶部41と、雛形画像データ7と模擬固有情報リスト410に含まれる模擬固有情報データとに基づいて申請用書類を模した模擬書類画像を示す模擬書類画像データ70を生成し、模擬書類画像データ70を用いて教師データを生成する教師データ自動生成部40と、を備える。【選択図】図2

Description

本開示は、教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラムに関する。
従来、例えば自治体に対する申請の際に、自治体において申請者からの申請用書類の受け付け及び申請用書類等の内容に不備があるか否かの審査が行われている。自治体は、例えば一申請者から申請書とともに本人確認書類の写しや申請内容の確認のための証明書類等の複数種類の書類を受け取り、これら複数の書類を対比して申請内容に不備がないかどうかの審査を行っている。同様の処理は、民間企業に対するサービス等の申し込みにおいても行われている。このとき、これら複数種類の申請用書類は紙媒体であることから、申請情報の確認作業や確認結果の入力作業の効率が悪くなる場合がある。そこで、例えば審査の前処理として、申請用書類をスキャナ等で読み取り、記入された文字を自動でデータ化して記憶装置に記憶することが行われる場合がある(例えば、特許文献1)。
特開2018―101327号公報
しかしながら、審査業務の種類は多様化しており、審査によっては膨大な確認事項が生じ、また、確認事項によって参照する申請用書類の組み合わせが異なる場合もある。このため、申請用書類を画像データ化しても、確認事項ごとに必要な申請用書類データを表示させる手間がかかり、審査効率が向上しない場合がある。
審査効率を向上するためには、例えば画像データ化した申請用書類(申請画像データ)に対し、申請用書類の種類や提出時の状態、確認事項等に応じた適切な画像処理を行うことが求められる。近年では、審査業務のデジタル化の進行に伴い、申請画像データの画像処理にAI技術を用いることへのニーズが高まっている。AI技術による申請画像データの画像処理では、申請画像データを用いた学習済みモデルの構築が前提となる。このため、予め多くの申請画像データを収集して機械学習(例えば教師あり学習)に用いる教師データを生成することが必要となる。
しかしながら、機械学習の教師データの生成には大量の申請画像データが必要であり、申請画像データの収集には多大な時間を要する。したがって、申請画像データの収集を待って学習済みモデルの構築を行うと非常に長い期間が必要となるため、結果として審査業務へのAI技術の適用により審査効率を向上することが困難であるという問題がある。
さらに、申請用書類には個人情報が含まれる場合があり、中でも本人確認書類は身分を証明するものである。このため、機械学習の教師データとして用いる大量の申請画像データを収集すること自体が困難である。また教師データの生成のために、オペレータの入力操作などにより申請用書類を作成して画像データ化し、さらに当該画像データにメタデータを付与して画像処理に係る画像情報の意味づけ(アノテーション)を行う場合、多大な時間と労力が生じる。このため、申請画像データの画像処理へのAI技術の適用による審査効率の向上が十分に実現できていない。
そこで、本開示は、申請用書類に関する教師データを効率的且つ簡便に生成することができ、審査効率を向上させることができる教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラムを提供することを目的とする。
上記目的を達成するために、本開示の一態様に係る教師データ自動生成装置は、機械学習に用いられる教師データを自動で生成する教師データ自動生成装置であって、申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データおよび、前記申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リストを記憶するデータ記憶部と、前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを含んで構成される前記教師データを生成する生成部と、を備えることを特徴とする。
また上記目的を達成するために、本開示の他の一態様に係る教師データ自動生成装置は、機械学習に用いられる教師データを自動で生成する教師データ自動生成装置であって、申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データおよび、前記申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リストを記憶するデータ記憶部と、前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを用いて前記教師データを生成する生成部と、を備え、前記データ記憶部には、前記申請用書類が転写された転写紙の背景領域を模した背景画像を示す背景画像データが記憶され、前記生成部は、前記背景画像に対し前景画像として前記模擬書類画像データが示す模擬書類画像を合成し、前記教師データを構成する画像データとして転写書類学習画像データを生成することを特徴とする。
また、上記目的を達成するために、本開示の一態様に係る教師データ自動生成方法は、コンピュータが、機械学習に用いられる教師データを自動で生成する教師データ自動生成方法であって、申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データおよび、前記申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リストを記憶し、前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを含んで構成される前記教師データを生成することを特徴とする。
また、上記目的を達成するために、本開示の一態様に係る教師データ自動生成プログラムは、申機械学習に用いられる教師データを自動で生成する教師データ自動生成プログラムであって、申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データおよび、前記申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リストを記憶することと、前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを含んで構成される前記教師データを生成することと、をコンピュータに実行させることを特徴とする。
本開示によれば、申請用書類に関する教師データの生成を効率的且つ簡便に行うことができ、審査効率を向上させることができる教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラムを提供することができる。
本開示の一実施形態に係る教師データ自動生成装置を含む情報処理システムの一構成例を示す模式図である。 本開示の一実施形態に係る教師データ自動生成装置を含む情報処理システムの機能構成の一例を示す概略的な機能ブロック図である。 本開示の一実施形態における雛形画像データのうち免許証の雛形を示す画像データの一例を示す模式図である。 本開示の一実施形態における模擬固有情報リストの一例を示す模式図である。 本開示の一実施形態における模擬書類画像データの一例を示す模式図である。 本開示の一実施形態における背景画像データの一例を示す模式図である。 本開示の一実施形態における転写書類学習画像データの一例を示す模式図である。 本開示の一実施形態における転写書類学習画像データの他の例を示す模式図である。 本開示の一実施形態における転写書類学習画像データのさらに他の例を示す模式図である。 本開示の一実施形態における領域抽出データについて説明する図である。 本開示の一実施形態に係る教師データ自動生成装置のハードウェア構成の一例を示す概略図である。 本開示の一実施形態に係る教師データ自動生成装置で実行される教師データ自動生成方法を説明するフローチャートである。 本開示の一実施形態の第一変形例に係る教師データ自動生成方法を説明するフローチャートである。 本開示の一実施形態の第二変形例における撮影書類学習画像データの一例を示す模式図である。 本開示の一実施形態の第二変形例における撮影背景画像データの一例を示す模式図である
以下、図面を参照して本開示の実施の形態を説明する。ただし、以下に説明する実施形態は、あくまでも例示であり、以下に明示しない種々の変形や技術の適用を排除する意図はない。本開示は、その趣旨を逸脱しない範囲で種々変形(例えば各実施形態を組み合わせる等)して実施することができる。また、以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付して表している。
また、以下の教師データ自動生成装置は、汎用のコンピュータなどの情報処理端末装置であるハードウェアと、コンピュータプログラムであるソフトウェアとの協働によって実現される。コンピュータプログラムは、教師データ自動生成装置が備える一又は複数のプロセッサによって読み取り可能であり、ハードディスクにインストールされることによりプロセッサが教師データ自動生成装置の各部として機能する。
以下、本実施形態に係る教師データ自動生成装置と、教師データ自動生成装置で実行される画像処理方法及び画像処理プログラムについて、図1から図12を参照して説明する。
1.情報処理システムの全体構成
図1に示すように、情報処理システム1は、申請者から申請された申請情報を取得し、申請内容の審査を行うための申請情報処理システムとして用いられる。図1では、情報処理システム1の一例として、自治体の内部システムとして申請者からの申請手続きを受け付け、審査担当者による審査の結果を得る申請情報処理システムを図示している。なお、この情報処理システム1は、自治体から依頼を受けた企業等のシステムであっても良いし、サービスの申込者からの申請手続(申込手続)を受け付ける企業の内部システムであっても良い。
情報処理システム1は、自治体内部又は外部の印刷部門のシステムと接続され、印刷装置によって情報処理システム1からの出力に応じた通知状等の印刷物を作成することができる。また、情報処理システム1は、銀行のシステムと接続され、審査に応じた振込等を行ってもよい。
図2は、情報処理システム1の機能構成の一例を示す概略的な機能ブロック図である。
図2に示すように、申請情報処理システムである情報処理システム1は、情報処理装置100を含んで構成される。情報処理装置100は、申請者から申請された申請情報を取得し、申請内容の審査を行うための申請情報処理装置として機能する。情報処理装置100では、例えば紙媒体の申請用書類を画像データ化した申請画像データに対してAI技術による画像処理を行い、審査に適した画像データを生成することができる。
また本実施形態において情報処理装置100は、教師データ自動生成部40を備えている。これにより、情報処理装置100は、上述の画像処理向けの学習済みモデルの構築に用いる教師データを自動で生成する教師データ自動生成装置として機能する。すなわち、情報処理装置100は、本実施形態に係る教師データ自動生成装置に相当する。
申請者からの申請手続きを受け付ける場合、審査機関である自治体や企業は、申請者が郵送や当該審査機関に訪問する等の方法により紙媒体の申請用書類を受け付けたり、インターネットを介して申請者から申請用書類を受け付けることができる。本実施形態では、一例として、申請者が郵送や自治体に訪問する等の方法により紙媒体の申請用書類を提出した場合のシステム構成および情報処理装置100について説明する。
2.情報処理装置の機能構成
図2に示すように、情報処理装置100(教師データ自動生成装置の一例)は、例えばコンピュータである。図2に示す各機能ブロックは、後に図11で説明する演算装置10のプロセッサ101が必要なプログラムを実行し、情報処理装置100の各部の動作を制御することにより実現される。
本実施形態に係る教師データ自動生成装置である情報処理装置100は、申請情報取得部11、記憶部12、審査部13、表示データ出力部14、データ出力部15、画像処理部30、審査画像記憶部31、教師データ自動生成部40、生成用データ記憶部41および教師データ記憶部42を有している。また、情報処理装置100は、外部装置であるスキャナ等の読取装置51、キーボードやマウス等の入力装置52、液晶ディスプレイ等の表示装置53およびコンピュータ54と接続されている。
コンピュータ54は、教師データ自動生成部40が生成した教師データに基づいて、上述の画像処理向けの学習済みモデルの構築を行う所定のコンピュータ装置である。コンピュータ54は、ネットワーク3を経由して情報処理装置100と通信可能なサーバ装置(クラウドサーバ、又はオンプレミスサーバ)であってもよいし、汎用のコンピュータ装置(例えばパーソナルコンピュータ)であってもよい。
コンピュータ54は、学習処理部(不図示)が学習用プログラムを実行することにより、教師データ自動生成部40が生成した教師データを用いて上述の画像処理向けの学習済みモデルを構築(生成)する。コンピュータ54の学習処理部は、例えば学習モデルに対して、教師データ自動生成部40が生成した教師データを用いた教師あり学習を行い、学習済みモデルを生成する。学習モデルとしては三層(入力層、中間層、出力層)を備えたニューラルネットワークを用いても良いが、より多層のニューラルネットワークを用いた、いわゆるディープラーニングの手法を用いてもよい。また、コンピュータ54の学習処理部はサポートベクターマシン、ランダムフォレスト、ロジスティック回帰、決定木又はk近傍法等の他の学習モデルを用いた機械学習を行うように構成してもよい。コンピュータ54では、生成した学習済みモデルが所定の記憶領域に記憶され、さらに当該学習済みモデルの複製(コピー)がネットワーク3を介して情報処理装置100に出力される。
情報処理装置100は、出力された学習済みモデルを取得すると、所定の記憶領域に画像処理向けの学習済みモデルМとして記憶する。これにより画像処理部30は、学習済みモデルМを用いて審査用画像データを自動生成することができ、AI技術による精度の高い画像処理が可能となる。
なお、コンピュータ54による学習済みモデルの生成機能を、情報処理装置100の一機能ブロックで実行するように構成されていてもよい。これにより、例えば教師データの追加時等における学習済みモデルの追加学習の結果を速やかに適用することができる。
また情報処理装置100は、上述の各装置類の他に、所定の審査サーバと接続されていてもよい。審査サーバは、例えば情報処理装置100(特に、画像処理部30)が生成した画像データに基づいて、申請内容の審査を行うサーバ装置である。審査サーバは、例えば情報処理装置100が生成した画像データに対するOCR(Optical Character Recognition)処理の結果に基づいて申請内容の審査(自動審査)を行うサーバ装置であってもよい。また、審査サーバはOCRエンジンとしてAI技術を適用したAI-OCRエンジンを有していてもよい。この場合、審査サーバは開放されたネットワーク環境(クラウド環境)に設けられたクラウドサーバであることが好ましい。これにより、AI-OCRエンジンが多くのデータから学習することができ、OCR処理結果の精度を向上させることができる。
また、読取装置51、入力装置52及び表示装置53は、情報処理装置100の一部として設けられていても良い。
以下、各機能ブロックについて説明する。
[申請情報取得部]
申請情報取得部(画像取得部の一例)11は、申請者からの申請用書類を電子データ化した申請画像データを取得するインタフェースである。情報処理装置100は、図2に示すように、申請情報が記入された申請用書類を読み取って申請用書類を電子データ化し、申請画像データを作成するスキャナ等の読取装置51と接続されている。
申請画像データは、申請者が提出した紙媒体による申請書類(申請書や証明書類等)の画像データであり、申請者の申請情報を含んでいる。
申請者から提出される申請用書類は、複数種類の属性に分類される。本実施形態における申請用書類の属性としては、例えば申請者の情報を含む(申請情報が記入された)申請書や、申請書に添付された証明書類が挙げられる。ここで、申請者には申請者本人だけでなく、申請者の家族等が含まれる場合もある。証明書類は、例えば申請者(申請者及び申請者の家族等)の本人確認書類の写しや申請内容の確認のための証明書類等である。例えば証明書類が示す本人確認書類は、免許証、保険証、および領収書等であって。証明書類は、これらの本人確認書類の写しである。領収書の写しは、例えば本人確認等のための補助書類として他の本人確認書類の写し(免許証や保険証の写し)と併せて提出されるものであり、例えば電気・水道・ガス等の公共料金領収書や、レシート等の写しである。なお上述のように申請者が提出する証明書類は、本人確認書類(例えば免許証、保険証、領収書等)を示す「写し」であるが、以下理解を容易にするため、証明書類の種類について単に「免許証」、「保険証」、「領収書」と記載する場合がある。
なお、証明書類は、申請書の添付書類として扱われる。添付書類には、上述の証明書類の他に、例えば請求書や注文書のような各種帳票が含まれる場合がある。
申請用書類がスキャナ等の読取装置51によって読み取られることで申請画像データが生成される場合、申請画像データは、画像情報として申請者の申請情報を含んでいる。
このように、本実施形態において申請情報取得部11は、申請画像データは、申請者が提出した申請用書類のうち申請者の申請情報を含む申請書及び申請者の証明書類の少なくとも一方の属性の申請書類の画像データである申請画像データを取得する。
読取装置51において申請画像データが生成されると、生成された申請画像データを申請情報取得部11に出力する。申請情報取得部11は、読取装置51から入力された申請画像データを取得すると、記憶部12に出力する。これにより、記憶部12に申請画像データが記憶される。
なお、申請情報取得部11が取得する申請画像データは、読取装置51から出力されたものに限られない。例えば、読取装置51は記憶部12に申請画像データを出力し、記憶部12に記憶された申請画像データを申請情報取得部11が取得する構成でもよい。
また申請画像データは、例えば情報処理装置100に接続された画像データ取得用のコンピュータ装置(不図示)から出力され、申請情報取得部11が取得したものでもよい。画像取得用のコンピュータ装置は、読取装置51と同様に申請用書類を読み取って申請画像データを作成して出力する、スキャナ等の読取装置と接続されていればよい。画像取得用のコンピュータ装置は当該読取装置から出力された申請画像データを取得すると、取得した申請画像データを情報処理装置100に出力する。これにより、申請情報取得部11は、画像取得用のコンピュータ装置から申請画像データを取得することができる。なお、画像取得用のコンピュータ装置が出力した申請画像データは、記憶部12に記憶され、申請情報取得部11が記憶部12から申請画像データを読み込んでもよい。
このように、情報処理装置100(特に申請情報取得部11)は、読取装置51と接続されていない構成であってもよい。
[記憶部]
記憶部12は、申請情報取得部11が取得した申請画像データと、申請者を示す申請者情報とを関連付けて記憶する。
また、記憶部12は、申請用書類の審査を行う審査担当者等によって、キーボード等の入力装置52を介して入力された情報を記憶する。例えば、後述するように、審査部13は、例えば「本人確認書類の氏名を確認して入力してください」「本人確認書類の氏名が申請書と一致しているか確認してください」等の審査項目が表示された審査画面61を表示装置53に表示し、審査担当者に文字入力やチェックリストの選択等による審査結果を入力させる。記憶部12は、入力装置52を介して審査担当者により入力された審査結果を示す情報を記憶する。また、記憶部12は、入力装置52を介して入力された、各申請データに対応する属性情報(例えば、申請者を示す情報等)を記憶する。
また、記憶部12は、画像処理部30における画像処理において参照される種々の情報を記憶する。また記憶部12は、申請画像データや申請者を示す申請者情報と、画像処理部30が生成した審査用画像データとを関連付けて記憶する。これにより、情報処理装置100において、審査用画像データがいずれの申請者の審査案件に関連するデータであるか、また審査用画像データがいずれの申請画像データから生成されたものであるか、を特定することができる。
[審査部]
審査部13は、申請画像データの内容、すなわち申請用書類の内容を審査するための審査項目が表示された審査画面を生成し、審査画面と申請画像データに基づく審査用画像データとを表示装置53に並べて表示させ、審査結果を取得して記憶部12に記憶させる機能を有している。申請書類の内容の確認は、審査担当者による審査画面及び審査用画像データの目視によって行われるため、当該機能による審査を目視審査ともいう。
より具体的に、審査部13は、審査画面の電子データ(審査画面データ)を生成し、審査の際に、審査担当者によって入力装置52から入力された情報(例えば、審査担当者が入力した審査結果)を取得する入力データを取得する。
また、審査部13は、審査画面の電子データと、入力された審査結果に対応する入力データとを合成して、表示装置53に表示させる。審査部13は、例えばマウスを用いてラジオボタンがチェックされた際のカーソルの位置に応じて、審査画面において対応するラジオボタンが選択表示された状態の審査画面の表示画面データを生成する。同様に、審査部13は、チェックボックスにチェックマークが表示されたり、テキストボックスに文字や数字が入力表示された状態の審査画面の表示画面データを生成してもよい。
審査部13は、各審査項目に対する審査結果に対応する入力データ(入力装置52から入力された情報)を取得する。審査部13は、一の審査用画像データに対する全審査項目に対する審査結果に対応する入力データを取得し、一の審査用画像データ(すなわち一申請者)に対する審査データを生成する。
審査部13は、審査データを各申請画像データ(各申請者)と紐づけて記憶部12に出力して記憶させる。
[画像処理部]
画像処理部30は、機械学習された学習済みモデルМを用いて申請画像データに対する画像処理を行い、審査部13における申請情報(申請画像データ)の内容の審査に用いる審査用画像データを生成する。例えば画像処理部30は、審査用画像データとして、審査部13が審査画面と並べて表示装置53に表示する画像データ(目視審査向けの審査用画像データ)を申請画像データから生成する。また情報処理装置100が審査サーバと接続されている場合、画像処理部30は、審査サーバに出力される画像データ(後述する自動審査向けの審査用画像データ)を申請画像データから生成可能である。
画像処理部30は、生成した審査用画像データを審査画像記憶部31に出力して保存する。
[審査画像記憶部]
審査画像記憶部31は、画像処理部30が生成した審査用画像データを記憶する。具体的には、審査画像記憶部31は、審査用画像データをファイル形式で記憶する所定の記憶領域である。画像処理部30は、審査用画像データを生成すると審査画像記憶部31に審査用画像データを出力して、審査画像記憶部31に記憶させる。
またこのとき画像処理部30は、審査画像記憶部31内における審査用画像データの保存先(例えばディレクトリ、フォルダ)を示す保存先データを生成し、申請情報取得部11が取得した申請画像データおよび申請者情報の少なくとも一方と関連付けて記憶部12に記憶する。保存先データは、例えばファイルパスやURL(Uniform Resource Locator)であってもよい。これにより、例えば審査部13は、審査画面の生成時において、申請画像データに対応する審査用画像データを取得し、審査画面と審査用画像データとを並べて表示装置53に表示することができる。
[教師データ自動生成部]
教師データ自動生成部40は、生成用データ記憶部41に記憶されたデータに基づいて機械学習に用いられる教師データを自動で生成し、生成した教師データを教師データ記憶部42に出力して保存する。教師データ自動生成部40は、画像処理部30が申請画像データの画像処理に用いる学習済みモデル構築のための教師データ(アノテーションが行われた学習用画像データ)を生成する。教師データ自動生成部40および教師データの詳細は、後述する。
[生成用データ記憶部]
生成用データ記憶部(データ記憶部の一例)41は、教師データの生成に用いる各種データを記憶する。生成用データ記憶部41に記憶される各種データの詳細は、後述する。
[教師データ記憶部]
教師データ記憶部42は、教師データ自動生成部40が生成した教師データを記憶する。教師データ記憶部42は、アノテーションされた学習用画像データである教師データをファイル形式で記憶する所定の記憶領域である。教師データ自動生成部40は、教師データを生成すると教師データ記憶部42に教師データを出力して記憶させる。
またこのとき教師データ自動生成部40は、教師データ記憶部42における教師データの保存先(例えばディレクトリ、フォルダ)を示す保存先データを生成し、教師データの種類と関連付けて記憶部12に記憶してもよい。保存先データは、例えばファイルパスやURL(Uniform Resource Locator)であってもよい。
[表示データ出力部]
表示データ出力部14は、審査部13が生成した表示データおよび画像処理部30が生成した審査用画像データを表示装置53に出力する。
[データ出力部]
データ出力部15は、入力装置52からの指示に応じて、記憶部12に記憶された申請画像データに対応する審査データを情報処理装置100の外部に出力する。審査データは、例えば、申請者が申請を行った手続き(例えば給付金等の受給手続き)の内容と、各申請者の申請内容の審査結果(例えば可決又は否決)の一覧が含まれる。データ出力部15は、指定された一又は複数の申請者に対する審査データを出力してもよく、記憶部12に記憶されたすべての審査データを一括して出力しても良い。
また、データ出力部15は、画像処理部30から審査用画像が入力されたことに応じて、入力された審査用画像を情報処理装置100の外部に出力してもよいし、審査画像記憶部31に記憶された審査用画像データを読み込んで、情報処理装置100の外部に出力してもよい。
データ出力部15は、通信インタフェース又は外部インタフェースとして機能して、インターネット又はLAN(Local Area Network)等のネットワーク3を介して接続された所定のコンピュータ、その他の外部記憶装置又は外部記憶媒体に審査データを出力する。
データ出力部15は、例えばLANを介して接続された自治体内の所定のコンピュータ等に審査データを出力することができる。また、データ出力部15は、インターネットを介して接続された外部の所定のコンピュータ等に審査データを出力することもできる。このため、情報処理システム1は、自治体の内部で運用されてもよく、自治体から審査を請け負った外部企業において運用されても良い。情報処理システム1が外部企業において運用される場合、当該企業は、申請書の受付、申請データの作成、審査、審査データの作成等を行い、審査データ、又は申請データ及び審査データの双方をインターネットを介して自治体に送信することができる。
また、データ出力部15は、ネットワーク3を介して接続されたコンピュータ54(学習済みモデルの生成装置)に教師データ記憶部42に記憶された教師データを出力することができる。これにより、コンピュータ54において、教師データ自動生成部40が生成した教師データに基づいて、申請画像データの画像処理向けの学習済みモデルを構築することができる。例えばデータ出力部15は、記憶部12に記憶された教師データの種類に紐づく教師データの保存先に基づいて教師データ記憶部42から所望の教師データを読み出し、コンピュータ54に読み出した教師データを出力する。これにより、所望の教師データに基づいて、コンピュータ54において申請画像データの画像処理向けの学習済みモデルが構築される。
またデータ出力部15は、例えばインターネットを介して接続された審査サーバに審査用画像データを出力することができる。これにより、審査サーバにおいて、例えばOCR技術を用いて審査用画像データの画像情報(申請書や証明書類の内容)の文字情報を読み取り、審査担当者の目視によらない申請用書類(申請書、証明書類等)の内容の審査、すなわち自動審査を実施することができる。
つまり、情報処理装置100は、審査サーバと接続されている場合には、申請用書類の内容の審査として、上述の目視審査と自動審査との2種類の種別の審査を実施することができる。なお、本実施形態において情報処理装置100と審査サーバとの接続は必須ではなく、情報処理装置100は審査サーバと接続されていてもよいし、接続されていなくてもよい。つまり、情報処理装置100は自動審査を実行せずに目視審査のみを実行可能に構成されていてもよい。したがって、画像処理部30は少なくとも目視審査向けの審査用画像データを生成すればよい。
(1.1)教師データ自動生成部における教師データ自動生成処理
次に、本実施形態に係る教師データ自動生成装置である情報処理装置100において、教師データ自動生成部40が実行する教師データ自動生成処理の詳細及び教師データ自動生成処理を実行する機能構成について、図2から図10を用いて詳細に説明する。
図2に示すように、教師データ自動生成部40は、教師データを構成する学習用画像データを生成する画像データ生成部401と、学習用画像データ内の画像情報に対する注釈データ(メタデータ)の付与による意味づけ、すなわちアノテーションを行う注釈データ付与部402と、を有している。教師データ自動生成部40は、画像データ生成部401が生成した学習用画像データに対して、注釈データ付与部402がアノテーションを行うことにより、教師データ生成することができる。生成された教師データは教師データ記憶部42に記憶され、データ出力部15によりネットワーク3を介してコンピュータ54に出力される。これにより、教師データ自動生成部40の生成した教師データに基づく機械学習が実行されて、申請画像データの画像処理向けの学習済みモデルが構築される。
(画像データ生成部)
画像データ生成部401は、生成用データ記憶部41に記憶されている教師データ生成用の各種データに基づいて、申請者が提出する申請用書類(申請書や、本人確認書類等の証明書類)を模した模擬書類画像を示す模擬書類画像データを生成する。模擬書類画像データは申請用書類を模した内容の画像情報を含んでおり、画像データ生成部401はこの模擬書類画像データを用いて、学習用画像データを生成する。模擬書類画像データは、申請用書類の雛形(テンプレート)を示す画像データに、申請用書類の内容を模した文字情報を示すデータ(文字列データ)を適用して生成される。
ここで、画像データ生成部401による模擬書類画像データの生成について、図3から図5を用いて具体的に説明する。
まず、生成用データ記憶部41に記憶されている教師データの生成用のデータについて説明する。生成用データ記憶部41には、例えば模擬書類画像データに生成に用いるデータとして、模擬書類画像データの生成に用いる画像データである雛形画像データが記憶されている。
〔雛形画像データ〕
雛形画像データは、申請内容の審査のために申請者が提出する申請用書類の雛形(テンプレート)を示す画像データである。ここで、雛形画像データについて、本人確認に用いる証明書類の雛形を示す雛形画像データを例にとって説明する。
図3は、生成用データ記憶部41が記憶する雛形画像データの一例を示す模式図である。図3では、雛形画像データの一例として証明書類が示す本人確認書類のうち免許証の雛形を示す雛形画像データ7を図示している。
雛形画像データ7は、申請画像データのうち読取装置51で読取られた証明書類が示す本人確認書類(本例では、免許証)の画像データから、固有情報を除いた画像データに相当する。ここで固有情報とは、各申請用書類に固有の情報であって、例えば氏名、住所、生年月日等の個人情報を含んでいる。本例のように、申請用書類が証明書類の場合、固有情報には証明書類の証明内容に関する情報(証明内容情報)が含まれる。
証明内容情報としては、証明書類が示す本人確認書類の有効年月日や交付日(発行日)、証明書類が示す本人確認書類に割り振られた固有の番号(例えば免許証番号)、証明書類が示す本人確認書類の発行者を示す情報等が想定される。つまり、証明書類における固有情報とは、個人情報と証明内容情報とを含んで構成される情報である。
図3に示すように、雛形画像データ7の画像領域には、免許証における固有情報の項目を示す画像情報を含む証明項目領域723が含まれている。具体的には、雛形画像データ7には、本人確認書類である免許証に含まれる固有情報に応じて多種多様な証明項目領域723(723a~723f)、および各証明内容領域724(724a~724f)が含まれている。
例えば、雛形画像データ7において、証明項目領域の一例である証明項目領域723aには証明書類の固有情報(ここでは、免許証に含まれる個人情報)の種類として「氏名」という文字列の画像情報が含まれている。また、証明項目領域723bには、固有情報(個人情報)の種類として生年月日を表す「生(うまれ)」という文字列の画像情報が含まれている。また、証明項目領域723cには、固有情報(個人情報)の種類として「住所」という文字列の画像情報が含まれている。また証明項目領域723dには、固有情報(ここでは、免許証に含まれる証明内容情報)の種類として交付日を表す「交付」という文字列の画像情報が含まれている。また、証明項目領域723eには固有情報(証明内容情報)の種類として有効年月日を表す「まで有効」という文字列の画像情報が含まれ、証明項目領域723fには固有情報(証明内容情報)の種類として免許証番号を示す「番号」という文字列の画像情報が含まれている。
また図3に示すように、雛形画像データ7の画像領域には、証明書類における固有情報の内容(項目に対応する固有情報の内容)を示す画像情報が適用される証明内容領域724が含まれている。具体的には、雛形画像データ7には、免許証に含まれる固有情報の項目に対応する証明内容領域724(724a~724f)が含まれている。
雛形画像データ7は、免許証の雛形を示す画像データであるため、固有情報の内容を示す画像情報は含まれない。したがって、雛形画像データ7における証明内容領域724(724a~724f)には固有情報の内容を示す画像情報が含まれず、空白(ブランク)の画像領域となっている。詳しくは後述するが、証明内容領域724には、模擬書類画像データの生成時において、画像データ生成部401によって固有情報を模した内容の文字情報(後述する図4の模擬固有情報リスト内のデータ)を示す画像情報が適用される。例えば、証明内容領域724aには、証明項目領域723aに対応する固有情報の内容として所定の人物の氏名を表す画像情報が適用される。
なお、実際の免許証には、上述した他にも固有情報に応じた証明項目領域および証明内容領域が含まれ得るが、本例では理解を容易にするため、多くの項目領域および内容領域のうちの一部に符号を付して図示している。
また、図3に示すように、本例では免許証の顔写真の領域に相当する画像領域である写真領域725には、所定の写真画像(例えば、使用許可を得た所定の顔写真画像や、合成技術により作成した架空の顔写真画像)を適用することができる。なお写真領域725は、雛形画像データでは空白(ブランク)の画像領域としてもよいが、実際の免許証との類似性を向上する観点では、少なくとも模擬書類画像データの生成時に写真画像を適用することが好ましい。
本例では、申請用書類のうち証明書類の雛形画像データ7として定型書類に相当する免許証の雛形を示す画像を例示したが、本開示における雛形画像データはこれに限られず、他の申請用書類の雛形を示す画像データであってもよい。
雛形画像データが示す申請用書類の雛形は、申請者の証明書類であって、免許証、保険証または領収書を示す書類のうち少なくとも一種類(免許証、保険証または領収書のうち少なくとも一種類の写し)の雛形であってもよい。
申請用書類は、記載項目の配置(書式)の規則性により、定型書類、準定型書類、非定型書類に区分される。定型書類は書式が一定である書類であり、準定型書類は書式が一定ではないものの規則性の高い書式を有する書類であり、非定型書類は書式の規則性が低い書類である。
申請用書類のうち、例えば保険証や領収書は準定型書類に相当する。雛形画像データは例えば準定型書類である保険証、領収書の雛形を示す画像データであってもよい。この場合、保険証や領収書の雛形を示す雛形画像データには、保険証や領収書に含まれる固有情報に応じて多種多様な証明項目領域および、証明項目領域に対応する固有情報の内容を示す証明内容領域が含まれる。
雛形画像データが示す申請用書類が定型書類、準定型書類、非定型書類のいずれであっても、本実施形態に係る教師データ自動生成装置(情報処理装置100)において雛形画像データを適用した模擬書類画像データを用いて教師データを生成し、当該教師データを用いて学習済みモデルMが構築されることで、当該学習済みモデルMによる画像処理の精度を向上し、ひいては審査効率を向上することができる。
このように、準定型書類や非定型書類のように書式が一定でない(定型書類でない)申請書用書類の雛形画像データを適用した模擬書類画像データによって教師データを生成してもよい。書式が一定でない申請用書類を示す申請画像データは、審査対象の画像情報を抽出(特定)する手間がかかる。したがって、当該教師データを用いて学習済みモデルMが構築されて自動的に当該画像情報を含む領域の抽出が可能となることで、審査効率をより向上することができる。
なお、定型書類は免許証に限られず、書式が一定であれば、申請書や各種証明書類、各種添付書類も定型書類に相当する。同様に、書式の規則性が高い場合は、申請書や各種証明書類、各種添付書類も準定型書類に相当する。
例えば申請書が定型書類または準定型書類に相当する場合、雛形画像データは、申請情報を含む申請書の雛形を示す画像データであってもよい。申請書には、固有情報として、個人情報に加えて申請内容に関する情報(申請者が入力(記載)した申請内容情報)が含まれる。このため、申請書の雛形を示す雛形画像データには、申請書に含まれる固有情報の項目を示す画像情報を含む証明項目領域と、証明項目領域に対応する固有情報の内容が適用される申請内容領域とが含まれる。
生成用データ記憶部41には、それぞれ異なる種類の申請用書類(申請書、免許証、保険証等)の雛形を示す複数種類の雛形画像データが記憶されていてもよい。これにより、画像データ生成部401は、複数種類の模擬書類画像データを生成することができ、ひいては教師データ自動生成部40において多様な教師データを生成することができる。
〔模擬固有情報リスト〕
また生成用データ記憶部41には、例えば模擬書類画像データに生成に用いるデータとして、模擬書類画像データの生成に用いる文字情報データであって、申請用書類における上述の固有情報を模したデータが登録された模擬固有情報リストが記憶されている。ここで、模擬固有情報リストにおいて、証明書類に含まれる固有情報を模したデータが登録されている場合を例にとって説明する。
図4は、生成用データ記憶部41に記憶される模擬固有情報リストの一例を模式的に示す図である。模擬固有情報リスト410は、申請用書類における固有の情報(固有情報)を模したデータである模擬固有情報データを多数登録したデータ群(テキストデータ群)である。模擬固有情報リスト410は、例えばテーブル形式で模擬固有情報データを蓄積しており、模擬固有情報データの削除や追加、内容更新が可能に構成されている。模擬固有情報リスト410に蓄積されている模擬固有情報データは、雛形画像データ7の各証明内容領域724に適用するためのデータである。
具体的には、模擬固有情報リスト410には、例えば架空の個人情報(実在しない架空の人物を示す個人情報)等のデータを含む模擬固有情報データが多数(本例ではn件)登録されている。模擬固有情報リスト410に登録される模擬固有情報データの件数(n)は、機械学習による学習済みモデルの構築に十分なデータ件数であればよい。
図4に示すように、模擬固有情報リスト410には申請者の個人情報を模した架空の個人情報(模擬個人情報)のデータとして、「A山A子」「B川B夫」等の架空の氏名や、「A県A市A町1-1-1」「B県B市B町1-2-1」等の架空の住所と所定の年月日による「生年月日」とを紐づけたレコードが登録されている。
また模擬固有情報リスト410において、模擬個人情報の各データは、データ内容を示す項目データと対応付けられている。図4では、模擬個人情報に対応する項目データとして「氏名」「住所」「生年月日」「性別」が例示されている。これらの項目データは、雛形画像データ(例えば、雛形画像データ7)の各証明項目領域723に含まれる画像情報が示す項目と対応している。つまり、模擬固有情報リスト410は、雛形画像データに合わせて、証明項目領域723に対応する項目データと、証明内容領域724に適用する模擬固有情報データとを対応付けて管理している。
なお本例では、アルファベットを用いた模擬個人情報のデータを示しているが、本開示はこれに限られず、模擬固有情報リスト410には実際の個人情報により近い形式の模擬個人情報のデータが登録されていてもよい。
また模擬固有情報リスト410には、模擬個人情報に加えて、申請用書類における申請内容情報または証明内容情報を模した情報を示す文字情報データ群である模擬内容情報を含んで構成されてもよい。模擬内容情報は、例えば証明書類に応じた固有情報に含まれる証明内容情報を模した文字情報データで構成されてもよい。これにより、模擬固有情報リスト410は、証明書類の雛形を示す雛形画像データ(例えば雛形画像データ7)の証明内容領域724に適用するための文字情報データを登録したリストとして構成される。
図4に示ように、例えば模擬固有情報リスト410は、模擬内容情報として所定の年月日による「交付年月日」「有効年月日」等のレコードが対応付けられている。交付年月日や有効年月日といった日付情報は、図4に示すように西暦を示す文字情報データであってもよいし、和暦を示す文字情報データであってもよい。日付情報が西暦を示す場合には、雛形画像データの証明内容領域724に適用する際に、必要に応じて和暦に変換して用いればよい。
また模擬固有情報リスト410には、各レコードを一意に識別する識別用データ(識別番号や識別コード)が付与されていてもよい。本例では、識別用データとして識別番号(「No」)が付与されている。
なお、本開示はこれに限られず、模擬固有情報リストにおける模擬内容情報は、例えば申請書に応じた固有情報に含まれる申請内容情報を模した文字情報データで構成されてもよい。これにより、模擬固有情報リストは、申請書類の雛形を示す雛形画像データの申請内容領域に適用するための文字情報データを登録したリストとして構成される。
以上、本実施形態における模擬固有情報リストについて、具体例を挙げて説明した。
なお、模擬固有情報リスト410の形式は上述のように一例であって、本開示における模擬固有情報リストの形態はこれに限られない。例えば模擬固有情報リストは、項目ごとに分かれた複数のリストで構成され、項目に応じた各リスト中から無作為に情報を選択する形式であってもよい。また、模擬個人情報および模擬内容情報がそれぞれ異なるリストに登録されており、各リストを対応付けて管理することによって模擬固有情報リストを構成してもよい。
本実施形態に係る教師データ自動生成装置である情報処理装置100は、申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データ(例えば雛形画像データ7)および、申請用書類における固有の情報を模したデータ群である模擬固有情報データを多数登録した模擬固有情報リスト(例えば模擬固有情報リスト410)を記憶する生成用データ記憶部41を備える。模擬固有情報リストには、例えば架空の個人情報のデータが含まれてもよい。
教師用データの生成に実在の申請者が提出した申請用書類を示す画像データや、実在の申請者の個人情報を含む固有情報リストを用いる場合、個人情報の使用許可や高度な情報セキュリティを適用した個人情報の管理が必要となり、情報処理システム1の運用組織において大きな作業負荷が生じる。本実施形態では、固有情報を含まない模擬固有情報リストの情報を用いることで、情報処理システム1の運用組織における作業負荷を低減することができる。
また固有情報リストには、免許証の雛形を示す雛形画像データ7の写真領域725に適用するための写真画像(上述の顔写真画像)の画像データを示す情報(例えば写真画像の保存先やファイル名等)が含まれていてもよい。当該写真画像データは、複数種類用意されていることが好ましい。写真画像データを示す情報は、模擬固有情報データに含まれる性別情報や氏名等と紐づけられていればよい。これにより、模擬書類画像データの生成時において、性別や氏名等に応じた写真画像データを選択して写真領域725に適用することができる。なお写真画像データは、模擬書類画像データの生成時において無作為に選択されて写真領域725に適用されてもよい。
また、本開示において、雛形画像データは、固有情報のうち個人情報のみを除いた画像データであってもよい。この場合、固有情報のうち証明書類における証明内容情報や申請書における申請内容情報は、予め雛形画像データに含まれていてもよい。これにより、模擬固有情報リストには模擬内容情報を登録する必要がなく、模擬個人情報のデータが登録されていればよい。このため、生成用データ記憶部41に記憶されるデータ量を削減することができる。
〔模擬書類画像データの生成〕
画像データ生成部401は、雛形画像データ(例えば雛形画像データ7)と模擬固有情報リスト(例えば模擬固有情報リスト410)に含まれる模擬固有情報データとに基づいて申請用書類を模した模擬書類画像を示す模擬書類画像データを生成する。教師データ自動生成部40は、画像データ生成部401が生成した模擬書類画像データ70を用いて教師データを生成する。これにより、教師データを生成するために多大な時間をかけて申請画像データを収集・生成をする必要がなく、速やかに教師データを自動生成することができる。つまり、本実施形態に係る教師データ自動生成装置である情報処理装置100は、申請用書類に関する教師データの生成を効率的且つ簡便に行うことができ、学習済みモデルを速やかに構築してAI技術の適用により審査効率を向上させることができる。
以下、図5を用いて模擬書類画像データの生成についてより具体的に説明する。図5は、模擬書類画像データの一例を示す模式図である。
本例では、画像データ生成部401は、免許証の雛形を示す雛形画像データ7と模擬固有情報リスト410に含まれる模擬固有情報データとに基づいて、免許証を模した模擬書類画像データ70を生成する。
生成用データ記憶部41には、雛形画像データの画像領域のうち模擬固有情報リストに登録された模擬固有情報データを適用する適用対象領域の位置情報(適用位置情報)が記憶されている。例えば、生成用データ記憶部41には、雛形画像データ7の画像領域のうち、模擬固有情報データを適用する証明内容領域(適用対象領域の一例)724(証明内容領域724a~724f)の位置情報が適用位置情報として記憶されている。
適用位置情報は、証明内容領域724と対応する証明項目領域723に含まれる項目を示すデータと関連付けて生成用データ記憶部41に記憶されている。画像データ生成部401は、生成用データ記憶部41に記憶されている適用位置情報に基づいて模擬固有情報リスト410に登録された模擬固有情報データを適用対象領域である証明内容領域724に適用して模擬書類画像データ70を生成する。
例えば、証明内容領域724aを示す適用位置情報には、証明内容領域724に対応する証明項目領域723(証明項目領域723a)に含まれる項目(「氏名」)を示すデータ(例えば文字情報データ「Name」)が関連付けられている。これにより、画像データ生成部401は、模擬固有情報リスト410から、証明項目領域723aに対応する模擬個人情報のデータ(例えば「A川A子」)を取得し、適用位置情報に基づいて証明内容領域724aに当該模擬個人情報のデータを適用する。これにより、より実際の証明書類の画像データ(例えば、免許証を示す申請画像データ)に近い態様の画像データとして、模擬書類画像データ70を生成することができる。
本実施形態において適用位置情報は、例えば雛形画像データ7の画像領域内における証明内容領域724の座標を含む情報である。適用位置情報は、例えば矩形状の証明内容領域724の一の角部(例えば、左上の角部)の頂点の座標情報(X,Y)と、当該角部を基準とした証明内容領域724のサイズ情報で構成されてもよい。サイズ情報は幅W(幅方向の画素数)および高さH(高さ方向の画素数)を含んでいればよい。また、適用位置情報の形式はこれに限られず、証明内容領域724の各角部の頂点(4点)のそれぞれの座標情報(X,Y)であってもよい。
画像データ生成部401は、模擬固有情報データ(例えば、模擬個人情報のデータ)を証明内容領域724適用する際に、文字情報データから画像データに変換し、変換した画像データを証明内容領域724内に配置(貼り付け)すればよい。これにより、雛形画像データ7の前景画像として模擬固有情報データを示す画像データが合成される。なお、より具体的には、模擬書類画像データ70は、雛形画像データ7を複製した画像データ(コピー雛形画像データ)に模擬固有情報データを適用して生成される。
同様にして、画像データ生成部401は、模擬固有情報リスト410内の各データをコピー雛形画像データの証明内容領域724b~724fに適用する。これにより、コピー雛形画像データの証明内容領域724のすべてに対して、模擬固有情報リスト410内の対応する模擬固有情報データが適用され、免許証を模した模擬書類画像データである模擬書類画像データ70を生成することができる。
また図4に例示したように、テーブル形式の模擬固有情報リスト(模擬固有情報リスト410)である場合には、画像データ生成部401が模擬固有情報リスト410内に登録されたレコード件数の分だけ、模擬書類画像データ70の生成処理を繰り返すことにより、当該レコード件数分(例えば、識別番号の最大数分)の模擬書類画像データ70を生成することができる。
このように、本実施形態に係る教師データ自動生成装置である情報処理装置100は、教師データにおける学習用画像データとして用いられる多数の模擬書類画像データ(本例では、模擬書類画像データ70)を、自動で生成することができる。これにより、情報処理装置100は、学習用画像データに用いられる模擬書類画像データを効率的かつ簡便に生成することができ、ひいては教師データを効率的かつ簡便に生成して審査効率を向上させることができる。
また、上述のように、生成用データ記憶部41には複数種類の雛形画像データが記憶されていてもよい。この場合、生成用データ記憶部41にはそれぞれ異なる種類の申請用書類(例えば、証明書類)の雛形を示す複数種類の雛形画像データと、各雛形画像データにおける適用対象領域(例えば証明内容領域724)の位置情報である適用位置情報が記憶されていればよい。
またこの場合、画像データ生成部401は、複数種類の雛形画像データと模擬固有情報リスト410と複数種類の雛形画像データのそれぞれにおける適用位置情報とを用いて、複数種類の模擬書類画像データを生成すればよい。
これにより、種別の異なる証明書類(例えば免許証、保険証等)や申請書に対応する雛形画像データに基づいて、多様な模擬書類画像データを作成することができる。なおこの場合、適用位置情報は雛形画像データの種別(雛形画像データが示す書類の種別)と関連付けて、生成用データ記憶部41に記憶されていればよい。
また、生成用データ記憶部41に複数種類の雛形画像データが記憶されている場合、生成用データ記憶部41には各雛形画像データに応じた複数の模擬固有情報リストが記憶されていてもよいし、一の模擬固有情報リスト(例えば、模擬固有情報リスト410)内に複数の雛形画像データに応じた固有情報データが登録されていてもよい。
また、雛形画像データが準定型書類(例えば保険証)の雛形を示す画像データである場合、当該準定型書類の書式パターンごとに適用位置情報が用意されていてもよい。
画像データ生成部401は、模擬書類画像データの生成処理を行うと、生成した複数(例えば、模擬固有情報リスト410のレコード件数分)の模擬書類画像データを教師データ記憶部42に出力して記憶させる。これにより、教師データ記憶部42に模擬書類画像データが蓄積される。教師データ記憶部42では、模擬書類画像データは例えば画像ファイル形式で保存される。模擬書類画像データの画像ファイル名は、例えば模擬書類画像データが示す申請用書類の種別(例えば、免許証、保険証、領収書等)を識別可能な文字列を含んでいればよい。これにより、教師データ記憶部42から当該画像ファイルを取得する際に、当該画像ファイルに含まれる模擬書類画像データが示す申請用書類の種別を取得することができる。
画像データ生成部401は、例えば、生成用データ記憶部41に新たな雛形画像データが追加されたり、模擬固有情報リスト410の模擬固有情報データが追加・更新されたりした場合に、模擬書類画像データの生成処理を行ってもよいし、所定の周期で模擬書類画像データの生成処理を行ってもよい。
〔学習用画像データの生成〕
次に、画像データ生成部401による学習用画像データの生成について説明する。上述のように、画像データ生成部401は、模擬書類画像データ70を用いて、教師データを構成する画像データ(学習用画像データ)を生成する。なお詳しくは後述するが、本実施形態において、上述した模擬書類画像データの生成処理で生成された模擬書類画像データ自体も、学習用画像データとして用いられる。
まず、画像データ生成部401が生成する学習用画像データの一例である転写書類学習データについて説明する。転写書類学習データは、申請用書類の画像データである申請画像データのうち、申請者が提出した証明書類を示す申請画像データを模した画像データである。
上述のように、申請画像データは、申請者が提出した申請書の原本を画像データ化して生成される。このため、申請書を示す申請画像データには、申請書類以外の画像領域がほぼ含まれない。一方、免許証や保険証といった証明書類を示す申請画像データは、申請者が提出した本人確認書類の写しを画像データ化して生成される。
したがって、証明書類を示す申請画像データには、当該写しを作成する印刷時における余白部分に相当する画像領域が含まれたり、画像情報として含まれる証明書類に傾きが生じたりする場合がある。また証明書類を示す申請画像データには、画像情報として複数の証明書類が含まれる場合もある。
例えば審査時において、審査画面と並べて証明書類を示す申請画像データが表示装置53に表示されると、審査担当者は審査画面における審査項目に対応する画像領域(例えば、申請者の「氏名」に関する画像情報を含む画像領域)を参照するために、マウスなどの入力装置52の操作によって画像の位置や傾きを調整することが必要となる。また証明書読取画像データに複数の証明書類が含まれる場合、いずれの証明書類を参照するか分かりづらいという問題も生じ得る。このようなことに起因して、審査効率が低減してしまう場合がある。したがって、情報処理装置100では、画像処理部30により、証明書類を示す申請画像データに対して、証明書類に相当する画像領域を認識して切り出し、切り出した画像領域の画像データに傾きがあれば調整するといった画像処理(画像分割処理)を行うことが必要となる。
そこで、本実施形態において教師データ自動生成部40では、画像分割処理向けの学習済みモデルの構築に用いる教師データを生成する。画像データ生成部401は、当該画像分割処理向けの教師データを構成する学習用画像データとして、証明書類を示す申請画像データを模した画像データ(転写書類学習画像データ)を生成する。学習用画像データとして転写書類学習画像データを含む教師データを用いることにより、学習済みモデル生成装置であるコンピュータ54は、画像処理部30が証明書類を示す申請画像データの画像分割処理に用いる学習済みモデルを構築することができる。
まず、転写書類学習画像データの生成に用いるデータについて説明する。本実施形態において生成用データ記憶部41には、申請用書類のうち証明書類が転写された転写紙の背景領域(証明書類以外の領域)を模した背景画像を示す背景画像データが記憶されている。ここで、背景画像データについて図6を用いて説明する。図6(a)から図6(e)は、転写書類学習画像データの生成に用いられる背景画像データの一例を示す図である。
図6に示すように、本実施形態において背景画像データ9(背景画像データ9a~9e)は、転写紙の背景領域におけるインクの濃淡やかすれを再現したグレースケールの画像領域を含んでいる。転写紙の背景領域の態様は、印刷環境や印刷機の種類等に応じて様々である。このため、本実施形態では、グレースケールの画像領域のサイズや灰色の階調の異なる複数種類(本例では5種類)の背景画像データ9が用意されている。
図7は、本実施形態における転写書類学習画像データの一例を示す図である。
本実施形態において画像データ生成部401は、背景画像データ9に対し前景画像として模擬書類画像データ70(模擬書類画像データ70の画像領域)を合成し、教師データを構成する画像データとして転写書類学習画像データ90(転写書類学習画像データ90a)を生成する。図7に示す転写書類学習画像データ90aは、図6に示す背景画像データ9aの画像領域に対して、模擬書類画像データ70の画像領域を前景として貼り付けて生成されている。
画像データ生成部401は、模擬書類画像データ70の画像領域と平行なXY平面内において模擬書類画像データ70を回転させず、正対した状態で背景画像データ9aの画像領域に合成する。これにより、転写書類学習画像データ90aにおいて模擬書類画像データ70の画像領域を傾きのない状態(回転なし状態)とすることができる。ここで、背景画像データ9の画像領域と平行なXY平面とは、例えば転写書類学習画像データ90aを転写紙に印刷した場合における紙面に相当し、転写書類学習画像データ90aを表示装置53に表示した場合における表示画面に相当する。
転写書類学習画像データ90aでは、模擬書類画像データ70の画像領域に傾き(回転)が生じていない。このため模擬書類画像データ70の画像領域における証明項目領域723、証明内容領域724内の画像情報が示す文字列には、傾きが生じていない。つまり、転写書類学習画像データ90aにおいて証明項目領域723、証明内容領域724内の画像情報が示す文字列は、背景画像データ9の画像領域と平行なXY平面内において回転せずに正対した状態となっている。
図8は、本実施形態における転写書類学習画像データの他の一例を示す図である。画像データ生成部401は、模擬書類画像データ70の画像領域と平行なXY平面内において所定角度で回転させた模擬書類画像データを背景画像データ9aに合成して、転写書類学習画像データ90bを生成する。これにより、図8に示す転写書類学習画像データ90bにおいて模擬書類画像データ70の画像領域を傾きが生じた状態(回転あり状態)とすることができる。
転写書類学習画像データ90bでは、模擬書類画像データ70の画像領域に傾き(回転)が生じている。このため模擬書類画像データ70の画像領域における証明項目領域723、証明内容領域724内の画像情報が示す文字列には、傾きが生じている。つまり、転写書類学習画像データ90aにおいて証明項目領域723、証明内容領域724内の画像情報が示す文字列は、背景画像データ9の画像領域と平行なXY平面内において模擬書類画像データ70の画像領域と同等の角度で回転した状態となっている。
このように、画像データ生成部401は、背景画像データ9(例えば背景画像データ9a)に対して一種類の模擬書類画像データが示す画像(模擬書類画像データの画像領域)を前景画像として合成し、一種類の模擬書類画像を含む転写書類学習画像データ90(例えば、転写書類学習画像データ90a,90b)を生成することができる。この場合、画像データ生成部401は、転写書類学習画像データ90として、一種類の模擬書類画像データを回転なし状態とした画像データ(転写書類学習画像データ90a)または一種類の模擬書類画像データを回転あり状態とした画像データ(転写書類学習画像データ90b)を生成することができる。
また画像データ生成部401は、回転あり状態の模擬書類画像データを含む転写書類学習画像データとして、模擬書類画像データの画像領域の回転角度が異なる複数種類の画像データを生成することができる。
図9は、本実施形態における転写書類学習画像データのさらに他の一例を示す図である。
図9に示すように、本実施形態において転写書類学習画像データ90に含まれる模擬書類画像データ(模擬書類画像データの画像領域)は一種類に限られず、複数種類の模擬書類画像データが含まれていてもよい。つまり、画像データ生成部401は、一の背景画像データ9(例えば背景画像データ9a)に対して複数種類(本例では、2種類)の模擬書類画像データが示す画像を前景画像として合成し、複数種類の模擬書類画像を含む転写書類学習画像データ90cを生成することができる。
本例では、転写書類学習画像データ90cには、免許証を模した模擬書類画像データ70aと保険証を模した模擬書類画像データ70bの画像領域が含まれている。本例では理解を容易にするため、模擬書類画像データ70bに含まれ得る多くの証明項目領域および証明内容領域のうちの一部である証明項目領域723および証明内容領域724のみを図示し、他の証明項目領域および証明内容領域の図示は省略している。
図9に示すように、複数種類の模擬書類画像データの画像領域を含む転写書類学習画像データにおいて、各模擬書類画像データの画像領域は、回転状態が異なっていてもよい。図9では、転写書類学習画像データ90cにおける模擬書類画像データ70aの画像領域が回転あり状態、模擬書類画像データ70bの画像領域が回転なし状態となっている。なお、これに限られず、転写書類学習画像データにおいて複数種類の模擬書類画像データの画像領域の両方が回転あり状態でもよいし、複数種類の模擬書類画像データの画像領域の両方が回転なし状態でもよい。
このように、本実施形態において画像データ生成部401は、背景画像データ9に対して一種類または複数種類の模擬書類画像データ(模擬書類画像データ70a,70b)が示す画像を前景画像として合成し、一種類または複数種類の模擬書類画像(模擬書類画像データの画像領域)を含む転写書類学習画像データ90を生成する。
これにより、画像データ生成部401は多種多様な転写書類学習画像データ90を生成することができ、転写書類学習用画像データを用いて生成される教師データをより実際の証明書類の申請画像データに近いものとすることができる。
また上述のように、生成用データ記憶部41には、複数種類の背景画像データ(例えば、背景画像データ9a~9e)が記憶されている。このため、画像データ生成部401は、転写書類学習画像データの生成時において複数種類の背景画像データが示す背景画像のうち少なくとも一種類を無作為に選択すればよい。つまり、画像データ生成部401は、複数種類の背景画像データのうち一種類を選択してもよいし、複数種類を選択してもよい。複数種類を選択する場合には、例えば当該複数種類の背景画像を合成して背景画像とすればよい。これにより、種々の背景画像データに対して模擬書類画像データの画像領域を合成した転写書類学習画像データを生成することができ、転写書類学習用画像データを用いて生成される教師データをさらに実際の証明書類の申請画像データに近いものとすることができる。また例えば複数種類の背景画像を合成することで、多様な態様の背景画像を生成することができ、模擬書類画像データをさらに実際の証明書類の申請画像データに近いものとすることができる。
画像データ生成部401は、生成用データ記憶部41から無作為に選択した背景画像データ9を読み込み、読み込んだ背景画像データ9に対して、教師データ記憶部42から読み込んだ模擬書類画像データの画像領域を合成する。これにより、画像データ生成部401は、少なくとも模擬書類画像データのデータ数分(例えば模擬固有情報リスト410のレコード件数分)の転写書類学習用画像データを自動生成することができる。これにより、本実施形態に係る教師データ自動生成装置である情報処理装置100は、教師データに用いる学習用画像データを効率的かつ簡便に生成することができ、ひいては教師データを効率的かつ簡便に生成することができる。画像データ生成部401は、生成した転写書類学習用画像データを教師データ記憶部42に出力して記憶させる。このとき、模擬書類画像データと同様に、転写書類学習用画像データを画像ファイルとして保存してもよい。また、転写書類学習用画像データの画像ファイル名は、当該画像ファイルを一意に識別可能な名称であればよい。
以上説明したように、画像データ生成部401は、雛形画像データ(例えば、雛形画像データ7)と模擬固有情報リスト(例えば、模擬固有情報リスト410)に含まれる模擬固有情報データとに基づいて申請用書類を模した模擬書類画像を示す模擬書類画像データ(例えば、模擬書類画像データ70,70b)を生成することができる。
ここで、模擬書類画像データが示す申請用書類は、申請者の証明書類であって、免許証、保険証または領収書を示す書類のうち少なくとも一種類(免許証、保険証または領収書のうち少なくとも一種類の写し)であればよく、申請書であってもよい。これにより、本人確認書類の写しとして申請者が提出する頻度が高い証明書類(免許証、保険証、領収書等の写し)に模した模擬書類画像データを生成し、これを用いた学習用画像データを生成することができる。なお、申請用書類における申請者の証明書類は、上述したものに限られず、申請業務の内容に応じて種々の書類が想定される。例えば、行政関係の申請業務であれば、戸籍謄本や住民票等の写しが申請用書類として想定される。また車両の登録等の申請業務であれば、申請書に加えて車検証や点検記録簿等が申請用書類として想定される。本実施形態において画像データ生成部401は、これらの種々の申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、これを用いた学習用画像データを生成することができる。
具体的には、画像データ生成部401は、転写紙の背景領域を模した背景画像を示す背景画像データ9に対し前景画像として前記模擬書類画像データを合成し、教師データを構成する画像データとして転写書類学習画像データを生成することができる。
これにより、画像処理部30が行う画像処理向けの学習済みモデルの構築に用いる教師データを構成する学習用画像データを生成することができる。
(注釈データ付与部)
教師データ自動生成部40において注釈データ付与部402は、画像データ生成部401が生成した学習用画像データ(模擬書類画像データ、転写書類学習データ)が示す画像にメタデータ(注釈データ)を付与して意味づけ(アノテーション)を行う。これにより、学習用画像データと注釈データとを含む教師データが生成される。
まず、転写書類学習データに対するアノテーションによる教師データの生成について説明する。
注釈データ付与部402は、転写書類学習データに付与する注釈データとして、書類分割データを生成する。書類分割データは、転写書類学習用画像データの画像領域内における模擬書類画像データの画像領域をアノテーションするための注釈データである。
ここで図7から図9を用いて、書類分割データについて説明する。
書類分割データは、転写書類学習画像データ90の画像領域、すなわち背景画像データ9の画像領域のうち、模擬書類画像データ70に相当する画像領域である模擬書類領域71の位置を示す模擬書類位置情報を含んでいる。模擬書類領域71は模擬書類画像データ70を囲む矩形状の領域である。本実施形態において模擬書類位置情報は、模擬書類領域71aの4つの角部の頂点P1~P4のそれぞれの座標情報(X,Y)で構成される。これにより、転写書類学習画像データ90の画像領域内における模擬書類領域71の位置、すなわち模擬書類画像データ70の位置を特定することができる。
注釈データ付与部402は、模擬書類画像データ70における模擬書類画像(模擬書類領域71の画像情報)が示す申請用書類の種別と、転写書類学習画像データ90の画像領域のうち模擬書類領域71の位置を示す模擬書類位置情報とを関連付けた書類分割データを取得し、当該書類分割データを転写書類学習画像データ90に付与する。これにより、機械学習によって転写書類学習画像データ90に含まれる模擬書類領域71を学習させるための教師データ(書類分割用教師データ)が生成される。
注釈データ付与部402は、少なくとも転写書類学習用画像データのデータ数分の教師データ(書類分割用教師データ)を自動生成することができる。
例えば、注釈データ付与部402は、転写書類学習画像データ90の模擬書類領域71(模擬書類領域71a)が示す申請書類の種別として「免許証」を表す「Driver′s License」という文字列データと、模擬書類位置情報とを関連付けた書類分割データを取得する。書類分割データのデータ構造(フォーマット)は、JSON(Javascript(登録商標) Object Notation)であってもよいし、XMLや平文であってもよい。例えば、図7に示す転写書類学習画像データ90aに付与される注釈データ(書類分割データ)のデータ構造がJSONである場合、模擬書類領域71が表す申請書類の種別として「免許証」を示すデータ「“Type”:“Driver′s License”」に関連付けて、模擬書類領域71aの角部の頂点P1~P4の座標情報である模擬書類位置情報を示すデータ「“point1”:{18,222},“point2”:{24,222},“point3”:{24,603},“point4”:{18,222}」を有するデータ構造となる。
これにより、転写書類学習画像データ90aに対し、模擬書類領域71(模擬書類領域71a)が表す申請用書類の種別が「免許証」であることに関連付けて、転写書類学習画像データ90aにおける模擬書類領域71の位置を示す模擬書類位置情報がアノテーションされる。したがって、転写書類学習画像データ90aに書類分割データをアノテーションした教師データにより、証明書類の申請画像データについて、傾きが生じていない証明書類の種別および画像領域を認識・検出するための学習を行うことができる。
また、図8に示す転写書類学習画像データ90bに対しても同様に、模擬書類領域71(模擬書類領域71a)が表す申請用書類の種別が「免許証」であることに関連付けて、転写書類学習画像データ90aにおける模擬書類領域71の位置を示す模擬書類位置情報がアノテーションされる。図8に示すように、転写書類学習画像データ90bにおいて模擬書類領域71(模擬書類画像データ70の画像領域)は回転あり状態で配置されている。模擬書類位置情報は、模擬書類領域71aの角部の頂点P1~P4の座標情報であることにより、模擬書類領域71の回転角度まで含めた位置を示すことができる。したがって、転写書類学習画像データ90bに書類分割データをアノテーションした教師データにより、証明書類の申請画像データについて、傾きが生じた証明書類の種別および画像領域を認識・検出するための学習を行うことができる。
また、図9に示すように、複数の模擬書類領域71(模擬書類領域71a,71b)を有する転写書類学習画像データ90cでは複数の書類分割データが付与される。例えば、転写書類学習画像データ90cには、申請用書類の種別が「免許証」であることに関連づけて示す模擬書類領域71aを示す書類分割データに加えて、「保険証」を示す模擬書類領域71bを示す書類分割データが付与される。したがって、転写書類学習画像データ90cに書類分割データをアノテーションした教師データにより、証明書類の申請画像データについて、複数の証明書類の種別および画像領域を認識・検出するための学習を行うことができる。
注釈データである書類分割データに含まれる情報(申請書類の種別を示す情報および模擬書類位置情報)は、例えば画像データ生成部401による転写書類学習画像データ90の生成時において取得される。具体的には、模擬書類位置情報は、背景画像データ9に模擬書類画像データ70の画像領域を合成する際に取得される。画像データ生成部401が取得した模擬書類位置情報(頂点P1~P4、頂点P10~P40の座標情報)は、情報処理装置100の一時記憶領域に保存されてもよいし、転写書類学習画像データ90を識別する情報(画像ファイル名など)と対応付けて教師データ記憶部42に記憶されてもよいし、注釈データ付与部402に出力されてもよい。
また、画像データ生成部401が注釈データ付与部402の機能を実装することで、転写書類学習画像データ90の生成に伴って、注釈データ(ここでは、書類分割データ)の取得および付与を行ってもよい。
書類分割用教師データによる機械学習(例えば、教師あり学習)で生成された学習済みモデル(書類分割用学習済みモデル)は、証明書類を示す申請画像データを入力すると、出力結果として、申請画像データに含まれる証明書類の画像領域の画像データ(証明書画像データ)と、当該画像データが示す申請書類の種別とを得ることができる。また出力される証明書画像データは、傾きが補正された回転なし状態となっている。
したがって、学習済みモデルМが書類分割用学習済みモデルである場合、当該画像処理部30は証明書類を示す申請画像データを学習済みモデルМに入力することで、出力結果として申請画像データから分割され、傾きが補正された証明書画像データおよび申請書類の種別を得ることができる。これにより、画像処理部30は、効率的かつ簡便に精度の高い画像処理(画像分割処理)を実行し、審査画面に表示するための審査用画像データを効率的に生成することができる。これにより、教師データ自動生成部40は、審査効率を向上することができる。
次に、模擬書類画像データ(例えば、図5に示す模擬書類画像データ70)に対するアノテーションによる教師データの生成について説明する。
注釈データ付与部402は、模擬書類画像データに付与する注釈データとして、領域抽出データを生成する。領域抽出データは、模擬書類画像データの画像領域内における特定の領域をアノテーションするための注釈データである。本実施形態において、領域抽出データは、模擬書類画像データ(例えば、模擬書類画像データ70)における模擬固有情報データの画像情報を含む模擬固有情報領域(証明項目領域723および証明内容領域724)をアノテーションするための注釈データである。
模擬書類画像データに対して領域抽出データを付与することにより、実際の申請用書類(例えば、証明書類)の画像データ(審査用画像データ)の画像領域内において固有情報データを表す固有情報領域(証明項目領域および証明内容領域)の位置を抽出することが可能となる。審査用画像データにおける固有情報データは、審査画面とともに表示装置53に表示されることで、目視審査の対象の画像情報となる。つまり、証明項目領域および証明内容領域による固有情報領域は、審査対象の画像情報を含む審査画像領域である。
したがって、模擬書類画像データに対して領域抽出データを付与した教師データにより、審査用画像データの画像領域における固有情報領域(審査画像領域)を学習させた学習済みモデル(領域抽出用学習済みモデル)を構築することができる。画像処理部30は、学習済みモデルМが領域抽出用学習済みモデルである場合に、申請用書類の画像データ(例えば、書類分割処理結果である審査用画像データ)を学習済みモデルМに入力することで、出力結果として、固有情報領域の位置情報(座標情報)を取得することができる。審査部13は、固有情報領域の位置情報に基づいて、審査画像領域である固有情報領域の視認が容易な態様で審査用画像データを表示装置53に表示可能となる。したがって、本実施形態に係る教師データ自動生成装置である情報処理装置100は、審査効率を向上することができる。
ここで、図10を用いて領域抽出データについて具体的に説明する。
図10(a)は、図5に示す模擬書類画像データ70(図7から図9に示す模擬書類画像データ70aに相当)の画像領域の一部を抜粋して示す図である。
例えば注釈データ付与部402は、模擬書類画像データ70の画像領域内において、模擬固有情報データ(ここでは、免許証の模擬書類画像データが示す氏名)を含む模擬固有情報領域170aの位置情報(審査領域位置情報)を取得する。具体的には、注釈データ付与部402は、模擬固有情報領域170aの位置を示す審査領域位置情報として模擬書類画像データ70の画像領域内における証明項目領域723の位置情報および証明内容領域724の位置情報を取得する。注釈データ付与部402は、審査領域位置情報として座標情報を含む位置情報を取得する。
図5に示す模擬書類画像データ70(図7から図9に示す模擬書類画像データ70a)は、免許証を模した画像データである。このため、当該模擬書類画像データ70(模擬書類画像データ70a)の証明項目領域および証明内容領域(模擬固有情報領域)の座標情報は予め生成用データ記憶部41に記憶されている。注釈データ付与部402は、模擬書類画像データが示す書類の種別が「運転免許証」である場合、生成用データ記憶部41から証明項目領域723および証明内容領域724を含む模擬固有情報領域170aの座標情報を抽出する。これにより、注釈データ付与部402は、模擬固有情報領域170aの座標情報を取得することができる。
生成用データ記憶部41には、模擬固有情報領域170aに含まれる証明項目領域723が示す模擬固有情報データの項目と、模擬固有情報領域170aの座標情報とが関連付けて記憶されている。注釈データ付与部402は、生成用データ記憶部41から模擬固有情報領域170aの座標情報とともに模擬固有情報データの項目を示す項目データ抽出する。これにより、注釈データ付与部402は、模擬固有情報データの種類を示す項目データと、模擬固有情報領域170aの位置とを関連付けた領域抽出データを取得して、模擬書類画像データ70aに付与することができる。これにより、機械学習によって模擬書類画像データ70a(定型書類である免許証を模した画像データ)に含まれる模擬固有情報領域の位置を学習させるための教師データ(領域抽出用教師データ)が生成される。
図10(b)は、図9に示す模擬書類画像データ70bの画像領域の一部を抜粋して示す図である。注釈データ付与部402は、模擬書類画像データ70bの画像領域内において、模擬固有情報データ(ここでは、保険証の模擬書類画像データが示す氏名)を含む模擬固有情報領域170bの位置情報(審査領域位置情報)を取得する。生成用データ記憶部41には、模擬固有情報領域170aと同様に、模擬固有情報領域170bに含まれる証明項目領域723が示す模擬固有情報データの項目と、模擬固有情報領域170bの座標情報とが関連付けて記憶されている。このため、注釈データ付与部402は、模擬固有情報データの種類を示す項目データと、模擬固有情報領域170bの位置とを関連付けた領域抽出データを取得して、模擬書類画像データ70bに付与することができる。これにより、機械学習によって模擬書類画像データ70b(準定型書類である免許証を模した画像データ)に含まれる模擬固有情報領域の位置を学習させるための教師データ(領域抽出用教師データ)が生成される。
このように、注釈データ付与部402は、模擬書類画像データ(模擬書類画像データ70a,70b)に含まれる模擬固有情報データの項目と、模擬書類画像データの画像領域のうち模擬固有情報データの画像情報を示す模擬固有情報領域170(模擬固有情報領域170a,170b)の位置とを関連付けた領域抽出データを取得し、該領域情報データを模擬書類画像データ70(模擬書類画像データ70a,70b)に付与して教師データ(領域抽出用教師データ)を生成する。注釈データ付与部402は、少なくとも模擬書類画像データのデータ数分の教師データ(領域抽出用教師データ)を自動生成することができる。
注釈データ付与部402が取得する模擬固有情報領域170(模擬固有情報領域170a,170b)の位置情報(審査領域位置情報)は、矩形状の領域である模擬固有情報領域の各角部の頂点それぞれの座標情報(X,Y)であってもよい。また、審査領域位置情報は、模擬固有情報領域の一の角部の頂点(例えば、左上の角部の頂点P100)の座標情報(X,Y)と、当該角部の頂点を基準とした模擬固有情報領域のサイズ情報で構成されてもよい。サイズ情報は幅W(幅方向の画素数)および高さH(高さ方向の画素数)を含んでいればよい。模擬固有情報領域のサイズ情報を含む審査領域位置情報は、模擬固有情報領域の各角部の頂点それぞれの座標情報を含む審査領域位置情報よりも、情報量を削減できる。このため、教師データを保存するための容量を低減させることができる。
注釈データ付与部402が模擬書類画像データに付与する注釈データである領域抽出データのデータ構造は、上述の書類分割データと同様に、JSONであってもよいし、XMLや平文であってもよい。例えば、図10(a)に示す模擬書類画像データ70aに付与される注釈データ(領域抽出データ)のデータ構造がJSONである場合、模擬固有情報領域170aにおける模擬固有情報データの項目(氏名)を示すデータ「“TagType”:“Name”」に関連付けて、模擬固有情報領域170aの一の角部の頂点P100の座標情報と模擬固有情報領域170aのサイズとを示すデータ「“X”:18,“Y”:345,“W”:903,“H”:45」を有するデータ構造となる。
以上説明したように、注釈データ付与部402は、模擬書類画像データに基づいて生成された複数種類の学習用画像データに対して、それぞれ異なる注釈データを付与(アノテーション)する。これにより、画像処理部30が実行する種々の画像処理に用いる学習済みモデルを構築するための種々の教師データを生成することができる。
なお、本例では注釈データ付与部402が書類分割用教師データおよび領域抽出用教師データを生成する例を説明したが、本開示はこれに限られない。注釈データ付与部402は、書類分割データや領域抽出データとは異なる注釈データを学習用画像データ(転写書類学習データ、模擬書類画像データ)に付与することで、さらに異なる種類の教師データを生成するように構成されてもよい。また、注釈データ付与部402は、書類分割用教師データおよび領域抽出用教師データのうち少なくとも一方を生成する構成であってもよい。
また注釈データ付与部402は、例えば模擬書類画像データ70の模擬書類画像(模擬書類領域71の画像情報)が示す申請用書類の種別のみを取得して、転写書類学習画像データ90に付与してもよい。これにより、機械学習によって転写書類学習画像データ90に含まれる申請用書類の種別(例えば、免許証、保険証、領収書等)を学習させるための教師データ(書類分類用教師データ)が生成される。この場合、注釈データ付与部402は、書類分割用教師データ、領域抽出用教師データおよび書類分類用教師データのうち少なくとも一種類を生成する構成であってもよい。つまり、書類分割用教師データ、領域抽出用教師データおよび書類分類用教師データのうちいずれか一種類のみを生成する構成であってもよいし、これらのうち2種類を生成する構成でもよいし、3種類すべてを生成するこうせいであってもよい。
また、教師データ自動生成部40(特に注釈データ付与部402)が生成した教師データ(書類分割用教師データ、領域抽出用教師データ、書類分類用教師データ)は、学習済みモデルの評価を行う検証データとして用いられてもよい。情報処理装置100では、当該評価の結果に基づいて教師データの内容の調整などを行い、最終的な学習済みモデルの生成に必要なデータをコンピュータ54に出力することができる。
(1.2)情報処理装置のハードウェア構成
図11は、情報処理装置100の機能部におけるハードウェア構成の一例を示す概略図である。図11に示すように、情報処理システム1は、演算装置10により実現される。演算装置10は、プロセッサ101、ROM(Read Only Memory)102、RAM(Random access memory)103及び補助記憶装置(メモリ)104を備える情報処理装置(コンピュータ)である。
演算装置10には、例えば外部インタフェース(I/F)105を介して読取装置51、入力装置52及び表示装置53、並びに外部記憶媒体57が接続されている。外部インタフェース(I/F)105は、例えばUSB(Universal Serial Bus)ポート等である。
演算装置10には、例えば通信インタフェース(I/F)106及びネットワーク108を介して他のコンピュータ55が接続されていてもよい。通信インタフェース(I/F)106は、例えばLAN(Local Area Network)ポート、無線LANインタフェース等である。
ここで、読取装置51、入力装置52及び表示装置53は、図2に示す情報処理装置100に接続された読取装置51、入力装置52及び表示装置53である。また、読取装置51、入力装置52、表示装置53及びコンピュータ55は、演算装置10と接続するためのユーザインタフェース(不図示)を備えている。ここで、演算装置10の各部のハードウェア資源が所定のプログラムと協働することにより、情報処理装置100の申請情報取得部11、記憶部12、審査部13、画像処理部30、教師データ自動生成部40、審査画像記憶部31、生成用データ記憶部41、教師データ記憶部42及び表示データ出力部14及びデータ出力部15の各機能が構築される。
プロセッサ101は、情報処理装置100を全体的に制御するプロセッサである。プロセッサ101は、バス107を介してROM102に格納されたプログラムを読み出し、プログラムに従って情報処理装置100を制御する。プロセッサ101は、情報処理装置100があらかじめ定められた審査画面を出力する等の審査処理を行うように情報処理装置100を制御する。
ROM102は、教師データを生成する教師データ自動生成処理を実行する教師データ自動生成プログラムと、審査用画像データを生成する画像処理を実行する画像処理プログラムと、申請手続きを受け付け、審査担当者による審査の結果を得る申請情報処理方法を実行するプログラムとを格納している。
RAM103は、計算データ、入力装置52を介して審査担当者により入力された各種データ等が一時的に格納されている。
補助記憶装置104は、例えば図示しないバッテリでバックアップされており、情報処理システム1の電源がオフされても記憶状態が保持される。補助記憶装置104には、外部インタフェース105を介して読取装置51から入力された申請用書類の画像データ、画像処理部30が生成した審査用画像データ、教師データ自動生成部40生成した模擬書類画像データ、転写書類学習データ、書類分割用教師データ、および領域抽出用教師データ等が記憶される。また、補助記憶装置104には、入力装置52から審査担当者によって入力された入力データの他、外部インタフェース105、通信インタフェース106を介して入力された各種データが記憶される。
読取装置51は、申請用書類を電子データ(画像データ)化し、外部インタフェース105を介して画像データを演算装置10に入力する。読取装置51による読み取りの制御は、情報処理システム1の演算装置10がプログラムを実行することにより行うようにしてもよいし、他の装置からの制御により行うようにしても良い。
入力装置52は、キーボード、カードリーダ、ポインティングデバイス又はマイク等の音声入力装置等であり、外部インタフェース105を介して審査担当者の操作に基づく指令や入力データを演算装置10に入力する。
表示装置53は、例えば液晶ディスプレイ(LCD:Liquid Crystal Display)や有機ELディスプレイ(OELD:Organic Electro-Luminescence Display)であり、外部インタフェース105を介して演算装置10から各種データを受信して表示する。表示装置53は、例えば演算装置10のメモリ上に読み込まれた各データ、プログラム等が実行された結果として得られたデータ、読取装置51がスキャンして得られた申請用書類の画像データに基づく審査用画像データ、審査部13での審査の過程で出力されたデータ等を表示する。
外部記憶媒体57は、例えばCD(Compact Disk)、DVD(Digital Versatile Disk)又はBlu-ray Disc(登録商標)等の光ディスク、フラッシュメモリ等の半導体メモリ、ポータブルハードディスクドライブである。外部記憶媒体57は、情報処理装置100から出力された審査データを記憶してもよい。
コンピュータ55は、通信インタフェース106を介してネットワーク108経由で演算装置10と接続されている。コンピュータ55は、図示しない表示装置および入力装置を備え、ネットワーク108経由で入力装置を介して作業者の操作に基づく指令や入力データを演算装置10に入力したり、演算装置10から各種データを受信して表示装置に表示させることができる。ネットワーク108は、有線ネットワーク又は無線ネットワークのいずれであってもよい。ネットワーク108が無線LAN、Bluetooth(登録商標)、モバイル通信ネットワーク等の無線ネットワークである場合、情報処理装置100は、遠隔地にいる審査担当者からリアルタイムで指令を受け付けたり、遠隔地にいる審査担当者に対してプログラム等の実行状態や取得データの表示を行うことができる。例えばコンピュータ55が自治体のコンピュータであり、情報処理装置100が自治体から審査を委託された企業のコンピュータで実行されている場合、情報処理システム1から審査データが出力され、ネットワーク108を介して自治体のコンピュータ55に送信される。
(1.3)教師データ自動生成方法
以下、本実施形態に係る情報処理方法について、図12を用いて説明する。図12は、本実施形態に係る教師データ自動生成方法の一例を説明するフローチャートである。
教師データ自動生成部40の画像データ生成部401は、生成用データ記憶部41から模擬書類画像データを生成するための雛形画像データを取得する(ステップS101)。画像データ生成部401は、例えば模擬書類画像データの生成を開始することを示す所定の契機(例えば、模擬固有情報リストの更新や新たなレコードの追加、模擬書類画像データの生成周期の到来等)が生じたことに基づいて、雛形画像データを取得する。これにより擬書類画像データの生成処理が開始される。
画像データ生成部401は、雛形画像データを取得すると、次いで生成用データ記憶部41から模擬固有情報リスト内のレコードを取得する(ステップS102)。画像データ生成部401は模擬固有情報リスト内のレコードの全件を一度に読み込んでもよいし、一件ずつ読み込んでもよいし、各項目の情報を無作為に1件ずつ選択(取得)して読込んでもよい。なお、画像データ生成部401は、模擬固有情報リストを取得した後で、雛形画像データを取得してもよい。
画像データ生成部401は、取得した雛形画像データと模擬固有情報リストに含まれる模擬固有情報データとに基づいて、模擬書類画像データを生成する(ステップS103)。例えば画像データ生成部401は、模擬固有情報リストの各レコードから、証明項目領域723が示す項目と対応する内容の模擬固有情報データを抽出し、抽出した模擬固有情報データを証明項目領域723に対応する証明内容領域724に適用する。これにより、模擬固有情報データを含む模擬書類画像データが生成される画像データ生成部401は、生成した模擬書類画像データを教師データ記憶部42に記憶させる。画像データ生成部401は、ステップS103の処理を、模擬固有情報リストのレコード数分繰り返すことで、模擬固有情報リスト内の全レコードを適用した多くの模擬書類画像データを自動生成することができる。また、上述のように、模擬固有情報リストから各項目の情報を無作為に1件ずつ読み込む場合には、ステップS103の処理を予め設定された任意の件数分繰り返すことで、任意の件数の模擬書類画像データを自動生成することができる。
次いで、画像データ生成部401は、転写書類学習データを生成するための背景画像データ9を生成用データ記憶部41から取得する(ステップS104)。例えば画像データ生成部401は、生成用データ記憶部41に記憶された複数種類の背景画像データ9a~90eのうち一の背景画像データ9を無作為に選択して取得する。
画像データ生成部401は、背景画像データ9を取得すると教師データ記憶部42に記憶されている模擬書類画像データを取得する(ステップS105)。
画像データ生成部401は、取得した背景画像データ9と模擬書類画像データとを用いて、転写書類学習データを生成する(ステップS106)。例えば、画像データ生成部401は、背景画像データ9が示す背景画像(背景画像データ9の画像領域)に対し、前景画像として模擬書類画像データの画像領域(模擬書類画像)を合成して、転写書類学習データを生成する。
画像データ生成部401は、ステップS105およびステップS106の処理(転写書類学習データ生成処理)を、模擬固有情報リストのレコード数分繰り返すことで、少なくとも模擬書類画像データのデータ数(教師データ記憶部42に記憶された模擬書類画像データの画像ファイル数)分の転写書類学習データを生成することができる。また、上述のように、模擬固有情報リストから各項目の情報を無作為に1件ずつ読み込む場合には、ステップS105およびステップS106の処理を予め設定された任意の件数分繰り返すことで、任意の件数の転写書類学習データを自動生成することができる。
次いで、教師データ自動生成部40の注釈データ付与部402は、転写書類学習データに対して、注釈データ(書類分割データ)を付与(アノテーション)して書類分割用教師データを生成する(ステップS107)。
さらに、注釈データ付与部402は、模擬書類画像に対して注釈データ(領域抽出データ)を付与(アノテーション)して領域抽出用教師データを生成する(ステップS108)。教師データ自動生成部40において生成される教師データ(書類分割用教師データ、領域抽出用教師データ)はいずれも、ステップS103で生成した模擬書類画像データが用いられている。
注釈データ付与部402は、生成した教師データ(書類分割用教師データ、領域抽出用教師データ)を教師データ記憶部42に記憶させる。
教師データ記憶部42に記憶された教師データは、データ出力部15に読み込まれ、ネットワーク3を介してコンピュータ54に出力される。これにより、コンピュータ54において、教師データ自動生成部40が生成した教師データを用いた機械学習が実行され、学習済みモデル(書類分割用学習済みモデル、領域抽出用学習済みモデル)が構築される。上述のようにコンピュータ54は、構築された学習済みモデルの複製を、ネットワーク3を介して情報処理装置100に出力する。これにより、画像処理部30が種々の画像処理に用いる学習済みモデルМが情報処理装置100に保持される。
このように、本実施形態に係る教師データ自動生成方法は、機械学習に用いられる教師データを自動で生成する教師データ自動生成方法であって、申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データ(例えば、雛形画像データ7)および、申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬情報リスト(例えば、模擬固有情報リスト)を記憶し、記憶された雛形画像データと該模擬固有情報リストに含まれる模擬固有情報データとに基づいて申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し(ステップS103)、模擬書類画像データを用いて教師データを生成する(ステップS107、ステップS108)。
本実施形態に係る教師データ自動生成方法によれば、申請用書類に関する教師データを効率的且つ簡便に生成することができ、審査効率を向上させることができる。
なお証明書類ではなく、申請書の雛形を示す雛形画像データおよび模擬固有情報リストに基づいて申請書を模した模擬書類画像データを生成し、当該模擬書類画像データを用いて教師データを生成する場合には、書類分割用教師データを生成するためのステップS104~107の処理は不要となる。
(1.4)教師データ自動生成プログラム
本実施形態に係る教師データ自動生成装置である情報処理装置100により実行される教師データ自動生成プログラムについて説明する。情報処理装置100は、機械学習に用いられる教師データを自動で生成する教師データ自動生成プログラムであって少なくとも以下の(a)、(b)の各動作をコンピュータに実行させるプログラムに従って、教師データ自動生成処理を行う。以下のプログラムは、例えばハードディスクドライブ、メモリ等の記録媒体やDVDディスク又はBlu-ray(登録商標)等の光ディスクに非一時的に記録される。以下のプログラムは、インターネットを介して配布されても良い。さらに、以下のプログラムは、クラウドサーバに記録され、インターネットを介して実行されても良い。
(a)申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データ(例えば、雛形画像データ7)および、申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リスト(例えば、模擬固有情報リスト410)を記憶すること
(b)前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを用いて前記教師データを生成すること
(1.5)変形例
(1.5.1)第一変形例
上記実施形態に係る教師データ自動生成方法(図12参照)では、書類分割用教師データの生成(ステップS107)を行った後に、領域抽出用教師データの生成(ステップS108)を実行する構成としたが、この構成に限られない。例えば図13に示すように、教師データ自動生成方法において、書類分割用教師データの生成(ステップS107)よりも前に、領域抽出用教師データの生成(ステップS108)を行う構成であってもよい。領域抽出用教師データの生成処理は模擬書類画像に対して注釈データ(領域抽出データ)を付与(アノテーション)する処理であるため、模擬書類画像データの生成後の任意のタイミングで実行することができる。このため、例えば図13に示すように、画像データ生成部401が模擬書類画像データを生成する処理(ステップS103)に次いで、注釈データ付与部402が模擬書類画像に対して注釈データ(領域抽出データ)を付与する処理(S108)を行う構成であってもよい。
(1.5.2)第二変形例
上記実施形態において、転写書類学習画像データの一例として、本人確認書類や領収書等の写しである証明書類を示す申請画像データを模した学習用画像データであって、背景画像データ(例えば背景画像データ9)と模擬書類画像データ(例えば模擬書類画像データ70)とを用いて生成した転写書類学習画像データ90について説明したが、本開示における転写書類学習画像データはこれに限られない。転写書類学習画像データは、模擬書類画像データおよび学習用画像データに加えてさらに別の画像データを用いた構成であってもよい。
例えば申請用書類のうち証明書類は、上述のように本人確認書類(免許証、保険証、および領収書等)の写しであるが、本人確認書類の写しである証明書類には、本人確認書類を印刷(転写紙に転写)して作成された証明書類(転写証明書類)の他にも、本人確認書類を撮影した写真画像を用いて作成された証明書類(撮影証明書類)が含まれる場合がある。ここで、当該写真画像を撮影する撮影機能を有する所定の端末装置(撮影装置の一例)としては、デジタルカメラ、スマートフォン、タブレット端末、パーソナルコンピューター等が挙げられる。
撮影証明書類には、例えば証明書類となる本人確認書類の写真画像を転写紙に印刷(プリントアウト)した書類や、印刷した写真画像を切り取って所定の台紙(転写紙など)に貼り付けた書類が含まれる。また撮影証明書類としては、複数種類の本人確認書類や本人確認書類の表面および裏面といった複数種類の写真画像をそれぞれ印刷し、印刷した複数種類の写真画像を切り取って一枚の台紙に貼り付けた書類が作成される場合もある。
このように、申請用書類の画像データである申請画像データには、撮影証明書類を示す申請画像データ(撮影証明書類画像データ)が含まれる場合がある。
上記のような場合を想定し、教師データ自動生成装置である情報処理装置100は、上述の撮影証明書類画像データを模した画像データである学習用画像データおよび当該学習用画像データを用いた教師データを生成可能に構成されてもよい。
〔撮影書類学習画像データの生成〕
本変形例では、図6から図9を参照しつつ図14および図15を用いて、転写書類学習画像データのさらに他の一例として、撮影証明書類画像データを模した学習用画像データである撮影書類学習画像データについて説明する。
図14は、本変形例における撮影書類学習画像データの一例を示す図である。図14に示すように、本変形例における撮影書類学習用画像データ900は、背景画像データ9と、一次合成画像データ750とで構成されている。詳しくは後述するが、一次合成画像データ750は、模擬書類画像データ70を用いて生成される。つまり、撮影書類学習用画像データ900は、背景画像データ9と模擬書類画像データ70を用いる点で上記実施形態における転写書類学習画像データ90と同様である。
なお、本例の撮影書類学習用画像データ900は、2種類の一次合成画像データ750(一次合成画像データ750a,750b)を含んだ画像データであるが、本開示はこれに限られず、撮影書類学習画像データに含まれる一次合成画像データは1種類でもよいし、3種類以上であってもよい。
〔撮影書類学習画像データの生成〕
図14は、本変形例における撮影書類学習画像データの一例を示す図である。図14に示すように、本変形例における撮影書類学習用画像データ900は、背景画像データ9と、一次合成画像データ750とが含まれている。一次合成画像データ750は、撮影証明書類に含まれる写真画像(本人確認書類を撮影した写真画像)を模した画像を示す画像データである。
まず、撮影書類学習用画像データ900において背景画像データ9に合成される一次合成画像データ750の生成について説明する。一次合成画像データ750は、撮影背景画像データ190と撮影模擬書類画像データ700とで構成されている。つまり、転写書類学習画像データのさらに他の一例である撮影書類学習用画像データ900は、背景画像データ9および模擬書類画像データ70に加えて、撮影背景画像データ190を用いて生成される構成である。
撮影模擬書類画像データ700は、模擬書類画像データ70を用いて生成された画像データであって、本人確認書類を撮影した写真画像の画像領域において、本人確認書類自体を示す画像領域(当該写真画像において背景に相当する領域を含まない画像領域)を模した画像データである。
上記端末装置で本人確認書類を撮影する場合、傾斜撮影となることが多いと想定される。ここで、「傾斜撮影」とは、上記端末装置のカメラレンズと被写体である申請書類とが正対していない(レンズ光軸が申請書類表面に対して直交していない)状態で撮影することを示す。本例において、撮影模擬書類画像データ700(撮影模擬書類画像データ700a,700b)は、上記端末装置で傾斜撮影された申請書類(証明書類)を模した画像データである。傾斜撮影された申請書類の写真画像では、撮影角度(レンズ光軸と被写体面との角度)により、正面撮影と比べて申請書類を示す画像領域が変形した状態になる。本例の撮影模擬書類画像データ700は、傾斜撮影により本人確認書類を示す画像領域が長方形上から台形状に変形した状態を模した画像データである。
本変形例における撮影模擬書類画像データは、模擬書類画像データ(本例では、模擬書類画像データ70)の一形態であって、模擬書類画像データを用いて生成される。
具体的には、画像データ生成部401は、教師データ記憶部42から読込んだ模擬書類画像データ70が示す画像(模擬書類画像データ70の画像領域)について変形処理を行い、撮影模擬書類画像データ700を生成する。本例において、画像データ生成部401は、模擬書類画像データ70a,70b(図9参照)を変形させて模擬書類画像データ700a,700bを生成する。
例えば画像データ生成部401は、射影変換により模擬書類画像データ70を変形させて撮影模擬書類画像データ700を生成する。これにより、傾斜撮影された本人確認書類(申請用書類の一例)を模した画像を示す撮影模擬書類画像データ700を生成することができる。画像データ生成部401は、生成した撮影模擬書類画像データ700を教師データ記憶部42に出力して記憶させる。
本例において画像データ生成部401は、射影変換によって長方形上の模擬書類画像データ70a,70bを台形状に変形させて模擬書類画像データ700a,700bを生成する。画像データ生成部401は、模擬書類画像データ70a,70bの四隅の各頂点の座標を台形の四隅の各頂点の座標と対応させる変換行列を用いて射影変換処理を行い、長方形状の模擬書類画像データ70a,70bから台形状の模擬書類画像データ700a,700bを生成する。
なお本開示において画像データ生成部401によって変形される模擬書類画像データ70の形状は、台形状に限られない。画像データ生成部401は、射影変換によって模擬書類画像データ70を任意の四角形状に変形することができる。画像データ生成部401が生成する撮影模擬書類画像データの形状は、図14に示す撮影模擬書類画像データ700a,700bのように台形状でもよいし、その他の四角形状(例えば、平行四辺形)であってもよい。
画像データ生成部401は、教師データ記憶部42に記憶されている全ての模擬書類画像データに変形処理を行って撮影模擬書類画像データを生成してもよいし、一部の模擬書類画像データに変形処理を行って撮影模擬書類画像データを生成してもよい。また一の模擬書類画像データ(例えば模擬書類画像データ70a)に対して異なる変換行列による射影変換処理を行うことで、一の模擬書類画像データから複数種類の撮影模擬書類画像データを生成してもよい。
また、画像データ生成部401が行う変形処理は、射影変換を用いたものに限らず、他の変換方式を用いてもよい。
次に、一次合成画像データ750を構成する撮影背景画像データ190について説明する。
撮影背景画像データ190は、撮影証明書類における写真画像(本人確認書類の写真画像)の背景領域を模した撮影背景画像を示す画像データである。撮影背景画像データ190は、生成用データ記憶部41に記憶されていればよい。図15は、撮影書類学習画像データの生成に用いられる撮影背景画像データの一例を示す図である。図15(a)から図15(e)に示すように、本変形例において撮影背景画像データ190(撮影背景画像データ190a~190e)は、床・壁・建具等に用いられる内装材の表面を示す画像領域を含んだ画像データである。内装材の表面は、木目柄、石目柄、布目柄、抽象柄、幾何学模様、文字、記号、単色無地等、絵柄や素材の種類に応じて様々である。本変形例では、一例として、色や模様(または素材)の異なる複数種類(本例では5種類)の撮影背景画像データ190が用意されている。
画像データ生成部401は、上述のようにして生成した撮影模擬書類画像データ700と撮影背景画像データ190とを用いて一次合成画像データ750を生成する。
具体的には、画像データ生成部401は、撮影背景画像データ190(図15参照)に対し前景画像として撮影模擬書類画像データ700(撮影模擬書類画像データ700の画像領域)を合成して一次合成画像データ750を生成する。これにより、図14に示すように、申請者が床や家具等に置いた本人確認書類を撮影した写真画像を模した画像を示す一次合成画像データ750が生成される。
本例では、画像データ生成部401は、撮影背景画像データ190bの画像領域に対して、撮影模擬書類画像データ700aの画像領域を前景として貼り付けて一次合成画像データ750aを生成する。また画像データ生成部401は、撮影背景画像データ190cの画像領域に対して、撮影模擬書類画像データ700bの画像領域を前景として貼り付けて一次合成画像データ750bを生成する。
なお、画像データ生成部401は、図8に示す転写書類学習画像データ90bにおける模擬書類画像データ70のように、撮影模擬書類画像データ700の画像領域と平行なXY平面内において所定角度で回転させた撮影模擬書類画像データ700を撮影背景画像データ190に合成して、一次合成画像データを生成してもよい。これにより、一次合成画像データにおいて撮影模擬書類画像データ700の画像領域を傾きが生じた状態(回転あり状態)とすることができる。
画像データ生成部401は、生成した一次合成画像データ750を教師データ記憶部42に出力して記憶させてもよい。
このように、本変形例において、画像データ生成部401は、撮影背景画像データ190と模擬書類画像データ70とを用いて申請用書類(例えば本人確認書類)を撮影した写真画像を模した画像である一次合成画像データ750を生成する。より具体的には、画像データ生成部401は、変形させた模擬書類画像データである撮影模擬書類画像データ700を撮影背景画像データ190に合成し、一次合成画像データ750を生成する。
また、本変形例において画像データ生成部401は、生成した一次合成画像データ750と背景画像データ9とを用いて、撮影書類学習用画像データ900を生成する。具体的には、画像データ生成部401は、背景画像データ9に対し前景画像として一次合成画像データ750(一次合成画像データ750の画像領域)を合成し、教師データを構成する画像データとして撮影書類学習用画像データ900を生成する。図14に示す本例の撮影書類学習用画像データ900は、図6に示す背景画像データ9bの画像領域に対して、一次合成画像データ750a,750bの画像領域を前景として貼り付けて生成されている。
撮影書類学習用画像データ900において背景画像データ9は、本人確認書類を撮影した写真画像を印刷した転写紙や、当該写真画像を張り付けた台紙の背景領域(余白部分)を模した背景画像示す画像データに相当する。
また画像データ生成部401は、転写書類学習画像データ90b(図8参照)における模擬書類画像データ70のように、撮影書類学習用画像データ900において一次合成画像データ750を回転あり状態とすることができる。つまり画像データ生成部401は、一次合成画像データ750の画像領域と平行なXY平面内において一次合成画像データ750を所定角度で回転させた状態(回転あり状態)で背景画像データ9に合成して、撮影書類学習用画像データ900を生成してもよい。
本例では、一次合成画像データ750aが回転なし状態で背景画像データ9に合成され、一次合成画像データ750bが回転あり状態で背景画像データ9に合成されている。なお、本開示において、撮影書類学習画像データは、複数の一次合成画像のうち一方のみが回転あり状態でもよいし、複数の一次合成画像のうちすべてが回転あり状態でもよいし、複数の一次合成画像がすべて回転なし状態でもよい。また、撮影模擬書類画像データに一つの一次合成画像が含まれる場合も、当該一の一次合成画像が回転あり状態でもよいし、回転なし状態でもよい。
このように、本変形例において画像データ生成部401は、撮影背景画像データ190と模擬書類画像データ70とを用いて本人確認書類を撮影した写真画像を模した画像である一次合成画像データ750(一次合成画像データ750a,750b)を生成し、一次合成画像データ750を背景画像データ9にさらに合成して撮影書類学習用画像データ900を生成する。
これにより、画像データ生成部401は、多種多様な撮影書類学習画像データを生成することができ、撮影転写書類学習用画像データを用いて生成される教師データをより実際の証明書類の申請画像データ(撮影証明書類画像データ)に近い態様とすることができる。
〔撮影転写書類学習用画像データのアノテーション〕
本変形例において、注釈データ付与部402は、画像データ生成部401が生成した撮影書類学習画像データが示す画像にアノテーションを行う。これにより、撮影転写書類学習用画像データと注釈データとを含む教師データが生成される。
本変形例において注釈データ付与部402は、撮影書類学習用画像データ900の画像領域内における撮影模擬書類画像データ700の画像領域に付与する注釈データとして、書類分割データを生成する。ここで、転写書類学習画像データ90に付与される書類分割データと区別して、撮影書類学習用画像データ900に付与される書類分割データを撮影書類分割データと称する。撮影書類分割データは、書類分割データの一例である。
撮影書類学習用画像データのアノテーションに用いる撮影書類分割データは、撮影書類学習用画像データ900の画像領域、すなわち背景画像データ9の画像領域のうち、撮影模擬書類画像データ700に相当する画像領域である撮影模擬書類領域710(撮影模擬書類領域710a,710b)の位置を示す撮影模擬書類位置情報を含んでいる。撮影模擬書類領域710は撮影模擬書類画像データ700を囲む矩形状の領域である。本変形例において撮影模擬書類位置情報は、撮影模擬書類領域710(撮影模擬書類領域710a,710b)の4つの角部の頂点のそれぞれの座標情報(X,Y)で構成される。これにより、転写書類学習画像データの一例である撮影書類学習用画像データ900の画像領域内における撮影模擬書類領域710の位置、すなわち撮影模擬書類画像データ700の位置を特定することができる。
注釈データ付与部402は、転写書類学習画像データ90への書類分割データの付与と同様の方法により、撮影書類学習用画像データ900に撮影書類分割データを付与する。
具体的には、注釈データ付与部402は、撮影模擬書類画像データ700における撮影模擬書類画像(撮影模擬書類領域710の画像情報)が示す申請用書類の種別と、撮影書類学習用画像データ900の画像領域のうち撮影模擬書類領域710の位置を示す撮影模擬書類位置情報とを関連付けた撮影書類分割データを取得し、当該撮影書類分割データを撮影書類学習用画像データ900に付与する。これにより、機械学習によって撮影書類学習用画像データ900に含まれる撮影模擬書類領域710を学習させるための教師データ(撮影書類分割用教師データ)が生成される。注釈データ付与部402は、少なくとも撮影書類学習用画像データのデータ数分の教師データ(撮影書類分割用教師データ)を自動生成することができる。
撮影書類分割データのデータ構造(フォーマット)は、上述の転写書類学習画像データ90に付与される書類分割データと同様であるため、詳細な説明は省略する。
撮影書類分割用教師データによる機械学習(例えば、教師あり学習)で生成された学習済みモデル(撮影書類分割用学習済みモデル)は、上記端末装置で撮影された本人確認書類を示す申請画像データ(撮影証明書類画像データ)を入力すると、出力結果として、撮影証明書類画像データに含まれる本人確認書類の画像領域の画像データ(証明書画像データ)と、当該画像データが示す申請書類の種別とを得ることができる。また出力される証明書画像データは、傾きが補正された回転なし状態となっている。
したがって、学習済みモデルМが撮影書類分割用学習済みモデルである場合、画像処理部30は撮影された証明書類(本人確認書類)を示す申請画像データを学習済みモデルМに入力することで、出力結果として申請画像データから分割され、傾きが補正された証明書画像データおよび申請書類の種別を得ることができる。これにより、画像処理部30は、効率的かつ簡便に精度の高い画像処理(画像分割処理)を実行し、審査画面に表示するための審査用画像データを効率的に生成することができる。これにより、教師データ自動生成部40は、審査効率を向上することができる。
(1.5.3)他の変形例
また上記実施形態では、情報処理装置100内において教師データ自動生成処理を行う例を説明したが、本開示はこれに限られない。本実施形態による教師データ自動生成装置は、情報処理装置100の一構成要素としてではなく単独で構成されてもよい。例えば、教師データ自動生成装置は、情報処理システム1に含まれる装置であって、情報処理装置100とネットワーク3を介して接続された所定のコンピュータ装置であってもよい。この場合、当該コンピュータ装置が教師データ自動生成部40、生成用データ記憶部41、教師データ記憶部42を備えていればよい。また、教師データの生成処理に係る情報のうち、記憶部12に記憶されている所定の情報は、データ出力部15によりネットワーク3を介して当該コンピュータ装置に出力されればよい。また、当該コンピュータ装置が生成した教師データは、ネットワーク3を介して情報処理装置100に出力されてもよいし、当該コンピュータ装置から、学習済みモデル生成装置であるコンピュータ54に出力されてもよい。
また、コンピュータ54が教師データ自動生成部40を備え、コンピュータ54において教師データを生成してもよい。これにより、生成された教師データによる追加学習を速やかに実行することができる。
また、教師データ自動生成部40は情報処理装置100に設けられ、生成用データ記憶部41および教師データ記憶部42が、情報処理装置100から独立したコンピュータ装置に設けられていてもよい。これにより、情報処理装置100において保持されるデータ容量を低減することができる。
以上、各実施形態により本開示を説明したが、本開示の範囲は、図示され記載された例示的な実施形態に限定されるものではなく、本開示が目的とするものと均等な効果をもたらす全ての実施形態をも含む。さらに、本開示の範囲は、請求項により画される発明の特徴の組み合わせに限定されるものではなく、全ての開示されたそれぞれの特徴のうち特定の特徴のあらゆる所望する組み合わせによって画されうる。
1 情報処理システム
3 ネットワーク
11 申請情報取得部
12 記憶部
13 審査部
14 表示データ出力部
15 データ出力部
30 画像処理部
40 教師データ自動生成部
31 審査画像記憶部
41 生成用データ記憶部
42 教師データ記憶部
51 読取装置
52 入力装置
53 表示装置
54 コンピュータ
100 情報処理装置
301 書類判定部
302 書類分割部
303 領域抽出部
304 領域分割部
401 画像データ生成部
402 注釈データ付与部

Claims (17)

  1. 機械学習に用いられる教師データを自動で生成する教師データ自動生成装置であって、
    申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データおよび、前記申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リストを記憶するデータ記憶部と、
    前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを含んで構成される前記教師データを生成する生成部と、を備える
    ことを特徴とする教師データ自動生成装置。
  2. 前記雛形画像データには、前記申請用書類における固有の情報の種類を示す項目画像情報が含まれ、
    前記生成部は、前記申請用書類における前記固有の情報の種類に対応する前記模擬固有情報データを前記雛形画像データに適用して前記模擬書類画像データを生成する
    ことを特徴とする請求項1に記載の教師データ自動生成装置。
  3. 前記生成部は、前記模擬書類画像データを少なくとも含む学習画像データを生成し、該学習画像データに対し該データ内の特定の画像領域の位置を含む注釈データを付与するアノテーションを行うことで前記教師データを生成する
    ことを特徴とする請求項1又は2に記載の教師データ自動生成装置。
  4. 機械学習に用いられる教師データを自動で生成する教師データ自動生成装置であって、
    申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データおよび、前記申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リストを記憶するデータ記憶部と、
    前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを用いて前記教師データを生成する生成部と、を備え、
    前記データ記憶部には、前記申請用書類が転写された転写紙の背景領域を模した背景画像を示す背景画像データが記憶され、
    前記生成部は、前記背景画像に対し前景画像として前記模擬書類画像データが示す模擬書類画像を合成し、前記教師データを構成する画像データとして転写書類学習画像データを生成する
    ことを特徴とする教師データ自動生成装置。
  5. 前記生成部は、前記背景画像と平行な面内において所定角度で回転させた前記模擬書類画像を前記背景画像に合成して、前記転写書類学習画像データを生成する
    ことを特徴とする請求項4に記載の教師データ自動生成装置。
  6. 前記生成部は、前記背景画像に対して一種類または複数種類の前記模擬書類画像データが示す画像を前記前景画像として合成し、一種類または複数種類の前記模擬書類画像を含む前記転写書類学習画像データを生成する
    ことを特徴とする請求項4又は5に記載の教師データ自動生成装置。
  7. 前記データ記憶部には、複数種類の前記背景画像データが記憶され、
    前記生成部は、前記転写書類学習画像データの生成時において複数種類の前記背景画像データのうち少なくとも一種類を無作為に選択する
    ことを特徴とする請求項4から6のいずれか1項に記載の教師データ自動生成装置。
  8. 前記データ記憶部には、前記申請用書類を撮影した写真画像の背景領域を模した撮影背景画像を示す撮影背景画像データが記憶され、
    前記生成部は、前記撮影背景画像と前記模擬書類画像とを用いて前記写真画像を模した画像を生成し、当該画像を前記背景画像にさらに合成して前記転写書類学習画像データを
    生成する
    ことを特徴とする請求項4から7のいずれか1項に記載の教師データ自動生成装置。
  9. 前記生成部は、変形させた該模擬書類画像を前記撮影背景画像に合成し、前記写真画像を模した画像を生成する
    ことを特徴とする請求項8に記載の教師データ自動生成装置。
  10. 前記生成部は、射影変換によって前記模擬書類画像を変形させる
    ことを特徴とする請求項9に記載の教師データ自動生成装置。
  11. 前記生成部は、
    前記転写書類学習画像データに含まれる前記模擬書類画像が示す前記申請用書類の種別と、前記転写書類学習画像データの画像領域のうち前記模擬書類画像に相当する模擬書類領域の位置とを関連付けた書類分割データを取得し、該書類分割データを前記転写書類学習画像データに付与して前記教師データを生成する
    ことを特徴とする請求項4から10のいずれか1項に記載の教師データ自動生成装置。
  12. 前記データ記憶部には、前記雛形画像データの画像領域のうち前記模擬固有情報データを適用する適用対象領域の位置情報が記憶され、
    前記生成部は、前記位置情報に基づいて前記模擬固有情報データを前記適用対象領域に適用して前記模擬書類画像データを生成する
    ことを特徴とする請求項1から11のいずれか1項に記載の教師データ自動生成装置。
  13. 前記データ記憶部には、それぞれ異なる種類の前記申請用書類の雛形を示す複数種類の前記雛形画像データと、複数種類の前記雛形画像データのそれぞれにおける前記適用対象領域の前記位置情報が記憶され、
    前記生成部は、複数種類の前記雛形画像データと前記模擬固有情報リストと複数種類の前記雛形画像データのそれぞれにおける前記位置情報とを用いて、複数種類の前記模擬書類画像データを生成する
    ことを特徴とする請求項2に記載の教師データ自動生成装置。
  14. 前記生成部は、
    前記模擬書類画像データに含まれる前記模擬固有情報データの項目と、該模擬書類画像データの画像領域のうち前記模擬固有情報データの画像情報を示す模擬固有情報領域の位置とを関連付けた領域情報データを取得し、該領域情報データを前記模擬書類画像データに付与して前記教師データを生成する。
    ことを特徴とする請求項1から1のいずれか1項に記載の教師データ自動生成装置。
  15. 前記申請用書類は、前記申請者の証明書類であって、免許証、保険証または領収書を示す書類のうち少なくとも一種類である
    ことを特徴とする請求項1から1のいずれか1項に記載の教師データ自動生成装置。
  16. コンピュータが、機械学習に用いられる教師データを自動で生成する教師データ自動生成方法であって、
    申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データおよび、前記申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リストを記憶し、
    前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを含んで構成される前記教師データを生成する
    ことを特徴とする教師データ自動生成方法。
  17. 機械学習に用いられる教師データを自動で生成する教師データ自動生成プログラムであって、
    申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データおよび、前記申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リストを記憶することと、
    前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを含んで構成される前記教師データを生成することと、をコンピュータに実行させる
    ことを特徴とする教師データ自動生成プログラム。
JP2022044268A 2022-03-18 2022-03-18 教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム Active JP7197042B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022044268A JP7197042B1 (ja) 2022-03-18 2022-03-18 教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022044268A JP7197042B1 (ja) 2022-03-18 2022-03-18 教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム

Publications (2)

Publication Number Publication Date
JP7197042B1 true JP7197042B1 (ja) 2022-12-27
JP2023137859A JP2023137859A (ja) 2023-09-29

Family

ID=84687871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022044268A Active JP7197042B1 (ja) 2022-03-18 2022-03-18 教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム

Country Status (1)

Country Link
JP (1) JP7197042B1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021047816A (ja) 2019-09-20 2021-03-25 トッパン・フォームズ株式会社 学習データ生成装置、学習データ生成方法、及びプログラム
JP2021060876A (ja) 2019-10-08 2021-04-15 キヤノン株式会社 学習データ生成装置、その制御方法、及びプログラム
CN112837263A (zh) 2020-12-21 2021-05-25 上海致宇信息技术有限公司 一种复杂背景下的身份证信息定位方法
US20210248420A1 (en) 2020-02-07 2021-08-12 International Business Machines Corporation Automated generation of structured training data from unstructured documents

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021047816A (ja) 2019-09-20 2021-03-25 トッパン・フォームズ株式会社 学習データ生成装置、学習データ生成方法、及びプログラム
JP2021060876A (ja) 2019-10-08 2021-04-15 キヤノン株式会社 学習データ生成装置、その制御方法、及びプログラム
US20210248420A1 (en) 2020-02-07 2021-08-12 International Business Machines Corporation Automated generation of structured training data from unstructured documents
CN112837263A (zh) 2020-12-21 2021-05-25 上海致宇信息技术有限公司 一种复杂背景下的身份证信息定位方法

Also Published As

Publication number Publication date
JP2023137859A (ja) 2023-09-29

Similar Documents

Publication Publication Date Title
JP5623079B2 (ja) ハード・コピーの書式からの書式定義の自動発生
Conway Digital transformations and the archival nature of surrogates
US8749800B2 (en) System for generating personalized documents
JP2007087322A (ja) ワークフローシステム、サーバ装置、ワークフローシステムの処理方法及びワークフロープログラム
Terras Digitization and digital resources in the humanities
US20120105901A1 (en) Document management support system, information management server apparatus, and information medium controller
CN111931780A (zh) 一种会计凭证智能管理方法及设备
JP2011060287A (ja) ワークフローサービスを実行するシステム及び方法
JP2021060629A (ja) 設問生成装置、設問生成方法、設問生成装置用プログラム、および、書類管理システム
JP7197042B1 (ja) 教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム
US20050022104A1 (en) Method and system for automating the production of publications
JP4254775B2 (ja) 書込画像取得装置、書込情報抽出方法、およびコンピュータプログラム
JP2007325196A (ja) 文書管理装置および文書管理方法
JP2022120902A (ja) 情報処理装置、学習装置、及び情報処理装置の制御方法
CN114972006A (zh) 图像生成方法、装置、设备和存储介质
JP2021182100A (ja) 採点支援方法
JP7176657B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
KR20100123959A (ko) 문서이미지 처리 시스템 및 그 방법
JP7268764B1 (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN117523417B (zh) 应用于自然资源统一确权登记的方法及电子设备
JP2000348048A (ja) 商品情報データベース、商品情報割付装置、ならびに割付校正システム
KR20110092414A (ko) 개인화된 대량의 포토앨범 제작 시스템 및 방법
JP6939863B2 (ja) 申請書処理装置及びプログラム
JP2018181220A (ja) マークシート解析システム
Akello et al. Developing guidelines for the digitisation of manual medical records at Entebbe Regional Referral Hospital

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220318

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220318

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221128

R150 Certificate of patent or registration of utility model

Ref document number: 7197042

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150