JP7197042B1 - 教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム - Google Patents
教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム Download PDFInfo
- Publication number
- JP7197042B1 JP7197042B1 JP2022044268A JP2022044268A JP7197042B1 JP 7197042 B1 JP7197042 B1 JP 7197042B1 JP 2022044268 A JP2022044268 A JP 2022044268A JP 2022044268 A JP2022044268 A JP 2022044268A JP 7197042 B1 JP7197042 B1 JP 7197042B1
- Authority
- JP
- Japan
- Prior art keywords
- data
- image data
- document
- simulated
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 94
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000013500 data storage Methods 0.000 claims abstract description 82
- 238000010801 machine learning Methods 0.000 claims abstract description 26
- 238000012546 transfer Methods 0.000 claims description 64
- 230000009466 transformation Effects 0.000 claims description 11
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 230000010365 information processing Effects 0.000 abstract description 97
- 238000012545 processing Methods 0.000 description 79
- 238000000605 extraction Methods 0.000 description 36
- 238000010586 diagram Methods 0.000 description 27
- 238000012795 verification Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 13
- 239000002131 composite material Substances 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012015 optical character recognition Methods 0.000 description 7
- 238000007639 printing Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
Description
さらに、申請用書類には個人情報が含まれる場合があり、中でも本人確認書類は身分を証明するものである。このため、機械学習の教師データとして用いる大量の申請画像データを収集すること自体が困難である。また教師データの生成のために、オペレータの入力操作などにより申請用書類を作成して画像データ化し、さらに当該画像データにメタデータを付与して画像処理に係る画像情報の意味づけ(アノテーション)を行う場合、多大な時間と労力が生じる。このため、申請画像データの画像処理へのAI技術の適用による審査効率の向上が十分に実現できていない。
そこで、本開示は、申請用書類に関する教師データを効率的且つ簡便に生成することができ、審査効率を向上させることができる教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラムを提供することを目的とする。
また上記目的を達成するために、本開示の他の一態様に係る教師データ自動生成装置は、機械学習に用いられる教師データを自動で生成する教師データ自動生成装置であって、申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データおよび、前記申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リストを記憶するデータ記憶部と、前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを用いて前記教師データを生成する生成部と、を備え、前記データ記憶部には、前記申請用書類が転写された転写紙の背景領域を模した背景画像を示す背景画像データが記憶され、前記生成部は、前記背景画像に対し前景画像として前記模擬書類画像データが示す模擬書類画像を合成し、前記教師データを構成する画像データとして転写書類学習画像データを生成することを特徴とする。
図1に示すように、情報処理システム1は、申請者から申請された申請情報を取得し、申請内容の審査を行うための申請情報処理システムとして用いられる。図1では、情報処理システム1の一例として、自治体の内部システムとして申請者からの申請手続きを受け付け、審査担当者による審査の結果を得る申請情報処理システムを図示している。なお、この情報処理システム1は、自治体から依頼を受けた企業等のシステムであっても良いし、サービスの申込者からの申請手続(申込手続)を受け付ける企業の内部システムであっても良い。
情報処理システム1は、自治体内部又は外部の印刷部門のシステムと接続され、印刷装置によって情報処理システム1からの出力に応じた通知状等の印刷物を作成することができる。また、情報処理システム1は、銀行のシステムと接続され、審査に応じた振込等を行ってもよい。
図2に示すように、申請情報処理システムである情報処理システム1は、情報処理装置100を含んで構成される。情報処理装置100は、申請者から申請された申請情報を取得し、申請内容の審査を行うための申請情報処理装置として機能する。情報処理装置100では、例えば紙媒体の申請用書類を画像データ化した申請画像データに対してAI技術による画像処理を行い、審査に適した画像データを生成することができる。
また本実施形態において情報処理装置100は、教師データ自動生成部40を備えている。これにより、情報処理装置100は、上述の画像処理向けの学習済みモデルの構築に用いる教師データを自動で生成する教師データ自動生成装置として機能する。すなわち、情報処理装置100は、本実施形態に係る教師データ自動生成装置に相当する。
図2に示すように、情報処理装置100(教師データ自動生成装置の一例)は、例えばコンピュータである。図2に示す各機能ブロックは、後に図11で説明する演算装置10のプロセッサ101が必要なプログラムを実行し、情報処理装置100の各部の動作を制御することにより実現される。
なお、コンピュータ54による学習済みモデルの生成機能を、情報処理装置100の一機能ブロックで実行するように構成されていてもよい。これにより、例えば教師データの追加時等における学習済みモデルの追加学習の結果を速やかに適用することができる。
また、読取装置51、入力装置52及び表示装置53は、情報処理装置100の一部として設けられていても良い。
以下、各機能ブロックについて説明する。
申請情報取得部(画像取得部の一例)11は、申請者からの申請用書類を電子データ化した申請画像データを取得するインタフェースである。情報処理装置100は、図2に示すように、申請情報が記入された申請用書類を読み取って申請用書類を電子データ化し、申請画像データを作成するスキャナ等の読取装置51と接続されている。
申請者から提出される申請用書類は、複数種類の属性に分類される。本実施形態における申請用書類の属性としては、例えば申請者の情報を含む(申請情報が記入された)申請書や、申請書に添付された証明書類が挙げられる。ここで、申請者には申請者本人だけでなく、申請者の家族等が含まれる場合もある。証明書類は、例えば申請者(申請者及び申請者の家族等)の本人確認書類の写しや申請内容の確認のための証明書類等である。例えば証明書類が示す本人確認書類は、免許証、保険証、および領収書等であって。証明書類は、これらの本人確認書類の写しである。領収書の写しは、例えば本人確認等のための補助書類として他の本人確認書類の写し(免許証や保険証の写し)と併せて提出されるものであり、例えば電気・水道・ガス等の公共料金領収書や、レシート等の写しである。なお上述のように申請者が提出する証明書類は、本人確認書類(例えば免許証、保険証、領収書等)を示す「写し」であるが、以下理解を容易にするため、証明書類の種類について単に「免許証」、「保険証」、「領収書」と記載する場合がある。
なお、証明書類は、申請書の添付書類として扱われる。添付書類には、上述の証明書類の他に、例えば請求書や注文書のような各種帳票が含まれる場合がある。
このように、本実施形態において申請情報取得部11は、申請画像データは、申請者が提出した申請用書類のうち申請者の申請情報を含む申請書及び申請者の証明書類の少なくとも一方の属性の申請書類の画像データである申請画像データを取得する。
また申請画像データは、例えば情報処理装置100に接続された画像データ取得用のコンピュータ装置(不図示)から出力され、申請情報取得部11が取得したものでもよい。画像取得用のコンピュータ装置は、読取装置51と同様に申請用書類を読み取って申請画像データを作成して出力する、スキャナ等の読取装置と接続されていればよい。画像取得用のコンピュータ装置は当該読取装置から出力された申請画像データを取得すると、取得した申請画像データを情報処理装置100に出力する。これにより、申請情報取得部11は、画像取得用のコンピュータ装置から申請画像データを取得することができる。なお、画像取得用のコンピュータ装置が出力した申請画像データは、記憶部12に記憶され、申請情報取得部11が記憶部12から申請画像データを読み込んでもよい。
このように、情報処理装置100(特に申請情報取得部11)は、読取装置51と接続されていない構成であってもよい。
記憶部12は、申請情報取得部11が取得した申請画像データと、申請者を示す申請者情報とを関連付けて記憶する。
また、記憶部12は、申請用書類の審査を行う審査担当者等によって、キーボード等の入力装置52を介して入力された情報を記憶する。例えば、後述するように、審査部13は、例えば「本人確認書類の氏名を確認して入力してください」「本人確認書類の氏名が申請書と一致しているか確認してください」等の審査項目が表示された審査画面61を表示装置53に表示し、審査担当者に文字入力やチェックリストの選択等による審査結果を入力させる。記憶部12は、入力装置52を介して審査担当者により入力された審査結果を示す情報を記憶する。また、記憶部12は、入力装置52を介して入力された、各申請データに対応する属性情報(例えば、申請者を示す情報等)を記憶する。
また、記憶部12は、画像処理部30における画像処理において参照される種々の情報を記憶する。また記憶部12は、申請画像データや申請者を示す申請者情報と、画像処理部30が生成した審査用画像データとを関連付けて記憶する。これにより、情報処理装置100において、審査用画像データがいずれの申請者の審査案件に関連するデータであるか、また審査用画像データがいずれの申請画像データから生成されたものであるか、を特定することができる。
審査部13は、申請画像データの内容、すなわち申請用書類の内容を審査するための審査項目が表示された審査画面を生成し、審査画面と申請画像データに基づく審査用画像データとを表示装置53に並べて表示させ、審査結果を取得して記憶部12に記憶させる機能を有している。申請書類の内容の確認は、審査担当者による審査画面及び審査用画像データの目視によって行われるため、当該機能による審査を目視審査ともいう。
より具体的に、審査部13は、審査画面の電子データ(審査画面データ)を生成し、審査の際に、審査担当者によって入力装置52から入力された情報(例えば、審査担当者が入力した審査結果)を取得する入力データを取得する。
審査部13は、各審査項目に対する審査結果に対応する入力データ(入力装置52から入力された情報)を取得する。審査部13は、一の審査用画像データに対する全審査項目に対する審査結果に対応する入力データを取得し、一の審査用画像データ(すなわち一申請者)に対する審査データを生成する。
審査部13は、審査データを各申請画像データ(各申請者)と紐づけて記憶部12に出力して記憶させる。
画像処理部30は、機械学習された学習済みモデルМを用いて申請画像データに対する画像処理を行い、審査部13における申請情報(申請画像データ)の内容の審査に用いる審査用画像データを生成する。例えば画像処理部30は、審査用画像データとして、審査部13が審査画面と並べて表示装置53に表示する画像データ(目視審査向けの審査用画像データ)を申請画像データから生成する。また情報処理装置100が審査サーバと接続されている場合、画像処理部30は、審査サーバに出力される画像データ(後述する自動審査向けの審査用画像データ)を申請画像データから生成可能である。
画像処理部30は、生成した審査用画像データを審査画像記憶部31に出力して保存する。
審査画像記憶部31は、画像処理部30が生成した審査用画像データを記憶する。具体的には、審査画像記憶部31は、審査用画像データをファイル形式で記憶する所定の記憶領域である。画像処理部30は、審査用画像データを生成すると審査画像記憶部31に審査用画像データを出力して、審査画像記憶部31に記憶させる。
またこのとき画像処理部30は、審査画像記憶部31内における審査用画像データの保存先(例えばディレクトリ、フォルダ)を示す保存先データを生成し、申請情報取得部11が取得した申請画像データおよび申請者情報の少なくとも一方と関連付けて記憶部12に記憶する。保存先データは、例えばファイルパスやURL(Uniform Resource Locator)であってもよい。これにより、例えば審査部13は、審査画面の生成時において、申請画像データに対応する審査用画像データを取得し、審査画面と審査用画像データとを並べて表示装置53に表示することができる。
教師データ自動生成部40は、生成用データ記憶部41に記憶されたデータに基づいて機械学習に用いられる教師データを自動で生成し、生成した教師データを教師データ記憶部42に出力して保存する。教師データ自動生成部40は、画像処理部30が申請画像データの画像処理に用いる学習済みモデル構築のための教師データ(アノテーションが行われた学習用画像データ)を生成する。教師データ自動生成部40および教師データの詳細は、後述する。
生成用データ記憶部(データ記憶部の一例)41は、教師データの生成に用いる各種データを記憶する。生成用データ記憶部41に記憶される各種データの詳細は、後述する。
教師データ記憶部42は、教師データ自動生成部40が生成した教師データを記憶する。教師データ記憶部42は、アノテーションされた学習用画像データである教師データをファイル形式で記憶する所定の記憶領域である。教師データ自動生成部40は、教師データを生成すると教師データ記憶部42に教師データを出力して記憶させる。
またこのとき教師データ自動生成部40は、教師データ記憶部42における教師データの保存先(例えばディレクトリ、フォルダ)を示す保存先データを生成し、教師データの種類と関連付けて記憶部12に記憶してもよい。保存先データは、例えばファイルパスやURL(Uniform Resource Locator)であってもよい。
表示データ出力部14は、審査部13が生成した表示データおよび画像処理部30が生成した審査用画像データを表示装置53に出力する。
データ出力部15は、入力装置52からの指示に応じて、記憶部12に記憶された申請画像データに対応する審査データを情報処理装置100の外部に出力する。審査データは、例えば、申請者が申請を行った手続き(例えば給付金等の受給手続き)の内容と、各申請者の申請内容の審査結果(例えば可決又は否決)の一覧が含まれる。データ出力部15は、指定された一又は複数の申請者に対する審査データを出力してもよく、記憶部12に記憶されたすべての審査データを一括して出力しても良い。
また、データ出力部15は、画像処理部30から審査用画像が入力されたことに応じて、入力された審査用画像を情報処理装置100の外部に出力してもよいし、審査画像記憶部31に記憶された審査用画像データを読み込んで、情報処理装置100の外部に出力してもよい。
データ出力部15は、例えばLANを介して接続された自治体内の所定のコンピュータ等に審査データを出力することができる。また、データ出力部15は、インターネットを介して接続された外部の所定のコンピュータ等に審査データを出力することもできる。このため、情報処理システム1は、自治体の内部で運用されてもよく、自治体から審査を請け負った外部企業において運用されても良い。情報処理システム1が外部企業において運用される場合、当該企業は、申請書の受付、申請データの作成、審査、審査データの作成等を行い、審査データ、又は申請データ及び審査データの双方をインターネットを介して自治体に送信することができる。
つまり、情報処理装置100は、審査サーバと接続されている場合には、申請用書類の内容の審査として、上述の目視審査と自動審査との2種類の種別の審査を実施することができる。なお、本実施形態において情報処理装置100と審査サーバとの接続は必須ではなく、情報処理装置100は審査サーバと接続されていてもよいし、接続されていなくてもよい。つまり、情報処理装置100は自動審査を実行せずに目視審査のみを実行可能に構成されていてもよい。したがって、画像処理部30は少なくとも目視審査向けの審査用画像データを生成すればよい。
次に、本実施形態に係る教師データ自動生成装置である情報処理装置100において、教師データ自動生成部40が実行する教師データ自動生成処理の詳細及び教師データ自動生成処理を実行する機能構成について、図2から図10を用いて詳細に説明する。
図2に示すように、教師データ自動生成部40は、教師データを構成する学習用画像データを生成する画像データ生成部401と、学習用画像データ内の画像情報に対する注釈データ(メタデータ)の付与による意味づけ、すなわちアノテーションを行う注釈データ付与部402と、を有している。教師データ自動生成部40は、画像データ生成部401が生成した学習用画像データに対して、注釈データ付与部402がアノテーションを行うことにより、教師データ生成することができる。生成された教師データは教師データ記憶部42に記憶され、データ出力部15によりネットワーク3を介してコンピュータ54に出力される。これにより、教師データ自動生成部40の生成した教師データに基づく機械学習が実行されて、申請画像データの画像処理向けの学習済みモデルが構築される。
画像データ生成部401は、生成用データ記憶部41に記憶されている教師データ生成用の各種データに基づいて、申請者が提出する申請用書類(申請書や、本人確認書類等の証明書類)を模した模擬書類画像を示す模擬書類画像データを生成する。模擬書類画像データは申請用書類を模した内容の画像情報を含んでおり、画像データ生成部401はこの模擬書類画像データを用いて、学習用画像データを生成する。模擬書類画像データは、申請用書類の雛形(テンプレート)を示す画像データに、申請用書類の内容を模した文字情報を示すデータ(文字列データ)を適用して生成される。
まず、生成用データ記憶部41に記憶されている教師データの生成用のデータについて説明する。生成用データ記憶部41には、例えば模擬書類画像データに生成に用いるデータとして、模擬書類画像データの生成に用いる画像データである雛形画像データが記憶されている。
雛形画像データは、申請内容の審査のために申請者が提出する申請用書類の雛形(テンプレート)を示す画像データである。ここで、雛形画像データについて、本人確認に用いる証明書類の雛形を示す雛形画像データを例にとって説明する。
図3は、生成用データ記憶部41が記憶する雛形画像データの一例を示す模式図である。図3では、雛形画像データの一例として証明書類が示す本人確認書類のうち免許証の雛形を示す雛形画像データ7を図示している。
証明内容情報としては、証明書類が示す本人確認書類の有効年月日や交付日(発行日)、証明書類が示す本人確認書類に割り振られた固有の番号(例えば免許証番号)、証明書類が示す本人確認書類の発行者を示す情報等が想定される。つまり、証明書類における固有情報とは、個人情報と証明内容情報とを含んで構成される情報である。
また、図3に示すように、本例では免許証の顔写真の領域に相当する画像領域である写真領域725には、所定の写真画像(例えば、使用許可を得た所定の顔写真画像や、合成技術により作成した架空の顔写真画像)を適用することができる。なお写真領域725は、雛形画像データでは空白(ブランク)の画像領域としてもよいが、実際の免許証との類似性を向上する観点では、少なくとも模擬書類画像データの生成時に写真画像を適用することが好ましい。
雛形画像データが示す申請用書類の雛形は、申請者の証明書類であって、免許証、保険証または領収書を示す書類のうち少なくとも一種類(免許証、保険証または領収書のうち少なくとも一種類の写し)の雛形であってもよい。
雛形画像データが示す申請用書類が定型書類、準定型書類、非定型書類のいずれであっても、本実施形態に係る教師データ自動生成装置(情報処理装置100)において雛形画像データを適用した模擬書類画像データを用いて教師データを生成し、当該教師データを用いて学習済みモデルMが構築されることで、当該学習済みモデルMによる画像処理の精度を向上し、ひいては審査効率を向上することができる。
例えば申請書が定型書類または準定型書類に相当する場合、雛形画像データは、申請情報を含む申請書の雛形を示す画像データであってもよい。申請書には、固有情報として、個人情報に加えて申請内容に関する情報(申請者が入力(記載)した申請内容情報)が含まれる。このため、申請書の雛形を示す雛形画像データには、申請書に含まれる固有情報の項目を示す画像情報を含む証明項目領域と、証明項目領域に対応する固有情報の内容が適用される申請内容領域とが含まれる。
また生成用データ記憶部41には、例えば模擬書類画像データに生成に用いるデータとして、模擬書類画像データの生成に用いる文字情報データであって、申請用書類における上述の固有情報を模したデータが登録された模擬固有情報リストが記憶されている。ここで、模擬固有情報リストにおいて、証明書類に含まれる固有情報を模したデータが登録されている場合を例にとって説明する。
また模擬固有情報リスト410において、模擬個人情報の各データは、データ内容を示す項目データと対応付けられている。図4では、模擬個人情報に対応する項目データとして「氏名」「住所」「生年月日」「性別」が例示されている。これらの項目データは、雛形画像データ(例えば、雛形画像データ7)の各証明項目領域723に含まれる画像情報が示す項目と対応している。つまり、模擬固有情報リスト410は、雛形画像データに合わせて、証明項目領域723に対応する項目データと、証明内容領域724に適用する模擬固有情報データとを対応付けて管理している。
また模擬固有情報リスト410には、各レコードを一意に識別する識別用データ(識別番号や識別コード)が付与されていてもよい。本例では、識別用データとして識別番号(「No」)が付与されている。
なお、模擬固有情報リスト410の形式は上述のように一例であって、本開示における模擬固有情報リストの形態はこれに限られない。例えば模擬固有情報リストは、項目ごとに分かれた複数のリストで構成され、項目に応じた各リスト中から無作為に情報を選択する形式であってもよい。また、模擬個人情報および模擬内容情報がそれぞれ異なるリストに登録されており、各リストを対応付けて管理することによって模擬固有情報リストを構成してもよい。
教師用データの生成に実在の申請者が提出した申請用書類を示す画像データや、実在の申請者の個人情報を含む固有情報リストを用いる場合、個人情報の使用許可や高度な情報セキュリティを適用した個人情報の管理が必要となり、情報処理システム1の運用組織において大きな作業負荷が生じる。本実施形態では、固有情報を含まない模擬固有情報リストの情報を用いることで、情報処理システム1の運用組織における作業負荷を低減することができる。
また、本開示において、雛形画像データは、固有情報のうち個人情報のみを除いた画像データであってもよい。この場合、固有情報のうち証明書類における証明内容情報や申請書における申請内容情報は、予め雛形画像データに含まれていてもよい。これにより、模擬固有情報リストには模擬内容情報を登録する必要がなく、模擬個人情報のデータが登録されていればよい。このため、生成用データ記憶部41に記憶されるデータ量を削減することができる。
画像データ生成部401は、雛形画像データ(例えば雛形画像データ7)と模擬固有情報リスト(例えば模擬固有情報リスト410)に含まれる模擬固有情報データとに基づいて申請用書類を模した模擬書類画像を示す模擬書類画像データを生成する。教師データ自動生成部40は、画像データ生成部401が生成した模擬書類画像データ70を用いて教師データを生成する。これにより、教師データを生成するために多大な時間をかけて申請画像データを収集・生成をする必要がなく、速やかに教師データを自動生成することができる。つまり、本実施形態に係る教師データ自動生成装置である情報処理装置100は、申請用書類に関する教師データの生成を効率的且つ簡便に行うことができ、学習済みモデルを速やかに構築してAI技術の適用により審査効率を向上させることができる。
以下、図5を用いて模擬書類画像データの生成についてより具体的に説明する。図5は、模擬書類画像データの一例を示す模式図である。
生成用データ記憶部41には、雛形画像データの画像領域のうち模擬固有情報リストに登録された模擬固有情報データを適用する適用対象領域の位置情報(適用位置情報)が記憶されている。例えば、生成用データ記憶部41には、雛形画像データ7の画像領域のうち、模擬固有情報データを適用する証明内容領域(適用対象領域の一例)724(証明内容領域724a~724f)の位置情報が適用位置情報として記憶されている。
例えば、証明内容領域724aを示す適用位置情報には、証明内容領域724に対応する証明項目領域723(証明項目領域723a)に含まれる項目(「氏名」)を示すデータ(例えば文字情報データ「Name」)が関連付けられている。これにより、画像データ生成部401は、模擬固有情報リスト410から、証明項目領域723aに対応する模擬個人情報のデータ(例えば「A川A子」)を取得し、適用位置情報に基づいて証明内容領域724aに当該模擬個人情報のデータを適用する。これにより、より実際の証明書類の画像データ(例えば、免許証を示す申請画像データ)に近い態様の画像データとして、模擬書類画像データ70を生成することができる。
同様にして、画像データ生成部401は、模擬固有情報リスト410内の各データをコピー雛形画像データの証明内容領域724b~724fに適用する。これにより、コピー雛形画像データの証明内容領域724のすべてに対して、模擬固有情報リスト410内の対応する模擬固有情報データが適用され、免許証を模した模擬書類画像データである模擬書類画像データ70を生成することができる。
このように、本実施形態に係る教師データ自動生成装置である情報処理装置100は、教師データにおける学習用画像データとして用いられる多数の模擬書類画像データ(本例では、模擬書類画像データ70)を、自動で生成することができる。これにより、情報処理装置100は、学習用画像データに用いられる模擬書類画像データを効率的かつ簡便に生成することができ、ひいては教師データを効率的かつ簡便に生成して審査効率を向上させることができる。
またこの場合、画像データ生成部401は、複数種類の雛形画像データと模擬固有情報リスト410と複数種類の雛形画像データのそれぞれにおける適用位置情報とを用いて、複数種類の模擬書類画像データを生成すればよい。
これにより、種別の異なる証明書類(例えば免許証、保険証等)や申請書に対応する雛形画像データに基づいて、多様な模擬書類画像データを作成することができる。なおこの場合、適用位置情報は雛形画像データの種別(雛形画像データが示す書類の種別)と関連付けて、生成用データ記憶部41に記憶されていればよい。
また、雛形画像データが準定型書類(例えば保険証)の雛形を示す画像データである場合、当該準定型書類の書式パターンごとに適用位置情報が用意されていてもよい。
次に、画像データ生成部401による学習用画像データの生成について説明する。上述のように、画像データ生成部401は、模擬書類画像データ70を用いて、教師データを構成する画像データ(学習用画像データ)を生成する。なお詳しくは後述するが、本実施形態において、上述した模擬書類画像データの生成処理で生成された模擬書類画像データ自体も、学習用画像データとして用いられる。
まず、画像データ生成部401が生成する学習用画像データの一例である転写書類学習データについて説明する。転写書類学習データは、申請用書類の画像データである申請画像データのうち、申請者が提出した証明書類を示す申請画像データを模した画像データである。
図6に示すように、本実施形態において背景画像データ9(背景画像データ9a~9e)は、転写紙の背景領域におけるインクの濃淡やかすれを再現したグレースケールの画像領域を含んでいる。転写紙の背景領域の態様は、印刷環境や印刷機の種類等に応じて様々である。このため、本実施形態では、グレースケールの画像領域のサイズや灰色の階調の異なる複数種類(本例では5種類)の背景画像データ9が用意されている。
本実施形態において画像データ生成部401は、背景画像データ9に対し前景画像として模擬書類画像データ70(模擬書類画像データ70の画像領域)を合成し、教師データを構成する画像データとして転写書類学習画像データ90(転写書類学習画像データ90a)を生成する。図7に示す転写書類学習画像データ90aは、図6に示す背景画像データ9aの画像領域に対して、模擬書類画像データ70の画像領域を前景として貼り付けて生成されている。
また画像データ生成部401は、回転あり状態の模擬書類画像データを含む転写書類学習画像データとして、模擬書類画像データの画像領域の回転角度が異なる複数種類の画像データを生成することができる。
図9に示すように、本実施形態において転写書類学習画像データ90に含まれる模擬書類画像データ(模擬書類画像データの画像領域)は一種類に限られず、複数種類の模擬書類画像データが含まれていてもよい。つまり、画像データ生成部401は、一の背景画像データ9(例えば背景画像データ9a)に対して複数種類(本例では、2種類)の模擬書類画像データが示す画像を前景画像として合成し、複数種類の模擬書類画像を含む転写書類学習画像データ90cを生成することができる。
これにより、画像データ生成部401は多種多様な転写書類学習画像データ90を生成することができ、転写書類学習用画像データを用いて生成される教師データをより実際の証明書類の申請画像データに近いものとすることができる。
ここで、模擬書類画像データが示す申請用書類は、申請者の証明書類であって、免許証、保険証または領収書を示す書類のうち少なくとも一種類(免許証、保険証または領収書のうち少なくとも一種類の写し)であればよく、申請書であってもよい。これにより、本人確認書類の写しとして申請者が提出する頻度が高い証明書類(免許証、保険証、領収書等の写し)に模した模擬書類画像データを生成し、これを用いた学習用画像データを生成することができる。なお、申請用書類における申請者の証明書類は、上述したものに限られず、申請業務の内容に応じて種々の書類が想定される。例えば、行政関係の申請業務であれば、戸籍謄本や住民票等の写しが申請用書類として想定される。また車両の登録等の申請業務であれば、申請書に加えて車検証や点検記録簿等が申請用書類として想定される。本実施形態において画像データ生成部401は、これらの種々の申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、これを用いた学習用画像データを生成することができる。
具体的には、画像データ生成部401は、転写紙の背景領域を模した背景画像を示す背景画像データ9に対し前景画像として前記模擬書類画像データを合成し、教師データを構成する画像データとして転写書類学習画像データを生成することができる。
これにより、画像処理部30が行う画像処理向けの学習済みモデルの構築に用いる教師データを構成する学習用画像データを生成することができる。
教師データ自動生成部40において注釈データ付与部402は、画像データ生成部401が生成した学習用画像データ(模擬書類画像データ、転写書類学習データ)が示す画像にメタデータ(注釈データ)を付与して意味づけ(アノテーション)を行う。これにより、学習用画像データと注釈データとを含む教師データが生成される。
注釈データ付与部402は、転写書類学習データに付与する注釈データとして、書類分割データを生成する。書類分割データは、転写書類学習用画像データの画像領域内における模擬書類画像データの画像領域をアノテーションするための注釈データである。
書類分割データは、転写書類学習画像データ90の画像領域、すなわち背景画像データ9の画像領域のうち、模擬書類画像データ70に相当する画像領域である模擬書類領域71の位置を示す模擬書類位置情報を含んでいる。模擬書類領域71は模擬書類画像データ70を囲む矩形状の領域である。本実施形態において模擬書類位置情報は、模擬書類領域71aの4つの角部の頂点P1~P4のそれぞれの座標情報(X,Y)で構成される。これにより、転写書類学習画像データ90の画像領域内における模擬書類領域71の位置、すなわち模擬書類画像データ70の位置を特定することができる。
注釈データ付与部402は、少なくとも転写書類学習用画像データのデータ数分の教師データ(書類分割用教師データ)を自動生成することができる。
これにより、転写書類学習画像データ90aに対し、模擬書類領域71(模擬書類領域71a)が表す申請用書類の種別が「免許証」であることに関連付けて、転写書類学習画像データ90aにおける模擬書類領域71の位置を示す模擬書類位置情報がアノテーションされる。したがって、転写書類学習画像データ90aに書類分割データをアノテーションした教師データにより、証明書類の申請画像データについて、傾きが生じていない証明書類の種別および画像領域を認識・検出するための学習を行うことができる。
また、画像データ生成部401が注釈データ付与部402の機能を実装することで、転写書類学習画像データ90の生成に伴って、注釈データ(ここでは、書類分割データ)の取得および付与を行ってもよい。
したがって、学習済みモデルМが書類分割用学習済みモデルである場合、当該画像処理部30は証明書類を示す申請画像データを学習済みモデルМに入力することで、出力結果として申請画像データから分割され、傾きが補正された証明書画像データおよび申請書類の種別を得ることができる。これにより、画像処理部30は、効率的かつ簡便に精度の高い画像処理(画像分割処理)を実行し、審査画面に表示するための審査用画像データを効率的に生成することができる。これにより、教師データ自動生成部40は、審査効率を向上することができる。
注釈データ付与部402は、模擬書類画像データに付与する注釈データとして、領域抽出データを生成する。領域抽出データは、模擬書類画像データの画像領域内における特定の領域をアノテーションするための注釈データである。本実施形態において、領域抽出データは、模擬書類画像データ(例えば、模擬書類画像データ70)における模擬固有情報データの画像情報を含む模擬固有情報領域(証明項目領域723および証明内容領域724)をアノテーションするための注釈データである。
図10(a)は、図5に示す模擬書類画像データ70(図7から図9に示す模擬書類画像データ70aに相当)の画像領域の一部を抜粋して示す図である。
例えば注釈データ付与部402は、模擬書類画像データ70の画像領域内において、模擬固有情報データ(ここでは、免許証の模擬書類画像データが示す氏名)を含む模擬固有情報領域170aの位置情報(審査領域位置情報)を取得する。具体的には、注釈データ付与部402は、模擬固有情報領域170aの位置を示す審査領域位置情報として模擬書類画像データ70の画像領域内における証明項目領域723の位置情報および証明内容領域724の位置情報を取得する。注釈データ付与部402は、審査領域位置情報として座標情報を含む位置情報を取得する。
なお、本例では注釈データ付与部402が書類分割用教師データおよび領域抽出用教師データを生成する例を説明したが、本開示はこれに限られない。注釈データ付与部402は、書類分割データや領域抽出データとは異なる注釈データを学習用画像データ(転写書類学習データ、模擬書類画像データ)に付与することで、さらに異なる種類の教師データを生成するように構成されてもよい。また、注釈データ付与部402は、書類分割用教師データおよび領域抽出用教師データのうち少なくとも一方を生成する構成であってもよい。
また、教師データ自動生成部40(特に注釈データ付与部402)が生成した教師データ(書類分割用教師データ、領域抽出用教師データ、書類分類用教師データ)は、学習済みモデルの評価を行う検証データとして用いられてもよい。情報処理装置100では、当該評価の結果に基づいて教師データの内容の調整などを行い、最終的な学習済みモデルの生成に必要なデータをコンピュータ54に出力することができる。
図11は、情報処理装置100の機能部におけるハードウェア構成の一例を示す概略図である。図11に示すように、情報処理システム1は、演算装置10により実現される。演算装置10は、プロセッサ101、ROM(Read Only Memory)102、RAM(Random access memory)103及び補助記憶装置(メモリ)104を備える情報処理装置(コンピュータ)である。
演算装置10には、例えば外部インタフェース(I/F)105を介して読取装置51、入力装置52及び表示装置53、並びに外部記憶媒体57が接続されている。外部インタフェース(I/F)105は、例えばUSB(Universal Serial Bus)ポート等である。
ここで、読取装置51、入力装置52及び表示装置53は、図2に示す情報処理装置100に接続された読取装置51、入力装置52及び表示装置53である。また、読取装置51、入力装置52、表示装置53及びコンピュータ55は、演算装置10と接続するためのユーザインタフェース(不図示)を備えている。ここで、演算装置10の各部のハードウェア資源が所定のプログラムと協働することにより、情報処理装置100の申請情報取得部11、記憶部12、審査部13、画像処理部30、教師データ自動生成部40、審査画像記憶部31、生成用データ記憶部41、教師データ記憶部42及び表示データ出力部14及びデータ出力部15の各機能が構築される。
ROM102は、教師データを生成する教師データ自動生成処理を実行する教師データ自動生成プログラムと、審査用画像データを生成する画像処理を実行する画像処理プログラムと、申請手続きを受け付け、審査担当者による審査の結果を得る申請情報処理方法を実行するプログラムとを格納している。
RAM103は、計算データ、入力装置52を介して審査担当者により入力された各種データ等が一時的に格納されている。
表示装置53は、例えば液晶ディスプレイ(LCD:Liquid Crystal Display)や有機ELディスプレイ(OELD:Organic Electro-Luminescence Display)であり、外部インタフェース105を介して演算装置10から各種データを受信して表示する。表示装置53は、例えば演算装置10のメモリ上に読み込まれた各データ、プログラム等が実行された結果として得られたデータ、読取装置51がスキャンして得られた申請用書類の画像データに基づく審査用画像データ、審査部13での審査の過程で出力されたデータ等を表示する。
以下、本実施形態に係る情報処理方法について、図12を用いて説明する。図12は、本実施形態に係る教師データ自動生成方法の一例を説明するフローチャートである。
教師データ自動生成部40の画像データ生成部401は、生成用データ記憶部41から模擬書類画像データを生成するための雛形画像データを取得する(ステップS101)。画像データ生成部401は、例えば模擬書類画像データの生成を開始することを示す所定の契機(例えば、模擬固有情報リストの更新や新たなレコードの追加、模擬書類画像データの生成周期の到来等)が生じたことに基づいて、雛形画像データを取得する。これにより擬書類画像データの生成処理が開始される。
画像データ生成部401は、取得した背景画像データ9と模擬書類画像データとを用いて、転写書類学習データを生成する(ステップS106)。例えば、画像データ生成部401は、背景画像データ9が示す背景画像(背景画像データ9の画像領域)に対し、前景画像として模擬書類画像データの画像領域(模擬書類画像)を合成して、転写書類学習データを生成する。
さらに、注釈データ付与部402は、模擬書類画像に対して注釈データ(領域抽出データ)を付与(アノテーション)して領域抽出用教師データを生成する(ステップS108)。教師データ自動生成部40において生成される教師データ(書類分割用教師データ、領域抽出用教師データ)はいずれも、ステップS103で生成した模擬書類画像データが用いられている。
注釈データ付与部402は、生成した教師データ(書類分割用教師データ、領域抽出用教師データ)を教師データ記憶部42に記憶させる。
本実施形態に係る教師データ自動生成方法によれば、申請用書類に関する教師データを効率的且つ簡便に生成することができ、審査効率を向上させることができる。
なお証明書類ではなく、申請書の雛形を示す雛形画像データおよび模擬固有情報リストに基づいて申請書を模した模擬書類画像データを生成し、当該模擬書類画像データを用いて教師データを生成する場合には、書類分割用教師データを生成するためのステップS104~107の処理は不要となる。
本実施形態に係る教師データ自動生成装置である情報処理装置100により実行される教師データ自動生成プログラムについて説明する。情報処理装置100は、機械学習に用いられる教師データを自動で生成する教師データ自動生成プログラムであって少なくとも以下の(a)、(b)の各動作をコンピュータに実行させるプログラムに従って、教師データ自動生成処理を行う。以下のプログラムは、例えばハードディスクドライブ、メモリ等の記録媒体やDVDディスク又はBlu-ray(登録商標)等の光ディスクに非一時的に記録される。以下のプログラムは、インターネットを介して配布されても良い。さらに、以下のプログラムは、クラウドサーバに記録され、インターネットを介して実行されても良い。
(b)前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを用いて前記教師データを生成すること
(1.5.1)第一変形例
上記実施形態に係る教師データ自動生成方法(図12参照)では、書類分割用教師データの生成(ステップS107)を行った後に、領域抽出用教師データの生成(ステップS108)を実行する構成としたが、この構成に限られない。例えば図13に示すように、教師データ自動生成方法において、書類分割用教師データの生成(ステップS107)よりも前に、領域抽出用教師データの生成(ステップS108)を行う構成であってもよい。領域抽出用教師データの生成処理は模擬書類画像に対して注釈データ(領域抽出データ)を付与(アノテーション)する処理であるため、模擬書類画像データの生成後の任意のタイミングで実行することができる。このため、例えば図13に示すように、画像データ生成部401が模擬書類画像データを生成する処理(ステップS103)に次いで、注釈データ付与部402が模擬書類画像に対して注釈データ(領域抽出データ)を付与する処理(S108)を行う構成であってもよい。
上記実施形態において、転写書類学習画像データの一例として、本人確認書類や領収書等の写しである証明書類を示す申請画像データを模した学習用画像データであって、背景画像データ(例えば背景画像データ9)と模擬書類画像データ(例えば模擬書類画像データ70)とを用いて生成した転写書類学習画像データ90について説明したが、本開示における転写書類学習画像データはこれに限られない。転写書類学習画像データは、模擬書類画像データおよび学習用画像データに加えてさらに別の画像データを用いた構成であってもよい。
撮影証明書類には、例えば証明書類となる本人確認書類の写真画像を転写紙に印刷(プリントアウト)した書類や、印刷した写真画像を切り取って所定の台紙(転写紙など)に貼り付けた書類が含まれる。また撮影証明書類としては、複数種類の本人確認書類や本人確認書類の表面および裏面といった複数種類の写真画像をそれぞれ印刷し、印刷した複数種類の写真画像を切り取って一枚の台紙に貼り付けた書類が作成される場合もある。
上記のような場合を想定し、教師データ自動生成装置である情報処理装置100は、上述の撮影証明書類画像データを模した画像データである学習用画像データおよび当該学習用画像データを用いた教師データを生成可能に構成されてもよい。
本変形例では、図6から図9を参照しつつ図14および図15を用いて、転写書類学習画像データのさらに他の一例として、撮影証明書類画像データを模した学習用画像データである撮影書類学習画像データについて説明する。
図14は、本変形例における撮影書類学習画像データの一例を示す図である。図14に示すように、本変形例における撮影書類学習用画像データ900は、背景画像データ9と、一次合成画像データ750とで構成されている。詳しくは後述するが、一次合成画像データ750は、模擬書類画像データ70を用いて生成される。つまり、撮影書類学習用画像データ900は、背景画像データ9と模擬書類画像データ70を用いる点で上記実施形態における転写書類学習画像データ90と同様である。
なお、本例の撮影書類学習用画像データ900は、2種類の一次合成画像データ750(一次合成画像データ750a,750b)を含んだ画像データであるが、本開示はこれに限られず、撮影書類学習画像データに含まれる一次合成画像データは1種類でもよいし、3種類以上であってもよい。
図14は、本変形例における撮影書類学習画像データの一例を示す図である。図14に示すように、本変形例における撮影書類学習用画像データ900は、背景画像データ9と、一次合成画像データ750とが含まれている。一次合成画像データ750は、撮影証明書類に含まれる写真画像(本人確認書類を撮影した写真画像)を模した画像を示す画像データである。
具体的には、画像データ生成部401は、教師データ記憶部42から読込んだ模擬書類画像データ70が示す画像(模擬書類画像データ70の画像領域)について変形処理を行い、撮影模擬書類画像データ700を生成する。本例において、画像データ生成部401は、模擬書類画像データ70a,70b(図9参照)を変形させて模擬書類画像データ700a,700bを生成する。
例えば画像データ生成部401は、射影変換により模擬書類画像データ70を変形させて撮影模擬書類画像データ700を生成する。これにより、傾斜撮影された本人確認書類(申請用書類の一例)を模した画像を示す撮影模擬書類画像データ700を生成することができる。画像データ生成部401は、生成した撮影模擬書類画像データ700を教師データ記憶部42に出力して記憶させる。
また、画像データ生成部401が行う変形処理は、射影変換を用いたものに限らず、他の変換方式を用いてもよい。
撮影背景画像データ190は、撮影証明書類における写真画像(本人確認書類の写真画像)の背景領域を模した撮影背景画像を示す画像データである。撮影背景画像データ190は、生成用データ記憶部41に記憶されていればよい。図15は、撮影書類学習画像データの生成に用いられる撮影背景画像データの一例を示す図である。図15(a)から図15(e)に示すように、本変形例において撮影背景画像データ190(撮影背景画像データ190a~190e)は、床・壁・建具等に用いられる内装材の表面を示す画像領域を含んだ画像データである。内装材の表面は、木目柄、石目柄、布目柄、抽象柄、幾何学模様、文字、記号、単色無地等、絵柄や素材の種類に応じて様々である。本変形例では、一例として、色や模様(または素材)の異なる複数種類(本例では5種類)の撮影背景画像データ190が用意されている。
具体的には、画像データ生成部401は、撮影背景画像データ190(図15参照)に対し前景画像として撮影模擬書類画像データ700(撮影模擬書類画像データ700の画像領域)を合成して一次合成画像データ750を生成する。これにより、図14に示すように、申請者が床や家具等に置いた本人確認書類を撮影した写真画像を模した画像を示す一次合成画像データ750が生成される。
画像データ生成部401は、生成した一次合成画像データ750を教師データ記憶部42に出力して記憶させてもよい。
撮影書類学習用画像データ900において背景画像データ9は、本人確認書類を撮影した写真画像を印刷した転写紙や、当該写真画像を張り付けた台紙の背景領域(余白部分)を模した背景画像示す画像データに相当する。
本例では、一次合成画像データ750aが回転なし状態で背景画像データ9に合成され、一次合成画像データ750bが回転あり状態で背景画像データ9に合成されている。なお、本開示において、撮影書類学習画像データは、複数の一次合成画像のうち一方のみが回転あり状態でもよいし、複数の一次合成画像のうちすべてが回転あり状態でもよいし、複数の一次合成画像がすべて回転なし状態でもよい。また、撮影模擬書類画像データに一つの一次合成画像が含まれる場合も、当該一の一次合成画像が回転あり状態でもよいし、回転なし状態でもよい。
これにより、画像データ生成部401は、多種多様な撮影書類学習画像データを生成することができ、撮影転写書類学習用画像データを用いて生成される教師データをより実際の証明書類の申請画像データ(撮影証明書類画像データ)に近い態様とすることができる。
本変形例において、注釈データ付与部402は、画像データ生成部401が生成した撮影書類学習画像データが示す画像にアノテーションを行う。これにより、撮影転写書類学習用画像データと注釈データとを含む教師データが生成される。
本変形例において注釈データ付与部402は、撮影書類学習用画像データ900の画像領域内における撮影模擬書類画像データ700の画像領域に付与する注釈データとして、書類分割データを生成する。ここで、転写書類学習画像データ90に付与される書類分割データと区別して、撮影書類学習用画像データ900に付与される書類分割データを撮影書類分割データと称する。撮影書類分割データは、書類分割データの一例である。
具体的には、注釈データ付与部402は、撮影模擬書類画像データ700における撮影模擬書類画像(撮影模擬書類領域710の画像情報)が示す申請用書類の種別と、撮影書類学習用画像データ900の画像領域のうち撮影模擬書類領域710の位置を示す撮影模擬書類位置情報とを関連付けた撮影書類分割データを取得し、当該撮影書類分割データを撮影書類学習用画像データ900に付与する。これにより、機械学習によって撮影書類学習用画像データ900に含まれる撮影模擬書類領域710を学習させるための教師データ(撮影書類分割用教師データ)が生成される。注釈データ付与部402は、少なくとも撮影書類学習用画像データのデータ数分の教師データ(撮影書類分割用教師データ)を自動生成することができる。
撮影書類分割データのデータ構造(フォーマット)は、上述の転写書類学習画像データ90に付与される書類分割データと同様であるため、詳細な説明は省略する。
したがって、学習済みモデルМが撮影書類分割用学習済みモデルである場合、画像処理部30は撮影された証明書類(本人確認書類)を示す申請画像データを学習済みモデルМに入力することで、出力結果として申請画像データから分割され、傾きが補正された証明書画像データおよび申請書類の種別を得ることができる。これにより、画像処理部30は、効率的かつ簡便に精度の高い画像処理(画像分割処理)を実行し、審査画面に表示するための審査用画像データを効率的に生成することができる。これにより、教師データ自動生成部40は、審査効率を向上することができる。
また上記実施形態では、情報処理装置100内において教師データ自動生成処理を行う例を説明したが、本開示はこれに限られない。本実施形態による教師データ自動生成装置は、情報処理装置100の一構成要素としてではなく単独で構成されてもよい。例えば、教師データ自動生成装置は、情報処理システム1に含まれる装置であって、情報処理装置100とネットワーク3を介して接続された所定のコンピュータ装置であってもよい。この場合、当該コンピュータ装置が教師データ自動生成部40、生成用データ記憶部41、教師データ記憶部42を備えていればよい。また、教師データの生成処理に係る情報のうち、記憶部12に記憶されている所定の情報は、データ出力部15によりネットワーク3を介して当該コンピュータ装置に出力されればよい。また、当該コンピュータ装置が生成した教師データは、ネットワーク3を介して情報処理装置100に出力されてもよいし、当該コンピュータ装置から、学習済みモデル生成装置であるコンピュータ54に出力されてもよい。
また、コンピュータ54が教師データ自動生成部40を備え、コンピュータ54において教師データを生成してもよい。これにより、生成された教師データによる追加学習を速やかに実行することができる。
3 ネットワーク
11 申請情報取得部
12 記憶部
13 審査部
14 表示データ出力部
15 データ出力部
30 画像処理部
40 教師データ自動生成部
31 審査画像記憶部
41 生成用データ記憶部
42 教師データ記憶部
51 読取装置
52 入力装置
53 表示装置
54 コンピュータ
100 情報処理装置
301 書類判定部
302 書類分割部
303 領域抽出部
304 領域分割部
401 画像データ生成部
402 注釈データ付与部
Claims (17)
- 機械学習に用いられる教師データを自動で生成する教師データ自動生成装置であって、
申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データおよび、前記申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リストを記憶するデータ記憶部と、
前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを含んで構成される前記教師データを生成する生成部と、を備える
ことを特徴とする教師データ自動生成装置。 - 前記雛形画像データには、前記申請用書類における固有の情報の種類を示す項目画像情報が含まれ、
前記生成部は、前記申請用書類における前記固有の情報の種類に対応する前記模擬固有情報データを前記雛形画像データに適用して前記模擬書類画像データを生成する
ことを特徴とする請求項1に記載の教師データ自動生成装置。 - 前記生成部は、前記模擬書類画像データを少なくとも含む学習画像データを生成し、該学習画像データに対し該データ内の特定の画像領域の位置を含む注釈データを付与するアノテーションを行うことで前記教師データを生成する
ことを特徴とする請求項1又は2に記載の教師データ自動生成装置。 - 機械学習に用いられる教師データを自動で生成する教師データ自動生成装置であって、
申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データおよび、前記申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リストを記憶するデータ記憶部と、
前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを用いて前記教師データを生成する生成部と、を備え、
前記データ記憶部には、前記申請用書類が転写された転写紙の背景領域を模した背景画像を示す背景画像データが記憶され、
前記生成部は、前記背景画像に対し前景画像として前記模擬書類画像データが示す模擬書類画像を合成し、前記教師データを構成する画像データとして転写書類学習画像データを生成する
ことを特徴とする教師データ自動生成装置。 - 前記生成部は、前記背景画像と平行な面内において所定角度で回転させた前記模擬書類画像を前記背景画像に合成して、前記転写書類学習画像データを生成する
ことを特徴とする請求項4に記載の教師データ自動生成装置。 - 前記生成部は、前記背景画像に対して一種類または複数種類の前記模擬書類画像データが示す画像を前記前景画像として合成し、一種類または複数種類の前記模擬書類画像を含む前記転写書類学習画像データを生成する
ことを特徴とする請求項4又は5に記載の教師データ自動生成装置。 - 前記データ記憶部には、複数種類の前記背景画像データが記憶され、
前記生成部は、前記転写書類学習画像データの生成時において複数種類の前記背景画像データのうち少なくとも一種類を無作為に選択する
ことを特徴とする請求項4から6のいずれか1項に記載の教師データ自動生成装置。 - 前記データ記憶部には、前記申請用書類を撮影した写真画像の背景領域を模した撮影背景画像を示す撮影背景画像データが記憶され、
前記生成部は、前記撮影背景画像と前記模擬書類画像とを用いて前記写真画像を模した画像を生成し、当該画像を前記背景画像にさらに合成して前記転写書類学習画像データを
生成する
ことを特徴とする請求項4から7のいずれか1項に記載の教師データ自動生成装置。 - 前記生成部は、変形させた該模擬書類画像を前記撮影背景画像に合成し、前記写真画像を模した画像を生成する
ことを特徴とする請求項8に記載の教師データ自動生成装置。 - 前記生成部は、射影変換によって前記模擬書類画像を変形させる
ことを特徴とする請求項9に記載の教師データ自動生成装置。 - 前記生成部は、
前記転写書類学習画像データに含まれる前記模擬書類画像が示す前記申請用書類の種別と、前記転写書類学習画像データの画像領域のうち前記模擬書類画像に相当する模擬書類領域の位置とを関連付けた書類分割データを取得し、該書類分割データを前記転写書類学習画像データに付与して前記教師データを生成する
ことを特徴とする請求項4から10のいずれか1項に記載の教師データ自動生成装置。 - 前記データ記憶部には、前記雛形画像データの画像領域のうち前記模擬固有情報データを適用する適用対象領域の位置情報が記憶され、
前記生成部は、前記位置情報に基づいて前記模擬固有情報データを前記適用対象領域に適用して前記模擬書類画像データを生成する
ことを特徴とする請求項1から11のいずれか1項に記載の教師データ自動生成装置。 - 前記データ記憶部には、それぞれ異なる種類の前記申請用書類の雛形を示す複数種類の前記雛形画像データと、複数種類の前記雛形画像データのそれぞれにおける前記適用対象領域の前記位置情報が記憶され、
前記生成部は、複数種類の前記雛形画像データと前記模擬固有情報リストと複数種類の前記雛形画像データのそれぞれにおける前記位置情報とを用いて、複数種類の前記模擬書類画像データを生成する
ことを特徴とする請求項12に記載の教師データ自動生成装置。 - 前記生成部は、
前記模擬書類画像データに含まれる前記模擬固有情報データの項目と、該模擬書類画像データの画像領域のうち前記模擬固有情報データの画像情報を示す模擬固有情報領域の位置とを関連付けた領域情報データを取得し、該領域情報データを前記模擬書類画像データに付与して前記教師データを生成する。
ことを特徴とする請求項1から13のいずれか1項に記載の教師データ自動生成装置。 - 前記申請用書類は、前記申請者の証明書類であって、免許証、保険証または領収書を示す書類のうち少なくとも一種類である
ことを特徴とする請求項1から14のいずれか1項に記載の教師データ自動生成装置。 - コンピュータが、機械学習に用いられる教師データを自動で生成する教師データ自動生成方法であって、
申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データおよび、前記申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リストを記憶し、
前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを含んで構成される前記教師データを生成する
ことを特徴とする教師データ自動生成方法。 - 機械学習に用いられる教師データを自動で生成する教師データ自動生成プログラムであって、
申請内容の審査のために申請者が提出する申請用書類の雛形を示す雛形画像データおよび、前記申請用書類における固有の情報を模したデータである模擬固有情報データを多数登録した模擬固有情報リストを記憶することと、
前記雛形画像データと前記模擬固有情報リストに含まれる模擬固有情報データとに基づいて前記申請用書類を模した模擬書類画像を示す模擬書類画像データを生成し、前記模擬書類画像データを含んで構成される前記教師データを生成することと、をコンピュータに実行させる
ことを特徴とする教師データ自動生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022044268A JP7197042B1 (ja) | 2022-03-18 | 2022-03-18 | 教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022044268A JP7197042B1 (ja) | 2022-03-18 | 2022-03-18 | 教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7197042B1 true JP7197042B1 (ja) | 2022-12-27 |
JP2023137859A JP2023137859A (ja) | 2023-09-29 |
Family
ID=84687871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022044268A Active JP7197042B1 (ja) | 2022-03-18 | 2022-03-18 | 教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7197042B1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021047816A (ja) | 2019-09-20 | 2021-03-25 | トッパン・フォームズ株式会社 | 学習データ生成装置、学習データ生成方法、及びプログラム |
JP2021060876A (ja) | 2019-10-08 | 2021-04-15 | キヤノン株式会社 | 学習データ生成装置、その制御方法、及びプログラム |
CN112837263A (zh) | 2020-12-21 | 2021-05-25 | 上海致宇信息技术有限公司 | 一种复杂背景下的身份证信息定位方法 |
US20210248420A1 (en) | 2020-02-07 | 2021-08-12 | International Business Machines Corporation | Automated generation of structured training data from unstructured documents |
-
2022
- 2022-03-18 JP JP2022044268A patent/JP7197042B1/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021047816A (ja) | 2019-09-20 | 2021-03-25 | トッパン・フォームズ株式会社 | 学習データ生成装置、学習データ生成方法、及びプログラム |
JP2021060876A (ja) | 2019-10-08 | 2021-04-15 | キヤノン株式会社 | 学習データ生成装置、その制御方法、及びプログラム |
US20210248420A1 (en) | 2020-02-07 | 2021-08-12 | International Business Machines Corporation | Automated generation of structured training data from unstructured documents |
CN112837263A (zh) | 2020-12-21 | 2021-05-25 | 上海致宇信息技术有限公司 | 一种复杂背景下的身份证信息定位方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2023137859A (ja) | 2023-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5623079B2 (ja) | ハード・コピーの書式からの書式定義の自動発生 | |
Conway | Digital transformations and the archival nature of surrogates | |
Terras | Digitization and digital resources in the humanities | |
US20110157615A1 (en) | System for generating personalized documents | |
US20120105901A1 (en) | Document management support system, information management server apparatus, and information medium controller | |
JP5893825B2 (ja) | ワークフローのための方法及びシステム | |
CN111931780A (zh) | 一种会计凭证智能管理方法及设备 | |
JP2021060629A (ja) | 設問生成装置、設問生成方法、設問生成装置用プログラム、および、書類管理システム | |
JP7197042B1 (ja) | 教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム | |
US20050022104A1 (en) | Method and system for automating the production of publications | |
JP4254775B2 (ja) | 書込画像取得装置、書込情報抽出方法、およびコンピュータプログラム | |
JP2007325196A (ja) | 文書管理装置および文書管理方法 | |
JP2008158777A (ja) | 画像処理装置及び方法、コンピュータプログラム及び記憶媒体 | |
CN114972006A (zh) | 图像生成方法、装置、设备和存储介质 | |
JP2021182100A (ja) | 採点支援方法 | |
JP7176657B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
KR20100123959A (ko) | 문서이미지 처리 시스템 및 그 방법 | |
CN117523417B (zh) | 应用于自然资源统一确权登记的方法及电子设备 | |
JP2000348048A (ja) | 商品情報データベース、商品情報割付装置、ならびに割付校正システム | |
KR20110092414A (ko) | 개인화된 대량의 포토앨범 제작 시스템 및 방법 | |
JP6939863B2 (ja) | 申請書処理装置及びプログラム | |
Manoni et al. | The Vatican Apostolic Library’s Digital Preservation Project | |
JP2023103825A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP2018181220A (ja) | マークシート解析システム | |
Akello et al. | Developing guidelines for the digitisation of manual medical records at Entebbe Regional Referral Hospital |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220318 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220318 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7197042 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |