JP7512764B2

JP7512764B2 - 学習装置、判定装置、学習方法、判定方法、学習プログラムおよび判定プログラム

Info

Publication number: JP7512764B2
Application number: JP2020140203A
Authority: JP
Inventors: 進遠藤; 一穂前田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2020-08-21
Filing date: 2020-08-21
Publication date: 2024-07-09
Anticipated expiration: 2040-08-21
Also published as: JP2022035703A

Description

本発明の実施形態は、学習装置、判定装置、学習方法、判定方法、学習プログラムおよび判定プログラムに関する。

従来、窓口等で提出された種々の書類については、書類間の整合性をチェックし、不整合のある項目を職員が修正している。例えば、税業務の窓口では、毎年、多くの申告書類が提出されている。提出された書類は、職員が、住民の基本情報や雇用元の提出書類と突き合わせて、間違いが無いかをチェックしている。

図１０は、書類不備の修正の一例を説明する説明図である。図１０に示すように、住民Ｈ１は、確定申告書Ｄ１および住民税申告書Ｄ２を市役所に提出する。また、住民Ｈ１の勤務先Ｋ１、Ｋ２は、住民Ｈ１に関する給与支払報告書Ｄ３、Ｄ４を提出する。また、年金機構Ｋ３は、住民Ｈ１に関する年金支払報告書Ｄ５を提出する。市役所の職員Ｈ２は、提出された確定申告書Ｄ１、住民税申告書Ｄ２、給与支払報告書Ｄ３、Ｄ４および年金支払報告書Ｄ５の各項目の記載を比較する。そして、職員Ｈ２は、不整合のある項目を検出し、その項目のデータを修正する。

このような、書類間の不備のチェック作業をサポートする従来技術としては、請求審査サーバが、請求書と明細書の記載内訳に対する点検を通過した請求書と明細書に対し、報価、薬価、診療報価のような基準単価適用、請求金額の計算、給与請求項目および診療コードのような事項に錯誤があるかどうかを自動的に点検するものが知られている。

特開２００７－２４１９８６号公報

しかしながら、上記の従来技術では、書類から不備のある事項を容易に把握できるが、その不備をどのように修正するかについては、書類の内容を確認した職員の判断を要することとなる。このように、従来技術では、請求審査サーバが点検して得られた不備のある事項を修正するためには、職員が書類間の突き合わせなどを行って修正方法を求める作業を要するという問題がある。

１つの側面では、書類の修正作業を支援できる学習装置、判定装置、学習方法、判定方法、学習プログラムおよび判定プログラムを提供することを目的とする。

１つの案では、学習装置は、説明変数を生成する処理と、目的変数を生成する処理と、モデルを生成する処理とを制御部が実行する。説明変数を生成する処理は、書類の修正履歴を含む複数の事例の学習用データをもとに、事例ごとに、当該事例の書類に含まれる項目を含む説明変数を生成する。目的変数を生成する処理は、学習用データをもとに、事例ごとに、当該事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が修正履歴と一致するか否かを含む目的変数を生成する。モデルを生成する処理は、生成した説明変数および目的変数に基づいて各事例の機械学習を行い、モデルを生成する。

書類の修正作業を支援できる。

図１は、実施形態にかかる情報処理装置の機能構成例を示すブロック図である。図２は、実施形態にかかる情報処理装置の学習時の動作例を示すフローチャートである。図３は、目的変数の生成を説明する説明図である。図４は、目的変数生成処理の一例を示すフローチャートである。図５は、学習モデル生成を説明する説明図である。図６は、実施形態にかかる情報処理装置の識別時の動作例を示すフローチャートである。図７は、学習モデルを用いた識別を説明する説明図である。図８は、表示画面例を説明する説明図である。図９は、コンピュータ構成の一例を示すブロック図である。図１０は、書類不備の修正の一例を説明する説明図である。

以下、図面を参照して、実施形態にかかる学習装置、判定装置、学習方法、判定方法、学習プログラムおよび判定プログラムを説明する。実施形態において同一の機能を有する構成には同一の符号を付し、重複する説明は省略する。なお、以下の実施形態で説明する学習装置、判定装置、学習方法、判定方法、学習プログラムおよび判定プログラムは、一例を示すに過ぎず、実施形態を限定するものではない。また、以下の各実施形態は、矛盾しない範囲内で適宜組みあわせてもよい。

図１は、実施形態にかかる情報処理装置の機能構成例を示すブロック図である。図１に示すように、情報処理装置１は、情報取得部１０、演算取得部１１、修正項目抽出部１２、対応資料抽出部１３、目的変数生成部１４、説明変数生成部１５、学習部１６、モデル保存部１７、入力部１８、識別部１９、候補値生成部２０および出力部２１を有する。

この情報処理装置１は、学習装置および判定装置の一例である。なお、学習装置および判定装置は一つの情報処理装置１で実現してもよいが、分割して実現してもよい。例えば、情報処理装置１は、情報取得部１０、演算取得部１１、修正項目抽出部１２、対応資料抽出部１３、目的変数生成部１４、説明変数生成部１５、学習部１６およびモデル保存部１７を有する学習装置であってもよい。また、情報処理装置１は、入力部１８、識別部１９、候補値生成部２０および出力部２１を有する判定装置であってもよい。

情報取得部１０は、提出書類から不備のある事項を判別するための学習モデルＭ１の学習用に予め用意された、書類の修正履歴を含む各事例の学習用データ３０を取得する。情報取得部１０は、取得した学習用データ３０を演算取得部１１、修正項目抽出部１２および説明変数生成部１５へ出力する。

例えば、学習用データ３０は、各事例について、書類の内容（例えば各項目における記入値）と、不備のある事項を修正した修正履歴（例えば不備のある項目と、その項目における修正値）とを含むデータである。

演算取得部１１は、復元演算情報３１を参照し、学習用データ３０の各事例において、書類に含まれる項目それぞれに対し、復元演算情報３１に定義された演算を行う処理部である。

ここで、復元演算情報３１には、書類に含まれる項目それぞれについて、不備がある場合に、職員Ｈ２が行う典型的な修正を復元する演算（復元演算と呼ぶ）が定義されている。

例えば、提出書類における不備として、ある資料（資料）の項目のおける値が、他の資料に既に含まれている場合がある。一例として、給与支払報告書Ｄ３、Ｄ４など給与資料において、給与支払報告書Ｄ４の給料の項目には、給与支払報告書Ｄ３の給料の項目を加算した値が含まれている場合がある（図１０参照）。このような場合、復元演算として、２つの値の最大値を用いれば、給料の合計を計算できる。

同様に、提出書類における不備として、他の資料には含まれておらず、別々に計上されている場合がある。一例として、給与支払報告書Ｄ３、Ｄ４など給与資料において、給与支払報告書Ｄ３の給料の項目には、勤務先Ｋ１の給料が計上されており、給与支払報告書Ｄ４の給料の項目には勤務先Ｋ２の給料が計上されている場合がある（図１０参照）。このような場合、復元演算として、２つの値の最大値を用いれば、給料の合計を計算できる。また、すでに別の項目に加算済みの項目を間違えて加算してしまった場合には、復元演算として、減算することで、正しい値を復元できる。

このように、復元演算情報３１には、書類に含まれる項目それぞれにおいて職員Ｈ２が行う典型的な修正内容に対応する復元演算が定義されている。この復元演算としては、書類で共通する項目同士の総和（加算と呼ぶ）、最大値への置き換え（最大値と呼ぶ）、２番目の値への置き換え（２番目と呼ぶ）などがある。復元演算情報３１には、確定申告書Ｄ１、住民税申告書Ｄ２、給与支払報告書Ｄ３、Ｄ４、年金支払報告書Ｄ５等の各書類およびその書類に含まれる項目ごとの、典型的な修正内容に対応する復元演算（例えば、最大値、２番目、加算）が定義される。

なお、本実施形態では復元演算として、最大値、２番目、加算を例示するが、他にも項目に関して所定の控除額を算出する復元演算や、項目同士を積算する復元演算などを復元演算情報３１の定義に含めてもよい。

演算取得部１１は、学習用データ３０の各事例において、書類に含まれる項目それぞれに対し、復元演算情報３１に定義された復元演算を一通り実施して得られた演算結果を目的変数生成部１４および説明変数生成部１５へ出力する。

修正項目抽出部１２は、学習用データ３０に含まれる修正履歴に基づき、学習用データ３０の各事例において、書類の中で修正のあった項目（修正項目と呼ぶ）を抽出する処理部である。修正項目抽出部１２は、抽出した修正項目を対応資料抽出部１３へ出力する。

対応資料抽出部１３は、学習用データ３０に含まれる修正履歴に基づき、修正項目抽出部１２が抽出した修正項目に対応する書類（対応資料と呼ぶ）を抽出する処理部である。対応資料抽出部１３は、抽出した対応資料および修正項目を目的変数生成部１４へ出力する。

目的変数生成部１４は、学習用データ３０の各事例について、学習モデルＭ１の学習に用いる目的変数を生成する処理部である。具体的には、目的変数生成部１４は、学習用データ３０の事例の書類に含まれる項目それぞれに対して復元演算を行った結果が学習用データ３０に含まれる修正履歴と一致するか否かを含む目的変数を生成する。

例えば、目的変数生成部１４は、演算取得部１１による各項目の復元演算の結果について、修正項目抽出部１２および対応資料抽出部１３により抽出した対応資料および修正項目における、学習用データ３０の修正履歴に含まれる修正値と一致するか否かを比較する。次いで、目的変数生成部１４は、一致する場合は、一致することを示す１を目的変数とする。なお、一致しない項目および修正項目に該当しない他の項目については不一致を示す０を目的変数とする。

このように、目的変数生成部１４は、学習用データ３０の事例の書類に含まれる項目それぞれについて、所定の復元演算が修正履歴と一致する（１）または一致しない（０）を含む目的変数を生成する。一例として、目的変数生成部１４は、書類別（例えば給与資料）×項目別（例えば給与所得）×復元演算別（例えば最大値、２番目、加算）で、修正履歴と一致する（１）または一致しない（０）を示す配列を目的変数として生成する。

説明変数生成部１５は、学習用データ３０の各事例について、学習モデルＭ１の学習に用いるための、各事例の特徴を示す説明変数を生成する処理部である。具体的には、説明変数生成部１５は、学習用データ３０の各事例の書類に含まれる各項目（年齢、家族関係、給与所得…）の値を含む説明変数を生成する。また、説明変数生成部１５は、学習用データ３０の各事例について、演算取得部１１が算出した各項目における復元演算の結果を説明変数に含めてもよい。

学習部１６は、学習用データ３０の各事例について、説明変数生成部１５が生成した説明変数と、目的変数生成部１４が生成した目的変数とをもとに、公知の機械学習処理を行うことで学習モデルＭ１を生成する処理部である。学習部１６が行う機械学習処理としては、決定木、ランダムフォレスト、ディープラーニング等がある。例えば、ディープラーニングの場合、学習部１６は、説明変数生成部１５が生成した説明変数を入力した場合に、目的変数生成部１４が生成した目的変数に対応する出力を行うように隠れ層のパラメータを求めることで、学習モデルＭ１を生成する。

また、学習部１６は、目的変数における書類別（例えば給与資料）×項目別（例えば給与所得）×復元演算別（例えば最大値、２番目、加算）で説明変数に対する学習を実施し、項目×書類（資料）×復元演算別で学習モデルＭ１を生成してもよい。

モデル保存部１７は、学習部１６が作成した学習モデルＭ１をストレージ（図示しない）などに保存する処理部である。具体的には、モデル保存部１７は、学習部１６が生成した学習モデルＭ１に関する各種パラメータを保存する。

入力部１８は、判定対象の事例に関する識別用データ３２の入力を受け付ける処理部である。具体的には、識別用データ３２には、判定対象の事例において、住民Ｈ１が提出した判定対象の書類に含まれる各項目の値が含まれる。入力部１８は、受け付けた識別用データ３２より、判定対象の書類に含まれる各項目の値を説明変数として識別部１９へ出力する。

なお、入力部１８は、復元演算情報３１を参照し、判定対象の書類に含まれる項目それぞれに対し、復元演算情報３１に定義された復元演算を一通り実施して得られた演算結果を説明変数に含めてもよい。

識別部１９は、判定対象の事例に関する説明変数を学習モデルＭ１に入力して、判定対象の事例の判別結果を取得する処理部である。具体的には、識別部１９は、モデル保存部１７が保存した学習モデルＭ１のパラメータを読み出して学習モデルＭ１を構築する。次いで、識別部１９は、学習モデルＭ１に対して入力部１８からの説明変数、すなわち判定対象の書類に含まれる各項目の値を入力する。次いで、識別部１９は、学習モデルＭ１の出力より、判定対象の書類に含まれる項目それぞれにおいて、所定の復元演算による修正の有無を示す確度（評価値）を得る。

次いで、識別部１９は、評価値が所定の閾値（例えば確度０．５）以上である項目を一致するもの（修正要）と判定し、その項目と、項目における復元演算を判別結果として出力する。例えば、識別部１９は、書類別（例えば給与資料）×項目別（例えば給与所得）×復元演算別（例えば最大値、２番目、加算）で確度０．５以上の出力が得られたものを、判別結果として出力する。

候補値生成部２０は、識別部１９が出力した判定結果をもとに、修正後の候補値を生成する処理部である。具体的には、候補値生成部２０は、判定対象の書類において、判別結果に含まれる項目に対して判別した復元演算を行うことで修正後の候補値を生成する。

例えば、候補値生成部２０は、書類別（例えば給与資料）×項目別（例えば給与所得）×復元演算別（例えば最大値、２番目、加算）で確度０．５以上の出力が得られたものについて、復元演算情報３１を参照して演算内容を取得する。次いで、候補値生成部２０は、判定対象の書類に含まれる項目の中の、判別結果に含まれる項目の値を取得し、復元演算情報３１より取得した演算内容での演算を行うことで、修正後の候補値を得る。

出力部２１は、判定対象の事例に関する識別部１９の判別結果および候補値生成部２０が生成した候補値を、ディスプレイへの表示やファイル出力などでユーザに対して出力する処理部である。

具体的には、出力部２１は、判定対象の事例の書類において修正要と判定した項目（例えば給与所得など）と、その項目における復元演算の内容（例えば最大値など）をディスプレイなどに表示する。これにより、ユーザは、判定対象の書類に含まれる各項目から、修正要の項目と、修正内容に対応する演算の内容とを容易に特定することができる。

また、出力部２１は、修正要と判定した項目について、修正後の候補値を合わせて出力してもよい。これにより、ユーザは、修正要の項目について、修正後の値を容易に特定することができる。

また、出力部２１は、修正要と判定した項目について、学習モデルＭ１の出力により得られた修正の有無を示す確度（評価値）を合わせて出力してもよい。これにより、ユーザは、修正要の項目について、どの程度の確度で修正要と判断されたかを容易に知ることができる。

図２は、実施形態にかかる情報処理装置１の学習時の動作例を示すフローチャートである。図２に示すように、処理が開始されると、情報取得部１０は、学習用データ３０を取得する（Ｓ１）。次いで、目的変数生成部１４は、学習用データ３０の各事例について、学習モデルＭ１の学習に用いる目的変数を生成する（Ｓ２）。

図３は、目的変数の生成を説明する説明図である。図３に示すように、学習用データ３０については、書類の内容（例えば各項目における記入値）を示す資料情報３０ａと、不備のある事項を修正した修正履歴３０ｂとが含まれる。

図３では、ユーザＵ１の事例に関する資料情報３０ａおよび修正履歴３０ｂを例示している。ここで、資料情報３０ａにおいて、給与資料（１）は、甲種給与所得の項目が「３０」であり、退職所得の項目が「１００」である。また、給与資料（２）は、甲種給与所得、退職所得ともに項目は「０」である。また、給与資料（３）は、甲種給与所得の項目が「０」であり、退職所得の項目が「８０」である。また、修正履歴３０ｂにおいて、「甲種給与所得」は「０」から「３０」に修正し、「退職所得」は「８０」から「１００」に修正する。

演算取得部１１は、資料情報３０ａの資料（書類）に含まれる項目それぞれに対し、復元演算情報３１に定義された復元演算（最大値、２番目、加算）を行い、演算結果３０ｃを得る。

目的変数生成部１４は、各項目の演算結果３０ｃについて、修正履歴３０ｂの修正後の値（甲種給与所得における「３０」および退職所得における「１００」）と値が一致するか否かを比較する。ここで、目的変数生成部１４は、一致する場合は１、不一致ならば０とすることで、目的変数３０ｄを得る。

図４は、目的変数生成処理の一例を示すフローチャートである。図４に示すように、処理が開始されると、情報取得部１０は、学習用データ３０より、変更前／変更後のデータ（修正履歴３０ｂ）を取得する（Ｓ１０）。次いで、情報取得部１０は、処理対象のユーザ（事例）と、そのユーザの資料情報３０ａを学習用データ３０より取得する（Ｓ１１）。取得した情報について、情報取得部１０は、演算取得部１１、修正項目抽出部１２および説明変数生成部１５へ出力する。

次いで、修正項目抽出部１２は、修正履歴３０ｂから変更された項目を取得する（Ｓ１３）。次いで、演算取得部１１は、資料種別の値のリストを取得する（Ｓ１４）。

次いで、演算取得部１１は、資料情報３０ａの資料（書類）に含まれる項目それぞれに対して復元演算を行い、演算結果３０ｃ（最大値、２番目、加算）を求める（Ｓ１５）。

次いで、目的変数生成部１４は、演算結果３０ｃの値の一つを取得し（Ｓ１６）、演算結果３０ｃの値に修正履歴３０ｂにおける変更後の値が一致するか否かを判定する（Ｓ１７）。

一致する場合（Ｓ１７：Ｙｅｓ）、目的変数生成部１４は、項目×資料種別×演算の対応する部分を１にセットする（Ｓ１８）。一致しない場合（Ｓ１７：Ｎｏ）、目的変数生成部１４は、１へのセットを行うことなくＳ１９へ処理を進める。

次いで、目的変数生成部１４は、すべての演算結果３０ｃを処理したか否かを判定する（Ｓ１９）。全ての演算結果３０ｃを処理していない場合（Ｓ１９：Ｎｏ）、目的変数生成部１４は、次の演算結果３０ｃの値を取得し（Ｓ２０）、Ｓ１６へ処理を戻す。

すべての演算結果３０ｃを処理した場合（Ｓ１９：Ｙｅｓ）、目的変数生成部１４は、すべての資料（書類）の値をチェックしたか否かを判定する（Ｓ２１）。すべての資料（書類）の値をチェックしていない場合（Ｓ２１：Ｎｏ）、演算取得部１１は、次の資料種別の値のリストを取得し（Ｓ２０）、Ｓ１５へ処理を戻す。

すべての資料（書類）の値をチェックした場合（Ｓ２１：Ｙｅｓ）、目的変数生成部１４は、すべての変更された項目をチェックしたか否かを判定する（Ｓ２３）。すべての変更された項目をチェックしていない場合（Ｓ２３：Ｎｏ）、目的変数生成部１４は、次の変更された項目を取得し（Ｓ２４）、Ｓ１４へ処理を戻す。

すべての変更された項目をチェックした場合（Ｓ２３：Ｙｅｓ）、目的変数生成部１４は、学習用データ３０に含まれるすべてのユーザ（事例）を処理したか否かを判定する（Ｓ２５）。すべてのユーザ（事例）を処理していない場合（Ｓ２５：Ｎｏ）、情報取得部１０は、次のユーザと資料情報３０ａを学習用データ３０より取得し（Ｓ２６）、Ｓ１３へ処理を戻す。

すべてのユーザ（事例）を処理した場合（Ｓ２５：Ｙｅｓ）、目的変数生成部１４は、項目×資料×演算で、１となっている部分以外を０とした行列を目的変数として作成し（Ｓ２７）、処理を終了する。

図２に戻り、Ｓ２に次いで、学習部１６は、学習用データ３０の各事例について、説明変数生成部１５が生成した説明変数と、目的変数生成部１４が生成した目的変数とをもとに、項目×資料×演算別で機械学習を実施する（Ｓ３）。次いで、モデル保存部１７は、機械学習により生成された学習モデルＭ１をストレージ等に保存する（Ｓ３）。

図５は、学習モデル生成を説明する説明図である。図５に示すように、説明変数生成部１５は、学習用データ３０の各事例の書類に含まれる各項目（年齢、家族関係、給与所得…）の値を含む資料情報３０ａと、演算取得部１１が算出した各項目における演算結果３０ｃとを合わせて説明変数３０ｅを生成する。学習部１６は、目的変数における項目×資料×演算別で説明変数に対する学習を実施し、項目×資料×演算別の学習モデルＭ１を生成する。

図６は、実施形態にかかる情報処理装置１の識別時の動作例を示すフローチャートである。図６に示すように、処理が開始されると、入力部１８は、識別用データ３２を取得する（Ｓ３０）。

次いで、識別部１９は、識別用データ３２により判定対象の書類に含まれる項目を取得する（Ｓ３１）。次いで、識別部１９は、モデル保存部１７の保存した学習モデルＭ１から、取得した項目で対応する学習モデルＭ１を取得する（Ｓ３２）。

次いで、識別部１９は、取得したモデルに項目の値を入力することで、項目に関する識別を行い、評価値が高いモデルを選択する（Ｓ３３）。次いで、候補値生成部２０は、モデルに対応する資料の値を識別用データ３２より取得し、復元演算を行うことで修正後の候補値を抽出する（Ｓ３４）。

次いで、出力部２１は、ディスプレイへの表示などにより、識別用データ３２の判別対象の事例に関する識別部１９の判別結果および候補値生成部２０が生成した候補値の結果出力を行い（Ｓ３５）、処理を終了する。

図７は、学習モデルを用いた識別を説明する説明図である。図７に示すように、学習モデルＭ１の学習については、ユーザＵ１、Ｕ２、Ｕ３…の各事例の特徴を説明変数３０ｅとする。また、各事例の書類に含まれる項目それぞれに対して復元演算を行った結果が修正履歴３０ｂと一致するか否かを示す行列を修正履歴３０ｂとしている。これにより、項目別（例えば給与所得）×書類別（例えば給与資料）×復元演算別（例えば最大値、２番目、加算）の学習モデルＭ１が生成される。

情報処理装置１では、判別対象の事例（ユーザＸ１、Ｘ２、Ｘ３…）の識別用データ３２より、説明変数に対応する値を設定して生成した学習モデルＭ１での判別を行う。これにより、判別対象の事例（ユーザＸ１、Ｘ２、Ｘ３…）について、項目別（例えば給与所得）×書類別（例えば給与資料）×復元演算別（例えば最大値、２番目、加算）の評価値（確度）を得ることができる。この評価値を所定の閾値（例えば０．５）で評価することで、情報処理装置１では、修正要とする書類別の項目と、その項目における復元演算の内容を判別できる。

例えば、判別用の閾値を０．５とする場合、ユーザＸ１の事例については、評価値が０．６である甲種給与所得×給与資料×加算を、修正要とする書類別の項目と、その項目における復元演算の内容と判別できる。

情報処理装置１では、上記の判別内容を出力結果３２ｂとしてディスプレイなどに表示して出力する。これにより、ユーザは、修正要とする書類別の項目と、修正内容に対応する演算の内容とを容易に特定することができる。

図８は、表示画面例を説明する説明図である。図８に示すように、出力部２１は、ディスプレイへの表示画面Ｇ１において、識別用データ３２に含まれる判別対象の事例の書類内容（確定申告書、給与支払報告書、年金支払報告書）を表示する。また、出力部２１は、表示画面Ｇ１において、判別対象の事例に関する出力結果３２ｂに基づくメッセージＭ０１、Ｍ０２を表示する。

例えば、メッセージＭ０１については、「「特定扶養」は併合時に確定申告書の「１人」を採用しましたが、９０％の確率で修正が必要です。修正候補は、確率の高い順に、給与支払い申告書の「２人」、年金支払報告書の「０人」です。」などである。

また、メッセージＭ０２については、「「給与収入」は併合時に確定申告書記載の「３７万円」を採用しましたが、８０％の確率で修正が必要です。修正候補は、確率の高い順に、給与支払い申告書の最大値である「３９万円」、給与支払い申告書のその他収入を引いた値である「３５万円」です。」などである。

これにより、ユーザは、判別対象の事例の書類内容を見比べながら、メッセージＭ０１、Ｍ０２における修正要とする書類別の項目、修正内容に対応する演算の内容、修正後の値、修正要と判断された確度を確認することができる。

（効果）
以上のように、情報処理装置１は、書類の修正履歴を含む複数の事例の学習用データ３０をもとに、事例ごとに、事例の書類に含まれる各項目を含む説明変数を生成する。また、情報処理装置１は、学習用データ３０をもとに、事例ごとに、事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が修正履歴と一致するか否かを含む目的変数を生成する。また、情報処理装置１は、生成した説明変数および目的変数に基づいて各事例の機械学習を行い、学習モデルＭ１を生成する。

このように生成した学習モデルＭ１では、判定対象の事例の書類に含まれる各項目を含む説明変数を入力することで、学習モデルＭ１の出力から修正すべき項目と、その項目において修正内容に対応する演算とを推定できる。すなわち、学習モデルＭ１を用いることで、判定対象の事例の書類の項目における修正方法を推定して提示できるようになり、書類の修正作業を支援できる。

また、情報処理装置１の目的変数を生成する処理は、事例の複数の書類に含まれる共通の項目に対して所定の演算を行った結果が修正履歴と一致するか否かを含む目的変数を生成する。これにより、生成した学習モデルＭ１では、複数の書類に含まれる共通の項目について、正すべき項目と、その項目において修正内容に対応する演算とを推定できる。例えば、判定対象の事例の給与支払報告書Ｄ３、Ｄ４において共通する項目（例えば給与所得、退職所得…）から、修正すべき項目（例えば給与所得）と、その項目において修正内容に対応する演算（例えば加算）とを推定できる。

また、所定の演算は、共通の項目における最大値、２番目の値または総和のいずれかを求めるものである。これにより、共通の項目における最大値、２番目の値または総和のいずれかの演算（修正内容）を推定することができる。

また、情報処理装置１の説明変数を生成する処理は、項目それぞれに対して所定の演算を行った結果を説明変数に含める。このように、項目それぞれに対して所定の演算を行った結果も説明変数として加えて学習モデルＭ１を生成することで、学習モデルＭ１の判定精度を向上させることができる。

また、情報処理装置１は、上記の学習モデルＭ１に対して、識別用データ３２が示す判定対象の書類に含まれる各項目を入力する。ついで、情報処理装置１は、学習モデルＭ１からの出力に基づいて、判定対象の書類に含まれる項目それぞれにおいて一致すると判定した演算の内容を出力する。これにより、ユーザは、判定対象の書類に含まれる各項目から、修正内容に対応する演算の内容と、その演算にかかる項目（修正すべき項目）とを容易に特定することができる。

また、情報処理装置１は、出力において、判定対象の書類に含まれる項目それぞれにおいて一致すると判定した演算による演算結果を含める。これにより、ユーザは、修正内容に対応する演算による演算結果、すなわち修正後の値を容易に特定することができる。

また、情報処理装置１は、出力において、一致すると判定した演算の内容における、学習モデルＭ１からの出力に基づく確度を含める。これにより、ユーザは、学習モデルＭ１に基づいて判定した修正内容が、どの程度の確度であるかを容易に知ることができる。

（その他）
なお、図示した各装置の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、情報処理装置１については、学習モデルＭ１を生成する構成と、生成した学習モデルＭ１をもとに判定する構成とを分散してもよい。

また、情報処理装置１の各種処理機能（情報取得部１０、演算取得部１１、修正項目抽出部１２、対応資料抽出部１３、目的変数生成部１４、説明変数生成部１５、学習部１６、モデル保存部１７、入力部１８、識別部１９、候補値生成部２０および出力部２１）は、ＣＰＵ（またはＭＰＵ、ＭＣＵ（Micro Controller Unit）等のマイクロ・コンピュータ）上で、その全部または任意の一部を実行するようにしてもよい。また、各種処理機能は、ＣＰＵ（またはＭＰＵ、ＭＣＵ等のマイクロ・コンピュータ）で解析実行されるプログラム上、またはワイヤードロジックによるハードウエア上で、その全部または任意の一部を実行するようにしてもよいことは言うまでもない。また、情報処理装置１で行われる各種処理機能は、クラウドコンピューティングにより、複数のコンピュータが協働して実行してもよい。

（コンピュータ構成例）
ところで、上記の実施形態で説明した各種の処理は、予め用意されたプログラムをコンピュータで実行することで実現できる。そこで、以下では、上記の実施形態と同様の機能を有するプログラムを実行するコンピュータ構成（ハードウエア）の一例を説明する。図９は、コンピュータ構成の一例を示すブロック図である。

図９に示すように、コンピュータ２００は、各種演算処理を実行するＣＰＵ２０１と、データ入力を受け付ける入力装置２０２と、モニタ２０３と、スピーカー２０４とを有する。また、コンピュータ２００は、記憶媒体からプログラム等を読み取る媒体読取装置２０５と、各種装置と接続するためのインタフェース装置２０６と、有線または無線により外部機器と通信接続するための通信装置２０７とを有する。また、情報処理装置１は、各種情報を一時記憶するＲＡＭ２０８と、ハードディスク装置２０９とを有する。また、コンピュータ２００内の各部（２０１～２０９）は、バス２１０に接続される。

ハードディスク装置２０９には、上記の実施形態で説明した機能構成（例えば情報取得部１０、演算取得部１１、修正項目抽出部１２、対応資料抽出部１３、目的変数生成部１４、説明変数生成部１５、学習部１６、モデル保存部１７、入力部１８、識別部１９、候補値生成部２０および出力部２１）における各種の処理を実行するためのプログラム２１１が記憶される。また、ハードディスク装置２０９には、プログラム２１１が参照する各種データ２１２が記憶される。入力装置２０２は、例えば、操作者から操作情報の入力を受け付ける。モニタ２０３は、例えば、操作者が操作する各種画面を表示する。インタフェース装置２０６は、例えば印刷装置等が接続される。通信装置２０７は、ＬＡＮ（Local Area Network）等の通信ネットワークと接続され、通信ネットワークを介した外部機器との間で各種情報をやりとりする。

ＣＰＵ２０１は、ハードディスク装置２０９に記憶されたプログラム２１１を読み出して、ＲＡＭ２０８に展開して実行することで、上記の機能構成（例えば情報取得部１０、演算取得部１１、修正項目抽出部１２、対応資料抽出部１３、目的変数生成部１４、説明変数生成部１５、学習部１６、モデル保存部１７、入力部１８、識別部１９、候補値生成部２０および出力部２１）に関する各種の処理を行う。なお、プログラム２１１は、ハードディスク装置２０９に記憶されていなくてもよい。例えば、コンピュータ２００が読み取り可能な記憶媒体に記憶されたプログラム２１１を読み出して実行するようにしてもよい。コンピュータ２００が読み取り可能な記憶媒体は、例えば、ＣＤ－ＲＯＭやＤＶＤディスク、ＵＳＢ（Universal Serial Bus）メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、ＬＡＮ等に接続された装置にこのプログラム２１１を記憶させておき、コンピュータ２００がこれらからプログラム２１１を読み出して実行するようにしてもよい。

以上の実施形態に関し、さらに以下の付記を開示する。

（付記１）書類の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目を含む説明変数を生成し、
前記学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が前記修正履歴と一致するか否かを含む目的変数を生成し、
生成した前記説明変数および前記目的変数に基づいて前記各事例の機械学習を行い、モデルを生成する、
処理を制御部が実行することを特徴とする学習装置。

（付記２）前記目的変数を生成する処理は、前記事例の複数の書類に含まれる共通の項目に対して前記所定の演算を行った結果が前記修正履歴と一致するか否かを含む前記目的変数を生成する、
ことを特徴とする付記１に記載の学習装置。

（付記３）前記所定の演算は、前記共通の項目における最大値、２番目の値または総和のいずれかを求める、
ことを特徴とする付記２に記載の学習装置。

（付記４）前記説明変数を生成する処理は、前記項目それぞれに対して所定の演算を行った結果を前記説明変数に含める、
ことを特徴とする付記１乃至３のいずれか一に記載の学習装置。

（付記５）書類の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目を説明変数とし、前記事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が前記修正履歴と一致するか否かを目的変数として機械学習したモデルに対して、判定対象の書類に含まれる各項目を入力し、
前記モデルからの出力に基づいて、前記判定対象の書類に含まれる項目それぞれにおいて一致すると判定した演算の内容を出力する、
処理を制御部が実行することを特徴とする判定装置。

（付記６）前記出力する処理は、前記判定対象の書類に含まれる項目それぞれにおいて一致すると判定した演算による演算結果を含める、
ことを特徴とする付記５に記載の判定装置。

（付記７）前記出力する処理は、前記一致すると判定した演算の内容における、前記モデルからの出力に基づく確度を含める、
ことを特徴とする付記５または６に記載の判定装置。

（付記８）書類の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる各項目を含む説明変数を生成し、
前記学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が前記修正履歴と一致するか否かを含む目的変数を生成し、
生成した前記説明変数および前記目的変数に基づいて前記各事例の機械学習を行い、モデルを生成する、
処理をコンピュータが実行することを特徴とする学習方法。

（付記９）前記目的変数を生成する処理は、前記事例の複数の書類に含まれる共通の項目に対して前記所定の演算を行った結果が前記修正履歴と一致するか否かを含む前記目的変数を生成する、
ことを特徴とする付記８に記載の学習方法。

（付記１０）前記所定の演算は、前記共通の項目における最大値、２番目の値または総和のいずれかを求める、
ことを特徴とする付記９に記載の学習方法。

（付記１１）前記説明変数を生成する処理は、前記項目それぞれに対して所定の演算を行った結果を前記説明変数に含める、
ことを特徴とする付記８乃至１０のいずれか一に記載の学習方法。

（付記１２）書類の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目を説明変数とし、前記事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が前記修正履歴と一致するか否かを目的変数として機械学習したモデルに対して、判定対象の書類に含まれる各項目を入力し、
前記モデルからの出力に基づいて、前記判定対象の書類に含まれる項目それぞれにおいて一致すると判定した演算の内容を出力する、
処理をコンピュータが実行することを特徴とする判定方法。

（付記１３）前記出力する処理は、前記判定対象の書類に含まれる項目それぞれにおいて一致すると判定した演算による演算結果を含める、
ことを特徴とする付記１２に記載の判定方法。

（付記１４）前記出力する処理は、前記一致すると判定した演算の内容における、前記モデルからの出力に基づく確度を含める、
ことを特徴とする付記１２または１３に記載の判定方法。

（付記１５）書類の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目を含む説明変数を生成し、
前記学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が前記修正履歴と一致するか否かを含む目的変数を生成し、
生成した前記説明変数および前記目的変数に基づいて前記各事例の機械学習を行い、モデルを生成する、
処理をコンピュータに実行させることを特徴とする学習プログラム。

（付記１６）前記目的変数を生成する処理は、前記事例の複数の書類に含まれる共通の項目に対して前記所定の演算を行った結果が前記修正履歴と一致するか否かを含む前記目的変数を生成する、
ことを特徴とする付記１５に記載の学習プログラム。

（付記１７）前記所定の演算は、前記共通の項目における最大値、２番目の値または総和のいずれかを求める、
ことを特徴とする付記１６に記載の学習プログラム。

（付記１８）前記説明変数を生成する処理は、前記項目それぞれに対して所定の演算を行った結果を前記説明変数に含める、
ことを特徴とする付記１５乃至１７のいずれか一に記載の学習プログラム。

（付記１９）書類の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目を説明変数とし、前記事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が前記修正履歴と一致するか否かを目的変数として機械学習したモデルに対して、判定対象の書類に含まれる各項目を入力し、
前記モデルからの出力に基づいて、前記判定対象の書類に含まれる項目それぞれにおいて一致すると判定した演算の内容を出力する、
処理をコンピュータに実行させることを特徴とする判定プログラム。

（付記２０）前記出力する処理は、前記判定対象の書類に含まれる項目それぞれにおいて一致すると判定した演算による演算結果を含める、
ことを特徴とする付記１９に記載の判定プログラム。

（付記２１）前記出力する処理は、前記一致すると判定した演算の内容における、前記モデルからの出力に基づく確度を含める、
ことを特徴とする付記１９または２０に記載の判定プログラム。

１…情報処理装置
１０…情報取得部
１１…演算取得部
１２…修正項目抽出部
１３…対応資料抽出部
１４…目的変数生成部
１５…説明変数生成部
１６…学習部
１７…モデル保存部
１８…入力部
１９…識別部
２０…候補値生成部
２１…出力部
３０…学習用データ
３０ａ…資料情報
３０ｂ…修正履歴
３０ｃ…演算結果
３０ｄ…目的変数
３０ｅ…説明変数
３１…復元演算情報
３２…識別用データ
３２ａ…評価値
３２ｂ…出力結果
２００…コンピュータ
２０１…ＣＰＵ
２０２…入力装置
２０３…モニタ
２０４…スピーカー
２０５…媒体読取装置
２０６…インタフェース装置
２０７…通信装置
２０８…ＲＡＭ
２０９…ハードディスク装置
２１０…バス
２１１…プログラム
２１２…各種データ
Ｄ１…確定申告書
Ｄ２…住民税申告書
Ｄ３、Ｄ４…給与支払報告書
Ｄ５…年金支払報告書
Ｇ１…表示画面
Ｈ１…住民
Ｈ２…職員
Ｋ１、Ｋ２…勤務先
Ｋ３…年金機構
Ｍ１…学習モデル
Ｍ０１、Ｍ０２…メッセージ

Claims

書類の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目を含む説明変数を生成し、
前記学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が前記修正履歴と一致するか否かを含む目的変数を生成し、
生成した前記説明変数および前記目的変数に基づいて前記各事例の機械学習を行い、モデルを生成する、
処理を制御部が実行することを特徴とする学習装置。
前記目的変数を生成する処理は、前記事例の複数の書類に含まれる共通の項目に対して前記所定の演算を行った結果が前記修正履歴と一致するか否かを含む前記目的変数を生成する、
ことを特徴とする請求項１に記載の学習装置。
前記所定の演算は、前記共通の項目における最大値、２番目の値または総和のいずれかを求める、
ことを特徴とする請求項２に記載の学習装置。
前記説明変数を生成する処理は、前記項目それぞれに対して所定の演算を行った結果を前記説明変数に含める、
ことを特徴とする請求項１乃至３のいずれか一項に記載の学習装置。
書類の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目を説明変数とし、前記事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が前記修正履歴と一致するか否かを目的変数として機械学習したモデルに対して、判定対象の書類に含まれる各項目を入力し、
前記モデルからの出力に基づいて、前記判定対象の書類に含まれる項目それぞれにおいて一致すると判定した演算の内容を出力する、
処理を制御部が実行することを特徴とする判定装置。
前記出力する処理は、前記判定対象の書類に含まれる項目それぞれにおいて一致すると判定した演算による演算結果を含める、
ことを特徴とする請求項５に記載の判定装置。
前記出力する処理は、前記一致すると判定した演算の内容における、前記モデルからの出力に基づく確度を含める、
ことを特徴とする請求項５または６に記載の判定装置。
書類の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目を含む説明変数を生成し、
前記学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が前記修正履歴と一致するか否かを含む目的変数を生成し、
生成した前記説明変数および前記目的変数に基づいて前記各事例の機械学習を行い、モデルを生成する、
処理をコンピュータが実行することを特徴とする学習方法。
書類の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目を説明変数とし、前記事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が前記修正履歴と一致するか否かを目的変数として機械学習したモデルに対して、判定対象の書類に含まれる各項目を入力し、
前記モデルからの出力に基づいて、前記判定対象の書類に含まれる項目それぞれにおいて一致すると判定した演算の内容を出力する、
処理をコンピュータが実行することを特徴とする判定方法。
書類の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目を含む説明変数を生成し、
前記学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が前記修正履歴と一致するか否かを含む目的変数を生成し、
生成した前記説明変数および前記目的変数に基づいて前記各事例の機械学習を行い、モデルを生成する、
処理をコンピュータに実行させることを特徴とする学習プログラム。
書類の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、当該事例の書類に含まれる項目を説明変数とし、前記事例の書類に含まれる項目それぞれに対して所定の演算を行った結果が前記修正履歴と一致するか否かを目的変数として機械学習したモデルに対して、判定対象の書類に含まれる各項目を入力し、
前記モデルからの出力に基づいて、前記判定対象の書類に含まれる項目それぞれにおいて一致すると判定した演算の内容を出力する、
処理をコンピュータに実行させることを特徴とする判定プログラム。