JP2020038570A

JP2020038570A - 推定装置、システム、方法及びプログラム、並びに、学習装置及び方法

Info

Publication number: JP2020038570A
Application number: JP2018166307A
Authority: JP
Inventors: 睦渡部; Mutsumi Watabe; 中山　淳也; Junya Nakayama; 淳也中山; 富志夫斎藤; Toshio Saito; 伸介山口; Shinsuke Yamaguchi
Original assignee: NEC Solution Innovators Ltd
Current assignee: NEC Solution Innovators Ltd
Priority date: 2018-09-05
Filing date: 2018-09-05
Publication date: 2020-03-12

Abstract

【課題】入力内容に応じた情報を推定する精度を向上させること。【解決手段】推定装置は、所定の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する前処理部と、処理済みの伝票データにおける説明文字列から前処理部により変換された特徴ベクトルと、当該処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する属性情報を推定するために機械学習された推定モデルを記憶する記憶部と、推定対象の伝票データにおける説明文字列から、前処理部及び機械学習された推定モデルを用いて当該推定対象の伝票データに対応する属性情報を推定する推定部と、を備える。【選択図】図３

Description

本発明は、推定装置、システム、方法及びプログラム、並びに、学習装置、方法及びプログラムに関し、特に、伝票データに対応する情報を推定するための推定装置、システム、方法及びプログラム、並びに、学習装置、方法及びプログラムに関する。

企業や自治体等では、部署内の経費精算のために経理担当者が会計システムに対して伝票入力を行い、その際、伝票に応じた勘定科目の選択を行い、後に、選択された勘定科目の適切さの審査が審査部門により行われる。

ここで、特許文献１には、会計処理装置に関する技術が開示されている。特許文献１にかかる会計処理装置は、ウェブ明細データの取引内容の記載に基づいて、勘定科目とキーワードとを予め対応付けた対応テーブルを参照して、特定の勘定科目を自動的に仕訳し、作成した仕訳データをユーザのコンピュータに送信するものである。

特開２０１４−１８２７８７号公報

しかしながら、特許文献１では、対応テーブルに登録するキーワードの選出に依存しており、仕訳の精度に限界があるという問題点がある。例えば、取引内容の記載にキーワードが含まれていない場合には、対応テーブルから適切な勘定科目に仕訳できない。そして、対応テーブルのメンテナンスは、負荷が大きく、キーワードを適切なものに維持しにくい。

本開示は、このような問題点を解決するためになされたものであり、入力内容に応じた情報を推定する精度を向上させるための推定装置、システム、方法及びプログラム、並びに、学習装置、方法及びプログラムを提供することを目的とする。

本開示の第１の態様にかかる推定装置は、
所定の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する前処理部と、
処理済みの伝票データにおける前記説明文字列から前記前処理部により変換された前記特徴ベクトルと、当該処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するために機械学習された推定モデルを記憶する記憶部と、
推定対象の伝票データにおける前記説明文字列から、前記前処理部及び前記機械学習された推定モデルを用いて当該推定対象の伝票データに対応する前記属性情報を推定する推定部と、
を備える。

本開示の第２の態様にかかる学習装置は、
処理済みの伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する前処理部と、
前記特徴ベクトルと前記処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するための推定モデルを機械学習する学習部と、
を備える。

本開示の第３の態様にかかる推定システムは、
所定の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する前処理部と、
処理済みの伝票データにおける前記説明文字列から前記前処理部により変換された前記特徴ベクトルと、当該処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するための推定モデルを機械学習する学習部と、
推定対象の伝票データにおける前記説明文字列から、前記前処理部及び前記機械学習された推定モデルを用いて当該推定対象の伝票データに対応する前記属性情報を推定する推定部と、
を備える。

本開示の第４の態様にかかる推定方法は、
コンピュータが、
推定対象の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換し、
処理済みの伝票データにおける前記説明文字列から前記所定の文字コードに基づき変換された前記特徴ベクトルと当該処理済みの伝票データに対応する属性情報とに基づいて任意の伝票データに対応する前記属性情報を推定するために機械学習された推定モデルを用いて、前記推定対象の伝票データにおける前記特徴ベクトルから、当該推定対象の伝票データに対応する前記属性情報を推定する。

本開示の第５の態様にかかる推定プログラムは、
推定対象の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する処理と、
処理済みの伝票データにおける前記説明文字列から前記所定の文字コードに基づき変換された前記特徴ベクトルと当該処理済みの伝票データに対応する属性情報とに基づいて任意の伝票データに対応する前記属性情報を推定するために機械学習された推定モデルを用いて、前記推定対象の伝票データにおける前記特徴ベクトルから、当該推定対象の伝票データに対応する前記属性情報を推定する処理と、
をコンピュータに実行させる。

本開示の第６の態様にかかる学習方法は、
コンピュータが、
処理済みの伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換し、
前記特徴ベクトルと前記処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するための推定モデルを機械学習する。

本開示の第７の態様にかかる学習プログラムは、
処理済みの伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する処理と、
前記特徴ベクトルと前記処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するための推定モデルを機械学習する処理と、
をコンピュータに実行させる。

本開示により、入力内容に応じた情報を推定する精度を向上させるための推定装置、システム、方法及びプログラム、並びに、学習装置、方法及びプログラムを提供することができる。

本実施の形態１にかかる学習装置の構成を示すブロック図である。本実施の形態１にかかる学習方法の流れを示すフローチャートである。本実施の形態２にかかる推定装置の構成を示すブロック図である。本実施の形態２にかかる推定方法の流れを示すフローチャートである。本実施の形態３にかかる会計システムの構成を示すブロック図である。本実施の形態３にかかる処理済み伝票データの内部構成の概念を示す図である。本実施の形態３にかかる学習装置の構成を示すブロック図である。本実施の形態３にかかる推定モデルの概念を示す図である。本実施の形態３にかかる推定装置の構成を示すブロック図である。本実施の形態３にかかる学習方法の流れを示すフローチャートである。本実施の形態３にかかる説明変数生成処理の流れを示すフローチャートである。本実施の形態３にかかるバイト列データ（特徴ベクトル）の例を示す図である。本実施の形態３にかかる機械学習の流れを示すフローチャートである。本実施の形態３にかかる起票時の推定処理の流れを示すフローチャートである。本実施の形態３にかかる伝票起票画面の例を示す図である。本実施の形態３にかかる推定結果の画面表示の例を示す図である。本実施の形態３にかかる審査時の推定比較処理の流れを示すフローチャートである。

以下では、本開示の実施の形態について、図面を参照しながら詳細に説明する。各図面において、同一又は対応する要素には同一の符号が付されており、説明の明確化のため、必要に応じて重複説明は省略される。

＜実施の形態１＞
図１は、本実施の形態１にかかる学習装置１の構成を示すブロック図である。学習装置１は、処理済みの伝票データに関する情報を用いて、任意の伝票データに対応する属性情報を推定する推定モデルを機械学習するための情報処理装置である。尚、学習装置１は、複数台のコンピュータにより実現したものであってもよい。学習装置１は、前処理部１１と、学習部１２とを備える。

前処理部１１は、処理済みの伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する。ここで、伝票データは、金銭や物品の出納や取引内容等が記録されたデータであり、例えば、日付、金額、取引相手、勘定科目、件名等が含まれる。そして、処理済みの伝票データとは、過去に起票済みであり、勘定科目等のデータ内容について承認を受けており、データ内容が確定したものを指すものとする。そして、説明文字列とは、例えば、件名等の文字列情報である。また、所定の文字コードとは、コンピュータ上で扱う文字に割り当てられた数値データを指す。そして、所定の文字コードに基づく特徴ベクトルとは、特徴ベクトルの要素の集合が所定の文字コードに対応することを指す。つまり、前処理部１１は、説明文字列内の各文字を文字コードに起因するに特徴ベクトルに変換するものである。

学習部１２は、特徴ベクトルと、処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する属性情報を推定するための推定モデルを機械学習する。ここで、属性情報とは、対応する伝票データにおける分類項目や支払情報を指す。分類項目とは、例えば、勘定科目、支払区分等である。支払情報とは、支払金額、支払予定日等である。また、推定モデルとは、所定のパラメータ（重み付け係数）を用いて表現される数学モデルであり、例えば、ニューラルネットワーク等で表現されたものである。そして、学習部１２は、例えば、処理済みの伝票データにおける特徴ベクトルを推定モデルの入力とし、処理済みの伝票データに対応する属性情報を正解ラベルとした教師あり学習を機械学習として行う。つまり、学習部１２は、推定モデルに所定のパラメータが設定された場合に、特徴ベクトルを推定モデルに入力して求められた出力値が正解ラベルに近付くように、パラメータを調整（更新）する。尚、機械学習はこれに限定されない。また、学習部１２は、機械学習済みの推定モデルを外部又は内部の記憶装置に保存してもよい。

尚、前処理部１１及び学習部１２は、学習装置１内の制御部（不図示）が、後述する本実施の形態にかかる学習方法が実装されたコンピュータプログラムをメモリ（不図示）に読み込み実行することにより、実現される。

図２は、本実施の形態１にかかる学習方法の流れを示すフローチャートである。まず、前処理部１１は、処理済みの伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する（Ｓ１１）。次に、学習部１２は、ステップＳ１１で変換された特徴ベクトルと、処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する属性情報を推定するための推定モデルを機械学習する（Ｓ１２）。

このようにして学習された推定モデルを用いることで、任意の伝票データの説明文字列又は特徴ベクトルから当該任意の伝票データに対応する属性情報を推定することができる。よって、入力内容に応じた情報の推定精度を向上させることができる。特に、起票者や承認者が件名等から該当する勘定科目を選択するには、長年の勘や経験を必要とし、分類の誤り等を防ぐための負担が大きいといえる。よって、本実施形態により、起票者や承認者の負担を軽減することができる。

＜実施の形態２＞
図３は、本実施の形態２にかかる推定装置２の構成を示すブロック図である。推定装置２は、実施の形態１と同等の方法により学習された推定モデルを用いて、推定対象の伝票データに対応する属性情報を推定するための情報処理装置である。尚、推定装置２は、複数台のコンピュータにより実現したものであってもよい。推定装置２は、前処理部２１と、記憶部２２と、推定部２３とを備える。

前処理部２１は、所定の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する。よって、前処理部２１は、対象が処理済みの伝票データに限らず、上述した前処理部１１と同等の処理を行うものである。

記憶部２２は、推定モデル２２０を記憶する揮発性又は不揮発性の記憶装置である。ここで、本実施の形態２にかかる推定モデル２２０は、任意の伝票データに対応する属性情報を推定するものである。そして、推定モデル２２０は、処理済みの伝票データにおける特徴ベクトルと、属性情報とに基づいて機械学習されたものである。ここで、処理済みの伝票データにおける特徴ベクトルは、処理済みの伝票データにおける説明文字列から前処理部２１により変換されたものである。そのため、本実施の形態２にかかる推定モデル２２０は、上述した実施形態１において学習済みの推定モデルを用いても構わない。また、属性情報は、実施の形態１と同等である。

推定部２３は、推定対象の伝票データにおける説明文字列から、前処理部２１及び記憶部２２に記憶され、機械学習された推定モデル２２０を用いて、当該推定対象の伝票データに対応する属性情報を推定する。つまり、推定部２３は、推定対象の伝票データにおける説明文字列から、前処理部２１により特徴ベクトルに変換し、変換された特徴ベクトルを推定モデル２２０に入力し、その出力値を推定対象の伝票データに対応する属性情報、つまり推定結果とする。

尚、前処理部２１、記憶部２２及び推定部２３は、推定装置２内の制御部（不図示）が、後述する本実施の形態にかかる推定方法が実装されたコンピュータプログラムをメモリ（不図示）に読み込み実行することにより、実現される。

図４は、本実施の形態２にかかる推定方法の流れを示すフローチャートである。まず、前処理部２１は、推定対象の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する（Ｓ２１）。次に、推定部２３は、記憶部２２に記憶された推定モデル２２０を用いて、推定対象の伝票データにおける特徴ベクトルから、当該推定対象の伝票データに対応する属性情報を推定する（Ｓ２２）。ここで、推定モデル２２０は、処理済みの伝票データにおける特徴ベクトルと当該処理済みの伝票データに対応する属性情報とに基づいて任意の伝票データに対応する前記属性情報を推定するために機械学習されたものである。そして、この場合の処理済みの伝票データにおける特徴ベクトルは、処理済みの伝票データにおける説明文字列から所定の文字コードに基づき前処理部２１等により変換された特徴ベクトルである。

このように、処理済みの伝票データに基づき事前に学習された推定モデルを用いることで、推定対象の伝票データの説明文字列から当該伝票データに対応する属性情報を推定することができる。よって、入力内容に応じた情報の推定精度を向上させることができる。また、上記同様、起票者や承認者の負担を軽減することができる。

＜実施の形態３＞
本実施の形態３は、上述した実施の形態１及び２を組み合わせて、推定システムとして実現した実施例である。本実施の形態３にかかる推定システムは、少なくとも前処理部と、学習部と、推定部と、を備える情報システムである。ここで、前処理部は、上述した前処理部１１又は前処理部２１に相当する。また、学習部は、上述した学習部１２に相当する。そして、推定部は、上述した推定部２３に相当する。これにより、上述した通り、入力内容に応じた情報の推定精度を向上させることができる。

また、前記推定モデルは、前記処理済みの伝票データの起票時に特定された特定情報をさらに用いて機械学習されたものであることが望ましい。そして、この場合、前記推定部は、前記推定対象の伝票データの起票時に特定された前記特定情報をさらに用いて当該推定対象の伝票データに対応する前記属性情報を推定することが望ましい。これにより、起票に関係する情報を用いて、高精度な推定が可能となる。

さらに、前記前処理部は、前記処理済みの伝票データから前記特定情報を抽出してもよい。この場合、前記推定モデルは、次のような第１、第２及び第３のニューラルネットワークを含んでいてもよい。すなわち、第１のニューラルネットワークは、前記特徴ベクトルに対して畳み込み演算を行うためのものである。第２のニューラルネットワークは、前記特定情報を入力とするものである。第３のニューラルネットワークは、前記第１のニューラルネットワークと前記第２のニューラルネットワークの出力を連結するものである。これにより、ニューラルネットワークによる高次元かつ大量の学習データにより、推定モデルの機械学習が容易に実現可能であり、高精度に推定可能となる。

また、前記特定情報は、前記推定対象の伝票データの起票時の起票日情報を含むことが望ましい。これにより、起票時期の傾向（例えば、毎年又は毎月決まった時期に発生する支払等）に応じた高精度な推定が可能となる。例えば、20日締めの場合、16日から20日頃に入力される伝票の勘定科目には共通性があるため、このような伝票の推定精度が向上する。

また、前記特定情報は、前記推定対象の伝票データの起票者の所属情報を含むことが望ましい。これにより、起票者の所属部署の傾向に応じた高精度な推定が可能となる。

また、前記特定情報は、前記推定対象の伝票データが属する会計年度を含むことが望ましい。これにより、例年、起票日が会計年度をまたぐような場合であっても適切な推定が可能となる。

また、前記推定部は、前記推定対象の伝票データの分類項目を前記属性情報として推定してもよい。つまり、前記推定モデルは、前記任意の伝票データの分類項目を前記属性情報として推定するためのものとしてもよい。これにより、勘定科目や支払方法区分等の分類先を適切に推定できる。

または、前記推定部は、前記推定対象の伝票データの支払情報を前記属性情報として推定してもよい。つまり、前記推定モデルは、前記任意の伝票データの支払情報を前記属性情報として推定するためのものとしてもよい。これにより、支払予定日や支払金額を精度良く推定できる。

また、前記推定部は、ユーザの要求に応じて前記属性情報を推定し、当該推定した属性情報を出力することが望ましい。これにより、ユーザの伝票データに対応する属性情報の選択作業を支援できる。さらに、前記推定部は、前記推定対象の伝票データの起票者を前記ユーザとして、前記推定した属性情報を出力するとよい。これにより、起票者の伝票入力業務を効率化できる。また、前記推定部は、前記ユーザが前記推定対象の伝票データの承認者である場合、前記承認者の要求に応じて推定した前記属性情報により、前記推定対象の伝票データの起票者により事前に選択された前記属性情報の妥当性の判定結果を前記承認者に出力するようにしてもよい。これにより、承認者の承認（審査）業務を効率化できる。さらに、前記推定部は、前記推定した属性情報の信頼度をさらに推定し、当該信頼度をさらに出力してもよい。これにより、ユーザの選択作業をより効果的に支援できる。さらに、前記推定部は、前記推定した属性情報及び信頼度を出力先で表示させるために出力してもよい。これにより、ユーザが出力先の装置等において推定結果の属性情報とその信頼度を視認して、推定結果の判別を容易に行うことができる。

図５は、本実施の形態３にかかる会計システム１０００の構成を示すブロック図である。会計システム１０００は、例えば、企業や自治体等で運用される財務会計システムである。会計システム１０００は、伝票ＤＢ（ＤａｔａＢａｓｅ）１００と、推定システム２００と、端末６１０及び６２０とを備え、これらが通信ネットワークＮを介して接続されている。ここで、通信ネットワークＮは、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、インターネット又は専用線等の通信回線である。

伝票ＤＢ１００は、伝票データを記憶するデータベースである。ここでは、伝票ＤＢ１００は、会計システム１０００上で管理される多数の伝票データを管理する。すなわち、伝票ＤＢ１００は、処理済み伝票データ１１１〜１１ｎ（ｎは２以上の自然数。）と、推定対象伝票データ１２０とを記憶する。処理済み伝票データ１１１〜１１ｎは、上述した通り、過去に起票者Ｕ１等により起票済みであり、承認者Ｕ２等により承認済みの伝票データである。また、推定対象伝票データ１２０は、起票者Ｕ１等により入力済み（承認前）又は入力中の伝票データである。

図６は、本実施の形態３にかかる処理済み伝票データ１１１の内部構成の概念を示す図である。処理済み伝票データ１１１は、件名１１１１、起票日１１１２、所属コード１１１３、会計年度１１１４、科目コード１１１５、区分コード１１１６、支払金額１１１７及び支払予定日１１１８を含む。ここで、起票日１１１２、所属コード１１１３及び会計年度１１１４は、処理済み伝票データ１１１の起票時に特定された特定情報の一例である。また、科目コード１１１５、区分コード１１１６、支払金額１１１７及び支払予定日１１１８は、処理済み伝票データ１１１に対応する属性情報の一例である。

件名１１１１は、説明文字列の一例であり、例えば、処理済み伝票データ１１１のタイトルである５０文字以内の文字列データである。但し、文字数はこれに限定されない。また、件名１１１１は、説明文字列が５０文字以上の場合には文字列のうち５０文字以上を切り捨てたもの、説明文字列が５０文字未満の場合には５０文字に足りない部分に「０」を埋めたものとしてもよい。起票日１１１２は、処理済み伝票データ１１１が会計システム１０００上で起票（作成）された年月日を示し、起票日情報の一例である。尚、年については、西暦と元号の変換は適宜なされるものとする。所属コード１１１３は、処理済み伝票データ１１１を起票した起票者が属する部署の所属情報（部門コード等）の一例である。会計年度１１１４は、処理済み伝票データ１１１が属する会計年度である。例えば、会計年度の締めが毎年３月末の場合、起票日１１１２が例えば、２０１８年４月某日であったとしても、会計年度１１１４が前年度の２０１７年度であることが有り得る。

科目コード１１１５は、処理済み伝票データ１１１に該当する勘定科目のコードである。区分コード１１１６は、処理済み伝票データ１１１に該当する支払方法区分等のカテゴリー値である各種区分コードである。ここで、科目コード１１１５及び区分コード１１１６は、分類項目の一例である。支払金額１１１７は、処理済み伝票データ１１１において発生した支払金額の数値情報であり、連続値である。支払予定日１１１８は、処理済み伝票データ１１１における決済の支払予定日である。尚、支払予定日１１１８は、支払期日等であってもよい。支払金額１１１７及び支払予定日１１１８は、支払情報の一例である。

尚、処理済み伝票データ１１ｎの構成は、処理済み伝票データ１１１と同様であり、推定対象伝票データ１２０の構成は、処理済み伝票データ１１１の一部を含むものであれば良いため、図示及び説明を省略する。

図５に戻り説明を続ける。推定システム２００は、学習装置３００と、推定装置４００とを含む情報システムである。尚、学習装置３００と推定装置４００とは同一の情報処理装置で実現してもよい。または、学習装置３００及び推定装置４００のそれぞれ、又は、一方は、複数台のコンピュータにより冗長化、分散して実現されてもよい。

学習装置３００は、上述した学習装置１の一例であり、少なくとも学習対象である推定モデル３１３を保持していることを示す。推定装置４００は、上述した推定装置２の一例であり、少なくとも学習済み推定モデル４１１を保持していることを示す。

図７は、本実施の形態３にかかる学習装置３００の構成を示すブロック図である。学習装置３００は、記憶部３１０と、制御部３２０と、ＩＦ（ＩｎｔｅｒＦａｃｅ）部３３０とを備える。記憶部３１０は、ハードディスク、フラッシュメモリ等の記憶装置である。記憶部３１０は、説明変数３１１と、正解ラベル３１２と、推定モデル３１３と、学習プログラム３１４とを記憶する。

説明変数３１１は、推定モデル３１３の入力として用いられるデータを示す。説明変数３１１は、例えば、件名バイト列３１１１、起票日情報３１１２、所属コード３１１３及び出納整理期間フラグ３１１４を含む。

件名バイト列３１１１は、説明文字列（件名１１１１等）から変換された所定の文字コードに基づくバイト列データ、又は、所定の文字コードに基づく特徴ベクトルの一例である。件名バイト列３１１１の詳細は後述する。

起票日情報３１１２は、起票日１１１２から変換された情報であり、ここでは、月３１１２１、日３１１２２、曜日３１１２３、週番号３１１２４を含む。月３１１２１は、月を示す数値（１〜１２）、日３１１２２は、日付を示す数値（１〜３１）、曜日３１１２３は、曜日を１〜７に変換した数値、週番号３１１２４は、年初からの週の数を示す数値（１〜５３）である。所属コード３１１３は、所属コード１１１３から１から始まる連番に変換された数値である。出納整理期間フラグ３１１４は、会計年度１１１４が起票日１１１２の属する年度であるか否かを示すフラグ情報である。ここで、起票日情報３１１２、所属コード３１１３及び出納整理期間フラグ３１１４は、離散値の説明変数である。

正解ラベル３１２は、推定モデル３１３を機械学習する際の教師データとなる情報である。ここでは、正解ラベル３１２は、科目コード３１２１、区分コード３１２２、支払金額３１２３、支払予定日３１２４を含む。これらは、処理済み伝票データ１１１内の科目コード１１１５、区分コード１１１６、支払金額１１１７、支払予定日１１１８と同等である。尚、正解ラベル３１２の内容は、推定内容に応じて適宜、変更可能である。

推定モデル３１３は、任意の伝票データに対応する属性情報を推定するための推定モデルの一例である。ここでは、推定モデル３１３は、パラメータ３１３０を含み、パラメータ３１３０は、複数のパラメータの集合を示すものとする。つまり、推定モデル３１３は、パラメータ３１３０の設定値に応じて、同じ入力値に対する出力値が変化するものである。

図８は、本実施の形態３にかかる推定モデル３１３の概念を示す図である。推定モデル３１３は、深層学習ネットワークである。推定モデル３１３は、件名バイト列ネットワーク３１３１、エンティティエンベッティングネットワーク３１３２、全結合層３１３３及び出力層３１３４で構成される。件名バイト列ネットワーク３１３１は、第１のニューラルネットワークの一例であり、一次元の畳み込みネットワーク（畳み込み層ブロックＣＮＮ１）により構成される。ここで、畳み込み層ブロックＣＮＮ１は、例えば、９層程度であるがこれに限定されない。件名バイト列ネットワーク３１３１は、説明変数３１１内の件名バイト列３１１１を入力とし、複数回の畳み込み演算を繰り返し、最終的に１０２４次元程度の実数値の特徴ベクトルを出力する。

エンティティエンベッティングネットワーク３１３２は、第２のニューラルネットワークの一例であり、入力された離散値をインデックスとして学習可能な特徴ベクトルへの変換を行うネットワークである。エンティティエンベッティングネットワーク３１３２は、説明変数３１１のうち件名バイト列３１１１以外の離散値を入力対象とする。エンティティエンベッティングネットワーク３１３２は、それぞれの入力離散値を１次元から最大５０次元程度の実数値ベクトルに変換して出力する。そして、エンティティエンベッティングネットワーク３１３２は、特定情報の種類ごとにそれぞれ対応する複数のネットワークを有する。具体的には、エンティティエンベッティングネットワーク３１３２は、月用ＥＥＮ１、日用ＥＥＮ２、曜日用ＥＥＮ３、週番号用ＥＥＮ４、所属コード用ＥＥＮ５及び出納整理期間フラグ用ＥＥＮ６を有する。

全結合層３１３３は、第３のニューラルネットワークの一例であり、件名バイト列ネットワーク３１３１の出力とエンティティエンベッティングネットワーク３１３２の出力を連結し、２０００次元程度の特徴ベクトルとする。そして、全結合層３１３３は、当該特徴ベクトルを入力層として隠れ層を２層程度有する多層パーセプトロンを用意する。

出力層３１３４は、全結合層３１３３の出力を受け取り、最終的な推定結果３１５を出力する。出力層３１３４は、推定する内容に応じて、分類クラス数と同数のノード数を持つ分類用出力層と、金額等の実数値を予測する場合の回帰分析用出力の２種類を用意し、タスクにより使い分けるようにしてもよい。

図７に戻り説明を続ける。学習プログラム３１４は、本実施の形態３にかかる学習方法が実装されたコンピュータプログラムである。

制御部３２０は、ＣＰＵ等のプロセッサ及びメモリを含むものであり、学習装置３００の各構成を制御する。制御部３２０のプロセッサは、記憶部３１０から学習プログラム３１４をメモリへ読み込み、学習プログラム３１４を実行する。これにより、制御部３２０は、前処理部３２１及び学習部３２２の機能を実現する。

前処理部３２１は、前処理部１１の一例であり、件名１１１１を所定の文字コード（例えばＵＴＦ−８）に基づくバイト列データに変換し、当該バイト列データから特徴ベクトル（件名バイト列３１１１）に変換する。例えば、前処理部３２１は、件名１１１１の文字数が所定数以上の場合、文字数が所定数となるように調整してバイト列データ及び特徴ベクトルに変換する。例えば、前処理部３２１は、件名１１１１の文字数が５０文字以上の場合、５０文字以上の文字を切り捨てて１文字目から５０文字目までをバイト列データに変換してもよい。また、前処理部３２１は、件名１１１１の文字数が５０文字未満の場合、最後の文字から５０文字目までに「０」を埋めて５０文字の文字列データとしてからバイト列データに変換してもよい。または、文字数が所定数以上又は未満の文字列についてそのままバイト列データに変換し、後述する特徴ベクトルへの変換時に文字数を調整してもよい。つまり、特徴ベクトルが単語単位ではないため、形態素解析や単語辞書から特徴量に変換する処理が不要となり、前処理及び推定処理全体を高速化できる。また、単語辞書のメンテナンスが不要となる。

さらに、前処理部３２１は、前記バイト列データをバイト単位でワンホットエンコーディングして特徴ベクトルに変換することが望ましい。これにより、未学習の単語であっても隣接する文字間の関係から精度良く推定が可能となる。尚、上述したようにバイト列データが５０文字未満又は５０文字以上の場合、前処理部３２１は、バイト列データのうち５０文字分を対象として特徴ベクトルへの変換を行っても良い。

また、前処理部３２１は、処理済み伝票データ１１１〜１１ｎから特定情報（起票日１１１２、所属コード１１１３、会計年度１１１４）を抽出する。

学習部３２２は、学習部１２の一例であり、前処理部３２１により変換された特徴ベクトル及び特定情報並びに正解ラベル３１２に基づいて、推定モデル３１３のパラメータ３１３０を機械学習する。

ＩＦ部３３０は、学習装置３００の外部との通信等を行うインタフェースである。

図９は、本実施の形態３にかかる推定装置４００の構成を示すブロック図である。推定装置４００は、記憶部４１０と、制御部４２０と、ＩＦ部４３０とを備える。記憶部４１０は、記憶部２２の一例であり、ハードディスク、フラッシュメモリ等の記憶装置である。記憶部４１０は、学習済み推定モデル４１１と、ユーザ情報４１２と、ログインユーザ情報４１３と、推定対象伝票データ４１４と、推定結果４１５と、判定結果４１６と、推定プログラム４１７とを記憶する。

学習済み推定モデル４１１は、上述した推定モデル２２０の一例であり、学習装置３００において推定モデル３１３のパラメータ３１３０が機械学習された推定モデルである。例えば、学習装置３００が出力結果として学習済み推定モデル４１１を記憶部４１０に格納してもよい。学習済み推定モデル４１１は、パラメータ４１１０を含む。そして、パラメータ４１１０は、複数のパラメータの集合を示し、特に、学習装置３００において機械学習済みのパラメータである。

ユーザ情報４１２は、会計システム１０００に登録されたユーザに関する情報である。例えば、ユーザ情報４１２には、起票者Ｕ１及び承認者Ｕ２の情報が含まれるものとする。ユーザ情報４１２は、認証情報４１２１と、所属コード４１２２とを含む。認証情報４１２１は、ユーザＩＤ及びパスワードの組等である。所属コード４１２２は、認証情報４１２１と対応付けられており、認証情報４１２１に含まれるユーザＩＤのユーザが所属する部署のコードである。

ログインユーザ情報４１３は、会計システム１０００にログインされたユーザの接続情報を管理する情報である。ログインユーザ情報４１３は、少なくとも所属コード４１３１、ログイン日４１３２、会計年度４１３３を含む。所属コード４１３１は、ログインが認められたユーザＩＤに対応づけられた所属コード４１２２である。ログイン日４１３２は、当該ユーザがログインした日時等である。会計年度４１３３は、当該ユーザがログイン時に起票対象とする伝票データが属する会計年度である。

推定対象伝票データ４１４は、起票者Ｕ１が入力中の伝票データ、又は、承認者Ｕ２が承認のために審査対象としている伝票データである。推定対象伝票データ４１４は、入力状態に応じて件名４１４１、起票日４１４２、所属コード４１４３及び会計年度４１４４を含む。これらは、件名１１１１、起票日１１１２、所属コード１１１３、会計年度１１１４と同等の情報である。

推定結果４１５は、推定対象伝票データ４１４に対して学習済み推定モデル４１１を用いて推定された属性情報やその信頼度等である。判定結果４１６は、推定対象伝票データ４１４に対して起票者Ｕ１が事前に選択した属性情報と、推定対象伝票データ４１４から学習済み推定モデル４１１により推定された属性情報との比較結果である。推定プログラム４１７は、本実施の形態３にかかる推定方法が実装されたコンピュータプログラムである。

制御部４２０は、ＣＰＵ等のプロセッサ及びメモリを含むものであり、推定装置４００の各構成を制御する。制御部４２０のプロセッサは、記憶部４１０から推定プログラム４１７をメモリへ読み込み、推定プログラム４１７を実行する。これにより、制御部４２０は、画面入出力部４２１、前処理部４２２及び推定部４２３の機能を実現する。

画面入出力部４２１は、通信ネットワークＮを介した端末６１０又は６２０等からの要求に応じて、画面を生成し、要求元へ返信する。具体的には、画面入出力部４２１は、ログイン画面、伝票起票画面、伝票審査画面等を生成する。また、画面入出力部４２１は、端末６１０又は６２０等からのログイン要求に応じて認証処理を行い、認証された場合にログインユーザ情報４１３を生成し、記憶部４１０へ保存する。また、画面入出力部４２１は、端末６１０又は６２０等からの推定指示又は推定比較指示を受け付けた場合、前処理部４２２を呼び出し、推定結果４１５及び判定結果４１６を返信する。

前処理部４２２は、前処理部２１の一例であり、前処理部３２１と同等の処理を行う。推定部４２３は、推定部２３の一例であり、前処理部４２２により変換された特徴ベクトル及び特定情報を学習済み推定モデル４１１に入力し、学習済み推定モデル４１１の出力を推定結果とする。また、推定部４２３は、学習済み推定モデル４１１を用いて分類項目を推定するか、または、回帰分析により支払情報を推定してもよい。また、推定部４２３は、推定対象伝票データ４１４に対して起票者Ｕ１が事前に選択した属性情報と、推定対象伝票データ４１４から学習済み推定モデル４１１により推定された属性情報との比較を行っても良い。

ＩＦ部４３０は、推定装置４００の外部との通信等を行うインタフェースである。

図５に戻り説明を続ける。端末６１０は、伝票データの起票者Ｕ１が起票作業に必要となる操作を行う端末装置であり、例えば、パーソナルコンピュータ等である。端末６１０は、通信ネットワークＮ等を介して伝票ＤＢ１００及び推定システム２００と通信可能に接続されており、起票者Ｕ１の操作に応じて推定装置４００へアクセスし、伝票データの入力等を行う。

端末６２０は、伝票データの承認者Ｕ２が承認作業に必要となる操作を行う端末装置であり、例えば、パーソナルコンピュータ等である。端末６２０は、通信ネットワークＮ等を介して伝票ＤＢ１００及び推定システム２００と通信可能に接続されており、承認者Ｕ２の操作に応じて推定装置４００へアクセスし、伝票データの審査等を行う。

図１０は、本実施の形態３にかかる学習方法の流れを示すフローチャートである。まず、学習装置３００の前処理部３２１は、処理済み伝票データ１１１〜１１ｎのそれぞれから、説明変数元データ及び正解ラベルを抽出する（Ｓ３１）。すなわち、前処理部３２１は、伝票ＤＢ１００から処理済み伝票データ１１１〜１１ｎのそれぞれを加工前データとして読み出し、１件ずつ処理を行う。例えば、前処理部３２１は、処理済み伝票データ１１１から件名１１１１、起票日１１１２、所属コード１１１３及び会計年度１１１４を抽出し、説明変数元データとしてメモリ等に保持する。また、前処理部３２１は、処理済み伝票データ１１１から科目コード１１１５、区分コード１１１６、支払金額１１１７及び支払予定日１１１８を抽出し、処理済み伝票データ１１１の正解ラベル３１２として記憶部３１０に保存する。

次に、前処理部３２１は、説明変数生成処理を行う（Ｓ３２）。図１１は、本実施の形態３にかかる説明変数生成処理の流れを示すフローチャートである。説明変数生成処理では、以下のステップＳ３２１〜Ｓ３２４の４つの処理の順序を問わず、適宜、並列実行してもよい。

まず、前処理部３２１は、説明変数元データに含まれる件名１１１１から件名バイト列３１１１に変換する（Ｓ３２１）。具体的には、前処理部３２１は、件名１１１１の１文字をＵＴＦ−８によるバイト表現（１バイト〜４バイト）に変換する（Ｓ３２１１）。ここで、１バイト（８ビット）は０から２５５までの整数である。次に、前処理部３２１は、１バイトごとにワンホットエンコーディング化し、２５６次元ベクトルに変換する（Ｓ３２１２）。これにより、２５６次元×（件名の元の文字数×（１〜４））の二次元配列が得られる。例えば、ＵＴＦ−８文字単位（ユニコード文字単位）でワンホットエンコーディングを行った場合、ユニコード文字が数万種あるため数万次元のエンコード表現となり、情報量の低下、使用メモリ量の増大、計算時間の増大を招いてしまう。一方、本実施形態では、最大でも「２５６次元×（１〜４）」で済むバイト単位の処理とすることで、これらの文字単位処理の問題を解決できる。また、ＵＴＦ−８で表現できる文字列であれば処理可能なため、日本語、英語、各種記号などが混在した文字列をそのまま使用することができる。

図１２は、本実施の形態３にかかるバイト列データ（特徴ベクトル）の例を示す図である。ここでは、件名が「日本」であるものとする。この場合、前処理部３２１は、ステップＳ３２１１により件名「日本」を文字「日」及び「本」に分割し、さらに各文字をＵＴＦ−８による文字コード（３バイト等）の表現に変換する。例えば、文字「日」が文字コード「０ｘＥ６９７Ａ５」、文字「本」が文字コード「０ｘＥ６９ＣＡＣ」に変換されたことを示す。

そして、前処理部３２１は、ステップＳ３２１２により、例えば、１バイト目の「０ｘＥ６」について２５６次元の特徴ベクトルに変換する。ここで、「０ｘＥ６」は１０進数表記では「２３０」であるため、ワンホットエンコーディング化すると、特徴ベクトルは、１番目から２５６番目の要素のうち２３０番目の要素のみ「１」、他の要素が「０」となる。他のバイトデータについても同様に、ワンホットエンコーディング化される。

図１１に戻り説明を続ける。また、前処理部３２１は、説明変数元データに含まれる所属コード１１１３を１から始まる連番（所属コード３１１３）に変換する（Ｓ３２２）。また、前処理部３２１は、説明変数元データに含まれる起票日１１１２から月、日、曜日、週番号をそれぞれ１から始まる連番（月３１１２１、日３１１２２、曜日３１１２３、週番号３１１２４）に変換する（Ｓ３２３）。また、前処理部３２１は、説明変数元データに含まれる起票日１１１２及び会計年度１１１４から出納整理期間フラグ３１１４に変換する（Ｓ３２４）。例えば、起票日１１１２の属する年度が会計年度１１１４と一致せず、会計年度１１１４より大きい場合、前処理部３２１は、出納整理期間フラグ３１１４に「１」をセットする。この場合、処理済み伝票データ１１１が翌年度の出納整理期間中に作成された伝票であることを示す。一方、起票日１１１２の属する年度が会計年度１１１４と一致する場合、前処理部３２１は、出納整理期間フラグ３１１４に「０」をセットする。この場合、処理済み伝票データ１１１が年度内に起票された伝票であることを示す。尚、起票日１１１２の属する年度が会計年度１１１４より小さい場合、エラーとしてもよい。

ステップＳ３２１、Ｓ３２２、Ｓ３２３及びＳ３２４の後、図１０のステップＳ３３へ進む。前処理部３２１は、ステップＳ３３の各変換結果を対応付けて説明変数３１１とし、ステップＳ３１で抽出された正解ラベル３１２と説明変数３１１とを対応付けて学習用データとして生成し、記憶部３１０へ保存する（Ｓ３３）。尚、ステップＳ３１からＳ３３は、処理済み伝票データ１１１〜１１ｎの全てに対して行われる。つまり、処理済み伝票データの１レコードごとに、説明変数と正解ラベルの組である学習用データが作成される。

続いて、学習部３２２は、推定モデル３１３の機械学習を行う（Ｓ３４）。図１３は、本実施の形態３にかかる機械学習の流れを示すフローチャートである。まず、学習部３２２は、説明変数３１１のうち件名バイト列３１１１を件名バイト列ネットワーク３１３１に入力する（Ｓ３４１）。次に、学習部３２２は、件名バイト列ネットワーク３１３１で畳み込み演算を行う（Ｓ３４２）。例えば、学習部３２２は、９層程度の畳み込み層ブロックＣＮＮ１を繰り返し、最終的に１０２４次元程度の実数値の特徴ベクトルを出力する。

また、ステップＳ３４１及びＳ３４２と前後又は並行して、学習部３２２は、説明変数３１１のうち起票日情報３１１２を、エンティティエンベッティングネットワーク３１３２に入力する（Ｓ３４３）。具体的には、学習部３２２は、月３１１２１を月用ＥＥＮ１へ、日３１１２２を日用ＥＥＮ２へ、曜日３１１２３を曜日用ＥＥＮ３へ、週番号３１１２４を週番号用ＥＥＮ４へ、所属コード３１１３を所属コード用ＥＥＮ５へ、出納整理期間フラグ３１１４を出納整理期間フラグ用ＥＥＮ６へ入力する。

そして、学習部３２２は、各エンティティエンベッティングネットワークを実数値ベクトルに変換する（Ｓ３４４）。例えば、学習部３２２は、特定情報ごとに、１次元から最大５０次元程度の実数値ベクトルを出力する。

ステップＳ３４２及びＳ３４４の後、学習部３２２は、件名バイト列ネットワーク３１３１の出力とエンティティエンベッティングネットワーク３１３２の出力とを全結合層３１３３で連結する（Ｓ３４５）。そして、学習部３２２は、全結合層３１３３の出力を出力層３１３４へ入力し、推定結果３１５を出力する（Ｓ３４６）。

その後、学習部３２２は、推定結果３１５と正解ラベル３１２を比較し、誤差が最小となるようにパラメータ３１３０（重み付け係数）を更新する（Ｓ３４７）。例えば、学習部３２２は、確率的勾配降下法等を用いることができるが、これに限定されない。そして、学習部３２２は、ステップＳ３４１〜Ｓ３４７の処理の繰り返し回数が指定回数を超えたか否かを判定する（Ｓ３４８）。繰り返し回数が指定回数を超えていない場合、学習部３２２は、ステップＳ３４７の更新後のパラメータ３１３０を件名バイト列ネットワーク３１３１、エンティティエンベッティングネットワーク３１３２、全結合層３１３３及び出力層３１３４、つまり、推定モデル３１３に設定する（Ｓ３４９）。そして、ステップＳ３４１及びＳ３４３へ戻る。また、処理済み伝票データと正解ラベルの組の全てについてこれらが行われる。

そして、ステップＳ３４８において、繰り返し回数が指定回数を超えた場合、ステップＳ３５へ進む。学習部３２２は、学習済みのパラメータ３１３０が設定された推定モデル３１３を出力する（Ｓ３５）。例えば、学習部３２２は、学習済みの推定モデル３１３を推定装置４００の記憶部４１０内に学習済み推定モデル４１１として保存する。

続いて、未処理の伝票データを起票又は承認のための審査の際に、学習済み推定モデル４１１を用いて推定する場合について説明する。まず、起票時について説明する。

図１４は、本実施の形態３にかかる起票時の推定処理の流れを示すフローチャートである。まず、推定装置４００は、起票者Ｕ１についての会計システム１０００へのログイン処理を行う（Ｓ４１０）。例えば、まず、端末６１０は、起票者Ｕ１の操作によりログイン要求を通信ネットワークＮを介して推定装置４００へ送信する。そして、推定装置４００の画面入出力部４２１は、ログイン画面を生成し、通信ネットワークＮを介して端末６１０へ返信する。端末６１０は、受信したログイン画面を表示し、起票者Ｕ１からのユーザＩＤ及びパスワードの認証情報の入力に応じて、認証情報を推定装置４００へ送信する。画面入出力部４２１は、受信した認証情報と記憶部４１０内の認証情報４１２１とが照合されれば、起票者Ｕ１のログインを認め、会計年度の入力画面を生成し、端末６１０へ送信する。

続いて、端末６１０は、受信した会計年度の入力画面を表示し、起票者Ｕ１から、起票対象の伝票データが属する会計年度の指定を受け付け（Ｓ４１１）、指定された会計年度を推定装置４００へ送信する。画面入出力部４２１は、受信した会計年度を会計年度４１４４の値の指定として記憶部４１０に保存する。

ここで、ステップＳ４１１の後、画面入出力部４２１は、ログインした起票者Ｕ１についてのログインユーザ情報４１３を生成する（Ｓ４１５）。すなわち、画面入出力部４２１は、起票者Ｕ１の認証情報４１２１に対応付けられた所属コード４１２２を特定し、所属コード４１３１としてログインユーザ情報４１３に含めて保存する。また、画面入出力部４２１は、現在の日付をログイン日４１３２としてログインユーザ情報４１３に含めて保存する。さらに、画面入出力部４２１は、ステップＳ４１１で指定された会計年度を会計年度４１３３としてログインユーザ情報４１３に含めて保存する。

また、ステップＳ４１１の後、画面入出力部４２１は、伝票起票画面を生成し、伝票起票画面を端末６１０へ送信する。端末６１０は、受信した伝票起票画面を表示し（Ｓ４１２）、起票者Ｕ１から起票対象の伝票データにおける件名の入力を受け付け（Ｓ４１３）、入力された件名を推定装置４００へ送信する。画面入出力部４２１は、入力された件名を件名４１４１として記憶部４１０に保存する。

図１５は、本実施の形態３にかかる伝票起票画面５００の例を示す図である。伝票起票画面５００は、例えば、ログイン情報５０１、会計年度５０２、起票日５０３、件名５０４は、推定指示ボタン５０５等が表示される。ログイン情報５０１は、ステップＳ４１０でログインした起票者Ｕ１の所属及び氏名等が表示されることを示す。会計年度５０２は、ステップＳ４１１で指定された会計年度が表示されることを示す。起票日５０３は、ステップＳ４１０でログインした日付が起票日として表示されることを示す。

また、件名５０４は、ステップＳ４１３で入力された件名を示す。推定指示ボタン５０５は、伝票起票画面５００に表示及び入力された伝票データについて、学習済み推定モデル４１１を用いて属性情報を推定する指示を行うものである。

図１４に戻り説明を続ける。その後、端末６１０は、起票者Ｕ１の操作により、入力中の伝票データに対して属性情報の推定指示を受け付け、属性情報の推定指示を推定装置４００へ送信する（Ｓ４１４）。例えば、起票者Ｕ１は、端末６１０を操作して推定指示ボタン５０５を押下したものとする。

ステップＳ４１４に応じて、画面入出力部４２１は、端末６１０から属性情報の推定指示を受信し、前処理を行う（Ｓ４１６）。具体的には、画面入出力部４２１は、件名４１４１、及び、ログインユーザ情報４１３を入力として、前処理部４２２を呼び出す。前処理部４２２は、件名４１４１及びログインユーザ情報４１３内の所属コード４１３１、ログイン日４１３２、会計年度４１３３を上述した説明変数元データとする。そして、前処理部４２２は、これらの説明変数元データを対象に、図１１と同様に、説明変数生成処理を行う。

そして、推定部４２３は、前処理部４２２により生成された説明変数を学習済み推定モデル４１１に入力し、属性情報を推定する（Ｓ４１７）。具体的には、推定部４２３は、ステップＳ３４１及びＳ３４２と同様に、説明変数のうち件名バイト列を件名バイト列ネットワーク３１３１に入力し、件名バイト列ネットワーク３１３１で畳み込み演算を行う。また、推定部４２３は、ステップＳ３４３及びＳ３４４と同様に、説明変数のうち月、日、曜日、週番号、所属コード、出納整理期間フラグのそれぞれを、エンティティエンベッティングネットワーク３１３２に入力し、実数値ベクトルに変換する。

続いて、推定部４２３は、ステップＳ３４５及びＳ３４６と同様に、件名バイト列ネットワーク３１３１の出力とエンティティエンベッティングネットワーク３１３２の出力とを全結合層３１３３で連結し、全結合層３１３３の出力を出力層３１３４へ入力し、属性情報（推定結果４１５）を推定する。ここで、推定結果４１５は、推定対象伝票データ４１４に対応する勘定科目、支払方法区分等の分類項目か、支払金額、支払予定日等の支払情報である。尚、推定部４２３は、２以上の属性情報を推定してもよい。その場合、推定結果４１５は、２以上の推定結果のリストとなる。

併せて、推定部４２３は、推定結果４１５の信頼度を算出する（Ｓ４１８）。例えば、推定部４２３は、伝票ＤＢ１００の処理済み伝票データ１１１〜１１ｎを参照し、件名４１４１、起票日４１４２、所属コード４１４３、会計年度４１４４の組合せに合致する伝票データにおいて、推定結果４１５と同様の属性情報が過去に承認された比率を信頼度として算出してもよい。尚、推定結果４１５がリストの場合、推定部４２３は、各属性情報について信頼度を算出するものとする。

そして、推定部４２３は、推定結果４１５及び信頼度を端末６１０へ送信する。尚、推定結果４１５がリストの場合、推定部４２３は、全ての信頼度を送信する必要はない。例えば、推定部４２３は、推定結果４１５の全てを送信すると共に、送信する推定結果４１５の全ての信頼度のうちより高い一部の信頼度に絞って送信してもよい。端末６１０は、受信した推定結果４１５及び信頼度を画面に表示する（Ｓ４１９）。

図１６は、本実施の形態３にかかる推定結果の画面表示の例を示す図である。推定結果表示画面５００ａは、伝票起票画面５００の件名５０４等に基づいて推定された推定結果リスト５１０を表示する。推定結果リスト５１０は、複数の推定結果（推定支出区分）（例えば、「資金前途」「概算」「前金(工事)・・・「分割」）を含み、そのうち推定支出区分５１１（「概算」）が最も信頼度が高い（信頼度５１２が９６％）ことを示す。尚、信頼度５１２をパーセント表示に代えて、信頼度が他の推定結果と比べて高いこと又は低いことを示す表示を用いても良い。例えば、信頼度５１２に代えて、「○」を表示するか、複数の推定結果の間で色の濃さを変えてグラデーション表現（例えば、同じ緑色でも信頼度が高い方が濃いなど）を用いて表示してもよい。

その後、起票者Ｕ１は、推定結果表示画面５００ａを確認し、推定結果リスト５１０の中から推定結果を選択する。端末６１０は、選択された推定結果を推定装置４００へ送信する。画面入出力部４２１は、受信した推定結果を属性情報として推定対象伝票データ４１４に対応付けて、伝票ＤＢ１００の推定対象伝票データ１２０として保存する。

以上のことから、起票者Ｕ１は、伝票データを入力する際に、（会計年度及び）件名（説明文字列）を入力するだけで、推定装置４００は、複数の属性情報の候補を推定して提示する。そのため、起票者Ｕ１は、自身で属性情報（分類項目や支払情報）を判断して入力する必要がなく、推定結果のリストの中から選択するだけで、自動入力することができる。そのため、伝票入力に伴う作業時間の削減と、入力内容の正確性の向上を図ることが可能になる。

次に、審査時について説明する。図１７は、本実施の形態３にかかる審査時の推定比較処理の流れを示すフローチャートである。前提として、事前に起票者Ｕ１は、伝票入力を終えており、その際、推定指示ボタン５０５を押下せず、自身の判断で属性情報を事前に入力（選択）し、その結果が伝票ＤＢ１００に推定対象伝票データ１２０として保存されているものとする。

まず、推定装置４００は、承認者Ｕ２についての会計システム１０００へのログイン処理を行う（Ｓ４２０）。尚、ログイン処理は、概ね、ステップＳ４１０と同様であるが、会計年度の入力は不要であるものとする。その代りに、端末６２０は、承認者Ｕ２の操作により審査対象伝票の指定を受け付け（Ｓ４２１）、指定された審査対象伝票のＩＤ等を推定装置４００へ送信する。画面入出力部４２１は、受信した審査対象伝票のＩＤ等に基づき伝票ＤＢ１００を検索し、ここでは、推定対象伝票データ１２０がヒットしたものとする。そこで、画面入出力部４２１は、伝票ＤＢ１００から推定対象伝票データ１２０を読み出す。

ここで、ステップＳ４２１の後、画面入出力部４２１は、推定対象伝票データ１２０から件名、所属コード、起票日、会計年度、（起票者Ｕ１により事前に選択された）属性情報を抽出し、推定対象伝票データ４１４として記憶部４１０に保存する（Ｓ４２４）。

また、ステップＳ４２１の後、画面入出力部４２１は、推定対象伝票データ１２０を表示するための表示画面を生成し、端末６２０へ送信する。そして、端末６２０は、受信した表示画面を表示する（Ｓ４２２）。尚、表示画面は、伝票起票画面５００と同等である。但し、表示内容は、推定対象伝票データ１２０の保存内容となる。また、推定指示ボタン５０５は、推定比較指示ボタンとなり、表示画面に表示された伝票データについて、学習済み推定モデル４１１を用いて属性情報を推定する処理と、当該伝票データに対して事前に起票者Ｕ１に入力された属性情報と推定結果とを比較する処理とを指示するものである。

その後、端末６２０は、承認者Ｕ２の操作により、表示中の伝票データに対して属性情報の推定比較指示を受け付け、属性情報の推定比較指示を推定装置４００へ送信する（Ｓ４２３）。例えば、承認者Ｕ２は、端末６２０を操作して推定比較指示ボタンを押下したものとする。

ステップＳ４２３に応じて、画面入出力部４２１は、端末６２０から属性情報の推定比較指示を受信し、前処理を行う（Ｓ４２５）。具体的には、画面入出力部４２１は、件名４１４１、起票日４１４２、所属コード４１４３、会計年度４１４４を入力として、前処理部４２２を呼び出す。前処理部４２２は、件名４１４１、起票日４１４２、所属コード４１４３、会計年度４１４４を上述した説明変数元データとする。そして、前処理部４２２は、これらの説明変数元データを対象に、図１１と同様に、説明変数生成処理を行う。

そして、推定部４２３は、ステップＳ４１７と同様に、前処理部４２２により生成された説明変数を学習済み推定モデル４１１に入力し、属性情報を推定する（Ｓ４２６）。併せて、推定部４２３は、ステップＳ４１８と同様に、推定結果４１５の信頼度を算出する（Ｓ４２７）。

さらに、推定部４２３は、推定結果４１５（属性情報）と、ステップＳ４２４で抽出された推定対象伝票データ１２０に含まれる（起票者Ｕ１により事前に選択された）属性情報とを比較する（Ｓ４２８）。つまり、推定部４２３は、当該比較により、起票者Ｕ１により事前に選択された属性情報の妥当性を判定する。そして、比較結果が一致する場合に、推定部４２３は判定結果４１６を妥当、例えば「○」とする。一方、比較結果が不一致の場合、推定部４２３は判定結果４１６を不当、例えば推定結果４１５を正解候補として判定結果４１６に含める。

その後、推定部４２３は、推定結果４１５、信頼度及び判定結果４１６を端末６２０へ送信する。端末６２０は、受信した推定結果４１５、信頼度及び判定結果４１６を画面に表示する（Ｓ４２９）。

以上のことから、承認者Ｕ２は、起票者Ｕ１により起票された伝票データを承認のために審査する際に、対象の伝票データを指定し、推定比較指示ボタンを押下するだけで、推定装置４００は、起票者Ｕ１により事前選択された属性情報の妥当性の判定結果を表示する。そのため、承認者Ｕ２は、対象の伝票データにおける属性情報の妥当性を容易に判断することができ、また、妥当でない場合には、学習済み推定モデル４１１による推定結果の提示を受けることで、妥当な属性情報を把握し、起票者Ｕ１へのフィードバック等を行うことができる。よって、審査及び承認に伴う作業時間の削減と、審査の正確性の向上を図ることが可能になる。

＜その他の実施の形態＞
尚、上述の実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではない。本開示は、任意の処理を、ＣＰＵ（Central Processing Unit）にコンピュータプログラムを実行させることにより実現することも可能である。

上述の例において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体（non-transitory computer readable medium）を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（tangible storage medium）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ−ＲＯＭ（Read Only Memory）、ＣＤ−Ｒ、ＣＤ−Ｒ／Ｗ、ＤＶＤ（Digital Versatile Disc）、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（Random Access Memory））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（transitory computer readable medium）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

なお、本開示は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。また、本開示は、それぞれの実施の形態を適宜組み合わせて実施されてもよい。

上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
（付記Ａ１）
所定の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する前処理部と、
処理済みの伝票データにおける前記説明文字列から前記前処理部により変換された前記特徴ベクトルと、当該処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するために機械学習された推定モデルを記憶する記憶部と、
推定対象の伝票データにおける前記説明文字列から、前記前処理部及び前記機械学習された推定モデルを用いて当該推定対象の伝票データに対応する前記属性情報を推定する推定部と、
を備える推定装置。
（付記Ａ２）
前記前処理部は、前記説明文字列を前記所定の文字コードに基づくバイト列データに変換し、当該バイト列データから前記特徴ベクトルに変換する
付記Ａ１に記載の推定装置。
（付記Ａ３）
前記前処理部は、前記バイト列データをバイト単位でワンホットエンコーディングして前記特徴ベクトルに変換する
付記Ａ２に記載の推定装置。
（付記Ａ４）
前記推定モデルは、前記処理済みの伝票データの起票時に特定された特定情報をさらに用いて機械学習されたものであり、
前記推定部は、
前記推定対象の伝票データの起票時に特定された前記特定情報をさらに用いて当該推定対象の伝票データに対応する前記属性情報を推定する
付記Ａ１乃至Ａ３のいずれか１項に記載の推定装置。
（付記Ａ５）
前記推定モデルは、
前記特徴ベクトルに対して畳み込み演算を行うための第１のニューラルネットワークと、
前記特定情報を入力とする第２のニューラルネットワークと、
前記第１のニューラルネットワークと前記第２のニューラルネットワークの出力を連結する第３のニューラルネットワークと、
を含む付記Ａ４に記載の推定装置。
（付記Ａ６）
前記特定情報は、前記推定対象の伝票データの起票時の起票日情報を含む、
付記Ａ４又はＡ５に記載の推定装置。
（付記Ａ７）
前記特定情報は、前記推定対象の伝票データの起票者の所属情報を含む、
付記Ａ４乃至Ａ６のいずれか１項に記載の推定装置。
（付記Ａ８）
前記特定情報は、前記推定対象の伝票データが属する会計年度を含む、
付記Ａ４乃至Ａ７のいずれか１項に記載の推定装置。
（付記Ａ９）
前記推定部は、
前記推定対象の伝票データの分類項目を前記属性情報として推定する
付記Ａ１乃至Ａ８のいずれか１項に記載の推定装置。
（付記Ａ１０）
前記推定部は、
前記推定対象の伝票データの支払情報を前記属性情報として推定する
付記Ａ１乃至Ａ８のいずれか１項に記載の推定装置。
（付記Ａ１１）
前記推定部は、
ユーザの要求に応じて前記属性情報を推定し、当該推定した属性情報を出力する
付記Ａ１乃至Ａ１０のいずれか１項に記載の推定装置。
（付記Ａ１２）
前記推定部は、
前記推定対象の伝票データの起票者を前記ユーザとして、前記推定した属性情報を出力する
付記Ａ１１に記載の推定装置。
（付記Ａ１３）
前記推定部は、
前記ユーザが前記推定対象の伝票データの承認者である場合、前記承認者の要求に応じて推定した前記属性情報により、前記推定対象の伝票データの起票者により事前に選択された前記属性情報の妥当性の判定結果を前記承認者に出力する
付記Ａ１１に記載の推定装置。
（付記Ａ１４）
前記推定部は、
前記推定した属性情報の信頼度をさらに推定し、当該信頼度をさらに出力する
付記Ａ１１乃至Ａ１３のいずれか１項に記載の推定装置。
（付記Ａ１５）
前記推定部は、
前記推定した属性情報及び信頼度を出力先で表示させるために出力する
付記Ａ１４に記載の推定装置。
（付記Ｂ１）
処理済みの伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する前処理部と、
前記特徴ベクトルと前記処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するための推定モデルを機械学習する学習部と、
を備える学習装置。
（付記Ｂ２）
前記前処理部は、前記説明文字列を前記所定の文字コードに基づくバイト列データに変換し、当該バイト列データから前記特徴ベクトルに変換する
付記Ｂ１に記載の学習装置。
（付記Ｂ３）
前記前処理部は、前記バイト列データをバイト単位でワンホットエンコーディングして前記特徴ベクトルに変換する
付記Ｂ２に記載の学習装置。
（付記Ｂ４）
前記学習部は、前記処理済みの伝票データの起票時に特定された特定情報にさらに基づいて、前記推定モデルを機械学習する
付記Ｂ１乃至Ｂ３のいずれか１項に記載の学習装置。
（付記Ｂ５）
前記前処理部は、前記処理済みの伝票データから前記特定情報を抽出し、
前記推定モデルは、
前記特徴ベクトルに対して畳み込み演算を行うための第１のニューラルネットワークと、
前記特定情報を入力とする第２のニューラルネットワークと、
前記第１のニューラルネットワークと前記第２のニューラルネットワークの出力を連結する第３のニューラルネットワークと、
を含む付記Ｂ４に記載の学習装置。
（付記Ｂ６）
前記特定情報は、前記処理済みの伝票データの起票時の起票日情報を含む、
付記Ｂ４又はＢ５に記載の学習装置。
（付記Ｂ７）
前記特定情報は、前記処理済みの伝票データの起票者の所属情報を含む、
付記Ｂ４乃至Ｂ６のいずれか１項に記載の学習装置。
（付記Ｂ８）
前記特定情報は、前記処理済みの伝票データが属する会計年度を含む、
付記Ｂ４乃至Ｂ７のいずれか１項に記載の学習装置。
（付記Ｂ９）
前記推定モデルは、前記任意の伝票データの分類項目を前記属性情報として推定するためのものである
付記Ｂ１乃至Ｂ８のいずれか１項に記載の学習装置。
（付記Ｂ１０）
前記推定モデルは、前記任意の伝票データの支払情報を前記属性情報として推定するためのものである
付記Ｂ１乃至Ｂ８のいずれか１項に記載の学習装置。
（付記Ｃ１）
所定の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する前処理部と、
処理済みの伝票データにおける前記説明文字列から前記前処理部により変換された前記特徴ベクトルと、当該処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するための推定モデルを機械学習する学習部と、
推定対象の伝票データにおける前記説明文字列から、前記前処理部及び前記機械学習された推定モデルを用いて当該推定対象の伝票データに対応する前記属性情報を推定する推定部と、
を備える推定システム。
（付記Ｃ２）
前記前処理部は、前記説明文字列を前記所定の文字コードに基づくバイト列データに変換し、当該バイト列データから前記特徴ベクトルに変換する
付記Ｃ１に記載の推定システム。
（付記Ｃ３）
前記前処理部は、前記バイト列データをバイト単位でワンホットエンコーディングして前記特徴ベクトルに変換する
付記Ｃ２に記載の推定システム。
（付記Ｄ１）
コンピュータが、
推定対象の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換し、
処理済みの伝票データにおける前記説明文字列から前記所定の文字コードに基づき変換された前記特徴ベクトルと当該処理済みの伝票データに対応する属性情報とに基づいて任意の伝票データに対応する前記属性情報を推定するために機械学習された推定モデルを用いて、前記推定対象の伝票データにおける前記特徴ベクトルから、当該推定対象の伝票データに対応する前記属性情報を推定する
推定方法。
（付記Ｅ１）
推定対象の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する処理と、
処理済みの伝票データにおける前記説明文字列から前記所定の文字コードに基づき変換された前記特徴ベクトルと当該処理済みの伝票データに対応する属性情報とに基づいて任意の伝票データに対応する前記属性情報を推定するために機械学習された推定モデルを用いて、前記推定対象の伝票データにおける前記特徴ベクトルから、当該推定対象の伝票データに対応する前記属性情報を推定する処理と、
をコンピュータに実行させる推定プログラム。
（付記Ｆ１）
コンピュータが、
処理済みの伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換し、
前記特徴ベクトルと前記処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するための推定モデルを機械学習する
学習方法。
（付記Ｇ１）
処理済みの伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する処理と、
前記特徴ベクトルと前記処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するための推定モデルを機械学習する処理と、
をコンピュータに実行させる学習プログラム。

１学習装置
１１前処理部
１２学習部
２推定装置
２１前処理部
２２記憶部
２２０推定モデル
２３推定部
１０００会計システム
１００伝票ＤＢ
１１１処理済み伝票データ
１１１１件名
１１１２起票日
１１１３所属コード
１１１４会計年度
１１１５科目コード
１１１６区分コード
１１１７支払金額
１１１８支払予定日
１１ｎ処理済み伝票データ
１２０推定対象伝票データ
２００推定システム
３００学習装置
３１０記憶部
３１１説明変数
３１１１件名バイト列
３１１２起票日情報
３１１２１月
３１１２２日
３１１２３曜日
３１１２４週番号
３１１３所属コード
３１１４出納整理期間フラグ
３１２正解ラベル
３１２１科目コード
３１２２区分コード
３１２３支払金額
３１２４支払予定日
３１３推定モデル
３１３０パラメータ
３１３１件名バイト列ネットワーク
ＣＮＮ１畳み込み層ブロック
３１３２エンティティエンベッティングネットワーク
ＥＥＮ１月用
ＥＥＮ２日用
ＥＥＮ３曜日用
ＥＥＮ４週番号用
ＥＥＮ５所属コード用
ＥＥＮ６出納整理期間フラグ用
３１３３全結合層
３１３４出力層
３１４学習プログラム
３１５推定結果
３２０制御部
３２１前処理部
３２２学習部
３３０ＩＦ部
４００推定装置
４１０記憶部
４１１学習済み推定モデル
４１１０パラメータ
４１２ユーザ情報
４１２１認証情報
４１２２所属コード
４１３ログインユーザ情報
４１３１所属コード
４１３２ログイン日
４１３３会計年度
４１４推定対象伝票データ
４１４１件名
４１４２起票日
４１４３所属コード
４１４４会計年度
４１５推定結果
４１６判定結果
４１７推定プログラム
４２０制御部
４２１画面入出力部
４２２前処理部
４２３推定部
４３０ＩＦ部
６１０端末
６２０端末
Ｕ１起票者
Ｕ２承認者
Ｎ通信ネットワーク
５００伝票起票画面
５００ａ推定結果表示画面
５０１ログイン情報
５０２会計年度
５０３起票日
５０４件名
５０５推定指示ボタン
５１０推定結果リスト
５１１推定支出区分
５１２信頼度

Claims

所定の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する前処理部と、
処理済みの伝票データにおける前記説明文字列から前記前処理部により変換された前記特徴ベクトルと、当該処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するために機械学習された推定モデルを記憶する記憶部と、
推定対象の伝票データにおける前記説明文字列から、前記前処理部及び前記機械学習された推定モデルを用いて当該推定対象の伝票データに対応する前記属性情報を推定する推定部と、
を備える推定装置。
前記前処理部は、前記説明文字列を前記所定の文字コードに基づくバイト列データに変換し、当該バイト列データから前記特徴ベクトルに変換する
請求項１に記載の推定装置。
前記前処理部は、前記バイト列データをバイト単位でワンホットエンコーディングして前記特徴ベクトルに変換する
請求項２に記載の推定装置。
前記推定モデルは、前記処理済みの伝票データの起票時に特定された特定情報をさらに用いて機械学習されたものであり、
前記推定部は、
前記推定対象の伝票データの起票時に特定された前記特定情報をさらに用いて当該推定対象の伝票データに対応する前記属性情報を推定する
請求項１乃至３のいずれか１項に記載の推定装置。
前記推定部は、
前記推定対象の伝票データの分類項目を前記属性情報として推定する
請求項１乃至４のいずれか１項に記載の推定装置。
処理済みの伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する前処理部と、
前記特徴ベクトルと前記処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するための推定モデルを機械学習する学習部と、
を備える学習装置。
所定の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する前処理部と、
処理済みの伝票データにおける前記説明文字列から前記前処理部により変換された前記特徴ベクトルと、当該処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するための推定モデルを機械学習する学習部と、
推定対象の伝票データにおける前記説明文字列から、前記前処理部及び前記機械学習された推定モデルを用いて当該推定対象の伝票データに対応する前記属性情報を推定する推定部と、
を備える推定システム。
コンピュータが、
推定対象の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換し、
処理済みの伝票データにおける前記説明文字列から前記所定の文字コードに基づき変換された前記特徴ベクトルと当該処理済みの伝票データに対応する属性情報とに基づいて任意の伝票データに対応する前記属性情報を推定するために機械学習された推定モデルを用いて、前記推定対象の伝票データにおける前記特徴ベクトルから、当該推定対象の伝票データに対応する前記属性情報を推定する
推定方法。
推定対象の伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換する処理と、
処理済みの伝票データにおける前記説明文字列から前記所定の文字コードに基づき変換された前記特徴ベクトルと当該処理済みの伝票データに対応する属性情報とに基づいて任意の伝票データに対応する前記属性情報を推定するために機械学習された推定モデルを用いて、前記推定対象の伝票データにおける前記特徴ベクトルから、当該推定対象の伝票データに対応する前記属性情報を推定する処理と、
をコンピュータに実行させる推定プログラム。
コンピュータが、
処理済みの伝票データの内容を説明する説明文字列を所定の文字コードに基づく特徴ベクトルに変換し、
前記特徴ベクトルと前記処理済みの伝票データに対応する属性情報とに基づいて、任意の伝票データに対応する前記属性情報を推定するための推定モデルを機械学習する
学習方法。