JP7409080B2

JP7409080B2 - 学習データ生成方法、学習データ生成プログラムおよび情報処理装置

Info

Publication number: JP7409080B2
Application number: JP2019237904A
Authority: JP
Inventors: 俊一渡邉
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2019-12-27
Filing date: 2019-12-27
Publication date: 2024-01-09
Anticipated expiration: 2039-12-27
Also published as: US11347972B2; US20210201079A1; JP2021105928A

Description

本発明は、学習データ生成方法、学習データ生成プログラムおよび情報処理装置に関する。

近年、製造業や医療をはじめとする多岐にわたる分野において、機械学習が利用されている。機械学習では、例えば、学習データを用いて所定のタスクが学習される。所定のタスクには、画像から製造された物品の欠陥を判別すること、または従業員の出勤簿データから当該従業員の健康状態を判定することなどが挙げられる。機械学習の一例として、ニューラルネットワーク（ＮＮ：Neural Network）を学習モデルとして用いる深層学習が知られている。

しかしながら、機械学習に用いる学習データとして、正例または負例の一方のラベルに関するデータそのものを収集することが難しい場合がある。例えば、医療の分野では、異常状態を示すデータが少ないために、異常状態を示す学習データを収集することが困難である。そこで、予測に利用された入力データに対して、実際の結果を教師ラベルとして付与することによって、新たな学習データを生成することが行われている。

特開２０１９－１８５４８３号公報

異常状態を示す学習データを収集する他の方法として、予測に利用された入力データと、新たに取得した入力データとの類似度に基づいて、当該新たに取得した入力データに対して教師ラベルを付与し、新たな学習データを生成することが考えられる。しかしながら、この方法によれば、入力データ同士を比較しているため、本来の予測に用いるタスクにとって重要な箇所を見逃した教師ラベルの推定となっている可能性が高い。つまり、当該新たな学習データを用いて学習モデルを更新すると、却って精度劣化を招く場合もある。

本発明の１つの側面では、学習モデルの精度を向上させることが可能な学習データを生成するデータ生成方法、データ生成プログラムおよび情報処理装置を提供することを目的とする。

発明の一観点によれば、コンピュータに、第１期間における対象の時系列な第１状態が入力されることによって前記第１期間の後における前記対象の第１結果を推定する機械学習モデルから、前記第１状態の特徴である第１の特徴を取得し、前記第１結果が確定した後の期間を含む第２期間における時系列な第２状態を前記機械学習モデルに入力することにより、前記第２状態の特徴である第２の特徴を取得し、前記第１の特徴と前記第２の特徴とに基づいて、前記第２状態を説明変数とするとともに前記第１結果の確定した結果を変更した第２結果を目的変数とした学習データを生成する、処理を実行させる学習データ生成プログラムが提供される。

一実施形態によれば、学習モデルの精度を向上させることが可能な学習データを生成するデータ生成方法、データ生成プログラムおよび情報処理装置を提供することができる。

図１（ａ）は、実施例１にかかる情報処理装置の機能構成を示す機能ブロック図である。図１（ｂ）は、実施例１にかかる端末装置の機能構成を示す機能ブロック図である。図２は、実施例１にかかる情報処理装置によって実行される処理の一例を示すフローチャートである。図３は、療養ありと予想されるときの出力例を示す図である。図４は、療養なしと予想されるときの出力例を示す図である。図５は、所定の行為を実施する前の状態と所定の行為を実施した後の特徴を示すコアテンソルの比較を説明する図である。図６は、グラフ構造とテンソルとの関係の一例を示す図である。図７は、部分グラフ構造の抽出の一例を示す図である。図８は、ディープテンソルの学習例を説明する図である。図９は、実施例２にかかる情報処理装置の機能構成を示す機能ブロック図である。図１０は、センサデータＤＢに記憶される情報の例を示す図である。図１１は、学習データＤＢに記憶される情報の例を示す図である。図１２は、学習データの例を説明する図である。図１３は、コアテンソルデータＤＢに記憶される情報の例を示す図である。図１４は、テンソル化を説明する図である。図１５は、類似度算出および教師ラベル推定を説明する図である。図１６は、実施例２の処理の流れを示すフローチャートである。図１７は、実施例２の処理の流れを示すフローチャートである。図１８は、比較例による教師ラベルの推定の問題点を説明する図である。図１９は、ハードウェア構成例を説明する図である。図２０は、ハードウェア構成例を説明する図である。

以下に、本願の開示する学習データ生成方法、学習データ生成プログラムおよび情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。

（実施例１）
図１（ａ）は、実施例１にかかる情報処理装置１００の機能構成を示す機能ブロック図である。図１（ａ）に示すように、情報処理装置１００は、通信部１０１、記憶部１０２、制御部１１０を有する。

通信部１０１は、他の装置との通信を制御する処理部であり、例えば通信インタフェースである。例えば、通信部１０１は、端末装置２００から、処理開始指示、学習データ、学習データの特徴量などを受信する。また、通信部１０１は、管理者の端末装置２００に対して、学習結果および予測結果などを出力する。さらに、通信部１０１は、通信部２０１に対して、学習モデルを配信する。

記憶部１０２は、プログラムおよびデータを記憶する記憶装置（例えばメモリまたはハードディスク）によって実現される。記憶部１０２は、センサデータＤＢ１０３、学習データＤＢ１０４、学習結果ＤＢ１０５を記憶する。センサデータＤＢ１０３は、対象の複数の状態を記憶するデータベースである。例えば、対象の複数の状態とは、従業員の出勤簿データの出欠区分に相当する。また、他の例として、対象の複数の状態は、製造ラインの工程毎に設置されたセンサが検出したセンサ値であっても良い。

学習データＤＢ１０４は、学習データに関する情報が記憶されているデータベースである。具体的には、学習データＤＢ１０４は、学習モデルの学習に利用されるデータである。学習モデルとは、パラメータが組み込まれたプログラムであり、入力に対して一定の結果を出力する。学習データＤＢ１０４は、例えば、対象の複数の状態と１つの教師ラベルの組となる各学習データを記憶する。また、学習データＤＢ１０４は、所定の行為を実施する前の状態を有する学習データと、所定の行為を実施した後の状態を有する学習データとを識別可能な状態で記憶している。

学習結果ＤＢ１０５は、学習結果に関する情報が記憶されているデータベースである。例えば、学習結果ＤＢ１０５は、制御部１１０による学習データの判別結果、および機械学習によって最適化されたＮＮの各種パラメータなどを記憶する。また、学習結果ＤＢ１０５は、学習により最適化された各種パラメータが設定された学習済みの学習モデルを記憶する。

制御部１１０は、情報処理装置１００全体の処理を司る処理部であり、例えばプロセッサにより実現される。制御部１１０は、第１の抽出部１２１、第２の抽出部１２２、判定部１２３、および実行部１２４を有する。

第１の抽出部１２１は、第１期間における対象の時系列な第１状態が入力されることによって第１期間の後における対象の第１結果を推定する機械学習モデルから、第１状態の特徴である第１の特徴を取得する。

つまり、第１の抽出部１２１は、学習データＤＢ１０４に記憶された学習データから所定の行為を実施する前の状態を有する第１の学習データを特定する。そして、第１の抽出部１２１は、第１の学習データから、複数の状態の相関と第１の学習データの目的変数の特徴とを示す第１の特徴を抽出する。ここで、所定の行為とは、例えば、教師ラベルが正例である学習データの対象に対して、教師ラベルが負例になるように実施される行為である。本実施例において、例えば、正例とは療養ありの従業員であり、負例とは療養なしの従業員である。また、例えば、所定の行為とは、療養ありの従業員に対してカウンセリングを実施する行為に相当する。また、所定の行為とは、欠陥ありの物品が製造される製造ラインのうち一部の工程に対する改良であっても良い。

第２の抽出部１２２は、第１結果が確定した後の期間を含む第２期間における時系列な第２状態を機械学習モデルに入力することにより、第２状態の特徴である第２の特徴を取得する。

つまり、第２の抽出部１２２は、学習データＤＢ１０４に記憶された学習データから所定の行為を実施する後の状態を有する第２の学習データを特定する。そして、第２の抽出部１２２は、第２の学習データから、複数の状態の相関と第２の学習データの目的変数の特徴とを示す第２の特徴を抽出する。

判定部１２３は、第１の特徴と第２の特徴とに基づいて、第２の状態を説明変数とするとともに第１結果の確定した結果を変更した第２結果を目的変数とした学習データを生成する。つまり、判定部１２３は、第１結果が確定した後に、第２状態を説明するとともに、第１結果が確定した後の結果を目的変数とした学習データを生成する。そして、判定部１２３は、第１の特徴と第２の特徴とに基づいて、学習データの目的変数を変更するか否かを判定する。

判定部１２３は、第１の特徴と第２の特徴とのそれぞれに基づいて、第２の学習データの目的変数を変更するか否かを判定する。そして、判定部１２３は、第２の学習データの目的変数を変更すると判定された場合に、第２の学習データの目的変数の教師ラベルを第１の教師ラベルとは異なるラベルに変更した第３の学習データを生成する。続いて、判定部１２３は、生成された第３の学習データを学習データＤＢ１０４に登録する。

実行部１２４は、学習データＤＢ１０４の学習データを取得する。そして、実行部１２４は、学習データの対象の複数の状態を説明変数としてＮＮに入力する。続いて、実行部１２４は、ＮＮの出力結果と複数の状態に対する結果を示す教師ラベルとの誤差が小さくなるように、ＮＮの学習を実行する。複数の状態に対する結果は、例えば、従業員の療養有無である。また、他の例として、複数の状態に対する結果は、製造ラインの各工程を経て製造された物品の欠陥の有無であっても良い。

図１（ｂ）は、実施例１にかかる端末装置２００の機能構成を示す機能ブロック図である。図１（ｂ）に示すように、端末装置２００は、通信部２０１、制御部２０２、表示部２０３、および入力部２０４を有する。

通信部２０１は、処理開始指示、学習データ、学習データの特徴量などを情報処理装置１００に対して出力する。また、通信部２０１は、学習結果および予測結果などを情報処理装置１００から受信する。さらに、通信部２０１は、通信部１０１により配信された学習モデルを受信する。

制御部２０２は、端末装置２００全体の処理を司る。制御部２０２は、例えばプロセッサによって実現される。制御部２０２は、学習モデルを用いて、対象の複数の状態から予測結果を特定し、特定した予測結果を表示部２０３に表示させる。例えば、制御部２０２は、従業員の出勤簿データの出欠区分に関する情報を入力部２０４に入力されたときに、従業員の療養の有無を予測し、予測結果を表示部２０３に表示させる。

表示部２０３は、学習結果または予測結果を表示する。表示部２０３は、例えば、表示装置などである。

入力部２０４は、各種の情報を入力する。入力部２０４は、例えば、キーボード、タッチパネル、またはマウスによって実現される。

図２は、実施例１にかかる情報処理装置１００によって実行される処理の一例を示すフローチャートである。まず、第１の抽出部１２１は、学習データＤＢ１０４に記憶された学習データから所定の行為を実施する前の状態を有する第１の学習データを特定する。そして、第１の抽出部１２１は、第１の学習データから、複数の状態の相関と第１の学習データの目的変数の特徴とを示す第１の特徴を抽出する。例えば、図５に示すように、第１の抽出部１２１は、従業員Ｘの最新日から所定期間前までの出勤簿データである予測元期間のデータを用いて、第１の特徴量を抽出する。つまり、第１の抽出部１２１は、第１期間における対象の時系列な第１状態が入力されることによって第１期間の後における対象の第１結果を推定する機械学習モデルから、第１状態の特徴である第１の特徴量を抽出する（Ｓ１）。

続いて、第２の抽出部１２２は、学習データＤＢ１０４に記憶された学習データから所定の行為を実施する後の状態を有する第２の学習データを特定する。そして、第２の抽出部１２２は、第２の学習データから、複数の状態の相関と前記第２の学習データの目的変数の特徴とを示す第２の特徴を抽出する。つまり、第２の抽出部１２２は、第１結果が確定した後の期間を含む第２期間における時系列な第２状態を前記機械学習モデルに入力することにより、第２状態の特徴である第２の特徴量を抽出する。（Ｓ２）。

続いて、判定部１２３は、第１の特徴量と第２の特徴量とに基づいて、第２の学習データの目的変数を変更するか否かを判定する。制御部１１０は、第２の学習データの目的変数を変更すると判定された場合に、第２の学習データの目的変数の教師ラベルを第１の教師ラベルとは異なる教師ラベルに変更した第３の学習データを生成する。具体的には、判定部１２３は、第１の特徴量と第２の特徴量との差分が予め設定された閾値以下であるときは、第２の学習データの目的変数を変更した第３の学習データを生成する。つまり、判定部１２３は、第１の特徴量と第２の特徴量とに基づいて、第２の状態を説明変数とするとともに第１結果の確定した結果を変更した第２結果を目的変数とした学習データを生成する。（Ｓ３）。

続いて、実行部１２４は、第３の学習データの説明変数と第３の学習データの目的変数とのそれぞれを学習させる。このとき、実行部１２４は、第１の学習データおよび第２の学習データとともに、実行部１２４は、第３の学習データも学習させる。そして、実行部１２４は、学習モデルを生成する。実行部１２４は、説明変数をニューラルネットワークに入力したときの出力結果と目的変数である正解情報との誤差が小さくなるようにニューラルネットワークのパラメータを変更した学習モデルを生成する（Ｓ４）。

ここで、端末装置２００が、学習モデルに基づいて、複数の状態に対する結果を予測したときの予測結果の出力例を説明する。

図３は、療養ありと予想されるときの出力例を示す図である。図３に示すように、療養ありと予測された場合、端末装置２００は、療養ありと予測したことを示す画像を表示部２０３の画面に表示する。例えば、表示部２０３は、カウンセリングの必要があることを示す画像を表示する。なお、図３に示すように、端末装置２００は、従業員ＩＤ、名前、または生年月日等の個人情報とともに、出勤簿データを示すデータＩＤを表示することもできる。

図４は、療養なしと予想されるときの出力例を示す図である。図４に示すように、療養なしと予測された場合、端末装置２００は、療養なしと予測したことを示す画像を表示部２０３の画面に表示する。例えば、表示部２０３は、カウンセリングの必要がないことを示す画像を表示する。なお、図４に示すように、端末装置２００は、図３に示す出力例と同様に、従業員ＩＤ、名前、または生年月日等の個人情報とともに、出勤簿データを示すデータＩＤを表示することもできる。

［効果］
上述したように、情報処理装置１００は、学習モデルの精度を向上させることが可能な学習データを生成することができる。また、情報処理装置１００は、所定の行為を実施した後の学習データに教師ラベルを付与する際の教師ラベル付与の精度を高めることができる。

（実施例２）
実施例２では、ディープテンソル（DeepTensor：DT）を用いて、学習データに教師ラベルを付与する方法を説明する。ＤＴは、グラフ構造のデータを深層学習する技術である。つまり、ＤＴは、入力としてグラフ構造を用い、グラフ構造をテンソルデータ（以下では、テンソルと記載する場合がある）に変換する。そして、ＤＴでは、予測に寄与するグラフの部分構造をコアテンソルとして抽出することで、高精度な予測を実現する。言い換えると、コアテンソルは、複数の状態の相関を示す部分パターンであるとともに、学習データのうち予測結果を決定するための特徴を示している。

図５は、所定の行為を実施する前の状態と所定の行為を実施した後の特徴を示すコアテンソルの比較を説明する図である。情報処理装置１００は、ＤＴを用いることで、所定の行為を実施する前の状態と所定の行為を実施した後の特徴を示すコアテンソルの変化に基づき、教師ラベルの変更の可否を判定することができる。

まず、情報処理装置１００は、過去の複数の学習データを用いて学習モデルを生成する際に、学習データの学習から得られるコアテンソル群を取得する。

次に、情報処理装置１００は、学習済みの学習モデルを用いて、最新日から所定時間経過前までの予測元期間の学習データから、最新日から所定時間経過後までの予測先期間の分類結果の予測をする際に生成される、所定行為を実施する前の特徴を示すコアテンソルを取得する。

そして、最新日が予測先期間を経過した後で、情報処理装置１００は、最新日から所定時間経過前である予測元期間の学習データにテンソル分解を行って生成される、所定行為を実施した後の特徴を示すコアテンソルを取得する。

さらに、情報処理装置１００は、所定行為を実施する前の特徴を示すコアテンソルと各学習時のコアテンソルとの類似度１を算出し、所定行為を実施した後の特徴を示すコアテンソルと各学習時のコアテンソルとの類似度２を算出する。情報処理装置１００は、類似度１と類似度２とを比較する。

［ディープテンソルの説明］
ここで、実施例２で用いるディープテンソルについて説明する。ディープテンソルとは、グラフ情報に基づくテンソルを入力とするディープラーニングに関する技術である。ディープテンソルは、ニューラルネットワークを学習させるとともに、予測に寄与する部分グラフ構造（グラフ情報の特徴量）の抽出方法も学習する。この抽出方法の学習は、入力したテンソルに対するテンソル分解のパラメータを最適化することによって実現される。

次に、図６および図７を用いてグラフ構造について説明する。図６は、グラフ構造とテンソルとの関係の一例を示す図である。図６に示すグラフ２０は、４つのノードがノード間の関係性（例えば「相関係数が所定値以上」）を示すエッジで結ばれている。なお、エッジで結ばれていないノード間は、当該関係性がないことを示している。グラフ２０を２階のテンソル、すなわち行列で表す場合、例えば、ノードの左側の番号に基づく行列表現は、「行列Ａ」で表される。一方、ノードの右側の番号（囲み線で囲んだ数字）に基づく行列表現は、「行列Ｂ」で表される。これらの行列の各成分は、ノード間が結ばれている（接続している）場合「１」で表され、ノード間が結ばれていない（接続していない）場合「０」で表される。

以下の説明では、この様な行列を接続行列ともいう。ここで、「行列Ｂ」は、「行列Ａ」の２，３行目および２，３列目を同時に置換することで生成できる。ディープテンソルでは、この様な置換処理を用いることで順序の違いを無視して処理を行う。すなわち、「行列Ａ」および「行列Ｂ」は、ディープテンソルでは順序性が無視され、同じグラフとして扱われる。なお、３階以上のテンソルについても同様の処理が実行される。

図７は、部分グラフ構造の抽出の一例を示す図である。図７に示すグラフ２１は、６つのノードがエッジによって結ばれたものである。グラフ２１は、行列（テンソル）で表すと行列２２に示すように表現できる。行列２２に対して、特定の行および列を入れ替える演算、特定の行および列を抽出する演算、ならびに、接続行列における非ゼロ要素をゼロに置換する演算を組み合わせることで、部分グラフ構造を抽出できる。例えば、行列２２の「ノード１，４，５」に対応する行列を抽出すると、行列２３となる。次に、行列２３の「ノード４，５」間の値をゼロに置換すると、行列２４となる。行列２４に対応する部分グラフ構造は、グラフ２５となる。

このような部分グラフ構造の抽出処理は、テンソル分解と呼ばれる数学的演算によって実現される。テンソル分解とは、入力されたｎ階テンソルをｎ階以下のテンソルの積で近似する演算である。例えば、入力されたｎ階テンソルを１つのｎ階テンソル（コアテンソルと呼ばれる。）、および、より低階のｎ個のテンソル（ｎ≧２の場合、通常は２階のテンソル、つまり行列が用いられる。）の積で近似する。この分解は一意ではなく、入力データが表すグラフ構造中の任意の部分グラフ構造をコアテンソルに含めることができる。

なお、出勤簿データは、複数のノードと複数のノードを接続するエッジとから成るグラフデータを構成することができる。ここで、複数のノードは、日付、月度および出欠区分のノードから構成される。日付、月度および出欠区分のノードは、日付、月度および出欠区分の数だけそれぞれ存在する。各ノードには、日付、月度および出欠区分の状況に応じた値が格納される。例えば、日付が１なら値「１」、出欠区分が「休暇」なら値「２」で「出社」なら値「１」などが設定される。エッジは、日付のノードと、月度のノードと、出欠区分のノードのうち関連のあるノードとを接続する。

続いて、ディープテンソルの学習について説明する。図８は、ディープテンソルの学習例を説明する図である。図８に示すように、情報処理装置１００は、療養ありなどの教師ラベル（ラベルＡ）が付された出勤簿データから入力テンソルを生成する。そして、情報処理装置１００は、入力テンソルに対してテンソル分解を行い、初回にランダムに生成されたターゲットコアテンソルに類似するようにコアテンソルを生成する。そして、情報処理装置１００は、コアテンソルをＮＮに入力して分類結果（ラベルＡ：７０％、ラベルＢ：３０％）を得る。その後、情報処理装置１００は、分類結果（ラベルＡ：７０％、ラベルＢ：３０％）と教師ラベル（ラベルＡ：１００％、ラベルＢ：０％）との分類誤差を算出する。

ここで、情報処理装置１００は、誤差逆伝搬法を拡張した拡張誤差伝搬法を用いて予測モデルの学習およびテンソル分解の方法の学習を実行する。すなわち、情報処理装置１００は、ＮＮが有する入力層、中間層、および出力層に対して、分類誤差を下層に伝搬させる形で、分類誤差を小さくするようにＮＮの各種パラメータを修正する。さらに、情報処理装置１００は、分類誤差をターゲットコアテンソルまで伝搬させ、予測に寄与するグラフの部分構造、すなわち体調不良者の特徴を示す特徴パターンもしくは通常者の特徴を示す特徴パターンに近づくように、ターゲットコアテンソルを修正する。

なお、学習後の予測時には、テンソル分解により、ターゲットコアテンソルに類似するように、入力テンソルをコアテンソル（入力テンソルの部分パターン）に変換し、コアテンソルをニューラルネットに入力することで、予測結果を得ることができる。

［機能構成］
図９は、実施例２にかかる情報処理装置１００の機能構成を示す機能ブロック図である。図９に示すように、情報処理装置１００は、通信部１０１、記憶部１０２、および制御部１１０を有する。

通信部１０１は、他の装置との通信を制御する処理部であり、例えば通信インタフェースである。例えば、通信部１０１は、処理開始指示、学習データ、学習データがテンソル化された入力テンソルなどを受信する。また、通信部１０１は、学習結果や予測結果などを出力する。

記憶部１０２は、プログラムやデータを記憶する記憶装置（例えばメモリやハードディスク）によって実現される。記憶部１０２は、センサデータＤＢ１０３、学習データＤＢ１０４、予測対象データＤＢ１０８、コアテンソルデータＤＢ１０６、更新用データＤＢ１０７、および学習結果ＤＢ１０５を記憶する。

センサデータＤＢ１０３は、従業員等の出勤に関する出勤簿データが記憶されるデータベースである。ここで記憶される出勤簿データは、各企業で使用される出勤簿をデータ化したものであり、公知の様々な出勤管理システムなどから取得することができる。

図１０は、センサデータＤＢ１０３に記憶される情報の一例を示す図である。図１０に示すように、センサデータＤＢ１０３には、「従業員Ｎｏ」、「日付」、「曜日」、「出欠区分」、「出勤時刻」、「退勤時刻」、「残業時間」、および「出張」に関する情報が、互いに対応付けられて記憶されている。なお、「出欠区分」には、出社、療養、休暇などの種別が格納される。また、日付および曜日などは、出勤簿データを構成する要素の一例である。

図１０の例は、従業員Ｎｏ．１００の従業員の出勤簿データを示している。例えば、図１０の２行目は、「2015年4月2日木曜日」の出勤簿データであり、この日は、出張がなく、「8：49」に出社して「0：00」に退社し、残業時間が「360分」である例を示す。また、図１０の７行目は、「2015年8月24日水曜日」の出勤簿データであり、この日から「2016年10月1日火曜日」まで「療養」したことを示す。なお、出勤簿データの単位は、日ごとに限らず、週単位や月単位であってもよい。

学習データＤＢ１０４は、テンソル化対象となる学習データに関する情報を記憶するデータベースである。具体的には、学習データＤＢ１０４には、学習モデルの学習に利用されるデータであり、出勤簿データを６か月の期間で切出されたデータと、教師ラベルの組となる各学習データとが記憶される。

例えば、６か月の出勤簿データを１つの学習データとし、その後の３か月以内に療養した療養期間がある場合に、教師ラベルとして「療養あり」が設定され、その後の３か月以内に療養期間がない場合に、教師ラベルとして「療養なし」が設定される。なお、教師ラベル「療養あり」が「正例」、教師ラベル「療養なし」が「負例」と記載される場合がある。また、６か月の出勤簿データに療養期間が含まれている場合、そのデータは学習データとして採用しないこともできる。これは、予測時に、予測元のデータ（入力）となる６か月分の出勤簿データにすでに「療養」が入っている従業員は、明らかに直近で療養しているとわかっており、この先３か月の療養予測の対象にはしないためである。

図１１は、学習データＤＢ１０４に記憶される情報の例を示す図である。図１１に示すように、学習データＤＢ１０４には、「従業員」、「データＩＤ」、「データ（説明変数）」、および「教師ラベル（目的変数）」に関する情報が互いに対応付けられて記憶されている。ここで記憶される「従業員」は、従業員を特定する識別子であり、「データＩＤ」は、学習データを識別する識別子である。このデータＩＤは、各ＤＢで共通する情報であり、このデータＩＤにより各ＤＢのデータを関連付けることができる。「データ（説明変数）」は、学習対象となるデータであり、「教師ラベル（目的変数）」は、学習時に目的変数となる情報である。

図１１の例では、従業員１（山田太郎）の１月から６月までの出勤簿データには、データＩＤとして「００１」が設定されており、「教師ラベル（目的変数）」として「療養あり」が設定されていることを示している。また、従業員１の２月から７月までの出勤簿データには、データＩＤとして「００２」が設定されており、教師ラベルとして「療養なし」が設定されていることを示している。また、従業員２（鈴木ジェーン）の１月から６月までの出勤簿データには、データＩＤとして「０１１」が設定されており、教師ラベルとして「療養なし」が設定されていることを示している。また、従業員２の２月から７月までの出勤簿データには、データＩＤとして「０１２」が設定されており、教師ラベルとして「療養なし」が設定されていることを示している。

図１２は、学習データの例を説明する図である。ここで、教師ラベルの設定例について詳細に説明する。学習データは、６か月ごとの出勤簿データと、その６か月以降から３か月以内に療養実績があるか否かを示すラベルとから構成される。図１２の（ａ）は、ラベル（療養あり）が付される体調不良者の出勤簿データである。図１２の（ｂ）は、療養しなかったラベル（療養なし）が付される通常者の出勤簿データである。図１２に示すように、実施例２にかかる情報処理装置１００は、「６か月分の出勤簿データ、ラベル（療養あり）」と、「６か月分の出勤簿データ、ラベル（療養なし）」とを学習データとして、予測モデルを学習する。なお、情報処理装置１００は、学習後、ある人の６か月分の出勤簿データから３か月以内に療養するか否かを予測する。なお、図１２内の網掛けは、休暇を示している。

予測対象データＤＢ１０８は、学習済みの学習モデルを用いて、療養するか療養しないかを予測する予測対象のデータに関する情報を記憶するデータベースである。予測対象データＤＢ１０８には、「年度」、「データＩＤ」、「従業員」、および「データ」が互いに対応付けられて記憶されている。

ここで記憶される「年度」は、予測対象の出勤簿データの年度を示し、「データＩＤ」は、予測対象データを識別する識別子である。「従業員」は、療養の可能性を予測した授業員の識別子であり、「データ」は、学習モデルに入力する対象のデータである。

コアテンソルデータＤＢ１０６は、各段階で取得されるコアテンソルに関する情報を記憶するデータベースである。具体的には、コアテンソルデータＤＢ１０６は、学習時のコアテンソル、予測時のコアテンソル、および更新時のコアテンソルの各段階で取得されたコアテンソルのデータを記憶する。

図１３は、コアテンソルデータＤＢ１０６に記憶される情報の例を示す図である。図１３に示すように、コアテンソルデータＤＢ１０６には、複数のデータＩＤの各々について、「学習時のコアテンソル」、「予測時のコアテンソル」、および「更新時のコアテンソル」が互いに対応付けられ記憶されている。図１３に示すように、該当するコアテンソルの欄にはコアテンソルのデータが格納され、該当しない欄には「－」などが設定されている。図１３の例では、データＩＤ「Ｘ」が付与された学習データから、「学習時のコアテンソル」として「コアテンソルＸ」が生成されたことを示している。

なお、「学習時のコアテンソル」は、学習モデルの学習時に、学習データから生成されるコアテンソルのデータを示している。「予測時のコアテンソル」は、学習済みの学習モデルを用いた予測時に、予測対象データから生成されるコアテンソルのデータを示している。「更新時のコアテンソル」は、学習済みであって更新対象である学習モデルを用いて、予測時の予測が正しいか間違っているかを判定できる時点の出勤簿データから生成される、コアテンソルのデータを示している。

更新用データＤＢ１０７は、学習済みの学習モデルの更新に利用される更新用の学習データに関する情報が記憶されているデータベースである。すなわち、更新用データＤＢ１０７には、後述する制御部１１０によって生成される再学習用の学習データが記憶されている。更新用データＤＢ１０７には、「データＩＤ」、「データ」、「教師ラベル」が互いに対応付けられて記憶されている。ここで記憶される「データＩＤ」は、更新用の学習データを識別する識別子である。「データ」は、更新時に説明変数となる出勤簿データである。「教師ラベル」は、更新時に目的変数となる出勤簿データである。

学習結果ＤＢ１０５は、学習結果に関する情報が記憶されているデータベースである。例えば、学習結果ＤＢ１０５には、制御部１１０による学習データの判別結果（分類結果）、機械学習やディープラーニングによって学習された、ＮＮの各種パラメータ、およびディープテンソルの各種パラメータなどが記憶されている。なお、学習結果ＤＢ１０５には、学習により最適化された各種パラメータが設定された学習済みの学習モデルそのものが記憶されていてもよい。

制御部１１０は、情報処理装置１００全体の処理を司る処理部であり、例えばプロセッサなどである。この制御部１１０は、学習部１１１、予測部１１２、ラベル推定部１１３、および更新部１１４を有する。なお、学習部１１１、予測部１１２、ラベル推定部１１３、および更新部１１４は、プロセッサなどが有する電子回路の一例、またはプロセッサなどが実行するプロセスの一例である。

学習部１１１は、図８で説明したディープテンソルを用いた深層学習により、ニューラルネットワークを適用した学習モデルの学習を実行する処理部である。具体的には、学習部１１１は、学習データＤＢ１０４に記憶される各学習データを読み込み、各学習データのデータを説明変数、教師ラベルを目的変数として、学習モデルの学習を実行する。そして、学習部１１１は、学習が完了すると、最適化されたニューラルネットワークのパラメータなどを、学習結果として学習結果ＤＢ１０５に格納する。なお、学習部１１１は、学習が完了すると、最適化されたニューラルネットワークのパラメータなどが設定された学習モデルそのものを、学習結果として学習結果ＤＢ１０５に格納することもできる。

ここで、学習部１１１は、学習データを学習モデル（ＮＮ）に入力する際に、学習データをテンソル化したテンソルデータを生成して入力することで、ディープテンソルを用いた学習処理を実行する。

図１４は、テンソル化を説明する図である。図１４に示すように、学習部１１１が生成するテンソルは、横方向に「月度」、縦方向に「日付」、奥行き方向に「出欠区分」を示しており、左側が「出張あり」、右側が「出張なし」のデータを示している。日付は、上から１日目を順に示し、出欠区分は、手前から出社、休暇、および休日を示している。例えば、図１４の（ａ）は、月度１の１日目に出社して出張した要素を示し、図１４の（ｂ）は、月度２の１日目に休暇を取得して出張しなかった要素を示している。なお、本実施例では、上述したテンソルを簡略化して図１４の（ｃ）のように記載される場合がある。すなわち、テンソルは、月度、日付、出欠区分、出張有無の各要素を重ねたキューブ状で表現され、各月度かつ日付の出張有無が区別して表現され、各月度かつ日付の出欠区分が区別して表現される。

また、学習部１１１は、各学習データに基づく学習時に、各学習データに対するテンソル分解などにより生成されるコアテンソルを取得する。そして、学習部１１１は、学習データのＩＤに対応付けて、取得した各コアテンソルをコアテンソルデータＤＢ１０６に格納する。すなわち、学習部１１１は、各学習データに対して「学習時のコアテンソル」を取得する。

例えば、学習部１１１は、学習データＤＢ１０４のデータＩＤ「４」の学習データ（データ、教師ラベル（療養なし））を読み込み、データ「１月から６月までの出勤簿データ」を説明変数としてＮＮに入力する。続いて、学習部１１１は、ＮＮの出力結果と教師ラベル「療養なし」との誤差が小さくなるように、ＮＮの学習を実行する。また、学習部１１１は、学習時に、当該データ「１月から６月までの出勤簿データ」から生成されるコアテンソルＡを取得して、コアテンソルデータＤＢ１０６に格納する。

予測部１１２は、学習済みの学習モデルを用いて、各従業員が療養する危険性が高いか否かを予測する処理部である。具体的には、予測部１１２は、学習モデルの学習が完了すると、学習結果ＤＢ１０５からパラメータ等を取得して、学習済みの学習モデルを構築する。そして、予測部１１２は、予測対象データＤＢ１０８から予測対象データを読み込んで、学習時と同様にテンソル化して学習済みの学習モデルに入力し、その出力結果に基づき、療養の可能性を予測して、記憶部１０２に格納したり、表示部２０３に出力したりする。

また、予測部１１２は、各予測対象データに基づく予測時に、各予測対象データに対するテンソル分解などにより生成されるコアテンソルを取得する。そして、予測部１１２は、予測対象データのＩＤに対応付けて、取得した各コアテンソルをコアテンソルデータＤＢ１０６に格納する。すなわち、予測部１１２は、各予測対象データに対して「予測時のコアテンソル」を取得する。

例えば、予測部１１２は、予測対象データＤＢ１０８のデータＩＤ「ＰＰＰ」の予測対象データを読み込み、データ「２０１９年６月から１２月までの出勤簿データ」を学習済みの学習モデル（ＮＮ）に入力する。続いて、予測部１１２は、学習済みの学習モデルの出力結果として、正例（療養あり）である確率と負例（療養なし）である確率とを取得する。そして、予測部１１２は、各確率のうち高い方の確率を予測結果と決定する。また、予測部１１２は、予測時に、当該データ「２０１９年６月から１２月までの出勤簿データ」から生成されるコアテンソルＰＰＰを取得して、コアテンソルデータＤＢ１０６に格納する。なお、予測部１１２は、予測結果が「正例（療養あり）」である予測対象データについてのみ、コアテンソルを取得して保持することもできる。

ラベル推定部１１３は、予測時のコアテンソルと更新時のコアテンソルとの変化に基づき、新たな学習データに付与する教師ラベルを推定する処理部である。具体的には、ラベル推定部１１３は、ある従業員の出勤簿データについて、予測時のコアテンソルと学習時のコアテンソルとの類似度を算出する。また、ラベル推定部１１３は、更新タイミングである現在のコアテンソルと学習時のコアテンソルとの類似度を算出する。そして、ラベル推定部１１３は、類似度の比較に基づく教師ラベルを新たな学習データに付与して、更新用データＤＢ１０７に格納する。

図１５は、類似度算出および教師ラベル推定を説明する図である。例えば、従業員Ｘの出勤簿データを例にして説明する。図１５に示すように、予測時（過去）に、予測部１１２は、従業員Ｘの最新日から６か月前までの出勤簿データである予測元期間のデータを用いて、最新日から３か月後の予測先期間で、従業員Ｘが療養するか否かを予測する。このとき、予測部１１２は、予測元期間のデータに基づくコアテンソルを取得する（Ｓ１１）。

また、予測部１１２は、「正例」すなわち「療養する」と予測し、現在の日時が予測した時期を経過すると、各従業員の出勤簿データを参照して、予測が正解であったか否かを判定する。ここでは、予測先期間経過後に、従業員Ｘが、「療養する」ことなく、通常通りに出社できたとする。この場合、予測時は「正例」だったにも関わらず、正解は「負例」となる。この場合、新たに生成する学習データには教師ラベル「負例」が付与されることが一般的である。しかし、予測が間違っていたのか、従業員Ｘに対する所定の行為により正解が変化したのかが特定できないため、このまま教師ラベルを付与すると信頼性が低くなる。

そこで、ラベル推定部１１３は、結果が「正例」ではなく「負例」に変わった従業員Ｘの出勤簿データのうち、予測先期間経過後の現在の最新日から６か月前までの出勤簿データである新予測元期間のデータからコアテンソルを生成する（Ｓ１２）。

続いて、ラベル推定部１１３は、予測時の予測元期間に基づくコアテンソルと、各学習データから生成されたコアテンソル（学習時のコアテンソル）との類似度を、コサイン類似度やk-meansクラスタリング等の手法を用いて算出する（Ｓ１３）。

例えば、ラベル推定部１１３は、予測時のコアテンソルと、教師ラベル「正例」が付与された学習データＡに基づくコアテンソルＡとの類似度「０．９」を算出する。同様に、ラベル推定部１１３は、予測時のコアテンソルと教師ラベル「正例」が付与された学習データＢに基づくコアテンソルＢとの類似度「０．８」、予測時のコアテンソルと教師ラベル「負例」が付与された学習データＣに基づくコアテンソルＣとの類似度「０．７」を算出する。

続いて、ラベル推定部１１３は、更新時の新予測元期間に基づくコアテンソルと、各学習時のコアテンソルとの類似度を、コサイン類似度やk-meansクラスタリング等の手法を用いて算出する（Ｓ１４）。

例えば、ラベル推定部１１３は、更新時のコアテンソルと、教師ラベル「正例」が付与された学習データＡに基づくコアテンソルＡとの類似度「０．９」を算出する。同様に、ラベル推定部１１３は、更新時のコアテンソルと教師ラベル「正例」が付与された学習データＢに基づくコアテンソルＢとの類似度「０．９」、更新時のコアテンソルと教師ラベル「負例」が付与された学習データＣに基づくコアテンソルＣとの類似度「０．４」を算出する。

その後、ラベル推定部１１３は、更新時から予測時に対する類似度の差分を算出し、正例に変化しているか、または、負例に変化しているかを判定する。そして、ラベル推定部１１３は、判定結果に基づき、新予測元期間のデータに付与する教師ラベルを決定する。

具体的には、ラベル推定部１１３は、負例を根拠に換算することにより、類似度の変化を算出する。例えば、ラベル推定部１１３は、「正例群」の変化については、「予測時の類似度－更新時の類似度」により差分を算出する。ラベル推定部１１３は、「負例群」の変化については、「更新時の類似度－予測時の類似度」により差分を算出する。

図１５の例で説明すると、ラベル推定部１１３は、「正例群」について、コアテンソルＡに対する類似度の差分「０．９－０．９＝０」を算出し、コアテンソルＢに対する類似度の差分「０．８－０．９＝－０．１」を算出する。また、ラベル推定部１１３は、「負例群」について、コアテンソルＣに対する類似度の差分「０．４－０．７＝－０．３」を算出する。そして、ラベル推定部１１３は、各差分の合計値「０＋（－０．１）＋（－０．３）＝－０．４」が閾値（例えば０．１）より小さいことから、負例から遠ざかっている（正例に近づいている）と判定する。この結果、ラベル推定部１１３は、新予測元期間のデータに付与する教師ラベルを、実際の結果「負例」ではなく、推定結果「正例」を付与した更新用の学習データを生成する。

なお、類似度の比較は様々な手法によって実行されても良い。例えば、ラベル推定部１１３は、教師ラベルが「正例」である学習データとの類似度の変化量と、教師ラベルが「負例」である学習データとの類似度の変化量とのうち、変化量が大きい方の教師ラベルを採用することができる。図１５の例では、ラベル推定部１１３は、正例側の変化量として「０＋０．１＝０．１」を算出し、負例側の変化量として「－０．３」を算出し、値が大きい「正例」を採用する。

また、正例から負例に変化したことの確からしさを判定する場合、学習データのうち「負例」との類似度を算出し、その類似度の変化が閾値以上の場合に「負例」を選択し、閾値未満の場合に「正例」を選択することもできる。

図９に戻り、更新部１１４は、更新用データＤＢ１０７に記憶される更新用の学習データを用いて、学習時と同様の手法により、学習済みの学習モデルの更新を実行する処理部である。すなわち、更新部１１４は、学習済みの学習モデルの再学習を実行する。

例えば、更新部１１４は、更新用データＤＢ１０７のデータＩＤ「ＰＰＰ」の学習データ（データ、教師ラベル（療養あり））を読み込み、データ「２０１９年６月から１２月までの出勤簿データ」を学習済みの学習モデル（ＮＮ）に入力する。続いて、更新部１１４は、学習モデルの出力結果と教師ラベル「療養あり」との誤差が小さくなるように、学習モデルの学習を実行する。

なお、更新部１１４は、再学習が完了すると、最適化されたニューラルネットワークのパラメータ、または、最適化されたニューラルネットワークのパラメータなどが設定された学習モデルを、学習結果として学習結果ＤＢ１０５に格納する。

［処理の流れ］
図１６と図１７は、処理の流れを示すフローチャートである。図１６および図１７に示すように、処理開始が指示されるまで（Ｓ１０１：Ｎｏ）、Ｓ１０１を繰り返す。そして、処理開始が指示されると（Ｓ１０１：Ｙｅｓ）、学習部１１１は、学習データを読み込み（Ｓ１０２）、コアテンソルを生成および保存を実行し（Ｓ１０３）、コアテンソルを用いた学習モデルの学習を実行する（Ｓ１０４）。

そして、学習部１１１は、学習が終了するまで（Ｓ１０５：Ｎｏ）、Ｓ１０２以降を繰り返す。一方、図１６に示すように、学習が終了すると（Ｓ１０５：Ｙｅｓ）、予測部１１２は、予測対象データを読み込み（Ｓ１０６）、学習時と同様の手法によりテンソル化などを実行して、学習モデルにより予測を実行する（Ｓ１０７）。また、予測部１１２は、予測時に生成された予測時のコアテンソルを取得して保存する（Ｓ１０８）。

また、予測部１１２は、予測対象データがなくなるまで（Ｓ１０９：Ｎｏ）、Ｓ１０６以降を繰り返す。一方、図１６に示すように、すべての予測対象データに対する予測が終了する（Ｓ１０９：Ｙｅｓ）と、所定期間が経過するまで（Ｓ１１０：Ｎｏ）、Ｓ１１０を繰り返し、所定期間が経過して、予測した日時に到達すると（Ｓ１１０：Ｙｅｓ）、ラベル推定部１１３は、予測結果が「正例」となった予測対象データ群を抽出し（Ｓ１１１）、実際の結果が「負例」に変化した予測対象データを抽出する（Ｓ１１２）。

そして、ラベル推定部１１３は、抽出した予測対象データの予測時のコアテンソルと、各学習データの学習時のコアテンソルとの類似度を算出する（Ｓ１１３）。

さらに、ラベル推定部１１３は、予測結果が変化した従業員の現時点の出勤簿データに基づくコアテンソル（更新時のコアテンソル）を取得し（Ｓ１１４）、更新時のコアテンソルと各学習データの学習時のコアテンソルとの類似度を算出する（Ｓ１１５）。その後、ラベル推定部１１３は、予測時の類似度と現在（更新時）の類似との差分を算出する（Ｓ１１６）。

そして、ラベル推定部１１３は、差分が閾値以上である場合（Ｓ１１７：Ｙｅｓ）、教師ラベルを「負例」のまま補正せずに、「負例」の更新用の学習データを生成する（Ｓ１１８）。一方、ラベル推定部１１３は、差分が閾値未満である場合（Ｓ１１７：Ｎｏ）、教師ラベルを「負例」から「正例」に補正し、「正例」の更新用の学習データを生成する（Ｓ１１９）。

ラベル推定部１１３は、対象のデータはないときは（Ｓ１２０：Ｙｅｓ）、処理を終了する。一方、対象のデータがあるときは（Ｓ１２０：Ｎｏ）、Ｓ１１２に移行する。

［効果］
上述したように、情報処理装置１００は、予測結果に基づいた施策効果を考慮した教師ラベル付与を行い、新たな学習データとして採用することで学習モデル精度を維持できる。情報処理装置１００は、インバランスな予測タスクにおいて、希少なサンプルデータ（正例）が損なわれることを防ぐことで学習モデルの精度維持を実現できる。

（実施例１または実施例２と、比較例との違い）
ここで、比較例を用いて、実施例１または実施例２の効果について具体的に説明する。図１および図９に示す情報処理装置１００は、従業員の６か月間の出勤簿データを説明変数とし、療養経験がある「正例」または療養経験がない「負例」を示す教師ラベルを目的変数とする各学習データを用いて、６か月間の出勤簿データからその後の３か月以内に療養する可能性があるか否かを予測する学習モデルを学習する。

そして、学習が完了すると、情報処理装置１００は、予測対象である従業員の出勤簿データを学習済みの学習モデルに入力して得られる結果に基づき、当該従業員が療養する危険性が高いか否かを予測する。

その後、情報処理装置１００は、予測対象である従業員の出勤簿データに対して、実際に療養した、または療養していない、のいずれかを示す結果を教師ラベルとして新たに付与した学習データを生成し、当該学習データを用いて学習モデルを更新する。このようにして、情報処理装置１００は、学習モデルを定期的に更新することで、学習モデルによる予測の精度を維持することができる。

続いて、図１８に基づいて比較例の処理について説明する。予測時に「正例」と予測された場合、療養しないように施策が行われることが一般的である。そして、その施策の結果、予測とは異なる結果「負例」となることがあるので、実際の結果をそのまま教師ラベルとして付与することは、学習ノイズとなる可能性がある。このため、一般的には、教師ラベルが既知である各学習データと、予測対象データとの類似度を算出し、類似度が最も高い学習データの教師ラベルを予測対象データに付与することで、学習モデルの更新用の学習データを生成することが行われる。
ここでは、ある従業員の出勤簿データを例にして説明する。予測時（過去）に、そのときの最新日から６か月遡った予測元期間の出勤簿データＡを学習済みの学習モデルに入力して、「正例」の予測結果を取得する。

そして、「正例」と判定された従業員に対して、カウンセリング等が行われ、３か月後（現在）も、ある従業員は療養することなく出勤できたとする。この場合、元々正例と予測されたにも関わらず、負例となったのは施策によるものか、最初から負例（予測が誤検知）だったのかが不明である。

このため、比較例では、現在の最新日から６か月遡った出勤簿データＢを説明変数として抽出し、出勤簿データと、学習に利用された各学習データ（過去データ）との類似度を算出し、類似度にしたがって、設定する教師ラベルを決定する。

例えば、出勤簿データＢ「出勤、出勤、午前休、午後休」と、教師ラベル「正例」が設定される過去データＡ「休、休、午前休、午後休」との類似度「２／４」を算出する。同様に、出勤簿データＢ「出勤、出勤、午前休、午後休」と、教師ラベル「負例」が設定される過去データＢ「出勤、出勤、午前休、出勤」との類似度「３／４」を算出する。

この結果、過去データＢとの類似度の方が高いので、出勤簿データＢ「出勤、出勤、午前休、午後休」に、過去データＢと同様の教師ラベル「負例」を設定した更新用の学習データを生成する。つまり、出勤簿データＢと過去データとの間の類似度評価では、負例の過去データＢに近いため、結果としては誤検知であった可能性が高まる。このため、新たな学習データとして追加する際は、そのまま負例ラベルが付与される。すなわち、施策効果でなく予測が外れていたと推定される。

ところが、このような単純な類似度比較は、一意にデータ同士を比較しているため、本来の予測タスクに重要な箇所を見逃した教師ラベルの推定となっている可能性が高い。図１８は、比較例による教師ラベルの推定の問題点を説明する図である。図１８に示すように、健康を損なう重要な箇所は「午前休」と「午後休」が連続で繋がっている箇所であるとする。この場合、単純な類似度比較では負例に近いと評価されたが、重要箇所に注目すると、正例に近いと判断されるべきである。したがって、新たな学習データとして、そのまま負例サンプルとして採用してしまうと、施策効果が考慮されていない異質な学習データとなり、学習精度の低下を招く。

（実施例３）
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。

［数値等］
また、上記実施例で用いたデータ例、数値、各閾値、教師ラベル数、具体例等は、あくまで一例であり、任意に変更することができる。また、入力データや学習方法などもあくまで一例であり、任意に変更することができる。また、学習モデルには、ニューラルネットワークなど様々なモデルを採用することができる。

［更新用の学習データ］
例えば、上記フローチャート等では、「正例」と予測されたが、実際に「負例」となった予測対象データについて、教師ラベルの補正を行う例を説明したが、これに限定されるものではない。例えば、すべての予測対象データについて、教師ラベルの補正を行うことができる。また、予測結果と実際の結果が異なる予測対象データについてのみ、上記処理を実行することができる。また、予測結果と実際の結果が同じ予測対象データについては、実際の結果をそのまま教師ラベルとして用いた更新用の学習データを生成することができる。なお、実際の結果は、出勤簿データにより特定することができる。

［学習］
上述した学習処理は、任意の回数だけ実行することもできる。例えば、すべての学習データを用いて実行することもでき、所定回数だけ実行することもできる。また、分類誤差の算出方法は、最小二乗法など公知の算出手法を採用することができ、ＮＮで用いられる一般的な算出手法を採用することもできる。なお、学習データや出勤簿データは、外部の装置から取得することもできる。

［想定システム］
上記実施例では、出勤簿データを学習して療養する可能性がある従業員を予測する例で説明したが、これに限定されるものではない。例えば、電子部品の動作データを用いた故障予測、通信データを用いた攻撃予測、道路の交通量データを用いた渋滞予測などにも適用することができる。

［ニューラルネットワーク］
本実施例では、ＲＮＮ（Recurrent Neural Networks）やＣＮＮ（Convolutional Neural Network）など様々なニューラルネットワークを用いることができる。また、学習の手法も、誤差逆伝播法以外にも公知の様々な手法を採用することができる。また、ニューラルネットワークは、例えば入力層、中間層（隠れ層）、出力層から構成される多段構成であり、各層は複数のノードがエッジで結ばれる構造を有する。各層は、「活性化関数」と呼ばれる関数を持ち、エッジは「重み」を持ち、各ノードの値は、前の層のノードの値、接続エッジの重みの値（重み係数）、層が持つ活性化関数から計算される。なお、計算方法については、公知の様々な手法を採用できる。

また、ニューラルネットワークにおける学習とは、出力層が正しい値となるように、パラメータ、すなわち、重みとバイアスを修正していくことである。誤差逆伝播法においては、ニューラルネットワークに対して、出力層の値がどれだけ正しい状態（望まれている状態）から離れているかを示す「損失関数（loss function）」を定め、最急降下法等を用いて、損失関数が最小化するように、重みやバイアスの更新が行われる。

［システム］
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。また、実施例で説明した具体例、分布、数値などは、あくまで一例であり、任意に変更することができる。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、ＣＰＵおよび当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。例えば、学習処理、更新用の学習データの生成処理、更新処理を別々の装置で実現することもできる。

［ハードウェア］
図１９は、ハードウェア構成例を説明する図である。図１９に示すように、情報処理装置１００は、通信装置１００ａ、ＨＤＤ（Hard Disk Drive）１００ｂ、メモリ１００ｃ、およびプロセッサ１００ｄを有する。また、図１９に示した各部は、バス等で相互に接続される。

通信装置１００ａは、ネットワークインタフェースカードなどであり、他のサーバとの通信を行う。ＨＤＤ１００ｂは、図１および図９に示した機能を動作させるプログラムおよびＤＢを記憶する。

プロセッサ１００ｄは、図１および図９に示した各処理部と同様の処理を実行するプログラムをＨＤＤ１００ｂ等から読み出してメモリ１００ｃに展開することで、図６等で説明した各機能を実行するプロセスを動作させる。すなわち、このプロセスは、情報処理装置１００が有する各処理部と同様の機能を実行する。具体的には、プロセッサ１００ｄは、制御部１１０、学習部１１１、予測部１１２、ラベル推定部１１３、更新部１１４、第１の抽出部１２１、第２の抽出部１２２、判定部１２３、実行部１２４等と同様の機能を有するプログラムをＨＤＤ１００ｂ等から読み出す。そして、プロセッサ１００ｄは、学習部１１１、予測部１１２、ラベル推定部１１３、更新部１１４等と同様の処理を実行するプロセスを実行する。

このように情報処理装置１００は、プログラムを読み出して実行することでデータ生成方法を実行する情報処理装置として動作する。また、情報処理装置１００は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、情報処理装置１００によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。

このプログラムは、インターネットなどのネットワークを介して配布することができる。また、このプログラムは、ハードディスク、フレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ、ＭＯ（Magneto-Optical disk）、ＤＶＤ（Digital Versatile Disc）などのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行することができる。
図２０は、ハードウェア構成例を説明する図である。図２０に示すように、端末装置２００は、通信装置２００ａ、ＨＤＤ（Hard Disk Drive）２００ｂ、メモリ２００ｃ、プロセッサ２００ｄ、表示装置２００e、入力装置２００ｆを有する。また、図２０に示した各部は、バス等で相互に接続される。

通信装置２００ａは、ネットワークインタフェースカードなどであり、他のサーバとの通信を行う。ＨＤＤ２００ｂは、図１に示した機能を動作させるプログラムやＤＢを記憶する。

プロセッサ２００ｄは、図１に示した各処理部と同様の処理を実行するプログラムをＨＤＤ２００ｂ等から読み出してメモリ２００ｃに展開することで、図１等で説明した各機能を実行するプロセスを動作させる。すなわち、このプロセスは、端末装置２００が有する各処理部と同様の機能を実行する。具体的には、プロセッサ２００ｄは、制御部２０２等と同様の機能を有するプログラムをＨＤＤ２００ｂ等から読み出す。そして、プロセッサ２００ｄは、制御部２０２等と同様の処理を実行するプロセスを実行する。

このように端末装置２００は、プログラムを読み出して実行することでデータ生成方法を実行する情報処理装置として動作する。また、端末装置２００は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、端末装置２００によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。

このプログラムは、インターネットなどのネットワークを介して配布することができる。また、このプログラムは、ハードディスク、フレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ、ＭＯ（Magneto-Optical disk）、ＤＶＤ（Digital Versatile Disc）などのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行することができる。

１００情報処理装置
１０１通信部
１０２記憶部
１０３センサデータＤＢ
１０４学習データＤＢ
１０５学習結果ＤＢ
１０６コアテンソルデータＤＢ
１０７更新用データＤＢ
１０８予測対象データＤＢ
１１０制御部
１１１学習部
１１２予測部
１１３ラベル推定部
１１４更新部
１２１第１の抽出部
１２２第２の抽出部
１２３判定部
１２４実行部
２００端末装置
２０１通信部
２０２制御部
２０３表示部
２０４入力部

Claims

コンピュータに、
第１期間における対象の時系列な第１状態が入力されることによって前記第１期間の後における前記対象の第１結果を推定する機械学習モデルから、前記第１状態の特徴である第１の特徴を取得し、
前記第１結果が確定した後の期間を含む第２期間における時系列な第２状態を前記機械学習モデルに入力することにより、前記第２状態の特徴である第２の特徴を取得し、
前記第１の特徴と前記第２の特徴とに基づいて、前記第２状態を説明変数とするとともに前記第１結果の確定した結果を変更した第２結果を目的変数とした学習データを生成する、
処理を実行させることを特徴とする学習データ生成プログラム。
前記説明変数をニューラルネットワークに入力したときの出力結果と前記目的変数である正解情報との誤差が小さくなるように前記ニューラルネットワークのパラメータを変更した学習モデルを生成する、
処理を実行させることを特徴とする請求項１に記載の学習データ生成プログラム。
対象の複数の状態を示す前記説明変数と、前記複数の状態に対する結果を示す前記目的変数と、を含む学習データのうち、前記対象に対して所定の行為を実施する前の第１の学習データから、前記複数の状態の相関と、前記第１の学習データの前記目的変数の特徴と、を示す前記第１の特徴を抽出し、
前記学習データのうち、前記対象に対して前記所定の行為を実施した後の第２の学習データから、前記複数の状態の相関と、前記第２の学習データの前記目的変数の特徴と、を示す前記第２の特徴を抽出し、
前記第１の特徴と前記第２の特徴とに基づいて、前記第２の学習データの前記目的変数を変更するか否かを判定する、
処理を実行させることを特徴とする請求項１に記載の学習データ生成プログラム。
前記説明変数は、従業員の出欠区分の状態であって、
前記目的変数は、前記従業員の療養の有無であって、
前記所定の行為は、前記従業員に対するカウンセリングである、
ことを特徴とする請求項３に記載の学習データ生成プログラム。
前記所定の行為は、教師ラベルが正例である学習データの対象に対して、前記教師ラベルが負例になるようにする行為であることを特徴とする請求項３に記載の学習データ生成プログラム。
前記第１の特徴を抽出する処理は、
前記複数の状態の相関を示す部分パターンであるとともに前記第１の学習データのうち予測結果を決定する特徴を有する第１のコアテンソルと、予測結果が特定された学習データの第３のコアテンソルとの第１の類似度を算出する処理を含み、
前記第２の特徴を抽出する処理は、
前記複数の状態の相関を示す部分パターンであるとともに前記第２の学習データのうち予測結果を決定する特徴を有する第２のコアテンソルと、前記第３のコアテンソルとの第２の類似度を算出する処理を含み、
前記判定する処理は、
前記第１の類似度と前記第２の類似度との差分が予め設定された閾値を超える場合に、前記第２の学習データの前記目的変数の教師ラベルを変更する処理を含むことを特徴とする請求項３に記載の学習データ生成プログラム。
前記第１の特徴を抽出する処理は、
学習モデルの学習に利用された、教師ラベルがそれぞれに付与される各学習データに基づいて生成される学習時の複数のコアテンソルを取得し、
前記第１の学習データから第１のコアテンソルを生成し、
前記第１のコアテンソルと前記学習時の複数のコアテンソルとの各第１の類似度を算出する処理を含み、
前記第２の特徴を抽出する処理は、
学習モデルの学習に利用された、教師ラベルがそれぞれに付与される各学習データに基づいて生成される学習時の複数のコアテンソルを取得し、
前記第２の学習データから第２のコアテンソルを生成し、
前記第２のコアテンソルと前記学習時の複数のコアテンソルとの各第２の類似度を算出する処理を含み、
前記判定する処理は、
前記各第１の類似度と前記各第２の類似度とに基づき、教師ラベルを決定する処理を含むことを特徴とする請求項３に記載の学習データ生成プログラム。
コンピュータが、
第１期間における対象の時系列な第１状態が入力されることによって前記第１期間の後における前記対象の第１結果を推定する機械学習モデルから、前記第１状態の特徴である第１の特徴を取得し、
前記第１結果が確定した後の期間を含む第２期間における時系列な第２状態を前記機械学習モデルに入力することにより、前記第２状態の特徴である第２の特徴を取得し、
前記第１の特徴と前記第２の特徴とに基づいて、前記第２状態を説明変数とするとともに前記第１結果の確定した結果を変更した第２結果を目的変数とした学習データを生成する
処理を実行することを特徴とする学習データ生成方法。
第１期間における対象の時系列な第１状態が入力されることによって前記第１期間の後における前記対象の第１結果を推定する機械学習モデルから、前記第１状態の特徴である第１の特徴を取得する第１の特徴部と、
前記第１結果が確定した後の期間を含む第２期間における時系列な第２状態を前記機械学習モデルに入力することにより、前記第２状態の特徴である第２の特徴を取得する第２の特徴部と、
前記第１の特徴と前記第２の特徴とに基づいて、前記第２状態を説明変数とするとともに前記第１結果の確定した結果を変更した第２結果を目的変数として学習データを生成する判定部と
を有することを特徴とする情報処理装置。