JP2020047079A

JP2020047079A - 学習プログラム、学習方法および学習装置

Info

Publication number: JP2020047079A
Application number: JP2018176277A
Authority: JP
Inventors: 俊一渡邉; Shunichi Watanabe
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2018-09-20
Filing date: 2018-09-20
Publication date: 2020-03-26

Abstract

【課題】学習精度の低下を抑制することを課題とする。【解決手段】学習装置は、第１の要素を含む多次元から成る第１のテンソルおよび第１の正解データに基づいて第１の分類器を学習する。学習装置は、多次元から成る第２のテンソルの入力に対し、学習された第１の分類器が予測した正例および負例の割合を示す推論結果に基づき、第１の要素に重みを反映した第２の要素を含む第２のテンソルを生成する。学習装置は、第２の要素を含む第２のテンソルおよび第２の正解データに基づいて第２の分類器を学習する。【選択図】図１

Description

本発明は、学習プログラム、学習方法および学習装置に関する。

グラフ構造のデータを深層学習することが可能なグラフ構造学習技術（以降、このようなグラフ構造学習を行う装置の一形態を「ディープテンソル（DeepTensor：DT）」と呼ぶ。）が知られている。ＤＴは、入力としてグラフ構造を用い、グラフ構造をテンソルデータ（以下では、テンソルと記載する場合がある）として扱う。そして、ＤＴでは、予測に寄与するグラフの部分構造（テンソルの部分パターン）をコアテンソルとして抽出することで、高精度な予測を実現する。

特開２０１４−２２９１４２号公報特表２０１７−５２００６８号公報特表２０１８−５１７９５６号公報特開２０１０−２１８０４５号公報

しかしながら、上記ＤＴを用いた学習では、異なる要因であるにも関わらず、テンソルの部分パターンが類似する場合があり、学習精度が低下する。

例えば、正例データである体調不良者の出勤簿データ、および、負例データである通常者の出勤簿データをＤＴに入力して予測モデルを学習し、学習済みの予測モデルに、判別対象者の出勤簿データを入力して、判別対象者が療養（休職）する可能性を予測する例を考える。この例では、出勤簿データにおける欠勤パターンを学習するが、うつ病などのメンタル要因による欠勤パターンと、交通事故や脳卒中などのフィジカル要因による欠勤パターンとが類似する場合がある。

ＤＴは、メンタル疾患となる要因を正例データ内の部分パターンから認識することに努めるが、メンタル要因の欠勤パターンとフィジカル要因の欠勤パターンが混在することから、本来重要であるメンタル要因の部分パターンの認識率が低下する。この結果、ＤＴの学習精度が低下し、判別精度の低下に繋がる。なお、フィジカル要因の混入度合や混入箇所は専門家でも判断し難く、人手による適切なラベル付けを以て予め除去するといった対応は困難である。

一つの側面では、学習精度の低下を抑制することができる学習プログラム、学習方法および学習装置を提供することを目的とする。

第１の案では、学習プログラムは、コンピュータに、第１の要素を含む多次元から成る第１のテンソルおよび第１の正解データに基づいて第１の分類器を学習する処理を実行させる。学習プログラムは、コンピュータに、多次元から成る第２のテンソルの入力に対し、学習された前記第１の分類器が予測した正例および負例の割合を示す推論結果に基づき、前記第１の要素に重みを反映した第２の要素を含む前記第２のテンソルを生成する処理を実行させる。学習プログラムは、コンピュータに、前記第２の要素を含む前記第２のテンソルおよび第２の正解データに基づいて第２の分類器を学習する処理を実行させる。

一つの側面では、学習精度の低下を抑制することができる。

図１は、実施例１にかかる学習装置の全体例を説明する図である。図２は、学習データの例を説明する図である。図３は、グラフ構造とテンソルとの関係の一例を示す図である。図４は、部分グラフ構造の抽出の一例を示す図である。図５は、ディープテンソルの学習例を説明する図である。図６は、入力テンソルを説明する図である。図７は、実施例１にかかる学習装置の機能構成を示す機能ブロック図である。図８は、出勤簿データＤＢに記憶される情報の例を示す図である。図９は、実施例１にかかる第１学習データＤＢに記憶される情報の例を示す図である。図１０は、実施例１にかかる第２学習データＤＢに記憶される情報の例を示す図である。図１１は、実施例１にかかる混合判別結果ＤＢに記憶される情報の例を示す図である。図１２は、テンソル化を説明する図である。図１３は、第１の学習を説明する図である。図１４は、混合割合の判別を説明する図である。図１５は、第２の学習を説明する図である。図１６は、学習処理の流れを示すフローチャートである。図１７は、ハードウェア構成例を説明する図である。

以下に、本願の開示する学習プログラム、学習方法および学習装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。

［全体構成］
近年、従業員の体調管理などは、企業にとっても取り組むべき重要な事項に位置づけられており、従業員の出勤簿データから、数か月先のメンタル不調を予測し、カウンセリング等の対応を早期に実施することが行われている。一般的には、専任スタッフが、膨大な人数の従業員の出勤簿データを閲覧し、頻繁な出張、長時間残業、連続する欠勤、無断欠勤、これらの組合せなどの特徴的なパターンの勤務状態に該当する従業員を目視で探している。このような特徴的なパターンは、各専任スタッフにより基準が異なることもあり、明確に定義することが難しい。

そこで、本実施例では、ディープテンソルを用いた深層学習の一例として、従業員等の出勤簿データを学習対象とし、体調不良者の出勤簿データおよび通常者の出勤簿データをディープテンソルに入力して従業員のメンタル不調を予測する予測モデルを学習する例を説明する。実施例１にかかる学習装置１００は、社員の日々の出勤、退勤時間、休暇取得、出張などの状況を含む出勤簿データを機械学習して予測モデルを生成し、学習後の予測モデルを用いて、予測対象のある社員の出勤簿データから、当該社員が療養（休職）するか療養しないかを予測するコンピュータ装置の一例である。なお、ここでは、学習装置１００が学習処理と予測処理とを実行する例で説明するが、別々の装置で実行することもできる。

具体的には、学習装置１００は、療養したことがある体調不良者の出勤簿データ（ラベル＝療養あり）と、療養したことがない通常者の出勤簿データ（ラベル＝療養なし）とを学習データとして、グラフ構造のデータを深層学習（ディープラーニング・Deep Learning；DL）するディープテンソルによって予測モデルを生成する。その後、学習結果を適用した予測モデルを用いて新規なグラフ構造のデータの正確な事象（ラベル）の推定（予測）を実現する。

ここで、出勤簿データにおいて、メンタル要因者が療養した特徴を示す特徴パターンと、交通事故や脳卒中などのフィジカル要因者が療養した特徴を示す特徴パターンとが類似することがあり、メンタル不調が疑われる従業員を特定することをさらに困難にしている。そこで、実施例１にかかる学習装置１００は、２段階の分類器（学習モデル）を用いることで、メンタル要因者の特徴パターンの抽出精度を向上させ、メンタル不調者の予測精度を向上させる。

図１は、実施例１にかかる学習装置の全体例を説明する図である。図１に示すように、学習装置１００は、フィジカル要因による療養期間を有するフィジカル要因者の出勤簿データと、フィジカル要因による療養期間を有さない通常者の出勤簿データとを用意する。そして、学習装置１００は、フィジカル要因者の出勤簿データを正例、通常者の出勤簿データを負例として、ディープテンソルによる学習を実行し、第１の学習モデルを生成する。ここで生成される第１の学習モデルは、フィジカル要因による療養の発生を予測するモデルである。

その後、学習装置１００は、メンタル要因による療養期間を有する療養者の出勤簿データである学習データＡ１を第１の学習モデルに入力し、推定結果Ａ１「推定値（フィジカル非要因率）、推定値（フィジカル要因率）」として「０．７５、０．２５」を取得する。ここで取得される予測結果は、学習データＡ１におけるフィジカル要因の特徴を示す特徴パターンの混合割合などである。図１の例では、学習データＡ１に含まれる出勤簿のパターンには、フィジカル要因の特徴を示す特徴パターンに該当する割合が０．２５、フィジカル要因の特徴パターンに該当しない割合が０．７５であることを示している。

続いて、学習装置１００は、メンタル要因による療養期間を有する療養者の出勤簿データである学習データＡ１を正例、療養期間を有さない通常者の出勤簿データである学習データＢ１を負例として学習を実行し、第２の学習モデルを生成する。このとき、学習装置１００は、学習データＡ１においてフィジカル要因の特徴パターンではない割合が０．７５であることから、学習データＡ１の重みを１から０．７５に変更して学習を実行する。ここで生成される第２の学習モデルは、療養者の出勤簿データにおけるフィジカル要因の割合を考慮した学習モデルであり、メンタル要因の療養の発生を予測するモデルである。

その後、学習装置１００は、予測対象の出勤簿データである予測対象データを、第２の学習モデルに入力し、その出力結果を取得する。そして、学習装置１００は、出力結果に基づいて、予測対象データに対応する従業員が療養する可能性があるか否かを判定する。

ここで、ディープテンソルに入力する学習データについて説明する。図２は、学習データの例を説明する図である。学習データは、６か月ごとの出勤簿データと、その６か月以降から３か月以内に療養実績があるか否かを示すラベルとから構成される。図２の（ａ）は、ラベル（療養あり）が付される体調不良者の出勤簿データであり、図２の（ｂ）は、療養しなかったラベル（療養なし）が付される通常者の出勤簿データである。図２に示すように、実施例１にかかる学習装置１００は、「６か月分の出勤簿データ、ラベル（療養あり）」と、「６か月分の出勤簿データ、ラベル（療養なし）」とを学習データとして予測モデルを学習する。学習装置１００は、学習後、ある人の６か月分の出勤簿データから３か月以内に療養するか否かを予測する。なお、図２内の網掛けは、休暇を示す。

次に、ディープテンソルについて説明する。ディープテンソルとは、テンソル（グラフ情報）を入力とするディープラーニングであり、ニューラルネットワーク（以降ではＮＮと記載する場合がある）の学習とともに、判別に寄与する部分グラフ構造を自動的に抽出する。この抽出処理は、ニューラルネットワークの学習とともに、入力テンソルデータのテンソル分解のパラメータを学習することによって実現される。

次に、図３および図４を用いてグラフ構造について説明する。図３は、グラフ構造とテンソルとの関係の一例を示す図である。図３に示すグラフ２０は、４つのノードがノード間の関係性（例えば「相関係数が所定値以上」）を示すエッジで結ばれている。なお、エッジで結ばれていないノード間は、当該関係性がないことを示す。グラフ２０を２階のテンソル、つまり行列で表す場合、例えば、ノードの左側の番号に基づく行列表現は「行列Ａ」で表され、ノードの右側の番号（囲み線で囲んだ数字）に基づく行列表現は「行列Ｂ」で表される。これらの行列の各成分は、ノード間が結ばれている（接続している）場合「１」で表され、ノード間が結ばれていない（接続していない）場合「０」で表される。以下の説明では、この様な行列を接続行列ともいう。ここで、「行列Ｂ」は、「行列Ａ」の２，３行目および２，３列目を同時に置換することで生成できる。ディープテンソルでは、この様な置換処理を用いることで順序の違いを無視して処理を行う。すなわち、「行列Ａ」および「行列Ｂ」は、ディープテンソルでは順序性が無視され、同じグラフとして扱われる。なお、３階以上のテンソルについても同様の処理となる。

図４は、部分グラフ構造の抽出の一例を示す図である。図４に示すグラフ２１は、６つのノードがエッジで結ばれたものである。グラフ２１は、行列（テンソル）で表すと行列２２に示すように表現できる。行列２２に対して、特定の行および列を入れ替える演算、特定の行および列を抽出する演算、ならびに、接続行列における非ゼロ要素をゼロに置換する演算を組み合わせることで、部分グラフ構造を抽出できる。例えば、行列２２の「ノード１，４，５」に対応する行列を抽出すると、行列２３となる。次に、行列２３の「ノード４，５」間の値をゼロに置換すると、行列２４となる。行列２４に対応する部分グラフ構造は、グラフ２５となる。

このような部分グラフ構造の抽出処理は、テンソル分解と呼ばれる数学的演算によって実現される。テンソル分解とは、入力されたｎ階テンソルをｎ階以下のテンソルの積で近似する演算である。例えば、入力されたｎ階テンソルを１つのｎ階テンソル（コアテンソルと呼ばれる。）、および、より低階のｎ個のテンソル（ｎ＞２の場合、通常は２階のテンソル、つまり行列が用いられる。）の積で近似する。この分解は一意ではなく、入力データが表すグラフ構造中の任意の部分グラフ構造をコアテンソルに含める事ができる。

続いて、ディープテンソルの学習について説明する。図５は、ディープテンソルの学習例を説明する図である。図５に示すように、学習装置１００は、療養ありなどの教師ラベル（ラベルＡ）が付された出勤簿データから入力テンソルを生成する。そして、学習装置１００は、入力テンソルにテンソル分解を行って、初回にランダムに生成されたターゲットコアテンソルに類似するようにコアテンソルを生成する。そして、学習装置１００は、コアテンソルをニューラルネットワーク（ＮＮ：Neural Network）に入力して分類結果（ラベルＡ：７０％、ラベルＢ：３０％）を得る。その後、学習装置１００は、分類結果（ラベルＡ：７０％、ラベルＢ：３０％）と教師ラベル（ラベルＡ：１００％、ラベルＢ：０％）との分類誤差を算出する。

ここで、学習装置１００は、誤差逆伝搬法を拡張した拡張誤差伝搬法を用いて予測モデルの学習およびテンソル分解の方法の学習を実行する。すなわち、学習装置１００は、ＮＮが有する入力層、中間層、出力層に対して、分類誤差を下層に伝搬させる形で、分類誤差を小さくするようにＮＮの各種パラメータを修正する。さらに、学習装置１００は、分類誤差をターゲットコアテンソルまで伝搬させ、予測に寄与するグラフの部分構造、すなわち体調不良者の特徴を示す特徴パターンもしくは通常者の特徴を示す特徴パターンに近づくように、ターゲットコアテンソルを修正する。

また、実施例１で説明するテンソル分解は、ターゲットコアテンソルに類似するようにコアテンソルを算出することにより、分類に重要な構造をコアテンソルの類似の位置に配置する。そして、このコアテンソルを用いてＮＮを学習することにより、精度の高い分類を実現する。テンソル分解は、２段階の最適化により計算される。図６は、入力テンソルを説明する図である。図６に示すように、第１段階では、与えられたターゲットコアテンソルを用いて、入力テンソルを最もよく近似するように要素行列のみ最適化される。第２段階では、第１段階で最適化された要素行列を用いて、入力テンソルを最もよく近似するようにコアテンソルを最適化する。

なお、学習後の予測時には、テンソル分解により、入力テンソルをコアテンソル（入力テンソルの部分パターン）に変換し、コアテンソルをニューラルネットに入力することで、予測結果を得ることができる。テンソル分解では、コアテンソルがターゲットコアテンソルに類似するように変換される。

［機能構成］
図７は、実施例１にかかる学習装置１００の機能構成を示す機能ブロック図である。図７に示すように、学習装置１００は、通信部１０１、記憶部１０２、制御部１３０を有する。

通信部１０１は、他の装置との通信を制御する処理部であり、例えば通信インタフェースである。例えば、通信部１０１は、管理者の端末から、処理開始指示、各学習データ、各学習データがテンソル化された入力テンソルなどを受信する。また、通信部１１は、管理者の端末に対して、学習結果や学習後の予測結果などを出力する。

記憶部１０２は、プログラムやデータを記憶する記憶装置の一例であり、例えばメモリやハードディスクなどである。この記憶部１０２は、出勤簿データＤＢ１０３、第１学習データＤＢ１０４、第１テンソルＤＢ１０５、第１学習結果ＤＢ１０６、第２学習データＤＢ１０７、第２テンソルＤＢ１０８、混合判別結果ＤＢ１０９、第２学習結果ＤＢ１１０、予測対象ＤＢ１１１を記憶する。

出勤簿データＤＢ１０３は、社員等の出勤に関する出勤簿データを記憶するデータベースである。ここで記憶される出勤簿データは、各企業で使用される出勤簿をデータ化したものであり、公知の様々な出勤管理システムなどから取得することができる。図８は、出勤簿データＤＢ１０３に記憶される情報の例を示す図である。図８に示すように、出勤簿データは、「従業員Ｎｏ、日付、曜日、出欠区分、出勤時刻、退勤時刻、残業時間、出張」を対応付けて記憶する。なお、出欠区分には、出社、療養、休暇などの種別が格納される。

図８の例は、従業員Ｎｏ．１００の従業員の出勤簿データを示している。例えば、図８の２行目は、「2015年4月2日木曜日」の出勤簿データであり、この日は、出張がなく、「8：49」に出社して「0：00」に退社し、残業時間が「360分」である例を示す。また、図８の７行目は、「2015年8月24日水曜日」の出勤簿データであり、この日から「2015年10月4日火曜日」まで「療養」したことを示す。なお、出勤簿データの単位は、日ごとに限らず、週単位や月単位であってもよい。

第１学習データＤＢ１０４は、テンソル化対象となる、フィジカル要因による療養期間を有するフィジカル要因者の特徴パターンを学習するために使用する第１の学習データを記憶するデータベースである。図９は、実施例１にかかる第１学習データＤＢ１０４に記憶される情報の例を示す図である。図９に示すように、第１学習データＤＢ１０４は、［データＩＤ、学習データ、ラベル」として「Ｙ１、学習データＣ１、フィジカル要因」や「Ｙ２、学習データＣ２、通常者」などを記憶する。

例えば、６か月の出勤簿データを１つの学習データとし、その後の３か月以内にフィジカル要因により療養した療養期間がある場合に、ラベルとして「フィジカル要因」が設定され、その後の３か月以内に療養期間がない場合に、ラベルとして「通常者」が設定される。

第１テンソルＤＢ１０５は、第１の学習データから生成された各テンソル（テンソルデータ）を記憶するデータベースである。この第１テンソルＤＢ１０５は、各テンソルとラベルとを対応付けたテンソルデータを記憶する。例えば、第１テンソルＤＢ１０５は、「データＮｏ、ラベル」として「テンソルＮｏ．１、フィジカル要因」や「テンソルＮｏ．２、通常者」などを記憶する。なお、ここで記憶される各テンソルは、学習装置１００以外の別の装置で生成してもよく、学習装置１００が生成することもできる。

第１学習結果ＤＢ１０６は、第１の学習結果を記憶するデータベースである。具体的には、第１学習結果ＤＢ１０６は、フィジカル要因による療養の有無を予測する第１の学習モデルに関する情報を記憶する。例えば、第１学習結果ＤＢ１０６は、制御部１３０による第１の学習データの判別結果（分類結果）、機械学習やディープラーニングによって学習された、ＮＮの各種パラメータやディープテンソルの各種パラメータなどを記憶する。

第２学習データＤＢ１０７は、テンソル化対象となる、メンタル要因による療養期間を有するメンタル要因者の特徴を示す特徴パターンを学習するために使用される第２の学習データを記憶するデータベースである。図１０は、実施例１にかかる第２学習データＤＢ１０７に記憶される情報の例を示す図である。図１０に示すように、第２学習データＤＢ１０７は、「データＩＤ、学習データ、ラベル」として「Ｘ１、学習データＡ１、療養あり」や「Ｘ２、学習データＡ２、療養なし（通常者）」などを記憶する。

例えば、６か月の出勤簿データを１つの学習データとし、その後の３か月以内に療養した療養期間がある場合に、ラベルとして「療養あり」が設定され、その後の３か月以内に療養期間がない場合に、ラベルとして「療養なし」が設定される。なお、６か月の出勤簿データに療養期間が含まれている場合、そのデータは学習データとして採用されない。これは、予測時に、予測元のデータ（入力）となる６か月分の出勤簿データにすでに「療養」が入っている人は、明らかに直近で療養しているとわかっており、この先３か月の療養予測の対象にはしないためである。

第２テンソルＤＢ１０８は、第２の学習データから生成された各テンソル（テンソルデータ）を記憶するデータベースである。この第２テンソルＤＢ１０８は、各テンソルとラベルとを対応付けたテンソルデータを記憶する。例えば、第２テンソルＤＢ１０８は、「データＮｏ、ラベル」として「テンソルＮｏ．１、療養あり」や「テンソルＮｏ．２、療養なし（通常者）」などを記憶する。なお、ここで記憶される各テンソルは、学習装置１００以外の別の装置で生成してもよく、学習装置１００が生成することもできる。

混合判別結果ＤＢ１０９は、第２の学習データに含まれる、フィジカル要因の特徴パターンと、フィジカル要因以外の特徴パターンとの混合割合を記憶するデータベースである。具体的には、混合判別結果ＤＢ１０９は、第２学習処理部１５０により予測された結果であり、第２の学習データを第１の学習モデルに入力して得られる判別結果である。

図１１は、実施例１にかかる混合判別結果ＤＢ１０９に記憶される情報の例を示す図である。図１１に示すように、混合判別結果ＤＢ１０９は、「データＩＤ、学習データ、推論値０（フィジカル非要因率）、推論値１（フィジカル要因率）」を対応付けて記憶する。ここで記憶される「データＩＤ」は、データを識別する識別子であり、「学習データ」は、ラベルに「療養あり」が設定された第２の学習データである。「推論値０（フィジカル非要因率）」は、学習データにフィジカル要因ではない特徴パターンが含まれる予測値（割合）であり、「推論値１（フィジカル要因率）」は、学習データにフィジカル要因の特徴パターンが含まれる予測値（割合）である。図１１の例は、データＩＤが「Ｘ１」である学習データＡ１について、フィジカル要因の特徴パターンの割合が０．２４５、フィジカル要因以外の特徴パターンの割合が０．７５５と予測されたことを示す。

第２学習結果ＤＢ１１０は、第２の学習結果を記憶するデータベースである。具体的には、第２学習結果ＤＢ１１０は、メンタル要因による療養の発生有無を予測する第２の学習モデルに関する情報を記憶する。例えば、第２学習結果ＤＢ１１０は、制御部１１０による第２の学習データの判別結果（分類結果）、機械学習やディープラーニングによって学習された、ＮＮの各種パラメータやディープテンソルの各種パラメータなどを記憶する。

予測対象ＤＢ１１１は、学習された第２の学習モデルを用いて、新規に療養の有無を予測する対象の出勤簿データを記憶するデータベースである。例えば、予測対象ＤＢ１１１は、予測対象の出勤簿データ、または、予測対象の出勤簿データから生成されたテンソルなどを記憶する。

制御部１３０は、学習装置１００全体の処理を司る処理部であり、例えばプロセッサなどである。この制御部１１０は、第１学習処理部１４０、第２学習処理部１５０、療養予測部１６０を有する。なお、第１学習処理部１４０、第２学習処理部１５０、療養予測部１６０は、プロセッサなどが有する電子回路やプロセッサなどが実行するプロセスの一例である。

第１学習処理部１４０は、第１生成部１４１と第１学習部１４２を有し、フィジカル要因による療養の有無を予測するための第１の学習モデルを構築する処理部である。

第１生成部１４１は、第１の学習データの生成および第１の学習データに対応するテンソルを生成する処理部である。例えば、第１生成部１４１は、出勤簿データＤＢ１０３に記憶される１月から１２月の出勤簿データのうち１月から６月の出勤簿データを抽出し、そのうち７月から９月の３か月にフィジカル要因の療養期間がない場合はラベル「療養なし」を、抽出した出勤簿データに付加した第１の学習データを生成する。また、第１生成部１４１は、１月から１２月の出勤簿データから、２月から７月の出勤簿データを抽出し、そのうち８月から１０月の３か月にフィジカル要因の療養期間がある場合はラベル「療養あり」を、抽出した出勤簿データに付加した第１の学習データを生成する。そして、第１生成部１４１は、生成した第１の学習データを第１学習データＤＢ１０４に格納する。なお、ここで記憶される情報は、管理者等によって格納することもでき、学習装置１００により生成することもできる。

また、第１生成部１４１は、第１学習データＤＢ１０４に記憶される各第１の学習データを読み出し、テンソル化して第１テンソルＤＢ１０５に格納する。このとき、第１生成部１４１は、第１の学習データに付加されるラベル（フィジカル要因）またはラベル（通常者）を、テンソルに対応付けて格納する。

具体的には、第１生成部１４１は、フィジカル要因による療養の傾向を特徴づけると想定される各属性を各次元として、第１の学習データからテンソルを生成する。例えば、第１生成部１４１は、月度、日付、出欠区分、出張有無の４要素を用いた４次元の４階テンソルを生成する。なお、６か月分のデータである場合は、月度の要素数は「６」、各月の日付数の最大値が３１であることから日付の要素数は「３１」、出欠の種類が出社・休暇・休日であれば出欠区分の要素数は「３」、出張はありとなしであることから出張有無の要素数は「２」となる。したがって、第１の学習データから生成されるテンソルは、「６×３１×３×２」のテンソルとなり、学習データの各月度、日付における出欠区分、出張有無に対応する要素の値が１、そうでない要素の値が０となる。

図１２は、テンソル化を説明する図である。図１２に示すように、第１生成部１４１が生成するテンソルは、横方向に月度、縦方向に日付、奥行き方向に出欠区分、左側が出張あり、右側が出張なしのデータとなる。日付は、上から１日目を順に示し、出欠区分は、手前から出社、休暇、休日を示す。例えば、図１２の（ａ）は、月度１の１日目に出社して出張した要素を示し、図１２の（ｂ）は、月度１の２日目に休暇を取得して出張しなかった要素を示す。

なお、本実施例では、上述したテンソルを簡略化して図１２の（ｃ）のように記載することとする。すなわち、月度、日付、出欠区分、出張有無の各要素を重ねたキューブ状で表現することとし、各月度かつ日付の出張有無を区別して表現し、各月度かつ日付の出欠区分を区別して表現することとする。

なお、第１生成部１４１は、予測時には、学習時と同様の手法で、予測対象ＤＢ１１１に記憶される各予測対象の出勤簿データから、ニューラルネットワークへの入力対象となるテンソルを生成することもできる。

第１学習部１４２は、各第１の学習データから生成された各テンソルおよびラベルを入力として、ディープテンソルによる学習モデルの学習およびテンソル分解の方法の学習を実行する処理部である。具体的には、第１学習部１４２は、フィジカル要因による療養期間を有する学習データと、療養期間を有さない通常者の学習データとを含む第１の学習データを用いて、ディープテンソルによるニューラルネットワークの学習を実行し、フィジカル要因による療養有無を判別（予測）する第１の学習モデルを生成する。言い換えると、第１学習部１４２は、フィジカル要因の特徴パターンの混合割合を判別する第１の学習モデルを生成する。

つまり、第１学習部１４２は、ディープテンソルの「グラフ（テンソル）の部分構造を認識することができる」という性質を利用して、学習を実行する。例えば、第１学習部１４２は、図５で説明した手法と同様、入力対象のテンソル（入力テンソル）からコアテンソルを抽出してＮＮに入力し、ＮＮからの分類結果と入力テンソルに付与されているラベルとの誤差（分類誤差）を算出する。そして、第１学習部１４２は、分類誤差を用いて、ＮＮのパラメータの学習およびターゲットコアテンソルの最適化を実行する。その後、第１学習部１４２は、学習が終了すると、各種パラメータを学習結果として第１学習結果ＤＢ１０６に格納する。

図１３は、第１の学習を説明する図である。図１３に示すように、第１の学習データのデータセットイメージは、療養期間を有する出勤簿データのうちフィジカル要因の特徴パターンを含む出勤簿データ（ラベル：フィジカル要因）と、療養期間を有さない出勤簿データ（ラベル：通常者）とから構成される。そして、第１学習部１４２は、交通事故や脳卒中などのフィジカル要因の療養期間を含む第１の学習データＹ１やフィジカル要因の療養期間を含まない第１の学習データＹ２などをＮＮに入力して学習を実行し、フィジカル要因による療養の発生有無を判別するための第１の学習モデルを生成する。

ＤＴによるニューラルネットワークへの入力データとなるテンソル表現は、図１１に示すように、要素として、データを識別する「データＩＤ」と、ノード間の線形量を示す「Ｎｏｄｅ＿ｄｉｍｅｎｓｉｏｎ」と、重みを示す「ｖａｌｕｅ」と、「ラベル」とを含む。ここで、第１の学習時では、各第１の学習データを同様の重要度で扱うことから、第１学習部１４２は、図１１に示すように、各第１の学習データに対応するテンソル表現の「ｖａｌｕｅ」を「１．０」としてＤＴに入力して学習を実行する。

すなわち、テンソルは線形の量なのであることから、長さを変えることができるが、第１の学習では元々の長さのまま学習を実行する。つまり、フィジカル要因の療養期間を含む第１の学習データＹ１やフィジカル要因の療養期間を含まない第１の学習データＹ２などの各第１の学習データの重要度を同じに扱ってＤＴの学習を実行する。

図７に戻り、第２学習処理部１５０は、第２生成部１５１と混合判別部１５２と第２学習部１５３とを有し、フィジカル要因による療養の影響度を小さくし、メンタル要因による療養の有無を予測するための第２の学習モデルを構築する処理部である。

第２生成部１５１は、第２の学習データの生成および第２の学習データに対応するテンソルを生成する処理部である。例えば、第２生成部１５１は、第２学習データＤＢ１０７に記憶される各第２の学習データを読み出し、テンソル化して第２テンソルＤＢ１０８に格納する。このとき、第２生成部１５１は、第２の学習データに付加されるラベル（フィジカル要因）またはラベル（通常者）を、テンソルに対応付けて格納する。なお、テンソル化する手法は、第１生成部１４１と同様なので、詳細な説明は省略する。また、第２の学習データの生成方法は、第１の学習データの手法と同様なので、詳細な説明は省略する。

混合判別部１５２は、第１学習部によって生成された第１の学習モデルを用いて、第２の学習データに含まれるフィジカル要因の特徴パターンの混合割合を判別する処理部である。具体的には、混合判別部１５２は、第１学習結果ＤＢ１０６から各種パラメータを取得し、各種パラメータを設定したＮＮである第１の学習モデルを構築する。そして、混合判別部１５２は、第２テンソルＤＢ１０８から第２の学習データに対応するテンソルデータを取得し、第１の学習モデルに入力して、判別結果（推論結果）を取得する。その後、混合判別部１５２は、取得した判別結果を混合判別結果ＤＢ１０９に格納する。

図１４は、混合割合の判別を説明する図である。図１４に示すように、混合割合の判別対象となる第２の学習データのデータセットイメージは、療養期間を有する出勤簿データのうち、フィジカル要因の特徴パターンやメンタル要因の特徴パターンを含む可能性が高く、判断の難しい出勤簿データである。そして、混合判別部１５２は、このような療養原因の判別が難しい第２の学習データを、フィジカル要因の療養の発生有無を判別するために学習された第１の学習モデルに入力し、判別結果を取得する。

そして、混合判別部１５２は、予測結果として「療養なし：０．７５５、療養あり：０．２４５」を取得したとする。この場合、混合判別部１５２は、第２の学習データに、フィジカル要因の特徴パターンに該当または類似する休暇パターンが「０．２４５」の割合で含まれている可能性があると判別する。言い換えると、混合判別部１５２は、第２の学習データに、フィジカル要因以外による特徴パターンに該当または類似する休暇パターンが「０．７５５」の割合で含まれている可能性があると判別することができる。

第２学習部１５３は、各第２の学習データから生成された各テンソルおよびラベルを入力として、ディープテンソルによる予測モデルの学習およびテンソル分解の方法の学習を実行する処理部である。具体的には、第２学習部１５３は、メンタル要因による療養期間を有する学習データと、療養期間を有さない通常者の学習データとを用いて、ディープテンソルによるニューラルネットワークの学習を実行し、メンタル要因による療養有無を予測する第２の学習モデルを生成する。そして、第２学習部１５３は、学習が終了すると、各種パラメータを学習結果として第２学習結果ＤＢ１１０に格納する。なお、ＮＮの学習手法は、第１学習部１４２と同様なので、詳細な説明は省略する。

図１５は、第２の学習を説明する図である。図１５に示すように、第２の学習データのデータセットイメージは、療養期間を有する出勤簿データのうちフィジカル要因かメンタル要因かは区別できないがいずれかの療養期間を含み、その混合割合が不明な出勤簿データと、療養期間を有さない出勤簿データとから構成される。

そして、第２学習部１５３は、混合割合が不明確な第２の学習データＸや療養期間を含まない第２の学習データＺなどをＮＮに入力して学習を実行し、メンタル要因による療養の発生有無を予測するための第２の学習モデルを生成する。

このとき、第２学習部１５３は、混合割合が不明確な第２の学習データＸ（ラベル：療養あり）に対しては、混合判別部１５２による判別結果にしたがって、テンソル表現の「ｖａｌｕｅ」を変更してＮＮに入力する。例えば、図１４を例にして説明すると、第２学習部１５３は、テンソル表現の「ｖａｌｕｅ」をデフォルト値の「１」から、フィジカル要因に該当しないと判別された割合である「０．７５５」に変更して、ＮＮに入力する。一方、第２学習部１５３は、療養期間を含まない第２の学習データＺ（ラベル：療養なし）については、テンソル表現の「ｖａｌｕｅ」をデフォルト値の「１」のままでＮＮに入力する。

つまり、第２学習部１５３は、混合割合が不明確な第２の学習データについては、混合判別部１５２による判別結果にしたがって、第２の学習モデルにおける学習の重要度を下げることで、フィジカル要因による特徴パターンの学習が進むことを抑制する。

療養予測部１６０は、第２の学習モデルを用いて、予測対象データのラベルを予測する処理部である。具体的には、療養予測部１６０は、第２学習結果ＤＢ１１０からパラメータ等を取得し、各種パラメータ等を設定したニューラルネットワークである第２の学習モデルを構築する。そして、療養予測部１６０は、予測対象ＤＢ１１１に記憶される予測対象の出勤簿データから生成されたテンソルを、第２の学習モデルに入力する。

その後、療養予測部１６０は、第２の学習モデルの出力結果である、療養するまたは療養しないかの予測結果を取得する。そして、療養予測部１６０は、予測結果をディスプレイに表示したり、管理者端末に送信したりする。例えば、療養予測部１６０は、療養する確率と療養しない確率とを含む予測結果を取得し、療養する確率の方が高い場合は、予測対象データに対応する従業員がメンタル要因による療養の可能性が高いと予測し、療養しない確率の方が高い場合は、当該従業員がメンタル要因による療養の可能性が低いと予測する。

［処理の流れ］
図１６は、学習処理の流れを示すフローチャートである。図１６に示すように、第１学習処理部１４０は、学習処理の開始指示を受け付けると（Ｓ１０１：Ｙｅｓ）、出勤簿データＤＢ１０３から、フィジカル要因の療養期間を有する療養者の出勤簿データを第１の学習データとして抽出する（Ｓ１０２）。

続いて、第１学習処理部１４０は、第１の学習データを１つ選択し（Ｓ１０３）、テンソル化を実行し（Ｓ１０４）、テンソルをＮＮに入力して、フィジカル要因の特徴パターンを学習する第１の学習モデルを生成する第１の学習を実行する（Ｓ１０５）。

ここで第１の学習を継続する場合は（Ｓ１０６：Ｎｏ）、Ｓ１０３以降が繰り返される。一方、第１の学習を終了すると（Ｓ１０６：Ｙｅｓ）、第２学習処理部１５０は、出勤簿データＤＢ１０３から、特定の要因に関わらず療養期間を有する療養者の出勤簿データを第２の学習データとして抽出する（Ｓ１０７）。

続いて、第２学習処理部１５０は、第２の学習データを１つ選択し（Ｓ１０８）、テンソル化を実行し（Ｓ１０９）、学習済みの第１の学習モデルに入力して、混合割合を判別する（Ｓ１１０）。そして、第２学習処理部１５０は、判別結果を混合判別結果ＤＢ１０９に格納する（Ｓ１１１）。

ここで判別処理を継続する場合は（Ｓ１１２：Ｎｏ）、Ｓ１０８以降が繰り返される。一方、判別処理を終了すると（Ｓ１１２：Ｙｅｓ）、第２学習処理部１５０は、第２の学習データを選択し（Ｓ１１３）、対応するテンソルと混合割合とをＮＮに入力して、メンタル要因の特徴パターンを学習する第２の学習モデルを生成する第２の学習を実行する（Ｓ１１４）。

ここで第２の学習を継続する場合は（Ｓ１１５：Ｎｏ）、Ｓ１１３以降が繰り返される。一方、第２の学習を終了すると（Ｓ１１５：Ｙｅｓ）、療養予測部１６０は、予測対象データを取得し（Ｓ１１６）、テンソル化を実行する（Ｓ１１７）。なお、テンソル化は、第１学習処理部１４０など他の処理部が実行することもできる。

続いて、療養予測部１６０は、予測対象データのテンソルを第２の学習モデルに入力して予測結果を取得し（Ｓ１１８）、予測結果を記憶部１０２等に格納する（Ｓ１１９）。そして、予測を継続する場合（Ｓ１２０：Ｎｏ）、Ｓ１１６以降が実行され、予測を終了する場合（Ｓ１２０：Ｙｅｓ）、学習処理全体が終了する。

［効果］
上述したように、学習装置１００は、正例データ内に存在する予測対象でない要素の混在程度をテンソルの重みを最適化し反映させることで、本来の目的に焦点を当てた部分パターン認識を高めることができる。したがって、学習装置１００は、フィジカル要因の混在程度をテンソルの重みで調整することで、本来のメンタル不調予測に影響を与える部分パターンを識別するコアテンソルの認識を維持することができる。

さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。

［学習］
上述した学習処理は、任意の回数だけ実行することもできる。例えば、すべての学習データを用いて実行することもでき、所定回数だけ実行することもできる。また、分類誤差の算出方法は、最小二乗法など公知の算出手法を採用することができ、ＮＮで用いられる一般的な算出手法を採用することもできる。なお、学習データや出勤簿データは、外部の装置から取得することもできる。なお、第１の学習モデルや第２の学習モデルは、分類器の一例である。

また、学習装置１００は、混合判別結果に基づいて、第２の学習データを選択することもできる。例えば、学習装置１００は、推論値０（フィジカル非要因率）が閾値未満の第２の学習データや推論値１（フィジカル要因率）が閾値以上の第２の学習データなどを、学習対象から除外することもできる。また、上記実施例では、フィジカル要因の療養期間とメンタル要因の療養期間とを例示して説明したが、これに限定されるものではなく、異なる要因の療養期間であれば、実施例１と同様の手法を適用することができる。

［ラベル］
上記実施例では、学習時、出勤簿データから自動で６か月や３か月の期間抽出の上、「療養あり」、「療養なし」、「フィジカル要因」、「通常者」などのラベルを付与し学習する例を説明したが、これに限定されるものではない。例えば、ユーザによりあらかじめ期間抽出やラベルが付与されている場合は、与えられたデータや付与済みのラベルを使用することもできる。また、ラベルの設定例も一例であり、療養ありと療養なしに限らず、体調不良者と通常者、休職ありと休職なしなどのように、体調不良者の有無を区別できる様々なラベルを用いることもできる。

また、６か月の出勤簿データを予測に用いるデータとして使用したが、これに限定されるものではなく、４か月など任意に変更することができる。また、６か月の出勤簿データに対して、その後３か月以内に療養したか否かによってラベルを付与する例を説明したが、これに限定されるものではなく、２か月以内など任意に変更することができる。また、上記実施例では、学習装置１００が出勤簿データをテンソル化する例を説明したが、他の装置がテンソル化したデータを取得して上記各処理を実行することもできる。

［想定システム］
上記実施例では、出勤簿データを学習して療養する可能性がある従業員を予測する例で説明したが、これに限定されるものではない。例えば、電子部品の動作データを用いた故障予測、通信データを用いた攻撃予測、道路の交通量データを用いた渋滞予測などにも適用することができる。

［ニューラルネットワーク］
本実施例では、ＲＮＮ（Recurrent Neural Networks）やＣＮＮ（Convolutional Neural Network）など様々なニューラルネットワークを用いることができる。また、学習の手法も、誤差逆伝播以外にも公知の様々な手法を採用することができる。また、ニューラルネットワークは、例えば入力層、中間層（隠れ層）、出力層から構成される多段構成であり、各層は複数のノードがエッジで結ばれる構造を有する。各層は、「活性化関数」と呼ばれる関数を持ち、エッジは「重み」を持ち、各ノードの値は、前の層のノードの値、接続エッジの重みの値（重み係数）、層が持つ活性化関数から計算される。なお、計算方法については、公知の様々な手法を採用できる。

また、ニューラルネットワークにおける学習とは、出力層が正しい値となるように、パラメータ、すなわち、重みとバイアスを修正していくことである。誤差逆伝播法においては、ニューラルネットワークに対して、出力層の値がどれだけ正しい状態（望まれている状態）から離れているかを示す「損失関数（loss function）」を定め、最急降下法等を用いて、損失関数が最小化するように、重みやバイアスの更新が行われる。

［システム］
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。また、実施例で説明した具体例、分布、数値などは、あくまで一例であり、任意に変更することができる。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、ＣＰＵおよび当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

［ハードウェア］
図１７は、ハードウェア構成例を説明する図である。図１７に示すように、学習装置１００は、通信装置１００ａ、ＨＤＤ（Hard Disk Drive）１００ｂ、メモリ１００ｃ、プロセッサ１００ｄを有する。また、図１７に示した各部は、バス等で相互に接続される。

通信装置１００ａは、ネットワークインタフェースカードなどであり、他のサーバとの通信を行う。ＨＤＤ１００ｂは、図７に示した機能を動作させるプログラムやＤＢを記憶する。

プロセッサ１００ｄは、図７に示した各処理部と同様の処理を実行するプログラムをＨＤＤ１０ｂ等から読み出してメモリ１００ｃに展開することで、図７等で説明した各機能を実行するプロセスを動作させる。すなわち、このプロセスは、学習装置１００が有する各処理部と同様の機能を実行する。具体的には、プロセッサ１００ｄは、第１学習処理部１４０、第２学習処理部１５０、療養予測部１６０等と同様の機能を有するプログラムをＨＤＤ１００ｂ等から読み出す。そして、プロセッサ１００ｄは、第１学習処理部１４０、第２学習処理部１５０、療養予測部１６０等と同様の処理を実行するプロセスを実行する。

このように学習装置１００は、プログラムを読み出して実行することで学習方法を実行する情報処理装置として動作する。また、学習装置１００は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、学習装置１００によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。

このプログラムは、インターネットなどのネットワークを介して配布することができる。また、このプログラムは、ハードディスク、フレキシブルディスク（ＦＤ）、ＣＤ−ＲＯＭ、ＭＯ（Magneto−Optical disk）、ＤＶＤ（Digital Versatile Disc）などのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行することができる。

１００学習装置
１０１通信部
１０２記憶部
１０３出勤簿データＤＢ
１０４第１学習データＤＢ
１０５第１テンソルＤＢ
１０６第１学習結果ＤＢ
１０７第２学習データＤＢ
１０８第２テンソルＤＢ
１０９混合判別結果ＤＢ
１１０第２学習結果ＤＢ
１１１予測対象ＤＢ
１３０制御部
１４０第１学習処理部
１４１第１生成部
１４２第１学習部
１５０第２学習処理部
１５１第２生成部
１５２混合判別部
１５３第２学習部
１６０療養予測部

Claims

コンピュータに、
第１の要素を含む多次元から成る第１のテンソルおよび第１の正解データに基づいて第１の分類器を学習し、
多次元から成る第２のテンソルの入力に対し、学習された前記第１の分類器が予測した正例および負例の割合を示す推論結果に基づき、前記第１の要素に重みを反映した第２の要素を含む前記第２のテンソルを生成し、
前記第２の要素を含む前記第２のテンソルおよび第２の正解データに基づいて第２の分類器を学習する、
処理を実行させることを特徴とする学習プログラム。
前記第１の分類器を学習する処理は、第１の事象に該当する第１の学習データから生成された前記第１のテンソルおよび前記第１の事象であることを示す前記第１の正解データを用いて、前記第１の分類器を学習し、
前記生成する処理は、前記第１の事象および第２の事象の混合割合が不明な第２の学習データから生成された前記第２のテンソルを学習済みの前記第１の分類器に入力して前記推論結果を取得し、前記推論結果により推定される前記第１の事象および第２の事象の混合割合に基づき、前記第２のテンソルの重みを変更し、
前記第２の分類器を学習する処理は、重みが変更された前記第２のテンソルおよび前記第２の事象に該当することを示す前記第２の正解データに基づいて、前記第２の分類器を学習する、ことを特徴とする請求項１に記載の学習プログラム。
前記生成する処理は、前記推論結果に含まれる前記第１の事象に該当する第１の確率値および前記第１の事象に該当しない第２の確率値に基づき、前記第２のテンソルの重みとして前記第２の確率値を設定し、
前記第２の分類器を学習する処理は、前記第２の確率値に基づいて、前記第２のテンソルが前記第２の分類器の学習に与える影響度を変更して、前記第２の分類器を学習する、ことを特徴とする請求項２に記載の学習プログラム。
コンピュータが、
第１の要素を含む多次元から成る第１のテンソルおよび第１の正解データに基づいて第１の分類器を学習し、
多次元から成る第２のテンソルの入力に対し、学習された前記第１の分類器が予測した正例および負例の割合を示す推論結果に基づき、前記第１の要素に重みを反映した第２の要素を含む前記第２のテンソルを生成し、
前記第２の要素を含む前記第２のテンソルおよび第２の正解データに基づいて第２の分類器を学習する、
処理を実行することを特徴とする学習方法。
第１の要素を含む多次元から成る第１のテンソルおよび第１の正解データに基づいて第１の分類器を学習する第１学習部と、
多次元から成る第２のテンソルの入力に対し、学習された前記第１の分類器が予測した正例および負例の割合を示す推論結果に基づき、前記第１の要素に重みを反映した第２の要素を含む前記第２のテンソルを生成する生成部と、
前記第２の要素を含む前記第２のテンソルおよび第２の正解データに基づいて第２の分類器を学習する第２学習部と
を有することを特徴とする学習装置。