JP2020016997A

JP2020016997A - データ生成方法、データ生成プログラムおよびデータ構造

Info

Publication number: JP2020016997A
Application number: JP2018138522A
Authority: JP
Inventors: 塩田　哲義; Tetsuyoshi Shioda; 哲義塩田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2018-07-24
Filing date: 2018-07-24
Publication date: 2020-01-30
Also published as: US20200034708A1

Abstract

【課題】分類器モデルの判定精度を向上させる。【解決手段】実施形態のデータ生成方法は、複数の単位時間から成る周期を有する時系列データを受け付け、時系列データに基づいて生成される図形を含む画像データを生成する処理をコンピュータが実行する。図形は、時系列データに含まれる単位時間を時系列順で螺旋状に並べるとともに、周期間で対応する単位時間が螺旋状の中心から放射状に揃うように配置することにより生成される。【選択図】図５

Description

本発明の実施形態は、データ生成方法、データ生成プログラムおよびデータ構造に関する。

従来、ニューラルネットワークを用いた機械学習アプローチで時系列データより株式市場のトレンド、従業員の休養の有無などの傾向を予測（分類）する試みがある。この予測では、教師とする時系列データを表現する図形データを学習用データとして生成し、分類器モデルであるＣＮＮ（Convolutional Neural Network）の学習を行う。そして、予測対象の時系列データを表現する図形データを学習後の分類器モデルに入力することで得られる出力をもとに、予測を行う。

分類器モデルの学習に用いる学習用データの生成については、時系列データを均等なサイズでオーバラップするデータのセグメントに分割し、各々のセグメントに関してセグメント内のデータを表現する画像を生成し、各々の画像に関するトレンドを決定する。そして、生成された各画像及び関連するトレンドを予測分析のためのデータ・セットとして保存する技術が知られている。

特開２０１７−１５７２１３号公報特開２００２−２６８９７１号公報

しかしながら、上記の従来技術では、例えばカレンダーにおける日曜から土曜日までの区切りで時系列データが分割されることで、金曜から月曜などにおける区切りを跨ぐイベントの規則性を図形データで表現することが困難となる。このため、分類器モデルにおいて区切りを跨ぐイベントなどの学習が進まず、判定精度が低くなるという問題がある。

１つの側面では、分類器モデルの判定精度を向上させることを可能とするデータ生成方法、データ生成プログラムおよびデータ構造を提供することを目的とする。

第１の案では、データ生成方法は、複数の単位時間から成る周期を有する時系列データを受け付け、時系列データに基づいて生成される図形を含む画像データを生成する処理をコンピュータが実行する。図形は、時系列データに含まれる単位時間を時系列順で螺旋状に並べるとともに、周期間で対応する単位時間が螺旋状の中心から放射状に揃うように配置することにより生成される。

本発明の１実施態様によれば、分類モデルの判定精度を向上させることができる。

図１は、分類器モデルの学習および分類器モデルによる予測を説明する説明図である。図２は、分類器モデルのニューラルネットワークを説明する説明図である。図３は、実施形態にかかる学習装置の機能構成例を示すブロック図である。図４は、学習フェーズの一例を示すフローチャートである。図５は、勤務データからの勤務実績図形データの生成例を説明する説明図である。図６は、勤務実績図形データの一例を説明する説明図である。図７−１は、従来の勤務実績図形データを例示する説明図である。図７−２は、実施形態にかかる学習装置が生成した勤務実績図形データを例示する説明図である。図８は、予測フェーズの一例を示すフローチャートである。図９は、スペクトラム分析結果を用いた図形生成を説明する説明図である。図１０は、プログラムを実行するコンピュータの一例を示す図である。

以下、図面を参照して、実施形態にかかるデータ生成方法、データ生成プログラムおよびデータ構造を説明する。実施形態において同一の機能を有する構成には同一の符号を付し、重複する説明は省略する。なお、以下の実施形態で説明するデータ生成方法、データ生成プログラムおよびデータ構造は、一例を示すに過ぎず、実施形態を限定するものではない。また、以下の各実施形態は、矛盾しない範囲内で適宜組みあわせてもよい。

図１は、分類器モデルの学習および分類器モデルによる予測を説明する説明図である。図１に示すように、分類器モデル１０は、学習フェーズ（Ｓ１）において教師とする勤務データ１での学習を行い、予測フェーズ（Ｓ２）において予測対象の勤務データ３より傾向を予測（分類）するＣＮＮである。

勤務データ１、３は、社員の日々の出勤、退勤時間、休暇取得、出張などの勤務状況（イベント）を時系列順に示すデータであり、時系列データの一例である。この勤務データ１、３などの時系列データは、複数の時間単位（例えば１日）から成る周期（例えば日〜土の１週間）を有する。

近年、従業員の体調管理などは、企業にとっても取り組むべき重要な事項に位置づけられており、従業員の勤務データ３から、数か月先のメンタル不調（療養の有無）を予測し、カウンセリング等の対応を早期に実施することが行われている。一般的には、職場支援スタッフなどの専任スタッフが、膨大な人数の従業員の勤務データ３を閲覧し、頻繁な出張、長時間残業、連続する欠勤、無断欠勤、これらの組合せなどの特徴的なパターンの勤務状態に該当する従業員を目視で探している。このような特徴的なパターンは、各専任スタッフにより基準が異なることもあり、明確に定義することが難しい。

そこで、本実施形態では、ＣＮＮを用いた機械学習アプローチの一例として、体調不良者（正例）および通常者（負例）の勤務データ１をもとに分類器モデル１０の学習を行う。そして、予測対象の勤務データ３を分類器モデル１０に入力して従業員のメンタル不調を予測する例を説明する。なお、予測対象は、これに限定されるものではない。例えば、電子部品の動作データを用いた故障予測、通信データを用いた攻撃予測、道路の交通量データを用いた渋滞予測など、従業員以外の他の予測対象にも適用することができる。

具体的には、学習フェーズ（Ｓ１）では、正解情報とする正例または負例が付与された勤務データ１をもとに、正例または負例の事例ごとに、時系列順に発生するイベントを図形で表現する時系列図形の生成を行う（Ｓ１１）。これにより、正例または負例の事例ごとに、時系列順に発生するイベントのパターンを図形として表現した勤務実績図形データ２が生成される。

次いで、学習フェーズ（Ｓ１）では、生成された勤務実績図形データ２を分類器モデル１０の入力層に入力し、分類器モデル１０の出力層からの出力が正例または負例を示すように分類器モデル１０内の各層のパラメータ調整を行うことで、分類器モデル１０の機械学習を行う（Ｓ１２）。

予測フェーズ（Ｓ２）では、Ｓ１１と同様、予測対象の勤務データ３をもとに時系列図形の生成を行って勤務実績図形データ４を生成する（Ｓ２１）。次いで、予測フェーズ（Ｓ２）では、生成された勤務実績図形データ４を分類器モデル１０の入力層に入力して体調不良者としての療養の有無などの分類（予測）を行う（Ｓ２２）。次いで、予測フェーズ（Ｓ２）では、勤務実績図形データ４の入力により分類器モデル１０の出力層から得られた予測結果をディスプレイなどに出力する（Ｓ２３）。

図２は、分類器モデル１０のニューラルネットワークを説明する説明図である。図２に示すように、分類器モデル１０のニューラルネットワーク１１は、階層構造を有し、入力層１１ａと出力層１１ｃとの間に複数の中間層１１ｂを有し得る。複数の中間層１１ｂは、例えば、畳み込み層、活性化関数層、プーリング層、全結合層およびソフトマックス層を含む。各層の数及び位置は、要求されるアーキテクチャに応じて随時変更され得る。すなわち、ニューラルネットワーク１１の階層構造や各層の構成は、識別する対象などに応じて、設計者が予め定めることができる。これにより、図形データの中の特徴部を用いてニューラルネットワーク１１における、畳み込み層、活性化関数層、プーリング層、全結合層およびソフトマックス層の少なくともいずれかのレイヤーの重みを変更し、周期的な時間単位の中で発生したイベントから療養する人を予測するための学習済みモデルを生成する。

例えば、本実施形態では、画像化した勤務実績図形データ２、４を入力層１１ａに入力することから、入力層１１ａについては、Ｎ×Ｍピクセル（ｐｉｘ）の画像データを受け付ける構成（Ｎ×Ｍ次元）となっている。また、中間層１１ｂにおいては、入力された画像データからの特徴抽出を可能とするように、畳み込み層と、プーリング層とを交互に積み重ねたＣＮＮ（畳み込みニューラルネットワーク）としての構成を有している。

また、出力層１１ｃについては、入力された勤務実績図形データ２、４に対して、体調不良者（療養あり）または通常者（療養なし）の分類結果を出力する構成となっている。具体的には、出力層１１ｃは、入力された勤務実績図形データ２、４に対して、療養の有無の確率的な度合いを出力する。

ここで、中間層１１ｂの演算について説明する。畳み込み層では、入力したニューロンデータの畳み込み演算（畳み込み処理）を行い、入力ニューロンデータの特徴を抽出する。例えば、畳み込み層では、Ｎ×Ｍピクセルの画像の各画素の値をそれぞれニューロンデータとして、それぞれパラメータが設定されたｍ×ｍのサイズの畳み込みフィルタと畳み込み（convolution）を計算することで、次層への出力用のニューロンデータを作成する。

例えば、畳み込み層では、当該計算をすることで、螺旋状の図形の中心から放射状の位置になるように配置された特徴部に対して、特徴部の特徴が類似するほどスコアが高くなるように重みづけられる。つまり、時系列図形２１のイベントのうち「労働（出勤日）」に対応する画像に対して、「非労働（出勤日」に対応する画像より「労働（出勤日）」に対応する画像であるときはスコアが高くなる。

活性化関数層では、畳み込み層で抽出された特徴を強調する。すなわち、活性化関数層では、活性化関数に出力用のニューロンデータを通過させることで、発火（activation）をモデル化する。発火とは、ニューロンから出力される信号の値がある値を超えるときに出力される信号が他のニューロンに伝達される現象をいう。活性化関数としては、非線形な活性化関数を用いることができ、例えば、ＲｅＬＵ（Rectified Linear Unit：ランプ関数）を用いることができる。

プーリング層は、例えば畳み込み層の直後に置かれ、入力したニューロンデータの間引きを行う。これにより、プーリング層では、抽出された特徴の位置感度を低下させる働きがある。例えば、プーリング層では、ｋ×ｋの領域ごとに、最大値を取り出すMax-Poolingにより、間引きを行う。間引きは、その他、何れの手法で行ってもよい。例えば、ｋ×ｋの領域の平均値を取り出すAverage-Poolingで、間引きを行ってもよい。また、プーリング層では、間引きを行うｋ×ｋの領域を一部重複させてもよく、重複させずに隣接させて間引きを行ってもよい。

全結合層では、抽出された特徴を結合して特徴を示す変数を生成する。すなわち、全結合層では、識別を行う対象数に応じて、入力したニューロンデータを全結合した全結合の演算を行う。例えば、Ｎ×Ｍピクセルの画像がニューロンデータとして入力される。全結合層は、Ｎ×Ｍピクセルのニューロンデータ全てを、それぞれ重み（パラメータ）と掛け合わせることで、次層への出力用のニューロンデータを作成する。

ソフトマックス層は、全結合層で生成された変数を確率に変換する。すなわち、ソフトマックス層は、正規化するような活性化関数に出力用のニューロンデータを通過させる演算を行うことで、発火をモデル化する。ソフトマックス層で用いる活性化関数としては、非線形な活性化関数を用いることができ、例えば、Softmax関数を用いることができる。ソフトマックス層による演算結果のニューロンデータは、出力層１１ｃに出力され、出力層１１ｃで識別が行われる。

上記の分類器モデル１０における学習フェーズ（Ｓ１）および予測フェーズ（Ｓ２）は、プログラムを実行するコンピュータなどの学習装置により実行される。

図３は、実施形態にかかる学習装置の機能構成例を示すブロック図である。図３に示すように、学習装置１００は、通信部１０１、記憶部１０２および制御部１１０を有する。

通信部１０１は、他の装置との通信を制御する処理部であり、例えば通信インタフェースである。例えば、通信部１０１は、管理者の端末から、処理開始などの指示、教師データ等を受信する。また、通信部１０１は、管理者の端末に対して、学習結果や学習後の予測結果などを出力する。

記憶部１０２は、プログラムやデータを記憶する記憶装置の一例であり、例えばメモリやハードディスクなどである。この記憶部１０２は、出勤簿データＤＢ１０３、学習用データＤＢ１０４、学習結果ＤＢ１０５、予測対象ＤＢ１０６、設定情報１０７を記憶する。

出勤簿データＤＢ１０３は、社員等の勤務に関する勤務データを記憶するデータベースである。ここで記憶される勤務データは、各企業で使用される出勤簿をデータ化したものであり、公知の様々な出勤管理システムなどから取得することができる。例えば、出勤簿データＤＢ１０３は、「従業員ＩＤ、日付、休日／労働（出勤日）／非労働（出勤日）などの勤務形態、出社時間、退社時間」などを勤務データとして格納する。

学習用データＤＢ１０４は、分類器モデル１０の学習にかかる教師データなどの学習用データを記憶するデータベースである。具体的には、学習用データＤＢ１０４は、出勤簿データＤＢ１０３と同様に各従業員の出勤簿から生成され、正解情報とする正例または負例が付与された勤務データ１を格納する。

ここで記憶される出勤簿データＤＢ１０３および学習用データＤＢ１０４のデータは、学習装置１００以外の別の装置で生成してもよく、学習装置１００が生成することもできる。

学習結果ＤＢ１０５は、学習結果を記憶するデータベースである。例えば、学習結果ＤＢ１０５は、機械学習によって学習された、分類器モデル１０の中間層１１ｂにおけるパラメータなどを記憶する。

予測対象ＤＢ１０６は、学習された分類器モデル１０を用いて、療養の有無を予測する対象（従業員）の勤務データ３を記憶するデータベースである。例えば、予測対象ＤＢ１０６は、出勤簿データＤＢ１０３より抽出された予測対象の従業員にかかる勤務データ３を記憶する。

設定情報１０７は、ユーザが管理者の端末などを介して予め設定した設定内容を示す。例えば、設定情報１０７における設定内容には、出勤簿データＤＢ１０３に含まれる項目（従業員ＩＤ、日付、休日／労働（出勤日）／非労働（出勤日）などの勤務形態、出社時間、退社時間…）の設定内容などがある。また、設定情報１０７における設定内容には、勤務実績図形データ２、４を生成する際の条件（図形に含まれる各要素の大きさ、長さ、配置位置、角度等）などがある。

制御部１１０は、学習装置１００全体の処理を司る処理部であり、例えばプロセッサなどである。この制御部１１０は、データ取得部１１１、図形データ生成部１１２、学習部１１３および予測部１１４を有する。なお、データ取得部１１１、図形データ生成部１１２、学習部１１３および予測部１１４は、プロセッサなどが有する電子回路やプロセッサなどが実行するプロセスの一例である。

データ取得部１１１は、学習フェーズ（Ｓ１）、予測フェーズ（Ｓ２）において処理の対象とするデータを取得する処理部である。具体的には、データ取得部１１１は、学習フェーズ（Ｓ１）において、正解情報付きの勤務データ１を学習用データＤＢ１０４より取得する。また、データ取得部１１１は、予測フェーズ（Ｓ２）において、予測対象の勤務データ３を予測対象ＤＢ１０６より取得する。

図形データ生成部１１２は、勤務データ１または勤務データ３の時系列データより時系列図形を作成する処理（Ｓ１１、Ｓ２１）を行い、勤務実績図形データ２または勤務実績図形データ４を生成する処理部である。

具体的には、図形データ生成部１１２は、勤務データ１、勤務データ３の時系列データに基づき、時系列データに含まれるイベント（例えば休日／労働（出勤日）／非労働（出勤日）などの勤務形態、出社時間、退社時間）を中心に対する周方向に沿って時系列順に配置する勤務実績図形データ２、４を生成する。例えば、図形データ生成部１１２は、勤務データ１、勤務データ３の時系列データが示すイベントを順に読み出し、イベントに対応する図形（例えば網掛け）に変換した上で、中心に対する周方向に沿って順次並べる。

また、図形データ生成部１１２は、勤務実績図形データ２、４において、所定の時間単位（例えば１週間）を１周期とする各周期で対応するイベント位置（例えば月曜、火曜…）について、直近の周期で対応するイベント位置同士を中心に対する半径方向に近接して配置する。なお、所定の時間単位については、設定情報１０７などおいて予め設定されているものとする。

例えば、図形データ生成部１１２は、日曜から土曜までの１週間分のイベントを周方向に１周（一例として日曜の０：００を０度とし、土曜の２４：００を３６０度とする）にわたり配置する。次いで、図形データ生成部１１２は、次の１週間分のイベントを前の周の外周または内周に同様に配置し、同心円、螺旋状などの周回状の図形とする勤務実績図形データ２、４を生成する。

これにより、勤務実績図形データ２、４では、時系列順に続くイベントや、各周期で対応するイベント位置同士が図形内で近傍に配置されることとなる。

なお、図形データ生成部１１２は、勤務実績図形データ２において、周方向に沿って時系列順に配置するイベントの間隔および半径方向に近接して配置するイベント位置同士の間隔を畳み込みフィルタのサイズをもとに設定してもよい。具体的には、図形データ生成部１１２は、設定情報１０７などを参照し、ニューラルネットワーク１１の畳み込み層における畳み込みフィルタの設定サイズ（ｍ×ｍ）を取得する。次いで、図形データ生成部１１２は、畳み込みフィルタにおけるｍ×ｍのサイズ内に、周方向および半径方向において所定数のイベントが含まれるように、周方向および半径方向におけるイベント間隔を設定する。これにより、図形データ生成部１１２は、時系列順に直近のイベント同士および直近の周期で対応するイベント同士が畳み込みフィルタに収まるような勤務実績図形データ２を生成することができる。

学習部１１３は、学習フェーズ（Ｓ１）において、多階層のニューラルネットワーク１１を学習させる誤差逆伝播法などのディープラーニング手法を用いることで、ニューラルネットワーク１１について教師データによる教師あり学習を行う。

例えば、学習部１１３は、教師あり学習で一般的に使用される誤差逆伝播法では、学習用の勤務実績図形データ２を入力層１１ａより入力してニューラルネットワーク１１に順伝播させる。次いで、学習部１１３は、出力層１１ｃから得られる分類結果と正解（正例・負例）とを比較して誤差を求める。そして、誤差逆伝播法では、分類結果と正解との誤差を分類時と逆方向にニューラルネットワーク１１に伝播させ、ニューラルネットワーク１１の各階層のパラメータを変更して最適解に近づけていく。その後、学習部１１３は、学習が終了すると、ニューラルネットワーク１１の各種パラメータを学習結果として学習結果ＤＢ１０５に格納する。

予測部１１４は、予測フェーズ（Ｓ２）において、学習結果を用いて、判別対象のデータのラベルを予測する処理部である。具体的には、予測部１１４は、学習結果ＤＢ１０５からニューラルネットワーク１１にかかる各種パラメータを読み出し、各種パラメータを設定した分類器モデル１０を構築する。そして、予測部１１４は、予測対象の勤務データ３より生成された勤務実績図形データ４を構築した分類器モデル１０の入力層１１ａに入力する。次いで、予測部１１４は、療養または療養しないかの分類結果を分類器モデル１０の出力層１１ｃより出力する。そして、予測部１１４は、予測結果をディスプレイに表示したり、管理者端末に送信したりする。

図４は、学習フェーズの一例を示すフローチャートである。図４に示すように、学習フェーズ（Ｓ１）が開始されると、データ取得部１１１は、学習用データＤＢ１０４を参照して学習用の勤務データ１の読み込みを行う（Ｓ１０１）。具体的には、データ取得部１１１は、正例または負例が付与された事例ごとに勤務データ１（例えば正例または負例とする所定の従業員の勤務状況）を読み出す。次いで、図形データ生成部１１２は、読み出した勤務データ１をもとに、勤務実績図形データ２を生成する（Ｓ１０２）。

図５は、勤務データ１からの勤務実績図形データ２の生成例を説明する説明図である。図５に示すように、図形データ生成部１１２は、勤務データ１に含まれるイベント（休日／労働（出勤日）／非労働（出勤日）などの勤務形態、出社時間、退社時間など）を、中心２０に対する周方向に沿って時系列順に配置する時系列図形２１を含む勤務実績図形データ２を生成する。また、時系列図形２１においては、日曜の０：００を０度、土曜の２４：００を３６０度とする１周にわたり日曜から土曜までのイベントを配置し、次の週を外に向けて配置していく螺旋形状であるものとする。なお、図示例では中心２０から外側に向けて螺旋形状にイベントを配置する時系列図形２１を例示するが、イベントの配置例を上記に限定しない。例えば、外側から中心２０に向けて螺旋形状にイベントを配置してもよい。

なお、第一週目の各曜日と第一週目の次の週の第二週目の各曜日に関し、同じ曜日は、螺旋形状の図形の中心から放射状に位置が対応する。例えば、第一週目の月曜日と第二週目の月曜日の位置が対応し、一週目の火曜日と第二週目の火曜日の位置が対応し、一週目の水曜日と第二週目の水曜日の位置が対応する。同様に、第三週目以降についても、曜日の位置が図形の中心から放射状に位置が対応する。つまり、同じ曜日に起きたイベントについては、螺旋形状の図形の中心から放射状に位置が対応する。

図６は、勤務実績図形データの一例を説明する説明図である。図６に示すように、図形データ生成部１１２は、直角に角度を変えていく螺旋形状の時系列図形２１とする勤務実績図形データ２ａを生成してもよい。

また、図形データ生成部１１２は、勤務実績図形データ２について、期間をずらして複数作成してもよい。例えば、図５の例では１１／１からのイベントを時系列図形２１とする勤務実績図形データ２を生成しているが、１１／８〜、１１／１５〜…のように１周ずらして複数の勤務実績図形データ２を作成してもよい。このように期間をずらして複数の勤務実績図形データ２を生成することで、時系列図形２１の中心２０寄りと外側寄りとでイベントの大きさが異なることにより生じる差別を解消することができる。

図４に戻り、Ｓ１０２に次いで、図形データ生成部１１２は、生成した勤務実績図形データ２について、勤務データ１に付与された正解情報（正例または負例）をもとに、「療養する」か「療養しない」かのラベル付けを行う（Ｓ１０３）。

次いで、図形データ生成部１１２は、学習用データＤＢ１０４に含まれる全ての学習用データで処理が完了したか否かを判定し（Ｓ１０４）、完了していない場合（Ｓ１０４：ＮＯ）はＳ１０１へ処理を戻す。

完了している場合（Ｓ１０４：ＹＥＳ）、学習部１１３は、ラベル付け後の勤務実績図形データ２をもとに、ＣＮＮより分類器モデル１０を生成する（Ｓ１０５）。

図７−１は、従来の勤務実績図形データを例示する説明図である。図７−１に示すように、従来の勤務実績図形データにおける時系列図形２１ａでは、例えば日曜から土曜のセグメントに分割される。このため、時系列図形２１ａでＣＮＮの学習を行う場合には、金曜から月曜にかけての特徴箇所２３が畳み込みフィルタ２４内に収まらないことがある。したがって、従来の勤務実績データでは、金曜から月曜にかけての特徴箇所２３についてＣＮＮの学習が進まず、判定精度が低くなる場合がある。

また、療養する人は、時間単位に対し、決まったパターンで休む傾向がある。ここで、カレンダーのように周期的な時間単位の連続性が切断されていると、イベントの発生の周期性を学習させることができない。例えば、１０日ごとにイベントが発生すると、カレンダーは１週間ごとであるため、次の週では、３日ずれている。このため、周期的な時間単位とは異なる周期で発生するイベントに関して、イベントが発生するか否かを判定するための学習済みモデルの判定精度が低くなる。

図７−２は、実施形態にかかる学習装置１００が生成した勤務実績図形データ２を例示する説明図である。図７−２に示すように、勤務実績図形データ２の時系列図形２１では、時系列順に続くイベントや、各周期で対応するイベント位置同士が近傍に配置される。このため、時系列図形２１でＣＮＮの学習を行う場合には、金曜から月曜にかけての特徴箇所２３が畳み込みフィルタ２４内に収まることから、特徴箇所２３についてＣＮＮの学習を進めることができる。

これにより、時間単位を構成する曜日ごとのイベントにつき、療養する人の傾向を学習させることができる。また、周期的な時間単位とは異なる周期で発生するイベントに関して、療養する人の傾向を学習させることができる。

図８は、予測フェーズの一例を示すフローチャートである。図８に示すように、予測フェーズの処理が開始されると、データ取得部１１１は、予測対象ＤＢ１０６を参照して予測用の勤務データ３の読み込みを行う（Ｓ２０１）。次いで、図形データ生成部１１２は、読み出した勤務データ３をもとに、Ｓ１０２と同様の処理を行い、勤務実績図形データ４を生成する（Ｓ２０２）。

次いで、予測部１１４は、学習結果ＤＢ１０５からニューラルネットワーク１１にかかる各種パラメータを読み出し、各種パラメータを設定した分類器モデル１０を構築する。次いで、予測部１１４は、構築した分類器モデル１０に勤務実績図形データ４を入力して「療養する」・「療養しない」の確率を計算し（Ｓ２０３）、分類器モデル１０の出力層１１ｃから計算結果（分類結果）を得る。次いで、予測部１１４は、ディプレイへの表示や、管理者端末への送信により計算結果を出力する（Ｓ２０４）。

なお、勤務実績図形データ２を生成する際に、１周期とする時間単位は、図形データ生成部１１２のスペクトラム分析による分析結果に基づいて検出した周期を用いてもよい。図９は、スペクトラム分析結果を用いた図形生成を説明する説明図である。

図９に示すように、図形データ生成部１１２は、勤務データ１について、所定の条件（例えば休日）でのスペクトラム分析を行う（Ｓ１１１）。これにより、図形データ生成部１１２は、周期（日）ごとのスペクトラム強度（例えば休日である場合に強い）を示すスペクトラムデータ５を分析結果として得る。

次いで、図形データ生成部１１２は、得られたスペクトラムデータ５をもとに周期の検出を行い（Ｓ１１２）、周期データ６を得る。例えば、勤務データ１のスペクトラム分析により３日勤務後に１日休みとするスペクトラムデータ５が得られた場合は、４日周期の周期データ６を得る。次いで、図形データ生成部１１２は、得られた周期データ６を１周期とする時間単位で時系列図形の生成を行い（Ｓ１１ａ）、勤務実績図形データ２を生成する。これにより、管理者などが周期について設定情報１０７に予め設定することなく、勤務データ１のスペクトラム分析で得られる特徴的な周期を１周期とすることができる。

以上のように、学習装置１００は、学習対象の勤務データ１に基づき、畳み込みニューラルネットワークを用いた分類器モデル１０の学習にかかる学習用データとしての勤務実績図形データ２を生成する。具体的には、学習装置１００は、勤務実績図形データ２において、勤務データ１に含まれるイベントを中心２０に対する周方向に沿って時系列順に配置する。また、学習装置１００は、勤務実績図形データ２において、勤務データ１における所定の時間単位を１周期とする各周期で対応するイベント位置について、直近の周期で対応するイベント位置同士を中心２０に対する半径方向に近接して配置する。

これにより、分類器モデル１０の学習に用いる勤務実績図形データ２では、勤務データ１において時系列順に続くイベントが図形内で近傍に配置されることとなる。例えば、勤務実績図形データ２では、カレンダーにおける日曜から土曜日までの区切りで分割されて、区切りを跨ぐイベントが離れて配置されることがなくなる。このため、勤務実績図形データ２では、例えば金曜から月曜などにおける週末の区切りを跨ぐイベントの規則性を表現することが可能となる。したがって、勤務実績図形データ２を分類器モデル１０の学習に用いることで、週末の区切りを跨ぐイベントなどの学習を進めることができ、分類器モデル１０の判別精度が低くなることを抑止できる。

また、学習装置１００は、勤務データ１に含まれるイベントを中心２０に対して螺旋状に配置する勤務実績図形データ２を生成する。これにより、勤務実績図形データ２では、勤務データ１において時系列順に続くイベントが途切れることなく螺旋状に配置されることとなる。したがって、勤務実績図形データ２を分類器モデル１０の学習に用いることで、時系列順に途切れることなくイベントの学習を行うことができ、分類器モデル１０の判別精度を向上させることができる。

また、学習装置１００は、分類器モデル１０の畳み込みフィルタサイズに基づき、勤務実績図形データ２において時系列順に配置するイベントの間隔および半径方向に近接して配置するイベント位置同士の間隔を設定する。これにより、学習装置１００は、時系列順に直近のイベント同士および直近の周期で対応するイベント同士を畳み込みフィルタに収まるように、勤務実績図形データ２を生成することができる。したがって、勤務実績図形データ２を分類器モデル１０の学習に用いることで、時系列順に直近のイベント同士および直近の周期で対応するイベント同士を特徴とする学習を行うことができ、分類器モデル１０の判別精度を向上させることができる。

また、学習装置１００は、勤務データ１のスペクトラム分析に基づいて検出した周期を１周期とする各周期で対応するイベント位置について、直近の周期で対応するイベント位置同士を中心２０に対する半径方向に近接して配置する。これにより、学習装置１００は、勤務データ１においてスペクトラム分析で得られる特徴的な周期を１周期とする勤務実績図形データ２を生成することができる。

また、学習装置１００は、従業員の勤務状況を記録する勤務データ１より分類器モデル１０の学習にかかる勤務実績図形データ２を生成することで、例えば従業員の勤務状況から療養の有無を判定するための分類器モデル１０の学習を行うことができる。

また、学習装置１００は、１週間を１周期とするカレンダーの曜日位置について、直近の週で対応する曜日同士を中心２０に対する半径方向に近接して配置する勤務実績図形データ２を生成する。これにより、勤務実績図形データ２を分類器モデル１０の学習に用いることで、曜日同士で特徴あるイベントの相関関係の学習を行うことができる。

なお、図示した各装置の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

学習装置１００で行われる各種処理機能は、ＣＰＵ（またはＭＰＵ、ＭＣＵ（Micro Controller Unit）等のマイクロ・コンピュータ）上で、その全部または任意の一部を実行するようにしてもよい。また、各種処理機能は、ＣＰＵ（またはＭＰＵ、ＭＣＵ等のマイクロ・コンピュータ）で解析実行されるプログラム上、またはワイヤードロジックによるハードウエア上で、その全部または任意の一部を実行するようにしてもよいことは言うまでもない。また、マッチング装置１で行われる各種処理機能は、クラウドコンピューティングにより、複数のコンピュータが協働して実行してもよい。

ところで、上記の実施形態で説明した各種の処理は、予め用意されたプログラムをコンピュータで実行することで実現できる。そこで、以下では、上記の実施形態と同様の機能を有するプログラムを実行するコンピュータ（ハードウエア）の一例を説明する。図１０は、プログラムを実行するコンピュータの一例を示す図である。

図１０に示すように、コンピュータ２００は、各種演算処理を実行するＣＰＵ２０１と、データ入力を受け付ける入力装置２０２と、モニタ２０３と、スピーカ２０４とを有する。また、コンピュータ２００は、記憶媒体からプログラム等を読み取る媒体読取装置２０５と、各種装置と接続するためのインタフェース装置２０６と、有線または無線により外部機器と通信接続するための通信装置２０７とを有する。また、コンピュータ２００は、各種情報を一時記憶するＲＡＭ２０８と、ハードディスク装置２０９とを有する。また、コンピュータ２００内の各部（２０１〜２０９）は、バス２１０に接続される。

ハードディスク装置２０９には、上記の実施形態で説明したデータ取得部１１１、図形データ生成部１１２、学習部１１３および予測部１１４等における各種の処理を実行するためのプログラム２１１が記憶される。また、ハードディスク装置２０９には、プログラム２１１が参照する各種データ２１２が記憶される。入力装置２０２は、例えば、コンピュータ２００の操作者から操作情報の入力を受け付ける。モニタ２０３は、例えば、操作者が操作する各種画面を表示する。インタフェース装置２０６は、例えば印刷装置等が接続される。通信装置２０７は、ＬＡＮ（Local Area Network）等の通信ネットワークと接続され、通信ネットワークを介した外部機器との間で各種情報をやりとりする。

ＣＰＵ２０１は、ハードディスク装置２０９に記憶されたプログラム２１１を読み出して、ＲＡＭ２０８に展開して実行することで、データ取得部１１１、図形データ生成部１１２、学習部１１３および予測部１１４等における各種の処理を行う。なお、プログラム２１１は、ハードディスク装置２０９に記憶されていなくてもよい。例えば、コンピュータ２００が読み取り可能な記憶媒体に記憶されたプログラム２１１を、コンピュータ２００が読み出して実行するようにしてもよい。コンピュータ２００が読み取り可能な記憶媒体は、例えば、ＣＤ−ＲＯＭやＤＶＤディスク、ＵＳＢ（Universal Serial Bus）メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、ＬＡＮ等に接続された装置にプログラム２１１を記憶させておき、コンピュータ２００がこれらからプログラム２１１を読み出して実行するようにしてもよい。

以上の実施形態に関し、さらに以下の付記を開示する。

（付記１）複数の単位時間から成る周期を有する時系列データを受け付け、
前記時系列データに基づいて生成される図形を含む画像データを生成する処理をコンピュータが実行するデータ生成方法であって、
前記図形は、前記時系列データに含まれる前記単位時間を時系列順で螺旋状に並べるとともに、前記周期間で対応する前記単位時間が前記螺旋状の中心から放射状に揃うように配置することにより生成される
ことを特徴とするデータ生成方法。

（付記２）前記画像データは、畳み込みニューラルネットワークに対する学習用データである
ことを特徴とする付記１に記載のデータ生成方法。

（付記３）前記生成する処理は、前記畳み込みニューラルネットワークの畳み込みフィルタサイズに基づき、前記周方向に沿って時系列順に配置するイベントの間隔および前記半径方向に近接して配置するイベント位置同士の間隔を設定する、
ことを特徴とする付記２に記載のデータ生成方法。

（付記４）前記生成する処理は、前記時系列データのスペクトラム分析に基づいて検出した周期を１周期とする、
ことを特徴とする付記１乃至３のいずれか一に記載のデータ生成方法。

（付記５）前記時系列データは、従業員の勤務状況を記録する勤務データである、
ことを特徴とする付記１乃至４のいずれか一に記載のデータ生成方法。

（付記６）前記生成する処理は、前記勤務データにおいて、１週間を１周期とするカレンダーの曜日位置について、直近の週で対応する曜日同士を前記中心に対する半径方向に近接して配置する前記図形を生成する、
ことを特徴とする付記５に記載のデータ生成方法。

（付記７）前記図形の中の特徴部を用いて、畳み込みニューラルネットワークにおける、畳み込み層、プーリング層、結合層の少なくともいずれかのレイヤーの重みを変更し、周期的な時間単位の中で発生したイベントから療養する人を予測するための学習済みモデルを生成する処理をさらにコンピュータが実行する
ことを特徴とする付記５または６に記載のデータ生成方法。

（付記８）複数の単位時間から成る周期を有する時系列データを受け付け、
前記時系列データに基づいて生成される図形を含む画像データを生成する処理をコンピュータに実行させるデータ生成プログラムであって、
前記図形は、前記時系列データに含まれる前記単位時間を時系列順で螺旋状に並べるとともに、前記周期間で対応する前記単位時間が前記螺旋状の中心から放射状に揃うように配置することにより生成される
ことを特徴とするデータ生成プログラム。

（付記９）前記画像データは、畳み込みニューラルネットワークに対する学習用データである
ことを特徴とする付記８に記載のデータ生成プログラム。

（付記１０）前記生成する処理は、前記畳み込みニューラルネットワークの畳み込みフィルタサイズに基づき、前記周方向に沿って時系列順に配置するイベントの間隔および前記半径方向に近接して配置するイベント位置同士の間隔を設定する、
ことを特徴とする付記９に記載のデータ生成プログラム。

（付記１１）前記生成する処理は、前記時系列データのスペクトラム分析に基づいて検出した周期を１周期とする、
ことを特徴とする付記８乃至１０のいずれか一に記載のデータ生成プログラム。

（付記１２）前記時系列データは、従業員の勤務状況を記録する勤務データである、
ことを特徴とする付記８乃至１１のいずれか一に記載のデータ生成プログラム。

（付記１３）前記生成する処理は、前記勤務データにおいて、１週間を１周期とするカレンダーの曜日位置について、直近の週で対応する曜日同士を前記中心に対する半径方向に近接して配置する前記図形を生成する、
ことを特徴とする付記１２に記載のデータ生成プログラム。

（付記１４）前記図形の中の特徴部を用いて、畳み込みニューラルネットワークにおける、畳み込み層、プーリング層、結合層の少なくともいずれかのレイヤーの重みを変更し、周期的な時間単位の中で発生したイベントから療養する人を予測するための学習済みモデルを生成する処理をさらにコンピュータに実行させる
ことを特徴とする付記１２または１３に記載のデータ生成プログラム。

（付記１５）複数の単位時間から成る周期を有する、学習対象の時系列データに基づき、前記時系列データに含まれる前記単位時間を時系列順で螺旋状に並べるとともに、前記周期間で対応する前記単位時間が前記螺旋状の中心から放射状に揃うように配置する図形データと、
前記図形データに付与された正解情報とを含み、
前記図形データと前記正解情報とを学習データとして、畳み込みニューラルネットワークの入力層に入力されることにより、演算結果を示す出力値を前記畳み込みニューラルネットワークの出力層から出力させ、前記正解情報と前記出力値との比較に基づく学習を行う、
処理をコンピュータに実行させることを特徴とするデータ構造。

１、３…勤務データ
２、２ａ、２ｂ、４…勤務実績図形データ
５…スペクトラムデータ
６…周期データ
１０…分類器モデル
１１…ニューラルネットワーク
１１ａ…入力層
１１ｂ…中間層
１１ｃ…出力層
２１、２１ａ…時系列図形
２３…特徴箇所
２４…畳み込みフィルタ
１００…学習装置
１０１…通信部
１０２…記憶部
１０３…出勤簿データＤＢ
１０４…学習用データＤＢ
１０５…学習結果ＤＢ
１０６…予測対象ＤＢ
１０７…設定情報
１１０…制御部
１１１…データ取得部
１１２…図形データ生成部
１１３…学習部
１１４…予測部
２００…コンピュータ
２０１…ＣＰＵ
２０２…入力装置
２０３…モニタ
２０４…スピーカ
２０５…媒体読取装置
２０６…インタフェース装置
２０７…通信装置
２０８…ＲＡＭ
２０９…ハードディスク装置
２１０…バス
２１１…プログラム
２１２…各種データ

Claims

複数の単位時間から成る周期を有する時系列データを受け付け、
前記時系列データに基づいて生成される図形を含む画像データを生成する処理をコンピュータが実行するデータ生成方法であって、
前記図形は、前記時系列データに含まれる前記単位時間を時系列順で螺旋状に並べるとともに、前記周期間で対応する前記単位時間が前記螺旋状の中心から放射状に揃うように配置することにより生成される
ことを特徴とするデータ生成方法。
前記画像データは、畳み込みニューラルネットワークに対する学習用データである
ことを特徴とする請求項１に記載のデータ生成方法。
前記生成する処理は、前記畳み込みニューラルネットワークの畳み込みフィルタサイズに基づき、前記周方向に沿って時系列順に配置するイベントの間隔および前記半径方向に近接して配置するイベント位置同士の間隔を設定する、
ことを特徴とする請求項２に記載のデータ生成方法。
前記生成する処理は、前記時系列データのスペクトラム分析に基づいて検出した周期を１周期とする、
ことを特徴とする請求項１乃至３のいずれか一項に記載のデータ生成方法。
前記時系列データは、従業員の勤務状況を記録する勤務データである、
ことを特徴とする請求項１乃至４のいずれか一項に記載のデータ生成方法。
前記生成する処理は、前記勤務データにおいて、１週間を１周期とするカレンダーの曜日位置について、直近の週で対応する曜日同士を前記中心に対する半径方向に近接して配置する前記図形を生成する、
ことを特徴とする請求項５に記載のデータ生成方法。
前記図形の中の特徴部を用いて、畳み込みニューラルネットワークにおける、畳み込み層、プーリング層、結合層の少なくともいずれかのレイヤーの重みを変更し、周期的な時間単位の中で発生したイベントから療養する人を予測するための学習済みモデルを生成する処理をさらにコンピュータが実行する
ことを特徴とする請求項５または６に記載のデータ生成方法。
複数の単位時間から成る周期を有する時系列データを受け付け、
前記時系列データに基づいて生成される図形を含む画像データを生成する処理をコンピュータに実行させるデータ生成プログラムであって、
前記図形は、前記時系列データに含まれる前記単位時間を時系列順で螺旋状に並べるとともに、前記周期間で対応する前記単位時間が前記螺旋状の中心から放射状に揃うように配置することにより生成される
ことを特徴とするデータ生成プログラム。
複数の単位時間から成る周期を有する、学習対象の時系列データに基づき、前記時系列データに含まれる前記単位時間を時系列順で螺旋状に並べるとともに、前記周期間で対応する前記単位時間が前記螺旋状の中心から放射状に揃うように配置する図形データと、
前記図形データに付与された正解情報とを含み、
前記図形データと前記正解情報とを学習データとして、畳み込みニューラルネットワークの入力層に入力されることにより、演算結果を示す出力値を前記畳み込みニューラルネットワークの出力層から出力させ、前記正解情報と前記出力値との比較に基づく学習を行う、
処理をコンピュータに実行させることを特徴とするデータ構造。