JP2016152039A - データ出力方法、データ出力プログラムおよびデータ出力装置 - Google Patents

データ出力方法、データ出力プログラムおよびデータ出力装置 Download PDF

Info

Publication number
JP2016152039A
JP2016152039A JP2015031096A JP2015031096A JP2016152039A JP 2016152039 A JP2016152039 A JP 2016152039A JP 2015031096 A JP2015031096 A JP 2015031096A JP 2015031096 A JP2015031096 A JP 2015031096A JP 2016152039 A JP2016152039 A JP 2016152039A
Authority
JP
Japan
Prior art keywords
series data
data
correlation
time
time series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015031096A
Other languages
English (en)
Other versions
JP6550783B2 (ja
Inventor
孝 河東
Takashi Kato
孝 河東
太田 唯子
Yuiko Ota
唯子 太田
稲越 宏弥
Hiroya Inakoshi
宏弥 稲越
湯上 伸弘
Nobuhiro Yugami
伸弘 湯上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015031096A priority Critical patent/JP6550783B2/ja
Publication of JP2016152039A publication Critical patent/JP2016152039A/ja
Application granted granted Critical
Publication of JP6550783B2 publication Critical patent/JP6550783B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】学習に有効なデータを特定する。
【解決手段】データ出力方法は、特定の監視対象の状態を示す値の時系列データと、特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データの其々との相関値を算出する。データ出力方法は、算出した相関値間の相関に基づき、複数の監視対象の状態を示す時系列データを複数のクラスタに分類する。データ出力方法は、複数のクラスタのそれぞれから何れかの時系列データを抽出する。データ出力方法は、複数のクラスタのそれぞれから抽出した各時系列データの種別を示す情報を出力する。
【選択図】図18

Description

本発明は、データ出力方法、データ出力プログラムおよびデータ出力装置に関する。
機械学習では、学習データを用いて予測モデルを生成し、生成した予測モデルにより予測を行う。このため、機械学習は、学習データによって、性能が変化する。そこで、学習に有効なデータを選択する技術がある。例えば、入力された複数種類の特徴量の時系列データと、目的変数の時系列データとの相関をそれぞれ分析し、目的変数に対する影響度の高い特徴量を特定する。
特開2012−27880号公報
しかしながら、従来の技術では、学習に有効なデータを特定できない場合がある。予測の対象とする事象には、時間帯によって発生原理が変化するものがある。一方、従来の技術では、発生原理によらずデータ全体で目的変数との相関がある特徴量が特定される。このため、従来の技術では、特定の時間帯において目的変数との相関が高い特徴量が選択されず、学習に有効なデータを特定できない場合がある。
一つの側面では、学習に有効なデータを特定できるデータ出力方法、データ出力プログラムおよびデータ出力装置を提供することを目的とする。
第1の案では、データ出力方法は、特定の監視対象の状態を示す値の時系列データと、特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データの其々との相関値を算出する。データ出力方法は、算出した相関値間の相関に基づき、複数の監視対象の状態を示す時系列データを複数のクラスタに分類する。データ出力方法は、複数のクラスタのそれぞれから何れかの時系列データを抽出する。データ出力方法は、複数のクラスタのそれぞれから抽出した各時系列データの種別を示す情報を出力する。
本発明の一の実施態様によれば、学習に有効なデータを特定できるという効果を奏する。
図1は、実施例1に係るデータ出力装置の機能的な構成の一例を示す図である。 図2は、目的変数データのデータ構成の一例を示す図である。 図3は、特徴量データのデータ構成の一例を示す図である。 図4は、相関値の算出の一例を説明する図である。 図5Aは、ウィンドウの一例を説明する図である。 図5Bは、ウィンドウの一例を説明する図である。 図5Cは、ウィンドウの一例を説明する図である。 図6は、スコアの求め方の一例を示す図である。 図7は、クラスタごとの特徴量を説明する図である。 図8は、発生原理が変化する事象の一例を示す図である。 図9は、ある道路の交通量の変化と、時間帯、事故数、降水量の変化を示す図である。 図10は、時間帯ごとに予測モデルを生成する一例を説明する図である。 図11は、予測する事象に合わせて細かく予測モデルを生成する一例を示す図である。 図12は、目的変数のデータと特徴量のデータの一例を示す図である。 図13は、目的変数のデータと、複数の特徴量のデータの分割の一例を示す図である。 図14は、相関の算出の一例を示す図である。 図15は、複数の特徴量のデータを分類する一例を示す図である。 図16は、クラスタごとのスコアの一例を示す図である。 図17は、クラスタごとの特徴量の抽出の一例を示す図である。 図18は、実施例1に係るデータ出力処理の手順の一例を示すフローチャートである。 図19は、実施例2に係るデータ出力装置の機能的な構成の一例を示す図である。 図20は、目的変数に対する各特徴量の相関値の一例を示す図である。 図21は、スコアが最も高い特徴量を抽出した一例を示す図である。 図22は、類似する特徴量を抽出の対象から除外した一例を示す図である。 図23は、残った特徴量からスコアが最も高い特徴量を抽出した一例を示す図である。 図24は、類似する特徴量を抽出の対象から除外した一例を示す図である。 図25は、残った特徴量からスコアが最も高い特徴量を抽出した一例を示す図である。 図26は、実施例2に係るデータ出力処理の手順の一例を示すフローチャートである。 図27は、データ出力プログラムを実行するコンピュータを示す図である。
以下に、本発明に係るデータ出力方法、データ出力プログラムおよびデータ出力装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。そして、各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
[装置構成]
本実施例に係るデータ出力装置10について説明する。データ出力装置10は、機械学習の予測モデルの生成に利用可能な各種のデータから、学習に有効なデータを特定して出力する装置である。データ出力装置10は、例えば、パーソナルコンピュータやサーバコンピュータなどのコンピュータなどである。データ出力装置10は、学習に有効なデータを用いて学習を行って予測モデルを生成し、生成した予測モデルにより予測を行う。
図1は、実施例1に係るデータ出力装置の機能的な構成の一例を示す図である。図1に示すように、データ出力装置10は、通信I/F(インタフェース)部20と、入力部21と、表示部22と、記憶部23と、制御部24とを有する。なお、データ出力装置10は、上記の機器以外の他の機器を有してもよい。
通信I/F部20は、他の装置との間で通信制御を行うインタフェースである。通信I/F部20としては、LANカードなどのネットワークインタフェースカードを採用できる。
通信I/F部20は、不図示のネットワークを介して他の装置と各種情報を送受信する。例えば、通信I/F部20は、機械学習において予測モデルの生成に用いる各種のデータを受信する。例えば、通信I/F部20は、機械学習で予測の対象とする特定の監視対象の状態を示す値の時系列データを受信する。この予測の対象とする特定の監視対象の状態を示す値の時系列データは、機械学習で予測モデルを生成する際の目的変数のデータとなる。また、通信I/F部20は、特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データを受信する。この特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データは、機械学習で予測モデルを生成する際の学習データの候補となる。
入力部21は、各種の情報を入力する入力デバイスである。入力部21としては、マウスやキーボードなどの操作の入力を受け付ける入力デバイスが挙げられる。入力部21は、各種の情報の入力を受け付ける。例えば、入力部21は、機械学習に関する各種の操作入力を受け付ける。入力部21は、ユーザからの操作入力を受け付け、受け付けた操作内容を示す操作情報を制御部24に入力する。
表示部22は、各種情報を表示する表示デバイスである。表示部22としては、LCD(Liquid Crystal Display)やCRT(Cathode Ray Tube)などの表示デバイスが挙げられる。表示部22は、各種情報を表示する。例えば、表示部22は、各種の操作画面や予測結果を示した画面など各種の画面を表示する。
記憶部23は、各種のデータを記憶する記憶デバイスである。例えば、記憶部23は、ハードディスク、SSD(Solid State Drive)、光ディスクなどの記憶装置である。なお、記憶部23は、RAM(Random Access Memory)、フラッシュメモリ、NVSRAM(Non Volatile Static Random Access Memory)などのデータを書き換え可能な半導体メモリであってもよい。
記憶部23は、制御部24で実行されるOS(Operating System)や各種プログラムを記憶する。例えば、記憶部23は、後述する各種の処理を実行するプログラムを含む各種のプログラムを記憶する。さらに、記憶部23は、制御部24で実行されるプログラムで用いられる各種データを記憶する。例えば、記憶部23は、目的変数データ30と、特徴量データ31とを記憶する。
目的変数データ30は、機械学習の目的変数のデータを記憶したデータである。目的変数データ30には、機械学習で予測の対象とする特定の監視対象の状態を示す値の時系列データが、目的変数のデータとして記憶されている。
図2は、目的変数データのデータ構成の一例を示す図である。目的変数データ30には、計測された時間ごとに、特定の監視対象の状態を示す値が目的変数のデータとして記憶されている。図2の例では、時間t1に対応して目的変数x1、時間t2に対応して目的変数x2、・・・、時間tに対応して目的変数xが記憶されている。
図1に戻り、特徴量データ31は、機械学習で予測モデルを生成する際の学習データの候補となる複数の特徴量のデータを記憶したデータである。特徴量データ31には、機械学習で予測の対象とする特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データが、複数の特徴量のデータとして記憶されている。
図3は、特徴量データのデータ構成の一例を示す図である。特徴量データ31には、計測された時間ごとに、複数の特徴量の状態を示す値が、特徴量のデータとして記憶されている。図3の例では、種別として、特徴量の種別を示すfa〜fzが格納されている。また、図3の例では、特徴量fa〜fzについて、時間t1に対応して特徴量fa1、fb1〜fz1、時間t2に対応して特徴量fa2、fb2〜fz2、・・・、時間tに対応して特徴量fa、fb〜fzが記憶されている。
図1に戻り、制御部24は、データ出力装置10を制御するデバイスである。制御部24としては、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等の電子回路や、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等の集積回路を採用できる。制御部24は、各種の処理手順を規定したプログラムや制御データを格納するための内部メモリを有し、これらによって種々の処理を実行する。制御部24は、各種のプログラムが動作することにより各種の処理部として機能する。例えば、制御部24は、受付部40と、算出部41と、分類部42と、抽出部43と、出力部44と、予測部45とを有する。
受付部40は、各種の受け付けを行う。例えば、受付部40は、各種の操作指示を受け付ける。例えば、受付部40は、機械学習に関する操作画面を表示部22に表示させて、入力部21から、処理開始などの操作指示を受け付ける。
算出部41は、各種の算出を行う。例えば、算出部41は、特定の監視対象の状態を示す値の時系列データと、特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データの其々との相関値を算出する。例えば、算出部41は、特定の監視対象の状態を示す値の時系列データと、複数の監視対象の状態を示す値の時系列データのそれぞれとを複数の期間に分割する。例えば、算出部41は、目的変数データ30に記憶された目的変数のデータと、特徴量データ31に記憶された複数の特徴量のデータとを所定の時間帯ごとのウィンドウに分割する。そして、算出部41は、期間ごとに、特定の監視対象の状態を示す値の時系列データと、複数の監視対象の状態を示す値の時系列データのそれぞれとの相関値を算出する。例えば、算出部41は、ウィンドウごとに、目的変数と、複数の特徴量との相関値を算出する。この相関値は、目的変数と特徴量との相関度合い示す値であれば、何れの方式で算出してもよい。例えば、算出部41は、相関値として、積率相関係数を算出する。
図4は、相関値の算出の一例を説明する図である。図4の例では、ウィンドウを曜日ごととしている。算出部41は、目的変数データ30に記憶された目的変数x1〜xと、特徴量データ31に記憶された特徴量fa1〜fa、・・・、fz1〜fzを曜日ごとのウィンドウに分割する。そして、算出部41は、ウィンドウごとに、対応する時間の目的変数xと、複数の特徴量fa〜fzそれぞれとの相関値を算出する。図4の例では、曜日ごとに、特徴量fa〜fzについての目的変数xとの相関値が示されている。
なお、図4の例では、所定の時間帯を曜日として、曜日ごとのウィンドウに分割する場合を例示した。しかし、これに限定されるものではない。例えば、ウィンドウの期間は、ユーザが指定してもよい。例えば、予測の対象とする事象の発生原理が変化するタイミングが判明している場合、ユーザが発生原理が変化するタイミングをウィンドウの期間として指定してもよい。例えば、予測の対象とする事象の発生原理が時間帯や曜日、月によって変化するものとする。この場合、ユーザがウィンドウの期間として、発生原理が変化するタイミングに応じた時間帯や曜日、月を指定する。算出部41は、指定された時間帯や曜日、月ごとに目的変数のデータおよび特徴量のデータを分割してもよい。図5Aは、ウィンドウの一例を説明する図である。図5Aの例は、ユーザが曜日ごとにウィンドウの期間を指定しており、算出部41は、目的変数xと、特徴量fa〜fzを曜日ごとのウィンドウに分割する。
また、例えば、ウィンドウの期間は、データの変化点を基準に定めてもよい。例えば、予測の対象とする事象の発生原理によって、目的変数xや特徴量fa〜fzのデータには変化点が発生する場合がある。この場合、算出部41は、データの変化点ごとに目的変数のデータおよび特徴量のデータを分割してもよい。図5Bは、ウィンドウの一例を説明する図である。図5Bの例は、目的変数xや特徴量fa〜fzのデータの変化点が発生しており、算出部41は、目的変数xと、特徴量fa〜fzのデータを変化点ごとのウィンドウに分割する。変化点は、発生原理の変化に対応するものであれば、例えば、閾値を通過する点、極大点、極小点など何れであってもよい。図5Bは、閾値を通過する点を変化点としている。このようにデータの変化点を基準にウィンドウの期間を定めることにより、算出部41は、発生原理の変化に対応してデータを分割できる。
また、例えば、ウィンドウの期間は、互いに重複させてもよい。例えば、算出部41は、一定期間をウィンドウ期間として、一定期間よりも短い期間ずつずらしながらウィンドウ期間ごとにデータを分割してもよい。図5Cは、ウィンドウの一例を説明する図である。図5Cの例は、算出部41は、ウィンドウの期間を重複させながら、目的変数xと、特徴量fa〜fzのデータをウィンドウに分割する。このようにウィンドウの期間を互いに重複させることにより、算出部41は、発生原理の変化が明確ではない場合でも、特徴量のデータを分割でき、後述する分類部42により、類似する特徴量を同じ分類に分類できる。
図1に戻り、分類部42は、各種の分類を行う。例えば、分類部42は、相関値間の相関に基づき、複数の監視対象の状態を示す時系列データを複数のクラスタに分類する。例えば、分類部42は、期間ごとに算出した相関値の複数の期間における分布に基づき、複数の監視対象の状態を示す値の時系列データを複数のクラスタに分類する。例えば、分類部42は、ウィンドウ毎の相関の変化が類似する特徴量を同じ分類に分類して、特徴量を複数のクラスタに分類する。例えば、分類部42は、特徴量ごとに、他の特徴量と各期間で相関値の誤差を求める。例えば、分類部42は、各期間で相関値の誤差として、各期間の相関値のユークリッド距離を求める。期間1〜mの特徴量faの相関値をta1〜taとし、特徴量fbの相関値をtb1〜tbとした場合、ユークリッド距離は、以下の式(1)に示すように期間ごとの相関値ta、tbの差を二乗して合計し、合計値の平方根を求めることで算出される。
ユークリッド距離=((ta1−tb12+・・・+(ta−tb21/2 (1)
分類部42は、ユークリッド距離が近い特徴量を同じ分類に分類する。例えば、分類部42は、何れかの特徴量を基準として、ユークリッド距離が閾値以下の特徴量を同じ分類に分類することを繰り返して、特徴量をクラスタに分類する。図4の例では、特徴量faと特徴量fbがクラスタAに分類され、特徴量fcと特徴量fdがクラスタBに分類されている。
抽出部43は、各種の抽出を行う。例えば、抽出部43は、複数のクラスタのそれぞれから何れかの時系列データを抽出する。例えば、抽出部43は、クラスタごとに、当該クラスタに分類された時系列データに対して算出された期間ごとの相関値を所定の重み付けで重み付け演算してスコアを求める。例えば、抽出部43は、各特徴量のウィンドウごとの相関値をそれぞれ所定の重み付けで重み付けする。そして、抽出部43は、クラスタごとに、重み付けされた相関値からスコアを求める。例えば、抽出部43は、クラスタごとに、重み付けされた特徴量の各相関値の平均値、最大値または最小値をスコアとして求める。そして、抽出部43は、クラスタごとに、スコアが最大の特徴量を抽出する。図4の例では、クラスタAから特徴量faが抽出され、クラスタBから特徴量fdが抽出される。
ここで、スコアの求め方について説明する。図6は、スコアの求め方の一例を示す図である。図6では、説明を簡易化するため、1つのクラスタに、3つの特徴量fa、fb、fcが分類され、3つのウィンドウW1、W2、W3について相関値が算出されている場合を例に説明する。図6(A)には、特徴量fa、fb、fcについてのウィンドウW1、W2、W3での相関値が示されている。図6(B)には、パターンA〜Cの3つのパターンで相関値を重み付けした結果が示されている。パターンAは、相関値に均等に重み付けした場合が示されている。例えば、パターンAでは、相関値に均等に「1」を重み付けする。この場合、重み付けした相関値は、図6(A)と同じとなる。パターンBは、相関値が大きいほど大きい重み付けをした場合が示されている。例えば、パターンBでは、相関値を二乗した値を重み付け後の相関値とする。パターンCは、相関値が所定の閾値以上の場合、相関値をそのまま重み付け後の相関値とし、相関値が所定の閾値未満の場合、ゼロとした場合が示されている。図6(B)に示したパターンCでは、閾値を0.5としている。この場合、重み付けした相関値は、相関値が0.5以上の場合、図6(A)と同じとなり、相関値が0.5未満の場合、ゼロとなる。なお、重み付けのパターンは、これに限定されるものではない。
抽出部43は、クラスタごとに、重み付けされた相関値からスコアを求める。図6(B)には、スコアとして、パターンA〜Cのそれぞれで各相関値の平均値、最大値または最小値を求めた結果が示されている。抽出部43は、クラスタごとに、スコアに基づき、特徴量を抽出する。例えば、抽出部43は、クラスタごとに、スコアが最大の特徴量を抽出する。例えば、スコアの平均値が最大の特徴量を抽出する場合、パターンAでは特徴量fcが抽出され、パターンBでは特徴量fbが抽出され、パターンCでは特徴量fbが抽出される。スコアの最大値が最大の特徴量を抽出する場合、パターンAでは特徴量fbが抽出され、パターンBでは特徴量fbが抽出され、パターンCでは特徴量fbが抽出される。スコアの最小値が最大の特徴量を抽出する場合、パターンAでは特徴量fcが抽出され、パターンBでは特徴量fcが抽出され、パターンCでは特徴量fcが抽出される。
スコアの平均値が最大となる特徴量を抽出する場合、重み付けされた相関値が全てのウィンドウで平均的に高い特徴量が抽出される。スコアの最大値が最大となる特徴量を抽出する場合、重み付けされた相関値が何れかのウィンドウで最も高い特徴量が抽出される。すなわち、特定のウィンドウにおいて目的変数に対して影響の大きい特徴量が抽出される。スコアの最小値が最大となる特徴量を抽出する場合、重み付けされた相関値が低いウィンドウがない特徴量が抽出される。すなわち、目的変数に対して影響の小さいウィンドウがない特徴量が抽出される。
図7は、クラスタごとの特徴量を説明する図である。図7の例では、説明を簡易化するため、2つのウィンドウW1、W2の相関を用いてクラスタに分類する場合を説明する。図7の例では、縦軸にウィンドウW2の目的変数と特徴量との相関が示され、横軸にウィンドウW1の目的変数と特徴量との相関が示されている。図7の例では、それぞれの特徴量が、ウィンドウW1での相関と、ウィンドウW2での相関に応じてプロットされている。特徴量は、ユークリッド距離が近いものごとにクラスタに分類されている。ユークリッド距離は、特徴量の点間の距離となる。図7の例では、特徴量が4つのクラスタC1〜C4に分類されている。クラスタC1は、ウィンドウW2で相関が高く、ウィンドウW1で相関が低い特徴量の分類である。クラスタC2は、ウィンドウW1とウィンドウW2で共に相関が高い特徴量の分類である。クラスタC3は、ウィンドウW1とウィンドウW2で共に相関が低い特徴量の分類である。クラスタC4は、ウィンドウW1で相関が高く、ウィンドウW2で相関が低い特徴量の分類である。
抽出部43は、クラスタごとに、スコアに基づき、特徴量を抽出する。例えば、抽出部43は、クラスタC1から特徴量f1を抽出し、クラスタC2から特徴量f2を抽出し、クラスタC3から特徴量f3を抽出し、クラスタC4から特徴量f4を抽出する。
出力部44は、各種の出力を行う。例えば、出力部44は、複数のクラスタのそれぞれから抽出した各時系列データの種別を示す情報を出力する。例えば、出力部44は、抽出部43によりクラスタごとに抽出された特徴量の種別を示す情報を出力する。例えば、図7の場合、出力部44は、抽出された特徴量の種別を示す情報として、特徴量f1、f2、f3、f4を出力する。クラスタC1〜C4には、それぞれ目的変数との相関が近い特徴量が分類される。機械学習では、目的変数との相関が似ている特徴量を多く用いても、同じようなパターンのみが学習されるため、予測精度が向上し難く、目的変数との相関に多様性のあるデータで学習することが好ましい。そこで、クラスタごとに、特徴量を抽出して出力することで、目的変数との相関に多様性のあるデータを抽出でき、学習に有効なデータを特定できるため、機械学習の予測精度を向上させることができる。
予測部45は、機械学習により各種の予測を行う。例えば、予測部45は、出力部44により出力された種別の時系列データを学習データとして用いて予測モデルを生成する。そして、予測部45は、生成した予測モデルにより予測を行う。
ここで、機械学習が予測の対象とする事象には、時間帯によって発生原理が変化するものがある。図8は、発生原理が変化する事象の一例を示す図である。図8は、ある道路の平日と休日の交通量の変化と、降水量の変化が示されている。平日の道路は、通勤の車両の通行が多い。通勤の車両は、降水に関わらず道路を走行する。このため、平日の交通量は、図8の符号60に示すように降水量が多い期間でも降水量の影響を受け難い。一方、休日の道路は、観光(行楽)の車両の通行が多い。観光は、天気が良い方が好ましい。このため、観光の車両は、天気が良いと多く、降水量が多いほど減少する。このため、休日の交通量は、図8の符号61に示すように降水量が多い期間で交通量が減少する。このように、道路の交通量は、平日と休日で交通量の発生原理が変化する。
例えば、従来の技術により、発生原理によらずデータ全体で目的変数との相関がある特徴量を特定する場合を想定する。この場合、特定の時間帯において目的変数との相関が高い特徴量が選択されなくなる。図9は、ある道路の交通量の変化と、時間帯、事故数、降水量の変化を示す図である。図9の例では、交通量と時間帯および事故数は、データ全体的に相関がある。このため、データ全体的での相関が中レベルとなっている。一方、交通量と降水量は、平日か休日かによって影響が変化し、データ全体的として相関が低い。このため、データ全体的での相関が低レベルなっている。この場合、従来の技術では、時間帯および事故数が目的変数との相関がある特徴量として特定される。すなわち、従来の技術では、データの発生原理によらず一定の相関がある特徴量のみが選択されるため、降水量のように特定の事象で有効な特徴量が見落とされる。
一方、本実施例に係るデータ出力装置10は、相関の変化が類似する特徴量ごとにクラスタに分類し、クラスタごとに、特徴量を抽出することで、降水量のように特定の事象で有効な特徴量も抽出できる。このように、データ出力装置10は、学習に有効なデータを特定できるため、機械学習の予測精度を向上させることができる。
また、例えば、機械学習が予測の対象とする事象が時間帯によって発生原理が変化する場合、時間帯ごとに当該時間帯の特徴量のデータを用いて学習を行い、時間帯ごとに予測モデルを生成する場合を想定する。図10は、時間帯ごとに予測モデルを生成する一例を説明する図である。図10は、ある道路の平日と休日の交通量の変化が示されている。図10の例では、平日の特徴量のデータを用いて平日用の特徴を学習して平日の予測モデルを生成する。また、図10の例では、休日の特徴量のデータを用いて休日用の特徴を学習して休日の予測モデルを生成する。この場合、予測する事象に対応させるには、予測する事象に合わせて細かく予測モデルを生成する。図11は、予測する事象に合わせて細かく予測モデルを生成する一例を示す図である。図11の例では、平日の昼間の時間帯の特徴量のデータを用いて学習を行い、平日の昼間の交通量の予測モデルを生成する。予測する事象に合わせて細かく予測モデルを生成する場合、予測モデルに使用できる特徴量のデータが少なくなる。図11には、平日の昼間の交通量の予測モデルに使用できる特徴量のデータの範囲が示されている。このように予測モデルに使用できる特徴量のデータが少なくなると、予測モデルの予測精度が低下する。
一方、本実施例に係るデータ出力装置10は、機械学習が予測の対象とする事象が時間帯によって発生原理が変化する場合でも1つの予測モデルで予測できる。また、データ出力装置10は、学習に有効な種別の時系列データを全て学習データとして用いて予測モデルを生成する。この結果、データ出力装置10は、予測モデルに使用できる特徴量のデータを確保できるため、データ不足による予測モデルの予測精度の低下が発生し難くなる。
次に具体例を用いて説明する。以下では、交通量の予測モデルを生成する場合を例に説明する。図12は、目的変数のデータと特徴量のデータの一例を示す図である。図12には、目的変数のデータとして、計測された時間ごとに、交通量のデータが示されている。また、図12には、特徴量のデータとして、計測された時間ごとに、降水量、気温、通信量、電力量のデータが示されている。降水量は、交通量を計測したエリアに降った降水量である。気温は、交通量を計測したエリアの気温である。通信量は、交通量を計測したエリアを含む地域のネットワークで通信が行われた通信量である。電力量は、交通量を計測したエリアを含む地域で使用された電力量である。また、特徴量のデータには、計測されたデータから生成された2次的データも含まれている。図12には、特徴量のデータとして、2単位時間前の気温、通信量の移動平均値が示されている。2単位時間前の気温は、2つ前に計測された気温である。通信量の移動平均値は、所定時間前までの通信量の平均値である。
算出部41は、目的変数のデータと、複数の特徴量のデータとを所定の時間帯ごとのウィンドウに分割する。図13は、目的変数のデータと、複数の特徴量のデータの分割の一例を示す図である。図13の例では、ウィンドウを曜日ごととしている。算出部41は、目的変数のデータと、複数の特徴量のデータを曜日ごとのウィンドウW1〜W3に分割する。
算出部41は、ウィンドウごとに、目的変数のデータと、複数の特徴量のデータそれぞれとの相関値を算出する。例えば、算出部41は、相関値として、積率相関係数を算出する。図14は、相関の算出の一例を示す図である。
ここで、積率相関係数の算出の一例を説明する。データX=(x1,・・・,xn)に対して、Xの平均、分散、標準偏差は、以下の式(2)〜(4)のように表せる。
Xの平均:μ(X)=(x1+・・・+x)/n (2)
Xの分散:σ2(X)={(x1−μ(X))2+・・・
+(x−μ(X))2}/n (3)
Xの標準偏差:σ(X)=(σ2(X))1/2 (4)
また、データX=(x1,・・・,xn)とデータY=(y1,・・・,yn)対して、X、Yの共分散は、以下の式(5)のように表せる。
X、Yの共分散:S(X,Y)={(x1−μ(x))×(y1−μ(y))+・・・
+(x−μ(x))×(y−μ(y))}/n (5)
X、Yの積率相関係数は、R(X,Y)=S(X,Y)/(σ(X)σ(Y))とする。
例えば、ウィンドウW1の目的変数X=(5,6,9,4)と降水量Y=(4,2,5,1)とした場合、X、Yの平均、分散、標準偏差は、以下のように算出される。
μ(X)=(5+6+9+4)/4=24/4=6
μ(Y)=(4+2+5+1)/4=2/4=3
σ2(X)=((5−6)2+(6−6)2+(9−6)2+(4−6)2)/4
=(1+0+9+4)/4=14/4=3.5
σ2(Y)=((4-3)2+(2-3)2+(5-3)2+(1-3)2)/4
=(1+1+4+4)/4=10/4=2.5
σ(X)=(3.5)1/2≒1.87
σ(Y)=(2.5)1/2≒ 1.58
よって、X、Yの共分散S(X,Y)、積率相関係数R(X,Y)は、以下のように算出される。
S(X,Y)=((5−6)×(4−3)+(6−6)×(2−3)+
(9−6)×(5−3)+(4−6)×(1−3))/4
=(−1+0+6+4)/4=9/4=2.25
R(X,Y)≒ 2.25/(1.87×1.58)≒2.25/2.95≒0.76
相関値を積率相関係数の絶対値とした場合、相関値は、以下のように算出される。
相関値:|R(X,Y)|≒|0.76|=0.76
分類部42は、ウィンドウごとに算出した相関の変化が類似する特徴量を同じ分類に分類して、特徴量を複数のクラスタに分類する。例えば、分類部42は、特徴量ごとに、他の特徴量と各期間で相関値の誤差を求める。そして、分類部42は、誤差が近い特徴量を同じ分類に分類する。図15は、複数の特徴量のデータを分類する一例を示す図である。図15の例では、気温および電力量がクラスタ1に分類され、降水量がクラスタ2に分類され、通信量、2単位時間前の気温および通信量の移動平均値がクラスタ3に分類されている。
抽出部43は、クラスタごとに、当該クラスタに分類された時系列データに対して算出された期間ごとの相関値を所定の重み付けで重み付け演算してスコアを求める。図16は、クラスタごとのスコアの一例を示す図である。図16の例では、相関値が0.7以上の重みを1とし、相関値が0.7未満の重みを0としてウィンドウW1〜W3の相関値を重み付け平均した値をスコアとしている。
抽出部43は、クラスタごとに、スコアに基づき、特徴量を抽出する。図17は、クラスタごとの特徴量の抽出の一例を示す図である。図17の例では、クラスタごとに、スコアが最大となる特徴量を抽出しており、クラスタ1から電力量が抽出され、クラスタ2から降水量が抽出され、クラスタ3から通信量の移動平均値が抽出される。
このように、データ出力装置10は、目的変数との相関に多様性のあるデータを抽出でき、学習に有効なデータを特定できるため、機械学習の予測精度を向上させることができる。
[処理の流れ]
実施例1に係るデータ出力装置10が多様性のあるデータを出力するデータ出力処理の流れについて説明する。図18は、実施例1に係るデータ出力処理の手順の一例を示すフローチャートである。このデータ出力処理は、所定のタイミング、例えば、入力部21から処理開始の操作指示を受け付けたタイミングで実行される。
図18に示すように、算出部41は、目的変数データ30に記憶された目的変数のデータと、特徴量データ31に記憶された複数の特徴量のデータとをウィンドウに分割する(S10)。算出部41は、ウィンドウごとに、目的変数の値と、複数の特徴量との相関値を算出する(S11)。
分類部42は、ウィンドウごとに算出した相関の変化が類似する特徴量を同じ分類に分類して、特徴量を複数のクラスタに分類する(S12)。抽出部43は、各特徴量のウィンドウごとの相関値をそれぞれ所定の重み付けで重み付けし、クラスタごとに、重み付けされた相関値からスコアを求める(S13)。抽出部43は、クラスタごとに、スコアに基づき、特徴量を抽出する(S14)。出力部44は、複数のクラスタのそれぞれから抽出した特徴量の種別を示す情報を出力し(S15)、処理を終了する。
[効果]
上述してきたように、本実施例に係るデータ出力装置10は、特定の監視対象の状態を示す値の時系列データと、特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データの其々との相関値を算出する。データ出力装置10は、算出した相関値間の相関に基づき、複数の監視対象の状態を示す時系列データを複数のクラスタに分類する。データ出力装置10は、複数のクラスタのそれぞれから何れかの時系列データを抽出する。データ出力装置10は、複数のクラスタのそれぞれから抽出した各時系列データの種別を示す情報を出力する。これにより、データ出力装置10は、学習に有効なデータを特定できる。
また、本実施例に係るデータ出力装置10は、特定の監視対象の状態を示す値の時系列データと、複数の監視対象の状態を示す値の時系列データのそれぞれとを複数の期間に分割する。データ出力装置10は、期間ごとに、特定の監視対象の状態を示す値の時系列データと、複数の監視対象の状態を示す値の時系列データのそれぞれとの相関値を算出する。データ出力装置10は、期間ごとに算出した相関値の複数の期間における分布に基づき、複数の監視対象の状態を示す値の時系列データを複数のクラスタに分類する。これにより、データ出力装置10は、期間ごとのデータが類似する時系列データを同じクラスタに分類できる。
また、本実施例に係るデータ出力装置10は、クラスタごとに、当該クラスタに分類された時系列データに対して算出された期間ごとの相関値を所定の重み付けで重み付け演算したスコアに基づき、当該クラスタに分類された時系列データから代表の時系列データを抽出する。これにより、データ出力装置10は、各クラスタから同様の特性を有する代表の時系列データを抽出できる。
次に、実施例2について説明する。図19は、実施例2に係るデータ出力装置の機能的な構成の一例を示す図である。なお、図1に示した実施例1に係るデータ出力装置10と同様の部分については、同様の符号を付して、主に異なる部分について説明する。
実施例2に係るデータ出力装置10は、特徴量をクラスタに分類することなく、学習に有効なデータを出力する。
抽出部43Aは、算出部41により算出した相関値間の相関の非類似性に基づき、時系列データを抽出する。例えば、抽出部43Aは、相関値間の相関に基づき、複数の監視対象の状態を示す値の時系列データから、何れかの時系列データを抽出し、抽出した時系列データと相関値が類似する時系列データを抽出の対象から除くことを繰り返して時系列データを抽出する。例えば、抽出部43Aは、何れかの特徴量を抽出し、抽出した特徴量と相関値が類似する特徴量を抽出の対象から除くことを繰り返して、目的変数との相関に多様性のあるデータを抽出する。
出力部44は、抽出部43Aにより抽出した時系列データの種別を示す情報を出力する。例えば、出力部44は、抽出部43Aにより抽出された特徴量の種別を示す情報を出力する。
具体例を用いて説明する。図20は、目的変数に対する各特徴量の相関値の一例を示す図である。図20には、降水量、気温、通信量、電力量、2単位時間前の気温、通信量の移動平均値のウィンドウW1〜W3ごとの相関値が示されている。抽出部43Aは、特徴量ごとに、ウィンドウごとの相関値を所定の重み付けで重み付け演算してスコアを求める。図20の例では、相関値が0.7以上の重みを1とし、相関値が0.7未満の重みを0としてウィンドウW1〜W3の相関値を重み付け平均した値をスコアとしている。
抽出部43Aは、何れかの特徴量を抽出する。例えば、抽出部43Aは、スコアが最も高い特徴量を抽出する。図21は、スコアが最も高い特徴量を抽出した一例を示す図である。図21の例では、降水量が抽出されている。
抽出部43Aは、抽出した特徴量と相関値が類似する特徴量を抽出の対象から除く。図22は、類似する特徴量を抽出の対象から除外した一例を示す図である。図22の例では、降水量と各期間の相関値のユークリッド距離が0.5以下の特徴量を除外している。
抽出部43Aは、残った特徴量からスコアが最も高い特徴量を抽出する。図23は、残った特徴量からスコアが最も高い特徴量を抽出した一例を示す図である。図23の例では、気温が抽出されている。
抽出部43Aは、抽出した特徴量と相関値が類似する特徴量を抽出の対象から除く。図24は、類似する特徴量を抽出の対象から除外した一例を示す図である。図24の例では、気温と各期間の相関値のユークリッド距離が0.5以下の特徴量が無いため、何れも除外されない。
抽出部43Aは、残った特徴量からスコアが最も高い特徴量を抽出する。図25は、残った特徴量からスコアが最も高い特徴量を抽出した一例を示す図である。図25の例では、残った2単位時間前の気温が抽出されている。
出力部44は、抽出部43Aにより抽出された降水量、気温、2単位時間前の気温を出力する。
[処理の流れ]
実施例2に係るデータ出力装置10が多様性のあるデータを出力するデータ出力処理の流れについて説明する。図26は、実施例2に係るデータ出力処理の手順の一例を示すフローチャートである。なお、図18に示した実施例1に係るデータ出力処理と同一の部分については、同一の符号を付してその説明を省略する。
図26に示すように、抽出部43Aは、何れかの特徴量を抽出する(S20)。例えば、抽出部43Aは、スコアが最も高い特徴量を抽出する。抽出部43Aは、抽出した特徴量と相関値が類似する特徴量を抽出の対象から除外する(S21)。抽出部43Aは、抽出の対象となる特徴量が存在するか判定する(S22)。抽出の対象となる特徴量が存在する場合(S22肯定)、上述のS20へ移行し、抽出の対象となる特徴量から何れかの特徴量を抽出する。
一方、抽出の対象となる特徴量が存在しない場合(S22否定)、出力部44は、抽出部43Aにより抽出された特徴量の種別を示す情報を出力し(S23)、処理を終了する。
[効果]
上述してきたように、本実施例に係るデータ出力装置10は、特定の監視対象の状態を示す値の時系列データと、特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データの其々との相関値を算出する。データ出力装置10は、相関値間の相関の非類似性に基づき、時系列データを抽出する。データ出力装置10は、抽出した時系列データの種別を示す情報を出力する。これにより、データ出力装置10は、学習に有効なデータを特定できる。
また、本実施例に係るデータ出力装置10は、算出した相関値間の相関に基づき、前記複数の監視対象の状態を示す値の時系列データから、何れかの時系列データを抽出し、抽出した時系列データと相関値が類似する時系列データを抽出の対象から除くことを繰り返して時系列データを抽出する。これにより、データ出力装置10は、特定の監視対象の状態との相関に多様性のある時系列データを抽出できる。
さて、これまで開示の装置に関する実施例について説明したが、開示の技術は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的状態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、受付部40、算出部41、分類部42、抽出部43(抽出部43A)、出力部44および予測部45の各処理部が適宜統合されてもよい。また、各処理部の処理が適宜複数の処理部の処理に分離されてもよい。さらに、各処理部にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
[データ出力プログラム]
また、上記の実施例で説明した各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することもできる。そこで、以下では、上記の実施例と同様の機能を有するプログラムを実行するコンピュータシステムの一例を説明する。図27は、データ出力プログラムを実行するコンピュータを示す図である。
図27に示すように、コンピュータ300は、CPU(Central Processing Unit)310、HDD(Hard Disk Drive)320、RAM(Random Access Memory)340を有する。これら300〜340の各部は、バス400を介して接続される。
HDD320には上記の受付部40、算出部41、分類部42、抽出部43(抽出部43A)、出力部44および予測部45と同様の機能を発揮するデータ出力プログラム320aが予め記憶される。なお、データ出力プログラム320aについては、適宜分離しても良い。
また、HDD320は、各種情報を記憶する。例えば、HDD320は、OSや分析に用いる各種データを記憶する。
そして、CPU310が、データ出力プログラム320aをHDD320から読み出して実行することで、実施例の各処理部と同様の動作を実行する。すなわち、データ出力プログラム320aは、受付部40、算出部41、分類部42、抽出部43(抽出部43A)、出力部44および予測部45と同様の動作を実行する。
なお、上記したデータ出力プログラム320aは、必ずしも最初からHDD320に記憶させることを要しない。
例えば、コンピュータ300に挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」にプログラムを記憶させておく。そして、コンピュータ300がこれらからプログラムを読み出して実行するようにしてもよい。
さらには、公衆回線、インターネット、LAN、WANなどを介してコンピュータ300に接続される「他のコンピュータ(またはサーバ)」などにプログラムを記憶させておく。そして、コンピュータ300がこれらからプログラムを読み出して実行するようにしてもよい。
10 データ出力装置
23 記憶部
24 制御部
30 目的変数データ
31 特徴量データ
40 受付部
41 算出部
42 分類部
43、43A 抽出部
44 出力部
45 予測部

Claims (9)

  1. 特定の監視対象の状態を示す値の時系列データと、前記特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データの其々との相関値を算出し、
    算出した相関値間の相関に基づき、前記複数の監視対象の状態を示す時系列データを複数のクラスタに分類し、
    前記複数のクラスタのそれぞれから何れかの時系列データを抽出し、
    前記複数のクラスタのそれぞれから抽出した各時系列データの種別を示す情報を出力する、
    ことを特徴とするデータ出力方法。
  2. 前記特定の監視対象の状態を示す値の時系列データと、前記複数の監視対象の状態を示す値の時系列データのそれぞれとを複数の期間に分割し、
    前記期間ごとに、前記特定の監視対象の状態を示す値の時系列データと、前記複数の監視対象の状態を示す値の時系列データのそれぞれとの相関値を算出し、
    前記期間ごとに算出した前記相関値の前記複数の期間における分布に基づき、前記複数の監視対象の状態を示す値の時系列データを前記複数のクラスタに分類する、
    ことを特徴とする請求項1に記載のデータ出力方法。
  3. 前記クラスタごとに、当該クラスタに分類された時系列データに対して算出された前記期間ごとの前記相関値を所定の重み付けで重み付け演算したスコアに基づき、当該クラスタに分類された時系列データから代表の時系列データを抽出する
    ことを特徴とする請求項2に記載のデータ出力方法。
  4. 特定の監視対象の状態を示す値の時系列データと、前記特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データの其々との相関値を算出し、
    算出した相関値間の相関に基づき、前記複数の監視対象の状態を示す時系列データを複数のクラスタに分類し、
    前記複数のクラスタのそれぞれから何れかの時系列データを抽出し、
    前記複数のクラスタのそれぞれから抽出した各時系列データの種別を示す情報を出力する、
    処理をコンピュータに実行させることを特徴とするデータ出力プログラム。
  5. 特定の監視対象の状態を示す値の時系列データと、前記特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データの其々との相関値を算出する算出部と、
    前記算出部により算出した相関値間の相関に基づき、前記複数の監視対象の状態を示す時系列データを複数のクラスタに分類する分類部と、
    前記分類部により分類した前記複数のクラスタのそれぞれから何れかの時系列データを抽出する抽出部と、
    前記抽出部により前記複数のクラスタのそれぞれから抽出した各時系列データの種別を示す情報を出力する出力部と、
    を有することを特徴とするデータ出力装置。
  6. 特定の監視対象の状態を示す値の時系列データと、前記特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データの其々との相関値を算出し、
    算出した相関値間の相関の非類似性に基づき、時系列データを抽出し、
    抽出した時系列データの種別を示す情報を出力する、
    ことを特徴とするデータ出力方法。
  7. 前記抽出する処理は、算出した相関値間の相関に基づき、前記複数の監視対象の状態を示す値の時系列データから、何れかの時系列データを抽出し、抽出した時系列データと相関値が類似する時系列データを抽出の対象から除くことを繰り返して時系列データを抽出する
    ことを特徴とする請求項6に記載のデータ出力方法。
  8. 特定の監視対象の状態を示す値の時系列データと、前記特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データの其々との相関値を算出し、
    算出した相関値間の相関の非類似性に基づき、時系列データを抽出し、
    抽出した時系列データの種別を示す情報を出力する、
    処理をコンピュータに実行させることを特徴とするデータ出力プログラム。
  9. 特定の監視対象の状態を示す値の時系列データと、前記特定の監視対象とは異なる複数の監視対象の状態を示す値の時系列データの其々との相関値を算出する算出部と、
    前記算出部により算出した相関値間の相関の非類似性に基づき、時系列データを抽出する抽出部と、
    前記抽出部により抽出した時系列データの種別を示す情報を出力する出力部と、
    を有することを特徴とするデータ出力装置。
JP2015031096A 2015-02-19 2015-02-19 データ出力方法、データ出力プログラムおよびデータ出力装置 Active JP6550783B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015031096A JP6550783B2 (ja) 2015-02-19 2015-02-19 データ出力方法、データ出力プログラムおよびデータ出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015031096A JP6550783B2 (ja) 2015-02-19 2015-02-19 データ出力方法、データ出力プログラムおよびデータ出力装置

Publications (2)

Publication Number Publication Date
JP2016152039A true JP2016152039A (ja) 2016-08-22
JP6550783B2 JP6550783B2 (ja) 2019-07-31

Family

ID=56695489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015031096A Active JP6550783B2 (ja) 2015-02-19 2015-02-19 データ出力方法、データ出力プログラムおよびデータ出力装置

Country Status (1)

Country Link
JP (1) JP6550783B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018032151A (ja) * 2016-08-23 2018-03-01 株式会社日立製作所 要因分析支援装置および要因分析支援方法
JP2018054765A (ja) * 2016-09-27 2018-04-05 日本電気株式会社 データ処理装置、データ処理方法、およびプログラム
JP2019159786A (ja) * 2018-03-13 2019-09-19 日本電気株式会社 情報処理装置、情報処理方法、プログラム
JP2019197323A (ja) * 2018-05-08 2019-11-14 国立研究開発法人情報通信研究機構 予測システムおよび予測方法
JP6727478B1 (ja) * 2019-03-28 2020-07-22 三菱電機株式会社 学習装置、学習方法及びプログラム
WO2020230436A1 (ja) * 2019-05-13 2020-11-19 株式会社日立製作所 診断装置と診断方法および加工装置
WO2022118689A1 (ja) * 2020-12-01 2022-06-09 ソニーグループ株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP7458268B2 (ja) 2020-08-21 2024-03-29 株式会社東芝 情報処理装置、情報処理方法、コンピュータプログラム及び情報処理システム
JP7511379B2 (ja) 2020-04-28 2024-07-05 株式会社マネーフォワード 情報処理装置及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001344590A (ja) * 2000-05-31 2001-12-14 Fuji Electric Co Ltd ニューラルネットワーク及びその学習方法、解析方法並びに異常判定方法
JP2004086897A (ja) * 2002-08-06 2004-03-18 Fuji Electric Holdings Co Ltd モデル構築方法およびモデル構築システム
JP2012027880A (ja) * 2010-07-28 2012-02-09 Hitachi Ltd 情報分析方法、計算機システム及び情報分析プログラム
JP2013206321A (ja) * 2012-03-29 2013-10-07 Fujitsu Ltd 管理装置、資源管理方法、資源管理プログラム及び情報処理システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001344590A (ja) * 2000-05-31 2001-12-14 Fuji Electric Co Ltd ニューラルネットワーク及びその学習方法、解析方法並びに異常判定方法
JP2004086897A (ja) * 2002-08-06 2004-03-18 Fuji Electric Holdings Co Ltd モデル構築方法およびモデル構築システム
JP2012027880A (ja) * 2010-07-28 2012-02-09 Hitachi Ltd 情報分析方法、計算機システム及び情報分析プログラム
JP2013206321A (ja) * 2012-03-29 2013-10-07 Fujitsu Ltd 管理装置、資源管理方法、資源管理プログラム及び情報処理システム

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018032151A (ja) * 2016-08-23 2018-03-01 株式会社日立製作所 要因分析支援装置および要因分析支援方法
JP2018054765A (ja) * 2016-09-27 2018-04-05 日本電気株式会社 データ処理装置、データ処理方法、およびプログラム
JP2019159786A (ja) * 2018-03-13 2019-09-19 日本電気株式会社 情報処理装置、情報処理方法、プログラム
JP7127305B2 (ja) 2018-03-13 2022-08-30 日本電気株式会社 情報処理装置、情報処理方法、プログラム
JP2019197323A (ja) * 2018-05-08 2019-11-14 国立研究開発法人情報通信研究機構 予測システムおよび予測方法
JP7199075B2 (ja) 2018-05-08 2023-01-05 国立研究開発法人情報通信研究機構 予測システムおよび予測方法
US11367020B2 (en) 2019-03-28 2022-06-21 Mitsubishi Electric Corporation Signal selection device, learning device, and signal selection method and program
WO2020194716A1 (ja) * 2019-03-28 2020-10-01 三菱電機株式会社 信号選択装置、学習装置、信号選択方法及びプログラム
JP6727478B1 (ja) * 2019-03-28 2020-07-22 三菱電機株式会社 学習装置、学習方法及びプログラム
JP2020187502A (ja) * 2019-05-13 2020-11-19 株式会社日立製作所 診断装置と診断方法および加工装置
WO2020230436A1 (ja) * 2019-05-13 2020-11-19 株式会社日立製作所 診断装置と診断方法および加工装置
JP7108577B2 (ja) 2019-05-13 2022-07-28 株式会社日立製作所 診断装置と診断方法および加工装置
JP7511379B2 (ja) 2020-04-28 2024-07-05 株式会社マネーフォワード 情報処理装置及びプログラム
JP7458268B2 (ja) 2020-08-21 2024-03-29 株式会社東芝 情報処理装置、情報処理方法、コンピュータプログラム及び情報処理システム
WO2022118689A1 (ja) * 2020-12-01 2022-06-09 ソニーグループ株式会社 情報処理装置、情報処理方法および情報処理プログラム

Also Published As

Publication number Publication date
JP6550783B2 (ja) 2019-07-31

Similar Documents

Publication Publication Date Title
JP6550783B2 (ja) データ出力方法、データ出力プログラムおよびデータ出力装置
TWI818999B (zh) 針對新場景的預測模型訓練方法及裝置
US10216558B1 (en) Predicting drive failures
EP2854053B1 (en) Defect prediction method and device
CN110443657B (zh) 客户流量数据处理方法、装置、电子设备及可读介质
US20210192586A1 (en) Systems and Methods for Detecting and Responding to Anomalous Traffic Conditions
US9276821B2 (en) Graphical representation of classification of workloads
US10073908B2 (en) Functional space-time trajectory clustering
US20150081599A1 (en) Method, Apparatus and Computer Program Product for Determining Failure Regions of an Electrical Device
KR101563406B1 (ko) 하둡 기반의 대용량 불균형 데이터 분류분석 시스템 및 방법
US20190391836A1 (en) Operation management apparatus, migration destination recommendation method, and storage medium
JP5421949B2 (ja) 交通量予測装置、交通量予測方法およびプログラム
US20210020036A1 (en) Predicting short-term traffic flow congestion on urban motorway networks
US10417083B2 (en) Label rectification and classification/prediction for multivariate time series data
Lin et al. Short-term forecasting of traffic volume: evaluating models based on multiple data sets and data diagnosis measures
US10769866B2 (en) Generating estimates of failure risk for a vehicular component
CN105095756A (zh) 可移植文档格式文档的检测方法和装置
WO2017200889A1 (en) Classifying entities in digital maps using discrete non-trace positioning data
KR101703972B1 (ko) 공간정보를 이용한 지하수 부존 지역 예측시스템 및 지하수 부존 지역 예측방법
JP2020194489A (ja) 異常検出方法、異常検出装置、及び異常検出システム
US9177215B2 (en) Sparse representation for dynamic sensor networks
Hidayat et al. Performance Analysis and mitigation of virtual machine server by using naive bayes classification
AU2021251463B2 (en) Generating performance predictions with uncertainty intervals
EP3745317A1 (en) Apparatus and method for analyzing time series data based on machine learning
Zhao et al. Cloud performance variability prediction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190617

R150 Certificate of patent or registration of utility model

Ref document number: 6550783

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150