JP2020149281A - データ予測装置、データ予測方法、及びデータ予測プログラム - Google Patents

データ予測装置、データ予測方法、及びデータ予測プログラム Download PDF

Info

Publication number
JP2020149281A
JP2020149281A JP2019045555A JP2019045555A JP2020149281A JP 2020149281 A JP2020149281 A JP 2020149281A JP 2019045555 A JP2019045555 A JP 2019045555A JP 2019045555 A JP2019045555 A JP 2019045555A JP 2020149281 A JP2020149281 A JP 2020149281A
Authority
JP
Japan
Prior art keywords
data
regression coefficient
calculation method
unit
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019045555A
Other languages
English (en)
Inventor
高嶋 洋一
Yoichi Takashima
洋一 高嶋
昌宏 湯口
Masahiro Yuguchi
昌宏 湯口
山田 智広
Tomohiro Yamada
智広 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2019045555A priority Critical patent/JP2020149281A/ja
Priority to PCT/JP2020/010303 priority patent/WO2020184560A1/ja
Publication of JP2020149281A publication Critical patent/JP2020149281A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】回帰係数を求める際に使用するデータの数を低減し、データを収集及び伝送する回線容量を低減し、学習過程における計算処理量を低減する、ことを目的とする。【解決手段】本開示のデータ予測装置は、L1正則化により回帰係数を求める第1算出法を用いて複数のデータに基づいて回帰係数を算出し、絶対値が閾値以上の回帰係数に対応するデータを選択するための選択情報をデータ収集部に送信する第1回帰係数算出部と、第1算出法及び第2算出法のいずれの算出法を用いるかを判定する判定部と、判定された算出法を用いて回帰係数を算出する第2回帰係数算出部と、判定された算出法が第1算出法である場合複数のデータを使用し、判定された算出法が第2算出法である場合選択データを使用し、使用したデータ及び第2回帰係数算出部で算出された回帰係数に基づいて予測した予測結果を出力する予測部と、を含む。【選択図】図4

Description

本開示は、データ予測装置、データ予測方法、及びデータ予測プログラムに関する。
各所に設置した大量のセンサから取得されるデータから、その中の特定のデータの近い将来の値を予測する問題では、(1)式に例示するように、図1に示す線形回帰による予測が行われることがある。下記(1)式は、図1に例示する1〜4の4つのセンサの時刻t−3から時刻tまでの単位時間毎のデータのうち時刻t−2から時刻tまでの12個のデータからセンサ1の時刻t+1におけるデータD1,t+1を予測する。
β+β1,t−2+β2,t−2+β3,t−2+β4,t−2
β1,t−1+β2,t−1+β3,t−1+β4,t−1
β1,t+β102,t+β113,t+β124,t=D1,t+1 …(1)
βk(k=0,…,12)は回帰係数であり、Dl,t−mは、図1に円で例示するデータであり、lはセンサの番号、t−mは時刻を表し、mは自然数を表す。
詳細には、以下の学習過程及び予測過程によりデータの予測が行われる。まず、予測するデータに関係しそうな各センサの過去のデータを収集して線形回帰式を作成し、予測しようとする現象(予測対象の特異な動き)が生じているサンプル区間のデータを線形回帰式の選択変数に代入して、回帰係数βkを連立方程式により求める(学習過程)。次に、求められた回帰係数βkにより、センサのデータから連続的に予測値を算出する(予測過程)。
非常に多量のセンサからの過去の長い期間のデータを用いる場合には、サンプル区間のデータが不足し、連立方程式の解が求まらなくなる場合がある。例えば、河川の水位の予想を行う場合、センサからのデータの代わり、あるいは、センサからのデータに追加して、例えば、気象庁で作成されるメッシュ状の雨量の予報値を用いることができる。しかしながら、この場合はさらに回帰係数の数が増えることになり、サンプル区間のデータが不足する場合がある。
サンプル区間のデータが不足した場合、L1正則化という方法(非特許文献1)を用いて、(2)式に例示するように、近似解の回帰係数を求めることができる。このL1正則化には、予測に貢献しにくい回帰係数をゼロに近づける性質がある。

は目的変数であり、xijは説明変数であり、tは調整パラメータである。
L1正則化を用いて構成される、関連技術のデータ予測装置10を図2に示す。データ収集部11は多数のセンサの各々からデータを収集し、予測部12及び学習区間選択部13に同じデータを送信する。学習区間選択部13では、予測しようとする事象が現れていそうなデータ区間内のデータをルールベースで選択し、選択したデータを学習するべきデータとして回帰係数算出部14に送信する。回帰係数算出部14では、L1正則化を用いて回帰係数を求め、当該回帰係数を予測部12に送信する。予測部12は、回帰係数算出部14から受信した回帰係数と、データ収集部11から受信したデータと、を線形回帰式に代入して連続的に予測値を算出する。
Robert Tibshirani, "Regression Shrinkage and Selection via the Lasso", Journal of the Royal Statistical Society, Series B (Methodological), 1996, Vol. 58, No. 1, pp.267-288
L1正則化により、多くの説明変数を使用する場合にも回帰係数を求めることはできるようになるが、予測に影響を及ぼすセンサの範囲、及びデータ計測時間の範囲は事前に既知でないため、広めに範囲を設定することになる。そのため、入力として使用するデータの数が非常に多くなり、データを収集及び伝送する回線容量を圧迫し、また、学習過程における計算処理量も膨大になる、という問題が発生する。
本開示では、回帰係数を求める際に使用するデータの数を低減し、データを収集及び伝送する回線容量を低減し、学習過程における計算処理量を低減する、ことを目的とする。
本開示の第1態様のデータ予測装置は、収集した複数のデータ、及び受信した選択情報に基づいて前記複数のデータから選択した選択データを送信するデータ収集部と、L1正則化により回帰係数を求める第1算出法を用いて、前記データ収集部から受信した前記複数のデータに基づいて回帰係数を算出し、算出した回帰係数のうち絶対値が閾値以上の回帰係数に対応するデータを選択するための選択情報を前記データ収集部に送信する第1回帰係数算出部と、回帰係数を算出する際に、前記第1算出法、及び前記第1算出法と異なる第2算出法のいずれの算出法を用いるかを判定する判定部と、前記判定部で判定された算出法を用いて回帰係数を算出する第2回帰係数算出部と、前記判定部で判定された算出法が前記第1算出法である場合、前記データ収集部から受信した前記複数のデータを使用し、前記判定部で判定された算出法が前記第2算出法である場合、前記データ収集部から受信した前記選択データを使用し、使用したデータ及び前記第2回帰係数算出部で算出された回帰係数に基づいて予測した予測結果を出力する予測部と、を含む。
本開示の第2態様は、第1態様のデータ予測装置であって、前記予測結果と実測値との誤差であって所定値以上の誤差の発生回数を監視する誤差監視部をさらに含み、前記判定部は、前記第2算出法を用いると判定した状態で、前記誤差監視部で監視された前記誤差の発生回数が所定回数以上になった場合は、前記第1算出法を用いると判定する。
本開示の第3態様は、第1態様のデータ予測装置であって、予め設定された事象が発生したか否かを判定する事象判定部をさらに含み、前記判定部は、前記第2算出法を用いると判定した状態で、前記事象判定部で前記事象が発生したことが判定された場合、前記第1算出法を用いると判定する。
本開示の第4態様は、第1態様〜第3態様のいずれかのデータ予測装置であって、前記予測結果と実測値との誤差であって所定値以上の誤差の発生回数を監視する誤差監視部をさらに含み、前記判定部は、前記誤差監視部で監視された前記誤差の発生回数が所定回数以上になった場合は、前記第1回帰係数算出部に対して、前記第1算出法による回帰係数の再算出の指示、及び前記データ収集部に対する選択情報の再送信の指示を行い、前記第1回帰係数算出部は、前記判定部からの指示に応じて回帰係数の再算出及び選択情報の再送信を行い、前記データ収集部は、前記判定部からの指示に応じて再送信された選択情報に応じて、前記第1回帰係数算出部に対する選択データの再送信を行う。
本開示の第5態様はプログラムであって、収集した複数のデータ、及び受信した選択情報に基づいて前記複数のデータから選択した選択データを送信し、L1正則化により回帰係数を求める第1算出法を用いて、受信した前記複数のデータに基づいて回帰係数を算出し、算出した回帰係数のうち絶対値が閾値以上の回帰係数に対応するデータを選択するための選択情報を送信し、回帰係数を算出する際に、前記第1算出法、及び前記第1算出法と異なる第2算出法のいずれの算出法を用いるかを判定し、判定された算出法を用いて回帰係数を算出し、判定された算出法が前記第1算出法である場合、受信した前記複数のデータを使用し、判定された算出法が前記第2算出法である場合、受信した前記選択データを使用し、使用したデータ及び算出された回帰係数に基づいて予測した予測結果を出力する、データ予測処理をコンピュータに実行させる。
本開示の第6態様は、データ予測方法であって、コンピュータが、収集した複数のデータ、及び受信した選択情報に基づいて前記複数のデータから選択した選択データを送信し、L1正則化により回帰係数を求める第1算出法を用いて、受信した前記複数のデータに基づいて回帰係数を算出し、算出した回帰係数のうち絶対値が閾値以上の回帰係数に対応するデータを選択するための選択情報を送信し、回帰係数を算出する際に、前記第1算出法、及び前記第1算出法と異なる第2算出法のいずれの算出法を用いるかを判定し、判定された算出法を用いて回帰係数を算出し、判定された算出法が前記第1算出法である場合、受信した前記複数のデータを使用し、判定された算出法が前記第2算出法である場合、受信した前記選択データを使用し、使用したデータ及び算出された回帰係数に基づいて予測した予測結果を出力する。
本開示では、データの数を低減し、データを収集及び伝送する回線容量を低減し、学習過程における計算処理量を低減する、ことができる。
線形回帰式によるデータの予測を説明する模式図である。 関連技術のデータ予測装置を例示するブロック図である。 本実施形態のデータ予測装置の基本例を例示するブロック図である。 本実施形態のデータ予測装置の拡張例を例示するブロック図である。 本実施形態のデータ予測装置の拡張例のハードウェア構成図を例示するブロック図である。 本実施形態の拡張例の学習フェーズの処理の流れを例示する模式図である。 本実施形態の拡張例の予測フェーズの処理の流れを例示する模式図である。 本実施形態の拡張例の再算出及び再選択フェーズの処理の流れを例示する模式図である。 本実施形態のデータ予測装置を例示するブロック図である。
本実施形態のデータ予測装置20を図3に例示する。データ収集部21は多数のセンサS,S,S,…の各々からデータを収集し、予測部22及び学習区間選択部23に同じデータを送信する。データ収集部21が、予測部22及び学習区間選択部23に送信するデータとしては、多数のセンサS,S,S,…から収集した複数のデータ、及び後述する第1回帰係数算出部25から受信した選択情報に基づいて収集した複数のデータから選択した選択データがある。
学習区間選択部23では、予測しようとする事象が現れていることが予測されるデータ区間をルールベースで選択し、学習するべきデータを第1回帰係数算出部25及び第2回帰係数算出部24に送信する。すなわち、学習区間選択部23は、予測しようとする事象が現れていないことが予測される区間に存在する不要なデータ及び変化の乏しいデータを取り除く。
第1回帰係数算出部25は、L1正則化により近似解の回帰係数を求める第1算出法を用いて、データ収集部21から送信され、かつ学習区間選択部23で選択された複数のデータに基づいて回帰係数を算出し、算出した回帰係数のうち絶対値が閾値以上の回帰係数を選択し、選択した回帰係数を示す情報を、データ収集部21及び第2回帰係数算出部24の各々に送信する。
データ収集部21では、第1回帰係数算出部25から受信した情報に基づいて、収集した複数のデータから絶対値が閾値以上の回帰係数に対応するデータを選択し、選択したデータを選択データとして予測部22、学習区間選択部23、及び誤差監視部26の各々に送信する。第1回帰係数算出部25からデータ収集部21に送信される情報は、データ収集部21においてデータを選択するために使用されるので、以下では選択情報という。
なお、データ収集部21では、絶対値が閾値以上の回帰係数に対応するデータが選択データとして選択され、絶対値が閾値未満の回帰係数に対応するデータが削除される。このため、データ収集部21に送信する選択情報としては、絶対値が閾値以上の回帰係数を示す情報に代えて、絶対値が閾値未満の回帰係数を示す情報を用い、データ収集部21において、絶対値が閾値未満の回帰係数に対応するデータを削除することにより、選択データを得るようにしてもよい。
第2回帰係数算出部24は、データ収集部21から送信され、かつ学習区間選択部23を通過した選択データを使用して、L1正則化ではなく、L2正則化または重回帰を用いて回帰係数を求める。
第2回帰係数算出部24で算出された回帰係数は、L2正則化または重回帰を用いた回帰計算による予測が行われる予測部22に送信される。データ収集部21では、選択データを予測部22及び学習区間選択部23に送信する。即ち、データ収集部21は、全てのセンサS,S,S,…の各々からデータを収集するが、データの送信は、選択的に行う。
予測部22では、データ収集部21から受信した選択データと、第2回帰係数算出部24から受信した回帰係数とを用いて、線形回帰式で予測した予測結果を出力する。
すなわち、予測結果は、絶対値が閾値未満の回帰係数に対応するデータが削除され、絶対値が閾値以上の回帰係数と絶対値が閾値以上の回帰係数に対応するデータとから算出されるため、学習過程で使用するデータ量が低減され、計算処理量を低減することができる。
誤差監視部26では、予測部22による予測結果と、データ収集部21で収集されたデータである実測値との差である誤差を監視し、所定値以上の誤差が所定回数(許容回数)以上発生した場合に、データ収集部21と第1回帰係数算出部25に、再選択指示を送信する。データ収集部21は、この再選択指示により、選択データの再選択が終わるまでの一定期間、選択データではなく、全てのデータを後段に送信するようになり、第1回帰係数算出部25では、再度、全てのデータを対象にしたL1正則化によるデータの選択が行われる。この際、L2正則化または重回帰による予測結果の誤差が、L1正則化による予測結果の誤差よりも大きい場合にのみ、選択データの再選択を行い、L2正則化または重回帰による予測結果の誤差が、L1正則化による予測結果の誤差以下である場合には、再選択を行わない。
なお、誤差監視部26では、予測部22による予測結果と、実測値の差である誤差を監視し、所定値以上の誤差が所定回数(許容回数)以上発生した場合に、第2回帰係数算出部24で、回帰係数の再算出を行うようにしてもよい。回帰係数の再算出後、所定値以上の誤差が所定回数(許容回数)以上発生した場合に、データ収集部21と第1回帰係数算出部25に、再選択指示を送信するようにしてもよい。
本実施形態のデータ予測装置20の拡張例であるデータ予測装置60を図4に例示する。データ予測装置20と同様の構成及び作用については、説明を適宜省略する。図4のデータ予測装置60は、データの傾向などに応じて、回帰係数の算出の際に使用する回帰係数算出法を選択する判定部67を有する点で、図3のデータ予測装置20と異なる。
データ収集部61は多数のセンサS,S,S,…からデータを収集し、予測部62及び学習区間選択部63に同じデータを送信する。学習区間選択部63では、予測しようとする事象が現れていそうなデータ区間をルールベースで選択し、学習するべきデータを回帰係数算出部64に送信する。
データ予測装置20では、第2回帰係数算出部24で回帰係数を算出する際に、例えば、L2正則化または重回帰を使用しているが、データ予測装置60では、第2回帰係数算出部64で回帰係数を算出する際に、判定部67の判定結果に応じて、使用する回帰係数算出法を選択する。使用する回帰係数算出法は、例えば、以下の2つから選択される。
1)選択データを使用する重回帰またはL2正則化(第2算出法)
2)全てのデータを使用するL1正則化(第1算出法)
誤差監視部66において、所定値以上の予測誤差(誤差)が所定回数(許容回数)以上発生したことが検出されるまでは、判定部67は、1)の回帰係数算出法を選択することを判定し、第2回帰係数算出部64は、選択データを使用して、1)の回帰係数算出法で回帰係数を算出する。誤差監視部66において、所定値以上の予測誤差が所定回数(許容回数)以上発生したことが検出された場合、判定部67は、回帰係数算出法を1)から2)に切り替えることを判定する。
第2回帰係数算出部64は、判定部67の判定に基づいて、2)の回帰係数算出法で全てのデータを使用して回帰係数を算出する。これにより、データに応じて、より誤差の少ない回帰係数算出法を選択することができる。
なお、学習区間選択部63において、事前に設定された事象(例えば、降雨など)が発生したか否かをルールベースで判定する事象判定部をさらに含み、事象判定部が学習するべきデータが更新されたことを判定した場合にも、判定部67は、2)の回帰係数算出法を選択することを判定してもよい。これにより、学習するべきデータが更新された場合においても、より誤差の少ない回帰係数算出法を選択することができる。
図5に、データ予測装置60のハードウェア構成を例示する。データ予測装置60は、一例として、図5に示すように、CPU(Central Processing Unit)51、一次記憶部52、二次記憶部53、及び、外部インタフェース54を含む。CPU51は、ハードウェアであるプロセッサの一例である。CPU51、一次記憶部52、二次記憶部53、及び、外部インタフェース54は、バス59を介して相互に接続されている。
一次記憶部52は、例えば、RAM(Random Access Memory)などの揮発性のメモリである。二次記憶部53は、例えば、HDD(Hard Disk Drive)、又はSSD(Solid State Drive)などの不揮発性のメモリである。
二次記憶部53は、プログラム格納領域53A及びデータ格納領域53Bを含む。プログラム格納領域53Aは、一例として、データ予測プログラムなどのプログラムを記憶している。データ格納領域53Bは、一例として、センサからのデータ及びデータ予測処理中の中間データなどを記憶する。
CPU51は、プログラム格納領域53Aからデータ予測プログラムを読み出して一次記憶部52に展開する。CPU51は、データ予測プログラムをロードして実行することで、図4のデータ収集部61、予測部62、学習区間選択部63、第2回帰係数算出部64、第1回帰係数算出部65、誤差監視部66、及び判定部67として動作する。
なお、データ予測プログラムなどのプログラムは、外部サーバに記憶され、ネットワークを介して、一次記憶部52に展開されてもよい。また、データ予測プログラムなどのプログラムは、Digital Versatile Disc(DVD)などの非一時的記録媒体に記憶され、記録媒体読込装置を介して、一次記憶部52に展開されてもよい。
外部インタフェース54には外部装置が接続され、外部インタフェース54は、外部装置とCPU51との間の各種情報の送受信を司る。図5では、外部インタフェース54に、センサ31A、及び危険報知システム31Bが接続されている例を示している。なお、センサ31Aは、多数のセンサを含む。
データ予測装置60で予測されたデータは、例えば、外部インタフェース54に接続される危険報知システム31Bに送信され、危険報知システム31Bにおける危険報知処理に使用されてもよい。また、データ予測装置10で予測されたデータは、例えば、外部インタフェース54に接続される外部記憶装置に記録されてもよいし、外部インタフェース54に接続されるディスプレイの画面に文字または画像として表示されてもよい。
また、データ予測装置60は、専用装置であってもよいし、ワークステーション、パーソナルコンピュータ、またはタブレットなどの汎用装置であってもよい。
図6〜図8に、データ予測装置60におけるデータ予測処理を例示する。図6は、学習フェーズの流れを例示する。
データ収集部61は、手順S201で、例えば、多数のセンサを含むセンサ31Aからデータを収集する。データ収集部61は、手順S202で、学習区間選択部63に、収集したデータを送信する。
学習区間選択部63は、手順S203で、予測に適切そうなデータ区間を選択して第2回帰係数算出部64と第1回帰係数算出部65に送信する。第1回帰係数算出部65は、L1正則化を用いて回帰係数を算出し、絶対値が閾値以上の回帰係数を選択して、第2回帰係数算出部64とデータ収集部61に送信する。
第2回帰係数算出部64は、手順S205で、第1回帰係数算出部65で選択されたデータを使用して、通常の回帰算出法、例えば、L2正則化または重回帰により、回帰係数を求めて予測部62に送信する。
図7は、予測フェーズの流れを例示する。データ収集部61は、手順S206で、手順S204で選択されたデータを予測部62及び誤差監視部66に送信する。予測部62は、手順S207で、手順S205で求めた回帰係数とデータとに基づいて、予測結果を算出し、誤差監視部66に送信すると共に、例えば、外部記憶装置に記憶する。
図8は、誤差監視及び再算出及び再選択フェーズの流れを例示する。誤差監視部66は、手順S208で、予測結果とデータ(実測値)との予測誤差を算出し、所定値以上の予測誤差が所定回数(許容回数)以上発生した場合、データ収集部61及び判定部67に、回帰係数算出法の切り替えを指示する。
回帰係数算出法の切り替えが指示されると、データ収集部61は、全てのデータを学習区間選択部63に送信し、判定部67は、第2回帰係数算出部64で、全てのデータを使用して、L1正則化により回帰係数を算出することを判定し、手順S209で、当該判定結果を第2回帰係数算出部64に送信する。第2回帰係数算出部64は、判定部67の判定を受信すると、回帰係数の算出法を切り替える。
誤差監視部66は、手順S210で、予測結果とデータ(実測値)との予測誤差を算出し、所定値以上の予測誤差が所定回数(許容回数)以上発生した場合、データ収集部61及び判定部67に、再選択を指示する。
再選択が指示されると、データ収集部61は、全てのデータを学習区間選択部63に送信し、判定部67は、再選択を行うことを判定し、手順S211で、当該判定結果を第1回帰係数算出部65に送信する。第1回帰係数算出部65は、判定部67の判定を受信すると、回帰係数の再選択を行う。
本実施形態によれば、L1正則化で算出した回帰係数だけを予測に用いる場合より、予測誤差が大きくなる傾向を示す場合があるが、予測誤差が大きい場合、あるいは、定期的に、データの再選択を行うことにより、予測誤差をある範囲に収めることが可能である。
なお、回帰係数算出法を、第1回帰係数算出部65で選択済みのデータを使用するL2正則化または重回帰から全てのデータを使用するL1正則化に切り替える例について説明したが、本実施形態はこれに限定されない。回帰係数算出法を、全てのデータを使用するL1正則化から、第1回帰係数算出部65で選択済みのデータを使用するL2正則化または重回帰に切り替えるようにしてもよい。
なお、データ予測装置60は、図9に例示するように、データ収集装置32A、学習装置32B及び予測装置32Cを含んでいてもよい。データ収集装置32Aは、データ収集部61を含み、学習装置32Bは、学習区間選択部63、第2回帰係数算出部64、第1回帰係数算出部65、誤差監視部66、及び判定部67を含み、予測装置32Cは予測部62を含む。
センサ31Aとデータ収集部61との間、及び、予測部62と、例えば、危険報知システム31Bなどの予測結果の出力先との間は、伝送回線で接続されている。また、図9に示される例では、データ収集部61と学習区間選択部63との間、第2回帰係数算出部64と予測部62との間も伝送回線で接続されている。
本開示のデータ予測装置は、収集した複数のデータ、及び受信した選択情報に基づいて前記複数のデータから選択した選択データを送信するデータ収集部と、L1正則化により回帰係数を求める第1算出法を用いて、前記データ収集部から受信した前記複数のデータに基づいて回帰係数を算出し、算出した回帰係数のうち絶対値が閾値以上の回帰係数に対応するデータを選択するための選択情報を前記データ収集部に送信する第1回帰係数算出部と、回帰係数を算出する際に、前記第1算出法、及び前記第1算出法と異なる第2算出法のいずれの算出法を用いるかを判定する判定部と、前記判定部で判定された算出法を用いて回帰係数を算出する第2回帰係数算出部と、前記判定部で判定された算出法が前記第1算出法である場合、前記データ収集部から受信した前記複数のデータを使用し、前記判定部で判定された算出法が前記第2算出法である場合、前記データ収集部から受信した前記選択データを使用し、使用したデータ及び前記第2回帰係数算出部で算出された回帰係数に基づいて予測した予測結果を出力する予測部と、を含む。
本開示では、これにより、データの数を低減し、データを収集及び伝送する回線容量を低減し、学習過程における計算処理量を低減する、ことができる。なお、データ収集部61から後段に送信するデータの数を低減する代わりに、データ収集部61がデータを受信するセンサの数を低減してもよい。
本開示では、第2回帰係数算出部65での算出に、通常の回帰係数算出法を使用する場合があるため、算出コストを低減することができ、算出リソースの少ない環境における処理を可能にする。
61 データ収集部
62 予測部
66 誤差監視部
64 第2回帰係数算出部
65 第1回帰係数算出部
31A センサ
51 CPU
52 一次記憶部
53 二次記憶部

Claims (6)

  1. 収集した複数のデータ、及び受信した選択情報に基づいて前記複数のデータから選択した選択データを送信するデータ収集部と、
    L1正則化により回帰係数を求める第1算出法を用いて、前記データ収集部から受信した前記複数のデータに基づいて回帰係数を算出し、算出した回帰係数のうち絶対値が閾値以上の回帰係数に対応するデータを選択するための選択情報を前記データ収集部に送信する第1回帰係数算出部と、
    回帰係数を算出する際に、前記第1算出法、及び前記第1算出法と異なる第2算出法のいずれの算出法を用いるかを判定する判定部と、
    前記判定部で判定された算出法を用いて回帰係数を算出する第2回帰係数算出部と、
    前記判定部で判定された算出法が前記第1算出法である場合、前記データ収集部から受信した前記複数のデータを使用し、前記判定部で判定された算出法が前記第2算出法である場合、前記データ収集部から受信した前記選択データを使用し、使用したデータ及び前記第2回帰係数算出部で算出された回帰係数に基づいて予測した予測結果を出力する予測部と、
    を含む、データ予測装置。
  2. 前記予測結果と実測値との誤差であって所定値以上の誤差の発生回数を監視する誤差監視部をさらに含み、
    前記判定部は、前記第2算出法を用いると判定した状態で、前記誤差監視部で監視された前記誤差の発生回数が所定回数以上になった場合は、前記第1算出法を用いると判定する、
    請求項1に記載のデータ予測装置。
  3. 予め設定された事象が発生したか否かを判定する事象判定部をさらに含み、
    前記判定部は、前記第2算出法を用いると判定した状態で、前記事象判定部で前記事象が発生したことが判定された場合、前記第1算出法を用いると判定する、
    請求項1に記載のデータ予測装置。
  4. 前記予測結果と実測値との誤差であって所定値以上の誤差の発生回数を監視する誤差監視部をさらに含み、
    前記判定部は、前記誤差監視部で監視された前記誤差の発生回数が所定回数以上になった場合は、前記第1回帰係数算出部に対して、前記第1算出法による回帰係数の再算出の指示、及び前記データ収集部に対する選択情報の再送信の指示を行い、
    前記第1回帰係数算出部は、前記判定部からの指示に応じて回帰係数の再算出及び選択情報の再送信を行い、
    前記データ収集部は、前記判定部からの指示に応じて再送信された選択情報に応じて、前記第1回帰係数算出部に対する選択データの再送信を行う、
    請求項1〜請求項3のいずれか1項に記載のデータ予測装置。
  5. 収集した複数のデータ、及び受信した選択情報に基づいて前記複数のデータから選択した選択データを送信し、
    L1正則化により回帰係数を求める第1算出法を用いて、受信した前記複数のデータに基づいて回帰係数を算出し、算出した回帰係数のうち絶対値が閾値以上の回帰係数に対応するデータを選択するための選択情報を送信し、
    回帰係数を算出する際に、前記第1算出法、及び前記第1算出法と異なる第2算出法のいずれの算出法を用いるかを判定し、
    判定された算出法を用いて回帰係数を算出し、
    判定された算出法が前記第1算出法である場合、受信した前記複数のデータを使用し、判定された算出法が前記第2算出法である場合、受信した前記選択データを使用し、使用したデータ及び算出された回帰係数に基づいて予測した予測結果を出力する、
    データ予測処理をコンピュータに実行させるためのプログラム。
  6. コンピュータが、
    収集した複数のデータ、及び受信した選択情報に基づいて前記複数のデータから選択した選択データを送信し、
    L1正則化により回帰係数を求める第1算出法を用いて、受信した前記複数のデータに基づいて回帰係数を算出し、算出した回帰係数のうち絶対値が閾値以上の回帰係数に対応するデータを選択するための選択情報を送信し、
    回帰係数を算出する際に、前記第1算出法、及び前記第1算出法と異なる第2算出法のいずれの算出法を用いるかを判定し、
    判定された算出法を用いて回帰係数を算出し、
    判定された算出法が前記第1算出法である場合、受信した前記複数のデータを使用し、判定された算出法が前記第2算出法である場合、受信した前記選択データを使用し、使用したデータ及び算出された回帰係数に基づいて予測した予測結果を出力する、
    データ予測方法。
JP2019045555A 2019-03-13 2019-03-13 データ予測装置、データ予測方法、及びデータ予測プログラム Pending JP2020149281A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019045555A JP2020149281A (ja) 2019-03-13 2019-03-13 データ予測装置、データ予測方法、及びデータ予測プログラム
PCT/JP2020/010303 WO2020184560A1 (ja) 2019-03-13 2020-03-10 データ予測装置、データ予測方法、及びデータ予測プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019045555A JP2020149281A (ja) 2019-03-13 2019-03-13 データ予測装置、データ予測方法、及びデータ予測プログラム

Publications (1)

Publication Number Publication Date
JP2020149281A true JP2020149281A (ja) 2020-09-17

Family

ID=72426576

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019045555A Pending JP2020149281A (ja) 2019-03-13 2019-03-13 データ予測装置、データ予測方法、及びデータ予測プログラム

Country Status (2)

Country Link
JP (1) JP2020149281A (ja)
WO (1) WO2020184560A1 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6610281B2 (ja) * 2016-01-20 2019-11-27 富士通株式会社 情報処理装置、制御方法及び制御プログラム
JP6759788B2 (ja) * 2016-07-13 2020-09-23 富士通株式会社 センサ制御装置、センサシステム、センサ制御方法、及びセンサ制御プログラム
JP6616791B2 (ja) * 2017-01-04 2019-12-04 株式会社東芝 情報処理装置、情報処理方法およびコンピュータプログラム
JP6740157B2 (ja) * 2017-03-13 2020-08-12 株式会社東芝 解析装置、解析方法、及び、プログラム
JP6847787B2 (ja) * 2017-08-04 2021-03-24 株式会社東芝 情報処理装置、情報処理方法及びコンピュータプログラム

Also Published As

Publication number Publication date
WO2020184560A1 (ja) 2020-09-17

Similar Documents

Publication Publication Date Title
JP7082461B2 (ja) 故障予知方法、故障予知装置および故障予知プログラム
JP6002250B2 (ja) 時系列データ処理装置及び方法並びに記憶媒体
JP6679086B2 (ja) 学習装置、予測装置、学習方法、予測方法、およびプログラム
CN109416408B (zh) 震中距估计装置、震中距估计方法以及计算机可读记录介质
US20120239627A1 (en) Data storage apparatus and data storage method
JP7393883B2 (ja) 予め選択されたシグネチャを使用して任意長の時系列を特徴付けるためのシステムおよび方法
JP6159594B2 (ja) 観測値処理装置、観測値処理方法及び観測値処理プログラム
JP6184344B2 (ja) 観測値処理装置
JPWO2015174067A1 (ja) 情報処理装置、異常検出方法、及び、記録媒体
WO2020184561A1 (ja) データ予測装置、データ予測方法、及びデータ予測プログラム
KR102158100B1 (ko) 이상 감지를 이용한 모니터링 자동화 방법 및 장치
WO2020184560A1 (ja) データ予測装置、データ予測方法、及びデータ予測プログラム
JP7367622B2 (ja) データ管理システム、データ管理方法、および、データ管理プログラム
JP6502062B2 (ja) 通信品質予測装置及び通信品質予測プログラム
US11614560B2 (en) Integration of physical sensors in a data assimilation framework
KR102417675B1 (ko) 재난위기수준표출장치 및 그 동작 방법
JP6365146B2 (ja) 時系列データの解析方法及び時系列データの異常監視装置
JP7149499B2 (ja) データ分析方法、データ分析装置及びデータ分析プログラム
JP6365144B2 (ja) 時系列データの解析方法及び時系列データの異常監視装置
CN113986700A (zh) 数据采集频率的优化方法、系统、装置及存储介质
JP2016224710A (ja) 解析システム、解析方法及び解析プログラム
JP2016211877A (ja) 下水流入量予測装置
JP2022032776A (ja) 画像処理装置及び画面処理プログラム
JP6750498B2 (ja) 制御装置、制御方法、制御プログラム及び制御システム
CN112000543A (zh) 一种存储系统的时延性能检测方法、装置及设备