JP2020181256A - 複数のセンサの時系列の計測値群における欠損値を補完するプログラム、装置及び方法 - Google Patents

複数のセンサの時系列の計測値群における欠損値を補完するプログラム、装置及び方法 Download PDF

Info

Publication number
JP2020181256A
JP2020181256A JP2019082109A JP2019082109A JP2020181256A JP 2020181256 A JP2020181256 A JP 2020181256A JP 2019082109 A JP2019082109 A JP 2019082109A JP 2019082109 A JP2019082109 A JP 2019082109A JP 2020181256 A JP2020181256 A JP 2020181256A
Authority
JP
Japan
Prior art keywords
sensor
measurement value
value group
series
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019082109A
Other languages
English (en)
Other versions
JP6994812B2 (ja
Inventor
亮一 小島
Ryoichi Kojima
亮一 小島
吉原 貴仁
Takahito Yoshihara
貴仁 吉原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2019082109A priority Critical patent/JP6994812B2/ja
Publication of JP2020181256A publication Critical patent/JP2020181256A/ja
Application granted granted Critical
Publication of JP6994812B2 publication Critical patent/JP6994812B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】複数のセンサにおける時系列の計測値群同士の関連性に基づいて、一部のセンサにおける欠損値を補完するプログラム、装置及び方法を提供する。【解決手段】エンコーダは、各センサiについて、所定期間Tdにおける周期tm毎の計測値群xiを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群xi,jを作成する計測値群生成手段と、各センサiについて、シフト計測値群xi,j毎に時系列直列に接続された各再帰型ニューラルネットワークが、各シフト計測値群xi,jと、時系列前段の再帰型ニューラルネットワークの隠れ層ベクトルhi,jとを入力し、時系列後段へ隠れ層ベクトルhi,j+1を出力する特徴抽出手段と、各センサiについて、末端の再帰型ニューラルネットワークxi,Jから出力された隠れ層ベクトルhiから、正規化された確率分布の潜在表現ziを生成する潜在表現生成エンジンとして機能させる。【選択図】図1

Description

本発明は、複数のセンサから出力された時系列の計測値群の中で、欠損値を補完する技術に関する。例えばスマートホームにおけるマルチモーダル(multi-modal)データに適する。
スマートホームとは、IoT(Internet of Things)やAI(Artificial Intelligence)の技術を用いて、住人にとってより安全・安心で快適な暮らしを実現するシステムをいう。このシステムは、住宅内に設置された複数のセンサからマルチモーダルデータを収集し、人が知覚可能な室内状態を分析する。
マルチモーダルデータには、時系列データと非時系列データとがある。時系列マルチモーダルデータとは、特徴に時間次元を持ち、周期的(例えば5分間隔)に取得された計測値群である。一方で、非時系列マルチモーダルデータは、特徴に時間次元を持たない。
時系列マルチモーダルデータとしては、例えば以下のようなものがある。
気温(触覚)、湿度(触覚)、照度(視覚)、動き(視覚)、
音声(聴覚)、映像(視覚)、消費電力
スマートホームに設置されたセンサは、無線によってエッジコンピュータへ、逐次、その計測値を送信する。そのために、例えば以下のような場合に、計測値群からなる時系列マルチモーダルデータを収集できないという問題がある。
センサが、無線状態の劣化によってエッジコンピュータとの間で通信できない
センサが、低消費電力を維持するために、スリープ(無効状態)している
センサが、故障している
このような場合に、できる限り、時系列マルチモーダルデータにおける欠損値を補完する必要がある。
従来、複数の計測器から定期的にデータを収集し、欠損したデータを再取得する技術がある(例えば特許文献1参照)。この技術によれば、欠損したデータの時刻値を起点として連続する所定回数分の再取得するグループを設定し、そのグループ毎に、当該計測器が保持するデータを再取得する。
尚、非時系列マルチモーダルデータについては、深層生成モデルを用いて、画像及びテキストの欠損を高品質に補完する技術もある(例えば非特許文献1参照)。但し、この技術によれば、データの時系列変化を補完することはできない。
WO2018/003053
arXiv : 1801.0870, Improving Bi-directional Generation between Different Modalities with Variational Autoencoders、[online]、[平成31年4月15日検索]、インターネット<URL:https://arxiv.org/abs/1801.08702>
しかしながら、特許文献1に記載の技術によれば、データの再取得時にも通信環境が改善しなかった場合や、計測器自体がスリープ状態や故障となってる場合、結局、そのデータの欠損を補完することはできない。即ち、この技術は、センサ毎のデータを補完するに過ぎない。
これに対し、本願の発明者らは、複数のセンサにおける時系列マルチモーダルデータの関連性の中で、一部のセンサの時系列データの欠損を補完することができないか、と考えた。
そこで、本発明は、複数のセンサにおける時系列の計測値群同士の関連性に基づいて、一部のセンサにおける欠損値を補完するプログラム、装置及び方法を提供することを目的とする。
本発明によれば、複数のセンサそれぞれから周期tm毎の計測値群を時系列に入力し、潜在表現を出力するエンコーダとしてコンピュータを機能させるプログラムであって、
エンコーダは、
各センサiについて、所定期間Tdにおける周期tm毎の計測値群xiを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群xi,jを作成する計測値群生成手段と、
各センサiについて、シフト計測値群xi,j毎に時系列直列に接続された各再帰型ニューラルネットワークが、各シフト計測値群xi,jと、時系列前段の再帰型ニューラルネットワークの隠れ層ベクトルhi,jとを入力し、時系列後段へ隠れ層ベクトルhi,j+1を出力する特徴抽出手段と、
各センサiについて、末端の再帰型ニューラルネットワークxi,Jから出力された隠れ層ベクトルhiから、正規化された確率分布の潜在表現ziを生成する潜在表現生成エンジンと
してコンピュータを機能させることを特徴とする。
本発明のプログラムにおける他の実施形態によれば、
潜在表現ziを入力し、センサi毎に時系列の計測値群を出力するデコーダによってVAE(Variational Autoencoder)として機能させ、
デコーダは、
各センサiについて、潜在表現ziからシフト計測値群xi,jをサンプリング的に生成するサンプリング生成手段と、
各センサiについて、サンプリングされたシフト計測値群xi,jを入力する、エンコーダと同一の特徴抽出手段と、
各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群xi,jから、所定期間Tdにおける周期tm毎の計測値群xiを再生する計測値群再生手段と
してコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
学習段階によれば、
エンコーダの潜在表現生成エンジンは、目的関数の要素として、
潜在表現ziを標準正規分布に近づけると共に、
エンコーダに入力された訓練データの単位時間Thの計測値群xiと、デコーダから出力された訓練データの単位時間Thの計測値群xiとの誤差を小さくする
べく学習する
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
運用段階によれば、
エンコーダによれば、無効なセンサiについて、周期tm毎の計測値群に所定値を埋め込み、
デコーダによれば、無効なセンサiについて、計測値群再生手段から出力された所定期間Tdの計測値群xiに補完する
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
特徴抽出手段における再帰型ニューラルネットワーク(RNN(Recurrent Neural Network))は、GRU(Gated Recurrent Unit)又はLSTM(Long Short Term Memory)である
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
特徴抽出手段は、
シフト計測値群xi,j毎に、1次元畳み込みニューラルネットワーク(1D−CNN(One Dimensional - Convolutional Neural Network))を介して、再帰型ニューラルネットワークへ入力する
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
特徴抽出手段における1次元畳み込みニューラルネットワークは、3次元フィルタで隣接3要素を畳み込む
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
特徴抽出手段における1次元畳み込みニューラルネットワークは、複数の1次元畳み込みニューラルネットワークを直列接続したものである
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
エンコーダにおける潜在表現生成エンジンは、各センサiにおける潜在表現ziを、3次元平均ベクトルμと3次元分散共分散行列の対角成分Σ1によって表現する
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
デコーダにおける潜在表現サンプリング手段は、各センサiにおける潜在表現ziから、所定期間Tdの計測値群xiをサンプリング的に再生したものである
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
センサは、温度センサ、湿度センサ、照度センサ、動きセンサ及び/又は消費電力センサであり、
時系列の計測値群は、時系列マルチモーダルデータである
ようにコンピュータを機能させることも好ましい。
本発明によれば、複数のセンサそれぞれから時系列の計測値群を入力し、潜在表現を出力するエンコーダを有する装置であって、
エンコーダは、
各センサiについて、所定期間Tdにおける周期tm毎の計測値群xiを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群xi,jを作成する計測値群生成手段と、
各センサiについて、シフト計測値群xi,j毎に時系列直列に接続された各再帰型ニューラルネットワークが、各シフト計測値群xi,jと、時系列前段の再帰型ニューラルネットワークの隠れ層ベクトルhi,jとを入力し、時系列後段へ隠れ層ベクトルhi,j+1を出力する特徴抽出手段と、
各センサiについて、末端の再帰型ニューラルネットワークxi,Jから出力された隠れ層ベクトルhiから、正規化された確率分布の潜在表現ziを生成する潜在表現生成エンジンと
を有することを特徴とする。
本発明の装置における他の実施形態によれば、潜在表現ziを入力し、センサi毎に時系列の計測値群を出力するデコーダによってVAEとして構成し、
デコーダは、
各センサiについて、潜在表現ziからシフト計測値群xi,jをサンプリング的に生成するサンプリング生成手段と、
各センサiについて、サンプリングされたシフト計測値群xi,jを入力する、エンコーダと同一の特徴抽出手段と、
各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群xi,jから、所定期間Tdにおける周期tm毎の計測値群xiを再生する計測値群再生手段と
を有することも好ましい。
本発明によれば、複数のセンサそれぞれから時系列の計測値群を入力し、潜在表現を出力する装置のエンコード方法であって、
装置は、
各センサiについて、所定期間Tdにおける周期tm毎の計測値群xiを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群xi,jを作成する第1のステップと、
各センサiについて、シフト計測値群xi,j毎に時系列直列に接続された各再帰型ニューラルネットワークが、各シフト計測値群xi,jと、時系列前段の再帰型ニューラルネットワークの隠れ層ベクトルhi,jとを入力し、時系列後段へ隠れ層ベクトルhi,j+1を出力する第2のステップと、
各センサiについて、末端の再帰型ニューラルネットワークxi,Jから出力された隠れ層ベクトルhiから、正規化された確率分布の潜在表現ziを生成する第3のステップと
を実行することを特徴とする。
前述の本発明の装置のエンコード方法に続いて実行され、潜在表現ziを入力し、センサi毎に時系列の計測値群を出力するように、VAEとして構成した装置のデコード方法であって、
各センサiについて、潜在表現ziからシフト計測値群xi,jをサンプリング的に生成する第4のステップと、
各センサiについて、サンプリングされたシフト計測値群xi,jを入力する、第2のステップと同一処理の第5のステップと、
各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群xi,jから、所定期間Tdにおける周期tm毎の計測値群xiを再生する第6のステップと
してコンピュータを機能させることを特徴とする。
本発明のプログラム、装置及び方法によれば、複数のセンサにおける時系列の計測値群同士の関連性に基づいて、一部のセンサにおける欠損値を補完することができる。
本発明のオートエンコーダにおける学習段階の機能構成図である。 本発明におけるエンコーダの機能説明図である。 本発明における特徴抽出部のGRUの機能構成図である。 本発明のエンコーダにおける特徴抽出部の機能構成図である。 本発明の特徴抽出部における畳み込みニューラルネットワークの数値例である。 本発明のオートエンコーダにおける運用段階の機能構成図である。 本発明のデコーダにおける特徴再生部の機能構成図である。 本発明におけるセンサの計測値群の補完を表す説明図である。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
本発明は、複数のセンサからの時系列データの特徴を獲得するべく、深層学習モデルのオートエンコーダ(VAE(Variational Autoencoder))として構成したものである。
スマートホームのセンサとしては、例えば温度センサ、湿度センサ、照度センサ、動きセンサ、消費電力センサがある。これらセンサは、周期的に計測値群を出力し続ける。そして、これら計測値群は、時系列マルチモーダルデータとして収集される。
これら時系列マルチモーダルデータは、学習段階では訓練データとして、運用段階では運用データとして、オートエンコーダに入力される。
<<学習段階>>
図1は、本発明のオートエンコーダにおける学習段階の機能構成図である。
図1によれば、オートエンコーダ1は、エンコーダ11と、デコーダ12と、学習モデル構築部13とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
<エンコーダ11>
エンコーダ11は、複数のセンサそれぞれから周期tm毎の計測値群(マルチモーダルデータ)を時系列に入力し、潜在表現を出力する。この潜在表現とは、多次元正規分布と仮定したものである。
各センサiについて、例えば以下のような、所定期間Tdにおける周期tm毎の計測値群xiが入力される。
センサi :気温センサ、湿度センサ、照度センサ、動きセンサ、電力センサ
所定期間Td :1日(24時間)
周期tm :5分
この場合、計測値群xiは、5分周期で288次元ベクトル(1日分)となる。
図1によれば、5つのセンサから、以下のような時系列マルチモーダルデータx=(x1, x2, x3, x4, x5)が入力されている。
気温 x1 = (22.6, 22.4, 22.3, 22.3, ..., 24.4, 24.5, 23.4)
湿度 x2 = (62.0, 62.4, 63.3, 62.1, ..., 52.6, 52.5, 52.5)
照度 x3 = (18, 20, 21, 9, ..., 325, 345, 338)
動き x4 = (0, 0.4, 0.2, 1.0, ..., 0.4, 0.2, 0)
消費電力 x5 = (43, 40, 56, 22, ..., 58, 78, 77)
尚、「動き」センサについては、例えば以下の動きの1分値を、5分毎に平均したものであってもよい。
動きを検知した場合 :1
動きを検知しない場合:0
例えば、5分中3分で動きを検知していた場合、0.6 (=3/5)となる。
また、5分中5分で動きを検知していた場合、1.0 (=5/5))となる。
図1によれば、エンコーダ11は、計測値群生成部111と、特徴抽出部112と、潜在表現生成エンジン113とを有する。
[計測値群生成部111]
計測値群生成部111は、各センサiについて、所定期間Tdにおける周期tm毎の計測値群xiを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群xi,jを作成する。
図2は、本発明におけるエンコーダの機能説明図である。
図2によれば、温度センサにおける時系列の気温の計測値群x1を表す。
x1 = (22.6, 22.4, 22.3, 22.3, ..., 24.4, 24.5, 23.4)
x1(1) =00:00の気温22.6度
x1(2) =00:05の気温22.4度
x1(3) =00:10の気温22.3度
・・・・・
x1(287)=23:50の気温24.5度
x1(288)=23:55の気温23.4度
ここから更に、12要素分(=5分周期で1時間分)の12次元ベクトルを生成する。そして、1要素ずつシフトさせて複数(j=277)のシフト計測値群xi,jを作成する。
x1,1,1=(22.6, 22.4, 22.3, 22.3, 22.2, 22.5, 22.3, 22.5, 22.5,
22.5, 23.5, 23.0)
x1,2,1=( 22.4, 22.3, 22.3, 22.2, 22.5, 22.3, 22.5, 22.5,
22.5, 23.5, 23.0, 22.9)
x1,3,1=( 22.3, 22.3, 22.2, 22.5, 22.3, 22.5, 22.5,
22.5, 23.5, 23.0, 22.9, 22.8)
・・・・・
x1,277,1=(
24.5, 24.6, 24.5,
24.4, 24.4, 24.7, 24.3, 24.7, 24.6, 24.4, 24.5, 23.4)
x1,1,1は、0:00〜0:55の1時間(12要素分)の12次元ベクトルを表す。
x1,277,1は、23:00〜23:55の1時間(12要素分)の12次元ベクトルを表す。
[特徴抽出部112]
特徴抽出部112は、各センサiについて、シフト計測値群xi,j毎に、時系列直列に接続された複数のRNN(Recurrent Neural Network)(再帰型ニューラルネットワーク)を有する。
RNNとは、数値データにおける時系列パターンを認識するニューラルネットワークである。RNNは、内部に状態を持ち、各時点における入力値及び状態に基づいて、次の状態に遷移させることができる。
図2によれば、特徴抽出部112は、シフト計測値群xi,j毎に、RNNを有する。そして、各RNNは、各シフト計測値群xi,jと、時系列前段のRNNの隠れ層ベクトルhi,jとを入力し、時系列後段へ隠れ層ベクトルhi,j+1を出力する。そのために、図2によれば、RNN1,1〜RNN1,277まで、277個のRNNが直列に接続されたものとなる。
特徴抽出部112のRNNとしては、例えばGRU(Gated Recurrent Unit)又はLSTM(Long Short Term Memory)であってもよい。
図3は、本発明における特徴抽出部のGRUの機能構成図である。
図3によれば、GRUは、入力ゲートと忘却ゲートを「更新ゲート」として、1つのゲートに統合したものである。LSTMと同様に、忘却・更新ゲートを導入することによって、長いステップ前の計測値の特徴の記憶を維持しやすくする。これは、各時間ステップ間を迂回するショートカットパスが、効率的に生成されることに基づく。これによって、学習中に、誤差を容易に逆伝播することができる。
このように、GRUは、時系列データについて、誤差が浅い層に伝わらない勾配消失の問題を軽減することができる。
図4は、本発明のエンコーダにおける特徴抽出部の機能構成図である。
図4によれば、特徴抽出部112は、シフト計測値群xi,j毎に、1次元畳み込みニューラルネットワーク(1D−CNN(One Dimensional - Convolutional Neural Network))を介して、RNNへ入力する。1D−CNNは、特徴抽出フィルタをして機能するオプション的なものであって、必須の構成要素とするものではない。
CNNとは、複数のユニットを持つ層が入力段から出力段へ向けて一方向に連結されており、出力層側のユニットが、隣接する入力層側の特定のユニットに結合された畳み込み層を有する順伝播型ネットワークをいう。
特徴抽出部112における1D−CNNは、3次元フィルタで隣接3要素を畳み込むものであってもよい。これは、複数の1D−CNNを直列接続したものである。
図5は、本発明の特徴抽出部における畳み込みニューラルネットワークの数値例である。
図5によれば、例えば図2で生成された時系列の計測値群x1,1,1が、CNNへ入力されている。
x1,1,1=(22.6, 22.4, 22.3, 22.3, 22.2, 22.5, 22.3, 22.5, 22.5,
22.5, 23.5, 23.0)
1D−CNNは、3次元フィルタ(1/3, 1/3, 1/3)で畳み込む。ここでの畳み込みは、左から順に隣接する3要素に1/3を掛けて足し合わせる。12次元を維持するために足りない要素は、隣接要素でパディングする。
具体的には、1層目の1D−CNNに、x1,1,1を入力した場合、以下のようになる。
x1,1,2=(22.6*1/3+22.6*1/3+22.4*1/3, 22.6*1/3+22.4*1/3+22.3*1/3,
22.4*1/3+22.3*1/3+22.3*1/3, 22.3*1/3+22.3*1/3+22.2*1/3,
22.3*1/3+22.2*1/3+22.5*1/3, 22.2*1/3+22.5*1/3+22.3*1/3,
22.5*1/3+22.3*1/3+22.5*1/3, 22.3*1/3+22.5*1/3+22.5*1/3,
22.5*1/3+22.5*1/3+22.5*1/3, 22.5*1/3+22.5*1/3+23.5*1/3,
22.5*1/3+23.5*1/3+23.0*1/3, 23.5*1/3+23.0*1/3+23.0*1/3)
=(22.5, 22.4, 22.3, 22.3, 22.3, 22.3, 22.4, 22.4, 22.5,
22.8, 23.0, 23.2)
次に、2層目の1D−CNNに、x1,1,2を入力した場合、1層目と同様の畳み込みによって、以下のように出力する。
x1,1,3=(22.5, 22.4, 22.3, 22.3, 22.3, 22.3, 22.4, 22.4, 22.6,
22.8, 23.0, 23.1)
2層目の1D−CNNから出力されたx1,1,3は、GRU1,1へ入力される。
ここで、GRU1,1は、以下のように、x1の時系列的特徴を保持している10次元隠れ層h1,1ベクトルを出力する。
h1,1=(19.7, 19.4, 21.0, 20.8, 20.0, 20.6, 21.4, 20.3, 21.0, 19.3)
以上の処理を、x1,2,1、x1,3,1、・・・、x1,277,1ついて同様に実行する。ここで、過去の時系列的特徴を伝えるために、2つ目以降のGRUへの入力は、直前の隠れ層の出力と1D−CNNの出力とを結合したものとなる。
[潜在表現生成エンジン113]
潜在表現生成エンジン113は、各センサiについて、末端のRNNxi,Jから出力された隠れ層ベクトルhiから、正規化された確率分布の潜在表現ziを生成する。
潜在表現ziは、マルチモーダルデータ(各センサiの時系列の計測値群x)に共通して潜在的に存在すると仮定される表現を意味する。
各センサiにおける潜在表現ziは、多次元正規分布の平均ベクトルμと、分散共分散行列の対角成分Σ1とによって表現される。
例えば、潜在表現zが3次元正規分布の場合、最後の隠れ層h1から3次元平均ベクトルμ1と、3次元分散共分散行列の対角成分Σ1とを、以下のように計算する。
μ1=(-0.17, -0.02, 0.32)
Figure 2020181256
対角成分Σ1=(0.3, 0.07, 0.12)
z1 = μ1+e*Σ1 = (-0.32, 0.04, 0.27)
e〜N(0,1)となる標準正規分布
z〜N(μ, diag(Σ)) diag:対角行列
そして、潜在表現生成エンジン113は、各センサiについて、例えば以下のような潜在表現ziを、デコーダ12へ出力する。
μ=(μ1, μ2, μ3, μ4, μ5)
=((-0.17, -0.02, 0.32), (0.1, 0.67, -0.12), (-0.21, 0.14, -0.11),
(0.22, -0.11, 0.18), (-0.31, 0.22, -0.12))
Σ=(Σ1, Σ2, Σ3, Σ4, Σ5)
=((0.3, 0.07, 0.12), (0.39, 0.2, 0.09), (0.4, 0.32, 0.34),
(0.15, 0.23, 0.43), (0.44, 0.22, 0.21))
z=(z1, z2, z3, z4, z5)
=((-0.32, 0.04, 0.27), (0.01, 0.12, -0.07), (0.06, -0.02, -0.12),
(0.21, 0.41, 0.33), (0.1, -0.31, -0.11))
<デコーダ12>
デコーダ12は、潜在表現ziを入力し、センサi毎に時系列の計測値群を出力する。
デコーダ12は、潜在表現サンプリング部121と、特徴再生部122と、計測値群再生部123とを有する。
[潜在表現サンプリング部121]
潜在表現サンプリング部121は、各センサiについて、潜在表現ziからシフト計測値群xi,jをサンプリング的に生成する。具体的には、以下のようにサンプリングされた計測値群xi,jを、センサi毎に、277個のGRUそれぞれに入力する。
x1,1,1〜x1,277,1
x2,1,1〜x2,277,1
x3,1,1〜x3,277,1
x4,1,1〜x4,277,1
x5,1,1〜x5,277,1
[特徴再生部122]
特徴再生部122は、エンコーダ11の特徴抽出部112の逆処理となるものであって、各センサiについて、サンプリングされたシフト計測値群xi,jを入力する。
そして、
[計測値群再生部123]
計測値群再生部123は、各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群xi,jから、所定期間Tdにおける周期tm毎の計測値群xiを再生する。
具体的には、5モーダルとして、以下のように計測値群が再生される。
y=(y1, y2, y3, y4, y5)
=((22.3, 23.4, 22.0, 20.3, ..., 24.5, 24.4, 23.0),
(60, 61.3, 62.9, 62.3, ..., 51.9, 52.5, 52.5),
(10, 21, 21, 14, ..., 320, 320, 330),
(0, 0.2, 0.2, 1.0, ..., 0.6, 0.6, 0.6),
(40, 41, 42, 50, ..., 54, 70, 80))
<学習モデル構築部13>
学習モデル構築部13は、エンコーダ11の潜在表現生成エンジン113を、以下のように目的関数を最大化する。
(1)潜在表現ziを標準正規分布に近づける
(2)エンコーダに入力された訓練データの単位時間Thの計測値群xiと、デコーダから出力された訓練データの単位時間Thの計測値群xiとの誤差を小さくする。
本発明の場合、潜在表現zからどれだけ尤もらしいxが生成されたかを、対数尤度の期待値E[logp(x|z)]で測る。そして、期待値Eが大きいほど好ましい。
(1)潜在表現zは、標準正規分布に近づくほど小さくなる、以下のようなKLダイバージェンスである。
KL(N(μ,Σ) || N(0,1))
最大化問題を考えるために、負にして5モーダル分を足し合わせると、以下のようになる。
L1=−(DKL(N(μ1,Σ1) || N(0,1))+DKL(N(μ2,Σ2) || N(0,1))
+DKL (N(μ3,Σ3) || N(0,1))+DKL(N(μ4,Σ4) || N(0,1))
+DKL(N(μ5,Σ5) || N(0,1)))
(2)再構築誤差についても、5モーダル分を考慮すると、以下のようになる。
L2=E[logp(x1|z)]+E[logp(x2|z)]+E[logp(x3|z)]
+E[logp(x4|z)]+E[logp(x5|z)]
学習モデル構築部13における学習は、L=L1+L2の最大化問題を誤差逆伝搬で解くことに相当する。その結果、潜在表現zのパラメタμ、Σを算出することができる。
KLダイバージェンスとは、2つの確率分布PとQの差異を測る尺度である。P、Q を離散確率分布とするとき、PのQに対するカルバック・ライブラー情報量は、以下のように定義される。
KL(P||Q)=∫ -∞P(x)log(p(x)/Q(x))dx
P(i)、Q(i):確率分布P、Qに従って選ばれた値がiの時の確率
P〜N(μ,Σ)、Q〜N(0,1)の場合、確率分布Pと標準正規分布の差異を表し、
Pが標準正規分布に近いほど小さくなる。
前述のμ、Σについては、以下のように、カルバック・ライブラー情報量が算出される。
μ=(-0.17, -0.02, 0.32)
Figure 2020181256
KL(P||Q)=-1/2 Σj=1 3(1+log(diag(Σ)j 2)−μj 2+diag(Σ)j 2
=4.49
エンコーダ11及びデコーダ12は、潜在表現から、エンコーダに入力された時系列マルチモーダルデータを再生するように学習する。
<<運用段階>>
図6は、本発明のオートエンコーダにおける運用段階の機能構成図である。
運用段階によれば、以下のように機能する。
エンコーダ11は、無効なセンサiについて、周期tm毎の計測値群に所定値を埋め込む。
デコーダ12は、無効なセンサiについて、計測値群再生手段から出力された所定期間Tdの計測値群xiに補完する。
また、エンコーダ11及びデコーダ12における運用段階の処理は、非常に軽いものである。そのために、エンコーダ11に5分計測値が入力される毎に、デコーダ12から補完された計測値が出力される。
図7は、本発明のデコーダにおける特徴再生部の機能構成図である。
図7によれば、デコーダ12の特徴再生部122は、前述したエンコーダ11の特徴抽出部112の逆処理となる。
特徴再生部122は、各センサiについて、サンプリングされた計測値群xi,j,1を、時系列直列に接続された複数のRNN(例えばGRU)へ入力する。
そして、各RNNは、その出力計測値群を、それぞれの1D−CNNへ出力する。尚、1D−CNNは、特徴抽出フィルタをして機能するオプション的なものであって、必須の構成要素とするものではない。但し、特徴再生部122における1D−CNNは、特徴抽出部112と同じ畳み込みを実行する。
図8は、本発明におけるセンサの計測値群の補完を表す説明図である。
図8(a)によれば、エンコーダ11に、以下のような時系列モーダルデータが入力されている。
x1=(20.1, 20.0, 20.0, 20.1, ・・・, 20.1, 20.1, 20.1),
x2=(63, 64, 64, 68, ・・・, 72, 72, 73)
x3=(-, -, -, -, ・・・, -, -, -)
x4=(-, -, -, -, ・・・, -, -, -)
x5=(32, 32, 34, 54, ・・・, 53, 56, 62)
ここで、温度、湿度、消費電力は計測値が入力されているが、照度及び動きについて計測値が欠損している。このとき、エンコーダ11の計測値群生成部111は、欠損しているマルチモーダルデータの要素を0で埋める。そして、学習済みの特徴抽出部112へ入力する。
例えば、スマートホームのシステムとして、家族の外出時を、照度センサ及び動きセンサによって観測しているとする。その場合、照度センサ300ルクス以上で、且つ、動きセンサ0.6以上である、家族が帰宅済みであると判断するとする。
ここで、図7(a)によれば、照度センサ及び動きセンサにおける故障等の障害によって、計測値が欠損している。そのために、家族の帰宅も判断できない。
これに対し、図8(b)によれば、本発明のデコーダ12から、補完された時系列モーダルデータが出力されている。
y3=(19, 20, 20, 340, ・・・, 335, 340, 320)
y4=(0, 0, 0, 0.6, ・・・, 1, 1, 1)
このように、欠損していた照度及び動きの計測値が、補完される。
本発明によれば、温度・湿度・消費電力の時系列マルチモーダルデータから、照度・動きの時系列モーダルデータが補完されている。
これによって、照度センサ及び動きセンサにおける故障等の障害が発生し、計測値が欠損していても、直ぐに家族の帰宅を判断することができる。
以上、詳細に説明したように、本発明のプログラム、装置及び方法によれば、複数のセンサにおける時系列の計測値群同士の関連性に基づいて、一部のセンサにおける欠損値を補完することができる。
本発明によれば、1つのセンサにける過去の計測値を単に用いるよりも、他のセンサにおける過去の時系列的特徴を用いるために、高い精度で計測値を補完することができる。即ち、欠損していない他の時系列モーダルデータから、欠損した時系列モーダルデータを補完することができる。
特に、欠損した時系列モーダルデータを、改めて再取得する必要もない。時系列マルチモーダルデータの欠損値の補完は、以下のような様々な障害に適用することができる。
・スマートホーム設置のセンサ故障、
・センサ通信先サーバの故障
・電子レンジ使用による電波干渉での無線通信エラー
・センサとサーバ間の通信エラー
また、本発明によれば、モーダル数を増加させることもでき、また、シミュレータとして新たにモーダルデータを生成することもできる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
11 エンコーダ
111 計測値群生成部
112 特徴抽出部
113 潜在表現生成エンジン
12 デコーダ
121 潜在表現サンプリング部
122 特徴再生部
123 計測値群再生部
13 学習モデル構築部

Claims (15)

  1. 複数のセンサそれぞれから周期tm毎の計測値群を時系列に入力し、潜在表現を出力するエンコーダとしてコンピュータを機能させるプログラムであって、
    前記エンコーダは、
    各センサiについて、所定期間Tdにおける周期tm毎の計測値群xiを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群xi,jを作成する計測値群生成手段と、
    各センサiについて、シフト計測値群xi,j毎に時系列直列に接続された各再帰型ニューラルネットワークが、各シフト計測値群xi,jと、時系列前段の再帰型ニューラルネットワークの隠れ層ベクトルhi,jとを入力し、時系列後段へ隠れ層ベクトルhi,j+1を出力する特徴抽出手段と、
    各センサiについて、末端の再帰型ニューラルネットワークxi,Jから出力された隠れ層ベクトルhiから、正規化された確率分布の潜在表現ziを生成する潜在表現生成エンジンと
    してコンピュータを機能させることを特徴とするプログラム。
  2. 前記潜在表現ziを入力し、センサi毎に時系列の計測値群を出力するデコーダによってVAE(Variational Autoencoder)として機能させ、
    前記デコーダは、
    各センサiについて、前記潜在表現ziからシフト計測値群xi,jをサンプリング的に生成するサンプリング生成手段と、
    各センサiについて、サンプリングされた前記シフト計測値群xi,jを入力する、前記エンコーダの前記特徴抽出手段の逆処理となる特徴再生手段と、
    各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群xi,jから、所定期間Tdにおける周期tm毎の計測値群xiを再生する計測値群再生手段と
    してコンピュータを機能させることを特徴とする請求項1に記載のプログラム。
  3. 学習段階によれば、
    前記エンコーダの前記潜在表現生成エンジンは、目的関数の要素として、
    潜在表現ziを標準正規分布に近づけると共に、
    前記エンコーダに入力された訓練データの単位時間Thの計測値群xiと、前記デコーダから出力された訓練データの単位時間Thの計測値群xiとの誤差を小さくする
    べく学習する
    ようにコンピュータを機能させることを特徴とする請求項2に記載のプログラム。
  4. 運用段階によれば、
    前記エンコーダによれば、無効なセンサiについて、周期tm毎の計測値群に所定値を埋め込み、
    前記デコーダによれば、無効なセンサiについて、前記計測値群再生手段から出力された所定期間Tdの計測値群xiに補完する
    ようにコンピュータを機能させることを特徴とする請求項2又は3に記載のプログラム。
  5. 前記特徴抽出手段における前記再帰型ニューラルネットワーク(RNN(Recurrent Neural Network))は、GRU(Gated Recurrent Unit)又はLSTM(Long Short Term Memory)である
    ようにコンピュータを機能させることを特徴とする請求項1から4のいずれか1項に記載のプログラム。
  6. 前記特徴抽出手段は、
    シフト計測値群xi,j毎に、1次元畳み込みニューラルネットワーク(1D−CNN(One Dimensional - Convolutional Neural Network))を介して、前記再帰型ニューラルネットワークへ入力する
    ようにコンピュータを機能させることを特徴とする請求項1から5のいずれか1項に記載のプログラム。
  7. 前記特徴抽出手段における前記1次元畳み込みニューラルネットワークは、3次元フィルタで隣接3要素を畳み込む
    ようにコンピュータを機能させることを特徴とする請求項6に記載のプログラム。
  8. 前記特徴抽出手段における前記1次元畳み込みニューラルネットワークは、複数の1次元畳み込みニューラルネットワークを直列接続したものである
    ようにコンピュータを機能させることを特徴とする請求項6又は7に記載のプログラム。
  9. 前記エンコーダにおける前記潜在表現生成エンジンは、各センサiにおける前記潜在表現ziを、3次元平均ベクトルμと3次元分散共分散行列の対角成分Σ1によって表現する
    ようにコンピュータを機能させることを特徴とする請求項1から8のいずれか1項に記載のプログラム。
  10. 前記デコーダにおける前記潜在表現サンプリング手段は、各センサiにおける前記潜在表現ziから、所定期間Tdの計測値群xiをサンプリング的に再生したものである
    ようにコンピュータを機能させることを特徴とする請求項9に記載のプログラム。
  11. 前記センサは、温度センサ、湿度センサ、照度センサ、動きセンサ及び/又は消費電力センサであり、
    前記時系列の計測値群は、時系列マルチモーダルデータである
    ようにコンピュータを機能させることを特徴とする請求項1から10のいずれか1項に記載のプログラム。
  12. 複数のセンサそれぞれから時系列の計測値群を入力し、潜在表現を出力するエンコーダを有する装置であって、
    前記エンコーダは、
    各センサiについて、所定期間Tdにおける周期tm毎の計測値群xiを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群xi,jを作成する計測値群生成手段と、
    各センサiについて、シフト計測値群xi,j毎に時系列直列に接続された各再帰型ニューラルネットワークが、各シフト計測値群xi,jと、時系列前段の再帰型ニューラルネットワークの隠れ層ベクトルhi,jとを入力し、時系列後段へ隠れ層ベクトルhi,j+1を出力する特徴抽出手段と、
    各センサiについて、末端の再帰型ニューラルネットワークxi,Jから出力された隠れ層ベクトルhiから、正規化された確率分布の潜在表現ziを生成する潜在表現生成エンジンと
    を有することを特徴とする装置。
  13. 前記潜在表現ziを入力し、センサi毎に時系列の計測値群を出力するデコーダによってVAEとして構成し、
    前記デコーダは、
    各センサiについて、前記潜在表現ziからシフト計測値群xi,jをサンプリング的に生成するサンプリング生成手段と、
    各センサiについて、サンプリングされた前記シフト計測値群xi,jを入力する、前記エンコーダの前記特徴抽出手段の逆処理となる特徴再生手段と、
    各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群xi,jから、所定期間Tdにおける周期tm毎の計測値群xiを再生する計測値群再生手段と
    を有することを特徴とする請求項11に記載の装置。
  14. 複数のセンサそれぞれから時系列の計測値群を入力し、潜在表現を出力する装置のエンコード方法であって、
    前記装置は、
    各センサiについて、所定期間Tdにおける周期tm毎の計測値群xiを、単位時間Th毎に周期tmずつシフトさせた複数jのシフト計測値群xi,jを作成する第1のステップと、
    各センサiについて、シフト計測値群xi,j毎に時系列直列に接続された各再帰型ニューラルネットワークが、各シフト計測値群xi,jと、時系列前段の再帰型ニューラルネットワークの隠れ層ベクトルhi,jとを入力し、時系列後段へ隠れ層ベクトルhi,j+1を出力する第2のステップと、
    各センサiについて、末端の再帰型ニューラルネットワークxi,Jから出力された隠れ層ベクトルhiから、正規化された確率分布の潜在表現ziを生成する第3のステップと
    を実行することを特徴とする装置のエンコード方法。
  15. 請求項13に記載の装置のエンコード方法に続いて実行され、前記潜在表現ziを入力し、センサi毎に時系列の計測値群を出力するように、VAEとして構成した装置のデコード方法であって、
    各センサiについて、前記潜在表現ziからシフト計測値群xi,jをサンプリング的に生成する第4のステップと、
    各センサiについて、サンプリングされた前記シフト計測値群xi,jを入力する、第2のステップの逆処理となる第5のステップと、
    各センサiについて、各再帰型ニューラルネットワークの出力層の出力値となる単位時間Thのシフト計測値群xi,jから、所定期間Tdにおける周期tm毎の計測値群xiを再生する第6のステップと
    してコンピュータを機能させることを特徴とする装置のデコード方法。

JP2019082109A 2019-04-23 2019-04-23 複数のセンサの時系列の計測値群における欠損値を補完するプログラム、装置及び方法 Active JP6994812B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019082109A JP6994812B2 (ja) 2019-04-23 2019-04-23 複数のセンサの時系列の計測値群における欠損値を補完するプログラム、装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019082109A JP6994812B2 (ja) 2019-04-23 2019-04-23 複数のセンサの時系列の計測値群における欠損値を補完するプログラム、装置及び方法

Publications (2)

Publication Number Publication Date
JP2020181256A true JP2020181256A (ja) 2020-11-05
JP6994812B2 JP6994812B2 (ja) 2022-01-14

Family

ID=73023995

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019082109A Active JP6994812B2 (ja) 2019-04-23 2019-04-23 複数のセンサの時系列の計測値群における欠損値を補完するプログラム、装置及び方法

Country Status (1)

Country Link
JP (1) JP6994812B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022092140A1 (ja) 2020-10-29 2022-05-05 デンカ株式会社 硬化性組成物、物品、確認方法および接着剤組成物
CN116362915A (zh) * 2023-05-31 2023-06-30 深圳市峰和数智科技有限公司 一种光伏电站气象数据补齐方法、装置及相关设备
CN116797053A (zh) * 2023-08-25 2023-09-22 深圳普菲特信息科技股份有限公司 基于神经网络的化工生产数据分析方法、系统和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008304970A (ja) * 2007-06-05 2008-12-18 Sony Corp 制御装置および方法、並びにプログラム
JP2017207904A (ja) * 2016-05-18 2017-11-24 エヌ・ティ・ティ・コミュニケーションズ株式会社 異常検知システム、モデル生成装置、異常検知装置、異常検知方法、モデル生成プログラム、および、異常検知プログラム
JP2019162408A (ja) * 2018-03-01 2019-09-26 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited 対象者における軽度認知障害の検出のためのシステム及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008304970A (ja) * 2007-06-05 2008-12-18 Sony Corp 制御装置および方法、並びにプログラム
JP2017207904A (ja) * 2016-05-18 2017-11-24 エヌ・ティ・ティ・コミュニケーションズ株式会社 異常検知システム、モデル生成装置、異常検知装置、異常検知方法、モデル生成プログラム、および、異常検知プログラム
JP2019162408A (ja) * 2018-03-01 2019-09-26 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited 対象者における軽度認知障害の検出のためのシステム及び方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022092140A1 (ja) 2020-10-29 2022-05-05 デンカ株式会社 硬化性組成物、物品、確認方法および接着剤組成物
CN116362915A (zh) * 2023-05-31 2023-06-30 深圳市峰和数智科技有限公司 一种光伏电站气象数据补齐方法、装置及相关设备
CN116362915B (zh) * 2023-05-31 2023-08-15 深圳市峰和数智科技有限公司 一种光伏电站气象数据补齐方法、装置及相关设备
CN116797053A (zh) * 2023-08-25 2023-09-22 深圳普菲特信息科技股份有限公司 基于神经网络的化工生产数据分析方法、系统和介质
CN116797053B (zh) * 2023-08-25 2023-11-10 深圳普菲特信息科技股份有限公司 基于神经网络的化工生产数据分析方法、系统和介质

Also Published As

Publication number Publication date
JP6994812B2 (ja) 2022-01-14

Similar Documents

Publication Publication Date Title
US11443194B2 (en) Anomaly detection using a dimensional-reduction model
US9785886B1 (en) Cooperative execution of a genetic algorithm with an efficient training algorithm for data-driven model creation
US10635978B2 (en) Ensembling of neural network models
JP6994812B2 (ja) 複数のセンサの時系列の計測値群における欠損値を補完するプログラム、装置及び方法
US10963790B2 (en) Pre-processing for data-driven model creation
JP2021502650A (ja) 時不変分類
CN113396457A (zh) 用于生物物理建模和响应预测的系统、方法和装置
KR102320706B1 (ko) 설비 모니터링 시스템의 모델 임계값 설정 방법
CN113177626B (zh) 数据驱动的复杂系统机理自动学习方法、系统及设备
Polikar et al. Guest editorial learning in nonstationary and evolving environments
KR20210056296A (ko) 입력 데이터의 처리를 위한 최적의 어노말리 감지 모델 결정 방법
US20240095535A1 (en) Executing a genetic algorithm on a low-power controller
CN117175588B (zh) 基于时空相关性的用电负荷预测方法及装置
WO2022009010A1 (en) Model fidelity monitoring and regeneration for manufacturing process decision support
CN115688871A (zh) 基于预训练增强的多元时间序列预测方法及系统
JP7102080B2 (ja) 未来の潜在表現を予測するエンコーダのプログラム、装置及び方法
KR20210074269A (ko) 입력 데이터의 처리를 위한 최적의 어노말리 감지 모델 결정 방법
CN112990428A (zh) 重复性人类活动异常运动检测
JP2024050510A (ja) トレーニングされた機械学習モデルを用いて根本原因分析を実行するための方法及びシステム
JP2019079088A (ja) 学習装置、プログラムパラメータおよび学習方法
US20230029400A1 (en) Method of Hierarchical Machine Learning for an Industrial Plant Machine Learning System
CN117034099A (zh) 一种系统日志异常检测方法
JP2022148878A (ja) プログラム、情報処理装置、及び方法
KR20210050413A (ko) 비정상 데이터 생성 방법
Mahzoon et al. Social skill acquisition model through face-to-face interaction: local contingency for open-ended development

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210216

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211213

R150 Certificate of patent or registration of utility model

Ref document number: 6994812

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150