(本開示の基礎となった知見)
上記のように、時系列データの分析において、時系列データのデータ構造を知るために自己相関関数が用いられる。自己相関関数を用いることで、前後のデータの相関関係を把握することができ、将来予測などのデータ分析が可能となる。従来の自己相関関数は、一定のサンプリング周期で取得された時系列データから算出される。しかしながら、例えば、家電機器から得られる時系列データは、一定のサンプリング周期で取得されないことも多く、等間隔にデータが取得されない時系列データの自己相関関数は高い精度で算出することが困難である。
従来技術では、測定部によって測定された所定期間内におけるセンサ値の欠落が検出された場合、ガウス過程を用いて、欠落したセンサ値を補間しているが、データ取得数が不十分であると補間精度が低下するおそれがある。
以上の課題を解決するために、本開示の一態様に係るデータ分析方法は、電化機器のデータ分析処理を行うデータ分析装置におけるデータ分析方法であって、前記電化機器の動作に関する第1情報と、前記第1情報の時間的な観測点を表す第2情報とを対応付けたM個(Mは3以上の自然数)以上の第3情報を含む時系列データ情報を取得し、前記時系列データ情報に含まれるN個(Nは3以上の自然数)の前記第3情報それぞれに含まれる前記第2情報を用いて、前記観測点それぞれの時間差の絶対値を算出し、算出した前記時間差の集合を第1集合として生成し、前記時間差の絶対値を算出した前記第3情報の組それぞれに対して、第1時刻における前記第1情報の値と、前記第1時刻から所定時間経過した第2時刻における前記第1情報の値との相関関係を表す自己相関係数を算出し、算出した前記自己相関係数の集合を第2集合として生成し、前記第1集合と前記第2集合とに基づいて、前記時間差の集合と前記自己相関係数の集合との関係を表す自己相関関数を算出し、前記自己相関関数に基づいて、前記第1情報を時系列的に分析し、分析の結果に関する第4情報を出力する。
この構成によれば、時系列データ情報に含まれるN個(Nは3以上の自然数)の第3情報それぞれに含まれる第2情報を用いて、観測点それぞれの時間差の絶対値が算出され、算出された時間差の集合が生成され、時間差の絶対値を算出した第3情報の組それぞれに対して、各第1情報の値の相関関係を表す自己相関係数が算出され、算出された自己相関係数の集合が生成され、時間差の集合と自己相関係数の集合との関係を表す自己相関関数が算出される。
したがって、離散時系列データの欠損を近似によって補間する従来手法で用いられる変数の数がN個であるのに対して、本開示の自己相関関数の算出に用いられる変数の数は、N個の第3情報から抽出される任意の2個の第2情報の組み合わせの数であるNC2個であるので、時系列データが等間隔にデータが取得されない離散時系列データであっても、取得されたデータ数より多いデータを用いて離散時系列データから高い精度で自己相関関数を算出することができる。また、高い精度で算出された自己相関関数を用いて、電化機器のデータ分析処理を正確に行うことができる。
また、上記のデータ分析方法において、さらに、前記第1集合において、重複する前記時間差を削除した第3集合を生成し、前記第2集合の生成は、前記第3集合に基づいて、前記第3集合に対応する前記自己相関係数の集合を前記第2集合として生成し、前記自己相関関数の算出は、前記第3集合と前記第2集合とに基づいて、前記自己相関関数を算出してもよい。
この構成によれば、第1集合において、重複する時間差を削除した第3集合が生成され、第3集合に対応する自己相関係数の集合が第2集合として生成され、第3集合と第2集合とに基づいて、自己相関関数が算出されるので、重複する時間差を有する第1集合と第2集合とに基づいて自己相関関数を算出する場合に比べて、自己相関関数の算出処理に要する時間をより短縮することができる。
また、上記のデータ分析方法において、さらに、前記第1集合と前記第3集合とに基づいて、前記第1集合から削除した重複する前記時間差の集合に対応する重複削除数の集合である第4集合を生成し、前記自己相関関数の算出は、前記第2集合と前記第3集合と前記第4集合とに基づいて、前記自己相関関数を算出してもよい。
この構成によれば、第1集合と第3集合とに基づいて、第1集合から削除した重複する時間差の集合に対応する重複削除数の集合である第4集合が生成され、第2集合と第3集合と第4集合とに基づいて、自己相関関数が算出されるので、削除した各時間差の重複数に応じた重み付け近似によって自己相関関数を算出することができる。
また、上記のデータ分析方法において、前記第3集合の生成は、前記第3集合の要素に0を加えてもよい。
この構成によれば、第3集合の要素に0が加えられるので、時間差が0である場合の自己相関係数の値を特定することができ、例えば、時間差が0である場合の自己相関係数の値を1に特定することができる。
また、上記のデータ分析方法において、自己相関関数の算出は、前記第2集合と前記第3集合と前記第4集合とに基づいて、前記自己相関関数の出力値が−1以上1以下になるように、前記自己相関関数を算出してもよい。
この構成によれば、第2集合と第3集合と第4集合とに基づいて、自己相関関数の出力値が−1以上1以下になるように、自己相関関数が算出されるので、−1以上1以下の範囲内の自己相関関数の出力値をデータ分析に用いることができる。
また、上記のデータ分析方法において、第3集合の生成は、前記第3集合の要素に0を加えてもよい。
この構成によれば、第3集合の要素に0が加えられるので、時間差が0である場合の自己相関係数の値を特定することができ、例えば、時間差が0である場合の自己相関係数の値を1に特定することができる。
また、上記のデータ分析方法において、前記自己相関関数の算出は、前記第2集合と前記第3集合とに基づいて、前記自己相関関数の出力値が−1以上1以下になるように、前記自己相関関数を算出してもよい。
この構成によれば、第2集合と第3集合とに基づいて、自己相関関数の出力値が−1以上1以下になるように、自己相関関数が算出されるので、−1以上1以下の範囲内の自己相関関数の出力値をデータ分析に用いることができる。
また、上記のデータ分析方法において、前記自己相関関数の算出は、前記第2集合と前記第3集合とに基づいて、前記自己相関関数の出力値が−1以上1以下になるように、前記自己相関関数を算出してもよい。
この構成によれば、第2集合と第3集合とに基づいて、自己相関関数の出力値が−1以上1以下になるように、自己相関関数が算出されるので、−1以上1以下の範囲内の自己相関関数の出力値をデータ分析に用いることができる。
また、上記のデータ分析方法において、さらに、前記データ分析装置に対して前記データ分析処理を行うように指示する指示情報を受信し、前記第1集合の生成は、前記指示情報が受信された後、前記時系列データ情報に含まれるN個(Nは3以上の自然数)の前記第3情報それぞれに含まれる前記第2情報を用いて、前記観測点それぞれの時間差の絶対値を算出し、算出した前記時間差の集合を第1集合として生成してもよい。
この構成によれば、データ分析装置に対してデータ分析処理を行うように指示する指示情報の受信をトリガにして、時間差の集合を第1集合として生成することができる。
また、上記のデータ分析方法において、前記指示情報は、ネットワークを介して前記データ分析装置に接続された端末においてユーザにより入力されてもよい。
この構成によれば、指示情報は、ネットワークを介してデータ分析装置に接続された端末においてユーザにより入力されるので、遠隔地から端末によりデータ分析装置に対してデータ分析処理を行うように指示することができる。
また、上記のデータ分析方法において、前記第1情報の分析は、前記電化機器の動作が正常であるか否かを判定し、前記第4情報は、前記電化機器の動作が正常であるか否かに関する情報を含んでもよい。この構成によれば、電化機器の動作が正常であるか否かを判定することができる。
本開示の他の態様に係るデータ分析装置は、電化機器のデータ分析処理を行うデータ分析装置であって、前記電化機器の動作に関する第1情報と、前記第1情報の時間的な観測点を表す第2情報とを対応付けたM個(Mは3以上の自然数)以上の第3情報を含む時系列データ情報を取得する取得部と、前記時系列データ情報に対するデータ分析処理を行う制御部とを備え、前記制御部は、前記時系列データ情報に含まれるN個(Nは3以上の自然数)の前記第3情報それぞれに含まれる前記第2情報を用いて、前記観測点それぞれの時間差の絶対値を算出し、算出した前記時間差の集合を第1集合として生成し、前記時間差の絶対値を算出した前記第3情報の組それぞれに対して、第1時刻における前記第1情報の値と、前記第1時刻から所定時間経過した第2時刻における前記第1情報の値との相関関係を表す自己相関係数を算出し、算出した前記自己相関係数の集合を第2集合として生成し、前記第1集合と前記第2集合とに基づいて、前記時間差の集合と前記自己相関係数の集合との関係を表す自己相関関数を算出し、前記自己相関関数に基づいて、前記第1情報を時系列的に分析し、分析の結果に関する第4情報を出力する。
この構成によれば、時系列データ情報に含まれるN個(Nは3以上の自然数)の第3情報それぞれに含まれる第2情報を用いて、観測点それぞれの時間差の絶対値が算出され、算出された時間差の集合が生成され、時間差の絶対値を算出した第3情報の組それぞれに対して、各第1情報の値の相関関係を表す自己相関係数が算出され、算出された自己相関係数の集合が生成され、時間差の集合と自己相関係数の集合との関係を表す自己相関関数が算出される。
したがって、離散時系列データの欠損を近似によって補間する従来手法で用いられる変数の数がN個であるのに対して、本開示の自己相関関数の算出に用いられる変数の数は、N個の第3情報から抽出される任意の2個の第2情報の組み合わせの数であるNC2個であるので、時系列データが等間隔にデータが取得されない離散時系列データであっても、取得されたデータ数より多いデータを用いて離散時系列データから高い精度で自己相関関数を算出することができる。また、高い精度で算出された自己相関関数を用いて、電化機器のデータ分析処理を正確に行うことができる。
本開示の他の態様に係るデータ分析プログラムは、電化機器のデータ分析処理を行うためのデータ分析プログラムであって、コンピュータに、前記電化機器の動作に関する第1情報と、前記第1情報の時間的な観測点を表す第2情報とを対応付けたM個(Mは3以上の自然数)以上の第3情報を含む時系列データ情報を取得し、前記時系列データ情報に含まれるN個(Nは3以上の自然数)の前記第3情報それぞれに含まれる前記第2情報を用いて、前記観測点それぞれの時間差の絶対値を算出し、算出した前記時間差の集合を第1集合として生成し、前記時間差の絶対値を算出した前記第3情報の組それぞれに対して、第1時刻における前記第1情報の値と、前記第1時刻から所定時間経過した第2時刻における前記第1情報の値との相関関係を表す自己相関係数を算出し、算出した前記自己相関係数の集合を第2集合として生成し、前記第1集合と前記第2集合とに基づいて、前記時間差の集合と前記自己相関係数の集合との関係を表す自己相関関数を算出し、前記自己相関関数に基づいて、前記第1情報を時系列的に分析し、分析の結果に関する第4情報を出力する処理を実行させる。
この構成によれば、時系列データ情報に含まれるN個(Nは3以上の自然数)の第3情報それぞれに含まれる第2情報を用いて、観測点それぞれの時間差の絶対値が算出され、算出された時間差の集合が生成され、時間差の絶対値を算出した第3情報の組それぞれに対して、各第1情報の値の相関関係を表す自己相関係数が算出され、算出された自己相関係数の集合が生成され、時間差の集合と自己相関係数の集合との関係を表す自己相関関数が算出される。
したがって、離散時系列データの欠損を近似によって補間する従来手法で用いられる変数の数がN個であるのに対して、本開示の自己相関関数の算出に用いられる変数の数は、N個の第3情報から抽出される任意の2個の第2情報の組み合わせの数であるNC2個であるので、時系列データが等間隔にデータが取得されない離散時系列データであっても、取得されたデータ数より多いデータを用いて離散時系列データから高い精度で自己相関関数を算出することができる。また、高い精度で算出された自己相関関数を用いて、電化機器のデータ分析処理を正確に行うことができる。
以下で説明する実施の形態は、本開示の一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
(実施の形態)
図1は、本開示の実施の形態における情報処理システムの全体構成を示す図である。
情報処理システム1は、データ分析装置100及び電化機器200を備える。ここで、データ分析装置100は、ネットワーク300を介して電化機器200と互いに通信可能に接続されている。ネットワーク300は、例えば、インターネット又はイントラネットであってもよい。データ分析装置100と電化機器200との接続は、Wi−Fi(登録商標)、Bluetooth(登録商標)、エコーネット(登録商標)又はエコーネットライト(登録商標)などの無線接続であってもよいし、イーサネット(登録商標)などの有線接続であってもよく、必要な情報を通信可能であれば、どのような接続を用いてもよい。
電化機器200は、電化機器200の動作に関する第1情報(以下、動作情報)を取得可能な電化機器である。本実施の形態では、電化機器200が空気調和装置(エアーコンディショナー)である場合を例として説明するが、電化機器200は時系列データを取得可能な電化機器であれば何でもよい。具体的には、電化機器200は、例えば、テレビ、空気調和装置、洗濯機、心拍計又は自動気象データ収集システムなどである。
図2は、本開示の実施の形態におけるデータ分析装置の構成を示すブロック図である。データ分析装置100は、例えば、コンピュータである。データ分析装置100は、プロセッサ11、メモリ12、通信部13、入力部14及び出力部15を備える。メモリ12は、例えば、HDD(ハードディスクドライブ)、RAM(ランダムアクセスメモリ)又は半導体メモリなどの補助記憶装置によって実装される。メモリ12は、時系列データ記憶部121を備える。
時系列データ記憶部121は、電化機器200の動作情報と、動作情報の時間的な観測点を表す第2情報(以下、時間情報)とを対応付けたM個(Mは3以上の自然数)以上の第3情報を含む時系列データ情報(以下、時系列データ)を記憶する。
通信部13は、ネットワーク300を介して、電化機器200との通信を実行する。通信部13は、電化機器200の動作に関する第1情報と、第1情報の時間的な観測点を表す第2情報とを対応付けたM個(Mは3以上の自然数)以上の第3情報を含む時系列データを取得する。通信部13は、電化機器200の時系列データを受信し、プロセッサ11へ出力する。
プロセッサ11は、時系列データ記憶部121、通信部13及び入力部14から情報を取得し、取得した情報に応じた処理を実行する。また、プロセッサ11は、時系列データ記憶部121、通信部13及び出力部15へ情報を送信する。プロセッサ11は、情報処理部111、時系列データ抽出部112、算出処理部113及びデータ分析部117を備える。
情報処理部111は、通信部13より電化機器200の時系列データを取得すると、時系列データを時系列データ記憶部121に記憶する。時系列データ記憶処理の詳細については後述する。また、情報処理部111は、入力部14によって入力された異常判定要求を、時系列データ抽出部112及び算出処理部113へ出力する。また、情報処理部111は、データ分析部117によって出力された異常判定結果表示画面を出力部15へ出力する。異常判定結果表示画面の詳細については後述する。
時系列データ抽出部112は、異常判定要求を取得すると、異常判定要求に応じた異常判定に必要な時系列データを時系列データ記憶部121から抽出する。
算出処理部113は、時系列データ抽出部112によって時系列データが抽出されると、自己相関関数算出処理を実行する。算出処理部113は、時間差集合生成部114、自己相関係数集合生成部115及び自己相関関数算出部116を備える。
時間差集合生成部114は、時系列データに含まれるN個(Nは3以上の自然数)の第3情報それぞれに含まれる第2情報を用いて、観測点それぞれの時間差の絶対値を算出し、算出した時間差の集合を第1集合として生成する。また、時間差集合生成部114は、第1集合において、重複する時間差を削除した第3集合を生成する。
自己相関係数集合生成部115は、時間差の絶対値を算出した第3情報の組それぞれに対して、第1時刻における第1情報の値と、第1時刻から所定時間経過した第2時刻における第1情報の値との相関関係を表す自己相関係数を算出し、算出した自己相関係数の集合を第2集合として生成する。また、自己相関係数集合生成部115は、第3集合に基づいて、第3集合に対応する自己相関係数の集合を第2集合として生成する。
自己相関関数算出部116は、第2集合と第3集合とに基づいて、時間差の集合と自己相関係数の集合との関係を表す自己相関関数を算出する。
なお、本実施の形態では、時間差集合生成部114は、第1集合において、重複する時間差を削除した第3集合を生成し、自己相関係数集合生成部115は、第3集合に基づいて、第3集合に対応する自己相関係数の集合を第2集合として生成しているが、本開示は特にこれに限定されず、時間差集合生成部114は、第3集合を生成しなくてもよく、自己相関係数集合生成部115は、第1集合に基づいて、第1集合に対応する自己相関係数の集合を第2集合として生成してもよい。この場合、自己相関関数算出部116は、第1集合と第2集合とに基づいて、時間差の集合と自己相関係数の集合との関係を表す自己相関関数を算出する。
データ分析部117は、自己相関関数に基づいて、第1情報を時系列的に分析し、分析の結果に関する第4情報を出力する。データ分析部117は、電化機器200の動作が正常であるか否かを判定する。第4情報は、電化機器200の動作が正常であるか否かに関する情報を含む。
入力部14は、ユーザの操作を入力として受け付け、プロセッサ11へ出力する。ユーザの操作内容には、異常判定要求が含まれる。入力部14は、例えば、リモートコントローラ、タッチパネル、音声入力装置又はキーボードなどであり、どのような手段によって実現されてもよい。
なお、ユーザの操作は、通信部13を介して外部機器から入力されてもよく、このとき、データ分析装置100は入力部14を備えていなくてもよい。すなわち、通信部13は、データ分析装置100に対してデータ分析処理を行うように指示する異常判定要求(指示情報)を受信してもよい。時間差集合生成部114は、異常判定要求(指示情報)が受信された後、時系列データに含まれるN個(Nは3以上の自然数)の第3情報それぞれに含まれる第2情報を用いて、観測点それぞれの時間差の絶対値を算出し、算出した時間差の集合を第1集合として生成してもよい。異常判定要求(指示情報)は、ネットワーク300を介してデータ分析装置100に接続された端末においてユーザにより入力されてもよい。
出力部15は、各種情報を表示可能であり、具体的には、プロセッサ11より取得した異常判定結果表示画面などを表示する。異常判定結果表示画面については後述する。出力部15は、例えば、ディスプレイ又はプロジェクタなどであり、各種情報を表示可能であればどのような手段によって実現されてもよい。各種情報は、通信部13を介して外部機器に表示されてもよく、このとき、データ分析装置100は出力部15を備えていなくてもよい。
また、データ分析装置100は、サーバであってもよい。データ分析装置100がサーバである場合、データ分析装置100は、入力部14及び出力部15を備えなくてもよく、データ分析装置100とネットワーク300を介して通信可能に接続されたユーザ端末が、入力部14及び出力部15を備えてもよい。ユーザ端末は、例えば、スマートフォン又はタブレット型コンピュータであり、異常判定要求をデータ分析装置100へ送信するとともに、異常判定結果又は異常判定結果表示画面をデータ分析装置100から受信してもよい。そして、ユーザ端末は、受信した異常判定結果から異常判定結果表示画面を生成し、生成した異常判定結果表示画面を表示してもよいし、又は、受信した異常判定結果表示画面を表示してもよい。
図3は、本開示の実施の形態における電化機器の構成を示すブロック図である。電化機器200は、操作部21、プロセッサ22、メモリ23、センサ24及び通信部25を備える。
操作部21は、ユーザの操作を入力として受け付け、プロセッサ22への指示を行う。操作部21は、ユーザの操作に応じて、プロセッサ22へ入力指示を出力する。ユーザの操作内容は、例えば、電化機器200に対する、電源ON/OFFの切り替え、動作状態の切り替え、及び設定パラメータの変更などを含む。また、操作部21は、例えば、リモートコントローラ、タッチパネル又は音声入力装置などである。操作部21としては、どのような操作手段が用いられてもよい。
センサ24は、電化機器200に設けられた種々のセンサを含む。電化機器200が空気調和装置である場合、センサ24は、例えば、室内配管温度及び風量などを測定する。センサ24は、測定したセンサ値を動作情報取得部222へ出力する。なお、センサ24によって測定されるセンサ値は、室内配管温度及び風量に限定されず、電化機器200の種類に応じて異なる。
プロセッサ22は、電化機器200に対する動作制御を実行する。プロセッサ22は、機器制御部221、動作情報取得部222及び通信制御部223を備える。
機器制御部221は、操作部21からユーザの操作に応じた入力指示を取得し、入力指示に対応した動作を電化機器200に実行させる。また、機器制御部221は、メモリ23から電化機器200の動作情報を取得し、動作情報の示す電化機器200の状態に応じて、電化機器200の動作を制御してもよい。
メモリ23は、例えば、HDD、RAM又は半導体メモリなどの補助記憶装置によって実装される。メモリ23は、動作情報記憶部231を備える。動作情報記憶部231は、動作情報取得部222によって取得された動作情報を記憶する。動作情報記憶部231は、記憶している動作情報を通信制御部223へ出力する。
動作情報取得部222は、電化機器200から動作情報を取得し、メモリ23に記憶する。このとき、電化機器200から動作情報が取得される時間間隔は一定でなくともよい。電化機器200から取得される動作情報は、例えば、電化機器200の識別情報、電化機器200の動作状態を示す動作状態情報、ユーザの操作による入力を示すユーザ設定情報、センサ24によって測定されたセンサ値情報などの電化機器200に関する種々の情報を含む。
通信制御部223は、動作情報記憶部231から動作情報を読み出し、通信部25へ出力する。
通信部25は、ネットワーク300を介して、データ分析装置100との通信を実行する。通信部25は、動作情報記憶部231に記憶された動作情報を取得し、電化機器200の動作情報をデータ分析装置100へ送信する。
以下、図を用いて本実施の形態に係る情報処理システムの処理について具体的に説明する。
図4は、本開示の実施の形態における時系列データ記憶処理を示すシーケンス図である。
まず、電化機器200の動作情報取得部222は、定期的に電化機器200の動作情報を取得する(ステップS1)。
次に、動作情報取得部222は、取得した動作情報を動作情報記憶部231に記憶する(ステップS2)。
次に、通信制御部223は、動作情報記憶部231から動作情報を読み出す(ステップS3)。
次に、通信部25は、通信制御部223によって読み出された動作情報を定期的にデータ分析装置100へ送信する(ステップS4)。
次に、データ分析装置100の通信部13は、電化機器200によって送信された動作情報を受信する(ステップS5)。通信部13は、受信した動作情報を情報処理部111へ出力する。
次に、情報処理部111は、動作情報を取得すると、動作情報と時間情報とを対応付けた時系列データを生成する(ステップS6)。時間情報は、情報処理部111が時系列データを生成する時刻である。なお、時間情報は、通信部13が動作情報を受信した時刻であってもよい。
次に、情報処理部111は、生成した時系列データを時系列データ記憶部121に記憶する。
なお、動作情報と時間情報とを対応付けた時系列データは、電化機器200の通信制御部223によって生成されてもよい。この場合、通信制御部223は、動作情報記憶部231から動作情報を読み出し、読み出した動作情報と時間情報とを対応付けた時系列データを生成する。このとき、時間情報は、通信制御部223が時系列データを生成する時刻であってもよい。また、時間情報は、動作情報取得部222が動作情報を取得した時刻であってもよい。そして、通信部25は、生成された時系列データを定期的にデータ分析装置100へ送信する。データ分析装置100の通信部13は、電化機器200によって送信された時系列データを受信する。通信部13は、受信した時系列データを情報処理部111へ出力する。情報処理部111は、取得した時系列データを時系列データ記憶部121に記憶する。
また、動作情報が一定の時間間隔で取得されていない場合、情報処理部111によって時系列データ記憶部121に記憶される時系列データは、不等間隔な時系列データである。
図5は、本開示の実施の形態におけるデータ分析装置の異常判定処理を示すフローチャートである。
まず、データ分析装置100の情報処理部111は、入力部14によって入力された異常判定要求を取得する(ステップS11)。異常判定要求は、例えば、異常判定対象の電化機器200の識別情報、異常判定対象のセンサ情報及び異常判定対象期間情報などの電化機器200の異常判定に必要な全ての情報を含む。
次に、時系列データ抽出部112は、異常判定要求に応じて、時系列データ記憶部121から該当する異常判定対象の時系列データを抽出する(ステップS12)。すなわち、時系列データ抽出部112は、時系列データ記憶部121に記憶されている時系列データの中から、異常判定要求に含まれる識別情報、センサ情報及び異常判定対象期間情報に対応する時系列データを抽出する。
次に、算出処理部113は、時系列データ抽出部112によって抽出された異常判定対象の時系列データに基づいて自己相関関数を算出する自己相関関数算出処理を実行する(ステップS13)。算出処理部113による自己相関関数算出処理の詳細については、図6を用いて後述する。
次に、データ分析部117は、算出処理部113によって自己相関関数が算出されたか否かを判断する(ステップS14)。ここで、自己相関関数が算出されなかったと判断された場合(ステップS14でNO)、データ分析部117は、異常判定要求によって指示された異常判定ができなかったことをユーザに通知するための判定不可通知画面を生成する(ステップS15)。
次に、出力部15は、データ分析部117によって生成された判定不可通知画面を表示する(ステップS16)。ユーザは、出力部15に表示された判定不可通知画面を確認することによって、電化機器200の異常判定が行われなかったことを知ることができる。
なお、本実施の形態では、自己相関関数が算出されなかったと判断された場合、異常判定要求によって指示された異常判定ができなかったことをユーザに通知するための判定不可通知画面が生成されるが、本開示は特にこれに限定されず、自己相関関数が算出されなかったと判断された場合、ステップS15及びステップS16の処理が行われずに、異常判定処理が終了されてもよい。
一方、自己相関関数が算出されたと判断された場合(ステップS14でYES)、データ分析部117は、算出処理部113によって算出された自己相関関数に基づいて、異常判定対象の時系列データに異常があるか否かを判定する(ステップS17)。データ分析部117は、例えば、算出処理部113によって算出された自己相関関数に基づいて、自己相関係数を算出し、算出した自己相関係数が所定の正常範囲内に収まっているか否かを判定する。データ分析部117は、算出した自己相関係数が所定の正常範囲内に収まっていると判定した場合、異常判定対象の時系列データに異常がなく、正常であると判定する。また、データ分析部117は、算出した自己相関係数が所定の正常範囲内に収まっていないと判定した場合、異常判定対象の時系列データに異常があると判定する。
なお、データ分析部117は、算出処理部113によって算出された自己相関関数を機械学習における入力変数として用いることで、異常判定対象の時系列データに異常があるか否かの異常判定結果を出力してもよい。データ分析部117は、算出処理部113によって算出された自己相関関数を用いて、異常判定対象の時系列データに異常があるか否かを判定する処理であれば、どのような処理であってもよい。
次に、データ分析部117は、異常判定対象の時系列データに異常があるか否かを表す異常判定結果に基づいて、異常判定結果表示画面を生成する(ステップS18)。なお、異常判定結果表示画面については後述する。
次に、出力部15は、データ分析部117によって生成された異常判定結果表示画面を表示する(ステップS19)。ユーザは、出力部15に表示された異常判定結果表示画面を確認することによって、電化機器200に異常があるか否かを知ることができる。
図6は、図5のステップS13における自己相関関数算出処理を示すフローチャートである。自己相関関数算出処理の導出に至った過程は後述する。
まず、時間差集合生成部114は、時系列データ抽出部112によって抽出された異常判定対象の時系列データの観測点数が3個以上であるか否かを判定する(ステップS21)。ここで、電化機器200の時系列データの観測点数が3個以上ではないと判定された場合、すなわち、電化機器200の時系列データの観測点数が2個以下であると判定された場合(ステップS21でNO)、自己相関関数算出処理が終了する。
一方、電化機器200の時系列データの観測点数が3個以上であると判定された場合(ステップS21でYES)、時間差集合生成部114は、異常判定対象の時系列データの時間情報に基づいて、全ての観測点間の時間差の絶対値を算出し、算出した時間差の集合である第1集合を生成する(ステップS22)。
次に、時間差集合生成部114は、第1集合において、重複する時間差を削除した第3集合を生成する(ステップS23)。
次に、自己相関係数集合生成部115は、異常判定対象の時系列データと、時間差集合生成部114によって生成された第3集合とに基づいて、第3集合に含まれる全ての時間差について自己相関係数を算出し、算出した自己相関係数の集合である第2集合を生成する(ステップS24)。なお、自己相関係数は、後述する式(4)によって算出される。また、自己相関係数集合生成部115は、第3集合に基づいて、第3集合に含まれる全ての時間差について自己相関係数を算出する。
次に、自己相関関数算出部116は、時間差集合生成部114によって生成された第3集合と、自己相関係数集合生成部115によって生成された第2集合とに基づいて、第3集合と第2集合との関係を表す自己相関関数を算出する(ステップS25)。第3集合と第2集合との関係を表す自己相関関数は、例えば、第3集合を説明変数とし、第2集合を目的変数とした多項式近似又はガウシアン近似などの近似手法によって算出される。このとき、自己相関係数は−1から1までの値しかとり得ず、また、時間差が0のときに自己相関係数は1になるため、自己相関関数を算出する際はこれらの制約条件を加えることが望ましい。すなわち、自己相関関数算出部116は、第2集合と第3集合とに基づいて、自己相関関数の出力値が−1以上1以下になるように、自己相関関数を算出する。
また、本実施の形態において、ステップS23の処理の後、時間差集合生成部114は、第3集合の要素に0を付加してもよい。この場合、自己相関関数算出部116は、要素に0が付加された第3集合と第2集合とに基づいて、第3集合と第2集合との関係を表す自己相関関数を算出してもよい。このとき、自己相関関数算出部116は、要素に0が付加された第3集合と第2集合とに基づいて、自己相関関数の出力値が−1以上1以下になるように、自己相関関数を算出してもよい。
また、本実施の形態では、ステップS23で第3集合を生成しているが、本開示は特にこれに限定されず、第3集合を生成しなくてもよい。この場合、自己相関係数集合生成部115は、時間差集合生成部114によって生成された第1集合に基づいて、第1集合に対応する自己相関係数を算出してもよく、算出した自己相関係数の集合である第2集合を生成してもよい。そして、自己相関関数算出部116は、第1集合と第2集合とに基づいて、第1集合と第2集合との関係を表す自己相関関数を算出してもよい。
また、自己相関関数算出部116は、第3集合と第2集合との関係を表す自己相関関数を算出する際、ステップS23で削除した各時間差の重複数を鑑みた、重み付け近似によって自己相関関数を算出してもよい。具体的には、重複数が1であった時間差は、重複数が0であった時間差に比べて、近似の際に2倍の重みが与えられる。時間差集合生成部114は、第1集合と第3集合とに基づいて、第1集合から削除した重複する時間差の集合に対応する重複削除数の集合である第4集合を生成してもよい。そして、自己相関関数算出部116は、第2集合と第3集合と第4集合とに基づいて、自己相関関数を算出してもよい。このとき、時間差集合生成部114は、第3集合の要素に0を付加してもよいし、第3集合の要素に0を付加しなくてもよい。また、自己相関関数算出部116は、第2集合と第3集合と第4集合とに基づいて、自己相関関数の出力値が−1以上1以下になるように、自己相関関数を算出してもよい。
図7は、本開示の実施の形態における時系列データ記憶部のデータベース構成の一例を示す図である。時系列データ記憶部121は、電化機器を識別するための識別情報を示す電化機器ID列、時間情報を示すタイムスタンプ列、センサ値情報を示す室内配管温度列、及びセンサ値情報を示す風量列を有する。
タイムスタンプ列には、電化機器200の動作情報に対応した時間情報が格納されている。タイムスタンプ列に格納される情報は、時刻を示す文字列又はシリアル値など、時間又は時刻を示す情報であれば何でもよい。図7に示すデータベースのタイムスタンプ列の1行目には、一例として、動作情報に対応した時間情報を示す「2017−12−22 15:27:11」という情報が格納されている。
電化機器ID列、室内配管温度列及び風量列には、電化機器200の動作情報が格納されている。時系列データ記憶部121は、電化機器200から他の動作情報が取得される場合、電化機器200から取得される他の動作情報を格納するための列を増やしてもよい。電化機器200から取得される動作情報を示す列は、電化機器200の種類によって変化する。電化機器200の種類ごとに、異なる時系列データ記憶部121に電化機器200から取得された動作情報を格納することが望ましい。
図7に示すデータベースの電化機器ID列には、一例として、電化機器200の電化機器IDを示す「XXX」という情報が格納されている。この情報は、電化機器200を識別するための情報が「XXX」であることを示している。図7に示すデータベースの室内配管温度列の1行目には、電化機器200の室内配管温度を測定するセンサの値を示す「7」という情報が格納されている。この情報は、電化機器200の室内配管温度が、7度であったことを示している。また、図7に示すデータベースの風量列の1行目には、電化機器200の風量を測定するセンサの値を示す「0.5」という情報が格納されている。この情報は、電化機器200の吹き出し風量が、0.5m3/hであったことを示している。
以下、自己相関関数算出処理の導出に至った過程について説明する。
定常過程時系列データから、一定とは限らない時間間隔ごとにN(N>2)個の標本が、t1からtN(tは、時刻又は時間を示す情報)まで観測されたとする。この観測された離散時系列データをXtとし、その要素を{xt1、xt2、・・・、xtN}(xtは、時刻又は時間を示すtにおける観測値を示す)とする。このとき、離散時系列データXtの自己相関関数R(h)は、以下に示す式(1)によって定義される。なお、式(1)における変数hは自己相関係数算出における時間差を示す。
ここで、離散時系列データXtは定常過程時系列データから取得された標本であるため、下記の式(2)及び式(3)が成り立つ。なお、μは標本平均を示し、σ2は標本分散を示す。
式(2)及び式(3)より、式(1)は、以下に示す式(4)と表される。
式(4)より、変数hに、自己相関係数を算出したい時間差の値を代入することで、所望の自己相関係数を得ることができる。つまり、時間差aにおける離散時系列データXtの自己相関係数R(a)は、以下に示す式(5)によって算出される。ただし、離散時系列データXtの各要素について、xtk=xtl+a(k及びlは1からNまでの自然数)を満たすk及びlの組み合わせが存在しない場合、その時間差aにおける自己相関係数は算出することができない。
ここで、要素xtiと要素xtjとの取得時間間隔をΔti,j(i及びjは1からNまでの自然数、且つ、i≠j)と表すとすると、時間差Δti,jについてはxtk=xtl+Δti,jを満たすk、lの組み合わせが必ず存在するため、式(4)より自己相関係数を算出することができる。
つまり、標本の取得時間間隔が一定か否かに関わらず、N個の標本から抽出される任意の2個の要素の組み合わせNC2個については、その2つの要素の時間間隔における自己相関係数は式(4)より算出し得る。
ここで、自己相関係数を算出し得る時間差の集合Hは、H={Δti,j}となる。この集合Hに算出したい離散時系列データXtの自己相関係数の時間差が含まれている場合、式(4)より自己相関係数を得ることが可能となる。しかし、集合Hに算出したい離散時系列データXtの自己相関係数の時間差が含まれていない場合、あるいは、集合Hに算出したい離散時系列データXtの自己相関係数の時間差が含まれていた場合でも、その時間差に該当するΔti,jの要素数が十分でないと、式(4)における右辺の分子で算出される積の標本平均(期待値)について、母平均の推定精度が低下する。すなわち、算出したい離散時系列データXtの自己相関係数の時間差に該当するΔti,jの要素数が少ない場合、自己相関係数による母自己相関係数の推定精度が低下する。特に、離散時系列データXtが不等間隔な時系列データであった場合、算出したい離散時系列データXtの自己相関係数の時間差に該当するΔti,jの要素数が単数であることも想定される。
上記課題を解決するため、本開示では、式(4)における変数hに、任意の実数を入力可能とし、かつ、高い精度で母自己相関係数を推定可能とするよう、得られた標本を基に自己相関関数を近似によって再構築する。以下、その手順について説明する。
自己相関係数を算出し得る時間差の集合Hについて、集合Hの要素に重複する値が含まれる場合、その重複する値を削除する。集合Hから重複する値を削除した集合をH´とし、削除した要素数をεとすると、集合H´の要素数はNC2−ε個である。なお、i=1のとき、Δt1,2≠Δt1,3≠Δt1,4≠…≠Δt1,N、であるため、重複する値を消去しても、集合Hには必ずN−1以上の要素は存在し、つまり、NC2−ε≧N−1が成り立つ。集合H´の全ての要素について、式(4)より自己相関係数を算出し、集合H´の全ての要素から算出された自己相関係数の集合をAとする。ここで、自己相関係数は、時間差0のとき必ず1を示すため、集合H´の要素に0を加え、集合Aの要素に1を加える。そして、集合H´を説明変数とし、集合Aを目的変数とし、集合H´と集合Aとの関係を表す自己相関関数R´(h)を算出する。
なお、集合H´を説明変数とし、集合Aを目的変数とした、集合H´と集合Aとの関係を表す自己相関関数を算出する際に用いる近似手法は、線形近似、多項式近似又はガウシアン近似など何でもよいが、離散時系列データXtの性質によって最適な近似手法を選択することが望ましい。また、自己相関係数は−1から1までの値しかとり得ないため、この制約条件を鑑みた近似手法が有効である。何れの近似手法を選択した場合でも、自己相関関数R´(h)の算出に用いられる変数の数はNC2−ε+1個であり、NC2−ε+1≧Nが成り立つ。つまり、離散時系列データXtの欠損を近似によって補間する従来手法で用いられる変数の数がN個であることと比較して、近似の精度が向上する。
なお、集合Hの各要素の重複数を鑑みて、集合H´の各要素に重みを付けて集合H´と集合Aとの関係を表す自己相関関数を算出する手法も有効である。
上記手順に従って得られた自己相関関数R´(h)における変数hには任意の実数が代入可能であるため、集合Hに算出したい離散時系列データXtの自己相関係数の時間差が含まれていない場合でも、自己相関関数R´(h)により自己相関係数が算出可能である。
また、集合Hに算出したい離散時系列データXtの自己相関係数の時間差が含まれている場合でも、上記手順に従って自己相関関数を近似によって再構築することで、算出したい離散時系列データXtの自己相関係数の時間差に近い時間差の自己相関係数も考慮した値を得ることが可能となるため、その自己相関係数の母自己相関係数推定精度が向上する。
また、自己相関関数R´(h)は、NC2−ε+1個の変数を用いた近似によって算出されているので、従来の観測されたN個の変数を用いた近似と比較し、自己相関関数の推定精度が高い。
以下、電化機器200が、データ分析装置100へ動作情報を送信した際の具体的な処理について説明する。
電化機器IDが「XXX」を示す電化機器200が、2017年12月22日15時27分11秒に、室温配管温度及び風量それぞれが「7」及び「0.5」を示す動作情報を、データ分析装置100へ送信したとする。図4に示すように、データ分析装置100は、動作情報を受信すると、動作情報と時間情報とを含む時系列データを生成して記憶する。なお、本実施の形態において、データ分析装置100の情報処理部111が時系列データを生成する時刻は、電化機器200が動作情報を送信した時刻と同じである。
このとき、データ分析装置100の情報処理部111は、図7に示す時系列データ記憶部121のデータベースに、電化機器ID列が「XXX」を示し、タイムスタンプ列が「2017−12−22 15:27:11」を示し、室内配管温度列が「7」を示し、風量列が「0.5」を示す新しい行を追加する。
以下、データ分析装置100における時系列データ抽出部112、算出処理部113及びデータ分析部117が、異常判定要求を取得した際に行う具体的な処理について説明する。
電化機器IDが「XXX」を示す電化機器200について、2017年12月22日15時28分30秒から2017年12月22日15時30分37秒までの期間の室内配管温度が異常であるか否かの判定をユーザが要求したとする。
図8は、本開示の実施の形態に係るデータ分析装置において、異常判定要求の入力時に表示される表示画面の一例を示す図である。出力部15は、異常判定要求の入力を受け付けるための表示画面を表示し、入力部14は、ユーザによる異常判定要求の入力を受け付ける。図8に示すように、ユーザは、入力部14を介して、異常判定を行う電化機器200の電化機器IDと、異常判定対象のセンサと、異常判定を行う期間とを指定する。ユーザにより、異常判定要求が入力されると、データ分析装置100の時系列データ抽出部112は、指定された電化機器ID、異常判定対象のセンサ及び異常判定を行う期間に対応する時系列データを抽出する。
時系列データ抽出部112は、図7に示すデータベースの中から、電化機器ID列に「XXX」が格納されており、タイムスタンプ列に2017年12月22日15時28分30秒から2017年12月22日15時30分37秒までの期間を示す時刻が格納されている行における、タイムスタンプ列及び室内配管温度列を異常判定対象の時系列データとして抽出する。
図9は、本開示の実施の形態における時系列データ抽出部によって時系列データ記憶部から抽出される異常判定対象の時系列データの一例を示す図である。
本実施の形態では、電化機器IDが「XXX」を示す電化機器について、2017年12月22日15時28分30秒から2017年12月22日15時30分37秒までの期間の室内配管温度が異常であるか否かの判定が、ユーザにより要求された。そのため、図9に示すように、2017年12月22日15時28分30秒から2017年12月22日15時30分37秒までの期間について、電化機器のタイムスタンプ及び室内配管温度が、自己相関関数算出処理に用いる異常判定対象の時系列データとして抽出されている。
時系列データの抽出が終了すると、算出処理部113は、自己相関関数算出処理を実行する。自己相関関数算出処理が実行されると、図6に示すステップS21〜ステップS25の処理が順に実行される。
まず、ステップS21において、時間差集合生成部114は、時系列データ抽出部112によって抽出された異常判定対象の時系列データの観測点数が3個以上であるか否か、すなわち時系列データ記憶部121のデータベースから抽出された時系列データの行数が3行以上であるか否かを判定する。ここで、図9に示すように、時系列データ抽出部112によって抽出された異常判定対象の時系列データの行数は5であるため、ステップS22に処理が移行する。
次に、ステップS22において、時間差集合生成部114は、時系列データ抽出部112によって抽出された異常判定対象の時系列データに基づいて、全ての観測点間の時間差の絶対値を算出し、算出した時間差の集合である第1集合を生成する。時間差集合生成部114は、例えば、2017年12月22日15時28分30秒に観測されたデータと、2017年12月22日15時29分25秒に観測されたデータとの観測点間の時間差の絶対値を「55秒」と算出する。ここで、図9に示すデータベースから抽出された異常判定対象の時系列データにおいて、観測点数が5個であるため、5個の観測点から2個の観測点を選ぶ組み合わせの総数は10個であり、10個の時間差が得られる。具体的には、全ての観測点間の時間差としては、「20秒」、「35秒」、「35秒」、「37秒」、「55秒」、「57秒」、「72秒」、「92秒」、「92秒」及び「127秒」が算出される。
次に、ステップS23において、時間差集合生成部114は、第1集合において、重複する時間差を削除した第3集合を生成する。時間差集合生成部114は、第1集合である「20秒」、「35秒」、「35秒」、「37秒」、「55秒」、「57秒」、「72秒」、「92秒」、「92秒」及び「127秒」から、重複する時間差を削除する。これにより、最終的に、観測点間の時間差として、「20秒」、「35秒」、「37秒」、「55秒」、「57秒」、「72秒」、「92秒」及び「127秒」が第3集合として生成される。
次に、ステップS24において、自己相関係数集合生成部115は、時系列データ抽出部112によって抽出された異常判定対象の時系列データと、時間差集合生成部114によって生成された観測点間の時間差の第3集合とに基づいて、観測点間の時間差の第3集合における自己相関係数を算出し、算出した自己相関係数の集合である第2集合を生成する。ここで、異常判定対象の時系列データの室内配管温度の標本平均μは、式(2)を用いて「3」と算出され、異常判定対象の時系列データの室内配管温度の標本分散σ2は、式(3)を用いて「3.2」と算出される。例えば、観測点間の時間差「35秒」の自己相関係数は、μ=3、σ2=3.2及びh=35を式(4)に代入することにより、以下に示す式(6)によって算出される。
ここで、tが「2017年12月22日15時28分30秒」であるとき、t+35は「2017年12月22日15時29分05秒」であり、異常判定対象の時系列データにおいて、「2017年12月22日15時28分30秒」の観測点と「2017年12月22日15時29分05秒」の観測点とは共に存在する。同様に、tが「2017年12月22日15時30分02秒」であるとき、t+35は「2017年12月22日15時30分37秒」であり、異常判定対象の時系列データにおいて、「2017年12月22日15時30分02秒」の観測点と「2017年12月22日15時30分37秒」の観測点とは共に存在する。このように、異常判定対象の時系列データにおいて、t及びt+35の観測点が共に存在するようなtは、「2017年12月22日15時28分30秒」及び「2017年12月22日15時30分02秒」のみであり、このときのt+35は、それぞれ、「2017年12月22日15時29分05秒」及び「2017年12月22日15時30分37秒」である。異常判定対象の時系列データにおいて、時刻「2017年12月22日15時28分30秒」における観測値は「2」であり、時刻「2017年12月22日15時29分05秒」における観測値は「4」であり、時刻「2017年12月22日15時30分02秒」における観測値は「6」であり、時刻「2017年12月22日15時30分37秒」における観測値は「1」である。したがって、式(6)における期待値算出部を展開すると、以下に示す式(7)で表され、観測点間の時間差「35秒」の自己相関係数は「−0.781」と算出される。
観測点間の時間差としては、「20秒」、「35秒」、「37秒」、「55秒」、「57秒」、「72秒」、「92秒」及び「127秒」が算出されており、それぞれの観測点間の時間差における自己相関係数は、「−0.313」、「−0.781」、「−0.938」、「0.313」、「0.938」、「0.625」、「−0.781」及び「0.625」と算出される。
図10は、本開示の実施の形態に係る自己相関係数集合生成部によって算出される、観測点間の時間差に対応する自己相関係数の一例を示す図である。
自己相関関数算出部116は、時間差集合生成部114によって生成された時間差の第3集合と、自己相関係数集合生成部115によって生成された自己相関係数の第2集合とに基づいて、時間差の第3集合と自己相関係数の第2集合との関係を表す自己相関関数を算出する。例えば、説明変数である時間差として、「20秒」、「35秒」、「37秒」、「55秒」、「57秒」、「72秒」、「92秒」及び「127秒」が算出されており、それぞれの時間差に対応する目的変数である自己相関係数として、「−0.313」、「−0.781」、「−0.938」、「0.313」、「0.938」、「0.625」、「−0.781」及び「0.625」が算出されている。そのため、時間差の第3集合と自己相関係数の第2集合との関係を表す自己相関関数は、最小二乗法を用いるとともに、時間差が0のときに自己相関係数が1を示すような制約を加えることにより、以下に示す4次多項式の式(8)で表される。式(8)における変数hは時間差を示し、R(h)は自己相関関数を示す。
R(h)=4.24*10−7h4−1.08*10−4h3+8.69*10−3h2−2.32*10−1h+1・・・(8)
自己相関関数算出処理が終了すると、データ分析部117は、異常判定処理を実行する。
データ分析部117は、自己相関関数算出処理で算出された自己相関関数に基づいて、異常判定対象の時系列データの異常を判定する。例えば、電化機器200の室内配管温度について、時間差40秒に対応する自己相関係数が0.5以下であれば、室内配管温度の時系列データに異常があることが知られている場合、データ分析部117は、自己相関関数算出部116によって算出された自己相関関数に基づいて、電化機器200の室内配管温度の時間差40秒に対応する自己相関係数が0.5以下であるか否かを判定する。
ここで、データ分析部117は、時間差40秒に対応する自己相関係数が0.5以下であると判定した場合、室内配管温度の時系列データに異常があると判定する。また、データ分析部117は、時間差40秒に対応する自己相関係数が0.5より大きいと判定した場合、室内配管温度の時系列データに異常がない、すなわち室内配管温度の時系列データが正常であると判定する。電化機器200の室内配管温度の時間差40秒に対応する自己相関係数は、式(8)にh=40を代入することで「−0.203」と算出され、自己相関係数が0.5以下であるため、データ分析部117は、室内配管温度の時系列データに異常があると判定する。
データ分析部117は、自己相関関数算出部116によって算出された自己相関関数に所定の時間差を代入することにより、所定の時間差に対応する自己相関係数を算出し、算出した自己相関係数が所定の閾値以下であるか否かを判定する。本実施の形態では、室内配管温度の時系列データの異常判定において、所定の時間差が40秒であるときの自己相関係数が所定の閾値である0.5以下である場合に、室内配管温度の時系列データに異常があることが予め知られている。そのため、データ分析部117は、自己相関関数算出部116によって算出された自己相関関数に所定の時間差である40秒を代入することにより、所定の時間差に対応する自己相関係数を算出し、算出した自己相関係数が所定の閾値である0.5以下であるか否かを判定している。なお、上記の所定の時間差及び所定の閾値は一例であり、上記の値に限定されない。また、上記の所定の時間差及び所定の閾値は、異常判定対象に応じて設定されることが好ましい。メモリ12は、所定の時間差及び所定の閾値を異常判定対象に対応付けて予め記憶する。データ分析部117は、メモリ12に記憶されている所定の時間差及び所定の閾値を用いて、異常判定対象の時系列データに異常があるか否かを判定する。
出力部15は、データ分析部117による異常判定結果を表示する。データ分析部117は、異常判定対象の時系列データに異常があるか否かを表す異常判定結果に基づいて、異常判定結果表示画面を生成し、生成した異常判定結果表示画面を出力部15へ出力する。
図11は、本開示の実施の形態に係るデータ分析部によって生成される異常判定結果表示画面の一例を示す図である。
図11に示す異常判定結果表示画面には、電化機器200の2017年12月22日15時28分30秒から2017年12月22日15時30分37秒までの期間に、室内配管温度の時系列データに異常があったことを示す異常判定結果が表示されている。データ分析部117は、異常判定対象の時系列データに異常があるか否かの異常判定結果に応じて異常判定結果表示画面を生成する。そして、出力部15は、データ分析部117によって生成された異常判定結果表示画面を表示する。
上記のように、時系列データに含まれるN個(Nは3以上の自然数)の第3情報それぞれに含まれる第2情報を用いて、観測点それぞれの時間差の絶対値が算出され、算出された時間差の集合が生成され、時間差の絶対値を算出した第3情報の組それぞれに対して、各第1情報の値の相関関係を表す自己相関係数が算出され、算出された自己相関係数の集合が生成され、時間差の集合と自己相関係数の集合との関係を表す自己相関関数が算出される。
したがって、離散時系列データの欠損を近似によって補間する従来手法で用いられる変数の数がN個であるのに対して、本開示の自己相関関数の算出に用いられる変数の数は、N個の第3情報から抽出される任意の2個の第2情報の組み合わせの数であるNC2個であるので、時系列データが等間隔にデータが取得されない離散時系列データであっても、取得されたデータ数より多いデータを用いて離散時系列データから高い精度で自己相関関数を算出することができる。また、高い精度で算出された自己相関関数を用いて、電化機器のデータ分析処理を正確に行うことができる。
なお、本実施の形態では、データ分析部117は、自己相関関数算出処理で算出された自己相関関数を用いて、異常判定対象の時系列データに異常があるか否かを判定する異常判定処理を行っているが、本開示は特にこれに限定されず、自己相関関数算出処理で算出された自己相関関数を、コレログラムの描画、将来予測又はクラスタリングなどの任意のデータ分析に用いてもよい。自己相関関数算出処理で算出された自己相関関数が任意のデータ分析に用いられる場合、本実施の形態における異常判定要求は別の要求に置き換えられてもよいし、異常判定処理及び異常判定結果表示処理が、自己相関関数の利用目的に応じて別処理に置き換えられてもよい。
コレログラムとは、横軸を時間差とし、縦軸を自己相関係数とする自己相関関数のグラフのことである。時系列データから算出された自己相関関数が、コレログラムの描画に用いられる場合、例えば、入力部14は、コレログラム描画期間、コレログラム描画対象センサ及びコレログラムのビン幅などを含むコレログラム描画要求の入力をユーザから受け付ける。データ分析部117は、自己相関関数算出処理で算出された自己相関関数を用いて、指定されたビン幅で区切った時間差ごとに自己相関係数を示したコレログラムを生成し、生成したコレログラムを描画した表示画面を生成する。そして、出力部15は、コレログラムを描画した表示画面を表示する。
また、時系列データから算出された自己相関関数が、将来予測に用いられる場合、例えば、入力部14は、将来予測に用いる過去の期間、将来予測対象センサ及び将来予測で出力される未来の期間などを含む将来予測要求の入力をユーザから受け付ける。データ分析部117は、自己相関関数算出処理で算出された自己相関関数を用いて、指定された未来の期間のセンサ値の変動を予測し、予測結果を表す予測結果表示画面を生成する。そして、出力部15は、予測結果を表す予測結果表示画面を表示する。
さらに、時系列データから算出された自己相関関数が、クラスタリングに用いられる場合、例えば、入力部14は、クラスタリング対象期間及びクラスタリング対象センサなどを含むクラスタリング要求の入力をユーザから受け付ける。データ分析部117は、自己相関関数算出処理で算出された自己相関関数を用いて、指定されたクラスタリング対象期間におけるクラスタリング対象センサの時系列データが属するクラスタ名を特定し、特定したクラスタ名を表すクラスタリング結果表示画面を生成する。そして、出力部15は、クラスタリング対象センサの時系列データが属するクラスタ名を表すクラスタリング結果表示画面を表示する。
また、本実施の形態におけるデータ分析装置100は、家電機器、工場設備又は車載機器等の異常判定又は将来予測に用いることができる。また、本実施の形態におけるデータ分析装置100は、市況情報に基づく株価の予測に用いることができる。さらに、本実施の形態におけるデータ分析装置100は、生体情報に基づく健康状態の診断又は予測等に用いることができる。すなわち、データ分析装置100は、時系列的な種々のログ情報に基づき、ログ情報と相関のある種々の状態の診断又は予測に用いることができる。
なお、上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
本開示の実施の形態に係る装置の機能の一部又は全ては典型的には集積回路であるLSI(Large Scale Integration)として実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。また、集積回路化はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後にプログラムすることが可能なFPGA(Field Programmable Gate Array)、又はLSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
また、本開示の実施の形態に係る装置の機能の一部又は全てを、CPU等のプロセッサがプログラムを実行することにより実現してもよい。
また、上記で用いた数字は、全て本開示を具体的に説明するために例示するものであり、本開示は例示された数字に制限されない。
また、上記フローチャートに示す各ステップが実行される順序は、本開示を具体的に説明するために例示するためのものであり、同様の効果が得られる範囲で上記以外の順序であってもよい。また、上記ステップの一部が、他のステップと同時(並列)に実行されてもよい。