JP2017076359A - マルチセンサーデータ要約 - Google Patents

マルチセンサーデータ要約 Download PDF

Info

Publication number
JP2017076359A
JP2017076359A JP2016047735A JP2016047735A JP2017076359A JP 2017076359 A JP2017076359 A JP 2017076359A JP 2016047735 A JP2016047735 A JP 2016047735A JP 2016047735 A JP2016047735 A JP 2016047735A JP 2017076359 A JP2017076359 A JP 2017076359A
Authority
JP
Japan
Prior art keywords
sensor
sensors
clusters
rules
sensor clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016047735A
Other languages
English (en)
Other versions
JP6219428B2 (ja
Inventor
アガワル プネート
Agarwal Puneet
アガワル プネート
シャロフ ゴータム
Shroff Gautam
シャロフ ゴータム
サイキア シャルミマーラ
Saikia Sarmimala
サイキア シャルミマーラ
シュリニヴァサン アシュウィン
Srinivasan Ashwin
シュリニヴァサン アシュウィン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tata Consultancy Services Ltd
Original Assignee
Tata Consultancy Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd filed Critical Tata Consultancy Services Ltd
Publication of JP2017076359A publication Critical patent/JP2017076359A/ja
Application granted granted Critical
Publication of JP6219428B2 publication Critical patent/JP6219428B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q9/00Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

【課題】マルチセンサーデータを要約するためのシステムおよび方法を提供する。
【解決手段】複数のセンサーに関連付けられたセンサーデータから、複数のヒストグラムを算出する502。それぞれセンサーの各ヒストグラムをクラスタリングして第1の複数のセンサークラスターを取得し504、それらから複数のルールの第1のセットを抽出する506。第1の複数のセンサークラスターの中からの2つ以上のセンサークラスターを選択的に合併し、第2の複数のセンサークラスターを取得し508、それらから複数のルールの第2のセットを抽出する510。複数の相関性のあるセンサーのセットを、複数のセットの第2のルールに基づいて特定する512。複数の相関性のあるセンサーのセットから複数のルールの第3のセットを抽出する514。複数のルールの第3のセットは、マルチセンサーデータを要約し、複数の顕著な共起センサー動作を表す。
【選択図】図5

Description

関連出願への相互参照および優先権
本出願は、2015年10月17日にインド国へ出願されたインド国特許出願第3945/MUM/2015(発明の名称:マルチセンサーデータの要約)に基づく優先権を主張する。該インド国特許出願の開示内容の全てが、参照によりここに組み込まれる。
本発明は、一般に、マルチセンサーデータ要約(multi-sensor data summarization)に関し、より具体的には、クラスタリング(clustering)ベースのマルチセンサーデータの要約に関する。
近代的な産業機器は、複数のコンポーネント部品およびそのサブシステムの動作を連続的にモニタリングする膨大な数のセンサーを備えている。例えば、産業機械(例えば、民用および商用車両、航空機、発電プラント、製造プラント)は、一般的に、膨大な数のセンサーを備えており、各センサーは、無線で、自身の読み取りを連続的に送信する。ユビキタスインターネット接続性の増加(携帯電話、大都市のWifiネットワークを介した接続であることが多い)により、全ての種類の近代的機器は、センサーの読み取りを、その製造者(例えば、自動車、エンジン、またはコンポーネントOEMs)およびその操作者(例えば、空港、工場、発電プラント)に定期的に送信する。産業機器によって送信されたデータは、複数の通常と異なる使用パターン(different usage patterns)や同様の機械の動作を判別するために利用される。しかしながら、複数の機械からのセンサーデータは、通常、高次元(high-dimensional)なものであるため、そのようなデータをクラスタリングし、機械の動作に関するパターンを発見することは、複雑かつ困難であることが多い。
本発明者らは、上述のような従来システムにおけるいくつかの技術的問題を認識している。複数の機械からのセンサーデータは、通常、高次元なものであり、そのようなデータをクラスタリングし、機械に関する複数のパターンを発見することは、複雑かつ困難であることが多い。さらに、現在の複数の機械の使用パターンは、1日の期間に渡って可視化されるか、もしくは、連続運転が、おそらくは数ダーツまたは数百のセンサーのそれぞれによって取得される複数の値の分布を介して、複数のヒストグラムとして可視化される。このような複数のヒストグラムの数は、何十万という数になり得る。そのため、そのような日々の動作を、複数の優位的パターン(dominant patterns)として簡潔に要約(summarize)することは、複雑かつ困難である。
以下の記述は、本発明の基本的な理解を提供するために、本発明のいくつかの実施形態の簡略化された要約を提供するものである。この概要は、実施形態の詳細な概観ではない。本概要は、本発明の重要/決定的な要素を特定、または本発明の範囲を正確に記述するよう意図されたものではない。本概要の唯一つの目的は、以下に提供されるより詳細な記述の前置きとして、簡略化された形式で、いくつかの実施形態を提供することにある。
上述の事項を参照し、実施形態の1つにおいて、マルチセンサーデータを要約するための方法およびシステムが提供される。1つの様態において、マルチセンサーデータを要約するためのコンピューター実施方法が提供される。本方法は、1つ以上のハードウェアプロセッサーを用いて、複数のセンサーに関連付けられたセンサーデータから、複数のヒストグラムを算出する工程を含む。さらに、本方法は、1つ以上のハードウェアプロセッサーを用いて、複数のヒストグラムから、複数のセンサーのそれぞれの各ヒストグラムをクラスタリングし、各ヒストグラムの形状に基づいて、第1の複数のセンサークラスターを取得する工程を含む。第1の複数のセンサークラスターのそれぞれのセンサークラスターは、複数のセンサーの特徴的センサー(distinct sensor)の特徴的センサー動作を表す重心ヒストグラム(centroid histogram)を含む。さらに、本方法は、1つ以上のハードウェアプロセッサーを用いて、第1の複数のセンサークラスターに対し頻出パターンマイニング(frequent pattern mining)を実行し、複数のルールの第1のセット(a first set of rules)を抽出する工程を含む。複数のルールの第1のセットのルールは、複数のセンサーの複数のセンサーのセットに関連付けられており、任意の時間間隔に渡って、第1の複数のセンサークラスター内において頻繁に現れる複数のセンサークラスターのセットを含む。
さらに、本方法は、1つ以上のハードウェアプロセッサーを用いて、第1の複数のセンサークラスターの中から、2つ以上のセンサークラスターを選択的に合併し、第2の複数のセンサークラスターを取得する工程を含む。2つ以上のセンサークラスターは、複数のセンサーのセットのセンサーに対応して選択される。2つ以上のセンサークラスターは、2つ以上のセンサークラスターに関連付けられた複数のルールの第1のセットの中からの2つ以上のルール、および、センサーの2つ以上のセンサークラスター間の距離測度(distance measure)に基づいて合併される。さらに、本方法は、1つ以上のハードウェアプロセッサーを用いて、第2の複数のセンサークラスターから、複数のルールの第2のセットを抽出する工程を含む。複数のルールの第2のセットは、第2の複数のセンサークラスターに関連付けられた複数の特徴的センサー動作を示す。また、本方法は、複数のルールの第2のセットに基づいて、第2の複数のセンサークラスターから、複数の相関性のあるセンサー(correlated sensors)の複数のセットを特定する工程を含む。さらに、本方法は、1つ以上のハードウェアプロセッサーを用いて、複数の相関性のあるセンサーの1つ以上のセットから、複数のルールの第3のセットを抽出する工程を含む。複数のルールの第3のセットは、マルチセンサーデータを要約し、顕著な共起センサー動作(prominent co-occurring sensor behaviors)を表すものである。
別の実施形態において、マルチセンサーデータを要約するためのコンピューター実施システムが提供される。本システムは、複数の命令を保存しているメモリーと、該メモリーに接続された少なくとも1つのプロセッサーとを含む。少なくとも1つのプロセッサーは、複数の命令によって、複数のセンサーに関連付けられたセンサーデータから、複数のヒストグラムを算出するよう設定されている。さらに、少なくとも1つのプロセッサーは、複数の命令によって、複数のヒストグラムから、複数のセンサーのそれぞれの各ヒストグラムをクラスタリングし、各ヒストグラムの形状に基づいて、第1の複数のセンサークラスターを取得するよう設定されている。第1の複数のセンサークラスターのそれぞれのセンサークラスターは、複数のセンサーの特徴的センサーの特徴的センサー動作を表す重心ヒストグラムを含む。さらに、少なくとも1つのプロセッサーは、複数の命令によって、第1の複数のセンサークラスターに対し頻出パターンマイニングを実行し、複数のルールの第1のセットを抽出するよう設定されている。複数のルールの第1のセットのルールは、複数のセンサーの複数のセンサーのセットに関連付けられており、任意の時間間隔に渡って、第1の複数のセンサークラスター内において頻繁に現れる複数のセンサークラスターのセットを含む。
さらに、少なくとも1つのプロセッサーは、複数の命令によって、第1の複数のセンサークラスターの中から、2つ以上のセンサークラスターを選択的に合併し、第2の複数のセンサークラスターを取得するよう設定されている。2つ以上のセンサークラスターは、複数のセンサーのセットのセンサーに対応して選択される。2つ以上のセンサークラスターは、2つ以上のセンサークラスターに関連付けられた複数のルールの第1のセットの中からの2つ以上のルール、および、センサーの2つ以上のセンサークラスター間の距離測度に基づいて合併される。さらに、少なくとも1つのプロセッサーは、複数の命令によって、第2の複数のセンサークラスターから、複数のルールの第2のセットを抽出するよう設定されている。複数のルールの第2のセットは、第2の複数のセンサークラスターに関連付けられた複数の特徴的センサー動作を示す。また、少なくとも1つのプロセッサーは、複数の命令によって、複数のルールの第2のセットに基づいて、第2の複数のセンサークラスターから、複数の相関性のあるセンサーの複数のセットを特定するよう設定されている。少なくとも1つのプロセッサーは、複数の命令によって、複数の相関性のあるセンサーの1つ以上のセットから、複数のルールの第3のセットを抽出するよう設定される。ここで、複数のルールの第3のセットは、マルチセンサーデータを要約し、顕著な共起センサー動作を表す。
さらに別の実施形態において、マルチセンサーデータを要約するための方法を実行するためのコンピュータープログラムを有する(コンピュータープログラムが具体化された)非一時的コンピューター可読媒体(non-transitory computer-readable medium)が提供される。本方法は、複数のセンサーに関連付けられたセンサーデータから、複数のヒストグラムを算出する工程を含む。さらに、本方法は、複数のヒストグラムから、複数のセンサーのそれぞれの各ヒストグラムをクラスタリングし、各ヒストグラムの形状に基づいて、第1の複数のセンサークラスターを取得する工程を含む。第1の複数のセンサークラスターのそれぞれのセンサークラスターは、複数のセンサーの特徴的センサーの特徴的センサー動作を表す重心ヒストグラムを含む。さらに、本方法は、第1の複数のセンサークラスターに対し頻出パターンマイニングを実行し、複数のルールの第1のセットを抽出する工程を含む。複数のルールの第1のセットのルールは、複数のセンサーの複数のセンサーのセットに関連付けられており、任意の時間間隔に渡って、第1の複数のセンサークラスター内において頻繁に現れる複数のセンサークラスターのセットを含む。
さらに、本方法は、第1の複数のセンサークラスターの中から、2つ以上のセンサークラスターを選択的に合併し、第2の複数のセンサークラスターを取得する工程を含む。2つ以上のセンサークラスターは、複数のセンサーのセットのセンサーに対応して選択される。2つ以上のセンサークラスターは、2つ以上のセンサークラスターに関連付けられた複数のルールの第1のセットの中からの2つ以上のルール、および、センサーの2つ以上のセンサークラスター間の距離測度に基づいて合併される。さらに、本方法は、第2の複数のセンサークラスターから、複数のルールの第2のセットを抽出する工程を含む。複数のルールの第2のセットは、第2の複数のセンサークラスターに関連付けられた複数の特徴的センサー動作を示す。また、本方法は、複数のルールの第2のセットに基づいて、第2の複数のセンサークラスターから、複数の相関性のあるセンサーの複数のセットを特定する工程を含む。さらに、本方法は、複数の相関性のあるセンサーの1つ以上のセットから、複数のルールの第3のセットを抽出する工程を含む。複数のルールの第3のセットは、マルチセンサーデータを要約し、顕著な共起センサー動作を表す。
添付の図面を参照して詳細な説明が記述される。各図面中において、参照番号の左端の桁の数字は、その参照番号が最初に現れる図面の番号を示すものである。各図面において、同様の特徴およびモジュールに対して、一貫して同じ参照番号が用いられている。
図1は、本発明の実施形態に係るマルチセンサーデータを要約するためのシステムのネットワーク実施を示す図である。
図2は、実施形態に係るマルチセンサーデータを要約するためのシステムのブロック図である。
図3は、例示的な実施形態に係るマルチセンサーデータを要約するための複数の日に渡る複数のセンサーの複数のヒストグラムの例を示す図である。
図4は、例示的な実施形態に係る図3の複数のヒストグラムから生成されたグラフである。
図5は、例示的な実施形態に係るマルチセンサーデータを要約するための方法のフロー図である。
図6Aは、例示的な実施形態に係るマルチセンサーデータの要約において得られた例示的な結果を示す図である。 図6Bは、例示的な実施形態に係るマルチセンサーデータの要約において得られた例示的な結果を示す図である。 図6Cは、例示的な実施形態に係るマルチセンサーデータの要約において得られた例示的な結果を示す図である。
本分野における当業者であれば、本発明の原理を具体化する図示のシステムおよびデバイスの概念図を表す任意のブロック図を適切に理解できるであろう。同様に、任意のフローチャート、フロー図等が、コンピューター可読媒体において実質的に表され、(明示的に示され、または、示されていない)コンピューターまたはプロセッサーによって実行される様々な処理を表すことは適切に理解されるであろう。
マルチセンサーデータを要約するためのシステムおよび方法が本明細書において開示される。マルチセンサーデータは、生産機器のような産業機械から受信される。マルチセンサーデータは、実際の使用パターンを判別するために分析される。実際の使用パターンは、製品または産業機械が実際に使用された際のパターンである。実際の機器の使用パターンを理解することは、(例えば、操作者の場合)運転・メンテナンス計画を発展および改良するために重要であり、さらに、高価な保険(例えば、航空機や原子力プラントの高価な資産)の価値を証明することもできる。ここに開示される様々な実施形態は、マルチセンサーデータを要約し、複数の通常と異なる優位使用パターンと、機械の使用に関連する複数の他の特徴間の相関とを判別するための方法およびシステムが提供する。例えば、開示の方法およびシステムは、エンジンの特定の使用パターンが、そのエンジンが内部に設置された機器のタイプに対応しているか否か、または、特定の駆動動作が車両、地形等の特定のモデルに特有であるか否かを分析することを容易にする。
複数のパターン(例えば、機械の複数の使用パターン)は、任意の動作の時間間隔(例えば、1日)、または、「連続運転」に渡って、複数のセンサーのそれぞれによって取得された複数の値の分布を介して、判別される。開示の実施形態は、そのような動作の時間間隔を複数の優位パターン(dominant patterns)に簡潔に要約、すなわち、データを利用可能な大部分の機械の複数の日(most machine-days)を1つ以上のグループ内に配置することを容易にする。複数の異なるグループは、センサーデータの観測された複数の分布(例えば、複数のヒストグラム)の観点から、複数の特徴的動作パターンによって特徴づけられている。複数の異なる動作パターンは、複数のセンサーの複数の異なるサブセットによって特徴づけられている。
ここに開示される様々な実施形態は、膨大な数の機械の動作日を、複数のルールの相対的に小さなセットによって要約するための方法およびシステムを提供する。ここで、複数のルールのそれぞれは、複数の互いに異なっていてもよいセンサーの複数のクラスター(clusters of possibly different sensors)における複数の構成要素(memberships)を含む。実施形態の1つにおいて、開示のシステムは、最初に、各センサーに従って、複数の日を別々にクラスタリングし、その後、特別に構成されたグラフ内の複数の類似性(communities)を用いて、複数のクラスターを組み合わせる。ここで、特別に構成されたグラフは、同じセンサーの複数のクラスター間のヒストグラム類似点(histogram similarity)と、互いに異なる複数のセンサーの複数のクラスター内の複数の共通日(common days)を考慮したものである。この処理において、単一のセンサーのいくつかのクラスターが合併される。さらに、システムは、単一のセンサークラスター構成要素の観点から規定された複数のルールを特定する。ここで、複数のルールのそれぞれは、複数のセンサークラスターの複数の異なるセットを用いることができる。複数の日の大部分をカバーするそのような複数のルールの小さなセットは、相互重複(mutual overlaps)に基づいて、複数のルールをクラスタリングされることにより判別される。
本発明、並びに、その様々な特徴および利点の詳細は、添付の図面に示され、以下の詳細な説明において詳細に述べられた非限定的な実施形態を参照して、より十分に説明される。ここで用いられる実施例は、本発明を実施可能とし、さらに、本分野における当業者が本発明を実施することを可能とするような本発明に対する理解を容易にするためのものにすぎない。したがって、実施例は、本発明の範囲を限定するものとして解するべきではない。
本発明の方法およびシステムは、ここに記述される特定の実施形態に限定されない。さらに、本発明の方法およびシステムは、ここに記述されるその他のモジュールおよび方法とは独立および別々に実施可能である。各デバイス要素/モジュールおよび方法は、他の要素/モジュールおよび他の方法と組み合わせて用いることもできる。
マルチセンサーデータを要約するための方法およびシステムを実施するための手法が、図1〜図6Cを参照して、詳細に説明される。記述されるマルチセンサーデータを要約するための方法およびシステムの様態は、任意の数の異なるシステム、使用環境、および/または設定において実施可能であるが、実施形態は、以下の例示的なシステムの文脈において記述される。
図1を参照すると、本発明の実施形態に係るマルチセンサーデータを要約するためのシステム102のネットワーク実施100が示されている。実施形態の1つにおいて、システム102は、膨大な数の日(または「動作」)に渡って観測されたマルチセンサーデータを用いて、複数の機械の集合(a collection of machines)の複数の使用および動作パターンを、複数のルールのセットの形式で、簡潔に要約するよう構成されている。複数のルールのそれぞれは、複数のセンサーのそれぞれ異なっていてもよい複数のセットの複数のクラスター(clusters of possibly different sets of sensors)内の構成要素(memberships)によって記述される。複数のセンサークラスターのそれぞれは、任意の時間間隔(例えば、1日中)に渡るセンサーデータ/値の特定の分布を特定する。
本発明は、システム102がマルチセンサーデータを要約するために実施されているものとして説明されるが、システム102は、任意の特定の機械または環境に限定されないことは理解されるであろう。システム102は、高次元データ(例えば、マルチセンサーデータ)が含まれるセンサーデータ用に利用可能であるのと同様に、様々な領域において利用可能である。システム102は、これに限定されるものではないが、類似性検出(community detection)、頻出パターンマイニング(frequent pattern mining)、およびヒストグラムクラスタリングを含むグラフベースの技術(graph based techniques)を用いて、高次元データのサブセットを共同的に(collaborative)クラスタリングすることによって、高次元データのマルチサブスペース(multi-subspace)クラスタリングを実行するよう構成されている。システム102は、ラップトップコンピューター、デスクトップコンピューター、ノートパソコン、ワークステーション、メインフレームコンピューター、サーバー、ネットワークサーバー等のような様々な演算システムにおいて実施することができる。
システム102は、1つ以上のデバイスおよび/または機械104−1、104−2...104−N(以下、集合的にセンサーデバイス104という)から、センサーデータを受信する。センサーデバイス104の例としては、これに限定されるものではないが、産業機械、ポータブルコンピューター、PDA(Personal Digital Assistant)、携帯型デバイス、ワークステーション、センサー内蔵デバイス、機械に内蔵され、センサー読み込みを保存する記憶デバイス等が挙げられる。複数のセンサーデバイス104は、ネットワーク106を介して、システム102に通信可能に接続されている。用語「センサーデバイス」および「センサー」は、システム102にセンサーデータを提供可能なデバイスを意味する。よって、用語「センサーデバイス」および「センサー」は、本明細書中において、同等の意味で用いられる。実施形態の1つにおいて、複数のセンサーデバイス104は、規則的な時間間隔で観測される様々なセンサーの読み込み/データ(エンジンスピード、燃料消費等)を含む重産業機械(heavy duty industrial machines)を含む。
実施形態の1つにおいて、ネットワーク106は、無線ネットワーク、有線ネットワーク、またはこれらの組み合わせであってもよい。ネットワーク106は、異なるタイプのネットワーク(例えば、イントラネット、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット等)の1つとして実施することができる。ネットワーク106は、専用ネットワークであっても、共有ネットワークであってもよい。共有ネットワークは、様々なタイプのプロトコル(例えば、ハイパーテキストトランスファープロトコル(HTTP)、トランスミッションコントロールプロトコル/インターネットプロトコル(TCP/IP)、ワイヤレスアプリケーションプロトコル(WAP)等)を用いて、互いに通信を行う異なるタイプのネットワークの接続を意味する。さらに、ネットワーク106は、様々なネットワークデバイス(ルーター、ブリッジ、サーバー、演算デバイス、記憶デバイス等)を含んでいてもよい。
複数のセンサーデバイス104は、ネットワーク106を介して、システム102にセンサーデータを送信する。システム102は、センサーデータを分析し、機械使用(machine usage)を要約するよう構成されている。ここで、特定の時間間隔に渡って、複数のセンサーから受信されるセンサーデータは、「マルチセンサーデータ(multi-sensor data)」と称される。任意の動作期間に渡るセンサーの動作は、機械が動作している特定の時間間隔に渡るセンサーデータの複数の異なる値の分布を取得可能なヒストグラムによって表すことができる。上述の時間間隔は、機械の単一の動作、一日、一週間等であってもよい。
実施形態の1つにおいて、システム102は、センサーデータから、複数のヒストグラム(もしくは、複数の強度プロファイル)を算出するよう構成されている。システム102は、日毎の複数のセンサーの動作のそれぞれを表す複数のヒストグラムを算出するよう構成されている。複数の日の複数のセンサーに対応する複数のヒストグラムの例が、図3を参照してさらに説明される。システム102は、マルチセンサーデータを系統的に(systematically)要約し、機械動作を判別するよう構成されている。マルチセンサーデータを要約するためのシステム102の例示的な実施形態が、図2を参照してさらに説明される。
図2は、本発明の実施形態に係るマルチセンサーデータを要約するためのシステム200のブロック図を示している。システム200は、プロセッサー202のような少なくとも1つのプロセッサーと、メモリー204のような少なくとも1つのメモリーと、ネットワークインターフェースユニット206のようなネットワークインターフェースユニットとを含む、または、これらと接続されている。実施形態の1つにおいて、プロセッサー202、メモリー204、およびネットワークインターフェースユニット206は、システムバス208のようなシステムバスまたは同様の機構によって接続されている。
プロセッサー202は、回路実施、特に、通信に関連する音声および論理機能を含む。例えば、プロセッサー202は、これに限定されるものではないが、1つ以上のデジタル信号プロセッサー(DSPs)、1つ以上のマイクロプロセッサー、1つ以上の特殊用途コンピューターチップ、1つ以上のフィールドプログラマブルゲートアレイ(FPGAs)、1つ以上の特定用途向け集積回路(ASICs)、1つ以上のコンピューター、様々なアナログ−デジタルコンバーター、デジタル−アナログコンバーター、および/またはその他のサポート回路を含む。また、プロセッサー202は、メッセージおよび/またはデータ、または情報をエンコード化(暗号化)する機能を含んでいてもよい。プロセッサー202は、特に、プロセッサー202の動作をサポートするよう構成されたクロック、演算論理ユニット(ALU)、および論理ゲートを含んでいてもよい。さらに、プロセッサー202は、メモリー204またはプロセッサー202がアクセス可能な他の媒体内に保存された1つ以上のソフトウェアプログラムを実行する機能を含んでいてもよい。
メモリー204のような少なくとも1つのメモリーは、システムの機能を実行するためにシステムによって用いられる任意の数の情報およびデータを保存している。メモリー204は、例えば、揮発性メモリーおよび/または不揮発性メモリーを含む。揮発性メモリーの例としては、これに限定されるものではないが、揮発性ランダムアクセスメモリー(RAM)が挙げられる。不揮発性メモリーは、追加的または代替的に、電気的消去可能プログラム可能リードオンリーメモリー(EEPROM)、フラッシュメモリー、ハードドライブ等を含む。揮発性メモリーのいくつかの例としては、これに限定されるものではないが、ランダムアクセスメモリー、ダイナミックランダムアクセスメモリー、スタティックランダムアクセスメモリー等を含む。非揮発性メモリーのいくつかの例としては、これに限定されるものではないが、ハードディスク、磁気テープ、光ディスク、プログラム可能リードオンリーメモリー、消去可能プログラム可能リードオンリーメモリー、電気的消去可能プログラム可能リードオンリーメモリー、フラッシュメモリー等が挙げられる。メモリー204は、システム200が、様々な例示的な実施形態に係る様々な機能を実行可能とするための情報、データ、アプリケーション、命令等を保存するよう構成されていてもよい。追加的または代替的に、メモリー204は、プロセッサー202によって実行されたときに、システムを様々な実施形態において記述されたような様態の動作を実行させる複数の命令を保存するよう構成されていてもよい。
ネットワークインターフェースユニット206は、複数のセンサー(または、複数のセンサーを組み込んでいる複数のデバイス)と、システム200との間の通信を容易にするよう構成されている。ネットワークインターフェースユニット206は、無線接続の形態であっても、有線接続の形態であってもよい。無線ネットワークインターフェースユニット206の例としては、これに限定されるものではないが、IEEE802.11(Wifi)、ブルートゥース(登録商標)、ワイドエリア無線接続が挙げられる。有線ネットワークインターフェースユニット206の例としては、これに限定されるものではないが、イーサネット(登録商標)が挙げられる。
システム200は、ネットワークインターフェースユニット206を介して、任意の時間間隔に渡って収集された複数のセンサーに関連付けられたセンサーデータ(T)を受信するよう構成されている。例えば、マルチセンサー時系列データTは、以下のように表される。
={v(t):t(t)∈{1,2,...,m}}
Figure 2017076359
Figure 2017076359

Figure 2017076359
ここで、Bは、時間間隔の数であり、インターバルbjkは、境界[ljk,ujk)によって規定され、f(i) jkは、インターバルbjk内に並ぶ複数の値の比(fraction)である。
Figure 2017076359
実施形態の1つにおいて、システム200は、センサーデータから、複数のヒストグラム(H)を算出するよう構成されている。ここで、複数のヒストグラム(H)は、複数のヒストグラムのそれぞれのヒストグラムが、任意の時間間隔(例えば、複数の日のうちの各日)に渡るセンサー動作を表すよう算出される。複数のヒストグラムは、全てのセンサーの複数のビン(bins)Bの固定されたセットを用いて算出される。任意の日(d)は、その日の全てのセンサーの複数のヒストグラムのセットによって表すことができる。
すなわち、d≡{H1i,H2i,...,HNi}である。
ここで、複数のヒストグラムのそれぞれは、B次元ベクトルである。
プロセッサー202は、メモリー204のコンテンツによって、および、任意選択的に、ここに記述されるその他のコンポーネントによって、システム200に、複数のセンサーのそれぞれの複数のヒストグラムを、第1の複数のセンサークラスターにグループ化/クラスタリングさせるよう構成されている。ここで、各センサークラスターは、類似の形状の複数のヒストグラムを含む。第1の複数のセンサークラスターの各センサークラスターは、1日以上の間のセンサーに対応する複数のヒストグラムのクラスターを含む。実施形態の1つにおいて、システム200は、センサークラスター内の複数の類似のヒストグラムのセットを、クラスタリングするよう構成されている。ここで、複数の類似のヒストグラムのセットのクラスタリングは、複数の類似のヒストグラムのセットの複数のヒストグラム間の距離測度(distance measure)が、しきい値距離測度よりも小さくなるよう実行される。例えば、複数のヒストグラム(または、複数の類似のヒストグラム)のセットHは、センサークラスターCknを形成する。ここで、センサークラスターCknは、任意のペアHki,Hkj∈Ckn用のD(Hki,Hkj)がD(Hki,Hkj)<τnkとなるよう形成される。ここで、D(Hki,Hkj)は、ヒストグラムHkiおよびHkj間の距離であり、複数の異なる動作日のセンサーkの2つのヒストグラムHkiおよびHkjは、これらのヒストグラム間の距離測度D(Hki,Hkj)が、距離測度の第1のしきい値(τnk)よりも小さい場合、類似とされる。ここで、ヒストグラム間の距離は、ヒストグラム間の形状類似性(shape similarity)を表すものである。実施形態の1つにおいて、ヒストグラム間の距離は、ユークリッド距離、アースムーバー距離(EMD: Earth Mover Distance)、カルバック・ライブラー測度(Kullback-Leibler divergence)、バッタチャリヤ距離(Bhattacharyya distance)、マンハッタン距離(Manhattan distance)、ワッサースタイン計量(Wasserstein metric:カントロヴィッチ計量(Kantorovich metric)としても知られている)等である。
実施形態の1つにおいて、複数のヒストグラムを複数のセンサークラスターにクラスタリングするために、球状クラスタリングモデル(spherical clustering model)やBIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)のようなクラスタリングモデルを用いることができる。BIRCHクラスタリングモデルは、距離測度しきい値τの初期値を、パラメーターとして取得する。実施形態の1つにおいて、プロセッサー202は、メモリー204のコンテンツによって、および、任意選択的に、ここに記述されるその他のコンポーネントによって、システム200に、複数の球状センサークラスターの半径の値(τ/2)を、距離測度の第1のしきい値として利用させるよう構成されている。距離測度の第1のしきい値は、センサーに関連付けられた複数のクラスターの質と数に依存してもよい。実施形態の1つにおいて、DB−インデックスが、複数のセンサークラスターの質の統計測度(statistical measure)として利用されてもよい。システム200は、τの様々な値のBIRCHクラスタリングを実行し、さらに、DB−インデックスの値が最適となるようなτ/2の値を選択するよう構成されている。DB−インデックスは、複数のクラスタリングモデルを評価するための計量値(metric)であり、クラスタリングがどの程度成されているかの検証が、データセットに固有の(inherent)複数の量および複数の特徴を用いて成される。実施形態の1つにおいて、τの値は、DB−インデックスの最適値が可能な限り低くなり、さらに、センサークラスターの重心(centroid)がクラスター内の複数のヒストグラムを表すことが保証されるように、選択されてもよい。複数のセンサーの個別のクラスタリングは、複数のクラスターのセットCkn∀k∈Nを生成する。実施形態の1つにおいて、システム200は、複数のセンサーヒストグラムが並ぶ複数の異なるセンサーの複数のセンサークラスターのセットによって、複数の日を表すよう構成されている。ここで、1日は、{C1i,C2i,...,CNi}のように表すことができ、i∈1,2,...,nである。
実施形態の1つにおいて、プロセッサー202は、メモリー204のコンテンツによって、および、任意選択的に、ここに記述されるその他のコンポーネントによって、システム200に、第1の複数のセンサークラスターの中から、複数のルールの第1のセットを抽出させるよう構成されている。ここで、複数のルールの第1のセットの抽出は、複数のルールの第1のセットのルールが複数のセンサーの複数のセンサーのセットに関連付けられ、さらに、任意の時間間隔に渡って第1の複数のセンサークラスター内において頻繁に現れる複数のセンサークラスターのセットを含むように実行される。以下、任意の時間間隔に渡って頻繁に発生する複数のヒストグラムの複数のパターンを、「頻出パターン(frequently occurring patterns)」という。実施形態の1つにおいて、複数のルールの第1のセットを抽出するために、システム200は、複数の日を共通して有する複数の異なるセンサーに関連付けられた第1の複数のセンサークラスターを特定するよう構成されている。実施形態の1つにおいて、複数の日を共通して有する第1の複数のセンサークラスターは、第1の複数のセンサークラスターに対する頻出パターンマイニング(frequent pattern mining)を実行することにより判別されてもよい。頻出パターンマイニングは、例えば、FP−成長モデル(FP-Growth model)のような頻出パターンマイニングモデルによって実行することができる。
実施形態の1つにおいて、プロセッサー202は、メモリー204のコンテンツによって、および、任意選択的に、ここに記述されるその他のコンポーネントによって、システム200に、複数のセンサークラスターに関連付けられた距離測度(τnk)のしきい値を広げること(broadening)により、第1の複数のセンサークラスターをリファイン(refine)させるよう構成されている。実施形態の1つにおいて、システム200は、同じ時間間隔の複数の他のセンサーの動作に基づいて、センサークラスター内のより多くの日を協働的に含むよう構成されていてもよい。実施形態の1つにおいて、システム200は、複数の同じ日の複数の他のセンサーの動作に基づいて、より多くの日がセンサークラスター内に協働的に含まれるよう、第1の複数のセンサークラスター内のセンサーの2つ以上のセンサークラスターを選択的に合併するよう構成されている。実施形態の1つにおいて、2つ以上のセンサークラスターを選択的に合併する一方、システム200は、複数のセンサークラスターが、複数のセンサーの1つまたは複数の他のセンサーの1つまたは複数のセンサークラスターに共通する複数の日の多くを有する場合、センサーの複数の類似のセンサークラスターを合併するよう構成されている。複数の日のほぼ同じセットを有する複数の異なるセンサーの複数のセンサークラスターを、以下、「共起センサークラスター(co-occurring sensor-clusters)」といい、これらの共起センサークラスター内において現れる複数のセンサーを、「共起センサー(co-occurring sensors)」という。
実施形態の1つにおいて、センサーの2つ以上のセンサークラスターは、複数のセンサーの共起性(co-occurrence)の判別に基づいて、複数の日の同じセットの2つ以上のセンサークラスターに合併される。この合併は、異なるセンサーのセンサークラスターに共通する複数の日の多くを有し、複数のセンサークラスターの複数の重心間の距離測度(例えば、ユークリッド距離)が第2のしきい値τによって境界付けられることを維持するように合併するための複数の候補センサークラスターを特定するよう、実行される。実施形態の1つにおいて、プロセッサー202は、メモリー204のコンテンツによって、および、任意選択的に、ここに記述されるその他のコンポーネントによって、システム200に、2つ以上のセンサークラスターに関連付けられた複数のルールの第1のセットの中からの2つ以上のルールおよび2つ以上のセンサークラスター間の距離測度に基づいて、2つ以上のセンサークラスター内の複数のセンサーの共起性を判別させるよう構成されている。実施形態の1つにおいて、プロセッサー202は、メモリー204のコンテンツによって、および、任意選択的に、ここに記述されるその他のコンポーネントによって、システム200に、合併のための複数の候補センサークラスターを特定するためのグラフベース技術(graph based technique)を採用させるよう構成されている。グラフベース技術は、複数のセンサークラスターと、複数のルールの第1のセットとを、複数のノード(節)および複数のノードを接続する複数のエッジ(枝)を有する第1のグラフの形式で表す工程を含む。複数のノードは、複数の頻出パターンのセット内に存在する複数のセンサーのセットに関連付けられた複数のセンサークラスターを表す。グラフの2つのノード間のエッジは、2つのセンサークラスターが、同じセンサーに属し、該2つのセンサークラスター間の距離が第2のしきい値τよりも小さい場合に作成される。また、システム200は、このようなエッジの重みとして、距離をエンコード化するよう構成されている。また、グラフの2つのノード間のエッジは、2つのセンサークラスターが頻出パターン/ルール内に存在する場合に作成される。また、システム200は、そのようなエッジの重みとして、頻出パターンのサポート(support)をエンコード化するよう構成されている。そのため、複数のエッジは、複数のイントラクラスターエッジ(intra-cluster edge)のセットと、複数の内部クラスターエッジ(inter-cluster edge)のセットとを含む。ここで、内部クラスターエッジは、複数のルールの第1のセットの中からのルールに関連付けられた複数のセンサークラスター間のエッジを含み、イントラクラスターエッジは、第2のしきい値距離測度よりも小さいセンサークラスター間の距離を有するセンサーの複数のセンサークラスター間のエッジを含む。内部クラスターエッジおよびイントラクラスターエッジを有するグラフの例が、図4を参照してさらに説明される。ここで、イントラエッジおよび内部エッジに関連付けられた重みは、それぞれ異なったスケールであり、そのため、システム200は、イントラエッジと内部エッジの重みを正規化するよう構成されている。
プロセッサー202は、メモリー204のコンテンツによって、および、任意選択的に、ここに記述されるその他のコンポーネントによって、システム200に、第1のグラフ内の複数のサブグラフを特定させるよう構成されている。ここで、第1のグラフ内の複数のサブグラフの特定は、各サブグラフが、強く関係する複数のセンサークラスターを有するように実行される。第1のグラフは、第1のグラフ内のサブグループの複数のノードが、互いに密に接続され、複数の他のノードとは疎に接続されるような様態で設定される。実施形態の1つにおいて、第1のグラフ内の複数のサブグラフは、グラフモジュール性(graph modularity)または類似性検出(community detection)のような標準技術を用いて、モジュール性に基づいて特定される。センサーの2つ以上のセンサークラスターが1つのサブグループ内に存在する場合、2つ以上のセンサークラスターに対し、クラスター合併が適用可能である。換言すれば、同じセンサーの2つ以上のセンサークラスターが、同じサブグラフ内において現れる場合、2つ以上のセンサークラスターが共に合併され、第2の複数のセンサークラスター(または、複数の合併済みセンサークラスター)が得られる。プロセッサー202は、メモリー204のコンテンツによって、および、任意選択的に、ここに記述されるその他のコンポーネントによって、システム200に、このような複数の合併済みセンサークラスター用の修正された(revised)距離測度しきい値τnkを算出するよう構成されている。実施形態の1つにおいて、合併されない複数のセンサークラスターは、それらの初期のしきい値距離測度(すなわち、第1のしきい値距離測度)を保つ。
同じセンサーの複数のセンサークラスターを合併する際、システム200は、全てのセンサーの複数のセンサークラスターを更新し、さらに、第2の複数のセンサークラスターまたはこれらの重心を用いて、複数の日を再エンコード化(暗号化)するよう構成されている。第2の複数のセンサークラスターは、複数の他のセンサーの複数のセンサークラスターの共起性に基づいて協働的に生成されるので、第2の複数のセンサークラスターは、高いサポートで、頻繁に現れる複数のセンサー動作を特定することをより容易としやすい。
実施形態の1つにおいて、システム200は、第2の複数のセンサークラスターから、複数のルールの第2のセットを抽出するよう構成されている。ここで、複数のルールの第2のセットは、複数のルールの第2のセットが第2の複数のセンサークラスターに関連付けられた複数の特徴的センサー動作を示すよう抽出される。複数のルールの第2のセットは、第2の複数のセンサークラスターに対し、頻出パターンマイニングを実行することにより判別されてもよい。
プロセッサー202は、メモリー204のコンテンツによって、および、任意選択的に、ここに記述されるその他のコンポーネントによって、システム200に、複数のルールの第2のセットに基づいて、第2の複数のセンサークラスターから、複数の相関性のあるセンサーの複数のセットを特定させるよう構成されている。実施形態の1つにおいて、複数の相関性のあるセンサーの複数のセットを特定するため、複数のルールの第2のセットが、第2のグラフの形式で表される。第2のグラフは、複数のノードと、複数のノードを接続する複数のエッジとを含んでおり、複数のノードは、第2の複数のセンサークラスターを表し、複数のエッジは、複数の内部クラスターエッジのセットを含んでいる。第2のグラフは、グラフモジュール性または類似性検出の技術に基づいて、複数の相関性のあるセンサーの複数のセットを特定するために利用可能である。ここで、第2のグラフのサブグラフが、複数の関連性のあるセンサーのセットを表すように、第2のグラフは、複数のサブグラフに区分化されていてもよい。第2のグラフ内においては、唯1つのエッジタイプ、すなわち、内部クラスターエッジのみが存在していることは理解されるであろう。類似性検出に基づいて、システム200は、複数のサブグループ(または複数の類似性)内に存在する複数のセンサークラスターから、複数の相関性のあるセンサーの複数のセットを特定するよう構成されている。実施形態の1つにおいて、システム200は、第2のグラフから、複数のサブグラフの第2の複数のセンサークラスターに関連付けられた複数のユニーク/特徴的センサーを特定するよう構成されている。ここで、複数のユニークセンサーは、複数の相関性のあるセンサーのセットを表す。例えば、類似性またはサブグループ{C11,C12,C24,C35}は、複数の相関性のあるセンサーのセット{s,s,s}を生成することができる。複数の相関性のあるセンサーのセットScorは、Scor={Cr,Cr,...,Cr}と表すことができ、Cr=<s,s,s...>は、複数の相関性のあるセンサーのp番目のセットである。
プロセッサー202は、メモリー204のコンテンツによって、および、任意選択的に、ここに記述されるその他のコンポーネントによって、システム200に、複数の相関性のあるセンサーの複数のセットから、複数のルールの第3のセットを抽出させるよう構成されている。ここで、複数のルールの第3のセットは、マルチセンサーデータを要約し、複数の顕著な共起センサー動作を表す。実施形態の1つにおいて、システム200は、複数の相関性のあるセンサーの各セットの頻出パターンマイニングを実行することにより、複数の相関性のあるセンサーの複数のセットから、複数のルールの第3のセットを抽出するよう構成されている。ここで、頻出パターンマイニングの各工程において考慮すべきセンサーの数が削減されるので、各工程における複数のユニーク項目(unique items)の数もまた削減される。そのため、システム200は、低サポートで、複数のルールの第3のセット(または複数のパターン)を特定するよう構成されている。実施形態の1つにおいて、複数の相関性のあるセンサーのp個のセットに対する頻出パターンマイニングは、複数の相関性のあるセンサーの特定の1つのセットの特定に繋がる。
com={FCr1,FCr2,...,FCrp
ここで、Crは、複数の相関性のあるセンサーのセットであり、FCrpは、複数の相関性のあるセンサーのセットCrから生成された複数の頻出項目(または複数の頻出パターン)のセットである。
プロセッサー202は、メモリー204のコンテンツによって、および、任意選択的に、ここに記述されるその他のコンポーネントによって、システム200に、複数の相関性のあるセンサーの複数のセットから生成された複数の頻出パターンのセットのクラスタリング(または組み合わせ)を実行させ、複数のルールの第3のセットを生成させるよう構成されている。複数のルールの第3のセットは、複数の候補頻出パターンのセットを表す。実施形態の1つにおいて、システム200は、ルールクラスタリング技術に基づいて、複数の候補頻出パターンのセットから、複数のルールの第3のセットを生成するよう構成されている。ルールベースのクラスタリング技術において、システム200は、複数のルールの第3のセット内の複数のルールの各ペア間の距離測度を規定するよう構成されている。距離測度は、ルールがカバーするデータ(すなわち、ルールがカバーする複数の処理)内の相互重複(mutual overlap)に反比例する。複数の頻出パターンのセットは、この距離測度のもと、DBSCANのような密度ベースの技術を介してクラスタリングされる。その結果、同じクラスター内の複数のルールは、非常に多く重複することになり、これは、各クラスターの1つ以上のルールが、複数のルールのセット全体のカバー率(coverage)を増加させにくいことを含む。システム200は、各ルールクラスターから、最頻出ルールを選択し、同時に、高いカバー率を補償する一方、データを簡潔に要約する複数のルールの最終セットを形成するよう構成されている。
図3は、例示的な実施形態に係る複数の日に渡る複数のセンサーの複数のヒストグラムの例を示している。複数のセンサーは、任意の時間間隔に渡るセンサーデータを記録し、そのようなセンサーデータは、複数のヒストグラムを生成するために利用される。例えば、センサーデータは、一定の時間間隔で観測される様々なセンサーからの読み出し(エンジンスピード、燃料消費等)を含む複数の重工業機械から導出されてもよい。ここに示されている複数のヒストグラムは、複数のセンサーのセンサー動作を表している。ヒストグラムは、機械が稼働している特定の時間間隔のセンサーデータから、センサーの複数の異なる値の分布を捕捉することは理解されるであろう。時間間隔は、機械の単一の稼動であり得、例えば、1日、1週間等である。例えば、ここで、複数のヒストグラムを算出するため、時間間隔として「1日」が選択される。
図3に示されているように、センサーデータを介して、5日間(D1、D2、D3、D4、およびD5)の4つのセンサー(S1、S2、S3、およびS4)のセンサー動作(ヒストグラム)が示されている。ここで、複数のヒストグラムは、Hijによってユニークに(一意に)特定されている。D1日において、センサーS1、S2、S3、およびS4に対応する複数のヒストグラムが、312(H11)、314(H21)、316(H31)、および318(H41)として示されている。D2日において、センサーS1、S2、S3、およびS4に対応する複数のヒストグラムが、322、324、326、および328として示されている。D3日において、センサーS1、S2、S3、およびS4に対応する複数のヒストグラムが、332、334、336、338として示されている。D4日において、センサーS1、S2、S3、およびS4に対応する複数のヒストグラムが、342、344、346、および348として示されている。D5日において、センサーS1、S2、S3、およびS4に対応する複数のヒストグラムが、352、354、356、および358として示されている。ここで、膨大な数のビン(例えば、1000個のビン)が複数のヒストグラム内の複数のセンサー値の分布を取得するために利用されているため、複数のヒストグラムは、複数の連続線として図示されている。
様々な状況において、動作日におけるセンサーのヒストグラムは、その他の複数の機械インスタンス(other machine instances)のヒストグラムと同様に、その他の多くの日々のヒストグラムと類似のものとなり得る。このような複数のヒストグラムの全ては、例えば、複数のヒストグラム間の距離測度を用いて、共にグループ化可能であり、センサークラスターを形成することができる。多くのセンサーのセンサー動作が類似である複数の日は、形成される複数のクラスターの全てが集合的に観測されたデータの大部分をカバーするような様態で、クラスター化される。類似の複数のヒストグラムは、同じセンサークラスターID「Cik」によってマークされる。例えば、S1およびS2のヒストグラムは、D1日およびD2日において類似である(ヒストグラム312、322が類似であり、ヒストグラム314、324が類似である)。D3日では、S1のヒストグラムが、わずかに異なっている一方、S2のヒストグラムが類似である。さらに、D4日では、S1およびS2のヒストグラムがその他の日々のものとは大きく異なっている一方、S3およびS4のヒストグラムがD1日のヒストグラムと類似である。また、図3から分かるように、その日のセンサー動作の全てに対して互いに類似となる2つの日が存在せず、そのため、複数のセンサーのサブセットは、複数の日のいくつかが、センサー動作の観点から類似であると判断されるように判別される。
本発明の様々な実施形態は、複数のセンサーの複数のヒストグラムを、センサークラスターの重心ヒストグラムがセンサークラスター内に含まれる複数のヒストグラムを表すような様態で、クラスタリングするための方法およびシステムを提供する。このような複数のセンサークラスターは、複数のセンサーヒストグラムの頻繁に発生する複数のパターンとして列挙され、膨大な量の多変数のセンサーデータを要約する。図3に示されているように、複数のヒストグラム{H11,H12,H13}のセットが類似である一方、H13がその他の2つのヒストグラムとはわずかに異なっている。そのため、システム(例えば、図2のシステム200)は、複数のセンサークラスターの境界の選択に応じて、これら全てを、1つ以上のクラスター内に入れるよう構成されている。実施形態の1つにおいて、システムは、複数の他のセンサーの複数のセンサークラスターと協力して、複数のクラスター境界を判別するよう構成されている。例えば、システムは、対応する複数の日が1つまたは複数の他のセンサーの1つのセンサークラスター内に存在する場合、複数のヒストグラムのこのような複数のセットを、複数の動作日をクラスターリングするよう、1つのクラスターに入れるよう構成されていてもよい。その結果、D1日、D2日、およびD3日は、S2の1つのセンサークラスター(C21)内に存在するため、現在の例では、{H11(312),H12(322),H13(332)}は、1つのクラスターを形成してもよい。同様に、D2日、D3日、およびD5日は、任意の如何なる1つのセンサークラスター内にも共に存在していないことから、{H32(326),H33(336)}およびH35(346)は、2つの異なるセンサークラスター内のものとなる。
複数のヒストグラムの複数のセンサークラスターを形成する際、同じセンサークラスターの一要素である複数の日は、多くのセンサー(多くのセンサーではあるが、全てのセンサーではない)用に、グループ化されてもよい。複数のセンサーのサブセットに従った複数の日のクラスタリングは、サブ空間クラスタリングに相当してもよい。システムは、複数の日をグループ化するために複数のセンサーの複数の異なるサブセットを選択するよう構成されており、これにより、このクラスタリングを、マルチサブ空間クラスタリング(multi-subspace clustering)と呼ぶことができる。これらの複数のセンサークラスターは、その後、複数のルール(または、複数の頻出発生パターン)のセットの形式で記述可能となる。図3を参照すると、2つのパターンが複数の日の大部分を記述している。{(C11+C12);C21}は、D1日と、D2日と、D3日とを記述しており、{C31;(C41+C44)}は、D1日と、D4日とを記述している。システム200は、このような複数のルールまたは複数のパターンを、教師なし手法(unsupervised manner)で特定するよう構成されている。
図4は、例示的な実施形態に係る図3において観測された複数のヒストグラムから生成されたグラフ400を示している。グラフ400は、図3を参照して説明された第1のグラフの例である。グラフ400は、複数の共起センサークラスター(または、複数の日の同じセットの大部分を含む複数の異なるセンサーの複数のセンサークラスター)を特定するために利用可能である。それぞれの日は、その複数のセンサーヒストグラムが並ぶ複数の異なるセンサークラスターの複数のクラスター識別子のセットによって表すことができる。同じセンサーの2つ以上のセンサークラスターは、2つ以上のセンサークラスターが他のセンサーのクラスターと大部分の共通した日々を有していると判断され、一方、複数のセンサークラスターの重心間の距離(例えば、ユークリッド距離)が、第2の閾値によって境界付けられ続けている場合、合併可能である。図3を参照して説明された例では、複数のセンサークラスターC11およびC12が合併可能である。なぜならば、C11、C12は、他のクラスターC21と、複数の日を共有しており、さらに、C11、C12の重心間の距離もまた小さいからである。
複数のクラスターは、グラフ400内の複数のノードとしてモデル化される。図3を参照して説明された複数のセンサークラスターの例では、グラフ400は、センサークラスターC11、C12、C13、C14、C21、C22、C23、C31、C32、C33、C41、C42、C43、C44、およびC45のような複数のセンサークラスターを含んでいる。さらに、グラフ400は、複数のノード(複数のセンサークラスター)間の複数のエッジを含んでいる。複数のエッジは、2つのノードが同じセンサーに属しており、さらに、それらの間の距離(例えば、ユークリッド距離)が距離測度の第2のしきい値よりも小さい場合、グラフの2つのノード間に描かれる。ここで、距離測度は、このようなエッジの重みにとしてエンコード化される。このような複数のエッジは、イントラクラスターエッジ(intra-cluster edges)と称され、グラフ400内では点線によって表される。例えば、エッジ406、408、410は、イントラクラスターエッジである。グラフ400内の点線で表されるエッジの全てがイントラクラスターエッジであることは留意されるであろうが、説明の簡略化および理解の明確さのため、図4では、3つのイントラクラスターエッジ(406、408、410)のみを示している。
また、グラフ400は、複数の内部クラスターエッジ(inter-cluster edge)を含んでいる。内部クラスターエッジは、複数の異なるセンサーの複数のクラスター間のエッジであり、図4中では実線によって表されている。内部クラスターエッジは、2つのクラスターの双方が複数のルールの第1のセットの1つのルール(または、単一の頻出パターン)内において生じる場合、2つのセンサーの複数のクラスター間に存在する。例えば、エッジ402、404は、グラフ400内の内部クラスターエッジである。図3を参照して説明したように、複数のサブグラフ内における複数のセンサークラスターの合併は、複数の合併されたセンサークラスターの形態(複数のセンサークラスターの第2のセット)をもたらす。そのため、日に関連してエンコード化されたデータ(day-wise encoded data)は、複数の頻出パターンを判別するため、複数の合併されたセンサークラスターによって更新される。
図5は、本発明に係るマルチセンサーデータを要約するための方法500のフロー図を示している。方法500は、マルチサブ空間クラスタリングを用いたマルチセンサーデータの大規模な集合を簡潔に要約することを容易とする。特に、システムは、複数の機械から収集されたマルチセンサーデータを用いて、複数のセンサーを内蔵(embodying)する複数の機械の集合の複数の使用および動作パターンを要約することができる。マルチセンサーデータ、またはセンサーデータは、そのような複数のセンサーを内蔵する複数の機械の動作期間または特定の時間間隔に渡って収集された複数のセンサーのセンサー値/読み出しを含んでいてもよい。例えば、センサーデータは、複数の日に区分化されていてもよい。
502において、本方法は、複数のセンサーに関連付けられたセンサーデータから、複数のヒストグラムを算出する工程を含む。実施形態の1つにおいて、各ヒストグラムは、1日間の複数のセンサーのうちの1つのセンサーの動作を表す。504において、複数のセンサーのそれぞれの複数のヒストグラムの各ヒストグラムがクラスタリングされ、第1の複数のセンサークラスターが取得される。実施形態の1つにおいて、各ヒストグラムは、各ヒストグラムの形状類似性(shape similarity)に基づいて、1つのセンサークラスター内にクラスタリングされる。複数のヒストグラムのクラスタリングの例が、図4を参照して説明される。第1の複数のセンサークラスターの各センサークラスターは、複数のセンサーのうちの1つのセンサーの特徴的センサー動作を表す重心ヒストグラムを含む。実施形態の1つにおいて、第1の複数のセンサーの複数のセンサークラスターに関連付けられた各ヒストグラムは、第1のしきい値距離測度によって境界付けられている。
506において、第1の複数のセンサークラスターの中から、複数のルールの第1のセットが抽出される。実施形態の1つにおいて、複数のルールの第1のセットは、複数のセンサーのセットの複数のヒストグラムから、複数のヒストグラムの複数のパターンを規定する。ここで、複数のヒストグラムの複数のパターンは、任意の時間間隔に渡って頻繁に発生する。実施形態の1つにおいて、複数のルールの第1のセットは、頻出パターンマイニング技術を用いることによって、抽出される。実施形態の1つにおいて、複数のルールの第1のセットのルールは、複数の異なるセンサーの複数のセンサークラスターを含み、これにより、センサーの唯一つのセンサークラスターが1つのルール内に存在し、それ以上のセンサークラスターは1つのルール内に存在しないようになっている。
508において、本方法は、複数のセンサーのうちの1つのセンサーに対応して、第1の複数のセンサークラスターの中から、2つ以上のセンサークラスターを選択的に合併し、第2の複数のセンサークラスターを取得する工程を含む。2つ以上のセンサークラスターは、2つ以上のセンサークラスターに関連付けられた複数のルールの第1のセットの中からの2つ以上のルール、およびセンサーの2つ以上のセンサークラスター間の距離測度に基づいて、合併される。実施形態の1つにおいて、センサーの2つ以上のセンサークラスターは、同じ時間間隔の2つ以上のセンサークラスター内の複数のセンサーの1つ以上の他のセンサーの共起性の判別に基づいて、選択的に合併される。実施形態の1つにおいて、1つ以上のセンサークラスターの共起性の判別は、第1の複数のセンサークラスターおよび複数のルールの第1のセットを、第1のグラフの形式で表す工程を含む。第1のグラフは、図4を参照して詳細に説明される。第1のグラフは、複数のノードと、該複数のノードを接続する複数のエッジとを含んでいる。複数のノードは、第1の複数のセンサークラスターを含んでおり、複数のエッジは、イントラクラスターエッジのセットと、内部クラスターエッジのセットとを含んでおり、これにより、内部クラスターエッジは、複数のルールの第1のセットの中からのルールに関連付けられた複数のセンサークラスター間のエッジを含み、さらに、イントラクラスターエッジが、第2のしきい値距離測度よりも小さい複数のセンサークラスター間の距離測度を有するセンサーの複数のセンサークラスター間のエッジを含むようになっている。第2の複数のセンサークラスターは、第1のグラフから特定される。実施形態の1つにおいて、複数のセンサークラスターの第2のセットは、第1のグラフから、複数のセンサークラスターを合併した後に形成される。第1のグラフは、複数のセンサーのセットに関連付けられた複数のセンサークラスターを有する1つ以上のサブグループを含む。1つ以上のサブグループは、類似性検出技術に基づいて、判別される。第1のグラフ内のサブグループは、複数のルールの第1のセットから導出された共起性および複数のイントラセンサークラスター間の距離によって判別された類似性に基づいて強固に接続された複数のセンサークラスターのグループを表す。センサーに関連付けられた2つ以上のセンサークラスターは、2つ以上のセンサークラスター間のイントラエッジの存在の判別に基づいて、合併される。
510において、本方法は、第2の複数のセンサークラスターから、複数のルールの第2のセットを抽出する工程を含む。複数のルールの第2のセットは、第2の複数のセンサークラスターに関連付けられた複数の特徴的センサー動作を示す。実施形態の1つにおいて、複数のルールの第2のセットは、頻出パターンマイニング技術に基づいて抽出される。
512において、複数の相関性のあるセンサーのセットが、複数のルールの第2のセットに基づいて、第2の複数のセンサークラスターから特定される。複数のルールの第2のセットは、第2のグラフの形式で表される。第2のグラフは、複数のノードと、該複数のノードを接続する複数のエッジとを含んでおり、それにより、複数のノードが第2の複数のセンサークラスターを含み、さらに、複数のエッジが複数の内部クラスターエッジのセットを含むようになっている。第2の複数のクラスターに関連付けられた複数のユニークセンサーは、第2のグラフ内の複数のサブグループから特定され、それにより、複数のユニークセンサーが複数の相関性のあるセンサーのセットを含むようになっている。
514において、複数のルールの第3のセットが、複数の相関性のあるセンサーのセットから抽出される。複数のルールの第3のセットは、マルチセンサーデータを要約し、複数の顕著な共起センサー動作を表す。複数のルールの第3のセットを抽出するために、頻出パターンマイニングが複数の相関性のあるセンサーの各セットに対して適用され、複数の頻出パターンのセットが取得され、さらに、複数の頻出パターンのセットが、複数の頻出パターン間の相互重複(mutual overlap)に基づいてクラスタリングされ、複数のルールの第3のセットが取得される。実施形態の1つにおいて、複数の頻出パターンのクラスタリングでは、ACRE(Alternating Covers of Rules and Exceptions:ルールおよび例外の交互カバー)と呼ばれる技術を利用することによって、相互重複に基づいて、複数の頻出パターンがクラスタリングされる。ACREは、複数の項目セット(itemsets)を有するデータセットを解釈するための技術である。この技術は、データセットに関する複数のルールセットを算出する工程を含む。複数のルールセットは、関連ルールマイニング技術(association rule mining technique)に基づいて、算出される。さらに、この技術は、データセット内の複数のルールをクラスタリングし、重ね合わせる工程を含んでいてもよい。重ね合わせる複数のルールは、データセットの共通する複数の処理(common transactions)に関連している。さらに、ACRE技術は、各クラスターから、少なくとも1つのルールを選択する工程を含む。少なくとも1つのルールは、各クラスター内に含まれる複数の項目セットを解釈する。
開示のマルチサブ空間クラスタリングモデルの適用例が、図6A〜6Cを参照して、以下に提供される。
図6A〜6Cは、例示的な実施形態に係るマルチセンサーデータの要約によって得られる例示的な結果を示している。ここで、センサーデータは、重産業機械から取得される。このセンサーデータは、3年以上に渡って、複数の異なる種類の各機器内の複数の異なるモデルのエンジンの稼動から取得されている。各時刻(例えば、各秒)において、200個を超えるセンサーからの複数のセンサー記録(オイル温度、スピード、冷媒温度等)が記録される。データは、3種類の異なる機器内に内蔵されたエンジンの種類毎の3年(850日)の時間間隔に関するものである(分野の専門用語では、「アプリケーション」とも呼ばれる)。開示のマルチサブ空間クラスタリングモデルの様々な実施形態は、複数の特徴的センサー動作の判別を容易にし、さらに、データの大部分(50%)をカバーする複数のルールの小さなセットを発見することにより、これらのエンジンの日々の動作を簡潔に要約するように、複数の日の重要な部分をカバーする複数の共起センサー動作の判別を容易にする。1000個のビンヒストグラムが複数のセンサーのそれぞれ用に個別に生成される。
システムは、全てのセンサーに対し、BRICHモデルを適用する。これは、10,000次元(1個のセンサー毎に1000ビンであり、10個のセンサー)のクラスタリング問題となる。BIRCHを適用することによって取得されたトップ10クラスターのクラスター分布が、図6Aを参照して説明される。図6Aは、BIRCHモデルの適用によって取得された各センサークラスター内に含まれる複数の日の数(Y軸上にプロットされている)と共に、クラスター識別子の変化(X軸上にプロットされている)を示している。全てのセンサーのセンサーデータに対するBIRCHの適用は、10,000次元(1個のセンサー毎に1000ビンであり、10個のセンサー)のクラスタリング問題となる。図6Bを参照すると、図6A内に示された複数のクラスターの中のトップ2クラスターの複数のヒストグラムパターン(612、614)が示されている。図から分かるように、トップ10クラスターの合計カバー率は、850日間の内の101日間であり、合計データの12%でしかない。
センサーデータへのDBSCANの適用は、同様の結果をもたらす。DBSCANは、2つのパラメーター、すなわち、クラスタリングのためのεと、minPtsとを必要とする。εの複数の異なる値、およびminPts=1に基づく複数の日のカバー率を含む表(表I)が以下に示されている。
Figure 2017076359
上の表(表I)から分かるように、より小さなε(ε=3)値では、606個のクラスターが取得され、それらのうちのトップ10のクラスターが複数の日の15%をカバーしている一方、より大きなε(ε=10)値では、39個のクラスターが取得され、それらのうちの1つのクラスターが711日の複数の日を含んでいる。複数の日のカバー率が高いものの、DBSCANモデルによって取得された複数のクラスターは、図6Aにおいて判別された複数のクラスターよりも、より多くのノイズを含む。よって、全てのセンサーのクラスタリングは、センサーデータの効率的な要約を容易にはしない。なぜならば、全てのセンサーのクラスタリングに利用可能な複数の方法は、ノイズである複数のクラスターを作成するか、少ない数の日しかカバーしない多すぎる数のクラスターを生成し、結果として低いデータカバー率をもたらすからである。
10個のセンサーの共分散行列(co-variance matrix)が算出され、さらに、類似性検出を用いて、複数の相関性のあるセンサーの3つのセットが特定される。類似性検出のために、共分散行列がグラフ(例えば、第1のグラフ)としてエンコード化される。該グラフにおいて、各ノードはセンサーであり、2つのノード間のエッジは、複数のセンサーの共分散値によって表される。複数の相関性のあるセンサーの複数のセットの内の2つは、2個のセンサーのそれぞれを含み、複数の相関性のあるセンサーの第3のセットは、6個のセンサーを含む。クラスタリングされたセンサーデータは、2つの半径(τnk=30およびτnk=25)のBIRCHのみを用いて、これらの6個のセンサーから構成されている。τnk=30では、400個のセンサークラスターが取得され、それらのうちのトップセンサークラスターは、60日の複数の日を含む。トップ10クラスターのカバー率は、複数の日の27%(234日)であった。τnk=25では、478個のクラスターが取得され、トップクラスターは43日の複数の日を含み、トップ10クラスターのカバー率は22%(188日)であった。よって、データの大部分をカバーする簡潔なクラスタリングを、イントラセンサー共分散に基づいて、複数のクラスターのサブ空間を選択することによっては、得ることができなかった。
センサーデータを要約するための提案のシステムおよび方法は、マルチサブ空間クラスタリングアプローチを提供する。マルチサブ空間クラスタリングアプローチでは、最初に、複数のセンサーヒストグラムが、全ての類似のセンサー動作が共に複数のクラスター内にグループ化されるよう、個別にクラスタリングされ、それにより、各クラスター重心が特徴的センサー動作を表すようになる。複数のセンサークラスターに対して判別された特徴的センサー動作の例が、以下の表(表II)に示されている。
Figure 2017076359
上の表IIに示されているように、全てのセンサー用に対し、複数の異なる数の特徴的動作が、見いだされている。多くの場合において、類似の複数のヒストグラム/センサー動作が複数の異なるクラスター間に渡って拡散することとなるが、複数のセンサーヒストグラムをクラスタリングするため、小さな値の半径が選択される(また、この半径は、低いDBインデックスを作成する)。そのため、開示のシステムは、それぞれの日(センサーデータの行)が、その日の後続する複数のセンサー、すなわち、それぞれの日に属する複数のクラスター識別子である複数の特徴的センサー動作によって表されるような記録の形式で、センサーデータを体系化、整理(organize)するよう構成されている。最小サポート(sup=5%)の頻出パターンマイニングがこのセンサーデータに対して適用され、複数の異なるセンサー動作を構成する複数の高サポート頻出発生パターン(複数のルールの第1のセット)が見いだされる。
本システムは、他のセンサーのクラスターと同時に共起する複数のセンサークラスターを合併するよう構成されている。合併のために、このような複数の類似のクラスターを見いだすため、本システムは、同じセンサーの複数のセンサークラスターの複数のイントラクラスター距離と共に、頻出パターンマイニングによって特定された複数のセンサークラスター間の重複情報(または、複数のルールの第1のセット)を、グラフとしてエンコードし、その後、類似性検出を行うよう構成されている。本システムは、8つの類似性を特定し、さらに、これらの類似性において、クラスター合併を実行する。取得された複数の類似性からのクラスター合併の結果が、以下の表IVに示されている。
Figure 2017076359
上の表(表IV)に示されているように、2番目の列は、クラスター合併が実行されたセンサー名を列挙しており、3番目の例は、合併のために類似性から特定されたクラスターIDを列挙しており、4番目の列は、合併される複数のクラスター内に含まれる複数の日の合計数を列挙しており、5番目の列は、第2のしきい値に応じて合併された複数の日の数を列挙している。選択されたクラスターは、以下に述べるようにして合併される。
図6Cを参照すると、2つのセンサークラスターの重心ヒストグラムであり、本システムによって合併のために選択されたセンサーAPP用のAPP_3(632として示されている)およびAPP_4(634として示されている)が示されている。APP_3は、87日の複数の日を有しており、そのうち80日が合併されたクラスター(APP_M_67)に含まれている一方、APP_4は、107日の複数の日を有しており、そのうち105日が合併のために含まれている。合併されたクラスター内に含まれていない複数の日は、それらのオリジナルのクラスター内に残されている。図6Cでは、残された複数の日の重心ヒストグラムが、APP3(rem)(636として示されている)およびAPP4(rem)(638として示されている)によって示されている。ここから分かるように、わずかに異なるヒストグラムを有する複数の日は、合併されたクラスター内に含まれず、複数の類似の外観のヒストグラム(similar looking histograms)のみが合併され、これにより、それらのオリジナルのクラスター内における異常値(外れ値)が取り除かれる。
複数のクラスターを合併した後、日に関連してエンコード化されたデータ(day-wise encoded data)が、複数の合併されたクラスターを用いて更新される。クラスター合併の後に、10個のセンサー用に、2466個の特徴的センサー動作が読み出され、複数の相関性のあるセンサーのセットを特定することによって、頻出パターンマイニングが実行可能となり、その後、頻出パターンマイニングがこれらの複数の相関性のあるセンサーに対してのみ実行され、これにより、頻出パターンマイニング処理がスピードアップされ、低サポートの複数のパターンであっても見いだされる。複数の相関性のあるセンサーのセットは、類似性検出を利用して判別され、その結果、複数の強固な相関性のあるセンサーの複数の類似性を生成することができる。複数の頻出パターン(または、複数のルール)の第2のセットは、グラフの形式で表され、モジュール性アルゴリズム(modularity algorithm)を用いて、複数の類似性(または、複数のサブグループ)がグラフ内において検出される。下の表IIIに示すように、10個のセンサー用に、6個の類似性が特定される。
Figure 2017076359
上の表IIIに示されているように、3つの類似性がそれぞれ互いに、3個、3個、および4個のセンサークラスターを有している一方、残りの類似性がシングルトン(singleton:1つしかインスタンスがないこと)類似性となっている。本システムは、その後、複数の相関性のあるセンサーのセットの複数の頻出パターンを探索し、それにより、パターンマイニング全体の特徴的項目の数を削減することができる。複数の相関性のあるセンサークラスターのこれらの3つのセットに対する頻出パターンマイニングは、複数の頻出パターンの3つのセットをもたらす。これらの3つのセットは、(ルールクラスタリング技術を用いて)組み合わされ、複数の日の重要部分をカバーする複数のトップ最小重複パターン(top minimal overlapping patterns)を特定する。センサーデータに対するマルチサブ空間クラスタリングの結果が、以下の表内に示されている。
Figure 2017076359
上の表に示されているように、3つのルールまたはトップパターンが、合併されたセンサークラスターの合併の観点から規定されている。複数のセンサークラスターの各パターンは、大部分は、エンジンが内部に配備されている既知の3種類の機器の中の異なるアプリケーション、すなわち、A1、A2、およびA3に属している。各クラスターのトップの3つの動作は、複数の日の合計数の50%に渡る機械の動作を説明している。{CIT_M_237,OPSV_M_29}は、{OPSV_M_29,APP_51}と23%の重複を有しており、{NBT_42,NET_109}と19%の重複を有している。{NBT_42,NET_109}および{OPSV_M_29,APP_51}は、12%の重複を有している。複数のトップパターン用に、表(4番目の列)には、各アプリケーションのパターンが観測される日数が列挙されている。3つのアプリケーション特定パターン(application-specific patterns)が、非重複であり、複数の日の35%をカバーしている。
開示の方法およびシステムの様々な実施形態は、膨大な数の日々に渡って観測されたマルチセンサーデータを用いて、複数の類似の機械の集合の複数の使用および動作パターンの簡潔な要約を、複数のルールのセットの形式で提供する。複数のルールのセットの各ルールは、複数のセンサーのそれぞれ異なっていてもよい複数のセットの複数のクラスター内の構成要素(membership)によって記述される。各センサークラスターは、任意の日における複数のセンサー値の特定の分布を特定する。開示の方法は、複数のルールの小さなセットと、それらが含む複数の単一センサークラスター(single-sensor clusters)とを自動的に発見し、それにより、これらルールが観測されたセンサーデータの大部分を共同的にカバーするようにするための手順を提供する。
上記の記述は、本分野における当業者が本発明を実施および使用することを可能とするために、本発明を説明するものである。本発明の範囲は、特許請求の範囲によって規定され、本分野における当業者が想到し得るその他の変形例を含む。そのようなその他の変形例が特許請求の範囲の文言と変わらない同等の要素を有するか、特許請求の範囲の文言と実質的に変わらない同等の要素を含んでいるのであれば、そのようなその他の変形例は、特許請求の範囲の権利範囲内に含まれる。
しかしながら、本発明による保護範囲は、メッセージを有するコンピューター可読手段に加え、プログラムにも及ぶことは理解されるであろう。そのようなコンピューター可読記憶媒体は、サーバー、携帯デバイス、または任意の適切なプログラム可能デバイス上でプログラムが実行されたとき、本発明の方法の1つ以上の工程を実施するプログラムコード手段(program-code means)を含む。ハードウェアデバイスは、例えば、サーバー、パーソナルコンピューター等、または、これらの組み合わせの任意の種類のコンピューターを含む任意の種類のプログラム可能なデバイスであってもよい。また、デバイスは、例えば、ハードウェア手段(例えば、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA))、ハードウェア手段およびソフトウェア手段の組み合わせ(例えば、ASICおよびFPGA)、少なくとも1つのマイクロプロセッサー、および、ソフトウェアモジュールが内部に保存されている少なくとも1つのメモリーのような手段を含む。よって、手段は、ハードウェア手段と、ソフトウェア手段の双方を含む。本発明の方法は、ハードウェアおよびソフトウェアにおいて実施可能である。また、デバイスは、ソフトウェア手段を含んでいてもよい。代替的に、本発明は、複数の異なるハードウェアデバイス、例えば、複数のCPUを用いて、実施されていてもよい。
本発明は、ハードウェア要素と、ソフトウェア要素とを含むことができる。本発明は、ソフトウェアにおいて実施することができ、これに限定されるものではないが、ファームウェア、常駐ソフトウェア、マイクロコード等を含む。ここに説明された様々なモジュールによって実行される機能は、他のモジュールや他のモジュールの組み合わせにおいて実施されてもよい。説明の目的のため、コンピューター使用可能またはコンピューター可読媒体は、命令実行システム、装置、またはデバイスによって使用可能またはこれらに関連したプログラムを含み、保存し、通信し、伝播し、または伝送可能な任意の装置であってもよい。
プログラムコードの保存および/または実行に適したデータ処理システムは、メモリー要素に直接的またはシステムバスを介して間接的に接続された少なくとも1つのプロセッサーを含む。メモリー要素は、プログラムコードの実際の実行の際に用いられるローカルメモリー、大容量記憶装置、および、実行の間に大容量記憶装置からの必須読み出しの回数を低減させるために少なくとも複数のプログラムコードの一時保存を提供するキャッシュメモリーを含む。
入力/出力(I/O)デバイス(これに限定されるものではないが、キーボード、ディスプレイ、ポインティングデバイス等を含む)は、システムに直接的またはI/Oコントローラーを介して接続されている。また、ネットワークアダプターは、システムに接続され、データ処理システムが、プライベートまたは公共ネットワークを介して、他のデータ処理システム、遠隔プリンター、または記憶デバイスに接続されることを可能とする。モデム、ケーブルモデム、およびイーサネットカードは、ネットワークアダプターの現在使用可能なタイプのいくつかの例である。
さらに、システムは、キーボード、マウス、スピーカー、マイク、および/または、タッチスクリーンデバイス(図示せず)のようなその他のユーザーインターフェースデバイスをバスに接続し、ユーザー入力を収集するユーザーインターフェースアダプターを含む。追加的に、通信アダプターは、バスをデータ処理ネットワークに接続し、表示アダプターは、バスを、例えば、モニター、プリンター、送信機のような出力デバイスとしても実装可能な表示デバイスに接続する。
特定の実施および実施形態の上述の記載は、本発明の実施および実施形態の一般的性質を十分に明らかにしており、現在の知識、容易な変形、および/または様々なアプリケーションへの適応を、本発明の全体的な考え方から逸脱することなく、特定の実施形態に適用することができる。さらに、そのため、そのような適応および変形は、開示の実施形態と同等な意味および範囲内に包含されるものである。本発明において使用された表現や専門用語は、説明の目的のために使用されたものであって、限定を構成するものではないことは理解されるであろう。そのため、本発明の実施形態は、好ましい実施形態に関連して説明されたが、本分野における当業者であれば、本発明の実施形態は、説明された本発明の考え方および範囲内における変形を行い実施可能であることは理解できるであろう。
上記の記述が、様々な実施形態を参照して提供された。本発明の属する分野および技術における当業者であれば、記述された構造および動作方法における変形および変更が、本発明の原理、考え方、および範囲から有意に逸脱することなく、実行可能であることを理解できるであろう。

Claims (15)

  1. マルチセンサーデータを要約するためのコンピューター実施方法であって、
    複数のセンサーに関連付けられたセンサーデータから、複数のヒストグラムを算出する工程と、
    前記複数のヒストグラムから、前記複数のセンサーのそれぞれの各ヒストグラムをクラスタリングし、前記各ヒストグラムの形状に基づいて、第1の複数のセンサークラスターを取得する工程と、
    前記第1の複数のセンサークラスターに対し頻出パターンマイニングを実行し、前記複数のセンサーの複数のセンサーのセットに関連付けられた複数のルールの第1のセットを抽出する工程と、
    前記第1の複数のセンサークラスターの中から、前記複数のセンサーのセットのセンサーに対応して選択された2つ以上のセンサークラスターを、前記2つ以上のセンサークラスターに関連付けられた前記複数のルールの第1のセットの中からの2つ以上のルール、および、前記センサーの前記2つ以上のセンサークラスター間の距離測度に基づいて選択的に合併し、第2の複数のセンサークラスターを取得する工程と、
    前記第2の複数のセンサークラスターから、前記第2の複数のセンサークラスターに関連付けられた複数の特徴的センサー動作を示す複数のルールの第2のセットを抽出する工程と、
    前記複数のルールの第2のセットに基づいて、前記第2の複数のセンサークラスターから、複数の相関性のあるセンサーの複数のセットを特定する工程と、
    前記複数の相関性のあるセンサーの1つ以上のセットから、前記マルチセンサーデータを要約し、複数の顕著な共起センサー動作を表す複数のルールの第3のセットを抽出する工程と、を含み、
    前記第1の複数のセンサークラスターのそれぞれのセンサークラスターは、前記複数のセンサーの特徴的センサーの特徴的センサー動作を表す重心ヒストグラムを含んでおり、
    前記複数のルールの第1のセットのルールは、前記複数のセンサーの複数のセンサーのセットに関連付けられており、さらに、任意の時間間隔に渡って、前記第1の複数のセンサークラスター内において頻繁に現れる複数のセンサークラスターのセットを含むことを特徴とするコンピューター実施方法。
  2. 前記第1の複数のセンサークラスターのセンサークラスターに関連付けられた前記各ヒストグラムは、第1のしきい値距離測度によって境界付けられており、
    前記第1のしきい値距離測度は、ユークリッド距離、アースムーバー距離、カルバック・ライブラー測度、バッタチャリア距離、マンハッタン距離、およびワッサースタイン計量の1つを含む請求項1に記載のコンピューター実施方法。
  3. 前記複数のルールの第2のセットは、頻出パターンマイニング技術を用いて抽出される請求項1に記載のコンピューター実施方法。
  4. 前記センサーの前記2つ以上のセンサークラスターを選択的に合併する工程は、同じ時間間隔の前記2つ以上のセンサークラスター内の前記複数のセンサーの1つ以上の他のセンサーの共起性の判別に基づいて、実行される請求項1に記載のコンピューター実施方法。
  5. 前記1つ以上の他のセンサーの前記共起性の前記判別は、
    前記第1の複数のセンサークラスターおよび前記複数のルールの第1のセットを、第1のグラフの形式で表す工程と、
    前記第1のグラフから、前記第2の複数のセンサークラスターを特定する工程と、を含み、
    前記第1のグラフは、複数のノードと、該複数のノードを接続する複数のエッジとを含んでおり、
    前記複数のノードは、前記第1の複数のセンサークラスターを表しており、
    前記複数のエッジは、イントラクラスターエッジのセットと、内部クラスターエッジのセットと、を含んでおり、
    前記内部クラスターエッジは、前記複数のルールの第1のセットのルールに関連付けられた複数のセンサークラスター間のエッジを含んでおり、
    前記イントラクラスターエッジは、第2のしきい値距離測度よりも小さい前記複数のセンサークラスター間の前記距離測度を有するセンサーの複数のセンサークラスター間のエッジを含んでおり、
    前記第2の複数のセンサークラスターのセンサークラスターは、前記第1のグラフのサブグラフから特定され、
    前記サブグラフは、前記複数のセンサーのセットに関連付けられた前記2つ以上のセンサークラスターを含み、
    前記サブグラフ内の前記複数のセンサーのセットのセンサーに関連付けられた前記2つ以上のセンサークラスターは、前記2つ以上のセンサークラスター間の前記イントラクラスターエッジの存在の判別に基づいて合併される請求項4に記載のコンピューター実施方法。
  6. 前記第2の複数のセンサークラスターに関連付けられた前記複数の相関性のあるセンサーの複数のセットを特定する工程は、
    前記複数のルールの第2のセットおよび前記第2の複数のセンサークラスターを、第2のグラフの形式で表す工程と、
    前記第2のグラフの1つ以上のサブグラフから、前記第2の複数のセンサークラスターに関連付けられた前記複数の相関性のあるセンサーの複数のセットを特定する工程と、を含み、
    前記第2のグラフは、複数のノードと、該複数のノードを接続する複数のエッジとを含んでおり、
    前記複数のノードは、前記第2の複数のセンサークラスターを表しており、
    前記複数のエッジは、前記第2の複数のセンサークラスター間の内部クラスターエッジを含んでおり、
    前記1つ以上のサブグループのそれぞれに関連付けられた複数のユニークセンサーは、前記複数の相関性のあるセンサーのセットを表している請求項1に記載のコンピューター実施方法。
  7. 前記複数のルールの第3のセットを抽出する工程は、
    前記複数の相関性のあるセンサーの複数のセットのそれぞれに対し、頻出パターンマイニングを適用し、複数の頻出パターンのセットを取得する工程と、
    前記複数の頻出パターン間の相互重複に基づいて、前記複数の頻出パターンのセットをクラスタリングし、前記複数のルールの第3のセットを取得する工程と、を含む請求項1に記載のコンピューター実施方法。
  8. マルチセンサーデータを要約するためのコンピューター実施システム200であって、
    前記システム200は、
    少なくとも1つのメモリー204と、
    前記少なくとも1つのメモリー204に接続された少なくとも1つのプロセッサー202と、を含み、
    前記少なくとも1つのプロセッサーは、前記少なくとも1つのメモリー204内に保存されている複数のプログラムされた命令を実行することにより、
    複数のセンサーに関連付けられたセンサーデータから、複数のヒストグラムを算出する工程と、
    前記複数のヒストグラムから、前記複数のセンサーのそれぞれの各ヒストグラムをクラスタリングし、前記各ヒストグラムの形状に基づいて、第1の複数のセンサークラスターを取得する工程と、
    前記第1の複数のセンサークラスターに対し頻出パターンマイニングを実行し、前記複数のセンサーの複数のセンサーのセットに関連付けられた複数のルールの第1のセットを抽出する工程と、
    前記第1の複数のセンサークラスターの中から、前記複数のセンサーのセットのセンサーに対応して選択された2つ以上のセンサークラスターを、前記2つ以上のセンサークラスターに関連付けられた前記複数のルールの第1のセットの中からの2つ以上のルール、および、前記センサーの前記2つ以上のセンサークラスター間の距離測度に基づいて選択的に合併し、第2の複数のセンサークラスターを取得する工程と、
    前記第2の複数のセンサークラスターから、前記第2の複数のセンサークラスターに関連付けられた複数の特徴的センサー動作を示す複数のルールの第2のセットを抽出する工程と、
    前記複数のルールの第2のセットに基づいて、前記第2の複数のセンサークラスターから、複数の相関性のあるセンサーの複数のセットを特定する工程と、
    前記複数の相関性のあるセンサーの1つ以上のセットから、前記マルチセンサーデータを要約し、複数の顕著な共起センサー動作を表す複数のルールの第3のセットを抽出する工程と、を実行可能であり、
    前記第1の複数のセンサークラスターのそれぞれのセンサークラスターは、前記複数のセンサーの特徴的センサーの特徴的センサー動作を表す重心ヒストグラムを含んでおり、
    前記複数のルールの第1のセットのルールは、前記複数のセンサーの複数のセンサーのセットに関連付けられており、さらに、任意の時間間隔に渡って、前記第1の複数のセンサークラスター内において頻繁に現れる複数のセンサークラスターのセットを含むことを特徴とするコンピューター実施システム。
  9. 前記第1の複数のセンサークラスターのセンサークラスターに関連付けられた前記各ヒストグラムは、第1のしきい値距離測度によって境界付けられており、
    前記第1のしきい値距離測度は、ユークリッド距離、アースムーバー距離、カルバック・ライブラー測度、バッタチャリア距離、マンハッタン距離、およびワッサースタイン計量のいずれか1つを含む請求項8に記載のコンピューター実施システム200。
  10. 前記少なくとも1つのプロセッサー202は、前記複数の命令によって、BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)クラスタリングモデルに基づいて、クラスタリングする工程を、さらに実行するよう構成されている請求項8に記載のコンピューター実施システム200。
  11. 前記少なくとも1つのプロセッサー202は、前記複数の命令によって、頻出パターンマイニング技術を用いて、前記複数のルールの第2のセットを抽出する工程を、さらに実行するように構成されている請求項8に記載のコンピューター実施システム200。
  12. 前記少なくとも1つのプロセッサー202は、前記複数の命令によって、同じ時間間隔の前記2つ以上のセンサークラスター内の前記複数のセンサーの1つ以上の他のセンサーの共起性の判別に基づいて、前記センサーの前記2つ以上のセンサークラスターを選択的に合併する工程を、さらに実行するよう構成されている請求項8に記載のコンピューター実施システム200。
  13. 前記1つ以上の他のセンサーの前記共起性を判別するため、前記少なくとも1つのプロセッサー202は、前記複数の命令によって、
    前記第1の複数のセンサークラスターおよび前記複数のルールの第1のセットを、第1のグラフの形式で表す工程と、
    前記第1のグラフから、前記第2の複数のセンサークラスターを特定する工程と、をさらに実行するよう構成されており、
    前記第1のグラフは、複数のノードと、該複数のノードを接続する複数のエッジとを含んでおり、
    前記複数のノードは、前記第1の複数のセンサークラスターを表しており、
    前記複数のエッジは、イントラクラスターエッジのセットと、内部クラスターエッジのセットと、を含んでおり、
    前記内部クラスターエッジは、前記複数のルールの第1のセットのルールに関連付けられた複数のセンサークラスター間のエッジを含んでおり、
    前記イントラクラスターエッジは、第2のしきい値距離測度よりも小さい前記複数のセンサークラスター間の前記距離測度を有するセンサーの複数のセンサークラスター間のエッジを含んでおり、
    前記第2の複数のセンサークラスターのセンサークラスターは、前記第1のグラフのサブグラフから特定され、
    前記サブグラフは、前記複数のセンサーのセットに関連付けられた前記2つ以上のセンサークラスターを含み、
    前記サブグラフ内の前記複数のセンサーのセットのセンサーに関連付けられた前記2つ以上のセンサークラスターは、前記2つ以上のセンサークラスター間の前記イントラクラスターエッジの存在の判別に基づいて合併される請求項12に記載のコンピューター実施システム200。
  14. 前記第2の複数のセンサークラスターに関連付けられた前記複数の相関性のあるセンサーの複数のセットを特定するため、前記少なくとも1つのプロセッサー202は、前記複数の命令によって、
    前記複数のルールの第2のセットおよび前記第2の複数のセンサークラスターを、第2のグラフの形式で表す工程と、
    前記第2のグラフの1つ以上のサブグラフから、前記第2の複数のセンサークラスターに関連付けられた前記複数の相関性のあるセンサーの複数のセットを特定する工程と、をさらに実行するよう構成されており、
    前記第2のグラフは、複数のノードと、該複数のノードを接続する複数のエッジとを含んでおり、
    前記複数のノードは、前記第2の複数のセンサークラスターを表しており、
    前記複数のエッジは、前記第2の複数のセンサークラスター間の内部クラスターエッジを含んでおり、
    前記1つ以上のサブグループのそれぞれに関連付けられた複数のユニークセンサーは、前記複数の相関性のあるセンサーのセットを表している請求項8に記載のコンピューター実施システム200。
  15. 前記複数のルールの第3のセットを抽出するために、前記少なくとも1つのプロセッサー202は、前記複数の命令によって、
    前記複数の相関性のあるセンサーの複数のセットのそれぞれに対し、頻出パターンマイニングを適用し、複数の頻出パターンのセットを取得する工程と、
    前記複数の頻出パターン間の相互重複に基づいて、前記複数の頻出パターンのセットをクラスタリングし、前記複数のルールの第3のセットを取得する工程と、をさらに実行するよう構成されている請求項8に記載のコンピューター実施システム200。
JP2016047735A 2015-10-17 2016-03-11 マルチセンサーデータ要約 Active JP6219428B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN3945MU2015 2015-10-17
IN3945/MUM/2015 2015-10-17

Publications (2)

Publication Number Publication Date
JP2017076359A true JP2017076359A (ja) 2017-04-20
JP6219428B2 JP6219428B2 (ja) 2017-10-25

Family

ID=55453051

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016047735A Active JP6219428B2 (ja) 2015-10-17 2016-03-11 マルチセンサーデータ要約

Country Status (7)

Country Link
US (1) US10332030B2 (ja)
EP (1) EP3157264B1 (ja)
JP (1) JP6219428B2 (ja)
AU (1) AU2016201330B2 (ja)
BR (1) BR102016005511B1 (ja)
CA (1) CA2923563C (ja)
MX (1) MX368053B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020149617A (ja) * 2019-03-15 2020-09-17 学校法人慶應義塾 分子動力学データ解析装置及びプログラム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105408898B (zh) * 2013-03-15 2019-05-28 弗兰克公司 测量数据的自动记录和图形生成
US10380204B1 (en) 2014-02-12 2019-08-13 Pinterest, Inc. Visual search
US10506380B2 (en) * 2016-12-22 2019-12-10 Nokia Solutions And Networks Oy User motion profiling based on user equipment cell location
US10755198B2 (en) * 2016-12-29 2020-08-25 Intel Corporation Data class analysis method and apparatus
CN112543852B (zh) * 2018-01-19 2022-08-12 罗伯特·博世有限公司 用于使用基于聚类的规则挖掘方法来优化结构的能量使用的系统和方法
US10929505B1 (en) * 2018-03-19 2021-02-23 EMC IP Holding Company LLC Method and system for implementing histogram-based alarms in a production system
JP7176385B2 (ja) * 2018-12-06 2022-11-22 富士通株式会社 分析プログラム、分析方法および分析装置
US10887928B2 (en) 2019-04-24 2021-01-05 Here Global B.V. Lane aware clusters for vehicle to vehicle communication
US11693924B2 (en) * 2019-06-06 2023-07-04 Hitachi, Ltd. System and method for maintenance recommendation in industrial networks
CN113282645A (zh) * 2021-07-23 2021-08-20 广东粤港澳大湾区硬科技创新研究院 一种卫星时序参数分析方法、系统、终端以及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008134750A (ja) * 2006-11-28 2008-06-12 Nippon Telegr & Teleph Corp <Ntt> データ分類装置、データ分類方法およびデータ分類プログラムならびに記録媒体
US7715961B1 (en) * 2004-04-28 2010-05-11 Agnik, Llc Onboard driver, vehicle and fleet data mining
JP2014515844A (ja) * 2011-03-04 2014-07-03 クゥアルコム・インコーポレイテッド コンテキスト類似度に基づいてクライアントデバイスをグループ化するための方法および装置
JP2014174943A (ja) * 2013-03-13 2014-09-22 Yahoo Japan Corp 時系列データ解析装置、時系列データ解析方法、およびプログラム
JP2015108990A (ja) * 2013-12-05 2015-06-11 株式会社日立ソリューションズ 異常検出装置及び異常検出方法
JP2015132939A (ja) * 2014-01-10 2015-07-23 三菱電機株式会社 データ処理装置及びデータ処理方法及びプログラム
WO2015145626A1 (ja) * 2014-03-26 2015-10-01 株式会社日立製作所 時系列データ管理方法及び時系列データ管理システム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7580912B2 (en) 2001-06-12 2009-08-25 Alcatel-Lucent Usa Inc. Performance data mining based on real time analysis of sensor data
US7143352B2 (en) * 2002-11-01 2006-11-28 Mitsubishi Electric Research Laboratories, Inc Blind summarization of video content
US7937167B1 (en) * 2006-08-12 2011-05-03 Hewlett-Packard Development Company L. P. Methodology to program sensors into collaborative sensing groups
WO2011145374A1 (ja) * 2010-05-17 2011-11-24 株式会社日立製作所 計算機システム、及び、規則生成方法
JP5301717B1 (ja) 2012-08-01 2013-09-25 株式会社日立パワーソリューションズ 設備状態監視方法およびその装置
CN103344941B (zh) * 2013-06-13 2015-08-12 北京空间飞行器总体设计部 基于无线传感器网络的实时目标检测方法
EP2916260A1 (en) * 2014-03-06 2015-09-09 Tata Consultancy Services Limited Time series analytics

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7715961B1 (en) * 2004-04-28 2010-05-11 Agnik, Llc Onboard driver, vehicle and fleet data mining
JP2008134750A (ja) * 2006-11-28 2008-06-12 Nippon Telegr & Teleph Corp <Ntt> データ分類装置、データ分類方法およびデータ分類プログラムならびに記録媒体
JP2014515844A (ja) * 2011-03-04 2014-07-03 クゥアルコム・インコーポレイテッド コンテキスト類似度に基づいてクライアントデバイスをグループ化するための方法および装置
JP2014174943A (ja) * 2013-03-13 2014-09-22 Yahoo Japan Corp 時系列データ解析装置、時系列データ解析方法、およびプログラム
JP2015108990A (ja) * 2013-12-05 2015-06-11 株式会社日立ソリューションズ 異常検出装置及び異常検出方法
JP2015132939A (ja) * 2014-01-10 2015-07-23 三菱電機株式会社 データ処理装置及びデータ処理方法及びプログラム
WO2015145626A1 (ja) * 2014-03-26 2015-10-01 株式会社日立製作所 時系列データ管理方法及び時系列データ管理システム

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
櫻井 茂明: "多様なデータに対する系列パターンマイニングの適用", 人工知能学会誌, vol. 第27巻,第2号, JPN6017033807, 1 March 2012 (2012-03-01), JP, pages 128 - 135, ISSN: 0003635641 *
福井 健一、外1名: "事象系列データからの共起性マイニング −燃料電池の損傷間および地震間の相互作用抽出−", 人工知能, vol. 第30巻,第2号, JPN6017033804, 1 March 2015 (2015-03-01), JP, pages 238 - 246, ISSN: 0003635640 *
羽室 行信、外1名: "ネットワーク構造を対象とした特徴量抽出とその応用", 経営の科学 オペレーションズ・リサーチ, vol. 第60巻,第8号, JPN6017033810, 1 August 2015 (2015-08-01), JP, pages 468 - 474, ISSN: 0003635642 *
鈴木 英之進: "データスカッシング−逆転の発想によるスケールダウン戦略−", 情報処理, vol. 第46巻,第1号, JPN6017033813, 15 January 2005 (2005-01-15), JP, pages 12 - 19, ISSN: 0003635643 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020149617A (ja) * 2019-03-15 2020-09-17 学校法人慶應義塾 分子動力学データ解析装置及びプログラム

Also Published As

Publication number Publication date
US10332030B2 (en) 2019-06-25
AU2016201330A1 (en) 2017-05-04
MX2016003107A (es) 2017-04-17
BR102016005511A2 (pt) 2017-05-30
CA2923563C (en) 2020-04-21
JP6219428B2 (ja) 2017-10-25
BR102016005511B1 (pt) 2021-04-13
AU2016201330B2 (en) 2018-05-10
MX368053B (es) 2019-09-18
EP3157264B1 (en) 2019-02-20
US20170109653A1 (en) 2017-04-20
CA2923563A1 (en) 2017-04-17
EP3157264A1 (en) 2017-04-19

Similar Documents

Publication Publication Date Title
JP6219428B2 (ja) マルチセンサーデータ要約
Amer et al. A dynamic Windows malware detection and prediction method based on contextual understanding of API call sequence
Suominen et al. Firms' knowledge profiles: Mapping patent data with unsupervised learning
Bedi et al. Community detection in social networks
US10621027B2 (en) IT system fault analysis technique based on configuration management database
Moosavi et al. Community detection in social networks using user frequent pattern mining
EP3918472B1 (en) Techniques to detect fusible operators with machine learning
Pan et al. Clustering of designers based on building information modeling event logs
Ma et al. Decomposition-based multiobjective evolutionary algorithm for community detection in dynamic social networks
Khan An exhaustive review on state-of-the-art techniques for anomaly detection on attributed networks
Bharti et al. Clustering‐based resource discovery on Internet‐of‐Things
Aqra et al. A novel association rule mining approach using TID intermediate itemset
Kohyarnejadfard et al. A framework for detecting system performance anomalies using tracing data analysis
US10346450B2 (en) Automatic datacenter state summarization
Liu et al. Functions-based CFG embedding for malware homology analysis
US20220284340A1 (en) Determining digital personas utilizing data-driven analytics
Murugappan et al. PCFA: mining of projected clusters in high dimensional data using modified FCM algorithm
Cui et al. A new technique for influence maximization on social networks using a moth-flame optimization algorithm
Tseng et al. A novel complex-events analytical system using episode pattern mining techniques
Barrera et al. An extension of iStar for Machine Learning requirements by following the PRISE methodology
Amrou M'hand et al. FuSTM: ProM plugin for fuzzy similar tasks mining based on entropy measure
Wankhade et al. A Detailed Analysis on Windows Event Log Viewer for Faster Root Cause Detection of Defect using Different Graph Plotting Method
Gill et al. ProvFL: Client-Driven Interpretability of Global Model Predictions in Federated Learning
Li et al. Behavior based social dimensions extraction for multi-label classification
Gupta et al. Performance Analysis of Software Quality using Data Mining Techniques.

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170927

R150 Certificate of patent or registration of utility model

Ref document number: 6219428

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250