JP7353238B2 - 高次元センサデータにおける異常事象の自動化された根本原因分析を実行する方法及びシステム - Google Patents

高次元センサデータにおける異常事象の自動化された根本原因分析を実行する方法及びシステム Download PDF

Info

Publication number
JP7353238B2
JP7353238B2 JP2020095164A JP2020095164A JP7353238B2 JP 7353238 B2 JP7353238 B2 JP 7353238B2 JP 2020095164 A JP2020095164 A JP 2020095164A JP 2020095164 A JP2020095164 A JP 2020095164A JP 7353238 B2 JP7353238 B2 JP 7353238B2
Authority
JP
Japan
Prior art keywords
sensor
data
sensor data
dag
applying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020095164A
Other languages
English (en)
Other versions
JP2021002335A5 (ja
JP2021002335A (ja
Inventor
ドクウー・ジュン
Original Assignee
パロ アルト リサーチ センター インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パロ アルト リサーチ センター インコーポレイテッド filed Critical パロ アルト リサーチ センター インコーポレイテッド
Publication of JP2021002335A publication Critical patent/JP2021002335A/ja
Publication of JP2021002335A5 publication Critical patent/JP2021002335A5/ja
Application granted granted Critical
Publication of JP7353238B2 publication Critical patent/JP7353238B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/4184Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by fault tolerance, reliability of production system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0275Fault isolation and identification, e.g. classify fault; estimate cause or root of failure
    • G05B23/0281Quantitative, e.g. mathematical distance; Clustering; Neural networks; Statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2323Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16YINFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
    • G16Y10/00Economic sectors
    • G16Y10/25Manufacturing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16YINFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
    • G16Y20/00Information sensed or collected by the things
    • G16Y20/10Information sensed or collected by the things relating to the environment, e.g. temperature; relating to location
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16YINFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
    • G16Y20/00Information sensed or collected by the things
    • G16Y20/20Information sensed or collected by the things relating to the thing itself
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16YINFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
    • G16Y40/00IoT characterised by the purpose of the information processing
    • G16Y40/20Analytics; Diagnosis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Automation & Control Theory (AREA)
  • Manufacturing & Machinery (AREA)
  • Biomedical Technology (AREA)
  • Signal Processing (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Algebra (AREA)
  • Discrete Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Toxicology (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computational Mathematics (AREA)

Description

本開示は、一般に、異常事象の根本原因分析を実行するシステム及び方法に関する。より具体的には、本開示は、高次元センサデータから隠れた異常事象の根本原因を識別することに関する。
多数の産業用途、例えば、デジタル製造において、モノのインターネット(IoT)対応機器の使用が増加するのに伴い、大量のセンサデータが容易に利用可能である。多くのサイバー物理システム(CPS)用途では、センサデータは、IoT装備装置から連続的に生成される。そのようなセンサデータは、工場機械の動作効率を最適化するために使用されることができる実施可能な情報を含む。具体的には、CPSにおける動作効率の最適化及び障害事象のリスクの低減は、工場のダウンタイムを低減し、製造プロセスにおける生産性を改善するために、それらの直近の用途に対する最も追求された目的の1つであった。しかしながら、センサデータの次元性及びサイズが増加すると、工場レイアウトでの機械の動作中に異常事象の根本原因を識別するために、センサ間の因果関係を手動で試験して識別するために、非常に高価なタスクにすぐになる。
実世界用途に十分にスケーリングするためには、センサデータからのセンサ間の因果関係を発見するために、根本原因分析ワークフローを自動化する必要がある。
本発明の一実施形態によれば、1つ以上の機械の動作における異常の根本原因を識別するシステムが提供される。動作中、システムは、機械に関連付けられたセンサのセットからセンサデータを取得し、センサデータをセンサのセット内の各センサのセンサ状態のセットに変換し、センサ状態のセットに基づいて、センサのセット間で最適な有向非循環グラフ(DAG)を構築して因果関係をモデル化することができ、直接隣接センサの状態を与えられたユーザ定義型標的センサの異常状態の確率を判定し、グラフ構造における異常状態をバックトラッキングすることによって標的センサに関連付けられた異常状態の根本原因を判定する。
この実施形態の変形例では、センサのセット内の各センサのセンサ状態のセットにセンサデータを変換することは、データ前処理技術をセンサデータに適用して、センサデータを、グローバル基準時間と時間整合させることであって、統一されたグローバル基準時間が時間間隔のセットを含むことと、データ要約技術を前処理されたセンサデータに適用することとを備える。
この実施形態の更なる変形例では、データ前処理技術を適用することは、更に、データ補間技術を時間整合されたセンサデータに適用して、欠落したセンサデータサンプルを置き換えることを備える。
この実施形態の更なる変形例では、データ要約技術を前処理されたセンサデータに適用することは、データ変換技術を適用して、統一されたグローバル基準時間に関連付けられた各時間間隔に対するメトリックのセットを生成することと、メトリックのセットに基づいて、クラスタリング技術を使用することによってセンサのセットに関連付けられた属性のセットにおいて、強力に接続されたコンポーネントである類似の属性をグループ化し、強力に接続されたコンポーネントのそれぞれを単一のメタノードに縮小させることと、メタノードのセットに基づいて、メタノードのDAGとしてメタグラフを構築することとを備える。有向グラフの強力に接続されたコンポーネントは、強力に接続されたサブグラフである。サブグラフ内の各ノードがサブグラフ内の全ての他のノードから到達可能である場合、有向グラフ内のサブグラフは、強力に接続されることができる。類似の属性のグループは、有向グラフ内の強力に接続されたコンポーネントとして表すことができる。
この実施形態の変形例では、センサ状態のセットに基づいて、メタノードのセットの中で最適なDAG構造を構築することは、入力のセット及びセンサ状態のセットに基づいてDAG構造のセットを構築することと、ベイジアンネットワーク発見技術を使用することによって、グラフ構造のセットから最適なDAG構造を検索することとを備える。
この実施形態の更なる変形例では、入力のセットは、気象データ、ユーザ指定のブラックリスト、及びユーザ指定のホワイトリストのうちの1つ以上を含む。
更なる変形例では、センサ状態のセットは、Kミーンズアルゴリズムを使用することによって取得される。
この実施形態の変形例では、センサのセットの中のDAG構造は、ノードのセットを備え、グラフ構造内の各ノードは、センサクラスタのセット(すなわち、メタノード)内のセンサと、有向エッジのセットとを表し、エッジのセット内の各有向エッジは、グラフ構造内の2つのノード間の因果関係を表す。
特許又は出願ファイルには、カラーで作成された少なくとも1つの図面が含まれている。本特許又は特許出願公開のカラー図面の写しは、その請求に応じて、必要な料金を支払うことにより、特許庁から提供されることとなる。
本発明の一実施形態に係る、例示的なデータ相関マップを示している。 本発明の一実施形態に係る、例示的なデータ品質マップを示している。 本発明の一実施形態に係る、例示的な根本原因分析システムアーキテクチャを示している。 本発明の実施形態に係る、シミュレートされた規則的事象に対するクラスタリングトポロジーのプロットを示している。 本発明の実施形態に係る、シミュレートされた不規則的事象に対するクラスタリングトポロジーのプロットを示している。 本発明の一実施形態に係る、時間平均データに基づいて、シミュレートされたセンサデータを三元状態にマッピングする例を示している。 本発明の一実施形態に係る、DAGモデル構造事前データモデルを示している。 本発明の一実施形態に係る、図2のアーキテクチャについての根本原因分析システム設計を示している。 本発明の一実施形態に係る、例示的な有向依存性グラフを示している。 本発明の一実施形態に係る、有向依存性グラフを使用した根本原因分析の例示的な結果を示している。 本発明の一実施形態に係る、異常事象の根本原因分析を実行するための例示的なプロセスを示すフローチャートを示している。 本発明の一実施形態に係る、根本原因分析システムを容易にする例示的なコンピュータシステムを示している。 本発明の一実施形態に係る、根本原因分析システムを容易にする例示的な装置を示している。
図面において、同様の参照番号は、同様の図要素を指す。
以下の説明は、当業者が実施形態を作製及び使用することを可能にするために提示され、特定の用途及びその要件に関連して提供される。開示される実施形態に対する様々な修正は、当業者には容易に明らかとなり、本明細書に定義される一般原理は、本開示の趣旨及び範囲から逸脱することなく、他の実施形態及び用途に適用され得る。したがって、本発明は、示される実施形態に限定されるものではなく、本明細書に開示される原理及び特徴と一致する最も広い範囲を与えられるものである。
概要
多くの実世界業界のCPS用途では、1つ以上の機械の動作中に記録されたセンサデータは多数であり、多くの場合、信頼できない測定値を生成する不均一な種類のセンサを含む。例えば、CPS用途では、工場エネルギー管理システム(FEMS)は、例えば、毎分受信した600個のセンサからのデータなど、複数の工場のサブステーションに関連付けられた多数のセンサから周期的にデータを受信することができる。センサは、エネルギー、電流、電圧などを測定するための電気計器、温度、湿度、CO2などを測定するための環境センサ、及び空気流、冷却設定点などを測定するための制御状態センサを含むことができる。これらのセンサは、工場レイアウトにおいて様々なレベルで設置されることができる。
様々なセンサからの記録されたセンサデータは、以下の不規則性を含むことができる。第1に、センサデータは、完全に異なるフォーマット及び物理的意味を有する不均質データを含むことができる。例えば、不均質データは、温度及び電力計の読み取り値を含むことができる。そのような不均質データでは、データ処理システムが、全ての変数を、根本原因分析ワークフローにおける更なる処理のために統一されたフレームワークとシームレスに変換することは困難である。第2に、センサと基地局との間の通信チャネルの不安定性に起因して、センサデータは、疎でエラーを起こしやすい可能性がある。したがって、信頼性の高い正確な分析結果を生み出す一方で、全ての種類のエラーを許容することが可能なデータ処理システムが必要とされている。第3に、CPS内の多数のセンサ及び他のデータソースが、更新をデータサーバにプッシュし続けるにつれて、データサーバは、これらの更新を短時間でフラッドされる。そのような大量のデータに対処するために、データ処理システムは、データサーバ内の蓄積されたデータに対して任意の種類の分析を実行する前に、データ要約及び圧縮技術を採用することができる。
図1Aは、本発明の一実施形態に係る、例示的なデータ相関マップを示している。データ相関マップは、FEMSからのフィーダーから収集されたデータに基づいている。図1Aでは、より明るい領域は、2つのセンサ測定値間のより高い相関を示している。一対のセンサ測定値間のそのような相関は、センサの設置位置及び種類に起因することができる。更にまた、分析されるセンサの数が増加するにつれて、より多くのセンサが相関する可能性が高い。センサデータ中のそのような高い相関の存在は、計算中に不必要なオーバーヘッドを損なう可能性がある。
図1Bは、本発明の一実施形態に係る、例示的なデータ品質マップを示している。データ品質は、単位時間持続時間を考慮して受信されるデータサンプルの総数に対する通常のデータサンプルの比率として定義されることができる。図1Bでは、データ品質は、1時間の時間ウィンドウについて計算され、暗い領域は、通常のサンプルを示す一方で、より明るい領域は、センサデータ内の相関又はランダムな損失を示している。
従来の自動根本原因分析方法は、センサデータ内の固有の不規則性を考慮するものではない。換言すれば、それらは、データの品質、種類及びフォーマットの仮定に基づいており、したがって、それらの自動化能力は、データセットの特性に応じて制限される。本明細書に記載される実施形態は、高次元センサデータにおける異常事象の自動根本原因分析を実行することに関連する上述の技術的問題を解決する。
より具体的には、根本原因分析システムは、センサデータを取得し、センサデータを前処理して、サンプリングレート及び欠落したセンサ読み取り値の不規則性に対処することができる。次いで、システムは、更なる処理のために関連するセンサデータのみを選択する。具体的には、システムは、前処理されたセンサデータをコンパクトかつ情報的データ表現に変換する。更に、システムは、センサのセット内の各センサに対するセンサ状態のセットを決定する。次いで、システムは、状態のセットに基づいて、センサクラスタのセット(すなわち、メタノード)間で最適なDAG構造を構築するように努力する。DAG構造を使用することにより、システムは、ユーザ指定の標的センサに関連付けられた異常事象の根本原因を判定することができる。具体的には、システムは、直接隣接センサの状態を与えられた標的センサの異常状態の確率を判定し、次いで、標的センサにおける異常事象の根本原因は、DAG構造における異常状態をバックトラッキングすることによって判定される。
本明細書に記載される根本原因分析システムは、以下の利点を提供する:システムが分析のために利用可能なセンサの数によって十分にスケーリングすることができるため、システムは、寸法的にスケーラブルである;このシステムは、気象、時間、及びセンサデータから学習した因果関係モデルを使用して、様々な形態の異常事象の根本原因分析タスクを実行することができるために多目的に使用することができる;システムは、破損した、ノイズが多い、及び損失のあるセンサデータの分析を行うことができるためにロバストである。
システムアーキテクチャ
図2は、本発明の一実施形態に係る、例示的な根本原因分析システムアーキテクチャを示している。根本原因分析システム200は、センサデータベース202、気象データベース204、及び3つの処理ステージを含むことができる。第1のステージは、データ前処理モジュール214を含むことができ、第2のステージは、データ要約モジュール220を含むことができ、第3のステージは、モデル発見モジュール228を含むことができる。データ前処理モジュール214は、更に、データ取得モジュール206、データ標準化モジュール208、外れ値検出モジュール210、及びデータ補間モジュール212を含むことができる。データ要約モジュール220は、更に、データ変換モジュール216及びセンサクラスタリングモジュール218を含むことができる。モデル発見モジュール228は、更に、自動状態分類モジュール222、ベイジアンネットワーク構造発見モジュール224、及び分析モジュール226を含むことができる。
センサデータベース202は、工場レイアウトで1つ以上の機械に埋め込まれた複数のセンサから収集されたセンサデータを記憶する。センサデータは、多変量時系列として表すことができ、例えば、センサデータは、異なるタイムスタンプにおいて大きな変数群の記録を含むことができる。気象データベース204は、気象に関連付けられたデータ、例えば、温度、露点、湿度などを含むことができる公的に入手可能なデータベースである。データ取得モジュール206は、センサデータベース202及び気象データベース204を周期的に照会し、ローカル分析サーバ内のバイナリデータフォーマットに保持された対応するデータレコードを記憶及び/又は更新する。
本発明の一実施形態では、ユーザは、全ての観察を網羅する時間間隔を示す2つのタイムスタンプ、すなわち、TからTを設定することができる。例えば、時間間隔は、1年に設定されることができる。この時間間隔は、分析期間と称されることができる。分析期間は、一対の(T、T)として表すことができ、システムは、ユーザによって明示的に指定されない限り、周期的な更新をサポートするように分析周期を自動的に設定することができる。
一実施形態では、データ標準化モジュール208は、T及びTが予め定義されて変更されていないこと、及び複数のセンサに関連付けられた全ての収集された属性がインデックス
Figure 0007353238000001
で順序付けられることを想定することができ、ここで、Nは、分析のためにデータ取得モジュール206によって収集された属性の総数を表す。用語「属性」はまた、データベース内の等価用語「カラム」とも称されることができる。データ標準化モジュール208は、収集された属性の全てを2つのグループに分割することができる。第1のグループ
Figure 0007353238000002
は、センサデータベースによって収集された属性を含む。第2のグループ
Figure 0007353238000003
は、公共データベースからの気象関連属性を含む。更にまた、データ標準化モジュール208は、Sにおける属性を2つのクラスに分類することができる。第1のクラスは、異常事象、例えば、電力計測定値からの異常な電力消費を対象とする一次センサ
Figure 0007353238000004
についての属性インデックスのセットを含むことができる。第2のクラスは、S/P又はS-Sによって表される残りのセンサ属性を含むことができる。
本発明の一実施形態では、データ標準化モジュール208は、カラム(又は属性)に基づいて、全ての取得されたセンサデータサンプルを時系列で変換することによって、センサデータの後続分析の効率を改善することができ、結果をカラムストアデータベースシステムに保存することができる。データ標準化モジュール208は、
Figure 0007353238000005
として各i番目の属性についての列ベクトルを構築することができ、ここで、nは、分析期間(T、T)中に収集されたサンプルの総数を表す。
Figure 0007353238000006
は、aについてのタイムスタンプの対応するアレイを示すものとし、ここで、
Figure 0007353238000007
について、T≦ti,j≦Tである。
センサと基地局との間のデータ通信チャネルの不安定性のために、2つの連続するタイムスタンプ間の差は、一定でないことがある。サンプリングレート内の任意の不規則性に対処するために、データ標準化モジュール208は、全てのサンプルを統一されたグローバル基準時間ドメインにマッピングすることができる。データ標準化モジュール208は、均一なグローバル基準時間を、等しい長さの間隔Δに秒で分割することができ、例えば、間隔の長さは、1時間とすることができる。
Figure 0007353238000008
は、k番目の時間間隔の開始時間を表し、ここで、Kは、分析期間(T、T)内の統一されたグローバル基準時間内の時間間隔の総数を表す。開始時間表記
Figure 0007353238000009
は、センサ属性S及び気象属性Wの双方に使用されることができる。
Figure 0007353238000010
の状態は、時間関連パラメータ表現トリプレットとして表すことができ、すなわち、θ=(θ、θ、θ)として表すことができる。トリプレットにおいて、θ、θ及びθは、それぞれ、年の月、週の日、及び日の時間の略である。データ標準化モジュール208が、統一されたグローバル基準時間間隔に全てのタイムスタンプをマッピングした後、各属性について新しい列ベクトルを生成する。
外れ値検出モジュール210は、各属性を3つの一般的な値タイプ、すなわち、連続的、離散的、及び一定の値のうちの1つに分類することができる。次いで、外れ値検出モジュール210は、列ベクトルのパターンを分析する。全てのグローバル基準時間間隔にわたって属性が一定のままである場合、これらの一定の種類の属性は、根本原因分析ワークフローにおいて可能な結果を生成しない場合があるため、更なる分析のために含まれなくてもよい。
データ補間モジュール212は、時間間隔内でタイムスタンプを用いて全てのサンプルを集計して、数値を含む特定の属性に関連付けられた平均及び分散を計算することができ、その結果、時間間隔に少なくとも1つの有効なサンプルが存在する。そうでなければ、データ補間モジュール212は、隣接する間隔の集計結果に基づいて補間アルゴリズムを実行することができる。属性がカテゴリー値、例えば、{高、中央、低}を含む場合、データ補間モジュール212は、ランダムハッシュを適用して、具体的な値を整数領域にマッピングし、連続数値としてマッピング後に属性を処理することができる。例えば、データ補間モジュール212は、連続値タイプの線形補間、及び離散値タイプの最近傍補間を使用することによって、欠落したセンサ読み取り値を置き換えることができる。
データ補間モジュール212の出力で利用可能なセンサデータ及び気象データに関連付けられた属性は、多様な属性タイプを含むことができる。属性タイプダイバーシティ及び多数の属性の悪影響を除去するために、データ要約モジュール220は、属性をコンパクトかつ情報的データ表現に変換することができる。データ要約モジュール220は、(データ変換モジュール216による)データ変換及び(センサクラスタリングモジュール218による)センサクラスタリングの2つの異なる動作を実行することができる。
一実施形態では、データ変換モジュール216は、各時間間隔のサンプルを2つの明確な特徴に要約することができる;それぞれ、規則的事象及び不規則的事象の平均特徴及び分散特徴。次いで、データ変換モジュール216は、特徴行列を構築し、時間間隔及び属性は、行列の行及び列にそれぞれ表される。平均特徴は、周期的に発生する事象、例えば、日中又は毎週の正弦波サイクルを捕捉することができる。周期的に発生する事象は、規則的事象と称されることができる。分散特徴は、非周期的発生事象を捕捉することができ、これはまた、属性サンプル値の変動を定量化することもできる。非周期的発生事象は、不規則的事象と称されることができる。
各時間間隔kについて、データ変換モジュール216は、センサデータの全ての属性に対する平均及び分散特徴を計算することができる。Ni、kは、時間間隔k中の属性iに関連付けられたサンプルの数を表し、Si、kは、時間間隔kの開始時の属性iのサンプルインデックス、すなわち、
Figure 0007353238000011
の開始時の属性iのサンプルインデックスを示すものとする。そして、平均及び分散特徴は、以下のように計算される。
Figure 0007353238000012
ここで、
Figure 0007353238000013
は、時間間隔kについて属性iの平均及び分散特徴を示す。
センサクラスタリングモジュール218は、センサ測定値が非常に相関性が高いことが多く、この高い相関がランク不足の特徴行列をもたらし得ることを考慮する。したがって、類似の属性群内の有限数の代表的属性(すなわち、特徴行列の列ベクトル)を選択する必要がある。同様の属性をグループ化する前に、センサクラスタリングモジュール218は、グループ化/クラスタリングに対する一貫性のない単位及び属性特徴のスケールの影響を排除するために、以下の動作を実行する。最初に、センサクラスタリングモジュール218は、単位長さ及びゼロ中心に対する各属性の特徴ベクトル(すなわち、特徴行列の列ベクトル)を正規化することができる。次いで、センサクラスタリングモジュール218は、各特徴ベクトルを単位K次元球体の表面上に等価にマッピングすることができる。
本発明の一実施形態では、センサクラスタリングモジュール218は、親和性クラスタリングアルゴリズムを使用することができる。親和性クラスタリングアルゴリズムを使用して、各群が、例示的なものと呼ぶことができる対応する単一の代表的属性を有し、グループ内の残りの属性を従動するものと呼ぶことができるような方法でグループ化することができる。各例示的なものの場合、センサクラスタリングモジュール218は、2つの特徴行列、すなわち、平均特徴行列及び変動特徴行列を構築することができる。データセンサクラスタリングモジュール218で実行されるデータ処理動作は、多数の相関属性を排除することによって、モデル発見モジュール228内の探索空間を低減することができる。更にまた、親和性クラスタリングアルゴリズムは、データポイント間の距離測定基準を通過及び使用するメッセージを介してクラスタを構築することによって、大きなデータセットを処理するための高速かつ信頼性の高い方法を提供する。
以下のセクションでは、センサクラスタリングモジュール218の動作について、更に詳細に説明する。本発明の一実施形態では、センサクラスタリングモジュール218は、それぞれ、式(1)及び(2)に従って属性iの平均及び分散特徴ベクトルを計算することができる。平均特徴ベクトルは、
Figure 0007353238000014
として表すことができ、分散特徴ベクトルは、
Figure 0007353238000015
として表すことができる。平均特徴ベクトル
Figure 0007353238000016
は、
Figure 0007353238000017
であるように、
Figure 0007353238000018
によって示されるゼロ中心及び単位長さベクトルに変換されることができ、ここで、
Figure 0007353238000019
である。同様に、分散特徴ベクトル
Figure 0007353238000020
も変換されることができる。属性iとjとの間の平均特徴における相違性は、
Figure 0007353238000021
としてユークリッド距離によって測定することができる。同様に、分散特徴ベクトル
Figure 0007353238000022
における相違度を測定することができ、
Figure 0007353238000023
として示される。
平均特徴ベクトルにおける相違度はまた、
Figure 0007353238000024
として定義することができ、ここで、
Figure 0007353238000025
は、属性iとjとの間の平均特徴の相関係数である。更に、平均特徴ベクトルの相違度尺度は、実数
Figure 0007353238000026
のセットによって境界付けられ、平均特徴ベクトルの類似度は、
Figure 0007353238000027
として定義することができる。分散特徴ベクトルの類似度は、
Figure 0007353238000028
として定義することができる。
そして、センサクラスタリングモジュール218は、以下の条件が満たされた場合に、平均及び分散特徴ベクトルのゼロ分散属性を決定することができる。
Figure 0007353238000029
ここで、
Figure 0007353238000030
は、正規化された平均特徴ベクトル及び
Figure 0007353238000031
は、正規化された分散特徴ベクトルの分散を示し、
Figure 0007353238000032
は、
Figure 0007353238000033
でのそれぞれの閾値である。
Figure 0007353238000034
を、平均及び分散特徴ベクトルのゼロ分散属性のインデックスのグループ(又はクラスタ)をそれぞれ示すものとする。一実施形態では、センサクラスタリングモジュール218は、親和性クラスタリングアルゴリズムを使用して、平均特徴及び分散特徴のクラスタを計算することができる。親和性クラスタリングアルゴリズムは、それぞれ、全ての非ゼロ分散属性
Figure 0007353238000035
について、類似度が
Figure 0007353238000036
を使用する。そして、例示的な属性の平均及び分散特徴は、それぞれ、特徴行列
Figure 0007353238000037
(式中、
Figure 0007353238000038
は、平均及び分散特徴の例示の属性指数である。
図3Aは、本発明の一実施形態に係る、シミュレートされた規則的事象についての例示的なもの及び従動するもののセンサのクラスタリングトポロジーのプロットを示している。図3Bは、本発明の一実施形態に係る、シミュレートされた不規則的事象についての例示的なもの及び従動するもののセンサのクラスタリングトポロジーのプロットを示している。図3A及び図3Bのトポロジーは、シミュレートされた規則的及び不規則的事象についての親和性クラスタリングアルゴリズムを使用することによって得られている。
図2に戻ると、モデル発見モジュール228は、以下のデータ処理モジュール:自動状態分類モジュール222、ベイジアンネットワーク構造発見モジュール224及び分析モジュール226を使用することによって、センサクラスタリングモジュール218によって出力されるデータを更に処理する。モデル発見モジュール228の目的は、観察されたセンサデータ及び気象データを所与として最適なベイジアンネットワーク(BN)構造を検索することによって、属性間の因果関係の単純なグラフ表示をDAGとして見つけることである。
自動状態分類モジュール222は、ニーポイント検出によるKミーンズアルゴリズムを使用することができ、最適数のクラスタKは、KとKを与えられたモデルの対数尤度との間のトレードオフのニーポイントによって判定されることができる。それにより、三元状態、例えば、高、低、及び非ピーク、及び二元状態、例えば、それぞれ規則的及び不規則的変動によって表される、規則的事象及び不規則的事象を伴うBN構造の状態構成を簡略化する。図4は、本発明の一実施形態に係る、シミュレートされたセンサデータの時間平均に基づいて、シミュレートされたセンサデータを三元状態にマッピングする例を示している。図4のプロット(a)は、目標センサ測定値、すなわち、電力計データの電力消費プロファイルの例を示している。この電力計データを最初に15分の平均に変換することができ、そのような平均電力計データをプロット(b)に示している。次いで、自動状態分類モジュール222は、平均電力測定器データを三元状態、例えば、高、低、及び非ピークに変換することができる(プロット(c)に示す)。
表1(以下に示す)は、自動状態分類モジュール222によって実行されるセンサ測定の事象分類を示している。表1はまた、平均及び変動特徴の特性間の比較を提供する。
Figure 0007353238000039
図2に戻ると、ベイジアンネットワーク構造発見モジュール224は、次に、ノード間の有向エッジによってDAGとして表される属性間の因果関係を伴う特徴行列に基づいて、最も確率の高いグラフィック構造のセットを見つけることができる。グラフィック構造のそれぞれは、センサに関連付けられた属性に対応する各ノードを有するノードのセットと、ノード間の有向エッジのセットと、を含むことができる。
以下のセクションでは、ベイジアンネットワーク構造発見モジュール224及び分析モジュール226の動作について、更に詳細に説明する。従来のシステムは、最適なBN構造を特定するための指数関数的探索空間を探索する必要があり、これは、BN構造及び状態に関する任意の制約なしに最適なBN構造を同定する必要がある。従来のシステムが、最適なBN構造を有限時間で見つけることができる場合であっても、得られる構造は、初期出発点に対して高度に敏感であり、したがって信頼できない。更にまた、BN構造中の状態が正確に定義されない場合、BN構造を学習するために使用されるアルゴリズムは、無限に遅い速度で最終解に収束し得る。
上述の問題を克服するために、本発明の一実施形態は、探索を誘導するために、BN構造の従来のデータモデルを設定し、図5は、そのような事前データモデルを示している。図5は、本発明の一実施形態に係る、DAGモデル構造事前データモデルを示している。事前データモデルは、BN構造上の気象属性502の時間パラメータ506及びセンサ属性(標的センサ測定508及び非標的センサ測定504を含む)の間の因果関係の基本的な制約を課す。因果関係の1つの方向のみが、例えば、時間パラメータ506から気象属性502に許可されるが、気象属性502から時間パラメータ506までは許可されない。そのような因果的制約は、任意の種類のセンサ及び気象データに対して普遍的に保持された基本的なBN構造を定義することができる。システムは、図2の自動状態分類モジュール222によって学習された個々の属性の隠れたパラメータを使用することによって因果関係モデルを表すことができる。一実施形態では、図2の自動状態分類モジュール222は、連続状態の最適な量子化を見つけることと同等であり得る、属性の特徴の連続状態のために、最適な離散状態、すなわち隠れパラメータを見出すことができる。次いで、ユーザは、それらの既知の依存知識に基づいて、ブラック/ホワイトリスト510を提供して、BN構造を更に制約することができる。
一実施形態では、表記Xは、Xavg及びXvarの双方を表すために使用される。表記X.iは、Xのi番目の列ベクトルを示し、属性iの観察された特徴サンプルを表す。標的センサ測定属性のための特徴行列は、
Figure 0007353238000040
で表すことができる。同様に、非標的センサ測定属性504及び気象属性502についての
Figure 0007353238000041
及びXをそれぞれ定義することができる。一実施形態では、観察された特徴サンプルXi,kは、下にある又は隠れた離散した状態θ、すなわち、
Figure 0007353238000042
に依存し得る。あるいは、θは、量子化後の連続ランダム変数Xi,kの離散状態表現として解釈することができる。表記
Figure 0007353238000043
は、
Figure 0007353238000044
の隠れた状態を示し、
Figure 0007353238000045
は、
Figure 0007353238000046
の隠れた状態を示し、同様に、気象及び時間属性の隠れた状態は、それぞれθ及びθによって示され得る。属性間の因果関係は、図5に示すDAGを使用することによって、隠れパラメータ
Figure 0007353238000047
によってコンパクトに表すことができる。図5では、ノード間の矢印は因果関係を表し、各プレートは、同じ属性を有するノード間の一例のみを示す。プレート内のノード間の依存性構造については、更なる想定はなされていない。
図2に戻ると、ベイジアンネットワーク構造発見モジュール224は、図5のグラフィックモデル及び特徴行列Xを考慮して、
Figure 0007353238000048
を見つけるように、
Figure 0007353238000049
コンパクトな確率的説明を見つける。この目的は、図5のX及びモデルを考慮して、
Figure 0007353238000050
について最良の図形構造を体系的に検索することを容易にするBNフレームワークを採用することによって達成することができる。
G=(N、E)は、ノード
Figure 0007353238000051
を有するDAG、及び変数間の直接的な依存性を表すエッジEを示す。更に、更なる変数は、以下のように定義することができる。
n次元のBNは、トリプレットB=(θ、G、Z)と、以下によって与えられるθに対する固有のジョイント確率分布として定義することができる:
Figure 0007353238000053
n個の変数を有する全てのベイジアンネットワークのセットは、
Figure 0007353238000054
によって表すことができる。一実施形態では、ベイジアンネットワーク構造発見モジュール224は、値
Figure 0007353238000055
を最大化するベイジアンネットワーク
Figure 0007353238000056
を探索することにより、ベイジアンネットワークを学習することができ、ここで、φはスコアリング機能を示し、
Figure 0007353238000057
は、Xから見出される隠れ状態θのサンプルを示す。一実施形態では、ベイジアンネットワーク構造発見モジュール224は、ベイジアン情報基準(BIC)スコアによって
Figure 0007353238000058
を検索するためのGreedyのヒルクライミング法を使用することができる。
ベイジアンネットワーク構造発見モジュール224は、ベイジアンネットワークフレームワークを使用して、不規則事象及び規則的事象に対する依存性モデルを説明することができる。図5に示す基本依存性モデルを考慮すると、ベイジアンネットワーク構造発見モジュール224は、不規則的及び規則的事象のために、完全な依存性構造(BN構造)を自動的に学習することができる。次いで、完全な依存性構造を所与として、ベイジアンネットワークパラメータ推定アルゴリズムを使用して、規則的及び不規則的事象に対する依存確率(すなわち、BN分布)を計算することができる。本発明の一実施形態では、ベイジアンネットワーク構造発見モジュール224は、センサ測定値、気象データ(例えば、温度、露点、湿度、イベント、及び条件)、及びタイムスタンプ(月、週、日、時間)から、BNを学習することができる。更に、システムはまた、ユーザが入力(例えば、ブラックリスト及びホワイトリスト)を図5の学習モデルに手動で提供することを可能にすることができる。
分析モジュール226は、次に、ノードiがリーフノード(すなわち、子なしのノード)であるまで、以下の動的方程式(6)を連続的に計算することによって、根本原因分析を実行する。
Figure 0007353238000059
ここで、Jはノードiの親ノードを示し、θJiは、ノードiの親ノードの状態を表し、
Figure 0007353238000060
は標的センサの異常状態を示す。
図6は、本発明の一実施形態に係る、図2のアーキテクチャについての根本原因分析システム設計を示している。図6は、2つの独立して実行されるシステム:トレーニングのためのシステム612、及び推論のためのシステム614を示している。一実施形態では、トレーニングシステム612は、データベースサーバからのデータストリーム602のバッチからベイジアンネットワーク構造606を学習し、工場レイアウト618の事前知識を学習することができる。推論システム614は、トレーニングデータセット608で利用可能でありかつユーザ定義の標的センサ616が与えられたベイジアンネットワーク構造の最新の更新を使用して、根本原因分析タスク610を実行することができる。メッセージ待ち行列604は、データベース、トレーニングシステム612、及び推論システム614の間のデータストリームを適切に制御することができる。
図7Aは、本発明の一実施形態に係る、例示的な有向依存性グラフを示している。ノード702-732は、異なるセンサを表し、ノードを接続する有向エッジは、ノード間の接続を表す。図7Bは、本発明の一実施形態に係る、有向依存性グラフを使用した根本原因分析の例示的な結果を示している。標的センサ710(黒影付き円)が与えられると、システムは、図7Bに示される有向依存性グラフを使用して、根本原因分析を実行する。一実施形態では、根本原因分析は、式(6)を使用して計算される。例えば、所与の標的センサ710の異常状態が「アイドル」状態に設定されている場合、式(6)を使用して、以下の機械に存在する条件により、センサ710内の「アイドル」状態が最も起こりやすいと結論付けることができる:センサ720に関連付けられた機械もアイドル状態である場合、センサ716に関連付けられた機械の入力において利用可能な入力がない場合、及びセンサ712に関連付けられた機械の接触時間が通常よりも長い場合。また、異常の最も確率が高い原因は、その状態の最も確率の高い原因がセンサ716及び730のうちのセンサ730’のオフ状態である、センサ716の「入力なし」状態によるものである。したがって、所与の標的センサ710内の異常状態の根本原因は、センサ730の特定のオフ状態にトレースバックされることができる。
図8は、本発明の一実施形態に係る、異常事象の根本原因分析を実行するための例示的なプロセスを示すフローチャートを示している。動作中、システムは、センサデータベースに記憶されたセンサデータを取得することができる(動作802)。センサデータは、工場レイアウトで1つ以上の機械に埋め込まれた複数のセンサに関連付けられる。
産業用IoT用途では、センサの数の増加に起因して、収集されたセンサデータの量は大きくなり得る。更にまた、センサデータは、通常、欠落した、破損した、ノイズが多い、及び非常に相関がある値を含む、多数の悪状態データを含む。このような不良な品質のセンサデータが根本原因分析を実行するために使用される場合、結果は不正確であり、したがって信頼することができない。更にまた、根本原因分析の計算複雑性は、多数のセンサデータに起因して大幅に増加し得る。センサデータのコンパクトかつ情報的表現を提供するために、システムは、センサデータをセンサ状態のセットに変換する(動作804)。
動作804に続いて、システムは、センサ状態のセットを使用して、最適なDAG構造を連続的に学習し、最も確率の高いBN構造を選択することによって、最適なBN構造を構築することができる(動作806)。次いで、システムは、最適なDAG構造について、グラフ内の直接隣接するもののうちのいくつかの状態を所与として、ユーザ指定の標的センサの異常状態の確率を判定することができる(動作808)。次いで、システムは、DAG上の異常状態をバックトラッキングすることによって、標的センサの異常状態の最も確率可能な原因を判定することができる(動作810)。
例示的なコンピュータシステム及び装置
図9は、本発明の一実施形態に係る、根本原因分析システムを容易にする例示的なコンピュータシステムを示している。コンピュータシステム900は、プロセッサ902、メモリ904、及び記憶デバイス906を含む。コンピュータシステム900は、ディスプレイ装置910、キーボード912、及びポインティングデバイス914に結合されることができ、また、1つ以上のネットワークインターフェースを介してネットワーク908に結合されることができる。記憶装置906は、オペレーティングシステム918及び根本原因分析システム920を記憶することができる。
根本原因分析システム920は、コンピュータシステム900によって実行されると、コンピュータシステム900に、本開示で説明される方法及び/又はプロセスを実行させることができる命令を含むことができる。根本原因分析システム920はまた、1つ以上のセンサに関連付けられたセンサデータを受信するための命令(センサデータ受信モジュール922)、センサデータ前処理を実行するための命令(センサデータ前処理モジュール924)、及びデータ前処理ステージの後にセンサデータを更に処理するための命令(データ要約モジュール926)と、を含むことができる。更にまた、根本原因分析システム920は、最も確率の高いグラフィカル構造を発見し、ユーザ指定の標的センサにおける異常の根本原因を判定するための命令(モデル発見モジュール928)を含むことができる。
図10は、本発明の一実施形態に係る、監視されていない異常検出システムを容易にする例示的な装置を示している。装置1000は、有線、無線、量子光、又は電気通信チャネルを介して互いに通信し得る複数のユニット又は装置を備えることができる。装置1000は、1つ以上の集積回路を使用して実現されることができ、図10に示されているものよりも少ない又は多いユニット又は装置を含むことができる。更に、装置1000は、コンピュータシステムに統合され得るか、又は他のコンピュータシステム及び/若しくはデバイスと通信することができる別個のデバイスとして実現され得る。具体的には、装置1000は、図9のコンピュータシステム900のモジュール920-928と同様の機能又は動作を実行するユニット1002-1010を備えることができ、センサデータ受信ユニット1002と、センサデータ前処理ユニット1004と、データ要約ユニット1006と、モデル発見ユニット1008とを含む。装置1000は、通信ユニット1010を更に含むことができる。
一般に、本発明の実施形態は、DAGを使用して高次元センサデータの異常事象の根本原因を追跡する方法及びシステムを提供する。センサデータを使用して工場機械動作における異常の根本原因を発見することが、例として使用されている。実際には、この解決策は、工場機械に関連付けられた異常の検出に限定されるものではない。また、他の種類の装置又は機械装置における異常を検出するために使用することもできる。
「発明を実施するための形態」の節に記載される方法及びプロセスは、上に論じられるようなコンピュータ可読記憶媒体内に記憶され得るコード及び/又はデータとして具体化され得る。コンピュータシステムが、コンピュータ可読記憶媒体上に記憶されたコード及び/又はデータを読み取って実行すると、コンピュータシステムは、データ構造及びコードとして具体化され、コンピュータ可読記憶媒体内に記憶された方法及び処理を実行する。
更に、上述の方法及び処理は、ハードウェアモジュール又は装置に含まれてもよい。ハードウェアモジュール又は装置としては、特定用途向け集積回路(application-specific integrated circuit、ASIC)チップ、フィールドプログラム可能ゲートアレイ(field-programmable gate array、FPGA)、特定の時刻に特定のソフトウェアモジュール又はコードを実行する専用又は共有プロセッサ、及び、既知の又は後に開発される他のプログラム可能論理デバイスを含むことができるが、これらに限定されない。ハードウェアモジュール又は装置が起動されると、それらの内部に含まれる方法及び処理が実行される。
本明細書に記載される前述の実施形態は、例示及び説明のみを目的として提示されている。それらは、網羅的であること、又は本発明を開示される形態に限定することを意図するものではない。したがって、多くの修正及び変形が、当業者には明らかであろう。更に、上記の開示は、本発明を限定することを意図するものではない。本発明の範囲は、添付の特許請求の範囲によって定義される。

Claims (17)

  1. 1つ以上の機械の動作における異常の根本原因を識別する方法であって、
    前記1つ以上の機械に関連付けられたセンサのセットからセンサデータを取得することと、
    前記センサデータをセンサ状態のセットに変換することと、を含み、
    前記方法は、さらに、
    入力のセット及び前記センサ状態のセットに基づいて有向非循環グラフ(DAG)のセットを構築し、
    ベイジアンネットワーク発見技術を使用することにより、前記DAGのセットから前記最適なDAGを検索することによって、
    前記センサ状態のセットに基づいて、前記センサのセットに対する最適な前記DAGを構築して因果関係をモデル化することと、
    前記DAGを使用することによって、直接隣接センサの状態に基づいて標的センサの異常状態の確率を判定することと、
    前記DAGにおける前記異常状態をバックトラッキングすることによって、前記標的センサに関連付けられた前記異常状態の根本原因を判定することと、を備える、方法。
  2. 前記センサデータをセンサ状態のセットに変換することが、
    前記センサデータにデータ前処理技術を適用して、前記センサデータを統一されたグローバル基準時間と時間整合させることであって、前記統一されたグローバル基準時間が時間間隔のセットを含むことと、
    前記前処理されたセンサデータにデータ要約技術を適用することと、を備える、請求項1に記載の方法。
  3. 前記データ前処理技術を適用することが、更に、
    前記時間整合されたセンサデータにデータ補間技術を適用して、欠落したセンサデータサンプルを置き換えることを備える、請求項2に記載の方法。
  4. 前記データ要約技術を前記前処理されたセンサデータに適用することが、
    データ変換技術を適用して、前記統一されたグローバル基準時間に関連付けられた各時間間隔に対するメトリックのセットを生成することと、
    前記メトリックのセットに基づいて、クラスタリング技術を使用することによって前記センサのセットに関連付けられた属性のセットにおいて、強力に接続されたコンポーネントである類似の属性をグループ化し、前記強力に接続されたコンポーネントのそれぞれを単一のメタノードに縮小させることと、
    メタノードのセットに基づいて、前記メタノードのDAGとしてメタグラフを構築することと、を備える、請求項2に記載の方法。
  5. 前記入力のセットが、
    気象データと、
    ユーザ指定のブラックリストと、
    ユーザ指定のホワイトリストと、のうちの1つ以上を含む、請求項に記載の方法。
  6. 前記センサ状態のセットが、Kミーンズアルゴリズムを使用することによって取得される、請求項1に記載の方法。
  7. 前記センサのセットの前記DAGが、
    ノードのセットであって、前記グラフ内の各ノードがセンサクラスタのセット内のセンサを表す、ノードのセットと、
    有向エッジのセットであって、前記エッジのセット内の各有向エッジが前記グラフ内の2つのノード間の因果関係を表す、有向エッジのセットと、を含む、請求項1に記載の方法。
  8. 1つ以上の機械の動作における異常の根本原因を識別する装置であって、
    1つ以上のプロセッサと、
    前記1つ以上の機械に埋め込まれたセンサのセットと、
    前記1つ以上のプロセッサによって実行されると、前記装置に、
    前記1つ以上の機械に関連付けられたセンサのセットからセンサデータを取得させ、
    前記センサデータをセンサ状態のセットに変換させ、
    さらに、前記装置に、
    入力のセット及び前記センサ状態のセットに基づいて有向非循環グラフ(DAG)のセットを構築し、
    ベイジアンネットワーク発見技術を使用することにより、前記DAGのセットから前記最適なDAGを検索することにより、
    前記センサ状態のセットに基づいて、前記センサのセットに対する最適な前記DAGを構築させて因果関係をモデル化させ、
    前記DAGを使用することによって、直接隣接センサの状態に基づいて標的センサの異常状態の確率を判定させ、
    前記DAGにおける前記異常状態をバックトラッキングすることによって、前記標的センサに関連付けられた前記異常状態の根本原因を判定させる、命令を記憶するメモリと、を備える、装置。
  9. 前記センサデータをセンサ状態のセットに変換することが、
    前記センサデータにデータ前処理技術を適用して、前記センサデータを統一されたグローバル基準時間と時間整合させることであって、前記統一されたグローバル基準時間が時間間隔のセットを含むことと、
    前記前処理されたセンサデータにデータ要約技術を適用することと、を備える、請求項に記載の装置。
  10. 前記データ前処理技術を適用することが、更に、
    前記時間整合されたセンサデータにデータ補間技術を適用して、欠落したセンサデータサンプルを置き換えることを備える、請求項に記載の装置。
  11. 前記データ要約技術を前記前処理されたセンサデータに適用することが、
    データ変換技術を適用して、前記統一されたグローバル基準時間に関連付けられた各時間間隔に対するメトリックのセットを生成することと、
    前記メトリックのセットに基づいて、クラスタリング技術を使用することによって前記センサのセットに関連付けられた属性のセットにおいて、強力に接続されたコンポーネントである類似の属性をグループ化し、前記強力に接続されたコンポーネントのそれぞれを単一のメタノードに縮小させることと、
    メタノードのセットに基づいて、前記メタノードのDAGとしてメタグラフを構築することと、を備える、請求項に記載の装置。
  12. 前記入力のセットが、
    気象データと、
    ユーザ指定のブラックリストと、
    ユーザ指定のホワイトリストと、のうちの1つ以上を含む、請求項に記載の装置。
  13. 前記センサ状態のセットが、Kミーンズアルゴリズムを使用することによって取得される、請求項に記載の装置。
  14. 前記センサのセットの前記DAGが、
    ノードのセットであって、前記グラフ内の各ノードがセンサクラスタのセット内のセンサを表す、ノードのセットと、
    有向エッジのセットであって、前記エッジのセット内の各有向エッジが前記グラフ内の2つのノード間の因果関係を表す、有向エッジのセットと、を含む、請求項に記載の装置。
  15. コンピュータによって実行されると、前記コンピュータに、1つ以上の機械の動作における異常の根本原因を識別する方法を実行させる命令を記憶する非一時的コンピュータ可読記憶媒体であって、前記方法が、
    前記1つ以上の機械に関連付けられたセンサのセットからセンサデータを取得することと、
    前記センサデータをセンサ状態のセットに変換することと、を含み、
    前記方法は、さらに、
    入力のセット及び前記センサ状態のセットに基づいて有向非循環グラフ(DAG)のセットを構築し、
    ベイジアンネットワーク発見技術を使用することにより、前記DAGのセットから前記最適なDAGを検索することによって、
    前記センサ状態のセットに基づいて、前記センサのセットに対する最適な前記DAGを構築して因果関係をモデル化することと、
    前記DAGを使用することによって、直接隣接センサの状態に基づいて標的センサの異常状態の確率を判定することと、
    前記DAGにおける前記異常状態をバックトラッキングすることによって、前記標的センサに関連付けられた前記異常状態の根本原因を判定することと、を備える、非一時的コンピュータ可読記憶媒体。
  16. 前記センサデータをセンサ状態のセットに変換することが、
    前記センサデータにデータ前処理技術を適用して、前記センサデータを統一されたグローバル基準時間と時間整合させることであって、前記統一されたグローバル基準時間が時間間隔のセットを含むことと、
    前記前処理されたセンサデータにデータ要約技術を適用することと、を備える、請求項15に記載の非一時的コンピュータ可読記憶媒体。
  17. 前記データ要約技術を前記前処理されたセンサデータに適用することが、
    データ変換技術を適用して、前記統一されたグローバル基準時間に関連付けられた各時間間隔に対するメトリックのセットを生成することと、
    前記メトリックのセットに基づいて、クラスタリング技術を使用することによって前記センサのセットに関連付けられた属性のセットにおいて、強力に接続されたコンポーネントである類似の属性をグループ化し、前記強力に接続されたコンポーネントのそれぞれを単一のメタノードに縮小させることと、
    メタノードのセットに基づいて、前記メタノードのDAGとしてメタグラフを構築することと、を備える、請求項16に記載の非一時的コンピュータ可読記憶媒体。
JP2020095164A 2019-06-21 2020-06-01 高次元センサデータにおける異常事象の自動化された根本原因分析を実行する方法及びシステム Active JP7353238B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/448,273 US11354184B2 (en) 2019-06-21 2019-06-21 Method and system for performing automated root cause analysis of anomaly events in high-dimensional sensor data
US16/448,273 2019-06-21

Publications (3)

Publication Number Publication Date
JP2021002335A JP2021002335A (ja) 2021-01-07
JP2021002335A5 JP2021002335A5 (ja) 2023-06-06
JP7353238B2 true JP7353238B2 (ja) 2023-09-29

Family

ID=71105307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020095164A Active JP7353238B2 (ja) 2019-06-21 2020-06-01 高次元センサデータにおける異常事象の自動化された根本原因分析を実行する方法及びシステム

Country Status (4)

Country Link
US (1) US11354184B2 (ja)
EP (1) EP3754906B1 (ja)
JP (1) JP7353238B2 (ja)
CN (1) CN112115306B (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11729190B2 (en) * 2019-10-29 2023-08-15 General Electric Company Virtual sensor supervised learning for cyber-attack neutralization
US11238129B2 (en) * 2019-12-11 2022-02-01 International Business Machines Corporation Root cause analysis using Granger causality
EP3958185A1 (en) * 2020-06-26 2022-02-23 Tata Consultancy Services Limited Neural networks for handling variable-dimensional time series data
US20220229903A1 (en) * 2021-01-21 2022-07-21 Intuit Inc. Feature extraction and time series anomaly detection over dynamic graphs
JPWO2023007578A1 (ja) * 2021-07-27 2023-02-02
CN113724892B (zh) * 2021-08-31 2024-06-21 深圳平安智慧医健科技有限公司 一种人口流动的分析方法、装置、电子设备及存储介质
EP4231108A1 (en) * 2022-02-18 2023-08-23 Tata Consultancy Services Limited Method and system for root cause identification of faults in manufacturing and process industries
WO2024052924A1 (en) * 2022-09-06 2024-03-14 Telefonaktiebolaget Lm Ericsson (Publ) Identification of root cause path with machine reasoning
KR102523458B1 (ko) * 2022-09-27 2023-04-19 주식회사 에이아이비즈 공정 설비의 비정상 동작 감지 방법, 컴퓨팅 장치 및 컴퓨터 프로그램
WO2024134795A1 (ja) * 2022-12-21 2024-06-27 日本電気株式会社 情報処理装置、分析支援方法、および分析支援プログラム
CN116610906B (zh) * 2023-04-11 2024-05-14 深圳润世华软件和信息技术服务有限公司 设备故障诊断方法、装置、计算机设备及其存储介质
CN117407662B (zh) * 2023-12-15 2024-04-02 广州市齐明软件科技有限公司 一种传感器数据处理方法及系统
CN118395351B (zh) * 2024-06-25 2024-09-03 深圳鼎智达表计信息科技有限公司 基于物联网的超声波水表模组计量数据处理方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8156377B2 (en) * 2010-07-02 2012-04-10 Oracle International Corporation Method and apparatus for determining ranked causal paths for faults in a complex multi-host system with probabilistic inference in a time series
IN2013CH03925A (ja) * 2013-09-02 2015-09-11 Appnomic Systems Private Ltd
US20150127284A1 (en) * 2013-11-03 2015-05-07 Microsoft Corporation Sensor Data Time Alignment
US9497071B2 (en) 2014-04-01 2016-11-15 Ca, Inc. Multi-hop root cause analysis
CN104809205B (zh) * 2015-04-27 2018-03-20 河海大学 一种在线河网时空异常事件检测方法
US10289471B2 (en) * 2016-02-08 2019-05-14 Nec Corporation Ranking causal anomalies via temporal and dynamical analysis on vanishing correlations
US10438124B2 (en) 2017-01-25 2019-10-08 Centurylink Intellectual Property Llc Machine discovery of aberrant operating states
US11044533B1 (en) * 2017-06-02 2021-06-22 Conviva Inc. Automatic diagnostics alerts

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Sarah Nadi,DRACA: Decision-support for Root Cause Analysis and Change Impact Analysis,UWSpace [online],2009年,https://uwspace.uwaterloo.ca/bitstream/handle/10012/4889/NADI_SARAH.pdf,[2023年8月15日検索]

Also Published As

Publication number Publication date
US20200401470A1 (en) 2020-12-24
CN112115306B (zh) 2023-04-07
JP2021002335A (ja) 2021-01-07
EP3754906A1 (en) 2020-12-23
EP3754906B1 (en) 2022-12-07
CN112115306A (zh) 2020-12-22
US11354184B2 (en) 2022-06-07

Similar Documents

Publication Publication Date Title
JP7353238B2 (ja) 高次元センサデータにおける異常事象の自動化された根本原因分析を実行する方法及びシステム
Cheng et al. Extracting kernel dataset from big sensory data in wireless sensor networks
CN110990461A (zh) 大数据分析模型算法选型方法、装置、电子设备及介质
CN110335168B (zh) 基于gru优化用电信息采集终端故障预测模型的方法及系统
CN113077097A (zh) 一种基于深度时空相似性的空气质量预测方法
CN114861788A (zh) 一种基于dbscan聚类的负荷异常检测方法及系统
Han et al. Neighborhood-based uncertainty generation in social networks
JP2018169994A (ja) 情報処理装置、情報処理方法およびコンピュータプログラム
US11651271B1 (en) Artificial intelligence system incorporating automatic model updates based on change point detection using likelihood ratios
Ding et al. Big data analytics in future internet of things
CN117688362A (zh) 基于多元数据特征增强的光伏功率区间预测方法及装置
CN117913808A (zh) 一种分布式光伏发电预测方法及其装置
US11636377B1 (en) Artificial intelligence system incorporating automatic model updates based on change point detection using time series decomposing and clustering
Chen et al. Data reconstruction in wireless sensor networks from incomplete and erroneous observations
Singh et al. Enhancing wind power forecasting from meteorological parameters using machine learning models
Chen et al. Robust data-driven automation based on relaxed supervised hashing with self-optimized labels
Shen et al. Long-term multivariate time series forecasting in data centers based on multi-factor separation evolutionary spatial–temporal graph neural networks
CN112860531A (zh) 基于深度异构图神经网络的区块链广泛共识性能评测方法
CN112732777A (zh) 基于时间序列的头寸预测方法、装置、设备和介质
KR102643592B1 (ko) 에지 컴퓨팅 환경에서의 IoT 누락데이터 관리 방법 및 장치
Wolfrath et al. Efficient transmission and reconstruction of dependent data streams via edge sampling
Wang et al. Bayesian Meta-Learning for Adaptive Traffic Prediction in Wireless Networks
Zhang et al. STCM: A spatio-temporal calibration model for low-cost air monitoring sensors
JP7135025B2 (ja) 情報処理装置、情報処理方法およびプログラム
Tzagkarakis et al. Evaluating short-term forecasting of multiple time series in iot environments

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20200615

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20200617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230529

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230529

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230817

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230919

R150 Certificate of patent or registration of utility model

Ref document number: 7353238

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150