JP2022028619A - 製造システムにおける故障の根本原因分析用の故障拡張システムモデルを構築するためのシステム及び方法 - Google Patents

製造システムにおける故障の根本原因分析用の故障拡張システムモデルを構築するためのシステム及び方法 Download PDF

Info

Publication number
JP2022028619A
JP2022028619A JP2021120269A JP2021120269A JP2022028619A JP 2022028619 A JP2022028619 A JP 2022028619A JP 2021120269 A JP2021120269 A JP 2021120269A JP 2021120269 A JP2021120269 A JP 2021120269A JP 2022028619 A JP2022028619 A JP 2022028619A
Authority
JP
Japan
Prior art keywords
failure
machine
topology
graph
causal relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021120269A
Other languages
English (en)
Inventor
ホン・ユウ
Hong Yu
アジェイ・ラガヴァン
Raghavan Ajay
サーマン・モスタファヴィ
Mostafavi Saman
テク・チュン
Deokwoo Jung
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palo Alto Research Center Inc
Original Assignee
Palo Alto Research Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palo Alto Research Center Inc filed Critical Palo Alto Research Center Inc
Publication of JP2022028619A publication Critical patent/JP2022028619A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • G05B23/0245Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model based on a qualitative model, e.g. rule based; if-then decisions
    • G05B23/0248Causal models, e.g. fault tree; digraphs; qualitative physics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/261Functional testing by simulating additional hardware, e.g. fault simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • G06F11/3075Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved in order to maintain consistency among the monitored data, e.g. ensuring that the monitored data belong to the same timeframe, to the same system or component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/321Display for diagnostics, e.g. diagnostic result display, self-test user interface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/31From computer integrated manufacturing till monitoring
    • G05B2219/31376MFL material flow
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/31From computer integrated manufacturing till monitoring
    • G05B2219/31472Graphical display of process
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0267Fault communication, e.g. human machine interface [HMI]
    • G05B23/0272Presentation of monitored results, e.g. selection of status reports to be displayed; Filtering information to the user

Abstract

【課題】製造システムにおける故障の原因を判定するためのシステムを提供する。【解決手段】システムは、マシン及び関連するプロセスを含む処理システムに関連するデータを記憶し、データは、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む。システムは、データに基づいて、処理システムのトポロジを判定し、トポロジは、プロセスの一部としてのマシン間の出力の流れを示す。システムは、トポロジに関連して、マシン故障の情報を判定する。システムは、マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す1つ以上の故障パラメータを生成する。システムは、トポロジ及びマシン故障情報に基づいて、1つ以上の故障パラメータを含むシステムモデルを構築することによって、処理システムの診断を容易にする。【選択図】図1A

Description

(関連出願の相互参照)
本出願は、2020年8月3日に出願された発明者Hong Yu、Ajay Raghavan、Saman Mostafavi、及びDeokwoo Jungによる「System and Method for Constructing Fault-Augmented System Model for Root Cause Analysis of Faults in Manufacturing Systems」と題する米国仮出願第63/060,522号、代理人整理番号PARC-20200165US01の利益を主張するものであり、その開示は、参照によりその全体が本明細書に組み込まれる。
本出願は、2020年10月1日に出願された発明者Hong Yu、Ajay Raghavan、Deokwoo Jung、及びSaman Mostafaviによる「System and Method for Determining Manufacturing Plant Topology and Fault Propagation Information」と題する米国特許出願第17/061,248号(代理人整理番号第PARC-20200124US02)(以下、「米国特許出願第17/061,248号」)に関し、この出願は、
2020年7月31日に出願された発明者Hong Yu、Ajay Raghavan、Deokwoo Jung、及びSaman Mostafaviによる「System and Method for Determining Manufacturing Plant Topology and Fault Propagation Information」と題する米国仮出願第63/059,446号、代理人整理番号PARC-20200124US01の利益を主張するものであり、
これらの開示は、参照によりその全体が本明細書に組み込まれる。
(発明の分野)
本開示は、概して、データマイニングに関する。より具体的には、本開示は、製造システムにおける故障の根本原因分析用の故障拡張システムモデルを構築するためのシステム及び方法に関する。
現代の製造(サイバーフィジカル製造システムなど)では、ネットワークは動的であり得、マシンは生産の需要の変化に合わせてクラスタに構成されている。予定されていないマシン停止及び生産ラインの性能低下の故障検出及び根本原因分析(RCA)は、多大な経済的価値を有し得る。モデルに基づく異常検出/故障診断アプローチは、公称プロセスモデルの知識を必要とする場合があるが、モデルに基づく根本原因分析(RCA)だけではなくて、故障間の因果関係を差し引きするために公称プロセスを超えてプロセスを外挿することが可能なシステムも必要とする場合がある。サイバーフィジカル製造システムの複雑さの状態は、システムモデルを手動で構築することを実行不可能にさせ得、故障モデリングの追加は、余分な複雑さをもたらし得る。
製造システムの現在のRCAアプローチは、一般に、データ駆動アプローチ、及びモデルに基づくアプローチの2つのカテゴリに分割することができる。マシン学習及びビッグデータ技術の最近の進歩は、製造データをマイニングすることによって、RCA目的のための情報を抽出するための門戸を開いている。2つの一般的なデータ駆動アプローチとしては、相関ルール抽出及びベイジアンネットワークが挙げられる。対照的に、モデルに基づくアプローチは、システムに関する知識及び/又は障害の物理学を利用しようと試みる。モデルに基づくアプローチは、第1の原理(有限要素モデルなど)に基づくか、又は状態空間モデリング(自動マシンなど)、すなわち物理学に基づくモデルに基づくことができる。しかしながら、このような物理学モデルに基づくアプローチに必要とされる詳細のレベルは、データ駆動アプローチのためにラベルデータを収集するコストがそのようなモデルを構築するコストを上回る、工学システムの小サブセットのみを実行可能にし得る。
したがって、製造システムにおけるRCAを判定するためのいくつかの現在のアプローチは、製造システム及び/又は故障の物理学に関する知識を利用するためにモデルに基づくアプローチを使用することができるが、これらのアプローチは、限定された量の標識データによって制約され得る。
一実施形態は、製造システムにおける故障の原因を判定するためのシステムを提供する。動作中、システムは、マシン及び関連するプロセスを含む、処理システムに関連するデータを記憶し、このデータは、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む。システムは、データに基づいて、処理システムのトポロジを判定し、トポロジは、プロセスの一部としてのマシン間の出力の流れを示す。システムは、トポロジに関連して、マシン故障の情報を判定する。システムは、マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す1つ以上の故障パラメータを生成する。システムは、トポロジ及びマシン故障情報に基づいて、1つ以上の故障パラメータを含むシステムモデルを構築することによって、処理システムの診断を容易にする。
いくつかの実施形態では、システムは、それぞれのマシン故障の頻度及び重大度に基づいて、マシン及びマシン故障をいくつかのタイプに分類する。システムは、システムモデル内の1つ以上の故障パラメータを変更することによって、複数の故障シナリオをシミュレートする。システムは、シミュレーションされた故障シナリオに基づいて、故障伝搬ルールのセットを判定する。
いくつかの実施形態では、システムは、トポロジ及びマシン故障情報に基づいて故障因果関係グラフを生成する。システムは、システムモデルに基づいて故障因果関係グラフをプルーニングする。システムは、マシンの故障とシステムレベルの性能劣化との間の因果関係を判定する。システムは、因果関係に基づいて、プルーニングした故障因果関係グラフに因果関係リンクを追加して、組み合わせた因果関係グラフを取得する。
いくつかの実施形態では、システムは、故障因果関係グラフを表示し、故障因果関係グラフ内のそれぞれのノードは、それぞれの出力に関して、それぞれの出力を処理する第1のマシンと、第1のマシンに関連する第1のプロセスと、それぞれの出力の処理中に第1のマシン及び第1のプロセスに関連する問題を示す停止コードと、を示し、故障因果関係グラフ内のそれぞれのエッジは、それぞれの出力に関して、開始ノードから目的ノードへの論理的流れを示す。
いくつかの実施形態では、システムは、故障因果関係グラフから1つ以上のノードを除去することによって故障因果関係グラフのサイズを低減することによって、システムモデルに基づいて故障因果関係グラフをプルーニングし、システムは、プルーニングした故障因果関係グラフを表示する。
いくつかの実施形態では、プルーニングした故障因果関係グラフに因果関係リンクを追加することに応答して、システムは、組み合わせた故障因果関係グラフを表示し、これにより、ユーザが処理システムの効率的な故障診断を実行することを可能にする。
いくつかの実施形態では、それぞれの故障パラメータは、それぞれのマシンの2つの連続する機能停止間の平均時間を示す、故障間の中間時間であって、それぞれの機能停止が、第1の分布から生成されたランダム事象である、中間時間と、故障における第1の標準偏差であって、それぞれの機能停止を表す第1の分布の標準偏差を示す、第1の標準偏差と、マシンが停止状態から回復する平均時間を示す、回復するまでの中間時間であって、ランダム回復時間が、第2の分布から生成される、回復するまでの中間時間と、回復時間を表す第2の分布の標準偏差を示す、回復における第2の標準偏差と、のうちの1つ以上を含む。
いくつかの実施形態では、システムは、トポロジ内のノードをマシンモデルで置換して故障拡張モデルを取得することによって、1つ以上の故障パラメータを含むシステムモデルを構築し、それぞれのマシンは、ビジー、利用可能、及び停止を含む状態を有する有限状態マシンによって示される。
いくつかの実施形態では、システムは、トポロジに基づいて、それぞれの出力を処理するためのマシンに関与する第1の総時間、又はそれぞれの出力を処理するためのプロセス内の全てのマシンに関与する第2の総時間と、プロセス時間における標準偏差と、それぞれのマシンが処理できる出力を示すデータ構造と、のうちの1つ以上を含む、通常動作パラメータを判定する。
いくつかの実施形態では、処理システムは、製造システムであって、ネットワークトポロジが、プロセスの一部としての、マシン間の材料の流れを更に示す、製造システムと、クラウド又はクラスタコンピューティングシステムであって、ネットワークトポロジが、クラウド又はクラスタコンピューティングシステムのプロセスの一部としての、マシン間の出力に関連する分散又は並列計算若しくはシミュレーションの流れを更に示す、クラウド又はクラスタコンピューティングシステムと、サプライチェーンシステムであって、ネットワークトポロジが、サプライチェーンチェーンシステムのプロセスの一部としての、マシン間の配送及び分配出力に関連する材料の流れを更に示す、サプライチェーンシステムと、のうちの1つ以上を含む。
図1Aは、本出願の一実施形態による、製造システムにおける故障の原因を判定するための例示的なアーキテクチャを示す。
図1Bは、本出願の一実施形態による、製造システムにおける故障の原因を判定するための例示的なアーキテクチャを示す。
図1Cは、本出願の一実施形態による、製造システムにおける故障の原因を判定するための例示的なアーキテクチャを示す。
図2は、本出願の一実施形態による、故障の重大度及び頻度に基づくマシン故障の図を示す。
図3は、本出願の一実施形態による、故障までの時間及び回復までの時間を含む、故障特性に基づく例示的なタイプのマシンを示す図を示す。
図4は、本出願の一実施形態による、例示的な故障拡張システムモデルを示す。
図5A-1は、本出願の一実施形態による、3つのプロセスのスループット及びサイクル時間の例示的な図を示す。 図5A-2は、本出願の一実施形態による、3つのプロセスのスループット及びサイクル時間の例示的な図を示す。
図5Bは、本出願の一実施形態による、ベースラインスループットの例示的な図を示す。
図5Cは、本出願の一実施形態による、第1のプロセスの故障の増加を考慮したスループットの例示的な図を示す。
図5Dは、本出願の一実施形態による、第2のプロセスの故障の増加を考慮したスループットの例示的な図を示す。
図5Eは、本出願の一実施形態による、第3のプロセスの故障の増加を考慮したスループットの例示的な図を示す。
図6は、本出願の一実施形態による、製造データセットに基づく例示的な故障伝搬ツリーを示す。
図7は、本出願の一実施形態による、製造システムにおける故障の原因を判定するための例示的な環境を示す。
図8Aは、本出願の一実施形態による、製造システムにおける故障の原因を判定するための方法を示すフロー図を提示する。
図8Bは、本出願の一実施形態による、製造システムにおける故障の原因を判定するための方法を示すフロー図を提示する。
図9は、本出願の一実施形態による、製造システムにおける故障の原因の判定を容易にする例示的な分散コンピュータ及び通信システムを示す。
以下の説明は、当業者が実施形態を製造及び使用することを可能にするために提示され、特定の用途及びその要件に関連して提供される。開示される実施形態に対する様々な修正は、当業者には容易に明らかとなり、本明細書に定義される一般原理は、本開示の趣旨及び範囲から逸脱することなく、他の実施形態及び用途に適用され得る。したがって、本発明は、示される実施形態に限定されるものではなく、本明細書に開示される原理及び特徴と一致する最も広い範囲を与えられるものである。
概要
本明細書に記載される実施形態は、学習したモデルを使用してシステムモデルを構築し、故障診断及び根本原因分析(RCA)に関する故障特性を用いるモデルを更に強化するシステムを提供する。
上記のように、現代の製造(例えば、サイバーフィジカル製造システム)では、ネットワークは動的であり得、マシンは生産の需要の変化に合わせてクラスタに構成されている。予定されていないマシン停止及び生産ラインの性能低下の故障検出及び根本原因分析(RCA)は、多大な経済的価値であり得る。モデルに基づく異常検出/故障診断アプローチは、公称プロセスモデルの知識を必要とする場合があるが、モデルに基づく根本原因分析(RCA)だけではなくて、故障間の因果関係を差し引きするために公称プロセスを超えてプロセスを外挿することが可能なシステムも必要とする場合がある。サイバーフィジカル製造システムの複雑さの状態は、システムモデルを手動で構築することを実行不可能にさせ得、故障モデリングの追加は、余分な複雑さをもたらし得る。
製造システムの現在のRCAアプローチは、一般に、データ駆動アプローチ、及びモデルに基づくアプローチの2つのカテゴリに分割することができる。マシン学習及びビッグデータ技術の最近の進歩は、製造データをマイニングすることによって、RCA目的のための情報を抽出するための門戸を開いている。2つの一般的なデータ駆動アプローチとしては、相関ルール抽出及びベイジアンネットワークが挙げられる。対照的に、モデルに基づくアプローチは、システムに関する知識及び/又は障害の物理学を利用しようと試みる。モデルに基づくアプローチは、第1の原理(有限要素モデルなど)に基づくか、又は状態空間モデリング(自動マシンなど)、すなわち物理学に基づくモデルに基づくことができる。しかしながら、このような物理学モデルに基づくアプローチに必要とされる詳細のレベルは、データ駆動アプローチのためにラベルデータを収集するコストがそのようなモデルを構築するコストを上回る、工学システムの小サブセットのみを実行可能にし得る。
したがって、製造システムにおけるRCAを判定するためのいくつかの現在のアプローチは、製造システム及び/又は故障の物理学に関する知識を利用するためにモデルに基づくアプローチを使用することができるが、これらのアプローチは、限定された量の標識データによって制約され得る。
本明細書に記載される実施形態は、データからの学習されたモデルに基づいて製造システムモデルの構築を容易にするシステムを提供することと、根本原因分析のための故障特性を用いる製造システムモデルを強化することとによって、この制約に対処する。記載されるシステムは、パラメータ化された故障モデルを使用することによって物理的トポロジに基づくシステムモデルを構築することができ、また、生産ライントポロジの変化を検出し、それに応じてシステムモデルを再構成することができる。
マシン故障は、故障の頻度及び重大度の両方を説明するパラメータによって表すことができる。これらの故障パラメータは、製造ログ(例えば、ログデータ)から自動化された方法で学習することができる。したがって、構築されたモデルは、マシンレベルで故障をシミュレートすることができるだけでなく、プロセスライン内の単一のマシンが必ずしも欠陥症状を示さない場合があるプロセスレベルで故障を複製することもできる。
(例えば、製造ログデータにおいて見出されるデータ/統計を分析することによって)データ駆動アプローチを使用して製造プラントトポロジ及び故障伝搬情報を判定することは、米国特許出願第17/061,248号に記載されている。記載される実施形態は、故障シナリオをシミュレートするために使用することができるシステムモデルを構築することによって、改良されたアプローチを提供することができる。具体的には、システムは、RCAに対するハイブリッドのデータ駆動及び故障拡張モデルに基づくアプローチを使用することができる。データ駆動アプローチを使用して、システムは、因果関係グラフを生成することができる。モデルに基づくアプローチを使用して、システムは、因果関係グラフをプルーニングし、故障シナリオシミュレーションによって生成される因果関係リンクを追加することができる。このハイブリッドアプローチを使用した製造システムにおける故障の原因を判定することを容易にする例示的なアーキテクチャを、図1A、図1B、図1C、及び図7に関連して以下に説明する。
このハイブリッドアプローチは、計算要求と異常検出タスクを実行するために必要とされる詳細のレベルとの間のバランスを取ることをもたらし得る。更に、モデルを使用することは、モジュール式の、拡張可能な、及び再構成可能な方法で、スマート工場の複数の構成要素を堅牢に説明することを可能にすることができる、オブジェクト指向アプローチとして見られ得る。本明細書に記載される実施形態は、ダウンタイム中に必要とされる分析時間の量を減少させることができ、それにより、製造システムにおける個々の生産ライン及び生産ライン全体にわたって、より改善され効率的なシステムをもたらすことができるシステムを提供する。
したがって、記載される実施形態は、製造システムにおける故障の原因を分析及び判定するために、データ駆動アプローチ又はモデルに基づくアプローチのみを使用する課題に対処する故障診断のためのシステムを提供する。データ駆動アプローチ及びモデルに基づくアプローチの両方を含むハイブリッドアプローチを使用することによって、記載される実施形態は、(例えば、コストのかかる大量の標識データの必要性を排除することによって)これらのアプローチのうちの1つを排他的に使用することに関与する制約に対処することができる。
「開始ノード」及び「目的ノード」という用語は、開始ノードから目的ノードへの、方向付けられたエッジを介して示されるように、材料が流れる1対のノードを指す。例えば、同じロット番号を有する材料は、図1A、図1B、図1C、及び図6に関連して以下に記載するように、第1のプロセスの一部(開始ノード)としての第1のマシンから、第2のプロセスの一部(目的ノード)としての第2のマシンへと流れ得る。
「製品バッチ情報」という用語は、製造システムにおけるプロセスの一部としてマシンによって処理された材料、製品、又は他の構成要素を示すか、又は識別することができるロット番号などの情報を指す。
「停止事象」とは、製造システムに一定期間停止させる、予定されていない事象を指す。「停止コード」は、製造システム内のマシン又はプロセスに関連する問題の識別子を指し、停止事象に関連し得る(ただし必ずしもそうではない)。
「マシンステータス情報」という用語は、所与のマシンの状態を指し、停止コード、故障タイプ、又は停止事象の他の指示体若しくは識別子を含むことができる。
「バッファ」という用語は、マシン/プロセス間のある期間にわたって材料が保持され得る物理的バッファ又は物理的容器を指す。この期間は、ヒト関連要因(例えば、人員の変化が発生し得るか、又は材料が1つのマシンから別のマシンへと手動で移動されなければならない場合)、又はシステム関連要因(例えば、所与のマシンの下流又はそれに続くマシンの性能及び使用)に依存し得る。
用語「マシン故障情報」は、トポロジ、例えば、製造ネットワークトポロジに関連するマシン故障の情報(故障までの時間及び回復までの時間に関する統計を含む)を指す。
用語「トポロジ」及び「ネットワークトポロジ」は、本開示において互換的に使用され、処理システム(例えば、製造システム)のマシン/プロセスが物理的及び論理的にどのように接続されるかについての説明を指す。
用語「因果関係グラフ」は、図1Aに関連して以下に記載されるように、故障伝搬経路を指す。「プルーニングした因果関係グラフ」は、図1Bに関して以下に記載されるように、特定のリンク/ノードが因果関係グラフに物理的に含まれる必要がないという判定により、除去されたノードを有する因果関係グラフを指す。「組み合わせた」又は「最終的に組み合わせた」因果関係グラフは、図1Cに関連して以下に記載されるように、因果関係リンクがマシン障害とシステムレベルの性能劣化との間の関係を示す、判定された因果関係リンクが追加されているプルーニングした因果関係グラフを指す。
「処理システム」という用語は、出力をもたらすプロセスを実行するマシン又はエンティティを有するシステムを指し、それらの出力は、処理システムを通した、流れの開始から修了までのそれぞれの出力の流れの一部として、次のマシン又はエンティティへの入力として使用される。本開示では、製造システム、製造ログデータ、及び製造ネットワークトポロジが例示の目的で描写されている。記載されるシステムは、クラウド/クラスタコンピューティングシステム又は施設内の分散並列計算/シミュレーション、及び配送/分配サプライチェーンを含むが、これらに限定されない、他の処理システムを含むことができる。
用語「出力」は、マシン、例えば、オブジェクト、マシン部品、材料、ユニット、又は構成要素によって処理され得る論理的若しくは物理的ユニット又は製品を指す。「出力」はまた、材料又は出力に対してプロセスを実行するマシン又はエンティティによって導出される材料出力又は他の結果を指し得る。出力は、物理的材料、又は計算若しくはシミュレーションの結果を含み得る。
製造システムにおける故障の原因を判定するための例示的な環境
図1A、図1B、及び図1Cは、本出願の一実施形態による、製造システムにおける故障の原因を判定するための例示的なアーキテクチャ100を示す。アーキテクチャ100は、データ駆動アプローチ及びモデルに基づくアプローチの両方を使用するハイブリッドアプローチを描写する。アーキテクチャ100は、工場データ101と、因果関係グラフ110と、プルーニングした因果関係グラフ120と、組み合わせた因果関係グラフ130と、ネットワークトポロジ140と、構築したシステムモデル160と、故障伝搬ツリー180と、を含むことができる。(因果関係グラフ110、プルーニングした因果関係グラフ120、及び組み合わせた因果関係グラフ130を有する)アーキテクチャ100の上半分又は分岐部は、データ駆動アプローチのパイプラインを表し、一方、(ネットワークトポロジ140、構築したシステムモデル160、及び故障伝搬ツリー180を有する)アーキテクチャ100の下半分又は分岐部は、モデルに基づくアプローチのパイプラインを表す。本明細書に記載されるように、2つの分岐部は緊密に接続され得る。
--ネットワークトポロジ、因果関係グラフ、及びシステムモデル
動作中、図1Aに示すように、システムは、工場データ101、例えば、製造ログデータ、又はマシン及び関連するプロセスを含む製造システムに関連するデータを記憶することができる。工場データ101は、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含むことができる。システムは、工場データ101に基づいて、例えば、製造ログデータ又は工場データ101からトポロジ情報を抽出することによって(操作103を介して、及び米国特許出願第17/061,248号に記載されているように)、ネットワークトポロジ140を判定することができる。ネットワークトポロジ140は、製造システムに対応することができ、製造システムのプロセスの一部としてマシン間のオブジェクト(例えば、生産ライン又は製造システム内の材料、製品、又はユニット)の流れを示すことができる。ネットワークトポロジ140は、各プロセスが複数の関連するマシンを有するプロセス142及び152を示すことができる。プロセス142は、マシンM1-1 143、M1-2 144、及びM1-x 145を含むことができ、一方で、プロセス152は、マシンM2-1 153、M2-2 154、及びM2-y 155を含むことができる。
ネットワークトポロジ140はまた、1つのマシンによって処理された後、かつ次のマシンによって処理される前に、特定の期間にわたって材料を配置することができる物理的バッファ(物理的ビンなど)を含むことができる。例えば、材料は、プロセス142のマシンM1-1 143によって処理されることから、一定期間バッファ148に流れ、プロセス152のマシンM2-2 154によって処理されることまで流れ得る。
工場データ101を使用して、システムは、(動作102を介して)故障伝搬経路を含むことができる因果関係グラフ110を生成することもできる。因果関係グラフ110は、それぞれのオブジェクト又は材料に関して、それぞれのオブジェクトを処理するマシン、マシンに関連するプロセス、及びマシン/プロセスによってオブジェクトを処理することに関連する停止コードを示すノードを含むことができる。因果関係グラフ110は、例示の目的のために、対応するマシン/プロセス情報を伴わずに、停止コードのみを描写している。例えば、ノード111は、停止コード(「SC」)1に対応することができ、ノード112は、SC 2に対応することができ、ノード113は、SC 3に対応することができ、ノード114は、SC 4に対応することができ、ノード115は、SC 5に対応することができ、ノード116は、SC mに対応することができる。因果関係グラフ110内のノード間のエッジは、開始ノードから目的ノードへのオブジェクトの論理的流れを示す。故障伝搬経路は、米国特許出願第17/061,248号に記載されている。システムは、ネットワークトポロジ140に関連したマシン故障の情報を判定することができ、それぞれのマシン故障の頻度及び重大度を示す故障パラメータを生成することができる。因果関係グラフ110の構築は、ベイジアンネットワーク及びグレンジャーの因果関係検定などのマシン学習又は統計分析技術を使用することに基づくことができる。
図1に示すように、システムは、ネットワークトポロジ140及びマシン故障情報に基づいて(例えば、動作105を介して)構築したシステムモデル160を生成することができる。システムモデル160は、故障拡張システムモデルを表すことができる。製造ログデータ(例えば、工場データ101)は、マシンのステータス(すなわち、マシンステータス情報)に関するリッチな情報を含むことができることを思い起こす。工場データ101は、マシンが停止し、停止から再開することに関連するタイムスタンプ情報を含むことができる。システムは、故障の持続時間及び故障から回復するまでにかかる時間(例えば、「回復するまでの時間」)を抽出することができる。システムは、それぞれの故障の頻度及び重大度を説明又は示すいくつかの統計的特性(すなわち、「故障パラメータ」)に基づいて故障又は障害をモデル化することができる。
これらのパラメータとしては、それぞれのマシンの2つの連続する機能停止の間の平均時間を示す、障害間の(又は障害までの)中間時間(MTTF)であって、それぞれの機能停止が、第1の分布から生成されたランダム事象である、中間時間と、故障における第1の標準偏差であって、それぞれの機能停止を表す第1の分布の標準偏差を示す、第1の標準偏差と、マシンが停止状態から回復するための平均時間を示す、回復するまでの中間時間(MTTR)であって、ランダム回復時間が、第2の分布から生成される、回復するまでの中間時間と、回復時間を表す第2の分布の標準偏差を示す、回復における第2の標準偏差と、が挙げられる。第1及び第2の分布は、例えば、ガウス分布又は別の分布であり得る。
--マシンシナリオに基づく例示的な故障拡張
図2は、本出願の一実施形態による、故障の重大度及び頻度に基づくマシン故障の図200を示す。図200では、x軸は、例えば、左側の稀な障害202から始まり右側の頻繁な障害204までの、障害の頻度に対応することができる。Y軸は、例えば、底部の容易な修復206から始まり頂部の難しい修復208までの、故障の重大度に対応することができる。
システムは、それぞれのマシン故障の頻度及び重大度に基づいて、マシン及びマシン故障をいくつかのタイプに分類することができる。例えば、図200には、4つの明白なタイプが示されており、各象限に1つが示されている。「タイプ1」212は故障しやすく(頻繁な障害であり)、修復が困難であり得る(修復が難しい)。「タイプ2」210は故障しにくい(稀な障害である)が、修復が困難であり得る(修復が難しい)。「タイプ3」214は故障しにくく(稀な障害である)、修復が容易である。「タイプ4」216は故障しやすい(頻繁な障害である)が、修復が容易である。したがって、タイプ3 214の故障からタイプ1 212の故障まで移動する斜めの矢印は、頻度及び重大度に関して測定された「良」から「不良」故障への移動を示す。図200は、マシン故障のタイプに関して4つのカテゴリのみを説明しているが、任意の数のカテゴリが使用されてもよい。
図3は、本出願の一実施形態による、障害までの時間及び回復までの時間を含む、故障特性に基づく例示的なタイプのマシンを示す図300を示す。図300は、以下の4つのマシンに関して障害までの時間(TTF)320(対数スケール)及び回復までの時間(TTR)330(対数スケール)を示すグラフを含むことができる。すなわち、マシン6 310、マシン19 312、マシン24 316、及びマシン89 318。マシン24 316のTTFグラフでは、TTFは高く、これは、このマシンの障害がより低頻度であること(322)を意味する。対照的に、マシン89 318のTTFグラフでは、TTFは低く、これは、マシンが故障しやすいこと(324)、又はより高い頻度の障害を経験することを意味する。
マシン24 316のTTRグラフでは、TTRの尾部は高く、これは、極端なケースを示しているため、これは、回復するまで複数時間/複数日を要した(332)。マシン89 318のTTRグラフでは、TTRも高く、これは、マシンが修復するのがより難しいこと(334)を示す。
--構築したシステムモデル(故障拡張システムモデル)
図1Bに戻ると、システムモデル160を生成する際、システムは、ネットワークトポロジ140のノードを、故障拡張マシンモデル(すなわち、システムモデル160)で置換することができる。このモデルは、例えば、Modelicaを使用して実装することができ、マシン間の接続を示すことができ、スループット分析を使用することによってプロセスボトルネックを識別することができる。したがって、この強化又は拡張モデルは、生産ラインレベル性能(例えば、システムレベルの性能劣化)に対する単一のマシン(例えば、所与のマシンの故障又は障害)の影響を考慮することができる。
システムモデル160は、プラントトポロジの一部に対応することができ、複数のマシン又はマシンモデル、2つのバッファ、及び特定のプロセスの一部としてマシンを通って流れる材料を有する、3つのプロセスを含むことができる。システムモデル160は、(例えば、それぞれ、ネットワークトポロジ140のマシンM1-1 143及びマシンM1-2 144に対応する)関連するマシン又はノード163及び166を有するプロセス_1 161と、(例えば、それぞれ、ネットワークトポロジ140のマシンM2-1 153及びマシンM2-2 154に対応する)関連するマシン又はノード174及び175を有するプロセス_2 173と、関連するマシン又はノード178及び179を有するプロセス_3 177と、を含むことができる。
各ノードは、マシンモデルを含むことができる。例えば、ノード163は、マシンモデル164及び165を含むことができ、ノード166は、マシンモデル167及び168を含むことができる。システムモデル160はまた、3つの別個の保持ビン又は物理バッファ(例えば、170、171、及び172)を有するバッファ_1 169と、3つの別個の保持ビン又は物理バッファを有するバッファ_2 176と、を含むことができる。入ってくる材料(162)は、(リンク121を介して)プロセス_1 161に流入することができ、ノード163又は166に描写されるマシンによって処理することができる。その後、材料は、(リンク122を介して)バッファ_1 169に流れることができる。このバッファ内で待機するのに費やされた一定期間の後、材料は、(リンク123を介して)プロセス_2 173に流入することができ、ノード174及び175に描写されるマシンによって処理することができる。その後、材料は、(リンク124を介して)バッファ_2 176に流れることができる。このバッファ内で待機するのに費やされた一定期間の後、材料は、(リンク125を介して)プロセス_3 177に流入することができ、ノード178及び179に描写されるマシンによって処理することができる。続いて、材料は、例えば、論理的に別のプロセス及び関連するマシンに、又は物理的に生産ラインの終端まで、(リンク126を介して)プロセス_3 177から流出することができる。
したがって、構築したシステムモデル160は、製造システムにおいてマシンがどのように接続されているか、及び各プロセスが同様の機能を実行する複数のマシンを有し得ることを描写する。更に、システムモデル160は、プロセスの一部であるマシンの各クラスタ間のバッファを描写する。システムは、マシン間の遅延に基づいてバッファサイズを推定することができる。システムモデル160は、各マシンがビジー、利用可能、及び停止を含む状態を有する有限状態マシンとして表され得るため、マシンの動作状態をモデル化することができる。
図4は、本出願の一実施形態による、例示的な故障拡張システムモデル400を示す。モデル400は、製造システムの動作に基づいて発生し得る、かつ図1Bの構築したシステムモデル160に関連するような、通常マシン動作420及びマシン障害動作460を描写する。通常マシン動作420の間、生成422モジュールは、ジョブ、例えば、所与のマシンのための入力材料又は部分の開始を表すことができる。データ構造440は、所与のマシンによって処理される入力部分を監視することができる。分岐424モジュールは、異なるマシンからの流れを示すことができる。待ち行列426は、所与のマシンのための内部バッファゾーン、例えば、入力材料又は部分が所与のマシンによって処理され得るまで待機する場所を表すことができる。データ構造442は、内部マシンバッファに記憶されたジョブを追跡することができ、各待ち行列処理されたジョブに関連する情報を含むことができる。
占有428モジュールは、所与のマシンが、処理のために待機部分を掴むために自由であるか又は利用可能であることを示すことができる。遅延430モジュールは、その部分を処理する(例えば、その部分を切断又は溶接する)ための所与のマシンに関与する時間を示すことができる。遅延430に基づいて、システムは、その部分又は材料の所与のマシンに関連する処理時間及び標準偏差406を判定することができる。解放432モジュールは、所与のマシンがその部分を解放し、その部分の処理が完了したことを示すことができる。リソーステーブル444は、所与のマシンが、ある部分(例えば、占有428動作のための「S」)を処理するために現在使用されていることを示すことができ、リソーステーブル444はまた、所与のマシンが、その部分(例えば、解放432動作のための「R」)を処理するために使用されて終了していることを示すことができる。
計数434は、所与のマシンによって処理された部分の数の総数を監視することができる。配置436モジュールは、次のマシン、例えば、所与の部分のための又はその部分の対応する生産ラインの一部としての流れの下流マシン/プロセス内の、「生成」モジュールに接続することができる。データ構造446は、特定部分に対して所与のマシンによって完了されたジョブの数(例えば、記憶、維持、及び追跡の数434)を追跡することができる。
マシン障害動作460の間、生成462モジュールは、障害の生成を表すことができる。生成462に基づいて、データ構造480は、所与のマシンによって経験される障害及び故障を追跡することができる。生成462及びデータ構造480に基づいて、システムは、所与のマシンに関連する障害までの時間(TTF)及び標準偏差402と、所与のマシンが経験する故障と、を判定することができる。
待ち行列464は、所与のマシンに関連する故障を記憶することができる所与のマシンのための内部バッファゾーンを表すことができる。データ構造482は、故障を追跡することができ、各待ち行列故障に関連する情報を含むことができる。占有466モジュールは、故障が、例えば、通常マシン動作420の占有428におけるような部分によっては占有されないが、代わりに、所与のマシンの障害又は故障によって「仮想」部分として占有される、所与のマシンのリソースを取得又は「占領」したことを示すことができる。遅延468モジュールは、障害又は故障中に所与のマシンが占領さられるのにかかる時間を示すことができる。遅延468に基づいて、システムは、所与のマシンに関連する回復するまでの時間(TTR)及び標準偏差404、及び所与のマシンが経験する故障を判定することができる。
解放470モジュールは、所与のマシンが仮想部分を解放し、障害によって占領されていること、例えば、マシンが故障又は障害から回復したことを示すことができる。配置472モジュールは、所与のマシンが通常マシン動作に戻ったことを示すことができる。
通常マシン動作420に関するリソーステーブル444の説明と同様に、システムは、リソーステーブル444において、所与のマシンが、現在、仮想部分を処理するために使用されていること、又は現在、障害若しくは故障(占有466動作についての「S」)に起因して利用不可能であること、及び所与のマシンが、仮想部分を処理するために使用されて終了していること、障害又は故障から回復していること、又は再び利用可能(例えば、解放470動作についての「R」)であることを示すことができる。
したがって、通常マシン動作420及びマシン障害動作460を示すシステムモデル400は、単一のマシンがシステムの全体的な処理にどのように影響し得るかを描写する。システムモデル400は、システムのユーザが、構築したシステムモデル160、及び製造システムのマシン間の動的に判定された接続を使用して、製造システムにおける故障の原因を判定することを可能にする。更に、(構築したシステムモデル160に基づく)システムモデル400は、ユーザが、マシンの新しい構成がシステムの全体的な処理にどのように影響するかをシミュレートすることを可能にする。ユーザが、構築したシステムモデル160によって示されるものとは異なる群のマシン/プロセスを使用して新しいオブジェクト又は材料を処理しようとする場合、ユーザは、所望の新しい構成で各マシンのモデルを収集し、シミュレーションを実行して、(図7に関して以下に説明するように)所望の新しい構成の性能を判定することができる。このハイブリッドアプローチを提供することにより、記載された実施形態は、履歴データが容易に利用可能でない可能性がある場合に、所望の新しい構成に対するデータ駆動のみのアプローチを使用するという問題に対処することができる。
--プルーニングした因果関係グラフ
図1Bに戻ると、純粋なデータ駆動アプローチから生成される因果関係グラフ110は、特にマシンと停止コードとの多数の組み合わせを有する製造システムにおいて高密度であり得る。構築したシステムモデル160は、(動作104及び106を介して)より効率的かつ使用可能なプルーニングした因果関係グラフ120を取得するために、因果関係グラフ110のプルーニングのガイダンスを提供することができる。システムは、製造システムの物理的トポロジに基づいて、又はシステムモデルを使用して製造システム内の重要なマシンの状態を識別及び分析する感度試験に基づいて、因果関係グラフ110をプルーニングすることができる。システムは、構築したシステムモデルに基づいて物理的な意味を持たない因果関係リンクをプルーニングすることができる。
例えば、システムモデル160は、因果関係グラフ110のノード113によって示されるマシン及び停止コードが(動作106を介して)より効率的な因果関係グラフを取得するために除去されるべきであると判定することができ、その結果、プルーニングした因果関係グラフ120が得られる。
--シミュレーションから生成した故障伝播ルール
図2及び図3に関連して上で説明されるように、システムは、それぞれの故障の頻度及び重大度に関する故障パラメータに基づいて、マシン及び故障をいくつかのタイプ(例えば、4つのタイプ)に分類することができる。システムはまた、システムモデル内の1つ以上の故障パラメータを変更し、シミュレーションされた障害シナリオに基づいて故障伝搬ルールのセットを判定することによって、複数の障害シナリオをシミュレートすることができる。
図5Aは、本出願の一実施形態による、3つのプロセスのスループット及びサイクル時間の例示的な図を示す。図510及び514は、プロセス1に関する情報を含む。図510は、1時間当たり約7,000単位のピークスループット512を含む、プロセス1の1時間当たりのスループットを示すことができる。図514は、プロセス1の1時間当たりのサイクル時間を示すことができる。図520及び524は、プロセス2に関する情報を含む。図520は、1時間当たり約2,200単位のピークスループット522を含む、プロセス2の1時間当たりのスループットを示すことができる。図524は、プロセス2の1時間当たりのサイクル時間を示すことができる。図530及び534は、プロセス3に関する情報を含む。図530は、1時間当たり約4,000単位のピークスループット532を含む、プロセス3の1時間当たりのスループットを示すことができる。図534は、プロセス3の1時間当たりのサイクル時間を示すことができる。
したがって、図5Aの図は、プロセス2におけるマシンが、プロセス2のスループットが大幅に低いため、生産ライン及び製造システムの全体的な効率においてボトルネックを生成し得ることを示す。すなわち、プロセス2(1時間当たり約2,200単位)について1時間当たりの部分で測定されたスループットは、プロセス1及び3の測定されたスループット(それぞれ、1時間当たり約7,000単位及び約4,000単位)よりも著しく低い。これは、プロセス2に関与するマシンの障害が、システム全体に大きな影響をもたらし得ることを示し得る。すなわち、識別された「ボトルネック」マシンの状態におけるわずかな変化は、生産ラインの性能の大きな変化をもたらし得る。図5B~図5Eの図は、プロセス1又は3のマシンにおいて同様の障害が発生した場合、全体的な性能への影響がより少ないことを示す。
図5Bは、本出願の一実施形態による、ベースラインスループットの例示的な図540を示す。ラインサイクル時間全体にわたるシミュレーションにおいて、図540は、ベースラインスループットが0.82であることを示す。
3つの例示的なプロセスの各々における障害の増加は、異なるスループットをもたらし得、プロセス2における障害の増加により、スループットに最大の影響をもたらす。
図5Cは、本出願の一実施形態による、第1のプロセス(プロセス1)の障害の増加を考慮したスループットの例示的な図550を示す。図550は、プロセス1の障害の増加が0.67のスループットをもたらし得ることを示す。
図5Dは、本出願の一実施形態による、第2のプロセス(プロセス2)の障害の増加を考慮したスループットの例示的な図560を示す。図560は、プロセス2の障害の増加が0.63のスループットをもたらし得ることを示す。
図5Eは、本出願の一実施形態による、第3のプロセス(プロセス3)の障害の増加を考慮したスループットの例示的な図570を示す。図570は、プロセス3の障害の増加が0.73のスループットをもたらし得ることを示す。
したがって、図5B~図5Dは、「ボトルネック」プロセス2が0.63のスループットをもたらし得、一方、プロセス1及び3における障害の増加が、それぞれ、0.67及び0.73のスループットをもたらし得ることを示す。システムモデルは、シミュレーションから、とりわけ、この故障伝搬ルールを生成することができる。したがって、システムは、マシンの障害とシステムレベルの性能劣化との間の因果関係を判定することができる。
図6は、本出願の一実施形態による、製造データセットに基づく例示的な故障伝搬ツリー600を示す。故障伝搬ツリー600は、例えば、マシンステータス情報、製品バッチ情報、停止コード、故障パラメータ、及びマシン、プロセス、又はシステムレベルにおける特徴/特性を示すノードを有する、マシンレベル610、プロセスレベル630、及びシステムレベル640における情報を含むことができる。システムは、2つのマシン(例えば、MA24 Num_Products 612及びMA25 Num_Products 614)の製品数がボトルネック632をもたらすと判定することができる。システムはまた、特定の停止コード(例えば、MA24停止コード1 616及びMA24停止コード2 618)によって示されるマシン/プロセスにおける故障が、ある重大度620をもたらし得ることを判定することができる。システムは、ボトルネック632及び重大度620に因果関係リンクを生成することができ、ラインスループット642で見られるように、システムレベルの性能劣化に対する因果関係リンクを更に生成することができる。
-組み合わせた因果関係グラフ
図1Cに戻ると、システムは、マシンの障害とシステムレベルの性能劣化との間の因果関係を判定することができる。図6に関連して上で説明される例示的な故障伝搬ツリーに加えて、システムは、(動作108を介して)図1Cの故障伝搬ツリー180を生成することができる。故障伝搬ツリー180は、「M1過剰摩耗」を示すノード181を含むことができる。ノード181の故障は、ノード182(「バッファ空」)と、「SC j」の停止コードを示すノード184とをもたらすことができる。ノード182によって示される空のバッファは、次のマシンが(「M2待機」のノード183によって示される)待機の故障状態に置かれることをもたらし得る。更に、ノード184のSC jは、ノード185の「SC k」の停止コードをもたらすことができる。
続いて、システムは、故障伝播ツリー180の因果関係リンクをプルーニングした因果関係グラフ120に追加して、(動作107及び109を介して)組み合わせた因果関係グラフ130を取得することができる。組み合わせた因果関係グラフ130は、プルーニングした因果関係グラフ120に対して以下の新しいリンク及びノード、すなわち、ノード111(SC 1)からノード114(SC 4)へのリンク/エッジ133、ノード114(SC 4)からノード115(SC 5)へのリンク/エッジ134、ノード111から新しいノード131(SC j)への新しいノード132(SC k)までの新しい故障伝搬経路を含むことができる。新しいノード131及び132は、それぞれ、故障伝搬ツリー180のノード184及び185に対応することができる。
したがって、組み合わせた因果関係グラフ130は、アーキテクチャ100の上半分のデータ駆動アプローチ(因果関係グラフ110、プルーニングした因果関係グラフ120、及び組み合わせた因果関係グラフ130を含む)と、アーキテクチャ100の下半分のモデルに基づくアプローチ(ネットワークトポロジ140、構築したシステムモデル160、及び故障伝搬ツリー180を含む)と、の両方を含むハイブリッドアプローチが、どのようにして、製造システムにおける故障の原因を判定するための改善されたシステムをもたらすことができるかを実証する。改善は、故障を直すために必要とされる分析時間の低減を含むことができ、その結果、単一のマシンの全体的なダウンタイムが低減され、生産ライン及び製造システム全体の性能が増加する。
製造システムにおける故障の原因を判定するための例示的な環境
図7は、本出願の一実施形態による、製造システムにおける故障の原因を判定するための例示的な環境700を示す。環境700は、デバイス702、関連するユーザ712、及び関連するディスプレイ714と、製造システム705と、デバイス706及び関連する記憶デバイス707と、デバイス708と、を含むことができる。デバイス702、706、及び708は、ネットワーク710を介して互いに通信することができる。製造システム705は、製造施設又は製造ネットワークを表すことができ、材料又はオブジェクト703(例えば、703.1~703.n)及びマシン704(例えば、704.1~704.m)を含むことができる。オブジェクト703は、例えば、特定のプロセスの一部として、及び本明細書に描写されるように、マシン704によって様々な処理を受けることができる。この処理は、(通信716を介して)デバイス706及び記憶デバイス707によって記憶され得るログデータを生成することができる。デバイス702、706、及び708は、サーバ、コンピューティングデバイス、又は本明細書に記載される機能を実行することができるいずれかのデバイスであり得る。
動作中、ユーザ712は、ディスプレイ714及びデバイス702を介して、製造システム705のためのネットワークトポロジ及び因果関係グラフを判定することができる。デバイス702は、トポロジ及び因果関係グラフ生成コマンド722をデバイス708に送信することができる。デバイス708は、トポロジ生成コマンド722を(コマンド730として)受信することができる。その後の、以前の、又は同様の時間において、デバイス706は、(ログデータ取得724要求をもたらす要求に基づいて)ログデータ726をデバイス708に送信することができる。デバイス708は、ログデータ726を(ログデータ728として)受信することができ、受信したログデータをシーケンスデータに変換することができる(図示せず)。
トポロジ及び因果関係グラフを生成するコマンド730に応答して、デバイス708は、ネットワークトポロジを生成し(動作732)、因果関係グラフを生成することができる(動作734)。デバイス708は、トポロジ736及び因果関係グラフ738をデバイス702に戻すことができる。トポロジ736(トポロジ740として)及び因果関係グラフ738(因果関係グラフ742として)を受信すると、デバイス702は、ディスプレイ714上に、製造ネットワークトポロジ744及び因果関係グラフ746を表示することができる。ユーザ712は、ネットワークトポロジ744及び因果関係グラフ746(図示せず)を操作するために、米国特許出願第17/061,248号に記載されているように、対話型グラフィカルユーザインターフェース(GUI)要素を使用することができる。
ユーザ712はまた、ネットワークトポロジ及び因果関係グラフに基づいて、ディスプレイ714及びデバイス702を介して、製造システム705のためのシステムモデルを判定することができる。デバイス702は、システムモデル生成コマンド750をデバイス708に送信することができる。デバイス708は、システムモデル生成コマンド750を(コマンド752として)受信することができる。デバイス708は、システムモデルを構築することができ(動作754)、システムモデル756をデバイス702に戻すことができる。システムモデル756を(システムモデル758として)受信すると、デバイス702は、システムモデル760をディスプレイ714上に表示することができる。
ユーザ712は、ディスプレイ714及びデバイス702を介して、システムモデルに基づいて、製造システム705に関する組み合わせた因果関係グラフを更に判定することができる。デバイス702は、組み合わせた因果関係グラフ生成コマンド762をデバイス708に送信することができる。デバイス708は、(コマンド764として)組み合わせた因果関係グラフ生成コマンド762を受信することができる。デバイス708は、因果関係グラフをプルーニングし(動作766)、システムモデルに基づいて故障伝播ツリーを生成することができる(動作768)。デバイス708はまた、組み合わせた因果関係グラフを生成することができる(動作770)。デバイス708は、プルーニングした因果関係グラフ772を戻すことができ、これは、プルーニングした因果関係グラフ774としてデバイス702によって受信され、プルーニングした因果関係グラフ776としてディスプレイ714上に表示される。デバイス708はまた、故障伝搬ツリー778を戻すことができ、これは、故障伝搬ツリー780としてデバイス702によって受信され、故障伝搬ツリー782としてディスプレイ714上に表示される。デバイス708はまた、組み合わせた因果関係グラフ784を戻すこともでき、これは、組み合わせた因果関係グラフ786としてデバイス702によって受信され、組み合わせた因果関係グラフ788としてディスプレイ714上に表示される。
ディスプレイ714は、ユーザ712が表示されたデータのいずれかを操作することを可能にする対話型GUI要素を含むことができる。GUI要素は、表示されたデータの各タイプ、例えば、744、746、760、776、782、及び788上に、又はその近くに位置することができる。いくつかの実施形態では、ユーザは、任意の診断又は指示された故障に対処することができ、例えば、シミュレーションを実行して追加情報を取得することによって、システムモデルを再構築することによって、又は最終的な組み合わせた因果関係グラフを再生成することによって、表示されたデータのいずれかを再生成するコマンドを生成することができる。システムは、元の組み合わせた因果関係グラフ上に新たに生成した組み合わせた因果関係グラフのオーバーレイを表示することができ、ユーザが差異に関する詳細な情報を閲覧することを可能にする他のGUI要素を表示することができる。
製造システムにおける故障の原因を判定する方法
図8Aは、本出願の一実施形態による、製造システムにおける故障の原因を判定する方法を示すフロー図800を提示する。動作中、システムは、マシン及び関連するプロセスを含む、製造システムに関連するデータを記憶し、このデータは、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む(動作802)。システムは、データに基づいて、製造システムのトポロジを判定し、このトポロジは、プロセスの一部としてのマシン間のオブジェクトの流れを示す(動作804)。システムは、トポロジに関連するマシン故障の情報を判定する(動作806)。システムは、マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す1つ以上の故障パラメータを生成する(動作808)。システムは、トポロジ及びマシン故障情報に基づいて、1つ以上の故障パラメータを含むシステムモデルを構築し、それによって製造システムの診断を容易にする(動作810)。システムは、トポロジ内のノードをマシンモデルで置換することによってシステムモデルを構築し、故障拡張モデルを取得することができ、それぞれのマシンは、ビジー、利用可能、及び停止を含む状態を有する有限状態マシンによって示される。この動作は、図8BのラベルAに継続する。
図8Bは、本出願の一実施形態による、製造システムにおける故障の原因を判定する方法を示すフロー図820を提示する。動作中、システムは、トポロジ及びマシン故障情報に基づいて故障因果関係グラフを生成する(動作822)。システムは、システムモデルに基づいて故障因果関係グラフをプルーニングする(動作824)。システムは、マシンの障害とシステムレベルの性能劣化との間の因果関係を判定する(動作826)。システムは、因果関係に基づいて、因果関係リンクをプルーニングした故障因果関係グラフに追加して、組み合わせた因果関係グラフを取得する(動作828)。システムは、故障因果関係グラフ、プルーニングした故障因果関係グラフ、又は組み合わせた故障因果関係グラフを表示し、これにより、ユーザが、(例えば、ユーザに関連するコンピューティングデバイスのディスプレイ上の対話型GUI要素を介して)製造システムの効率的な故障診断を実行すること(動作830)を可能にする。
出願の概要、実用的な用途への組み込み、技術分野に対する改善
要約すると、本明細書に記載される実施形態は、製造システムにおける故障の原因を判定するために、データ駆動アプローチ及びモデルに基づくアプローチを含むハイブリッドアプローチを利用するシステムを提供する。システムは、集中的なコンピューティングリソース(例えば、追加の感知システムの設置)を必要とすることなく、又はシステム全体の代わりに単一の構成要素/マシンに焦点を合わせることなく、ネットワークトポロジ(製造又は生産ラインネットワークトポロジなど)及び因果関係グラフを効率的に構築することができるため、実用的な用途に組み込むことができる。システムは、ネットワークトポロジ及び因果関係グラフを生成して表示することができる。
更に、システムは、ネットワークトポロジから故障拡張システムモデルを構築することができ、故障拡張システムモデルに基づいて因果関係グラフをプルーニングし、ネットワークトポロジに基づいてマシン故障情報を判定し、それぞれの故障の頻度及び重大度を示す故障パラメータに基づいて故障伝搬ツリーを生成することができる。システムは、故障拡張システムモデル及び故障伝搬ツリーを使用して、プルーニングした因果関係グラフを修正して、最終的な組み合わせた因果関係グラフを取得することができる。最終的な組み合わせた因果関係グラフは、視覚表示の一部としてユーザに提示され得、これにより、ユーザは、製造システム全体の状態をより迅速かつ効率的に解釈して評価することができ、例えば、表示されたスクリーン及び対話型グラフィカルユーザ要素を介して、故障診断及び根本原因分析を可能にする。したがって、システムは、大量の反復ログデータを迅速で、効率的、及び効果的なオンサイト診断のために、簡素な視覚化に変換することができる。
本明細書に記載されるグラフ生成/ディスプレイは、製造システムの又は製造施設内の構成要素、マシン、プロセス、又は他の機器の全体的なダウンタイムに関与する分析時間の低減をもたらすことができる。これらの改善は、製造システムにおけるマシンの動作、生産ラインの性能、及び製造システム全体の改善をもたらすことができる。説明される実施形態はまた、製造システム分析、生産ライン監視、データ分析、データマイニング、マシン依存の可視化、及び故障伝搬経路の可視化の技術及び工学分野に改善をもたらすことができる。
例示的な分散コンピュータシステム
図9は、本出願の一実施形態による、製造ネットワークトポロジ及び故障伝搬情報の判定を容易にする例示的な分散コンピュータ及び通信システムを示す。コンピュータシステム902は、プロセッサ904、メモリ906、及び記憶デバイス908を含む。メモリ906は、管理メモリとして機能する揮発性メモリ(例えば、RAM)を含むことができ、1つ以上のメモリプールを記憶するために使用することができる。更に、コンピュータシステム902は、ディスプレイデバイス910、キーボード912、及びポインティングデバイス914に結合することができる。記憶デバイス908は、オペレーティングシステム916、コンテンツ処理システム918、及びデータ934を記憶することができる。
コンテンツ処理システム918は、コンピュータシステム902によって実行されると、本開示に記載されている方法及び/又はプロセスをコンピュータシステム902に実行させることができる命令を含み得る。具体的には、コンテンツ処理システム918は、コンピュータネットワークを介して他のネットワークノードへ/から、データパケットを送信及び/又は受信する/取得するための命令を含み得る(通信モジュール920)。データパケットは、例えば、要求、コマンド、データ、ユーザ入力、ログデータ、トポロジ、経路、グラフなどを含むことができる。
コンテンツ処理システム918は、マシン及び関連するプロセスを含む製造システムに関連するデータを記憶するための命令を更に含むことができ、データは、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む(データ保存モジュール922)。コンテンツ処理システム918は、データに基づいて、製造システムのトポロジを判定するための命令を含むことができ、このトポロジは、プロセスの一部としてのマシン間のオブジェクトの流れを示す(トポロジ判定モジュール924)。コンテンツ処理システム918はまた、トポロジに関連するマシン故障の情報を判定するための命令を含むことができる(故障情報判定モジュール926)。コンテンツ処理システム918は、マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す1つ以上の故障パラメータを生成するための命令を含むことができる(故障パラメータ生成モジュール928)。コンテンツ処理システム918は、トポロジ及びマシン故障情報に基づいて、1つ以上の故障パラメータを含むシステムモデルを構築するための命令を含むことができ、それによって製造システムの診断を容易にする(システムモデル構築モジュール930)。
コンテンツ処理システム918は、更に、トポロジ及びマシン故障情報に基づいて、故障因果関係グラフを生成するための命令と、システムモデルに基づいて、故障因果関係グラフをプルーニングする命令と、マシンの障害とシステムレベルの性能劣化との間の因果関係を判定する命令と、因果関係に基づいて、プルーニングした故障因果関係グラフに因果関係リンクを追加して、組み合わせた因果関係グラフを取得する命令と、を含むことができる(因果関係グラフ管理モジュール932)。コンテンツ処理システム918は、故障因果関係グラフ、プルーニングした故障因果関係グラフ、及び組み合わせた故障因果関係グラフを表示するための命令を含むことができる(因果関係グラフ管理モジュール932)。コンテンツ処理システム918のモジュールはまた、本明細書に記載される動作及び機能を実行することができる同様のモジュールを有する装置を備えることができる。
データ934は、入力として必要とされるか、又は本開示に記載される方法及び/若しくはプロセスによって出力として生成される、いずれかのデータを含むことができる。具体的には、データ934は、少なくとも、データと、ログデータと、時間系列又はシーケンスデータと、タイムスタンプ情報と、マシンステータス情報と、マシン故障情報と、停止コード又は故障タイプと、製品バッチ情報又はロット番号と、オブジェクト、出力、又は材料の名称又は他の識別子と、トポロジと、ネットワークトポロジと、製造ネットワークトポロジ及び関連するグラフと、プロセスの一部としてのマシン間のオブジェクト又は材料の流れの指示体と、故障パラメータと、故障の頻度又は重大度の指示体と、システムモデルと、故障診断と、数と、いくつかのタイプと、カテゴリ化と、障害シナリオと、故障伝搬ルールと、グラフと、故障因果関係グラフと、プルーニングした又は組み合わせた故障因果関係グラフと、因果関係と、マシン障害又はシステムレベルの性能劣化の指示体と、因果関係リンクと、ノードと、エッジと、グラフのサイズと、障害間の中間時間と、ランダム事象と、機能停止と、分布と、ガウス分布と、障害における標準偏差と、回復するまでの中間時間と、ランダムな回復時間と、回復における標準偏差と、回復時間と、有限状態マシンと、ビジー、利用可能、及び停止を含む状態の指示体と、通常動作パラメータと、プロセス時間と、プロセス時間における標準偏差と、データ構造と、を記憶することができる。
「発明を実施するための形態」に記載されるデータ構造及びコードは、典型的には、コンピュータ可読記憶媒体に記憶され、コンピュータ可読記憶媒体は、コンピュータシステムが使用するためのコード及び/又はデータを記憶することができる任意のデバイス又は媒体であり得る。コンピュータ可読記憶媒体としては、揮発性メモリ、不揮発性メモリ、ディスクドライブなどの磁気及び光学記憶デバイス、磁気テープ、CD(コンパクトディスク)、DVD(デジタル多用途ディスク若しくはデジタルビデオディスク)、又は既知の、若しくは今後開発されるコンピュータ可読媒体を記憶することができる他の媒体が挙げられるが、これらに限定されない。
「発明を実施するための形態」の節に記載される方法及びプロセスは、上に論じられるようなコンピュータ可読記憶媒体内に記憶され得るコード及び/又はデータとして具体化され得る。コンピュータシステムが、コンピュータ可読記憶媒体上に記憶されたコード及び/又はデータを読み取って実行すると、コンピュータシステムは、データ構造及びコードとして具体化され、コンピュータ可読記憶媒体内に記憶された方法及び処理を実行する。
更に、上で説明される方法及び処理は、ハードウェアモジュール又は装置に含まれ得る。ハードウェアモジュール又は装置としては、特定用途向け集積回路(application-specific integrated circuit、ASIC)チップ、フィールドプログラム可能ゲートアレイ(field-programmable gate array、FPGA)、特定の時刻に特定のソフトウェアモジュール又はコードを実行する専用又は共有プロセッサ、及び、既知の又は後に開発される他のプログラム可能論理デバイスが挙げられ得るが、これらに限定されない。ハードウェアモジュール又は装置が起動されると、それらの内部に含まれる方法及び処理が実行される。
本明細書に記載される前述の実施形態は、例示及び説明のみを目的として提示されている。これらは、網羅的であること、又は本発明を開示される形態に限定することを意図するものではない。したがって、多くの修正及び変形が、当業者には明らかであろう。加えて、上記の開示は、本発明を限定することを意図するものではない。本発明の範囲は、添付の特許請求の範囲によって定義される。

Claims (20)

  1. コンピュータ実装方法であって、
    マシン及び関連するプロセスを含む処理システムに関連するデータを記憶することであって、前記データが、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む、記憶することと、
    前記データに基づいて、前記処理システムのトポロジを判定することであって、前記トポロジが、前記プロセスの一部としての前記マシン間の出力の流れを示す、判定することと、
    前記トポロジに関連するマシン故障の情報を判定することと、
    前記マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す1つ以上の故障パラメータを生成することと、
    前記トポロジ及び前記マシン故障情報に基づいて、前記1つ以上の故障パラメータを含むシステムモデルを構築することにより、前記処理システムの診断を容易にすることと、を含む、コンピュータ実装方法。
  2. それぞれのマシン故障の前記頻度及び前記重大度に基づいて、前記マシン及び前記マシン故障をいくつかのタイプに分類することと、
    前記システムモデル内の前記1つ以上の故障パラメータを変更することによって、複数の障害シナリオをシミュレートすることと、
    前記シミュレートされた障害シナリオに基づいて、故障伝搬ルールのセットを判定することと、を更に含む、請求項1に記載の方法。
  3. 前記トポロジ及び前記マシン故障情報に基づいて故障因果関係グラフを生成することと、
    前記システムモデルに基づいて前記故障因果関係グラフをプルーニングすることと、
    前記マシンの障害とシステムレベルの性能劣化との間の因果関係を判定することと、
    前記因果関係に基づいて、前記プルーニングした故障因果関係グラフに因果関係リンクを追加して、組み合わせた因果関係グラフを取得することと、を更に含む、請求項1に記載の方法。
  4. 前記故障因果関係グラフを表示することを更に含み、
    前記故障因果関係グラフ内のそれぞれのノードが、それぞれの出力に関して、前記それぞれの出力を処理する第1のマシンと、前記第1のマシンに関連する第1のプロセスと、前記それぞれの出力の処理における前記第1のマシン及び前記第1のプロセスに関連する問題を示す停止コードと、を示し、
    前記故障因果関係グラフ内のそれぞれのエッジが、前記それぞれの出力に関して、開始ノードから目的ノードへの論理的流れを示す、請求項3に記載の方法。
  5. 前記システムモデルに基づいて前記故障因果関係グラフをプルーニングすることが、前記故障因果関係グラフから1つ以上のノードを除去することによって前記故障因果関係グラフのサイズを低減することを含み、
    前記方法が、前記プルーニングした故障因果関係グラフを表示することを更に含む、請求項4に記載の方法。
  6. 前記プルーニングした故障因果関係グラフに前記因果関係リンクを追加することに応答して、前記組み合わせた因果関係グラフを表示することにより、ユーザが前記処理システムの効率的な故障診断を実行することを可能にすることを更に含む、請求項3に記載の方法。
  7. それぞれの故障パラメータが、
    それぞれのマシンの2つの連続する機能停止間の平均時間を示す、障害間の中間時間であって、それぞれの機能停止が、第1の分布から生成されたランダム事象である、中間時間と、
    障害における第1の標準偏差であって、前記それぞれの機能停止を表す前記第1の分布の標準偏差を示す、第1の標準偏差と、
    マシンが停止状態から回復するまでの平均時間を示す、回復するまでの中間時間であって、ランダム回復時間が第2の分布から生成される、回復するまでの中間時間と、
    回復における第2の標準偏差であって、前記回復時間を表す前記第2の分布の標準偏差を示す、第2の標準偏差と、のうちの1つ以上を含む、請求項1に記載の方法。
  8. 前記1つ以上の故障パラメータを含む前記システムモデルを構築することが、
    前記トポロジ内のノードをマシンモデルで置換して、故障拡張モデルを取得することを含み、
    それぞれのマシンが、ビジー、利用可能、及び停止を含む状態を有する有限状態マシンによって示される、請求項1に記載の方法。
  9. 前記トポロジに基づいて、
    それぞれの出力を処理するためのマシンに関与する第1の総時間、又はそれぞれの出力を処理するためのプロセスにおける全てのマシンに関与する第2の総時間を示すプロセス時間と、
    前記プロセス時間における標準偏差と、
    それぞれのマシンが処理することができる前記出力を示すデータ構造と、のうちの1つ以上を含む、通常動作パラメータを判定することを更に含む、請求項1に記載の方法。
  10. 前記処理システムが、
    製造システムであって、前記ネットワークトポロジが、前記プロセスの一部としての前記マシン間の材料の流れを更に示す、製造システムと、
    クラウド又はクラスタコンピューティングシステムであって、前記ネットワークトポロジが、前記クラウド又はクラスタコンピューティングシステムの前記プロセスの一部としての、前記マシン間の出力に関連付けられた分散又は並列計算又はシミュレーションの流れを更に示す、クラウド又はクラスタコンピューティングシステムと、
    供給チェーンシステムであって、前記ネットワークトポロジが、前記供給チェーンシステムの前記プロセスの一部としての、前記マシン間の配送及び分配出力に関連する材料の流れを更に示す、供給チェーンシステムと、のうちの1つ以上を含む、請求項1に記載の方法。
  11. コンピュータシステムであって、
    プロセッサと、
    前記プロセッサによって実行されると、前記プロセッサに方法を実行させる命令を記憶する記憶デバイスと、を含み、前記方法が、
    マシン及び関連するプロセスを含む処理システムに関連するデータを記憶することであって、前記データが、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む、記憶することと、
    前記データに基づいて、前記処理システムのトポロジを判定することであって、前記トポロジが、前記プロセスの一部としての前記マシン間の出力の流れを示す、判定することと、
    前記トポロジに関連するマシン故障の情報を判定することと、
    前記マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す1つ以上の故障パラメータを生成することと、
    前記トポロジ及び前記マシン故障情報に基づいて、前記1つ以上の故障パラメータを含むシステムモデルを構築することにより、前記処理システムの診断を容易にすることと、を含む、コンピュータシステム。
  12. 前記方法が、
    前記マシン及び前記マシン故障を、それぞれのマシン故障の前記頻度及び前記重大度に基づいていくつかのタイプに分類することと、
    前記システムモデル内の前記1つ以上の故障パラメータを変更することによって、複数の障害シナリオをシミュレートすることと、
    前記シミュレートされた障害シナリオに基づいて、故障伝搬ルールのセットを判定することと、を更に含む、請求項11に記載のコンピュータシステム。
  13. 前記方法が、
    前記トポロジ及び前記マシン故障情報に基づいて故障因果関係グラフを生成することと、
    前記システムモデルに基づいて前記故障因果関係グラフをプルーニングすることと、
    前記マシンの障害とシステムレベルの性能劣化との間の因果関係を判定することと、
    前記因果関係に基づいて、因果関係リンクを前記プルーニングした故障因果関係グラフに追加して、組み合わせた因果関係グラフを取得することと、を更に含む、請求項11に記載のコンピュータシステム。
  14. 前記方法が、
    前記故障因果関係グラフを表示することを更に含み、
    前記故障因果関係グラフ内のそれぞれのノードが、それぞれの出力に関して、前記それぞれの出力を処理する第1のマシンと、前記第1のマシンに関連する第1のプロセスと、前記それぞれの出力の処理における前記第1のマシン及び前記第1のプロセスに関連する問題を示す停止コードと、を示し、
    前記故障因果関係グラフ内のそれぞれのエッジが、前記それぞれの出力に関して、開始ノードから目的ノードへの論理的流れを示す、請求項13に記載のコンピュータシステム。
  15. 前記システムモデルに基づいて前記故障因果関係グラフをプルーニングすることが、前記故障因果関係グラフから1つ以上のノードを除去することによって前記故障因果関係グラフのサイズを低減することを含み、
    前記方法が、
    前記プルーニングした故障因果関係グラフを表示することと、
    前記プルーニングした故障因果関係グラフに前記因果関係リンクを追加することに応答して、前記組み合わせた因果関係グラフを表示することにより、ユーザが前記処理システムの効率的な故障診断を実行することを可能にすることと、を更に含む、請求項14に記載のコンピュータシステム。
  16. それぞれの故障パラメータが、
    それぞれのマシンの2つの連続する機能停止間の平均時間を示す、障害間の中間時間であって、それぞれの機能停止が、第1の分布から生成されたランダム事象である、中間時間と、
    障害における第1の標準偏差であって、前記それぞれの機能停止を表す前記第1の分布の標準偏差を示す、第1の標準偏差と、
    マシンが停止状態から回復するまでの平均時間を示す、回復するまでの中間時間であって、ランダム回復時間が第2の分布から生成される、回復するまでの中間時間と、
    回復における第2の標準偏差であって、前記回復時間を表す前記第2の分布の標準偏差を示す、第2の標準偏差と、のうちの1つ以上を含む、請求項11に記載のコンピュータシステム。
  17. 前記1つ以上の故障パラメータを含む前記システムモデルを構築することが、
    前記トポロジ内のノードをマシンモデルで置換して、故障拡張モデルを取得することを含み、
    それぞれのマシンが、ビジー、利用可能、及び停止を含む状態を有する有限状態マシンによって示される、請求項11に記載のコンピュータシステム。
  18. 前記方法が、
    前記トポロジに基づいて、
    それぞれの出力を処理するためのマシンに関与する第1の総時間、又はそれぞれの出力を処理するためのプロセスにおける全てのマシンに関与する第2の総時間を示すプロセス時間と、
    前記プロセス時間における標準偏差と、
    それぞれのマシンが処理することができる前記出力を示すデータ構造と、のうちの1つ以上を含む、通常動作パラメータを判定することを更に含む、請求項11に記載のコンピュータシステム。
  19. 前記処理システムが、
    製造システムであって、前記ネットワークトポロジが、前記プロセスの一部としての前記マシン間の材料の流れを更に示す、製造システムと、
    クラウド又はクラスタコンピューティングシステムであって、前記ネットワークトポロジが、前記クラウド又はクラスタコンピューティングシステムの前記プロセスの一部としての、前記マシン間の出力に関連付けられた分散又は並列計算又はシミュレーションの流れを更に示す、クラウド又はクラスタコンピューティングシステムと、
    供給チェーンシステムであって、前記ネットワークトポロジが、前記供給チェーンシステムの前記プロセスの一部としての、前記マシン間の配送及び分配出力に関連する材料の流れを更に示す、供給チェーンシステムと、のうちの1つ以上を含む、請求項11に記載のコンピュータシステム。
  20. 装置であって、
    マシン及び関連するプロセスを含む製造システムに関連するデータを記憶するように構成されたデータ記憶モジュールであって、前記データが、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む、データ記憶モジュールと、
    前記データに基づいて、前記製造システムのトポロジを判定するように構成されたトポロジ判定モジュールであって、前記トポロジが、前記プロセスの一部としての前記マシン間の出力の流れを示す、トポロジ判定モジュールと、
    前記トポロジに関連するマシン故障の情報を判定するように構成された故障情報判定モジュールと、
    前記マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す1つ以上の故障パラメータを生成するように構成された故障パラメータ生成モジュールと、
    前記トポロジ及び前記マシン故障情報に基づいて、前記1つ以上の故障パラメータを含むシステムモデルを構築することによって、前記製造システムの診断を容易にするように構成されたモデル構築モジュールと、を備える、装置。
JP2021120269A 2020-08-03 2021-07-21 製造システムにおける故障の根本原因分析用の故障拡張システムモデルを構築するためのシステム及び方法 Pending JP2022028619A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202063060522P 2020-08-03 2020-08-03
US63/060,522 2020-08-03
US17/068,613 2020-10-12
US17/068,613 US11314577B2 (en) 2020-08-03 2020-10-12 System and method for constructing fault-augmented system model for root cause analysis of faults in manufacturing systems

Publications (1)

Publication Number Publication Date
JP2022028619A true JP2022028619A (ja) 2022-02-16

Family

ID=76807505

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021120269A Pending JP2022028619A (ja) 2020-08-03 2021-07-21 製造システムにおける故障の根本原因分析用の故障拡張システムモデルを構築するためのシステム及び方法

Country Status (3)

Country Link
US (1) US11314577B2 (ja)
EP (1) EP3951533B1 (ja)
JP (1) JP2022028619A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4231108A1 (en) * 2022-02-18 2023-08-23 Tata Consultancy Services Limited Method and system for root cause identification of faults in manufacturing and process industries
CN114422337A (zh) * 2022-03-09 2022-04-29 中国建设银行股份有限公司 网络抓包定位故障的方法及相关装置
CN114490303B (zh) * 2022-04-07 2022-07-12 阿里巴巴达摩院(杭州)科技有限公司 故障根因确定方法、装置和云设备
US20240061740A1 (en) * 2022-08-15 2024-02-22 Nec Laboratories America, Inc. Disentangled graph learning for incremental causal discovery and root cause analysis
CN116796031B (zh) * 2023-03-01 2024-03-26 中国人民解放军海军航空大学 一种基于因果关系的故障传播路径辨识方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8458117B2 (en) 2009-02-02 2013-06-04 The Boeing Company System and method for dependency and root cause discovery
US20160203036A1 (en) * 2015-01-09 2016-07-14 Ecorithm, Inc. Machine learning-based fault detection system
US10474519B2 (en) * 2015-09-17 2019-11-12 Netapp, Inc. Server fault analysis system using event logs
US9537720B1 (en) * 2015-12-10 2017-01-03 International Business Machines Corporation Topology discovery for fault finding in virtual computing environments
US10558766B2 (en) 2015-12-31 2020-02-11 Palo Alto Research Center Incorporated Method for Modelica-based system fault analysis at the design stage
US10360114B2 (en) * 2016-02-24 2019-07-23 Quanta Computer Inc. Hardware recovery systems

Also Published As

Publication number Publication date
US11314577B2 (en) 2022-04-26
US20220035694A1 (en) 2022-02-03
EP3951533C0 (en) 2024-03-13
EP3951533A1 (en) 2022-02-09
EP3951533B1 (en) 2024-03-13

Similar Documents

Publication Publication Date Title
JP2022028619A (ja) 製造システムにおける故障の根本原因分析用の故障拡張システムモデルを構築するためのシステム及び方法
Friederich et al. A framework for data-driven digital twins of smart manufacturing systems
US10693711B1 (en) Real-time event correlation in information networks
JP2017142800A (ja) プロセス制御ネットワークのルールビルダー
US20110161730A1 (en) Systems, methods, and apparatus to debug a network application
KR20040062528A (ko) 시스템 및 기업 이벤트의 근본 원인을 상관시키고결정하는 방법 및 시스템
CN104796273A (zh) 一种网络故障根源诊断的方法和装置
US8457811B2 (en) Device for system diagnosis
US20230129123A1 (en) Monitoring and Management System for Automatically Generating an Issue Prediction for a Trouble Ticket
US10664765B2 (en) Labelling intervals using system data to identify unusual activity in information technology systems
Friederich et al. Towards data-driven reliability modeling for cyber-physical production systems
CN113946499A (zh) 一种微服务链路跟踪及性能分析方法、系统、设备及应用
CN102169455A (zh) 用于软件性能测试的调试方法和系统
US20230239194A1 (en) Node health prediction based on failure issues experienced prior to deployment in a cloud computing system
US11029936B2 (en) Deploying packages to devices in a fleet in stages
CN111913824A (zh) 确定数据链路故障原因的方法及相关设备
CN105681070A (zh) 一种自动收集计算机集群节点信息并分析的方法及系统
CN113705896A (zh) 目标设备的确定方法、装置及电子设备
CN116194894A (zh) 原生云应用程序的故障定位
US11663544B2 (en) System and methods for risk assessment in a multi-tenant cloud environment
EP3945386A1 (en) System and method for determining manufacturing plant topology and fault propagation information
CN114503132A (zh) 机器学习模型训练的调试和剖析
Cohen et al. Utilizing timed petri nets to guide data-driven fault diagnosis of PLC-timed event systems
JP2022028620A (ja) 製造プロセスにおける因果推論のためのシステム及び方法
O’Halloran et al. Early design stage reliability analysis using function-flow failure rates

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20210729

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20211118

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20240116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20240116