JP2022028619A

JP2022028619A - 製造システムにおける故障の根本原因分析用の故障拡張システムモデルを構築するためのシステム及び方法

Info

Publication number: JP2022028619A
Application number: JP2021120269A
Authority: JP
Inventors: ホン・ユウ; Hong Yu; アジェイ・ラガヴァン; Raghavan Ajay; サーマン・モスタファヴィ; Mostafavi Saman; テク・チュン; Deokwoo Jung
Original assignee: Palo Alto Research Center Inc
Current assignee: Palo Alto Research Center Inc
Priority date: 2020-08-03
Filing date: 2021-07-21
Publication date: 2022-02-16
Also published as: US11314577B2; US20220035694A1; EP3951533C0; EP3951533A1; EP3951533B1

Abstract

【課題】製造システムにおける故障の原因を判定するためのシステムを提供する。【解決手段】システムは、マシン及び関連するプロセスを含む処理システムに関連するデータを記憶し、データは、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む。システムは、データに基づいて、処理システムのトポロジを判定し、トポロジは、プロセスの一部としてのマシン間の出力の流れを示す。システムは、トポロジに関連して、マシン故障の情報を判定する。システムは、マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す１つ以上の故障パラメータを生成する。システムは、トポロジ及びマシン故障情報に基づいて、１つ以上の故障パラメータを含むシステムモデルを構築することによって、処理システムの診断を容易にする。【選択図】図１Ａ

Description

（関連出願の相互参照）
本出願は、２０２０年８月３日に出願された発明者ＨｏｎｇＹｕ、ＡｊａｙＲａｇｈａｖａｎ、ＳａｍａｎＭｏｓｔａｆａｖｉ、及びＤｅｏｋｗｏｏＪｕｎｇによる「ＳｙｓｔｅｍａｎｄＭｅｔｈｏｄｆｏｒＣｏｎｓｔｒｕｃｔｉｎｇＦａｕｌｔ－ＡｕｇｍｅｎｔｅｄＳｙｓｔｅｍＭｏｄｅｌｆｏｒＲｏｏｔＣａｕｓｅＡｎａｌｙｓｉｓｏｆＦａｕｌｔｓｉｎＭａｎｕｆａｃｔｕｒｉｎｇＳｙｓｔｅｍｓ」と題する米国仮出願第６３／０６０，５２２号、代理人整理番号ＰＡＲＣ－２０２００１６５ＵＳ０１の利益を主張するものであり、その開示は、参照によりその全体が本明細書に組み込まれる。

本出願は、２０２０年１０月１日に出願された発明者ＨｏｎｇＹｕ、ＡｊａｙＲａｇｈａｖａｎ、ＤｅｏｋｗｏｏＪｕｎｇ、及びＳａｍａｎＭｏｓｔａｆａｖｉによる「ＳｙｓｔｅｍａｎｄＭｅｔｈｏｄｆｏｒＤｅｔｅｒｍｉｎｉｎｇＭａｎｕｆａｃｔｕｒｉｎｇＰｌａｎｔＴｏｐｏｌｏｇｙａｎｄＦａｕｌｔＰｒｏｐａｇａｔｉｏｎＩｎｆｏｒｍａｔｉｏｎ」と題する米国特許出願第１７／０６１，２４８号（代理人整理番号第ＰＡＲＣ－２０２００１２４ＵＳ０２）（以下、「米国特許出願第１７／０６１，２４８号」）に関し、この出願は、
２０２０年７月３１日に出願された発明者ＨｏｎｇＹｕ、ＡｊａｙＲａｇｈａｖａｎ、ＤｅｏｋｗｏｏＪｕｎｇ、及びＳａｍａｎＭｏｓｔａｆａｖｉによる「ＳｙｓｔｅｍａｎｄＭｅｔｈｏｄｆｏｒＤｅｔｅｒｍｉｎｉｎｇＭａｎｕｆａｃｔｕｒｉｎｇＰｌａｎｔＴｏｐｏｌｏｇｙａｎｄＦａｕｌｔＰｒｏｐａｇａｔｉｏｎＩｎｆｏｒｍａｔｉｏｎ」と題する米国仮出願第６３／０５９，４４６号、代理人整理番号ＰＡＲＣ－２０２００１２４ＵＳ０１の利益を主張するものであり、
これらの開示は、参照によりその全体が本明細書に組み込まれる。

（発明の分野）
本開示は、概して、データマイニングに関する。より具体的には、本開示は、製造システムにおける故障の根本原因分析用の故障拡張システムモデルを構築するためのシステム及び方法に関する。

現代の製造（サイバーフィジカル製造システムなど）では、ネットワークは動的であり得、マシンは生産の需要の変化に合わせてクラスタに構成されている。予定されていないマシン停止及び生産ラインの性能低下の故障検出及び根本原因分析（ＲＣＡ）は、多大な経済的価値を有し得る。モデルに基づく異常検出／故障診断アプローチは、公称プロセスモデルの知識を必要とする場合があるが、モデルに基づく根本原因分析（ＲＣＡ）だけではなくて、故障間の因果関係を差し引きするために公称プロセスを超えてプロセスを外挿することが可能なシステムも必要とする場合がある。サイバーフィジカル製造システムの複雑さの状態は、システムモデルを手動で構築することを実行不可能にさせ得、故障モデリングの追加は、余分な複雑さをもたらし得る。

製造システムの現在のＲＣＡアプローチは、一般に、データ駆動アプローチ、及びモデルに基づくアプローチの２つのカテゴリに分割することができる。マシン学習及びビッグデータ技術の最近の進歩は、製造データをマイニングすることによって、ＲＣＡ目的のための情報を抽出するための門戸を開いている。２つの一般的なデータ駆動アプローチとしては、相関ルール抽出及びベイジアンネットワークが挙げられる。対照的に、モデルに基づくアプローチは、システムに関する知識及び／又は障害の物理学を利用しようと試みる。モデルに基づくアプローチは、第１の原理（有限要素モデルなど）に基づくか、又は状態空間モデリング（自動マシンなど）、すなわち物理学に基づくモデルに基づくことができる。しかしながら、このような物理学モデルに基づくアプローチに必要とされる詳細のレベルは、データ駆動アプローチのためにラベルデータを収集するコストがそのようなモデルを構築するコストを上回る、工学システムの小サブセットのみを実行可能にし得る。

したがって、製造システムにおけるＲＣＡを判定するためのいくつかの現在のアプローチは、製造システム及び／又は故障の物理学に関する知識を利用するためにモデルに基づくアプローチを使用することができるが、これらのアプローチは、限定された量の標識データによって制約され得る。

一実施形態は、製造システムにおける故障の原因を判定するためのシステムを提供する。動作中、システムは、マシン及び関連するプロセスを含む、処理システムに関連するデータを記憶し、このデータは、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む。システムは、データに基づいて、処理システムのトポロジを判定し、トポロジは、プロセスの一部としてのマシン間の出力の流れを示す。システムは、トポロジに関連して、マシン故障の情報を判定する。システムは、マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す１つ以上の故障パラメータを生成する。システムは、トポロジ及びマシン故障情報に基づいて、１つ以上の故障パラメータを含むシステムモデルを構築することによって、処理システムの診断を容易にする。

いくつかの実施形態では、システムは、それぞれのマシン故障の頻度及び重大度に基づいて、マシン及びマシン故障をいくつかのタイプに分類する。システムは、システムモデル内の１つ以上の故障パラメータを変更することによって、複数の故障シナリオをシミュレートする。システムは、シミュレーションされた故障シナリオに基づいて、故障伝搬ルールのセットを判定する。

いくつかの実施形態では、システムは、トポロジ及びマシン故障情報に基づいて故障因果関係グラフを生成する。システムは、システムモデルに基づいて故障因果関係グラフをプルーニングする。システムは、マシンの故障とシステムレベルの性能劣化との間の因果関係を判定する。システムは、因果関係に基づいて、プルーニングした故障因果関係グラフに因果関係リンクを追加して、組み合わせた因果関係グラフを取得する。

いくつかの実施形態では、システムは、故障因果関係グラフを表示し、故障因果関係グラフ内のそれぞれのノードは、それぞれの出力に関して、それぞれの出力を処理する第１のマシンと、第１のマシンに関連する第１のプロセスと、それぞれの出力の処理中に第１のマシン及び第１のプロセスに関連する問題を示す停止コードと、を示し、故障因果関係グラフ内のそれぞれのエッジは、それぞれの出力に関して、開始ノードから目的ノードへの論理的流れを示す。

いくつかの実施形態では、システムは、故障因果関係グラフから１つ以上のノードを除去することによって故障因果関係グラフのサイズを低減することによって、システムモデルに基づいて故障因果関係グラフをプルーニングし、システムは、プルーニングした故障因果関係グラフを表示する。

いくつかの実施形態では、プルーニングした故障因果関係グラフに因果関係リンクを追加することに応答して、システムは、組み合わせた故障因果関係グラフを表示し、これにより、ユーザが処理システムの効率的な故障診断を実行することを可能にする。

いくつかの実施形態では、それぞれの故障パラメータは、それぞれのマシンの２つの連続する機能停止間の平均時間を示す、故障間の中間時間であって、それぞれの機能停止が、第１の分布から生成されたランダム事象である、中間時間と、故障における第１の標準偏差であって、それぞれの機能停止を表す第１の分布の標準偏差を示す、第１の標準偏差と、マシンが停止状態から回復する平均時間を示す、回復するまでの中間時間であって、ランダム回復時間が、第２の分布から生成される、回復するまでの中間時間と、回復時間を表す第２の分布の標準偏差を示す、回復における第２の標準偏差と、のうちの１つ以上を含む。

いくつかの実施形態では、システムは、トポロジ内のノードをマシンモデルで置換して故障拡張モデルを取得することによって、１つ以上の故障パラメータを含むシステムモデルを構築し、それぞれのマシンは、ビジー、利用可能、及び停止を含む状態を有する有限状態マシンによって示される。

いくつかの実施形態では、システムは、トポロジに基づいて、それぞれの出力を処理するためのマシンに関与する第１の総時間、又はそれぞれの出力を処理するためのプロセス内の全てのマシンに関与する第２の総時間と、プロセス時間における標準偏差と、それぞれのマシンが処理できる出力を示すデータ構造と、のうちの１つ以上を含む、通常動作パラメータを判定する。

いくつかの実施形態では、処理システムは、製造システムであって、ネットワークトポロジが、プロセスの一部としての、マシン間の材料の流れを更に示す、製造システムと、クラウド又はクラスタコンピューティングシステムであって、ネットワークトポロジが、クラウド又はクラスタコンピューティングシステムのプロセスの一部としての、マシン間の出力に関連する分散又は並列計算若しくはシミュレーションの流れを更に示す、クラウド又はクラスタコンピューティングシステムと、サプライチェーンシステムであって、ネットワークトポロジが、サプライチェーンチェーンシステムのプロセスの一部としての、マシン間の配送及び分配出力に関連する材料の流れを更に示す、サプライチェーンシステムと、のうちの１つ以上を含む。

図１Ａは、本出願の一実施形態による、製造システムにおける故障の原因を判定するための例示的なアーキテクチャを示す。

図１Ｂは、本出願の一実施形態による、製造システムにおける故障の原因を判定するための例示的なアーキテクチャを示す。

図１Ｃは、本出願の一実施形態による、製造システムにおける故障の原因を判定するための例示的なアーキテクチャを示す。

図２は、本出願の一実施形態による、故障の重大度及び頻度に基づくマシン故障の図を示す。

図３は、本出願の一実施形態による、故障までの時間及び回復までの時間を含む、故障特性に基づく例示的なタイプのマシンを示す図を示す。

図４は、本出願の一実施形態による、例示的な故障拡張システムモデルを示す。

図５Ａ－１は、本出願の一実施形態による、３つのプロセスのスループット及びサイクル時間の例示的な図を示す。図５Ａ－２は、本出願の一実施形態による、３つのプロセスのスループット及びサイクル時間の例示的な図を示す。

図５Ｂは、本出願の一実施形態による、ベースラインスループットの例示的な図を示す。

図５Ｃは、本出願の一実施形態による、第１のプロセスの故障の増加を考慮したスループットの例示的な図を示す。

図５Ｄは、本出願の一実施形態による、第２のプロセスの故障の増加を考慮したスループットの例示的な図を示す。

図５Ｅは、本出願の一実施形態による、第３のプロセスの故障の増加を考慮したスループットの例示的な図を示す。

図６は、本出願の一実施形態による、製造データセットに基づく例示的な故障伝搬ツリーを示す。

図７は、本出願の一実施形態による、製造システムにおける故障の原因を判定するための例示的な環境を示す。

図８Ａは、本出願の一実施形態による、製造システムにおける故障の原因を判定するための方法を示すフロー図を提示する。

図８Ｂは、本出願の一実施形態による、製造システムにおける故障の原因を判定するための方法を示すフロー図を提示する。

図９は、本出願の一実施形態による、製造システムにおける故障の原因の判定を容易にする例示的な分散コンピュータ及び通信システムを示す。

以下の説明は、当業者が実施形態を製造及び使用することを可能にするために提示され、特定の用途及びその要件に関連して提供される。開示される実施形態に対する様々な修正は、当業者には容易に明らかとなり、本明細書に定義される一般原理は、本開示の趣旨及び範囲から逸脱することなく、他の実施形態及び用途に適用され得る。したがって、本発明は、示される実施形態に限定されるものではなく、本明細書に開示される原理及び特徴と一致する最も広い範囲を与えられるものである。
概要

本明細書に記載される実施形態は、学習したモデルを使用してシステムモデルを構築し、故障診断及び根本原因分析（ＲＣＡ）に関する故障特性を用いるモデルを更に強化するシステムを提供する。

上記のように、現代の製造（例えば、サイバーフィジカル製造システム）では、ネットワークは動的であり得、マシンは生産の需要の変化に合わせてクラスタに構成されている。予定されていないマシン停止及び生産ラインの性能低下の故障検出及び根本原因分析（ＲＣＡ）は、多大な経済的価値であり得る。モデルに基づく異常検出／故障診断アプローチは、公称プロセスモデルの知識を必要とする場合があるが、モデルに基づく根本原因分析（ＲＣＡ）だけではなくて、故障間の因果関係を差し引きするために公称プロセスを超えてプロセスを外挿することが可能なシステムも必要とする場合がある。サイバーフィジカル製造システムの複雑さの状態は、システムモデルを手動で構築することを実行不可能にさせ得、故障モデリングの追加は、余分な複雑さをもたらし得る。

本明細書に記載される実施形態は、データからの学習されたモデルに基づいて製造システムモデルの構築を容易にするシステムを提供することと、根本原因分析のための故障特性を用いる製造システムモデルを強化することとによって、この制約に対処する。記載されるシステムは、パラメータ化された故障モデルを使用することによって物理的トポロジに基づくシステムモデルを構築することができ、また、生産ライントポロジの変化を検出し、それに応じてシステムモデルを再構成することができる。

マシン故障は、故障の頻度及び重大度の両方を説明するパラメータによって表すことができる。これらの故障パラメータは、製造ログ（例えば、ログデータ）から自動化された方法で学習することができる。したがって、構築されたモデルは、マシンレベルで故障をシミュレートすることができるだけでなく、プロセスライン内の単一のマシンが必ずしも欠陥症状を示さない場合があるプロセスレベルで故障を複製することもできる。

（例えば、製造ログデータにおいて見出されるデータ／統計を分析することによって）データ駆動アプローチを使用して製造プラントトポロジ及び故障伝搬情報を判定することは、米国特許出願第１７／０６１，２４８号に記載されている。記載される実施形態は、故障シナリオをシミュレートするために使用することができるシステムモデルを構築することによって、改良されたアプローチを提供することができる。具体的には、システムは、ＲＣＡに対するハイブリッドのデータ駆動及び故障拡張モデルに基づくアプローチを使用することができる。データ駆動アプローチを使用して、システムは、因果関係グラフを生成することができる。モデルに基づくアプローチを使用して、システムは、因果関係グラフをプルーニングし、故障シナリオシミュレーションによって生成される因果関係リンクを追加することができる。このハイブリッドアプローチを使用した製造システムにおける故障の原因を判定することを容易にする例示的なアーキテクチャを、図１Ａ、図１Ｂ、図１Ｃ、及び図７に関連して以下に説明する。

このハイブリッドアプローチは、計算要求と異常検出タスクを実行するために必要とされる詳細のレベルとの間のバランスを取ることをもたらし得る。更に、モデルを使用することは、モジュール式の、拡張可能な、及び再構成可能な方法で、スマート工場の複数の構成要素を堅牢に説明することを可能にすることができる、オブジェクト指向アプローチとして見られ得る。本明細書に記載される実施形態は、ダウンタイム中に必要とされる分析時間の量を減少させることができ、それにより、製造システムにおける個々の生産ライン及び生産ライン全体にわたって、より改善され効率的なシステムをもたらすことができるシステムを提供する。

したがって、記載される実施形態は、製造システムにおける故障の原因を分析及び判定するために、データ駆動アプローチ又はモデルに基づくアプローチのみを使用する課題に対処する故障診断のためのシステムを提供する。データ駆動アプローチ及びモデルに基づくアプローチの両方を含むハイブリッドアプローチを使用することによって、記載される実施形態は、（例えば、コストのかかる大量の標識データの必要性を排除することによって）これらのアプローチのうちの１つを排他的に使用することに関与する制約に対処することができる。

「開始ノード」及び「目的ノード」という用語は、開始ノードから目的ノードへの、方向付けられたエッジを介して示されるように、材料が流れる１対のノードを指す。例えば、同じロット番号を有する材料は、図１Ａ、図１Ｂ、図１Ｃ、及び図６に関連して以下に記載するように、第１のプロセスの一部（開始ノード）としての第１のマシンから、第２のプロセスの一部（目的ノード）としての第２のマシンへと流れ得る。

「製品バッチ情報」という用語は、製造システムにおけるプロセスの一部としてマシンによって処理された材料、製品、又は他の構成要素を示すか、又は識別することができるロット番号などの情報を指す。

「停止事象」とは、製造システムに一定期間停止させる、予定されていない事象を指す。「停止コード」は、製造システム内のマシン又はプロセスに関連する問題の識別子を指し、停止事象に関連し得る（ただし必ずしもそうではない）。

「マシンステータス情報」という用語は、所与のマシンの状態を指し、停止コード、故障タイプ、又は停止事象の他の指示体若しくは識別子を含むことができる。

「バッファ」という用語は、マシン／プロセス間のある期間にわたって材料が保持され得る物理的バッファ又は物理的容器を指す。この期間は、ヒト関連要因（例えば、人員の変化が発生し得るか、又は材料が１つのマシンから別のマシンへと手動で移動されなければならない場合）、又はシステム関連要因（例えば、所与のマシンの下流又はそれに続くマシンの性能及び使用）に依存し得る。

用語「マシン故障情報」は、トポロジ、例えば、製造ネットワークトポロジに関連するマシン故障の情報（故障までの時間及び回復までの時間に関する統計を含む）を指す。

用語「トポロジ」及び「ネットワークトポロジ」は、本開示において互換的に使用され、処理システム（例えば、製造システム）のマシン／プロセスが物理的及び論理的にどのように接続されるかについての説明を指す。

用語「因果関係グラフ」は、図１Ａに関連して以下に記載されるように、故障伝搬経路を指す。「プルーニングした因果関係グラフ」は、図１Ｂに関して以下に記載されるように、特定のリンク／ノードが因果関係グラフに物理的に含まれる必要がないという判定により、除去されたノードを有する因果関係グラフを指す。「組み合わせた」又は「最終的に組み合わせた」因果関係グラフは、図１Ｃに関連して以下に記載されるように、因果関係リンクがマシン障害とシステムレベルの性能劣化との間の関係を示す、判定された因果関係リンクが追加されているプルーニングした因果関係グラフを指す。

「処理システム」という用語は、出力をもたらすプロセスを実行するマシン又はエンティティを有するシステムを指し、それらの出力は、処理システムを通した、流れの開始から修了までのそれぞれの出力の流れの一部として、次のマシン又はエンティティへの入力として使用される。本開示では、製造システム、製造ログデータ、及び製造ネットワークトポロジが例示の目的で描写されている。記載されるシステムは、クラウド／クラスタコンピューティングシステム又は施設内の分散並列計算／シミュレーション、及び配送／分配サプライチェーンを含むが、これらに限定されない、他の処理システムを含むことができる。

用語「出力」は、マシン、例えば、オブジェクト、マシン部品、材料、ユニット、又は構成要素によって処理され得る論理的若しくは物理的ユニット又は製品を指す。「出力」はまた、材料又は出力に対してプロセスを実行するマシン又はエンティティによって導出される材料出力又は他の結果を指し得る。出力は、物理的材料、又は計算若しくはシミュレーションの結果を含み得る。
製造システムにおける故障の原因を判定するための例示的な環境

図１Ａ、図１Ｂ、及び図１Ｃは、本出願の一実施形態による、製造システムにおける故障の原因を判定するための例示的なアーキテクチャ１００を示す。アーキテクチャ１００は、データ駆動アプローチ及びモデルに基づくアプローチの両方を使用するハイブリッドアプローチを描写する。アーキテクチャ１００は、工場データ１０１と、因果関係グラフ１１０と、プルーニングした因果関係グラフ１２０と、組み合わせた因果関係グラフ１３０と、ネットワークトポロジ１４０と、構築したシステムモデル１６０と、故障伝搬ツリー１８０と、を含むことができる。（因果関係グラフ１１０、プルーニングした因果関係グラフ１２０、及び組み合わせた因果関係グラフ１３０を有する）アーキテクチャ１００の上半分又は分岐部は、データ駆動アプローチのパイプラインを表し、一方、（ネットワークトポロジ１４０、構築したシステムモデル１６０、及び故障伝搬ツリー１８０を有する）アーキテクチャ１００の下半分又は分岐部は、モデルに基づくアプローチのパイプラインを表す。本明細書に記載されるように、２つの分岐部は緊密に接続され得る。

－－ネットワークトポロジ、因果関係グラフ、及びシステムモデル

動作中、図１Ａに示すように、システムは、工場データ１０１、例えば、製造ログデータ、又はマシン及び関連するプロセスを含む製造システムに関連するデータを記憶することができる。工場データ１０１は、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含むことができる。システムは、工場データ１０１に基づいて、例えば、製造ログデータ又は工場データ１０１からトポロジ情報を抽出することによって（操作１０３を介して、及び米国特許出願第１７／０６１，２４８号に記載されているように）、ネットワークトポロジ１４０を判定することができる。ネットワークトポロジ１４０は、製造システムに対応することができ、製造システムのプロセスの一部としてマシン間のオブジェクト（例えば、生産ライン又は製造システム内の材料、製品、又はユニット）の流れを示すことができる。ネットワークトポロジ１４０は、各プロセスが複数の関連するマシンを有するプロセス１４２及び１５２を示すことができる。プロセス１４２は、マシンＭ１－１１４３、Ｍ１－２１４４、及びＭ１－ｘ１４５を含むことができ、一方で、プロセス１５２は、マシンＭ２－１１５３、Ｍ２－２１５４、及びＭ２－ｙ１５５を含むことができる。

ネットワークトポロジ１４０はまた、１つのマシンによって処理された後、かつ次のマシンによって処理される前に、特定の期間にわたって材料を配置することができる物理的バッファ（物理的ビンなど）を含むことができる。例えば、材料は、プロセス１４２のマシンＭ１－１１４３によって処理されることから、一定期間バッファ１４８に流れ、プロセス１５２のマシンＭ２－２１５４によって処理されることまで流れ得る。

工場データ１０１を使用して、システムは、（動作１０２を介して）故障伝搬経路を含むことができる因果関係グラフ１１０を生成することもできる。因果関係グラフ１１０は、それぞれのオブジェクト又は材料に関して、それぞれのオブジェクトを処理するマシン、マシンに関連するプロセス、及びマシン／プロセスによってオブジェクトを処理することに関連する停止コードを示すノードを含むことができる。因果関係グラフ１１０は、例示の目的のために、対応するマシン／プロセス情報を伴わずに、停止コードのみを描写している。例えば、ノード１１１は、停止コード（「ＳＣ」）１に対応することができ、ノード１１２は、ＳＣ２に対応することができ、ノード１１３は、ＳＣ３に対応することができ、ノード１１４は、ＳＣ４に対応することができ、ノード１１５は、ＳＣ５に対応することができ、ノード１１６は、ＳＣｍに対応することができる。因果関係グラフ１１０内のノード間のエッジは、開始ノードから目的ノードへのオブジェクトの論理的流れを示す。故障伝搬経路は、米国特許出願第１７／０６１，２４８号に記載されている。システムは、ネットワークトポロジ１４０に関連したマシン故障の情報を判定することができ、それぞれのマシン故障の頻度及び重大度を示す故障パラメータを生成することができる。因果関係グラフ１１０の構築は、ベイジアンネットワーク及びグレンジャーの因果関係検定などのマシン学習又は統計分析技術を使用することに基づくことができる。

図１に示すように、システムは、ネットワークトポロジ１４０及びマシン故障情報に基づいて（例えば、動作１０５を介して）構築したシステムモデル１６０を生成することができる。システムモデル１６０は、故障拡張システムモデルを表すことができる。製造ログデータ（例えば、工場データ１０１）は、マシンのステータス（すなわち、マシンステータス情報）に関するリッチな情報を含むことができることを思い起こす。工場データ１０１は、マシンが停止し、停止から再開することに関連するタイムスタンプ情報を含むことができる。システムは、故障の持続時間及び故障から回復するまでにかかる時間（例えば、「回復するまでの時間」）を抽出することができる。システムは、それぞれの故障の頻度及び重大度を説明又は示すいくつかの統計的特性（すなわち、「故障パラメータ」）に基づいて故障又は障害をモデル化することができる。

これらのパラメータとしては、それぞれのマシンの２つの連続する機能停止の間の平均時間を示す、障害間の（又は障害までの）中間時間（ＭＴＴＦ）であって、それぞれの機能停止が、第１の分布から生成されたランダム事象である、中間時間と、故障における第１の標準偏差であって、それぞれの機能停止を表す第１の分布の標準偏差を示す、第１の標準偏差と、マシンが停止状態から回復するための平均時間を示す、回復するまでの中間時間（ＭＴＴＲ）であって、ランダム回復時間が、第２の分布から生成される、回復するまでの中間時間と、回復時間を表す第２の分布の標準偏差を示す、回復における第２の標準偏差と、が挙げられる。第１及び第２の分布は、例えば、ガウス分布又は別の分布であり得る。
－－マシンシナリオに基づく例示的な故障拡張

図２は、本出願の一実施形態による、故障の重大度及び頻度に基づくマシン故障の図２００を示す。図２００では、ｘ軸は、例えば、左側の稀な障害２０２から始まり右側の頻繁な障害２０４までの、障害の頻度に対応することができる。Ｙ軸は、例えば、底部の容易な修復２０６から始まり頂部の難しい修復２０８までの、故障の重大度に対応することができる。

システムは、それぞれのマシン故障の頻度及び重大度に基づいて、マシン及びマシン故障をいくつかのタイプに分類することができる。例えば、図２００には、４つの明白なタイプが示されており、各象限に１つが示されている。「タイプ１」２１２は故障しやすく（頻繁な障害であり）、修復が困難であり得る（修復が難しい）。「タイプ２」２１０は故障しにくい（稀な障害である）が、修復が困難であり得る（修復が難しい）。「タイプ３」２１４は故障しにくく（稀な障害である）、修復が容易である。「タイプ４」２１６は故障しやすい（頻繁な障害である）が、修復が容易である。したがって、タイプ３２１４の故障からタイプ１２１２の故障まで移動する斜めの矢印は、頻度及び重大度に関して測定された「良」から「不良」故障への移動を示す。図２００は、マシン故障のタイプに関して４つのカテゴリのみを説明しているが、任意の数のカテゴリが使用されてもよい。

図３は、本出願の一実施形態による、障害までの時間及び回復までの時間を含む、故障特性に基づく例示的なタイプのマシンを示す図３００を示す。図３００は、以下の４つのマシンに関して障害までの時間（ＴＴＦ）３２０（対数スケール）及び回復までの時間（ＴＴＲ）３３０（対数スケール）を示すグラフを含むことができる。すなわち、マシン６３１０、マシン１９３１２、マシン２４３１６、及びマシン８９３１８。マシン２４３１６のＴＴＦグラフでは、ＴＴＦは高く、これは、このマシンの障害がより低頻度であること（３２２）を意味する。対照的に、マシン８９３１８のＴＴＦグラフでは、ＴＴＦは低く、これは、マシンが故障しやすいこと（３２４）、又はより高い頻度の障害を経験することを意味する。

マシン２４３１６のＴＴＲグラフでは、ＴＴＲの尾部は高く、これは、極端なケースを示しているため、これは、回復するまで複数時間／複数日を要した（３３２）。マシン８９３１８のＴＴＲグラフでは、ＴＴＲも高く、これは、マシンが修復するのがより難しいこと（３３４）を示す。
－－構築したシステムモデル（故障拡張システムモデル）

図１Ｂに戻ると、システムモデル１６０を生成する際、システムは、ネットワークトポロジ１４０のノードを、故障拡張マシンモデル（すなわち、システムモデル１６０）で置換することができる。このモデルは、例えば、Ｍｏｄｅｌｉｃａを使用して実装することができ、マシン間の接続を示すことができ、スループット分析を使用することによってプロセスボトルネックを識別することができる。したがって、この強化又は拡張モデルは、生産ラインレベル性能（例えば、システムレベルの性能劣化）に対する単一のマシン（例えば、所与のマシンの故障又は障害）の影響を考慮することができる。

システムモデル１６０は、プラントトポロジの一部に対応することができ、複数のマシン又はマシンモデル、２つのバッファ、及び特定のプロセスの一部としてマシンを通って流れる材料を有する、３つのプロセスを含むことができる。システムモデル１６０は、（例えば、それぞれ、ネットワークトポロジ１４０のマシンＭ１－１１４３及びマシンＭ１－２１４４に対応する）関連するマシン又はノード１６３及び１６６を有するプロセス＿１１６１と、（例えば、それぞれ、ネットワークトポロジ１４０のマシンＭ２－１１５３及びマシンＭ２－２１５４に対応する）関連するマシン又はノード１７４及び１７５を有するプロセス＿２１７３と、関連するマシン又はノード１７８及び１７９を有するプロセス＿３１７７と、を含むことができる。

各ノードは、マシンモデルを含むことができる。例えば、ノード１６３は、マシンモデル１６４及び１６５を含むことができ、ノード１６６は、マシンモデル１６７及び１６８を含むことができる。システムモデル１６０はまた、３つの別個の保持ビン又は物理バッファ（例えば、１７０、１７１、及び１７２）を有するバッファ＿１１６９と、３つの別個の保持ビン又は物理バッファを有するバッファ＿２１７６と、を含むことができる。入ってくる材料（１６２）は、（リンク１２１を介して）プロセス＿１１６１に流入することができ、ノード１６３又は１６６に描写されるマシンによって処理することができる。その後、材料は、（リンク１２２を介して）バッファ＿１１６９に流れることができる。このバッファ内で待機するのに費やされた一定期間の後、材料は、（リンク１２３を介して）プロセス＿２１７３に流入することができ、ノード１７４及び１７５に描写されるマシンによって処理することができる。その後、材料は、（リンク１２４を介して）バッファ＿２１７６に流れることができる。このバッファ内で待機するのに費やされた一定期間の後、材料は、（リンク１２５を介して）プロセス＿３１７７に流入することができ、ノード１７８及び１７９に描写されるマシンによって処理することができる。続いて、材料は、例えば、論理的に別のプロセス及び関連するマシンに、又は物理的に生産ラインの終端まで、（リンク１２６を介して）プロセス＿３１７７から流出することができる。

したがって、構築したシステムモデル１６０は、製造システムにおいてマシンがどのように接続されているか、及び各プロセスが同様の機能を実行する複数のマシンを有し得ることを描写する。更に、システムモデル１６０は、プロセスの一部であるマシンの各クラスタ間のバッファを描写する。システムは、マシン間の遅延に基づいてバッファサイズを推定することができる。システムモデル１６０は、各マシンがビジー、利用可能、及び停止を含む状態を有する有限状態マシンとして表され得るため、マシンの動作状態をモデル化することができる。

図４は、本出願の一実施形態による、例示的な故障拡張システムモデル４００を示す。モデル４００は、製造システムの動作に基づいて発生し得る、かつ図１Ｂの構築したシステムモデル１６０に関連するような、通常マシン動作４２０及びマシン障害動作４６０を描写する。通常マシン動作４２０の間、生成４２２モジュールは、ジョブ、例えば、所与のマシンのための入力材料又は部分の開始を表すことができる。データ構造４４０は、所与のマシンによって処理される入力部分を監視することができる。分岐４２４モジュールは、異なるマシンからの流れを示すことができる。待ち行列４２６は、所与のマシンのための内部バッファゾーン、例えば、入力材料又は部分が所与のマシンによって処理され得るまで待機する場所を表すことができる。データ構造４４２は、内部マシンバッファに記憶されたジョブを追跡することができ、各待ち行列処理されたジョブに関連する情報を含むことができる。

占有４２８モジュールは、所与のマシンが、処理のために待機部分を掴むために自由であるか又は利用可能であることを示すことができる。遅延４３０モジュールは、その部分を処理する（例えば、その部分を切断又は溶接する）ための所与のマシンに関与する時間を示すことができる。遅延４３０に基づいて、システムは、その部分又は材料の所与のマシンに関連する処理時間及び標準偏差４０６を判定することができる。解放４３２モジュールは、所与のマシンがその部分を解放し、その部分の処理が完了したことを示すことができる。リソーステーブル４４４は、所与のマシンが、ある部分（例えば、占有４２８動作のための「Ｓ」）を処理するために現在使用されていることを示すことができ、リソーステーブル４４４はまた、所与のマシンが、その部分（例えば、解放４３２動作のための「Ｒ」）を処理するために使用されて終了していることを示すことができる。

計数４３４は、所与のマシンによって処理された部分の数の総数を監視することができる。配置４３６モジュールは、次のマシン、例えば、所与の部分のための又はその部分の対応する生産ラインの一部としての流れの下流マシン／プロセス内の、「生成」モジュールに接続することができる。データ構造４４６は、特定部分に対して所与のマシンによって完了されたジョブの数（例えば、記憶、維持、及び追跡の数４３４）を追跡することができる。

マシン障害動作４６０の間、生成４６２モジュールは、障害の生成を表すことができる。生成４６２に基づいて、データ構造４８０は、所与のマシンによって経験される障害及び故障を追跡することができる。生成４６２及びデータ構造４８０に基づいて、システムは、所与のマシンに関連する障害までの時間（ＴＴＦ）及び標準偏差４０２と、所与のマシンが経験する故障と、を判定することができる。

待ち行列４６４は、所与のマシンに関連する故障を記憶することができる所与のマシンのための内部バッファゾーンを表すことができる。データ構造４８２は、故障を追跡することができ、各待ち行列故障に関連する情報を含むことができる。占有４６６モジュールは、故障が、例えば、通常マシン動作４２０の占有４２８におけるような部分によっては占有されないが、代わりに、所与のマシンの障害又は故障によって「仮想」部分として占有される、所与のマシンのリソースを取得又は「占領」したことを示すことができる。遅延４６８モジュールは、障害又は故障中に所与のマシンが占領さられるのにかかる時間を示すことができる。遅延４６８に基づいて、システムは、所与のマシンに関連する回復するまでの時間（ＴＴＲ）及び標準偏差４０４、及び所与のマシンが経験する故障を判定することができる。

解放４７０モジュールは、所与のマシンが仮想部分を解放し、障害によって占領されていること、例えば、マシンが故障又は障害から回復したことを示すことができる。配置４７２モジュールは、所与のマシンが通常マシン動作に戻ったことを示すことができる。

通常マシン動作４２０に関するリソーステーブル４４４の説明と同様に、システムは、リソーステーブル４４４において、所与のマシンが、現在、仮想部分を処理するために使用されていること、又は現在、障害若しくは故障（占有４６６動作についての「Ｓ」）に起因して利用不可能であること、及び所与のマシンが、仮想部分を処理するために使用されて終了していること、障害又は故障から回復していること、又は再び利用可能（例えば、解放４７０動作についての「Ｒ」）であることを示すことができる。

したがって、通常マシン動作４２０及びマシン障害動作４６０を示すシステムモデル４００は、単一のマシンがシステムの全体的な処理にどのように影響し得るかを描写する。システムモデル４００は、システムのユーザが、構築したシステムモデル１６０、及び製造システムのマシン間の動的に判定された接続を使用して、製造システムにおける故障の原因を判定することを可能にする。更に、（構築したシステムモデル１６０に基づく）システムモデル４００は、ユーザが、マシンの新しい構成がシステムの全体的な処理にどのように影響するかをシミュレートすることを可能にする。ユーザが、構築したシステムモデル１６０によって示されるものとは異なる群のマシン／プロセスを使用して新しいオブジェクト又は材料を処理しようとする場合、ユーザは、所望の新しい構成で各マシンのモデルを収集し、シミュレーションを実行して、（図７に関して以下に説明するように）所望の新しい構成の性能を判定することができる。このハイブリッドアプローチを提供することにより、記載された実施形態は、履歴データが容易に利用可能でない可能性がある場合に、所望の新しい構成に対するデータ駆動のみのアプローチを使用するという問題に対処することができる。
－－プルーニングした因果関係グラフ

図１Ｂに戻ると、純粋なデータ駆動アプローチから生成される因果関係グラフ１１０は、特にマシンと停止コードとの多数の組み合わせを有する製造システムにおいて高密度であり得る。構築したシステムモデル１６０は、（動作１０４及び１０６を介して）より効率的かつ使用可能なプルーニングした因果関係グラフ１２０を取得するために、因果関係グラフ１１０のプルーニングのガイダンスを提供することができる。システムは、製造システムの物理的トポロジに基づいて、又はシステムモデルを使用して製造システム内の重要なマシンの状態を識別及び分析する感度試験に基づいて、因果関係グラフ１１０をプルーニングすることができる。システムは、構築したシステムモデルに基づいて物理的な意味を持たない因果関係リンクをプルーニングすることができる。

例えば、システムモデル１６０は、因果関係グラフ１１０のノード１１３によって示されるマシン及び停止コードが（動作１０６を介して）より効率的な因果関係グラフを取得するために除去されるべきであると判定することができ、その結果、プルーニングした因果関係グラフ１２０が得られる。
－－シミュレーションから生成した故障伝播ルール

図２及び図３に関連して上で説明されるように、システムは、それぞれの故障の頻度及び重大度に関する故障パラメータに基づいて、マシン及び故障をいくつかのタイプ（例えば、４つのタイプ）に分類することができる。システムはまた、システムモデル内の１つ以上の故障パラメータを変更し、シミュレーションされた障害シナリオに基づいて故障伝搬ルールのセットを判定することによって、複数の障害シナリオをシミュレートすることができる。

図５Ａは、本出願の一実施形態による、３つのプロセスのスループット及びサイクル時間の例示的な図を示す。図５１０及び５１４は、プロセス１に関する情報を含む。図５１０は、１時間当たり約７，０００単位のピークスループット５１２を含む、プロセス１の１時間当たりのスループットを示すことができる。図５１４は、プロセス１の１時間当たりのサイクル時間を示すことができる。図５２０及び５２４は、プロセス２に関する情報を含む。図５２０は、１時間当たり約２，２００単位のピークスループット５２２を含む、プロセス２の１時間当たりのスループットを示すことができる。図５２４は、プロセス２の１時間当たりのサイクル時間を示すことができる。図５３０及び５３４は、プロセス３に関する情報を含む。図５３０は、１時間当たり約４，０００単位のピークスループット５３２を含む、プロセス３の１時間当たりのスループットを示すことができる。図５３４は、プロセス３の１時間当たりのサイクル時間を示すことができる。

したがって、図５Ａの図は、プロセス２におけるマシンが、プロセス２のスループットが大幅に低いため、生産ライン及び製造システムの全体的な効率においてボトルネックを生成し得ることを示す。すなわち、プロセス２（１時間当たり約２，２００単位）について１時間当たりの部分で測定されたスループットは、プロセス１及び３の測定されたスループット（それぞれ、１時間当たり約７，０００単位及び約４，０００単位）よりも著しく低い。これは、プロセス２に関与するマシンの障害が、システム全体に大きな影響をもたらし得ることを示し得る。すなわち、識別された「ボトルネック」マシンの状態におけるわずかな変化は、生産ラインの性能の大きな変化をもたらし得る。図５Ｂ～図５Ｅの図は、プロセス１又は３のマシンにおいて同様の障害が発生した場合、全体的な性能への影響がより少ないことを示す。

図５Ｂは、本出願の一実施形態による、ベースラインスループットの例示的な図５４０を示す。ラインサイクル時間全体にわたるシミュレーションにおいて、図５４０は、ベースラインスループットが０．８２であることを示す。

３つの例示的なプロセスの各々における障害の増加は、異なるスループットをもたらし得、プロセス２における障害の増加により、スループットに最大の影響をもたらす。

図５Ｃは、本出願の一実施形態による、第１のプロセス（プロセス１）の障害の増加を考慮したスループットの例示的な図５５０を示す。図５５０は、プロセス１の障害の増加が０．６７のスループットをもたらし得ることを示す。

図５Ｄは、本出願の一実施形態による、第２のプロセス（プロセス２）の障害の増加を考慮したスループットの例示的な図５６０を示す。図５６０は、プロセス２の障害の増加が０．６３のスループットをもたらし得ることを示す。

図５Ｅは、本出願の一実施形態による、第３のプロセス（プロセス３）の障害の増加を考慮したスループットの例示的な図５７０を示す。図５７０は、プロセス３の障害の増加が０．７３のスループットをもたらし得ることを示す。

したがって、図５Ｂ～図５Ｄは、「ボトルネック」プロセス２が０．６３のスループットをもたらし得、一方、プロセス１及び３における障害の増加が、それぞれ、０．６７及び０．７３のスループットをもたらし得ることを示す。システムモデルは、シミュレーションから、とりわけ、この故障伝搬ルールを生成することができる。したがって、システムは、マシンの障害とシステムレベルの性能劣化との間の因果関係を判定することができる。

図６は、本出願の一実施形態による、製造データセットに基づく例示的な故障伝搬ツリー６００を示す。故障伝搬ツリー６００は、例えば、マシンステータス情報、製品バッチ情報、停止コード、故障パラメータ、及びマシン、プロセス、又はシステムレベルにおける特徴／特性を示すノードを有する、マシンレベル６１０、プロセスレベル６３０、及びシステムレベル６４０における情報を含むことができる。システムは、２つのマシン（例えば、ＭＡ２４Ｎｕｍ＿Ｐｒｏｄｕｃｔｓ６１２及びＭＡ２５Ｎｕｍ＿Ｐｒｏｄｕｃｔｓ６１４）の製品数がボトルネック６３２をもたらすと判定することができる。システムはまた、特定の停止コード（例えば、ＭＡ２４停止コード１６１６及びＭＡ２４停止コード２６１８）によって示されるマシン／プロセスにおける故障が、ある重大度６２０をもたらし得ることを判定することができる。システムは、ボトルネック６３２及び重大度６２０に因果関係リンクを生成することができ、ラインスループット６４２で見られるように、システムレベルの性能劣化に対する因果関係リンクを更に生成することができる。

－組み合わせた因果関係グラフ

図１Ｃに戻ると、システムは、マシンの障害とシステムレベルの性能劣化との間の因果関係を判定することができる。図６に関連して上で説明される例示的な故障伝搬ツリーに加えて、システムは、（動作１０８を介して）図１Ｃの故障伝搬ツリー１８０を生成することができる。故障伝搬ツリー１８０は、「Ｍ１過剰摩耗」を示すノード１８１を含むことができる。ノード１８１の故障は、ノード１８２（「バッファ空」）と、「ＳＣｊ」の停止コードを示すノード１８４とをもたらすことができる。ノード１８２によって示される空のバッファは、次のマシンが（「Ｍ２待機」のノード１８３によって示される）待機の故障状態に置かれることをもたらし得る。更に、ノード１８４のＳＣｊは、ノード１８５の「ＳＣｋ」の停止コードをもたらすことができる。

続いて、システムは、故障伝播ツリー１８０の因果関係リンクをプルーニングした因果関係グラフ１２０に追加して、（動作１０７及び１０９を介して）組み合わせた因果関係グラフ１３０を取得することができる。組み合わせた因果関係グラフ１３０は、プルーニングした因果関係グラフ１２０に対して以下の新しいリンク及びノード、すなわち、ノード１１１（ＳＣ１）からノード１１４（ＳＣ４）へのリンク／エッジ１３３、ノード１１４（ＳＣ４）からノード１１５（ＳＣ５）へのリンク／エッジ１３４、ノード１１１から新しいノード１３１（ＳＣｊ）への新しいノード１３２（ＳＣｋ）までの新しい故障伝搬経路を含むことができる。新しいノード１３１及び１３２は、それぞれ、故障伝搬ツリー１８０のノード１８４及び１８５に対応することができる。

したがって、組み合わせた因果関係グラフ１３０は、アーキテクチャ１００の上半分のデータ駆動アプローチ（因果関係グラフ１１０、プルーニングした因果関係グラフ１２０、及び組み合わせた因果関係グラフ１３０を含む）と、アーキテクチャ１００の下半分のモデルに基づくアプローチ（ネットワークトポロジ１４０、構築したシステムモデル１６０、及び故障伝搬ツリー１８０を含む）と、の両方を含むハイブリッドアプローチが、どのようにして、製造システムにおける故障の原因を判定するための改善されたシステムをもたらすことができるかを実証する。改善は、故障を直すために必要とされる分析時間の低減を含むことができ、その結果、単一のマシンの全体的なダウンタイムが低減され、生産ライン及び製造システム全体の性能が増加する。
製造システムにおける故障の原因を判定するための例示的な環境

図７は、本出願の一実施形態による、製造システムにおける故障の原因を判定するための例示的な環境７００を示す。環境７００は、デバイス７０２、関連するユーザ７１２、及び関連するディスプレイ７１４と、製造システム７０５と、デバイス７０６及び関連する記憶デバイス７０７と、デバイス７０８と、を含むことができる。デバイス７０２、７０６、及び７０８は、ネットワーク７１０を介して互いに通信することができる。製造システム７０５は、製造施設又は製造ネットワークを表すことができ、材料又はオブジェクト７０３（例えば、７０３．１～７０３．ｎ）及びマシン７０４（例えば、７０４．１～７０４．ｍ）を含むことができる。オブジェクト７０３は、例えば、特定のプロセスの一部として、及び本明細書に描写されるように、マシン７０４によって様々な処理を受けることができる。この処理は、（通信７１６を介して）デバイス７０６及び記憶デバイス７０７によって記憶され得るログデータを生成することができる。デバイス７０２、７０６、及び７０８は、サーバ、コンピューティングデバイス、又は本明細書に記載される機能を実行することができるいずれかのデバイスであり得る。

動作中、ユーザ７１２は、ディスプレイ７１４及びデバイス７０２を介して、製造システム７０５のためのネットワークトポロジ及び因果関係グラフを判定することができる。デバイス７０２は、トポロジ及び因果関係グラフ生成コマンド７２２をデバイス７０８に送信することができる。デバイス７０８は、トポロジ生成コマンド７２２を（コマンド７３０として）受信することができる。その後の、以前の、又は同様の時間において、デバイス７０６は、（ログデータ取得７２４要求をもたらす要求に基づいて）ログデータ７２６をデバイス７０８に送信することができる。デバイス７０８は、ログデータ７２６を（ログデータ７２８として）受信することができ、受信したログデータをシーケンスデータに変換することができる（図示せず）。

トポロジ及び因果関係グラフを生成するコマンド７３０に応答して、デバイス７０８は、ネットワークトポロジを生成し（動作７３２）、因果関係グラフを生成することができる（動作７３４）。デバイス７０８は、トポロジ７３６及び因果関係グラフ７３８をデバイス７０２に戻すことができる。トポロジ７３６（トポロジ７４０として）及び因果関係グラフ７３８（因果関係グラフ７４２として）を受信すると、デバイス７０２は、ディスプレイ７１４上に、製造ネットワークトポロジ７４４及び因果関係グラフ７４６を表示することができる。ユーザ７１２は、ネットワークトポロジ７４４及び因果関係グラフ７４６（図示せず）を操作するために、米国特許出願第１７／０６１，２４８号に記載されているように、対話型グラフィカルユーザインターフェース（ＧＵＩ）要素を使用することができる。

ユーザ７１２はまた、ネットワークトポロジ及び因果関係グラフに基づいて、ディスプレイ７１４及びデバイス７０２を介して、製造システム７０５のためのシステムモデルを判定することができる。デバイス７０２は、システムモデル生成コマンド７５０をデバイス７０８に送信することができる。デバイス７０８は、システムモデル生成コマンド７５０を（コマンド７５２として）受信することができる。デバイス７０８は、システムモデルを構築することができ（動作７５４）、システムモデル７５６をデバイス７０２に戻すことができる。システムモデル７５６を（システムモデル７５８として）受信すると、デバイス７０２は、システムモデル７６０をディスプレイ７１４上に表示することができる。

ユーザ７１２は、ディスプレイ７１４及びデバイス７０２を介して、システムモデルに基づいて、製造システム７０５に関する組み合わせた因果関係グラフを更に判定することができる。デバイス７０２は、組み合わせた因果関係グラフ生成コマンド７６２をデバイス７０８に送信することができる。デバイス７０８は、（コマンド７６４として）組み合わせた因果関係グラフ生成コマンド７６２を受信することができる。デバイス７０８は、因果関係グラフをプルーニングし（動作７６６）、システムモデルに基づいて故障伝播ツリーを生成することができる（動作７６８）。デバイス７０８はまた、組み合わせた因果関係グラフを生成することができる（動作７７０）。デバイス７０８は、プルーニングした因果関係グラフ７７２を戻すことができ、これは、プルーニングした因果関係グラフ７７４としてデバイス７０２によって受信され、プルーニングした因果関係グラフ７７６としてディスプレイ７１４上に表示される。デバイス７０８はまた、故障伝搬ツリー７７８を戻すことができ、これは、故障伝搬ツリー７８０としてデバイス７０２によって受信され、故障伝搬ツリー７８２としてディスプレイ７１４上に表示される。デバイス７０８はまた、組み合わせた因果関係グラフ７８４を戻すこともでき、これは、組み合わせた因果関係グラフ７８６としてデバイス７０２によって受信され、組み合わせた因果関係グラフ７８８としてディスプレイ７１４上に表示される。

ディスプレイ７１４は、ユーザ７１２が表示されたデータのいずれかを操作することを可能にする対話型ＧＵＩ要素を含むことができる。ＧＵＩ要素は、表示されたデータの各タイプ、例えば、７４４、７４６、７６０、７７６、７８２、及び７８８上に、又はその近くに位置することができる。いくつかの実施形態では、ユーザは、任意の診断又は指示された故障に対処することができ、例えば、シミュレーションを実行して追加情報を取得することによって、システムモデルを再構築することによって、又は最終的な組み合わせた因果関係グラフを再生成することによって、表示されたデータのいずれかを再生成するコマンドを生成することができる。システムは、元の組み合わせた因果関係グラフ上に新たに生成した組み合わせた因果関係グラフのオーバーレイを表示することができ、ユーザが差異に関する詳細な情報を閲覧することを可能にする他のＧＵＩ要素を表示することができる。
製造システムにおける故障の原因を判定する方法

図８Ａは、本出願の一実施形態による、製造システムにおける故障の原因を判定する方法を示すフロー図８００を提示する。動作中、システムは、マシン及び関連するプロセスを含む、製造システムに関連するデータを記憶し、このデータは、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む（動作８０２）。システムは、データに基づいて、製造システムのトポロジを判定し、このトポロジは、プロセスの一部としてのマシン間のオブジェクトの流れを示す（動作８０４）。システムは、トポロジに関連するマシン故障の情報を判定する（動作８０６）。システムは、マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す１つ以上の故障パラメータを生成する（動作８０８）。システムは、トポロジ及びマシン故障情報に基づいて、１つ以上の故障パラメータを含むシステムモデルを構築し、それによって製造システムの診断を容易にする（動作８１０）。システムは、トポロジ内のノードをマシンモデルで置換することによってシステムモデルを構築し、故障拡張モデルを取得することができ、それぞれのマシンは、ビジー、利用可能、及び停止を含む状態を有する有限状態マシンによって示される。この動作は、図８ＢのラベルＡに継続する。

図８Ｂは、本出願の一実施形態による、製造システムにおける故障の原因を判定する方法を示すフロー図８２０を提示する。動作中、システムは、トポロジ及びマシン故障情報に基づいて故障因果関係グラフを生成する（動作８２２）。システムは、システムモデルに基づいて故障因果関係グラフをプルーニングする（動作８２４）。システムは、マシンの障害とシステムレベルの性能劣化との間の因果関係を判定する（動作８２６）。システムは、因果関係に基づいて、因果関係リンクをプルーニングした故障因果関係グラフに追加して、組み合わせた因果関係グラフを取得する（動作８２８）。システムは、故障因果関係グラフ、プルーニングした故障因果関係グラフ、又は組み合わせた故障因果関係グラフを表示し、これにより、ユーザが、（例えば、ユーザに関連するコンピューティングデバイスのディスプレイ上の対話型ＧＵＩ要素を介して）製造システムの効率的な故障診断を実行すること（動作８３０）を可能にする。
出願の概要、実用的な用途への組み込み、技術分野に対する改善

要約すると、本明細書に記載される実施形態は、製造システムにおける故障の原因を判定するために、データ駆動アプローチ及びモデルに基づくアプローチを含むハイブリッドアプローチを利用するシステムを提供する。システムは、集中的なコンピューティングリソース（例えば、追加の感知システムの設置）を必要とすることなく、又はシステム全体の代わりに単一の構成要素／マシンに焦点を合わせることなく、ネットワークトポロジ（製造又は生産ラインネットワークトポロジなど）及び因果関係グラフを効率的に構築することができるため、実用的な用途に組み込むことができる。システムは、ネットワークトポロジ及び因果関係グラフを生成して表示することができる。

更に、システムは、ネットワークトポロジから故障拡張システムモデルを構築することができ、故障拡張システムモデルに基づいて因果関係グラフをプルーニングし、ネットワークトポロジに基づいてマシン故障情報を判定し、それぞれの故障の頻度及び重大度を示す故障パラメータに基づいて故障伝搬ツリーを生成することができる。システムは、故障拡張システムモデル及び故障伝搬ツリーを使用して、プルーニングした因果関係グラフを修正して、最終的な組み合わせた因果関係グラフを取得することができる。最終的な組み合わせた因果関係グラフは、視覚表示の一部としてユーザに提示され得、これにより、ユーザは、製造システム全体の状態をより迅速かつ効率的に解釈して評価することができ、例えば、表示されたスクリーン及び対話型グラフィカルユーザ要素を介して、故障診断及び根本原因分析を可能にする。したがって、システムは、大量の反復ログデータを迅速で、効率的、及び効果的なオンサイト診断のために、簡素な視覚化に変換することができる。

本明細書に記載されるグラフ生成／ディスプレイは、製造システムの又は製造施設内の構成要素、マシン、プロセス、又は他の機器の全体的なダウンタイムに関与する分析時間の低減をもたらすことができる。これらの改善は、製造システムにおけるマシンの動作、生産ラインの性能、及び製造システム全体の改善をもたらすことができる。説明される実施形態はまた、製造システム分析、生産ライン監視、データ分析、データマイニング、マシン依存の可視化、及び故障伝搬経路の可視化の技術及び工学分野に改善をもたらすことができる。
例示的な分散コンピュータシステム

図９は、本出願の一実施形態による、製造ネットワークトポロジ及び故障伝搬情報の判定を容易にする例示的な分散コンピュータ及び通信システムを示す。コンピュータシステム９０２は、プロセッサ９０４、メモリ９０６、及び記憶デバイス９０８を含む。メモリ９０６は、管理メモリとして機能する揮発性メモリ（例えば、ＲＡＭ）を含むことができ、１つ以上のメモリプールを記憶するために使用することができる。更に、コンピュータシステム９０２は、ディスプレイデバイス９１０、キーボード９１２、及びポインティングデバイス９１４に結合することができる。記憶デバイス９０８は、オペレーティングシステム９１６、コンテンツ処理システム９１８、及びデータ９３４を記憶することができる。

コンテンツ処理システム９１８は、コンピュータシステム９０２によって実行されると、本開示に記載されている方法及び／又はプロセスをコンピュータシステム９０２に実行させることができる命令を含み得る。具体的には、コンテンツ処理システム９１８は、コンピュータネットワークを介して他のネットワークノードへ／から、データパケットを送信及び／又は受信する／取得するための命令を含み得る（通信モジュール９２０）。データパケットは、例えば、要求、コマンド、データ、ユーザ入力、ログデータ、トポロジ、経路、グラフなどを含むことができる。

コンテンツ処理システム９１８は、マシン及び関連するプロセスを含む製造システムに関連するデータを記憶するための命令を更に含むことができ、データは、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む（データ保存モジュール９２２）。コンテンツ処理システム９１８は、データに基づいて、製造システムのトポロジを判定するための命令を含むことができ、このトポロジは、プロセスの一部としてのマシン間のオブジェクトの流れを示す（トポロジ判定モジュール９２４）。コンテンツ処理システム９１８はまた、トポロジに関連するマシン故障の情報を判定するための命令を含むことができる（故障情報判定モジュール９２６）。コンテンツ処理システム９１８は、マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す１つ以上の故障パラメータを生成するための命令を含むことができる（故障パラメータ生成モジュール９２８）。コンテンツ処理システム９１８は、トポロジ及びマシン故障情報に基づいて、１つ以上の故障パラメータを含むシステムモデルを構築するための命令を含むことができ、それによって製造システムの診断を容易にする（システムモデル構築モジュール９３０）。

コンテンツ処理システム９１８は、更に、トポロジ及びマシン故障情報に基づいて、故障因果関係グラフを生成するための命令と、システムモデルに基づいて、故障因果関係グラフをプルーニングする命令と、マシンの障害とシステムレベルの性能劣化との間の因果関係を判定する命令と、因果関係に基づいて、プルーニングした故障因果関係グラフに因果関係リンクを追加して、組み合わせた因果関係グラフを取得する命令と、を含むことができる（因果関係グラフ管理モジュール９３２）。コンテンツ処理システム９１８は、故障因果関係グラフ、プルーニングした故障因果関係グラフ、及び組み合わせた故障因果関係グラフを表示するための命令を含むことができる（因果関係グラフ管理モジュール９３２）。コンテンツ処理システム９１８のモジュールはまた、本明細書に記載される動作及び機能を実行することができる同様のモジュールを有する装置を備えることができる。

データ９３４は、入力として必要とされるか、又は本開示に記載される方法及び／若しくはプロセスによって出力として生成される、いずれかのデータを含むことができる。具体的には、データ９３４は、少なくとも、データと、ログデータと、時間系列又はシーケンスデータと、タイムスタンプ情報と、マシンステータス情報と、マシン故障情報と、停止コード又は故障タイプと、製品バッチ情報又はロット番号と、オブジェクト、出力、又は材料の名称又は他の識別子と、トポロジと、ネットワークトポロジと、製造ネットワークトポロジ及び関連するグラフと、プロセスの一部としてのマシン間のオブジェクト又は材料の流れの指示体と、故障パラメータと、故障の頻度又は重大度の指示体と、システムモデルと、故障診断と、数と、いくつかのタイプと、カテゴリ化と、障害シナリオと、故障伝搬ルールと、グラフと、故障因果関係グラフと、プルーニングした又は組み合わせた故障因果関係グラフと、因果関係と、マシン障害又はシステムレベルの性能劣化の指示体と、因果関係リンクと、ノードと、エッジと、グラフのサイズと、障害間の中間時間と、ランダム事象と、機能停止と、分布と、ガウス分布と、障害における標準偏差と、回復するまでの中間時間と、ランダムな回復時間と、回復における標準偏差と、回復時間と、有限状態マシンと、ビジー、利用可能、及び停止を含む状態の指示体と、通常動作パラメータと、プロセス時間と、プロセス時間における標準偏差と、データ構造と、を記憶することができる。

「発明を実施するための形態」に記載されるデータ構造及びコードは、典型的には、コンピュータ可読記憶媒体に記憶され、コンピュータ可読記憶媒体は、コンピュータシステムが使用するためのコード及び／又はデータを記憶することができる任意のデバイス又は媒体であり得る。コンピュータ可読記憶媒体としては、揮発性メモリ、不揮発性メモリ、ディスクドライブなどの磁気及び光学記憶デバイス、磁気テープ、ＣＤ（コンパクトディスク）、ＤＶＤ（デジタル多用途ディスク若しくはデジタルビデオディスク）、又は既知の、若しくは今後開発されるコンピュータ可読媒体を記憶することができる他の媒体が挙げられるが、これらに限定されない。

「発明を実施するための形態」の節に記載される方法及びプロセスは、上に論じられるようなコンピュータ可読記憶媒体内に記憶され得るコード及び／又はデータとして具体化され得る。コンピュータシステムが、コンピュータ可読記憶媒体上に記憶されたコード及び／又はデータを読み取って実行すると、コンピュータシステムは、データ構造及びコードとして具体化され、コンピュータ可読記憶媒体内に記憶された方法及び処理を実行する。

更に、上で説明される方法及び処理は、ハードウェアモジュール又は装置に含まれ得る。ハードウェアモジュール又は装置としては、特定用途向け集積回路（application-specific integrated circuit、ＡＳＩＣ）チップ、フィールドプログラム可能ゲートアレイ（field-programmable gate array、ＦＰＧＡ）、特定の時刻に特定のソフトウェアモジュール又はコードを実行する専用又は共有プロセッサ、及び、既知の又は後に開発される他のプログラム可能論理デバイスが挙げられ得るが、これらに限定されない。ハードウェアモジュール又は装置が起動されると、それらの内部に含まれる方法及び処理が実行される。

本明細書に記載される前述の実施形態は、例示及び説明のみを目的として提示されている。これらは、網羅的であること、又は本発明を開示される形態に限定することを意図するものではない。したがって、多くの修正及び変形が、当業者には明らかであろう。加えて、上記の開示は、本発明を限定することを意図するものではない。本発明の範囲は、添付の特許請求の範囲によって定義される。

Claims

コンピュータ実装方法であって、
マシン及び関連するプロセスを含む処理システムに関連するデータを記憶することであって、前記データが、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む、記憶することと、
前記データに基づいて、前記処理システムのトポロジを判定することであって、前記トポロジが、前記プロセスの一部としての前記マシン間の出力の流れを示す、判定することと、
前記トポロジに関連するマシン故障の情報を判定することと、
前記マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す１つ以上の故障パラメータを生成することと、
前記トポロジ及び前記マシン故障情報に基づいて、前記１つ以上の故障パラメータを含むシステムモデルを構築することにより、前記処理システムの診断を容易にすることと、を含む、コンピュータ実装方法。
それぞれのマシン故障の前記頻度及び前記重大度に基づいて、前記マシン及び前記マシン故障をいくつかのタイプに分類することと、
前記システムモデル内の前記１つ以上の故障パラメータを変更することによって、複数の障害シナリオをシミュレートすることと、
前記シミュレートされた障害シナリオに基づいて、故障伝搬ルールのセットを判定することと、を更に含む、請求項１に記載の方法。
前記トポロジ及び前記マシン故障情報に基づいて故障因果関係グラフを生成することと、
前記システムモデルに基づいて前記故障因果関係グラフをプルーニングすることと、
前記マシンの障害とシステムレベルの性能劣化との間の因果関係を判定することと、
前記因果関係に基づいて、前記プルーニングした故障因果関係グラフに因果関係リンクを追加して、組み合わせた因果関係グラフを取得することと、を更に含む、請求項１に記載の方法。
前記故障因果関係グラフを表示することを更に含み、
前記故障因果関係グラフ内のそれぞれのノードが、それぞれの出力に関して、前記それぞれの出力を処理する第１のマシンと、前記第１のマシンに関連する第１のプロセスと、前記それぞれの出力の処理における前記第１のマシン及び前記第１のプロセスに関連する問題を示す停止コードと、を示し、
前記故障因果関係グラフ内のそれぞれのエッジが、前記それぞれの出力に関して、開始ノードから目的ノードへの論理的流れを示す、請求項３に記載の方法。
前記システムモデルに基づいて前記故障因果関係グラフをプルーニングすることが、前記故障因果関係グラフから１つ以上のノードを除去することによって前記故障因果関係グラフのサイズを低減することを含み、
前記方法が、前記プルーニングした故障因果関係グラフを表示することを更に含む、請求項４に記載の方法。
前記プルーニングした故障因果関係グラフに前記因果関係リンクを追加することに応答して、前記組み合わせた因果関係グラフを表示することにより、ユーザが前記処理システムの効率的な故障診断を実行することを可能にすることを更に含む、請求項３に記載の方法。
それぞれの故障パラメータが、
それぞれのマシンの２つの連続する機能停止間の平均時間を示す、障害間の中間時間であって、それぞれの機能停止が、第１の分布から生成されたランダム事象である、中間時間と、
障害における第１の標準偏差であって、前記それぞれの機能停止を表す前記第１の分布の標準偏差を示す、第１の標準偏差と、
マシンが停止状態から回復するまでの平均時間を示す、回復するまでの中間時間であって、ランダム回復時間が第２の分布から生成される、回復するまでの中間時間と、
回復における第２の標準偏差であって、前記回復時間を表す前記第２の分布の標準偏差を示す、第２の標準偏差と、のうちの１つ以上を含む、請求項１に記載の方法。
前記１つ以上の故障パラメータを含む前記システムモデルを構築することが、
前記トポロジ内のノードをマシンモデルで置換して、故障拡張モデルを取得することを含み、
それぞれのマシンが、ビジー、利用可能、及び停止を含む状態を有する有限状態マシンによって示される、請求項１に記載の方法。
前記トポロジに基づいて、
それぞれの出力を処理するためのマシンに関与する第１の総時間、又はそれぞれの出力を処理するためのプロセスにおける全てのマシンに関与する第２の総時間を示すプロセス時間と、
前記プロセス時間における標準偏差と、
それぞれのマシンが処理することができる前記出力を示すデータ構造と、のうちの１つ以上を含む、通常動作パラメータを判定することを更に含む、請求項１に記載の方法。
前記処理システムが、
製造システムであって、前記ネットワークトポロジが、前記プロセスの一部としての前記マシン間の材料の流れを更に示す、製造システムと、
クラウド又はクラスタコンピューティングシステムであって、前記ネットワークトポロジが、前記クラウド又はクラスタコンピューティングシステムの前記プロセスの一部としての、前記マシン間の出力に関連付けられた分散又は並列計算又はシミュレーションの流れを更に示す、クラウド又はクラスタコンピューティングシステムと、
供給チェーンシステムであって、前記ネットワークトポロジが、前記供給チェーンシステムの前記プロセスの一部としての、前記マシン間の配送及び分配出力に関連する材料の流れを更に示す、供給チェーンシステムと、のうちの１つ以上を含む、請求項１に記載の方法。
コンピュータシステムであって、
プロセッサと、
前記プロセッサによって実行されると、前記プロセッサに方法を実行させる命令を記憶する記憶デバイスと、を含み、前記方法が、
マシン及び関連するプロセスを含む処理システムに関連するデータを記憶することであって、前記データが、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む、記憶することと、
前記データに基づいて、前記処理システムのトポロジを判定することであって、前記トポロジが、前記プロセスの一部としての前記マシン間の出力の流れを示す、判定することと、
前記トポロジに関連するマシン故障の情報を判定することと、
前記マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す１つ以上の故障パラメータを生成することと、
前記トポロジ及び前記マシン故障情報に基づいて、前記１つ以上の故障パラメータを含むシステムモデルを構築することにより、前記処理システムの診断を容易にすることと、を含む、コンピュータシステム。
前記方法が、
前記マシン及び前記マシン故障を、それぞれのマシン故障の前記頻度及び前記重大度に基づいていくつかのタイプに分類することと、
前記システムモデル内の前記１つ以上の故障パラメータを変更することによって、複数の障害シナリオをシミュレートすることと、
前記シミュレートされた障害シナリオに基づいて、故障伝搬ルールのセットを判定することと、を更に含む、請求項１１に記載のコンピュータシステム。
前記方法が、
前記トポロジ及び前記マシン故障情報に基づいて故障因果関係グラフを生成することと、
前記システムモデルに基づいて前記故障因果関係グラフをプルーニングすることと、
前記マシンの障害とシステムレベルの性能劣化との間の因果関係を判定することと、
前記因果関係に基づいて、因果関係リンクを前記プルーニングした故障因果関係グラフに追加して、組み合わせた因果関係グラフを取得することと、を更に含む、請求項１１に記載のコンピュータシステム。
前記方法が、
前記故障因果関係グラフを表示することを更に含み、
前記故障因果関係グラフ内のそれぞれのノードが、それぞれの出力に関して、前記それぞれの出力を処理する第１のマシンと、前記第１のマシンに関連する第１のプロセスと、前記それぞれの出力の処理における前記第１のマシン及び前記第１のプロセスに関連する問題を示す停止コードと、を示し、
前記故障因果関係グラフ内のそれぞれのエッジが、前記それぞれの出力に関して、開始ノードから目的ノードへの論理的流れを示す、請求項１３に記載のコンピュータシステム。
前記システムモデルに基づいて前記故障因果関係グラフをプルーニングすることが、前記故障因果関係グラフから１つ以上のノードを除去することによって前記故障因果関係グラフのサイズを低減することを含み、
前記方法が、
前記プルーニングした故障因果関係グラフを表示することと、
前記プルーニングした故障因果関係グラフに前記因果関係リンクを追加することに応答して、前記組み合わせた因果関係グラフを表示することにより、ユーザが前記処理システムの効率的な故障診断を実行することを可能にすることと、を更に含む、請求項１４に記載のコンピュータシステム。
それぞれの故障パラメータが、
それぞれのマシンの２つの連続する機能停止間の平均時間を示す、障害間の中間時間であって、それぞれの機能停止が、第１の分布から生成されたランダム事象である、中間時間と、
障害における第１の標準偏差であって、前記それぞれの機能停止を表す前記第１の分布の標準偏差を示す、第１の標準偏差と、
マシンが停止状態から回復するまでの平均時間を示す、回復するまでの中間時間であって、ランダム回復時間が第２の分布から生成される、回復するまでの中間時間と、
回復における第２の標準偏差であって、前記回復時間を表す前記第２の分布の標準偏差を示す、第２の標準偏差と、のうちの１つ以上を含む、請求項１１に記載のコンピュータシステム。
前記１つ以上の故障パラメータを含む前記システムモデルを構築することが、
前記トポロジ内のノードをマシンモデルで置換して、故障拡張モデルを取得することを含み、
それぞれのマシンが、ビジー、利用可能、及び停止を含む状態を有する有限状態マシンによって示される、請求項１１に記載のコンピュータシステム。
前記方法が、
前記トポロジに基づいて、
それぞれの出力を処理するためのマシンに関与する第１の総時間、又はそれぞれの出力を処理するためのプロセスにおける全てのマシンに関与する第２の総時間を示すプロセス時間と、
前記プロセス時間における標準偏差と、
それぞれのマシンが処理することができる前記出力を示すデータ構造と、のうちの１つ以上を含む、通常動作パラメータを判定することを更に含む、請求項１１に記載のコンピュータシステム。
前記処理システムが、
製造システムであって、前記ネットワークトポロジが、前記プロセスの一部としての前記マシン間の材料の流れを更に示す、製造システムと、
クラウド又はクラスタコンピューティングシステムであって、前記ネットワークトポロジが、前記クラウド又はクラスタコンピューティングシステムの前記プロセスの一部としての、前記マシン間の出力に関連付けられた分散又は並列計算又はシミュレーションの流れを更に示す、クラウド又はクラスタコンピューティングシステムと、
供給チェーンシステムであって、前記ネットワークトポロジが、前記供給チェーンシステムの前記プロセスの一部としての、前記マシン間の配送及び分配出力に関連する材料の流れを更に示す、供給チェーンシステムと、のうちの１つ以上を含む、請求項１１に記載のコンピュータシステム。
装置であって、
マシン及び関連するプロセスを含む製造システムに関連するデータを記憶するように構成されたデータ記憶モジュールであって、前記データが、タイムスタンプ情報、マシンステータス情報、及び製品バッチ情報を含む、データ記憶モジュールと、
前記データに基づいて、前記製造システムのトポロジを判定するように構成されたトポロジ判定モジュールであって、前記トポロジが、前記プロセスの一部としての前記マシン間の出力の流れを示す、トポロジ判定モジュールと、
前記トポロジに関連するマシン故障の情報を判定するように構成された故障情報判定モジュールと、
前記マシン故障情報に基づいて、それぞれの故障の頻度及び重大度を示す１つ以上の故障パラメータを生成するように構成された故障パラメータ生成モジュールと、
前記トポロジ及び前記マシン故障情報に基づいて、前記１つ以上の故障パラメータを含むシステムモデルを構築することによって、前記製造システムの診断を容易にするように構成されたモデル構築モジュールと、を備える、装置。