JP2023525959A

JP2023525959A - 非線形特性を伴う性能低下の予測

Info

Publication number: JP2023525959A
Application number: JP2022562596A
Authority: JP
Inventors: コードジャジ、ネダ; サリュウ、モショド、オモレード
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2020-05-11
Filing date: 2021-05-05
Publication date: 2023-06-20
Also published as: US11175973B1; WO2021229371A1; GB202218236D0; US20210349772A1; DE112021002699T5; GB2610965A; IL296764A; KR20220154827A; CN115699037A; AU2021271205A1; CA3175610A1; AU2021271205B2

Abstract

非線形特性を伴う徐々の性能低下を予測するための技術が説明される。この技術は、新しいデータ・サンプルを故障予測モデルに入力することを含んでいる方法を含み、故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、各トレーニング・サンプルが複数のクラスタにクラスタ化され、複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる。この方法は、複数のクラスタのうちの新しいデータ・サンプルを含んでいる第１のクラスタの第１の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することをさらに含む。

Description

本開示は、予測モデル化に関連しており、より詳細には、非線形特性を伴う性能低下の予測に関連している。

非線形の性能低下は、１つまたは複数の機械システムまたは機械要素の徐々の劣化に関連する現象を含むことがあり、この徐々の劣化は、最終的に、１つまたは複数の機械システムまたは機械要素の故障または永続的に準最適な性能をもたらす可能性がある。非線形の性能低下に関連するそのような徐々の劣化は、摩耗（例えば、別の物質との相互作用に基づく構成要素の徐々の除去または変形による弱化）、疲労（例えば、循環的負荷から生じる弱化）、クリープ（例えば、持続的な機械的応力から生じる変形）、またはその他の非線形の現象、あるいはその組み合わせのうちのいずれかの種類に関連することがある。非線形の性能低下は、機械的応力、化学的応力、熱的応力、またはその他の応力によって引き起こされる可能性がある。例えば、摩耗の現象は、アブレシブ摩耗、浸食摩耗、腐食摩耗、およびその他の種類の摩耗を含むことがある。

しかし、摩耗によって引き起こされる劣化などの非線形の性能低下を予測することは、多くの課題を提起する。一例として、摩耗は、長期間にわたって進行する徐々の故障である。それに応じて、正常な状態と摩耗した状態の間の関係は非線形であり、線形モデル（例えば、単純ベイズ、サポート・ベクター・マシン（ＳＶＭ：Support Vector Machines）など）を適応不可能にする。さらに、摩耗故障の進行は、類似する資産の間で、例えば使用特性に応じて、非常に変わりやすい（例えば、ある資産は５０日以内に故障し、一方、他の資産は６か月以内に故障する）。１つの例として、一軸ねじポンプ（ＰＣＰ：progressing cavity pump）における摩耗に関連する性能低下は、例えば、地下の地層の種類、砂の粒度、またはいずれかの特定のＰＣＰの動作プロファイル、あるいはその組み合わせなどの、複数の要因に依存することがある。したがって、同じ時点での時間と故障の関数としての性能低下のレベルは、さまざまな動作上の要因に基づいて、異なる資産間で変化する可能性がある。

非線形の性能低下を予測することの別の課題は、摩耗に関連する性能低下などの非線形の性能低下が発生している資産の、正常な動作状態と故障した動作状態の間の不均衡に関連している。言い換えると、正常な性能を示すトレーニング・データセットが大部分（例えば、９０％を超える部分）を占め、極少数のデータが故障した性能を示す。不均衡なトレーニング・データから正確な予測を行うのは、難しいことで有名である。例えば、高度にパラメータ化された非線形の方法（例えば、人工ニューラル・ネットワーク（ＡＮＮ：Artificial Neural Networks））を利用することは、ＡＮＮ内の莫大な数のパラメータを微調整して最適化することができるために（両方のクラスの十分な例を含む）豊富なデータが必要とされる限りにおいて、賢明な解決策ではない。しかし、データが非常に不均衡な場合、異常状態での例の数が、ＡＮＮを効果的にトレーニングするのに不十分である。不均衡なデータの問題を改善するために、オーバサンプリング手法またはアンダーサンプリング手法あるいはその両方が採用されることができるが、これらの手法は、最終的にデータにおける元の分布をゆがめ、したがって、解決策を偏らせる可能性がある（例えば、増加した誤検出の指示によって精度が低下する）。

非線形の性能低下を正確に予測することに関連するさらなる課題は、摩耗に関連する性能低下などの非線形の性能低下が必ずしも破局的故障ではないということである。ＰＣＰの例に再び戻ると、摩耗したＰＣＰは、必ずしも機能を停止しないが、回転翼の摩耗のため、準最適に機能するであろう。このため、（破局的故障の日付とは対照的に）性能低下の特定のレベルでポンプを交換するための「故障日」が、オペレータの主観的な判断に影響されるようになる。これはさらに、データのラベル付け（例えば、実際にＰＣＰが標準以下の性能で機能し続けているときに、いつＰＣＰからのデータに故障としてラベル付けするかを決定すること）を複雑にする。

現実世界の応用において非線形の性能低下を予測することに関連するさらに別の課題は、故障の特徴を適切に識別することに関連している。この課題は二重になっている。第一に、故障の特徴を識別するために使用できるデータが評価されなければならない。この評価は、非線形の性能低下に必ずしも直接関連していないデータから情報を推論することを伴うことがある。例えば、摩耗に関連する性能低下を起こしやすい資産は、摩耗を直接測定するための機器がめったに明示的に取り付けられていない。ＰＣＰの例に再び戻ると、速度、生産速度、トルク、およびケーシング圧の間の相互作用のみが、故障の特徴を推論するために使用できる情報であることがある。第２に、識別された故障の特徴の排他性が評価されなければならない。言い換えると、識別された故障の特徴が、２つ以上の現象と相関性があることがあり、このようにして誤検出を増やす。上記を踏まえて、非線形の性能低下が、（ｉ）非線形の性能低下に関する使用可能なデータから故障の特徴を識別すること、および（ｉｉ）識別された故障の特徴が、非線形の性能低下を排他的に（または主に）表しているかどうかを判定することというさらなる課題を提起することが分かる。

前述の問題の組み合わせは、非線形の性能低下の予測モデル化の問題を解決困難にする。したがって、非線形の現象に起因する性能低下を正確に予測する技術に対する必要性が存在する。

本開示の態様は、新しいデータ・サンプルを故障予測モデルに入力することを含んでいるコンピュータ実装方法を対象にする。故障予測モデルは、ラベル付けされた過去のデータセットを使用してトレーニングされる。各データ点は、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられる。各トレーニング・サンプルは複数のクラスタにクラスタ化され、複数のクラスタは、正常スコアおよび異常スコアにそれぞれ関連付けられる。この方法は、複数のクラスタのうちの新しいデータ・サンプルを含んでいる第１のクラスタの第１の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することをさらに含む。

本発明は、有利に、不均衡なトレーニング・データセットから、非線形の性能低下を正確に予測することができるのが好ましい。さらに、正常スコアおよび異常スコアは、有利に、分類に関連付けられた異常の程度を定量化することができるのが好ましい。本発明のさらなる利点は、（不均衡なトレーニング・データを過度にパラメータ化する傾向がある）ＡＮＮに依存せず、（分類を偏らせる傾向がある）不均衡なトレーニング・データのオーバサンプリング技術またはアンダーサンプリング技術にも依存しないのが好ましいということである。

好ましい実施形態によれば、本開示は、ルックバック・ウィンドウが、各トレーニング・サンプルに含めるための連続的な前のデータ点の数を定義することをさらに含む。ルックバック・ウィンドウは、有利に、正常動作または異常動作を示す特徴のサイズを調節することができる。例えば、ルックバック・ウィンドウが短いほど、個々のデータ点に対する感度が高くなることがあり、一方、ルックバック・ウィンドウが長いほど、個々のデータ点に対する感度が低くなることがある。

好ましい実施形態によれば、この方法は、予測範囲が、未来の事前に定義された時間の量を定義すること、および事前に定義された時間の量だけ未来の各データ点の各ラベルが各トレーニング・サンプルに関連付けられることをさらに含む。予測範囲は、有利に、ルックバック・ウィンドウによって定義されたさまざまな特徴を対応する未来の結果にリンクすることができる。例えば、予測範囲が短いほど、特定の予測に関する警告が短くなる（例えば、摩耗に関連する故障の１日前である）ことがあり、一方、予測範囲が長いほど、特定の予測に関する警告が長くなる（例えば、摩耗に関連する故障の１か月前である）ことがある。

好ましい実施形態によれば、この方法は、Ｋ平均クラスタ化を使用して各トレーニング・サンプルがクラスタ化されることをさらに含む。Ｋ平均クラスタ化は、有利に、効率的かつ拡張可能なクラスタ化技術である。

１つの態様によれば、１つまたは複数のプロセッサと、プログラム命令を格納している１つまたは複数のコンピュータ可読ストレージ媒体とを備えているシステムが提供されており、プログラム命令が、１つまたは複数のプロセッサによって実行された場合に、１つまたは複数のプロセッサに、新しいデータ・サンプルを故障予測モデルに入力することであって、故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、各トレーニング・サンプルが複数のクラスタにクラスタ化され、複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、入力することと、複数のクラスタのうちの新しいデータ・サンプルを含んでいる第１のクラスタの第１の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することとを含む方法を実行させるように構成される。

１つの態様によれば、１つまたは複数のコンピュータ可読ストレージ媒体と、１つまたは複数のコンピュータ可読ストレージ媒体に集合的に格納されたプログラム命令とを備えているコンピュータ・プログラム製品が提供されており、プログラム命令が、１つまたは複数のプロセッサに、新しいデータ・サンプルを故障予測モデルに入力することであって、故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、各トレーニング・サンプルが複数のクラスタにクラスタ化され、複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、入力することと、複数のクラスタのうちの新しいデータ・サンプルを含んでいる第１のクラスタの第１の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することとを含む方法を実行させるように構成された命令を含む。

本開示のさらなる態様は、一軸ねじポンプ（ＰＣＰ）の摩耗に関連する劣化を予測するためのコンピュータ実装方法に関連しており、この方法は、ＰＣＰの新しいデータ・サンプルを、ＰＣＰの摩耗に関連する劣化を予測するように構成されたモデルに入力することを含む。このモデルは、ラベル付けされた過去のＰＣＰデータセットを使用してトレーニングされる。各データ点は、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられる。各トレーニング・サンプルは複数のクラスタにクラスタ化され、複数のクラスタは、正常スコアおよび異常スコアにそれぞれ関連付けられる。この方法は、複数のクラスタのうちの新しいデータ・サンプルを含んでいる第１のクラスタの第１の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することをさらに含み、この分類は、ＰＣＰの摩耗に関連する劣化を示す。

本開示の前述の態様は、有利に、ＰＣＰに関連するデータの不均衡なトレーニング・データセットから、ＰＣＰにおける摩耗に関連する劣化の非線形の性能低下を正確に予測できるのが好ましい。さらに、正常スコアおよび異常スコアは、有利に、分類に関連付けられた異常の程度を定量化することができるのが好ましい。

本開示のさらなる態様は、一軸ねじポンプ（ＰＣＰ）の摩耗に関連する劣化を予測するためのコンピュータ実装方法に関連しており、この方法は、１つまたは複数のＰＣＰに関連付けられた過去のデータの２値のラベル付けを実行することによって、ラベル付けされた過去のデータを生成することを含む。この方法は、ルックバック・ウィンドウおよび予測範囲をラベル付けされた過去のデータの各データ点に適用することによって、複数のトレーニング・データ・サンプルを生成することをさらに含む。この方法は、複数のトレーニング・データ・サンプルを複数のクラスタにクラスタ化することをさらに含む。この方法は、複数のクラスタのうちの各クラスタのクラスタ・スコアを計算することをさらに含む。この方法は、ＰＣＰの新しいデータ・サンプルを複数のクラスタのうちの第１のクラスタに割り当てることをさらに含む。この方法は、第１のクラスタに関連付けられたクラスタ・スコアに基づいて、分類を新しいデータ・サンプルに割り当てることをさらに含み、この分類は、ＰＣＰの未来の摩耗に関連する劣化の可能性を示す。

本開示は、有利に、ＰＣＰに関連するデータの不均衡なトレーニング・データセットから、ＰＣＰにおける摩耗に関連する劣化の非線形の性能低下を正確に予測することができるのが好ましい。さらに、クラスタ・スコアは、有利に、分類に関連付けられた異常の程度を定量化することができるのが好ましい。

好ましい実施形態によれば、この方法は、ラベル付けされた過去のデータが、既知のポンプ交換日の前の既定の期間の間、故障としてラベル付けされることをさらに含む。本開示のこの実施形態は、有利に、「正常な」データと「故障している」データの間の明確な決定境界を提供し、一方、その他の方法では、そのような確定的決定境界は、性能における摩耗に関連する劣化の非線形性および漸進性に起因して、必ずしも存在しない。

好ましい実施形態によれば、この方法は、過去のデータが、ポンプ速度データ、ポンプ・トルク・データ、ケーシング圧データ、生産速度データ、およびＰＣＰに関連する保守記録を含むことをさらに含む。これは、有利に、ＰＣＰに使用できるデータである。言い換えると、このデータを使用して、ＰＣＰの性能における摩耗に関連する劣化を予測することによって、追加のデータ計測器が不要になる。

好ましい実施形態によれば、この方法は、各クラスタのクラスタ・スコアを計算することが、第１のクラスタの正常スコアを計算することをさらに含み、正常スコアが、第１のクラスタ内の正常状態に関連付けられたトレーニング・データ・サンプルの第１の比率を、複数のトレーニング・データ・サンプルにおける正常状態に関連付けられたトレーニング・データ・サンプルの第２の比率で割った値であることをさらに含む。クラスタ・スコアを計算することは、第１のクラスタの異常スコアを計算することをさらに含み、異常スコアは、第１のクラスタ内の劣化状態に関連付けられたトレーニング・データ・サンプルの第３の比率を、複数のトレーニング・データ・サンプルにおける劣化状態に関連付けられたトレーニング・データ・サンプルの第４の比率で割った値である。正常スコアおよび異常スコアを計算することは、有利に、予測された分類の異常の相対的程度を定量化し、したがって、追加の精度および文脈を分類に与える。

好ましい実施形態によれば、この方法は、新しいデータ・サンプルに関する故障信号を生成することをさらに含み、故障信号は、既定の数の前のデータ点にわたる新しいサンプルに関する平均異常スコアを含む。故障信号は、有利に、特定のデータ・サンプルに関する異常スコアの後処理された平滑化を表し、それによって、データのストリームの連続的な異常スコアにおける誤検出またはノイズあるいはその両方を減らす。

本開示の追加の態様は、前述の方法を実行するように構成されたシステムおよびコンピュータ・プログラム製品を対象にする。本概要は、本開示のすべての実装またはすべての実施形態あるいはその両方の各態様を説明するよう意図されていない。

以下の図面を単に例として参照し、本発明の好ましい実施形態について説明する。

本開示の一部の実施形態に従う、例示的な計算環境を示すブロック図である。本開示の一部の実施形態に従う、例示的な故障予測モデルを示すブロック図である。本開示の一部の実施形態に従う、非線形特性を伴う性能低下を予測するための例示的な方法のフローチャートを示す図である。本開示の一部の実施形態に従う、故障予測モデルをトレーニングするための例示的な方法のフローチャートを示す図である。本開示の一部の実施形態に従う、故障予測モデルからの出力に基づいて結果を生成するための例示的な方法のフローチャートを示す図である。本開示の一部の実施形態に従う、故障信号を計算するための例示的な方法のフローチャートを示す図である。本開示の一部の実施形態に従う、故障までの日数の関数として累積異常スコアのグラフの実験結果を示す図である。本開示の一部の実施形態に従う、故障までの日数の関数として故障ラベルの強度のグラフの実験結果を示す図である。本開示の一部の実施形態に従う、故障の前のさまざまな期間に関する混同行列の実験結果を示す図である。本開示の一部の実施形態に従う、例示的なコンピュータを示すブロック図である。本開示の一部の実施形態に従う、クラウド・コンピューティング環境を示す図である。本開示の一部の実施形態に従う、抽象モデル・レイヤを示す図である。

本開示は、さまざまな変更および代替の形態を受け入れるが、その詳細が、図面において例として示されており、詳細に説明される。しかし、本開示を説明されている特定の実施形態に限定することが意図されていないということが、理解されるべきである。反対に、本開示の思想および範囲に含まれるすべての変更、同等のもの、および代替手段を対象にすることが意図されている。

本開示の実施形態は、予測モデル化を対象にしており、より詳細には、非線形特性を伴う性能低下の予測を対象にしている。そのような応用に限定されないが、本開示の実施形態は、前述の文脈を踏まえてよりよく理解され得る。

本開示の実施形態は、非線形の故障メカニズム（例えば、摩耗、疲労、クリープなど）の初期段階の間に資産の性能における劣化を検出して、資産の次回の故障を予測し、故障に先立つ資産の予防保守を推奨するための技術を対象にしている。本開示の実施形態は、資産の過去のデータを入力として取り込み、資産の未来の故障または性能低下の可能性を示す異常スコア、分類、または故障信号、あるいはその組み合わせを出力として生成する半教師あり機械学習方法を活用する。

非線形現象の予測モデル化における前述の課題を克服することにおいて、本開示の実施形態は、（ｉ）正常なデータと故障を示すデータを区別する非線形の決定境界、（ｉｉ）計算的に単純な実装（例えば、非線形にもかかわらず、ＡＮＮの場合にあり得るように過度にパラメータ化されない）、（ｉｉｉ）クラスのバランスを調整しない（したがって、データにおける元の分布をゆがめ、その後、解決策を偏らせることがない）、または（ｉｖ）任意の類似する一群の資産に容易に適用されることができる包括的な解決策、あるいはその組み合わせなどの、ただしこれらに限定されない、特徴を実現する。

ここで図を参照すると、図１は、本開示の一部の実施形態に従って、例示的な計算環境１００を示している。計算環境１００は、ネットワーク１０８を介してセンサ・データ記録システム１０４およびエンドポイント・アプリケーション１０６に通信可能に結合された故障予測システム１０２を含んでいる。故障予測システム１０２は、センサ・データ記録システム１０４からデータを受信し、非線形現象に起因する関連する資産１１０の性能における未来の劣化に関連する予測（例えば、未来の時間間隔でのＰＣＰの摩耗に関連する性能低下の予測）を行うように構成されることができる。故障予測システム１０２は、エンドポイント・アプリケーション１０６と情報をやりとりするようにさらに構成されることができる。例えば、故障予測システム１０２は、センサ・データ記録システム１０４から故障の指示を検出することの要求をエンドポイント・アプリケーション１０６から受信することができる。別の例として、故障予測システム１０２は、センサ・データ記録システム１０４から識別された可能性のある故障の特徴に関する更新情報をエンドポイント・アプリケーション１０６に配信することができる。

センサ・データ記録システム１０４は、資産１１０の機能に直接的または間接的に関連するデータを取得するように構成された１つまたは複数のデータ収集システムを含むことができる。例えば、資産１１０が油井製造システム内のＰＣＰである場合、センサ・データ記録システム１０４は、速度、トルク、ケーシング圧、または生産速度、あるいはその組み合わせなどの、ただしこれらに限定されない、データを収集することができる。別の例として、資産１１０が車両の機械的コンポーネント（例えば、燃料ポンプ、車輪軸受、ヘッド・ガスケットなど）である場合、センサ・データ記録システム１０４は、走行距離、速度、エンジン・エラー・コードなどの、ただしこれらに限定されない、データを収集することができる。これら２つの非限定的な例から分かるように、センサ・データ記録システム１０４は、資産１１０に直接関連付けられたデータを必ずしも収集する必要はない。反対に、一部の実施形態では、センサ・データ記録システム１０４は、資産１１０に関連するその他のコンポーネントに関連付けられたデータを収集するが、それでも、収集されたデータは、資産１１０の機能に関する間接的な推論を提供することに役立つことがある。これは、非線形の性能低下を予測するためのデータを収集するためにシステムの特定のコンポーネントを取り付けることが、経済的に実行不可能であるか、または技術的に実現困難であるか、あるいはその両方である限りにおいて、有益であることができる。したがって、多くの現実世界の応用では、非線形の性能低下の予測は、（ｉ）非線形の性能低下に関する使用可能なデータから故障の特徴を識別すること、および（ｉｉ）識別された故障の特徴が、非線形の性能低下を排他的に（または主に）表しているかどうかを判定することという課題を含む。

エンドポイント・アプリケーション１０６は、例えば、デスクトップ、ラップトップ、タブレット、スマートフォン、またはその他のエンドポイント・デバイスなどの、ユーザ・ワークステーション上で実行されるアプリケーションであることができる。エンドポイント・アプリケーション１０６は、故障予測システム１０２と情報をやりとりするためのインターフェイスをユーザに提供することができる。例えば、ユーザは、センサ・データ記録システム１０４からのデータに基づく資産１１０の予測故障分析を要求することができる。別の例として、故障予測システム１０２は、資産１１０に関連する、センサ・データ記録システム１０４からのデータから検出された故障の特徴に基づいて、更新情報、通知、または警告をエンドポイント・アプリケーション１０６に配信することができる。さらに、一部の実施形態では、エンドポイント・アプリケーション１０６は、ユーザが、ストリーミング・データを受信するようにトレーニング済みの故障予測システム１０２を構成することができるメカニズムを提供し、ストリーミング・データは、故障予測システム１０２をトレーニングするために使用される、資産１１０に類似する資産に関するものであることができる（例えば、油井オペレータは、自分自身のＰＣＰデータを、１つまたは複数の他のＰＣＰからの類似するＰＣＰデータに対してすでにトレーニングされた故障予測システム１０２にストリーミング配信してよい）。

故障予測システム１０２は、一部の実施形態では、クラウド・コンピューティング・アーキテクチャにおいて仮想的にプロビジョニングされることができる。一部の実施形態では、故障予測システム１０２は、例えば、メインフレーム、計算ノード、デスクトップ、ラップトップ、タブレット、または１つまたは複数のプロセッサおよび１つまたは複数のコンピュータ可読ストレージ媒体を含んでいる別のシステムなどの、コンピュータに存在することができる。

故障予測システム１０２は、データ・ウェアハウス１１２、モデル・コンテナ１１４、および計算エンジン１１６を含むことができる。データ・ウェアハウス１１２は、センサ・データ記録システム１０４から収集されたデータであることができ、データの１つまたは複数のサンプルを含むことができる、集約されたセンサ・データ１１８を含むことができる。

モデル・コンテナ１１４は、データ形式を整えられたセンサ・データ１２０を少なくとも部分的に生成するために、集約されたセンサ・データ１１８に対して実行されることができる、データ準備／工学ユーティリティ１２６を含むことができる。例えば、データ準備／工学ユーティリティ１２６は、集約されたセンサ・データ１１８をデータ形式を整えられたセンサ・データ１２０に変換するときに、外れ値を除去すること、データ形式整えの問題を修正すること、ヌル値を解決することなどを実行するように構成されることができる。一部の実施形態では、データ形式を整えられたセンサ・データ１２０は、例えば、集約されたセンサ・データ１１８に適用されたルックバック・ウィンドウを含むことができる。

データ形式を整えられたセンサ・データ１２０は、故障予測モデル１２４に入力されることができる。一部の実施形態では、データ形式を整えられたセンサ・データ１２０および故障予測モデル１２４は、計算エンジン１１６のデプロイメント・リソース１３０に読み込まれる。データ形式を整えられたセンサ・データ１２０を入力として使用する故障予測モデル１２４の実行後に、計算エンジン１１６は、結果１２２を生成し、結果１２２をデータ・ウェアハウス１１２に格納することができる。結果１２２は、例えば、異常スコア、分類、または故障信号、あるいはその組み合わせを含むことができる。結果１２２は、非線形の性能低下に起因する未来の劣化した性能の可能性（例えば、ＰＣＰにおける摩耗に関連する性能低下の可能性）を示すことができる。

計算エンジン１１６は、予測サービス１２８をさらに含むことができ、予測サービス１２８は、要求をエンドポイント・アプリケーション１０６から受信するか、または通知をエンドポイント・アプリケーション１０６に配信するように構成されることができる。予測サービス１２８は、故障予測システム１０２の機能を調整することができる。例えば、一部の実施形態では、予測サービス１２８は、データ形式を整えられたセンサ・データ１２０を生成する目的で、デプロイメント・リソース１３０を使用して、データ準備／工学ユーティリティ１２６が集約されたセンサ・データ１１８に対して実行されることを引き起こすことができる。上記の例を続けると、予測サービス１２８は、結果１２２を生成するために、データ形式を整えられたセンサ・データ１２０を入力として使用して、故障予測モデル１２４をデプロイメント・リソース１３０にデプロイするようにさらに構成されることができる。予測サービス１２８は、結果１２２をエンドポイント・アプリケーション１０６に送信するようにさらに構成されることができる。

ここで図２を参照すると、本開示の一部の実施形態に従う、故障予測モデル１２４のブロック図が示されている。故障予測モデル１２４は、例えば、トレーニング・モード２００およびデプロイメント・モード２２８を含むことができる。トレーニング・モード２００では、故障予測モデル１２４が、摩耗に起因する故障または劣化などの非線形の性能低下を正確に予測するようにトレーニングされる。デプロイメント・モード２２８では、故障予測モデル１２４が、入力データを受信し、入力データのデータ形式を整え、データに関連する非線形現象に関連している予測（例えば、ＰＣＰにおける摩耗に起因する未来の準最適な性能の予測など）を行うように構成される。

トレーニング・モード２００では、故障予測モデル１２４は、１つまたは複数の資産１１０に関連付けられた１つまたは複数のセンサ・データ記録システム１０４から、過去のデータ２０２を受信することができ、過去のデータ２０２は、トレーニング・サブセット２０４－１およびテスト・サブセット２０４－２にセグメント化される。トレーニング・サブセット２０４－１は、故障予測モデル１２４をトレーニングして妥当性を確認するように構成されることができ、テスト・サブセット２０４－２は、故障予測モデル１２４をテストするために使用されることができ、テストは、例えば、精度、正確さ、再現率などの、故障予測モデル１２４の特性を定量化するために使用されることができる。

トレーニング・モード２００は、ラベル付けされた過去のデータ２０６をさらに含むことができ、ラベル付けされた過去のデータ２０６は、センサ読み取り値（例えば、速度、トルク、生産速度、ケーシング圧など）を含んでいる時間的に整列している過去の故障記録（例えば、ＰＣＰの交換を示す保守記録）から、導出されることができる。ラベル付けされた過去のデータ２０６は、資産１１０の正常動作を示している正常状態を示すデータ２０８－１、および資産１１０の準最適な性能、劣化している性能、または故障した性能を示している劣化状態（例えば、ＰＣＰの摩耗した状態）を示すデータ２０８－２を含む。正常状態を示しているデータ２０８－１と劣化状態を示しているデータ２０８－２の間の決定境界は、主題専門家（ＳＭＥ：subject matter expert）によって主観的に行われるか、統計的尺度（例えば、正常動作時の平均値から１標準偏差外側）によって客観的に行われるか、機械学習から推論されるか、またはその他の戦略もしくは技術を使用して決定されることができる。前述したように、劣化状態を示すデータ２０８－２は、必ずしも、機能していない資産１１０に関連するデータである必要はない。むしろ、劣化状態を示すデータ２０８－２は、資産１１０が機能したままである場合でも、資産１１０の準最適な性能を示す。例えば、一部の実施形態では、資産１１０に明示的な故障が発生するか、またはその他の理由でｘ日に交換される場合、ｘ日の前の既定の期間のデータが、劣化状態を示すデータ２０８－２として自動的にラベル付けされることができる。

トレーニング・モード２００は、時間枠付きの過去のデータ２１０をさらに含むことができる。時間枠付きの過去のデータ２１０は、ルックバック・ウィンドウ２１２および予測範囲２１４を含むことができる。ルックバック・ウィンドウ２１２は、各データ・サンプルに含めるための現在のデータ点の前のデータ点の数（例えば、Ｄ_ｘ）のことを指すことができる。予測範囲２１４は、現在のデータ点からある数（例えば、Ｄ_ｙ）のデータ点だけ未来のデータ点のラベルのことを指すことができる。ルックバック・ウィンドウ２１２および予測範囲２１４は、トレーニング・サブセット２０４－１内の各データ点を、正常状態に関連付けられた各データ・サンプル２１６－１および劣化状態に関連付けられた各データ・サンプル２１６－２（集合的にデータ・サンプル２１６と呼ばれる）に変換するために使用されることができる。言い換えると、故障予測モデル１２４は、資産１１０の性能の履歴（ルックバック・ウィンドウ２１２に等しい）を使用して、性能の劣化のレベルに関して、資産１１０の可能性のある未来の状態に関する決定を行うように、トレーニングされる。各データ・サンプル２１６は、（ルックバック・ウィンドウ２１２に基づいて）データ・ストリームごとに現在のデータ点および複数の前のデータ点に対応する、データ点のベクトル、行列、またはテンソルを含むことができ、各データ・サンプル２１６は、予測範囲２１４によって、未来のデータ点のラベルにさらに関連付けられることができる（未来のデータ点のラベルは、ベクトル、行列、またはテンソル内の既定の位置に追加されるか、またはその他の方法でベクトル、行列、またはテンソルに関連付けられることができる）。言い換えると、正常状態に関連付けられたデータ・サンプル２１６－１は、正常状態を示すデータ２０８－１である予測範囲２１４でのデータ点によって、識別されることができる。同様に、劣化状態に関連付けられたデータ・サンプル２１６－２は、劣化状態を示すデータ２０８－２としてラベル付けされた予測範囲２１４でのデータ点を含んでいるデータ・サンプルであることができる。

例えば、ルックバック・ウィンドウ２１２は１０日であることができ、予測範囲２１４は２０日であることができる。この状況では、トレーニング・サブセット２０４－１内のデータの単一のストリームからの最初の時間でのデータ点の場合、データ点が、前の１０個のデータ点（例えば、ルックバック・ウィンドウ２１２）を含んでいるベクトルに変換されることができ、このベクトルが、２０日後の未来のデータ点（例えば、ラベルが、正常状態を示すデータ２０８－１または劣化状態を示すデータ２０８－２のいずれかである、予測範囲２１４）のラベルに関連付けられることができる。この例では、２０日後の未来のデータ点のラベルが、劣化状態を示すデータ２０８－２である場合、現在のデータ点および前の１０個のデータ点のデータ点のベクトルは、トレーニングの目的のための予測的な故障の特徴と見なされることができる。反対に、２０日後の未来のデータ点のラベルが、正常状態を示すデータ２０８－１である場合、現在のデータ点および前の１０個のデータ点のデータ点のベクトルは、トレーニングの目的のための予測的な正常な特徴であると仮定されることができる。

当業者によって理解されるように、ルックバック・ウィンドウ２１２および予測範囲２１４は、さまざまな尺度に従って、さまざまな数であることができる。例えば、一部の実施形態では、ルックバック・ウィンドウ２１２および予測範囲２１４の単位は、秒、分、日、週、月などであることができる。さまざまな実施形態では、ルックバック・ウィンドウ２１２は、予測範囲２１４と比較して小さいか、大きいか、または等しい。一部の実施形態では、ルックバック・ウィンドウ２１２は、有用性と計算オーバーヘッドの間のトレードオフに対処するようにサイズ設定される。例えば、相対的に大きいルックバック・ウィンドウ２１２は、故障の特徴を正確に検出するために使用される情報を増やすが、実施するために必要な計算能力も増やす。反対に、相対的に小さいルックバック・ウィンドウ２１２は、故障の特徴を正確に検出するために使用される情報を減らすが、実施するために必要な計算能力を減らす。一部の実施形態では、予測範囲２１４は、故障の特徴に基づいてサイズ設定される。例えば、資産１１０が、データにおいて故障の指示がそれ自身を明示し始めたときから２０日の時間枠に関連付けられている場合、予測範囲２１４は、２４日以下でなければならない（言い換えると、２０日より大きい予測範囲２１４は誤検出の増加をもたらす）。さらに、一部の実施形態では、ルックバック・ウィンドウ２１２および予測範囲２１４の単位は、必ずしも時間に基づくインクリメントである必要は全くなく、単に前の、または後のデータ点の数によって参照されることができ、データ点の間隔は、非時間的特性に基づいてよい。さらに、上記の例で説明されたデータ・サンプル２１６はベクトル形式であるが、他の実施形態では、多次元データまたはマルチモーダル・データ・ストリームを表すために、行列またはテンソルが使用されることができる。１つの例として、３つのデータ・ストリームに関連付けられた資産１１０の場合、データ・サンプル２１６は、入力データと出力データの対を含むことができ、入力部分は、３つのデータ・ストリームごとに各ルックバック・ウィンドウ２１２のサンプルで構成されている３次元テンソルを含み、出力部分は、予測範囲２１４での未来の性能の２値（例えば、正常の場合に０、故障の場合に１）のインジケータを含む。

トレーニング・モード２００は、データ２１８をクラスタ化することをさらに含むことができる。クラスタ化２１８は、現在知られているか、または今後開発される任意のテスト可能なクラスタ化技術を使用して、データ・サンプル２１６をクラスタ化することができる。言い換えると、クラスタ化されたデータ２１８は複数のクラスタ２２０を含むことができ、各クラスタは、少なくとも１つのデータ・サンプル２１６を含む。特に、クラスタ２２０の数は、データ・サンプル２１６を（過学習せずに）正確に適合させるように構成可能である。

一部の実施形態では、クラスタ２２０は、Ｋ平均クラスタ化を使用することによって決定される。Ｋ平均クラスタ化は、有利に、大きいデータセットに合わせて拡張可能な計算効率の良いクラスタ化技術である。さらに一般的には、使用されるクラスタ化技術の種類、使用されるクラスタの数、および使用されるクラスタのパラメータ（例えば、形状、サイズなど）は、本開示の一部の実施形態に従って故障予測モデル１２４の性能を改善するために必要に応じて調節されることができる、すべて調整可能なパラメータである。例えば、さまざまな正常な動作プロファイルおよびさまざまな劣化している動作プロファイルを捕捉するための十分な数のクラスタがあることは、有益であることがある。

クラスタ化されたデータ２１８は、クラスタ２２０の各々に割り当てられたクラスタ・スコア２２２をさらに含むことができる。クラスタ・スコア２２２は、正常スコア２２４および異常スコア２２６を含むことができる。一部の実施形態では、正常スコア２２４が、方程式１に従って計算されることができる。
方程式１：

同様に、一部の実施形態では、異常スコア２２６が方程式２に従って計算されることができる。
方程式２：

方程式１に関しては、

は、クラスタ２２０のうちの特定のクラスタＣ_ｉ内の正常状態に関連付けられたデータ・サンプル２１６－１の数を参照することができ、一方、Ｎ_ｎは、時間枠付きの過去のデータ２１０内の標準状態に関連付けられたデータ・サンプル２１６－１の総数を参照することができる。同様に、方程式２に関しては、項

は、クラスタ２２０のうちの特定のクラスタＣ_ｉ内の劣化状態に関連付けられたデータ・サンプル２１６－２の数を参照することができ、一方、Ｎ_ｆは、時間枠付きの過去のデータ２１０内の劣化状態に関連付けられたデータ・サンプル２１６－２の総数を参照することができる。方程式１および方程式２の両方の項

は、クラスタ２２０のうちの特定のクラスタＣ_ｉ内のデータ・サンプル２１６の総数を参照することができ、一方、Ｎは、時間枠付きの過去のデータ２０６内のデータ・サンプル２１６の総数を参照することができる。

言い換えると、正常スコア２２４は、特定のクラスタ内の正常状態に関連付けられたデータ・サンプル２１６－１の比率を、時間枠付きの過去のデータ２１０全体内の正常状態に関連付けられたデータ・サンプル２１６－１の比率で割った値であることができる。同様に、異常スコア２２６は、特定のクラスタ内の劣化状態に関連付けられたデータ・サンプル２１６－２の比率を、時間枠付きの過去のデータ２１０全体内の劣化状態に関連付けられたデータ・サンプル２１６－２の比率で割った値であることができる。

クラスタ２２０を作成し、クラスタ・スコア２２２を生成した後に、故障予測モデル１２４はトレーニングされたと見なされることができる。一部の実施形態では、トレーニング・サブセット２０４－１を使用して故障予測モデル１２４をトレーニングした後に、テスト・サブセット２０４－２およびデプロイメント・モード２２８を使用して故障予測モデル１２４がテストされることができる。デプロイメント・モード２２８の説明がテスト・サブセット２０４－２に関して行われるが、デプロイメント・モード２２８の説明は、新しいデータに関連付けられた未来の非線形現象（例えば、ＰＣＰにおける摩耗に関連する性能低下）を予測する目的でストリーミング・リアルタイム・データを受信することにも、同じように適用可能である。

デプロイメント・モード２２８で、故障予測モデル１２４は、テスト・サブセット２０４－２を時間枠付きのデータ・サンプル２３０へとデータ形式を整えることができる。時間枠付きのデータ・サンプル２３０は、データ・サンプル２１６に類似することができるが、（正常状態および劣化状態の指示が故障予測モデル１２４によって予測される情報であり、したがって、故障予測モデル１２４の性能をテストしている間に故障予測モデル１２４から隠蔽される限りにおいて）正常状態の指示も劣化状態の指示も含まない。したがって、時間枠付きのデータ・サンプル２３０内の各サンプルは、テスト・サブセット２０４－２からのデータ点、およびルックバック・ウィンドウ２１２に従う、前の複数のデータ点を含むことができる。前述したように、この一連のデータは、テスト・サブセット２０４－２内のデータの複雑さ、次元、およびモダリティに応じて、ベクトル形式、行列形式、またはテンソル形式で格納されることができる。一部の実施形態では、時間枠付きのデータ・サンプル２３０は、データ形式を整えられたセンサ・データ１２０と一致する。

次に、時間枠付きのデータ・サンプル２３０の各サンプルが、各クラスタ２２０に関連付けられることができる。その後、クラスタ２２０のうちの関連するクラスタに基づいて、分類２３２が時間枠付きのデータ・サンプル２３０の各々に関連付けられることができる。例えば、異常スコア２２６より大きい正常スコア２２４を有している各クラスタ２２０内に配置された各時間枠付きのデータ・サンプル２３０の場合、その各時間枠付きのデータ・サンプル２３０は、正常（例えば、「０」のスコア）と見なされることができる。反対に、その各時間枠付きのデータ・サンプル２３０が、正常スコア２２４より大きい異常スコア２２６を有している各クラスタ２２０内に配置されている場合、その各時間枠付きのデータ・サンプル２３０は、異常または未来の故障の予測（例えば、「１」のスコア）と見なされることができる。一部の実施形態では、分類２３２は、時間枠付きのデータ・サンプル２３０を捕捉しているクラスタ２２０の異常スコア２２６を、異常スコア２２６より大きい正常スコア２２４を有しているすべてのクラスタ２２０の平均異常スコアと比較することを含む。このようにして、時間枠付きのデータ・サンプル２３０を捕捉しているクラスタ２２０の異常スコア２２６が、その他の点では正常と見なされている他のクラスタ２２０で見られる異常のベースライン・レベルと比較されることができる。

故障予測モデル１２４は、故障信号２３４をさらに含むことができる。故障信号２３４は、前の既定の数のデータ点について異常スコアの平均値を取得することによって、異常スコア２２６または分類２３２を平滑化するように構成されることができる。例えば、故障信号２３４が、方程式３に従って計算されることができる。
方程式３：

方程式３では、項ｘが、既定の数の連続する前のデータ点を参照することができ、これらのデータ点に対して、特定の時間枠付きのデータ・サンプル２３０の平均異常スコアを決定する。一部の実施形態では、ｘは、故障予測モデル１２４の設計考慮事項に従う調整可能なパラメータであることができる。例えば、相対的に大きいｘは、故障を示す特定の異常スコアに対する故障予測モデル１２４の感度を減らす（それによって誤検出を減らす）ことができ、一方、相対的に小さいｘは、故障を示す各異常スコアに対する故障予測モデル１２４の感度を増やす（それによって検出漏れを減らす）ことができる。さらに、方程式３の項ＡＳ_ｎは、データ点ｎを含んでいるクラスタ２２０のうちの１つのクラスタの異常スコア２２６を参照することができるが、他の実施形態では、分類２３２が使用されることもできる。故障信号２３４は、図５Ｂに関してさらに詳細に説明される。

ここで図３を参照すると、本開示の一部の実施形態に従う、故障予測モデル１２４を利用するための例示的な方法３００のフローチャートが示されている。方法３００は、例えば、故障予測モデル１２４、故障予測システム１０２、コンピュータ、計算ノード、プロセッサ、あるいはハードウェアもしくはソフトウェアまたはその両方の別の組み合わせによって実装されることができる。

動作３０２は、故障予測モデル１２４をトレーニングすることを含む。故障予測モデル１２４をトレーニングすることは、故障予測モデル１２４のトレーニング・モード２００に関して前述した態様を含むことができる。動作３０２は、図４に関して以下でさらに詳細に説明される。

動作３０４は、集約されたセンサ・データ１１８をデータ形式を整えられたセンサ・データ１２０へとデータ形式を整えることを含む。一部の実施形態では、データ形式を整えられたセンサ・データ１２０は、時間枠付きのデータ・サンプル２３０と一致する。動作３０４は、データ形式を整えられたセンサ・データ１２０を生成するために、ルックバック・ウィンドウ２１２を集約されたセンサ・データ１１８内の各データ点に適用することを含むことができる。一部の実施形態では、動作３０４は、外れ値の除去、ヌル値の除去などの、その他のデータ・クレンジング動作またはデータ形式整え動作あるいはその両方をさらに含む。

動作３０６は、データ形式を整えられたセンサ・データ１２０を故障予測モデル１２４に入力することを含む。動作３０８は、故障予測モデル１２４からの出力に基づいて結果１２２を生成することを含む。一部の実施形態では、結果１２２は、分類２３２（例えば、正常または未来の故障の指示）または故障信号２３４（例えば、未来の故障の可能性に関連する定量化）あるいはその両方を含む。

動作３１０は、結果に基づいて緩和処置を実行することを含む。例えば、緩和処置は、通知、警告、報告、または別の送信の形態で結果１２２をエンドポイント・アプリケーション１０６に送信することを含むことができる。一部の実施形態では、動作３１０は、資産１１０の交換、再構築、またはその他の方法での保守などの、資産１１０の保守に関連するスケジューリング・イベントをトリガーすることを含む。一部の実施形態では、スケジューリング・イベントは結果１２２に基づく。例えば、しきい値を超える故障信号２３４は、保守イベントが時間ウィンドウ内（例えば、予測範囲２１４内）でスケジューリングされることをトリガーしてよい。一部の実施形態では、緩和処置は、必要な交換部品を発注すること、および発注された交換部品を資産１１０に関連付けられた場所に発送することなどの、物流活動に関連することができる。

ここで図４を参照すると、本開示の一部の実施形態に従う、故障予測モデル１２４をトレーニングするための例示的な方法４００のフローチャートが示されている。一部の実施形態では、方法４００は、図３の動作３０２の下位の方法である。一部の実施形態では、方法４００は、例えば、故障予測モデル１２４、故障予測システム１０２、コンピュータ、計算ノード、プロセッサ、あるいはハードウェアもしくはソフトウェアまたはその両方の別の組み合わせによって実装されることができる。

動作４０２は、過去のデータ２０２をトレーニング・サブセット２０４－１およびテスト・サブセット２０４－２に集約することを含む。動作４０４は、過去のデータ２０２にラベルを付け、正常状態を示すデータ２０８－１および劣化状態を示すデータ２０８－２を含んでいるラベル付けされた過去のデータ２０６を生成することを含む。動作４０６は、ルックバック・ウィンドウ２１２および予測範囲２１４を過去のデータ２０２内の各データ点に適用することによって、正常状態に関連付けられたデータ・サンプル２１６－１および劣化状態に関連付けられたデータ・サンプル２１６－２を生成することを含む。

動作４０８は、データ・サンプル２１６を複数のクラスタ２２０にクラスタ化することを含む。一部の実施形態では、動作４０８は、Ｋ平均クラスタ化を利用する。動作４１０は、クラスタ２２０の各々に関連付けられたクラスタ・スコア２２２を計算することを含む。クラスタ・スコア２２２は、クラスタ２２０内のクラスタごとに、各正常スコア２２４および各異常スコア２２６を含むことができる。

動作４１２は、故障予測モデル１２４を調整することを含む。故障予測モデル１２４を調整することは、例えば、（ｉ）正常状態を示すデータ２０８－１および劣化状態を示すデータ２０８－２の定義を変更することによって、ラベル付けされた過去のデータ２０６を変更すること、（ｉｉ）ルックバック・ウィンドウ２１２のサイズを変更すること、（ｉｉｉ）予測範囲２１４のサイズを変更すること、（ｉｖ）クラスタ２２０に関連付けられたパラメータ（例えば、クラスタの数、クラスタの形状、クラスタのサイズなど）を変更すること、またはその他のモデル調整技術もしくは戦略またはその両方、あるいはその組み合わせを含むことができる。一部の実施形態では、故障予測モデル１２４は、テスト・サブセット２０４－２のテストからの結果に基づいて調整される。

動作４１４は、トレーニングされた故障予測モデル１２４を出力することを含む。一部の実施形態では、トレーニングされた故障予測モデル１２４を出力することは、トレーニングされた故障予測モデル１２４を、例えば、仮想的にプロビジョニングされたモデル・コンテナ１１４などの、コンピュータ可読ストレージ媒体に格納することを含む。

ここで図５Ａを参照すると、本開示の一部の実施形態に従う、故障予測モデル１２４からの出力に基づいて結果を生成するための例示的な方法５００のフローチャートが示されている。一部の実施形態では、方法５００は、図３の動作３０８の下位の方法である。一部の実施形態では、方法５００は、例えば、故障予測モデル１２４、故障予測システム１０２、コンピュータ、計算ノード、プロセッサ、あるいはハードウェアもしくはソフトウェアまたはその両方の別の組み合わせによって実装されることができる。

動作５０２は、２値分類結果２３２を、前に故障予測モデル１２４に入力された各データ・サンプル（例えば、時間枠付きのデータ・サンプル２３０）に関連付けることを含む。一部の実施形態では、分類２３２は、「正常」（例えば、０）、あるいは「異常」、「故障」、または別の非正常インジケータ（例えば、１）のいずれかである。分類２３２は、各時間枠付きのデータ・サンプル２３０を捕捉するクラスタ２２０の正常スコア２２４および異常スコア２２６に基づくことができる。より詳細には、正常スコア２２４が異常スコア２２６より大きい場合、対応する時間枠付きのデータ・サンプル２３０は正常と見なされる。反対に、異常スコア２２６が正常スコア２２４より大きい場合、対応する時間枠付きのデータ・サンプル２３０は、異常またはその他の方法で故障を示していると見なされる。

動作５０４は、各入力データ・サンプル（例えば、時間枠付きのデータ・サンプル２３０）の故障信号２３４を生成することを含む。故障信号２３４は、時間枠付きのデータ・サンプル２３０に関連付けられた正常スコア２２４、異常スコア２２６、または分類２３２、あるいはその組み合わせに基づくことができる。一部の実施形態では、故障信号２３４は、真に異常なデータの、より信頼性のあるインジケータを表す（例えば、誤検出を減らす）。故障信号２３４は、図５Ｂに関して以下でさらに詳細に説明される。

ここで図５Ｂを参照すると、本開示の一部の実施形態に従う、故障信号２３４を生成するための例示的な方法５１０のフローチャートが示されている。一部の実施形態では、方法５１０は、図５Ａの動作５０４の下位の方法である。一部の実施形態では、方法５１０は、例えば、故障予測モデル１２４、故障予測システム１０２、コンピュータ、計算ノード、プロセッサ、あるいはハードウェアもしくはソフトウェアまたはその両方の別の組み合わせによって実装されることができる。

動作５１２は、正常としてランク付けされたクラスタ２２０の平均異常スコアを計算することを含む。正常動作時の平均異常スコアを計算することは、正常スコア２２４が異常スコア２２６より大きいクラスタ２２０のクラスタごとに、異常スコア２２６の平均値を求めることを含むことができる。これは、誤検出を減らすように機能することができる異常のベースライン・レベルを確立する限りにおいて有益であることができる。

動作５１４は、時間枠付きの受信データ・サンプル２３０を、異常スコア２２６および正常スコア２２４に関連付けられたクラスタ２２０に割り当てることを含む。指定されたクラスタの異常スコアが（動作５１２で決定された）正常動作時の平均異常スコアより大きい場合、そのデータ・サンプルが故障モードにあるとして分類され（１として分類され）、そうでない場合、そのデータ・サンプルが正常モードにあるとして分類される（０として分類される）。

動作５１６は、既定の期間（例えば、１０日）または既定の数の時間枠付きのデータ・サンプル２３０にわたって、その資産について、０または１の２値分類結果の平均値として故障信号２３４を計算することを含む。一部の実施形態では、動作５１６は、方程式３を利用することができる。

図１～５を再び参照すると、本開示の態様の１つの特定の応用は、一軸ねじポンプ（ＰＣＰ）内の回転子の摩耗によって引き起こされる性能低下を検出することに関連している。ＰＣＰ内の回転子の摩耗によって引き起こされる性能低下が非線形現象であるため、本開示の態様は、ＰＣＰ内の摩耗によって引き起こされる回転子の劣化を正確に予測することによく適している。

ＰＣＰを利用する人工採油システムは、砂を伴った低温の重質原油の生産（ＣＨＯＰＳ：coldheavy oil production with sand）などの、さまざまな非熱的石油およびガス回収方法を可能にする。ＰＣＰは、地下貯留層から地表へ、石油と砂の粘性混合物を引き上げることができ、他の人工採油システム（例えば、電動水中ポンプ（ＥＳＰ：electric submersible pump））と比較して、採油コストを改善し、保守コストを改善し、応用の柔軟性を改善し、環境影響を減らす。

ＰＣＰが重油内のより多い砂の含有量に対処することに適しているにもかかわらず、持続する砂の取り込みから生じる１つの問題は、アブレシブ摩耗故障である。アブレシブ摩耗は、回転子上の硬質クロムめっきが摩耗する際の、ポンプ性能における漸進的な劣化のことを指すことができ、ＰＣＰにおける故障の最も一般的な種類である。この摩耗は、回転子上のクロムめっきの表面に限定されるか、またはベースメタルに拡大する可能性がある。いずれの場合も、元の回転子の形状が変化する。形状におけるこの変化は、回転子と固定子の間のかみ合いが変化する限りにおいて、ＰＣＰの性能に影響を与えることがある。硬質クロムめっきが摩耗してベースメタルまで下がる激しいアブレシブ摩耗は、回転子内のエラストマーに永続的損傷を与え、ポンプの交換を必要とする可能性がある。

油井内のポンプの故障は、失われる生産時間に関して多大な損失をもたらす。したがって、ポンプの摩耗故障を予測する能力は、故障に先立つＰＣＰの積極的なスケジューリングされた保守を提供することによって、これらのコストを減らす。さらに、摩耗の初期段階の間のポンプの性能低下の改善された認識は、動作寿命を延ばすための業務的意思決定において、オペレータが適切な調整を行うのに役立つことがある。

しかし、ＰＣＰにおける故障を予測することは、非線形特性を伴う性能低下を予測するのと同様の理由のため、困難である。一つには、故障メカニズムは漸進的であり、回転子が次第に摩耗する間に、ＰＣＰが長期間にわたって準最適な性能で機能したままであることがあるため、過去のデータに「正常」または「異常」として適切にラベル付けすることにおいて問題を引き起こす。別の課題は、ＰＣＰに使用できる不均衡な一連の過去のデータ（例えば、異常なデータよりも著しく多い正常なデータ）に関連している。さらに別の課題は、動作環境（例えば、砂の含有量が少ない地層と比較して砂の含有量が多い地層）によって変化する、変わりやすい故障メカニズムに関連している。したがって、ＰＣＰの故障を正確に予測するのは困難である。それにもかかわらず、本開示の態様は、ＰＣＰの予測監視の分野において実施された場合、摩耗に関連するメカニズムに起因するＰＣＰの性能低下を正確に予測することができる。

例えば、図４の説明に再び戻ると、この図は、ＰＣＰなどの資産１１０のための故障予測モデル１２４をトレーニングすることに関連しているため、動作４０２は、ポンプ速度、ポンプ・トルク、ケーシング圧、および生産速度などのセンサ・データを集約することができる。集約されたセンサ・データは、トレーニング・サブセット２０４－１（例えば、データの約８０％）およびテスト・サブセット２０４－２（例えば、データの約２０％）に分離されることができる。動作４０４は、正常状態を示すデータ２０８－１（トレーニング・サブセット２０４－１内の不均衡なデータの約９７％）または劣化状態を示すデータ２０８－２（トレーニング・サブセット２０４－１内の不均衡なデータの約３％）として過去のデータにラベルを付けることができる。一部の実施形態では、劣化状態を示すデータ２０８－２は、（保守記録から決定された）既知のＰＣＰ交換日の２５日～３日前のすべてのデータであることができ、一方、既知のＰＣＰ交換日の２５日前に先立つデータは、正常状態を示すデータ２０８－１と見なされることができる。

動作４０６は、ルックバック・ウィンドウ２１２および予測範囲２１４を各データ点に適用することによって、データ・サンプル２１６を生成することができる。動作４０８は、Ｋ平均クラスタ化を使用してデータ・サンプル２１６をクラスタ化することができ、動作４１０は、方程式１および方程式２に従って、正常スコア２２４および異常スコア２２６をそれぞれ計算することができる。動作４１２は、故障予測モデル１２４を調整することができ、動作４１４は、トレーニングされた故障予測モデル１２４を出力することができる。

テスト・サブセット２０４－２をＰＣＰの応用のトレーニングされた故障予測モデル１２４に適用することは、本開示の態様の有用性を示す。図６Ａは、累積異常スコア２２６（ｙ軸）のグラフの実験結果を、既知のポンプ交換日までの日数（ｘ軸）の関数として示している。図に示されているように、故障の２５日前と既知のポンプ交換日の間で、傾向線が急に増加している。したがって、図６Ａは、異常スコア２２６がＰＣＰの故障をうまく予測することに使用されることができるということを示している。

図６Ｂは、故障を示す分類２３２の強度（ｙ軸）のグラフの実験結果を、故障までの日数（ｘ軸）の関数として示している。図に示されているように、故障を示す分類２３２の強度は、故障の約２５日前と既知のポンプ交換日の間で著しく上昇している。したがって、図６Ｂは、分類２３２がＰＣＰの故障を予測することにうまく使用されることができるということを示している。

特に、故障信号２３４に関連するグラフは提供されていないが、故障信号２３４が、図６Ａおよび６Ｂに示された結果と比較してノイズが減少した同様の予測力を示すということが、当業者にとって明らかである。これは、故障信号２３４が平均スコアを表し、一方、図６Ａが累積スコアを示しており、図６Ｂが強度スコアを示しているためである。

図７は、前述したように、テスト・サブセット２０４－２をＰＣＰの故障予測モデル１２４に使用する、既知のポンプ交換日の前のさまざまな期間の混同行列に関連する実験結果を示している。図７に示されているように、故障の３０日前７００－１の場合、正常（実際のラベル７０２－１）－正常（予測されたラベル７０４－１）ボックスは０．７６であり、故障－正常ボックスは０．３８であり、正常－故障ボックスは０．２４であり、故障－故障ボックスは０．６２である。故障の１４日前７００－２の場合、正常（実際のラベル７０２－２）－正常（予測されたラベル７０４－２）ボックスは０．７６であり、故障－正常ボックスは０．２６であり、正常－故障ボックスは０．２４であり、故障－故障ボックスは０．７４である。故障の５日前７００－３の場合、正常（実際のラベル７０２－３）－正常（予測されたラベル７０４－３）ボックスは０．７６であり、故障－正常ボックスは０．１２であり、正常－故障ボックスは０．２４であり、故障－故障ボックスは０．８８である。

一般に、図７は、実際のポンプ交換日への近さの関数として、予測性能の改善を示している。さらに、図７は、故障の５日前７００－３で約８８％、故障の１４日前７００－２で約７５％、および故障の３０日前７００－１で約６２％の再現率（例えば、真の検出数を真の検出と検出漏れの総数で割った値）を示している。一方、本開示の態様は、約７８％（故障の５日前７００－３）、７６％（故障の１４日前７００－２）、および７２％（故障の３０日前７００－１）の精度（例えば、真の検出数を真の検出と誤検出の総数で割った値）を実現した。したがって、図７は、本開示の態様が、回転子の摩耗の結果としてのＰＣＰの性能低下を予測するための堅牢な故障予測モデル１２４を実現するということを示している。

図８は、本開示の一部の実施形態に従う、例示的なコンピュータ８００のブロック図を示している。さまざまな実施形態では、コンピュータ８００は、図３～５で説明された方法のいずれかまたはすべてを実行すること、または図１～２もしくは６～７またはその両方のうちのいずれか１つで説明された機能を実装すること、あるいはその両方を行うことができる。一部の実施形態では、コンピュータ８００は、ネットワーク８５０を介してリモートのデータ処理システムからプロセッサ実行可能命令をダウンロードすることによって、前述の方法および機能に関連する命令を受信する。他の実施形態では、コンピュータ８００は、コンピュータ８００によって提供された命令に基づいてクライアント・マシンが方法または方法の一部を実行するように、前述の方法または機能あるいはその両方のための命令をクライアント・マシンに提供する。一部の実施形態では、コンピュータ８００は、図１の故障予測システム１０２、図１の故障予測モデル１２４、または本開示の別の態様に組み込まれる（またはコンピュータ８００に類似する機能が、これらに仮想的にプロビジョニングされる）。

コンピュータ８００は、メモリ８２５、ストレージ８３０、相互接続８２０（例えば、バス）、１つまたは複数のＣＰＵ８０５（本明細書ではプロセッサとも呼ばれる）、Ｉ／Ｏデバイス・インターフェイス８１０、Ｉ／Ｏデバイス８１２、およびネットワーク・インターフェイス８１５を含んでいる。

各ＣＰＵ８０５は、メモリ８２５またはストレージ８３０に格納されたプログラミング命令を取得して実行する。相互接続８２０は、プログラミング命令などのデータを、ＣＰＵ８０５、Ｉ／Ｏデバイス・インターフェイス８１０、ストレージ８３０、ネットワーク・インターフェイス８１５、およびメモリ８２５の間で移動するために使用される。相互接続８２０は、１つまたは複数のバスを使用して実装されることができる。さまざまな実施形態では、ＣＰＵ８０５は、単一のＣＰＵ、複数のＣＰＵ、または複数のプロセッシング・コアを含んでいる単一のＣＰＵであることができる。一部の実施形態では、ＣＰＵ８０５は、デジタル信号プロセッサ（ＤＳＰ：digital signal processor）であることができる。一部の実施形態では、ＣＰＵ８０５は、１つまたは複数の３Ｄ集積回路（３ＤＩＣ：3D integrated circuit）（例えば、３Ｄウエハー・レベル・パッケージング（３ＤＷＬＰ：3D wafer-level packaging）、３Ｄインターポーザベースの統合、３ＤスタックＩＣ（３Ｄ－ＳＩＣ：3D stacked IC）、モノリシック３ＤＩＣ、３Ｄ異種統合、３Ｄシステム・イン・パッケージ（３ＤＳｉＰ：3D system in package）、またはパッケージ・オン・パッケージ（ＰｏＰ：package on package）ＣＰＵ構成、あるいはその組み合わせ）を含む。メモリ８２５は、一般に、ランダム・アクセス・メモリ（例えば、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ：static random-access memory）、ダイナミック・ランダム・アクセス・メモリ（ＤＲＡＭ：dynamic random access memory）、またはフラッシュ）を表すために含められている。ストレージ８３０は、一般に、ハード・ディスク・ドライブ、半導体デバイス（ＳＳＤ：solid state device）、取り外し可能メモリ・カード、光ストレージ、またはフラッシュ・メモリ・デバイスなどの、不揮発性メモリを表すために含められている。代替の実施形態では、ストレージ８３０は、Ｉ／Ｏデバイス・インターフェイス８１０を介してコンピュータ８００に接続されたか、またはネットワーク・インターフェイス８１５を介してネットワーク８５０に接続された、ストレージ領域ネットワーク（ＳＡＮ：storage area-network）デバイス、クラウド、またはその他のデバイスに置き換えられることができる。

一部の実施形態では、メモリ８２５は命令８６０を格納する。しかし、さまざまな実施形態では、命令８６０は、メモリ８２５およびストレージ８３０それぞれに部分的に格納されるか、またはメモリ８２５もしくはストレージ８３０に完全に格納されるか、またはネットワーク・インターフェイス８１５を介してネットワーク８５０を経由してアクセスされる。

命令８６０は、図３～５の方法のうちのいずれかの一部またはすべてを実行すること、または図１～２もしくは６～７またはその両方で説明された機能を実装すること、あるいはその両方のためのコンピュータ可読命令およびコンピュータ実行可能命令であることができる。一部の実施形態では、命令８６０は、非線形の性能低下予測プロトコル（または命令、メカニズムなど）または故障予測プロトコル（または命令、メカニズムなど）と呼ばれることができる。命令８６０がメモリ８２５内に示されているが、命令８６０は、多数のコンピュータ可読ストレージ媒体にわたって集合的に格納された、１つまたは複数のＣＰＵ８０５によって実行可能なプログラム命令を含むことができる。

さまざまな実施形態では、Ｉ／Ｏデバイス８１２は、情報を提示し、入力を受信することができるインターフェイスを含む。例えば、Ｉ／Ｏデバイス８１２は、情報をコンピュータ８００と対話しているユーザに提示し、ユーザから入力を受信することができる。

コンピュータ８００は、ネットワーク・インターフェイス８１５を介してネットワーク８５０に接続される。ネットワーク８５０は、物理的ネットワーク、無線ネットワーク、セルラー・ネットワーク、または異なるネットワークを含むことができる。

本開示にはクラウド・コンピューティングに関する詳細な説明が含まれているが、本明細書において示された内容の実装は、クラウド・コンピューティング環境に限定されないと理解されるべきである。むしろ、本発明の実施形態は、現在既知であるか、または今後開発される任意のその他の種類のコンピューティング環境と組み合わせて実装できる。

クラウド・コンピューティングは、構成可能な計算リソース（例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、およびサービス）の共有プールへの便利なオンデマンドのネットワーク・アクセスを可能にするためのサービス提供モデルであり、管理上の手間またはサービス・プロバイダとのやりとりを最小限に抑えて、これらのリソースを迅速にプロビジョニングおよび解放することができる。このクラウド・モデルは、少なくとも５つの特徴、少なくとも３つのサービス・モデル、および少なくとも４つのデプロイメント・モデルを含んでよい。

特徴は、次のとおりである。
オンデマンドのセルフ・サービス：クラウドの利用者は、サーバの時間、ネットワーク・ストレージなどの計算能力を一方的に、サービス・プロバイダとの人間的なやりとりを必要とせず、必要に応じて自動的にプロビジョニングすることができる。
幅広いネットワーク・アクセス：能力は、ネットワークを経由して利用可能であり、標準的なメカニズムを使用してアクセスできるため、異種のシン・クライアントまたはシック・クライアント・プラットフォーム（例えば、携帯電話、ラップトップ、およびＰＤＡ）による利用を促進する。
リソース・プール：プロバイダの計算リソースは、プールされ、マルチテナント・モデルを使用して複数の利用者に提供される。さまざまな物理的および仮想的リソースが、要求に従って動的に割り当ておよび再割り当てされる。場所に依存しないという感覚があり、利用者は通常、提供されるリソースの正確な場所に関して管理することも知ることもないが、さらに高い抽象レベルでは、場所（例えば、国、州、またはデータセンター）を指定できることがある。

迅速な順応性：能力は、迅速かつ柔軟に、場合によっては自動的にプロビジョニングされ、素早くスケールアウトし、迅速に解放されて素早くスケールインすることができる。プロビジョニングに使用できる能力は、利用者には、多くの場合、任意の量をいつでも無制限に購入できるように見える。

測定されるサービス：クラウド・システムは、計測機能を活用することによって、サービスの種類（例えば、ストレージ、処理、帯域幅、およびアクティブなユーザのアカウント）に適した抽象レベルで、リソースの使用を自動的に制御および最適化する。リソースの使用状況は監視、制御、および報告することができ、利用されるサービスのプロバイダと利用者の両方に透明性が提供される。

サービス・モデルは、次のとおりである。
ＳａａＳ（Software as a Service）：利用者に提供される能力は、クラウド・インフラストラクチャ上で稼働しているプロバイダのアプリケーションの利用である。それらのアプリケーションは、Ｗｅｂブラウザ（例えば、Ｗｅｂベースの電子メール）などのシン・クライアント・インターフェイスを介して、さまざまなクライアント・デバイスからアクセスできる。利用者は、ネットワーク、サーバ、オペレーティング・システム、ストレージ、または個々のアプリケーション機能を含む基盤になるクラウド・インフラストラクチャを、限定的なユーザ固有のアプリケーション構成設定を行う可能性を除き、管理することも制御することもない。
ＰａａＳ（Platform as a Service）：利用者に提供される能力は、プロバイダによってサポートされるプログラミング言語およびツールを使用して作成された、利用者が作成または取得したアプリケーションをクラウド・インフラストラクチャにデプロイすることである。利用者は、ネットワーク、サーバ、オペレーティング・システム、またはストレージを含む基盤になるクラウド・インフラストラクチャを管理することも制御することもないが、デプロイされたアプリケーション、および場合によってはアプリケーション・ホスティング環境の構成を制御することができる。
ＩａａＳ（Infrastructure as a Service）：利用者に提供される能力は、処理、ストレージ、ネットワーク、およびその他の基本的な計算リソースのプロビジョニングであり、利用者は、オペレーティング・システムおよびアプリケーションを含むことができる任意のソフトウェアをデプロイして実行できる。利用者は、基盤になるクラウド・インフラストラクチャを管理することも制御することもないが、オペレーティング・システム、ストレージ、およびデプロイされたアプリケーションを制御することができ、場合によっては、選択されたネットワーク・コンポーネント（例えば、ホスト・ファイアウォール）を限定的に制御できる。

デプロイメント・モデルは、次のとおりである。
プライベート・クラウド：このクラウド・インフラストラクチャは、ある組織のためにのみ運用される。この組織またはサード・パーティによって管理することができ、オンプレミスまたはオフプレミスに存在することができる。
コミュニティ・クラウド：このクラウド・インフラストラクチャは、複数の組織によって共有され、関心事（例えば、任務、セキュリティ要件、ポリシー、およびコンプライアンスに関する考慮事項）を共有している特定のコミュニティをサポートする。これらの組織またはサード・パーティによって管理することができ、オンプレミスまたはオフプレミスに存在することができる。
パブリック・クラウド：このクラウド・インフラストラクチャは、一般ユーザまたは大規模な業界団体が使用できるようになっており、クラウド・サービスを販売する組織によって所有される。
ハイブリッド・クラウド：このクラウド・インフラストラクチャは、データとアプリケーションの移植を可能にする標準化された技術または独自の技術（例えば、クラウド間の負荷バランスを調整するためのクラウド・バースト）によって固有の実体を残したまま互いに結合された２つ以上のクラウド（プライベート、コミュニティ、またはパブリック）の複合である。

クラウド・コンピューティング環境は、ステートレス、疎結合、モジュール性、および意味的相互運用性に重点を置いたサービス指向の環境である。クラウド・コンピューティングの中心になるのは、相互接続されたノードのネットワークを含んでいるインフラストラクチャである。

ここで図９を参照すると、例示的なクラウド・コンピューティング環境５０が示されている。図示されているように、クラウド・コンピューティング環境５０は、クラウドの利用者によって使用されるローカル・コンピューティング・デバイス（例えば、パーソナル・デジタル・アシスタント（ＰＤＡ：personal digital assistant）または携帯電話５４Ａ、デスクトップ・コンピュータ５４Ｂ、ラップトップ・コンピュータ５４Ｃ、または自動車コンピュータ・システム５４Ｎ、あるいはその組み合わせなど）が通信できる１つまたは複数のクラウド・コンピューティング・ノード１０を含んでいる。ノード１０は、互いに通信してよい。ノード１０は、１つまたは複数のネットワーク内で、本明細書において前述されたプライベート・クラウド、コミュニティ・クラウド、パブリック・クラウド、またはハイブリッド・クラウド、あるいはこれらの組み合わせなどに、物理的または仮想的にグループ化されてよい（図示されていない）。これによって、クラウド・コンピューティング環境５０は、クラウドの利用者がローカル・コンピューティング・デバイス上でリソースを維持する必要のないインフラストラクチャ、プラットフォーム、またはＳａａＳ、あるいはその組み合わせを提供できる。図９に示されたコンピューティング・デバイス５４Ａ～Ｎの種類は、例示のみが意図されており、コンピューティング・ノード１０およびクラウド・コンピューティング環境５０は、任意の種類のネットワークまたはネットワーク・アドレス可能な接続（例えば、Ｗｅｂブラウザを使用した接続）あるいはその両方を経由して任意の種類のコンピュータ制御デバイスと通信することができると理解される。

ここで図１０を参照すると、クラウド・コンピューティング環境５０（図９）によって提供される機能的抽象レイヤのセットが示されている。図１０に示されたコンポーネント、レイヤ、および機能は、例示のみが意図されており、本発明の実施形態がこれらに限定されないということが、あらかじめ理解されるべきである。図示されているように、次のレイヤおよび対応する機能が提供される。

ハードウェアおよびソフトウェア・レイヤ６０は、ハードウェア・コンポーネントおよびソフトウェア・コンポーネントを含む。ハードウェア・コンポーネントの例としては、メインフレーム６１、ＲＩＳＣ（Reduced Instruction Set Computer）アーキテクチャベースのサーバ６２、サーバ６３、ブレード・サーバ６４、ストレージ・デバイス６５、ならびにネットワークおよびネットワーク・コンポーネント６６が挙げられる。一部の実施形態では、ソフトウェア・コンポーネントは、ネットワーク・アプリケーション・サーバ・ソフトウェア６７およびデータベース・ソフトウェア６８を含む。

仮想化レイヤ７０は、仮想サーバ７１、仮想ストレージ７２、仮想プライベート・ネットワークを含む仮想ネットワーク７３、仮想アプリケーションおよびオペレーティング・システム７４、ならびに仮想クライアント７５などの仮想的実体を提供できる抽象レイヤを備える。

一例を挙げると、管理レイヤ８０は、以下で説明される機能を提供することができる。リソース・プロビジョニング８１は、クラウド・コンピューティング環境内でタスクを実行するために利用される計算リソースおよびその他のリソースの動的調達を行う。計測および価格設定８２は、クラウド・コンピューティング環境内でリソースが利用される際のコスト追跡、およびそれらのリソースの利用に対する請求書またはインボイスの送付を行う。一例を挙げると、それらのリソースは、アプリケーション・ソフトウェア・ライセンスを含んでよい。セキュリティは、クラウドの利用者およびタスクのＩＤ検証を行うとともに、データおよびその他のリソースの保護を行う。ユーザ・ポータル８３は、クラウド・コンピューティング環境へのアクセスを利用者およびシステム管理者に提供する。サービス・レベル管理８４は、必要なサービス・レベルを満たすように、クラウドの計算リソースの割り当てと管理を行う。サービス水準合意（ＳＬＡ：Service Level Agreement）計画および実行８５は、今後の要求が予想されるクラウドの計算リソースの事前準備および調達を、ＳＬＡに従って行う。

ワークロード・レイヤ９０は、クラウド・コンピューティング環境で利用できる機能の例を示している。このレイヤから提供されてよいワークロードおよび機能の例としては、マッピングおよびナビゲーション９１、ソフトウェア開発およびライフサイクル管理９２、仮想クラスルーム教育の配信９３、データ解析処理９４、トランザクション処理９５、ならびに非線形の性能低下予測９６が挙げられる。

本発明の実施形態は、任意の可能な統合の技術的詳細レベルで、システム、方法、またはコンピュータ・プログラム製品、あるいはその組み合わせであることができる。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を含んでいるコンピュータ可読ストレージ媒体を含むことができる。

コンピュータ可読ストレージ媒体は、命令実行デバイスによって使用するための命令を保持および格納できる有形のデバイスであることができる。コンピュータ可読ストレージ媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイス、またはこれらの任意の適切な組み合わせであることができるが、これらに限定されない。コンピュータ可読ストレージ媒体のさらに具体的な例の非網羅的リストは、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ（ＲＡＭ：random access memory）、読み取り専用メモリ（ＲＯＭ：read-only memory）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭ：erasable programmable read-only memoryまたはフラッシュ・メモリ）、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ：static random access memory）、ポータブル・コンパクト・ディスク読み取り専用メモリ（ＣＤ－ＲＯＭ：compact disc read-only memory）、デジタル・バーサタイル・ディスク（ＤＶＤ：digital versatile disk）、メモリ・スティック、フロッピー（Ｒ）・ディスク、命令が記録されているパンチカードまたは溝の中の隆起構造などの機械的にエンコードされるデバイス、およびこれらの任意の適切な組み合わせを含む。本明細書において使用されるとき、コンピュータ可読ストレージ媒体は、それ自体が、電波またはその他の自由に伝搬する電磁波、導波管またはその他の送信媒体を伝搬する電磁波（例えば、光ファイバ・ケーブルを通過する光パルス）、あるいはワイヤを介して送信される電気信号などの一過性の信号であると解釈されるべきではない。

本明細書に記載されたコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体から各コンピューティング・デバイス／処理デバイスへ、またはネットワーク（例えば、インターネット、ローカル・エリア・ネットワーク、広域ネットワーク、または無線ネットワーク、あるいはその組み合わせ）を介して外部コンピュータまたは外部ストレージ・デバイスへダウンロードされることができる。このネットワークは、銅伝送ケーブル、光伝送ファイバ、無線送信、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組み合わせを備えることができる。各コンピューティング・デバイス／処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェイスは、コンピュータ可読プログラム命令をネットワークから受信し、それらのコンピュータ可読プログラム命令を各コンピューティング・デバイス／処理デバイス内のコンピュータ可読ストレージ媒体に格納するために転送する。

本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ（ＩＳＡ：instruction-set-architecture）命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路のための構成データ、あるいは、Ｓｍａｌｌｔａｌｋ（Ｒ）、Ｃ＋＋などのオブジェクト指向プログラミング言語、および「Ｃ」プログラミング言語または同様のプログラミング言語などの手続き型プログラミング言語を含む１つまたは複数のプログラミング言語の任意の組み合わせで記述されたソース・コードまたはオブジェクト・コードであることができる。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で全体的に実行すること、ユーザのコンピュータ上でスタンドアロン・ソフトウェア・パッケージとして部分的に実行すること、ユーザのコンピュータ上およびリモート・コンピュータ上でそれぞれ部分的に実行すること、あるいはリモート・コンピュータ上またはサーバ上で全体的に実行することができる。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク（ＬＡＮ：local area network）または広域ネットワーク（ＷＡＮ：wide area network）を含む任意の種類のネットワークを介してユーザのコンピュータに接続されることができ、または接続は、（例えば、インターネット・サービス・プロバイダを使用してインターネットを介して）外部コンピュータに対して行われることができる。一部の実施形態では、本発明の態様を実行するために、例えばプログラマブル論理回路、フィールドプログラマブル・ゲート・アレイ（ＦＰＧＡ：field-programmable gate array）、またはプログラマブル・ロジック・アレイ（ＰＬＡ：programmable logic array）を含む電子回路は、コンピュータ可読プログラム命令の状態情報を利用することによって、電子回路をカスタマイズするためのコンピュータ可読プログラム命令を実行することができる。

本発明の態様は、本明細書において、本発明の実施形態に従って、方法、装置（システム）、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、ならびにフローチャート図またはブロック図あるいはその両方に含まれるブロックの組み合わせが、コンピュータ可読プログラム命令によって実装されることができるということが理解されるであろう。

これらのコンピュータ可読プログラム命令は、コンピュータまたはその他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックに指定される機能／動作を実施する手段を作り出すべく、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提供されてマシンを作り出すものであることができる。これらのコンピュータ可読プログラム命令は、命令が格納されたコンピュータ可読ストレージ媒体がフローチャートまたはブロック図あるいはその両方のブロックに指定される機能／動作の態様を実施する命令を含んでいる製品を備えるように、コンピュータ可読ストレージ媒体に格納され、コンピュータ、プログラム可能なデータ処理装置、または他のデバイス、あるいはその組み合わせに特定の方式で機能するように指示できるものであることもできる。

コンピュータ可読プログラム命令は、コンピュータ上、その他のプログラム可能な装置上、またはその他のデバイス上で実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックに指定される機能／動作を実施するように、コンピュータ、その他のプログラム可能なデータ処理装置、またはその他のデバイスに読み込まれることもでき、それによって、一連の動作可能なステップを、コンピュータ上、その他のプログラム可能な装置上、またはコンピュータ実装プロセスを生成するその他のデバイス上で実行させる。

図内のフローチャートおよびブロック図は、本発明のさまざまな実施形態に従って、システム、方法、およびコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能、および動作を示す。これに関連して、フローチャートまたはブロック図内の各ブロックは、規定された論理機能を実装するための１つまたは複数の実行可能な命令を含んでいる、命令のモジュール、セグメント、またはサブセットを表すことができる。一部の代替の実装では、ブロックに示された機能は、図に示された順序とは異なる順序で発生することができる。例えば、連続して示された２つのブロックは、実際には、含まれている機能に応じて、実質的に同時に実行されるか、または場合によっては逆の順序で実行され得る。ブロック図またはフローチャート図あるいはその両方の各ブロック、ならびにブロック図またはフローチャート図あるいはその両方に含まれるブロックの組み合わせは、規定された機能もしくは動作を実行するか、または専用ハードウェアとコンピュータ命令の組み合わせを実行する専用ハードウェアベースのシステムによって実装されることができるということにも注意する。

ＣＤ、ＤＶＤなどのストレージ媒体を読み込むことを介して、クライアント、サーバ、およびプロキシ・コンピュータに手動で直接読み込むことによって、プロセス・ソフトウェア（例えば、図３～５に関して説明された方法の任意の部分を実行するか、または図１～２もしくは６～７またはその両方で説明された機能の任意の部分を実装するか、あるいはその両方を行うように構成された、図８の命令８６０に格納された命令のいずれかまたは任意のソフトウェアあるいはその両方）がデプロイされることができるということが理解されるが、プロセス・ソフトウェアは、プロセス・ソフトウェアを中央サーバまたは中央サーバのグループに送信することによって、コンピュータ・システムに自動的または半自動的にデプロイされることもできる。その後、プロセス・ソフトウェアは、プロセス・ソフトウェアを実行するクライアント・コンピュータにダウンロードされる。代替として、プロセス・ソフトウェアは、電子メールを介してクライアント・システムに直接送信される。その後、プロセス・ソフトウェアは、ディレクトリに分離されるか、またはプロセス・ソフトウェアをディレクトリに分離するプログラム命令のセットを実行することによって、ディレクトリに読み込まれる。別の代替手段は、プロセス・ソフトウェアをクライアント・コンピュータのハード・ドライブ上のディレクトリに直接送信することである。プロキシ・サーバが存在する場合、プロセスは、プロキシ・サーバのコードを選択し、プロキシ・サーバのコードを配置するコンピュータを決定し、プロキシ・サーバのコードを送信し、その後、プロキシ・サーバのコードをプロキシ・コンピュータにインストールする。プロセス・ソフトウェアは、プロキシ・サーバに送信されてから、プロキシ・サーバに格納される。

本発明の実施形態は、クライアント企業、非営利組織、政府機関、内部組織構造などとのサービス契約の一部として配信されることもできる。これらの実施形態は、本明細書に記載された方法の一部またはすべてを実装するソフトウェア、ハードウェア、およびＷｅｂサービスを実行するようにコンピュータ・システムを構成することと、そのようなソフトウェア、ハードウェア、およびＷｅｂサービスをデプロイすることとを含むことができる。これらの実施形態は、クライアントの動作を解析することと、解析に応答して推奨を作成することと、推奨のサブセットを実施するシステムを構築することと、システムを既存のプロセスおよびインフラストラクチャに統合することと、システムの使用を計測することと、費用をシステムのユーザの割り当てることと、請求書を送付するか、インボイスを送付する（例えば、インボイスを生成する）か、またはその他の方法でシステムの使用に対する支払いを受信することとを含むこともできる。

本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、さまざまな実施形態を制限することを意図していない。本明細書において使用されるとき、単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈で特に明示的に示されない限り、複数形も含むよう意図されている。「含む」または「含んでいる」あるいはその両方の用語は、本明細書で使用される場合、記載された機能、整数、ステップ、動作、要素、またはコンポーネント、あるいはその組み合わせの存在を示すが、１つまたは複数のその他の機能、整数、ステップ、動作、要素、コンポーネント、またはこれらのグループ、あるいはその組み合わせの存在または追加を除外していないということが、さらに理解されるであろう。さまざまな実施形態のうちの例示的な実施形態の前の詳細な説明では、本明細書の一部を形成する（類似する番号が類似する要素を表す）添付の図面への参照が行われ、特定の実施形態例が例として示されており、さまざまな実施形態が実践されることができる。これらの実施形態は、当業者が実施形態を実践できるようにするために十分詳細に説明されたが、他の実施形態が使用されることができ、さまざまな実施形態の範囲から逸脱することなく、論理的変更、機械的変更、電気的変更、およびその他の変更が行われることができる。前の説明では、さまざまな実施形態の完全な理解を可能にするために、多くの特定の詳細が示された。しかし、さまざまな実施形態は、それらの特定の詳細なしで実践されることができる。他の例では、実施形態を不明瞭にしないために、周知の回路、構造、および技術は詳細に示されていない。

「実施形態」という用語の異なる事例は、本明細書内で使用されるとき、同じ実施形態を必ずしも参照しないが、同じ実施形態を参照することもできる。本明細書において示されたか、または説明されたすべてのデータおよびデータ構造は単なる例であり、他の実施形態では、異なるデータの量、データの種類、フィールド、フィールドの数および種類、フィールド名、行の数および種類、レコード、エントリ、またはデータの編成が使用されることができる。加えて、分離したデータ構造が必要でなくてよいように、任意のデータが論理と組み合わせられることができる。したがって、前の詳細な説明は、限定する意味で受け取られるべきではない。

本開示のさまざまな実施形態の説明は、例示の目的で提示されているが、網羅的であることは意図されておらず、開示された実施形態に制限されない。説明された実施形態の範囲および思想から逸脱しない多くの変更および変形が、当業者にとって明らかであろう。本明細書で使用された用語は、実施形態の原理、実際の適用、または市場で見られる技術を超える技術的改良を最も適切に説明するため、または他の当業者が本明細書で開示された実施形態を理解できるようにするために選択されている。

本開示は、特定の実施形態に関して説明されたが、実施形態の変更および修正が当業者にとって明らかになるということが予想される。したがって、以下の特許請求の範囲が、そのようなすべての変更および修正を、本開示の真の思想および範囲に含まれるとして、対象にすると解釈されるということが意図される。

本開示で説明されたすべての利点は例示的な利点であり、本開示の思想および範囲内にとどまりながら、説明された利点のすべてまたは一部を実現するか、あるいはいずれも実現しない本開示の実施形態が存在することができる。

以下では、本開示の一部の態様を示すために、実施例の非限定的リストが提供される。実施例１はコンピュータ実装方法である。この方法は、新しいデータ・サンプルを故障予測モデルに入力することであって、故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、各トレーニング・サンプルが複数のクラスタにクラスタ化され、複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、入力することと、新しいデータ・サンプルを含んでいる複数のクラスタのうちの第１のクラスタの第１の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタのうちのクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することとを含む。

実施例２は、任意選択的特徴を含んでいるか、または除外している、実施例１の方法を含む。この例では、分類が、新しいデータ・サンプルに関連付けられた資産の摩耗に関連する性能低下の可能性を示す。

実施例３は、任意選択的特徴を含んでいるか、または除外している、実施例１～２のうちのいずれか１つの方法を含む。この例では、ルックバック・ウィンドウが、各トレーニング・サンプルに含めるための連続的な前のデータ点の数を定義する。

実施例４は、任意選択的特徴を含んでいるか、または除外している、実施例１～３のうちのいずれか１つの方法を含む。この例では、予測範囲が、未来の事前に定義された時間の量を定義し、事前に定義された時間の量だけ未来の各データ点の各ラベルが、各トレーニング・サンプルに関連付けられる。

実施例５は、任意選択的特徴を含んでいるか、または除外している、実施例１～４のうちのいずれか１つの方法を含む。この例では、Ｋ平均クラスタ化を使用して各トレーニング・サンプルがクラスタ化される。

実施例６は、任意選択的特徴を含んでいるか、または除外している、実施例１～５のうちのいずれか１つの方法を含む。この例では、リモートのデータ処理システムから故障予測システムにダウンロードされたソフトウェアに従って、故障予測システムによって方法が実行される。任意選択的に、この方法は、ソフトウェアの使用を計測することと、使用の計測に基づいてインボイスを生成することとをさらに含む。

実施例７はシステムである。このシステムは、１つまたは複数のプロセッサと、プログラム命令を格納している１つまたは複数のコンピュータ可読ストレージ媒体とを含み、プログラム命令は、１つまたは複数のプロセッサによって実行された場合に、１つまたは複数のプロセッサに、新しいデータ・サンプルを故障予測モデルに入力することであって、故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、各トレーニング・サンプルが複数のクラスタにクラスタ化され、複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、入力することと、新しいデータ・サンプルを含んでいる複数のクラスタのうちの第１のクラスタの第１の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタのうちのクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することとを含んでいる方法を実行させるように構成される。

実施例８は、任意選択的特徴を含んでいるか、または除外している、実施例７のシステムを含む。この例では、分類が、新しいデータ・サンプルに関連付けられた資産の摩耗に関連する性能低下の可能性を示す。

実施例９は、任意選択的特徴を含んでいるか、または除外している、実施例７～８のうちのいずれか１つのシステムを含む。この例では、ルックバック・ウィンドウが、各トレーニング・サンプルに含めるための連続的な前のデータ点の数を定義する。

実施例１０は、任意選択的特徴を含んでいるか、または除外している、実施例７～９のうちのいずれか１つのシステムを含む。この例では、予測範囲が、未来の事前に定義された時間の量を定義し、事前に定義された時間の量だけ未来の各データ点の各ラベルが、各トレーニング・サンプルに関連付けられる。

実施例１１は、任意選択的特徴を含んでいるか、または除外している、実施例７～１０のうちのいずれか１つのシステムを含む。この例では、Ｋ平均クラスタ化を使用して各トレーニング・サンプルがクラスタ化される。

実施例１２はコンピュータ・プログラム製品である。コンピュータ・プログラム製品は、１つまたは複数のコンピュータ可読ストレージ媒体と、１つまたは複数のコンピュータ可読ストレージ媒体に集合的に格納されたプログラム命令とを含み、プログラム命令は、１つまたは複数のプロセッサに、新しいデータ・サンプルを故障予測モデルに入力することであって、故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、各トレーニング・サンプルが複数のクラスタにクラスタ化され、複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、入力することと、新しいデータ・サンプルを含んでいる複数のクラスタのうちの第１のクラスタの第１の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタ内のクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することとを含んでいる方法を実行させるように構成された命令を含む。

実施例１３は、任意選択的特徴を含んでいるか、または除外している、実施例１２のコンピュータ・プログラム製品を含む。この例では、分類が、新しいデータ・サンプルに関連付けられた資産の摩耗に関連する性能低下の可能性を示す。

実施例１４は、任意選択的特徴を含んでいるか、または除外している、実施例１２～１３のうちのいずれか１つのコンピュータ・プログラム製品を含む。この例では、ルックバック・ウィンドウが、各トレーニング・サンプルに含めるための連続的な前のデータ点の数を定義する。

実施例１５は、任意選択的特徴を含んでいるか、または除外している、実施例１２～１４のうちのいずれか１つのコンピュータ・プログラム製品を含む。この例では、予測範囲が、未来の事前に定義された時間の量を定義し、事前に定義された時間の量だけ未来の各データ点の各ラベルが、各トレーニング・サンプルに関連付けられる。

実施例１６は、任意選択的特徴を含んでいるか、または除外している、実施例１２～１５のうちのいずれか１つのコンピュータ・プログラム製品を含む。この例では、Ｋ平均クラスタ化を使用して各トレーニング・サンプルがクラスタ化される。

実施例１７は、一軸ねじポンプ（ＰＣＰ）の摩耗に関連する劣化を予測するためのコンピュータ実装方法であり、この方法は、ＰＣＰの新しいデータ・サンプルを、ＰＣＰの摩耗に関連する劣化を予測するように構成されたモデルに入力することであって、このモデルが、ラベル付けされた過去のＰＣＰデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、各トレーニング・サンプルが複数のクラスタにクラスタ化され、複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、入力することと、新しいデータ・サンプルを含んでいる複数のクラスタのうちの第１のクラスタの第１の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタ内のクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することとを含み、この分類は、ＰＣＰの摩耗に関連する劣化を示す。

実施例１８は、一軸ねじポンプ（ＰＣＰ）の摩耗に関連する劣化を予測するためのコンピュータ実装方法であり、この方法は、１つまたは複数のＰＣＰに関連付けられた過去のデータの２値のラベル付けを実行することによって、ラベル付けされた過去のデータを生成することと、ルックバック・ウィンドウおよび予測範囲をラベル付けされた過去のデータの各データ点に適用することによって、複数のトレーニング・データ・サンプルを生成することと、複数のトレーニング・データ・サンプルを複数のクラスタにクラスタ化することと、複数のクラスタのうちの各クラスタのクラスタ・スコアを計算することと、ＰＣＰの新しいデータ・サンプルを複数のクラスタのうちの第１のクラスタに割り当てることと、第１のクラスタに関連付けられたクラスタ・スコアに基づいて、分類を新しいデータ・サンプルに割り当てることとを含み、この分類は、ＰＣＰの未来の摩耗に関連する劣化の可能性を示す。

実施例１９は、任意選択的特徴を含んでいるか、または除外している、実施例１８の方法を含む。この例では、ラベル付けされた過去のデータが、既知のポンプ交換日の前の既定の期間の間、故障としてラベル付けされる。

実施例２０は、任意選択的特徴を含んでいるか、または除外している、実施例１８～１９のうちのいずれか１つの方法を含む。この例では、ラベル付けされた過去のデータは、ポンプ速度データ、ポンプ・トルク・データ、ケーシング圧データ、生産速度データ、および保守記録を含む。

実施例２１は、任意選択的特徴を含んでいるか、または除外している、実施例１８～２０のうちのいずれか１つの方法を含む。この例では、各クラスタのクラスタ・スコアを計算することは、第１のクラスタの正常スコアを計算することであって、正常スコアが、第１のクラスタ内の正常状態に関連付けられたトレーニング・データ・サンプルの第１の比率を、複数のトレーニング・データ・サンプルにおける正常状態に関連付けられたトレーニング・データ・サンプルの第２の比率で割った値である、計算することと、第１のクラスタの異常スコアを計算することであって、異常スコアが、第１のクラスタ内の劣化状態に関連付けられたトレーニング・データ・サンプルの第３の比率を、複数のトレーニング・データ・サンプルにおける劣化状態に関連付けられたトレーニング・データ・サンプルの第４の比率で割った値である、計算することとをさらに含む。任意選択的に、分類は、第１のクラスタの正常スコアまたは異常スコアのより大きい値に基づく。

実施例２２は、任意選択的特徴を含んでいるか、または除外している、実施例１８～２１のうちのいずれか１つの方法を含む。この例では、この方法は、新しいデータ・サンプルに関する故障信号を生成することを含み、故障信号は、既定の数の前のデータ点にわたる新しいデータ・サンプルに関する平均異常スコアを含む。任意選択的に、故障信号を生成することは、異常スコアより大きい正常スコアを有している複数のクラスタのうちのクラスタの平均異常スコアを計算することと、既定の数の前のデータ点の各々について、平均異常スコアより大きい第１のクラスタの異常スコアを有しているデータ点に１の値を関連付けることと、平均異常スコアより小さい第１のクラスタの異常スコアを有しているデータ点に０の値を関連付けることと、既定の数の前のデータ点の各々に関連付けられた１の値および０の値の平均値として故障信号を計算することとをさらに含む。

Claims

新しいデータ・サンプルを故障予測モデルに入力することであって、前記故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、前記各トレーニング・サンプルが複数のクラスタにクラスタ化され、前記複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、前記入力することと、
前記複数のクラスタのうちの前記新しいデータ・サンプルを含んでいる第１のクラスタの第１の異常スコアを、前記異常スコアより大きい前記正常スコアを有している前記複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、前記新しいデータ・サンプルに関連付けられた分類を出力することとを含む、コンピュータ実装方法。
前記分類が、前記新しいデータ・サンプルに関連付けられた資産の摩耗に関連する性能低下の可能性を示す、請求項１に記載の方法。
前記ルックバック・ウィンドウが、各トレーニング・サンプルに含めるための連続的な前のデータ点の数を定義する、請求項１に記載の方法。
前記予測範囲が、未来の事前に定義された時間の量を定義し、前記事前に定義された時間の量だけ未来の各データ点の各ラベルが、前記各トレーニング・サンプルに関連付けられる、請求項１に記載の方法。
Ｋ平均クラスタ化を使用して前記各トレーニング・サンプルがクラスタ化される、請求項１に記載の方法。
リモートのデータ処理システムから故障予測システムにダウンロードされたソフトウェアに従って、前記故障予測システムによって前記方法が実行される、請求項１に記載の方法。
前記方法が、
前記ソフトウェアの使用を計測することと、
前記使用の計測に基づいてインボイスを生成することとをさらに含む、請求項６に記載の方法。
前記方法が、一軸ねじポンプ（ＰＣＰ）の摩耗に関連する劣化を予測するためのものであり、前記入力ステップが、ＰＣＰの新しいデータ・サンプルを、前記ＰＣＰの摩耗に関連する劣化を予測するように構成されたモデルに入力することを含み、前記モデルが、ラベル付けされた過去のＰＣＰデータセットを使用してトレーニングされ、前記出力ステップの間に出力された前記分類が、前記ＰＣＰの前記摩耗に関連する劣化を示す、請求項１に記載の方法。
１つまたは複数のＰＣＰに関連付けられた過去のデータの２値のラベル付けを実行することによって、前記ラベル付けされた過去のデータを生成することを含み、前記複数のトレーニング・データ・サンプルが、ルックバック・ウィンドウおよび予測範囲を前記ラベル付けされた過去のデータの各データ点に適用することによって作成され、前記方法が、
前記複数のクラスタの各クラスタについて計算されるクラスタ・スコアを計算することであって、前記クラスタ・スコアが前記正常スコアおよび前記異常スコアである、前記計算することと、
ＰＣＰの前記新しいデータ・サンプルを前記複数のクラスタのうちの第１のクラスタに割り当てることと、
前記第１のクラスタに関連付けられたクラスタ・スコアに基づいて分類を前記新しいデータ・サンプルに割り当てることとを含む、請求項８に記載の方法。
前記ラベル付けされた過去のデータが、既知のポンプ交換日の前の既定の期間の間、故障としてラベル付けされる、請求項９に記載の方法。
前記ラベル付けされた過去のデータが、ポンプ速度データ、ポンプ・トルク・データ、ケーシング圧データ、生産速度データ、および保守記録を含む、請求項９に記載の方法。
前記各クラスタの前記クラスタ・スコアを計算することが、
前記第１のクラスタの正常スコアを計算することであって、前記正常スコアが、前記第１のクラスタ内の正常状態に関連付けられたトレーニング・データ・サンプルの第１の比率を、前記複数のトレーニング・データ・サンプルにおける前記正常状態に関連付けられたトレーニング・データ・サンプルの第２の比率で割った値である、前記計算することと、
前記第１のクラスタの異常スコアを計算することであって、前記異常スコアが、前記第１のクラスタ内の劣化状態に関連付けられたトレーニング・データ・サンプルの第３の比率を、前記複数のトレーニング・データ・サンプルにおける前記劣化状態に関連付けられたトレーニング・データ・サンプルの第４の比率で割った値である、前記計算することとをさらに含む、請求項９に記載の方法。
前記分類が、前記第１のクラスタの前記正常スコアまたは前記異常スコアのより大きい値に基づく、請求項１２に記載の方法。
前記方法が、
前記新しいデータ・サンプルに関する故障信号を生成することをさらに含み、前記故障信号が、既定の数の前のデータ点にわたる前記新しいデータ・サンプルに関する平均異常スコアを含む、請求項９に記載の方法。
前記故障信号を生成することが、
異常スコアより大きい正常スコアを有している前記複数のクラスタのクラスタの平均異常スコアを計算することと、
前記既定の数の前のデータ点の各々について、前記平均異常スコアより大きい前記第１のクラスタの異常スコアを有しているデータ点に１の値を関連付けることと、前記平均異常スコアより小さい前記第１のクラスタの異常スコアを有しているデータ点に０の値を関連付けることと、
前記既定の数の前のデータ点の各々に関連付けられた前記１の値および０の値の平均値として前記故障信号を計算することとをさらに含む、請求項１４に記載の方法。
１つまたは複数のプロセッサと、
プログラム命令を格納している１つまたは複数のコンピュータ可読ストレージ媒体とを備えているシステムであって、前記プログラム命令が、前記１つまたは複数のプロセッサによって実行された場合に、前記１つまたは複数のプロセッサに、
新しいデータ・サンプルを故障予測モデルに入力することであって、前記故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、前記各トレーニング・サンプルが複数のクラスタにクラスタ化され、前記複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、前記入力することと、
前記複数のクラスタのうちの前記新しいデータ・サンプルを含んでいる第１のクラスタの第１の異常スコアを、前記異常スコアより大きい前記正常スコアを有している前記複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、前記新しいデータ・サンプルに関連付けられた分類を出力することとを含んでいる方法を実行させるように構成される、システム。
前記分類が、前記新しいデータ・サンプルに関連付けられた資産の摩耗に関連する性能低下の可能性を示す、請求項１６に記載のシステム。
前記ルックバック・ウィンドウが、各トレーニング・サンプルに含めるための連続的な前のデータ点の数を定義する、請求項１６に記載のシステム。
前記予測範囲が、未来の事前に定義された時間の量を定義し、前記事前に定義された時間の量だけ未来の各データ点の各ラベルが、前記各トレーニング・サンプルに関連付けられる、請求項１６に記載のシステム。
Ｋ平均クラスタ化を使用して前記各トレーニング・サンプルがクラスタ化される、請求項１６に記載のシステム。
１つまたは複数のコンピュータ可読ストレージ媒体と、前記１つまたは複数のコンピュータ可読ストレージ媒体に集合的に格納されたプログラム命令とを備えているコンピュータ・プログラム製品であって、前記プログラム命令が、１つまたは複数のプロセッサに、
新しいデータ・サンプルを故障予測モデルに入力することであって、前記故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、前記各トレーニング・サンプルが複数のクラスタにクラスタ化され、前記複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、前記入力することと、
前記複数のクラスタのうちの前記新しいデータ・サンプルを含んでいる第１のクラスタの第１の異常スコアを、前記異常スコアより大きい前記正常スコアを有している前記複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、前記新しいデータ・サンプルに関連付けられた分類を出力することとを含んでいる方法を実行させるように構成された命令を含む、コンピュータ・プログラム製品。
前記分類が、前記新しいデータ・サンプルに関連付けられた資産の摩耗に関連する性能低下の可能性を示す、請求項２１に記載のコンピュータ・プログラム製品。
前記ルックバック・ウィンドウが、各トレーニング・サンプルに含めるための連続的な前のデータ点の数を定義する、請求項２１に記載のコンピュータ・プログラム製品。
前記予測範囲が、未来の事前に定義された時間の量を定義し、前記事前に定義された時間の量だけ未来の各データ点の各ラベルが、前記各トレーニング・サンプルに関連付けられる、請求項２１に記載のコンピュータ・プログラム製品。
Ｋ平均クラスタ化を使用して前記各トレーニング・サンプルがクラスタ化される、請求項２１に記載のコンピュータ・プログラム製品。
一軸ねじポンプ（ＰＣＰ）の摩耗に関連する劣化を予測するためのコンピュータ実装方法であって、前記方法が、
ＰＣＰの新しいデータ・サンプルを、前記ＰＣＰの摩耗に関連する劣化を予測するように構成されたモデルに入力することであって、前記モデルが、ラベル付けされた過去のＰＣＰデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、前記各トレーニング・サンプルが複数のクラスタにクラスタ化され、前記複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、前記入力することと、
前記複数のクラスタのうちの前記新しいデータ・サンプルを含んでいる第１のクラスタの第１の異常スコアを、前記異常スコアより大きい前記正常スコアを有している前記複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、前記新しいデータ・サンプルに関連付けられた分類を出力することとを含み、前記分類が、前記ＰＣＰの前記摩耗に関連する劣化を示す、コンピュータ実装方法。
一軸ねじポンプ（ＰＣＰ）の摩耗に関連する劣化を予測するためのコンピュータ実装方法であって、前記方法が、
１つまたは複数のＰＣＰに関連付けられた過去のデータの２値のラベル付けを実行することによって、ラベル付けされた過去のデータを生成することと、
ルックバック・ウィンドウおよび予測範囲を前記ラベル付けされた過去のデータの各データ点に適用することによって、複数のトレーニング・データ・サンプルを生成することと、
前記複数のトレーニング・データ・サンプルを複数のクラスタにクラスタ化することと、
前記複数のクラスタのうちの各クラスタのクラスタ・スコアを計算することと、
ＰＣＰの新しいデータ・サンプルを前記複数のクラスタのうちの第１のクラスタに割り当てることと、
前記第１のクラスタに関連付けられたクラスタ・スコアに基づいて、分類を前記新しいデータ・サンプルに割り当てることとを含み、前記分類が、前記ＰＣＰの未来の摩耗に関連する劣化の可能性を示す、コンピュータ実装方法。
前記ラベル付けされた過去のデータが、既知のポンプ交換日の前の既定の期間の間、故障としてラベル付けされる、請求項２７に記載の方法。
前記ラベル付けされた過去のデータが、ポンプ速度データ、ポンプ・トルク・データ、ケーシング圧データ、生産速度データ、および保守記録を含む、請求項２７に記載の方法。
前記各クラスタの前記クラスタ・スコアを計算することが、
前記第１のクラスタの正常スコアを計算することであって、前記正常スコアが、前記第１のクラスタ内の正常状態に関連付けられたトレーニング・データ・サンプルの第１の比率を、前記複数のトレーニング・データ・サンプルにおける前記正常状態に関連付けられたトレーニング・データ・サンプルの第２の比率で割った値である、前記計算することと、
前記第１のクラスタの異常スコアを計算することであって、前記異常スコアが、前記第１のクラスタ内の劣化状態に関連付けられたトレーニング・データ・サンプルの第３の比率を、前記複数のトレーニング・データ・サンプルにおける前記劣化状態に関連付けられたトレーニング・データ・サンプルの第４の比率で割った値である、前記計算することとをさらに含む、請求項２７に記載の方法。
前記分類が、前記第１のクラスタの前記正常スコアまたは前記異常スコアのより大きい値に基づく、請求項３０に記載の方法。
前記方法が、
前記新しいデータ・サンプルに関する故障信号を生成することをさらに含み、前記故障信号が、既定の数の前のデータ点にわたる前記新しいデータ・サンプルに関する平均異常スコアを含む、請求項２７に記載の方法。
前記故障信号を生成することが、
異常スコアより大きい正常スコアを有している前記複数のクラスタのクラスタの平均異常スコアを計算することと、
前記既定の数の前のデータ点の各々について、前記平均異常スコアより大きい前記第１のクラスタの異常スコアを有しているデータ点に１の値を関連付けることと、前記平均異常スコアより小さい前記第１のクラスタの異常スコアを有しているデータ点に０の値を関連付けることと、
前記既定の数の前のデータ点の各々に関連付けられた前記１の値および０の値の平均値として前記故障信号を計算することとをさらに含む、請求項３２に記載の方法。
前記プログラムがコンピュータ上で実行された場合に請求項１ないし１５および請求項２６ないし３３のいずれか一項に記載の前記方法を実行するように適応されたプログラム・コードの手段を含む、コンピュータ・プログラム。