JP2019153279A

JP2019153279A - 物理的システムに影響を与えるイベントの予測

Info

Publication number: JP2019153279A
Application number: JP2018239489A
Authority: JP
Inventors: グレアントザビエル; Grehant Xavier
Original assignee: Dassault Systemes SE
Current assignee: Dassault Systemes SE
Priority date: 2017-12-25
Filing date: 2018-12-21
Publication date: 2019-09-12
Anticipated expiration: 2038-12-21
Also published as: CN109977987A; JP7495777B2; US20190197424A1; EP3502920A1

Abstract

【課題】物理的システムのイベントの新しい発生を予測する。【解決手段】物理的システムの過去のイベントであってそれぞれがいくつかの属性を含む過去のイベントの第１の集合を供給すること、第１の集合のそれぞれの過去のイベントに対してシグネチャを供給すること、いくつかの属性を含む新しいイベントを供給すること、新しいイベントのシグネチャを計算すること、新しいイベントのシグネチャと第１の集合のそれぞれの過去のイベントのそれぞれのシグネチャとの間の類似性尺度を計算すること、類似性尺度に従って新しいイベントに最も近い過去のイベントを決定することであってそれによって過去のイベントの第２の集合形成する決定すること、第２の集合のそれぞれの属性に対して関連性のスコアを計算すること、関連性の、より大きいスコアを有する属性を選択することによって、属性の集合を供給すること、を含む。【選択図】図１

Description

本発明は、コンピュータプログラムおよびシステムの分野に関し、より具体的には、物理的システムのイベントの新しい発生を予測するための、方法、システムおよびプログラムに関する。

予測は、エンジニアリングにおける意思決定に使用される。それらは、イベントの、ありうる原因および結果を特定し、イベントに応じて効率的な行為を計画することに役立つ。例えば、進行中の衛星打ち上げでは、事故の予測は事故の新しい発生を回避するために必要である。アプリケーションの領域は、例えば、産業の実際上すべての分野（自動車、航空宇宙、産業機器など）において、製品と資産のメンテナンスをサポートすることを支援することを含む。さらに、それは、設計および製造の品質のための経験のリターンに適用され、例えば、コンピュータ援用設計（ＣＡＤ）システムは、設計されたデバイスの誤動作のリスクが最小化されるように、デバイスの設計のための推奨を提供できる。

「変数重要度（ｖａｒｉａｂｌｅｉｍｐｏｒｔａｎｃｅ）」の問題は、その知識が特定の目標変数の値を決定するのに重要である変数を見つけることに関係があり、例えば、イベントのコストまたはイベントが生じる確率を決定するために最も重要である変数を見つけることに関係がある（コストおよび確率は目標変数である）。例えば、裁断機の使用の期間、その上で裁断するために用いられる材料の平均強度、および、平均室温は、機械が故障する確率を決定するために最も重要な要因の１つかもしれない。基本的に、観察結果（ｏｂｓｅｒｖａｔｉｏｎ）を最もよく特徴づける変数は、生じる観察結果の可能性を最もよく決定する変数であると主張することができ、それは変数であり、従って、変数重要度の問題は、観察結果の特徴づけの問題より一般的である。しかしながら、観察結果を特徴づけるこの方法において、変数重要度を使用することに関して２つの問題がある。第１に、それは、それぞれの観察結果について起こる確率が分かっていることを必要とする。第２に、変数重要度は、特別な観察結果ではなく一般的な観察結果の発生確率と最もよく相関する変数を返し、すなわち、それは、観察結果の集合全体を特徴づける変数の集合を返し、他のものに関する観察結果を特徴づける変数の集合を返さない。

従って、プラントのような物理的システムの特定のイベントを最もよく特徴づける変数（例えば、物理的システムイベントの正常な機能と物理的システムの所与の故障との間の違いについて最もよく説明する変数）を特定することは、重要である。これらの変数の値は、恐らく、イベントの原因の１つ（データがイベントより先に存在する場合）、または、その結果の１つ（イベントが発生した後にデータが生成された場合）である。

この情況において、物理的システムのイベントの新しい発生の改善された予測が、依然として求められている。

従って、物理的システムのイベントの新しい発生を予測するためのコンピュータ実行方法が提供される。本方法は、前記物理的システムの過去のイベントであってそれぞれがいくつかの属性（ａｔｔｒｉｂｕｔｅ）を含む過去のイベントの第１の集合を供給すること、前記第１の集合のそれぞれの過去のイベントに対してシグネチャ（ｓｉｇｎａｔｕｒｅ）を供給すること、いくつかの属性を含む新しいイベントを供給すること、前記新しいイベントのシグネチャを計算すること、前記新しいイベントの前記シグネチャと前記第１の集合のそれぞれの過去のイベントのそれぞれのシグネチャとの間の類似性尺度（ｓｉｍｉｌａｒｉｔｙｍｅａｓｕｒｅ）を計算すること、前記類似性尺度に従って、前記新しいイベントに最も近い前記過去のイベントを決定することであって、それによって過去のイベントの第２の集合を形成する、決定すること、前記第２の集合のそれぞれの属性に対して、関連性のスコアを計算すること、関連性の、より大きい前記スコアを有する前記属性を選択することによって、属性の集合を供給すること、を含む。

本方法は、下記の１つ以上を含んでもよい。
−関連性の前記スコアが計算される前記第２の集合の前記属性は、前記第１および第２の集合の両方に存在する。
−属性の関連性の前記スコアは、前記第２の集合におけるその値の分布確率を前記第１の集合におけるその値の分布確率と比較することによって計算される。
−前記第１の集合のそれぞれの過去のイベントに対しておよび前記新しいイベントに対してシグネチャを供給することは、前記第１の集合のそれぞれの過去のイベントに対しておよび前記新しいイベントに対して数値ベクトルを供給することを含む。
−シグネチャを供給することは、−過去のイベントの第３の集合で機械学習モデルをトレーニングすることと、−前記第１の集合のそれぞれの過去のイベントおよび前記新しいイベントに前記機械学習モデルを適用すること、とを含む。
−前記トレーニングされたモデルは、コンテキスト依存オートエンコーダ（ｃｏｎｔｅｘｔｓｅｎｓｉｔｉｖｅａｕｔｏ−ｅｎｃｏｄｅｒ）である。
−前記新しいイベントに最も近い前記過去のイベントを決定するために使用される類似度は、−コサイン類似度、−ユークリッド距離、−逆ユークリッド距離、の中の１つである。
−属性は、少なくとも１つの構造化属性を含む。
−属性は、少なくとも１つの非構造化属性をさらに含む。
−関連性の前記スコアは、構造化属性の値だけで計算される。
−過去のイベントの第２の集合を形成した後に、前記第２の集合の過去のイベントの少なくとも１つの部分集合を計算し、ここで、関連性の前記スコアを計算することは、前記第２の集合の過去のイベントの前記少なくとも１つの部分集合のそれぞれの属性に対して関連性の前記スコアを計算すること、を含む。
−前記第１の集合の前記過去のイベントおよび前記新しいイベントは、前記同じ属性によって記述される。
−前記新しいイベントおよび前記新しいイベントのシグネチャが、前記過去のイベントおよび前記過去のイベントの前記シグネチャと共に記憶され、それによって過去のイベントとなる。
本方法を行うための命令を含むコンピュータプログラムがさらに提供される。
前記コンピュータプログラムが記録されている、コンピュータ読み取り可能な記憶媒体がさらに提供される。
前記コンピュータプログラムが記録されているメモリにつながれたプロセッサを含むシステムがさらに提供される。

本方法の一例のフローチャートを示す。本方法の一例を図示する。本方法の一例を図示する。本方法の一例を図示する。本方法の一例を図示する。本方法を行うためのシステムの一例を示す。

図１のフローチャートを参照して、物理的システムのイベントの新しい発生を予測するためのコンピュータ実行方法が提案される。物理的システムは、典型的にはデバイスまたは組み立てツールである。本方法は、物理的システムの過去のイベントの第１の集合を供給することを含む。それぞれの過去のイベントは、いくつかの属性を含む。本方法はさらに、第１の集合のそれぞれの過去のイベントに対してシグネチャを供給することを含む。次に、いくつかの属性を含む新しいイベントが供給される。新しいイベントのシグネチャと第１の集合のそれぞれの過去のイベントのそれぞれのシグネチャとの間の類似性尺度が計算される。本方法はさらに、類似性尺度に従って、新しいイベントに最も近い１つ以上の過去のイベントを決定することを含み、それによって、これらの１つ以上の過去のイベントは、過去のイベントの第２の集合を形成する。本方法はさらに、第２の集合のそれぞれの属性に対して関連性のスコアを計算することと、関連性の、より大きいスコアを有する属性を選択することによって、属性の集合を供給することと、を含む。

そのような方法は、物理的システムにおけるイベントの新しい発生の予測を改善する。確かに、本方法は、特徴づけられるものに類似する観察結果の集合を使用し、これらの多数の観察結果は、属性の統計的分析を行うことを可能にする。次に、観察結果のより大きい集合における同じ属性の確率分布に類似の観察結果について記述することに利用できる属性の確率分布が計算される。これをするために、それぞれの属性に対して、類似性尺度またはダイバージェンス尺度（ｄｉｖｅｒｇｅｎｃｅｍｅａｓｕｒｅ）が経験分布間で使用される。類似性尺度またはダイバージェンス尺度は、関連性のスコアで計算される。類似性尺度またはダイバージェンス尺度は、類似する観察結果の集合およびより大きな集合のそれぞれに対する属性の値で計算される。次に、類似性またはダイバージェンスは属性の重要度をスコアリングするために使用される。従って、本発明は、変数重要度技術および次元削減技術（観察結果（典型的には利用可能なすべての観察結果）のグループの特徴づけを供給する）に対立するものとして、個々のイベントの特徴づけを供給する。本発明によって供給された特徴づけは、本発明によって選択された属性がイベントの原因または結果における要素を含む値を恐らく示すという意味で、イベントの原因および結果に関係する。例えば、これは、次元削減技術（それは特定のイベントの原因および結果を特定することを目指さない）に対しては真実ではない。確かに、次元削減技術は、データに含まれるいくらかの情報を保持する一方でデータのサイズを縮小するが、次元削減技術によって保持された次元は入力変数の複雑な組み合わせかもしれず、それぞれの入力変数の役割を容易にトレースバックすることを可能にしないかもしれない。さらに、分散、近傍または距離を維持することは、保持された次元が特定の観察結果を特徴づけることを保証しない。変数重要度計算技術は、イベントの原因または結果を示すためのよい候補およびイベントの発生に関連する変数を特定するように、ある種の方法で使用されてもよい。これは、例えば、イベントのある種のグループが生じるか生じないかを予測するタスクにおける変数の重要度を計算することによって行うことができる。しかし、これらの技術は、それぞれのイベントの発生の確率を知ること、分類または回帰のタスクについての管理されたトレーニング、および特に、イベントを演繹的にクラスに分類すること、および従って、イベントについて先に規定されたグループに分析を限定すること、を必要とし、一方で、それらは本発明では必要とされない。次元削減技術（それは典型的には属性を組み合わせることによって次元を構築する）に対立するものとして、本発明によって提供される特徴づけは、観察結果について記述することに利用できるものの中で、個々の属性の単純で理解しやすい特定である。

本方法は、コンピュータで実行される。これは、少なくとも１つのコンピュータまたは任意の同様のシステムによって、本方法のステップ（あるいは本質的にすべてのステップ）が実行されることを意味する。従って、本方法のステップは、コンピュータによって、恐らく完全に自動的に、あるいは半自動的に行われる。例において、本方法のステップのうちの少なくともいくつかのトリガーは、ユーザとコンピュータとの対話によって行われてもよい。ユーザとコンピュータとの対話の要求されるレベルは、予測された自動性のレベルによって決まるものであってもよく、ユーザの希望を実行する必要性とバランスをとってもよい。例において、このレベルは、ユーザで規定されてもよいし、および／または、予め規定されてもよい。

例えば、イベントおよびイベントの集合を供給するステップは、ユーザの行為によって行われてもよく、その場合、ユーザは、イベントのリストの中からイベントを選択するか、イベントを入力する。

方法のコンピュータ実行の典型例は、この目的に適したシステムで本方法を行うことである。システムは、メモリおよびグラフィカルユーザインタフェース（ＧＵＩ）につながれたプロセッサを含んでもよく、メモリには、本方法を行うための命令を含むコンピュータプログラムが記録されていてもよい。メモリはまた、データベースを記憶してもよい。メモリは、そのような記憶に適した任意のハードウェアであり、いくつかの物理的に異なる部品（例えばプログラム用のもの、および恐らくデータベース用のもの）を恐らく含む。

本方法は、通常、物理的システムのイベントを扱う。物理的システムは、典型的には、現実世界の製品の製造を可能にするかそれに寄与するデバイスである。物理的システムは、航空宇宙、建築、建造、消費財、ハイテク装置、産業用機器、輸送、船舶、および／または、海洋石油／ガス生産または輸送を含む（ただしこれらに限定されない）、様々で無制限の産業分野における任意のデバイスでありうる。従って、物理的システムは、任意の機械部品であってもよいデバイスまたは産業製品であってもよく、それは例えば、地上の輸送手段（例えば、自動車および軽トラック機器、レーシングカー、オートバイ、トラックおよびモーター機器、トラックおよびバス、列車を含む）の部品、空中の輸送手段（例えば、機体機器、航空宇宙機器、推進機器、防衛製品、航空機器、宇宙機器を含む）の部品、海上の輸送手段（例えば、海軍機器、商用船、海洋機器、ヨットおよび作業船、船舶用機器を含む）の部品、一般的な機械部品（例えば、産業用製造機械類、重い移動体の機械類または機器、インストールされた機器、産業用機器製品、作られた金属製品、タイヤ製造製品を含む）、電気機械的または電子部品（例えば、家電、セキュリティおよび／またはコントロールおよび／または計測の製品、計算および通信の機器、半導体、医療の装置および機器を含む）、消費財（例えば、家具、家庭および園芸の製品、レジャー用品、流行製品、耐久消費財小売り業者の製品、繊維雑貨小売り業者の製品を含む）、包装（例えば、食物および飲料およびタバコ、美容およびパーソナルケア、家庭用製品の包装を含む）であってもよい。

図２は、システムの一例を示し、当該システムは、クライアントコンピュータシステム（例えばユーザのワークステーション）である。

本例のクライアントコンピュータは、内部通信バス（ＢＵＳ）１０００に接続された中央処理装置（ＣＰＵ）１０１０、同じくＢＵＳに接続されたランダムアクセスメモリ（ＲＡＭ）１０７０を含む。クライアントコンピュータは、ＢＵＳに接続されたビデオランダムアクセスメモリ１１００に関係するグラフィック処理装置（ＧＰＵ）１１１０をさらに備える。ビデオＲＡＭ１１００は、この技術において、フレームバッファとしても知られている。大容量記憶装置コントローラ１０２０は、ハードドライブ１０３０のような大容量メモリ装置へのアクセスを管理する。コンピュータプログラムの命令およびデータを明確に包含するのに適した大容量メモリ装置は、すべての形式の不揮発性メモリ(ＥＰＲＯＭ、ＥＥＰＲＯＭ、およびフラッシュメモリ装置のような半導体メモリ装置を例えば含む)、内部ハードディスクおよびリムーバブルディスクのような磁気ディスク、光磁気ディスク、および、ＣＤ−ＲＯＭディスク１０４０を含む。前記のいずれかは、特別に設計されたＡＳＩＣｓ（特定用途向け集積回路）によって補足されるか、それに組み込まれてもよい。ネットワークアダプタ１０５０は、ネットワーク１０６０へのアクセスを管理する。また、クライアントコンピュータは、カーソル制御装置、キーボードなどのような触覚デバイス１０９０を含んでもよい。ディスプレイ１０８０上の任意の所望の位置にユーザが選択的にカーソルを置くことを可能にするために、クライアントコンピュータにおいてカーソル制御装置が使用される。さらに、カーソル制御装置は、ユーザが、様々なコマンドを選択し、制御信号を入力することを可能にする。カーソル制御装置は、システムに制御信号を入力するための複数の信号生成装置を含む。典型的には、カーソル制御装置は、マウスであってもよく、マウスのボタンは信号を生成するために使用される。あるいはまたはさらに、クライアントコンピュータシステムは、感知可能なパッドおよび／または感知可能なスクリーンを含んでもよい。

コンピュータプログラムは、コンピュータによって実行可能な命令を含んでもよく、命令は、上記のシステムに本方法を行わせるための手段を含む。プログラムは、任意のデータ記憶媒体（システムのメモリを含む）に記録可能であってもよい。プログラムは、例えば、デジタル電子回路において、または、コンピュータハードウェア、ファームウェア、ソフトウェアにおいて、もしくはそれらの組み合わせにおいて、実行されてもよい。プログラムは、装置（例えばプログラム可能なプロセッサによる実行のための機械可読の記憶装置に明確に組み込まれた製品）として実行されてもよい。方法ステップは、入力データを処理し出力を生成することによって本方法の機能を行う命令のプログラムを実行するプログラム可能なプロセッサによって行われてもよい。このように、プロセッサは、プログラム可能であってもよく、且つ、データ記憶システム、少なくとも１つの入力装置、および少なくとも１つの出力装置、からデータおよび命令を受け取るように、およびそれへデータおよび命令を送るように、つながれていてもよい。望むのであれば、アプリケーションプログラムは、ハイレベルの手続き型またはオブジェクト指向のプログラミング言語で、または、アセンブリ言語もしくは機械語で実行されてもよい。いずれの場合も、言語は、コンパイラ型言語またはインタープリタ型言語であってもよい。プログラムは、完全なインストールプログラムまたはアップデートプログラムであってもよい。システムへのプログラムの適用は、いずれの場合も、本方法を行うための命令をもたらす。

図１を再び参照して、ステップＳ１０において、物理的システムの過去のイベントの第１の集合が供給される。イベントは、観察結果と呼ぶこともできる。イベント（または観察結果）は属性の集合であり、イベントは１つの属性のみを含んでもよい。実際上は、イベントはいくつかの属性を含む。属性は、データに関係するシンボルである。シンボルは、物理的システムのパラメータを特徴づける。例えば、物理的システムはプラントであり、属性は、温度、圧力、距離、プラント中の位置などである。属性に関係するデータは、プラント中に散在するプローブによって供給されてもよく、例えば、プローブは、変数のデータとして測定の値を供給する。集合のイベントは、好ましくは同じ属性で有する。

属性は、構造化属性であってもよい。構造化属性は、構造化データ（所定のフォーマットで表現されているか記憶されているデータ）に関係する属性である。構造化データは、数、カテゴリ（すなわち、値、日付、時刻などの有限のリストから得られた値）を含む（ただしそれらに限定されない）。

属性は、構造化されていなくてもよい。非構造化属性は、構造化されていないデータ（所定のフォーマットなしで表現されているか記憶されているデータ）に関係する属性である。非構造化属性は平文（ｐｌａｉｎｔｅｘｔ）を含む（ただしそれには限定されない）。

次に、ステップＳ２０において、第１の集合に含まれるそれぞれの過去のイベントに対してシグネチャが供給される。イベントシグネチャのシグネチャは、他のイベントの中でイベントを特徴づけることを可能にするイベントの特別な表現である。それぞれのシグネチャは、ユニークなものであってもよいし、そうでなくてもよい。少なくともイベントは日付を有しタイムスタンプされるので、イベントは通常はユニークであり、そのため、イベントのそれぞれのシグネチャは典型的にはユニークである。

興味深いことには、本発明は、日付がないイベントである観察結果に適用してもよい。
多数の観察結果が、同じイベントに関係してもよい。イベント分析の場合には、本発明は、イベントの考えられる原因および結果を見つけることに役立つ。考えられる原因は、イベントに先行する特徴属性で見つかり、考えられる結果は、イベントに続く特徴属性で見つかる。日付がないイベントに対して、特徴変数も、そのままのイベントの考えられる原因または結果となるであろう。

イベントのシグネチャである供給されたシグネチャは、イベントに関係するすべての属性から、またはこれらの属性の集合から、計算されてもよい（すなわち供給されてもよい）。

例において、イベントのシグネチャは、テキスト、数、カテゴリ、日付などのような潜在的に異なる種類の複数の属性で記述される。最初に知られる観察結果の属性が必ずしも数的であるとは限らないため、それらは、まず、数値のみをとる属性の新しい集合に変換できる。それぞれのイベントは、数値の集合に変換される。実際上は、シグネチャは、数値ベクトルであってもよい。

図２に図示されるように、イベントのシグネチャは、数値ベクトルで表現されてもよい。同じモデルが、本方法において使用されるすべてのイベントに（例えばイベントの第１の集合や、本方法の後のステップで分析されるイベントなどに）適用される。イベントに対するシグネチャのベクトル化または計算は、それぞれのイベントの生データを、１つのイベント当たり数値Ｎ（Ｎは正の整数である）の、中間の高次元ナイーブ表現ベクトルに変換する。明瞭さのために、ベクトル化が、シグネチャの計算のすべてではなくてもよい。ナイーブなシグネチャを供給することが最初のステップであってもよい。その後、ナイーブなシグネチャは、例えば削減次元技術（シグネチャを与える）を適用することによって改善できる。

第１の例において、ベクトル化は、（専門家による事故の記述のような）フリーテキスト（ｆｒｅｅｔｅｘｔ）の形式をとる属性を、複数（潜在的に大きな数）の属性に変換する。例えば、それぞれの属性は、テキスト中の特別な単語の発生の数に対応してもよい。一例において、ＴＦ−ＩＤＦ（ｔｅｒｍｆｒｅｑｕｅｎｃｙ−ｉｎｖｅｒｓｅｄｏｃｕｍｅｎｔｆｒｅｑｕｅｎｃｙ）に基づく方法は、テキスト中の単語の発生の数と、同じ属性に単語が出現する観察結果の数との比を計算することを含む。

第２の例において、（例えば自動車製造業者またはモデルのような）カテゴリ値をとる属性は、最初の属性に対してありうる値があるのと同数のブール属性（Ｂｏｏｌｅａｎａｔｔｒｉｂｕｔｅ）に変換できる。次に、“Ｔｒｕｅ（真）”および“Ｆａｌｓｅ（偽）”のブール値は、数値を得るために、１または０（あるいは逆）に変換される。あるいは、ハッシュ法が使用できる（ＳｃｉｋｉｔＬｅａｒｎによって提供されたハッシング・ベクトライザ（ＨａｓｈｉｎｇＶｅｃｔｏｒｉｚｅｒ）など）。第３の例において、数値属性を未変更にしておくことができる。この第３の例において、有効な問題は、数値属性におけるデータの欠如をどのように数字として表現するかということかもしれない。複数のソリューションの中で、１つは、そのプロセス用の既知の技術のうちの１つに従ったデータを入力し、データがこの属性に利用可能かどうかを示すカテゴリ変数を加えることにある。これらの第１、第２および第３の例は組み合わせることができることが理解されるべきである。

イベントのシグネチャが数値ベクトルで表現される場合、シグネチャがバイアスを導入できるので、イベントを比較するためにその表現が直接使用されなくてもよい。第１に、１つの情報がナイーブ表現の多次元で黙示的に伝えられる場合、観察結果間の類似性を測るときに、属性にわたって重複しない他のいくつかの情報よりも高い重要度が与えられる。例えば、１つの属性が外気温で、他の属性がＧＰＳ座標であり、観察結果がすべての緯度ごとに生じる場合、高緯度は低温と関連しているため、温度と関係する、情報のある程度の重複がある。それらの次元が、最初の属性（それは任意でありうる）の選択に直接起因するため、これは望ましくない。例えば、どういう理由であれ、属性を重複させることが望まれるかもしれず、これは、観察結果間の比較に影響を与えるべきでない。第２に、二次元上の値に、定義についての異なるセグメントがある場合、それは、類似性におけるそれらの重要度に影響を与えるであろう。より高い分散（ｖａｒｉａｎｃｅ）を備える次元は、より小さい分散を備えるものよりも、高い重要度が与えられるであろう。最初の属性の分散が任意なので、これは望ましくない。単位の選択は、例えば任意である。所与の属性のための単位としてキロメートルの代りにメートルを選ぶことは、観察結果間の比較に影響を与えない。

ナイーブ表現（１つのイベント当たり数値Ｎの、中間の高次元ナイーブ表現ベクトル）は、数のシグネチャ（イベントについて記述する入力変数の任意の選択）によって導入されたバイアスを緩和する表現に変換される。例において、イベントのシグネチャを供給することは、過去のイベントの第３の集合で機械学習モデルをトレーニングすることをさらに含んでもよい。機械学習モデルは、イベントの異なる集合においてトレーニングされてもよい。例において、機械学習モデルはイベントの集合Ａにおいてトレーニングされ、次に、モデルはイベントの集合Ｂに適用され、その後、集合Ｂのイベントは新しいイベントと比較される。イベントの集合Ａはイベントの集合Ｂと等しくなりうるが、イベントの集合Ａは、集合Ｂとは異なることも可能である。集合ＡおよびＢは共に、過去のイベントの集合である。例において、モデルは、６か月ごとにすべての過去のイベントにおいてトレーニングされ、毎日、すべての新しく来るイベントに適用される。例えば、モデルは、毎年、１月１日および６月１日にトレーニングされ、従って、２月１５日に、イベントの集合Ａは１月１日まで過去のイベントをすべて含み、イベントの集合Ｂは２月１５日まで過去のイベントをすべて含む。集合Ａは集合Ｂに含まれるが、逆は真ではない。集合Ａと集合Ｂとは異なる。一例において、第１の集合と第３の集合とは同一である。

ディープラーニングは、このステップを実行するためのいくつかの興味深い選択肢を提供する。例えば、トレーニングされるモデルは、ニューラルネットワークのクラスであるコンテキスト依存オートエンコーダ（または積層（ｓｔａｃｋｅｄ）コンテキスト依存オートエンコーダ）であり、ニューラルネットワークは機械学習モデルのクラスである。オートエンコーダまたは積層オートエンコーダは、多層の人工ニューロンからなり、１つの中央層は典型的には入力層よりサイズが小さく、最後の層は最初の層と同じサイズを有する。ニューラルネットワークは、入力を再生するようにトレーニングされ、中央層の出力は入力の表現として使用される。従って、入力の表現は、入力を再生するのに必要な情報をできるだけ多く含む入力の圧縮である（すなわち、中間層は入力層および出力層より小さなサイズを有する）。小さい表現に対してニューラルネットワークがうまく働くようにするために、表現における関連情報を、入力を再構成するのに最適な方法で分配する傾向があるであろう。最適な表現は、損失関数（出力と入力との間の差の関数）を最小化する次元に対して見つかるであろう。この最適な表現は、最新のネットワークトポロジが許す限りのバイアスがない表現を供給する。

ニューラルネットワークがトレーニングされた後、イベントは再び、（中間層の出力において）それらの表現を得るために、（トレーニングされるネットワークを変更することなしに）ネットワークの最初の層を通される。機械学習モデルは、過去のイベント集合（例えば過去のイベントの第１の集合）に適用される。

イベントの集合のイベントがテキストのデータを含む場合、モデルの入力として供給された数値ベクトルは、ボキャブラリのそれぞれの単語のテキスト中の発生の数で構成される。ボキャブラリは、テキストの集合の単語の選択によって得られてもよい。選択は、それらのテキスト中の単語のＴＦ−ＩＤＦに基づくことができ、例えば、ボキャブラリは、それらのテキストにおいて最も高い平均ＴＦ−ＩＤＦの単語の集合である。あるいは、それぞれのイベントに関係するテキストのデータは、ｄｏｃ２ｖｅｃまたは同様の文書埋め込み技術で得られる。

例において、ニューラルネットワークは、イベントと関係するデータに基づいてイベントのシグネチャを生産するために使用される。ニューラルネットワークは、ディープニューラルネットワークであってもよい。述べられたように、ニューラルネットワークは、コンテキスト依存オートエンコーダであってもよい。ニューラルネットワークは、積層コンテキスト依存オートエンコーダであってもよい。コンテキスト依存オートエンコーダはシンプルであり、そのトレーニングおよび実行は、ディープニューラルネットワークのものより速い。さらに、コンテキスト依存オートエンコーダは、積層コンテキスト依存オートエンコーダに比べて、より低いメモリプリント（ｍｅｍｏｒｙｐｒｉｎｔ）を有する。しかしながら、後者は、情報をよりよくキャプチャする。ニューラルネットワークがコンテキスト依存オートエンコーダまたは積層コンテキスト依存オートエンコーダである場合、両方とも、コンテキストとして非テキスト変数から生じるデータをとり、それは、入力の残りとは別に取り扱われる。実際、コンテキストおよび他のデータの役割がよりよく理解され、コンテキストは、予めベクトル化されたときから、構造化されていないデータから引き出すことも可能である。メインデータは、表現される情報を含み、コンテキストは、それによってメインデータが解釈されてもよいコンテキスト情報を含む。例えば、メインデータは、イベントについて記述するフリーテキストから来ることができ、コンテキストデータは、関係する構造化データから来ることができる。

図３は、過去のイベントの第１の集合に対するシグネチャの計算の一例を図示する。イベントは次元Ｎのナイーブ表現に変換され、それは次に、トレーニングされたモデルの入力に供給され、次元ｎ＜Ｎの低い次元の表現に変換される。

図１に戻って、ステップＳ３０において、いくつかの属性を含む新しいイベントが供給される。このイベントは１つ以上の属性を含み、少なくとも１つの属性は、第１の集合のイベントのものと類似する。実際上、新しいイベントは、第１の集合のイベントと同じ属性を有し、すなわち、新しいイベントおよび第１の集合の過去のイベントは、同じ属性によって記述される。

次に、ステップＳ４０において、新しいイベントのシグネチャが計算される。シグネチャは、ステップＳ２０を参照して述べたように計算される。

図５は、図３に図示されステップＳ２０を参照して述べたように、分析される新しい観察結果が、過去のイベントの同じステップにどのように通されるかを示す。新しいイベントは最初にベクトル化され、すなわち、それは第１の数値ベクトルに変換され、次に、第１の数値ベクトルは、最終の表現を供給するために、トレーニングされたモデルに通される。

新しいイベントおよび新しいイベントのシグネチャは、過去のイベントおよび過去のイベントのシグネチャと共に記憶されてもよく、それによって過去のイベントとなってもよい。これは、イベントの関連する変数を特定するために使用されるイベントの一貫性を改善する。

次に、ステップＳ５０において、新しいイベントのシグネチャと第１の集合のそれぞれの過去のイベントのそれぞれのシグネチャとの間の類似性尺度が計算される。ステップＳ２０およびＳ３０において生産されたベクトルは、類似度を使用して２つずつ比較できる。相違度（ｄｉｓｓｉｍｉｌａｒｉｔｙｍｅｔｒｉｃ）が使用されてもよいことが、理解されるべきである。使用される類似度または相違度は、コサイン類似度、ユークリッド距離、逆ユークリッド距離などであってもよい（ただしそれらには限定されない）。よいベクトル表現は、類似のイベントが類似のベクトル表現を有するベクトル表現である。イベントについてのよいベクトル表現は、イベントＡのベクトルが、異なるイベントであるイベントＣよりも、同じイベントの別の発生であるイベントＢのベクトルにより類似することを、確証するであろう。さらに、それは、Ａ、ＤおよびＥが異なるイベントの発生であり、ＤがＥよりもＡにより類似する場合、イベントＥのベクトルよりもイベントＤのベクトルにより類似するであろう。

ひとたび、新しいイベントのシグネチャと第１のもののイベントとの間のすべての組み合わせのすべての類似性尺度が計算されると、新しいものに最も近い過去のイベントとして決定された第１の集合の過去のイベントを含む過去のイベントの第２の集合が計算される（Ｓ６０）。最も近い過去のイベントによって、第１の集合のイベントのランキングは、それぞれのイベントに関係している類似性（あるいは相違性）尺度に基づいて生成され、最高のランキング（例えば最高の類似性尺度）の複数のイベントがイベントの第２の集合の形成のために選択されることが理解されるべきである。このように、第２の集合は、ステップＳ３０において供給された新しいイベントと最も類似するイベントで形成される。

第２の集合を形成するために選択される第１の集合のイベントの数は、ユーザによって選択されてもよいし、自動的に選択されてもよいし、または予め定められていてもよい。ユーザによって選択されるときに彼／彼女は、類似性の閾値を規定してもよく、その場合、閾値よりも高い類似性値を備えるイベントだけが、イベントの第２の集合を形成するであろう。あるいは、ユーザは、イベントの第２の集合を形成するであろう最高の類似性値を備える複数のイベントを規定してもよい。興味深いことには、これは、ユーザが、本発明によって表示されるかもしれない結果をカスタマイズすることを可能にする（例えば物理的システムの特定のイベントを最もよく特徴づける特定された属性）。第２の集合を形成するイベントの数は自動的にカスタマイズされてもよく、閾値は、ステップＳ６０からＳ８０のそれぞれの反復に対して増加され、特定のイベントを最もよく特徴づける特定された属性の数が最高となる閾値は、本方法の次の反復用の閾値として保持されるであろう。

次に、ステップＳ７０では、関連性のスコアは第２の集合のそれぞれの属性に対して計算される。関連性のスコアは、特定のイベントの特徴づけにおける属性の影響（あるいは重要度）の尺度である。

それぞれの属性の関連性のスコアは、第２の集合のそれぞれの属性の値の分布と第１の集合のそれぞれの属性の値の分布との間の分離を計算することによって計算されてもよい。分離の計算は、供給された新しいイベントに類似するイベントと、供給された新しいイベントに類似しないイベントとの間の差を供給することを目的とする。この目的のために、属性の関連性のスコアは、第２の集合のその値の分布確率を、第１の集合のその値の分布確率と比較することによって計算される。属性に対する分布の差が比較の結果として得られる場合、属性は関連しており、これに対して、分布の差が比較の結果として得られない場合、属性は、供給された新しいイベントに関連していない。

好ましくは、関連性のスコアが計算される第２の集合の属性は、第１および第２の集合の両方に存在する。これは例えば、先に述べたように、第１の集合のイベントのすべてが同じ属性を有するときのケースである。これは、第２の集合のそれぞれのイベントのそれぞれの属性に対して関連性の重要なスコアが計算できることを、確実にする。従って、新しいイベントの特徴づけにおける関連する属性の特定が改善され、その結果、関係する物理的システムの新しいイベントの新しい発生の予測が改善される。

関連性のスコアは、新しいイベントのすべての属性に対して、または、ある種の属性のみに対して、計算できる。例において、関連性のスコアは構造化属性だけに対して計算される。構造化属性だけを使用することは、これらの属性の要約を、例えばそれらの分布の統計的分析の形式（ヒストグラム、平均、標準など）で作ることを可能にする。

例において、過去のイベントの第２の集合は、過去イベントの部分集合へ細分されてもよい。第２の集合の下位区分は、１つ以上の属性の類似性に基づいてもよい。例えば、関連性のスコアの同じ値または近い値（例えば、値の所与の範囲に属する値）を有する属性を備えるイベントは、第２の集合の過去のイベントの部分集合を形成するであろう。従って、過去のイベントの第２の集合が形成された後に、第２の集合の過去のイベントの少なくとも１つの部分集合が形成される（または計算される）。１つの部分集合が形成される場合、残りの過去のイベント（その１つの部分集合に属さないもの）は、第２の集合の過去のイベントの別の部分集合を黙示的に形成することが、理解されるべきである。第２の集合のそのような下位区分は、特徴づける１つ以上の属性の選択を改善する。

次に、属性の集合が、関連性の最大のスコアを有する属性を選択することによって供給される（すなわち特定される）。これらの１つ以上の最も関連する属性は、ステップＳ３０の新しいイベントを最もよく特徴づけるものである。興味深いことには、ここで、キーワードによって照会を行うか、または属性に制約を導入することが可能であり、第１および第２の集合を制限することをもたらし、それは、属性の関連性のスコアを修正することをもたらしうる。

図５は、本方法の一例を示す。この例において、イベントの代りに観察結果が使用される。既に説明したように、観察結果は日付がないイベントである。観察結果のベクトル表現（Ｓ２０）は、システムに提出されたもの（Ｓ１０）に類似する観察結果を検索するために使用され、それは観察結果のそれぞれの最初の属性に対するものであり、値は、類似の観察結果をフィルタリングする前および後の確率分布について記述するためにグループ化され、そのように記述された確率分布の比較はそれぞれの属性の関連性の尺度を測るために使用され、この尺度は、入力で与えられた観察結果の特徴として属性を選択するべきかどうかを決定するために使用される。

ベクトル表現は、類似度（例えばコサイン類似度）を使用して比較される（Ｓ５０）。システムの入力に提出されたもの（Ｓ３０）に最も類似するベクトル表現を備える観察結果（Ｓ６０）だけが、保持される。類似性の閾値は、集合、または結果の最大数、または両方であってもよい（Ｓ６０）。結果の要約は、結果の閾値または最大数を調節するのを助けるように示すことができる。この例において、Ｓ１は、最も類似する観察結果の検索の前の観察結果の集合であり、Ｓ２は、集合Ｓ１から形成された過去のイベントの集合である。Ｓ２の観察結果は、Ｓ１に含まれる。

Ｓ１およびＳ２のイベントについて記述することに最初に利用できる属性が集められる。それらは、ナイーブまたは最終のベクトル表現で見出される値ではない。なぜなら、これらの値の意味が典型的に直観的ではないためである。これらは、システムの入力で見出される属性およびそれらの値である。なぜなら、それらが典型的にはユーザに意味をなすためである。

これらの属性は、数のタイプであってもよいし、そうでなくてもよい。この時点で、任意のタイプの属性が使用できるが、それらのタイプの変数の確率分布を比較する方法がある。

例えば、数値変数に対して、２つのサンプルのコルモゴロフ・スミルノフ検定（ＫｏｌｍｏｇｏｒｏｖＳｍｉｒｎｏｖｔｅｓｔ）は、経験分布間の類似性尺度を供給する。ここで、分布は経験的と呼ばれる。なぜなら、それらは、それらの確率分布の理論モデルのパラメータによってではなく、それらの値をサンプリングすることによって規定されるためである。それは、確率密度関数間の絶対差の積分を測ること、または、それぞれの離散値の確率間の絶対差の合計を測ることにある。コルモゴロフ・スミルノフ検定は、実際には、類似性ではなくダイバージェンスを供給する。そのどんな狭義減少関数も、類似性として使用できる。Ｓ１およびＳ２において最も類似する（または最も相違しない）分布を備えた属性は、保持される。

例において、本方法は、コンピュータ援用設計（ＣＡＤ）システムにおける物理的システムのモデルの設計を可能にする。最初に、物理的システムのモデルが供給される。物理的システムは、過去のイベントの第１の集合に関係しており、それぞれの過去のイベントは、いくつかの属性を含む。次に、第１の集合のそれぞれの過去のイベントに対して属性の集合が供給され、その属性は、過去のイベントの属性の中から選択される。これは、図１を参照して述べたように行われる。次に、前記それぞれの過去のイベントが、新しいイベントとして供給される。ユーザの行為によって、物理的システムの供給されたモデルの属性の選択が行われる。選択の結果、本発明を実行するかまたはランさせるコンピュータ化されたシステムは、選択された属性が属性の集合に属するかどうかを決定し、選択された属性が属性の集合に属する場合には、ユーザへ警報を発する。このように、製造される物理的システムの、ＣＡＤシステムにおける設計が改善される。説明のために、ここで、ＣＡＤシステムについて述べる。

ＣＡＤシステムは、ＣＡＴＩＡのような、モデル化オブジェクトの図的表現に基づいてモデル化オブジェクトを少なくとも設計するために適した任意のシステムを意味する。この場合、モデル化オブジェクトを規定するデータは、モデル化オブジェクトの表現を可能にするデータを含む。ＣＡＤシステムは、例えば、エッジまたは線を使用して、ある種の場合には面または表面と共に、ＣＡＤモデル化オブジェクトの表現を提供してもよい。線、エッジ、または表面は、様々な方法（例えば非一様有理Ｂスプライン（ＮＵＲＢＳ））で表現されてもよい。特別には、ＣＡＤファイルは、形状がそれから生成されてもよい仕様を含んでおり、それは次に、表現が生成されることを可能にする。モデル化オブジェクトの仕様は、単一のＣＡＤファイルか多数のそれに格納されてもよい。ＣＡＤシステムにおいてモデル化オブジェクトを表現するファイルの典型的なサイズは、１つの部品当たり１メガバイトの範囲にある。また、モデル化オブジェクトは、典型的には何千もの部品の組立体であってもよい。

ＣＡＤの環境において、モデル化オブジェクトは、典型的には３Ｄモデル化オブジェクトであってもよく、例えば、一部品または部品の組立体、または恐らく製品の組立体、といった製品を表現する。「３Ｄモデル化オブジェクト」は、その３Ｄ表現を可能にするデータによってモデル化される任意のオブジェクトを意味する。３Ｄ表現は、すべての角度から部品を見ることを可能にする。例えば、３Ｄモデル化オブジェクトは、３Ｄ表現されるときに、処理され且つその軸のうちのいずれかの周り、または、表現が表示されるスクリーン中の任意の軸の周りで回転されてもよい。これは特に、２Ｄアイコン（３Ｄモデル化されていない）を除外する。３Ｄ表現の表示は、設計を容易にする（すなわち、統計的に設計者が彼らのタスクを遂行する速度を増加させる）。製品の設計は製造工程の一部であるので、これは、産業における製造工程を加速する。

３Ｄモデル化オブジェクトは、例えばＣＡＤソフトウェアソリューションまたはＣＡＤシステムによるその仮想設計の完了の後に続いて実際の世界において製造される製品の形状を表現してもよく、その製品は、（例えば、機械的）部品または部品の組立体（または部品の組立体と同等のもの。本方法の観点から部品の組立体が部品自体とみなされてもよいし、あるいは、本方法は組立体のそれぞれの部品に独立に適用されてもよい）、あるいはより一般的には任意の剛体の組立体（例えば移動体の機構）などである。ＣＡＤソフトウェアソリューションは、航空宇宙、建築、建造、消費財、ハイテク装置、産業用機器、輸送、船舶、および／または、海洋石油／ガス生産または輸送を含む（ただしこれらに限定されない）、様々で無制限の産業分野における製品の設計を可能にする。このように、本方法で設計される３Ｄモデル化オブジェクトは、任意の機械部品であってもよい産業製品を表してもよく、例えば、地上の輸送手段（例えば、自動車および軽トラック機器、レーシングカー、オートバイ、トラックおよびモーター機器、トラックおよびバス、列車を含む）の部品、空中の輸送手段（例えば、機体機器、航空宇宙機器、推進機器、防衛製品、航空機器、宇宙機器を含む）の部品、海上の輸送手段（例えば、海軍機器、商用船、海洋機器、ヨットおよび作業船、船舶用機器を含む）の部品、一般的な機械部品（例えば、産業用製造機械類、重い移動体の機械類または機器、インストールされた機器、産業用機器製品、作られた金属製品、タイヤ製造製品を含む）、電気機械的または電子部品（例えば、家電、セキュリティおよび／またはコントロールおよび／または計測の製品、計算および通信の機器、半導体、医療の装置および機器を含む）、消費財（例えば、家具、家庭および園芸の製品、レジャー用品、流行製品、耐久消費財小売り業者の製品、繊維雑貨小売り業者の製品を含む）、包装（例えば、食物および飲料およびタバコ、美容およびパーソナルケア、家庭用製品の包装を含む）を表してもよい。

物理的システムのモデルを設計する場合、設計中になされた選択は、製品の寿命における不具合に影響がある。例えば、部品の材料の選択は、長期における部品の特性、および、その部品が不適切に振る舞うかもしれない条件を変えるかもしれない。特定の事故を調査する場合に、その事故の発生と関連しているような設計の選択を特定するために本発明を使用できる。そのような関連する設計の選択の特定において、そのような選択が、製品の将来のバージョンにおいてまたはすぐに再び起こることを防ぐために、（例えば製品ライフサイクル管理システム上の）通知を広めることができる。そのような通知は、コンピュータ援用設計のアプリケーションにおいて自動化されてもよい。例えば、新しいタスクが、コンピュータ援用設計ソフトウェア中のやることリストに自動的に加えられてもよい。タスクのクリックは、設計者が適切な変更を加えることを可能にするように、コンピュータ援用設計ソフトウェアのコンテキスト（ｃｏｎｔｅｘｔ）をスイッチしてもよい。類似する場合（例えば類似する特徴を共有する製品と類似する場合）に生じた過去の事故の数の特定は、事故が生じる機会を最小化する変数の値を明らかにできる。例えば、材料Ａ、ＢまたはＣが選ばれたときの欠陥製品の比率を比較することは、３つの選択肢の間における選択の助けとなるであろう。警報は、事故（または特に重大な事故）の実質的な数の特徴として、本発明によって特定されたそれぞれの変数に対して、設計アプリケーションにおいて自動的に起こすことが可能である。従って、設計者がその変数に対する値を選択する前に、彼らがなそうとしている決定が危機的であると彼らに通知するために警報を提供でき、それが過去に製品に与えた影響を彼らがチェックすることを可能にし、または、設計者がその変数に対する値を選択した後に、彼らがなした決定が将来において事故を引き起こしそうであることを彼らに通知するために、警報を提供できる。なぜなら、それが過去の類似する場合（類似する他の特徴を有する製品、および、それに対して同じ値が選ばれた場合）において事故を引き起こしたためである。従って、どの設計決定が重要か（すなわちフィールドデータの分析がどの設計決定に対して重要であるか）が分からないソリューションとは異なり、本発明は、フィールドデータ分析で増強される、コンピュータ援用設計ソフトウェアの開発および実行における必要経費を削減する。興味深いことには、ＣＡＤソフトウェアの修正の限定された数だけが、使用のコンテキストを事故データ中の変数にリンクするために必要とされるであろうために、本発明は、開発に非常に限定された影響を及ぼす。これらの修正は、重要なものとして特定された変数の値の設定に関係する使用のコンテキストにおいてのみなされる必要がある。特にソフトウェアが進展し使用のコンテキストが変わるため、これらの修正はコストがかかり、従って、重要な変数へのマップコンテキスト（ｍａｐｃｏｎｔｅｘｔ）の規則が変更されることを必要とする。さらに、限定された数の分析だけが結果として実行されるであろうために、本発明は実行にわずかな影響を及ぼす。すなわち、分析は、重要な変数にリンクされた使用のコンテキストに対して起こされるだけであり、設計者への混乱を限定するであろう。設計行為を完了するときであって次のものに移る前に、重要でない分析をスキップすることはより低いレイテンシー（ｌａｔｅｎｃｙ）をもたらし、従って、設計者にとってより流動的な経験をもたらす。

Claims

物理的システムのイベントの新しい発生を予測するためのコンピュータ実行方法であって、
前記物理的システムの過去のイベントであってそれぞれがいくつかの属性を含む過去のイベントの第１の集合を供給するステップ（Ｓ１０）、
前記第１の集合のそれぞれの過去のイベントに対してシグネチャを供給するステップ（Ｓ２０）、
いくつかの属性を含む新しいイベントを供給するステップ（Ｓ３０）、
前記新しいイベントのシグネチャを計算するステップ（Ｓ４０）、
前記新しいイベントの前記シグネチャと前記第１の集合のそれぞれの過去のイベントのそれぞれのシグネチャとの間の類似性尺度を計算するステップ（Ｓ５０）、
前記類似性尺度に従って、前記新しいイベントに最も近い前記過去のイベントを決定するステップであって、それによって過去のイベントの第２の集合を形成する、決定するステップ（Ｓ６０）、
前記第２の集合のそれぞれの属性に対して、関連性のスコアを計算するステップ（Ｓ７０）、
関連性の、より大きい前記スコアを有する前記属性を選択することによって、属性の集合を供給するステップ（Ｓ８０）
を含むコンピュータ実行方法。
関連性の前記スコアが計算される前記第２の集合の前記属性は、前記第１および第２の集合の両方に存在する
請求項１に記載のコンピュータ実行方法。
属性の関連性の前記スコアは、前記第２の集合におけるその値の分布確率を前記第１の集合におけるその値の分布確率と比較することによって計算される
請求項２に記載のコンピュータ実行方法。
前記第１の集合のそれぞれの過去のイベントに対しておよび前記新しいイベントに対してシグネチャを供給するステップは、前記第１の集合のそれぞれの過去のイベントに対しておよび前記新しいイベントに対して数値ベクトルを供給するステップを含む
請求項１〜３のいずれか１項に記載のコンピュータ実行方法。
前記シグネチャを供給するステップは、
過去のイベントの第３の集合で機械学習モデルをトレーニングするステップと、
前記第１の集合のそれぞれの過去のイベントおよび前記新しいイベントに前記機械学習モデルを適用するステップと
を含む請求項４に記載のコンピュータ実行方法。
前記トレーニングされたモデルは、コンテキスト依存オートエンコーダである
請求項５に記載のコンピュータ実行方法。
前記新しいイベントに最も近い前記過去のイベントを決定するために使用される類似度は、
コサイン類似度、
ユークリッド距離、
逆ユークリッド距離
の中の１つである
請求項１〜６のいずれか１項に記載のコンピュータ実行方法。
前記属性は、少なくとも１つの構造化属性を含む
請求項１〜７のいずれか１項に記載のコンピュータ実行方法。
前記属性は、少なくとも１つの非構造化属性をさらに含む
請求項８に記載のコンピュータ実行方法。
関連性の前記スコアは、構造化属性の値だけで計算される
請求項８または９に記載のコンピュータ実行方法。
過去のイベントの第２の集合を形成した後に、
前記第２の集合の過去のイベントの少なくとも１つの部分集合を計算するステップ、をさらに含み、
関連性の前記スコアを計算するステップは、
前記第２の集合の過去のイベントの前記少なくとも１つの部分集合のそれぞれの属性に対して関連性の前記スコアを計算するステップを含む
請求項１〜１０のいずれか１項に記載のコンピュータ実行方法。
前記第１の集合の前記過去のイベントおよび前記新しいイベントは、前記同じ属性によって記述される
請求項１〜１１のいずれか１項に記載のコンピュータ実行方法。
前記新しいイベントおよび前記新しいイベントのシグネチャが、前記過去のイベントおよび前記過去のイベントの前記シグネチャと共に記憶され、それによって過去のイベントとなる
請求項１〜１２のいずれか１項に記載のコンピュータ実行方法。
請求項１〜１３のいずれか１項に記載の前記方法を行うための命令を含むコンピュータプログラム。
請求項１４に記載の前記コンピュータプログラムが記録されているメモリにつながれたプロセッサを含むシステム。