JP7495777B2 - 物理的システムに影響を与えるイベントの予測 - Google Patents

物理的システムに影響を与えるイベントの予測 Download PDF

Info

Publication number
JP7495777B2
JP7495777B2 JP2018239489A JP2018239489A JP7495777B2 JP 7495777 B2 JP7495777 B2 JP 7495777B2 JP 2018239489 A JP2018239489 A JP 2018239489A JP 2018239489 A JP2018239489 A JP 2018239489A JP 7495777 B2 JP7495777 B2 JP 7495777B2
Authority
JP
Japan
Prior art keywords
event
events
past
attributes
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018239489A
Other languages
English (en)
Other versions
JP2019153279A (ja
Inventor
グレアント ザビエル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dassault Systemes SE
Original Assignee
Dassault Systemes SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dassault Systemes SE filed Critical Dassault Systemes SE
Publication of JP2019153279A publication Critical patent/JP2019153279A/ja
Application granted granted Critical
Publication of JP7495777B2 publication Critical patent/JP7495777B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/024Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0283Predictive maintenance, e.g. involving the monitoring of a system and, based on the monitoring results, taking decisions on the maintenance schedule of the monitored system; Estimating remaining useful life [RUL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Algebra (AREA)
  • Fuzzy Systems (AREA)
  • Operations Research (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、コンピュータプログラムおよびシステムの分野に関し、より具体的には、物理的システムのイベントの新しい発生を予測するための、方法、システムおよびプログラムに関する。
予測は、エンジニアリングにおける意思決定に使用される。それらは、イベントの、ありうる原因および結果を特定し、イベントに応じて効率的な行為を計画することに役立つ。例えば、進行中の衛星打ち上げでは、事故の予測は事故の新しい発生を回避するために必要である。アプリケーションの領域は、例えば、産業の実際上すべての分野(自動車、航空宇宙、産業機器など)において、製品と資産のメンテナンスをサポートすることを支援することを含む。さらに、それは、設計および製造の品質のための経験のリターンに適用され、例えば、コンピュータ援用設計(CAD)システムは、設計されたデバイスの誤動作のリスクが最小化されるように、デバイスの設計のための推奨を提供できる。
「変数重要度(variable importance)」の問題は、その知識が特定の目標変数の値を決定するのに重要である変数を見つけることに関係があり、例えば、イベントのコストまたはイベントが生じる確率を決定するために最も重要である変数を見つけることに関係がある(コストおよび確率は目標変数である)。例えば、裁断機の使用の期間、その上で裁断するために用いられる材料の平均強度、および、平均室温は、機械が故障する確率を決定するために最も重要な要因の1つかもしれない。基本的に、観察結果(observation)を最もよく特徴づける変数は、生じる観察結果の可能性を最もよく決定する変数であると主張することができ、それは変数であり、従って、変数重要度の問題は、観察結果の特徴づけの問題より一般的である。しかしながら、観察結果を特徴づけるこの方法において、変数重要度を使用することに関して2つの問題がある。第1に、それは、それぞれの観察結果について起こる確率が分かっていることを必要とする。第2に、変数重要度は、特別な観察結果ではなく一般的な観察結果の発生確率と最もよく相関する変数を返し、すなわち、それは、観察結果の集合全体を特徴づける変数の集合を返し、他のものに関する観察結果を特徴づける変数の集合を返さない。
従って、プラントのような物理的システムの特定のイベントを最もよく特徴づける変数(例えば、物理的システムイベントの正常な機能と物理的システムの所与の故障との間の違いについて最もよく説明する変数)を特定することは、重要である。これらの変数の値は、恐らく、イベントの原因の1つ(データがイベントより先に存在する場合)、または、その結果の1つ(イベントが発生した後にデータが生成された場合)である。
この情況において、物理的システムのイベントの新しい発生の改善された予測が、依然として求められている。
従って、物理的システムのイベントの新しい発生を予測するためのコンピュータ実行方法が提供される。本方法は、前記物理的システムの過去のイベントであってそれぞれがいくつかの属性(attribute)を含む過去のイベントの第1の集合を供給すること、前記第1の集合のそれぞれの過去のイベントに対してシグネチャ(signature)を供給すること、いくつかの属性を含む新しいイベントを供給すること、前記新しいイベントのシグネチャを計算すること、前記新しいイベントの前記シグネチャと前記第1の集合のそれぞれの過去のイベントのそれぞれのシグネチャとの間の類似性尺度(similarity measure)を計算すること、前記類似性尺度に従って、前記新しいイベントに最も近い前記過去のイベントを決定することであって、それによって過去のイベントの第2の集合を形成する、決定すること、前記第2の集合のそれぞれの属性に対して、関連性のスコアを計算すること、関連性の、より大きい前記スコアを有する前記属性を選択することによって、属性の集合を供給すること、を含む。
本方法は、下記の1つ以上を含んでもよい。
-関連性の前記スコアが計算される前記第2の集合の前記属性は、前記第1および第2の集合の両方に存在する。
-属性の関連性の前記スコアは、前記第2の集合におけるその値の分布確率を前記第1の集合におけるその値の分布確率と比較することによって計算される。
-前記第1の集合のそれぞれの過去のイベントに対しておよび前記新しいイベントに対してシグネチャを供給することは、前記第1の集合のそれぞれの過去のイベントに対しておよび前記新しいイベントに対して数値ベクトルを供給することを含む。
-シグネチャを供給することは、-過去のイベントの第3の集合で機械学習モデルをトレーニングすることと、-前記第1の集合のそれぞれの過去のイベントおよび前記新しいイベントに前記機械学習モデルを適用すること、とを含む。
-前記トレーニングされたモデルは、コンテキスト依存オートエンコーダ(context sensitive auto-encoder)である。
-前記新しいイベントに最も近い前記過去のイベントを決定するために使用される類似度は、-コサイン類似度、-ユークリッド距離、-逆ユークリッド距離、の中の1つである。
-属性は、少なくとも1つの構造化属性を含む。
-属性は、少なくとも1つの非構造化属性をさらに含む。
-関連性の前記スコアは、構造化属性の値だけで計算される。
-過去のイベントの第2の集合を形成した後に、前記第2の集合の過去のイベントの少なくとも1つの部分集合を計算し、ここで、関連性の前記スコアを計算することは、前記第2の集合の過去のイベントの前記少なくとも1つの部分集合のそれぞれの属性に対して関連性の前記スコアを計算すること、を含む。
-前記第1の集合の前記過去のイベントおよび前記新しいイベントは、前記同じ属性によって記述される。
-前記新しいイベントおよび前記新しいイベントのシグネチャが、前記過去のイベントおよび前記過去のイベントの前記シグネチャと共に記憶され、それによって過去のイベントとなる。
本方法を行うための命令を含むコンピュータプログラムがさらに提供される。
前記コンピュータプログラムが記録されている、コンピュータ読み取り可能な記憶媒体がさらに提供される。
前記コンピュータプログラムが記録されているメモリにつながれたプロセッサを含むシステムがさらに提供される。
本方法の一例のフローチャートを示す。 本方法の一例を図示する。 本方法の一例を図示する。 本方法の一例を図示する。 本方法の一例を図示する。 本方法を行うためのシステムの一例を示す。
図1のフローチャートを参照して、物理的システムのイベントの新しい発生を予測するためのコンピュータ実行方法が提案される。物理的システムは、典型的にはデバイスまたは組み立てツールである。本方法は、物理的システムの過去のイベントの第1の集合を供給することを含む。それぞれの過去のイベントは、いくつかの属性を含む。本方法はさらに、第1の集合のそれぞれの過去のイベントに対してシグネチャを供給することを含む。次に、いくつかの属性を含む新しいイベントが供給される。新しいイベントのシグネチャと第1の集合のそれぞれの過去のイベントのそれぞれのシグネチャとの間の類似性尺度が計算される。本方法はさらに、類似性尺度に従って、新しいイベントに最も近い1つ以上の過去のイベントを決定することを含み、それによって、これらの1つ以上の過去のイベントは、過去のイベントの第2の集合を形成する。本方法はさらに、第2の集合のそれぞれの属性に対して関連性のスコアを計算することと、関連性の、より大きいスコアを有する属性を選択することによって、属性の集合を供給することと、を含む。
そのような方法は、物理的システムにおけるイベントの新しい発生の予測を改善する。確かに、本方法は、特徴づけられるものに類似する観察結果の集合を使用し、これらの多数の観察結果は、属性の統計的分析を行うことを可能にする。次に、観察結果のより大きい集合における同じ属性の確率分布に類似の観察結果について記述することに利用できる属性の確率分布が計算される。これをするために、それぞれの属性に対して、類似性尺度またはダイバージェンス尺度(divergence measure)が経験分布間で使用される。類似性尺度またはダイバージェンス尺度は、関連性のスコアで計算される。類似性尺度またはダイバージェンス尺度は、類似する観察結果の集合およびより大きな集合のそれぞれに対する属性の値で計算される。次に、類似性またはダイバージェンスは属性の重要度をスコアリングするために使用される。従って、本発明は、変数重要度技術および次元削減技術(観察結果(典型的には利用可能なすべての観察結果)のグループの特徴づけを供給する)に対立するものとして、個々のイベントの特徴づけを供給する。本発明によって供給された特徴づけは、本発明によって選択された属性がイベントの原因または結果における要素を含む値を恐らく示すという意味で、イベントの原因および結果に関係する。例えば、これは、次元削減技術(それは特定のイベントの原因および結果を特定することを目指さない)に対しては真実ではない。確かに、次元削減技術は、データに含まれるいくらかの情報を保持する一方でデータのサイズを縮小するが、次元削減技術によって保持された次元は入力変数の複雑な組み合わせかもしれず、それぞれの入力変数の役割を容易にトレースバックすることを可能にしないかもしれない。さらに、分散、近傍または距離を維持することは、保持された次元が特定の観察結果を特徴づけることを保証しない。変数重要度計算技術は、イベントの原因または結果を示すためのよい候補およびイベントの発生に関連する変数を特定するように、ある種の方法で使用されてもよい。これは、例えば、イベントのある種のグループが生じるか生じないかを予測するタスクにおける変数の重要度を計算することによって行うことができる。しかし、これらの技術は、それぞれのイベントの発生の確率を知ること、分類または回帰のタスクについての管理されたトレーニング、および特に、イベントを演繹的にクラスに分類すること、および従って、イベントについて先に規定されたグループに分析を限定すること、を必要とし、一方で、それらは本発明では必要とされない。次元削減技術(それは典型的には属性を組み合わせることによって次元を構築する)に対立するものとして、本発明によって提供される特徴づけは、観察結果について記述することに利用できるものの中で、個々の属性の単純で理解しやすい特定である。
本方法は、コンピュータで実行される。これは、少なくとも1つのコンピュータまたは任意の同様のシステムによって、本方法のステップ(あるいは本質的にすべてのステップ)が実行されることを意味する。従って、本方法のステップは、コンピュータによって、恐らく完全に自動的に、あるいは半自動的に行われる。例において、本方法のステップのうちの少なくともいくつかのトリガーは、ユーザとコンピュータとの対話によって行われてもよい。ユーザとコンピュータとの対話の要求されるレベルは、予測された自動性のレベルによって決まるものであってもよく、ユーザの希望を実行する必要性とバランスをとってもよい。例において、このレベルは、ユーザで規定されてもよいし、および/または、予め規定されてもよい。
例えば、イベントおよびイベントの集合を供給するステップは、ユーザの行為によって行われてもよく、その場合、ユーザは、イベントのリストの中からイベントを選択するか、イベントを入力する。
方法のコンピュータ実行の典型例は、この目的に適したシステムで本方法を行うことである。システムは、メモリおよびグラフィカルユーザインタフェース(GUI)につながれたプロセッサを含んでもよく、メモリには、本方法を行うための命令を含むコンピュータプログラムが記録されていてもよい。メモリはまた、データベースを記憶してもよい。メモリは、そのような記憶に適した任意のハードウェアであり、いくつかの物理的に異なる部品(例えばプログラム用のもの、および恐らくデータベース用のもの)を恐らく含む。
本方法は、通常、物理的システムのイベントを扱う。物理的システムは、典型的には、現実世界の製品の製造を可能にするかそれに寄与するデバイスである。物理的システムは、航空宇宙、建築、建造、消費財、ハイテク装置、産業用機器、輸送、船舶、および/または、海洋石油/ガス生産または輸送を含む(ただしこれらに限定されない)、様々で無制限の産業分野における任意のデバイスでありうる。従って、物理的システムは、任意の機械部品であってもよいデバイスまたは産業製品であってもよく、それは例えば、地上の輸送手段(例えば、自動車および軽トラック機器、レーシングカー、オートバイ、トラックおよびモーター機器、トラックおよびバス、列車を含む)の部品、空中の輸送手段(例えば、機体機器、航空宇宙機器、推進機器、防衛製品、航空機器、宇宙機器を含む)の部品、海上の輸送手段(例えば、海軍機器、商用船、海洋機器、ヨットおよび作業船、船舶用機器を含む)の部品、一般的な機械部品(例えば、産業用製造機械類、重い移動体の機械類または機器、インストールされた機器、産業用機器製品、作られた金属製品、タイヤ製造製品を含む)、電気機械的または電子部品(例えば、家電、セキュリティおよび/またはコントロールおよび/または計測の製品、計算および通信の機器、半導体、医療の装置および機器を含む)、消費財(例えば、家具、家庭および園芸の製品、レジャー用品、流行製品、耐久消費財小売り業者の製品、繊維雑貨小売り業者の製品を含む)、包装(例えば、食物および飲料およびタバコ、美容およびパーソナルケア、家庭用製品の包装を含む)であってもよい。
図2は、システムの一例を示し、当該システムは、クライアントコンピュータシステム(例えばユーザのワークステーション)である。
本例のクライアントコンピュータは、内部通信バス(BUS)1000に接続された中央処理装置(CPU)1010、同じくBUSに接続されたランダムアクセスメモリ(RAM)1070を含む。クライアントコンピュータは、BUSに接続されたビデオランダムアクセスメモリ1100に関係するグラフィック処理装置(GPU)1110をさらに備える。ビデオRAM1100は、この技術において、フレームバッファとしても知られている。大容量記憶装置コントローラ1020は、ハードドライブ1030のような大容量メモリ装置へのアクセスを管理する。コンピュータプログラムの命令およびデータを明確に包含するのに適した大容量メモリ装置は、すべての形式の不揮発性メモリ(EPROM、EEPROM、およびフラッシュメモリ装置のような半導体メモリ装置を例えば含む)、内部ハードディスクおよびリムーバブルディスクのような磁気ディスク、光磁気ディスク、および、CD-ROMディスク1040を含む。前記のいずれかは、特別に設計されたASICs(特定用途向け集積回路)によって補足されるか、それに組み込まれてもよい。ネットワークアダプタ1050は、ネットワーク1060へのアクセスを管理する。また、クライアントコンピュータは、カーソル制御装置、キーボードなどのような触覚デバイス1090を含んでもよい。ディスプレイ1080上の任意の所望の位置にユーザが選択的にカーソルを置くことを可能にするために、クライアントコンピュータにおいてカーソル制御装置が使用される。さらに、カーソル制御装置は、ユーザが、様々なコマンドを選択し、制御信号を入力することを可能にする。カーソル制御装置は、システムに制御信号を入力するための複数の信号生成装置を含む。典型的には、カーソル制御装置は、マウスであってもよく、マウスのボタンは信号を生成するために使用される。あるいはまたはさらに、クライアントコンピュータシステムは、感知可能なパッドおよび/または感知可能なスクリーンを含んでもよい。
コンピュータプログラムは、コンピュータによって実行可能な命令を含んでもよく、命令は、上記のシステムに本方法を行わせるための手段を含む。プログラムは、任意のデータ記憶媒体(システムのメモリを含む)に記録可能であってもよい。プログラムは、例えば、デジタル電子回路において、または、コンピュータハードウェア、ファームウェア、ソフトウェアにおいて、もしくはそれらの組み合わせにおいて、実行されてもよい。プログラムは、装置(例えばプログラム可能なプロセッサによる実行のための機械可読の記憶装置に明確に組み込まれた製品)として実行されてもよい。方法ステップは、入力データを処理し出力を生成することによって本方法の機能を行う命令のプログラムを実行するプログラム可能なプロセッサによって行われてもよい。このように、プロセッサは、プログラム可能であってもよく、且つ、データ記憶システム、少なくとも1つの入力装置、および少なくとも1つの出力装置、からデータおよび命令を受け取るように、およびそれへデータおよび命令を送るように、つながれていてもよい。望むのであれば、アプリケーションプログラムは、ハイレベルの手続き型またはオブジェクト指向のプログラミング言語で、または、アセンブリ言語もしくは機械語で実行されてもよい。いずれの場合も、言語は、コンパイラ型言語またはインタープリタ型言語であってもよい。プログラムは、完全なインストールプログラムまたはアップデートプログラムであってもよい。システムへのプログラムの適用は、いずれの場合も、本方法を行うための命令をもたらす。
図1を再び参照して、ステップS10において、物理的システムの過去のイベントの第1の集合が供給される。イベントは、観察結果と呼ぶこともできる。イベント(または観察結果)は属性の集合であり、イベントは1つの属性のみを含んでもよい。実際上は、イベントはいくつかの属性を含む。属性は、データに関係するシンボルである。シンボルは、物理的システムのパラメータを特徴づける。例えば、物理的システムはプラントであり、属性は、温度、圧力、距離、プラント中の位置などである。属性に関係するデータは、プラント中に散在するプローブによって供給されてもよく、例えば、プローブは、変数のデータとして測定の値を供給する。集合のイベントは、好ましくは同じ属性で有する。
属性は、構造化属性であってもよい。構造化属性は、構造化データ(所定のフォーマットで表現されているか記憶されているデータ)に関係する属性である。構造化データは、数、カテゴリ(すなわち、値、日付、時刻などの有限のリストから得られた値)を含む(ただしそれらに限定されない)。
属性は、構造化されていなくてもよい。非構造化属性は、構造化されていないデータ(所定のフォーマットなしで表現されているか記憶されているデータ)に関係する属性である。非構造化属性は平文(plain text)を含む(ただしそれには限定されない)。
次に、ステップS20において、第1の集合に含まれるそれぞれの過去のイベントに対してシグネチャが供給される。イベントシグネチャのシグネチャは、他のイベントの中でイベントを特徴づけることを可能にするイベントの特別な表現である。それぞれのシグネチャは、ユニークなものであってもよいし、そうでなくてもよい。少なくともイベントは日付を有しタイムスタンプされるので、イベントは通常はユニークであり、そのため、イベントのそれぞれのシグネチャは典型的にはユニークである。
興味深いことには、本発明は、日付がないイベントである観察結果に適用してもよい。
多数の観察結果が、同じイベントに関係してもよい。イベント分析の場合には、本発明は、イベントの考えられる原因および結果を見つけることに役立つ。考えられる原因は、イベントに先行する特徴属性で見つかり、考えられる結果は、イベントに続く特徴属性で見つかる。日付がないイベントに対して、特徴変数も、そのままのイベントの考えられる原因または結果となるであろう。
イベントのシグネチャである供給されたシグネチャは、イベントに関係するすべての属性から、またはこれらの属性の集合から、計算されてもよい(すなわち供給されてもよい)。
例において、イベントのシグネチャは、テキスト、数、カテゴリ、日付などのような潜在的に異なる種類の複数の属性で記述される。最初に知られる観察結果の属性が必ずしも数的であるとは限らないため、それらは、まず、数値のみをとる属性の新しい集合に変換できる。それぞれのイベントは、数値の集合に変換される。実際上は、シグネチャは、数値ベクトルであってもよい。
図2に図示されるように、イベントのシグネチャは、数値ベクトルで表現されてもよい。同じモデルが、本方法において使用されるすべてのイベントに(例えばイベントの第1の集合や、本方法の後のステップで分析されるイベントなどに)適用される。イベントに対するシグネチャのベクトル化または計算は、それぞれのイベントの生データを、1つのイベント当たり数値N(Nは正の整数である)の、中間の高次元ナイーブ表現ベクトルに変換する。明瞭さのために、ベクトル化が、シグネチャの計算のすべてではなくてもよい。ナイーブなシグネチャを供給することが最初のステップであってもよい。その後、ナイーブなシグネチャは、例えば削減次元技術(シグネチャを与える)を適用することによって改善できる。
第1の例において、ベクトル化は、(専門家による事故の記述のような)フリーテキスト(free text)の形式をとる属性を、複数(潜在的に大きな数)の属性に変換する。例えば、それぞれの属性は、テキスト中の特別な単語の発生の数に対応してもよい。一例において、TF-IDF(term frequency-inverse document frequency)に基づく方法は、テキスト中の単語の発生の数と、同じ属性に単語が出現する観察結果の数との比を計算することを含む。
第2の例において、(例えば自動車製造業者またはモデルのような)カテゴリ値をとる属性は、最初の属性に対してありうる値があるのと同数のブール属性(Boolean attribute)に変換できる。次に、“True(真)”および“False(偽)”のブール値は、数値を得るために、1または0(あるいは逆)に変換される。あるいは、ハッシュ法が使用できる(Scikit Learnによって提供されたハッシング・ベクトライザ(Hashing Vectorizer)など)。第3の例において、数値属性を未変更にしておくことができる。この第3の例において、有効な問題は、数値属性におけるデータの欠如をどのように数字として表現するかということかもしれない。複数のソリューションの中で、1つは、そのプロセス用の既知の技術のうちの1つに従ったデータを入力し、データがこの属性に利用可能かどうかを示すカテゴリ変数を加えることにある。これらの第1、第2および第3の例は組み合わせることができることが理解されるべきである。
イベントのシグネチャが数値ベクトルで表現される場合、シグネチャがバイアスを導入できるので、イベントを比較するためにその表現が直接使用されなくてもよい。第1に、1つの情報がナイーブ表現の多次元で黙示的に伝えられる場合、観察結果間の類似性を測るときに、属性にわたって重複しない他のいくつかの情報よりも高い重要度が与えられる。例えば、1つの属性が外気温で、他の属性がGPS座標であり、観察結果がすべての緯度ごとに生じる場合、高緯度は低温と関連しているため、温度と関係する、情報のある程度の重複がある。それらの次元が、最初の属性(それは任意でありうる)の選択に直接起因するため、これは望ましくない。例えば、どういう理由であれ、属性を重複させることが望まれるかもしれず、これは、観察結果間の比較に影響を与えるべきでない。第2に、二次元上の値に、定義についての異なるセグメントがある場合、それは、類似性におけるそれらの重要度に影響を与えるであろう。より高い分散(variance)を備える次元は、より小さい分散を備えるものよりも、高い重要度が与えられるであろう。最初の属性の分散が任意なので、これは望ましくない。単位の選択は、例えば任意である。所与の属性のための単位としてキロメートルの代りにメートルを選ぶことは、観察結果間の比較に影響を与えない。
ナイーブ表現(1つのイベント当たり数値Nの、中間の高次元ナイーブ表現ベクトル)は、数のシグネチャ(イベントについて記述する入力変数の任意の選択)によって導入されたバイアスを緩和する表現に変換される。例において、イベントのシグネチャを供給することは、過去のイベントの第3の集合で機械学習モデルをトレーニングすることをさらに含んでもよい。機械学習モデルは、イベントの異なる集合においてトレーニングされてもよい。例において、機械学習モデルはイベントの集合Aにおいてトレーニングされ、次に、モデルはイベントの集合Bに適用され、その後、集合Bのイベントは新しいイベントと比較される。イベントの集合Aはイベントの集合Bと等しくなりうるが、イベントの集合Aは、集合Bとは異なることも可能である。集合AおよびBは共に、過去のイベントの集合である。例において、モデルは、6か月ごとにすべての過去のイベントにおいてトレーニングされ、毎日、すべての新しく来るイベントに適用される。例えば、モデルは、毎年、1月1日および6月1日にトレーニングされ、従って、2月15日に、イベントの集合Aは1月1日まで過去のイベントをすべて含み、イベントの集合Bは2月15日まで過去のイベントをすべて含む。集合Aは集合Bに含まれるが、逆は真ではない。集合Aと集合Bとは異なる。一例において、第1の集合と第3の集合とは同一である。
ディープラーニングは、このステップを実行するためのいくつかの興味深い選択肢を提供する。例えば、トレーニングされるモデルは、ニューラルネットワークのクラスであるコンテキスト依存オートエンコーダ(または積層(stacked)コンテキスト依存オートエンコーダ)であり、ニューラルネットワークは機械学習モデルのクラスである。オートエンコーダまたは積層オートエンコーダは、多層の人工ニューロンからなり、1つの中央層は典型的には入力層よりサイズが小さく、最後の層は最初の層と同じサイズを有する。ニューラルネットワークは、入力を再生するようにトレーニングされ、中央層の出力は入力の表現として使用される。従って、入力の表現は、入力を再生するのに必要な情報をできるだけ多く含む入力の圧縮である(すなわち、中間層は入力層および出力層より小さなサイズを有する)。小さい表現に対してニューラルネットワークがうまく働くようにするために、表現における関連情報を、入力を再構成するのに最適な方法で分配する傾向があるであろう。最適な表現は、損失関数(出力と入力との間の差の関数)を最小化する次元に対して見つかるであろう。この最適な表現は、最新のネットワークトポロジが許す限りのバイアスがない表現を供給する。
ニューラルネットワークがトレーニングされた後、イベントは再び、(中間層の出力において)それらの表現を得るために、(トレーニングされるネットワークを変更することなしに)ネットワークの最初の層を通される。機械学習モデルは、過去のイベント集合(例えば過去のイベントの第1の集合)に適用される。
イベントの集合のイベントがテキストのデータを含む場合、モデルの入力として供給された数値ベクトルは、ボキャブラリのそれぞれの単語のテキスト中の発生の数で構成される。ボキャブラリは、テキストの集合の単語の選択によって得られてもよい。選択は、それらのテキスト中の単語のTF-IDFに基づくことができ、例えば、ボキャブラリは、それらのテキストにおいて最も高い平均TF-IDFの単語の集合である。あるいは、それぞれのイベントに関係するテキストのデータは、doc2vecまたは同様の文書埋め込み技術で得られる。
例において、ニューラルネットワークは、イベントと関係するデータに基づいてイベントのシグネチャを生産するために使用される。ニューラルネットワークは、ディープニューラルネットワークであってもよい。述べられたように、ニューラルネットワークは、コンテキスト依存オートエンコーダであってもよい。ニューラルネットワークは、積層コンテキスト依存オートエンコーダであってもよい。コンテキスト依存オートエンコーダはシンプルであり、そのトレーニングおよび実行は、ディープニューラルネットワークのものより速い。さらに、コンテキスト依存オートエンコーダは、積層コンテキスト依存オートエンコーダに比べて、より低いメモリプリント(memory print)を有する。しかしながら、後者は、情報をよりよくキャプチャする。ニューラルネットワークがコンテキスト依存オートエンコーダまたは積層コンテキスト依存オートエンコーダである場合、両方とも、コンテキストとして非テキスト変数から生じるデータをとり、それは、入力の残りとは別に取り扱われる。実際、コンテキストおよび他のデータの役割がよりよく理解され、コンテキストは、予めベクトル化されたときから、構造化されていないデータから引き出すことも可能である。メインデータは、表現される情報を含み、コンテキストは、それによってメインデータが解釈されてもよいコンテキスト情報を含む。例えば、メインデータは、イベントについて記述するフリーテキストから来ることができ、コンテキストデータは、関係する構造化データから来ることができる。
図3は、過去のイベントの第1の集合に対するシグネチャの計算の一例を図示する。イベントは次元Nのナイーブ表現に変換され、それは次に、トレーニングされたモデルの入力に供給され、次元n<Nの低い次元の表現に変換される。
図1に戻って、ステップS30において、いくつかの属性を含む新しいイベントが供給される。このイベントは1つ以上の属性を含み、少なくとも1つの属性は、第1の集合のイベントのものと類似する。実際上、新しいイベントは、第1の集合のイベントと同じ属性を有し、すなわち、新しいイベントおよび第1の集合の過去のイベントは、同じ属性によって記述される。
次に、ステップS40において、新しいイベントのシグネチャが計算される。シグネチャは、ステップS20を参照して述べたように計算される。
図5は、図3に図示されステップS20を参照して述べたように、分析される新しい観察結果が、過去のイベントの同じステップにどのように通されるかを示す。新しいイベントは最初にベクトル化され、すなわち、それは第1の数値ベクトルに変換され、次に、第1の数値ベクトルは、最終の表現を供給するために、トレーニングされたモデルに通される。
新しいイベントおよび新しいイベントのシグネチャは、過去のイベントおよび過去のイベントのシグネチャと共に記憶されてもよく、それによって過去のイベントとなってもよい。これは、イベントの関連する変数を特定するために使用されるイベントの一貫性を改善する。
次に、ステップS50において、新しいイベントのシグネチャと第1の集合のそれぞれの過去のイベントのそれぞれのシグネチャとの間の類似性尺度が計算される。ステップS20およびS30において生産されたベクトルは、類似度を使用して2つずつ比較できる。相違度(dissimilarity metric)が使用されてもよいことが、理解されるべきである。使用される類似度または相違度は、コサイン類似度、ユークリッド距離、逆ユークリッド距離などであってもよい(ただしそれらには限定されない)。よいベクトル表現は、類似のイベントが類似のベクトル表現を有するベクトル表現である。イベントについてのよいベクトル表現は、イベントAのベクトルが、異なるイベントであるイベントCよりも、同じイベントの別の発生であるイベントBのベクトルにより類似することを、確証するであろう。さらに、それは、A、DおよびEが異なるイベントの発生であり、DがEよりもAにより類似する場合、イベントEのベクトルよりもイベントDのベクトルにより類似するであろう。
ひとたび、新しいイベントのシグネチャと第1のもののイベントとの間のすべての組み合わせのすべての類似性尺度が計算されると、新しいものに最も近い過去のイベントとして決定された第1の集合の過去のイベントを含む過去のイベントの第2の集合が計算される(S60)。最も近い過去のイベントによって、第1の集合のイベントのランキングは、それぞれのイベントに関係している類似性(あるいは相違性)尺度に基づいて生成され、最高のランキング(例えば最高の類似性尺度)の複数のイベントがイベントの第2の集合の形成のために選択されることが理解されるべきである。このように、第2の集合は、ステップS30において供給された新しいイベントと最も類似するイベントで形成される。
第2の集合を形成するために選択される第1の集合のイベントの数は、ユーザによって選択されてもよいし、自動的に選択されてもよいし、または予め定められていてもよい。ユーザによって選択されるときに彼/彼女は、類似性の閾値を規定してもよく、その場合、閾値よりも高い類似性値を備えるイベントだけが、イベントの第2の集合を形成するであろう。あるいは、ユーザは、イベントの第2の集合を形成するであろう最高の類似性値を備える複数のイベントを規定してもよい。興味深いことには、これは、ユーザが、本発明によって表示されるかもしれない結果をカスタマイズすることを可能にする(例えば物理的システムの特定のイベントを最もよく特徴づける特定された属性)。第2の集合を形成するイベントの数は自動的にカスタマイズされてもよく、閾値は、ステップS60からS80のそれぞれの反復に対して増加され、特定のイベントを最もよく特徴づける特定された属性の数が最高となる閾値は、本方法の次の反復用の閾値として保持されるであろう。
次に、ステップS70では、関連性のスコアは第2の集合のそれぞれの属性に対して計算される。関連性のスコアは、特定のイベントの特徴づけにおける属性の影響(あるいは重要度)の尺度である。
それぞれの属性の関連性のスコアは、第2の集合のそれぞれの属性の値の分布と第1の集合のそれぞれの属性の値の分布との間の分離を計算することによって計算されてもよい。分離の計算は、供給された新しいイベントに類似するイベントと、供給された新しいイベントに類似しないイベントとの間の差を供給することを目的とする。この目的のために、属性の関連性のスコアは、第2の集合のその値の分布確率を、第1の集合のその値の分布確率と比較することによって計算される。属性に対する分布の差が比較の結果として得られる場合、属性は関連しており、これに対して、分布の差が比較の結果として得られない場合、属性は、供給された新しいイベントに関連していない。
好ましくは、関連性のスコアが計算される第2の集合の属性は、第1および第2の集合の両方に存在する。これは例えば、先に述べたように、第1の集合のイベントのすべてが同じ属性を有するときのケースである。これは、第2の集合のそれぞれのイベントのそれぞれの属性に対して関連性の重要なスコアが計算できることを、確実にする。従って、新しいイベントの特徴づけにおける関連する属性の特定が改善され、その結果、関係する物理的システムの新しいイベントの新しい発生の予測が改善される。
関連性のスコアは、新しいイベントのすべての属性に対して、または、ある種の属性のみに対して、計算できる。例において、関連性のスコアは構造化属性だけに対して計算される。構造化属性だけを使用することは、これらの属性の要約を、例えばそれらの分布の統計的分析の形式(ヒストグラム、平均、標準など)で作ることを可能にする。
例において、過去のイベントの第2の集合は、過去イベントの部分集合へ細分されてもよい。第2の集合の下位区分は、1つ以上の属性の類似性に基づいてもよい。例えば、関連性のスコアの同じ値または近い値(例えば、値の所与の範囲に属する値)を有する属性を備えるイベントは、第2の集合の過去のイベントの部分集合を形成するであろう。従って、過去のイベントの第2の集合が形成された後に、第2の集合の過去のイベントの少なくとも1つの部分集合が形成される(または計算される)。1つの部分集合が形成される場合、残りの過去のイベント(その1つの部分集合に属さないもの)は、第2の集合の過去のイベントの別の部分集合を黙示的に形成することが、理解されるべきである。第2の集合のそのような下位区分は、特徴づける1つ以上の属性の選択を改善する。
次に、属性の集合が、関連性の最大のスコアを有する属性を選択することによって供給される(すなわち特定される)。これらの1つ以上の最も関連する属性は、ステップS30の新しいイベントを最もよく特徴づけるものである。興味深いことには、ここで、キーワードによって照会を行うか、または属性に制約を導入することが可能であり、第1および第2の集合を制限することをもたらし、それは、属性の関連性のスコアを修正することをもたらしうる。
図5は、本方法の一例を示す。この例において、イベントの代りに観察結果が使用される。既に説明したように、観察結果は日付がないイベントである。観察結果のベクトル表現(S20)は、システムに提出されたもの(S10)に類似する観察結果を検索するために使用され、それは観察結果のそれぞれの最初の属性に対するものであり、値は、類似の観察結果をフィルタリングする前および後の確率分布について記述するためにグループ化され、そのように記述された確率分布の比較はそれぞれの属性の関連性の尺度を測るために使用され、この尺度は、入力で与えられた観察結果の特徴として属性を選択するべきかどうかを決定するために使用される。
ベクトル表現は、類似度(例えばコサイン類似度)を使用して比較される(S50)。システムの入力に提出されたもの(S30)に最も類似するベクトル表現を備える観察結果(S60)だけが、保持される。類似性の閾値は、集合、または結果の最大数、または両方であってもよい(S60)。結果の要約は、結果の閾値または最大数を調節するのを助けるように示すことができる。この例において、S1は、最も類似する観察結果の検索の前の観察結果の集合であり、S2は、集合S1から形成された過去のイベントの集合である。S2の観察結果は、S1に含まれる。
S1およびS2のイベントについて記述することに最初に利用できる属性が集められる。それらは、ナイーブまたは最終のベクトル表現で見出される値ではない。なぜなら、これらの値の意味が典型的に直観的ではないためである。これらは、システムの入力で見出される属性およびそれらの値である。なぜなら、それらが典型的にはユーザに意味をなすためである。
これらの属性は、数のタイプであってもよいし、そうでなくてもよい。この時点で、任意のタイプの属性が使用できるが、それらのタイプの変数の確率分布を比較する方法がある。
例えば、数値変数に対して、2つのサンプルのコルモゴロフ・スミルノフ検定(Kolmogorov Smirnov test)は、経験分布間の類似性尺度を供給する。ここで、分布は経験的と呼ばれる。なぜなら、それらは、それらの確率分布の理論モデルのパラメータによってではなく、それらの値をサンプリングすることによって規定されるためである。それは、確率密度関数間の絶対差の積分を測ること、または、それぞれの離散値の確率間の絶対差の合計を測ることにある。コルモゴロフ・スミルノフ検定は、実際には、類似性ではなくダイバージェンスを供給する。そのどんな狭義減少関数も、類似性として使用できる。S1およびS2において最も類似する(または最も相違しない)分布を備えた属性は、保持される。
例において、本方法は、コンピュータ援用設計(CAD)システムにおける物理的システムのモデルの設計を可能にする。最初に、物理的システムのモデルが供給される。物理的システムは、過去のイベントの第1の集合に関係しており、それぞれの過去のイベントは、いくつかの属性を含む。次に、第1の集合のそれぞれの過去のイベントに対して属性の集合が供給され、その属性は、過去のイベントの属性の中から選択される。これは、図1を参照して述べたように行われる。次に、前記それぞれの過去のイベントが、新しいイベントとして供給される。ユーザの行為によって、物理的システムの供給されたモデルの属性の選択が行われる。選択の結果、本発明を実行するかまたはランさせるコンピュータ化されたシステムは、選択された属性が属性の集合に属するかどうかを決定し、選択された属性が属性の集合に属する場合には、ユーザへ警報を発する。このように、製造される物理的システムの、CADシステムにおける設計が改善される。説明のために、ここで、CADシステムについて述べる。
CADシステムは、CATIAのような、モデル化オブジェクトの図的表現に基づいてモデル化オブジェクトを少なくとも設計するために適した任意のシステムを意味する。この場合、モデル化オブジェクトを規定するデータは、モデル化オブジェクトの表現を可能にするデータを含む。CADシステムは、例えば、エッジまたは線を使用して、ある種の場合には面または表面と共に、CADモデル化オブジェクトの表現を提供してもよい。線、エッジ、または表面は、様々な方法(例えば非一様有理Bスプライン(NURBS))で表現されてもよい。特別には、CADファイルは、形状がそれから生成されてもよい仕様を含んでおり、それは次に、表現が生成されることを可能にする。モデル化オブジェクトの仕様は、単一のCADファイルか多数のそれに格納されてもよい。CADシステムにおいてモデル化オブジェクトを表現するファイルの典型的なサイズは、1つの部品当たり1メガバイトの範囲にある。また、モデル化オブジェクトは、典型的には何千もの部品の組立体であってもよい。
CADの環境において、モデル化オブジェクトは、典型的には3Dモデル化オブジェクトであってもよく、例えば、一部品または部品の組立体、または恐らく製品の組立体、といった製品を表現する。「3Dモデル化オブジェクト」は、その3D表現を可能にするデータによってモデル化される任意のオブジェクトを意味する。3D表現は、すべての角度から部品を見ることを可能にする。例えば、3Dモデル化オブジェクトは、3D表現されるときに、処理され且つその軸のうちのいずれかの周り、または、表現が表示されるスクリーン中の任意の軸の周りで回転されてもよい。これは特に、2Dアイコン(3Dモデル化されていない)を除外する。3D表現の表示は、設計を容易にする(すなわち、統計的に設計者が彼らのタスクを遂行する速度を増加させる)。製品の設計は製造工程の一部であるので、これは、産業における製造工程を加速する。
3Dモデル化オブジェクトは、例えばCADソフトウェアソリューションまたはCADシステムによるその仮想設計の完了の後に続いて実際の世界において製造される製品の形状を表現してもよく、その製品は、(例えば、機械的)部品または部品の組立体(または部品の組立体と同等のもの。本方法の観点から部品の組立体が部品自体とみなされてもよいし、あるいは、本方法は組立体のそれぞれの部品に独立に適用されてもよい)、あるいはより一般的には任意の剛体の組立体(例えば移動体の機構)などである。CADソフトウェアソリューションは、航空宇宙、建築、建造、消費財、ハイテク装置、産業用機器、輸送、船舶、および/または、海洋石油/ガス生産または輸送を含む(ただしこれらに限定されない)、様々で無制限の産業分野における製品の設計を可能にする。このように、本方法で設計される3Dモデル化オブジェクトは、任意の機械部品であってもよい産業製品を表してもよく、例えば、地上の輸送手段(例えば、自動車および軽トラック機器、レーシングカー、オートバイ、トラックおよびモーター機器、トラックおよびバス、列車を含む)の部品、空中の輸送手段(例えば、機体機器、航空宇宙機器、推進機器、防衛製品、航空機器、宇宙機器を含む)の部品、海上の輸送手段(例えば、海軍機器、商用船、海洋機器、ヨットおよび作業船、船舶用機器を含む)の部品、一般的な機械部品(例えば、産業用製造機械類、重い移動体の機械類または機器、インストールされた機器、産業用機器製品、作られた金属製品、タイヤ製造製品を含む)、電気機械的または電子部品(例えば、家電、セキュリティおよび/またはコントロールおよび/または計測の製品、計算および通信の機器、半導体、医療の装置および機器を含む)、消費財(例えば、家具、家庭および園芸の製品、レジャー用品、流行製品、耐久消費財小売り業者の製品、繊維雑貨小売り業者の製品を含む)、包装(例えば、食物および飲料およびタバコ、美容およびパーソナルケア、家庭用製品の包装を含む)を表してもよい。
物理的システムのモデルを設計する場合、設計中になされた選択は、製品の寿命における不具合に影響がある。例えば、部品の材料の選択は、長期における部品の特性、および、その部品が不適切に振る舞うかもしれない条件を変えるかもしれない。特定の事故を調査する場合に、その事故の発生と関連しているような設計の選択を特定するために本発明を使用できる。そのような関連する設計の選択の特定において、そのような選択が、製品の将来のバージョンにおいてまたはすぐに再び起こることを防ぐために、(例えば製品ライフサイクル管理システム上の)通知を広めることができる。そのような通知は、コンピュータ援用設計のアプリケーションにおいて自動化されてもよい。例えば、新しいタスクが、コンピュータ援用設計ソフトウェア中のやることリストに自動的に加えられてもよい。タスクのクリックは、設計者が適切な変更を加えることを可能にするように、コンピュータ援用設計ソフトウェアのコンテキスト(context)をスイッチしてもよい。類似する場合(例えば類似する特徴を共有する製品と類似する場合)に生じた過去の事故の数の特定は、事故が生じる機会を最小化する変数の値を明らかにできる。例えば、材料A、BまたはCが選ばれたときの欠陥製品の比率を比較することは、3つの選択肢の間における選択の助けとなるであろう。警報は、事故(または特に重大な事故)の実質的な数の特徴として、本発明によって特定されたそれぞれの変数に対して、設計アプリケーションにおいて自動的に起こすことが可能である。従って、設計者がその変数に対する値を選択する前に、彼らがなそうとしている決定が危機的であると彼らに通知するために警報を提供でき、それが過去に製品に与えた影響を彼らがチェックすることを可能にし、または、設計者がその変数に対する値を選択した後に、彼らがなした決定が将来において事故を引き起こしそうであることを彼らに通知するために、警報を提供できる。なぜなら、それが過去の類似する場合(類似する他の特徴を有する製品、および、それに対して同じ値が選ばれた場合)において事故を引き起こしたためである。従って、どの設計決定が重要か(すなわちフィールドデータの分析がどの設計決定に対して重要であるか)が分からないソリューションとは異なり、本発明は、フィールドデータ分析で増強される、コンピュータ援用設計ソフトウェアの開発および実行における必要経費を削減する。興味深いことには、CADソフトウェアの修正の限定された数だけが、使用のコンテキストを事故データ中の変数にリンクするために必要とされるであろうために、本発明は、開発に非常に限定された影響を及ぼす。これらの修正は、重要なものとして特定された変数の値の設定に関係する使用のコンテキストにおいてのみなされる必要がある。特にソフトウェアが進展し使用のコンテキストが変わるため、これらの修正はコストがかかり、従って、重要な変数へのマップコンテキスト(map context)の規則が変更されることを必要とする。さらに、限定された数の分析だけが結果として実行されるであろうために、本発明は実行にわずかな影響を及ぼす。すなわち、分析は、重要な変数にリンクされた使用のコンテキストに対して起こされるだけであり、設計者への混乱を限定するであろう。設計行為を完了するときであって次のものに移る前に、重要でない分析をスキップすることはより低いレイテンシー(latency)をもたらし、従って、設計者にとってより流動的な経験をもたらす。

Claims (13)

  1. 物理的システムのイベントの新しい発生を予測するためのコンピュータ実行方法であって、
    前記物理的システムの過去のイベントであってそれぞれがいくつかの属性を含む過去のイベントの第1の集合を供給するステップ(S10)、
    前記第1の集合のそれぞれの過去のイベントに対してシグネチャを供給するステップ(S20)、
    いくつかの属性を含む新しいイベントを供給するステップ(S30)、
    前記新しいイベントのシグネチャを計算するステップ(S40)、
    前記新しいイベントの前記シグネチャと前記第1の集合のそれぞれの過去のイベントのそれぞれのシグネチャとの間の類似性尺度を計算するステップ(S50)、
    前記類似性尺度に従って、前記新しいイベントに最も近い前記過去のイベントを決定するステップであって、それによって過去のイベントの第2の集合を形成する、決定するステップ(S60)、
    前記第2の集合のそれぞれの属性に対して、関連性のスコアを計算するステップ(S70)、
    関連性の、より大きい前記スコアを有する前記属性を選択することによって、属性の集合を供給するステップ(S80)
    を含み、
    関連性の前記スコアが計算される前記第2の集合の前記属性は、前記第1および第2の集合の両方に存在し、
    属性の関連性の前記スコアは、前記第2の集合におけるその値の分布確率を前記第1の集合におけるその値の分布確率と比較することによって計算される
    コンピュータ実行方法。
  2. 前記第1の集合のそれぞれの過去のイベントに対しておよび前記新しいイベントに対してシグネチャを供給するステップは、前記第1の集合のそれぞれの過去のイベントに対しておよび前記新しいイベントに対して数値ベクトルを供給するステップを含む
    請求項1に記載のコンピュータ実行方法。
  3. 前記シグネチャを供給するステップは、
    過去のイベントの第3の集合で機械学習モデルをトレーニングするステップと、
    前記第1の集合のそれぞれの過去のイベントおよび前記新しいイベントに前記機械学習モデルを適用するステップと
    を含む請求項2に記載のコンピュータ実行方法。
  4. 前記トレーニングされたモデルは、コンテキスト依存オートエンコーダである
    請求項3に記載のコンピュータ実行方法。
  5. 前記新しいイベントに最も近い前記過去のイベントを決定するために使用される類似度は、
    コサイン類似度、
    ユークリッド距離、
    逆ユークリッド距離
    の中の1つである
    請求項1~4のいずれか1項に記載のコンピュータ実行方法。
  6. 前記属性は、少なくとも1つの構造化属性を含む
    請求項1~5のいずれか1項に記載のコンピュータ実行方法。
  7. 前記属性は、少なくとも1つの非構造化属性をさらに含む
    請求項6に記載のコンピュータ実行方法。
  8. 関連性の前記スコアは、構造化属性の値だけで計算される
    請求項6または7に記載のコンピュータ実行方法。
  9. 過去のイベントの第2の集合を形成した後に、
    前記第2の集合の過去のイベントの少なくとも1つの部分集合を計算するステップ、をさらに含み、
    関連性の前記スコアを計算するステップは、
    前記第2の集合の過去のイベントの前記少なくとも1つの部分集合のそれぞれの属性に対して関連性の前記スコアを計算するステップを含む
    請求項1~8のいずれか1項に記載のコンピュータ実行方法。
  10. 前記第1の集合の前記過去のイベントおよび前記新しいイベントは、同じ属性によって記述される
    請求項1~9のいずれか1項に記載のコンピュータ実行方法。
  11. 前記新しいイベントおよび前記新しいイベントのシグネチャが、前記過去のイベントおよび前記過去のイベントの前記シグネチャと共に記憶され、それによって過去のイベントとなる
    請求項1~10のいずれか1項に記載のコンピュータ実行方法。
  12. 請求項1~11のいずれか1項に記載の前記方法をコンピュータに行わせるための命令を含むコンピュータプログラム。
  13. 請求項12に記載の前記コンピュータプログラムが記録されているメモリにつながれたプロセッサを含むシステム。
JP2018239489A 2017-12-25 2018-12-21 物理的システムに影響を与えるイベントの予測 Active JP7495777B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP17306934.5 2017-12-25
EP17306934.5A EP3502920A1 (en) 2017-12-25 2017-12-25 Prediction of an event affecting a physical system

Publications (2)

Publication Number Publication Date
JP2019153279A JP2019153279A (ja) 2019-09-12
JP7495777B2 true JP7495777B2 (ja) 2024-06-05

Family

ID=60971958

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018239489A Active JP7495777B2 (ja) 2017-12-25 2018-12-21 物理的システムに影響を与えるイベントの予測

Country Status (4)

Country Link
US (1) US20190197424A1 (ja)
EP (1) EP3502920A1 (ja)
JP (1) JP7495777B2 (ja)
CN (1) CN109977987A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3430767B1 (en) * 2016-03-16 2020-09-23 Telefonaktiebolaget LM Ericsson (PUBL) Method and device for real-time network event processing
WO2020112023A1 (en) * 2018-11-26 2020-06-04 Agency For Science, Technology And Research Method and system for predicting performance in electronic design based on machine learning
FR3108738B1 (fr) * 2020-03-26 2022-04-29 Safran Electronics & Defense Procédé de traitement de données de vol
WO2022174095A1 (en) 2021-02-15 2022-08-18 Baker Hughes Oilfield Operations Llc Operation identification of sequential events
US12026204B2 (en) 2022-05-31 2024-07-02 Acronis International Gmbh Automatic incident dispatcher

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009237914A (ja) 2008-03-27 2009-10-15 Toshiba Corp リスク要因を同定するためのリスク予測装置
US20150253366A1 (en) 2014-03-06 2015-09-10 Tata Consultancy Services Limited Time Series Analytics
JP2016170518A (ja) 2015-03-11 2016-09-23 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US20160371588A1 (en) 2014-12-05 2016-12-22 Simularity, Inc. Event predictive archetypes
JP2017033307A (ja) 2015-07-31 2017-02-09 国立大学法人 筑波大学 プログラム,グループ予測装置,及びグループ予測方法
JP2017107541A (ja) 2015-12-01 2017-06-15 株式会社リコー 情報処理装置、情報処理方法、プログラムおよび検査システム
JP2017173956A (ja) 2016-03-22 2017-09-28 日本電気株式会社 情報処理装置、情報処理システム、制御方法、及びプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5771342A (en) * 1995-06-05 1998-06-23 Saltire Software Method and apparatus for dynamically displaying consistently dimensioned two-dimensional drawings
US7730494B1 (en) * 2005-04-20 2010-06-01 At&T Corp. Methods and apparatus for service and network management event correlation
US20080062167A1 (en) * 2006-09-13 2008-03-13 International Design And Construction Online, Inc. Computer-based system and method for providing situational awareness for a structure using three-dimensional modeling
US8683490B2 (en) * 2007-02-15 2014-03-25 Microsoft Corporation Computer system events interface
US8260773B2 (en) * 2008-09-24 2012-09-04 International Business Machines Corporation Method for extracting signature from problem records through unstructured and structured text mapping, classification and ranking
US20130204826A1 (en) * 2012-02-07 2013-08-08 Avmet Applications Inc. System and method for identification of similar events using data and characteristics
US9026856B2 (en) * 2012-09-06 2015-05-05 Red Hat, Inc. Predicting symptoms of run-time problems in view of analysis of expert decision making
US9880916B2 (en) * 2012-09-25 2018-01-30 International Business Machines Corporation Management of system events using one or more event attributes
US20160110669A1 (en) * 2014-10-15 2016-04-21 AJOOOBA, Inc. Optimizing events
CN104376406B (zh) * 2014-11-05 2019-04-16 上海计算机软件技术开发中心 一种基于大数据的企业创新资源管理与分析方法
US20160275170A1 (en) * 2015-03-20 2016-09-22 International Business Machines Corporation Event recommendation system and method
EP3430767B1 (en) * 2016-03-16 2020-09-23 Telefonaktiebolaget LM Ericsson (PUBL) Method and device for real-time network event processing
CN105868108B (zh) * 2016-03-28 2018-09-07 中国科学院信息工程研究所 基于神经网络的指令集无关的二进制代码相似性检测方法
EP3255581A1 (en) * 2016-06-10 2017-12-13 General Electric Company Digital pattern prognostics
US11080359B2 (en) * 2017-12-21 2021-08-03 International Business Machines Corporation Stable data-driven discovery of a symbolic expression

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009237914A (ja) 2008-03-27 2009-10-15 Toshiba Corp リスク要因を同定するためのリスク予測装置
US20150253366A1 (en) 2014-03-06 2015-09-10 Tata Consultancy Services Limited Time Series Analytics
US20160371588A1 (en) 2014-12-05 2016-12-22 Simularity, Inc. Event predictive archetypes
JP2016170518A (ja) 2015-03-11 2016-09-23 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
JP2017033307A (ja) 2015-07-31 2017-02-09 国立大学法人 筑波大学 プログラム,グループ予測装置,及びグループ予測方法
JP2017107541A (ja) 2015-12-01 2017-06-15 株式会社リコー 情報処理装置、情報処理方法、プログラムおよび検査システム
JP2017173956A (ja) 2016-03-22 2017-09-28 日本電気株式会社 情報処理装置、情報処理システム、制御方法、及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高橋 和子 外,社会学における職業・産業コーディング自動化システムの活用,自然言語処理,日本,一般社団法人言語処理学会,2017年02月15日,第24巻第1号,pp. 135-170

Also Published As

Publication number Publication date
CN109977987A (zh) 2019-07-05
EP3502920A1 (en) 2019-06-26
JP2019153279A (ja) 2019-09-12
US20190197424A1 (en) 2019-06-27

Similar Documents

Publication Publication Date Title
JP7495777B2 (ja) 物理的システムに影響を与えるイベントの予測
US11347201B2 (en) Methods and apparatus for machine learning predictions of manufacture processes
CN107038751B (zh) 从2d图像进行3d建模对象的识别的方法、介质与系统
Kim et al. Imbalanced classification of manufacturing quality conditions using cost-sensitive decision tree ensembles
US10949425B2 (en) Retrieval of outcomes of precomputed models
US10303784B2 (en) Querying a database with likeness criterion
EP3264286B1 (en) Querying a database with morphology criterion
US11176481B2 (en) Evaluation of a training set
CN106227760B (zh) 用于构建、查询数据库的方法、装置和介质
Danglade et al. On the use of machine learning to defeature CAD models for simulation
JP6390239B2 (ja) 情報処理装置、及びプログラム
CN111316292A (zh) 使用共现单纯复形的持续几何特征对客户可观察对象进行多尺度分层聚类
US20230267248A1 (en) Machine learning-based generation of constraints for computer-aided design (cad) assemblies
CN116663338B (zh) 一种基于相似算例的仿真分析方法、装置、设备及介质
US11741154B2 (en) 3D clustering navigation
JP2006350766A (ja) 情報処理装置,情報処理用プログラムが記録された媒体及び情報処理方法
EP4163086B1 (en) 3d printing planning
Rashmi et al. Hybrid Entropy Method for Large Data Set Reduction Using MLP-ANN and SVM Classifiers
CN117785250A (zh) 系统变更的质控方法、装置、计算机设备和存储介质
CN117455695A (zh) 资源借调违约预测方法、装置、计算机设备和存储介质
Vadvári et al. Polytopic Representation of Parameter Varying Neural Models for Loading Systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230509

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231006

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240328

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20240408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240430

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240524

R150 Certificate of patent or registration of utility model

Ref document number: 7495777

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150