JP6688821B2 - 特徴抽出およびその解釈のための、信号分析システムおよび方法 - Google Patents

特徴抽出およびその解釈のための、信号分析システムおよび方法 Download PDF

Info

Publication number
JP6688821B2
JP6688821B2 JP2018041673A JP2018041673A JP6688821B2 JP 6688821 B2 JP6688821 B2 JP 6688821B2 JP 2018041673 A JP2018041673 A JP 2018041673A JP 2018041673 A JP2018041673 A JP 2018041673A JP 6688821 B2 JP6688821 B2 JP 6688821B2
Authority
JP
Japan
Prior art keywords
feature
window
features
hardware processors
filtered data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018041673A
Other languages
English (en)
Other versions
JP2019087221A (ja
Inventor
スネハシス・バネルジー
タヌシャム・チャットパディヤイ
アヤン・ムケルジー
Original Assignee
タタ・コンサルタンシー・サーヴィシズ・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by タタ・コンサルタンシー・サーヴィシズ・リミテッド filed Critical タタ・コンサルタンシー・サーヴィシズ・リミテッド
Publication of JP2019087221A publication Critical patent/JP2019087221A/ja
Application granted granted Critical
Publication of JP6688821B2 publication Critical patent/JP6688821B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/10Interfaces, programming languages or software development kits, e.g. for simulating neural networks

Description

関連出願の相互参照および優先権
この特許出願は、2017年11月3日に出願されたインド特許出願第201721039304号の優先権を主張する。
ここでの開示は、概して、データ分析システム、より詳細には、推奨のための特徴抽出およびその解釈のため信号分析システムおよび方法に関する。
センサデータを基にした記述的および規範的システムの開発は、分類および回帰のような機械学習タスクを関与させる。そのようないずれのシステム開発も、問題領域を理解するための異なる利害関係者の関与、因果関係分析、信号処理(SP)、および機械学習(ML)技法のためのモデルを生成してデータ分析を行うこと、そして最後に、開発者がソリューションを展開することを要求する。ここで、そのようなシステムを開発することの課題は、各々の利害関係者が自分自身の言葉および用語を話すことである。関連する調査では、上記のワークフローにおける最も難しいタスクは、すなわち特徴エンジニアリング(特徴列挙/抽出と特徴選択との組合せ)であることがわかっており、ディープラーニングアプローチでは、そのような特徴は、1-Dセンサ信号については解釈可能でなく、したがって、故障予測(prognostics)およびアクティビティ監視を行うことに関してはエラーを被りやすい。
本開示の実施形態は、従来のシステムにおいて発明者によって認識された前述の技術的課題の1つまたは複数に対するソリューションとして、技術的改善を提示する。例えば、一態様では、特徴抽出および解釈のためにデータ分析を行うための、プロセッサによって実施される方法が提供される。この方法は、1つまたは複数のハードウェアプロセッサによって入力データ(例えば入力信号)を1つまたは複数のセンサから得るステップと、1つまたは複数のハードウェアプロセッサによって入力データを前処理して、雑音と1つまたは複数の異常のうちの少なくとも一方をフィルタリングしてフィルタリング済みデータを得るステップと、ウィンドウを基にした処理技法をフィルタリング済みデータに対して使用して第1の特徴セットをフィルタリング済みデータから抽出するステップであって、第1の特徴セットからの各特徴が一意であり1つまたは複数の領域に対応する、ステップと、第1の特徴セットにメタデータを適用するステップと、選択および推奨システムを使用して、メタデータを適用するときに第1の特徴セットから第2の特徴セットを生成するステップと、ウィンドウを基にした処理技法において観察された1つまたは複数の時間インスタンスに基づいて、第2の特徴セットについての1つまたは複数の特徴値を生成するステップと、例えば知識グラフ探索のような構造化知識表現法による探索に基づいて、1つまたは複数の生成された特徴値の、1つまたは複数の対応する事前定義済み領域値との比較を行うステップと、この比較に基づいて、1つまたは複数の生成された特徴値を1つまたは複数の対応する領域特有テンプレートにマッピングするステップとを含む。
一実施形態では、ウィンドウを基にした処理技法をフィルタリング済みデータに対して使用して第1の特徴セットをフィルタリング済みデータから抽出するステップは、ウィンドウを基にした処理技法を使用して適用される各ウィンドウに関連するウィンドウサイズ(またはフレーム)を分析するステップと、分析されたウィンドウサイズを使用して各ウィンドウに関連する第1の特徴セットを抽出するステップとを含み得る。一実施形態では、ウィンドウサイズは、領域によって指定されるウィンドウと、統計的に識別されるウィンドウサイズのうちの少なくとも一方の重み付き集約に基づいて分析される。
一実施形態では、この方法はさらに、第2の特徴セットからの各特徴に対応する1つまたは複数の特徴値を調整して、1つまたは複数の領域内の各特徴の性能を決定するステップを含み得る。一実施形態では、この方法はさらに、ウィンドウを基にした処理技法を適用するときに各ウィンドウから1つまたは複数の重複特徴を識別するステップと、1つまたは複数の重複特徴を第1の特徴セットからフィルタリングするステップとを含み得る。
別の態様では、特徴抽出および解釈のためにデータ分析を行うためのシステムが提供される。このシステムは、命令を記憶したメモリと、1つまたは複数の通信インタフェースと、1つまたは複数の通信インタフェースによってメモリに結合された1つまたは複数のハードウェアプロセッサとを含み、1つまたは複数のハードウェアプロセッサは、命令によって、入力データを1つまたは複数のセンサから得るステップと、入力データを前処理して、雑音と1つまたは複数の異常のうちの少なくとも一方をフィルタリングしてフィルタリング済みデータを得るステップと、ウィンドウを基にした処理技法をフィルタリング済みデータに対して使用して第1の特徴セットをフィルタリング済みデータから抽出するステップであって、第1の特徴セットからの各特徴が一意であり1つまたは複数の領域に対応する、ステップと、第1の特徴セットにメタデータを適用するステップと、選択および推奨システムを使用して、メタデータを適用するときに第1の特徴セットから第2の特徴セットを生成するステップと、ウィンドウを基にした処理技法において観察された1つまたは複数の時間インスタンスに基づいて、第2の特徴セットについての1つまたは複数の特徴値を生成するステップと、例えば知識グラフ探索のような構造化知識表現法による探索に基づいて、1つまたは複数の生成された特徴値の、1つまたは複数の対応する事前定義済み領域値との比較を行うステップと、この比較に基づいて、1つまたは複数の生成された特徴値を1つまたは複数の対応する領域特有テンプレートにマッピングするステップとを行うように構成される。
一実施形態では、第1の特徴セットは、ウィンドウを基にした処理技法を使用して適用される各ウィンドウに関連するウィンドウサイズ(またはフレーム)を分析するステップと、分析されたウィンドウサイズを使用して各ウィンドウに関連する第1の特徴セットを抽出するステップとによって、フィルタリング済みデータから抽出される。一実施形態では、ウィンドウサイズは、領域によって指定されるウィンドウと、統計的に識別されるウィンドウサイズのうちの少なくとも一方の重み付き集約に基づいて分析される。
一実施形態では、1つまたは複数のハードウェアプロセッサはさらに、第2の特徴セットからの各特徴に対応する1つまたは複数の特徴値を調整して、1つまたは複数の領域内の各特徴の性能を決定するステップを行うように構成され得る。一実施形態では、ウィンドウを基にした処理技法がフィルタリング済みデータに適用されたとき、1つまたは複数のハードウェアプロセッサはさらに、各ウィンドウから1つまたは複数の重複特徴を識別するステップと、1つまたは複数の重複特徴を第1の特徴セットからフィルタリングするステップとを行うように構成される。
さらに別の態様では、1つまたは複数の命令を含む1つまたは複数の非一時的な機械可読情報記憶媒体が提供される。1つまたは複数の命令は、1つまたは複数のハードウェアプロセッサによって実行されたとき、入力データを1つまたは複数のセンサから得るステップと、1つまたは複数のハードウェアプロセッサによって入力データを前処理して、雑音と1つまたは複数の異常のうちの少なくとも一方をフィルタリングしてフィルタリング済みデータを得るステップと、ウィンドウを基にした処理技法をフィルタリング済みデータに対して使用して第1の特徴セットをフィルタリング済みデータから抽出するステップであって、第1の特徴セットからの各特徴が一意であり1つまたは複数の領域に対応する、ステップと、第1の特徴セットにメタデータを適用するステップと、選択および推奨システムを使用して、メタデータを適用するときに第1の特徴セットから第2の特徴セットを生成するステップと、ウィンドウを基にした処理技法において観察された1つまたは複数の時間インスタンスに基づいて、第2の特徴セットについての1つまたは複数の特徴値を生成するステップと、例えば知識グラフ探索のような構造化知識表現法による探索に基づいて、1つまたは複数の生成された特徴値の、1つまたは複数の対応する事前定義済み領域値との比較を行うステップと、この比較に基づいて、1つまたは複数の生成された特徴値を1つまたは複数の対応する領域特有テンプレートにマッピングするステップとによって、特徴抽出およびその解釈のためにデータ分析を行うことを引き起こす。
一実施形態では、ウィンドウを基にした処理技法をフィルタリング済みデータに対して使用して第1の特徴セットをフィルタリング済み信号から抽出するステップは、ウィンドウを基にした処理技法を使用して適用される各ウィンドウに関連するウィンドウサイズ(またはウィンドウフレーム)を分析するステップと、分析されたウィンドウサイズを使用して各ウィンドウに関連する第1の特徴セットを抽出するステップと、を含み得る。一実施形態では、ウィンドウサイズは、領域によって指定されるウィンドウと、統計的に識別されるウィンドウサイズのうちの少なくとも一方の重み付き集約に基づいて分析される。
一実施形態では、命令はさらに、第2の特徴セットからの各特徴に対応する1つまたは複数の特徴値を調整して、1つまたは複数の領域内の各特徴の性能を決定するステップを引き起こし得る。一実施形態では、命令はさらに、ウィンドウを基にした処理技法を適用するときに各ウィンドウから1つまたは複数の重複特徴を識別するステップと、1つまたは複数の重複特徴を第1の特徴セットからフィルタリングするステップとを引き起こし得る。
前述の全般的な記載と後続の詳細な記載の両方は、例示的かつ説明的なものにすぎず、特許請求される本発明の限定でないことが理解されるべきである。
この開示に組み込まれ、この開示の一部をなす添付図面は、例示的な実施形態を示し、この記載と共に、開示される原理を説明する働きをする。
本開示の一実施形態による、推奨のための入力データからの特徴抽出およびその解釈のためのデータ分析システムの例示的なブロック図を示す。 本開示の一実施形態による、このシステムを使用した推奨のための入力データからの特徴抽出およびその解釈のための方法を示す例示的なブロック図を示す。 本開示の一実施形態による、ワイドラーニングアーキテクチャに基づく特徴エンジニアリングのための例示的な自動化された方法を示す。 本開示の一実施形態による、図1のシステムの特徴解釈モジュールを示す例示的なブロック図である。 本開示の例示的な一実施形態による、図1のシステムを使用した特徴解釈のための方法を示す流れ図を示す。
添付図面を参照して、例示的な実施形態が記載される。図において、参照番号の一番左の数字は、その参照番号が最初に現れる図を識別する。好都合な場合は常に、図面を通して、同じまたは同様の部分を参照するために同じ参照番号が使用される。開示される原理の例および特徴がここで記載されるが、開示される実施形態の思想および範囲を逸脱することなく、修正、適応、および他の実装が可能である。後続の詳細な記載は例示にすぎないと考えられ、真の範囲および思想は後続の特許請求の範囲によって示されることが意図される。
センサデータを基にした記述的および規範的システムの開発は、分類および回帰のような機械学習タスクを関与させる。そのようないずれのシステム開発も、問題領域を理解するために異なる利害関係者の関与、因果関係分析、信号処理(SP)、および機械学習(ML)技法のためのモデルを生成してデータ分析を行うこと、そして最後に、開発者がソリューションを展開することを要求する。問題領域を理解するために、因果関係分析のためのモデルの特徴の意味がわかる領域専門家、例えば、機械故障予測の場合は機械プラントの機械技術者、適切な信号処理アルゴリズム(スペクトログラムのような)およびそれらの対応する調整パラメータ(スペクトルタイプおよびウィンドウオーバラップのような)を提案できる信号処理(SP)専門家、データ分析を行うことができ、分類および回帰のようなMLタスクのためのモデルを設計できる機械学習(ML)専門家、他の利害関係者が入力を共有した後でエンドユーザによって使用されるべき展開可能なソリューションを構築できるコーダまたは開発者が要求される。
ここで、そのようなシステムを開発することの問題は、各々の利害関係者が自分自身の言葉および用語を話すことである。そのようなセンサデータ分析タスクに関する典型的なワークフローステップは、次のとおりである。1. 領域専門家が、使用事例および適用に関係する問題の目標をSPおよびMLリソースパーソンに説明する。2. SP専門家が、所与の問題について特徴として使用できるアルゴリズム(データを分析容易にするためのデータ変換)のリストを提供する。3. ML専門家が、利用可能なデータセットの分析と、類似の問題に関する自分の知識とに基づいて、最適な特徴セットを推奨する。4. SP専門家が、これらのアルゴリズムのパラメータ(ウィンドウサイズ、高速フーリエ変換アルゴリズムのnポイントのような)を調整し、ML専門家が、(ハイパー)パラメータを調整してソリューションモデルを導出する。5. 推奨された特徴セットが、検証および確認のために領域専門家に提示されて、抽出された特徴が適切かどうかチェックされる。6. 現在の特徴が無意味である場合がしばしばあるが、その場合に、アプローチを変更し領域専門家のフィードバックを考慮に入れながら反復して、ステップ2〜5が繰り返される。7. 完成されたモデルを有する最終的なシステムが、開発者によって展開される。関係する調査では、上記のワークフローにおける最も難しいタスクは、タスク2および3、すなわち特徴エンジニアリング(特徴列挙/抽出と特徴選択との組合せ)であることがわかっている。ステップ5(領域専門家による特徴の検証)は、ディープラーニングを基にしたアプローチにおいては難しい。というのは、得られる特徴は、1-Dセンサ信号については解釈可能でないからである。本開示の実施形態は、修正ワイドラーニングアプローチを使用して、機械故障予測およびアクティビティ監視のために、推奨された特徴をどのように解釈するかを示すシステムおよび方法を提供する。
本開示の実施形態は、特徴抽出およびその解釈のために信号分析を行うシステムおよび方法を提供する。このシステムは、信号データ分析問題を解決するために、解釈可能な特徴推奨のためのアプローチを実装する。提案されるアプローチは、ワイドラーニングアーキテクチャに基づき、推奨された特徴の解釈のための手段を提供する。そのような解釈は、(畳み込みニューラルネットワークのような)ディープラーニングのような特徴学習アプローチ、または主成分分析のような特徴変換アプローチでは利用可能でないことが留意されるべきである。結果は、この特徴推奨および解釈技法が、性能と、ソリューションを開発する時間の劇的な短縮との点から、目下の問題に対して非常に効果的であることを表わす。
より詳細には、本開示は、分類および回帰タスクに適したセンサ信号データ分析(の自動化)のためのシステムおよび方法を記載する。これは、解釈可能な特徴推奨ならびに特徴学習のためのアプローチに基づく。この方法は、特徴の解釈が非常に重要であると考えられる故障予測の領域のデータセットに対して実験を行うことによってテストされた。提案されるアプローチは、ワイドラーニングアーキテクチャに基づき、推奨された特徴の解釈のための手段を提供する。結果は、この特徴推奨および解釈技法が、性能と、ソリューションを開発する時間の劇的な短縮との点から、目下の問題に対して非常に効果的であることを表わす。また、この人間が関与する解釈システムをどのように規範的システムとして使用できるかが例によって表わされる。提案されるシステムの入力は、生信号データであり、出力は、1)解釈可能な特徴セット、および2)機械学習モデルであり、これは、ある意味では、センサデータ分析プロセスを自動化することであり、別の意味では、故障予測のための因果関係分析を行うことである。本開示は、センサから導出されたデータに制限または限定されず、処理のための信号値指向のフォーマットにマッピングされ得る任意の様々なデータへのものであることが、この技術分野の当業者に留意および理解されるべきである。また、システムは、メタデータと適用を伴う領域の知識ベースとの組合せにさらに基づいて活用できる組込み学習を有する。
ここで図面、より詳細には、同様の参照文字が図面を通して一貫して対応する特徴を示す図1〜図5を参照すると、好ましい実施形態が表わされ、これらの実施形態は、以下の例示的なシステムおよび/または方法の文脈で記載される。
図1は、本開示の一実施形態による、推奨のための入力データからの特徴抽出およびその解釈のためのデータ分析システムの例示的なブロック図を示す。一実施形態では、システム100は、1つまたは複数のプロセッサ104と、通信インタフェースデバイスまたは入出力(I/O)インタフェース106と、1つまたは複数のプロセッサ104に動作可能に結合された1つまたは複数のデータ記憶デバイスまたはメモリ102とを含む。1つまたは複数のプロセッサ104は、1つまたは複数のソフトウェア処理モジュールおよび/またはハードウェアプロセッサであってよい。一実施形態では、ハードウェアプロセッサは、1つまたは複数のマイクロプロセッサ、マイクロコンピュータ、マイクロコントローラ、ディジタル信号プロセッサ、中央処理ユニット、状態機械、ロジック回路、および/または、動作命令に基づいて信号を操作する任意のデバイスとして実装されることが可能である。プロセッサは、能力のうちでもとりわけ、メモリに記憶されたコンピュータ可読命令をフェッチして実行するように構成される。一実施形態では、デバイス100は、ラップトップコンピュータ、ノートブック、ハンドヘルドデバイス、ワークステーション、メインフレームコンピュータ、サーバ、ネットワーククラウドなどのような様々なコンピューティングシステム内で実装されることが可能である。
I/Oインタフェースデバイス106は、様々なソフトウェアおよびハードウェアインタフェース、例えば、ウェブインタフェース、グラフィカルユーザインタフェースなどを含むことが可能であり、例えばLAN、ケーブルなどの有線ネットワーク、およびWLAN、セルラー、衛星のような無線ネットワークを含む、多様なネットワークN/Wおよびプロトコルタイプ内で、複数の通信を容易にすることができる。一実施形態では、I/Oインタフェースデバイスは、複数のデバイスを相互にまたは別のサーバに接続するための、1つまたは複数のポートを含むことができる。
メモリ102は、例えば、スタティックランダムアクセスメモリ(SRAM)およびダイナミックランダムアクセスメモリ(DRAM)のような揮発性メモリ、ならびに/または、リードオンリメモリ(ROM)、消去可能プログラム可能なROM、フラッシュメモリ、ハードディスク、光学ディスク、および磁気テープのような不揮発性メモリを含む、この技術分野で知られている任意のコンピュータ可読媒体を含むことができる。一実施形態では、データベース108がメモリ102に記憶されることが可能であり、データベース108は、次のものに限定されないが、分析のために受け取られた1つまたは複数の入力データ(例えば入力信号)に関係する情報、抽出された特徴、対応するメタデータ、推奨のための解釈詳細などを記憶するためのマッチングテンプレート、特徴に関連する値の調整情報、各特徴の性能データなどを含み得る。一実施形態では、メモリ102は、1つまたは複数の分類器(図1には示さず)などを記憶し得る。これらの分類器は、ここに記載された方法を実行するために、特徴の学習を可能にし、特徴を評価し、訓練データを使用してシステム100を訓練するために、1つまたは複数のハードウェアプロセッサ104によって(またはシステム100によって)実装される。
図2は、図1を参照して、本開示の一実施形態による、システム100を使用して推奨のための入力データからの特徴抽出およびその解釈のための方法を示す例示的なブロック図を示す。図3は、図1〜図2を参照して、本開示の一実施形態による、ワイドラーニングアーキテクチャに基づく特徴エンジニアリングのための例示的な自動化された方法を示す。一実施形態では、システム100は、1つまたは複数のハードウェアプロセッサ104に動作可能に結合され、1つまたは複数のプロセッサ104によってこの方法のステップの実行のための命令を記憶するように構成された、1つまたは複数のデータ記憶デバイスまたはメモリ102を含む。ここで、図1に示されるようなシステム100のコンポーネント、および図2の流れ図、および図3のアーキテクチャを参照して、本開示の方法のステップが記載される。本開示の一実施形態では、ステップ202で、1つまたは複数のハードウェアプロセッサ104は、1つまたは複数のセンサから入力信号を得る。本開示の一実施形態では、ステップ202で、1つまたは複数のハードウェアプロセッサ104は、入力データ(例えば、データを含む入力信号)を前処理して、雑音と1つまたは複数の異常のうちの少なくとも一方をフィルタリングし(例えば、有限インパルス応答(FIR)フィルタを使用して)、フィルタリング済みデータ(例えば、フィルタリング済み信号)を得る。一実施形態では、システム100は、注釈付き入力信号データのセットを受け入れる。a)標準的な前処理ステップが実行され、最終的な結果はラベル付き行列フォーマットを含むことが可能であり、b)データは、複数の重畳した(例えば通常は5つの)「訓練およびテスト」に区分され、その後、信号データが得られる。例示的な一実施形態では、システム100は、利用可能なデータインスタンスの数に応じて、重畳の数を自動的に決定する。クラスタの数は、クラスタ品質メトリック、すなわちシルエット係数に基づいて決定された。データ区分は、訓練・評価・テストのセット間のクラスタメンバの比例分布(重畳数に従う)からなるものであった。隠れたテストセットについて性能(例えば精度)が報告され、一方、残りは特徴推奨のために使用される。性能メトリックはまた、以下の形の式を満たすような、多目的最適化問題の形のコスト関数として扱われるこ
とが可能である。operatorは、定数を伴う任意の数学演算であることが可能である。
min. or max. (weight1 * metric1 {operator} weight2 * metric2 {operator} ..... )
訓練データは、様々な特徴抽出レベルで特徴を抽出するために渡される。「評価」セットは、「訓練」セットから導出された、得られた特徴に対する分類器が関与する評価(ラッパー法の特徴選択)のために使用される。使用される分類器は、ランダムフォレストと、時間限定パラメータ調整を有するサポートベクターマシン(SVM)のための線形およびガウスカーネルとのアンサンブルである。直観は、調整不十分なモデルを使用しても、良好な特徴が現れる、というものである。
本開示の一実施形態では、ステップ206で、1つまたは複数のハードウェアプロセッサは、ウィンドウを基にした処理技法をフィルタリング済みデータに対して使用して、第1の特徴セットをフィルタリング済みデータから抽出し、第1の特徴セットからの各特徴は、一意であり、1つまたは複数の領域(および/または適用)に対応する。一実施形態では、事前定義済みの数のサンプルが一度にとられる。この数「n」は、ヒューリスティックおよび入力データ特性によって選択されるか、もしくはパラメータ最適化のための何らかのアルゴリズム/技法(例えばグリッド探索)を適用することによって選択されるかのいずれかとすることができ、または、より精巧な何らかの方法が使用されてもよい。信号として得られた入力データに対する、ある典型的な実現では、このサイズは、ウィンドウと呼ばれ得る。本開示の一実施形態では、ステップ208で、1つまたは複数のハードウェアプロセッサ104は、第1の特徴セットにメタデータを適用し、ステップ210で、選択および推奨システム(メモリ102に記憶されている)を使用して、メタデータを適用するときに第1の特徴セットから第2の特徴セットを生成する。一実施形態では、特徴は、ウィンドウを基にした処理技法を使用して適用される各ウィンドウに関連するウィンドウサイズ(またはウィンドウフレーム)を分析し、分析されたウィンドウサイズを使用して各ウィンドウに関連する特徴セットを抽出することで、抽出される。一実施形態では、ウィンドウサイズは、領域によって指定されるウィンドウと、統計的に適用されるウィンドウサイズのうちの少なくとも一方の重み付き集約に基づいて分析される。本開示の一実施形態では、ウィンドウを基にした処理技法を適用するとき、システム100は、各ウィンドウから1つまたは複数の重複特徴を識別し、識別された1つまたは複数の重複特徴を特徴セットからフィルタリングする(例えば、第1の特徴セットおよび第2の特徴セットから特徴をフィルタリングする)。
センサデータ分析の特徴は、1つまたは複数のタイプに分類されることが可能であり、例えばこれらのタイプは、次のものに限定されないが、(i)時間領域特徴(TD)、(ii)フーリエ変換を基にした特徴/短時間フーリエ変換(STFT)、(iii)離散ウェーブレット変換を基にした特徴(DWT)などである。したがって、レベル1では、基本的な特徴が抽出され、特徴選択モジュールに渡される。DWTは、そのパラメータの1つとしてマザーウェーブレットタイプの入力を要求するが、自動化されたマザーウェーブレット識別は困難な問題である。ウェーブレット変換を実施するための適切なマザーウェーブレットは、最大のエネルギー対エントロピー比を有するという点から、入力信号をマザーウェーブレットのライブラリと比較することによって選択される。特徴の目的は2つのグループ間で区別することなので、よりエラーを被りにくい代替的な距離を基にしたアプローチがシステム100によって適用されてもよい。ここでは、各マザーウェーブレットのエネルギー対エントロピー比がランク付けされ、訓練クラスのセットへの最大距離を有するものが、特徴として追加される。レベル2では、スペクトル的、統計的、時間領域を基にした、および、山および谷の特徴が抽出される。レベル3は、レベル2の特徴の種々の比および派生物を含む。例示的なアーキテクチャでは「n」個のレベルがあり得るが、各層は、階層、領域知識、およびメタデータに基づいて、論理的に分離される。2つの強力な特徴選択技法の組合せをラッパーアプローチで反復的に適用することによって、特徴サブセットが選択され、例えば、選択技法は、最小冗長性最大関連性(minimum-redundancy maximum-relevancy)(mRMR)技法、および/または、最大関連性最大重要性(maximum relevance-maximum significance)(MRMS)技法を含み得る。これらの技法は、特徴選択の異なる態様をカバーする。例えば、mRMRは分類器独立であり、MRMSは、センサデータ中で発生する可能性の高い、実数値の、雑音の多い特徴を低減するために効果的である。システム100は、必要に応じてより多くの特徴選択器を追加することを受容する。システム100は、特定の性能メトリック(精度、感度、特異性のような)について、濃度「k」の2つの特徴セット、すなわち、a)Fe1 - 交差検証のいずれかの重畳において最も高いメトリックを生じるもの、b)Fe2 - すべての重畳にわたって最も一貫性がありうまく機能するもの、を見つける。上記の特徴選択ステップは、階層的に行われ、すなわち、層1が、ユーザ定義の事前設定済みしきい値τまたは選択されたメトリックの可能な最大値(例えば1.0)によって設定される予想される結果を生じない場合は、層2(より高いレベルの特徴)が呼び出され、以下同様である。「c」は、「k」に対する正則化項であり、実験システムのハードウェア能力に比例的に依存する。今日のローエンドデスクトップマシンの場合の例として、「c」の値は25前後となる。特徴選択後、最終的な「f」個の特徴に対して網羅的探索が行われて、タスクについての理想的な特徴組合せ(2f-1個のサブセットのうちで最良)が見つけられる。図3は、図1〜図2を参照して、最適な特徴セットについての網羅的探索を行うことによる第2の特徴セットの生成を示す。ブルートフォースを適用することなく、適切な特徴組合せに確実に達することはできないことが表わされた。「s」は、網羅的探索の選択のための正則化項であり、同様に機能する「c」よりもわずかに大きい(例えば、今日のローエンドデスクトップマシンの場合は30)。「f」が大きい場合、ハイブリッドアプローチが適用されて、最適に近い特徴選択が実施される。これは、遺伝的探索、ヒューリスティクス、およびベイズ、多目的、蟻コロニーのような様々な最適化技法の組合せによって行われ、範囲は限定されない。この選択された特徴推奨セットは、標準的な技法(グリッド探索、ランダム探索のような)に基づいて、人工ニューラルネットワーク(ANN)、SVM、ランダムフォレスト事後パラメータ調整のような標準的な分類器を使用したモデル化のために使用されて、隠れたテストセットに対する結果が導出され、この結果は実際のシステム性能を表わす。システム100はまた、特徴解釈可能性が必要とされない場合に、ディープラーニング法を基にして導出された特徴を使用するオプションを有する。ワイドラーニング法およびディープラーニング法からの推奨された特徴が、重み付きランク付けを基にして組み合わされて、指定されたタスクについての優れたモデルを形成することがで
きる。重みは、ユーザ指定であってもよく、多くのデータインスタンスを実行することおいて自動的に学習されてもよく、または領域によって指定されてもよい。特徴ランク付けは、両方の特徴セットを用いた性能が関与するラッパーアプローチに基づく。
本開示の一実施形態では、ステップ212で、1つまたは複数のハードウェアプロセッサ104は、ウィンドウを基にした処理技法において観察された1つまたは複数の時間インスタンスに基づいて、第2の特徴セットについての1つまたは複数の特徴値を生成する(図4に示される)。本開示の一実施形態では、ステップ214で、1つまたは複数のハードウェアプロセッサ104は、例えば知識グラフ探索のような構造化知識表現法による探索に基づいて、1つまたは複数の生成された特徴値の、1つまたは複数の対応する事前定義済み領域値との比較を行う。言い換えれば、1つまたは複数の生成された特徴値の、1つまたは複数の対応する事前定義済み領域値との比較は、1つまたは複数の構造化知識表現法を基にした探索技法を使用して行われ得る。本開示の一実施形態では、ステップ216で、1つまたは複数のハードウェアプロセッサ104は、この比較に基づいて、1つまたは複数の生成された特徴値を、1つまたは複数の対応する領域特有テンプレートにマッピングする。索引付けされた各特徴値が生成されているステップの詳細を記憶するマッピングテーブルが、反復的に維持される(メモリ102内で)。索引付けされた各値が生成されるステップは典型的に、変換の領域、変換技法、変換されたベクトルにおける特徴値の場所、などに関する情報を含むことになる。
図4は、図1〜図3を参照して、本開示の一実施形態による、図1のシステム100の特徴解釈モジュールを示す例示的なブロック図である。表1および表2は、それぞれ0.5秒および1秒のウィンドウサイズで、データセットD1(Nasaベアリング)中での分類タスクについて得られた、サンプルの推奨される特徴セットのいくつかを表わす。
推奨される特徴は、指定されるウィンドウサイズに基づいて異なることが理解されることが可能である。特徴タイプについて得られた値の範囲と共に特徴を列挙することは、得られた特徴値を領域専門家が物質界および問題領域にマッピングするのを助け、それによって、より深い洞察が得られることが可能である。どんな特徴セット推奨フレームワークも、関連する特徴の対応するインデックスのみを推奨するであろう。そのような特徴識別メカニズムは、推奨された特徴を生成された特徴プールからさかのぼって突き止めるには十分である。しかし、そのような実践は、領域専門家の意見を取り込むことを通して推奨をさらに精緻化するためのどんな余地も残さない。また、ウィンドウ付き処理を扱うとき、しばしば、異なるウィンドウの同じ特徴が報告される可能性がある。したがって、時間変動に依存しない特徴の場合、複数ウィンドウに関する報告の代わりに、異なるウィンドウ内の特徴を識別し、これらを共に圧縮するための手段がある必要がある。この問題に対処するために、提案されるシステム100は、図4に示されるような特徴解釈モジュールからなる。特徴解釈モジュールは、推奨された特徴インデックスを入力として受け入れ、データ処理のウィンドウにわたるその段階的発生プロセスを分析することによって得ることのできるどんな緻密な情報も返す。特徴値が導出されて、入力から導出された特徴プールが形成される間、索引付けされた各特徴値が生成されているステップの詳細を記憶するマッピングテーブルが反復的に維持される。索引付けされた各値が生成されるステップは典型的に、変換の領域、変換技法、変換されたベクトルにおける特徴値の場所、などに関する情報を含むことになる。これは、一意の識別子にタグ付けされた特徴名のハードコーディングされたリポジトリとは対照的であり、それによって、新しい特徴抽出モジュールを追加することができ、メタデータ更新はコンポーネントプラグイン時に起こる。データベース108内の特徴抽出アルゴリズムエントリについてのフォーマットが維持され、このフォーマットは、アルゴリズム記述と、後で解釈を補助できる値範囲とを含む。別の特徴は、関連する特徴空間を探査することができるように、領域専門家が、経験により、物質界とのつながりを有するように見える特徴に重みを追加できることである。例として、領域専門家がスペクトル特徴を特定の適用について関連するとしてタグ付けした場合、より多くのパラメータ調整が様々なスペクトル特徴に対して実施されることになる。
この場合、ベアリング故障が、シャフト周波数における問題以外のすべての可能な理由のせいで生じ得ることを予測することができ(特徴はこの周波数を差別化要因として示さない)、それに対して、ベアリング保持器周波数が原因として故障に最も関係するように見える。したがって、将来の欠陥防止のために、推奨された特徴と、物質界へのそのマッピングとの物理的解釈によって、故障の理由を製造業者に提言することができる。ヘルスケアのような他の適用においても同様の観察を行うことができる。
上記に対処するために、テンプレートが維持され、分野または領域または適用についての特徴および予想値に関連するデータが、知識グラフ(以下、知識探索グラフまたは知識ベースとも呼ばれる)内に維持され、これは、領域および分野専門家によって提供されるか、または自動化されたウェブマイニングもしくは関連するテキストおよびメディアリポジトリの処理によって提供されるかのいずれかである。知識ベースは、オントロジーを用いた容易な拡張およびプラグアンドプレイ、および将来の証明技術との整合のために、セマンティックウェブ技術を使用して維持される。テンプレートによって満たされた結果は、最終的にユーザに表わされ、推奨が良かったか悪かったかを判断するためにフィードバックがシステム100に返される。したがって、将来のデータ分析タスクのために、特徴に対する重みが修正される。
図5は、図1〜図4を参照して、本開示の例示的な一実施形態による、図1のシステム100を使用した特徴解釈の方法を示す流れ図を示す。前述の図において論じたように、領域専門家(以下、DEとも呼ばれる)が、領域にマッピングされた特徴を提供し、特徴データベースマッピングがウェブマイニング技法によって得られる。その各値/特徴の信頼度スコアが、しきい値、例えばTと比較される。一実施形態では、信頼度スコアがしきい値T以上である場合は、特徴データベース(メモリ102に記憶されている)は、関連する技法(またはアルゴリズム)、領域、適用、メタデータなどへの、データパターンのマッピングを用いて、継続的に構築(または更新)される。一実施形態では、信頼度スコアがしきい値T未満である場合は、領域専門家によって検証が実施されてよく、特徴データベース(メモリ102に記憶されている)は、関連する技法(またはアルゴリズム)、領域、適用、メタデータなどへの、データパターンのマッピングを用いて、継続的に構築される。ウィンドウを基にした処理が行われて特徴が抽出され、一方、特徴マップが、生成された特徴を常に把握している。領域専門家からの手作業の特徴もまた入力として受け取られてよく、ウィンドウを基にした処理が抽出特徴セットに対して行われてよい。ウィンドウを基にした技法が適用されるとき、時間インスタンスのウィンドウにまたがる類似の特徴は、重複を避けるために統合され、メタデータが特徴選択のために適用される。さらに、特徴が、システム100(全体的なアーキテクチャを示す図3の、選択および推奨システムとも呼ばれる)によって抽出され推奨される。各特徴につき得られた値が結合されて、データインスタンス(または時間ウィンドウインスタンス)にわたって見つかったある範囲の特徴値が作り出される。特徴範囲(または値)は、知識グラフ探索に基づいて(またはそれによって)領域および適用の知識と比較されて、1つまたは複数のマッチがもしあればそれが決定される。さらに、特徴解釈のために、領域および/または適用における特徴の概要がマッチングテンプレートによって抽出される。
実験結果
一般的であり公開されている2つの1次元センサ信号データセットに対して、実験が行われる。この仕様は、表3において表にされ、次のように記載される。
D1およびD2:NASAベアリングデータセットは、4つのベアリングデータインスタンスを含み、各インスタンスは984個のレコードを有し、一方、第1のベアリングは、総計984個の記録された示度のうち700番目のレコードの後で故障する。最後の2つの示度は、欠損値があるので考慮されない。したがって、282が、クラスについてのグラウンドトゥルース(ground truth)としての、得られた「悪いベアリング」(クラス0)レコードであり、一方、第1のベアリングの残りの700個と、故障しない残りの3つのベアリングそれぞれからの982個の値とが、「良いベアリング」クラス1を形成する。データ不均衡化を扱いその影響を見るために、2つのデータセットが作り出され、すなわち、完全なデータセットインスタンスを含むD1と、ランダムに選択された「良いベアリング」インスタンスの小さいサブセットをすべての「悪いベアリング」インスタンスと共に含むD2とである。比較可能な結果を得るために、2進分類タスクに制限された。
D3:Mobifall3データセットは、22〜47歳のボランティアによって作り出された一般的な故障検出データセットである。このデータセットは様々なレベルのアクティビティを含むが、2進分類タスクに制限するために「故障」(クラス0)と「故障なし」(クラス1)とに区分化された。
実験セットアップ
Nvidia GTX1080GPUを有する8コアIntel 2.66 GHzマシン上でTheanoを使用して、ディープラーニングを基にした実験が実施された。多層パーセプトロン(MLP)、畳み込みニューラルネットワーク(CNN)、および長短期メモリ(LSTM)を基にした再帰型ニューラルネットワークが、標準的な経験則および原理に従って構成されて、グリッド探索を基にしたハイパーパラメータ最適化を用いて3つのデータセットについての結果が得られた。主成分分析(PCA)は、直交変換を使用して考慮中の特徴を表現する主成分を導出する、統計的プロシージャである。上記のデータセットに対して、PCA後に得られた種々の数の主成分で線形およびガウスSVMカーネルの両方を使用して、実験が実施された。
結果および分析
表4は、PCA(SVMを分類器とする)、MLP、CNN、LSTM、最新技術(SoA)、および提案されるワイド方法の各々の場合の、データセットについての得られた結果を、対応する労力と共に列挙する。
上記の表から、PCAを基にした方法(特徴が解釈可能でない場合)は、ワイド方法よりも性能が下回ることが明白である。ディープラーニング(DL)アプローチは、生データと、提案される方法によって推奨された特徴との両方に適用された。DLを基にした技法は、SoAおよび提案されるワイドラーニング方法と比較したときに失敗することがわかるが、これはおそらく、データインスタンスがより少ないからである。DLの2つの主要な問題は、1-Dセンサ信号についてはしばしば利用可能でない、多くの訓練用データ(「悪い」クラス)を必要とすること、および、因果分析のために特徴を解釈する方法がないことである。DL技法は、すべてのテストインスタンスを1つのクラスに分類することが観察され、このクラスは、NASAベアリングデータセットD1およびD2についての表3(混同行列を除く)のクラス間の比を計算することによって見出すことができる。別の注目すべき観察は、どのインスタンスにおいても、推奨された特徴に対する分類性能は、自動化された特徴学習と比較して下落していないことである。DLの場合、Mobifallデータセットについての性能は同等でないが、これは、ディープモデルを訓練するための入力ベクトルの数が少ないことに帰することができる。したがって、システム100による提案されるワイドラーニングアプローチは、開発時間の大幅な短縮と、同等の性能とを伴って、上記の場合について効果的であることがわかった。
物理的解釈
従来、特徴選択方法は手作業の労力であり、領域専門家が、自分の領域専門知識および経験を用いていくつかの特徴を識別し、次いでこれらを様々なクラスラベルについてプロットして、特徴が問題と関連するか否かを結論づける。これに沿って、ここでは、NASAベアリングデータセットが解釈分析に選択されている。他のデータセットにおいても、同様の解釈が見出された。自動化された特徴推奨方法は、以下に報告されるように、ベアリング回転要素の基本周波数の14Hz(DWT特徴)高調波空間における特徴を予測した。したがって、推奨された特徴を、関与する領域専門家によってさらに考察および分析されるように、物質界要素にマッピングすることができる。ベアリング物理学は、以下のように基本周波数を提案する。
a. 外輪周波数=236.4Hz
b. 内輪周波数=296.9Hz
c. 転動体周波数=279.8Hz
d. シャフト周波数=33.33Hz
e. ベアリング保持器周波数=14.7Hz
この書かれた記載は、任意のこの技術分野の当業者が実施形態を作成および使用できるようにするために、ここでの主題を記載する。主題の実施形態の範囲は、特許請求の範囲によって定義され、この技術分野の当業者が思いつく他の修正も含み得る。そのような他の修正は、それらが特許請求の範囲の文字通りの言葉と異ならない同様の要素を有する場合、またはそれらが特許請求の範囲の文字通りの言葉との実質的でない違いを有する等価な要素を含む場合は、特許請求の範囲内にあることが意図される。
保護の範囲は、そのようなプログラムに、それに加えて、メッセージを中に有するコンピュータ可読手段に拡張されることが理解されるべきである。そのようなコンピュータ可読記憶手段は、プログラムがサーバまたはモバイルデバイスまたは任意の適切なプログラム可能デバイス上で実行されたときに本方法の1つまたは複数のステップを実装するための、プログラムコード手段を含む。ハードウェアデバイスは、プログラムされ得る任意の種類のデバイスであることが可能であり、例えば、サーバまたはパーソナルコンピュータなどのような任意の種類のコンピュータ、またはこれらの任意の組合せを含む。デバイスはまた、例えば、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)のようなハードウェア手段、またはハードウェア手段とソフトウェア手段の組合せ、例えば、ASICおよびFPGA、もしくは、少なくとも1つのマイクロプロセッサおよびその中にソフトウェアモジュールが位置する少なくとも1つのメモリを含み得る。したがって、手段は、ハードウェア手段とソフトウェア手段の両方を含むことができる。ここに記載された方法の実施形態は、ハードウェアおよびソフトウェアにおいて実装されることが可能である。デバイスはまた、ソフトウェア手段をみ得る。別法として、実施形態は、例えば複数のCPUを使用して、異なるハードウェアデバイス上で実装され得る。
ここでの実施形態は、ハードウェア要素およびソフトウェア要素を含むことが可能である。ソフトウェアにおいて実装される実施形態は、次のものに限定されないが、ファームウェア、常駐ソフトウェア、マイクロコードなどを含む。ここに記載された様々なモジュールによって実行される機能は、他のモジュール、または他のモジュールの組合せにおいて実装され得る。この記載の目的で、コンピュータ使用可能またはコンピュータ可読媒体は、命令実行システム、装置、またはデバイスによって使用されるかまたはそれとの関連で使用されるためのプログラムを含み、記憶し、伝達し、伝搬し、または搬送できる、任意の装置とすることができる。
示されるステップは、表わされる例示的な実施形態を説明するために記載され、進行中の技術開発が特定の機能が実行される方式を変えることになることも予期されるべきである。これらの例は、限定ではなく例示のためにここに提示される。さらに、機能的な構成単位の境界は、ここでは、記載の便宜上、任意に画定されている。指定される機能およびそれらの関係が適切に実行される限り、代替の境界が画定されることが可能である。ここに含まれる教示に基づいて、代替(ここに記載されたものの等価物、拡張、変形、逸脱などを含む)は、関連する技術分野の当業者には明らかであろう。そのような代替も、開示される実施形態の範囲および趣旨の内に入る。また、単語「包含する」、「有する」、「含む」、および「備える」、ならびに他の類似の形は、等価な意味であり、無制限であることが意図される。したがって、これらの単語のいずれか1つが項目に続く場合、これはそのような項目の網羅的な列挙を意味せず、または、列挙された項目のみに限定されることも意味しない。また、ここでおよび添付の特許請求の範囲において使用されるように、単数形「a」、「an」、および「the」は、文脈が明らかに別段に指示しない限り、複数の参照を含むことが留意されなければならない。
さらに、本開示に従う実施形態を実装する際、1つまたは複数のコンピュータ可読記憶媒体が利用され得る。コンピュータ可読記憶媒体は、プロセッサによって読取可能な情報またはデータが記憶され得る任意のタイプの物理メモリを指す。したがって、コンピュータ可読記憶媒体は、ここに記載された実施形態に従うステップまたは段階をプロセッサに実行させるための命令を含めて、1つまたは複数のプロセッサによる実行のための命令を記憶し得る。「コンピュータ可読媒体」という用語は、有形の物を含み、搬送波および一時的信号を除外する、すなわち非一時的である、と理解されるべきである。例は、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、揮発性メモリ、不揮発性メモリ、ハードドライブ、CD ROM、DVD、フラッシュドライブ、ディスク、および知られている他の任意の物理記憶媒体を含む。
本開示および例は、例示にすぎないと考えられ、開示される実施形態の真の範囲および趣旨は、後続の特許請求の範囲によって示されることが意図される。
100 システム
102 メモリ
104 プロセッサ
106 通信インタフェースデバイス、入出力(I/O)インタフェース
108 データベース

Claims (15)

1つまたは複数のハードウェアプロセッサによって入力データを1つまたは複数のセンサから得るステップ(202)と、
前記1つまたは複数のハードウェアプロセッサによって前記入力データを前処理して、雑音と1つまたは複数の異常のうちの少なくとも一方をフィルタリングしてフィルタリング済みデータを得るステップ(204)と、
前記1つまたは複数のハードウェアプロセッサによって、ウィンドウを基にした処理技法を前記フィルタリング済みデータに対して使用して第1の特徴セットを前記フィルタリング済みデータから抽出するステップであって、前記第1の特徴セットからの各特徴が一意であり1つまたは複数の領域に対応する、ステップ(206)と、
前記1つまたは複数のハードウェアプロセッサによって、選択および推奨システムを使用して、前記第1の特徴セットから第2の特徴セットを生成するステップ(210)と、
前記1つまたは複数のハードウェアプロセッサによって、前記ウィンドウを基にした処理技法において観察された1つまたは複数の時間インスタンスに基づいて、前記第2の特徴セットについての1つまたは複数の特徴値を生成するステップであって、前記1つまたは複数の特徴値が、変換の領域、変換技法、変換されたベクトルにおける前記1つまたは複数の特徴値の場所を含むステップの詳細を記憶するマッピングテーブルを反復的に維持することによって生成される、ステップ(212)と、
前記1つまたは複数のハードウェアプロセッサによって、1つまたは複数の構造化知識表現法を基にした探索を使用して、前記1つまたは複数の生成された特徴値の、1つまたは複数の対応する事前定義済み領域値との比較を行うステップ(214)と、
前記1つまたは複数のハードウェアプロセッサによって、前記比較に基づいて、前記1つまたは複数の生成された特徴値を1つまたは複数の対応する領域特有テンプレートにマッピングするステップ(216)と
を含む方法。
前記1つまたは複数のハードウェアプロセッサによって、ウィンドウを基にした処理技法を前記フィルタリング済みデータに対して使用して第1の特徴セットを前記フィルタリング済みデータから抽出する前記ステップ(206)が、
前記ウィンドウを基にした処理技法を使用して適用される各ウィンドウに関連するウィンドウサイズを分析するステップと、
前記分析されたウィンドウサイズを使用して、各ウィンドウに関連する前記第1の特徴セットを抽出するステップと
を含む、請求項1に記載の方法。
前記ウィンドウサイズが、領域によって指定されるウィンドウと、統計的に識別されるウィンドウサイズのうちの少なくとも一方の重み付き集約に基づいて分析される、請求項2に記載の方法。
前記1つまたは複数のハードウェアプロセッサによって、前記第2の特徴セットからの各特徴に対応する前記1つまたは複数の特徴値を調整して、前記1つまたは複数の領域内の各特徴の性能を決定するステップをさらに含む、請求項1に記載の方法。
前記ウィンドウを基にした処理技法を前記フィルタリング済みデータに適用したときに、前記1つまたは複数のハードウェアプロセッサによって、各ウィンドウから1つまたは複数の重複特徴を識別するステップと、前記1つまたは複数の重複特徴を前記第1の特徴セットからフィルタリングするステップとをさらに含む、請求項1に記載の方法。
システム(100)であって、
命令を記憶したメモリ(102)と、
1つまたは複数の通信インタフェース(106)と、
前記1つまたは複数の通信インタフェース(106)によって前記メモリ(102)に結合された1つまたは複数のハードウェアプロセッサ(104)と
を含み、前記1つまたは複数のハードウェアプロセッサ(104)が、前記命令によって、
入力データを1つまたは複数のセンサから得るステップと、
前記入力データを前処理して、雑音と1つまたは複数の異常のうちの少なくとも一方をフィルタリングしてフィルタリング済みデータを得るステップと、
ウィンドウを基にした処理技法を前記フィルタリング済みデータに対して使用して第1の特徴セットを前記フィルタリング済みデータから抽出するステップであって、前記第1の特徴セットからの各特徴が一意であり1つまたは複数の領域に対応する、ステップと、
選択および推奨システムを使用して、前記第1の特徴セットから第2の特徴セットを生成するステップと、
前記ウィンドウを基にした処理技法において観察された1つまたは複数の時間インスタンスに基づいて、前記第2の特徴セットについての1つまたは複数の特徴値を生成するステップであって、前記1つまたは複数の特徴値が、変換の領域、変換技法、変換されたベクトルにおける前記1つまたは複数の特徴値の場所を含むステップの詳細を記憶するマッピングテーブルを反復的に維持することによって生成される、ステップと、
1つまたは複数の構造化知識表現法を基にした探索を使用して、前記1つまたは複数の生成された特徴値の、1つまたは複数の対応する事前定義済み領域値との比較を行うステップと、
前記比較に基づいて、前記1つまたは複数の生成された特徴値を1つまたは複数の対応する領域特有テンプレートにマッピングするステップと
を行うように構成された、システム(100)。
前記1つまたは複数のハードウェアプロセッサが、
前記ウィンドウを基にした処理技法を使用して適用される各ウィンドウに関連するウィンドウサイズを分析するステップと、
前記分析されたウィンドウサイズを使用して、各ウィンドウに関連する前記第1の特徴セットを抽出するステップと
によって前記フィルタリング済みデータから前記第1の特徴セットを抽出る、請求項6に記載のシステム。
前記ウィンドウサイズが、領域によって指定されるウィンドウと、統計的に識別されるウィンドウサイズのうちの少なくとも一方の重み付き集約に基づいて分析される、請求項7に記載のシステム。
前記1つまたは複数のハードウェアプロセッサがさらに、前記第2の特徴セットからの各特徴に対応する前記1つまたは複数の特徴値を調整して、前記1つまたは複数の領域内の各特徴の性能を決定するステップを行うように構成された、請求項6に記載のシステム。
前記ウィンドウを基にした処理技法がフィルタリング済みデータに適用されたとき、前記1つまたは複数のハードウェアプロセッサがさらに、各ウィンドウから1つまたは複数の重複特徴を識別するステップと、前記1つまたは複数の重複特徴を前記第1の特徴セットからフィルタリングするステップを行うように構成された、請求項6に記載のシステム。
1つまたは複数の命令を含む1つまたは複数の非一時的な機械可読情報記憶媒体であって、前記1つまたは複数の命令が、1つまたは複数のハードウェアプロセッサによって実行されたとき、
前記1つまたは複数のハードウェアプロセッサによって入力データを1つまたは複数のセンサから得るステップと、
前記1つまたは複数のハードウェアプロセッサによって前記入力データを前処理して、雑音と1つまたは複数の異常のうちの少なくとも一方をフィルタリングしてフィルタリング済みデータを得るステップと、
ウィンドウを基にした処理技法を前記フィルタリング済みデータに対して使用して第1の特徴セットを前記フィルタリング済みデータから抽出するステップであって、前記第1の特徴セットからの各特徴が一意であり1つまたは複数の領域に対応する、ステップと、
選択および推奨システムを使用して、前記第1の特徴セットから第2の特徴セットを生成するステップと、
前記ウィンドウを基にした処理技法において観察された1つまたは複数の時間インスタンスに基づいて、前記第2の特徴セットについての1つまたは複数の特徴値を生成するステップであって、前記1つまたは複数の特徴値が、変換の領域、変換技法、変換されたベクトルにおける前記1つまたは複数の特徴値の場所を含むステップの詳細を記憶するマッピングテーブルを反復的に維持することによって生成される、ステップと、
1つまたは複数の構造化知識表現法を基にした探索を使用して、前記1つまたは複数の生成された特徴値の、1つまたは複数の対応する事前定義済み領域値との比較を行うステップと、
前記比較に基づいて、前記1つまたは複数の生成された特徴値を1つまたは複数の対応する領域特有テンプレートにマッピングするステップと
を引き起こす、1つまたは複数の非一時的な機械可読情報記憶媒体。
ウィンドウを基にした処理技法を前記フィルタリング済みデータに対して使用して第1の特徴セットを前記フィルタリング済みデータから抽出する前記ステップが、
前記ウィンドウを基にした処理技法を使用して適用される各ウィンドウに関連するウィンドウサイズを分析するステップと、
前記分析されたウィンドウサイズを使用して、各ウィンドウに関連する前記第1の特徴セットを抽出するステップと、
を含む、請求項11に記載の1つまたは複数の非一時的な機械可読情報記憶媒体。
前記ウィンドウサイズが、領域によって指定されるウィンドウと、統計的に識別されるウィンドウサイズのうちの少なくとも一方の重み付き集約に基づいて分析される、請求項12に記載の1つまたは複数の非一時的な機械可読情報記憶媒体。
前記1つまたは複数の命令がさらに、前記第2の特徴セットからの各特徴に対応する前記1つまたは複数の特徴値を調整して、前記1つまたは複数の領域内の各特徴の性能を決定するステップを引き起こす、請求項11に記載の1つまたは複数の非一時的な機械可読情報記憶媒体。
前記1つまたは複数の命令がさらに、
前記ウィンドウを基にした処理技法を前記フィルタリング済みデータに適用したときに各ウィンドウから1つまたは複数の重複特徴を識別するステップと、
前記1つまたは複数の重複特徴を前記第1の特徴セットからフィルタリングするステップと
を引き起こす、請求項11に記載の1つまたは複数の非一時的な機械可読情報記憶媒体。
JP2018041673A 2017-11-03 2018-03-08 特徴抽出およびその解釈のための、信号分析システムおよび方法 Active JP6688821B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN201721039304 2017-11-03
IN201721039304 2017-11-03

Publications (2)

Publication Number Publication Date
JP2019087221A JP2019087221A (ja) 2019-06-06
JP6688821B2 true JP6688821B2 (ja) 2020-04-28

Family

ID=61198709

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018041673A Active JP6688821B2 (ja) 2017-11-03 2018-03-08 特徴抽出およびその解釈のための、信号分析システムおよび方法

Country Status (5)

Country Link
US (1) US10664698B2 (ja)
EP (1) EP3480714A1 (ja)
JP (1) JP6688821B2 (ja)
CN (1) CN109753863B (ja)
AU (1) AU2018201654A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220329329A1 (en) * 2021-04-13 2022-10-13 Samsung Electronics Co., Ltd. Systems, methods, and apparatus for symbol timing recovery based on machine learning

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11704370B2 (en) 2018-04-20 2023-07-18 Microsoft Technology Licensing, Llc Framework for managing features across environments
US11295197B2 (en) * 2018-08-27 2022-04-05 International Business Machines Corporation Facilitating extraction of individual customer level rationales utilizing deep learning neural networks coupled with interpretability-oriented feature engineering and post-processing
US10970498B2 (en) * 2019-04-25 2021-04-06 Palo Alto Research Center Incorporated Chipless RFID decoding system and method
CN110146812B (zh) * 2019-05-15 2021-07-13 吉林大学珠海学院 一种基于特征节点增量式宽度学习的电机故障诊断方法
KR102269535B1 (ko) * 2019-06-17 2021-06-25 가톨릭관동대학교산학협력단 자동화된 작업 하중 평가 장치 및 그 방법
US11531703B2 (en) 2019-06-28 2022-12-20 Capital One Services, Llc Determining data categorizations based on an ontology and a machine-learning model
US10489454B1 (en) 2019-06-28 2019-11-26 Capital One Services, Llc Indexing a dataset based on dataset tags and an ontology
CN110442618B (zh) * 2019-07-25 2023-04-18 昆明理工大学 融合专家信息关联关系的卷积神经网络评审专家推荐方法
CN110516815A (zh) * 2019-08-29 2019-11-29 腾讯科技(深圳)有限公司 人工智能推荐模型的特征处理方法、装置及电子设备
US20210097456A1 (en) * 2019-09-30 2021-04-01 Rockwell Automation Technologies, Inc. Progressive contextualization and analytics of industrial data
CN112629659A (zh) * 2019-10-08 2021-04-09 中强光电股份有限公司 用于训练用于不同的光谱仪的管线的自动化模型训练装置和自动化模型训练方法
CN112633307A (zh) * 2019-10-08 2021-04-09 中强光电股份有限公司 用于光谱仪的自动化模型训练装置和自动化模型训练方法
CN111340110B (zh) * 2020-02-25 2023-04-18 湖南师范大学 一种基于工业过程运行状态趋势分析的故障预警方法
CN111553482B (zh) * 2020-04-09 2023-08-08 哈尔滨工业大学 机器学习模型超参数的调优方法
TWI754473B (zh) * 2020-11-27 2022-02-01 中強光電股份有限公司 用於光譜模型解釋的電子裝置和方法
JPWO2022190384A1 (ja) * 2021-03-12 2022-09-15
CN113935443B (zh) * 2021-12-20 2022-04-22 广东电网有限责任公司广州供电局 异构设备多域联合故障预测方法、装置、终端及存储介质

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6650779B2 (en) * 1999-03-26 2003-11-18 Georgia Tech Research Corp. Method and apparatus for analyzing an image to detect and identify patterns
US9818136B1 (en) * 2003-02-05 2017-11-14 Steven M. Hoffberg System and method for determining contingent relevance
US20060059112A1 (en) * 2004-08-25 2006-03-16 Jie Cheng Machine learning with robust estimation, bayesian classification and model stacking
EP1724684A1 (en) * 2005-05-17 2006-11-22 BUSI Incubateur d'entreprises d'AUVEFGNE System and method for task scheduling, signal analysis and remote sensor
US20070098303A1 (en) * 2005-10-31 2007-05-03 Eastman Kodak Company Determining a particular person from a collection
US20080030592A1 (en) * 2006-08-01 2008-02-07 Eastman Kodak Company Producing digital image with different resolution portions
WO2008130906A1 (en) * 2007-04-17 2008-10-30 Mikos, Ltd. System and method for using three dimensional infrared imaging to provide psychological profiles of individuals
US9041775B2 (en) * 2011-03-23 2015-05-26 Mgestyk Technologies Inc. Apparatus and system for interfacing with computers and other electronic devices through gestures by using depth sensing and methods of use
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
US8873813B2 (en) * 2012-09-17 2014-10-28 Z Advanced Computing, Inc. Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities
CN102360383B (zh) * 2011-10-15 2013-07-31 西安交通大学 一种面向文本的领域术语与术语关系抽取方法
US20150141043A1 (en) * 2013-08-23 2015-05-21 Cellepathy Ltd. Corrective navigation instructions
US9983670B2 (en) * 2012-09-14 2018-05-29 Interaxon Inc. Systems and methods for collecting, analyzing, and sharing bio-signal and non-bio-signal data
US9116880B2 (en) * 2012-11-30 2015-08-25 Microsoft Technology Licensing, Llc Generating stimuli for use in soliciting grounded linguistic information
US9355123B2 (en) * 2013-07-19 2016-05-31 Nant Holdings Ip, Llc Fast recognition algorithm processing, systems and methods
US9424607B2 (en) * 2013-09-20 2016-08-23 Elwha Llc Systems and methods for insurance based upon status of vehicle software
US9383210B2 (en) * 2014-01-30 2016-07-05 James L. Carr Image navigation and registration (INR) transfer from exquisite systems to hosted space payloads
US20160012318A1 (en) * 2014-07-12 2016-01-14 Microsoft Technology Licensing, Llc Adaptive featurization as a service
US10007690B2 (en) * 2014-09-26 2018-06-26 International Business Machines Corporation Data ingestion stager for time series database
IN2015CH01424A (ja) * 2015-03-20 2015-04-10 Wipro Ltd
US10033941B2 (en) * 2015-05-11 2018-07-24 Google Llc Privacy filtering of area description file prior to upload
US20160358099A1 (en) 2015-06-04 2016-12-08 The Boeing Company Advanced analytical infrastructure for machine learning
EP3433816A1 (en) * 2016-03-22 2019-01-30 URU, Inc. Apparatus, systems, and methods for integrating digital media content into other digital media content

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220329329A1 (en) * 2021-04-13 2022-10-13 Samsung Electronics Co., Ltd. Systems, methods, and apparatus for symbol timing recovery based on machine learning
US11677480B2 (en) * 2021-04-13 2023-06-13 Samsung Electronics Co., Ltd. Systems, methods, and apparatus for symbol timing recovery based on machine learning

Also Published As

Publication number Publication date
CN109753863B (zh) 2024-01-12
CN109753863A (zh) 2019-05-14
EP3480714A1 (en) 2019-05-08
AU2018201654A1 (en) 2019-05-23
US20190138806A1 (en) 2019-05-09
JP2019087221A (ja) 2019-06-06
US10664698B2 (en) 2020-05-26

Similar Documents

Publication Publication Date Title
JP6688821B2 (ja) 特徴抽出およびその解釈のための、信号分析システムおよび方法
Kusiak Convolutional and generative adversarial neural networks in manufacturing
US11481553B1 (en) Intelligent knowledge management-driven decision making model
EP3633959B1 (en) Automation of data analytics in an internet of things (iot) platform
US11037073B1 (en) Data analysis system using artificial intelligence
US20220198266A1 (en) Using disentangled learning to train an interpretable deep learning model
US20230076795A1 (en) Automated continuous validation for regulatory compliance of a computer system (cs) comprising a dynamic component
Elouataoui et al. Data quality in the era of big data: a global review
EP3330974A1 (en) System and method for physiological monitoring
US20200012941A1 (en) Method and system for generation of hybrid learning techniques
He et al. Learning with supervised data for anomaly detection in smart manufacturing
Prakash et al. Big data preprocessing for modern world: opportunities and challenges
Renjith et al. Pragmatic evaluation of the impact of dimensionality reduction in the performance of clustering algorithms
Krajsic et al. Lambda architecture for anomaly detection in online process mining using autoencoders
Serrano et al. Toward proactive social inclusion powered by machine learning
Krishnan et al. A rebalancing framework for classification of imbalanced medical appointment no-show data
US20220114490A1 (en) Methods and systems for processing unstructured and unlabelled data
Han et al. Empirical investigation of code and process metrics for defect prediction
Dzemyda et al. Data science: new issues, challenges and applications
Alhakbani et al. A swarm intelligence approach in undersampling majority class
US11811797B2 (en) Machine learning methods and systems for developing security governance recommendations
AU2018232908B2 (en) Method and system for inferential data mining
Parisot et al. Helping predictive analytics interpretation using regression trees and clustering perturbation
US20240152538A1 (en) System, apparatus, and method for structuring documentary data for improved topic extraction and modeling
US20230077998A1 (en) Systems and Methods for Smart Instance Selection

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180419

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190913

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200203

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20200203

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20200212

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20200217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200316

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200406

R150 Certificate of patent or registration of utility model

Ref document number: 6688821

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250