JP6962665B2 - 情報の分類方法、および分類プロセッサ - Google Patents

情報の分類方法、および分類プロセッサ Download PDF

Info

Publication number
JP6962665B2
JP6962665B2 JP2019547145A JP2019547145A JP6962665B2 JP 6962665 B2 JP6962665 B2 JP 6962665B2 JP 2019547145 A JP2019547145 A JP 2019547145A JP 2019547145 A JP2019547145 A JP 2019547145A JP 6962665 B2 JP6962665 B2 JP 6962665B2
Authority
JP
Japan
Prior art keywords
classification
class
information
data
techniques
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019547145A
Other languages
English (en)
Other versions
JP2020509497A (ja
Inventor
ジーサ ベンドルフ
ニコラ レオー
ティム リスト
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2020509497A publication Critical patent/JP2020509497A/ja
Application granted granted Critical
Publication of JP6962665B2 publication Critical patent/JP6962665B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、情報分類の方法に関する。さらなる実施の形態は、情報を分類するための分類プロセッサに関する。いくつかの実施の態様は、誤り検出方法に関する。
アプリケーションの多くの領域は、正確にデータを分類して、そして、同様に、自動的な方法で、例えば、スパム(eメールトラフィックにおける)、悪性腫瘍(ガン診断法)、または、稼働の状態を検出(技術的な設備)するタスク(task)を含み、および"正常なデータ"から前記データを区別する。技術的な挑戦は、可能な限り、正確に、分類を実行する技術を見つけることであり、言い換えれば、可能な限り、多くの誤りを認識することであり、同時に、できるだけ少ない誤った分類(誤分類)をエラーとすべきである。これに加えて、枠組み条件の中に存在する困難は、変えられるかもしれず、前に知られなかった誤りが起きるかもしれず、したがって、技術は、アプリケーションの進行の間にそれに応じて適応させなければならない。
原則として、専門家の知識の助けを伴う、または、機械学習から獲得した技術手段による、そのような分類は実行される可能性がある。それぞれの技術自体は、特別な制限、および不利な点を有する。特に、機械学習技術は、一般的に、大量の高品質データを必要とする一方で、実施に関して多額の出費を必要としかつ適応性がない。
文献では、サポートベクタマシーン、ロジスティック回帰、ベイズ識別器、決定木、ニューラルネットワークなどのような、分類技術の理論は、詳細が記述されている(例えば、Aggarwal 2014 Hanetal.2011を参照)。単独の分類器の技術的なアプリケーションは、広く文書化されてきており、また、特許文書に記述されてきた(US 2005/141782 A1およびUS 2006/058898 A1)。また、さまざまな技術の組み合わせが出願された(US 2005/097067 A1)。スパムフィルタリングの問題のために、適用可能な手法が記述されてきた(US 2004/177110 A1)。これに加えて、メタ学習(meta−learning)が知られている(US 6,842,751 B1)。
しかしながら、手法は、比較的に不正確、言い換えれば、相対的に多くのデータの数が誤った分類をされる。これに加えて、仮に、新しい、または、未知のデータが少しでも適用できたとしても、既知の手法は、新しい、または、未知のデータに適応させるのには非常に時間がかかる。
したがって、本発明の目的は、改良された正確な分類を備えており、およびまたは、新規なまたはデータへの適応に関する概念(concept)を提供することである。
この目的は、独立請求項によって達成される。
有利なさらなる改良は、従属請求項に見られる。
実施の形態は、第1のクラス、または、第2のクラスで情報を分類する方法を提供する。方法は、情報が第1のクラスの分類基準を満たす場合、情報を第1のクラスに割り当て、情報が第1のクラスの分類基準を満たさない場合、情報を第2のクラスに割り当てるために、第1のクラスの分類技術を情報に適用するステップを含む。方法は、情報が第2のクラスの分類基準を満たす場合、情報を第2のクラスに割り当て、かつ、情報が第2のクラスの分類基準を満たしていい場合、情報を第1のクラスに割り当てるために、第2のクラスの分類技術を情報に適用するステップをさらに含む。方法は、2つの分類方法により情が異なって割り当てられている場合、または、2つの分類方法によ互いに異なる情報の割り当てが数に達した場合には、2つの分類技術のうちの少なくとも1つの分類技術を更新するステップをさらに含むその際に、第1のクラスと第2のクラスは互いに異なる。
本発明の概念に従えば、2つの分類技術(2つの異なる、補足し合う、または、補う分類技術)は、前記情報を第1のクラスまたは第2のクラスに分類するために、同時に情報に適用され、更新段階(206)は、2つの分類技術により情が異なって割り当てられている場合、または、2つの分類技術によ互いに異なる情報の割り当てが数に達した場合には前記2つの分類段階(202、204)のうちの少なくとも1つの分類基準更新るように構成されており、2つの分類技術のうちの少なくとも1つの分類技術が更新される。
さらなる実施の形態は、情報を第1のクラスまは第2のクラスに分類するための分類プロセッサを提供する。分類プロセッサは、2つの並行した分類段階と、更新ステージとを備える。2つの分類段階のうちの第1の分類段階、情報が第1のクラスの分類基準を満たす場合、情報を第1のクラスに割り当て、情報が第1のクラスの分類基準を満たさない場合、情報を第2のクラスに割り当てる。2つの分類段階のうちの第2の分類段階、情報が第2のクラスの分類基準を満たす場合、情報を第2のクラスに割り当て、情報が第2のクラスの分類基準を満たさない場合、情報を第1のクラスに割り当て、第1のクラスと第2のクラスは、互いに異なる。更新ステージはつの分類技術により情が異なって割り当てられている場合、または、2つの分類技術によ互いに異なる情報の割り当てが数に達した場合には、2つの分類技術(202、204)のうちの少なくとも1つの分類技術を更新るように構成される
第1のクラス、または、第2のクラスの情報分類の方法の好ましい実施の形態は、以下に記述される。しかしながら、以下の記述は、分類プロセッサに適用してもよい。
実施の形態では、方法は、データを分類してもよい。もちろん、方法は、データセットのデータを分類してもよく、データセットのデータは、方法によって個々に分類されることが可能である。
実施の形態では、第1の分類技術と第2の分類技術は、互いに補完していてもよい。第1の分類技術は、第1のクラスに属する情報を認識するように構成され(例えば、適合され、または、トレーニングされ)ていてもよいのに対して、第2の分類技術は、第2のクラスに属する情報を認識するように構成され(例えば、適合され、または、トレーニングされ)ていてもよい。認識されなかった情報は、それぞれの分類技術によって、それぞれ他のクラスに割り当てられてもよい。
例えば、第1の分類技術は、第1のクラスに属する情報を認識して、および第2の分類技術は、第2のクラスに属する情報を認識するために、第1の分類技術と第2の分類技術は、異なっていてもよい。例えば、第1の分類技術は、異常値を検出する方法であってもよいのに対して、第2の分類技術は、ルールベースの技術であってもよい。
もちろん、第1の分類技術は、第1のクラスに属する情報を認識し、および第2の分類技術は、第2のクラスに属する情報を認識するために、第1の分類技術と第2の分類技術は、同じであってもよいが、トレーニングの期間は異なり、それによって、第1の分類技術は、第1のクラスに属する情報を認識して、および第2の分類技術は、第2のクラスに属する情報を認識する。例えば、両方の分類技術は、異常値を検出する方法、または、ルールベースの技術であってもよい。
実施の形態では、第1の分類技術は、異常値を検出する方法であってもよい。
この状況では、第1の分類技術は、第1のクラスの情報だけで、初期化段階の間に、初期化されてもよい。
実施の形態では、第2の分類技術は、ルールベースの技術であってもよい。
第2の分類技術は、初期化段階の間に、第2のクラスの情報だけで、または、第2のクラスの既知の分類情報だけに基づく分類基準だけで、初期化されてもよい。
実施の形態では、2つの分類技術のうちの少なくとも1つは、情報の実際のクラス割り当てについての知識を用いている間に、更新されてもよい。
例えば、2つの分類技術のうちの少なくとも1つによる情報の誤った分類の事象の中で、それぞれの分類技術、または、それぞれの分類技術の分類基準は、更新されてもよい。
例えば、第1の分類技術が不正確に情報を分類して、第2の分類技術が正確に情報を分類すると、第1の分類技術、または、第1の分類技術の分類基準(のみ更新してもよい。同様に、第1の分類技術が正確に情報を分類して、第2の分類技術が不正確に情報を分類すると、第2の分類技術、または、第2の分類技術の分類基準(のみ)を更新してもよい。もちろん、両方の分類技術、または、2つの分類技術のうちの1つだけが、不正確に情報を分類すれば、両方の分類基準(または、分類技術の分類基準)を更新することもできる。
実施の形態では、更新段階(例えば、初期化段階に続くトレーニング段階の間)は、実際には第1のクラスに割り当てられるべき所定の数の情報が、第2の分類技術によ正確に1のクラスに割り当てられているが、第1の分類技術によ、誤っ第2のクラスに割り当てられた場合、トレーニング情報のセットを更新した上で第1の分類技術を新たにトレーニング(または、適用)することによ、第1の分類技術の分類基準を更新するために、第1の分類技術をトレーニングするために用いられるトレーニング情報のセットのうちの少なくともいくつかを置き換えるステップをえる
実施の形態では、更新段階(例えば、初期化段階に続くトレーニング段階の間)は、実際には第2のクラスに割り当てられるべき所定の数の情報が、第1の分類技術によ、正確に第2のクラスに割り当てられているが、第2の分類技術によ、誤って第1のクラスに割り当てられた場合、トレーニング情報のセットを更新した上で第2の分類技術のトレーニング(または、適用)を更新することによ、第2の分類技術の分類基準を更新するために、第2の分類技術をトレーニングするために用いられるトレーニング情報のセットのうちの少なくともいくつかを置き換えるステップをえる
実施の形態では、更新段階(例えば、初期化段階に続くトレーニング段階の間)は、実際には第1のクラスに割り当てられるべき所定の数の情報が、第1の分類技術によ、正確に第1のクラスに割り当てられているが、第2の分類技術によ、誤って第2のクラスに割り当てられた場合、トレーニング情報のセットを更新した上で第2の分類技術のトレーニング(または、適用)を更新することによ、第2の分類技術の分類基準を更新するために、第2の分類技術をトレーニングするために用いられるトレーニング情報のセットの少なくともいくつかを置き換えるステップをえる
実施の形態では、更新段階(例えば、初期化段階に続くトレーニング段階の間)は、実際には第2のクラスに割り当てられるべき所定の数の情報が、第2の分類技術により、正確に第2のクラスに割り当てられているが、第1の分類技術によ、誤って第1のクラスに割り当てられた場合更新されたテストデータセットを使用して第1の分類方法を再トレーニングすることにより、最初の分類方法の分類基準を更新するために、更新段階(例えば、初期化段階後のトレーニング段階)に、第1の分類方法をトレーニングするために使用されるトレーニング情報のセット(例えば、テストデータセット)の少なくとも一部を置き換えることができる。
本発明の実施の形態は、添付された図面と関連して詳細に説明される。
本発明の情報分類の方法は、正確な分類をすることができる、そして/あるいは、新しい、または、未知のデータに適用することができる。
図1は、実施の形態に従った、情報を第1のクラスまは第2のクラスに分類する方法のフローチャートが示されている。 図2aは、第1の分類段階に従った、1つの分類技術の備えた方法を用いるときと比較することによ、2つの分類技術を備えた方法を用いるときには、1つの分類技術のみを備えた方法と比較して、より少ないフィードバックが必要とされることを例示するために、第1のクラスのデータと、第2のクラスのデータと、を備えたデータセットのみではなく、2つの分類技術を備えた方法によって提供されたデータの領域の分類結果の概略図が示されている。 図2bは、第2の分類段階に従った、1つの分類技術の備えた方法を用いるときと比較することによ、2つの分類技術を備えた方法を用いるときには、1つの分類技術のみを備えた方法と比較して、より少ないフィードバックが必要とされることを例示するために、第1のクラスのデータと、第2のクラスのデータと、を備えたデータセットのみではなく、2つの分類技術を備えた方法によって提供されたデータの領域の分類結果の概略図が示されている。 図2cは、第3の分類段階に従った、1つの分類技術のみを備えた方法を用いるときと比較することによ、2つの分類技術を備えた方法を用いるときには、1つの分類技術のみを備えた方法と比較して、より少ないフィードバックが必要とされることを例示するために、第1のクラスのデータと、第2のクラスのデータと、を備えたデータセットのみではなく、2つの分類技術を備えた方法によって提供されたデータの領域の分類結果の概略図が示されている。 図3aは、第1の分類段階に従った、1つの分類技術のみを備えた方法を用いるときと比較することによ、2つの分類技術を備えた方法を用いるときには、1つの分類技術のみを備えた方法と比較して、より高いレベルの正確性を得られることを例示するために、第1のクラスのデータと、第2のクラスのデータと、を備えたデータセットのみではなく、2つの分類技術を備えた方法によ提供されたデータの領域の分類結果の概略図が示されている。 図3bは、第2の分類段階に従った、1つの分類技術のみを備えた方法を用いるときと比較することによ、2つの分類技術を備えた方法を用いるときには、1つの分類技術のみを備えた方法と比較して、より高いレベルの正確性を得られることを例示するために、第1のクラスのデータと、第2のクラスのデータと、を備えたデータセットのみではなく、2つの分類技術を備えた方法によ提供されたデータの領域の分類結果の概略図が示されている。 図3cは、第3の分類段階に従った、1つの分類技術のみを備えた方法を用いるときと比較することによ、2つの分類技術を備えた方法を用いるときには、1つの分類技術のみを備えた方法と比較して、より高いレベルの正確性を得られることを例示するために、第1のクラスのデータと、第2のクラスのデータと、を備えたデータセットのみではなく、2つの分類技術を備えた方法によって提供されたデータの領域の分類結果の概略図が示されている。 図4は、本発明の実施の形態に従った、第1のクラスまは第2のクラス の情報の分類のための分類プロセッサの概略図が示されている。
本発明の以下の記述では、同一であるか、実行中に同一である要素は数字で同一の参照番号で提供される、そのため、それらの説明は相互に交換可能である。
図1には、第1のクラスまは第2のクラスの中の情報を分類する方法100のフローチャートが示されている。方法100は、情報が第1のクラスの分類基準を満たす場合、第1のクラスに割り当て、情報が第1のクラスの分類基準を満たさない場合、第2のクラスに割り当てるための第1の分類技術を情報に適用するステップ102を含む。方法100は、情報が第2のクラスの分類基準を満たす場合、第2のクラスに割り当て、情報が第2のクラスの分類基準を満たさない場合、第1のクラスに割り当てるための第2の分類技術を情報に適用するステップ106をさらに含む。さらに、方法100は、2つの分類方法により情が異なって割り当てられている場合、または、2つの分類技術によ互いに異なる情報の割り当てが数に達した合には、2つの分類技術のうちの少なくとも1つの分類技術更新するステップを備える。その際、第1のクラスと第2のクラスは互いに異なる。
実施の形態では、方法100は、データ(例えば、e−mail(送信者、アドレス、リファレンス(reference)など)、技術的な設備(technical plant)(温度、圧力、バルブの位置など)、または、疾病パターン(徴候、年齢、血液値など)についての情報)を分類してもよい。もちろん、方法100は、データ(例えば、e−mailについての情報、技術的な設備、または、疾病パターンについての情報)のデータセット(例えば、e−mail(送信者、アドレス、リファレンス(reference)など)についての情報、技術的な設備(温度、圧力、バルブの位置など)、または、疾病パターン(徴候、年齢、血液値など))も分類してもよく、データセットのデータにとって、方法によって、個々に分類されること(例えば、e−mail、あるいは、e−mailのセットが個々に分類された)は可能である。
実施の形態では、第1の分類技術と第2の分類技術は、互いに補完してもよい。第1の分類技術は、第1のクラスに属する情報を認識するように構成され(例えば、適合され、または、トレーニングされ)ていてもよいのに対して、第2の分類技術は、第2のクラスに属する情報を認識するように構成され(例えば、適合され、または、トレーニングされ)ていてもよい。認識されなかった情報は、それぞれの分類技術によって、それぞれ他のクラスに割り当てられてもよい。
例えば、第1の分類技術と第2の分類技術は、異なっていてもよく、それによって、第1の分類技術は、第1のクラスに属する方法を認識し、そして、第2の分類技術は、第2のクラスに属する方法を認識する。例えば、第1の分類技術は、異常値を検出する方法であってもよいのに対して、第2の分類技術は、ルールベースの技術であってもよい。
もちろん、第1の分類技術と第2の分類技術は、同じであってもよいが、トレーニングの期間は異なり、それによって、第1の分類技術は、第1のクラスに属する情報を認識し、そして、第2の分類技術は、第2のクラスに属する情報を認識する。両方の分類技術は、異常値を検出する方法、または、ルールベースの技術であってもよい。
方法100は、このように、例えば、異なる分類技術、例えば、機械学習技術を組み合わせて利用され、専門家の知識も考慮に入れてもよい。利用している間に、フィードバック手段によってそれぞれの技術を更新することによ、正確性のレベルは、アプリケーションが進行している間に、次第に改良されるかもしれず、かつ、技術は、枠組み条件の中で変化するために応してもよい。
例として、分類技術(2つのクラスの間を区別する)を実施する2つの補完する手段は、以下に記述される。
第1の手法は、クラス1への所属についての知識に基づいており(例えば、“正常なデータ”は、以下で、Nデータと呼ばれる)、クラス1の基準を満たしていないどのデータもクラス2に自動的に割り当てられる(“誤ったデータ"は、以下で、Fと呼ばれる)。逆に、第2の手法は、クラス2への所属についての知識に基づいており、クラス2の基準を満たしていないどのデータもクラス1に自動的に割り当てられる。アプリケーションの一般的な事例(例えば、スパム検出、腫瘍検出、誤り検出)では、タスク(task)は、非常に大量のクラス所属1のデータ(正常なデータ)からクラス所属2のデータ(誤ったデータ)を濾過する。この理由のために、2つの上述の手法は、互いに明確に異なっているかもしれず、第1の事例では、比較的非常に多くの数の“誤った肯定的な”結果は、一般的に生じ(クラス1はクラス2として分類される)、これに反して、第2の事例では、比較的多数の“誤った否定的な”結果は、一般的に生じる(クラス1はクラス2として分類される)。アプリケーションの事例に応じて、どちらか一方の欠点は、許容したほうがよい。理想的には、分類技術は、できる限り、低い偽陽性率を示すとともに高特異性)に、できる限り、低い偽陰性率を示すべきである(高感度)。
例として、方法100は、また、上述の2つの組み合わせを基礎にしていてもよい。任意に、アプリケーションの間に得られてもよいクラスと関連する知識は、それぞれの技術の連続した改良に組み込まれてもよい(フィードバック)。連続した更新を伴う1つの単独の技術を用いることと比較される、2つの(補完的な)技術の組み合わせから成る有利な点は、高いレベルの正確性を得るために、図2を参照して、以下にさらに詳細に記述されるように、一般的には、より少ないフィードバックが必要とされる。これに加えて、2つの補完する技術は、それぞれの技術の結果で誤った肯定的な結果と誤った否定的な結果の両方が同じになる可能性を提供し、そして、フィードバックの手段によってそれらを減少させることは、図3を参照して、以下にさらに詳細に記述される。
図2aの左側には、第1のクラスのデータ122(または、第1のクラスのデータ122、例えば、正常なデータ(N))と、第2のクラスのデータ124(または、第2のクラスのデータ124、例えば、誤ったデータ(F))と、備えたデータセット120の概略図が示されており、および、初期化段階に続いて、例として、第1の分類技術(M1)によって第1のクラスと関連する(属している)として認識されているデータセット120の領域126、そして、第2の分類技術(M2)によって第2のクラスと関連する(属している)として認識されているデータセット120の領域128、そして、データセット120の領域130(アプリケーションの領域)が有する、それに適用される2つの技術と、を備えた方法100が示されている。
図2a(また、図2b、および2c)の中には、方法100の分類結果は、データセット120のそれぞれの領域のために、かぎかっこで示されており、第1の値は、第1の分類技術の分類結果を示しており、第2の値は、第2の分類技術の分類結果を示しており、第3の値は、実際の分類技術の分類結果(または、目標の分類結果)を示している。それらの領域は、下線が引かれたフィードバック手段によって、分類技術の更新に組み込まれている。
図2aの左側で見られるように、データセット120のアプリケーション領域130の範囲内に位置するが、領域126の外側に位置する、第1の分類技術によって第1のクラスと関連すると認識されているデータセット120の第1のクラス(例えば、正常なデータ)のデータ122の領域132は、(F,N,N)によって示されており、言い換えれば、第1の分類技術は、データセット120の領域132のデータを第2のクラスのデータ(例えば、誤ったデータ)に割り当て、逆に、第2の分類技術は、データセット120の領域132のデータを第1のクラスのデータ(例えば、正常なデータ)に割り当てる。実際には、データセット120のこの領域132のデータは、第1のクラスのデータ(例えば、正常なデータ)に割り当てられるべきであった、しかしながら、そのため、第1の分類結果は不正確であり、そのため、第1の分類技術(または、第1の分類技術の分類基準)は、その次の更新段階のトレーニングステップに適用されることになっている。
データセット120のアプリケーション領域130の範囲内、および領域126の範囲内に位置しており、第1の分類技術によって、第1のデータ(例えば、正常なデータ)と関連すると認識されている、第1のクラス(例えば、正常なデータ)のデータ122の領域134は、(N,N,N)によって示されており、言い換えれば、第1の分類技術は、データセット120の領域134のデータは、第1のクラスのデータ(例えば、正常なデータ)に割り当て、そして、また、第2の分類技術は、データセット120の領域134のデータを第1のクラスのデータ(例えば、正常なデータ)に割り当てる。データセット120の領域134のデータは、第1のクラスに割り当てられるべきであった、そのため、両方の分類技術の分類結果は正しい。
データセット120の第2のクラス(例えば、誤ったデータ)のデータ124の領域136は、(F,N,F)によって示されたアプリケーション領域130の範囲内に位置しており、言い換えれば、第1の分類技術は、データセット120の領域136のデータを第2のクラスのデータ(例えば、誤ったデータ)に割り当て、逆に、第2の分類技術は、データセット120の領域136のデータを第1のクラスのデータ(例えば、正常なデータ)に割り当てる。実際には、データセット120の領域136のデータは、第2のクラスのデータ(例えば、誤ったデータ)に割り当てられるべきであった、そのため、第2の分類技術の結果は不正確であり、そして、そのため、第2の分類技術(または、第2の分類技術の分類基準)は、その次の更新段階のトレーニングステップに適用されることになっている。
比較すると、図2aの右側には、第1のクラス(例えば、正常なデータ)のデータ122と、第2のクラス(例えば、誤ったデータ)のデータ124と、を有する同一のデータセット120の概略図が示されており、同様に、初期化段階の後に、例えば、1つの単独の分類技術(M1)によって第1のクラスのデータ(例えば、正常なデータ)と関連すると認識されているデータセットの領域140、およびデータセットのデータの領域(アプリケーション領域)130は、1つの単独の分類技術と、だけを備えたそれに適用する従来の方法を有する。
図2a(および、図2bと2c)には、従の方法の分類結果がそれぞれの領域のために、かぎかっこで示され、かぎかっこの中の第1の値は、単独の分類技術の分類結果を示しており、そして、第2の値は、実際の分類結果(または、目標の分類結果)を示している。
例えば、アプリケーション領域130の範囲内ではあるが、データの領域140の外部に位置する、単独の分類技術によって第1のクラスのデータ(例えば、正常なデータ)に所属すると認識されているデータセット120の第1のクラスのデータ(例えば、正常なデータ)のデータ122の領域142は、(F,N)によって示されており、言い換えれば、単独の分類技術は、データセット120の領域142のデータを第2のクラス(例えば、誤ったデータ)に割り当てる。実際には、データセット120の領域142のデータは、第1のクラスのデータ(例えば、正常なデータ)に割り当てられるべきであった、そのため、単独の分類技術の分類結果は、不正確であり、そして、そのため、単独の分類技術(または、単独の分類技術の分類基準)は、その次の更新段階のトレーニングステップに適用されることになっている。
アプリケーション領域130の範囲内であり、また、データの領域140の範囲内に位置しており、単独の分類技術によって、第1のクラス(例えば、正常なデータ)と関連すると認識されている第1のクラス(例えば、正常なデータ)のデータ122の領域144は、(N,N)で示されており、言い換えれば、単独の分類技術は、データセット120の領域144のデータを第1のクラス(例えば、正常なデータ)に割り当てる。データセット120の領域142のデータは、第1のクラスのデータ(例えば、正常なデータ)に割り当てられるべきであった、そのため、単独の分類技術の分類結果は、正確である。
アプリケーション領域130の範囲内に位置している、データセット120の第2のクラス(例えば、誤ったデータ)のデータ124の領域146は、(F,F)によって示されており、言い換えれば、単独の分類技術は、データセット120の領域146のデータを第2のクラス(例えば、誤ったデータ)に割り当てる。データセット120の領域136は、第2のクラス(例えば、誤ったデータ)に割り当てられるべきであった、そのため、単独の分類技術の分類結果は、正確である。
図2aの左側には、第1のクラス(例えば、正常なデータ)のデータ122と、第2のクラス(例えば、誤ったデータ)のデータ124と、を備えたデータセット120の概略図が示されており、更新段階の第1のトレーニングステップに続く、例として、第1の分類技術によって第1のクラスのデータ(例えば、正常なデータ)と提携すると、すぐに、認識されるデータの領域126、そして、第2の分類技術によって第2のクラスのデータ(例えば、誤ったデータ)と提携すると、すぐに、認識されるデータの領域128、そして、それに適用される方法100を有する、データセット120のデータの領域(アプリケーションの領域)130が示されている。
図2bに見られるように、2つの分類技術(または、2つの分類技術の分類基準)は、、前の分類結果に基づいて更新される。詳細には、第1の分類技術(または、第1の分類技術の分類基準)は、前に誤って検出されたデータセット120のデータ132の領域に基づいて更新されてもよく、それによって、第1の分類技術は、すぐに、データセット120のデータ132を第1のクラス122のデータであると認識する。これに加えて、第2の分類技術(または、第2の分類技術の分類基準)は、前の分類結果に基づいて更新される。詳細には、第1の分類技術(または、第1の分類技術の分類基準)は、前に誤って検出されたデータセット120のデータ136の領域に基づいて更新されてもよく、それによって、第2の分類技術は、すぐに、データセット120のこのデータ136を第2のクラス122のデータであると認識する。データセット120の領域136は、すぐに、第1の分類技術によって、第1のクラスのデータ(例えば、正常なデータ)と関連すると認識され、したがって、図2aと比較すると、大きくなる。同様に、第2の分類技術によって、第2のクラスのデータ(例えば、誤ったデータ)と関連すると認識されているデータセット120の領域128は、図2aと比較して長くなる。
最初の更新ステップに続いて、アプリケーション領域130の範囲内ではあるが、データの領域126の外部に位置しており、第1の分類技術によって第1のクラスのデータ(例えば、正常なデータ)と関連すると、すぐに、認識されるデータセット120の第1のクラスのデータ(例えば、正常なデータ)のデータ122の領域132は、図2bでは、(F,N,N)によって示されており、言い換えれば、第1の分類技術は、データセット120の領域132のデータを第2のクラス(例えば、誤ったデータ)に割り当てる。逆に、第2の分類技術は、データセット120の領域132のデータを第1のクラスのデータ(例えば、正常なデータ)に割り当てる。実際には、データセット120の領域132のデータは、第1のクラスのデータ(例えば、正常なデータ)に割り当てられるべきであった、しかしながら、そのため、第1の分類技術の分類結果は、不正確であり、そして、そのため、第1の分類技術(または、第1の分類技術の分類基準)は、その次の更新段階のトレーニングステップに適用されることになっている。
アプリケーション領域130の範囲内、および、データの領域126の範囲内に位置しており、第1の分類技術によって第1のクラスのデータ(例えば、正常なデータ)と関連すると、すぐに、認識される第1のクラスのデータ122の領域134は、(N,N,N)によって示されており、言い換えれば、第1の分類技術は、データセット120の領域134のデータを第1のクラス(例えば、正常なデータ)に割り当て、そして、また、第2の分類技術は、データセット120の領域134のデータを第1のクラス(例えば、正常なデータ)に割り当てる。データセット120の領域134のデータは、第1のクラスのデータ(例えば、正常なデータ)に割り当てられるべきであり、そのため、両方の分類技術の分類結果は、正確である。
アプリケーション領域130の範囲内ではあるが、データの領域128の外部に位置しており、第2の分類技術によって第2のクラスに所属すると、すぐに、正しく認識されるデータセット120の第2のクラスのデータ(例えば、誤ったデータ)のデータ124の領域136は、(F,N,F)によって示されており、言い換えれば、第1の分類技術は、データセット120のこの領域136のデータを第2のクラス(例えば、誤ったデータ)に割り当て、逆に、第2の分類技術は、データセット120のこの領域136のデータを第1のクラスのデータ(例えば、正常なデータ)に割り当てる。実際には、データセット120のこの領域136のデータは、第2のクラスのデータ(例えば、誤ったデータ)に割り当てられるべきであった、そのため、第2の分類技術の分類結果は、不正確であり、そして、そのため、第2の分類技術(または、第2の分類技術の分類基準)は、その次の更新段階のトレーニングステップに適用されることになっている。
アプリケーション領域130の範囲内、および、データの領域128の範囲内に位置しており、第2の分類技術によって第2のクラスのデータ(例えば、正常なデータ)と関連すると、すぐに、正しく認識される第2のクラスのデータ(例えば、誤ったデータ)のデータの領域138は、(F,F,F)によって示されており、言い換えれば、第1の分類技術は、データセット120の領域134のデータを第2のクラスのデータ(例えば、誤ったデータ)に割り当て、そして、また、第2の分類技術は、データセット120の領域138のデータを第2のクラスのデータ(例えば、誤ったデータ)に割り当てる。データセット120の領域138のデータは、第2のクラスのデータに割り当てられるべきであり、そのため、両方の分類技術の分類結果は、正確である。
比較として、図2bの右側には、第1のクラス(例えば、正常なデータ)のデータ122と、第2のクラス(例えば、誤ったデータ)のデータ124と、備えた、同一のデータセット120の概略図、同様に、トレーニング段階の第1のトレーニングステップの後に、例えば、単独の分類技術によって、第1のクラスのデータ(例えば、正常なデータ)と関連すると、すぐに、認識されるデータの領域140、そして、単独の分類技術と、を備えたそれに適用される従来の方法を有するデータセット120の領域(アプリケーション領域)130が示されている。
図2bの右側に見られるように、単独の分類技術は、また、前に誤って検出されたデータセット120のデータの領域142に基づいて適応され、それによって、第1の分類技術は、セット120のこのデータの領域142を第1のクラス122のデータであると、すぐに、認識する。しかしながら、方法100と比較すると、これは、図2bの中で灰色(ハッチされた)領域150としてマークされた追加の支出を含む。詳細には、領域146(150を含む)は更新のために用いられるので、追加の支出は、次の更新ステップの中でそれ自身が感じられるようにするために、逆に、136(128を除く)は、小さい領域で、左側で用いられる。
第1の更新段階に続いて、アプリケーション領域130の範囲内ではあるが、データセット120の領域140の外部に位置しており、単独の分類技術によって第1のクラスのデータ(例えば、正常なデータ)と関連すると認識されているデータセット120の第1のクラス(例えば、正常なデータ)のデータ122の領域142は、(F,N)によって示されており、言い換えれば、単独の分類技術は、データセット120の領域142のデータを第2のクラス(例えば、誤ったデータ)に割り当てる。実際には、データセット120の領域142のデータは、第1のクラスのデータ(例えば、正常なデータ)に割り当てられるべきであった、そのため、単独の分類技術の分類結果は、不正確であり、そのため、単独の分類技術(または、単独の分類技術の分類基準)は、その次の更新段階のトレーニングステップに適用されることになっている。
アプリケーション領域130の範囲内であり、および、データセット120の領域140の範囲内に位置しており、単独の分類技術によって第1のクラスのデータ(例えば、正常なデータ)と関連すると認識されている第1のクラスのデータ(例えば、正常なデータ)のデータ122の領域144は、(N,N)によって示されており、言い換えれば、単独の分類技術は、データセット120の領域142のデータを第1のクラス(例えば、正常なデータ)に割り当てる。データセット120の領域142のデータは、第1のクラスのデータ(例えば、正常なデータ)に割り当てられるべきであり、そのため、単独の分類技術の分類結果は、正確である。
アプリケーション領域130の範囲内に位置する、データセット120の第2のクラス(例えば、誤ったデータ)のデータ124の領域146は、(F,F)によって示されており、言い換えれば、単独の分類技術は、データセット120の領域146のデータを第2のクラスのデータ(例えば、誤ったデータ)に割り当てる。データセット120の領域146のデータは、第2のクラスのデータ(例えば、誤ったデータ)に割り当てられるべきであり、そのため、単独の分類技術の分類結果は、正確である。
図2cの左側には、第1のクラス(例えば、正常なデータ)のデータ122(N)と、第2のクラス(例えば、誤ったデータ)のデータ124(F)と、備えた同じデータセット120の概略図、同様に、トレーニング段階の第2のトレーニングステップに従った、
例えば、第1の分類技術によって、第1のクラス(例えば、正常なデータ)と関連すると、すぐに、認識されるデータの領域126(M1)、および、第2の分類技術によって、第2のクラス(例えば、誤ったデータ)と関連すると、すぐに、認識されるデータの領域(M2)が示されている。
図2cに見られるように、2つの分類技術(または、2つの分類技術の分類基準)は、前の分類結果に基づいて更新される。詳細には、第1の分類技術(または、第1の分類技術の分類基準)は、前に誤って検出されたデータセット120の領域132に基づいて更新されてもよく、それによって、第1の分類技術は、データセット120のこの領域132を第1のクラス122のデータであると、すぐに、認識する。これに加えて、第2の分類技術(または、第2の分類技術の分類基準)は、前に誤って検出されたデータセット120の領域136に基づいて更新されてもよく、それによって、第2の分類技術は、データセット120の領域136を第2のクラス122のデータであると、すぐに認識する。第1の分類技術によって、第1のクラスと関連すると認識されたデータセット120の領域126(M1)は、したがって、図2bと比較して、より長くなる。同様に、第2の分類技術によって第2のクラスと関連すると認識されたデータセット120の領域128(M2)は、したがって、図2bと比較して、より長くなる。
比較として、図2cには、第1のクラス(例えば、正常なデータ)のデータ122と、第2のクラス(例えば、誤ったデータ)のデータ124と、を備えた同一のデータセット120、同様に、第2の更新段階の後に、例として、単独の分類技術によって第1のクラスと関連すると、すぐに、認識されるデータセットの領域140(M1)の概略図が示されている。
図2の右側に見られるように、単独の分類技術は、前に誤って検出されたデータセット120の領域142に基づいて適用されてもよく、それによって、単独の分類技術は、データセット120のこの領域142を第1のクラス122のデータであると、すぐに、認識する。
言い換えれば、図2aから2cには、2つの技術、M1およびM2が組み合わされたときに、フィードバック手段による更新メカニズムの実例が示されている。システムの空間の全体の状態は、例えば、特定の割合の“誤った”状態(F)、および“正常な状態”(N)が含まれていてもよい。初めに、既知のNデータセットは、M1をトレーニングするために用いられてもよく、そして、あるいは、既知のFデータ、または、専門家の知識から知られたルールは、M2を初期化するために用いられてもよい。2つの技術のアプリケーションは、データ(破線によって枠組みされた領域)130の上で実行される。M1の分類がM2の分類(明確に示された領域132、136、142、146)と一致しなければ、フィードバックについての追加の情報(例えば、専門家の知識)は、一方、または、両方の技術を適用するために用いられる。アプリケーションの進行の中で、そして、連続するフィードバック手段によ、M1およびM2は、継続的調整されて、理想的には、最終的に、全ての状態空間が正しく分類されるまで、必要なフィードバックはより少なくなる。
第2の更新(第2の更新段階)として、1つの単独の方法(図2aから2cの右側)と比較して、補完する技術(図2aから2cの左側)の組み合わせの利用は、1つの単独の技術(灰色(でハッチングされた)領域)のために必要なさらなるフィードバックをしてからの効果が生じる。M1タイプの単独の技術を用いると、この状況の範囲内で、誤った肯定的な結果の数が高い傾向があるときからのすべてのF結果のためのフィードバックが得られる。M2タイプ(表されていない)の1つの単独の技術を用いると、この状況の範囲内で、誤った否定的な結果の数が高い傾向があるときからのすべてのN結果のためのフィードバックが得られる。
図2aないし2cと比較すると、3aないし3cには、第1の分類技術(M1)が誤った分類をした、例えば、第2のクラスのデータ(例えば、誤ったデータ)の領域127は、第1のクラスのデータ(例えば、正常なデータ)として示されている。
この領域127のために、図3aには、分類結果として、(N,N,F)が示されており、言い換えれば、第1の分類技術は、領域127のデータを第1のクラスのデータ(例えば、正常なデータ)に割り当て、そして、また、第2の分類技術は、領域127のデータを第1のクラスのデータ(例えば、正常なデータ)に割り当てる。実際には、領域127のデータは、第2のクラス(例えば、誤ったデータ)のデータである。そのため、両方の分類技術の結果は間違っている。それによって、両方の分類技術(両方の分類技術の分類基準)は、それに続く(反復的な)更新ステップに適応される。
この場合には、領域141のための分類結果として、従来の分類技術では(N,F)得られ、言い換えれば、単独の分類技術は、領域127のデータを第1のクラス(例えば、正常なデータ)に割り当てる。実際には、しかしながら、領域127のデータは、第2のクラス(例えば、誤ったデータ)のデータである。そのため、単独の分類技術の結果は誤っている。
図3bの左側に見られるように、(N,F,F)は、適用後の領域127のための分類結果として示されており、言い換えれば、第1の分類技術は、領域127のデータを第1のクラスのデータ(例えば、正常なデータ)に割り当て、逆に、第2の分類技術は、もうすでに、領域127のデータを第2のクラスのデータ(例えば、誤ったデータ)に割り当ている。したがって、第1の分類技術の分類結果は、誤り続けており、そのため、第1の分類技術(または、第1の分類技術の分類基準)は、それに続く(反復的な)更新ステップに適応される。
また、従来の分類技術は、まだ、領域141のために、図3の中に、分類結果として、(N、F)を提供し、言い換えれば、単独の分類技術は、領域127のデータを第1のクラス(例えば、正常なデータ)に割り当てる。実際には、しかしながら、領域127のデータは、第2のクラス(例えば、誤ったデータ)のデータである。そのため、単独の分類技術の結果は間違っている。フィードバックがF結果だけのために得られたときから、適応は起こらない(領域は表示されない)。
言い換えれば、図3aないし3cには、フィードバックの方法による更新メカニズムの実例が示されている。詳細には、図3aないし3cには、単独の技術と比較した2つの補完する技術の組み合わせのための方法の比較が示されている。図2aないし2cとは対照的に、ここでは、M1が誤った否定的な結果を生じさせる場合が描写されている。単独の技術を用いたときには(図3aないし3cの右側)、M1の訂正は不可能である。しかしながら、組み合わされた2つの補完的な技術は、対応する適応を可能にする(図3c参照)。誤った肯定的な結果を生じさせる場合には、類推によって、M2は、修正されてもよい。
模範的な第1の分類技術、および第2の分類技術は以下に記述される。
第1の分類技術(または、第1の分類技術の分類基準)では、“異常値検出”のための技術が用いられてもよい。これは、さまざまなデータマイニングの技術、および多重線形回帰(multiple linear regression)、クラスタリング(clustering)(クラスタ形成(cluster formation))、質的モデルなどのような機械学習が含まれる。この技術で決定的でありえることは、クラス1(Nデータ)だけを含む一組のトレーニングデータに基づいて、それがトレーニングされるということである。もし、必要であれば、用いられる技術のためのパラメータは、テストデータのセットの手段によって調整されてもよく、そして、それは、クラス2のデータ(Fデータ)を含む。
第2の分類技術(技術2(M2))では、ルールベースの技術が用いられてもよく、ルールは明確に述べられてもよく、例えば、手動の手段(専門家の知識に基づいた)、または、(二進数の)分類技術は、サポートベクタマシーン、決定木、ロジスティック回帰、ニューラルネットワークなどを用いてもよい。また、専門家のルール、および自動的に作成されたルール/分類のルールセットを組み合せることが可能である。M2のためのトレーニングデータセットは、FデータとNデータとの両方で構成されてもよい。トレーニングデータ、決定木、または、決定森の類似するセットから自動的にルールを抽出する技術が用いられてもよい。専門家のルールを使用する場合、既知のエラー(クラス2に属する)に基づいてルールを作成できることが重要である
以下には、(反復的な、または、連続的な)データを分類する方法100の更新過程がより詳細に述べられる。
第1の段階では、トレーニングデータのセットは、Nデータだけを含むデータが用いられてもよい。第1の分類技術(M1)は、トレーニングデータのこのセットの上でトレーニングされてもよい。M1のために必要とされるかもしれないどんなパラメータもまず最初に推定されるか、交差検証の手段によって決定されてよい。
第2の段階では、おそらくもうすでに知られているかもしれない誤りは、ルールとして明確に述べられてもよい。それらは、第2の分類技術(M2)のために、出発点形成てもよい。他方で、それぞれのポイントをNデータポイントと分類するためのM2のために、初期値が用いられてもよい。
第3の段階では、M1およびM2は、データセット(分類されるための)に並行して適用されてもよい。データセットのそれぞれのデータポイントのために、M1、およびM2は、互いに、独立した分類(N、または、F)を提供してもよい。互いに異なる結果の数、言い換えれば、M1による分類≠M2による分類、決定される。
第4のステップでは、互い異なる結果の数が特定の所定の範囲を超えるとすぐに、これらの結果は、例えば、システムの専門家、ユーザー、または他のソースによ実際の分類(E)と比較することができる。その後、1およびM2は以下のように調整してもよい
M1=F,M2=N,E=N)を伴う結果の数が、所定の数を超えた場合、M1は適応されてもよく(トレーニングデータのセットは適応され)、言い換えれば、M1のためのトレーニングデータのセットから一定の数のランダムに引き出されたデータポイントは、(M1 = F,M2 = N,E = N)結果から対応する数のランダムに選ばれたデータポイントによって、置き換えられてもよい。
M1=F,M2=N,E=F)を伴う結果の数が、所定の数を超える場合、M2は適応されてもよく(トレーニングデータのセットは適され)、言い換えれば、M2のためのトレーニングデータのセットから一定の数のランダムに引き出されたデータポイントは、(M1=F,M2=N,E=F)結果から対応する数のランダムに選ばれたデータポイントによって、置き換えられてもよい。M2のためのトレーニングデータのセットは、今のところは、Nデータのみを含む場合、(M1=F,M2=N,E=F)結果から所定の数のランダムに選ばれたデータポイントは、M2のための既存のトレーニングデータのセットに加えられてもよい。
M1=N,M2=F,E=N)を伴う結果の数が、所定の数を超える場合、M2は適されてもよく(トレーニングデータセットは適応され)、言い換えれば、M2のためのトレーニングデータセットのNデータからの一定の数のランダムに引き出されたデータポイントは、(M1=N,M2=F,E=N)結果から対応する数のランダムに選ばれたデータポイントによって、置き換えられてもよい。M2のためのトレーニングデータセットが、まだ存在していない場合、(M1=N,M2=F,E=N)結果から一定の数のランダムに引き出されたデータポイントは、M2のための初期のトレーニングデータセットとして用いられてもよい。
M1=N,M2=F,E=F)を伴う結果の数が、所定の数を超える場合、M1は適応されてもよく(パラメータ調整済み)、言い換えれば、M1のためのテストデータセットのFデータから一定の数のランダムに引き出されたデータポイントは、(M1=N,M2=F,E=F)結果から対応する数のランダムに選ばれたデータポイントによって、置き換えられてもよい。M1のためのテストデータセットが存在していない場合、(M1=F,M2=N,E=F)結果から所定の数のランダムに選ばれたデータポイントは、M1のための初期のテストデータセットとして用いられてもよい。最適条件パラメータは、テストデータのアカウントを取得している間に、交差検証によって決定されてもよい。
第5の段階では、M1、およびM2は、新しいトレーニングデータセット、または、新しいパラメータを伴ってトレーニングされてもよい。
第6の段階では、ステップ3から6までが繰り返される。
図4には、本発明の実施の形態に従った、第1のクラス、または、第2のクラスで情報を分類するための分類プロセッサ200の概略図が示されている。分類プロセッサ200は、2つの並行した分類段階202、204と更新段階206とをえる。2つの分類段階202、および204のうちの第1の分類段階202は、情報が第1のクラスの分類基準を満たしていれば、情報を第1のクラスに割り当て、情報が第1のクラスの分類基準を満たしていなければ、情報を第2のクラスに割り当てる。2つの分類段階202、および204のうちの第2の分類段階204は、情報が第2のクラスの分類基準を満たしている場合、情報を第2のクラスに割り当て、情報が第2のクラスの分類基準を満たしていない場合、情報を第1のクラスに割り当て、第1のクラスと第2のクラスは互いに異なる。更新段階は、2つの分類技術によって情報が異なって割り当てられている場合、または、2つの分類技術による互いに異なる情報の割り当てが所定の数に達した場合には、2つの分類技術のうちの少なくとも1つ分類技術を更新るように構成される
異なる補完技術の組み合わせによって、実施の形態は、高度なロバスト性、および正確性を有する方法(または、分類プロセッサ、または、分類機)を提供する。これに加えて、連続したフィードバックは、アプリケーションの進行の中で正確な絶え間ない改良、そして、修正された外部状況への適応、または、新しく起きた誤りを検出することを可能にする。2つの補完技術の組み合わせを用いる決定的な利点は、必要なフィードバック動作の割合を1つの単独の技術よりも小さくして、そして、アプリケーションの経過の中で減少させていくことにある。
本発明の実施の形態は、フィルタリング、腫瘍発見、クレジットカード詐欺の識別と技術的な設備の誤り検出のために用いられる。
実施の形態では、方法100による情報分類は、例えば、センサデータ(または、センサ値)の一式のセンサデータ(または、センサ値)であってもよい。
実施の形態では、センサデータは、1つ、または、1つ以上の外部のセンサ(例えば、技術的な設備)によって検出されてもよい。
実施の形態では、例えば、センサデータは、温度、圧力、体積流量、または、制御信号であってもよい。
実施の形態では、情報が、両方の分類技術によって、第1のクラスに割り当てられていたときに、第1の信号は出力されてもよい。例えば、第1のクラスの情報は、あらかじめ定められたセンサデータ領域(または、目標計測値領域)の範囲内に存在する通常情報(例えば、センサデータ(または、計測されたセンサ値))であってもよく、第1の信号は、(例えば、技術の設備の)動作の正確な状態を示していてもよい。
実施の形態では、情報が、両方の分類技術によって、第2のクラスに割り当てられていたときに、第2の信号は出力されてもよい。例えば、第2のクラスの情報は、あらかじめ定められたセンサデータ領域(または、目標計測値領域)の外部に存在する誤り情報(例えば、センサデータ(または、計測されたセンサ値))であってもよく、第2の信号は、(例えば、技術の設備の)動作の誤った状態を示している。
実施の形態では、情報が、分類技術によって、異なるクラスに割り当てられていたときに、第3の信号は出力されてもよい。
実施の形態では、方法は、技術的な設備(例えば、サービスプラント)の中の誤りを検出して、それらを報告させるために用いられてもよい。
実施の形態では、センサの時系列データ(例えば、温度、圧力、容積測定流量、または、実際の信号)は、方法のための入力データとして用いられてもよい。
実施の形態では、時間に割り当てられた、すべて、または、選ばれたセンサは、データポイントとみなしてもよい。
実施の形態では、方法によって、それぞれのポイントは、正常として、誤りとして、または、不明として分類されてもよい。
実施の形態では、誤りとしてのデータポイントの分類は、技術的な設備の稼働の中で誤りと示されていてもよく、それによって、前記誤りは、除かれてもよい。
実施の形態では、方法の基礎になる補完的な技術が、異なる分類を示唆しているときには、不明としての分類、発生してもよい。
実施の形態では、例えば、実際のクラス分類についての知識のような、さらなる(外部の)情報が用いられている間に、“不明”の分類を伴うデータポイントは、分類されてもよい。
実施の形態では、実際の分類は、更新のために用いられ、そして、方法の基礎になる技術を改良する。例えば、実際の分類についての情報は、ユーザ(例えば、施設管理者)によって提供されてもよい。しかしながら、分類基準の更新は、ユーザによってよりも、アルゴリズムによって実行されることに注意すべきである。
実施の形態では、不明としてのデータポイントの分類は、アプリケーションの進行の中では、減少するかもしれず、データポイントの誤った分類の数も、また、減少していく。
実施の形態では、方法は枠組み状態を変えて(例えば、暖房から冷房に切り替えるように)、分類を適応して、そして、新しい誤りのタイプを検出することが可能である。
実施の形態では、どんなさらなる(外部の)情報(例えば、ユーザによって提供された)を除き、“不明”クラスのデータポイントは、いつも誤りとみなされてもよいか、いつも正常とみなされてもよいかのいずれかでもよい。
いくつかの実施例は、装置の環境の範囲内で記述されてきており、前記実施例は、また、一致する方法の記述として表現されたことは理解できた、そのため、装置のブロック、または、構造構成要素も、また、一致する方法のステップとして、または、方法のステップの特徴として理解できた。類似的に、それとともに、実施例は、結合、または、対応する装置の対応するブロック、または、詳細、または、特徴として、記述されて表現されている。すべての方法ステップのうちのいくつかは、例えば、マイクロプロセッサ、プログラム可能なコンピュータ、または、電子回路のようなハードウエア装置(または、ハードウエア装置を用いている間に)によって実行されてもよい。
発明に係る信号の符号化は、オーディオ信号、または、ビデオ信号、または、キャリアストリーム信号のような、ディジタル格納メディアに格納されてもよく、または、無線送信メディア、または、インターネットのような有線送信メディア上で送信されてもよい。
発明に係る符号化されたオーディオ信号は、ディジタル格納メディアに格納されてもよく、または、無線送信メディア、または、インターネットのような有線送信メディア上で送信されてもよい。
特定の実施件に応じて、発明の実施の形態は、ハードウエア、または、ソフトウェアで実施されてもよい。実施は、電子的に読み取り可能な制御信号が格納され、それぞれの方法が実行される、プログラム可能なコンピュータシステム協働できるまたは協働る、フロッピーディスク、DVD、ブルーレイディスク、CD、ROM、PROM、EPROM、EEPROM、または、FLASHメモリ、ハードディスクなどのような他の磁気的、または、光学的なメモリを使用して行ってもよい。したがって、デジタル記憶媒体はコンピュータで読み取り可能である。
発明に係るいくつかの実施の態様は、ここに述べられたどのような方法であっても実行されるプログラム可能なコンピュータシステムと協働することができる読み取り可能な制御信号を有するデータキャリアをえる
一般的に、本発明の実施の形態は、プログラムコードを有するコンピュータプログラム製品として実施することが可能であり、コンピュータプログラム製品がコンピュータで動いているときには、いくつかの方法を実行するために、効果的なプログラムコードを有するコンピュータプログラム製品として実施されている。
プログラムコードは、また、例えば、機械で読み取り可能なキャリアに格納されていてもよい。
他の実施の形態では、機械で読み取り可能なキャリアに格納された、ここに記述された方法のうちのいくつかを実行するための前記コンピュータプログラムをえる
えれば、発明の実施の形態の方法は、したがって、コンピュータプログラムがコンピュータで動いているときには、ここに記述された方法のうちのいくつかを実行するためのプログラムコードを有するコンピュータプログラムである。
発明のさらなる実施の形態の方法は、このような、ここに記述されたいくつかの方法が実行されているコンピュータプログラム上のデータキャリア(または、デジタル格納メディア、または、コンピュータ読み取り可能なメディア)は、そのうちに記録される、ここに記述された方法のうちの1つを実行するためのコンピュータプログラムをえる。データキャリア、ディジタル格納媒体、または、コンピュータで読み取り可能なメディアは、典型的には有形およびまた過性およびまた過性である
発明のさらなる実施の形態の方法は、したがって、ここに記述されたどのような方法をも実行するためのコンピュータプログラムを表す、信号のデータストリーム、または、シーケンスである。信号のデータストリーム、または、シーケンスは、例えば、インターネットを経由するような、例えば、データ通信接続を経由して送信されるように構成されていてもよい。
さらなる実施の形態は、処理手段、例えば、ここに記述されたどのような方法をも実行するように構成された、または、適応される、コンピュータ、または、プログラム可能な論理装置をえる
さらなる実施の形態は、ここに記述されたどのような方法をも実行するためプログラムが動作するコンピュータをえる
発明に係るさらなる実施の形態は、ここに記述された方法の少なくとも1つを受信機で実行するためのコンピュータプログラムを送信するように構成された装置、または、システムを含む。送信は、例えば、電気的でも光学的でもよい。受信機は、例えば、コンピュータ、モバイル装置、メモリ装置、または、類似した装置であってもよい。装置、または、システムは、例えば、コンピュータプログラムを受信機に送信するためのファイルサーバを含んでいてもよい。
いくつかの実施の態様では、プログラム可能な論理装置(例えば、フィールド・プログラブル・ゲート・アレイ(field programmable gate array, an FPGA))は、ここに述べられた方法の機能のいくつか、または、すべてを実行するために用いられていてもよい。いくつかの実施の態様では、フィールド・プログラブル・ゲート・アレイは、ここに述べられたどのような方法をも実行するために、マイクロプロセッサ(microprocessor)と協働してもよい。一般的には、方法は、いくつかの実施の態様の中で、どのようなハードウエア機器によっても、実施される。前記ハードウエア装置は、コンピュータプロセッサ(CPU)、または、グラフィックカード(GPU)のような一般的に適用可能なハードウエアであってもよく、または、ASICのような、方法に特有なハードウエアであってもよい。
ここで述べられた装置は、例えば、ハードウエア機器を用いている間、または、コンピュータを用いている間、または、ハードウェア機器とコンピュータを組み合わせて用いている間に実施されてもよい。
ここに述べられた装置、または、ここに述べられた装置の構成要素のどれでも、少なくとも部分的に、ハードウェアの中で、または、ソフトウェア(コンピュータプログラム)の中で実施されてもよい。
ここで述べられた方法は、例えば、ハードウエア機器を用いている間、または、コンピュータを用いている間、または、ハードウェア機器とコンピュータを組み合わせて用いている間に実施されてもよい。
ここに述べられた方法、または、ここに述べられた装置の構成要素のどれでも少なくとも部分的に、ハードウェアの中で、または、ソフトウェア(コンピュータプログラム)の中で遂行されてもよい。
以上に記述された実施の形態は、本発明の原理を説明するための具体例を単に表したものである。他の当業者は、ここに述べられた配置、および詳細の修正、および変更を高く評価すると理解します。これは、発明は、明細書の手段、および実施の形態の議論によって、ここで示された特定の詳細によってよりも、以下の請求項の範囲によってのみ限定されることを意図する。

Claims (15)

  1. 情報を第1のクラス、または、第2のクラスに分類するコンピュータで実施される方法(100)であって、
    前記方法(100)は、
    記情報が第1のクラスの分類基準を満たす場合、前記情報を前記第1のクラスに割り当て、前記情報が前記第1のクラスの分類基準を満たさない場合、前記情報を前記第2のクラスに割り当てるために、第1の分類技術(M1)を前記情報に適用するステップ(102)と、
    記情報が第2のクラスの分類基準を満たす場合、前記情報を前記第2のクラスに割り当て、前記情報が前記第2のクラスの分類基準を満たさない場合、前記情報を前記第1のクラスに割り当てるために、第2の分類技術(M2)を前記情報に適用するステップ(104)と、
    前記2つの分類技術(M1、M2)により前記情報が異なって割り当てられている場合、または、前記2つの分類技術に互いに異なる情報の割り当てが数に達した場合には、前記2つの分類技術のうちの少なくとも1つの分類基準を更新するステップ(106)と、
    を備え、
    前記第1のクラス、および前記第2のクラスは、互いに異なり、
    前記方法(100)は、技術的な設備で、誤りを検出するために用いられ、
    前記方法(100)によって分類される前記情報は、センサデータであり、
    前記方法(100)は、さらに、
    記情報が、両方の分類技術によ第1のクラスに割り当てられた場合、第1の信号を出力するステップと、
    記情報が、両方の分類技術によ第2のクラスに割り当てられた場合、第2の信号を出力するステップと、
    記情報が、前記分類技術によ異なるクラスに割り当てられた場合、第3の信号を出力するステップと、
    を備えていることを特徴とするコンピュータで実施される方法(100)。
  2. 前記第1の信号は、技術的な設備の正常な動作状態を示しており、
    前記第2の信号は、技術的な設備の故障した動作状態を示していること、
    を特徴とする請求項1に記載のコンピュータで実施される方法(100)。
  3. 前記第1の分類技術(M1)および前記第2の分類技術(M2)は、互いに補完することを特徴とする、請求項1まは請求項2のうちのいずれか1つに記載のコンピュータで実施される方法(100)。
  4. 前記2つの分類技術(M1、M2)のうちのいずれか少なくとも1つは、前記情報の実際のクラスの割り当てについての知識を用いている間に更新されることを特徴とする請求項1ないし請求項3のうちのいずれか1つに記載のコンピュータで実施される方法(100)。
  5. 前記情報は、データであり、または、
    前記情報は、データセット(120)のデータであり、
    前記データセット(120)のデータは、前記方法(100)によ個々に分類されることを特徴とする請求項1ないし請求項4のうちのいずれか1つに記載のコンピュータで実施される方法(100)。
  6. 前記第1の分類技術(M1)は、異常値検出技術であることを特徴とする請求項1ないし請求項5のうちのいずれか1つに記載のコンピュータで実施される方法(100)。
  7. 前記方法(100)は、初期化段階の間に第1の情報のみで前記第1の分類技術(M1)を初期化するステップを備えることを特徴とする請求項6に記載のコンピュータで実施される方法(100)。
  8. 前記第2の分類技術(M2)は、ルールベースの技術であることを特徴とする請求項1ないし請求項7のうちのいずれか1つに記載のコンピュータで実施される方法(100)。
  9. 前記方法(100)は、初期化段階の間に、前記第2のクラスの情報のみ、または、前記第2のクラスの既知の分類情報のみの分類基準で前記第2の分類技術(M2)を初期化するステップを備えることを特徴とする請求項8に記載のコンピュータで実施される方法(100)。
  10. 初期化段階に続くトレーニング段階で、実際には前記第1のクラスに割り当てられるべき所定の数の情報が、前記第2の分類技術(M2)によ正確に前記第1のクラスに割り当てられているが、前記第1の分類技術(M1)によ誤って前記第2のクラスに割り当てられた場合前記第1の分類技術(M1)を置き換えられたトレーニング情報のセットに再適用することにより、前記第1の分類技術(M1)の前記分類基準更新するために、前記第1の分類技術(M1)をトレーニングするために用いられる、前記トレーニング情報のセットのうちの少なくとも一部が、置き換えられることを特徴とする請求項1ないし請求項9のうちのいずれか1つに記載のコンピュータで実施される方法(100)。
  11. 初期化段階に続くトレーニング段階で、実際には前記第2のクラスに割り当てられるべき所定の数の情報が、前記第1の分類技術(M1)によ正確に前記第2のクラスに割り当てられているが、前記第2の分類技術(M2)によ誤って前記第1のクラスに割り当てられた場合前記第2の分類技術(M2)を置き換えられたトレーニング情報のセットに再適用することにより、前記第2の分類技術(M2)の前記分類基準更新するために、前記第2の分類技術(M2)をトレーニングするために用いられる、前記第2のクラスの前記トレーニング情報のセットのうちの少なくとも一部が、置き換えられることを特徴とする請求項1ないし請求項10のうちのいずれか1つに記載のコンピュータで実施される方法(100)。
  12. 初期化段階に続くトレーニング段階で、実際には前記第1のクラスに割り当てられるべき所定の数の情報が、前記第1の分類技術(M1)によ正確に前記第1のクラスに割り当てられているが、前記第2の分類技術(M2)によ誤って前記第2のクラスに割り当てられた場合前記第2の分類技術(M2)を置き換えられたトレーニング情報のセットに再適用することにより、前記第2の分類技術(M2)の前記分類基準更新するために、前記第2の前記分類技術(M2)をトレーニングするために用いられる、前記第1のクラスの前記トレーニング情報のセットのうちの少なくとも一部が、置き換えられることを特徴とする請求項1ないし請求項11のうちのいずれか1つに記載のコンピュータで実施される方法(100)。
  13. 初期化段階に続くトレーニング段階で、実際には前記第2のクラスに割り当てられるべき所定の数の情報が、前記第2の分類技術(M2)によ正確に前記第2のクラスに割り当てられているが、前記第1の分類技術(M1)によ誤って前記第1のクラスに割り当てられた場合、更新されたテストデータのセットを用いて、前記第1の分類技術(M1)を再トレーニングすることによ、前記第1の分類技術(M1)の前記分類基準更新するために、前記第1の分類技術(M1)をトレーニングするために用いられるトレーニング情報のセットのうちの少なくとも一部が、置き換えられることを特徴とする請求項1ないし請求項12のうちのいずれか1つに記載のコンピュータで実施される方法(100)。
  14. 情報を第1のクラス、または、第2のクラスに分類するための分類プロセッサ(200)であって、
    前記分類プロセッサ(200)は、
    2つの並行した分類段階(202、204)と、
    更新段階(206)と、
    を備え、
    前記2つの分類段階(202、204)の第1の分類段階(202)は、前記情報が前記第1のクラスの分類基準を満たす場合、前記情報を前記第1のクラスに割り当て、前記情報が前記第1のクラスの分類基準を満たさない場合、前記情報を第2のクラスに割り当てるように構成され、前記2つの分類段階(202、204)の第2の分類段階(204)は、前記情報が前記第2のクラスの分類基準を満たす場合、前記情報を前記第2のクラスに割り当て、前記情報が前記第2のクラスの分類基準を満たさない場合、前記情報を第1のクラスに割り当てるように構成され
    前記第1のクラスおよび前記第2のクラスは異なっており、
    前記更新段階(206)は、2つの分類段階により前記情報が異なるように割り当てられている場合または2つの分類段階による互いに異なる情報の割り当てが所定の数に達した場合には、前記2つの分類段階(202、204)のうちの少なくとも1つの分類基準を更新するように構成されており、
    前記分類プロセッサ(200)により分類された前記情報、センサデータである場合
    前記分類プロセッサ(200)は、前記情報が両方の分類技術(202、204)によって前記第1のクラスに割り当てられた場合、第1の信号を出力するように構成され、
    前記分類プロセッサ(200)は、前記情報が両方の分類技術(202、204)によって前記第2のクラスに割り当てられた場合、第2の信号を出力するように構成され、
    前記分類プロセッサ(200)は、前記情報が両方の分類技術(202、204)によって異クラスに割り当てられた場合、第3の信号を出力するように構成されるとを特徴とする分類プロセッサ(200)。
  15. 前記分類プロセッサは、技術的な設備り検ために用いられることを特徴とする請求項14に記載の前記分類プロセッサ(200)。
JP2019547145A 2017-02-28 2018-02-26 情報の分類方法、および分類プロセッサ Active JP6962665B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17158525.0 2017-02-28
EP17158525.0A EP3367261A1 (de) 2017-02-28 2017-02-28 Verfahren zum klassifizieren von information und klassifizierungsprozessor
PCT/EP2018/054709 WO2018158201A1 (de) 2017-02-28 2018-02-26 Verfahren zum klassifizieren von information und klassifizierungsprozessor

Publications (2)

Publication Number Publication Date
JP2020509497A JP2020509497A (ja) 2020-03-26
JP6962665B2 true JP6962665B2 (ja) 2021-11-05

Family

ID=58231402

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019547145A Active JP6962665B2 (ja) 2017-02-28 2018-02-26 情報の分類方法、および分類プロセッサ

Country Status (7)

Country Link
US (1) US20190361921A1 (ja)
EP (2) EP3367261A1 (ja)
JP (1) JP6962665B2 (ja)
KR (1) KR102335038B1 (ja)
CN (1) CN110431543B (ja)
ES (1) ES2880202T3 (ja)
WO (1) WO2018158201A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11774925B2 (en) * 2018-11-05 2023-10-03 Johnson Controls Tyco IP Holdings LLP Building management system with device twinning, communication connection validation, and block chain

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6842751B1 (en) 2000-07-31 2005-01-11 International Business Machines Corporation Methods and apparatus for selecting a data classification model using meta-learning
JP4118703B2 (ja) 2002-05-23 2008-07-16 株式会社日立ハイテクノロジーズ 欠陥分類装置及び欠陥自動分類方法並びに欠陥検査方法及び処理装置
US7219148B2 (en) 2003-03-03 2007-05-15 Microsoft Corporation Feedback loop for spam prevention
US7240039B2 (en) 2003-10-29 2007-07-03 Hewlett-Packard Development Company, L.P. System and method for combining valuations of multiple evaluators
US7096153B2 (en) 2003-12-31 2006-08-22 Honeywell International Inc. Principal component analysis based fault classification
US7725414B2 (en) * 2004-03-16 2010-05-25 Buzzmetrics, Ltd An Israel Corporation Method for developing a classifier for classifying communications
US7349746B2 (en) 2004-09-10 2008-03-25 Exxonmobil Research And Engineering Company System and method for abnormal event detection in the operation of continuous industrial processes
US7467116B2 (en) * 2004-09-17 2008-12-16 Proximex Corporation Incremental data fusion and decision making system and associated method
US7945437B2 (en) * 2005-02-03 2011-05-17 Shopping.Com Systems and methods for using automated translation and other statistical methods to convert a classifier in one language to another language
US8930365B2 (en) * 2006-04-29 2015-01-06 Yahoo! Inc. System and method for evolutionary clustering of sequential data sets
US8407164B2 (en) * 2006-10-02 2013-03-26 The Trustees Of Columbia University In The City Of New York Data classification and hierarchical clustering
US8200601B2 (en) * 2009-05-26 2012-06-12 Microsoft Corporation Boosting to determine indicative features from a training set
CA3026879A1 (en) * 2009-08-24 2011-03-10 Nuix North America, Inc. Generating a reference set for use during document review
CA2718579C (en) * 2009-10-22 2017-10-03 National Research Council Of Canada Text categorization based on co-classification learning from multilingual corpora
KR101249576B1 (ko) * 2010-09-13 2013-04-01 한국수력원자력 주식회사 서포트 벡터 머신을 이용한 회전기계의 결함진단 방법 및 장치
JP5552023B2 (ja) * 2010-10-27 2014-07-16 インターナショナル・ビジネス・マシーンズ・コーポレーション クラスタリング・システム、方法及びプログラム
JP5996384B2 (ja) 2012-11-09 2016-09-21 株式会社東芝 プロセス監視診断装置、プロセス監視診断プログラム
CN104463208A (zh) * 2014-12-09 2015-03-25 北京工商大学 组合标记规则的多视图协同半监督分类算法
KR102415503B1 (ko) 2015-08-21 2022-07-01 삼성전자주식회사 분류기 학습 방법 및 객체 검출 방법
CN107085572A (zh) * 2016-02-14 2017-08-22 富士通株式会社 对在时间上逐一到达的输入数据进行分类的方法和系统
EP3309777A1 (en) * 2016-10-13 2018-04-18 Thomson Licensing Device and method for audio frame processing
US10956402B2 (en) * 2018-04-13 2021-03-23 Visa International Service Association Method and system for automatically detecting errors in at least one date entry using image maps

Also Published As

Publication number Publication date
JP2020509497A (ja) 2020-03-26
WO2018158201A1 (de) 2018-09-07
EP3367261A1 (de) 2018-08-29
KR102335038B1 (ko) 2021-12-06
KR20190117771A (ko) 2019-10-16
EP3590052A1 (de) 2020-01-08
US20190361921A1 (en) 2019-11-28
CN110431543B (zh) 2024-03-15
EP3590052B1 (de) 2021-05-19
ES2880202T3 (es) 2021-11-23
CN110431543A (zh) 2019-11-08

Similar Documents

Publication Publication Date Title
CN106656981B (zh) 网络入侵检测方法和装置
US7096153B2 (en) Principal component analysis based fault classification
US7447609B2 (en) Principal component analysis based fault classification
WO2016132468A1 (ja) データ評価方法および装置、故障診断方法および装置
CN111783875A (zh) 基于聚类分析的异常用户检测方法、装置、设备及介质
JP6962665B2 (ja) 情報の分類方法、および分類プロセッサ
CN106708647B (zh) 大数据环境下的分布式跨维度异常数据检测方法
CN108509970A (zh) 学习方法、对应的系统、设备和计算机程序产品
TWI747055B (zh) 狀態推斷裝置以及狀態推斷方法
US20200183805A1 (en) Log analysis method, system, and program
CN109564613B (zh) 签名创建设备、签名创建方法、记录签名创建程序的记录介质、以及软件确定系统
JP2017022593A (ja) 検証装置、検証方法及び検証プログラム
CN116467732A (zh) 全局异常值的隐私保护和去中心化检测
US11461369B2 (en) Sensor-based detection of related devices
US20200379016A1 (en) Waveform segmentation device and waveform segmentation method
CN112154463A (zh) 信息处理装置、信息处理方法以及信息处理程序
WO2022114025A1 (ja) 異常検知方法、異常検知装置、及び、プログラム
CN114297335A (zh) 基于自集成学习的高度噪声数据处理方法与系统
JP7526591B2 (ja) 音響認識システム、音響認識方法
JP7264911B2 (ja) パターン認識装置及び学習済みモデル
CN115210744A (zh) 用于制造过程的系统、方法和介质
Qian et al. Latent patient cluster discovery for robust future forecasting and new-patient generalization
US20210125088A1 (en) Product detection device, method, and program
WO2020251059A1 (en) Using normalizing flows to detect anomalous data points in time-series data
CN112927068B (zh) 业务数据风险分类门限确定方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20191024

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201110

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210208

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210412

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20210510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210914

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211013

R150 Certificate of patent or registration of utility model

Ref document number: 6962665

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150