JP6962665B2

JP6962665B2 - 情報の分類方法、および分類プロセッサ

Info

Publication number: JP6962665B2
Application number: JP2019547145A
Authority: JP
Inventors: ジーサベンドルフ; ニコラレオー; ティムリスト
Original assignee: フラウンホッファー−ゲゼルシャフトツァフェルダールングデァアンゲヴァンテンフォアシュンクエー．ファオ
Priority date: 2017-02-28
Filing date: 2018-02-26
Publication date: 2021-11-05
Anticipated expiration: 2038-02-26
Also published as: EP3590052B1; KR20190117771A; CN110431543A; EP3367261A1; US20190361921A1; JP2020509497A; ES2880202T3; WO2018158201A1; CN110431543B; EP3590052A1; KR102335038B1

Description

本発明は、情報分類の方法に関する。さらなる実施の形態は、情報を分類するための分類プロセッサに関する。いくつかの実施の態様は、誤り検出方法に関する。

アプリケーションの多くの領域は、正確にデータを分類して、そして、同様に、自動的な方法で、例えば、スパム（ｅメールのトラフィックにおける）、悪性腫瘍（ガン診断法）、または、稼働の状態を検出（技術的な設備）するタスク（ｔａｓｋ）を含み、および"正常なデータ"から前記データを区別する。技術的な挑戦は、可能な限り、正確に、分類を実行する技術を見つけることであり、言い換えれば、可能な限り、多くの誤りを認識することであり、同時に、できるだけ少ない誤った分類（誤分類）をエラーとすべきである。これに加えて、枠組み条件の中に存在する困難は、変えられるかもしれず、前に知られなかった誤りが起きるかもしれず、したがって、技術は、アプリケーションの進行の間にそれに応じて適応させなければならない。

原則として、専門家の知識の助けを伴う、または、機械学習から獲得した技術手段による、そのような分類は実行される可能性がある。それぞれの技術自体は、特別な制限、および不利な点を有する。特に、機械学習技術は、一般的に、大量の高品質データを必要とする一方で、実施に関して多額の出費を必要としかつ適応性がない。

文献では、サポートベクタマシーン、ロジスティック回帰、ベイズ識別器、決定木、ニューラルネットワークなどのような、分類技術の理論は、詳細が記述されている（例えば、Ａｇｇａｒｗａｌ２０１４Ｈａｎｅｔａｌ．２０１１を参照）。単独の分類器の技術的なアプリケーションは、広く文書化されてきており、また、特許文書に記述されてきた（ＵＳ２００５／１４１７８２Ａ１およびＵＳ２００６／０５８８９８Ａ１）。また、さまざまな技術の組み合わせが出願された（ＵＳ２００５／０９７０６７Ａ１）。スパムフィルタリングの問題のために、適用可能な手法が記述されてきた（ＵＳ２００４／１７７１１０Ａ１）。これに加えて、メタ学習（ｍｅｔａ−ｌｅａｒｎｉｎｇ）が知られている（ＵＳ６，８４２，７５１Ｂ１）。

しかしながら、既知の手法は、比較的に不正確、言い換えれば、相対的に多くのデータの数が誤った分類をされる。これに加えて、仮に、新しい、または、未知のデータが少しでも適用できたとしても、既知の手法は、新しい、または、未知のデータに適応させるのには非常に時間がかかる。

したがって、本発明の目的は、改良された正確な分類を備えており、および／または、新規なまたは未知のデータへの適応に関する概念（ｃｏｎｃｅｐｔ）を提供することである。

この目的は、独立請求項によって達成される。

有利なさらなる改良は、従属請求項に見られる。

実施の形態は、第１のクラス、または、第２のクラスで情報を分類する方法を提供する。方法は、情報が第１のクラスの分類基準を満たす場合、情報を第１のクラスに割り当て、情報が第１のクラスの分類基準を満たさない場合、情報を第２のクラスに割り当てるために、第１のクラスの分類技術を情報に適用するステップを含む。方法は、情報が第２のクラスの分類基準を満たす場合、情報を第２のクラスに割り当て、かつ、情報が第２のクラスの分類基準を満たしていない場合、情報を第１のクラスに割り当てるために、第２のクラスの分類技術を情報に適用するステップをさらに含む。方法は、２つの分類方法により情報が異なって割り当てられている場合、または、２つの分類方法による互いに異なる情報の割り当てが所定の数に達した場合には、２つの分類技術のうちの少なくとも１つの分類技術を更新するステップをさらに含む。その際に、第１のクラスと第２のクラスは互いに異なる。

本発明の概念に従えば、２つの分類技術（２つの異なる、補足し合う、または、補う分類技術）は、前記情報を第１のクラスまたは第２のクラスに分類するために、同時に情報に適用され、更新段階（２０６）は、２つの分類技術により情報が異なって割り当てられている場合、または、２つの分類技術による互いに異なる情報の割り当てが所定の数に達した場合には、前記２つの分類段階（２０２、２０４）のうちの少なくとも１つの分類基準を更新するように構成されており、２つの分類技術のうちの少なくとも１つの分類技術が更新される。

さらなる実施の形態は、情報を第１のクラスまたは第２のクラスに分類するための分類プロセッサを提供する。分類プロセッサは、２つの並行した分類段階と、更新ステージとを備える。２つの分類段階のうちの第１の分類段階は、情報が第１のクラスの分類基準を満たす場合、情報を第１のクラスに割り当て、情報が第１のクラスの分類基準を満たさない場合、情報を第２のクラスに割り当てる。２つの分類段階のうちの第２の分類段階は、情報が第２のクラスの分類基準を満たす場合、情報を第２のクラスに割り当て、情報が第２のクラスの分類基準を満たさない場合、情報を第１のクラスに割り当て、第１のクラスと第２のクラスは、互いに異なる。更新ステージは２つの分類技術により情報が異なって割り当てられている場合、または、２つの分類技術による互いに異なる情報の割り当てが所定の数に達した場合には、２つの分類技術（２０２、２０４）のうちの少なくとも１つの分類技術を更新するように構成される。

第１のクラス、または、第２のクラスの情報分類の方法の好ましい実施の形態は、以下に記述される。しかしながら、以下の記述は、分類プロセッサに適用してもよい。

実施の形態では、方法は、データを分類してもよい。もちろん、方法は、データセットのデータを分類してもよく、データセットのデータは、方法によって個々に分類されることが可能である。

実施の形態では、第１の分類技術と第２の分類技術は、互いに補完していてもよい。第１の分類技術は、第１のクラスに属する情報を認識するように構成され（例えば、適合され、または、トレーニングされ）ていてもよいのに対して、第２の分類技術は、第２のクラスに属する情報を認識するように構成され（例えば、適合され、または、トレーニングされ）ていてもよい。認識されなかった情報は、それぞれの分類技術によって、それぞれ他のクラスに割り当てられてもよい。

例えば、第１の分類技術は、第１のクラスに属する情報を認識して、および第２の分類技術は、第２のクラスに属する情報を認識するために、第１の分類技術と第２の分類技術は、異なっていてもよい。例えば、第１の分類技術は、異常値を検出する方法であってもよいのに対して、第２の分類技術は、ルールベースの技術であってもよい。

もちろん、第１の分類技術は、第１のクラスに属する情報を認識し、および第２の分類技術は、第２のクラスに属する情報を認識するために、第１の分類技術と第２の分類技術は、同じであってもよいが、トレーニングの期間は異なり、それによって、第１の分類技術は、第１のクラスに属する情報を認識して、および第２の分類技術は、第２のクラスに属する情報を認識する。例えば、両方の分類技術は、異常値を検出する方法、または、ルールベースの技術であってもよい。

実施の形態では、第１の分類技術は、異常値を検出する方法であってもよい。

この状況では、第１の分類技術は、第１のクラスの情報だけで、初期化段階の間に、初期化されてもよい。

実施の形態では、第２の分類技術は、ルールベースの技術であってもよい。

第２の分類技術は、初期化段階の間に、第２のクラスの情報だけで、または、第２のクラスの既知の分類情報だけに基づく分類基準だけで、初期化されてもよい。

実施の形態では、２つの分類技術のうちの少なくとも１つは、情報の実際のクラス割り当てについての知識を用いている間に、更新されてもよい。

例えば、２つの分類技術のうちの少なくとも１つによる情報の誤った分類の事象の中で、それぞれの分類技術、または、それぞれの分類技術の分類基準は、更新されてもよい。

例えば、第１の分類技術が不正確に情報を分類して、第２の分類技術が正確に情報を分類すると、第１の分類技術、または、第１の分類技術の分類基準（のみ）を更新してもよい。同様に、第１の分類技術が正確に情報を分類して、第２の分類技術が不正確に情報を分類すると、第２の分類技術、または、第２の分類技術の分類基準（のみ）を更新してもよい。もちろん、両方の分類技術、または、２つの分類技術のうちの１つだけが、不正確に情報を分類すれば、両方の分類基準（または、分類技術の分類基準）を更新することもできる。

実施の形態では、更新段階（例えば、初期化段階に続くトレーニング段階の間）は、実際には第１のクラスに割り当てられるべき所定の数の情報が、第２の分類技術により正確に第１のクラスに割り当てられているが、第１の分類技術により、誤って第２のクラスに割り当てられた場合、トレーニング情報のセットを更新した上で第１の分類技術を新たにトレーニング（または、適用）することにより、第１の分類技術の分類基準を更新するために、第１の分類技術をトレーニングするために用いられるトレーニング情報のセットのうちの少なくともいくつかを置き換えるステップを備える。

実施の形態では、更新段階（例えば、初期化段階に続くトレーニング段階の間）は、実際には第２のクラスに割り当てられるべき所定の数の情報が、第１の分類技術により、正確に第２のクラスに割り当てられているが、第２の分類技術により、誤って第１のクラスに割り当てられた場合、トレーニング情報のセットを更新した上で第２の分類技術のトレーニング（または、適用）を更新することにより、第２の分類技術の分類基準を更新するために、第２の分類技術をトレーニングするために用いられるトレーニング情報のセットのうちの少なくともいくつかを置き換えるステップを備える。

実施の形態では、更新段階（例えば、初期化段階に続くトレーニング段階の間）は、実際には第１のクラスに割り当てられるべき所定の数の情報が、第１の分類技術により、正確に第１のクラスに割り当てられているが、第２の分類技術により、誤って第２のクラスに割り当てられた場合、トレーニング情報のセットを更新した上で第２の分類技術のトレーニング（または、適用）を更新することにより、第２の分類技術の分類基準を更新するために、第２の分類技術をトレーニングするために用いられるトレーニング情報のセットの少なくともいくつかを置き換えるステップを備える。

実施の形態では、更新段階（例えば、初期化段階に続くトレーニング段階の間）は、実際には第２のクラスに割り当てられるべき所定の数の情報が、第２の分類技術により、正確に第２のクラスに割り当てられているが、第１の分類技術により、誤って第１のクラスに割り当てられた場合、更新されたテストデータセットを使用して第１の分類方法を再トレーニングすることにより、最初の分類方法の分類基準を更新するために、更新段階（例えば、初期化段階後のトレーニング段階）に、第１の分類方法をトレーニングするために使用されるトレーニング情報のセット（例えば、テストデータセット）の少なくとも一部を置き換えることができる。

本発明の実施の形態は、添付された図面と関連して詳細に説明される。

本発明の情報分類の方法は、正確な分類をすることができる、そして／あるいは、新しい、または、未知のデータに適用することができる。

図１は、実施の形態に従った、情報を第１のクラスまたは第２のクラスに分類する方法のフローチャートが示されている。図２ａは、第１の分類段階に従った、１つの分類技術のみを備えた方法を用いるときと比較することにより、２つの分類技術を備えた方法を用いるときには、１つの分類技術のみを備えた方法と比較して、より少ないフィードバックが必要とされることを例示するために、第１のクラスのデータと、第２のクラスのデータと、を備えたデータセットのみではなく、２つの分類技術を備えた方法によって提供されたデータの領域の分類結果の概略図が示されている。図２ｂは、第２の分類段階に従った、１つの分類技術のみを備えた方法を用いるときと比較することにより、２つの分類技術を備えた方法を用いるときには、１つの分類技術のみを備えた方法と比較して、より少ないフィードバックが必要とされることを例示するために、第１のクラスのデータと、第２のクラスのデータと、を備えたデータセットのみではなく、２つの分類技術を備えた方法によって提供されたデータの領域の分類結果の概略図が示されている。図２ｃは、第３の分類段階に従った、１つの分類技術のみを備えた方法を用いるときと比較することにより、２つの分類技術を備えた方法を用いるときには、１つの分類技術のみを備えた方法と比較して、より少ないフィードバックが必要とされることを例示するために、第１のクラスのデータと、第２のクラスのデータと、を備えたデータセットのみではなく、２つの分類技術を備えた方法によって提供されたデータの領域の分類結果の概略図が示されている。図３ａは、第１の分類段階に従った、１つの分類技術のみを備えた方法を用いるときと比較することにより、２つの分類技術を備えた方法を用いるときには、１つの分類技術のみを備えた方法と比較して、より高いレベルの正確性を得られることを例示するために、第１のクラスのデータと、第２のクラスのデータと、を備えたデータセットのみではなく、２つの分類技術を備えた方法により提供されたデータの領域の分類結果の概略図が示されている。図３ｂは、第２の分類段階に従った、１つの分類技術のみを備えた方法を用いるときと比較することにより、２つの分類技術を備えた方法を用いるときには、１つの分類技術のみを備えた方法と比較して、より高いレベルの正確性を得られることを例示するために、第１のクラスのデータと、第２のクラスのデータと、を備えたデータセットのみではなく、２つの分類技術を備えた方法により提供されたデータの領域の分類結果の概略図が示されている。図３ｃは、第３の分類段階に従った、１つの分類技術のみを備えた方法を用いるときと比較することにより、２つの分類技術を備えた方法を用いるときには、１つの分類技術のみを備えた方法と比較して、より高いレベルの正確性を得られることを例示するために、第１のクラスのデータと、第２のクラスのデータと、を備えたデータセットのみではなく、２つの分類技術を備えた方法によって提供されたデータの領域の分類結果の概略図が示されている。図４は、本発明の実施の形態に従った、第１のクラスまたは第２のクラス内への情報の分類のための分類プロセッサの概略図が示されている。

本発明の以下の記述では、同一であるか、実行中に同一である要素は数字で同一の参照番号で提供される、そのため、それらの説明は相互に交換可能である。

図１には、第１のクラスまたは第２のクラスの中の情報を分類する方法１００のフローチャートが示されている。方法１００は、情報が第１のクラスの分類基準を満たす場合、第１のクラスに割り当て、情報が第１のクラスの分類基準を満たさない場合、第２のクラスに割り当てるための第１の分類技術を情報に適用するステップ１０２を含む。方法１００は、情報が第２のクラスの分類基準を満たす場合、第２のクラスに割り当て、情報が第２のクラスの分類基準を満たさない場合、第１のクラスに割り当てるための第２の分類技術を情報に適用するステップ１０６をさらに含む。さらに、方法１００は、２つの分類方法により情報が異なって割り当てられている場合、または、２つの分類技術による互いに異なる情報の割り当てが所定の数に達した場合には、２つの分類技術のうちの少なくとも１つの分類技術を更新するステップを備える。その際、第１のクラスと第２のクラスは互いに異なる。

実施の形態では、方法１００は、データ（例えば、ｅ−ｍａｉｌ（送信者、アドレス、リファレンス（ｒｅｆｅｒｅｎｃｅ）など）、技術的な設備（ｔｅｃｈｎｉｃａｌｐｌａｎｔ）（温度、圧力、バルブの位置など）、または、疾病パターン（徴候、年齢、血液値など）についての情報）を分類してもよい。もちろん、方法１００は、データ（例えば、ｅ−ｍａｉｌについての情報、技術的な設備、または、疾病パターンについての情報）のデータセット（例えば、ｅ−ｍａｉｌ（送信者、アドレス、リファレンス（ｒｅｆｅｒｅｎｃｅ）など）についての情報、技術的な設備（温度、圧力、バルブの位置など）、または、疾病パターン（徴候、年齢、血液値など））も分類してもよく、データセットのデータにとって、方法によって、個々に分類されること（例えば、ｅ−ｍａｉｌ、あるいは、ｅ−ｍａｉｌのセットが個々に分類された）は可能である。

実施の形態では、第１の分類技術と第２の分類技術は、互いに補完してもよい。第１の分類技術は、第１のクラスに属する情報を認識するように構成され（例えば、適合され、または、トレーニングされ）ていてもよいのに対して、第２の分類技術は、第２のクラスに属する情報を認識するように構成され（例えば、適合され、または、トレーニングされ）ていてもよい。認識されなかった情報は、それぞれの分類技術によって、それぞれ他のクラスに割り当てられてもよい。

例えば、第１の分類技術と第２の分類技術は、異なっていてもよく、それによって、第１の分類技術は、第１のクラスに属する方法を認識し、そして、第２の分類技術は、第２のクラスに属する方法を認識する。例えば、第１の分類技術は、異常値を検出する方法であってもよいのに対して、第２の分類技術は、ルールベースの技術であってもよい。

もちろん、第１の分類技術と第２の分類技術は、同じであってもよいが、トレーニングの期間は異なり、それによって、第１の分類技術は、第１のクラスに属する情報を認識し、そして、第２の分類技術は、第２のクラスに属する情報を認識する。両方の分類技術は、異常値を検出する方法、または、ルールベースの技術であってもよい。

方法１００は、このように、例えば、異なる分類技術、例えば、機械学習技術を組み合わせて利用され、専門家の知識も考慮に入れてもよい。利用している間に、フィードバック手段によってそれぞれの技術を更新することにより、正確性のレベルは、アプリケーションが進行している間に、次第に改良されるかもしれず、かつ、技術は、枠組み条件の中で変化するために対応してもよい。

例として、分類技術（２つのクラスの間を区別する）を実施する２つの補完する手段は、以下に記述される。

第１の手法は、クラス１への所属についての知識に基づいており（例えば、“正常なデータ”は、以下で、Ｎデータと呼ばれる）、クラス１の基準を満たしていないどのデータもクラス２に自動的に割り当てられる（“誤ったデータ"は、以下で、Ｆと呼ばれる）。逆に、第２の手法は、クラス２への所属についての知識に基づいており、クラス２の基準を満たしていないどのデータもクラス１に自動的に割り当てられる。アプリケーションの一般的な事例（例えば、スパム検出、腫瘍検出、誤り検出）では、タスク（ｔａｓｋ）は、非常に大量のクラス所属１のデータ（正常なデータ）からクラス所属２のデータ（誤ったデータ）を濾過する。この理由のために、２つの上述の手法は、互いに明確に異なっているかもしれず、第１の事例では、比較的非常に多くの数の“誤った肯定的な”結果は、一般的に生じ（クラス１はクラス２として分類される）、これに反して、第２の事例では、比較的多数の“誤った否定的な”結果は、一般的に生じる（クラス１はクラス２として分類される）。アプリケーションの事例に応じて、どちらか一方の欠点は、許容したほうがよい。理想的には、分類技術は、できる限り、低い偽陽性率を示すとともに（高特異性）に、できる限り、低い偽陰性率を示すべきである（高感度）。

例として、方法１００は、また、上述の２つの組み合わせを基礎にしていてもよい。任意に、アプリケーションの間に得られてもよいクラスと関連する知識は、それぞれの技術の連続した改良に組み込まれてもよい（フィードバック）。連続した更新を伴う１つの単独の技術を用いることと比較される、２つの（補完的な）技術の組み合わせから成る有利な点は、高いレベルの正確性を得るために、図２を参照して、以下にさらに詳細に記述されるように、一般的には、より少ないフィードバックが必要とされる。これに加えて、２つの補完する技術は、それぞれの技術の結果で誤った肯定的な結果と誤った否定的な結果の両方が同じになる可能性を提供し、そして、フィードバックの手段によってそれらを減少させることは、図３を参照して、以下にさらに詳細に記述される。

図２ａの左側には、第１のクラスのデータ１２２（または、第１のクラスのデータ１２２、例えば、正常なデータ（Ｎ））と、第２のクラスのデータ１２４（または、第２のクラスのデータ１２４、例えば、誤ったデータ（Ｆ））と、備えたデータセット１２０の概略図が示されており、および、初期化段階に続いて、例として、第１の分類技術（Ｍ１）によって第１のクラスと関連する（属している）として認識されているデータセット１２０の領域１２６、そして、第２の分類技術（Ｍ２）によって第２のクラスと関連する（属している）として認識されているデータセット１２０の領域１２８、そして、データセット１２０の領域１３０（アプリケーションの領域）が有する、それに適用される２つの技術と、を備えた方法１００が示されている。

図２ａ（また、図２ｂ、および２ｃ）の中には、方法１００の分類結果は、データセット１２０のそれぞれの領域のために、かぎかっこで示されており、第１の値は、第１の分類技術の分類結果を示しており、第２の値は、第２の分類技術の分類結果を示しており、第３の値は、実際の分類技術の分類結果（または、目標の分類結果）を示している。それらの領域は、下線が引かれたフィードバック手段によって、分類技術の更新に組み込まれている。

図２ａの左側で見られるように、データセット１２０のアプリケーション領域１３０の範囲内に位置するが、領域１２６の外側に位置する、第１の分類技術によって第１のクラスと関連すると認識されているデータセット１２０の第１のクラス（例えば、正常なデータ）のデータ１２２の領域１３２は、（Ｆ，Ｎ，Ｎ）によって示されており、言い換えれば、第１の分類技術は、データセット１２０の領域１３２のデータを第２のクラスのデータ（例えば、誤ったデータ）に割り当て、逆に、第２の分類技術は、データセット１２０の領域１３２のデータを第１のクラスのデータ（例えば、正常なデータ）に割り当てる。実際には、データセット１２０のこの領域１３２のデータは、第１のクラスのデータ（例えば、正常なデータ）に割り当てられるべきであった、しかしながら、そのため、第１の分類結果は不正確であり、そのため、第１の分類技術（または、第１の分類技術の分類基準）は、その次の更新段階のトレーニングステップに適用されることになっている。

データセット１２０のアプリケーション領域１３０の範囲内、および領域１２６の範囲内に位置しており、第１の分類技術によって、第１のデータ（例えば、正常なデータ）と関連すると認識されている、第１のクラス（例えば、正常なデータ）のデータ１２２の領域１３４は、（Ｎ，Ｎ，Ｎ）によって示されており、言い換えれば、第１の分類技術は、データセット１２０の領域１３４のデータは、第１のクラスのデータ（例えば、正常なデータ）に割り当て、そして、また、第２の分類技術は、データセット１２０の領域１３４のデータを第１のクラスのデータ（例えば、正常なデータ）に割り当てる。データセット１２０の領域１３４のデータは、第１のクラスに割り当てられるべきであった、そのため、両方の分類技術の分類結果は正しい。

データセット１２０の第２のクラス（例えば、誤ったデータ）のデータ１２４の領域１３６は、（Ｆ，Ｎ，Ｆ）によって示されたアプリケーション領域１３０の範囲内に位置しており、言い換えれば、第１の分類技術は、データセット１２０の領域１３６のデータを第２のクラスのデータ（例えば、誤ったデータ）に割り当て、逆に、第２の分類技術は、データセット１２０の領域１３６のデータを第１のクラスのデータ（例えば、正常なデータ）に割り当てる。実際には、データセット１２０の領域１３６のデータは、第２のクラスのデータ（例えば、誤ったデータ）に割り当てられるべきであった、そのため、第２の分類技術の結果は不正確であり、そして、そのため、第２の分類技術（または、第２の分類技術の分類基準）は、その次の更新段階のトレーニングステップに適用されることになっている。

比較すると、図２ａの右側には、第１のクラス（例えば、正常なデータ）のデータ１２２と、第２のクラス（例えば、誤ったデータ）のデータ１２４と、を有する同一のデータセット１２０の概略図が示されており、同様に、初期化段階の後に、例えば、１つの単独の分類技術（Ｍ１）によって第１のクラスのデータ（例えば、正常なデータ）と関連すると認識されているデータセットの領域１４０、およびデータセットのデータの領域（アプリケーション領域）１３０は、１つの単独の分類技術と、だけを備えたそれに適用する従来の方法を有する。

図２ａ（および、図２ｂと図２ｃ）には、従来の方法の分類結果がそれぞれの領域のために、かぎかっこで示され、かぎかっこの中の第１の値は、単独の分類技術の分類結果を示しており、そして、第２の値は、実際の分類結果（または、目標の分類結果）を示している。

例えば、アプリケーション領域１３０の範囲内ではあるが、データの領域１４０の外部に位置する、単独の分類技術によって第１のクラスのデータ（例えば、正常なデータ）に所属すると認識されているデータセット１２０の第１のクラスのデータ（例えば、正常なデータ）のデータ１２２の領域１４２は、（Ｆ，Ｎ）によって示されており、言い換えれば、単独の分類技術は、データセット１２０の領域１４２のデータを第２のクラス（例えば、誤ったデータ）に割り当てる。実際には、データセット１２０の領域１４２のデータは、第１のクラスのデータ（例えば、正常なデータ）に割り当てられるべきであった、そのため、単独の分類技術の分類結果は、不正確であり、そして、そのため、単独の分類技術（または、単独の分類技術の分類基準）は、その次の更新段階のトレーニングステップに適用されることになっている。

アプリケーション領域１３０の範囲内であり、また、データの領域１４０の範囲内に位置しており、単独の分類技術によって、第１のクラス（例えば、正常なデータ）と関連すると認識されている第１のクラス（例えば、正常なデータ）のデータ１２２の領域１４４は、（Ｎ，Ｎ）で示されており、言い換えれば、単独の分類技術は、データセット１２０の領域１４４のデータを第１のクラス（例えば、正常なデータ）に割り当てる。データセット１２０の領域１４２のデータは、第１のクラスのデータ（例えば、正常なデータ）に割り当てられるべきであった、そのため、単独の分類技術の分類結果は、正確である。

アプリケーション領域１３０の範囲内に位置している、データセット１２０の第２のクラス（例えば、誤ったデータ）のデータ１２４の領域１４６は、（Ｆ，Ｆ）によって示されており、言い換えれば、単独の分類技術は、データセット１２０の領域１４６のデータを第２のクラス（例えば、誤ったデータ）に割り当てる。データセット１２０の領域１３６は、第２のクラス（例えば、誤ったデータ）に割り当てられるべきであった、そのため、単独の分類技術の分類結果は、正確である。

図２ａの左側には、第１のクラス（例えば、正常なデータ）のデータ１２２と、第２のクラス（例えば、誤ったデータ）のデータ１２４と、を備えたデータセット１２０の概略図が示されており、更新段階の第１のトレーニングステップに続く、例として、第１の分類技術によって第１のクラスのデータ（例えば、正常なデータ）と提携すると、すぐに、認識されるデータの領域１２６、そして、第２の分類技術によって第２のクラスのデータ（例えば、誤ったデータ）と提携すると、すぐに、認識されるデータの領域１２８、そして、それに適用される方法１００を有する、データセット１２０のデータの領域（アプリケーションの領域）１３０が示されている。

図２ｂに見られるように、２つの分類技術（または、２つの分類技術の分類基準）は、、前の分類結果に基づいて更新される。詳細には、第１の分類技術（または、第１の分類技術の分類基準）は、前に誤って検出されたデータセット１２０のデータ１３２の領域に基づいて更新されてもよく、それによって、第１の分類技術は、すぐに、データセット１２０のデータ１３２を第１のクラス１２２のデータであると認識する。これに加えて、第２の分類技術（または、第２の分類技術の分類基準）は、前の分類結果に基づいて更新される。詳細には、第１の分類技術（または、第１の分類技術の分類基準）は、前に誤って検出されたデータセット１２０のデータ１３６の領域に基づいて更新されてもよく、それによって、第２の分類技術は、すぐに、データセット１２０のこのデータ１３６を第２のクラス１２２のデータであると認識する。データセット１２０の領域１３６は、すぐに、第１の分類技術によって、第１のクラスのデータ（例えば、正常なデータ）と関連すると認識され、したがって、図２ａと比較すると、大きくなる。同様に、第２の分類技術によって、第２のクラスのデータ（例えば、誤ったデータ）と関連すると認識されているデータセット１２０の領域１２８は、図２ａと比較して長くなる。

最初の更新ステップに続いて、アプリケーション領域１３０の範囲内ではあるが、データの領域１２６の外部に位置しており、第１の分類技術によって第１のクラスのデータ（例えば、正常なデータ）と関連すると、すぐに、認識されるデータセット１２０の第１のクラスのデータ（例えば、正常なデータ）のデータ１２２の領域１３２は、図２ｂでは、（Ｆ，Ｎ，Ｎ）によって示されており、言い換えれば、第１の分類技術は、データセット１２０の領域１３２のデータを第２のクラス（例えば、誤ったデータ）に割り当てる。逆に、第２の分類技術は、データセット１２０の領域１３２のデータを第１のクラスのデータ（例えば、正常なデータ）に割り当てる。実際には、データセット１２０の領域１３２のデータは、第１のクラスのデータ（例えば、正常なデータ）に割り当てられるべきであった、しかしながら、そのため、第１の分類技術の分類結果は、不正確であり、そして、そのため、第１の分類技術（または、第１の分類技術の分類基準）は、その次の更新段階のトレーニングステップに適用されることになっている。

アプリケーション領域１３０の範囲内、および、データの領域１２６の範囲内に位置しており、第１の分類技術によって第１のクラスのデータ（例えば、正常なデータ）と関連すると、すぐに、認識される第１のクラスのデータ１２２の領域１３４は、（Ｎ，Ｎ，Ｎ）によって示されており、言い換えれば、第１の分類技術は、データセット１２０の領域１３４のデータを第１のクラス（例えば、正常なデータ）に割り当て、そして、また、第２の分類技術は、データセット１２０の領域１３４のデータを第１のクラス（例えば、正常なデータ）に割り当てる。データセット１２０の領域１３４のデータは、第１のクラスのデータ（例えば、正常なデータ）に割り当てられるべきであり、そのため、両方の分類技術の分類結果は、正確である。

アプリケーション領域１３０の範囲内ではあるが、データの領域１２８の外部に位置しており、第２の分類技術によって第２のクラスに所属すると、すぐに、正しく認識されるデータセット１２０の第２のクラスのデータ（例えば、誤ったデータ）のデータ１２４の領域１３６は、（Ｆ，Ｎ，Ｆ）によって示されており、言い換えれば、第１の分類技術は、データセット１２０のこの領域１３６のデータを第２のクラス（例えば、誤ったデータ）に割り当て、逆に、第２の分類技術は、データセット１２０のこの領域１３６のデータを第１のクラスのデータ（例えば、正常なデータ）に割り当てる。実際には、データセット１２０のこの領域１３６のデータは、第２のクラスのデータ（例えば、誤ったデータ）に割り当てられるべきであった、そのため、第２の分類技術の分類結果は、不正確であり、そして、そのため、第２の分類技術（または、第２の分類技術の分類基準）は、その次の更新段階のトレーニングステップに適用されることになっている。

アプリケーション領域１３０の範囲内、および、データの領域１２８の範囲内に位置しており、第２の分類技術によって第２のクラスのデータ（例えば、正常なデータ）と関連すると、すぐに、正しく認識される第２のクラスのデータ（例えば、誤ったデータ）のデータの領域１３８は、（Ｆ，Ｆ，Ｆ）によって示されており、言い換えれば、第１の分類技術は、データセット１２０の領域１３４のデータを第２のクラスのデータ（例えば、誤ったデータ）に割り当て、そして、また、第２の分類技術は、データセット１２０の領域１３８のデータを第２のクラスのデータ（例えば、誤ったデータ）に割り当てる。データセット１２０の領域１３８のデータは、第２のクラスのデータに割り当てられるべきであり、そのため、両方の分類技術の分類結果は、正確である。

比較として、図２ｂの右側には、第１のクラス（例えば、正常なデータ）のデータ１２２と、第２のクラス（例えば、誤ったデータ）のデータ１２４と、備えた、同一のデータセット１２０の概略図、同様に、トレーニング段階の第１のトレーニングステップの後に、例えば、単独の分類技術によって、第１のクラスのデータ（例えば、正常なデータ）と関連すると、すぐに、認識されるデータの領域１４０、そして、単独の分類技術と、を備えたそれに適用される従来の方法を有するデータセット１２０の領域（アプリケーション領域）１３０が示されている。

図２ｂの右側に見られるように、単独の分類技術は、また、前に誤って検出されたデータセット１２０のデータの領域１４２に基づいて適応され、それによって、第１の分類技術は、セット１２０のこのデータの領域１４２を第１のクラス１２２のデータであると、すぐに、認識する。しかしながら、方法１００と比較すると、これは、図２ｂの中で灰色（ハッチされた）領域１５０としてマークされた追加の支出を含む。詳細には、領域１４６（１５０を含む）は更新のために用いられるので、追加の支出は、次の更新ステップの中でそれ自身が感じられるようにするために、逆に、１３６（１２８を除く）は、小さい領域で、左側で用いられる。

第１の更新段階に続いて、アプリケーション領域１３０の範囲内ではあるが、データセット１２０の領域１４０の外部に位置しており、単独の分類技術によって第１のクラスのデータ（例えば、正常なデータ）と関連すると認識されているデータセット１２０の第１のクラス（例えば、正常なデータ）のデータ１２２の領域１４２は、（Ｆ，Ｎ）によって示されており、言い換えれば、単独の分類技術は、データセット１２０の領域１４２のデータを第２のクラス（例えば、誤ったデータ）に割り当てる。実際には、データセット１２０の領域１４２のデータは、第１のクラスのデータ（例えば、正常なデータ）に割り当てられるべきであった、そのため、単独の分類技術の分類結果は、不正確であり、そのため、単独の分類技術（または、単独の分類技術の分類基準）は、その次の更新段階のトレーニングステップに適用されることになっている。

アプリケーション領域１３０の範囲内であり、および、データセット１２０の領域１４０の範囲内に位置しており、単独の分類技術によって第１のクラスのデータ（例えば、正常なデータ）と関連すると認識されている第１のクラスのデータ（例えば、正常なデータ）のデータ１２２の領域１４４は、（Ｎ，Ｎ）によって示されており、言い換えれば、単独の分類技術は、データセット１２０の領域１４２のデータを第１のクラス（例えば、正常なデータ）に割り当てる。データセット１２０の領域１４２のデータは、第１のクラスのデータ（例えば、正常なデータ）に割り当てられるべきであり、そのため、単独の分類技術の分類結果は、正確である。

アプリケーション領域１３０の範囲内に位置する、データセット１２０の第２のクラス（例えば、誤ったデータ）のデータ１２４の領域１４６は、（Ｆ，Ｆ）によって示されており、言い換えれば、単独の分類技術は、データセット１２０の領域１４６のデータを第２のクラスのデータ（例えば、誤ったデータ）に割り当てる。データセット１２０の領域１４６のデータは、第２のクラスのデータ（例えば、誤ったデータ）に割り当てられるべきであり、そのため、単独の分類技術の分類結果は、正確である。

図２ｃの左側には、第１のクラス（例えば、正常なデータ）のデータ１２２（Ｎ）と、第２のクラス（例えば、誤ったデータ）のデータ１２４（Ｆ）と、備えた同じデータセット１２０の概略図、同様に、トレーニング段階の第２のトレーニングステップに従った、
例えば、第１の分類技術によって、第１のクラス（例えば、正常なデータ）と関連すると、すぐに、認識されるデータの領域１２６（Ｍ１）、および、第２の分類技術によって、第２のクラス（例えば、誤ったデータ）と関連すると、すぐに、認識されるデータの領域（Ｍ２）が示されている。

図２ｃに見られるように、２つの分類技術（または、２つの分類技術の分類基準）は、前の分類結果に基づいて更新される。詳細には、第１の分類技術（または、第１の分類技術の分類基準）は、前に誤って検出されたデータセット１２０の領域１３２に基づいて更新されてもよく、それによって、第１の分類技術は、データセット１２０のこの領域１３２を第１のクラス１２２のデータであると、すぐに、認識する。これに加えて、第２の分類技術（または、第２の分類技術の分類基準）は、前に誤って検出されたデータセット１２０の領域１３６に基づいて更新されてもよく、それによって、第２の分類技術は、データセット１２０の領域１３６を第２のクラス１２２のデータであると、すぐに認識する。第１の分類技術によって、第１のクラスと関連すると認識されたデータセット１２０の領域１２６（Ｍ１）は、したがって、図２ｂと比較して、より長くなる。同様に、第２の分類技術によって第２のクラスと関連すると認識されたデータセット１２０の領域１２８（Ｍ２）は、したがって、図２ｂと比較して、より長くなる。

比較として、図２ｃには、第１のクラス（例えば、正常なデータ）のデータ１２２と、第２のクラス（例えば、誤ったデータ）のデータ１２４と、を備えた同一のデータセット１２０、同様に、第２の更新段階の後に、例として、単独の分類技術によって第１のクラスと関連すると、すぐに、認識されるデータセットの領域１４０（Ｍ１）の概略図が示されている。

図２ｃの右側に見られるように、単独の分類技術は、前に誤って検出されたデータセット１２０の領域１４２に基づいて適用されてもよく、それによって、単独の分類技術は、データセット１２０のこの領域１４２を第１のクラス１２２のデータであると、すぐに、認識する。

言い換えれば、図２ａから２ｃには、２つの技術、Ｍ１およびＭ２が組み合わされたときに、フィードバック手段による更新メカニズムの実例が示されている。システムの空間の全体の状態は、例えば、特定の割合の“誤った”状態（Ｆ）、および“正常な状態”（Ｎ）が含まれていてもよい。初めに、既知のＮデータセットは、Ｍ１をトレーニングするために用いられてもよく、そして、あるいは、既知のＦデータ、または、専門家の知識から知られたルールは、Ｍ２を初期化するために用いられてもよい。２つの技術のアプリケーションは、未知のデータ（破線によって枠組みされた領域）１３０の上で実行される。Ｍ１の分類がＭ２の分類（明確に示された領域１３２、１３６、１４２、１４６）と一致しなければ、フィードバックについての追加の情報（例えば、専門家の知識）は、一方、または、両方の技術を適用するために用いられる。アプリケーションの進行の中で、そして、連続するフィードバック手段により、Ｍ１およびＭ２は、継続的に調整されて、理想的には、最終的に、全ての状態空間が正しく分類されるまで、必要なフィードバックはより少なくなる。

第２の更新（第２の更新段階）として、１つの単独の方法（図２ａから２ｃの右側）と比較して、補完する技術（図２ａから２ｃの左側）の組み合わせの利用は、１つの単独の技術（灰色（でハッチングされた）領域）のために必要なさらなるフィードバックをしてからの効果が生じる。Ｍ１タイプの単独の技術を用いると、この状況の範囲内で、誤った肯定的な結果の数が高い傾向があるときからのすべてのＦ結果のためのフィードバックが得られる。Ｍ２タイプ（表されていない）の１つの単独の技術を用いると、この状況の範囲内で、誤った否定的な結果の数が高い傾向があるときからのすべてのＮ結果のためのフィードバックが得られる。

図２ａないし２ｃと比較すると、図３ａないし３ｃには、第１の分類技術（Ｍ１）が誤った分類をした、例えば、第２のクラスのデータ（例えば、誤ったデータ）の領域１２７は、第１のクラスのデータ（例えば、正常なデータ）として示されている。

この領域１２７のために、図３ａには、分類結果として、（Ｎ，Ｎ，Ｆ）が示されており、言い換えれば、第１の分類技術は、領域１２７のデータを第１のクラスのデータ（例えば、正常なデータ）に割り当て、そして、また、第２の分類技術は、領域１２７のデータを第１のクラスのデータ（例えば、正常なデータ）に割り当てる。実際には、領域１２７のデータは、第２のクラス（例えば、誤ったデータ）のデータである。そのため、両方の分類技術の結果は間違っている。それによって、両方の分類技術（両方の分類技術の分類基準）は、それに続く（反復的な）更新ステップに適応される。

この場合には、領域１４１のための分類結果として、従来の分類技術では（Ｎ，Ｆ）が得られ、言い換えれば、単独の分類技術は、領域１２７のデータを第１のクラス（例えば、正常なデータ）に割り当てる。実際には、しかしながら、領域１２７のデータは、第２のクラス（例えば、誤ったデータ）のデータである。そのため、単独の分類技術の結果は誤っている。

図３ｂの左側に見られるように、（Ｎ，Ｆ，Ｆ）は、適用後の領域１２７のための分類結果として示されており、言い換えれば、第１の分類技術は、領域１２７のデータを第１のクラスのデータ（例えば、正常なデータ）に割り当て、逆に、第２の分類技術は、もうすでに、領域１２７のデータを第２のクラスのデータ（例えば、誤ったデータ）に割り当ている。したがって、第１の分類技術の分類結果は、誤り続けており、そのため、第１の分類技術（または、第１の分類技術の分類基準）は、それに続く（反復的な）更新ステップに適応される。

また、従来の分類技術は、まだ、領域１４１のために、図３の中に、分類結果として、（Ｎ、Ｆ）を提供し、言い換えれば、単独の分類技術は、領域１２７のデータを第１のクラス（例えば、正常なデータ）に割り当てる。実際には、しかしながら、領域１２７のデータは、第２のクラス（例えば、誤ったデータ）のデータである。そのため、単独の分類技術の結果は間違っている。フィードバックがＦ結果だけのために得られたときから、適応は起こらない（領域は表示されない）。

言い換えれば、図３ａないし３ｃには、フィードバックの方法による更新メカニズムの実例が示されている。詳細には、図３ａないし３ｃには、単独の技術と比較した２つの補完する技術の組み合わせのための方法の比較が示されている。図２ａないし２ｃとは対照的に、ここでは、Ｍ１が誤った否定的な結果を生じさせる場合が描写されている。単独の技術を用いたときには（図３ａないし３ｃの右側）、Ｍ１の訂正は不可能である。しかしながら、組み合わされた２つの補完的な技術は、対応する適応を可能にする（図３ｃ参照）。誤った肯定的な結果を生じさせる場合には、類推によって、Ｍ２は、修正されてもよい。

模範的な第１の分類技術、および第２の分類技術は以下に記述される。

第１の分類技術（または、第１の分類技術の分類基準）では、“異常値検出”のための技術が用いられてもよい。これは、さまざまなデータマイニングの技術、および多重線形回帰（ｍｕｌｔｉｐｌｅｌｉｎｅａｒｒｅｇｒｅｓｓｉｏｎ）、クラスタリング（ｃｌｕｓｔｅｒｉｎｇ）（クラスタ形成（ｃｌｕｓｔｅｒｆｏｒｍａｔｉｏｎ））、質的モデルなどのような機械学習が含まれる。この技術で決定的でありえることは、クラス１（Ｎデータ）だけを含む一組のトレーニングデータに基づいて、それがトレーニングされるということである。もし、必要であれば、用いられる技術のためのパラメータは、テストデータのセットの手段によって調整されてもよく、そして、それは、クラス２のデータ（Ｆデータ）を含む。

第２の分類技術（技術２（Ｍ２））では、ルールベースの技術が用いられてもよく、ルールは明確に述べられてもよく、例えば、手動の手段（専門家の知識に基づいた）、または、（二進数の）分類技術は、サポートベクタマシーン、決定木、ロジスティック回帰、ニューラルネットワークなどを用いてもよい。また、専門家のルール、および自動的に作成されたルール/分類のルールセットを組み合せることが可能である。Ｍ２のためのトレーニングデータセットは、ＦデータとＮデータとの両方で構成されてもよい。トレーニングデータ、決定木、または、決定森の類似するセットから自動的にルールを抽出する技術が用いられてもよい。専門家のルールを使用する場合、既知のエラー（クラス２に属する）に基づいてルールを作成できることが重要である。

以下には、（反復的な、または、連続的な）データを分類する方法１００の更新過程がより詳細に述べられる。

第１の段階では、トレーニングデータのセットは、Ｎデータだけを含むデータが用いられてもよい。第１の分類技術（Ｍ１）は、トレーニングデータのこのセットの上でトレーニングされてもよい。Ｍ１のために必要とされるかもしれないどんなパラメータもまず最初に推定されるか、交差検証の手段によって決定されてよい。

第２の段階では、おそらくもうすでに知られているかもしれない誤りは、ルールとして明確に述べられてもよい。それらは、第２の分類技術（Ｍ２）のために、出発点を形成してもよい。他方で、それぞれのポイントをＮデータポイントと分類するためのＭ２のために、初期値が用いられてもよい。

第３の段階では、Ｍ１およびＭ２は、未知のデータセット（分類されるための）に並行して適用されてもよい。未知のデータセットのそれぞれのデータポイントのために、Ｍ１、およびＭ２は、互いに、独立した分類（Ｎ、または、Ｆ）を提供してもよい。互いに異なる結果の数、言い換えれば、Ｍ１による分類≠Ｍ２による分類が、決定される。

第４のステップでは、互いに異なる結果の数が特定の所定の範囲を超えるとすぐに、これらの結果は、例えば、システムの専門家、ユーザー、または他のソースによる実際の分類（Ｅ）と比較することができる。その後、Ｍ１およびＭ２は、以下のように調整してもよい。

（Ｍ１＝Ｆ，Ｍ２＝Ｎ，Ｅ＝Ｎ）を伴う結果の数が、所定の数を超えた場合、Ｍ１は適応されてもよく（トレーニングデータのセットは適応され）、言い換えれば、Ｍ１のためのトレーニングデータのセットから一定の数のランダムに引き出されたデータポイントは、（Ｍ１＝Ｆ，Ｍ２＝Ｎ，Ｅ＝Ｎ）結果から対応する数のランダムに選ばれたデータポイントによって、置き換えられてもよい。

（Ｍ１＝Ｆ，Ｍ２＝Ｎ，Ｅ＝Ｆ）を伴う結果の数が、所定の数を超える場合、Ｍ２は適応されてもよく（トレーニングデータのセットは適合され）、言い換えれば、Ｍ２のためのトレーニングデータのセットから一定の数のランダムに引き出されたデータポイントは、（Ｍ１＝Ｆ，Ｍ２＝Ｎ，Ｅ＝Ｆ）結果から対応する数のランダムに選ばれたデータポイントによって、置き換えられてもよい。Ｍ２のためのトレーニングデータのセットは、今のところは、Ｎデータのみを含む場合、（Ｍ１＝Ｆ，Ｍ２＝Ｎ，Ｅ＝Ｆ）結果から所定の数のランダムに選ばれたデータポイントは、Ｍ２のための既存のトレーニングデータのセットに加えられてもよい。

（Ｍ１＝Ｎ，Ｍ２＝Ｆ，Ｅ＝Ｎ）を伴う結果の数が、所定の数を超える場合、Ｍ２は適合されてもよく（トレーニングデータセットは適応され）、言い換えれば、Ｍ２のためのトレーニングデータセットのＮデータからの一定の数のランダムに引き出されたデータポイントは、（Ｍ１＝Ｎ，Ｍ２＝Ｆ，Ｅ＝Ｎ）結果から対応する数のランダムに選ばれたデータポイントによって、置き換えられてもよい。Ｍ２のためのトレーニングデータセットが、まだ存在していない場合、（Ｍ１＝Ｎ，Ｍ２＝Ｆ，Ｅ＝Ｎ）結果から一定の数のランダムに引き出されたデータポイントは、Ｍ２のための初期のトレーニングデータセットとして用いられてもよい。

（Ｍ１＝Ｎ，Ｍ２＝Ｆ，Ｅ＝Ｆ）を伴う結果の数が、所定の数を超える場合、Ｍ１は適応されてもよく（パラメータ調整済み）、言い換えれば、Ｍ１のためのテストデータセットのＦデータから一定の数のランダムに引き出されたデータポイントは、（Ｍ１＝Ｎ，Ｍ２＝Ｆ，Ｅ＝Ｆ）結果から対応する数のランダムに選ばれたデータポイントによって、置き換えられてもよい。Ｍ１のためのテストデータセットが存在していない場合、（Ｍ１＝Ｆ，Ｍ２＝Ｎ，Ｅ＝Ｆ）結果から所定の数のランダムに選ばれたデータポイントは、Ｍ１のための初期のテストデータセットとして用いられてもよい。最適条件パラメータは、テストデータのアカウントを取得している間に、交差検証によって決定されてもよい。

第５の段階では、Ｍ１、およびＭ２は、新しいトレーニングデータセット、または、新しいパラメータを伴ってトレーニングされてもよい。

第６の段階では、ステップ３から６までが繰り返される。

図４には、本発明の実施の形態に従った、第１のクラス、または、第２のクラスで情報を分類するための分類プロセッサ２００の概略図が示されている。分類プロセッサ２００は、２つの並行した分類段階２０２、２０４と更新段階２０６とを備える。２つの分類段階２０２、および２０４のうちの第１の分類段階２０２は、情報が第１のクラスの分類基準を満たしていれば、情報を第１のクラスに割り当て、情報が第１のクラスの分類基準を満たしていなければ、情報を第２のクラスに割り当てる。２つの分類段階２０２、および２０４のうちの第２の分類段階２０４は、情報が第２のクラスの分類基準を満たしている場合、情報を第２のクラスに割り当て、情報が第２のクラスの分類基準を満たしていない場合、情報を第１のクラスに割り当て、第１のクラスと第２のクラスは互いに異なる。更新段階は、２つの分類技術によって情報が異なって割り当てられている場合、または、２つの分類技術による互いに異なる情報の割り当てが所定の数に達した場合には、２つの分類技術のうちの少なくとも１つの分類技術を更新するように構成される。

異なる補完技術の組み合わせによって、実施の形態は、高度なロバスト性、および正確性を有する方法（または、分類プロセッサ、または、分類機）を提供する。これに加えて、連続したフィードバックは、アプリケーションの進行の中で正確な絶え間ない改良、そして、修正された外部状況への適応、または、新しく起きた誤りを検出することを可能にする。２つの補完技術の組み合わせを用いる決定的な利点は、必要なフィードバック動作の割合を１つの単独の技術よりも小さくして、そして、アプリケーションの経過の中で減少させていくことにある。

本発明の実施の形態は、フィルタリング、腫瘍発見、クレジットカード詐欺の識別と技術的な設備の誤り検出のために用いられる。

実施の形態では、方法１００による情報分類は、例えば、センサデータ（または、センサ値）の一式のセンサデータ（または、センサ値）であってもよい。

実施の形態では、センサデータは、１つ、または、１つ以上の外部のセンサ（例えば、技術的な設備）によって検出されてもよい。

実施の形態では、例えば、センサデータは、温度、圧力、体積流量、または、制御信号であってもよい。

実施の形態では、情報が、両方の分類技術によって、第１のクラスに割り当てられていたときに、第１の信号は出力されてもよい。例えば、第１のクラスの情報は、あらかじめ定められたセンサデータ領域（または、目標計測値領域）の範囲内に存在する通常情報（例えば、センサデータ（または、計測されたセンサ値））であってもよく、第１の信号は、（例えば、技術の設備の）動作の正確な状態を示していてもよい。

実施の形態では、情報が、両方の分類技術によって、第２のクラスに割り当てられていたときに、第２の信号は出力されてもよい。例えば、第２のクラスの情報は、あらかじめ定められたセンサデータ領域（または、目標計測値領域）の外部に存在する誤り情報（例えば、センサデータ（または、計測されたセンサ値））であってもよく、第２の信号は、（例えば、技術の設備の）動作の誤った状態を示している。

実施の形態では、情報が、分類技術によって、異なるクラスに割り当てられていたときに、第３の信号は出力されてもよい。

実施の形態では、方法は、技術的な設備（例えば、サービスプラント）の中の誤りを検出して、それらを報告させるために用いられてもよい。

実施の形態では、センサの時系列データ（例えば、温度、圧力、容積測定流量、または、実際の信号）は、方法のための入力データとして用いられてもよい。

実施の形態では、時間に割り当てられた、すべて、または、選ばれたセンサは、データポイントとみなしてもよい。

実施の形態では、方法によって、それぞれのポイントは、正常として、誤りとして、または、不明として分類されてもよい。

実施の形態では、誤りとしてのデータポイントの分類は、技術的な設備の稼働の中で誤りと示されていてもよく、それによって、前記誤りは、除かれてもよい。

実施の形態では、方法の基礎になる補完的な技術が、異なる分類を示唆しているときには、不明としての分類が、発生してもよい。

実施の形態では、例えば、実際のクラス分類についての知識のような、さらなる（外部の）情報が用いられている間に、“不明”の分類を伴うデータポイントは、分類されてもよい。

実施の形態では、実際の分類は、更新のために用いられ、そして、方法の基礎になる技術を改良する。例えば、実際の分類についての情報は、ユーザ（例えば、施設管理者）によって提供されてもよい。しかしながら、分類基準の更新は、ユーザによってよりも、アルゴリズムによって実行されることに注意すべきである。

実施の形態では、不明としてのデータポイントの分類は、アプリケーションの進行の中では、減少するかもしれず、データポイントの誤った分類の数も、また、減少していく。

実施の形態では、方法は枠組み状態を変えて（例えば、暖房から冷房に切り替えるように）、分類を適応して、そして、新しい誤りのタイプを検出することが可能である。

実施の形態では、どんなさらなる（外部の）情報（例えば、ユーザによって提供された）を除き、“不明”クラスのデータポイントは、いつも誤りとみなされてもよいか、いつも正常とみなされてもよいかのいずれかでもよい。

いくつかの実施例は、装置の環境の範囲内で記述されてきており、前記実施例は、また、一致する方法の記述として表現されたことは理解できた、そのため、装置のブロック、または、構造構成要素も、また、一致する方法のステップとして、または、方法のステップの特徴として理解できた。類似的に、それとともに、実施例は、結合、または、対応する装置の対応するブロック、または、詳細、または、特徴として、記述されて表現されている。すべての方法ステップのうちのいくつかは、例えば、マイクロプロセッサ、プログラム可能なコンピュータ、または、電子回路のようなハードウエア装置（または、ハードウエア装置を用いている間に）によって実行されてもよい。

発明に係る信号の符号化は、オーディオ信号、または、ビデオ信号、または、キャリアストリーム信号のような、ディジタル格納メディアに格納されてもよく、または、無線送信メディア、または、インターネットのような有線送信メディア上で送信されてもよい。

発明に係る符号化されたオーディオ信号は、ディジタル格納メディアに格納されてもよく、または、無線送信メディア、または、インターネットのような有線送信メディア上で送信されてもよい。

特定の実施条件に応じて、発明の実施の形態は、ハードウエア、または、ソフトウェアで実施されてもよい。実施は、電子的に読み取り可能な制御信号が格納され、それぞれの方法が実行される、プログラム可能なコンピュータシステムと協働できるまたは協働する、フロッピーディスク、ＤＶＤ、ブルーレイディスク、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、または、ＦＬＡＳＨメモリ、ハードディスクなどのような他の磁気的、または、光学的なメモリを使用して行ってもよい。したがって、デジタル記憶媒体はコンピュータで読み取り可能である。

発明に係るいくつかの実施の態様は、ここに述べられたどのような方法であっても実行されるプログラム可能なコンピュータシステムと協働することができる読み取り可能な制御信号を有するデータキャリアを備える。

一般的に、本発明の実施の形態は、プログラムコードを有するコンピュータプログラム製品として実施することが可能であり、コンピュータプログラム製品がコンピュータで動いているときには、いくつかの方法を実行するために、効果的なプログラムコードを有するコンピュータプログラム製品として実施されている。

プログラムコードは、また、例えば、機械で読み取り可能なキャリアに格納されていてもよい。

他の実施の形態では、機械で読み取り可能なキャリアに格納された、ここに記述された方法のうちのいくつかを実行するための前記コンピュータプログラムを備える。

言い換えれば、発明の実施の形態の方法は、したがって、コンピュータプログラムがコンピュータで動いているときには、ここに記述された方法のうちのいくつかを実行するためのプログラムコードを有するコンピュータプログラムである。

発明のさらなる実施の形態の方法は、このような、ここに記述されたいくつかの方法が実行されているコンピュータプログラム上のデータキャリア（または、デジタル格納メディア、または、コンピュータ読み取り可能なメディア）は、そのうちに記録される、ここに記述された方法のうちの１つを実行するためのコンピュータプログラムを備える。データキャリア、ディジタル格納媒体、または、コンピュータで読み取り可能なメディアは、典型的には有形および／または非一過性、および／または非一過性である。

発明のさらなる実施の形態の方法は、したがって、ここに記述されたどのような方法をも実行するためのコンピュータプログラムを表す、信号のデータストリーム、または、シーケンスである。信号のデータストリーム、または、シーケンスは、例えば、インターネットを経由するような、例えば、データ通信接続を経由して送信されるように構成されていてもよい。

さらなる実施の形態は、処理手段、例えば、ここに記述されたどのような方法をも実行するように構成された、または、適応される、コンピュータ、または、プログラム可能な論理装置を備える。

さらなる実施の形態は、ここに記述されたどのような方法をも実行するためプログラムが動作するコンピュータを備える。

発明に係るさらなる実施の形態は、ここに記述された方法の少なくとも１つを受信機で実行するためのコンピュータプログラムを送信するように構成された装置、または、システムを含む。送信は、例えば、電気的でも光学的でもよい。受信機は、例えば、コンピュータ、モバイル装置、メモリ装置、または、類似した装置であってもよい。装置、または、システムは、例えば、コンピュータプログラムを受信機に送信するためのファイルサーバを含んでいてもよい。

いくつかの実施の態様では、プログラム可能な論理装置（例えば、フィールド・プログラブル・ゲート・アレイ（ｆｉｅｌｄｐｒｏｇｒａｍｍａｂｌｅｇａｔｅａｒｒａｙ，ａｎＦＰＧＡ））は、ここに述べられた方法の機能のいくつか、または、すべてを実行するために用いられていてもよい。いくつかの実施の態様では、フィールド・プログラブル・ゲート・アレイは、ここに述べられたどのような方法をも実行するために、マイクロプロセッサ（ｍｉｃｒｏｐｒｏｃｅｓｓｏｒ）と協働してもよい。一般的には、方法は、いくつかの実施の態様の中で、どのようなハードウエア機器によっても、実施される。前記ハードウエア装置は、コンピュータプロセッサ（ＣＰＵ）、または、グラフィックカード（ＧＰＵ）のような一般的に適用可能なハードウエアであってもよく、または、ＡＳＩＣのような、方法に特有なハードウエアであってもよい。

ここで述べられた装置は、例えば、ハードウエア機器を用いている間、または、コンピュータを用いている間、または、ハードウェア機器とコンピュータを組み合わせて用いている間に実施されてもよい。

ここに述べられた装置、または、ここに述べられた装置の構成要素のどれでも、少なくとも部分的に、ハードウェアの中で、または、ソフトウェア（コンピュータプログラム）の中で実施されてもよい。

ここで述べられた方法は、例えば、ハードウエア機器を用いている間、または、コンピュータを用いている間、または、ハードウェア機器とコンピュータを組み合わせて用いている間に実施されてもよい。

ここに述べられた方法、または、ここに述べられた装置の構成要素のどれでも少なくとも部分的に、ハードウェアの中で、または、ソフトウェア（コンピュータプログラム）の中で遂行されてもよい。

以上に記述された実施の形態は、本発明の原理を説明するための具体例を単に表したものである。他の当業者は、ここに述べられた配置、および詳細の修正、および変更を高く評価すると理解します。これは、発明は、明細書の手段、および実施の形態の議論によって、ここで示された特定の詳細によってよりも、以下の請求項の範囲によってのみ限定されることを意図する。

Claims

情報を第１のクラス、または、第２のクラスに分類するコンピュータで実施される方法（１００）であって、
前記方法（１００）は、
前記情報が第１のクラスの分類基準を満たす場合、前記情報を前記第１のクラスに割り当て、前記情報が前記第１のクラスの分類基準を満たさない場合、前記情報を前記第２のクラスに割り当てるために、第１の分類技術（Ｍ１）を前記情報に適用するステップ（１０２）と、
前記情報が第２のクラスの分類基準を満たす場合、前記情報を前記第２のクラスに割り当て、前記情報が前記第２のクラスの分類基準を満たさない場合、前記情報を前記第１のクラスに割り当てるために、第２の分類技術（Ｍ２）を前記情報に適用するステップ（１０４）と、
前記２つの分類技術（Ｍ１、Ｍ２）により前記情報が異なって割り当てられている場合、または、前記２つの分類技術による互いに異なる情報の割り当てが所定の数に達した場合には、前記２つの分類技術のうちの少なくとも１つの分類基準を更新するステップ（１０６）と、
を備え、
前記第１のクラス、および前記第２のクラスは、互いに異なり、
前記方法（１００）は、技術的な設備で、誤りを検出するために用いられ、
前記方法（１００）によって分類される前記情報は、センサデータであり、
前記方法（１００）は、さらに、
前記情報が、両方の分類技術により第１のクラスに割り当てられた場合、第１の信号を出力するステップと、
前記情報が、両方の分類技術により第２のクラスに割り当てられた場合、第２の信号を出力するステップと、
前記情報が、前記分類技術により異なるクラスに割り当てられた場合、第３の信号を出力するステップと、
を備えていることを特徴とするコンピュータで実施される方法（１００）。
前記第１の信号は、技術的な設備の正常な動作状態を示しており、
前記第２の信号は、技術的な設備の故障した動作状態を示していること、
を特徴とする請求項１に記載のコンピュータで実施される方法（１００）。
前記第１の分類技術（Ｍ１）および前記第２の分類技術（Ｍ２）は、互いに補完することを特徴とする、請求項１または請求項２のうちのいずれか１つに記載のコンピュータで実施される方法（１００）。
前記２つの分類技術（Ｍ１、Ｍ２）のうちのいずれか少なくとも１つは、前記情報の実際のクラスの割り当てについての知識を用いている間に更新されることを特徴とする請求項１ないし請求項３のうちのいずれか１つに記載のコンピュータで実施される方法（１００）。
前記情報は、データであり、または、
前記情報は、データセット（１２０）のデータであり、
前記データセット（１２０）のデータは、前記方法（１００）により個々に分類されることを特徴とする請求項１ないし請求項４のうちのいずれか１つに記載のコンピュータで実施される方法（１００）。
前記第１の分類技術（Ｍ１）は、異常値検出技術であることを特徴とする請求項１ないし請求項５のうちのいずれか１つに記載のコンピュータで実施される方法（１００）。
前記方法（１００）は、初期化段階の間に第１の情報のみで前記第１の分類技術（Ｍ１）を初期化するステップを備えることを特徴とする請求項６に記載のコンピュータで実施される方法（１００）。
前記第２の分類技術（Ｍ２）は、ルールベースの技術であることを特徴とする請求項１ないし請求項７のうちのいずれか１つに記載のコンピュータで実施される方法（１００）。
前記方法（１００）は、初期化段階の間に、前記第２のクラスの情報のみ、または、前記第２のクラスの既知の分類情報のみの分類基準で前記第２の分類技術（Ｍ２）を初期化するステップを備えることを特徴とする請求項８に記載のコンピュータで実施される方法（１００）。
初期化段階に続くトレーニング段階で、実際には前記第１のクラスに割り当てられるべき所定の数の情報が、前記第２の分類技術（Ｍ２）により正確に前記第１のクラスに割り当てられているが、前記第１の分類技術（Ｍ１）により誤って前記第２のクラスに割り当てられた場合、前記第１の分類技術（Ｍ１）を置き換えられたトレーニング情報のセットに再適用することにより、前記第１の分類技術（Ｍ１）の前記分類基準を更新するために、前記第１の分類技術（Ｍ１）をトレーニングするために用いられる、前記トレーニング情報のセットのうちの少なくとも一部が、置き換えられることを特徴とする請求項１ないし請求項９のうちのいずれか１つに記載のコンピュータで実施される方法（１００）。
初期化段階に続くトレーニング段階で、実際には前記第２のクラスに割り当てられるべき所定の数の情報が、前記第１の分類技術（Ｍ１）により正確に前記第２のクラスに割り当てられているが、前記第２の分類技術（Ｍ２）により誤って前記第１のクラスに割り当てられた場合、前記第２の分類技術（Ｍ２）を置き換えられたトレーニング情報のセットに再適用することにより、前記第２の分類技術（Ｍ２）の前記分類基準を更新するために、前記第２の分類技術（Ｍ２）をトレーニングするために用いられる、前記第２のクラスの前記トレーニング情報のセットのうちの少なくとも一部が、置き換えられることを特徴とする請求項１ないし請求項１０のうちのいずれか１つに記載のコンピュータで実施される方法（１００）。
初期化段階に続くトレーニング段階で、実際には前記第１のクラスに割り当てられるべき所定の数の情報が、前記第１の分類技術（Ｍ１）により正確に前記第１のクラスに割り当てられているが、前記第２の分類技術（Ｍ２）により誤って前記第２のクラスに割り当てられた場合、前記第２の分類技術（Ｍ２）を置き換えられたトレーニング情報のセットに再適用することにより、前記第２の分類技術（Ｍ２）の前記分類基準を更新するために、前記第２の前記分類技術（Ｍ２）をトレーニングするために用いられる、前記第１のクラスの前記トレーニング情報のセットのうちの少なくとも一部が、置き換えられることを特徴とする請求項１ないし請求項１１のうちのいずれか１つに記載のコンピュータで実施される方法（１００）。
初期化段階に続くトレーニング段階で、実際には前記第２のクラスに割り当てられるべき所定の数の情報が、前記第２の分類技術（Ｍ２）により正確に前記第２のクラスに割り当てられているが、前記第１の分類技術（Ｍ１）により誤って前記第１のクラスに割り当てられた場合、更新されたテストデータのセットを用いて、前記第１の分類技術（Ｍ１）を再トレーニングすることにより、前記第１の分類技術（Ｍ１）の前記分類基準を更新するために、前記第１の分類技術（Ｍ１）をトレーニングするために用いられるトレーニング情報のセットのうちの少なくとも一部が、置き換えられることを特徴とする請求項１ないし請求項１２のうちのいずれか１つに記載のコンピュータで実施される方法（１００）。
情報を第１のクラス、または、第２のクラスに分類するための分類プロセッサ（２００）であって、
前記分類プロセッサ（２００）は、
２つの並行した分類段階（２０２、２０４）と、
更新段階（２０６）と、
を備え、
前記２つの分類段階（２０２、２０４）の第１の分類段階（２０２）は、前記情報が前記第１のクラスの分類基準を満たす場合、前記情報を前記第１のクラスに割り当て、前記情報が前記第１のクラスの分類基準を満たさない場合、前記情報を第２のクラスに割り当てるように構成され、前記２つの分類段階（２０２、２０４）の第２の分類段階（２０４）は、前記情報が前記第２のクラスの分類基準を満たす場合、前記情報を前記第２のクラスに割り当て、前記情報が前記第２のクラスの分類基準を満たさない場合、前記情報を第１のクラスに割り当てるように構成され、
前記第１のクラスおよび前記第２のクラスは異なっており、
前記更新段階（２０６）は、２つの分類段階により前記情報が異なるように割り当てられている場合または２つの分類段階による互いに異なる情報の割り当てが所定の数に達した場合には、前記２つの分類段階（２０２、２０４）のうちの少なくとも１つの分類基準を更新するように構成されており、
前記分類プロセッサ（２００）により分類された前記情報が、センサデータである場合、
前記分類プロセッサ（２００）は、前記情報が両方の分類技術（２０２、２０４）によって前記第１のクラスに割り当てられた場合、第１の信号を出力するように構成され、
前記分類プロセッサ（２００）は、前記情報が両方の分類技術（２０２、２０４）によって前記第２のクラスに割り当てられた場合、第２の信号を出力するように構成され、
前記分類プロセッサ（２００）は、前記情報が両方の分類技術（２０２、２０４）によって異なるクラスに割り当てられた場合、第３の信号を出力するように構成されることを特徴とする分類プロセッサ（２００）。
前記分類プロセッサは、技術的な設備の誤り検出のために用いられることを特徴とする請求項１４に記載の前記分類プロセッサ（２００）。