JP2000514224A - マッピングの組み合わせを伴うパターン認識 - Google Patents

マッピングの組み合わせを伴うパターン認識

Info

Publication number
JP2000514224A
JP2000514224A JP10504915A JP50491598A JP2000514224A JP 2000514224 A JP2000514224 A JP 2000514224A JP 10504915 A JP10504915 A JP 10504915A JP 50491598 A JP50491598 A JP 50491598A JP 2000514224 A JP2000514224 A JP 2000514224A
Authority
JP
Japan
Prior art keywords
pattern
training
standardization
input
standardized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10504915A
Other languages
English (en)
Inventor
クリシュナ チャンドラ パーサウド
ポール ジェー ウエルズ
Original Assignee
アロマスキャン パブリック リミテッド カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB9614192.4A external-priority patent/GB9614192D0/en
Priority claimed from GBGB9617913.0A external-priority patent/GB9617913D0/en
Application filed by アロマスキャン パブリック リミテッド カンパニー filed Critical アロマスキャン パブリック リミテッド カンパニー
Publication of JP2000514224A publication Critical patent/JP2000514224A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Investigating Or Analyzing Materials By The Use Of Fluid Adsorption Or Reactions (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
  • Image Analysis (AREA)
  • Eye Examination Apparatus (AREA)
  • Developing Agents For Electrophotography (AREA)

Abstract

(57)【要約】 減少した次元数の空間へのマッピングが線形マッピングアルゴリズムにより達成され、そのアルゴリズムは主要成分分析(PCA)アルゴリズムまたはその変形とすることができる。標準化変換は、複合線形回帰アルゴリズムを使用して実行することができる。その代わりに、複合非線形回帰アルゴリズム、制限数学的変換またはニューラルネットワークを使用して標準化変換を実行することができる。入力パターンは、ガスセンサアレイの応答またはそれに関連する量を含む。応答はニューラルネットワークへ入力される前に正規化され、または減少した次元数の空間にマッピングされる。

Description

【発明の詳細な説明】 マッピングの組み合わせを伴うパターン認識 本発明はパターン認識に関し、特に形態が外からの変動を受けるパターンを標 準化する方法および装置に関する。 現在ガス感知の分野において十分に確立されたアプローチは、ガスの感知およ び識別の目的でガスセンサのアレイを使用する。そのようなアレイは、例えば、 複数の半導体有機ポリマー(SOP)に基づくガス感知要素を有する(例えば、 Hatfield J.V.,Neaves P.,Hicks P.J.,Persaud K.およびTravers P.のSensors a nd Actuators B、18-19(1994)221ならびにその中の参考文献を参照)。各ガス感 知要素は異なるSOPを有し、そのSOPはガスの範囲に対して広範かつ重なり 合う感度を示すように選択される。こうして、多数のガスを検出および識別する ために単一の装置を使用することができ、ガスはセンサアレイにわたる応答の特 徴的なパターン(または「分子の指紋」)により認識される。 しかし、温度、湿度、およびセンサの経時効果などの要因により生じる測定間 の変動により、認識が妨害を受ける。さらに、製造条件の変動は、センサ間の指 紋の精密な形状の変動を生む。多くの理由から、そのような変動の効果を排除し 、または実質的に軽減することが非常に望ましい。第1に、パターン認識の信頼 性−および、それによるガスの識別−が増大するであろう。第2に、既知のガス の測定に対応する応答の指紋は、その種類の、または、それどころか他の種類の 全てのアレイについての万国共通の基準とみなすことができるであろう。第3に 、再調整の必要が除去または減少される。 そのようなアレイで使用されるガスセンサの数が非常に多く−典型的には20 以上−、それゆえ、応答の出力パターンは本質的には多次元空間内の位置である 。パターンとパターングループとの視覚的比較は、未処理パターンの多次元空間 からのデータを2次元または3次元空間へマッピングすることにより大きく促進 されることが分かっている。主要成分分析(PCA)などの非線形または線形の 直交変換を適用することができる(例えば、Gardner JWおよびShurmer HVの Sensors and Actuators B4(1991)109,Kohonen T,Self Organization and Ass ociate Memory,New York,Springer-Verlag,1989,3rd Edition,ならびにJoliffe ITのPrincipal Component Analysis,New York,Springer-Verlag,1986を参照)。 人間は2次元または3次元空間において関係を認識することに非常に熟達してい るので、マッピングによりパターンの比較は容易化される。しかし、そのような 変換は、それ自体では、上述したセンサ応答の変動の問題を改善するわけではな い。未処理データ中に存在するあらゆる散乱が変換されたデータへ伝わることが ある。 ユーザが定義した分類に入力パターンを配置することが必要な監督されたトレ ーニング問題に対して多層人工ニューラルネットワークが通常使用される。その ようなネットワークは、2以上の層に構成されたニューロンまたはノードとして 知られる複数組の処理要素からなる。一つの層は常に入力層であり、提示された 入力パターンにより出力が規定されるニューロンであり、もう一つの層は常に出 力層である。通常、入力層と出力層に挟まれた少なくとも1つのニューロンの「 隠された」層があり、ネットワークは情報が一方向のみに流れる「フィードフォ ワード」型である。普通は、各層におけるニューロンへの入力は、もっぱらそれ 以前の層中のニューロンの出力から始まっている。 ネットワーク中の所定のニューロンの出力はニューロンへの入力の関数である 。より詳細には、一つのニューロンは、バイアスと呼ばれる常に1.0に等しい 仮定入力と共に、nからn−1が付されたn個の入力を有する。ニューロンは、 入力を乗算するn+1個の重み、およびニューロンの出力を作るために重み付け された入力の合計に適用される活性化関数により特徴付けられる。バイアスを含 む重み付けされた入力の合計は正味の入力として知られ、よってn個の入力xi (i=0,....,n-1)の組からのニューロンの出力Oは式1から得られる: ここで、netは正味の入力であり、f( )は活性化関数であり、wnはバイアスの 重み付けである。 ニューロンの動作特性は主として重みにより制御される。活性化関数は典型的 に非線形関数であり、しばしば、ニューロンの正味の入力に適用された時にその ニューロンの出力を決定するある種の閾値関数である。S字状関数がしばしば使 用される。 入力パターンをユーザが規定した分類中に配置する能力は、ニューラルネット ワークの頻繁に使用される属性である。実際、ニューラルネットワークはパター ン認識の目的でガスセンサの分野において広く使用されている。一つの観点では 、本発明は、パターン認識の先駆工程として、センサアレイの出力を標準化する 手段としてニューラルネットワークを使用することを含む。別の観点では、本発 明は、センサアレイの出力を標準化する手段として、修正されたマッピングアル ゴリズムを使用することを含む。これらのアプローチは、上述の種類の変動を実 質的に除去する。実際、ここにおける「標準化」は、本来的に異なる種類のパタ ーンの分離を維持しつつ上述の一般的な種類の変動を実質的に除去するプロセス を示すことを意図している。「標準化手段」はそのような標準化を実行する物理 的な手段を含むと理解され、そこにおいて「未処理」データは標準化手段に入力 され、標準化されたデーター減少した次元の−が出力される。 本発明は、ガスセンサ出力の標準化には限定されず、あらゆる形態のパターン 標準化に適用可能であると理解される。さらに、「ガス」の語は、例えば液体の 揮発性成分を含む全てのガス状の種を含むと理解される。 本発明の第1の観点によれば、入力パターンを標準化する方法が提供され、そ の方法は、 標準化手段をトレーニングして前記標準化を行う工程と、 前記標準化パターンに入力パターンを入力する工程と、および 前記標準化手段から標準化パターンを出力する工程と、を有する。 標準化手段は、ニューラルネットワークとすることができる。 トレーニングは、ニューラルネットワークへトレーニングパターンを入力する 工程と、出力パターンを基準パターンとする工程と、を有することができる。 その代わりに、トレーニングは、 複数の基準パターンを、好ましくは1次元から5次元の間の減少した次元数 (P)の空間にマッピングする工程と、 複数のトレーニングパターンを前記標準化手段に入力する工程であって、各ト レーニングパターンは基準パターンに対応する種類である工程と、および、前記 トレーニングパターンを、前記減少した基準パターンの次元数と等しい減少した 次元数の空間にマッピングする工程と、および 減少した次元のトレーニングパターンに標準化変換を行い、前記トレーニング パターンを実質的に前記減少した次元数の基準パターン上にマッピングする工程 と、を有することができる。 入力パターンは、マッピングされた基準パターンの次元数と等しい減少した次 元数の空間にマッピングすることができ、そのように減少した入力パターンに標 準化変換を適用して減少した次元数の標準化パターンを作成することができる。 減少した次元数の空間へマッピングする工程は、線形マッピングアルゴリズム により達成することができ、その線形マッピングアルゴリズムは、主要成分分析 アルゴリズムまたはその変形とすることができる。トレーニングは、各トレーニ ングパターンベクトルまたはそれに関連するベクトルと各基準パターン主要成分 の固有ベクトルとの内積を計算することによりトレーニングパターンPCAスコ アを生成する工程と、および、標準化変換を実行して、トレーニングパターンP CAスコアを対応する基準パターンPCAスコア上にマッピングする工程と、を 有することができる。入力パターンPCAスコアは、各入力パターンベクトルま たはそれに関連するベクトルと、各基準パターン主要成分の固有ベクトルとの内 積を計算することにより生成され、前記標準化変換は前記入力パターンPCAス コアに適用することができる。そのような関連するベクトルは、例えば正規化お よびそれに続く基準列平均(データの重心)の減算により作成することができる 。 標準化変換は、複合線形回帰アルゴリズムを使用して実行することができる。 代わりに、標準化変換は複合非線形回帰アルゴリズム、制限数学的変換または ニューラルネットワークを使用して実行することができる。トレーニングパター ンベクトルと各基準パターン主要成分の固有ベクトルの内積を入力層へ入力し、 かつ出力層が対応する基準パターンの対応する内積を出力するようにすることに より、ニューラルネットワークをトレーニングしてトレーニングパターンを基準 パターン上にマッピングすることができる。次に、新しいパターンの内積をニュ ーラルネットワークにより変換することができる。 入力パターンは、ガスセンサアレイの応答またはそれに関連する量を含むこと ができる。ニューラルネットワークへ入力される前に応答を正規化し、または減 少した次元数の空間にマッピングすることができる。 アレイ内のガスセンサの数を21以上とすることができる。 基準パターンは、複数の異なるガスに対する少なくとも1つのガスセンサアレ イの応答を含むことができる。 ガスセンサの応答から一定のオフセットを減算することができる。この手順を 使用することにより、個々のガスセンサが相互に実質的に同一の様相で応答する パターン間でより大きな分離を達成することができる。 温度、湿度、センサの年齢、およびセンサの基礎抵抗値を含むグループの1以 上の要素に関連する量をニューラルネットワークへ入力することもできる。 本発明の第2の観点によれば、本発明の第1の観点を実行するのに適した標準 化手段が提供され、その手段はコンピュータを含むことができる。 標準化手段は、入力パターンが入力される複数の入力ノードと、および標準化 パターンが出力される複数の出力ノードと、を有するパターン標準化ニューラル ネットワークを含み、前記ニューラルネットワークは標準化を行うように事前に トレーニングすることができる。 本発明による方法および装置を添付図面を参照して以下に説明する。添付図面 において、 図1は、ニューラルネットワークの概略図である。 図2は、アレイAの標準化前後の未処理データのサモン(Sammon)マップであ って、標準化はアレイAの平均パターンへのものである。 図3は、正規化されたデータが使用される以外は図2と同様である。 図4は、アレイDの標準化前後の正規化データのサモンマップであって、標準 化はアレイDの平均パターンへのものである。 図5は、アレイBの正規化データの標準化前後のサモンマップであって、標準 化はアレイA、B、CおよびDの平均パターンへのものである。 図6は、アレイAおよびCの標準化されていない未処理データのサモンマップ である。 図7は、アレイDの標準化前後の未処理データのサモンマップであって、標準 化はアレイCの未処理データへのものである。 図8は、センサアレイの酢酸ブチルおよび酢酸エチルの蒸気への暴露により生 じた非標準化未処理データのサモンマップであり、55日の期間にわたり17回 の測定が行われている。 図9は、図8の標準化前後の未処理データのサブセットのサモンマップであり 、標準化はオリジナル取得パターンへのものである。 図10は、(a)標準化していないデータのサモンマップ、および(b)標準 化データのサモンマップであって、両ケースのデータはそこから減算される一定 値を有する。 図11は、7つの校正物質およびP=4での2次元PCAプロットである。 図12は、1つの校正物質、6つの未知物質およびP=3での2次元PCAプ ロットである。 図13は、2つの校正物質、5つの未知物質およびP=3での2次元PCAプ ロットである。 図14は、4つの校正物質、3つの未知物質およびP=3での2次元PCAプ ロットである。 図15は、7つの校正物質およびP=3での2次元PCAプロットである。 図16は、3つの未知物質のマッピングを示す図14の拡大部である。 本発明は、入力パターンを標準化する装置および方法を含む。図1はパターン 標準化ニューラルネットワークを示し、それは入力パターン12が入力される複 数の入力ノード10と、および標準化されたパターン16が出力される複数の出 力ノード14を備え、ニューラルネットワークは標準化を実行するように事前に トレーニングされている。 トレーニングは、一連のトレーニングステップを含み、そのステップにおいて はトレーニングパターンがニューラルネットワークに入力され、出力パターンを 基準パターンとする。 ニューラルネットワークは、3層のフィードフォワード・ニューラルネットワ ークであり、それにおいては必然的に、入力ノード数および出力ノード数が入力 パターンの成分の数以上(以下の例では32)である。図1は入力層10、隠し 層18および出力層14を示すが、表示の単純のため図1は層間相互連結20の 1つのサブセットのみを示す。この記述のニューラルネットワークは成功である ことが本発明で証明されているが、パーゼン(Parzen)ネットワークまたはラジ アル基礎関数ネツトワーク(radial basis function network)などの他のアー キテクチャも本発明の視野内であることを注記しておく。トレーニングは、誤差 逆伝搬方法を使用して実行されたが、確率的アルゴリズムなどの他のトレーニン グアルゴリズムもこの目的に使用可能である。8個、16個および32個の隠し ノードを使用した場合でも実質的に同一の結果が得られることが示された。 以下の例の入力パターンはガスセンサアレイの応答またはそれに関連する量を 含むが、ここに含める教示は他のパターン認識応用に転用することができる。こ れらの例で使用されるガスセンサアレイは複数のSOPベースのセンサを含み、 アレイの応答は、アレイをガスに露出した状態で測定した個々のガスセンサの直 流抵抗変化を含む(Hatfield et al,ibid参照)。 パターン−入力パターンおよび標準化された出力パターンは、本例ではサモン (Sammon)のマッピング手法(例えば、Sammon Jr J.W.IEEE Trans on Computer 5c-18(1969)401参照)により2次元に減少される。これは、パターンの多次 元空間から2次元空間への非線形直交変換であり、パターンの視覚的比較を大き く助ける。例1 32個のSOPセンサの4個のアレイを使用した。以下、アレイA、B、Cお よびDとして示す。各アレイはSOPセンサの異なる組み合わせを含む。各アレ イを5つの溶媒:ブタノン、酢酸エチル、エタノール/水、プロパノールおよび トルエンからの蒸気に暴露した。空気中で7つの異なる溶媒蒸気濃度において各 溶媒の測定を行った。表1は5つの溶媒全てについて使用された%体積濃度を示 す。単純のため、表1では可変濃度測定を1から7の「測定番号」で記述する。 以下、これらの測定番号を濃度値の代わりに使用する。 酢酸エチル、エタノール/水、プロパノール、およびトルエンについての測定 番号1、3、5および6に対応するアレイAからの未処理データ(すなわち、測 定された直流抵抗変化)を使用して標準化を実行するようにニューラルネットワ ークをトレーニングした。トレーニングは一連のトレーニング「ステップ」から なり、そこで、これらの測定番号の1つに対応するトレーニングパターンをニュ ーラルネットワークに入力すると共に、出力パターンを基準パターンとする。基 準パターンは、アレイAを伴う特定の溶媒についての平均パターンである。言い 換えれば、特定の溶媒についての未処理データを、その溶媒についての平均パタ ーンに標準化する。トレーニング後、ニューラルネットワークを使用して全ての 未処理データに対応するパターンを変更した。サモン(Sammon)マッピングを入 力および出力パターンについて実行した。その結果を図2に示す。酢酸エチル、 エタノール/水、プロパノールおよびトルエンの溶媒では、標準化されたデータ 点は目標、つまり平均値の周りに非常に緊密にクラスター化し、トルエン測定( トレーニングパターンとして使用せず)1つのみが例外であった。比較すると、 非標準化未処理データは散乱の程度が大きい。しかし、トレーニングステップか ら除外されたブタノンについての結果はあまり満足できるものではない。非標準 化データに見られる散乱は、測定条件の変動および応答パターン中の濃度依存性 の小さな変動によると思われる。 「未処理」データではなく、正規化されたデータの使用も調査された。正規化 は、個々のガスセンサの抵抗値変化を、アレイについての総抵抗値変化のパーセ ンテージとして示すことにより達成された。以前と同様に、同一のデータセット をトレーニングに使用し、基準パターンは再度、酢酸エチル、エタノール/水、 プロパノールおよびトルエンについての(今度は正規化された)データの平均パ ターンとした。その結果は図3に示され、ブタノンデータのクラスターに相当な 改善を示した。よって、正規化したデータの使用は、これまでニューラルネット ワークが未知であったガスまたは溶媒に対応するデータでさえも、優秀な標準化 を容易にするようである。さらに、正規化されたデータは収束の観点でも長所を 有する。トレーニングのための同一の4つの溶媒の測定番号1、4、6および7 を使用するセンサアレイB、CおよびDでも同様の結果が得られた。例えば、図 4はアレイDで得られた正規化されたパターンから生成した標準化データを示す 。図4からは異なる溶媒に対応する各クラスターが測定番号1から7に対応する 7つの異なるパターンからなることは明確では無いものの、非常に緊密なデータ のクラスターが観察される。例2 例1で述べた正規化データを再度使用し、各センサアレイAからDについての そのパターンは4個のアレイ全てについての平均溶媒パターンに標準化されてい る。トレーニングのために、酢酸エチル、エタノール/水、プロパノールおよび トルエンの溶媒の測定番号1、4、6および7に対応する正規化データを選択し 、そうしてトレーニングステップからブタン測定を除外した。基準パターンは、 全ての測定番号および全てのアレイAからDについて平均化された、問題の溶媒 についての対応する平均パターンであった。 図5にアレイBの標準化の結果を示し、その基準の、平均パターンは白抜き記 号により図示される。これまで見られなかったブタノンデータについてさえも優 秀なクラスター化が示されている。アレイA、CおよびDの標準化においても非 常に類似したクラスター化が観察された。これらの結果は、異なるアレイの応答 特性中の相違により生じるパターン変動は、平均アレイパターンへの標準化によ り実質的に除去することができることを示す。これは、問題のアレイが異なるS OPの組み合わせからなる場合でさえ達成可能である。例3 例1に述べた正規化データを使用した。この例では、アレイA、BおよびDで 行った測定に対応するデータをアレイCの応答へ標準化した。この変換は、異な るアレイが異なるSOPの組み合わせを有し、それゆえ図6に示されるように、 アレイAおよびCのオリジナルデータを示す異なる固有応答を所有する場合でさ えも達成された。 アレイA、BおよびDについての酢酸エチル、エタノール/水、プロパノール およびトルエンの測定番号1、3、5および6に対応する未処理の非正規化デー タをトレーニングデータとして使用し、アレイCの対応データを基準パターンと して使用した。トレーニング後、アレイA、BおよびDの全てのパターンをアレ イCの応答へ標準化した。アレイDについての結果を図7に示す。アレイAおよ びBからのデータでも同質の結果が得られた。図7は、過去にトレーニング中に ネットワークへ示されていない溶媒についてさえ、1つのセンサアレイからのデ ータを別の、物理的に別個のアレイの対応データ上またはその非常に近傍にマッ ピングできることを示している。例4 センサアレイを使用し、ある時間にわたる一連の測定の標準化を行った。SO Pベースの32個のセンサを使用し、55日の期間にわたり酢酸ブチル蒸気およ び酢酸エチル蒸気の17回の測定を行い、各々の測定は3または4回繰り返した 。図8は未処理データのサモンマップを示し、大きな散乱の存在を示している。 番号はデータの測定番号を示す。散乱は、湿度、温度および動作誤差などの毎日 の条件変動に起因し、それら変動はランダムなものと考えられる。そのようなも のについて、従来の統計的手法はそれらランダムな変動を修正するために適当で はない。加えて、SOPセンサの基礎抵抗値は時間の関数として増加し、この基 礎抵抗値の変動は、−おそらく系統的な−時間の関数としてのセンサ応答の変動 につながる。 トレーニングは、酢酸ブチルの最初の9回の測定および酢酸エチルの最初の7 回の測定からの未処理データをトレーニングパターンとして使用して実行した。 最初の測定日に取得した対応するデータを基準パターンとして使用した。残りの データセット(酢酸ブチルの8回の測定、酢酸エチルの10回の測定)を標準化 し、酢酸ブチルについての結果を、かなり散乱した非標準化データとともに図9 に示す。非標準化パターン(黒塗り円)および基準パターン(白抜き円)に、mm ddのフォーマットで測定日を付した。実際、基準パターンはほとんど完全に標準 化したパターンに重なり、この方法の非常に高い精度と再現性を示している。例5 あるガス状の試料はアレイ内のセンサから非常に類似した応答を生じる。本例 では、3つの異なるアップルの芳香がアレイ内の32個の全てのセンサ中で約3 %の応答を生成した。(3%の応答は、センサの基礎直流抵抗値の3%の変化に 対応する。)従って、各パターン内の分散は非常に小さく、その結果異なるアッ プル試料に対応するパターンは相互に非常に類似している。 しかし、全てのセンサ応答から一定のオフセットを減算することにより、各パ ターンの分散およびそれによってパターン間の差が拡大される。よって、さらな る処理の前に、各センサ応答から、最小パターン応答値の80%に対応する一定 のオフセットを減算した。トレーニングは、ストロベリー、2つのアップル(「 アップル1」および「アップル2」)、酢酸エチル、エタノール水およびライム の芳香の測定からの未処理データをトレーニングパターンとして使用して実行し た。5日間にわたり測定を行い、毎日、芳香毎に4回の反復測定を実行した。基 準パターンは、ストロベリー、酢酸エチルおよびライムについての5日間全てに 渡る平均パターンであり、平均パターンはそれぞれアップル1およびアップル2 についての4日目および5日目からのものである。第3のアップルの芳香(「ア ップル3」)はニューラルネットワークへ与えなかった。平均誤差が約0.5% になるまでニューラルネットワークをトレーニングし、その後データベース全体 を標準化した。 図10(a)および(b)は、標準化前後のストロベリー、ライムおよび3つ のアップルの芳香のサモンマップを示す。標準化されていないクラスターはかな り散乱しており、ネットワークが未知であるアップル3についてさえ、標準化の 効果はクラスター化を非常に緊密にしている。図10には示していないが、酢酸 エチルおよびエタノール水についても同様の結果が観察された。標準化を行わな いと、2日間のストロベリーデータはアップル1に非常に近く、もう1日のスト ロベリーデータはライムに近いことがわかった。標準化後は、これらのデータは 別個のストロベリークラスターになった。 非標準化データの全体の分類精度は87.2%に過ぎず、標準化後にはこの数 字は96.7%に改善された。ストロベリーデータでは、78%の非標準化デー タ分類精度が得られ、標準化データでは100%の精度が得られた。3つのアッ プル芳香については、標準化を行うと分類精度は88.0%から95.4%に増 加した。 センサ応答から減算される一定値は異なる方法で計算可能であることを注意し ておく。よって、例えば上記の手順は、(i)パターンにわたる平均センサ応答 、および(ii)この平均センサ応答の50%の各センサ応答から減算することに より繰り返される。パターン中の最小応答の80%を減算するアプローチと比較 すると、これらのアプローチを使用する大きな差異は認められなかった。後者の アプローチは、残りの応答は常に正であるので便利である。 トレーニングおよび標準化段階において、入力パターンに加えてさらなる情報 をニューラルネットワークへ入力することが望ましいことがわかっている。この 付加的な情報は、湿度、温度、センサの年齢またはセンサに基づく抵抗値、もし くはそれらの組み合わせに関するものとすることができる。標準化は未処理入力 パターンのものである必要はない。むしろ、変換データの標準化を実行する前に パターンを2次元または3次元空間へ減少させることが望ましい。 別の観点では、本発明は、入力パターンを少ない次元の空間に減少させる修正 されたデータマッピングアルゴリズムに向けられている。本発明が提供する修正 は、マッピングプロセスと協力してパターン標準化プロセスを実行することを可 能とする。その方法は2つの段階を有する:標準化手段をトレーニングして標準 化を実行する段階と、次ぎに「未処理」入力データをマッピングおよび標準化す る段階である。 トレーニングは、 減少した次元、好ましくは1次元から5次元の空間上に複数の基準パターンを マッピングする工程と、 前記標準化手段に複数のトレーニングパターンを入力する工程であって、各ト レーニングパターンは基準パターンに対応した種類である工程と、および前記ト レーニングパターンを、減少した基準パターンと同一次元数の減少した次元数の 空間でマッピングする工程と、および 減少した次元数のトレーニングパターン上へ標準化変換を実行して、実質的に 前記トレーニングパターンを減少した次元数の基準パターンにマッピングする工 程と、を含む。 入力パターンは、マッピングされた基準パターンとの次元数と同一の減少した 次元数の空間上にマッピングされ、そうして減少した入力パターンに標準化変換 を適用して減少した次元数の標準化パターンを作成する。 減少した次元数の空間へのマッピングは、線形マッピングアルゴリズムを使用 して達成することができ、そのアルゴリズムは主要成分分析(PCA)アルゴリ ズムまたはその変形とすることができる。しかし、非線形アルゴリズムの使用も 本発明の視野の範囲内であることを注記しておく。 標準化変換は、以下に詳細に説明するように、複合線形回帰アルゴリズムによ り実行することができる。 代わりに、標準化変換は、複合非線形回帰アルゴリズム、または制限数学的変 換により実行することができる。前者の長所は、有効なマッピングのために必要 な校正物質量が増加するものの、データ中に存在するあらゆる非線形性により適 合可能であることである。「制限数学的変換」は、回転、または可能であれば関 数の組み合わせなどの比較的単純な数学的関数を含むと理解される。他の可能性 は、この目的のためにニューラルネットワークを使用することである。 入力パターンおよびトレーニングパターンは、ガスセンサアレイの応答または それに関連する量を含むことができる。応答は減少した次元数の空間へのマッピ ングの前に正規化することができる。そのようなガスセンサアレイ−それは典型 的に少なくとも20の個別ガスセンサ要素を含む−の応答のマッピングおよび標 準化は、本発明の主要な目的と考えられる。しかし、本発明の視野は、一般的に 入力パターンの標準化を包含する。 基準パターンは、多数の異なるガスに対する少なくとも1つのガスセンサの基 準アレイの応答を含む。言い換えれば、ガスセンサアレイの応答は物理的に異な る、基準アレイに対して標準化できる。この手順は、製造条件の変動により生じ るアレイ間の応答変動をかなり除去する。修正PCAアルゴリズムを使用するガスセンサアレイ応答の標準化 1.アルゴリズムの概要 a)基準パターンを提供する1組の校正物質を使用する基準PCAマップの生成 。校正物質の数は装置の空間に及ぶのに十分である。 b)基準マップPCAローディングベクトルを使用する基準マップに共通な未処 理トレーニングデータ(N個の校正物質の)予想。 c)複合線形回帰を使用して、トレーニングパターンのPCAスコアの、対応す る基準パターンのPCAスコアへのマッピングを最適化すること。この標準化変 換は、オリジナル基準マップ中のPCAスコアに及ぶのに十分な次元数(P)の 減少したPCAスペース内で生じる。 事実上、可能な最も単純な方法で、標準化変換はトレーニングデータを「歪ま せ」、それをオリジナル基準PCAマップと一致させる。その歪みはP次元空間 での回転、せん断および伸張を含む。 d)基準マップPCAベクトルを使用する未知の非校正物質データの未処理入力 パターンの予想、それに続く標準化変換を使用する変換。 一般的に、複合線形回帰変換は、定義によりPx(P+1)の自由度を有する Px(P+1)行列である。N個のトレーニングパターンを作るN個の校正物資 を使用するならば、NP個の情報が生成される。一般的な線形マッピングの場合 : Pは好ましくは2から4の間であり(基準PCAマップの性質に依存する)、 よってNminは3から5の間である。これはガスセンサアレイ装置を通るために 、許容可能な校正物質種数である。変換行列間に付加的な制約が存在するように 応答のドリフトが生じるならば、この数を更に減少させることができる。 2. トレーニングパターンおよび入力パターンのマッピング 2.1 基準パターンの処理 a) i番目の基準パターンのj番目の測定値としてDij Rを規定す る。 iは1からNまで変化し、ここでNは基準パターン数である。jは1から32ま で変化し、それは本例ではアレイ中のセンサ数に対応する。 b) Dij Rを正規化する−このステップは任意的であり、ユーザが 規定する正規化により置き換えることができる。 i)平均減算 Dij R=Dij R-(Σ(j)Dij R/32) ii)平均減算行値のrms(各行は異なる基準パターンに対応する) を計算: rmsi=(Σ(j)Dij R2/32)0.5 iii)平均減算Dij Rの各値をその行についてのrmsにより除算: Dij R=Dij R/rmsi c)中央列(i個の基準パターンにわたる所定のセンサ値に対応する 列): Dij R=Dij R−(Σ(i)Dij R/N) d)PCAを実行する。 2.2 トレーニングパターンおよび入力パターンの処理 a) 基準データの「マスター」PCAマップを形成する。そのマッ プは、PCA「スコア」(パターンのPCA座標値)、列平均およびローディン グベクトル(主要成分に対応する固有ベクトル)を含む。 b) トレーニングパターンDij Tを以下のように処理する: i)セクション2.1(b)のように、平均減算およびrmsによる除 算で新しいDij Rを生成する。 ii)各Dij Tからマスターマップ列平均を減算する(セクション2 .1(c)と等価)。 c)各行と、各PCAベクトルkについて正規化されたマスターマッ プローディングベクトル(r’jk)との内積を形成することにより、マスターマ ップを通じてDij T(各々がトレーニングパターンに対応)を再生し、それによ りトレーニングパターンスコアを生成する: Nik=Σ(j)Dij T・r'jk ここで、Nikは新しいスコア(パターンi、PCA成分k)であり、jは1から 32まで変化し、r’jkはk番目のPCA成分ローディングベクトルのj番目の 成分を示す。 2組のスコアーマスターマップから、およびマスターマップを通じた「再生」 トレーニングデータから−がP個のPCA成分で生成され、ここでPはPCA伸 張を断ち切ることにより設定される。 d)標準化変換−地理的マッピング−は、新しいトレーニングスコア NjkのマスタースコアLik(kは1からPまで変化)上への複合線形回帰により 決定される。 e)ステップ2.2a−cを使用して−可能な未知の−入力パターン についてのスコアを決定し、次に標準化変換をスコアに適用して標準化およびマ ッピングされたスコアを決定する。 3. 結果 32個のセンサガス感知アレイを使用して2つの異なる日にデータを取得した 。7つの液体、すなわち、エタノール、1−プロパノール、1−ブタノール、ト ルエン、2−プロパノール、1−ペンタノールおよびエチルベンゼンからの蒸気 を使用した。試料を分子ふるいで乾燥させ、乾性窒素を与えた。各々の日に各蒸 気の3回の測定を行った。 a) 初日のデータ全て(21回の測定の総計)を基準パターンとして使用した 。次元数Pを4に設定した。2日目に取得したデータを初日のデータに対して標 準化した。その結果を図11に示し、それは2つの最大主要成分を使用した2次 元プロットである。図11から16の全てにおいて、黒塗り円は初日のデータを 示し、クロスは標準化していない2日目のデータを示し、白抜き円は標準化した 2日目のデータを示す。図11は、「未処理」応答データには日毎の変化がかな り存在し、それは事実上は標準化アルゴリズムにより除去されることを示してい る。 b) マッピングおよび標準化変換は、P=3で行った。図12から16は標準 化変換を規定するために使用される基準パターンおよびトレーニングパターン数 の変化の結果を示す。図12では、校正物質としてただ1つの蒸気を使用し、反 復的測定のために3つの基準およびトレーニングパターンを提供している。よっ て、他の6つの蒸気は「未知のもの」である。図13は基準およびトレーニング パターンに2つの校正物質を使用した(5つは未知のもの)結果を示す。同様に 、図14は4つの校正物質を使用した(3つは未知のもの)結果を示し、図15 は校正物質として7つの蒸気全てを使用した結果を示す。図16は図14に示す 3つの未知のもののマッピングのみを示す。プロットは2次元であり、ここでも 2つの最大主要成分に対応する。 図12から16は、予想されたように、校正物質数が増加すると標準化の質が 向上することを示す。特に、変動の修正は4以上の校正物質について良好であり 、P=3の時にNmin=4であるので、これは予想できたことであった。4つ未 満の校正物質を使用すると、回帰行列を飽和させるために情報が不十分であり、 標準化適合の質が低下する。 上記の方法について多くの変形が存在する。例えば、トレーニングパターンは 多くの反復的サンプリングからの平均基準パターン上にマッピングすることがで き、その手順はデータのマッピングをさらに「緊密にする」であろう。 上述の標準化ルーチンは多数要素ガス感知装置の分野に数々の大きな利益を与 える。測定間のばらつき、および所定のガスセンサアレイの応答へのセンサの老 化の影響を除去または相当に減少させる能力は、より信頼性の高いパターン認識 を可能とし、装置の再校正の必要性を減少させる。異なるアレイ−異なる物理的 組成のものでさえ−の応答を標準化する能力は、応答の装置に依存する「普遍的 な」指紋パターンを生成させる。これらの装置に依存する指紋は、トレーニング に使用される基準パターンにより決定される。そうして、基準パターンの生成に 単一の基準アレイを使用することの大きな長所が生じる。なぜなら、これは製造 条件の変動により生じるアレイ応答の変動を除去することによりアレイの標準化 を可能とするからである。基準パターンは、指定された「基準アレイ」、または 複数のアレイから取得し、もしくは「仮想的な」アレイによりソフトウェアで生 成可能である。 表1 ブタノン(BT);酢酸エチル(EA);エタノール水(EW);プロパ ノール(PR)およびトルエン(TO)の溶媒について、体積濃度%
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),OA(BF,BJ,CF ,CG,CI,CM,GA,GN,ML,MR,NE, SN,TD,TG),AP(GH,KE,LS,MW,S D,SZ,UG,ZW),EA(AM,AZ,BY,KG ,KZ,MD,RU,TJ,TM),AL,AM,AT ,AU,AZ,BA,BB,BG,BR,BY,CA, CH,CN,CU,CZ,DE,DK,EE,ES,F I,GB,GE,GH,HU,IL,IS,JP,KE ,KG,KP,KR,KZ,LC,LK,LR,LS, LT,LU,LV,MD,MG,MK,MN,MW,M X,NO,NZ,PL,PT,RO,RU,SD,SE ,SG,SI,SK,SL,TJ,TM,TR,TT, UA,UG,US,UZ,VN,YU,ZW (72)発明者 ウエルズ ポール ジェー イギリス国 ケンブリッジシャー ピーイ ー18 6エーピー ハンティングドン ザ ウォークス イースト 7

Claims (1)

  1. 【特許請求の範囲】 1.入力パターンを標準化する方法において、 標準化手段をトレーニングして前記標準化を行う工程と、 前記標準化手段に入力パターンを入力する工程と、 前記標準化手段から標準化パターンを出力する工程と、を有する方法。 2.前記標準化手段はニューラルネットワークを含む請求項1に記載の方法。 3.前記トレーニングは、ニューラルネットワークへトレーニングパターンを入 力する工程と、出力パターンを基準パターンとする工程と、を有する請求項2に 記載の方法。 4.前記トレーニングは、 複数の基準パターンを、好ましくは1次元から5次元の間の減少した次元数の 空間にマッピングする工程と、 複数のトレーニングパターンを前記標準化手段に入力する工程であって、各ト レーニングパターンは基準パターンに対応する種類である工程と、 前記トレーニングパターンを、前記減少した基準パターンの次元数と等しい減 少した次元数の空間にマッピングする工程と、及び 減少した次元のトレーニングパターンへの標準化変換を行い、前記トレーニン グパターンを実質的に前記減少した次元数の基準パターン上にマッピングする工 程と、を有する請求項1に記載の方法。 5.入力パターンは、マッピングされた基準パターンの次元数と等しい減少した 次元数の空間にマッピングされ、標準化変換は減少した入力パターンに適用され て減少した次元数の標準化パターンを作成する請求項4に記載の方法。 6.減少した次元数の空間へマッピングする工程は、線形マッピングアルゴリズ ムにより達成される請求項4または5に記載の方法。 7.前記線形マッピングアルゴリズムは、主要成分分析アルゴリズムまたはその 変形である請求項6に記載の方法。 8.前記トレーニングは、 各トレーニングパターンベクトルまたはそれに関連するベクトルと各基準パタ ーン主要成分の固有ベクトルとの内積を計算することにより、トレーニングパタ ーンPCAスコアを生成する工程と、および 標準化変換を実行して、トレーニングパターンPCAスコアを対応する基準パ ターンPCAスコア上にマッピングする工程と、を有する請求項7に記載の方法 。 9.入力パターンPCAスコアは、各入力パターンベクトルまたはそれに関連す るベクトルと、各基準パターン主要成分の固有ベクトルとの内積を計算すること により生成され、前記標準化変換は前記入力パターンPCAスコアに適用される 請求項8に記載の方法。 10.前記標準化変換は、複合線形回帰アルゴリズムを使用して実行される請求 項4乃至9のいずれかに記載の方法。 11.標準化変換は、複合非線形回帰アルゴリズム、制限数学的変換またはニュ ーラルネットワークを使用して実行される請求項4乃至9のいずれかに記載の方 法。 12.前記入力パターンおよび前記トレーニングパターンは、ガスセンサアレイ の応答またはそれに関連する量を含む請求項1乃至11のいずれかに記載の方法 。 13.前記応答は正規化される請求項12に記載の方法。 14.アレイ内のガスセンサの数は21以上である請求項12または13に記載 の方法。 15.基準パターンは、複数の異なるガスに対する少なくとも1つのガスセンサ アレイの応答を含む請求項12乃至14のいずれかに記載の方法。 16.ガスセンサの応答から一定のオフセットが減算される請求項12乃至15 のいずれかに記載の方法。 17.温度、湿度、センサの年齢、およびセンサの基礎抵抗値を含むグループの 1以上の要素に関連する量がニューラルネットワークへ入力される、請求項2、 3または11に従属する場合の請求項12乃至16のいずれかに記載の方法。 18.請求項1乃至17のいずれかに記載の方法を実行するための標準化手段。 19.コンピュータを含む請求項18に記載の標準化手段。 20.入力パターンが入力される複数の入力ノードと、標準化パターンが出力さ れる複数の出力ノードと、を有するパターン標準化ニューラルネットワークを含 み、前記ニューラルネットワークは標準化を行うように事前にトレーニングされ る請求項19に記載の装置。
JP10504915A 1996-07-05 1997-07-03 マッピングの組み合わせを伴うパターン認識 Pending JP2000514224A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GBGB9614192.4A GB9614192D0 (en) 1996-07-05 1996-07-05 Neural network
GB9614192.4 1996-08-28
GBGB9617913.0A GB9617913D0 (en) 1996-08-28 1996-08-28 Pattern standardisation
GB9617913.0 1996-08-28
PCT/GB1997/001794 WO1998001819A1 (en) 1996-07-05 1997-07-03 Pattern recognition with combination of mappings

Publications (1)

Publication Number Publication Date
JP2000514224A true JP2000514224A (ja) 2000-10-24

Family

ID=26309647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10504915A Pending JP2000514224A (ja) 1996-07-05 1997-07-03 マッピングの組み合わせを伴うパターン認識

Country Status (6)

Country Link
EP (1) EP0909426B1 (ja)
JP (1) JP2000514224A (ja)
AT (1) ATE199600T1 (ja)
AU (1) AU3353697A (ja)
DE (1) DE69704201T2 (ja)
WO (1) WO1998001819A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004528123A (ja) * 2001-05-31 2004-09-16 イシス・イノベイション・リミテッド 患者の状態表示
JP6725928B1 (ja) * 2020-02-13 2020-07-22 東洋インキScホールディングス株式会社 回帰モデル作成方法、回帰モデル作成装置、及び、回帰モデル作成プログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6959248B2 (en) 2001-10-25 2005-10-25 The Regents Of The University Of California Real-time detection method and system for identifying individual aerosol particles
DE102007036277A1 (de) 2007-07-31 2009-02-05 Technische Universität Berlin Verfahren und Vorrichtung zur automatischen Mustererkennung

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004528123A (ja) * 2001-05-31 2004-09-16 イシス・イノベイション・リミテッド 患者の状態表示
JP6725928B1 (ja) * 2020-02-13 2020-07-22 東洋インキScホールディングス株式会社 回帰モデル作成方法、回帰モデル作成装置、及び、回帰モデル作成プログラム
WO2021162033A1 (ja) * 2020-02-13 2021-08-19 東洋インキScホールディングス株式会社 回帰モデル作成方法、回帰モデル作成装置、及び、回帰モデル作成プログラム
JP2021128042A (ja) * 2020-02-13 2021-09-02 東洋インキScホールディングス株式会社 回帰モデル作成方法、回帰モデル作成装置、及び、回帰モデル作成プログラム

Also Published As

Publication number Publication date
DE69704201T2 (de) 2001-10-11
WO1998001819A1 (en) 1998-01-15
ATE199600T1 (de) 2001-03-15
DE69704201D1 (de) 2001-04-12
EP0909426B1 (en) 2001-03-07
AU3353697A (en) 1998-02-02
EP0909426A1 (en) 1999-04-21

Similar Documents

Publication Publication Date Title
Gardner et al. Detection of vapours and odours from a multisensor array using pattern-recognition techniques Part 2. Artificial neural networks
Singh et al. Fuzzy neural computing of coffee and tainted-water data from an electronic nose
Gutierrez-Osuna Pattern analysis for machine olfaction: A review
Banerjee et al. Black tea classification employing feature fusion of E-Nose and E-Tongue responses
Llobet et al. Fuzzy ARTMAP based electronic nose data analysis
Daszykowski et al. Looking for natural patterns in data: Part 1. Density-based approach
Berrueta et al. Supervised pattern recognition in food analysis
Bhattacharya et al. Preemptive identification of optimum fermentation time for black tea using electronic nose
EP0811198A1 (en) Neural networks
Getino et al. Analysis of VOCs with a tin oxide sensor array
US11906533B2 (en) Chemical sensing system
CN113740381A (zh) 一种基于流形学习的跨域子空间学习电子鼻漂移补偿方法
Niebling Identification of gases with classical pattern-recognition methods and artificial neural networks
CN113030197A (zh) 一种气体传感器漂移补偿方法
Wen et al. Rapid odor recognition based on reliefF algorithm using electronic nose and its application in fruit identification and classification
JP2000514224A (ja) マッピングの組み合わせを伴うパターン認識
Teppola et al. A combined approach of partial least squares and fuzzy c-means clustering for the monitoring of an activated-sludge waste-water treatment plant
CN116933084A (zh) 一种污染物排放的预测方法和装置
Goodacre et al. Plant seed classification using pyrolysis mass spectrometry with unsupervised learning: the application of auto-associative and Kohonen artificial neural networks
CN111125629A (zh) 一种域自适应的pls回归模型建模方法
US20020059151A1 (en) Data analysis
CN113804833A (zh) 基于凸集投影和极限学习机的电子鼻漂移通用校准方法
Saikia et al. A computational model for optimum process parameters based on factory data and overall liquor rating of black tea
Delpha et al. An electronic nose for the discrimination of forane 134a and carbon dioxide in a humidity controlled atmosphere
Bicego Odor classification using similarity-based representation