JP2012528327A - 大量の分光データにおける相関変数を識別するためのシステムおよび方法 - Google Patents
大量の分光データにおける相関変数を識別するためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2012528327A JP2012528327A JP2012513029A JP2012513029A JP2012528327A JP 2012528327 A JP2012528327 A JP 2012528327A JP 2012513029 A JP2012513029 A JP 2012513029A JP 2012513029 A JP2012513029 A JP 2012513029A JP 2012528327 A JP2012528327 A JP 2012528327A
- Authority
- JP
- Japan
- Prior art keywords
- group
- subset
- variables
- principal component
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 93
- 238000004611 spectroscopical analysis Methods 0.000 title claims description 10
- 238000000513 principal component analysis Methods 0.000 claims abstract description 90
- 230000002596 correlated effect Effects 0.000 claims abstract description 16
- 239000013598 vector Substances 0.000 claims description 64
- 238000004949 mass spectrometry Methods 0.000 claims description 38
- 238000012545 processing Methods 0.000 claims description 19
- 238000004811 liquid chromatography Methods 0.000 claims description 12
- 238000005259 measurement Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 8
- 238000012306 spectroscopic technique Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 3
- 230000009191 jumping Effects 0.000 claims 1
- 238000005192 partition Methods 0.000 claims 1
- 230000003595 spectral effect Effects 0.000 abstract description 12
- 239000000523 sample Substances 0.000 description 30
- 238000001228 spectrum Methods 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 11
- 150000001875 compounds Chemical class 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 9
- 238000012880 independent component analysis Methods 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000000691 measurement method Methods 0.000 description 6
- 238000005481 NMR spectroscopy Methods 0.000 description 5
- 238000000491 multivariate analysis Methods 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000000870 ultraviolet spectroscopy Methods 0.000 description 4
- 238000004566 IR spectroscopy Methods 0.000 description 3
- 238000004497 NIR spectroscopy Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 238000005251 capillar electrophoresis Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004817 gas chromatography Methods 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000000816 matrix-assisted laser desorption--ionisation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000001069 Raman spectroscopy Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000738 capillary electrophoresis-mass spectrometry Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013375 chromatographic separation Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000012468 concentrated sample Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000000186 gas chromatography-infrared spectroscopy Methods 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 238000001906 matrix-assisted laser desorption--ionisation mass spectrometry Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000012732 spatial analysis Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000004808 supercritical fluid chromatography Methods 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000005139 ultra-violet Raman spectroscopy Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
- H01J49/0036—Step by step routines describing the handling of the data generated during a measurement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
Abstract
Description
本願は、米国特許出願第12/200,636号(2008年8月28日出願、「636出願」と呼ぶ)の一部継続出願である。「636出願」は、米国特許出願第11/848,717号(2007年8月31日出願、「717出願」と呼ぶ)の一部継続出願である。「636出願」は、米国仮特許出願第61/057,719号(2008年5月30日出願、「719出願」と呼ぶ)の利益も主張する。上記すべての出願は、それらの全体が参照により本明細書に引用される。
図1は、本教示の実施形態が実装され得るコンピュータシステム100を示す、ブロック図である。コンピュータシステム100は、情報を通信するためのバス102または他の通信機構と、情報を処理するための、バス102と連結されるプロセッサ104とを含む。コンピュータシステム100はまた、ベースコールを決定するための、バス102に連結されるランダムアクセスメモリ(RAM)または他の動的記憶デバイスであり得る、メモリ106と、プロセッサ104によって実行される命令とを含む。メモリ106はまた、プロセッサ104によって実行される命令の実行中に一時的な変数または他の中間情報を記憶するために使用され得る。コンピュータシステム100はさらに、プロセッサ104に対する静的情報および命令を記憶するための、バス102に連結されるリードオンリメモリ(ROM)108または他の静的記憶デバイスを含む。情報および命令を記憶するために、磁気ディスクまたは光ディスク等の記憶デバイス110が提供され、バス102に連結される。
主成分分析(PCA)は、データを視覚化および分類することを補助するために幅広く使用される、多変量解析(MVA)ツールである。PCAは、多次元データセットの次元性を低減すると同時に、その分散に最も寄与するデータセットの特徴を保持するために使用され得る、統計技術である。このため、PCAはしばしば、線形判別分析(LDA)等、高次元データを上手く処理しない技術に対して、データを前処理するために使用される。
(主成分変数グループ化)
種々の実施形態において、相関変数のグループは、主成分分析(PCA)、続いて、変数グループ化を使用して識別される。PCA、続く、変数グループ化は、主成分変数グループ化(PCVG)と呼ぶことができる。
1.パレートスケーリングを使用して、全ての変数に対してPCAを実施する。
2.使用されるPCの数(m)を決定する。抽出されるPCの全てnの使用は、元のデータを正確に再生する。しかしながら、これらのPCの多くは、データ中のノイズの揺らぎを表し、情報を失わずに無視することができる。m個のPCの選択は、データを効果的に平滑化する。各変数は、このm次元空間中のベクトルによって表される。
3.原点から最も遠い変数に対応する目標ベクトル(t)を決定する。これを有効にするために、自動スケーリングは使用しない。自動スケーリングは、小さいノイズピークを含む全ての変数に均等に重み付けするため、望ましくない。
4.このベクトルの周囲の空間角度(α)を定義し、その角度内にある他のデータ点(ベクトル)を発見し、随意に、低強度の変数を無視する。第2のベクトルがxである場合、xと目標ベクトルとの間の角度(θ)は、
x.t=|x||t|cos(θ)
から発見することができる。
5.全ての選択されたベクトルの平均を計算し、新しい平均ベクトルを使用してステップ3を繰り返し、全ての選択された変数をグループに割り当てる。このようにして、「再センタリング」は、空間角度の配向を微調整し、最も強度の高い変数が何らかの形で非典型的である場合、有効であり得る。例えば、ピークが最も集中したサンプル中で飽和した場合、プロファイルは、歪められ得る。パレートスケーリングが使用されてきたため、平均ベクトルを計算することも、より低い強度のイオンが結果に与える影響を少なくする。
6.十分な強度を有する変数が残らなくなるまで、すでにグループ化された変数を無視して、ステップ3からのプロセスを繰り返す。
上記のように、大量のデータを生成する質量分析の能力は、多くのデータ処理技術に対して重大な問題をもたらす。具体的に、多数のサンプルを有する質量分析(MS)データ、液体クロマトグラフィ連結質量分析(LC−MS)データ、および画像MSデータの高次元性(多数の変数)は、これらの技術にとって問題となり得る。
図6は、本教示に従った、変数グループ化を実施するための、ソフトウェアツールのためのユーザインターフェース600の例示的な画像である。ユーザインターフェース600およびソフトウェアツールは、既存の表示プログラムと一緒に使用することができる。1つの既存の表示プログラムは、例えば、Applied Biosystems/MDS Sciex からのMARKERVIEWTMである。
本教示の種々の実施形態において、関連変数を決定するために、PCローディングを分析するための方法を記載する。例えば、一連のサンプルから同様の表現パターンを示す方法である。これらの方法は、質量分析(MS)データを使用して示される。しかしながら、これらの方法は、他の用途にも適用可能である。
Claims (20)
- 大量の分光データから変数の相関表示のグループを識別するためのシステムであって、
複数のサンプルを分析し、前記複数のサンプルから複数の変数を生成する分光計と、
前記分光計と通信しているプロセッサと
を備え、
(a)前記プロセッサは、前記分光計から複数の測定された変数を取得し、
(b)前記プロセッサは、前記複数の測定された変数を複数の測定された変数のサブセットに分割し、
(c)前記プロセッサは、各測定された変数のサブセットに対して主成分分析、および続く変数グループ化を実施し、各測定された変数のサブセットに対する1つ以上のグループ表示、および前記複数の測定された変数のサブセットに対する複数のグループ表示を生成し、
(d)前記プロセッサは、各測定された変数のサブセットに対して生成される1つ以上のグループ表示の数の合計として、前記複数のグループ表示の総数を計算し、
(e)前記総数が主成分分析、および続く変数グループ化に対して許容可能な変数の最大数以下である場合、前記プロセッサは、ステップ(k)にジャンプし、
(f)前記プロセッサは、前記複数のグループ表示を複数のグループ表示のサブセットに分割し、
(g)前記プロセッサは、各グループ表示のサブセットに対して主成分分析、および続く変数グループ化を実施し、各グループ表示のサブセットに対する1つ以上のグループ表示、および前記複数のグループ表示のサブセットに対する複数のグループ表示を生成し、
(h)前記プロセッサは、各グループ表示のサブセットに対して生成される1つ以上のグループ表示の数の合計として、前記複数のグループ表示の総数を計算し、
(i)前記総数が前記最大数以下である場合、前記プロセッサは、ステップ(k)にジャンプし、
(j)前記総数が変数の前記最大数よりも大きい場合、前記プロセッサは、ステップ(f)〜(j)を繰り返し、
(k)前記プロセッサは、前記複数のグループ表示に対して主成分分析、および続く変数グループ化を実施し、変数の相関表示の複数のグループを生成する、
システム。 - 前記プロセッサは、
(i)各測定された変数のサブセットに対して主成分分析を実施するステップと、
(ii)前記主成分分析によって生成されたいくつかの主成分を選択するステップと、
(iii)前記いくつかの主成分を有するサブセットの主成分空間を作成するステップと、
(iv)前記サブセットの主成分空間において、各測定された変数のサブセットの変数を選択するステップであって、前記変数は、閾値よりも大きい有意値を有する、ステップと、
(v)前記サブセットの主成分空間の原点から前記変数まで延在するベクトルの周囲の空間角度を定義するステップと、
(vi)前記ベクトルの空間角度内で1つ以上の変数のグループを選択するステップと、
(vii)前記グループが最小数の変数を含む場合、グループ表示を前記グループに割り当てるステップであって、変数の前記最小数は、グループが含むと予想される相関変数の最小数である、ステップと、
(viii)前記サブセットの主成分空間に、選択されていない変数、グループ表示が割り当てられているグループの一部を成していない変数、または前記閾値を超える有意値を有する変数が残らなくなるまで、ステップ(iv)〜(viii)を繰り返すステップと
によって、各測定された変数のサブセットに対して主成分分析、および続く変数グループ化を実施し、各測定された変数のサブセットに対する1つ以上のグループ表示、および前記複数の測定された変数のサブセットに対する複数のグループ表示を生成する、
請求項1に記載のシステム。 - 前記プロセッサは、
(i)各グループ表示のサブセットに対して主成分分析を実施するステップと、
(ii)前記主成分分析によって生成されたいくつかの主成分を選択するステップと、
(iii)前記いくつかの主成分を有するサブセットの主成分空間を作成するステップと、
(iv)前記サブセットの主成分空間において、各グループ表示のサブセットの表示を選択するステップであって、前記表示は、閾値よりも大きい有意値を有する、ステップと、
(v)前記サブセットの主成分空間の原点から前記表示まで延在するベクトルの周囲の空間角度を定義するステップと、
(vi)前記ベクトルの空間角度内で1つ以上の表示のグループを選択するステップと、
(vii)前記グループが最小数の表示を含む場合、グループ表示を前記グループに割り当てるステップであって、表示の前記最小数は、グループが含むと予想される相関表示の最小数である、ステップと、
(viii)前記サブセットの主成分空間に、選択されていない表示、グループ表示が割り当てられているグループの一部を成していない表示、または前記閾値を超える有意値を有する表示が残らなくなるまで、ステップ(iv)〜(viii)を繰り返すステップと
によって、各グループ表示のサブセットに対して主成分分析、および続く変数グループ化を実施し、各グループ表示のサブセットに対する1つ以上のグループ表示、および前記複数のグループ表示のサブセットに対する複数のグループ表示を生成する、
請求項1に記載のシステム。 - 前記プロセッサは、
(i)前記複数のグループ表示に対して主成分分析を実施するステップと、
(ii)前記主成分分析によって生成されたいくつかの主成分を選択するステップと、
(iii)前記いくつかの主成分を有するサブセットの主成分空間を作成するステップと、
(iv)前記サブセットの主成分空間において、前記複数のグループ表示の表示を選択するステップであって、前記表示は、閾値よりも大きい有意値を有する、ステップと、
(v)前記サブセットの主成分空間の原点から前記表示まで延在するベクトルの周囲の空間角度を定義するステップと、
(vi)前記ベクトルの空間角度内で1つ以上の表示のグループを選択するステップと、
(vii)前記グループが最小数の表示を含む場合、変数の相関表示のグループとして前記グループを識別するステップであって、表示の前記最小数は、グループが含むと予想される変数の相関表示の最小数である、ステップと、
(viii)前記サブセットの主成分空間に、選択されていない表示、グループ表示が割り当てられているグループの一部を成していない表示、または前記閾値を超える有意値を有する表示が残らなくなるまで、ステップ(iv)〜(viii)を繰り返すステップと
によって、前記複数のグループ表示に対して主成分分析、および続く変数グループ化を実施し、変数の相関表示の複数のグループを生成する、
請求項1に記載のシステム。 - 前記最大数は、前記プロセッサの処理能力に基づく、請求項1に記載のシステム。
- 前記最大数は、相関点が異なるサブセットに分割されないように必要とされるいくつかの点に基づく、請求項1に記載のシステム。
- 大量の分光データから相関変数の表示のグループを識別するための方法であって、
(a)分光計を使用して複数のサンプルを分析するステップと、
(b)前記分光計を使用して、前記複数のサンプルから複数の測定された変数を生成するステップと、
(c)プロセッサを使用して、前記分光計から前記複数の測定された変数を取得するステップと、
(d)前記プロセッサを使用して、前記複数の測定された変数を複数の測定された変数のサブセットに分割するステップと、
(c)前記プロセッサを使用して、各測定された変数のサブセットに対して主成分分析、および続く変数グループ化を実施し、各測定された変数のサブセットに対する1つ以上のグループ表示、および前記複数の測定された変数のサブセットに対する複数のグループ表示を生成するステップと、
(d)前記プロセッサを使用して、各測定された変数のサブセットに対して生成される1つ以上のグループ表示の数の合計として、前記複数のグループ表示の総数を計算するステップと、
(e)前記総数が主成分分析、および続く変数グループ化に対して許容可能な変数の最大数以下である場合、前記プロセッサを使用して、ステップ(k)にジャンプするステップと、
(f)前記プロセッサを使用して、前記複数のグループ表示を複数のグループ表示のサブセットに分割するステップと、
(g)前記プロセッサを使用して、各グループ表示のサブセットに対して主成分分析、および続く変数グループ化を実施し、各グループ表示のサブセットに対する1つ以上のグループ表示、および前記複数のグループ表示のサブセットに対する複数のグループ表示を生成するステップと、
(h)前記プロセッサを使用して、各グループ表示のサブセットに対して生成される1つ以上のグループ表示の数の合計として、前記複数のグループ表示の総数を計算するステップと、
(i)前記総数が前記最大数以下である場合、前記プロセッサを使用して、ステップ(k)にジャンプするステップと、
(j)前記総数が変数の前記最大数よりも大きい場合、前記プロセッサを使用して、ステップ(f)〜(j)を繰り返すステップと、
(k)前記プロセッサを使用して、前記複数のグループ表示に対して主成分分析、および続く変数グループ化を実施し、変数の相関表示の複数のグループを生成するステップと
を含む、方法。 - 前記プロセッサを使用して、各測定された変数のサブセットに対して主成分分析、および続く変数グループ化を実施し、各測定された変数のサブセットに対する1つ以上のグループ表示、および前記複数の測定された変数のサブセットに対する複数のグループ表示を生成するステップは、
(i)前記プロセッサを使用して、各測定された変数のサブセットに対して主成分分析を実施するステップと、
(ii)前記プロセッサを使用して、前記主成分分析によって生成されたいくつかの主成分を選択するステップと、
(iii)前記プロセッサを使用して、前記いくつかの主成分を有するサブセットの主成分空間を作成するステップと、
(iv)前記プロセッサを使用して、前記サブセットの主成分空間において、各測定された変数のサブセットの変数を選択するステップであって、前記変数は、閾値よりも大きい有意値を有する、ステップと、
(v)前記プロセッサを使用して、前記サブセットの主成分空間の原点から前記変数まで延在するベクトルの周囲の空間角度を定義するステップと、
(vi)前記プロセッサを使用して、前記ベクトルの空間角度内で1つ以上の変数のグループを選択するステップと、
(vii)前記プロセッサを使用して、前記グループが最小数の変数を含む場合、グループ表示を前記グループに割り当てるステップであって、変数の前記最小数は、グループが含むと予想される相関変数の最小数である、ステップと、
(viii)前記プロセッサを使用して、前記サブセットの主成分空間に、選択されていない変数、グループ表示が割り当てられているグループの一部を成していない変数、または前記閾値を超える有意値を有する変数が残らなくなるまで、ステップ(iv)〜(viii)を繰り返すステップと
を含む、請求項7に記載の方法。 - 前記プロセッサを使用して、各グループ表示のサブセットに対して主成分分析、および続く変数グループ化を実施し、各グループ表示のサブセットに対する1つ以上のグループ表示、および前記複数のグループ表示のサブセットに対する複数のグループ表示を生成するステップは、
(i)前記プロセッサを使用して、各グループ表示のサブセットに対して主成分分析を実施するステップと、
(ii)前記プロセッサを使用して、前記主成分分析によって生成されたいくつかの主成分を選択するステップと、
(iii)前記プロセッサを使用して、前記いくつかの主成分を有するサブセットの主成分空間を作成するステップと、
(iv)前記プロセッサを使用して、前記サブセットの主成分空間において、各グループ表示のサブセットの表示を選択するステップであって、前記表示は、閾値よりも大きい有意値を有する、ステップと、
(v)前記プロセッサを使用して、前記サブセットの主成分空間の原点から前記表示まで延在するベクトルの周囲の空間角度を定義するステップと、
(vi)前記プロセッサを使用して、前記ベクトルの空間角度内で1つ以上の表示のグループを選択するステップと、
(vii)前記プロセッサを使用して、前記グループが最小数の表示を含む場合、グループ表示を前記グループに割り当てるステップであって、表示の前記最小数は、グループが含むと予想される相関表示の最小数である、ステップと、
(viii)前記プロセッサを使用して、前記サブセットの主成分空間に、選択されていない表示、グループ表示が割り当てられているグループの一部を成していない表示、または前記閾値を超える有意値を有する表示が残らなくなるまで、ステップ(iv)〜(viii)を繰り返すステップと
を含む、請求項7に記載の方法。 - 前記プロセッサを使用して、前記複数のグループ表示に対して主成分分析、および続く変数グループ化を実施し、変数の相関表示の複数のグループを生成するステップは、
(i)前記プロセッサを使用して、前記複数のグループ表示に対して主成分分析を実施するステップと、
(ii)前記プロセッサを使用して、前記主成分分析によって生成されたいくつかの主成分を選択するステップと、
(iii)前記プロセッサを使用して、前記いくつかの主成分を有するサブセットの主成分空間を作成するステップと、
(iv)前記プロセッサを使用して、前記サブセットの主成分空間において、前記複数のグループ表示の表示を選択するステップであって、前記表示は、閾値よりも大きい有意値を有する、ステップと、
(v)前記プロセッサを使用して、前記サブセットの主成分空間の原点から前記表示まで延在するベクトルの周囲の空間角度を定義するステップと、
(vi)前記プロセッサを使用して、前記ベクトルの空間角度内で1つ以上の表示のグループを選択するステップと、
(vii)前記プロセッサを使用して、前記グループが最小数の表示を含む場合、変数の相関表示のグループとして前記グループを識別するステップであって、表示の前記最小数は、グループが含むと予想される変数の相関表示の最小数である、ステップと、
(viii)前記プロセッサを使用して、前記サブセットの主成分空間に、選択されていない表示、グループ表示が割り当てられているグループの一部を成していない表示、または前記閾値を超える有意値を有する表示が残らなくなるまで、ステップ(iv)〜(viii)を繰り返すステップと
を含む、請求項7に記載の方法。 - 前記複数のサンプルを分析するステップは、質量分析(MS)を実施するステップを含む、請求項7に記載の方法。
- 前記複数のサンプルを分析するステップは、液体クロマトグラフィ連結質量分析(LC−MS)を実施するステップを含む、請求項7に記載の方法。
- 前記複数のサンプルを分析するステップは、画像質量分析を実施するステップを含む、請求項7に記載の方法。
- そのコンテンツがプログラムを含む有形コンピュータ可読記憶媒体を含むコンピュータプログラム製品であって、前記プログラムは、大量のデータから変数の相関表示のグループを識別する方法を実施するために、プロセッサ上で実行される命令を有し、
前記方法は、
(a)システムを提供するステップであって、前記システムは、別個のソフトウェアモジュールを含み、前記別個のソフトウェアモジュールは、測定モジュール、分割モジュール、およびグループ化モジュールを含む、ステップと、
(b)分光測光技術によって生成される複数のサンプルから複数の測定された変数を取得するステップであって、前記取得するステップは、前記測定モジュールによって実施される、ステップと、
(c)前記分割モジュールを使用して、前記複数の測定された変数を複数の測定された変数のサブセットに分割するステップと、
(d)前記グループ化モジュールを使用して、各測定された変数のサブセットに対して主成分分析、および続く変数グループ化を実施し、各測定された変数のサブセットに対する1つ以上のグループ表示、および前記複数の測定された変数のサブセットに対する複数のグループ表示を生成するステップと、
(e)前記グループ化モジュールを使用して、各測定された変数のサブセットに対して生成される1つ以上のグループ表示の数の合計として、前記複数のグループ表示の総数を計算するステップと、
(f)前記総数が主成分分析、および続く変数グループ化に対して許容可能な変数の最大数以下である場合、前記グループ化モジュールを使用して、ステップ(l)にジャンプするステップと、
(g)前記グループ化モジュールを使用して、前記複数のグループ表示を複数のグループ表示のサブセットに分割するステップと、
(h)前記グループ化モジュールを使用して、各グループ表示のサブセットに対して主成分分析、および続く変数グループ化を実施し、各グループ表示のサブセットに対する1つ以上のグループ表示、および前記複数のグループ表示のサブセットに対する複数のグループ表示を生成するステップと、
(i)前記グループ化モジュールを使用して、各グループ表示のサブセットに対して生成される1つ以上のグループ表示の数の合計として、前記複数のグループ表示の前記総数を計算するステップと、
(j)前記総数が前記最大数以下である場合、前記グループ化モジュールを使用して、ステップ(l)にジャンプするステップと、
(k)前記総数が変数の前記最大数よりも大きい場合、前記グループ化モジュールを使用して、ステップ(g)〜(k)を繰り返すステップと、
(l)前記グループ化モジュールを使用して、前記複数のグループ表示に対して主成分分析、および続く変数グループ化を実施し、変数の相関表示の複数のグループを生成するステップと
を含む、コンピュータプログラム製品。 - 前記グループ化モジュールを使用して、各測定された変数のサブセットに対して主成分分析、および続く変数グループ化を実施し、各測定された変数のサブセットに対する1つ以上のグループ表示、および前記複数の測定された変数のサブセットに対する複数のグループ表示を生成するステップは、
(i)前記グループ化モジュールを使用して、各測定された変数のサブセットに対して主成分分析を実施するステップと、
(ii)前記グループ化モジュールを使用して、前記主成分分析によって生成されたいくつかの主成分を選択するステップと、
(iii)前記グループ化モジュールを使用して、前記いくつかの主成分を有するサブセットの主成分空間を作成するステップと、
(iv)前記グループ化モジュールを使用して、前記サブセットの主成分空間において、各測定された変数のサブセットの変数を選択するステップであって、前記変数は、閾値よりも大きい有意値を有する、ステップと、
(v)前記グループ化モジュールを使用して、前記サブセットの主成分空間の原点から前記変数まで延在するベクトルの周囲の空間角度を定義するステップと、
(vi)前記グループ化モジュールを使用して、前記ベクトルの空間角度内で1つ以上の変数のグループを選択するステップと、
(vii)前記グループ化モジュールを使用して、前記グループが最小数の変数を含む場合、グループ表示を前記グループに割り当てるステップであって、変数の前記最小数は、グループが含むと予想される相関変数の最小数である、ステップと、
(viii)前記グループ化モジュールを使用して、前記サブセットの主成分空間に、選択されていない変数、グループ表示が割り当てられているグループの一部を成していない変数、または前記閾値を超える有意値を有する変数が残らなくなるまで、ステップ(iv)〜(viii)を繰り返すステップと
を含む、請求項14に記載のコンピュータプログラム製品。 - 前記グループ化モジュールを使用して、各グループ表示のサブセットに対して主成分分析、および続く変数グループ化を実施し、各グループ表示のサブセットに対する1つ以上のグループ表示、および前記複数のグループ表示のサブセットに対する複数のグループ表示を生成するステップは、
(i)前記グループ化モジュールを使用して、各グループ表示のサブセットに対して主成分分析を実施するステップと、
(ii)前記グループ化モジュールを使用して、前記主成分分析によって生成されたいくつかの主成分を選択するステップと、
(iii)前記グループ化モジュールを使用して、前記いくつかの主成分を有するサブセットの主成分空間を作成するステップと、
(iv)前記グループ化モジュールを使用して、前記サブセットの主成分空間において、各グループ表示のサブセットの表示を選択するステップであって、前記表示は、閾値よりも大きい有意値を有する、ステップと、
(v)前記グループ化モジュールを使用して、前記サブセットの主成分空間の原点から前記表示まで延在するベクトルの周囲の空間角度を定義するステップと、
(vi)前記グループ化モジュールを使用して、前記ベクトルの空間角度内で1つ以上の表示のグループを選択するステップと、
(vii)前記グループ化モジュールを使用して、前記グループが最小数の表示を含む場合、グループ表示を前記グループに割り当てるステップであって、表示の前記最小数は、グループが含むと予想される相関表示の最小数である、ステップと、
(viii)前記グループ化モジュールを使用して、前記サブセットの主成分空間に、選択されていない表示、グループ表示が割り当てられているグループの一部を成していない表示、または前記閾値を超える有意値を有する表示が残らなくなるまで、ステップ(iv)〜(viii)を繰り返すステップと
を含む、請求項14に記載のコンピュータプログラム製品。 - 前記グループ化モジュールを使用して、前記複数のグループ表示に対して主成分分析、および続く変数グループ化を実施し、変数の相関表示の複数のグループを生成するステップは、
(i)前記グループ化モジュールを使用して、前記複数のグループ表示に対して主成分分析を実施するステップと、
(ii)前記グループ化モジュールを使用して、前記主成分分析によって生成されたいくつかの主成分を選択するステップと、
(iii)前記グループ化モジュールを使用して、前記いくつかの主成分を有するサブセットの主成分空間を作成するステップと、
(iv)前記グループ化モジュールを使用して、前記サブセットの主成分空間において、前記複数のグループ表示の表示を選択するステップであって、前記表示は、閾値よりも大きい有意値を有する、ステップと、
(v)前記グループ化モジュールを使用して、前記サブセットの主成分空間の原点から前記表示まで延在するベクトルの周囲の空間角度を定義するステップと、
(vi)前記グループ化モジュールを使用して、前記ベクトルの空間角度内で1つ以上の表示のグループを選択するステップと、
(vii)前記グループ化モジュールを使用して、前記グループが最小数の表示を含む場合、変数の相関表示のグループとして前記グループを識別するステップであって、表示の前記最小数は、グループが含むと予想される変数の相関表示の最小数である、ステップと、
(viii)前記グループ化モジュールを使用して、前記サブセットの主成分空間に、選択されていない表示、グループ表示が割り当てられているグループの一部を成していない表示、または前記閾値を超える有意値を有する表示が残らなくなるまで、ステップ(iv)〜(viii)を繰り返すステップと
を含む、請求項14に記載のコンピュータプログラム製品。 - 前記分光技術は、質量分析(MS)を含む、請求項14に記載のコンピュータプログラム製品。
- 前記分光技術は、液体クロマトグラフィ連結質量分析(LC−MS)を含む、請求項14に記載のコンピュータプログラム製品。
- 前記分光技術は、画像質量分析を含む、請求項14に記載のコンピュータプログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/474,418 | 2009-05-29 | ||
US12/474,418 US8180581B2 (en) | 2007-08-31 | 2009-05-29 | Systems and methods for identifying correlated variables in large amounts of data |
PCT/US2009/049828 WO2010138133A1 (en) | 2009-05-29 | 2009-07-07 | Systems and methods for identifying correlated variables in large amounts of spectrometry data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012528327A true JP2012528327A (ja) | 2012-11-12 |
JP5441199B2 JP5441199B2 (ja) | 2014-03-12 |
Family
ID=43222988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012513029A Active JP5441199B2 (ja) | 2009-05-29 | 2009-07-07 | 大量の分光データにおける相関変数を識別するためのシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8180581B2 (ja) |
EP (1) | EP2435165A4 (ja) |
JP (1) | JP5441199B2 (ja) |
CA (1) | CA2763991C (ja) |
WO (1) | WO2010138133A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015135318A (ja) * | 2013-12-17 | 2015-07-27 | キヤノン株式会社 | データ処理装置、データ表示システム、試料データ取得システム、及びデータ処理方法 |
JP2019200211A (ja) * | 2013-12-17 | 2019-11-21 | キヤノン株式会社 | データ処理装置、データ表示システム、試料データ取得システム、及びデータ処理方法 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8530828B2 (en) * | 2007-02-02 | 2013-09-10 | Dh Technologies Development Pte. Ltd. | Systems and methods for reducing noise from mass spectra |
KR101378939B1 (ko) * | 2009-10-12 | 2014-04-02 | 한국전자통신연구원 | 다차원 공간에서 스카이라인 객체가 되기 위한 최소 비용 벡터 획득 방법 및 장치 |
US8451273B2 (en) * | 2009-10-12 | 2013-05-28 | Electronics And Telecommunications Research Institute | Method and apparatus for obtaining minimum cost vector for making skyline object in multi-dimensional space |
EP2517136A4 (en) * | 2009-12-23 | 2017-03-22 | The Governors of the University of Alberta | Automated, objective and optimized feature selection in chemometric modeling (cluster resolution) |
JP5753272B2 (ja) * | 2010-11-16 | 2015-07-22 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | タップ出力の正規化を伴う非線形モデル |
FR3003034B1 (fr) | 2013-03-05 | 2017-09-08 | Polyor Sarl | Protocole pour la preconisation et le dosage de la fertilisation phospho-potassique et magnesique (pkmg) de cultures agronomiques |
US11868851B2 (en) * | 2015-03-11 | 2024-01-09 | Symphonyai Sensa Llc | Systems and methods for predicting outcomes using a prediction learning model |
US10558933B2 (en) | 2016-03-30 | 2020-02-11 | International Business Machines Corporation | Merging feature subsets using graphical representation |
CN107727602B (zh) * | 2017-10-09 | 2020-04-07 | 广西科技大学 | 中红外光谱结合向量夹角定量分析三氯蔗糖含量的方法 |
WO2023037248A1 (en) | 2021-09-08 | 2023-03-16 | Dh Technologies Development Pte. Ltd. | Identification of changing pathways or disease indicators through cluster analysis |
WO2023148663A1 (en) | 2022-02-04 | 2023-08-10 | Dh Technologies Development Pte. Ltd. | Compound identification using a mass spectrum |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007317068A (ja) * | 2006-05-29 | 2007-12-06 | Osaka Prefecture Univ | リコメンド装置およびリコメンドシステム |
WO2009029818A1 (en) * | 2007-08-31 | 2009-03-05 | Mds Analytical Technologies | Methods and systems for identifying correlated variables and convolved peaks |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0485573B1 (en) | 1990-06-04 | 1995-09-13 | Eastman Kodak Company | Method for interactive self-modeling mixture analysis |
JP3339779B2 (ja) * | 1996-07-17 | 2002-10-28 | 富士通株式会社 | Smtラインを備えた製造管理システム |
US7921068B2 (en) | 1998-05-01 | 2011-04-05 | Health Discovery Corporation | Data mining platform for knowledge discovery from heterogeneous data types and/or heterogeneous data sources |
US7729789B2 (en) * | 2004-05-04 | 2010-06-01 | Fisher-Rosemount Systems, Inc. | Process plant monitoring based on multivariate statistical analysis and on-line process simulation |
WO2005113830A2 (en) * | 2004-05-20 | 2005-12-01 | Waters Investments Limited | System and method for grouping precursor and fragment ions using selected ion chromatograms |
EP2115763A1 (en) * | 2007-02-02 | 2009-11-11 | MDS Analytical Technologies, a business unit Of MDS Inc., doing busi. through its SCIEX div. | Systems and methods for reducing noise from mass spectra |
-
2009
- 2009-05-29 US US12/474,418 patent/US8180581B2/en active Active
- 2009-07-07 WO PCT/US2009/049828 patent/WO2010138133A1/en active Application Filing
- 2009-07-07 JP JP2012513029A patent/JP5441199B2/ja active Active
- 2009-07-07 CA CA2763991A patent/CA2763991C/en not_active Expired - Fee Related
- 2009-07-07 EP EP09845351.7A patent/EP2435165A4/en not_active Ceased
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007317068A (ja) * | 2006-05-29 | 2007-12-06 | Osaka Prefecture Univ | リコメンド装置およびリコメンドシステム |
WO2009029818A1 (en) * | 2007-08-31 | 2009-03-05 | Mds Analytical Technologies | Methods and systems for identifying correlated variables and convolved peaks |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015135318A (ja) * | 2013-12-17 | 2015-07-27 | キヤノン株式会社 | データ処理装置、データ表示システム、試料データ取得システム、及びデータ処理方法 |
JP2019200211A (ja) * | 2013-12-17 | 2019-11-21 | キヤノン株式会社 | データ処理装置、データ表示システム、試料データ取得システム、及びデータ処理方法 |
US10565474B2 (en) | 2013-12-17 | 2020-02-18 | Canon Kabushiki Kaisha | Data processing apparatus, data display system, sample data obtaining system, method for processing data, and computer-readable storage medium |
Also Published As
Publication number | Publication date |
---|---|
US20090254314A1 (en) | 2009-10-08 |
EP2435165A1 (en) | 2012-04-04 |
JP5441199B2 (ja) | 2014-03-12 |
CA2763991A1 (en) | 2010-12-02 |
CA2763991C (en) | 2017-06-13 |
WO2010138133A1 (en) | 2010-12-02 |
US8180581B2 (en) | 2012-05-15 |
EP2435165A4 (en) | 2016-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5441199B2 (ja) | 大量の分光データにおける相関変数を識別するためのシステムおよび方法 | |
JP6272610B2 (ja) | 生成イオンスペクトルのデータ独立取得および参照スペクトルライブラリ照合 | |
Want et al. | Processing and analysis of GC/LC-MS-based metabolomics data | |
Sinkov et al. | Cluster resolution: A metric for automated, objective and optimized feature selection in chemometric modeling | |
US9442887B2 (en) | Systems and methods for processing fragment ion spectra to determine mechanism of fragmentation and structure of molecule | |
WO2015037003A1 (en) | Method and electronic nose for comparing odors | |
EP3584795B1 (en) | 3d mass spectrometry predictive classification | |
WO2005015209A2 (en) | Methods and systems for the annotation of biomolecule patterns in chromatography/mass-spectrometry analysis | |
WO2016002047A1 (ja) | 質量分析データ処理装置 | |
US7587285B2 (en) | Method for identifying correlated variables | |
CA2975812A1 (en) | Interference detection and peak of interest deconvolution | |
JP5796880B2 (ja) | 相関する変数および畳み込みピークを識別する方法、およびシステム | |
Bader et al. | Reduction of ion mobility spectrometry data by clustering characteristic peak structures | |
JP5860833B2 (ja) | 質量分析データ処理方法及び装置 | |
JP6503966B2 (ja) | 多変量解析結果表示装置 | |
EP2936544B1 (en) | Compound identification using multiple spectra at different collision energies | |
JP2016070789A (ja) | 質量分析データ処理装置 | |
US10446376B2 (en) | Compound identification using multiple spectra at different collision energies | |
Grissa et al. | A hybrid data mining approach for the identification of biomarkers in metabolomic data | |
CN117999605A (zh) | 谱比较 | |
Kaever et al. | Metabolite Clustering and Visualization of Mass Spectrometry Data Using One‐Dimensional Self‐Organizing Maps | |
Feussner et al. | Alexander Kaever, Manuel Landesfeind, Kirstin Feussner | |
Yamazaki et al. | Phenomenome profilerTM analysis of human colon cancer cell lines |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130819 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130821 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5441199 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |