JP6525864B2 - スペクトルデータに基づいたサンプルの分類方法、データベースの作成方法及び該データベースの使用方法、並びに対応するコンピュータプログラム、データ記憶媒体及びシステム - Google Patents
スペクトルデータに基づいたサンプルの分類方法、データベースの作成方法及び該データベースの使用方法、並びに対応するコンピュータプログラム、データ記憶媒体及びシステム Download PDFInfo
- Publication number
- JP6525864B2 JP6525864B2 JP2015505675A JP2015505675A JP6525864B2 JP 6525864 B2 JP6525864 B2 JP 6525864B2 JP 2015505675 A JP2015505675 A JP 2015505675A JP 2015505675 A JP2015505675 A JP 2015505675A JP 6525864 B2 JP6525864 B2 JP 6525864B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- spectra
- sample
- class
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 115
- 230000003595 spectral effect Effects 0.000 title claims description 93
- 238000004590 computer program Methods 0.000 title claims description 8
- 238000013500 data storage Methods 0.000 title description 2
- 238000001228 spectrum Methods 0.000 claims description 385
- 239000002245 particle Substances 0.000 claims description 131
- 239000000523 sample Substances 0.000 claims description 108
- 230000001186 cumulative effect Effects 0.000 claims description 37
- 244000005700 microbiome Species 0.000 claims description 22
- 239000013598 vector Substances 0.000 claims description 20
- 239000012472 biological sample Substances 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000001254 matrix assisted laser desorption--ionisation time-of-flight mass spectrum Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 6
- 102100034757 Thiol S-methyltransferase METTL7B Human genes 0.000 claims 3
- 101710082490 Thiol S-methyltransferase METTL7B Proteins 0.000 claims 3
- 239000000126 substance Substances 0.000 description 32
- 239000000203 mixture Substances 0.000 description 26
- 150000002500 ions Chemical class 0.000 description 19
- 241000894007 species Species 0.000 description 18
- 230000000875 corresponding effect Effects 0.000 description 12
- 238000001906 matrix-assisted laser desorption--ionisation mass spectrometry Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 11
- 239000012491 analyte Substances 0.000 description 10
- 238000007796 conventional method Methods 0.000 description 10
- 108090000623 proteins and genes Proteins 0.000 description 10
- 102000004169 proteins and genes Human genes 0.000 description 10
- 239000000443 aerosol Substances 0.000 description 9
- 238000004949 mass spectrometry Methods 0.000 description 9
- 241000894006 Bacteria Species 0.000 description 8
- 239000000411 inducer Substances 0.000 description 8
- 238000001819 mass spectrum Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 5
- 238000000691 measurement method Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000001869 matrix assisted laser desorption--ionisation mass spectrum Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000001157 Fourier transform infrared spectrum Methods 0.000 description 3
- 238000001237 Raman spectrum Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000002329 infrared spectrum Methods 0.000 description 3
- 230000008080 stochastic effect Effects 0.000 description 3
- 238000005309 stochastic process Methods 0.000 description 3
- 241000282339 Mustela Species 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000238634 Libellulidae Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004992 fission Effects 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000000816 matrix-assisted laser desorption--ionisation Methods 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 108010027322 single cell proteins Proteins 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J3/00—Spectrometry; Spectrophotometry; Monochromators; Measuring colours
- G01J3/28—Investigating the spectrum
- G01J3/44—Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/483—Physical analysis of biological material
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J3/00—Spectrometry; Spectrophotometry; Monochromators; Measuring colours
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
- G06F2218/14—Classification; Matching by matching peak patterns
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Urology & Nephrology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Hematology (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Signal Processing (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Spectrometry And Color Measurement (AREA)
Description
a)基準スペクトルとして使用するために、第1スペクトルの少なくとも2つのセットを得る工程、各セットは同じクラスに属する基準サンプルのスペクトルを含む;
b)基準スペクトルの各々について、スペクトル特性に関連した同じ少なくとも1つの量の値を決定する工程;
c)決定された値に基づいて、量の種々(different)の値に確率を関連付ける工程;
d)サンプルからスペクトルを取得し、このスペクトルの同じ少なくとも1つの量の値を決定する工程;及び
e)確率及び前記少なくとも2つのクラスの各々について得られたスペクトルにおける量の値に基づいて、サンプルがそのクラスに属する確率を計算する工程、を含む。
式中、P(Ii|Aj)は基準クラスAjの値Iiと関連した確率であり、k≠jを有するP(Ii|Ak)は基準クラスAjとは異なる少なくとも1つの基準クラスの値Iiと関連した確率である。
a)基準スペクトルとして使用するために、第1スペクトルの少なくとも2つのセットを得る工程、各セットは同じクラスに属する基準サンプルのスペクトルを含む;
b)基準スペクトルの各々について、スペクトル特性に関連した同じ少なくとも1つの量の値を決定する工程;及び
c)決定された値に基づいて、量の種々の値に確率を関連付ける工程、を含む。
d)サンプルからスペクトルを取得し、このスペクトルの同じ少なくとも1つの量の値を決定する工程;及び
e)データベースから得られた確率及び前記少なくとも2つのクラスの各々について得られたスペクトルにおける量の値に基づいて、サンプルがそのクラスに属する確率を計算する工程、を含む。
−サンプルからスペクトルを得るように構成された手段;
−上述したように本発明による方法を実施するよう構成された分析手段、を含む。
MSにおける単一イオン化事象スペクトルの非常に確率的である性質により、単一粒子スペクトルの強度Iは、分析物の分子の質量に対応する位置で、この分析物の分子Aが粒子中に存在する確率P(A|I)についての尺度としてのみ考えられ得る。
−P(A)は物質Aを含む粒子の割合であり;
−P(I|¬A)は物質Aを含まない粒子についての強度Iの確率密度関数であり;及び
−P(¬A)は物質Aを含まない粒子の割合である。
細菌などの微生物は、MALDI−MSの区別可能な特性をもたらす多くの物質の存在によって特徴付けられる。生物(細菌、ウイルスなど)及び生物の状態(増殖性細胞、芽胞)に応じて、この数は最低5個〜最大50個又はそれ以上の間で変化し得る。
−全ての特性が存在
<序論>
P(I|Aj)及びP(I|¬Aj)のPDFは、物質Ajを確実に含む、及び物質Ajを含まないそれぞれの基準粒子の十分に大きなセットを評価することによって近似され得る。
あらゆる実際の質量分析計において、蓄積されたスペクトルにおけるピークは有限幅を有する。このため、各特性について単一粒子の振幅を記録するとき、特性が発生し得る有限幅の質量間隔許容しなければならない。
F(Ispectrum(MZ))は、
最後に、単一粒子スペクトルにつての強度スコアISは、次に質量分析計の全質量範囲にわたる形状関数と単一粒子のイオン強度スペクトルとの積の積分として定義され得る。
一般に、微生物のMALDIスペクトルは、典型的には2000Da〜20000Daの間の質量領域において10〜50個の限られた数のピークによって特徴付けられる。これらのピークはタンパク質、ペプチドなどの物質の存在を示している。
検討中の生物中に存在する物質に関連する特性についての確率密度関数は、生物中に存在する物質に関連しないそれらとは著しく異なる。例として、図4は、特性誘導物質を含有する粒子コレクション及びこの物質を含有しない粒子コレクションについての特性のPDFからの例を示している。
P(I|¬A1)=P(I|A2)
n個の可能な粒子タイプを有し、粒子タイプlが物質Ajを含有する、より複雑な粒子コレクションが考慮される場合、積P(I|¬Aj)P(¬Aj)は、
したがって、2成分混合物の場合のように、複雑な混合物では、P(Aj)に遭遇する確率はP(Ai)=1/nに等しい。
図4に示される特性PDF及びベイズの定理に基づいて、特性誘導物質Aが(単一粒子スペクトルの)特性強度の関数として存在(又は欠如)する確率が導出され得る。図5はこの確率を示している。
−単一粒子スペクトルが基準分離株のうちの1つから生じる確率、Ptotalは、上述したように「任意の特性が存在」規則に従って、2つの分離株の各々についての2つの単一特性確率から導出される。
−特性強度Iが、不明瞭な特性確率についての臨界強度(図5参照)を超えるときのみ、この特性についての特性確率が割り当てられ、そうでない場合は特性確率は「未定義」とされる。
−スペクトルは、
式中、Pminはスペクトルを分類するために超えなければならない閾値確率である。この例では、閾値確率Pmin=0.9が使用される。
種々のクラスに割り当てられている単一粒子スペクトルが実際に基準スペクトルに対応することを確認するために、クラスごとに蓄積された単一粒子スペクトルを基準スペクトルと比較することができる。
一般に、細菌の蓄積されたスペクトルは、ある場所に10〜40個の間の区別可能なピークを含む。潜在的に、全てのピーク位置(それらの質量の観点から)は、単一粒子を分類するための特性として使用され得る。
%特性選択ベクトルを生成する%
分離株に対してループする
単一粒子スペクトルファイルに対してループする
単一粒子スペクトルを強度配列として読み取る
総イオンカウントを計算する
スペクトルを総イオンカウントで正規化する
正規化スペクトルを和スペクトルに加える
ループ終了
和スペクトルを表示する
(手動又は自動のどちらかで)スペクトル特性をマークする
特性/分離株の識別を保存する
特性に対してループする
特性形状関数を抜き出す
特性形状関数を特性選択ベクトルとして保存する
ループ終了
ループ終了
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
分離株に対してループする
単一粒子ファイルに対してループする
単一粒子スペクトルを強度配列として読み取る
全ての分離株に属する全ての特性についての特性強度を抜き出す
対応する特性強度配列における全ての特性についての特性強度を保存する
ループ終了
特性に対してループする
特性強度配列の要素を適切に離隔したコンテナにビン化する
特性強度頻度配列においてコンテナあたりの要素の数を戻す
特性強度頻度配列を処理された単一粒子スペクトルの数で割る
ループ終了
ループ終了
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
特性確率密度関数に対してループする
累積確率密度関数を生成する
ループ終了
分離株に対してループする
特性/分離株の識別表に従って、分離株についての特性「ネイティブ」を選択する
「ネイティブ」の特性に対してループする
「その他」の特性に対してループする
ネイティブの特性及びその他の特性の各組み合わせに対してコルモゴロフ−スミルノフ統計量を決定して保存する
ループ終了
各「ネイティブ」の特性に対する最小コルモゴロフ−スミルノフ統計量を決定して、minKSとして保存する
ループ終了
最大minKSを有するN個(ユーザーによって指定される数であるが、少なくとも1つである)の特性を選択する
各分離株において特性選択を保存する
ループ終了
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%単一粒子の分類%
ループを待つ
単一粒子の質量スペクトルを読み取る
単一粒子の質量スペクトルを正規化する
(選択された)特性の強度を決定する
(選択された)特性に対してループする
分離株に対してループする
P(I|Am n)P(A)及びP(I|¬An)P(¬A)への寄与を決定する
ループ終了
P(Am n|I)を決定する
ループ終了
分離株に対してループする
「ネイティブ」の特性リストを用いて、各分離株についてPtotalを決定する
ループ終了
スペクトルを基準に相当するクラスのうちの1つに、又は未知のクラスに割り当てる
ループ終了
クラスに対してループする
スペクトルの数が最小数よりも多い場合
クラスに割り当てられた全てのスペクトルを合計する
蓄積されたスペクトルを平滑化する
平滑化されたスペクトルをリサンプルする
リサンプルされたスペクトルからベースラインを引く
ピークを抜き出す
ピークリストを検討中のクラス(例えば属)に属するサブクラス(例えば種)に分類する
分類が成功した場合
識別を報告する
その他の場合
クラス内に種の混合物が存在し得るかどうかを確認する
混合物が存在する場合
混合物をさらに区別するために新たな特性セットを生成する
検討中のグループに割り当てられたそれらの粒子について新たな単一粒子の分類を実行する
その他の場合
蓄積されたスペクトルと基準スペクトルとの分類学的距離を決定する
終了
終了
終了
ループ終了
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
本発明は一側面において以下の発明を包含する。
(発明1)
スペクトルデータに基づいて、少なくとも2つのクラスのうちの1つにサンプルを分類する方法であって、
a)基準スペクトルとして使用するために、第1スペクトルの少なくとも2つのセットを得る工程、各前記セットは同じクラスに属する基準サンプルのスペクトルを含む;
b)前記基準スペクトルの各々について、スペクトル特性に関連した少なくとも1つの同じ量の値を決定する工程;
c)決定された前記値に基づいて、前記量の種々の値に確率を関連付ける工程;
d)前記サンプルからスペクトルを取得し、このスペクトルの少なくとも1つの同じ量の値を決定する工程;及び
e)前記確率及び前記少なくとも2つのクラスの各々について得られたスペクトルにおける前記量の値に基づいて、前記サンプルがそのクラスに属する確率を計算する工程、を含む、方法。
(発明2)
発明1に記載の方法であって、前記スペクトルのデータは、ラマンスペクトル、近赤外スペクトル、FT−IRスペクトル、周波数スペクトル、MALDI MSスペクトル又はMALDI TOF−MSスペクトル、好ましくはMALDI TOF−MSスペクトルを含む、方法。
(発明3)
発明1又は2に記載の方法であって、前記基準スペクトル及び前記サンプルから得られたスペクトルは単一粒子のスペクトルである、方法。
(発明4)
発明1〜3のいずれか一項に記載の方法であって、前記サンプルは生体サンプルである、方法。
(発明5)
発明4に記載の方法であって、前記生体サンプルは微生物を含み、前記分類は前記微生物の分類を含む、方法。
(発明6)
発明1〜5のいずれか一項に記載の方法であって、前記少なくとも1つの量は基準クラスの特徴的なスペクトル特性に基づいて選択される、方法。
(発明7)
発明1〜6のいずれか一項に記載の方法であって、値I i がスペクトル特性量Qiに関連して得られるサンプルスペクトルについて、
式中、P(I i |A j )は前記基準クラスA j の前記値I i と関連した確率であり、k≠jを有するP(I i |A k )は前記基準クラスA j とは異なる少なくとも1つの基準クラスの前記値I i と関連した確率である、方法。
(発明8)
発明1〜7のいずれか一項に記載の方法であって、前記ステップb)は、前記基準スペクトルの各々について、前記スペクトル特性に関連した少なくとも2つの同じ量の値を決定する工程を含み、ステップe)は、全ての量において得られた前記確率を前記サンプルがそれぞれのクラスに属する全体的な確率に組み合わせる工程を含む、方法。
(発明9)
発明1〜8のいずれか一項に記載の方法であって、前記値は少なくとも1つの所定のスペクトル値での強度、又はスペクトル値の所定の範囲内での強度に関連する、方法。
(発明10)
発明1〜9のいずれか一項に記載の方法であって、前記値は正規化される方法。
(発明11)
発明1〜10のいずれか一項に記載の方法であって、前記値は、重み関数とスペクトル値の所定の範囲にわたるそれぞれのスペクトルの前記強度とを乗算することによって決定される、方法。
(発明12)
発明11に記載の方法であって、前記重み関数は同じクラスのスペクトルの累積スペクトルに基づく、方法。
(発明13)
発明1〜12のいずれか一項に記載の方法であって、前記値は所定のスペクトル値での前記強度、又は所定のスペクトル範囲内での前記強度の間の比に関連する、方法。
(発明14)
発明1〜13のいずれか一項に記載の方法であって、前記値はスペクトル値の所定の範囲内のピーク位置に関連する、方法。
(発明15)
発明1〜14のいずれか一項に記載の方法であって、前記値はベクトルである、方法。
(発明16)
発明1〜15のいずれか一項に記載の方法であって、前記ステップd)及びe)は基準クラスの第1セットに対して、その後基準クラスの第2セットに対して実施され、前記第2セットは、前記第1セットの基準クラスのうちの1つへの前記サンプルの分類に基づいて選択される、方法。
(発明17)
発明5及び16に記載の方法であって、前記第1セット及び第2セットは生物学的な分類階層に基づいて選択される、方法。
(発明18)
発明1〜17のいずれか一項に記載の方法であって、前記ステップd)は前記サンプルから少なくとも2つのスペクトルを得る工程、及びこれらの少なくとも2つのスペクトルの少なくとも1つの同じ量の値を決定する工程を含み、前記ステップe)は同じクラスに分類された前記サンプルスペクトルを累積スペクトルに統合する工程、及びこの累積スペクトルをそれぞれのクラスの前記基準スペクトルを統合することによって得られた累積基準スペクトルと比較する工程を含む、方法。
(発明19)
スペクトルデータに基づいた少なくとも2つのクラスのうちの1つへのサンプルの分類に使用するデータベースを作成する方法であって、
a)基準スペクトルとして使用するために、第1スペクトルの少なくとも2つのセットを得る工程、各前記セットは同じクラスに属する基準サンプルのスペクトルを含む;
b)前記基準スペクトルの各々について、スペクトル特性に関連した少なくとも1つの同じ量の値を決定する工程;及び
c)決定された前記値に基づいて、前記量の種々の値に確率を関連付ける工程、を含む、方法。
(発明20)
発明19に記載の方法で得られたデータベースを用いて、スペクトルデータに基づいて、少なくとも2つのクラスのうちの1つにサンプルを分類する方法であって、該方法は、
d)前記サンプルからスペクトルを取得し、このスペクトルの少なくとも1つの同じ量の値を決定する工程;及び
e)前記データベースから得られた前記確率及び前記少なくとも2つのクラスの各々について得られたスペクトルにおける前記量の値に基づいて、前記サンプルがそのクラスに属する確率を計算する工程、を含む、方法。
(発明21)
コンピュータで実行するとき、発明1〜20のいずれかに記載の方法におけるステップを実行する、コンピュータプログラム。
(発明22)
発明21に記載のコンピュータプログラムを含むデータ記憶媒体。
(発明23)
スペクトルデータに基づいてサンプルを分類するシステムであって、
−サンプルからスペクトルを得るように構成された手段;
−発明1〜20のいずれかに記載の方法を実施するように構成された分析手段、を含む、システム。
(発明24)
発明23に記載のシステムであって、サンプルから単一粒子スペクトルを得るように構成された手段を含む、システム。
Claims (13)
- スペクトルデータに基づいて、少なくとも2つのクラスのうちの1つにサンプルを分類する方法であって、
前記スペクトルデータは、MALDI MSスペクトル又はMALDI TOF−MSスペクトルを含み、
前記方法は、
a)基準スペクトルとして使用するために、第1スペクトルの少なくとも2つのセットを得る工程、各前記セットは同じクラスに属する基準サンプルのスペクトルを含む;
b)前記基準スペクトルの各々について、前記スペクトルデータのうち選択した1つに含まれるスペクトル特性に関連した少なくとも1つの同じ量の値を決定する工程であって、前記決定は、前記基準スペクトルの各々に対して所定の関数又は演算を適用することによって、行われる工程;
c)各基準スペクトルのセットに関して、工程b)で決定された前記値に基づいて、前記少なくとも1つの量の異なる値に確率を関連付け、前記量の値及び関連付けされた確率からの確率密度関数(PDF)を構築する工程;
d)前記サンプルからスペクトルを取得し、このスペクトルの少なくとも1つの同じ量の値を決定する工程;及び
e)工程c)で決定された前記確率密度関数及び前記少なくとも2つのクラスの各々について得られたスペクトルにおける前記量の値に基づいて、前記サンプルがそのクラスに属する確率を計算する工程、
を含み、
前記基準スペクトル及び前記サンプルから得られたスペクトルは単一粒子のスペクトルである、
方法。 - 請求項1に記載の方法であって、前記サンプルは生体サンプルであり、
前記生体サンプルは微生物を含み、前記分類は前記微生物の分類を含み、及び/又は
前記少なくとも1つの量は基準クラスの特徴的なスペクトル特性に基づいて選択される、
該方法。 - 請求項1〜3のいずれか一項に記載の方法であって、前記ステップb)は、前記基準スペクトルの各々について、前記スペクトル特性に関連した少なくとも2つの同じ量の値を決定する工程を含み、ステップe)は、全ての量において得られた前記確率を前記サンプルがそれぞれのクラスに属する全体的な確率に組み合わせる工程を含む、方法。
- 請求項1〜4のいずれか一項に記載の方法であって、
前記値は少なくとも1つの所定のスペクトル値での強度、又はスペクトル値の所定の範囲内での強度に関連する、及び/又は
前記値は正規化される、
方法。 - 請求項1〜5のいずれか一項に記載の方法であって、前記値は、重み関数とスペクトル値の所定の範囲にわたるそれぞれのスペクトルの前記強度とを乗算することによって決定される、方法であり、
前記重み関数は同じクラスのスペクトルの累積スペクトルに基づく、該方法。 - 請求項1〜6のいずれか一項に記載の方法であって、
前記値は所定のスペクトル値での前記強度、又は所定のスペクトル範囲内での前記強度の間の比に関連する、及び/又は、
前記値はスペクトル値の所定の範囲内のピーク位置に関連する、及び/又は、
前記値はベクトルである、
方法。 - 請求項1〜7のいずれか一項に記載の方法であって、前記ステップd)及びe)は基準クラスの第1セットに対して、その後基準クラスの第2セットに対して実施され、前記第2セットは、前記第1セットの基準クラスのうちの1つへの前記サンプルの分類に基づいて選択される、方法であり、
前記サンプルは生体サンプルであり、前記生体サンプルは微生物を含み、前記分類は前記微生物の分類を含み、
前記第1セット及び第2セットは生物学的な分類階層に基づいて選択される、方法。 - 請求項1〜8のいずれか一項に記載の方法であって、前記ステップd)は前記サンプルから少なくとも2つのスペクトルを得る工程、及びこれらの少なくとも2つのスペクトルの少なくとも1つの同じ量の値を決定する工程を含み、前記ステップe)は同じクラスに分類された前記サンプルスペクトルを累積スペクトルに統合する工程、及びこの累積スペクトルをそれぞれのクラスの前記基準スペクトルを統合することによって得られた累積基準スペクトルと比較する工程を含む、方法。
- スペクトルデータに基づいた少なくとも2つのクラスのうちの1つへのサンプルの分類に使用するデータベースを作成する方法であって、
前記スペクトルデータは、MALDI MSスペクトル又はMALDI TOF−MSスペクトルを含み、
前記方法は、
a)基準スペクトルとして使用するために、第1スペクトルの少なくとも2つのセットを得る工程、各前記セットは同じクラスに属する基準サンプルのスペクトルを含む;
b)前記基準スペクトルの各々について、前記スペクトルデータのうち選択した1つに含まれるスペクトル特性に関連した少なくとも1つの同じ量の値を決定する工程であって、前記決定は、前記基準スペクトルの各々に対して所定の関数又は演算を適用することによって、行われる工程;及び
c)各基準スペクトルのセットに関して、決定された前記値に基づいて、前記少なくとも1つの量の異なる値に確率を関連付け、前記量の値及び関連付けされた確率からの確率密度関数(PDF)を構築する工程、を含み
前記基準スペクトルは単一粒子のスペクトルである、
方法。 - 請求項10に記載の方法で得られたデータベースを用いて、スペクトルデータに基づいて、少なくとも2つのクラスのうちの1つにサンプルを分類する方法であって、該方法は、
前記スペクトルデータは、MALDI MSスペクトル又はMALDI TOF−MSスペクトルを含み、
前記方法は、
d)前記サンプルから単一粒子スペクトルを取得し、このスペクトルの少なくとも1つの同じ量の値を決定する工程;及び
e)前記データベースから得られた前記確率密度関数及び前記少なくとも2つのクラスの各々について得られたスペクトルにおける前記量の値に基づいて、前記サンプルがそのクラスに属する確率を計算する工程、を含む、方法。 - コンピュータで実行するとき、請求項1〜11のいずれか1項に記載の方法におけるステップを実行するコンピュータプログラムを含むデータ記憶媒体。
- スペクトルデータに基づいてサンプルを分類するシステムであって、
−サンプルから単一粒子スペクトルを得るように構成された手段;
−請求項1〜11のいずれか1項に記載の方法を実施するように構成された分析手段、を含む、システム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NL2008620 | 2012-04-10 | ||
NL2008620 | 2012-04-10 | ||
NL2009015A NL2009015C2 (en) | 2012-04-10 | 2012-06-15 | Method for classification of a sample on the basis of spectral data, method for creating a database and method for using this database, and corresponding computer program, data storage medium and system. |
NL2009015 | 2012-06-15 | ||
PCT/NL2013/050260 WO2013154425A1 (en) | 2012-04-10 | 2013-04-10 | Method for classification of a sample on the basis of spectral data, method for creating a database and method for using this database, and corresponding computer program, data storage medium and system |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015516570A JP2015516570A (ja) | 2015-06-11 |
JP2015516570A5 JP2015516570A5 (ja) | 2016-06-02 |
JP6525864B2 true JP6525864B2 (ja) | 2019-06-05 |
Family
ID=48237199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015505675A Expired - Fee Related JP6525864B2 (ja) | 2012-04-10 | 2013-04-10 | スペクトルデータに基づいたサンプルの分類方法、データベースの作成方法及び該データベースの使用方法、並びに対応するコンピュータプログラム、データ記憶媒体及びシステム |
Country Status (9)
Country | Link |
---|---|
US (1) | US20150066377A1 (ja) |
EP (1) | EP2836958B1 (ja) |
JP (1) | JP6525864B2 (ja) |
CN (1) | CN104380311B (ja) |
BR (1) | BR112014025246A8 (ja) |
IN (1) | IN2014DN09363A (ja) |
NL (1) | NL2009015C2 (ja) |
RU (1) | RU2633797C2 (ja) |
WO (1) | WO2013154425A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102500948B1 (ko) * | 2021-10-01 | 2023-02-20 | 한국전자기술연구원 | 시변적 ims 데이터 처리를 통한 위험 물질 검출 장치 및 방법 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9754774B2 (en) | 2014-02-14 | 2017-09-05 | Perkinelmer Health Sciences, Inc. | Systems and methods for automated analysis of output in single particle inductively coupled plasma mass spectrometry and similar data sets |
JP6397041B2 (ja) * | 2014-02-14 | 2018-09-26 | パーキンエルマー・ヘルス・サイエンシーズ・インコーポレイテッドPerkinelmer Health Sciences, Inc. | 単一粒子誘導結合プラズマ質量分析における出力および類似データセットの自動化された分析のためのシステムおよび方法 |
CN106198482B (zh) * | 2015-05-04 | 2019-07-05 | 清华大学 | 基于拉曼光谱的检测保健品中是否添加有西药的方法 |
WO2016196125A1 (en) * | 2015-05-29 | 2016-12-08 | Virgin Instruments Corporation | Method for developing and applying databases for identification of microorganisms by maldi-tof mass spectrometry |
WO2016200164A1 (ko) * | 2015-06-09 | 2016-12-15 | 한양대학교 산학협력단 | 촉각 인지 시스템, 및 그 데이터베이스 구축 방법 |
EP3822977A1 (en) * | 2015-08-26 | 2021-05-19 | Viavi Solutions Inc. | Identification using spectroscopy |
WO2017040826A1 (en) | 2015-09-01 | 2017-03-09 | Massachusetts Institute Of Technology | Apparatus, systems, and methods for talbot spectrometers |
KR101816400B1 (ko) * | 2016-05-12 | 2018-01-09 | 에스케이이노베이션 주식회사 | 이차전지용 활물질의 평가방법 |
WO2018039136A1 (en) * | 2016-08-22 | 2018-03-01 | Jo Eung Joon | Time versus intensity distribution analysis using a matrix-assisted laser desorption/ionization time-of-flight mass spectrometer |
US10444213B2 (en) | 2016-08-25 | 2019-10-15 | Viavi Solutions Inc. | Spectroscopic classification of conformance with dietary restrictions |
WO2018080522A1 (en) | 2016-10-28 | 2018-05-03 | Hewlett-Packard Development Company, L.P. | Target class feature model |
WO2018158399A1 (en) | 2017-03-02 | 2018-09-07 | Biosparq B.V. | Diagnostic method and system for diagnosis |
FR3065285B1 (fr) * | 2017-04-14 | 2019-07-05 | Commissariat A L'energie Atomique Et Aux Energies Alternatives | Procede d’acquisition d’un spectre |
US10804562B2 (en) * | 2017-12-06 | 2020-10-13 | Tesla Motors Canada ULC | Method and system for determining concentration of electrolyte components for lithium-ion cells |
US11009452B2 (en) | 2018-01-26 | 2021-05-18 | Viavi Solutions Inc. | Reduced false positive identification for spectroscopic quantification |
US10810408B2 (en) | 2018-01-26 | 2020-10-20 | Viavi Solutions Inc. | Reduced false positive identification for spectroscopic classification |
US11656174B2 (en) | 2018-01-26 | 2023-05-23 | Viavi Solutions Inc. | Outlier detection for spectroscopic classification |
IT201800002353A1 (it) * | 2018-02-02 | 2019-08-02 | Alifax Srl | Procedimento di identificazione batterica tramite analisi multivariata di profili spettrali |
JP6951753B2 (ja) * | 2018-03-27 | 2021-10-20 | エバ・ジャパン 株式会社 | 情報探索システム及びプログラム |
JP7031450B2 (ja) * | 2018-04-02 | 2022-03-08 | 日本製鉄株式会社 | 粒子発生源解析システム、粒子発生源解析方法、及びプログラム |
JP2022529624A (ja) * | 2019-04-15 | 2022-06-23 | セキュリティ マターズ リミテッド | サンプルを分類する方法およびシステム |
JP7362337B2 (ja) * | 2019-07-30 | 2023-10-17 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法、及びプログラム |
RU2751434C1 (ru) * | 2020-09-04 | 2021-07-13 | Андрей Валентинович Крашенинников | Мобильный лазерный эмиссионный анализатор веществ |
CN112255215B (zh) * | 2020-09-16 | 2021-08-17 | 清华大学 | 检测分析活体细胞生命活动状态的修饰二聚体表面增强拉曼的方法 |
CA3200138A1 (en) * | 2020-11-26 | 2022-06-02 | 12535441 Canada Ltd. | Spectral diagnostic system |
CN112614542B (zh) * | 2020-12-29 | 2024-02-20 | 北京携云启源科技有限公司 | 一种微生物鉴定方法、装置、设备及存储介质 |
CN113092407B (zh) * | 2021-04-20 | 2024-01-30 | 深圳华创智信科技有限公司 | 基于近红外光谱的五常稻花香水稻原产地品种识别方法 |
WO2024008522A1 (en) * | 2022-07-05 | 2024-01-11 | Trinamix Gmbh | Generating a spectrum of a sample |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4103324B2 (ja) * | 2000-03-06 | 2008-06-18 | 住友化学株式会社 | 酸化チタン、それを用いてなる光触媒体及び光触媒体コーティング剤 |
JP2004536276A (ja) * | 2000-11-16 | 2004-12-02 | シファーゲン バイオシステムズ, インコーポレイテッド | 質量スペクトルを分析する方法 |
US20030087456A1 (en) * | 2001-10-08 | 2003-05-08 | Jones Howland D.T. | Within-sample variance classification of samples |
US20070184455A1 (en) * | 2003-05-16 | 2007-08-09 | Cheryl Arrowsmith | Evaluation of spectra |
BRPI0514958A (pt) * | 2004-09-07 | 2008-07-01 | Petromodel Ehf | aparelho e método para análise de tamanho, forma e angularidade e para análise composicional de partìculas de mineral e rocha |
DE102005002672B4 (de) * | 2005-01-13 | 2009-02-26 | Universität Leipzig | Verfahren zur schnellen Differenzierung von Mikroorganismen auf Subspezies-Ebene mittels MALDI-TOF MS |
US20090012723A1 (en) * | 2005-06-09 | 2009-01-08 | Chemlmage Corporation | Adaptive Method for Outlier Detection and Spectral Library Augmentation |
JP2007240326A (ja) * | 2006-03-08 | 2007-09-20 | Intec Web & Genome Informatics Corp | 波形解析装置 |
EP2157599A1 (en) | 2008-08-21 | 2010-02-24 | Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO | Method and apparatus for identification of biological material |
JP5649835B2 (ja) * | 2010-02-25 | 2015-01-07 | オリンパス株式会社 | 振動スペクトル分析方法 |
JP5458389B2 (ja) * | 2010-07-05 | 2014-04-02 | 清水建設株式会社 | パラメタ選定方法及びパラメタ選定システム |
AU2011289284B2 (en) * | 2010-08-13 | 2015-04-09 | Somalogic Operating Co., Inc. | Pancreatic cancer biomarkers and uses thereof |
EP2439536A1 (en) * | 2010-10-01 | 2012-04-11 | Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO | New classification method for spectral data |
-
2012
- 2012-06-15 NL NL2009015A patent/NL2009015C2/en not_active IP Right Cessation
-
2013
- 2013-04-10 WO PCT/NL2013/050260 patent/WO2013154425A1/en active Application Filing
- 2013-04-10 CN CN201380030388.3A patent/CN104380311B/zh not_active Expired - Fee Related
- 2013-04-10 EP EP13720102.6A patent/EP2836958B1/en active Active
- 2013-04-10 JP JP2015505675A patent/JP6525864B2/ja not_active Expired - Fee Related
- 2013-04-10 BR BR112014025246A patent/BR112014025246A8/pt not_active Application Discontinuation
- 2013-04-10 US US14/389,974 patent/US20150066377A1/en not_active Abandoned
- 2013-04-10 IN IN9363DEN2014 patent/IN2014DN09363A/en unknown
- 2013-04-10 RU RU2014145011A patent/RU2633797C2/ru active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102500948B1 (ko) * | 2021-10-01 | 2023-02-20 | 한국전자기술연구원 | 시변적 ims 데이터 처리를 통한 위험 물질 검출 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
US20150066377A1 (en) | 2015-03-05 |
CN104380311B (zh) | 2018-06-26 |
JP2015516570A (ja) | 2015-06-11 |
IN2014DN09363A (ja) | 2015-07-17 |
EP2836958B1 (en) | 2020-06-10 |
BR112014025246A8 (pt) | 2021-03-02 |
CN104380311A (zh) | 2015-02-25 |
NL2009015C2 (en) | 2013-10-15 |
RU2633797C2 (ru) | 2017-10-18 |
RU2014145011A (ru) | 2016-05-27 |
EP2836958A1 (en) | 2015-02-18 |
WO2013154425A1 (en) | 2013-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6525864B2 (ja) | スペクトルデータに基づいたサンプルの分類方法、データベースの作成方法及び該データベースの使用方法、並びに対応するコンピュータプログラム、データ記憶媒体及びシステム | |
Aaij et al. | Selection and processing of calibration samples to measure the particle identification performance of the LHCb experiment in Run 2 | |
Karpievitch et al. | Normalization and missing value imputation for label-free LC-MS analysis | |
CN104380088B (zh) | 对sem-eds数据集中的未知物的聚类分析 | |
JP5870851B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US9305755B2 (en) | Mass analysis data processing method and mass analysis data processing apparatus | |
O'Brien et al. | The effects of nonignorable missing data on label-free mass spectrometry proteomics experiments | |
Gardner et al. | Self-organizing map and relational perspective mapping for the accurate visualization of high-dimensional hyperspectral data | |
JP6743892B2 (ja) | 質量分析データ解析装置及び解析方法 | |
US20220044921A1 (en) | Methods and systems for detecting aerosol particles | |
CA2447888A1 (en) | Model for spectral and chromatographic data | |
JP5964983B2 (ja) | 質量分析法により微生物を特定するための方法 | |
US20130346023A1 (en) | Systems and methods for unmixing data captured by a flow cytometer | |
Mantini et al. | Independent component analysis for the extraction of reliable protein signal profiles from MALDI-TOF mass spectra | |
JP2007523323A (ja) | スペクトルにおけるシグナルをクラスタにする方法 | |
US9563744B1 (en) | Method of predicting development and severity of graft-versus-host disease | |
TEVNPH Working Group | Combined CDF and D0 Upper Limits on Standard Model Higgs-Boson Production with up to 2.4 fb-1 of data | |
US20110113003A1 (en) | Multi-dimensional spectral analysis for improved identification and confirmation of radioactive isotopes | |
Kaddi et al. | Multivariate hypergeometric similarity measure | |
CN106650779A (zh) | 谱图相似度的计算方法 | |
Wozniewski | Differential cross section measurements in the H→ ττ decay channel with CMS data of proton-proton collisions at the Large Hadron Collider at CERN | |
Willingale et al. | Searching for biomarkers of heart failure in the mass spectra of blood plasma | |
Chen et al. | Towards biologically plausible and private gene expression data generation | |
US20230197426A1 (en) | Predictive test for prognosis of myelodysplastic syndrome patients using mass spectrometry of blood-based sample | |
Klaila et al. | Supervised topological data analysis for MALDI imaging applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160404 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160404 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161206 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170410 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171010 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20171218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180417 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180713 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181016 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20181204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190314 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20190325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190409 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190507 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6525864 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |