JP2004506216A - 混合物の化学成分を同定および定量するための方法およびシステム - Google Patents
混合物の化学成分を同定および定量するための方法およびシステム Download PDFInfo
- Publication number
- JP2004506216A JP2004506216A JP2002518495A JP2002518495A JP2004506216A JP 2004506216 A JP2004506216 A JP 2004506216A JP 2002518495 A JP2002518495 A JP 2002518495A JP 2002518495 A JP2002518495 A JP 2002518495A JP 2004506216 A JP2004506216 A JP 2004506216A
- Authority
- JP
- Japan
- Prior art keywords
- chromatogram
- mass
- data
- chromatograms
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 239000000203 mixture Substances 0.000 title description 20
- 239000000126 substance Substances 0.000 title description 12
- 238000012545 processing Methods 0.000 claims abstract description 31
- 238000009499 grossing Methods 0.000 claims abstract description 25
- 238000012937 correction Methods 0.000 claims abstract description 15
- 238000000491 multivariate analysis Methods 0.000 claims abstract description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims 1
- 238000004587 chromatography analysis Methods 0.000 abstract description 14
- 238000004949 mass spectrometry Methods 0.000 abstract description 13
- 150000002500 ions Chemical class 0.000 description 17
- 238000002474 experimental method Methods 0.000 description 16
- 238000001819 mass spectrum Methods 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 15
- 238000013459 approach Methods 0.000 description 11
- 238000001228 spectrum Methods 0.000 description 11
- 238000011156 evaluation Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000000513 principal component analysis Methods 0.000 description 10
- 238000000926 separation method Methods 0.000 description 9
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 8
- 229940098773 bovine serum albumin Drugs 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 7
- 238000000855 fermentation Methods 0.000 description 7
- 230000004151 fermentation Effects 0.000 description 7
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 241000191965 Staphylococcus carnosus Species 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 6
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 239000000796 flavoring agent Substances 0.000 description 5
- 235000019634 flavors Nutrition 0.000 description 5
- 238000003909 pattern recognition Methods 0.000 description 5
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 241000186660 Lactobacillus Species 0.000 description 4
- 150000001299 aldehydes Chemical class 0.000 description 4
- 235000014121 butter Nutrition 0.000 description 4
- 235000014113 dietary fatty acids Nutrition 0.000 description 4
- 229930195729 fatty acid Natural products 0.000 description 4
- 239000000194 fatty acid Substances 0.000 description 4
- 150000004665 fatty acids Chemical class 0.000 description 4
- 229940039696 lactobacillus Drugs 0.000 description 4
- 238000004811 liquid chromatography Methods 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 3
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 235000019253 formic acid Nutrition 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 238000011081 inoculation Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 235000013580 sausages Nutrition 0.000 description 3
- JZQKTMZYLHNFPL-BLHCBFLLSA-N (2E,4E)-deca-2,4-dienal Chemical compound CCCCC\C=C\C=C\C=O JZQKTMZYLHNFPL-BLHCBFLLSA-N 0.000 description 2
- JZQKTMZYLHNFPL-UHFFFAOYSA-N 2-trans-4-trans-decadienal Natural products CCCCCC=CC=CC=O JZQKTMZYLHNFPL-UHFFFAOYSA-N 0.000 description 2
- 102000018832 Cytochromes Human genes 0.000 description 2
- 108010052832 Cytochromes Proteins 0.000 description 2
- 230000005526 G1 to G0 transition Effects 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000002045 capillary electrochromatography Methods 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 239000003792 electrolyte Substances 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000004817 gas chromatography Methods 0.000 description 2
- NIOYUNMRJMEDGI-UHFFFAOYSA-N hexadecanal Chemical compound CCCCCCCCCCCCCCCC=O NIOYUNMRJMEDGI-UHFFFAOYSA-N 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- JARKCYVAAOWBJS-UHFFFAOYSA-N hexanal Chemical compound CCCCCC=O JARKCYVAAOWBJS-UHFFFAOYSA-N 0.000 description 2
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 2
- 238000005040 ion trap Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- FWWQKRXKHIRPJY-UHFFFAOYSA-N octadecanal Chemical compound CCCCCCCCCCCCCCCCCC=O FWWQKRXKHIRPJY-UHFFFAOYSA-N 0.000 description 2
- HGBOYTHUEUWSSQ-UHFFFAOYSA-N pentanal Chemical compound CCCCC=O HGBOYTHUEUWSSQ-UHFFFAOYSA-N 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000004611 spectroscopical analysis Methods 0.000 description 2
- 238000004808 supercritical fluid chromatography Methods 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- MMFCJPPRCYDLLZ-CMDGGOBGSA-N (2E)-dec-2-enal Chemical compound CCCCCCC\C=C\C=O MMFCJPPRCYDLLZ-CMDGGOBGSA-N 0.000 description 1
- ADHNUPOJJCKWRT-JLXBFWJWSA-N (2e,4e)-octadeca-2,4-dienoic acid Chemical compound CCCCCCCCCCCCC\C=C\C=C\C(O)=O ADHNUPOJJCKWRT-JLXBFWJWSA-N 0.000 description 1
- GYSCBCSGKXNZRH-UHFFFAOYSA-N 1-benzothiophene-2-carboxamide Chemical compound C1=CC=C2SC(C(=O)N)=CC2=C1 GYSCBCSGKXNZRH-UHFFFAOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000208199 Buxus sempervirens Species 0.000 description 1
- GHVNFZFCNZKVNT-UHFFFAOYSA-N Decanoic acid Natural products CCCCCCCCCC(O)=O GHVNFZFCNZKVNT-UHFFFAOYSA-N 0.000 description 1
- 241000463291 Elga Species 0.000 description 1
- TUNFSRHWOTWDNC-UHFFFAOYSA-N Myristic acid Natural products CCCCCCCCCCCCCC(O)=O TUNFSRHWOTWDNC-UHFFFAOYSA-N 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 230000008238 biochemical pathway Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 238000000738 capillary electrophoresis-mass spectrometry Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- SECPZKHBENQXJG-UHFFFAOYSA-N cis-palmitoleic acid Natural products CCCCCCC=CCCCCCCCC(O)=O SECPZKHBENQXJG-UHFFFAOYSA-N 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011157 data evaluation Methods 0.000 description 1
- MMFCJPPRCYDLLZ-UHFFFAOYSA-N dec-2-enal Natural products CCCCCCCC=CC=O MMFCJPPRCYDLLZ-UHFFFAOYSA-N 0.000 description 1
- WHHGLZMJPXIBIX-UHFFFAOYSA-N decabromodiphenyl ether Chemical compound BrC1=C(Br)C(Br)=C(Br)C(Br)=C1OC1=C(Br)C(Br)=C(Br)C(Br)=C1Br WHHGLZMJPXIBIX-UHFFFAOYSA-N 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000001307 helium Substances 0.000 description 1
- 229910052734 helium Inorganic materials 0.000 description 1
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 238000001155 isoelectric focusing Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 235000013622 meat product Nutrition 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012808 pre-inoculation Methods 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 230000013777 protein digestion Effects 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000005070 ripening Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- NNNVXFKZMRGJPM-KHPPLWFESA-N sapienic acid Chemical compound CCCCCCCCC\C=C/CCCCC(O)=O NNNVXFKZMRGJPM-KHPPLWFESA-N 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- -1 small molecule aldehydes Chemical class 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- PHYFQTYBJUILEZ-IUPFWZBJSA-N triolein Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(OC(=O)CCCCCCC\C=C/CCCCCCCC)COC(=O)CCCCCCC\C=C/CCCCCCCC PHYFQTYBJUILEZ-IUPFWZBJSA-N 0.000 description 1
- 229960001322 trypsin Drugs 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8665—Signal analysis for calibrating the measuring apparatus
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8624—Detection of slopes or peaks; baseline correction
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
- H01J49/0036—Step by step routines describing the handling of the data generated during a measurement
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8624—Detection of slopes or peaks; baseline correction
- G01N30/8641—Baseline
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8658—Optimising operation parameters
- G01N30/8662—Expert systems; optimising a large number of parameters
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8675—Evaluation, i.e. decoding of the signal into analytical information
- G01N30/8686—Fingerprinting, e.g. without prior knowledge of the sample components
Landscapes
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Electron Tubes For Measurement (AREA)
- Investigating Or Analyzing Non-Biological Materials By The Use Of Chemical Means (AREA)
Abstract
クロマトグラフィーデータと質量分析データとの組み合わせからのデータを処理および評価するための、方法およびシステム。これらの方法およびシステムは、データの平滑化、および決定されたエントロピー値に基づく、データセットのクロマトグラムに関する線質係数の決定を包含する。1つの実施形態において、これらの方法およびシステムは、エントロピー値の決定の前に、データベースライン補正をさらに包含する。さらなる実施形態において、本発明によって処理されたクロマトグラムと、1つ以上のデータセットの1つ以上のクロマトグラムとの間の相関が決定される。好ましくは、この相関は、多変量解析を使用して実行される。
Description
【0001】
(発明の分野)
本発明は、データの処理および評価の分野に関する。特に、本発明は、質量クロマトグラフィーおよび質量分析のデータの処理および評価に関する。
【0002】
(関連出願の引用)
本願は、2000年8月3日に出願された、同時係属中の蘭国特許出願番号1015875、および2000年8月28日に出願された、同時係属中の蘭国特許出願番号1016034の利益を主張する。
【0003】
(背景)
質量分析技術、ならびに質量分析計(「MS」)の、広範な種々の分離および微小規模分離技術との組み合わせの両方における開発は、データ生成の観点から、MSの能力を急速に増加させている。近年の装置を使用して、上記データ(例えば、クロマトグラムおよび質量スペクトル)を獲得するために必要とされる時間は、もはや重要な要因ではない;むしろ、データを解析するために必要な時間が、重要な要因である。特に、データセットはしばしば、2桁〜3桁の範囲の質量対電荷(「m/z」)にわたって測定された、何千もの質量スペクトルを含む。このようなデータセットを使用する拡張した研究は、完全な解析が必要とされる場合に、数日を要し得る。特に、研究の環境において、この解析は、代表的に、高度に資格があり、その結果高価な人員によって、実行されなければならない。
【0004】
これに関連して、データの効率的な処理および評価を使用して、データの取り扱いの速度を改善することは、非常に望ましい。適用に依存して、情報の抽出は、異なる観点からアプローチされ得る。例えば、キャピラリー電気泳動/質量分析(CE/MS)または液体クロマトグラフィー/質量分析(LC/MS)による不純物の研究において、データの処理および評価の道具は、非常に低いレベルで存在する化合物の効率的なピーク検出を実行し得なければならない。他方で、非常に類似した複雑な混合物のスクリーニングおよび比較(例えば、急速に拡張しているプロテオミクス(proteomics)の分野において)が実施される場合には、データの処理および評価の道具は、複数の複雑な混合物に関するデータを相関付け得なければならない。
【0005】
質量分析とクロマトグラフィーとの組み合わせによって作成されたデータを処理するための1つの以前のアプローチは、Windigらに対する米国特許第5,672,869号(「’869特許」)である。’869特許は、生データを平滑化することによって、擬似ピークおよびノイズを分離する、データ処理アプローチを記載する。次いで、このアプローチは、処理されたデータと生データとを比較する。質量のトレースがバックグラウンドノイズのみを含む場合には、生データと処理されたデータとの間の差異が強調され、そしてこのアルゴリズムは、その特定の質量のトレースに対して、低い質量クロマトグラフィー線質(「MCQ」)値を割り当てる。他方で、ピークを含む質量のトレースには、高いMCQ値が割り当てられる。次いで、’869特許は、およその閾値より高いMCQを有する質量のトレースのみを選択することを教示する。
【0006】
しかし、特に複雑かつ/またはノイズの多いデータに対しては、適切な閾値がどれであるかは必ずしも明らかではない。例えば、高すぎる閾値を選択することによって、低い強度の信号に関するいくつかの関連する情報が失われ得、一方で低すぎる閾値を設定することは、実際にはバックグラウンドノイズにすぎない多くの「信号」を選択し得る。その結果、この問題に取り組むために、訓練された人員による生データと処理されたデータとの高価な目視検査が必要とされ得、従って、データ処理の効率および速度が低下する。
【0007】
従って、より効率的かつ明白なデータ処理を提供するデータ処理技術に対する必要性が、存在する。
【0008】
(発明の要旨)
本発明は、情報内容理論に適合し、そしてこの理論をデータ平滑化と組み合わせて、データの効率的かつ明白な評価をさらに容易にする、データ品質の尺度を提供する。特に本発明は、本明細書中でエントロピー値と呼ばれるものに基づいて、データ品質の尺度を提供する。本発明のエントロピー値のアプローチは、データ選択のためにあいまいさがより低い閾値を提供することによって、データの処理を改善する。その結果、例えば、本発明は、データを自分で調査および選択するために訓練された人員が必要とされ得る時間の量を減少させることによって、データの処理の速度を高める。
【0009】
本発明は、一方に擬似ピークおよびノイズと、他方に関連するデータとの間の分離が、より正確かつ明白に起こり、これによってデータの解析時間が短縮される、データ処理の方法を提供する。その結果、訓練された人員は、自分の時間をそのデータの解釈に使用し得る。同時に、本発明は、複雑な混合物のフィンガープリントを作成する選択肢を提供し、これらは、種々の分野(化学、薬学、医学、生物学、バイオテクノロジーなど)において、特に、ライフサイエンス(例えば、DNAフラグメント、タンパク質および代謝成分に関する生物学的材料の分析から)において次第に使用されるようになっている。
【0010】
1つの局面において、本発明は、データの処理および評価の方法を提供し、この方法は、クロマトグラムのデータポイントを平滑化する工程、およびこの平滑化クロマトグラムに対するエントロピー値を決定する工程を包含する。1つの実施形態において、この方法はまた、平滑化補正クロマトグラムに対するエントロピー値の決定の前に、クロマトグラムのデータポイントをベースラインに対して補正する工程を包含する。このクロマトグラムは、質量クロマトグラムまたは全イオン電流(「TIC」)クロマトグラムのいずれであってもよい。平滑化工程とベースライン補正工程の順序は、本発明に対して重要ではないことが、認識されるべきである。すなわち、クロマトグラムは、平滑化されてからベースライン補正されてもよく、またはベースライン補正されてから平滑化されてもよい。従って、用語「平滑化補正クロマトグラム」は、実施の特定の順序を示さないことが理解されるべきである。
【0011】
別の実施形態において、本発明の方法は、さらに、クロマトグラムに対する線質因子(すなわち、「IQ値」)を、データセットの複数のクロマトグラムに対するエントロピー値の評価に基づいて、決定する。好ましい実施形態において、この方法は、(補正クロマトグラムおよび/または平滑化補正クロマトグラムのいずれかの)個々のクロマトグラムを、そのIQ値に基づいて選択する。次いで、この方法は、これらの選択されたクロマトグラムを使用して、再構築された全イオン電流(「RIC」)クロマトグラムを作成する。この方法は、さらに、RICクロマトグラムから、1つ以上の質量信号を排除し得る。1つの実施形態において、1つ以上の質量信号は、個々の質量信号に対する質量信号線質値に基づいて、排除のために選択される。別の実施形態において、この方法は、これらの選択されたクロマトグラムを使用して、1つ以上の質量値に対して再構築された質量クロマトグラムを作成する。さらに、種々の実施形態において、RICクロマトグラムが、同じかまたは他のデータセットの他のクロマトグラムとの比較のためのフィンガープリントとして使用される。
【0012】
別の局面において、本発明は、平滑化クロマトグラムまたは平滑化補正クロマトグラムのいずれかを、データセットの複数のクロマトグラムと相関付ける、データの処理および評価の方法を提供する。平滑化補正クロマトグラム(または平滑クロマトグラム)のクロマトグラムおよびデータセットのクロマトグラムは、例えば、質量クロマトグラム、全イオン電流クロマトグラム、またはRICクロマトグラムであり得る。好ましい実施形態において、相関を決定する工程は、多変量解析を使用する工程を包含する。多変量解析の適切な形態としては、主成分分析(「PCA」)、判別式解析(「DA」)、部分最小自乗(「PLS」)、予測線形判別解析(「PLDA」)、ニューラルネットワーク、およびパターン認識技術が挙げられるが、これらに限定されない。
【0013】
本発明の別の実施形態において、複数の平滑化質量クロマトグラムのエントロピー値は、それぞれ計算され、そして格納され、その後所望であれば、これらのエントロピーが処理されるか、または場合によっては、計量化学方法および生物測定方法によって、これらのエントロピー値に従って選択される成分が処理される。成分選択の好ましい形態としては、多変量解析技術(PCA、DA、PLS、PLDA、ニューラルネットワーク)、パターン認識技術、およびフーリエ変換技術が挙げられる。別の実施形態において、選択された成分は、さらに、フィンガープリントを作成するために使用され、そしてこのフィンガープリントは、計量化学技術および生物測定技術と共に、種々の起源の複雑な混合物に対する特徴付け方法として使用される。
【0014】
別の局面において、本発明は、データの処理および評価のためのシステムを提供する。このシステムは、質量クロマトグラムのデータポイントを平滑化するための平滑化デバイス、および質量クロマトグラムのエントロピー値を決定するためのエントロピー計算デバイスを備えることを特徴とする。1つの実施形態において、このシステムはさらに、クロマトグラムのベースラインを補正するためのベースライン補正デバイスを備える。好ましくは、このシステムは、混合物の成分を分離するためのクロマトグラフ、および分離された成分が送達される分光計を備える。1つの実施形態において、このシステムはさらに、エントロピー値を格納するための格納デバイスを備える。
【0015】
別の局面において、本発明の方法およびシステムは、物質の混合物の化学成分を同定および定量するための方法に関し、この方法は、一般に、以下の工程を包含する:(1)この混合物を分離方法に供して、この混合物の成分を別個の物質に分離する工程;(2)この分離された物質を質量分析に供して、成分を検出および同定し、そして全イオン電流(「TIC」)クロマトグラム(またはイオン通電クロマトグラム)および質量スペクトルを獲得する工程;(3)質量スペクトルから質量を選択する工程;ならびに(4)各質量に対して質量クロマトグラムを獲得する工程。
【0016】
本発明の上記および他の特徴および利点、ならびに本発明自体は、以下の説明、図面、および添付の特許請求の範囲から、より完全に理解される。
【0017】
(詳細な説明)
混合物(または物質)中の成分の検出、同定および定量は、頻繁に、クロマトグラフィー(または電気移動)および分光法の組み合わせを利用する。図1は、液体クロマトグラフィーと質量分析との組み合わせ(「LC/MS」)によって得られた、全イオン電流(「TIC」)クロマトグラムの例を示す。
【0018】
クロマトグラフィーは、主として、分離技術として使用される。分離されるべき分子の混合物は、移動相と固定相との間で複数回交換される。これが起こる速度は、多くの要因(例えば、異なる分子の移動度、温度、および結合力)に依存する。各種の分子が移動相に残る時間の差異は、移動速度および物質の分離における差異を生じる。種々の種に対する移動速度の差異にかかわらず、従来のクロマトグラフィーの特異性は一般に、分離された成分の同定を可能にするには不十分である。従って、クロマトグラフィー技術は、代表的に、別の分析技術と連続して使用される。クロマトグラフィーと共に通常使用される技術は、質量分析である。
【0019】
従来のLC/MS技術において、クロマトグラフィーデバイス(またはクロマトグラフ)は、質量分析計に連結され、この分析計は、クロマトグラフからの移動相の出現の際に、移動相を繰り返し走査する。この質量分析計の各走査が、質量スペクトルを生じる。従って、多数の質量スペクトルが、しばしば、各分析に対して記録されて、非常に広範なデータセットを生じる。代表的に、「バックグラウンド」のみを含む複数のスペクトルが得られる。なぜなら、質量分析計が走査を始める場合、代表的に、目的の成分はクロマトグラフから出現しないからである。成分を含む移動相がクロマトグラフを出る場合には、この質量スペクトルは、一般に、変化(これは例えば、質量分析計に入る成分の型に依存する)を示す。代表的に、各質量スペクトル(または走査)は、多数のイオンを含み、これらは一緒になって、そのスペクトルに関連する全イオン電流を生じる。図1は、LC/MS技術に対して、この全イオン電流(例えば、強度)の例示的なプロットを、各質量スペクトル(すなわち、走査)に対して、時間(例えば、走査数)の関数として示す。従って、図1は、全イオン電流(「TIC」)クロマトグラムを示す。この全イオン電流クロマトグラムは、一般に、LC/MS技術の生データであり、そして成分検出のための基礎を形成する。代替のグラフは、時間(例えば、走査数)の関数としての、個々の質量対電荷の比のグラフであり、このグラフは、一般に、質量スペクトログラムとして公知である。
【0020】
本発明の方法は、クロマトグラフィー方法と質量分析方法との組み合わせから得られたデータを使用し得る。適切なクロマトグラフィー(すなわち、分離)方法としては、とりわけ、ガスクロマトグラフィー(「GC」)、液体クロマトグラフィー(「LC」)、電気移動法、電気泳動、キャピラリー電気クロマトグラフィー(「CE」)、等電収束法、および超臨界液体クロマトグラフィーが挙げられる。適切な型の質量分析としては、イオントラップ、飛行時間型MS、フーリエ変換MS、四重極、セクター計測またはMSハードウェア設計の複数の組み合わせが挙げられるが、これらに限定されない。MSハードウェアの複数の組み合わせとしては、とりわけ、三重四重極(QQQ)、QTOF、イオントラップ/セクター計測、四重極セクター、および高分解能質量クロマトグラフィーが挙げられる。クロマトグラフィーと質量分析との他の組み合わせ(LC/NMR、LC/UV、LC/MS/MS、GC/MS、CE/MS、CEC/MS、ITP/MS、IEF/MS、SFC/MSが挙げられるが、これらに限定されない)が使用され得る。
【0021】
本発明によるデータ平滑化は、当該分野で公知の多数の手順のいずれかによって、実行され得る。好ましくは、平滑化は、Savitsky−Golay関数を使用して実行される。1つの実施形態において、選択可能な平滑化ウィンドウWおよび選択可能な平滑化次数Oを用いるSavitsky−Golay関数が使用される。1つの実施形態において、W=8およびO=2の値が使用される。1つの実施形態において、本発明の方法は、次いで、平滑化クロマトグラムに対して、エントロピー値を決定する。別の実施形態において、エントロピー値の決定は、ベースラインに対する質量クロマトグラムの補正によって実行されて、平滑化補正クロマトグラムを作成する。
【0022】
本発明によるベースライン補正は、ピークが存在しない位置でさえもクロマトグラムの全てのピークを通ってベースラインが延びるとの仮定に基づく。1つの実施形態において、クロマトグラムの一次導関数および二次導関数が最初に誘発されて、ピークが存在する位置を演繹する。次いで、ベースラインの関数が、クロマトグラムの残りのデータポイントにわたってプロットされる。1つの実施形態において、ベースライン関数は、三次式近似補間のようなスプライン関数を含む。このベースライン関数を使用して、各データポイントにおけるベースラインの推定高さによって、元のクロマトグラムの各データポイントを補正する。これにより、補正クロマトグラムが生じる。好ましい実施形態において、この関数は、Savitsky−Golayアルゴリズムの補助によってプロットされる。
【0023】
Savitsky−Golayアルゴリズムおよび「平滑化」は、Numerical Recipes in C,第2版、The Art of Scientific Computing,W.H.Press,B.P.Flannery,S.A.Teukolsky,W.T.Vetterrling,Cambridge University Press,1988,ISBN 0−521−35465−Xに記載されている。
【0024】
1つの実施形態において、クロマトグラムの一次導関数および二次導関数が最初に誘発されて、ピークが存在する位置を演繹し、そして化学的情報(例えば、ピーク)を含む質量クロマトグラムが、TICクロマトグラムへの包含のために選択され、一方で実質的にバックグラウンドノイズまたは擬似ピークのみを含む質量クロマトグラムは、TICクロマトグラムから排除される。従って、得られるTICクロマトグラムにおける信号対ノイズ比は、実質的にノイズのみを含むクロマトグラムの選択的な排除によって、かなり増加される。
【0025】
別の局面において、特定の時間ウィンドウ(例えば、走査数範囲)内に入る質量スペクトルのみが、処理のために選択される。例えば、低い走査数(すなわち、初期の時間)からの質量スペクトルを処理することは、望ましくなくあり得る。なぜなら、例えば、このようなスペクトルは、移動相のみを含み得、そして目的の化学的または生物学的情報(例えば、成分)を含まないかもしれないからである。同様に、高い走査数(すなわち、遅い時間)からの質量スペクトルは、いかなる認識可能な化学的情報も生物学的情報も含まないかもしれない。すなわち、目的の成分の全ては、クロマトグラフからすでに出てしまったかもしれない。
【0026】
ベースライン補正および/またはデータポイント平滑化の後に、本発明の方法は、平滑化された(または平滑化および補正された)クロマトグラムに対して、実質的に以下の式に従って、エントロピー値を決定する:
【0027】
【数2】
ここで、Hは、エントロピー値であり、そしてpiは、クロマトグラムのi番目のデータポイントの強度値である。等式1はまた、ゲーム理論と関連して、Numerical Recipes in Cに記載されている。別の実施形態において、エントロピー値は、実質的に、以下の式によって決定される:
【0028】
【数3】
ここで、Hおよびpiは、上記と同じ意味を有する。他の実施形態において、等式1および/または2のエントロピー値Hは、これらの等式の右辺の合計の負の値である。しかし、エントロピーが正の値として表されるか負の値として表されるかは、本発明において重要ではない。
【0029】
1つの実施形態において、TICクロマトグラムが、質量クロマトグラムから作成され、これらは、各個々の質量クロマトグラムに関連するエントロピー値に基づく重み付けによって重み付けされている(すなわち、エントロピーで重み付けされている)。得られるTICクロマトグラムは、本発明によるRICクロマトグラムの1つのバージョンである。
【0030】
別の実施形態において、質量クロマトグラム(これは、補正されているかまたは平滑化および補正されている)は、個々のクロマトグラムのエントロピー値に基づいて、TICクロマトグラムへの包含について選択される。1つの実施形態において、この選択は、エントロピーの逆数である線質係数(「IQ」)に基づく。別の実施形態において、IQは、エントロピーの負の逆数である。しかし、先に説明したように、IQ値(またはエントロピー値)の単純な符号の変化は、本発明の実施に対して、実質的に、重要な効果を有さない。好ましくは、IQ値は、個々のIQ値を、データセットに対して決定された最大IQ値で除算することによって、0と1との間で決定される。
【0031】
好ましい実施形態において、クロマトグラムの選択およびエントロピー値に基づく決定は、以下の式によって実質的に決定される、線質係数(「IQ」)に基づく:
IQ=1−(H/Hmax) 等式(3)
ここで、IQは、線質係数であり、Hは、平滑化補正クロマトグラム(または平滑化クロマトグラム)のエントロピー値であり、そしてHmaxは、データセットのクロマトグラムに対して決定された最大エントロピー値である。上記のように、他の実施形態において、等式3のIQ値は、この等式の右辺の負の値である。従って、IQ値の絶対値が高い(エントロピーが低い)クロマトグラムは、代表的に、強い信号および少ないノイズを含む。IQ値の絶対値が低いクロマトグラムは、代表的に、多くのノイズおよび少ない信号を含む。クロマトグラム(TICクロマトグラム、またはRICクロマトグラムのいずれか)をそのIQ値に関して並べることによって、それらの情報内容によるクロマトグラムの区別が可能となり、これによって、有用な信号のトレースが、実質的なノイズのトレースから分離され得る。
【0032】
図1は、LC/MSによって得られた、混合物についてのTICクロマトグラムを示す。図1のTICクロマトグラムは、生データである。すなわち、本発明によって処理されていないデータである。図2は、図1を構成する質量クロマトグラムのエントロピー値を示し、ここで、これらのエントロピー値は、線質係数IQとして与えられている。従って、図2のX軸は、質量クロマトグラムに関連する質量対電荷の比(「m/z」)であり、そしてY軸は、質量クロマトグラムのIQ値である。また、水平線として、選択されたIQ閾値がプロットされている。まとめると、図2は、エントロピー値に基づく質量クロマトグラムの選択を示す。
【0033】
1つの実施形態において、このように選択された質量クロマトグラムは、再構築された全イオン電流(「RIC」)クロマトグラムを作成するために使用される。1つの実施形態において、この選択されたクロマトグラムは、エントロピーで重み付けされている。別の実施形態において、選択された質量クロマトグラムに関連するイオン電流は、その質量クロマトグラムにおける最も強い値のイオン電流と等しく設定される。この後者のRICクロマトグラム作成アプローチは、本明細書中において、IQ強度で重み付けされたRICクロマトグラムと称される。
【0034】
図3は、図1のTICクロマトグラムについてのRICクロマトグラムを示す。図3のRICクロマトグラムは、本発明の方法に従って、図2に示す閾値より高いIQ値を有する質量クロマトグラムを選択することによって、作成された。図1と図3とのクロマトグラムの比較は、ノイズの有意な減少を明らかに示す。ここでピークは、ノイズを超えて容易に区別可能である。
【0035】
1つの実施形態において、本発明は、さらに、RICクロマトグラムから1つ以上の質量信号を排除する。1つの実施形態において、特定の成分に関連する質量が排除される。このような成分としては、例えば、移動相、固定相、および/または既知もしくは疑われる夾雑物が挙げられ得る。このような夾雑物は、例えば、分析中の混合物の一部、またはクロマトグラフィー技術もしくは質量分析技術に関連するものを含み得る。別の実施形態において、個々の質量信号の質量信号線質値に基づいて、排除のために、1つ以上の質量信号が選択される。質量信号線質係数は、関連する質量スペクトルまたは質量クロマトグラムについてのエントロピー値(例えば、等式(1)〜(3)によって提供されるような)に基づき得るか、あるいは質量信号線質の何らかの他の測定値(例えば、信号対ノイズ比)に基づき得る。
【0036】
本発明の別の実施形態において、RICクロマトグラムは、1つ以上の質量信号の選択された群がそこから排除されて作成されるが、この排除操作は、RICクロマトグラム中にピークが残らなくなるまで続けられる。
【0037】
別の実施形態において、時間単位あたりの強度の合計をクロマトグラムとして使用する(例えば、TICクロマトグラム)かわりに、本発明は、単位時間あたりで合計されたエントロピー値を使用して、全エントロピークロマトグラム(「TEC」)を得る。さらに、クロマトグラムがエントロピー値に基づいて選択される、この実施形態の1つのバージョンにおいて、得られるクロマトグラムは、再構築されたエントロピークロマトグラム(「REC」)を含む。
【0038】
さらに、1つの実施形態において、質量クロマトグラムは、これらが関連するピークを含む尤度に従って、またはこれらが特定の成分に関連する尤度に従って、格納される。以下に説明されるように、エントロピー値に基づくデータ処理は、クロマトグラムの選択に対してさほどあいまいではない閾値を提供する。例えば、本発明によって作成されたRICクロマトグラムは、混合物の分析の際に、操作者に非常に良好な補助を提供する。
【0039】
図4aおよび4bを参照すると、クロマトグラフィー−質量分析装置(例えば、LC/MS)から得られたデータを処理するための、本発明の方法の種々の実施形態が示されている。1つの実施形態において、本発明の方法は、クロマトグラムを選択することによって開始する(ボックスA)。選択されたクロマトグラムは平滑化され(ボックスB)、次いでベースライン補正が実行される(ボックスC)。この平滑化およびベースライン補正の順序はまた、逆にされ得る。平滑化工程およびベースライン補正工程が実行された後に、平滑化補正クロマトグラムのエントロピーが決定される(ボックスD)。(N=N+1)を介するループによって示されるように、ボックスA、B、CおよびDのこれら工程は、全ての所望のクロマトグラムが処理されるまで(すなわち、「全てが処理されたか?」の問いに対して「YES」になるまで)、複数のクロマトグラムに対して実行され得る。
【0040】
図4Bを参照すると、質量クロマトグラムは、エントロピー値および/または線質係数IQに従って並べられ得(ボックスE)、そして所望であれば、表示され得る(ボックスF)。1つの実施形態において、表示されたIQ値(例えば、図2のように)に基づいて、閾値が設定され得る(ボックスG)。この方法の1つの実施形態において、RICクロマトグラムが、閾値より高いIQ値を有する平滑化補正クロマトグラムから作成される。
【0041】
次いで、エントロピー値が設定されたエントロピー閾値を越える、選択された質量クロマトグラム(ボックスHとGとの間のループ線によって示されるように)が使用されて、再構築されたTIC(すなわち、RIC)クロマトグラムが作成される(ボックスJ)。1つの実施形態において、この方法はまた(ボックスK)、関連するエントロピー値のリストを作成し、そして選択された平滑化補正クロマトグラムを表示する(ボックスL)。さらに、ボックスMおよびNによって示されるように、1つの実施形態において、クロマトグラムおよび/または選択された質量スペクトルが、所望であれば、ボックスF、GおよびHの工程のいずれかにおいて表示されて、データの解析を容易にし得る。
【0042】
別の局面において、本発明は、クロマトグラム(本発明の方法によって処理または作成された)とデータセットの複数のクロマトグラムとを相関付ける、データの処理および評価の方法を提供する。1つの実施形態において、本発明は、RICクロマトグラムを、1つ以上のTICクロマトグラム、または同じかもしくは異なるデータセットのRICクロマトグラムと相関付ける。従って、種々の実施形態において、RICクロマトグラムは、混合物に対するフィンガープリントとして働き得、これは後に、計量化学/生物測定技術によって、他の既知または未知の混合物と比較され得る。別の実施形態において、エントロピーで重み付けされたRICクロマトグラムが、フィンガープリントとして使用される。別の実施形態において、IQスペクトルが、フィンガープリントとして使用される。
【0043】
本発明は、図5に示すように、混合物のフィンガープリントを作成する種々の実施形態を提供する。図5の各実施形態は、質量クロマトグラム(すなわち、m/zトレース対時間)からなるデータセットで開始する。1つの実施形態において、m/z値の関数としてIQ値が決定されて、IQスペクトルを作成し(これの例は図2に示される)、次いでこのIQスペクトルが、多変量データ処理操作のための入力として使用される。1つの実施形態において、全IQスペクトルが使用され、そして他の実施形態において、IQの閾値が使用される。なお別の実施形態において、IQ強度で重み付けされたRICクロマトグラムが、多変量データ処理操作のための入力として使用される。
【0044】
図5に示す別の実施形態において、RICクロマトグラムは、多変量データ処理操作のための入力として使用される。別の実施形態において、時間単位あたりの強度の合計を入力クロマトグラムとして使用する代わりに、単位時間あたりの合計されたエントロピー値(すなわち、RECクロマトグラム)が、多変量データ多処理操作のための入力として使用される。別の実施形態において、例えば、エントロピー値に基づく質量クロマトグラムの選択がなされない場合には、TICクロマトグラムが、多変量データ処理操作のための入力として使用される。同様に、選択がなされない場合には、1つの実施形態は、TECクロマトグラムを入力として使用する。1つ以上の形態での、m/z次元と時間次元との両方の多変量解析による評価の組み合わせは、エントロピー選択ありまたはなしで、分光法と結び付いた分離方法による、複雑な混合物の特徴付けの新規方法を提供する。
【0045】
特定の実施形態において、平滑化質量クロマトグラム(または平滑化補正質量クロマトグラム)が、化学成分の同定のためのフィンガープリントとして使用される。1つの実施形態において、選択された質量に関連する平滑化質量クロマトグラム(または平滑化補正質量クロマトグラム)と、他の全ての質量クロマトグラムとの間の相関が、決定される。次いで、質量クロマトグラムは、それらの相関係数に基づいて、評価され得る。
【0046】
いくつかの実施形態において、上記方法の機能性は、汎用コンピュータにソフトウェアとして実装され得る。さらに、このようなプログラムは、コンピュータのランダムアクセスメモリの一部を蓄えて、ベースライン補正デバイス、平滑化デバイス、エントロピー値の決定のためのエントロピー値デバイス、クロマトグラムのエントロピー値に基づいてクロマトグラムを選択するための選択デバイス、ならびにクロマトグラムおよび質量スペクトルを用いる操作およびそれに対する操作を提供し得る。このような実施形態において、プログラムは、多数の高レベルの言語(例えば、FORTRAN、PASCAL、C、C++、またはBASIC)のいずれか1つで書き込まれ得る。さらに、このプログラムは、スクリプト、マクロで書き込まれ得るか、または市販のソフトウェアに機能的に埋め込まれ得る(例えば、EXCELまたはVISUAL BASIC)。さらに、このソフトウェアは、コンピュータに常駐するマイクロプロセッサのためのアセンブリ言語に実装され得る。例えば、このソフトウェアは、IBM PCまたはPCクローンで実行されるよう構成される場合には、Intel80×86アセンブリ言語で実装され得る。このソフトウェアは、「コンピュータ読み取り可能な媒体」(例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、磁気テープ、PROM、EPROM、またはCD−ROM)が挙げられるがこれらに限定されない、製品に埋め込まれ得る。
【0047】
(実施例の実験アプローチ)
実施例は、以下に記載される実験アプローチを共有する。これらの実施例は、CE/MS、LC/MS、および/またはGC/MS技術によって得られるデータの評価を記載する。
【0048】
(試薬および材料)
アセトニトリルを、Biosolve B.V.(Valkenswaard,The Netherlands)から購入し、そしてメタノール、ギ酸および酢酸を、Merck(Darmstadt,Germany)から購入した。水を、ELGAシステムを通して精製した。酢酸アンモニウム、トリプシン、ウシ血清アルブミン(BSA)、ジチオトレイトール(DTT)およびシトクロムCを、Sigma(Deisenhofen,Germany)から購入した。ヨードアセトアミドを、Fluka(Buchs,Switzerland)から購入した。ヘキサメトリンジブロミド(hexametrine dibromide)(ポリブレン)を、Aldrich(Steinheim,Germany)から購入した。
【0049】
(CE/MS技術)
CE/MS測定を、従来のESIインターフェースではなくナノエレクトロスプレーx−y−zポジショナー(Protana(Odense,Denmark))を取り付けたLCQ(Thermoquest,San Jose,CA,USA)で実施した。このCE装置は、Prince Technologies(Emmen,The Netherlands)製のPrinceであった。内径(i.d.)20μm、長さ65cmの、テーパ状で金メッキされた、使用したCEキャピラリーは、New Objective(Cambridge,MA,USA)製であった;これらを、伝導性ペーストLeit C(Protana)を介してx−y−zポジショナーのノズルに接続した。CEキャピラリーの内壁を、2% v/vエチレングリコール中の5% w/vのポリブレン溶液で、その日の始めに、Batemanら、Rapid Comm.Mass Speectrom.,第11巻、307頁(1997)によって記載された方法の改変を使用して、コーティングした。一連のコーティング工程を、2barの圧力で以下のように実施した:ポリブレン溶液(20分)、水(5分)、バックグラウンド電解質(20分)。バックグラウンド電解質(「BGE」)は、50% v/v MeOH中50mMのAcOHであった。−25kVの電位をキャピラリーの注入端に印加し、そして+1.7kVをナノエレクトロスプレーチップに印加することによって、分離を行った。注入容量は約3nLであった。
【0050】
(LC/MS技術)
LC/MS測定を、LCQ DECA(Thermoquest,San Jose,CA,USA)で、従来のESI源を陽イオンモード検出において使用して、実施した。スプレー電圧は3.5kVであり、一方で加熱されたキャピラリー温度は250℃であった。25μL/分の溶出フローを、EldexマイクロLC(Separations)によって提供した。分析を、spherisorb C18−シリカ(粒子サイズ5μm、LC Packings(Amsterdam,The Netherlands)から購入した)を充填した15cm×内径800μmのカラムで実施した。注入ループは、5μLであった。勾配溶出を実施した。移動相A:0.1% v/v HCOOH中10mM NH4OAc;移動相B:0.1% v/v HCOOH、80% v/v MeCN中10mM NH4OAc。勾配:0分・10%B/10分・30%B/25分・60%B/30分・100%B。
【0051】
(GC/MS技術)
質量分析検出を、HP 5973 MSDシステムによって、電子衝撃源を介して実施した。電子エネルギーは70eVであり、源温度は230℃であった。ガスクロマトグラフィーを、HP 6890 GCシステムを使用して、DB5−MSでコーティングした30m×内径320μmのカラムで実施した。ヘリウムの流れは48cm/秒であり、そして温度勾配は、以下であった:0分・25℃/4分・25℃/10分・75℃/22分・135℃/24分・250℃/30分・250℃。多変量解析の前に、シフトルーチンを全データセットのTICクロマトグラムに適用して、小さな保持時間の変動を補正した。GC−MS TICプロフィールのデータ解析を、MATLAB(The MathWorks,Inc.,Natick,MA,USA)によって実行した。
【0052】
(タンパク質消化)
ウシ血清アルブミンをDTTによって還元し、そしてヨードアセトアミドを使用してカルバミドメチル化し、その後、トリプシンで消化した(酵素/基質比1:30)。シトクロムCを、最初に変性せずに消化した。消化を、100mM NH4HCO3緩衝液(pH7.5)中37℃で一晩実施した。PCA分析のために使用したBSA消化サンプルの最終濃度は、10μMであった。
【0053】
(ソーセージの醗酵)
揮発性化合物のGC/MSプロフィールを、細菌株(Lactobacillus FC1、Staphylococcus carnosus)およびこれらの対応する無細胞酵素抽出物を接種したソーセージバターから、獲得した(表1)。サンプリング(Likens−Nickerson抽出)および引き続くGC−MSによる分析を、接種前、および醗酵中の3つの異なる時点(t=24時間、66時間、および3週間)に実施した。さらに、接種なしのコントロール実験を実施した。
【0054】
【表1】
(実施例1:MCQアプローチとの比較)
第一の実施例は、LC/MSデータおよびCE/MSデータの、Windigら、Anal.Chem.第68巻、3602頁(1996)のCODAアルゴリズムおよび本発明の方法による評価を比較する。この比較を、LC/MSデータおよびCE/MSデータに対して実施した。CE/MSデータを考慮すると、通電クロマトグラムにおけるスパイクの存在およびピークの鋭利さによって、さらなる挑戦が提示された。
【0055】
CODAアルゴリズムは、MCQ値を、生データファイルの全ての整数のm/z値の質量クロマトグラムに対して割り当てる。高いMCQ値は、特定の質量のトレースがピークを含むことの指標である。閾値のMCQを選択することによって、そして選択された閾値より低いMCQ値を有する質量のトレース(すなわち、質量クロマトグラム)を排除することによって、特定のクロマトグラムのみが、RICクロマトグラムの作成のために選択される。
【0056】
本発明の方法もまた使用して、データを処理し、そしてIQ値(実質的に等式3に従って決定された)を、生データファイルの全ての整数のm/z値の質量クロマトグラムに対して割り当てた。高いIQ値は、特定の質量のトレースがピークを含むことの強い指標である。上記のように、閾値IQを使用して、質量クロマトグラムを選択して、TICクロマトグラムをコンパイルし、そして/またはRICクロマトグラムを作成する。
【0057】
LC/MSデータに対して、本発明の方法は、図6Aおよび6Bに示すように、CODAアルゴリズムより改善された性能を示す。これらの図において、MCQおよびIQのプロットが比較されている。この場合に試験されたサンプルは、500nMの濃度でのBSA消化物のLC/MS分析であった。図6A(MCQプロット)と図6B(IQプロット)との比較から、正確なカットオフ値の設定が、IQプロット(図6B)においてより容易であったことが、容易にわかり得る。対照的に、MCQプロットにおいては、妥協が選択されなければならなかった:高すぎる閾値を使用することによって、低いm/z領域における何らかの潜在的な関連する情報が失われたかもしれず(図6Aを参照のこと)、一方で低すぎる閾値を設定することは、バックグラウンドノイズにすぎない多くの高いm/z値を選択した。
【0058】
本発明が非常に低いS/Nピークを検出し得るという証拠として、図6Aおよび6Bからの2つの例示的なピークを、図7Aおよび7Bに示す。ピークAが図7Aに示され、そしてピークBが図7Bに示される。これら2つのトリプシン消化フラグメントのピークAおよびBは、LC/MSによって、それぞれ3および7のS/N比で、検出された。それにもかかわらず、これらには、カットオフの閾値より十分に高いMCQ値およびIQ値が割り当てられた。
【0059】
(実施例2:香味プロフィールの事例研究)
第二の実施例は、かなり複雑なサンプルからのデータを処理および評価するための、本発明の方法の使用を示す。この実施例は、MSデータの取り扱いのために多変量解析(「MVA」)アプローチを包含する実施形態を示し、2つの事例研究が記載される。第一の事例において、本発明は、複雑なサンプルに対して主成分分析(「PCA」)を実行するために使用される。このアプローチにおいて、サンプルは、LC/MS分析によって検出された異なる質量における情報内容に基づいて、MVAを使用して、クロマトグラム間の相関を決定することによって、比較される。二次元プロットを、所定のサンプルに代表的なスポットを用いて作成した。これらのプロットにおいて、類似の質量に関する類似の情報を有するサンプルを一緒にクラスター化し、一方でより類似でないサンプルを、より大きな距離に配置する。これらの二次元プロットを、ペプチド/タンパク質プロフィールに対するパターン認識の手段として効果的に変化させ得る。
【0060】
本発明の多変量解析実施形態に関する、第二の事例研究として、GC/MSデータへの適用が実証される。複雑な香味のプロフィールを、部分的にモデルとみなした。なぜならこれらは、非常に詳細に、存在する化合物の同一性および化合物自体の間の強度比に関して、分析され得るからである。香味のプロフィールの場合には、MVAは、例えば、化合物間の複雑な関係を検出して生化学的経路を解明するために使用され得る。さらに、MVAは、観察される傾向および差異に関連するピークの選択的な検出を可能にする。負荷プロットは、これらの差異を可視化し、そして決定するために有用である。これらの負荷プロットは、2つの細菌株およびそれらの対応する無細胞酵素抽出物によって誘導される、醗酵した肉製品(ソーセージバター)における香味化合物の形成に関する研究に、適用されてきた。
【0061】
上記のように、1つの実施形態において、相関が、本発明によって処理されたクロマトグラムと、1つ以上のデータセットのクロマトグラム(これもまた、本発明によって処理され得る)との間で決定される。相関は、例えば、質量クロマトグラム、IQスペクトル、TICクロマトグラム、およびRICクロマトグラムの間で、決定され得る。この実施例において、多変量解析を使用して、相関を決定した。かなり複雑な、非常に類似したサンプルが、迅速にスクリーニングされなければならず、そしてクロマトグラム間の差異が認識されなければならない場合において、本発明によるMVAは、データの評価の速度を増大させ得る。複雑かつ類似のサンプルの迅速な分析に対する必要性は、非常にしばしば、製薬産業およびバイオテクノロジー産業における実際の状況であり、そしてプロテオミクスおよび体液プロフィーリングのような研究分野において、ますます直面する問題となる。
【0062】
生物学的サンプルのパターン認識を評価するために、1つの供給業者からの2つのBSAバッチおよび別の供給業者からの第三のバッチを、還元し、カルバミドメチル化し、消化し、そして上記のように、LC/MSによって分析した。データファイルを、主成分分析(PCA)に供して、IQスペクトル間の相関を決定した。図8に見られ得るように、LC/MSの実行に対応するデータセット全体が、スコアプロットにおいて点として示される。3つのわずかに異なるサンプルは、スコアプロットの3つの異なる領域に集中し、このことは、パターン認識アプローチが、この特定のクラスのLC/MSデータに適用され得ることを示す。負荷プロットの評価は、さらに、バッチ間の差異を明らかにし、そして品質評価基準を提供した。
【0063】
図9A〜Dは、Hとして同定される醗酵実験の、GC/MS TICクロマトグラムの例を示し(表1もまた参照のこと)、ここで、Lactobacillus、Staphylococcus carnosusおよびStaphyllococcus carnosus無細胞抽出物が、適用された。図9Aは、実験E0(接種前のバター、すなわちコントロールバター)のクロマトグラムを示す(表1もまた参照のこと)。図9B〜9Dは、それぞれ、実験H2、H4およびH7の接種物のTICクロマトグラムを示す。実験E0、H2、H4およびH7のTICクロマトグラムにおいて、ヘキサデカナール(ピーク45)、オクタデカナール(ピーク49)、ならびに高級脂肪酸であるテトラデカン酸、ヘキサデセン酸、ヘキサデカン酸、オクタデカジエン酸、オレイン酸、およびオクタデカン酸の濃度の強い増加が、醗酵の間に観察された(図9A〜D;それぞれピーク44、46、47、50、51および52)。しかし、二番目に主要な効果が見られた:低分子のアルデヒドおよび脂肪酸の濃度の増加。この効果は、ピーク4(ペンタナール)、9(ヘキサナール)、32(デセナール)、34(デカジエナール)、35(デカジエナール異性体)および36(デカン酸)に対して、醗酵の間の早期に観察された(図9B)。これらのより短鎖の酸化生成物は、コントロール実験(図9A)には存在しなかった。
【0064】
主成分分析(PCA)を、TICクロマトグラムの全ての時間ポイント(すなわち、質量スペクトル)を使用して適用し、これらのTICクロマトグラム間で、相関を決定した。これにより、スコアプロットおよび詳細な負荷プロットが生じた。熟成の間の香味化合物の形成における差異は、細菌株によって誘導され、そして適用される酵素混合物は、これらのプロットを使用してモニタリングされた。スコアプロット(PC1対PC2、図10)は、醗酵の間に起こる主要な傾向の調査を提供する。PC1およびPC2の対応するクロマトグラフ負荷パターンが、それぞれ図11Aおよび11Bに与えられる。コントロール実験のスペクトル(E0、E2、E4およびE7で標識されるポイント)は、接種実験のスペクトル(B、D、F、GおよびHで標識されるデータポイント)と比較して、異なる方向へのシフトを示した。さらに、より小さなシフトが起こった。これは、化学組成におけるより小さな変化を示す。
【0065】
添加された細菌を含む実験は、一般に、低級アルデヒドおよび脂肪酸の濃度の増加を示した。この傾向は、主として、PC2(これは、短鎖アルデヒドおよび酸に対する主軸である)に沿うシフトによって代表される。より長鎖のアルデヒドおよび酸の濃度の強い増加は、PC1によってほとんど排他的に表される。株および無細胞抽出物を添加された、表1の実験の一般的な傾向は、Fと同定された実験(LactobacillusおよびStaphylococcus carnosusを用いる)、およびHと同定された実験(Lactobacillus、Staphylococcus carnosusおよびStaphylococcus carnosusの無細胞抽出物を用いる)に対して特に目立つが、醗酵の最後の段階(F7およびH7)の間の高濃度の長鎖アルデヒドおよび脂肪酸の形成は、図10のスコアプロットに反映される。この実施例は、本発明の実施による、複雑なクロマトグラフィー−質量分析データの効果的な処理および評価を示す。
【0066】
本発明は、特定の実施形態を参照して特に示され、そして記載されたが、形式および細部における種々の変化が、添付の特許請求の範囲によって規定される本発明の意図および範囲から逸脱することなく、本発明においてなされ得ることが、当業者によって理解されるべきである。従って、本発明の範囲は、添付の特許請求の範囲によって示され、従って、特許請求の範囲の意味および均等物の範囲内の全ての変化は、包含されることが意図される。
【図面の簡単な説明】
【図1】図1は、質量分析計と組み合わせた液体クロマトグラフ(LC/MS)によって獲得した場合の、全イオン電流(TIC)クロマトグラムの例を示す。
【図2】図2は、クロマトグラムの計算されたIQ値の例示的なプロット、すなわち、IQスペクトルを示す。
【図3】図3は、図1のTICクロマトグラムに対する再構築された全イオン電流(RIC)クロマトグラムを示す。
【図4a】図4aは、本発明の方法の実施形態の流れ図である。
【図4b】図4bは、本発明の方法の実施形態の流れ図である。
【図5】図5は、生物測定/計量化学技術による、選択された成分またはエントロピーで重み付けされた成分の処理の実施形態の、流れ図である。
【図6】図6Aおよび6Bは、実施例1による消化されたBSAの500nMでのLC/MS泳動に対する、MCQプロットとIQプロットとの比較を示す。
【図7】図7Aおよび7Bは、それぞれ図6Aおよび6Bにおいて「A」および「B」と印したピークを示す。
【図8】図8は、実施例2による3つの異なるBSA消化物のセットに対するスコアプロットを示す。
【図9A】図9Aは、実施例1および2においてHと同定された実験のセットに対する、ガスクロマトグラフィー/質量分析(GC/MS)TICクロマトグラムを示す。
【図9B】図9Bは、実施例1および2においてHと同定された実験のセットに対する、ガスクロマトグラフィー/質量分析(GC/MS)TICクロマトグラムを示す。
【図9C】図9Cは、実施例1および2においてHと同定された実験のセットに対する、ガスクロマトグラフィー/質量分析(GC/MS)TICクロマトグラムを示す。
【図9D】図9Dは、実施例1および2においてHと同定された実験のセットに対する、ガスクロマトグラフィー/質量分析(GC/MS)TICクロマトグラムを示す。
【図10】図10は、実施例2によるPC1対PC2のスコアプロットを示す。
【図11】図11Aおよび11Bは、実施例2によるPC1およびPC2に対する負荷プロットを示す。
(発明の分野)
本発明は、データの処理および評価の分野に関する。特に、本発明は、質量クロマトグラフィーおよび質量分析のデータの処理および評価に関する。
【0002】
(関連出願の引用)
本願は、2000年8月3日に出願された、同時係属中の蘭国特許出願番号1015875、および2000年8月28日に出願された、同時係属中の蘭国特許出願番号1016034の利益を主張する。
【0003】
(背景)
質量分析技術、ならびに質量分析計(「MS」)の、広範な種々の分離および微小規模分離技術との組み合わせの両方における開発は、データ生成の観点から、MSの能力を急速に増加させている。近年の装置を使用して、上記データ(例えば、クロマトグラムおよび質量スペクトル)を獲得するために必要とされる時間は、もはや重要な要因ではない;むしろ、データを解析するために必要な時間が、重要な要因である。特に、データセットはしばしば、2桁〜3桁の範囲の質量対電荷(「m/z」)にわたって測定された、何千もの質量スペクトルを含む。このようなデータセットを使用する拡張した研究は、完全な解析が必要とされる場合に、数日を要し得る。特に、研究の環境において、この解析は、代表的に、高度に資格があり、その結果高価な人員によって、実行されなければならない。
【0004】
これに関連して、データの効率的な処理および評価を使用して、データの取り扱いの速度を改善することは、非常に望ましい。適用に依存して、情報の抽出は、異なる観点からアプローチされ得る。例えば、キャピラリー電気泳動/質量分析(CE/MS)または液体クロマトグラフィー/質量分析(LC/MS)による不純物の研究において、データの処理および評価の道具は、非常に低いレベルで存在する化合物の効率的なピーク検出を実行し得なければならない。他方で、非常に類似した複雑な混合物のスクリーニングおよび比較(例えば、急速に拡張しているプロテオミクス(proteomics)の分野において)が実施される場合には、データの処理および評価の道具は、複数の複雑な混合物に関するデータを相関付け得なければならない。
【0005】
質量分析とクロマトグラフィーとの組み合わせによって作成されたデータを処理するための1つの以前のアプローチは、Windigらに対する米国特許第5,672,869号(「’869特許」)である。’869特許は、生データを平滑化することによって、擬似ピークおよびノイズを分離する、データ処理アプローチを記載する。次いで、このアプローチは、処理されたデータと生データとを比較する。質量のトレースがバックグラウンドノイズのみを含む場合には、生データと処理されたデータとの間の差異が強調され、そしてこのアルゴリズムは、その特定の質量のトレースに対して、低い質量クロマトグラフィー線質(「MCQ」)値を割り当てる。他方で、ピークを含む質量のトレースには、高いMCQ値が割り当てられる。次いで、’869特許は、およその閾値より高いMCQを有する質量のトレースのみを選択することを教示する。
【0006】
しかし、特に複雑かつ/またはノイズの多いデータに対しては、適切な閾値がどれであるかは必ずしも明らかではない。例えば、高すぎる閾値を選択することによって、低い強度の信号に関するいくつかの関連する情報が失われ得、一方で低すぎる閾値を設定することは、実際にはバックグラウンドノイズにすぎない多くの「信号」を選択し得る。その結果、この問題に取り組むために、訓練された人員による生データと処理されたデータとの高価な目視検査が必要とされ得、従って、データ処理の効率および速度が低下する。
【0007】
従って、より効率的かつ明白なデータ処理を提供するデータ処理技術に対する必要性が、存在する。
【0008】
(発明の要旨)
本発明は、情報内容理論に適合し、そしてこの理論をデータ平滑化と組み合わせて、データの効率的かつ明白な評価をさらに容易にする、データ品質の尺度を提供する。特に本発明は、本明細書中でエントロピー値と呼ばれるものに基づいて、データ品質の尺度を提供する。本発明のエントロピー値のアプローチは、データ選択のためにあいまいさがより低い閾値を提供することによって、データの処理を改善する。その結果、例えば、本発明は、データを自分で調査および選択するために訓練された人員が必要とされ得る時間の量を減少させることによって、データの処理の速度を高める。
【0009】
本発明は、一方に擬似ピークおよびノイズと、他方に関連するデータとの間の分離が、より正確かつ明白に起こり、これによってデータの解析時間が短縮される、データ処理の方法を提供する。その結果、訓練された人員は、自分の時間をそのデータの解釈に使用し得る。同時に、本発明は、複雑な混合物のフィンガープリントを作成する選択肢を提供し、これらは、種々の分野(化学、薬学、医学、生物学、バイオテクノロジーなど)において、特に、ライフサイエンス(例えば、DNAフラグメント、タンパク質および代謝成分に関する生物学的材料の分析から)において次第に使用されるようになっている。
【0010】
1つの局面において、本発明は、データの処理および評価の方法を提供し、この方法は、クロマトグラムのデータポイントを平滑化する工程、およびこの平滑化クロマトグラムに対するエントロピー値を決定する工程を包含する。1つの実施形態において、この方法はまた、平滑化補正クロマトグラムに対するエントロピー値の決定の前に、クロマトグラムのデータポイントをベースラインに対して補正する工程を包含する。このクロマトグラムは、質量クロマトグラムまたは全イオン電流(「TIC」)クロマトグラムのいずれであってもよい。平滑化工程とベースライン補正工程の順序は、本発明に対して重要ではないことが、認識されるべきである。すなわち、クロマトグラムは、平滑化されてからベースライン補正されてもよく、またはベースライン補正されてから平滑化されてもよい。従って、用語「平滑化補正クロマトグラム」は、実施の特定の順序を示さないことが理解されるべきである。
【0011】
別の実施形態において、本発明の方法は、さらに、クロマトグラムに対する線質因子(すなわち、「IQ値」)を、データセットの複数のクロマトグラムに対するエントロピー値の評価に基づいて、決定する。好ましい実施形態において、この方法は、(補正クロマトグラムおよび/または平滑化補正クロマトグラムのいずれかの)個々のクロマトグラムを、そのIQ値に基づいて選択する。次いで、この方法は、これらの選択されたクロマトグラムを使用して、再構築された全イオン電流(「RIC」)クロマトグラムを作成する。この方法は、さらに、RICクロマトグラムから、1つ以上の質量信号を排除し得る。1つの実施形態において、1つ以上の質量信号は、個々の質量信号に対する質量信号線質値に基づいて、排除のために選択される。別の実施形態において、この方法は、これらの選択されたクロマトグラムを使用して、1つ以上の質量値に対して再構築された質量クロマトグラムを作成する。さらに、種々の実施形態において、RICクロマトグラムが、同じかまたは他のデータセットの他のクロマトグラムとの比較のためのフィンガープリントとして使用される。
【0012】
別の局面において、本発明は、平滑化クロマトグラムまたは平滑化補正クロマトグラムのいずれかを、データセットの複数のクロマトグラムと相関付ける、データの処理および評価の方法を提供する。平滑化補正クロマトグラム(または平滑クロマトグラム)のクロマトグラムおよびデータセットのクロマトグラムは、例えば、質量クロマトグラム、全イオン電流クロマトグラム、またはRICクロマトグラムであり得る。好ましい実施形態において、相関を決定する工程は、多変量解析を使用する工程を包含する。多変量解析の適切な形態としては、主成分分析(「PCA」)、判別式解析(「DA」)、部分最小自乗(「PLS」)、予測線形判別解析(「PLDA」)、ニューラルネットワーク、およびパターン認識技術が挙げられるが、これらに限定されない。
【0013】
本発明の別の実施形態において、複数の平滑化質量クロマトグラムのエントロピー値は、それぞれ計算され、そして格納され、その後所望であれば、これらのエントロピーが処理されるか、または場合によっては、計量化学方法および生物測定方法によって、これらのエントロピー値に従って選択される成分が処理される。成分選択の好ましい形態としては、多変量解析技術(PCA、DA、PLS、PLDA、ニューラルネットワーク)、パターン認識技術、およびフーリエ変換技術が挙げられる。別の実施形態において、選択された成分は、さらに、フィンガープリントを作成するために使用され、そしてこのフィンガープリントは、計量化学技術および生物測定技術と共に、種々の起源の複雑な混合物に対する特徴付け方法として使用される。
【0014】
別の局面において、本発明は、データの処理および評価のためのシステムを提供する。このシステムは、質量クロマトグラムのデータポイントを平滑化するための平滑化デバイス、および質量クロマトグラムのエントロピー値を決定するためのエントロピー計算デバイスを備えることを特徴とする。1つの実施形態において、このシステムはさらに、クロマトグラムのベースラインを補正するためのベースライン補正デバイスを備える。好ましくは、このシステムは、混合物の成分を分離するためのクロマトグラフ、および分離された成分が送達される分光計を備える。1つの実施形態において、このシステムはさらに、エントロピー値を格納するための格納デバイスを備える。
【0015】
別の局面において、本発明の方法およびシステムは、物質の混合物の化学成分を同定および定量するための方法に関し、この方法は、一般に、以下の工程を包含する:(1)この混合物を分離方法に供して、この混合物の成分を別個の物質に分離する工程;(2)この分離された物質を質量分析に供して、成分を検出および同定し、そして全イオン電流(「TIC」)クロマトグラム(またはイオン通電クロマトグラム)および質量スペクトルを獲得する工程;(3)質量スペクトルから質量を選択する工程;ならびに(4)各質量に対して質量クロマトグラムを獲得する工程。
【0016】
本発明の上記および他の特徴および利点、ならびに本発明自体は、以下の説明、図面、および添付の特許請求の範囲から、より完全に理解される。
【0017】
(詳細な説明)
混合物(または物質)中の成分の検出、同定および定量は、頻繁に、クロマトグラフィー(または電気移動)および分光法の組み合わせを利用する。図1は、液体クロマトグラフィーと質量分析との組み合わせ(「LC/MS」)によって得られた、全イオン電流(「TIC」)クロマトグラムの例を示す。
【0018】
クロマトグラフィーは、主として、分離技術として使用される。分離されるべき分子の混合物は、移動相と固定相との間で複数回交換される。これが起こる速度は、多くの要因(例えば、異なる分子の移動度、温度、および結合力)に依存する。各種の分子が移動相に残る時間の差異は、移動速度および物質の分離における差異を生じる。種々の種に対する移動速度の差異にかかわらず、従来のクロマトグラフィーの特異性は一般に、分離された成分の同定を可能にするには不十分である。従って、クロマトグラフィー技術は、代表的に、別の分析技術と連続して使用される。クロマトグラフィーと共に通常使用される技術は、質量分析である。
【0019】
従来のLC/MS技術において、クロマトグラフィーデバイス(またはクロマトグラフ)は、質量分析計に連結され、この分析計は、クロマトグラフからの移動相の出現の際に、移動相を繰り返し走査する。この質量分析計の各走査が、質量スペクトルを生じる。従って、多数の質量スペクトルが、しばしば、各分析に対して記録されて、非常に広範なデータセットを生じる。代表的に、「バックグラウンド」のみを含む複数のスペクトルが得られる。なぜなら、質量分析計が走査を始める場合、代表的に、目的の成分はクロマトグラフから出現しないからである。成分を含む移動相がクロマトグラフを出る場合には、この質量スペクトルは、一般に、変化(これは例えば、質量分析計に入る成分の型に依存する)を示す。代表的に、各質量スペクトル(または走査)は、多数のイオンを含み、これらは一緒になって、そのスペクトルに関連する全イオン電流を生じる。図1は、LC/MS技術に対して、この全イオン電流(例えば、強度)の例示的なプロットを、各質量スペクトル(すなわち、走査)に対して、時間(例えば、走査数)の関数として示す。従って、図1は、全イオン電流(「TIC」)クロマトグラムを示す。この全イオン電流クロマトグラムは、一般に、LC/MS技術の生データであり、そして成分検出のための基礎を形成する。代替のグラフは、時間(例えば、走査数)の関数としての、個々の質量対電荷の比のグラフであり、このグラフは、一般に、質量スペクトログラムとして公知である。
【0020】
本発明の方法は、クロマトグラフィー方法と質量分析方法との組み合わせから得られたデータを使用し得る。適切なクロマトグラフィー(すなわち、分離)方法としては、とりわけ、ガスクロマトグラフィー(「GC」)、液体クロマトグラフィー(「LC」)、電気移動法、電気泳動、キャピラリー電気クロマトグラフィー(「CE」)、等電収束法、および超臨界液体クロマトグラフィーが挙げられる。適切な型の質量分析としては、イオントラップ、飛行時間型MS、フーリエ変換MS、四重極、セクター計測またはMSハードウェア設計の複数の組み合わせが挙げられるが、これらに限定されない。MSハードウェアの複数の組み合わせとしては、とりわけ、三重四重極(QQQ)、QTOF、イオントラップ/セクター計測、四重極セクター、および高分解能質量クロマトグラフィーが挙げられる。クロマトグラフィーと質量分析との他の組み合わせ(LC/NMR、LC/UV、LC/MS/MS、GC/MS、CE/MS、CEC/MS、ITP/MS、IEF/MS、SFC/MSが挙げられるが、これらに限定されない)が使用され得る。
【0021】
本発明によるデータ平滑化は、当該分野で公知の多数の手順のいずれかによって、実行され得る。好ましくは、平滑化は、Savitsky−Golay関数を使用して実行される。1つの実施形態において、選択可能な平滑化ウィンドウWおよび選択可能な平滑化次数Oを用いるSavitsky−Golay関数が使用される。1つの実施形態において、W=8およびO=2の値が使用される。1つの実施形態において、本発明の方法は、次いで、平滑化クロマトグラムに対して、エントロピー値を決定する。別の実施形態において、エントロピー値の決定は、ベースラインに対する質量クロマトグラムの補正によって実行されて、平滑化補正クロマトグラムを作成する。
【0022】
本発明によるベースライン補正は、ピークが存在しない位置でさえもクロマトグラムの全てのピークを通ってベースラインが延びるとの仮定に基づく。1つの実施形態において、クロマトグラムの一次導関数および二次導関数が最初に誘発されて、ピークが存在する位置を演繹する。次いで、ベースラインの関数が、クロマトグラムの残りのデータポイントにわたってプロットされる。1つの実施形態において、ベースライン関数は、三次式近似補間のようなスプライン関数を含む。このベースライン関数を使用して、各データポイントにおけるベースラインの推定高さによって、元のクロマトグラムの各データポイントを補正する。これにより、補正クロマトグラムが生じる。好ましい実施形態において、この関数は、Savitsky−Golayアルゴリズムの補助によってプロットされる。
【0023】
Savitsky−Golayアルゴリズムおよび「平滑化」は、Numerical Recipes in C,第2版、The Art of Scientific Computing,W.H.Press,B.P.Flannery,S.A.Teukolsky,W.T.Vetterrling,Cambridge University Press,1988,ISBN 0−521−35465−Xに記載されている。
【0024】
1つの実施形態において、クロマトグラムの一次導関数および二次導関数が最初に誘発されて、ピークが存在する位置を演繹し、そして化学的情報(例えば、ピーク)を含む質量クロマトグラムが、TICクロマトグラムへの包含のために選択され、一方で実質的にバックグラウンドノイズまたは擬似ピークのみを含む質量クロマトグラムは、TICクロマトグラムから排除される。従って、得られるTICクロマトグラムにおける信号対ノイズ比は、実質的にノイズのみを含むクロマトグラムの選択的な排除によって、かなり増加される。
【0025】
別の局面において、特定の時間ウィンドウ(例えば、走査数範囲)内に入る質量スペクトルのみが、処理のために選択される。例えば、低い走査数(すなわち、初期の時間)からの質量スペクトルを処理することは、望ましくなくあり得る。なぜなら、例えば、このようなスペクトルは、移動相のみを含み得、そして目的の化学的または生物学的情報(例えば、成分)を含まないかもしれないからである。同様に、高い走査数(すなわち、遅い時間)からの質量スペクトルは、いかなる認識可能な化学的情報も生物学的情報も含まないかもしれない。すなわち、目的の成分の全ては、クロマトグラフからすでに出てしまったかもしれない。
【0026】
ベースライン補正および/またはデータポイント平滑化の後に、本発明の方法は、平滑化された(または平滑化および補正された)クロマトグラムに対して、実質的に以下の式に従って、エントロピー値を決定する:
【0027】
【数2】
ここで、Hは、エントロピー値であり、そしてpiは、クロマトグラムのi番目のデータポイントの強度値である。等式1はまた、ゲーム理論と関連して、Numerical Recipes in Cに記載されている。別の実施形態において、エントロピー値は、実質的に、以下の式によって決定される:
【0028】
【数3】
ここで、Hおよびpiは、上記と同じ意味を有する。他の実施形態において、等式1および/または2のエントロピー値Hは、これらの等式の右辺の合計の負の値である。しかし、エントロピーが正の値として表されるか負の値として表されるかは、本発明において重要ではない。
【0029】
1つの実施形態において、TICクロマトグラムが、質量クロマトグラムから作成され、これらは、各個々の質量クロマトグラムに関連するエントロピー値に基づく重み付けによって重み付けされている(すなわち、エントロピーで重み付けされている)。得られるTICクロマトグラムは、本発明によるRICクロマトグラムの1つのバージョンである。
【0030】
別の実施形態において、質量クロマトグラム(これは、補正されているかまたは平滑化および補正されている)は、個々のクロマトグラムのエントロピー値に基づいて、TICクロマトグラムへの包含について選択される。1つの実施形態において、この選択は、エントロピーの逆数である線質係数(「IQ」)に基づく。別の実施形態において、IQは、エントロピーの負の逆数である。しかし、先に説明したように、IQ値(またはエントロピー値)の単純な符号の変化は、本発明の実施に対して、実質的に、重要な効果を有さない。好ましくは、IQ値は、個々のIQ値を、データセットに対して決定された最大IQ値で除算することによって、0と1との間で決定される。
【0031】
好ましい実施形態において、クロマトグラムの選択およびエントロピー値に基づく決定は、以下の式によって実質的に決定される、線質係数(「IQ」)に基づく:
IQ=1−(H/Hmax) 等式(3)
ここで、IQは、線質係数であり、Hは、平滑化補正クロマトグラム(または平滑化クロマトグラム)のエントロピー値であり、そしてHmaxは、データセットのクロマトグラムに対して決定された最大エントロピー値である。上記のように、他の実施形態において、等式3のIQ値は、この等式の右辺の負の値である。従って、IQ値の絶対値が高い(エントロピーが低い)クロマトグラムは、代表的に、強い信号および少ないノイズを含む。IQ値の絶対値が低いクロマトグラムは、代表的に、多くのノイズおよび少ない信号を含む。クロマトグラム(TICクロマトグラム、またはRICクロマトグラムのいずれか)をそのIQ値に関して並べることによって、それらの情報内容によるクロマトグラムの区別が可能となり、これによって、有用な信号のトレースが、実質的なノイズのトレースから分離され得る。
【0032】
図1は、LC/MSによって得られた、混合物についてのTICクロマトグラムを示す。図1のTICクロマトグラムは、生データである。すなわち、本発明によって処理されていないデータである。図2は、図1を構成する質量クロマトグラムのエントロピー値を示し、ここで、これらのエントロピー値は、線質係数IQとして与えられている。従って、図2のX軸は、質量クロマトグラムに関連する質量対電荷の比(「m/z」)であり、そしてY軸は、質量クロマトグラムのIQ値である。また、水平線として、選択されたIQ閾値がプロットされている。まとめると、図2は、エントロピー値に基づく質量クロマトグラムの選択を示す。
【0033】
1つの実施形態において、このように選択された質量クロマトグラムは、再構築された全イオン電流(「RIC」)クロマトグラムを作成するために使用される。1つの実施形態において、この選択されたクロマトグラムは、エントロピーで重み付けされている。別の実施形態において、選択された質量クロマトグラムに関連するイオン電流は、その質量クロマトグラムにおける最も強い値のイオン電流と等しく設定される。この後者のRICクロマトグラム作成アプローチは、本明細書中において、IQ強度で重み付けされたRICクロマトグラムと称される。
【0034】
図3は、図1のTICクロマトグラムについてのRICクロマトグラムを示す。図3のRICクロマトグラムは、本発明の方法に従って、図2に示す閾値より高いIQ値を有する質量クロマトグラムを選択することによって、作成された。図1と図3とのクロマトグラムの比較は、ノイズの有意な減少を明らかに示す。ここでピークは、ノイズを超えて容易に区別可能である。
【0035】
1つの実施形態において、本発明は、さらに、RICクロマトグラムから1つ以上の質量信号を排除する。1つの実施形態において、特定の成分に関連する質量が排除される。このような成分としては、例えば、移動相、固定相、および/または既知もしくは疑われる夾雑物が挙げられ得る。このような夾雑物は、例えば、分析中の混合物の一部、またはクロマトグラフィー技術もしくは質量分析技術に関連するものを含み得る。別の実施形態において、個々の質量信号の質量信号線質値に基づいて、排除のために、1つ以上の質量信号が選択される。質量信号線質係数は、関連する質量スペクトルまたは質量クロマトグラムについてのエントロピー値(例えば、等式(1)〜(3)によって提供されるような)に基づき得るか、あるいは質量信号線質の何らかの他の測定値(例えば、信号対ノイズ比)に基づき得る。
【0036】
本発明の別の実施形態において、RICクロマトグラムは、1つ以上の質量信号の選択された群がそこから排除されて作成されるが、この排除操作は、RICクロマトグラム中にピークが残らなくなるまで続けられる。
【0037】
別の実施形態において、時間単位あたりの強度の合計をクロマトグラムとして使用する(例えば、TICクロマトグラム)かわりに、本発明は、単位時間あたりで合計されたエントロピー値を使用して、全エントロピークロマトグラム(「TEC」)を得る。さらに、クロマトグラムがエントロピー値に基づいて選択される、この実施形態の1つのバージョンにおいて、得られるクロマトグラムは、再構築されたエントロピークロマトグラム(「REC」)を含む。
【0038】
さらに、1つの実施形態において、質量クロマトグラムは、これらが関連するピークを含む尤度に従って、またはこれらが特定の成分に関連する尤度に従って、格納される。以下に説明されるように、エントロピー値に基づくデータ処理は、クロマトグラムの選択に対してさほどあいまいではない閾値を提供する。例えば、本発明によって作成されたRICクロマトグラムは、混合物の分析の際に、操作者に非常に良好な補助を提供する。
【0039】
図4aおよび4bを参照すると、クロマトグラフィー−質量分析装置(例えば、LC/MS)から得られたデータを処理するための、本発明の方法の種々の実施形態が示されている。1つの実施形態において、本発明の方法は、クロマトグラムを選択することによって開始する(ボックスA)。選択されたクロマトグラムは平滑化され(ボックスB)、次いでベースライン補正が実行される(ボックスC)。この平滑化およびベースライン補正の順序はまた、逆にされ得る。平滑化工程およびベースライン補正工程が実行された後に、平滑化補正クロマトグラムのエントロピーが決定される(ボックスD)。(N=N+1)を介するループによって示されるように、ボックスA、B、CおよびDのこれら工程は、全ての所望のクロマトグラムが処理されるまで(すなわち、「全てが処理されたか?」の問いに対して「YES」になるまで)、複数のクロマトグラムに対して実行され得る。
【0040】
図4Bを参照すると、質量クロマトグラムは、エントロピー値および/または線質係数IQに従って並べられ得(ボックスE)、そして所望であれば、表示され得る(ボックスF)。1つの実施形態において、表示されたIQ値(例えば、図2のように)に基づいて、閾値が設定され得る(ボックスG)。この方法の1つの実施形態において、RICクロマトグラムが、閾値より高いIQ値を有する平滑化補正クロマトグラムから作成される。
【0041】
次いで、エントロピー値が設定されたエントロピー閾値を越える、選択された質量クロマトグラム(ボックスHとGとの間のループ線によって示されるように)が使用されて、再構築されたTIC(すなわち、RIC)クロマトグラムが作成される(ボックスJ)。1つの実施形態において、この方法はまた(ボックスK)、関連するエントロピー値のリストを作成し、そして選択された平滑化補正クロマトグラムを表示する(ボックスL)。さらに、ボックスMおよびNによって示されるように、1つの実施形態において、クロマトグラムおよび/または選択された質量スペクトルが、所望であれば、ボックスF、GおよびHの工程のいずれかにおいて表示されて、データの解析を容易にし得る。
【0042】
別の局面において、本発明は、クロマトグラム(本発明の方法によって処理または作成された)とデータセットの複数のクロマトグラムとを相関付ける、データの処理および評価の方法を提供する。1つの実施形態において、本発明は、RICクロマトグラムを、1つ以上のTICクロマトグラム、または同じかもしくは異なるデータセットのRICクロマトグラムと相関付ける。従って、種々の実施形態において、RICクロマトグラムは、混合物に対するフィンガープリントとして働き得、これは後に、計量化学/生物測定技術によって、他の既知または未知の混合物と比較され得る。別の実施形態において、エントロピーで重み付けされたRICクロマトグラムが、フィンガープリントとして使用される。別の実施形態において、IQスペクトルが、フィンガープリントとして使用される。
【0043】
本発明は、図5に示すように、混合物のフィンガープリントを作成する種々の実施形態を提供する。図5の各実施形態は、質量クロマトグラム(すなわち、m/zトレース対時間)からなるデータセットで開始する。1つの実施形態において、m/z値の関数としてIQ値が決定されて、IQスペクトルを作成し(これの例は図2に示される)、次いでこのIQスペクトルが、多変量データ処理操作のための入力として使用される。1つの実施形態において、全IQスペクトルが使用され、そして他の実施形態において、IQの閾値が使用される。なお別の実施形態において、IQ強度で重み付けされたRICクロマトグラムが、多変量データ処理操作のための入力として使用される。
【0044】
図5に示す別の実施形態において、RICクロマトグラムは、多変量データ処理操作のための入力として使用される。別の実施形態において、時間単位あたりの強度の合計を入力クロマトグラムとして使用する代わりに、単位時間あたりの合計されたエントロピー値(すなわち、RECクロマトグラム)が、多変量データ多処理操作のための入力として使用される。別の実施形態において、例えば、エントロピー値に基づく質量クロマトグラムの選択がなされない場合には、TICクロマトグラムが、多変量データ処理操作のための入力として使用される。同様に、選択がなされない場合には、1つの実施形態は、TECクロマトグラムを入力として使用する。1つ以上の形態での、m/z次元と時間次元との両方の多変量解析による評価の組み合わせは、エントロピー選択ありまたはなしで、分光法と結び付いた分離方法による、複雑な混合物の特徴付けの新規方法を提供する。
【0045】
特定の実施形態において、平滑化質量クロマトグラム(または平滑化補正質量クロマトグラム)が、化学成分の同定のためのフィンガープリントとして使用される。1つの実施形態において、選択された質量に関連する平滑化質量クロマトグラム(または平滑化補正質量クロマトグラム)と、他の全ての質量クロマトグラムとの間の相関が、決定される。次いで、質量クロマトグラムは、それらの相関係数に基づいて、評価され得る。
【0046】
いくつかの実施形態において、上記方法の機能性は、汎用コンピュータにソフトウェアとして実装され得る。さらに、このようなプログラムは、コンピュータのランダムアクセスメモリの一部を蓄えて、ベースライン補正デバイス、平滑化デバイス、エントロピー値の決定のためのエントロピー値デバイス、クロマトグラムのエントロピー値に基づいてクロマトグラムを選択するための選択デバイス、ならびにクロマトグラムおよび質量スペクトルを用いる操作およびそれに対する操作を提供し得る。このような実施形態において、プログラムは、多数の高レベルの言語(例えば、FORTRAN、PASCAL、C、C++、またはBASIC)のいずれか1つで書き込まれ得る。さらに、このプログラムは、スクリプト、マクロで書き込まれ得るか、または市販のソフトウェアに機能的に埋め込まれ得る(例えば、EXCELまたはVISUAL BASIC)。さらに、このソフトウェアは、コンピュータに常駐するマイクロプロセッサのためのアセンブリ言語に実装され得る。例えば、このソフトウェアは、IBM PCまたはPCクローンで実行されるよう構成される場合には、Intel80×86アセンブリ言語で実装され得る。このソフトウェアは、「コンピュータ読み取り可能な媒体」(例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、磁気テープ、PROM、EPROM、またはCD−ROM)が挙げられるがこれらに限定されない、製品に埋め込まれ得る。
【0047】
(実施例の実験アプローチ)
実施例は、以下に記載される実験アプローチを共有する。これらの実施例は、CE/MS、LC/MS、および/またはGC/MS技術によって得られるデータの評価を記載する。
【0048】
(試薬および材料)
アセトニトリルを、Biosolve B.V.(Valkenswaard,The Netherlands)から購入し、そしてメタノール、ギ酸および酢酸を、Merck(Darmstadt,Germany)から購入した。水を、ELGAシステムを通して精製した。酢酸アンモニウム、トリプシン、ウシ血清アルブミン(BSA)、ジチオトレイトール(DTT)およびシトクロムCを、Sigma(Deisenhofen,Germany)から購入した。ヨードアセトアミドを、Fluka(Buchs,Switzerland)から購入した。ヘキサメトリンジブロミド(hexametrine dibromide)(ポリブレン)を、Aldrich(Steinheim,Germany)から購入した。
【0049】
(CE/MS技術)
CE/MS測定を、従来のESIインターフェースではなくナノエレクトロスプレーx−y−zポジショナー(Protana(Odense,Denmark))を取り付けたLCQ(Thermoquest,San Jose,CA,USA)で実施した。このCE装置は、Prince Technologies(Emmen,The Netherlands)製のPrinceであった。内径(i.d.)20μm、長さ65cmの、テーパ状で金メッキされた、使用したCEキャピラリーは、New Objective(Cambridge,MA,USA)製であった;これらを、伝導性ペーストLeit C(Protana)を介してx−y−zポジショナーのノズルに接続した。CEキャピラリーの内壁を、2% v/vエチレングリコール中の5% w/vのポリブレン溶液で、その日の始めに、Batemanら、Rapid Comm.Mass Speectrom.,第11巻、307頁(1997)によって記載された方法の改変を使用して、コーティングした。一連のコーティング工程を、2barの圧力で以下のように実施した:ポリブレン溶液(20分)、水(5分)、バックグラウンド電解質(20分)。バックグラウンド電解質(「BGE」)は、50% v/v MeOH中50mMのAcOHであった。−25kVの電位をキャピラリーの注入端に印加し、そして+1.7kVをナノエレクトロスプレーチップに印加することによって、分離を行った。注入容量は約3nLであった。
【0050】
(LC/MS技術)
LC/MS測定を、LCQ DECA(Thermoquest,San Jose,CA,USA)で、従来のESI源を陽イオンモード検出において使用して、実施した。スプレー電圧は3.5kVであり、一方で加熱されたキャピラリー温度は250℃であった。25μL/分の溶出フローを、EldexマイクロLC(Separations)によって提供した。分析を、spherisorb C18−シリカ(粒子サイズ5μm、LC Packings(Amsterdam,The Netherlands)から購入した)を充填した15cm×内径800μmのカラムで実施した。注入ループは、5μLであった。勾配溶出を実施した。移動相A:0.1% v/v HCOOH中10mM NH4OAc;移動相B:0.1% v/v HCOOH、80% v/v MeCN中10mM NH4OAc。勾配:0分・10%B/10分・30%B/25分・60%B/30分・100%B。
【0051】
(GC/MS技術)
質量分析検出を、HP 5973 MSDシステムによって、電子衝撃源を介して実施した。電子エネルギーは70eVであり、源温度は230℃であった。ガスクロマトグラフィーを、HP 6890 GCシステムを使用して、DB5−MSでコーティングした30m×内径320μmのカラムで実施した。ヘリウムの流れは48cm/秒であり、そして温度勾配は、以下であった:0分・25℃/4分・25℃/10分・75℃/22分・135℃/24分・250℃/30分・250℃。多変量解析の前に、シフトルーチンを全データセットのTICクロマトグラムに適用して、小さな保持時間の変動を補正した。GC−MS TICプロフィールのデータ解析を、MATLAB(The MathWorks,Inc.,Natick,MA,USA)によって実行した。
【0052】
(タンパク質消化)
ウシ血清アルブミンをDTTによって還元し、そしてヨードアセトアミドを使用してカルバミドメチル化し、その後、トリプシンで消化した(酵素/基質比1:30)。シトクロムCを、最初に変性せずに消化した。消化を、100mM NH4HCO3緩衝液(pH7.5)中37℃で一晩実施した。PCA分析のために使用したBSA消化サンプルの最終濃度は、10μMであった。
【0053】
(ソーセージの醗酵)
揮発性化合物のGC/MSプロフィールを、細菌株(Lactobacillus FC1、Staphylococcus carnosus)およびこれらの対応する無細胞酵素抽出物を接種したソーセージバターから、獲得した(表1)。サンプリング(Likens−Nickerson抽出)および引き続くGC−MSによる分析を、接種前、および醗酵中の3つの異なる時点(t=24時間、66時間、および3週間)に実施した。さらに、接種なしのコントロール実験を実施した。
【0054】
【表1】
(実施例1:MCQアプローチとの比較)
第一の実施例は、LC/MSデータおよびCE/MSデータの、Windigら、Anal.Chem.第68巻、3602頁(1996)のCODAアルゴリズムおよび本発明の方法による評価を比較する。この比較を、LC/MSデータおよびCE/MSデータに対して実施した。CE/MSデータを考慮すると、通電クロマトグラムにおけるスパイクの存在およびピークの鋭利さによって、さらなる挑戦が提示された。
【0055】
CODAアルゴリズムは、MCQ値を、生データファイルの全ての整数のm/z値の質量クロマトグラムに対して割り当てる。高いMCQ値は、特定の質量のトレースがピークを含むことの指標である。閾値のMCQを選択することによって、そして選択された閾値より低いMCQ値を有する質量のトレース(すなわち、質量クロマトグラム)を排除することによって、特定のクロマトグラムのみが、RICクロマトグラムの作成のために選択される。
【0056】
本発明の方法もまた使用して、データを処理し、そしてIQ値(実質的に等式3に従って決定された)を、生データファイルの全ての整数のm/z値の質量クロマトグラムに対して割り当てた。高いIQ値は、特定の質量のトレースがピークを含むことの強い指標である。上記のように、閾値IQを使用して、質量クロマトグラムを選択して、TICクロマトグラムをコンパイルし、そして/またはRICクロマトグラムを作成する。
【0057】
LC/MSデータに対して、本発明の方法は、図6Aおよび6Bに示すように、CODAアルゴリズムより改善された性能を示す。これらの図において、MCQおよびIQのプロットが比較されている。この場合に試験されたサンプルは、500nMの濃度でのBSA消化物のLC/MS分析であった。図6A(MCQプロット)と図6B(IQプロット)との比較から、正確なカットオフ値の設定が、IQプロット(図6B)においてより容易であったことが、容易にわかり得る。対照的に、MCQプロットにおいては、妥協が選択されなければならなかった:高すぎる閾値を使用することによって、低いm/z領域における何らかの潜在的な関連する情報が失われたかもしれず(図6Aを参照のこと)、一方で低すぎる閾値を設定することは、バックグラウンドノイズにすぎない多くの高いm/z値を選択した。
【0058】
本発明が非常に低いS/Nピークを検出し得るという証拠として、図6Aおよび6Bからの2つの例示的なピークを、図7Aおよび7Bに示す。ピークAが図7Aに示され、そしてピークBが図7Bに示される。これら2つのトリプシン消化フラグメントのピークAおよびBは、LC/MSによって、それぞれ3および7のS/N比で、検出された。それにもかかわらず、これらには、カットオフの閾値より十分に高いMCQ値およびIQ値が割り当てられた。
【0059】
(実施例2:香味プロフィールの事例研究)
第二の実施例は、かなり複雑なサンプルからのデータを処理および評価するための、本発明の方法の使用を示す。この実施例は、MSデータの取り扱いのために多変量解析(「MVA」)アプローチを包含する実施形態を示し、2つの事例研究が記載される。第一の事例において、本発明は、複雑なサンプルに対して主成分分析(「PCA」)を実行するために使用される。このアプローチにおいて、サンプルは、LC/MS分析によって検出された異なる質量における情報内容に基づいて、MVAを使用して、クロマトグラム間の相関を決定することによって、比較される。二次元プロットを、所定のサンプルに代表的なスポットを用いて作成した。これらのプロットにおいて、類似の質量に関する類似の情報を有するサンプルを一緒にクラスター化し、一方でより類似でないサンプルを、より大きな距離に配置する。これらの二次元プロットを、ペプチド/タンパク質プロフィールに対するパターン認識の手段として効果的に変化させ得る。
【0060】
本発明の多変量解析実施形態に関する、第二の事例研究として、GC/MSデータへの適用が実証される。複雑な香味のプロフィールを、部分的にモデルとみなした。なぜならこれらは、非常に詳細に、存在する化合物の同一性および化合物自体の間の強度比に関して、分析され得るからである。香味のプロフィールの場合には、MVAは、例えば、化合物間の複雑な関係を検出して生化学的経路を解明するために使用され得る。さらに、MVAは、観察される傾向および差異に関連するピークの選択的な検出を可能にする。負荷プロットは、これらの差異を可視化し、そして決定するために有用である。これらの負荷プロットは、2つの細菌株およびそれらの対応する無細胞酵素抽出物によって誘導される、醗酵した肉製品(ソーセージバター)における香味化合物の形成に関する研究に、適用されてきた。
【0061】
上記のように、1つの実施形態において、相関が、本発明によって処理されたクロマトグラムと、1つ以上のデータセットのクロマトグラム(これもまた、本発明によって処理され得る)との間で決定される。相関は、例えば、質量クロマトグラム、IQスペクトル、TICクロマトグラム、およびRICクロマトグラムの間で、決定され得る。この実施例において、多変量解析を使用して、相関を決定した。かなり複雑な、非常に類似したサンプルが、迅速にスクリーニングされなければならず、そしてクロマトグラム間の差異が認識されなければならない場合において、本発明によるMVAは、データの評価の速度を増大させ得る。複雑かつ類似のサンプルの迅速な分析に対する必要性は、非常にしばしば、製薬産業およびバイオテクノロジー産業における実際の状況であり、そしてプロテオミクスおよび体液プロフィーリングのような研究分野において、ますます直面する問題となる。
【0062】
生物学的サンプルのパターン認識を評価するために、1つの供給業者からの2つのBSAバッチおよび別の供給業者からの第三のバッチを、還元し、カルバミドメチル化し、消化し、そして上記のように、LC/MSによって分析した。データファイルを、主成分分析(PCA)に供して、IQスペクトル間の相関を決定した。図8に見られ得るように、LC/MSの実行に対応するデータセット全体が、スコアプロットにおいて点として示される。3つのわずかに異なるサンプルは、スコアプロットの3つの異なる領域に集中し、このことは、パターン認識アプローチが、この特定のクラスのLC/MSデータに適用され得ることを示す。負荷プロットの評価は、さらに、バッチ間の差異を明らかにし、そして品質評価基準を提供した。
【0063】
図9A〜Dは、Hとして同定される醗酵実験の、GC/MS TICクロマトグラムの例を示し(表1もまた参照のこと)、ここで、Lactobacillus、Staphylococcus carnosusおよびStaphyllococcus carnosus無細胞抽出物が、適用された。図9Aは、実験E0(接種前のバター、すなわちコントロールバター)のクロマトグラムを示す(表1もまた参照のこと)。図9B〜9Dは、それぞれ、実験H2、H4およびH7の接種物のTICクロマトグラムを示す。実験E0、H2、H4およびH7のTICクロマトグラムにおいて、ヘキサデカナール(ピーク45)、オクタデカナール(ピーク49)、ならびに高級脂肪酸であるテトラデカン酸、ヘキサデセン酸、ヘキサデカン酸、オクタデカジエン酸、オレイン酸、およびオクタデカン酸の濃度の強い増加が、醗酵の間に観察された(図9A〜D;それぞれピーク44、46、47、50、51および52)。しかし、二番目に主要な効果が見られた:低分子のアルデヒドおよび脂肪酸の濃度の増加。この効果は、ピーク4(ペンタナール)、9(ヘキサナール)、32(デセナール)、34(デカジエナール)、35(デカジエナール異性体)および36(デカン酸)に対して、醗酵の間の早期に観察された(図9B)。これらのより短鎖の酸化生成物は、コントロール実験(図9A)には存在しなかった。
【0064】
主成分分析(PCA)を、TICクロマトグラムの全ての時間ポイント(すなわち、質量スペクトル)を使用して適用し、これらのTICクロマトグラム間で、相関を決定した。これにより、スコアプロットおよび詳細な負荷プロットが生じた。熟成の間の香味化合物の形成における差異は、細菌株によって誘導され、そして適用される酵素混合物は、これらのプロットを使用してモニタリングされた。スコアプロット(PC1対PC2、図10)は、醗酵の間に起こる主要な傾向の調査を提供する。PC1およびPC2の対応するクロマトグラフ負荷パターンが、それぞれ図11Aおよび11Bに与えられる。コントロール実験のスペクトル(E0、E2、E4およびE7で標識されるポイント)は、接種実験のスペクトル(B、D、F、GおよびHで標識されるデータポイント)と比較して、異なる方向へのシフトを示した。さらに、より小さなシフトが起こった。これは、化学組成におけるより小さな変化を示す。
【0065】
添加された細菌を含む実験は、一般に、低級アルデヒドおよび脂肪酸の濃度の増加を示した。この傾向は、主として、PC2(これは、短鎖アルデヒドおよび酸に対する主軸である)に沿うシフトによって代表される。より長鎖のアルデヒドおよび酸の濃度の強い増加は、PC1によってほとんど排他的に表される。株および無細胞抽出物を添加された、表1の実験の一般的な傾向は、Fと同定された実験(LactobacillusおよびStaphylococcus carnosusを用いる)、およびHと同定された実験(Lactobacillus、Staphylococcus carnosusおよびStaphylococcus carnosusの無細胞抽出物を用いる)に対して特に目立つが、醗酵の最後の段階(F7およびH7)の間の高濃度の長鎖アルデヒドおよび脂肪酸の形成は、図10のスコアプロットに反映される。この実施例は、本発明の実施による、複雑なクロマトグラフィー−質量分析データの効果的な処理および評価を示す。
【0066】
本発明は、特定の実施形態を参照して特に示され、そして記載されたが、形式および細部における種々の変化が、添付の特許請求の範囲によって規定される本発明の意図および範囲から逸脱することなく、本発明においてなされ得ることが、当業者によって理解されるべきである。従って、本発明の範囲は、添付の特許請求の範囲によって示され、従って、特許請求の範囲の意味および均等物の範囲内の全ての変化は、包含されることが意図される。
【図面の簡単な説明】
【図1】図1は、質量分析計と組み合わせた液体クロマトグラフ(LC/MS)によって獲得した場合の、全イオン電流(TIC)クロマトグラムの例を示す。
【図2】図2は、クロマトグラムの計算されたIQ値の例示的なプロット、すなわち、IQスペクトルを示す。
【図3】図3は、図1のTICクロマトグラムに対する再構築された全イオン電流(RIC)クロマトグラムを示す。
【図4a】図4aは、本発明の方法の実施形態の流れ図である。
【図4b】図4bは、本発明の方法の実施形態の流れ図である。
【図5】図5は、生物測定/計量化学技術による、選択された成分またはエントロピーで重み付けされた成分の処理の実施形態の、流れ図である。
【図6】図6Aおよび6Bは、実施例1による消化されたBSAの500nMでのLC/MS泳動に対する、MCQプロットとIQプロットとの比較を示す。
【図7】図7Aおよび7Bは、それぞれ図6Aおよび6Bにおいて「A」および「B」と印したピークを示す。
【図8】図8は、実施例2による3つの異なるBSA消化物のセットに対するスコアプロットを示す。
【図9A】図9Aは、実施例1および2においてHと同定された実験のセットに対する、ガスクロマトグラフィー/質量分析(GC/MS)TICクロマトグラムを示す。
【図9B】図9Bは、実施例1および2においてHと同定された実験のセットに対する、ガスクロマトグラフィー/質量分析(GC/MS)TICクロマトグラムを示す。
【図9C】図9Cは、実施例1および2においてHと同定された実験のセットに対する、ガスクロマトグラフィー/質量分析(GC/MS)TICクロマトグラムを示す。
【図9D】図9Dは、実施例1および2においてHと同定された実験のセットに対する、ガスクロマトグラフィー/質量分析(GC/MS)TICクロマトグラムを示す。
【図10】図10は、実施例2によるPC1対PC2のスコアプロットを示す。
【図11】図11Aおよび11Bは、実施例2によるPC1およびPC2に対する負荷プロットを示す。
Claims (17)
- データの処理および評価の方法であって、以下の工程:
(a)ベースラインに対してクロマトグラムのデータポイントを補正し、補正クロマトグラムを提供する工程;
(b)該クロマトグラムのデータポイントを平滑化して、平滑化補正クロマトグラムを提供する工程;および
(c)該平滑化補正クロマトグラムに対するエントロピー値を、該平滑化補正クロマトグラムの複数のデータポイントについて、データポイント値と該データポイント値の対数との積に基づいて決定する工程、
を包含する、方法。 - さらに、以下の工程:
データセットの複数のクロマトグラムに対して、工程(a)〜(c)を繰り返す工程;ならびに
該データセットの該複数のクロマトグラムの前記エントロピー値に基づいて、平滑化補正クロマトグラムについての線質係数を決定する工程であって、該線質係数が、実質的に、以下の式:
IQ=1−(H/Hmax)
によって定義され、ここで、IQは、線質係数であり、Hは、該平滑化補正クロマトグラムのエントロピー値であり、そしてHmaxは、該データセットの複数のクロマトグラムの最大エントロピー値である、工程、
を包含する、請求項2に記載の方法。 - 個々の平滑化補正クロマトグラムの前記線質係数に基づいて選択された複数の平滑化補正クロマトグラムから、再構築した全イオン電流クロマトグラムを作成する工程をさらに包含する、請求項3に記載の方法。
- さらに、以下の工程:
工程(a)および(b)の前の質量信号に対応するデータポイント値と、工程(a)および(b)の後の質量信号に対応するデータポイント値との間の差異に基づいて、1つ以上の質量信号の各々に対して、質量信号線質値を割り当てる工程、
を包含し、ここで、再構築された全イオン電流クロマトグラムを作成する前記工程が、該再構築された全イオン電流クロマトグラムから、個々の質量信号の該質量信号線質値に基づいて選択された1つ以上の質量信号を排除する工程を包含する、請求項4に記載の方法。 - 工程(a)および(b)の前の質量信号に対応するデータポイント値と、工程(a)および(b)の後の質量信号に対応するデータポイント値との間の差異に基づいて、1つ以上の質量信号の各々に対して、質量信号線質値を割り当てる工程をさらに包含する、請求項1に記載の方法。
- データセットの複数のクロマトグラムの各々と、前記個々の質量信号の前記質量信号線質値に基づいて選択された1つ以上の質量信号に関連する平滑化補正クロマトグラムとの間の相関を決定する工程をさらに包含する、請求項6に記載の方法。
- 前記相関を決定する工程が、前記データセットの前記クロマトグラムの多変量解析を、前記個々の質量信号の前記質量信号線質値に基づいて選択された1つ以上の質量信号に関連する平滑化補正クロマトグラムに対して実行する工程を包含する、請求項7に記載の方法。
- 前記平滑化する工程が、Savitsky−Golayアルゴリズムによって実質的に定義される方法論の使用を包含する、請求項1に記載の方法。
- データの処理および評価の方法であって、以下の工程:
(a)クロマトグラムのデータポイントをベースラインに対して補正して、補正クロマトグラムを提供する工程;
(b)該クロマトグラムのデータポイントを平滑化して、平滑化補正クロマトグラムを提供する工程;
(c)該平滑化補正クロマトグラムの複数のデータポイントに対して、データポイント値とデータポイント値の対数との積に基づいて、該平滑化補正クロマトグラムに対するエントロピー値を決定する工程;
(d)データセットの複数のクロマトグラムに対して、工程(a)〜(c)を繰り返す工程;
(e)該データセットの複数のクロマトグラムの該エントロピー値に基づいて、平滑化補正クロマトグラムについての線質係数を決定する工程;
(f)工程(a)および(b)の前の質量信号に対応するデータポイント値と、工程(a)および(b)の後の質量信号に対応するデータポイント値との間の差異に基づいて、1つ以上の質量信号の各々に対して、質量信号線質値を割り当てる工程;ならびに
(g)データセットの複数のクロマトグラムの各々と、該個々の質量信号の該質量信号線質値に基づいて選択された1つ以上の質量信号に関連する平滑化補正クロマトグラムとの間の相関を決定する工程、
を包含する、方法。 - 相関を決定する前記工程が、前記データセットの前記クロマトグラムの多変量解析を、前記個々の質量信号の前記質量信号線質値に基づいて選択された1つ以上の質量信号に関連する前記平滑化相関クロマトグラムに対して実行する工程を包含する、請求項10に記載の方法。
- 請求項10に記載の方法を実行するためのコンピュータ読み取り可能プログラム手段が取り込まれた、製品。
- データの処理および評価のためのシステムであって、以下:
ベースライン補正デバイス;
クロマトグラムのデータポイントを平滑化するための、平滑化デバイス;
該クロマトグラムの複数のデータポイントに対して、データポイント値とデータポイント値の対数との積に基づいて、該クロマトグラムに対するエントロピー値を決定するための、エントロピー値デバイス;ならびに
該クロマトグラムのエントロピー値に基づいて、クロマトグラムを選択するための、選択デバイス、
を備える、システム。 - 前記選択デバイスによって選択されたクロマトグラムに基づいて、再構築された全イオン電流クロマトグラムを作成するための、合計デバイスをさらに備える、請求項13に記載のシステム。
- 前記選択デバイスが、1つ以上の質量信号を選択するようさらに適合されており、そして前記合計デバイスが、前記再構築された全イオン電流クロマトグラムから、該1つ以上の選択された質量信号を排除するよう適合されている、請求項14に記載のシステム。
- データセットの複数のクロマトグラムと、1つ以上の選択された質量信号に関連するクロマトグラムとの間の相関を決定するための、相関器をさらに備える、請求項13に記載のシステム。
- 前記相関器が、選択されたクロマトグラムの少なくとも1つと、データセットの複数のクロマトグラムに関する1つ以上の選択された質量信号との、多変量解析を実施するための、多変量解析器を備える、請求項16に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NL1015875A NL1015875C2 (nl) | 2000-08-03 | 2000-08-03 | Werkwijze en systeem voor het identificeren en kwantificeren van chemische componenten van een te onderzoeken mengsel van materialen. |
NL1016034A NL1016034C2 (nl) | 2000-08-03 | 2000-08-28 | Werkwijze en systeem voor het identificeren en kwantificeren van chemische componenten van een te onderzoeken mengsel van materialen. |
PCT/NL2001/000590 WO2002013228A2 (en) | 2000-08-03 | 2001-08-03 | Method and system for identifying and quantifying chemical components of a mixture |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004506216A true JP2004506216A (ja) | 2004-02-26 |
Family
ID=26643217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002518495A Pending JP2004506216A (ja) | 2000-08-03 | 2001-08-03 | 混合物の化学成分を同定および定量するための方法およびシステム |
Country Status (10)
Country | Link |
---|---|
US (2) | US6743364B2 (ja) |
EP (1) | EP1384248B1 (ja) |
JP (1) | JP2004506216A (ja) |
AT (1) | ATE307387T1 (ja) |
AU (1) | AU2001294343A1 (ja) |
CA (1) | CA2417621A1 (ja) |
DE (1) | DE60114245T2 (ja) |
IL (1) | IL154188A0 (ja) |
NL (1) | NL1016034C2 (ja) |
WO (1) | WO2002013228A2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009513985A (ja) * | 2005-10-25 | 2009-04-02 | ウオーターズ・インベストメンツ・リミテツド | クロマトグラフィーにおける基線モデリング |
JP2010515923A (ja) * | 2007-01-12 | 2010-05-13 | ボード オブ リージェンツ, ザ ユニバーシティ オブ テキサス システム | 接続型低フロー分離技術 |
JP2014112068A (ja) * | 2012-04-27 | 2014-06-19 | Shimadzu Corp | 質量分析におけるピーク検出方法及びそのシステム |
JP2014526050A (ja) * | 2011-08-17 | 2014-10-02 | スミスズ ディテクション インコーポレイティド | スペクトル分析のためのずれ補正 |
JP2015511720A (ja) * | 2012-03-29 | 2015-04-20 | コーニンクレッカ フィリップス エヌ ヴェ | ガスクロマトグラフィー質量分析データをフィルタリングするための方法およびシステム |
WO2018087824A1 (ja) * | 2016-11-09 | 2018-05-17 | 株式会社島津製作所 | クロマトグラフ質量分析用データ解析装置 |
JP2021519974A (ja) * | 2018-03-29 | 2021-08-12 | ライカ マイクロシステムズ シーエムエス ゲゼルシャフト ミット ベシュレンクテル ハフツングLeica Microsystems CMS GmbH | 信号データのボケ除去のためのベースライン推定および半二次最小化を使用する装置および方法 |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6687395B1 (en) * | 1999-07-21 | 2004-02-03 | Surromed, Inc. | System for microvolume laser scanning cytometry |
NL1016034C2 (nl) * | 2000-08-03 | 2002-02-08 | Tno | Werkwijze en systeem voor het identificeren en kwantificeren van chemische componenten van een te onderzoeken mengsel van materialen. |
US6787761B2 (en) * | 2000-11-27 | 2004-09-07 | Surromed, Inc. | Median filter for liquid chromatography-mass spectrometry data |
WO2002044715A1 (en) * | 2000-11-28 | 2002-06-06 | Surromed, Inc. | Methods for efficiently minig broad data sets for biological markers |
US20020115056A1 (en) * | 2000-12-26 | 2002-08-22 | Goodlett David R. | Rapid and quantitative proteome analysis and related methods |
WO2003017177A2 (en) * | 2001-08-13 | 2003-02-27 | Beyong Genomics, Inc. | Method and system for profiling biological systems |
US6873915B2 (en) * | 2001-08-24 | 2005-03-29 | Surromed, Inc. | Peak selection in multidimensional data |
US6835927B2 (en) | 2001-10-15 | 2004-12-28 | Surromed, Inc. | Mass spectrometric quantification of chemical mixture components |
CA2484625A1 (en) * | 2002-05-09 | 2003-11-20 | Surromed, Inc. | Methods for time-alignment of liquid chromatography-mass spectrometry data |
GB2405972B (en) * | 2002-05-31 | 2007-08-15 | Waters Investments Ltd | A method of using data binning in the analysis of chromatograhpy/spectrometry data |
GB0305796D0 (en) | 2002-07-24 | 2003-04-16 | Micromass Ltd | Method of mass spectrometry and a mass spectrometer |
US7457708B2 (en) * | 2003-03-13 | 2008-11-25 | Agilent Technologies Inc | Methods and devices for identifying related ions from chromatographic mass spectral datasets containing overlapping components |
WO2005020125A2 (en) * | 2003-08-20 | 2005-03-03 | Bg Medicine, Inc. | Methods and systems for profiling biological systems |
US7022980B2 (en) * | 2004-02-02 | 2006-04-04 | Agilent Technologies, Inc. | Spectral axis transform |
US7248360B2 (en) * | 2004-04-02 | 2007-07-24 | Ppd Biomarker Discovery Sciences, Llc | Polychronic laser scanning system and method of use |
CA2501003C (en) | 2004-04-23 | 2009-05-19 | F. Hoffmann-La Roche Ag | Sample analysis to provide characterization data |
GB2413695B (en) * | 2004-04-30 | 2009-01-21 | Micromass Ltd | Mass spectrometer |
US7488935B2 (en) * | 2005-06-24 | 2009-02-10 | Agilent Technologies, Inc. | Apparatus and method for processing of mass spectrometry data |
GB2432712B (en) * | 2005-11-23 | 2007-12-27 | Micromass Ltd | Mass spectrometer |
GB0609253D0 (en) * | 2006-05-10 | 2006-06-21 | Micromass Ltd | Mass spectrometer |
EP2099957A1 (en) * | 2007-01-10 | 2009-09-16 | GE Healthcare Bio-Sciences AB | Multi-modal ion exchange chromotography resins |
US7783458B2 (en) * | 2007-06-22 | 2010-08-24 | Ricardo Claps | Discrete principal component analysis (DPCA) |
US8554518B1 (en) | 2007-06-22 | 2013-10-08 | Ricardo Claps | Discrete principal component analysis (DPCA) for pattern recognition and diagnostics of tissue pathologies such as cancer |
JP2012502296A (ja) * | 2008-09-09 | 2012-01-26 | デ スタート デル ネダーランデン、フェルト.ドール デ ミニスター ファン フォルクスヘーゾンドハイド、フェルジイン アン スポルト | Lcms技術及びその使用 |
US8158003B2 (en) | 2009-08-26 | 2012-04-17 | International Business Machines Corporation | Precision peak matching in liquid chromatography-mass spectroscopy |
US8935101B2 (en) | 2010-12-16 | 2015-01-13 | Thermo Finnigan Llc | Method and apparatus for correlating precursor and product ions in all-ions fragmentation experiments |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01311218A (ja) * | 1988-06-09 | 1989-12-15 | Shimadzu Corp | 分析データ処理装置 |
JPH07103959A (ja) * | 1993-10-05 | 1995-04-21 | Hitachi Ltd | クロマトグラム解析方法およびクロマトグラフ装置およびこれらに用いられるデータ処理装置 |
JPH1010110A (ja) * | 1996-04-03 | 1998-01-16 | Eastman Kodak Co | 有機物質の混合物の化学成分を同定し且つ定量する方法 |
JPH10508386A (ja) * | 1996-01-05 | 1998-08-18 | マクセント・ソリューションズ・リミテッド | 元素質量分析計において干渉を減少させる方法 |
JPH10339727A (ja) * | 1997-06-10 | 1998-12-22 | Hitachi Ltd | クロマトグラフィ分析方法及びクロマトグラフィ分析装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5644503A (en) * | 1994-03-28 | 1997-07-01 | Hitachi, Ltd. | Methods and apparatuses for analyzing multichannel chromatogram |
JP2001515234A (ja) | 1997-07-25 | 2001-09-18 | アフィメトリックス インコーポレイテッド | 多型性データベースを提供するためのシステム |
US6560542B1 (en) * | 2000-01-24 | 2003-05-06 | The Cielo Institute | Algorithmic design of peptides for binding and/or modulation of the functions of receptors and/or other proteins |
NL1016034C2 (nl) * | 2000-08-03 | 2002-02-08 | Tno | Werkwijze en systeem voor het identificeren en kwantificeren van chemische componenten van een te onderzoeken mengsel van materialen. |
-
2000
- 2000-08-28 NL NL1016034A patent/NL1016034C2/nl not_active IP Right Cessation
-
2001
- 2001-08-02 US US09/920,993 patent/US6743364B2/en not_active Expired - Fee Related
- 2001-08-03 WO PCT/NL2001/000590 patent/WO2002013228A2/en active IP Right Grant
- 2001-08-03 CA CA002417621A patent/CA2417621A1/en not_active Abandoned
- 2001-08-03 JP JP2002518495A patent/JP2004506216A/ja active Pending
- 2001-08-03 AU AU2001294343A patent/AU2001294343A1/en not_active Abandoned
- 2001-08-03 IL IL15418801A patent/IL154188A0/xx unknown
- 2001-08-03 EP EP01974972A patent/EP1384248B1/en not_active Expired - Lifetime
- 2001-08-03 AT AT01974972T patent/ATE307387T1/de not_active IP Right Cessation
- 2001-08-03 DE DE60114245T patent/DE60114245T2/de not_active Expired - Lifetime
-
2004
- 2004-04-22 US US10/829,680 patent/US7056434B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01311218A (ja) * | 1988-06-09 | 1989-12-15 | Shimadzu Corp | 分析データ処理装置 |
JPH07103959A (ja) * | 1993-10-05 | 1995-04-21 | Hitachi Ltd | クロマトグラム解析方法およびクロマトグラフ装置およびこれらに用いられるデータ処理装置 |
JPH10508386A (ja) * | 1996-01-05 | 1998-08-18 | マクセント・ソリューションズ・リミテッド | 元素質量分析計において干渉を減少させる方法 |
JPH1010110A (ja) * | 1996-04-03 | 1998-01-16 | Eastman Kodak Co | 有機物質の混合物の化学成分を同定し且つ定量する方法 |
JPH10339727A (ja) * | 1997-06-10 | 1998-12-22 | Hitachi Ltd | クロマトグラフィ分析方法及びクロマトグラフィ分析装置 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009513985A (ja) * | 2005-10-25 | 2009-04-02 | ウオーターズ・インベストメンツ・リミテツド | クロマトグラフィーにおける基線モデリング |
US8511140B2 (en) | 2005-10-25 | 2013-08-20 | Waters Technologies Corporation | Baseline modeling in chromatography |
JP2010515923A (ja) * | 2007-01-12 | 2010-05-13 | ボード オブ リージェンツ, ザ ユニバーシティ オブ テキサス システム | 接続型低フロー分離技術 |
JP2014526050A (ja) * | 2011-08-17 | 2014-10-02 | スミスズ ディテクション インコーポレイティド | スペクトル分析のためのずれ補正 |
US9812306B2 (en) | 2011-08-17 | 2017-11-07 | Smiths Detection Inc. | Shift correction for spectral analysis |
JP2015511720A (ja) * | 2012-03-29 | 2015-04-20 | コーニンクレッカ フィリップス エヌ ヴェ | ガスクロマトグラフィー質量分析データをフィルタリングするための方法およびシステム |
JP2014112068A (ja) * | 2012-04-27 | 2014-06-19 | Shimadzu Corp | 質量分析におけるピーク検出方法及びそのシステム |
WO2018087824A1 (ja) * | 2016-11-09 | 2018-05-17 | 株式会社島津製作所 | クロマトグラフ質量分析用データ解析装置 |
JPWO2018087824A1 (ja) * | 2016-11-09 | 2019-04-04 | 株式会社島津製作所 | クロマトグラフ質量分析用データ解析装置 |
JP2021519974A (ja) * | 2018-03-29 | 2021-08-12 | ライカ マイクロシステムズ シーエムエス ゲゼルシャフト ミット ベシュレンクテル ハフツングLeica Microsystems CMS GmbH | 信号データのボケ除去のためのベースライン推定および半二次最小化を使用する装置および方法 |
JP7391865B2 (ja) | 2018-03-29 | 2023-12-05 | ライカ マイクロシステムズ シーエムエス ゲゼルシャフト ミット ベシュレンクテル ハフツング | 信号データのボケ除去のためのベースライン推定および半二次最小化を使用する装置および方法 |
US11854166B2 (en) | 2018-03-29 | 2023-12-26 | Leica Microsystems Cms Gmbh | Apparatus and method using baseline estimation and half-quadratic minimization for the deblurring of signal data |
Also Published As
Publication number | Publication date |
---|---|
US6743364B2 (en) | 2004-06-01 |
DE60114245D1 (de) | 2005-11-24 |
US20020053545A1 (en) | 2002-05-09 |
EP1384248A2 (en) | 2004-01-28 |
EP1384248B1 (en) | 2005-10-19 |
DE60114245T2 (de) | 2006-07-13 |
US20040267459A1 (en) | 2004-12-30 |
CA2417621A1 (en) | 2002-02-14 |
WO2002013228A3 (en) | 2003-10-16 |
WO2002013228A2 (en) | 2002-02-14 |
ATE307387T1 (de) | 2005-11-15 |
US7056434B2 (en) | 2006-06-06 |
AU2001294343A1 (en) | 2002-02-18 |
NL1016034C2 (nl) | 2002-02-08 |
IL154188A0 (en) | 2003-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1384248B1 (en) | Method and system for identifying and quantifying chemical components of a mixture | |
CN106055895B (zh) | 产物离子谱的数据独立获取及参考谱库匹配 | |
US5672869A (en) | Noise and background reduction method for component detection in chromatography/spectrometry | |
EP1623351B1 (en) | Computational method and system for mass spectral analysis | |
JP5542433B2 (ja) | イオン検出およびn次元データのパラメータ推定 | |
JP5068541B2 (ja) | 液体クロマトグラフィ/質量分析データ中のピークを同定し、スペクトルおよびクロマトグラムを形成するための装置および方法 | |
JP5027511B2 (ja) | 質量分析(ms)およびその他の計測器システムを較正し、msおよびその他のデータを処理するための方法 | |
JP6159258B2 (ja) | バックグラウンド減算を媒介したデータ依存式収集方法及びシステム | |
CN111902719B (zh) | 自动的质谱分析方法和仪器 | |
EP1879684A2 (en) | Chromatographic and mass spectral data analysis | |
JP4676955B2 (ja) | クロマトグラフィ/質量分析/質量分析装置における動的信号選択 | |
US6329652B1 (en) | Method for comparison of similar samples in liquid chromatography/mass spectrometry | |
JP2008241721A (ja) | 試料解析方法及び試料解析プログラム | |
US20140236497A1 (en) | Methods and systems for experimental set-up and data analysis in targeted proteomics applications | |
US20070095757A1 (en) | Methods and systems for the annotation of biomolecule patterns in chromatography/mass-spectrometry analysis | |
JP4857000B2 (ja) | 質量分析システム | |
JP2018504600A (ja) | 干渉検出および着目ピークのデコンボルーション | |
EP1623352B1 (en) | Computational methods and systems for multidimensional analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080724 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110708 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111205 |