JP6611822B2 - 質量分析によって不明微生物亜群を一組の参照亜群の中から同定する方法 - Google Patents
質量分析によって不明微生物亜群を一組の参照亜群の中から同定する方法 Download PDFInfo
- Publication number
- JP6611822B2 JP6611822B2 JP2017555309A JP2017555309A JP6611822B2 JP 6611822 B2 JP6611822 B2 JP 6611822B2 JP 2017555309 A JP2017555309 A JP 2017555309A JP 2017555309 A JP2017555309 A JP 2017555309A JP 6611822 B2 JP6611822 B2 JP 6611822B2
- Authority
- JP
- Japan
- Prior art keywords
- mass
- charge
- subgroup
- spectrum
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 111
- 238000004949 mass spectrometry Methods 0.000 title claims description 16
- 230000000813 microbial effect Effects 0.000 title claims description 5
- 238000001228 spectrum Methods 0.000 claims description 154
- 244000005700 microbiome Species 0.000 claims description 113
- 238000013145 classification model Methods 0.000 claims description 51
- 238000001819 mass spectrum Methods 0.000 claims description 31
- 230000000717 retained effect Effects 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 239000000523 sample Substances 0.000 description 34
- 241000588724 Escherichia coli Species 0.000 description 32
- 238000007635 classification algorithm Methods 0.000 description 25
- 230000003595 spectral effect Effects 0.000 description 18
- 241000607768 Shigella Species 0.000 description 15
- 239000000203 mixture Substances 0.000 description 14
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 13
- 241000894007 species Species 0.000 description 13
- 230000009466 transformation Effects 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000012417 linear regression Methods 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 239000013074 reference sample Substances 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 235000019800 disodium phosphate Nutrition 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000013213 extrapolation Methods 0.000 description 3
- 238000004611 spectroscopical analysis Methods 0.000 description 3
- 241000607762 Shigella flexneri Species 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000003795 desorption Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 239000011800 void material Substances 0.000 description 2
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108010079723 Shiga Toxin Proteins 0.000 description 1
- 241000607764 Shigella dysenteriae Species 0.000 description 1
- 241000607760 Shigella sonnei Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005464 sample preparation method Methods 0.000 description 1
- 229940007046 shigella dysenteriae Drugs 0.000 description 1
- 229940115939 shigella sonnei Drugs 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- AFVLVVWMAFSXCK-UHFFFAOYSA-N α-cyano-4-hydroxycinnamic acid Chemical compound OC(=O)C(C#N)=CC1=CC=C(O)C=C1 AFVLVVWMAFSXCK-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/02—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
- C12Q1/04—Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/569—Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B99/00—Subject matter not provided for in other groups of this subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
- H01J49/0036—Step by step routines describing the handling of the data generated during a measurement
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/02—Details
- H01J49/10—Ion sources; Ion guns
- H01J49/16—Ion sources; Ion guns using surface ionisation, e.g. field-, thermionic- or photo-emission
- H01J49/161—Ion sources; Ion guns using surface ionisation, e.g. field-, thermionic- or photo-emission using photoionisation, e.g. by laser
- H01J49/164—Laser desorption/ionisation, e.g. matrix-assisted laser desorption/ionisation [MALDI]
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/26—Mass spectrometers or separator tubes
- H01J49/34—Dynamic spectrometers
- H01J49/40—Time-of-flight spectrometers
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Hematology (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Urology & Nephrology (AREA)
- Bioethics (AREA)
- General Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Food Science & Technology (AREA)
- Pathology (AREA)
- Medicinal Chemistry (AREA)
Description
・群、より具体的には種が予め分かっている微生物の「学習」質量スペクトルと呼ばれるものに依存する知識ベースに関連づけられた分類モデル(classifying model)を、教師あり学習法(supervised learning method)によって構築する第1のステップであり、この分類モデルと知識ベースとが協力して、これらのさまざまな群を識別する規則を定義する第1のステップと、
・特定の不明微生物を同定する第2のステップであり、
○特定の不明微生物の質量スペクトルを取得すること、
○不明微生物が属する少なくとも1つの群、より具体的には不明微生物が属する1つの種を決定するために、取得したスペクトルに、関連知識ベースに関する分類モデルを適用すること、すなわち予め構築されたモデルおよび知識ベースを適用すること
によって特定の不明微生物を同定する第2のステップと
からなる。
・前記群に属する微生物として同定された微生物の一組の学習スペクトルに基づいて、関連群ごとに1つの知識ベースおよび1つの分類モデルを構築する第1のステップと、
・その群の前記亜群に属する微生物として同定された微生物の少なくとも一組の学習スペクトルの取得に基づいて、関連亜群ごとに1つの知識ベースおよび1つの分類モデルを構築する第2のステップであり、
○取得されたスペクトルの質量対電荷オフセットをそれらのさまざまな亜群に共通する参照質量対電荷に基づいて補正することを可能にする調整モデルを構築すること、
○学習スペクトルの全てのピークリストの質量対電荷を調整すること、
○調整された学習スペクトルに基づいて、亜群ごとに1つの分類モデルおよび関連知識ベースを構築すること
を含む第2のステップと、
・不明微生物を1つの亜群に分類する第3のステップであり、
○不明微生物の少なくとも1つのスペクトルを取得すること、
○前記群ごとの分類モデルおよび前記群ごとの知識ベースに従って、前記スペクトルを1つの群に分類すること、
○不明微生物のスペクトルの質量対電荷オフセットを補正することを可能にする調整モデルに従って、前記スペクトルの全てのピークリストの質量対電荷を調整すること、
○前記亜群ごとの分類モデルおよび亜群ごとの知識ベースを用いて、前記1つの群の1つの亜群に分類すること
を含む第3のステップと
を含む方法に関する。
・それぞれの亜群のそれぞれのスペクトルの質量対電荷の空間を離散化すること、
・離散化ステップによって画定された質量対電荷の付近のピークの存在または非存在を許容係数(tolerance factor)に従って検出すること、
・それぞれの亜群のピークの存在の頻度に応じて前記質量対電荷をフィルタリングすること、
・保持された質量対電荷の位置を近似すること
からなるステップを含むことができる。
・取得されたスペクトルの質量対電荷オフセットを前記さまざまな亜群に共通する参照質量対電荷に基づいて補正することを可能にする第2の調整モデルを構築すること、
・学習スペクトルの全てのピークリストの質量対電荷を第2の調整モデルに基づいて調整する第2のステップ
を含む。
・参照質量対電荷の付近のピークの存在または非存在を許容係数に従って検出すること、
・それぞれの亜群のピークの存在の頻度に応じて前記質量対電荷をフィルタリングし、かつ/または保持された参照質量対電荷の位置を近似すること
からなるステップを用いて選択される。
■同定する微生物の質量スペクトルを生成することができる質量分析計と、
■前記請求項のいずれか一項に記載の方法を実装することによって、質量分析計によって生成された質量スペクトルに関連づけられた微生物を同定することができるコンピュータシステムと
を備えるデバイスである。
■同定する微生物の少なくとも1つの質量スペクトルを取得することができる質量分析計と、
■質量分析計によって取得された前記少なくとも1つの質量スペクトルに関連づけられた微生物を同定することができるコンピュータシステムと
を備え、前記システムが、
− コンピュータメモリであり、
○微生物の群ごとの1つの知識ベースおよび1つの分類モデルと、
○微生物の亜群ごとの1つの知識ベースおよび1つの分類モデルと、
○質量分析計によって取得されたスペクトルの質量対電荷オフセットを、亜群ごとの知識ベースおよび亜群ごとの分類モデルの前記さまざまな亜群に共通する参照に基づいて補正する調整モデルと、
○取得された質量スペクトルに基づいてピークリストを作成するコンピュータ命令と、
○前記群ごとの分類モデルおよび前記群ごとの知識ベースに従って、微生物を、作成されたピークリストに応じた1つの群に分類するコンピュータ命令と、
○調整モデルに従ってピークリストを調整するコンピュータ命令と、
○前記亜群ごとの分類モデルおよび前記亜群ごとの知識ベースに従って、微生物を、調整されたピークリストに応じた1つの亜群に分類するコンピュータ命令と
を記憶したコンピュータメモリ、
− コンピュータメモリに記憶されたコンピュータ命令を実装して、微生物を1つの群および1つの亜群に分類するマイクロプロセッサベースのコンピュータユニット、
− 分類の結果を記憶するコンピュータメモリおよび/または分類の結果を表示する表示画面
を備える、デバイスである。
・関心の質量対電荷の範囲を離散化する第1のステップ241
によって得ることができる。このステップは、微生物の特性質量対電荷の大部分を含むことが知られている取得後に得られた質量対電荷区間に関して制限されたピークリストの質量対電荷区間にわたって、例えば3000から17000Thまでの質量対電荷範囲にわたって実行することができる。この区間に基づいて、質量対電荷の範囲を、
○規則正しい質量対電荷区間(例えば1Th)に、または
○次第に増大する質量対電荷区間に
離散化する。
{m(i)};i=1,...,I
を得る。それぞれの値m(i)は、値m(i+1)から、離散化ピッチと呼ばれる質量対電荷区間だけ分離されている。
m(i+1)=m(i)+t1×m(i)
を用いて離散化を反復的に定義し、m(1)を関心の質量対電荷の範囲の下限に初期値とすることである。上式でt1は許容係数である。したがって、離散化ピッチはt1×m(i)に等しい。例えば、関心の質量対電荷範囲が3000から17000Th、許容差がt1=0.0008であるときには、3000Thにおける離散化ピッチが2.4Thであり、17000Thにおける離散化ピッチが13.6Thである。
m(i+1)=m(i)+t1×m(1)
X={x(s)};s=1,...,S
であり、質量対電荷に適用される許容係数はt1である。この操作は、許容差によって画定された当該の質量対電荷m(i)を中心とする区間、すなわち区間[m(i)−m(i)×t1;m(i)+m(i)×t1]内において、X={x(s)};s=1,...,Sの中のピークの存在を探索することからなる。
{m(i)};i=1,...,Iの中から、質量対電荷の集合{m(j)};j=1,...,J、J≦I
を得る。これらの質量対電荷は、頻度に関するフィルタリングステップの後も保持される。例えば、下表2によれば、フィルタリングの後、質量対電荷m(I−1)およびm(I)だけが保持される。
|M(j,n+1)−M(j,n)|<ε
となったときに終了となる。
が得られる。最初の離散化は、1つの質量対電荷から次の質量対電荷までの区間の重なりを保証するように選ばれたため、複数の保持された質量対電荷m(j)が、同じおおよその質量対電荷に対応することがある。この場合、これらの質量対電荷の近似値
は、その値の演算において保持された精度に応じて等しいかまたはほぼ等しい。下表3は、離散化ピッチが2Thである本発明の実装態様の一例について、区間5338から5398Th内の保持されたおおよその質量対電荷の位置を特に示す。
− X={x(s)};s=1,...,Sが、当該のスペクトルのピークの質量対電荷のリストであり、
− R={R(k)};k=1,...,Kが、参照質量対電荷のリストであり、
− t3が、質量対電荷{R(k)}の位置を中心とする許容係数であり、例えばt3=0.0004である。許容係数t2の値は、t3よりも大きいかまたはt3に等しい。
[R(k)−R(k)×t3;R(k)+R(k)×t3]
内に存在する、{x(s)};s=1,...,Sの中の質量対電荷を探索することからなる。
・線形回帰モデル:
C=β0+β1x;β0およびβ1はモデルの定数である。
・2次多項式回帰モデル:
C=β0+β1x+β2x2;β0、β1およびβ2はモデルの定数である。
・非パラメトリックまたは非線形回帰モデル、例えばスプライン、LoessもしくはLowess型回帰などの局所回帰モデルまたはカーネル回帰モデルなど
・それぞれの質量対電荷x(s)に対して、調整された質量対電荷を
を用いて得る。
・スペクトルのピークの調整された位置のリストを
;s=1,...,Sで示す。
− それぞれの亜群AからFのピークの存在の頻度。
− それぞれの亜群の剰余の中央値。この中央値は、それぞれの箱ひげ図内の水平線によって表されている。
− それぞれの亜群の剰余の四分位間区間。この四分位間区間は、それぞれの箱ひげ図の大きさによって表されている。
しかしながら、この再調整ステップは、当該の群の亜群間におけるこれらの3つのインジケータのうちの少なくとも1つのインジケータの不均一性に基づいてある参照質量対電荷を除去するステップ後も保持された質量対電荷だけに基づいて実行される。
− 例えば群レベル分類のための許容距離(tolerance distance)に等しいか、または有利には、群レベル分類のための許容距離よりも小さい許容距離の演算に基づくことができ、
− 例えばステップ150で説明したような質量対電荷の離散化によって得られたピークの行列に基づくことができる。質量対電荷の離散化に使用されるピッチは、群レベル分類に使用されるピッチとまったく同じか、または有利には、群レベル分類に使用されるピッチよりも細かい。
■不明微生物の少なくとも1つの質量スペクトルを取得することができる質量分析計と、
■質量分析計によって取得された1つまたは複数の質量スペクトルに応じて不明微生物を同定することができるコンピュータシステムと
を備え、前記システムが、
− コンピュータメモリであり、
○微生物群ごとの分類モデルおよび知識ベースと、
○微生物亜群ごとの分類モデルおよび知識ベースと、
○質量対電荷オフセットを補正する調整モデルと、
○取得した質量スペクトルに基づいてピークリストを作成するコンピュータ命令と、
○前記群ごとの分類モデルおよび前記群ごとの知識ベースに従って、不明微生物を、作成されたピークリストに応じた1つの群に分類するコンピュータ命令と、
○調整モデルに従ってピークリストを調整するコンピュータ命令と、
○前記亜群ごとの分類モデルおよび前記亜群ごとの知識ベースに従って、微生物を、調整されたピークリストに応じた1つの亜群に分類するコンピュータ命令と
を記憶したコンピュータメモリ、
− コンピュータメモリに記憶されたコンピュータ命令を実施して、微生物を1つの群および1つの亜群に分類するマイクロプロセッサベースのコンピュータユニット、
− 分類の結果を記憶するコンピュータメモリおよび/または分類の結果を表示する表示画面
を備える、デバイスによって実施される。
上式で、
○{R(l)},l={1,...,L}は、当該のスペクトル中でピークが観察されたL個の参照質量対電荷のリストである。
○fは、ステップ260および任意選択の270に従って得た調整モデルである。
○
は、
を用いて得た調整された質量対電荷である。
本発明に基づく方法を、種大腸菌の血清群(serogroup)およびシゲラ属の種の血清群の分類に適用する。したがって、この方法の目的は、病原性に応じて亜群を識別することである。
○亜群Aを形成する60株の非O157大腸菌(参照esh−col)
○亜群Bを形成する8株のO157大腸菌(参照esh−o157)
○亜群Cを形成する12株の志賀赤痢菌(参照shg−dys)
○亜群Dを形成する12株のフレクスナー赤痢菌(参照shg−flx)
○亜群Eを形成する12株のボイド赤痢菌(参照shg−boy)
○亜群Fを形成する12株のソンネ赤痢菌(参照shg−son)
を含む。現在のVITEK(登録商標) MS装置はこれらの116種類の微生物を識別しない。したがって、この装置の分類アルゴリズムは、これらの微生物を、関連知識ベースの群「大腸菌/シゲラ属」に分類する。
・ブロス(broth)を使用した寒天増殖培地上で培養した後、コロニーをサンプリングする。
・脱塩水300μLを含む2mLのエッペンドルフ管中でコロニーを懸濁させる。
・無水エタノール0.9mLを加え、(渦流)混合する。
・10000rpmで2分間、遠心分離する。
・ピペットを使用して上澄みを除く。
・70%ギ酸40μLを加え、(渦流)混合する。
・アセトニトリル40μLを加え、(渦流)混合する。
・10000rpmで2分間、遠心分離する。
・上澄み1μLを付着させる。
・乾燥させる。
・HCCAマトリックス1μLを加える。
・線形モード
・ラスタリング:レギュラーサーキュラ(regular circular)
・1試料当たり100プロファイル
・1プロファイル当たり5照射
・2000トムソンから20000トムソンの間での取得
・オートクオリティパラメータ(auto−quality parameter)の起動
■非O157大腸菌、亜群A
■O157大腸菌、亜群B
■志賀赤痢菌、亜群C
■フレクスナー赤痢菌、亜群D
■ボイド赤痢菌、亜群E
■ソンネ赤痢菌、亜群F
− 当該のスペクトルについて、予め決められた37個の参照質量対電荷のうち少なくとも28個の質量対電荷が検出されなければならず、それぞれの参照質量対電荷の理論上の位置と、取得されたスペクトル中のこれらの質量対電荷の調整後の位置との間の二乗平均平方根誤差(RMSE)は、1よりも小さくなければならない。
Claims (16)
- 質量分析によって不明微生物亜群を一組の参照亜群の中から同定するための方法であって、それぞれの亜群が、一組の参照群の中の1つの群に属しており、
● 前記一組の参照群に属する微生物として同定された微生物の一組の学習スペクトルに基づいて、関連群ごとに1つの知識ベースおよび1つの分類モデルを構築する第1のステップと、
● 前記1つの群の前記亜群に属する微生物として同定された微生物の少なくとも一組の学習スペクトルの取得に基づいて、関連亜群ごとに1つの知識ベースおよび1つの分類モデルを構築する第2のステップであり、前記一組の参照群の各群について、
○ 前記1つの群の前記亜群の前記学習スペクトルの質量対電荷オフセットを前記1つの群の前記さまざまな亜群に共通する参照質量対電荷に基づいて補正することを可能にする調整モデルを構築すること、
○ 前記1つの群の前記亜群の前記学習スペクトルの全てのピークリストの質量対電荷を調整すること、
○ 前記亜群の調整された前記学習スペクトルに基づいて、亜群ごとに1つの分類モデルおよび関連知識ベースを構築すること
を含む第2のステップと、
● 不明微生物を1つの亜群に分類する第3のステップであり、
○ 前記不明微生物の少なくとも1つのスペクトルを取得すること、
○ 前記群ごとの分類モデルおよび前記群ごとの知識ベースに従って、前記スペクトルを1つの群に分類すること、
○ 1つの群の前記調整モデルに従って、前記スペクトルの全てのピークリストの質量対電荷を調整し、前記不明微生物のスペクトルの質量対電荷オフセットを補正することを可能にすること、
○ 前記亜群ごとの分類モデルおよび前記亜群ごとの知識ベースを用いて、調整された前記ピークリストを前記1つの群の1つの亜群に分類すること
を含む第3のステップと
を含む方法。 - 関連亜群ごとに1つの知識ベースおよび1つの分類モデルを構築する前記ステップの中に、
● 前記さまざまな亜群に共通する参照質量対電荷に基づいて前記取得されたスペクトルの質量対電荷オフセットを補正することを可能にする第2の調整モデルを構築すること、
● 前記第2の調整モデルに基づいて前記学習スペクトルの全てのピークリストの質量対電荷を調整する第2のステップ
を含む、請求項1に記載の同定方法。 - 前記参照質量対電荷のリストを最適化するステップを含み、前記最適化ステップが、前記調整ステップのうちの少なくとも1つの調整ステップの後に得られた調整の品質に基づく、請求項1または2に記載の同定方法。
- 調整モデルの前記構築が、前記さまざまな亜群に共通する参照質量対電荷の既知のリストを使用する、請求項1から3のいずれか一項に記載の同定方法。
- 前記さまざまな亜群に共通する前記既知の参照質量対電荷が、
● 参照質量対電荷の付近のピークの存在または非存在を許容係数に従って検出すること、
● 各前記亜群のピークの存在の頻度に応じて前記質量対電荷をフィルタリングし、かつ/または保持された前記参照質量対電荷の位置を近似すること
からなるステップを用いて選択される、請求項4に記載の同定方法。 - 前記さまざまな亜群に共通し、前記1つの群の各前記亜群の前記ピークの存在の頻度の統計的基準に従って推測された参照質量対電荷のリストを、調整モデルの前記構築が使用する、請求項1から5のいずれか一項に記載の同定方法。
- 前記さまざまな亜群に共通する前記参照質量対電荷が、
● 各亜群のそれぞれの前記スペクトルの質量対電荷の空間を離散化すること、
● 前記離散化ステップによって画定された質量対電荷の付近のピークの存在または非存在を許容係数に従って検出すること、
● 各前記亜群のピークの存在の頻度に応じて前記質量対電荷をフィルタリングすること、
● 保持された質量対電荷の位置を近似すること
からなるステップを用いて推測される、請求項6に記載の同定方法。 - 前記離散化ステップが、前記スペクトルの前記取得の後に得られた質量対電荷の区間に関して制限された質量対電荷の前記区間にわたって実行される、請求項7に記載の同定方法。
- 前記近似ステップが、保持された各質量対電荷の付近に存在するピークの位置の分布を代表する位置を探索することからなる、請求項5から8のいずれか一項に記載の同定方法。
- 関連亜群ごとに1つの知識ベースおよび1つの分類モデルを構築する前記ステップが、前記取得されたスペクトルの質量対電荷を離散化するステップを含む、請求項1から9のいずれか一項に記載の同定方法。
- 関連亜群ごとに1つの知識ベースおよび1つの分類モデルを構築する前記ステップが、前記取得されたスペクトルの強度を処理するステップを含む、請求項1から10のいずれか一項に記載の同定方法。
- 関連亜群ごとに1つの知識ベースおよび1つの分類モデルを構築する前記ステップが、前記取得されたスペクトルの品質を制御するステップを含む、請求項1から11のいずれか一項に記載の同定方法。
- 前記1つまたは複数の調整モデルのパラメータが、ロバスト推定法と呼ばれる方法を用いて得られる、請求項1から12のいずれか一項に記載の同定方法。
- 関連群ごとに1つの知識ベースおよび1つの分類モデルを構築する前記第1のステップのために取得された前記スペクトルが、関連亜群ごとに1つの知識ベースおよび1つの分類モデルを構築する前記第2のステップのために直接に使用され、学習微生物の群および亜群が既知である、請求項1から13のいずれか一項に記載の同定方法。
- 質量分析によって微生物を同定するためのデバイスであって、
● 同定する微生物の質量スペクトルを生成することができる質量分析計と、
● 請求項1から14のいずれか一項に記載の方法を実施することによって、前記質量分析計によって生成された前記質量スペクトルに関連づけられた前記微生物を同定することができるコンピューティングユニットと
を備えるデバイス。 - 質量分析によって微生物を同定するためのデバイスであって、
● 同定する微生物の少なくとも1つの質量スペクトルを取得することができる質量分析計と、
● 前記質量分析計によって取得された前記少なくとも1つの質量スペクトルに関連づけられた微生物を同定することができるコンピュータシステムと
を備え、前記システムが、
− コンピュータメモリであり、
○ 微生物の群ごとの1つの知識ベースおよび1つの分類モデルと、
○ 微生物の亜群ごとの1つの知識ベースおよび1つの分類モデルと、
○ 前記質量分析計によって取得された前記スペクトルの質量対電荷オフセットを、前記亜群ごとの知識ベースおよび分類モデルの前記さまざまな亜群に共通する参照に基づいて補正するための調整モデルと、
○ 前記取得された質量スペクトルに基づいてピークリストを作成するためのコンピュータ命令と、
○ 前記群ごとの分類モデルおよび前記群ごとの知識ベースに従って、前記微生物を、作成された前記ピークリストに応じて1つの群に分類するためのコンピュータ命令と、
○ 前記調整モデルに従って前記ピークリストを調整するためのコンピュータ命令と、
○ 前記亜群ごとの分類モデルおよび前記亜群ごとの知識ベースに従って、前記微生物を、調整された前記ピークリストに応じて1つの亜群に分類するためのコンピュータ命令と
を記憶したコンピュータメモリ、
− 前記微生物を1つの群および1つの亜群に分類するように前記コンピュータメモリに記憶されたコンピュータ命令を実装するための、マイクロプロセッサベースのコンピュータユニット、
− 前記分類の結果を記憶するためのコンピュータメモリおよび/または前記分類の結果を表示するための表示画面
を備える、
デバイス。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1553731 | 2015-04-24 | ||
FR1553731A FR3035410B1 (fr) | 2015-04-24 | 2015-04-24 | Procede d'identification par spectrometrie de masse d'un sous-groupe de microorganisme inconnu parmi un ensemble de sous-groupes de reference |
PCT/FR2016/050940 WO2016185108A1 (fr) | 2015-04-24 | 2016-04-21 | Procédé d'identification par spectrométrie de masse d'un sous-groupe de microorganisme inconnu parmi un ensemble de sous-groupes de référence |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018513382A JP2018513382A (ja) | 2018-05-24 |
JP6611822B2 true JP6611822B2 (ja) | 2019-11-27 |
Family
ID=53674123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017555309A Active JP6611822B2 (ja) | 2015-04-24 | 2016-04-21 | 質量分析によって不明微生物亜群を一組の参照亜群の中から同定する方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11562165B2 (ja) |
EP (1) | EP3286678A1 (ja) |
JP (1) | JP6611822B2 (ja) |
CN (1) | CN107533593B (ja) |
FR (1) | FR3035410B1 (ja) |
WO (1) | WO2016185108A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10930371B2 (en) * | 2017-07-10 | 2021-02-23 | Chang Gung Memorial Hospital, Linkou | Method of creating characteristic peak profiles of mass spectra and identification model for analyzing and identifying microorganizm |
JP2020060444A (ja) * | 2018-10-10 | 2020-04-16 | 株式会社島津製作所 | 質量分析装置、質量分析方法および質量分析プログラム |
EP3660504A1 (en) * | 2018-11-30 | 2020-06-03 | Thermo Fisher Scientific (Bremen) GmbH | Systems and methods for determining mass of an ion species |
CN111325121B (zh) * | 2020-02-10 | 2024-02-20 | 浙江迪谱诊断技术有限公司 | 一种核酸质谱数值处理方法 |
WO2021245798A1 (ja) * | 2020-06-02 | 2021-12-09 | 株式会社島津製作所 | 微生物識別用マーカーの特定方法 |
CN114184668B (zh) * | 2020-09-15 | 2024-03-26 | 广州禾信康源医疗科技有限公司 | 微生物鉴定方法和双极性标准谱图生成方法 |
US11990327B2 (en) * | 2022-02-18 | 2024-05-21 | Shimadzu Corporation | Method, system and program for processing mass spectrometry data |
CN117034017B (zh) * | 2023-09-07 | 2024-03-19 | 云鉴康(杭州)医疗科技有限公司 | 一种基于深度学习的质谱图分类方法、系统、介质及设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102009032649B4 (de) * | 2009-07-10 | 2017-12-21 | Bruker Daltonik Gmbh | Massenspektrometrische Identifizierung von Mikroben nach Unterarten |
FR2951548B1 (fr) * | 2009-10-15 | 2011-11-11 | Biomerieux Sa | Procede de caracterisation d'au moins un microorganisme par spectrometrie de masse |
DE102010006450B4 (de) * | 2010-02-01 | 2019-03-28 | Bruker Daltonik Gmbh | Gestufte Suche nach Mikrobenspektren in Referenzbibiliotheken |
EP2600385A1 (fr) * | 2011-12-02 | 2013-06-05 | bioMérieux, Inc. | Procédé d'identification de microorganismes par spectrométrie de masse |
EP2600284A1 (fr) * | 2011-12-02 | 2013-06-05 | bioMérieux, Inc. | Procédé d'identification de microorganismes par spectrométrie de masse et normalisation de scores |
EP2648133A1 (fr) * | 2012-04-04 | 2013-10-09 | Biomerieux | Identification de microorganismes par spectrometrie et classification structurée |
US9677109B2 (en) * | 2013-03-15 | 2017-06-13 | Accelerate Diagnostics, Inc. | Rapid determination of microbial growth and antimicrobial susceptibility |
CN103245716A (zh) * | 2013-05-23 | 2013-08-14 | 中国科学院化学研究所 | 基于小分子代谢物质谱分析的快速高灵敏度微生物鉴定方法 |
-
2015
- 2015-04-24 FR FR1553731A patent/FR3035410B1/fr active Active
-
2016
- 2016-04-21 CN CN201680023818.2A patent/CN107533593B/zh active Active
- 2016-04-21 EP EP16726914.1A patent/EP3286678A1/fr active Pending
- 2016-04-21 WO PCT/FR2016/050940 patent/WO2016185108A1/fr unknown
- 2016-04-21 US US15/569,005 patent/US11562165B2/en active Active
- 2016-04-21 JP JP2017555309A patent/JP6611822B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US20190049445A1 (en) | 2019-02-14 |
CN107533593A (zh) | 2018-01-02 |
EP3286678A1 (fr) | 2018-02-28 |
FR3035410B1 (fr) | 2021-10-01 |
WO2016185108A1 (fr) | 2016-11-24 |
US11562165B2 (en) | 2023-01-24 |
JP2018513382A (ja) | 2018-05-24 |
FR3035410A1 (fr) | 2016-10-28 |
CN107533593B (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6611822B2 (ja) | 質量分析によって不明微生物亜群を一組の参照亜群の中から同定する方法 | |
CN108931570B (zh) | 质谱分析数据解析装置以及质谱分析数据解析用程序 | |
JP2023088913A (ja) | 誤検知を減少させた分光学的分類のための識別 | |
Tang et al. | MALDI-TOF mass spectrometry on intact bacteria combined with a refined analysis framework allows accurate classification of MSSA and MRSA | |
JP5964983B2 (ja) | 質量分析法により微生物を特定するための方法 | |
CN111770720A (zh) | 用于实时拉曼光谱法以进行癌症检测的系统和方法 | |
JP2006267111A (ja) | スペクトル、特にnmrスペクトルのセットをプロセッシングする方法 | |
JP6370903B2 (ja) | 生体サンプルを分析するための方法及びデバイス | |
CN110687072A (zh) | 一种基于光谱相似度的校正集和验证集选择及建模方法 | |
US20190252172A1 (en) | Categorization data manipulation using a matrix-assisted laser desorption/ionization time-of-flight mass spectrometer | |
CN104990893A (zh) | 一种基于相似判别的汽油辛烷值检测方法 | |
CN108491690B (zh) | 一种蛋白质组学中肽段的肽段定量效率预测方法 | |
US8725469B2 (en) | Optimization of data processing parameters | |
TWI428581B (zh) | 辨識光譜的方法 | |
US20230009725A1 (en) | Use of genetic algorithms to determine a model to identity sample properties based on raman spectra | |
CN111344572A (zh) | 基于maldi-tof质量分析的抗生素抗性辨别装置及方法 | |
Vranckx et al. | Analysis of MALDI‐TOF MS Spectra using the BioNumerics Software | |
McDonald et al. | Mining whole-sample mass spectrometry proteomics data for biomarkers–An overview | |
US20200104768A1 (en) | Method and Apparatus for Process Optimization | |
JP2003530858A (ja) | 質量分析法に基づくプロテオームデータベース調査による微生物同定のための方法およびシステム | |
US20230282310A1 (en) | Microorganism Discrimination Method and System | |
US20240094173A1 (en) | A method of analysis of mass spectrometry data | |
TW202001246A (zh) | 檢測微生物抗藥性方法 | |
JP2024000735A (ja) | 学習データを作成する方法、微生物の判別方法、解析装置、プログラム | |
US20240060884A1 (en) | Monitoring and control of unwanted polymer by-product generated in monomers production, storage, and handling using infrared spectroscopy analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190123 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190920 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191029 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6611822 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |