JP2021042965A - 微生物判別方法、微生物判定システム、及び微生物判別プログラム - Google Patents

微生物判別方法、微生物判定システム、及び微生物判別プログラム Download PDF

Info

Publication number
JP2021042965A
JP2021042965A JP2019162711A JP2019162711A JP2021042965A JP 2021042965 A JP2021042965 A JP 2021042965A JP 2019162711 A JP2019162711 A JP 2019162711A JP 2019162711 A JP2019162711 A JP 2019162711A JP 2021042965 A JP2021042965 A JP 2021042965A
Authority
JP
Japan
Prior art keywords
microorganism
subspecies
discrimination
microorganisms
mass spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019162711A
Other languages
English (en)
Other versions
JP7334549B2 (ja
Inventor
賢志 山田
Kenji Yamada
賢志 山田
華奈江 寺本
Kanae Teramoto
華奈江 寺本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Priority to JP2019162711A priority Critical patent/JP7334549B2/ja
Publication of JP2021042965A publication Critical patent/JP2021042965A/ja
Application granted granted Critical
Publication of JP7334549B2 publication Critical patent/JP7334549B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

【課題】微生物判別を正確且つ容易に行うことを可能とする。【解決手段】同一種に属し、亜種、株、又はタイプが既知である複数の既知微生物に関する複数のマススペクトルを取得し(S11)、異なる亜種、株、又はタイプの間で質量が相違すると推定されるマーカー候補タンパク質のm/zを記載したリストを作成し(S12)、前記m/zの前後所定の範囲のみを非零とするマスクを作成して(S14)、前記複数のマススペクトルの各々に対してマスキングを施し(S15)、各マススペクトルに連続ウェーブレット変換を施すことによって複数のウェーブレット画像を生成し(S16)、前記複数のウェーブレット画像と、前記複数の既知微生物の各々の亜種、株、又はタイプの情報とを学習データとする機械学習によって判別モデルを生成し、未知微生物のマススペクトルを前記判別モデルに適用することによって、該未知微生物の亜種、株、又はタイプを判別する。【選択図】図2

Description

本発明は、微生物判別方法、微生物判定システム、及び微生物判別プログラムに関する。
近年、マトリックス支援レーザ脱離イオン化質量分析法(Matrix-assisted laser desorption/ionization mass spectrometry :MALDI-MS)による微生物判別技術が、臨床医学及び品質管理等の分野で急速に広がっている。この方法は、ごく微量の微生物試料を用いて得られたマススペクトルに基づいて微生物の判別を行う手法であり、短時間で分析結果を得ることができ、多検体の連続分析も容易であるため簡便且つ迅速な微生物判別が可能である。
MALDI-MSによる微生物判別を行うためには、分類上異なるグループに属する微生物(例えば、同一の種であるが株が異なる微生物)の間で、マススペクトル上での位置や高さが異なるピーク、すなわちバイオマーカーピークを見出し、判別しようとする微生物のマススペクトルと既知微生物のマススペクトルにおけるバイオマーカーピークを照合する必要がある。細菌をはじめとする微生物の判別では、バイオマーカーピークとしてタンパク質のピークが用いられることが多く、特にリボソームタンパク質のピークがしばしば用いられる(例えば、非特許文献1及び非特許文献2を参照)。
寺本華奈江、「MALDI-MS によるバクテリア分析」、島津評論、第74巻、第1・2号、株式会社島津製作所、2017年9月20日, pp.51-62 寺本華奈江、他6名、"MALDI-MS Proteotyping of Cutibacterium acnes", 2nd International BMS Symposium 2018 P-11,2018年10月26日
特に、近縁の微生物同士の判別(すなわち、亜種、株、又はタイプレベルでの判別)を行うことにより、病原性の有無、又は感染源の特定など、医療分野又は食品分野等での非常に有用な情報を取得することができる。しかしながら、従来のMALDI-MSを利用した微生物判別において、こうした近縁の微生物を正確に判別するためには、多数のバイオマーカーピークの照合を行う必要があり、判別の容易性の点で更なる改善の余地があった。
本発明は上記の点に鑑みてなされたものであり、その目的とするところは、正確性の高い微生物判別を容易に行うことのできる微生物判別方法、微生物判別システム、及び微生物判別プログラムを提供することにある。
上記課題を解決するためになされた本発明に係る微生物判別方法は、
同一の種に属し、亜種、株、又はタイプが既知である複数の既知微生物をそれぞれ質量分析して複数のマススペクトルを取得し、
前記既知微生物と同一の種に属する微生物において、異なる亜種間、異なる株間、又は異なるタイプ間で質量が相違すると推定されるマーカー候補タンパク質のm/zを記載したm/zリストを作成し、
前記m/zリストに記載されたm/zの前後所定の範囲のみを非零とするマスクを作成し、
前記複数のマススペクトルの各々に対して前記マスクによるマスキングを施し、
前記マスキング後の前記複数のマススペクトルの各々に連続ウェーブレット変換を施すことによって複数のウェーブレット画像を生成し、
前記複数のウェーブレット画像と、前記複数の既知微生物の各々の亜種、株、又はタイプの情報とを学習データとする機械学習によって判別モデルを生成し、
前記既知微生物と同一の種に属し、亜種、株、又はタイプが未知である未知微生物を質量分析して得られたマススペクトルを前記判別モデルに適用することによって、該未知微生物の亜種、株、又はタイプを判別するものである。
また、上記課題を解決するためになされた本発明に係る微生物判別システムは、
同一の種に属し、亜種、株、又はタイプが既知である複数の既知微生物をそれぞれ質量分析して得られた複数のマススペクトルを取得する既知サンプルデータ取得部と、
前記既知微生物と同一の種に属する微生物において、異なる亜種間、異なる株間、又は異なるタイプ間で質量が相違すると推定されるマーカー候補タンパク質のm/zを記載したm/zリストを取得するm/zリスト取得部と、
前記m/zリストに記載されたm/zの前後所定の範囲のみを非零とするマスクを作成するマスク作成部と、
前記複数のマススペクトルの各々に対して前記マスクによるマスキングを施すマスキング部と、
前記マスキング後の前記複数のマススペクトルの各々に連続ウェーブレット変換を施すことによって複数のウェーブレット画像を生成するウェーブレット画像生成部と、
前記複数のウェーブレット画像と、前記複数の既知微生物の各々の亜種、株、又はタイプの情報とを学習データとする機械学習によって判別モデルを生成するモデル生成部と、
前記既知微生物と同一の種に属し、亜種、株、又はタイプが未知である未知微生物を質量分析して得られたマススペクトルを前記判別モデルに適用することによって、該未知微生物の亜種、株、又はタイプを判別する判別部と、
を備えるものである。
また、上記課題を解決するためになされた本発明に係る微生物判別プログラムは、上記微生物判別システムの機能を実現するためのコンピュータプログラムであり、コンピュータを、前記微生物判別システムの各部として機能させるものである。
上記本発明に係る微生物判別方法、微生物判別システム、及び微生物判別プログラムによれば、複数の既知微生物のマススペクトルに基づく機械学習によって微生物判別のための判別モデルを作成し、未知微生物のマススペクトルを該判別モデルに適用することによって、容易に正確性の高い微生物判別を行うことができる。また、前記判別モデルの作成に際し、既知微生物のマススペクトルデータを複数の画素から成る2次元画像であるウェーブレット画像に変換しておくことにより、ディープラーニング等の高性能な機械学習アルゴリズムへの適用が容易となる。また、該ウェーブレット画像への変換に先立って、マススペクトルのマスキングを行うことによって亜種間、株間、又はタイプ間の差異が強調されたウェーブレット画像を生成することができ、より判別能力の高い判別モデルを作成することができる。
本発明の一実施形態に係る微生物判別システムの概略構成図。 学習データ生成部における処理の流れを示すフローチャート。 本実施形態におけるm/zリストの一例を示す図。 キャリブレーションの前後における既知サンプルデータの一例を示す図。 前記m/zリストに基づいて作成されたマスクの全体を示す図。 前記マスクのm/z6787付近の拡大図。 前記マスクをキャリブレーション後の既知サンプルデータに適用した結果を示す図。 ウェーブレット画像の一例を示す図。 前記ウェーブレット画像から有効画素を抽出して得られたウェーブレット画像を示す図。 判別部における処理の流れを示すフローチャート。 実施例における判別モデルの評価結果を示す図。
図1は本発明の一実施形態に係る微生物判別システム10の要部構成を示す図である。この微生物判別システム10は、学習データ生成部20、モデル生成部30、判別部40、データ記憶部50、マウス等のポインティングデバイスやキーボード等を含む入力部60、及び液晶ディスプレイ等の表示装置を含む表示部70を備えている。
学習データ生成部20は、既知微生物をMALDI-MSで分析して得られたマススペクトルデータに所定の処理を施すことにより、機械学習に用いられる学習データを生成するものである。学習データ生成部20は、既知サンプルデータ取得部21、m/zリスト取得部22、既知サンプルデータキャリブレーション部23(本発明におけるキャリブレーション部に相当)、マスク作成部24、既知サンプルデータマスキング部25(本発明におけるマスキング部に相当)、及び既知サンプルデータ画像化部26(本発明におけるウェーブレット画像生成部に相当)を含んでいる。
モデル生成部30は、前記学習データを用いた機械学習アルゴリズムによって、未知微生物を判別するための判別モデルを生成するものである。
判別部40は、未知微生物を質量分析して得られたマススペクトルデータに所定の処理を施すと共に、該処理後のデータを前記判別モデルに適用することにより、前記未知微生物が属する亜種、株、又はタイプの判別を行うものである。判別部40は、未知サンプルデータ取得部41、未知サンプルデータキャリブレーション部42、未知サンプルデータマスキング部43、未知サンプルデータ画像化部44、及び判別実行部45を含んでいる。
学習データ生成部20、モデル生成部30、及び判別部40の実体は、パーソナルコンピュータ又はそれよりも高性能なコンピュータであり、該コンピュータに予めインストールされた専用のデータ解析ソフトウェアをコンピュータ上で動作させることにより、各部の機能が実現される。データ記憶部50は、前記コンピュータに内蔵された又は直接接続された記憶装置によるものとするほか、例えば前記コンピュータからインターネット等を介してアクセス可能である別のコンピュータシステム上に存在する、つまりはクラウドコンピューティングにおける記憶装置などを利用してもよい。
また、本実施形態に係る微生物判別システム10は、学習データ生成部20、モデル生成部30、及び判別部40の機能を複数のコンピュータに分担させるものとすることもできる。具体的には、例えば、学習データ生成部20及びモデル生成部30の機能を一台のコンピュータに割り当て、判別部40の機能をそれとは別のコンピュータに割り当てることが考えられる。
まず、学習データ生成部20における処理の詳細について図2のフローチャートを参照しつつ説明する。
始めに、既知サンプルデータ取得部21が、亜種、株、又はタイプが既知である微生物(以下、単に「既知微生物」とよぶ)のマススペクトルデータをデータ記憶部50から取得する(ステップS11)。なお、前記既知微生物のマススペクトルデータは、予め既知微生物をMALDI-MSで分析することによって取得され、該既知微生物の亜種、株、又はタイプの情報(以下、これを「正解ラベル」とよぶ)と関連付けてデータ記憶部50に記憶されている。
次に、m/zリスト取得部22が、判別対象とする微生物の亜種間、株間、又はタイプ間で質量に差異があると推定されるタンパク質(以下、「マーカー候補タンパク質」とよぶ)及びそのm/zを記載したリスト(以下、「m/zリスト」とよぶ)をデータ記憶部50から取得する(ステップS12)。なお、m/zリストは、予めユーザ又は本実施形態に係る微生物判別システム10のメーカによって作成され、データ記憶部50に記憶されている。前記マーカー候補タンパク質は、例えば、亜種、株、又はタイプの異なる複数の微生物の塩基配列又はアミノ酸配列の比較、又は亜種、株、又はタイプの異なる複数の微生物を実際にMALDI-MSで分析して得られたマススペクトルの比較によって決定することができる。また、マーカー候補タンパク質のm/zは、NCBI(National Center for Biotechnology Information)等の公的データベースに収録されている各タンパク質の理論質量を、該タンパク質に由来するイオンのm/zに変換することによって求めることができる。例えば、シナピン酸をマトリックスとして調整された微生物試料をMALDI-MSで分析すると、主にプロトン化分子([M+H]+)のピークが観測される。したがって、このような場合にはマーカー候補タンパク質の理論質量にプロトンの質量を加算することで前記イオンの質量への変換が可能となる。なお、マーカー候補タンパク質の理論質量が公的データベースに収録されていない場合には、該マーカー候補タンパク質の塩基配列又はアミノ酸配列からその理論質量を計算し、それをイオンのm/zに変換したものを前記m/zリストに記載してもよい。
ステップS12で作成されるm/zリストの一例を図3に示す。このm/zリストは、アクネ菌(Cutibacterium acnes)のタイプ間で質量に差異があると推定されるタンパク質に関するm/zリストであって、左側の列にマーカー候補タンパク質の名称が、右側の列に該マーカー候補タンパク質の理論m/zが記載されている。なお、同図において複数のm/zが記載されているタンパク質(例えば、L23又はL15等)は、タイプ間で質量に差異があることが実測で確認できたタンパク質である。
続いて、既知サンプルデータキャリブレーション部23が、ステップS11で取得した既知微生物のマススペクトルデータに対してステップS12で取得したm/zリストを用いたキャリブレーションを行う(ステップS13)。具体的には、前記既知微生物のマススペクトルデータについてピーク検出を行ってピークリスト(すなわち検出されたピークのm/zのリスト)を作成すると共に、該ピークリストをステップS11で取得したm/zリストと照合し、両者におけるm/z値の差異を打ち消すように前記既知微生物のマススペクトルデータの横軸を補正する。
アクネ菌をMALDI-MSで分析して得られたマススペクトルに対して、図3のm/zリストを用いたキャリブレーションを行った結果の一例を図4に示す。なお、図4ではm/z6787の付近を拡大して示している。図4において、同一の線種(実線、破線、又は一点鎖線)で示したものは同一サンプルに由来する波形であり、マーカ(〇印)の付いていない線で示されているのがキャリブレーション前の波形であり、マーカー付きの線で示されているのがキャリブレーション後の波形である。図4に示す通り、キャリブレーション前のデータでは、m/z6787付近のピークがサンプルごとにばらついているのに対し、キャリブレーション後のデータではそれらのピークが理論値(すなわちm/z6787)に揃っている。
続いて、マスク作成部24が、前記m/zリストに基づいてマーカー候補タンパク質の理論m/zの近傍だけで非零となるマスクを生成する(ステップS14)。具体的には、例えば、ステップS12で取得されたm/zリストに記載されている各m/zの位置にピークを有する仮想的なマススペクトルを作成し、当該マススペクトルの波形を輪郭線とし、該輪郭線の上側の領域のみをマスキングするようなマスクを作成する。ここで、仮想的なマススペクトル上における各ピークは正規分布形状とすることが望ましい。また、各ピークの高さは典型的には飽和させ、各ピークの幅はMALDI-MSにおけるピークの出現位置の誤差を考慮した適当な値とする。なお、該ピークの高さ及び幅は、システム側で予め定められた値とすることもできるが、ユーザが任意の値を設定できるようにしてもよい。
ステップS14で作成されるマスクの一例を図5に示す。同図のマスクは図3のm/zリストに基づいて作成されたものであり、該m/zリストに記載された各m/zの近傍以外の領域をマスキングするものとなっている。該マスクのm/z6787付近を拡大したものを図6に示す。同図においてm/z6787を中心とするピークの波形がマスクの輪郭線であり、網掛けで示した領域が当該マスクによってマスクされる領域である。
次に、既知サンプルデータマスキング部25が、ステップS11で取得した既知微生物のマススペクトルデータに、ステップS14で作成したマスクを適用することによってマスキングを行う(ステップS15)。これにより、各マススペクトルデータは、マーカー候補タンパク質の理論m/zの近傍のみで値を持つマススペクトルとなる。
アクネ菌をMALDI-MSで分析して得られたマススペクトルに、図5のマスクを用いたマスキングを施した結果の一例を図7に示す。なお、同図では、前記マススペクトルのm/z6787付近を拡大して示している。同図において、破線がマスキング前のデータを示しており、実線がマスキング後のデータを示している。同図に示す通り、マスキング後のデータでは、前記m/zリストに含まれているm/z(すなわちm/z6787)の近傍だけが非零の値をとっている。これにより、判別に役立たないピーク(例えばノイズピークや、亜種間、株間、又はタイプ間で差異が見られないピーク等)を除去することができる。
続いて、既知サンプルデータ画像化部26が、前記マスキング後の既知微生物のマススペクトルデータ(m/zと強度との対応関係を表す1次元信号データ)を、連続ウェーブレット変換によって2次元画像データ(ウェーブレット変換後の信号強度分布を、m/z値を横軸とし、周波数を縦軸とし、信号強度を画素値として表したデータ。以下、「ウェ−ブレット画像」とよぶ)に変換する(ステップS16)。
上述のアクネ菌由来のマススペクトルに、図3のm/zリストを用いたキャリブレーション及び図5のマスクによるマスキングを施した上で、2次元画像(ウェーブレット画像)への変換を行った結果の一例を図8に示す。なおウェーブレット画像の各画素は複素数であるため、同図では各画素を絶対値に変換して等高線で示し、各等高線で囲まれた領域を濃淡の異なる網掛けで示している(後述の図9において同じ)。
なお、上記ウェーブレット変換後の画像には、図8に示すように、絶対値が小さい領域(図中の白色の領域)が多く含まれる。このような領域の大部分は、ステップS15でマスキングされた領域に由来するものであり、微生物の判別には寄与しない。そこで、連続ウェーブレット変換の後にこのような領域に相当する画素を除去するか、あるいはこのような領域がなるべく生じないように、連続ウェーブレット変換を施す前のマススペクトルから、値のない範囲を予めカットしておくことが望ましい。後者の方法で有効画素の抽出を行ったウェーブレット画像を図9に示す。
データ記憶部50には、同一の種に属する、様々な亜種、株、又はタイプの微生物に由来する複数のマススペクトルが記憶されており、学習データ生成部20では、これら複数のマススペクトルのそれぞれについて上記ステップS11〜S16の処理が実行される。これにより得られた複数のウェーブレット画像データは、上述の正解ラベルとそれぞれ関連付けられてデータ記憶部50に記憶される。
続いて、ユーザが入力部60を操作して、前記複数のウェーブレット画像データを学習データとする判別モデルの作成を指示すると、モデル生成部30において判別モデル(微生物判別のための数式的なモデル)の作成が実行される。具体的には、モデル生成部30が、データ記憶部50から前記複数のウェーブレット画像及びそれらに関連付けられた正解ラベルを読み出し、これらを学習データとして、予め定められた機械学習アルゴリズムによる判別モデルの作成を行う。前記機械学習アルゴリズムとしては、典型的にはディープラーニングが用いられるが、これに限定されるものではなく、その他の機械学習アルゴリズム(例えば、サポートベクターマシン等)を用いるようにしてもよい。生成された判別モデルは、ステップS12で生成されたm/zリスト及びステップS14で生成されたマスクのデータと関連付けてデータ記憶部50に記憶される。
その後、判別対象とする未知微生物をMALDI-MSで分析して得られたマススペクトルデータがデータ記憶部50に記憶されている状態で、ユーザが、入力部60を介して前記判別モデルによる前記未知微生物の判別を指示すると、判別部40による判別処理が実行される。
以下、このときの判別部40における処理の詳細について図10のフローチャートを参照しつつ説明する。まず、判別部40の未知サンプルデータ取得部41が、ユーザによって指定された前記未知微生物のマススペクトルデータをデータ記憶部50から取得する(ステップS21)。続いて、未知サンプルデータキャリブレーション部42が、前記判別モデルに対応付けてデータ記憶部50に記憶されているm/zリスト(すなわちステップS12で作成されたm/zリスト)を読み出し、該m/zリストを用いて前記未知微生物のマススペクトルデータに対するキャリブレーションを実行する(ステップS22)。次に、未知サンプルデータマスキング部43が、前記判別モデルに対応付けてデータ記憶部50に記憶されているマスク(すなわちステップS14で作成されたマスク)を読み出し、該マスクを用いて、前記キャリブレーション後のマススペクトルに対するマスキングを行う(ステップS23)。その後、未知サンプルデータ画像化部44が、前記キャリブレーション及び前記マスキング後のマススペクトルデータに連続ウェーブレット変換を施すことによって、該マススペクトルをウェーブレット画像に変換する(ステップS24)。なお、これらのステップS22、ステップS23、及びステップS24における処理の詳細は、それぞれステップS13、ステップS15、及びステップS16と同様であるため、ここでは説明を省略する。
その後、判別実行部45が前記判別モデルをデータ記憶部50から読み出し、ステップS24で生成した前記ウェーブレット画像データの各画素値を前記判別モデルに入力することによって得られる出力値から、前記未知微生物がいかなる亜種、株、又はタイプに属するものであるかを判別する(ステップS25)。判別実行部45による判別結果は、データ記憶部50に記憶されると共に、表示部70の画面上に表示されてユーザに提示される(ステップS26)。
以上、本発明を実施するための形態について説明を行ったが、本発明は上記の実施形態に限定されるものではなく、本発明の趣旨の範囲で適宜変更が許容される。例えば、前記実施形態では、学習データ生成部20、モデル生成部30、及び判別部40の機能を一台のコンピュータによって実現する構成としたが、これらはそれぞれ別のコンピュータによって実現されるものとしてもよい。また、上記実施形態において、既知サンプルデータ取得部21及び未知サンプルデータ取得部41は、いずれも、これらの機能ブロックと同一のコンピュータに設けられた記憶装置に設けられたデータ記憶部50から既知微生物のマススペクトルデータと正解ラベル、及び未知微生物のマススペクトルデータを取得するものとしたが、これに代えて、ネットワークを介して接続された別のコンピュータから前記未知データ及び既知データを取得するものとしてもよい。
以下、本発明に係る微生物判別方法の実施例について説明する。なお、ここでは本発明をアクネ菌のタイピング(タイプの判別)に適用した例を示すが、本発明は、その他の微生物のタイピング、亜種判別、又は株判別にも好適に用いることができる。
1.既知サンプルデータの取得
アクネ菌は、形態、細胞壁の構成成分、及び血清型凝集試験の結果等の表現型によって5つのタイプ(Type I A1, Type I A2, Type I B, Type II, 及びType III)に分類される。本実施例では、タイプが既知のアクネ菌45株をサンプルとしてMALDI-MSによる分析を行い、得られた45個のマススペクトルデータの中からランダムに選出した70%のマススペクトルデータを判別モデルの作成に使用した。以下、これらのマススペクトルを「学習用マススペクトル」とよぶ)。なお、残り30%のマススペクトルデータは、判別モデルの評価(詳細は後述)に使用した。以下、これらのマススペクトルを「評価用マススペクトル」とよぶ。
2.m/zリストの作成
NCBIから入手したアクネ菌のアミノ酸配列情報に基づいて、タイプ間で質量に相違があるタンパク質を抽出し、さらにその中からMALDI-MSによって安定的に検出可能なタンパク質を選出した。更に、NCBIからこれらのタンパク質(マーカー候補タンパク質)の理論質量を取得してm/zに変換することにより、図3で示したm/zリストを作成した。
3.キャリブレーション
前記m/zリストを用いて前記学習用マススペクトルのキャリブレーションを行った。具体的には、前記学習用マススペクトルの各々についてピーク検出を行ってピークリストを作成すると共に、該ピークリストを前記m/zリストと照合し、図4で示したように、両者におけるm/z値の差異を打ち消すように各学習用マススペクトルの横軸を補正した。
4.マスキング
さらに、前記m/zリストに基づいて、該リストに含まれる理論m/zの近傍だけで信号強度が非零となるマスクを作成し、これを用いて前記キャリブレーション後の各学習用マススペクトルのマスキングを行った。前記マスクのプロファイル、及び該マスクを学習用マススペクトルに適用した結果は、図5〜図7で例示した通りである。
5.ウェーブレット画像への変換
前記キャリブレーション及び前記マスキングを施した各学習用マススペクトルから値を有しない領域を除去した上で、連続ウェーブレット変換によってウェーブレット画像(図9で例示)に変換した。
6.判別モデルの生成
各学習用マススペクトルに対して上記のキャリブレーション、マスキング、ウェーブレット画像への変換を行って得られた複数のウェーブレット画像データを学習用データとして、ディープラーニングによる判別モデルの生成を行った。
7.判別モデルの評価
以上の方法で生成した判別モデルによって、評価用マススペクトルのタイピングを行うことができるか否かを確認した。具体的には、上述の通り、タイプが既知のアクネ菌45株について得られた45個のマススペクトルデータに対して、上述のような「学習用マススペクトル」と「評価用マススペクトル」へのランダムな分割と、「学習用マススペクトル」を用いた判別モデルの生成、及び該判別モデルを用いた「評価用マススペクトル」のタイピングを100回繰り返し行うことにより、判別モデルの誤判別率を導出した。なお、上記の通り本実施例では「評価用マススペクトル」についても正解(すなわちアクネ菌のタイプ)が分かっているため、前記判別モデルによる「評価用マススペクトル」のタイピングの成否を判定することができる。
図11は、「学習用マススペクトル」を用いて生成した判別モデルによって、「評価用マススペクトル」の判別を行った結果の一例である。この例では、全ての「評価用マススペクトル」が正しいタイプに判定されている。上記100回のタイピングの結果、本実施例における判別モデルの誤判別率の平均値は6.7%であった。このことから、本発明の方法によって良好な判別モデルを生成できることが確認された。
[種々の態様]
上述した例示的な実施形態は、以下の態様の具体例であることが当業者により理解される。
(第1項)一態様に係る微生物判別方法は、
同一の種に属し、亜種、株、又はタイプが既知である複数の既知微生物をそれぞれ質量分析して複数のマススペクトルを取得し、
前記既知微生物と同一の種に属する微生物において、異なる亜種間、異なる株間、又は異なるタイプ間で質量が相違すると推定されるマーカー候補タンパク質のm/zを記載したm/zリストを作成し、
前記m/zリストに記載されたm/zの前後所定の範囲のみを非零とするマスクを作成し、
前記複数のマススペクトルの各々に対して前記マスクによるマスキングを施し、
前記マスキング後の前記複数のマススペクトルの各々に連続ウェーブレット変換を施すことによって複数のウェーブレット画像を生成し、
前記複数のウェーブレット画像と、前記複数の既知微生物の各々の亜種、株、又はタイプの情報とを学習データとする機械学習によって判別モデルを生成し、
前記既知微生物と同一の種に属し、亜種、株、又はタイプが未知である未知微生物を質量分析して得られたマススペクトルを前記判別モデルに適用することによって、該未知微生物の亜種、株、又はタイプを判別するものである。
(第2項)第1項に記載の微生物判別方法は、
前記既知微生物のマススペクトルに含まれるピークのm/zと、前記m/zリストに記載されたm/zとを照合して、両者の差異が小さくなるように該マススペクトルをキャリブレーションし、
キャリブレーション後の該マススペクトルに対して前記マスキングを施すものであってもよい。
(第3項)第1項又は第2項に記載の微生物判別方法は、
前記既知微生物がアクネ菌であり、
前記マーカー候補タンパク質が、リボソームタンパク質L30、L29、S15、S19、L23、L21、L07/L12、S08、L15、L09、L13、及びL06、並びにAntitoxinであって、
アクネ菌である前記未知微生物のタイプを判別するものであってもよい。
(第4項)一態様に係る微生物判システムは、
同一の種に属し、亜種、株、又はタイプが既知である複数の既知微生物をそれぞれ質量分析して得られた複数のマススペクトルを取得する既知サンプルデータ取得部と、
前記既知微生物と同一の種に属する微生物において、異なる亜種間、異なる株間、又は異なるタイプ間で質量が相違すると推定されるマーカー候補タンパク質のm/zを記載したm/zリストを取得するm/zリスト取得部と、
前記m/zリストに記載されたm/zの前後所定の範囲のみを非零とするマスクを作成するマスク作成部と、
前記複数のマススペクトルの各々に対して前記マスクによるマスキングを施すマスキング部と、
前記マスキング後の前記複数のマススペクトルの各々に連続ウェーブレット変換を施すことによって複数のウェーブレット画像を生成するウェーブレット画像生成部と、
前記複数のウェーブレット画像と、前記複数の既知微生物の各々の亜種、株、又はタイプの情報とを学習データとする機械学習によって判別モデルを生成するモデル生成部と、
前記既知微生物と同一の種に属し、亜種、株、又はタイプが未知である未知微生物を質量分析して得られたマススペクトルを前記判別モデルに適用することによって、該未知微生物の亜種、株、又はタイプを判別する判別部と、
を備えるものである。
(第5項)第4項に記載の微生物判別システムは、
前記既知微生物のマススペクトルに含まれるピークのm/zと、前記m/zリストに記載されたm/zとを照合して、両者の差異が小さくなるように該マススペクトルをキャリブレーションするキャリブレーション部、
を更に備え、
前記既知微生物のマススペクトルに対して前記キャリブレーション部によるキャリブレーションを施した上で、前記マスキング部によるマスキングを行うものであってもよい。
(第6項)第4項又は第5項に記載の微生物判別システムは、
前記既知微生物がアクネ菌であり、
前記マーカー候補タンパク質が、リボソームタンパク質L30、L29、S15、S19、L23、L21、L07/L12、S08、L15、L09、L13、及びL06、並びにAntitoxinであって、
前記判別部において、アクネ菌である前記未知微生物のタイプを判別するものであってもよい。
(第7項)一態様に係る微生物判別プログラムは、コンピュータを、第4項〜第6項のいずれかに記載の微生物判別システムの各部として機能させるものである。
第1項に記載の微生物判別方法、第4項に記載の微生物判別システム、又は第7項に記載の微生物判別プログラムによれば、複数の既知微生物のマススペクトルに基づく機械学習によって微生物判別のための判別モデルを作成し、未知微生物のマススペクトルを該判別モデルに適用することによって、容易に正確性の高い微生物判別を行うことができる。また、前記判別モデルの作成に際し、既知微生物のマススペクトルデータをウェーブレット画像に変換しておくことにより、ディープラーニング等の高性能な機械学習アルゴリズムへの適用が容易となる。また、該ウェーブレット画像への変換に先立って、マススペクトルのマスキングを行うことによって亜種間、株間、又はタイプ間の差異が強調されたウェーブレット画像を生成することができ、より判別能力の高い判別モデルを作成することができる。
また、第2項に記載の微生物判別方法又は第5項に記載の微生物判別システムによれば、
既知微生物のマススペクトルをウェーブレット画像に変化する前にキャリブレーションを行うことにより、前記複数のマススペクトルデータにおける横軸のずれを補正して、生成される判別モデルの正確性を高めることができる。
また、第3項に記載の微生物判別方法又は第6項に記載の微生物判別システムによれば、アクネ菌のタイプピングを容易且つ正確に行うことが可能となる。
10…微生物判別システム
20…学習データ生成部
21…既知サンプルデータ取得部
22…m/zリスト取得部
23…既知サンプルデータキャリブレーション部
24…マスク作成部
25…既知サンプルデータマスキング部
26…既知サンプルデータ画像化部
30…モデル生成部
40…判別部
41…未知サンプルデータ取得部
42…未知サンプルデータキャリブレーション部
43…未知サンプルデータマスキング部
44…未知サンプルデータ画像化部
45…判別実行部
50…データ記憶部
60…入力部
70…表示部

Claims (7)

  1. 同一の種に属し、亜種、株、又はタイプが既知である複数の既知微生物をそれぞれ質量分析して複数のマススペクトルを取得し、
    前記既知微生物と同一の種に属する微生物において、異なる亜種間、異なる株間、又は異なるタイプ間で質量が相違すると推定されるマーカー候補タンパク質のm/zを記載したm/zリストを作成し、
    前記m/zリストに記載されたm/zの前後所定の範囲のみを非零とするマスクを作成し、
    前記複数のマススペクトルの各々に対して前記マスクによるマスキングを施し、
    前記マスキング後の前記複数のマススペクトルの各々に連続ウェーブレット変換を施すことによって複数のウェーブレット画像を生成し、
    前記複数のウェーブレット画像と、前記複数の既知微生物の各々の亜種、株、又はタイプの情報とを学習データとする機械学習によって判別モデルを生成し、
    前記既知微生物と同一の種に属し、亜種、株、又はタイプが未知である未知微生物を質量分析して得られたマススペクトルを前記判別モデルに適用することによって、該未知微生物の亜種、株、又はタイプを判別する、微生物判別方法。
  2. 前記既知微生物のマススペクトルに含まれるピークのm/zと、前記m/zリストに記載されたm/zとを照合して、両者の差異が小さくなるように該マススペクトルをキャリブレーションし、
    キャリブレーション後の該マススペクトルに対して前記マスキングを施す請求項1に記載の微生物判別方法。
  3. 前記複数の既知微生物の各々がアクネ菌であり、
    前記マーカー候補タンパク質が、リボソームタンパク質L30、L29、S15、S19、L23、L21、L07/L12、S08、L15、L09、L13、及びL06、並びにAntitoxinであって、
    アクネ菌である前記未知微生物のタイプを判別する請求項1又は2に記載の微生物判別方法。
  4. 同一の種に属し、亜種、株、又はタイプが既知である複数の既知微生物をそれぞれ質量分析して得られた複数のマススペクトルを取得する既知サンプルデータ取得部と、
    前記既知微生物と同一の種に属する微生物において、異なる亜種間、異なる株間、又は異なるタイプ間で質量が相違すると推定されるマーカー候補タンパク質のm/zを記載したm/zリストを取得するm/zリスト取得部と、
    前記m/zリストに記載されたm/zの前後所定の範囲のみを非零とするマスクを作成するマスク作成部と、
    前記複数のマススペクトルの各々に対して前記マスクによるマスキングを施すマスキング部と、
    前記マスキング後の前記複数のマススペクトルの各々に連続ウェーブレット変換を施すことによって複数のウェーブレット画像を生成するウェーブレット画像生成部と、
    前記複数のウェーブレット画像と、前記複数の既知微生物の各々の亜種、株、又はタイプの情報とを学習データとする機械学習によって判別モデルを生成するモデル生成部と、
    前記既知微生物と同一の種に属し、亜種、株、又はタイプが未知である未知微生物を質量分析して得られたマススペクトルを前記判別モデルに適用することによって、該未知微生物の亜種、株、又はタイプを判別する判別部と、
    を備える微生物判別システム。
  5. 前記既知微生物のマススペクトルに含まれるピークのm/zと、前記m/zリストに記載されたm/zとを照合して、両者の差異が小さくなるように該マススペクトルをキャリブレーションするキャリブレーション部、
    を更に備え、
    前記既知微生物のマススペクトルに対して前記キャリブレーション部によるキャリブレーションを施した上で、前記マスキング部によるマスキングを行う請求項4に記載の微生物判別システム。
  6. 前記既知微生物の各々がアクネ菌であり、
    前記マーカー候補タンパク質が、リボソームタンパク質L30、L29、S15、S19、L23、L21、L07/L12、S08、L15、L09、L13、及びL06、並びにAntitoxinであって、
    前記判別部において、アクネ菌である前記未知微生物のタイプを判別する請求項4又は請求項5に記載の微生物判別システム。
  7. コンピュータを、請求項4〜6のいずれかに記載の微生物判別システムの各部として機能させる微生物判別プログラム。
JP2019162711A 2019-09-06 2019-09-06 微生物判別方法、微生物判別システム、及び微生物判別プログラム Active JP7334549B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019162711A JP7334549B2 (ja) 2019-09-06 2019-09-06 微生物判別方法、微生物判別システム、及び微生物判別プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019162711A JP7334549B2 (ja) 2019-09-06 2019-09-06 微生物判別方法、微生物判別システム、及び微生物判別プログラム

Publications (2)

Publication Number Publication Date
JP2021042965A true JP2021042965A (ja) 2021-03-18
JP7334549B2 JP7334549B2 (ja) 2023-08-29

Family

ID=74863203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019162711A Active JP7334549B2 (ja) 2019-09-06 2019-09-06 微生物判別方法、微生物判別システム、及び微生物判別プログラム

Country Status (1)

Country Link
JP (1) JP7334549B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016537964A (ja) * 2013-10-09 2016-12-08 ユニバーシティ オブ メリーランド,ボルチモア 真菌を同定する方法
WO2017168743A1 (ja) * 2016-03-31 2017-10-05 株式会社島津製作所 微生物の識別方法
JP2019516084A (ja) * 2016-06-28 2019-06-13 株式会社島津製作所 飛行時間型質量分析に基づく信号処理方法およびシステム並びに電子機器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016537964A (ja) * 2013-10-09 2016-12-08 ユニバーシティ オブ メリーランド,ボルチモア 真菌を同定する方法
WO2017168743A1 (ja) * 2016-03-31 2017-10-05 株式会社島津製作所 微生物の識別方法
JP2019516084A (ja) * 2016-06-28 2019-06-13 株式会社島津製作所 飛行時間型質量分析に基づく信号処理方法およびシステム並びに電子機器

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"MALDI-MS Proteotyping of Cutibacterium Acnes", 2'ND_INTERNATIONAL BMS SYMPOSIUM 2018, JPN6022052388, 26 October 2018 (2018-10-26), ISSN: 0004942485 *
"MALDI-MSによるバクテリア分析", 島津評論, vol. Vol.74,No.1-2, JPN6022052383, 20 September 2017 (2017-09-20), pages 51 - 62, ISSN: 0004942484 *
"Rapid Screening of Epidemiologically Important Salmonella enterica subsp. enterica Serovars by Whole", APPLIED AND ENVIRONMENTAL MICROBIOLOGY, vol. 77, no. 12, JPN6022052384, 2011, pages 4136 - 4146, ISSN: 0004942482 *
"TOFwave: reproducibility in biomarker discovery from time-of-flight mass spectrometry data", MOLECULAR BIOSYSTEMS, vol. 8, JPN6022052381, 2012, pages 2845 - 2849, ISSN: 0004942483 *

Also Published As

Publication number Publication date
JP7334549B2 (ja) 2023-08-29

Similar Documents

Publication Publication Date Title
Girard et al. Identification and typing of the emerging pathogen Candida auris by matrix‐assisted laser desorption ionisation time of flight mass spectrometry
Feng et al. FTIR-assisted MALDI-TOF MS for the identification and typing of bacteria
Barberis et al. Comparison of the Bruker MALDI-TOF mass spectrometry system and conventional phenotypic methods for identification of Gram-positive rods
De Bruyne et al. Bacterial species identification from MALDI-TOF mass spectra through data analysis and machine learning
CN108931570B (zh) 质谱分析数据解析装置以及质谱分析数据解析用程序
JP5348029B2 (ja) 質量分析データ処理方法及び装置
Webb-Robertson et al. A support vector machine model for the prediction of proteotypic peptides for accurate mass and time proteomics
Wang et al. A large-scale investigation and identification of methicillin-resistant Staphylococcus aureus based on peaks binning of matrix-assisted laser desorption ionization-time of flight MS spectra
US10957523B2 (en) 3D mass spectrometry predictive classification
Webb-Robertson et al. A support vector machine model for the prediction of proteotypic peptides for accurate mass and time proteomics
Xu et al. Comparison of human axillary odour profiles obtained by gas chromatography/mass spectrometry and skin microbial profiles obtained by denaturing gradient gel electrophoresis using multivariate pattern recognition
US8831316B2 (en) Point source detection
CN102906851B (zh) 分析质谱的方法及系统
Hansen et al. X-Hitting: an algorithm for novelty detection and dereplication by UV spectra of complex mixtures of natural products
JP7334549B2 (ja) 微生物判別方法、微生物判別システム、及び微生物判別プログラム
CN106650779B (zh) 谱图相似度的计算方法
US20200118650A1 (en) Mass spectrometer, mass spectrometry method, and non-transitory computer readable medium
US20230282310A1 (en) Microorganism Discrimination Method and System
JP2018044810A (ja) 病原菌の検出法および検出装置
JP2020060444A5 (ja)
JP2021025953A (ja) 質量分析データ処理方法、質量分析データ処理システム、及び質量分析データ処理プログラム
JP2016133339A (ja) 質量分析データ処理装置および質量分析データ処理方法
Plantinga et al. Beta Diversity and Distance-Based Analysis of Microbiome Data
Ovchinnikova et al. Recognizing off-sample mass spectrometry images with machine and deep learning
Jarman et al. The statistical defensibility of forensic proteomics

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211223

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211223

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221213

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230718

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230731

R151 Written notification of patent or utility model registration

Ref document number: 7334549

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151