JP2020144491A - 微生物同定システム及び微生物同定用プログラム - Google Patents
微生物同定システム及び微生物同定用プログラム Download PDFInfo
- Publication number
- JP2020144491A JP2020144491A JP2019039113A JP2019039113A JP2020144491A JP 2020144491 A JP2020144491 A JP 2020144491A JP 2019039113 A JP2019039113 A JP 2019039113A JP 2019039113 A JP2019039113 A JP 2019039113A JP 2020144491 A JP2020144491 A JP 2020144491A
- Authority
- JP
- Japan
- Prior art keywords
- protein
- information
- proteins
- identification
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
【課題】微生物同定のためのバイオマーカーの数の増加、及び質の向上を図る。【解決手段】一実施形態の微生物同定システムは、同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集部201と、収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定部202と、類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正するアノテーション修正部203と、を含むバイオマーカー選定支援部20を備える。【選択図】図1
Description
本発明は、質量分析を利用して微生物の識別や同定を行う微生物同定システム、及びコンピュータ上で微生物を同定する処理を行うための微生物同定用プログラムに関する。
マトリクス支援レーザ脱離イオン化飛行時間型質量分析装置を用いた微生物(細菌、真菌類)の同定法は、近年、その経済性や迅速性から急速に普及が進んでいる。特に、菌種以下のレベル(菌株、系統等)での同定を行うことで、病原性の有無の判定や感染源の特定など、医療分野での非常に有用な情報の取得が可能である。そうした解析のためには、それぞれ異なるグループに属する微生物の間で、発現が異なるマススペクトルピーク、つまりはバイオマーカーを見いだすことが必要になる。
細菌を始めとする微生物の同定では、バイオマーカーとしてタンパク質が利用されることが多い。特にごく近縁の細菌類の識別、例えば同じ菌種における菌株の識別には、リボゾームタンパク質がしばしば用いられる(非特許文献1、2など参照)。タンパク質を対象とするバイオマーカー探索の、従来の一般的な手順は次のとおりである。
よく知られているように、様々な微生物に由来するタンパク質に関する情報は、米国NCBI(国立生物工学情報センター)が提供しているGenBankやスイスバイオインフォマティクス研究所等が提供しているUniProtなどの公共データベース(DB)に収録されている。そこで、作業者はまず、識別対象である近縁の微生物についてのタンパク質情報を上述したような公共DBから入手し、そうしたタンパク質情報から各株に固有な理論質量値を持つタンパク質を探索することにより、バイオマーカーとなり得るタンパク質の候補を見つける。そのうえで、実際の微生物を質量分析装置で測定することで得られるタンパク質の質量情報を利用して、バイオマーカーとして適切なタンパク質を選択する。
例えば非特許文献2には、Acinetobacter属細菌の基準株のゲノム情報から求まるリボゾームタンパク質の理論分子量と質量分析装置を用いて測定された実測値とを比較し、複数の装置メーカーによる質量分析装置で検出可能であるタンパク質の中からバイオマーカーを選択することが記載されている。
田村廣人、ほか3名、「リボゾームタンパク質をバイオマーカーとしたMALDI-TOF MSによる細菌識別−S10-GERMS法による細菌の迅速識別−」、島津評論 Vol.70、No.3・4、2014年3月31日発行
下平潤、ほか4名、「MALDI-TOF MSを用いたバイオマーカーによる Acinetobacter属細菌の高精度識別」、第68回日本生物工学会大会要旨集、2016年9月30日
「CD-HIT」、[online]、[平成31年1月31日検索]、インターネット<URL: http://weizhongli-lab.org/cd-hit/>
上記のような公共DBにおいて提供されるタンパク質情報にはアノテーション情報の一つとしてタンパク質名が含まれる。但し、こうしたDBに収録されている全てのタンパク質について機能が特定されタンパク質名が付与されているというわけではなく、実際には、機能が特定されておらず名称が「Uncharacterized protein」等となっているタンパク質も少なくない。これは、主として、公共DBで提供されるタンパク質情報には、微生物に対する遺伝子解析により判明した遺伝子の塩基配列情報を翻訳することで得られた、理論的なアミノ酸配列情報が含まれているためである。従来、タンパク質を対象としてバイオマーカーを探索する際には、こうした、名称が付与されておらず機能が確定しないタンパク質はバイオマーカーの候補から除外されるのが一般的である。
微生物の同定性能を高めるには、適切なバイオマーカーを数多く選定することが重要である。非常に似通っている近縁種の微生物の識別や株レベルでの同定の際には、同種のタンパク質でありながら菌株間や系統間で相違するアミノ酸配列の僅かな部分構造を探索することでバイオマーカーとして利用可能なタンパク質を見つける。そのため、バイオマーカーの数を増やすには、バイオマーカーの候補となり得るタンパク質の情報をできるだけ多く集めることが重要である。しかしながら、上述したように従来は、機能が特定されていないタンパク質の情報は活用されておらず、これがバイオマーカーの数を増やすことの大きな制約の一つとなっていた。
本発明はこうした課題を解決するために成されたものであり、その目的とするところは、微生物を同定するためのバイオマーカーをより多くまたより適切に選定できるようにすることで、微生物同定の正確性を向上させることができる微生物同定システム及びそのためのコンピュータプログラムを提供することである。
上記課題を解決するために成された本発明の一つの態様の微生物同定システムは、試料に対する質量分析を行い、その分析により得られたデータに基づいて該試料に含まれる微生物を同定するシステムであって、微生物の同定に利用されるバイオマーカーを探索するバイオマーカー選定支援部を有し、該バイオマーカー選定支援部は、
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集部と、
前記タンパク質情報収集部により収集されたタンパク質情報中のアミノ酸配列情報を利用してタンパク質同士の類似性を判定する類似性判定部と、
前記類似性判定部により類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加部と、
を備えるものである。
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集部と、
前記タンパク質情報収集部により収集されたタンパク質情報中のアミノ酸配列情報を利用してタンパク質同士の類似性を判定する類似性判定部と、
前記類似性判定部により類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加部と、
を備えるものである。
また上記課題を解決するために成された本発明の一つの態様の微生物同定用プログラムは、上記態様の微生物同定システムにおける少なくとも一部の機能を実現するためのコンピュータプログラムであり、試料に対する質量分析を行い、その分析により得られたデータに基づいて該試料に含まれる微生物を同定するシステムにおいて、微生物の同定に利用されるバイオマーカーを探索するものであって、コンピュータに、
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集ステップと、
前記タンパク質情報収集ステップにおいて収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定ステップと、
前記類似性判定ステップにおいて類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報がされていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加ステップと、
を実行させるものである。
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集ステップと、
前記タンパク質情報収集ステップにおいて収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定ステップと、
前記類似性判定ステップにおいて類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報がされていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加ステップと、
を実行させるものである。
本発明の一態様である微生物同定システム及び微生物同定用プログラムによれば、タンパク質名又はその機能を特定する識別情報が付与されていない不確定のタンパク質であっても、それとアミノ酸配列が類似し且つタンパク質名又はその機能を特定する識別情報が付与されているタンパク質がほかに存在すれば、上記不確定のタンパク質もバイオマーカー探索の際の対象のタンパク質とすることができる。それにより、バイオマーカーの候補となり得るタンパク質の種類を増やすことができ、結果的に、微生物の同定に利用可能なバイオマーカーの数を増やして同定の精度を向上させることができる。
本発明の一実施形態である微生物同定システムについて、添付図面を参照して説明する。
図1は、本実施形態の微生物同定システムの概略ブロック構成図である。
図1は、本実施形態の微生物同定システムの概略ブロック構成図である。
図1に示すように、本システムは、試料に対して測定を実行する質量分析部1と、質量分析部1で得られたマススペクトルデータを解析することで微生物の同定や識別等の処理を行う微生物解析処理部2と、ユーザインターフェイスである入力部3及び表示部4と、を備える。微生物解析処理部2は機能ブロックとして、バイオマーカー選定支援部20、バイオマーカー選定部21、分析データ格納部22、及び微生物同定処理部23、を含む。バイオマーカー選定支援部20は下位の機能ブロックとして、タンパク質情報収集部201、タンパク質類似性判定部202、及びタンパク質アノテーション修正部203、を含む。
タンパク質情報収集部201はインターネット等の通信ネットワーク5を介して、本システムに含まれない外部の微生物データベース6に接続されている。微生物データベース6としては例えば、米国NCBIが提供しているGenBankやスイスバイオインフォマティクス研究所等が提供しているUniProtなどの公共のデータベースを用いることができる。また、単一のデータベースでなく、複数のデータベースを利用してもよい。もちろん、こうした公共のデータベースではなく、ユーザが独自に構築したプライベートなデータベースであってもよい。また、そうしたプライベートなデータベースを使用する場合に、本システムはデータベースを含む構成としてもよい。
いずれにしても、この微生物データベース6には、多数の微生物それぞれについて、その微生物に由来する(つまりは微生物の細胞を構成する)多数のタンパク質の情報が収録されている。タンパク質情報は、タンパク質名、分子量(質量)、アミノ酸配列を含むが、タンパク質の機能が特定されていない場合にはタンパク質名は「Uncharacterized protein」となっている。このような機能が特定されていないタンパク質は、微生物の遺伝子情報から転写、理論的な変換等によって導かれたアミノ酸配列を有するものを含む。そのため、そうしたアミノ酸配列を持つタンパク質はあくまでも理論的に推定され得るものあって実在しないものである場合もある。
質量分析部1は特にその方式を問わないが、一般に質量精度や質量分解能が高いことが望ましいことから、飛行時間型質量分析装置(TOFMS)、或いはフーリエ変換イオンサイクロトロン共鳴質量分析装置(FT−ICRMS)などが有用である。
微生物解析処理部2の実体は、例えば汎用のパーソナルコンピュータ又はより性能の高いワークステーションであり、そうしたコンピュータにインストールされた専用のデータ処理用プログラムを該コンピュータにおいて動作させることで図1に示したような各機能ブロックの機能が実現される。もちろん、そうしたコンピュータは単体であるとは限らず、複数のコンピュータからなるコンピュータシステムであってもよい。いずれにしても、上記データ処理用プログラムの一部が、本発明の一実施形態である微生物同定用プログラムに相当する。また、通常、入力部3はコンピュータに付設されたキーボードやポインティングデバイス(マウスなど)であり、表示部4は同じくコンピュータに付設されたモニタである。
本微生物同定システムでは、試料に対し質量分析部1で質量分析を実行することで得られたマススペクトルデータに基づいて微生物同定が実行されるが、その際に、菌株(又は系統)に特異的なアミノ酸配列を有するタンパク質、具体的には、同種のタンパク質でありながら菌株や系統に特異的な部分構造を有するタンパク質がバイオマーカーとして利用される。バイオマーカーは基本的に分析担当者の判断により決定されるが、バイオマーカー選定支援部20はそのバイオマーカーの探索作業を支援するものである。
次に、バイオマーカー選定支援部20の処理動作について、図1に加え図2を用いて詳しく説明する。図2は、バイオマーカー選定支援部20により行われるタンパク質情報集積処理の概念図である。
分析担当者は入力部3から、識別したい複数種類の近縁微生物を指定する。タンパク質情報収集部201は微生物データベース6にアクセスし、指定された複数種の微生物についてのタンパク質情報を全て収集する。図2は、細菌αと細菌βとを識別する場合のごく簡単な例を示したものであり、この場合には、タンパク質情報収集部201は、細菌αに関連付けられている全てのタンパク質情報と細菌βに関連付けられている全てのタンパク質情報とを微生物データベース6から読み込む。細菌αと細菌βとが同種で菌株が相違するものであるような場合、それら細菌に含まれるタンパク質は殆ど共通である。但し、上述したように微生物データベース6に収録されているタンパク質のアミノ酸配列は遺伝子情報から理論的に導き出されたものであるため、機能が特定されておらずタンパク質名が「Uncharacterized protein」であるタンパク質も多く含まれる。図2中の「タンパク質名?」とはタンパク質名が「Uncharacterized protein」であることを意味する。
次に、タンパク質類似性判定部202は、収集されたタンパク質情報中の各タンパク質についてアミノ酸配列の類似性を判定し、アミノ酸配列の類似性が高い複数のタンパク質をグループ化する。こうしたアミノ酸配列の類似性(又は相同性)に基づくグループ化のための手法の一例としては、非特許文献3に記載のCD-HIT (Cluster Database at High Identity with Tolerance)などを用いることができる。
CD-HITは、アミノ酸配列や塩基配列などの配列をその類似性に基づいてクラスタリングするプログラムであり、例えばUniProtにおけるアミノ酸配列の比較などに広く利用されている。CD-HITでは、アミノ酸配列の類似性を示す指標値として、クラスタリングを行う際のidentityの閾値が計算される。この指標は簡単にいえば配列一致度であり、例えばこれを90%とすれば、配列一致度が90%以上であるアミノ酸配列が同じクラスタに分類されるようにクラスタリングが行われる。そこで、ここでは、CD-HITのプログラムを用い配列一致度を適宜に(例えば90%、85%など)設定することで、アミノ酸配列の類似性が高いタンパク質をグループ化することができる。もちろん、アミノ酸配列の類似性判定の手法はこれに限るものではなく、既存の様々な手法を用いることができる。
図2の例では、アミノ酸配列の類似性判定の結果として、細菌α由来のタンパク質D、細菌α由来のタンパク質?(1)、及び細菌β由来のタンパク質?(4)の三つが同じグループに分類されたものとしている。
タンパク質アノテーション修正部203は同一グループに分類された複数のタンパク質の名称を確認し、一つのグループ中の複数のタンパク質のうちの一つが、機能が確定したタンパク質であって(つまりは有意なタンパク質名を有していて)、それ以外のタンパク質が有意なタンパク質名を有さない(つまりはタンパク質名が「Uncharacterized protein」である)場合に、その「Uncharacterized protein」というタンパク質名を上記一つの有意なタンパク質名を有するタンパク質と同じ名称に修正する。即ち、図2の例の場合に、細菌α由来のタンパク質?(1)、及び細菌β由来のタンパク質?(4)の名称をいずれもタンパク質Dに修正する。つまりは、タンパク質のアノテーション情報の一部を書き換える。
また、タンパク質アノテーション修正部203は、同一グループに分類された複数のタンパク質の名称を確認し、その全てが有意なタンパク質名を有さないものである(つまりはタンパク質名が「Uncharacterized protein」である)場合には、その「Uncharacterized protein」というタンパク質名を、例えば同じグループに属しており且つ他のタンパク質とは区別可能であることを示す仮のタンパク質名(例えば「Uncharacterized protein - GroupAA」)に修正する。
バイオマーカー選定部21は、こうしてアノテーション情報が修正されたあとのタンパク質情報に基づいてバイオマーカーの選定を実施する。具体的には例えば、細菌α由来と細菌β由来とでタンパク質名が同じであるタンパク質のアミノ酸配列を取得し、細菌αと細菌βとの間での部分配列の相違を探索する。そして、部分配列の相違に菌株間の特異性があるか否かを判定し、特異性が見いだせる場合にはそのタンパク質をバイオマーカーの候補に選定する。一方、例えば菌株間での特異性がない場合、つまりは細菌αと細菌βとでアミノ酸配列が同一であるものが存在する場合などには、そのタンパク質をバイオマーカーの候補に選定しない。
上述したようなアノテーション情報の修正を行うと、通常、タンパク質名が「Uncharacterized protein」となっているタンパク質の一部は、機能が特定されたタンパク質として扱われるようになる。例えば図2の例では、微生物データベース6から読み込まれたときのタンパク質情報では細菌β由来のタンパク質Dは存在しなかったのに対し、アノテーション情報修正後のタンパク質情報では細菌β由来のタンパク質Dが存在する。したがって、従来であれば、バイオマーカーの候補として検討対象から外されていたタンパク質名がDであるタンパク質が、本実施態様のシステムでは、バイオマーカーの候補として検討対象となる。また、バイオマーカー選定部21は、「Uncharacterized protein」というタンパク質名を持つタンパク質はバイオマーカー候補の検討対象から外すものの、一つのグループであることが確認された「Uncharacterized protein - GroupAA」という仮のタンパク質名を持つタンパク質はバイオマーカー候補の検討対象に加える。それにより、バイオマーカーの候補を増やすことが可能となり、最終的にバイオマーカーの数を増やすことができる。
実際の微生物同定の際には、試料に対して質量分析部1で質量分析を実行することで得られたマススペクトルデータが分析データ格納部22に格納される。微生物同定処理部23は、バイオマーカー選定部21で選定された複数のバイオマーカーに着目し、マススペクトルデータにおいてバイオマーカーに対応するマススペクトルピークが検出されるか否かを調べ、その結果に基づいて試料中の微生物を同定する。バイオマーカーの数が増えるとともに、近縁の微生物同士を的確に識別するのに有用なバイオマーカーが選定されることにより、バイオマーカーを用いた微生物の同定精度を上げることができる。
上記実施形態のシステムでは、アミノ酸配列の類似性のみを利用してタンパク質をグループ化していたが、タンパク質情報として与えられる別のアノテーション情報もタンパク質をグループ化する際に利用するようにしてもよい。具体的には、アミノ酸配列から計算される理論質量(分子量)の情報も利用し、例えば理論質量の差が所定の値以下である場合に同じグループに分類する等の制約を付けてもよい。
或いは、アミノ酸配列の類似性を判定する際に、単に相違するアミノ酸残基の数ではなく、その相違の内容、例えば部分配列の欠損数、部分配列の置換数などを用いた所定のアルゴリズムで類似性を判定するようにしてもよい。
また、上記実施形態や変形例はあくまでも本発明の一例にすぎず、本発明の趣旨の範囲で適宜変形、修正、追加等を行っても本願特許請求の範囲に包含されることは当然である。
[種々の態様]
上述した例示的な実施形態は、以下の態様の具体例であることが当業者により理解される。
上述した例示的な実施形態は、以下の態様の具体例であることが当業者により理解される。
第1の態様による微生物同定システムは、試料に対する質量分析を行い、その分析により得られたデータに基づいて該試料に含まれる微生物を同定するシステムであって、微生物の同定に利用されるバイオマーカーを探索するバイオマーカー選定支援部を有し、該バイオマーカー選定支援部は、
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集部と、
前記タンパク質情報収集部により収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定部と、
前記類似性判定部により類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加部と、
を備えるものである。
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集部と、
前記タンパク質情報収集部により収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定部と、
前記類似性判定部により類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加部と、
を備えるものである。
また第1の態様による微生物同定用プログラムは、試料に対する質量分析を行い、その分析により得られたデータに基づいて該試料に含まれる微生物を同定するシステムにおいて、微生物の同定に利用されるバイオマーカーを探索するものであって、コンピュータに、
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集ステップと、
前記タンパク質情報収集ステップにおいて収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定ステップと、
前記類似性判定ステップにおいて類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加ステップと、
を実行させるものである。
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集ステップと、
前記タンパク質情報収集ステップにおいて収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定ステップと、
前記類似性判定ステップにおいて類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加ステップと、
を実行させるものである。
上記第1の態様による微生物同定システム又は微生物同定用プログラムによれば、従来はバイオマーカーの候補の検討対象から外されていた機能が特定されていないタンパク質を、バイオマーカーの候補の検討対象に加えることが可能となる。それにより、微生物同定に有用なバイオマーカーの数を増やすとともに、ごく近縁である微生物同士の識別に有用なバイオマーカーを選定することができるようになり、微生物同定の精度の向上を図ることができる。或いは、従来は十分に識別できなかったような微生物の識別が可能となる。
第2の態様による微生物同定システム又は微生物同定用プログラムは、第1の態様による微生物同定システム又は微生物同定用プログラムにおいて、
前記情報付加部はさらに、前記複数のタンパク質の全てがタンパク質名又はその機能を特定する識別情報が付与されていない場合に、該複数のタンパク質が同じタンパク質であるとしてタンパク質情報を追加する又は修正するものである。
前記情報付加部はさらに、前記複数のタンパク質の全てがタンパク質名又はその機能を特定する識別情報が付与されていない場合に、該複数のタンパク質が同じタンパク質であるとしてタンパク質情報を追加する又は修正するものである。
タンパク質名やその機能を特定する識別情報が付与されていない場合であっても、複数種の微生物に由来するタンパク質においてアミノ酸配列が類似していて同一であるとみなし得るタンパク質が複数存在している場合には、これをバイオマーカーとして利用できる可能性がある。そこで、第2の態様では、こうしたタンパク質について例えば仮のタンパク質名を与えてバイオマーカーの選定対象に加える。
この第2の態様による微生物同定システム又は微生物同定用プログラムによれば、機能が特定されていないタンパク質であってもバイオマーカーの候補の検討対象となる可能性が高まるので、さらに一層、微生物同定に有用なバイオマーカーの数を増やすことができる。
この第2の態様による微生物同定システム又は微生物同定用プログラムによれば、機能が特定されていないタンパク質であってもバイオマーカーの候補の検討対象となる可能性が高まるので、さらに一層、微生物同定に有用なバイオマーカーの数を増やすことができる。
第3の態様による微生物同定システム又は微生物同定用プログラムは、第1又は第2の態様による微生物同定システム又は微生物同定用プログラムにおいて、
前記類似性判定部は、タンパク質情報中の理論質量の情報をさらに利用して、タンパク質同士の類似性を判定するものとすることができる。
前記類似性判定部は、タンパク質情報中の理論質量の情報をさらに利用して、タンパク質同士の類似性を判定するものとすることができる。
第3の態様による微生物同定システム又は微生物同定用プログラムによれば、アミノ酸配列に加えて理論質量を利用することで、タンパク質の類似性の判定精度を向上させることができる。それにより、バイオマーカーの候補をより精度良く選定することが可能となり、バイオマーカーの的確性を向上させることができる。
1…質量分析部
2…微生物解析処理部
20…バイオマーカー選定支援部
201…タンパク質情報収集部
202…タンパク質類似性判定部
203…タンパク質アノテーション修正部
21…バイオマーカー選定部
22…分析データ格納部
23…微生物同定処理部
3…入力部
4…表示部
5…通信ネットワーク
6…微生物データベース
2…微生物解析処理部
20…バイオマーカー選定支援部
201…タンパク質情報収集部
202…タンパク質類似性判定部
203…タンパク質アノテーション修正部
21…バイオマーカー選定部
22…分析データ格納部
23…微生物同定処理部
3…入力部
4…表示部
5…通信ネットワーク
6…微生物データベース
Claims (6)
- 試料に対する質量分析を行い、その分析により得られたデータに基づいて該試料に含まれる微生物を同定するシステムであって、微生物の同定に利用されるバイオマーカーを探索するバイオマーカー選定支援部を有し、該バイオマーカー選定支援部は、
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集部と、
前記タンパク質情報収集部により収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定部と、
前記類似性判定部により類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加部と、
を備える微生物同定システム。 - 前記情報付加部はさらに、前記類似性判定部により類似性が高いと判定された複数のタンパク質の全てがタンパク質名又はその機能を特定する識別情報が付与されていない場合に、該複数のタンパク質が同じタンパク質であるとしてタンパク質情報を追加する又は修正する、請求項1に記載の微生物同定システム。
- 前記類似性判定部は、タンパク質情報中の理論質量の情報をさらに利用して、タンパク質同士の類似性を判定する、請求項1又は2に記載の微生物同定システム。
- 試料に対する質量分析を行い、その分析により得られたデータに基づいて該試料に含まれる微生物を同定するシステムにおいて、微生物の同定に利用されるバイオマーカーを探索するものであって、コンピュータに、
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集ステップと、
前記タンパク質情報収集ステップにおいて収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定ステップと、
前記類似性判定ステップにおいて類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加ステップと、
を実行させる微生物同定用プログラム。 - 前記情報付加ステップではさらに、前記複数のタンパク質の全てがタンパク質名又はその機能を特定する識別情報が付与されていない場合に、該複数のタンパク質が同じタンパク質であるとしてタンパク質情報を追加する又は修正する、請求項4に記載の微生物同定用プログラム。
- 前記類似性判定ステップは、タンパク質情報中の理論質量の情報をさらに利用して、タンパク質同士の類似性を判定する、請求項4又は5に記載の微生物同定用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019039113A JP7151556B2 (ja) | 2019-03-05 | 2019-03-05 | 微生物同定システム及び微生物同定用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019039113A JP7151556B2 (ja) | 2019-03-05 | 2019-03-05 | 微生物同定システム及び微生物同定用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020144491A true JP2020144491A (ja) | 2020-09-10 |
JP7151556B2 JP7151556B2 (ja) | 2022-10-12 |
Family
ID=72353608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019039113A Active JP7151556B2 (ja) | 2019-03-05 | 2019-03-05 | 微生物同定システム及び微生物同定用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7151556B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7189720B2 (ja) | 2018-10-04 | 2022-12-14 | 株式会社クボタ | 作業車両 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003530858A (ja) * | 2000-04-12 | 2003-10-21 | ザ ジョンズ ホプキンズ ユニバーシティ | 質量分析法に基づくプロテオームデータベース調査による微生物同定のための方法およびシステム |
JP2007316063A (ja) * | 2006-04-28 | 2007-12-06 | National Institute Of Advanced Industrial & Technology | 細胞の迅速識別方法及び識別装置 |
US20120197535A1 (en) * | 2011-01-03 | 2012-08-02 | Goodlett David R | Methods for identifying bacteria |
JP2015184020A (ja) * | 2014-03-20 | 2015-10-22 | 株式会社島津製作所 | 微生物の識別方法 |
-
2019
- 2019-03-05 JP JP2019039113A patent/JP7151556B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003530858A (ja) * | 2000-04-12 | 2003-10-21 | ザ ジョンズ ホプキンズ ユニバーシティ | 質量分析法に基づくプロテオームデータベース調査による微生物同定のための方法およびシステム |
JP2007316063A (ja) * | 2006-04-28 | 2007-12-06 | National Institute Of Advanced Industrial & Technology | 細胞の迅速識別方法及び識別装置 |
US20120197535A1 (en) * | 2011-01-03 | 2012-08-02 | Goodlett David R | Methods for identifying bacteria |
JP2015184020A (ja) * | 2014-03-20 | 2015-10-22 | 株式会社島津製作所 | 微生物の識別方法 |
Also Published As
Publication number | Publication date |
---|---|
JP7151556B2 (ja) | 2022-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6238069B2 (ja) | 微生物の識別方法 | |
JP5750676B2 (ja) | 細胞識別装置及びプログラム | |
EP3438275B1 (en) | Microorganism identification method | |
US20150294065A1 (en) | Database-Driven Primary Analysis of Raw Sequencing Data | |
WO2017168743A1 (ja) | 微生物の識別方法 | |
Corvelo et al. | taxMaps: comprehensive and highly accurate taxonomic classification of short-read data in reasonable time | |
US11809498B2 (en) | Optimizing k-mer databases by k-mer subtraction | |
Shi et al. | Fast and accurate metagenotyping of the human gut microbiome with GT-Pro | |
Teng et al. | MALDI-TOF MS for identification of Tsukamurella species: Tsukamurella tyrosinosolvens as the predominant species associated with ocular infections | |
JP6934650B2 (ja) | 微生物の識別方法 | |
Wang et al. | A genoproteomic approach to detect peptide markers of bacterial respiratory pathogens | |
US20170108509A1 (en) | Method For Using Protein Databases To Identify Microorganisms | |
JP7151556B2 (ja) | 微生物同定システム及び微生物同定用プログラム | |
Saha et al. | MSC: a metagenomic sequence classification algorithm | |
US20180330053A1 (en) | Primer design using indexed genomic information | |
Shao et al. | Limitations of matrix-assisted laser desorption/ionization time-of-flight mass spectrometry for the identification of Aspergillus species | |
US11177017B2 (en) | Method of deconvolution of mixed molecular information in a complex sample to identify organism(s) | |
Popic et al. | GATTACA: lightweight metagenomic binning with compact indexing of kmer counts and minhash-based panel selection | |
Esmat et al. | A parallel hash‐based method for local sequence alignment | |
Liu et al. | CSMD: a computational subtraction-based microbiome discovery pipeline for species-level characterization of clinical metagenomic samples | |
CN114944197B (zh) | 基于测序数据的自动化血清型分析鉴定方法及系统 | |
WO2020230397A1 (ja) | 理論質量の外れ値検出方法 | |
Jenson et al. | MARLOWE: Taxonomic Characterization of Unknown Samples for Forensics Using De Novo Peptide Identification | |
Gollwitzer et al. | MetaFast: Enabling Fast Metagenomic Classification via Seed Counting and Edit Distance Approximation | |
Kuhring et al. | An iterative and automated computational pipeline for untargeted strain-level identification using MS/MS spectra from pathogenic samples |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210622 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220830 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220912 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7151556 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |