JP2020144491A

JP2020144491A - 微生物同定システム及び微生物同定用プログラム

Info

Publication number: JP2020144491A
Application number: JP2019039113A
Authority: JP
Inventors: 達樹大久保; Tatsuki Okubo; 児嶋　浩一; Koichi Kojima; 浩一児嶋
Original assignee: Shimadzu Corp
Current assignee: Shimadzu Corp
Priority date: 2019-03-05
Filing date: 2019-03-05
Publication date: 2020-09-10
Anticipated expiration: 2039-03-05
Also published as: JP7151556B2

Abstract

【課題】微生物同定のためのバイオマーカーの数の増加、及び質の向上を図る。【解決手段】一実施形態の微生物同定システムは、同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集部２０１と、収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定部２０２と、類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正するアノテーション修正部２０３と、を含むバイオマーカー選定支援部２０を備える。【選択図】図１

Description

本発明は、質量分析を利用して微生物の識別や同定を行う微生物同定システム、及びコンピュータ上で微生物を同定する処理を行うための微生物同定用プログラムに関する。

マトリクス支援レーザ脱離イオン化飛行時間型質量分析装置を用いた微生物（細菌、真菌類）の同定法は、近年、その経済性や迅速性から急速に普及が進んでいる。特に、菌種以下のレベル（菌株、系統等）での同定を行うことで、病原性の有無の判定や感染源の特定など、医療分野での非常に有用な情報の取得が可能である。そうした解析のためには、それぞれ異なるグループに属する微生物の間で、発現が異なるマススペクトルピーク、つまりはバイオマーカーを見いだすことが必要になる。

細菌を始めとする微生物の同定では、バイオマーカーとしてタンパク質が利用されることが多い。特にごく近縁の細菌類の識別、例えば同じ菌種における菌株の識別には、リボゾームタンパク質がしばしば用いられる（非特許文献１、２など参照）。タンパク質を対象とするバイオマーカー探索の、従来の一般的な手順は次のとおりである。

よく知られているように、様々な微生物に由来するタンパク質に関する情報は、米国NCBI（国立生物工学情報センター）が提供しているGenBankやスイスバイオインフォマティクス研究所等が提供しているUniProtなどの公共データベース（ＤＢ）に収録されている。そこで、作業者はまず、識別対象である近縁の微生物についてのタンパク質情報を上述したような公共ＤＢから入手し、そうしたタンパク質情報から各株に固有な理論質量値を持つタンパク質を探索することにより、バイオマーカーとなり得るタンパク質の候補を見つける。そのうえで、実際の微生物を質量分析装置で測定することで得られるタンパク質の質量情報を利用して、バイオマーカーとして適切なタンパク質を選択する。

例えば非特許文献２には、Acinetobacter属細菌の基準株のゲノム情報から求まるリボゾームタンパク質の理論分子量と質量分析装置を用いて測定された実測値とを比較し、複数の装置メーカーによる質量分析装置で検出可能であるタンパク質の中からバイオマーカーを選択することが記載されている。

田村廣人、ほか３名、「リボゾームタンパク質をバイオマーカーとしたMALDI-TOF MSによる細菌識別−S10-GERMS法による細菌の迅速識別−」、島津評論 Vol.70、No.3・4、2014年3月31日発行下平潤、ほか４名、「MALDI-TOF MSを用いたバイオマーカーによる Acinetobacter属細菌の高精度識別」、第68回日本生物工学会大会要旨集、2016年9月30日「CD-HIT」、［online］、［平成31年1月31日検索］、インターネット＜URL： http://weizhongli-lab.org/cd-hit/＞

上記のような公共ＤＢにおいて提供されるタンパク質情報にはアノテーション情報の一つとしてタンパク質名が含まれる。但し、こうしたＤＢに収録されている全てのタンパク質について機能が特定されタンパク質名が付与されているというわけではなく、実際には、機能が特定されておらず名称が「Uncharacterized protein」等となっているタンパク質も少なくない。これは、主として、公共ＤＢで提供されるタンパク質情報には、微生物に対する遺伝子解析により判明した遺伝子の塩基配列情報を翻訳することで得られた、理論的なアミノ酸配列情報が含まれているためである。従来、タンパク質を対象としてバイオマーカーを探索する際には、こうした、名称が付与されておらず機能が確定しないタンパク質はバイオマーカーの候補から除外されるのが一般的である。

微生物の同定性能を高めるには、適切なバイオマーカーを数多く選定することが重要である。非常に似通っている近縁種の微生物の識別や株レベルでの同定の際には、同種のタンパク質でありながら菌株間や系統間で相違するアミノ酸配列の僅かな部分構造を探索することでバイオマーカーとして利用可能なタンパク質を見つける。そのため、バイオマーカーの数を増やすには、バイオマーカーの候補となり得るタンパク質の情報をできるだけ多く集めることが重要である。しかしながら、上述したように従来は、機能が特定されていないタンパク質の情報は活用されておらず、これがバイオマーカーの数を増やすことの大きな制約の一つとなっていた。

本発明はこうした課題を解決するために成されたものであり、その目的とするところは、微生物を同定するためのバイオマーカーをより多くまたより適切に選定できるようにすることで、微生物同定の正確性を向上させることができる微生物同定システム及びそのためのコンピュータプログラムを提供することである。

上記課題を解決するために成された本発明の一つの態様の微生物同定システムは、試料に対する質量分析を行い、その分析により得られたデータに基づいて該試料に含まれる微生物を同定するシステムであって、微生物の同定に利用されるバイオマーカーを探索するバイオマーカー選定支援部を有し、該バイオマーカー選定支援部は、
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集部と、
前記タンパク質情報収集部により収集されたタンパク質情報中のアミノ酸配列情報を利用してタンパク質同士の類似性を判定する類似性判定部と、
前記類似性判定部により類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加部と、
を備えるものである。

また上記課題を解決するために成された本発明の一つの態様の微生物同定用プログラムは、上記態様の微生物同定システムにおける少なくとも一部の機能を実現するためのコンピュータプログラムであり、試料に対する質量分析を行い、その分析により得られたデータに基づいて該試料に含まれる微生物を同定するシステムにおいて、微生物の同定に利用されるバイオマーカーを探索するものであって、コンピュータに、
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集ステップと、
前記タンパク質情報収集ステップにおいて収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定ステップと、
前記類似性判定ステップにおいて類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報がされていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加ステップと、
を実行させるものである。

本発明の一態様である微生物同定システム及び微生物同定用プログラムによれば、タンパク質名又はその機能を特定する識別情報が付与されていない不確定のタンパク質であっても、それとアミノ酸配列が類似し且つタンパク質名又はその機能を特定する識別情報が付与されているタンパク質がほかに存在すれば、上記不確定のタンパク質もバイオマーカー探索の際の対象のタンパク質とすることができる。それにより、バイオマーカーの候補となり得るタンパク質の種類を増やすことができ、結果的に、微生物の同定に利用可能なバイオマーカーの数を増やして同定の精度を向上させることができる。

本発明の一実施形態である微生物同定システムの概略ブロック構成図。本実施形態の微生物同定システムにおける、バイオマーカー探索の際のタンパク質情報集積処理の概念図。

本発明の一実施形態である微生物同定システムについて、添付図面を参照して説明する。
図１は、本実施形態の微生物同定システムの概略ブロック構成図である。

図１に示すように、本システムは、試料に対して測定を実行する質量分析部１と、質量分析部１で得られたマススペクトルデータを解析することで微生物の同定や識別等の処理を行う微生物解析処理部２と、ユーザインターフェイスである入力部３及び表示部４と、を備える。微生物解析処理部２は機能ブロックとして、バイオマーカー選定支援部２０、バイオマーカー選定部２１、分析データ格納部２２、及び微生物同定処理部２３、を含む。バイオマーカー選定支援部２０は下位の機能ブロックとして、タンパク質情報収集部２０１、タンパク質類似性判定部２０２、及びタンパク質アノテーション修正部２０３、を含む。

タンパク質情報収集部２０１はインターネット等の通信ネットワーク５を介して、本システムに含まれない外部の微生物データベース６に接続されている。微生物データベース６としては例えば、米国NCBIが提供しているGenBankやスイスバイオインフォマティクス研究所等が提供しているUniProtなどの公共のデータベースを用いることができる。また、単一のデータベースでなく、複数のデータベースを利用してもよい。もちろん、こうした公共のデータベースではなく、ユーザが独自に構築したプライベートなデータベースであってもよい。また、そうしたプライベートなデータベースを使用する場合に、本システムはデータベースを含む構成としてもよい。

いずれにしても、この微生物データベース６には、多数の微生物それぞれについて、その微生物に由来する（つまりは微生物の細胞を構成する）多数のタンパク質の情報が収録されている。タンパク質情報は、タンパク質名、分子量（質量）、アミノ酸配列を含むが、タンパク質の機能が特定されていない場合にはタンパク質名は「Uncharacterized protein」となっている。このような機能が特定されていないタンパク質は、微生物の遺伝子情報から転写、理論的な変換等によって導かれたアミノ酸配列を有するものを含む。そのため、そうしたアミノ酸配列を持つタンパク質はあくまでも理論的に推定され得るものあって実在しないものである場合もある。

質量分析部１は特にその方式を問わないが、一般に質量精度や質量分解能が高いことが望ましいことから、飛行時間型質量分析装置（ＴＯＦＭＳ）、或いはフーリエ変換イオンサイクロトロン共鳴質量分析装置（ＦＴ−ＩＣＲＭＳ）などが有用である。

微生物解析処理部２の実体は、例えば汎用のパーソナルコンピュータ又はより性能の高いワークステーションであり、そうしたコンピュータにインストールされた専用のデータ処理用プログラムを該コンピュータにおいて動作させることで図１に示したような各機能ブロックの機能が実現される。もちろん、そうしたコンピュータは単体であるとは限らず、複数のコンピュータからなるコンピュータシステムであってもよい。いずれにしても、上記データ処理用プログラムの一部が、本発明の一実施形態である微生物同定用プログラムに相当する。また、通常、入力部３はコンピュータに付設されたキーボードやポインティングデバイス（マウスなど）であり、表示部４は同じくコンピュータに付設されたモニタである。

本微生物同定システムでは、試料に対し質量分析部１で質量分析を実行することで得られたマススペクトルデータに基づいて微生物同定が実行されるが、その際に、菌株（又は系統）に特異的なアミノ酸配列を有するタンパク質、具体的には、同種のタンパク質でありながら菌株や系統に特異的な部分構造を有するタンパク質がバイオマーカーとして利用される。バイオマーカーは基本的に分析担当者の判断により決定されるが、バイオマーカー選定支援部２０はそのバイオマーカーの探索作業を支援するものである。

次に、バイオマーカー選定支援部２０の処理動作について、図１に加え図２を用いて詳しく説明する。図２は、バイオマーカー選定支援部２０により行われるタンパク質情報集積処理の概念図である。

分析担当者は入力部３から、識別したい複数種類の近縁微生物を指定する。タンパク質情報収集部２０１は微生物データベース６にアクセスし、指定された複数種の微生物についてのタンパク質情報を全て収集する。図２は、細菌αと細菌βとを識別する場合のごく簡単な例を示したものであり、この場合には、タンパク質情報収集部２０１は、細菌αに関連付けられている全てのタンパク質情報と細菌βに関連付けられている全てのタンパク質情報とを微生物データベース６から読み込む。細菌αと細菌βとが同種で菌株が相違するものであるような場合、それら細菌に含まれるタンパク質は殆ど共通である。但し、上述したように微生物データベース６に収録されているタンパク質のアミノ酸配列は遺伝子情報から理論的に導き出されたものであるため、機能が特定されておらずタンパク質名が「Uncharacterized protein」であるタンパク質も多く含まれる。図２中の「タンパク質名？」とはタンパク質名が「Uncharacterized protein」であることを意味する。

次に、タンパク質類似性判定部２０２は、収集されたタンパク質情報中の各タンパク質についてアミノ酸配列の類似性を判定し、アミノ酸配列の類似性が高い複数のタンパク質をグループ化する。こうしたアミノ酸配列の類似性（又は相同性）に基づくグループ化のための手法の一例としては、非特許文献３に記載のCD-HIT (Cluster Database at High Identity with Tolerance）などを用いることができる。

CD-HITは、アミノ酸配列や塩基配列などの配列をその類似性に基づいてクラスタリングするプログラムであり、例えばUniProtにおけるアミノ酸配列の比較などに広く利用されている。CD-HITでは、アミノ酸配列の類似性を示す指標値として、クラスタリングを行う際のidentityの閾値が計算される。この指標は簡単にいえば配列一致度であり、例えばこれを９０％とすれば、配列一致度が９０％以上であるアミノ酸配列が同じクラスタに分類されるようにクラスタリングが行われる。そこで、ここでは、CD-HITのプログラムを用い配列一致度を適宜に（例えば９０％、８５％など）設定することで、アミノ酸配列の類似性が高いタンパク質をグループ化することができる。もちろん、アミノ酸配列の類似性判定の手法はこれに限るものではなく、既存の様々な手法を用いることができる。

図２の例では、アミノ酸配列の類似性判定の結果として、細菌α由来のタンパク質Ｄ、細菌α由来のタンパク質？(1)、及び細菌β由来のタンパク質？(4)の三つが同じグループに分類されたものとしている。

タンパク質アノテーション修正部２０３は同一グループに分類された複数のタンパク質の名称を確認し、一つのグループ中の複数のタンパク質のうちの一つが、機能が確定したタンパク質であって（つまりは有意なタンパク質名を有していて）、それ以外のタンパク質が有意なタンパク質名を有さない（つまりはタンパク質名が「Uncharacterized protein」である）場合に、その「Uncharacterized protein」というタンパク質名を上記一つの有意なタンパク質名を有するタンパク質と同じ名称に修正する。即ち、図２の例の場合に、細菌α由来のタンパク質？(1)、及び細菌β由来のタンパク質？(4)の名称をいずれもタンパク質Ｄに修正する。つまりは、タンパク質のアノテーション情報の一部を書き換える。

また、タンパク質アノテーション修正部２０３は、同一グループに分類された複数のタンパク質の名称を確認し、その全てが有意なタンパク質名を有さないものである（つまりはタンパク質名が「Uncharacterized protein」である）場合には、その「Uncharacterized protein」というタンパク質名を、例えば同じグループに属しており且つ他のタンパク質とは区別可能であることを示す仮のタンパク質名（例えば「Uncharacterized protein - GroupAA」）に修正する。

バイオマーカー選定部２１は、こうしてアノテーション情報が修正されたあとのタンパク質情報に基づいてバイオマーカーの選定を実施する。具体的には例えば、細菌α由来と細菌β由来とでタンパク質名が同じであるタンパク質のアミノ酸配列を取得し、細菌αと細菌βとの間での部分配列の相違を探索する。そして、部分配列の相違に菌株間の特異性があるか否かを判定し、特異性が見いだせる場合にはそのタンパク質をバイオマーカーの候補に選定する。一方、例えば菌株間での特異性がない場合、つまりは細菌αと細菌βとでアミノ酸配列が同一であるものが存在する場合などには、そのタンパク質をバイオマーカーの候補に選定しない。

上述したようなアノテーション情報の修正を行うと、通常、タンパク質名が「Uncharacterized protein」となっているタンパク質の一部は、機能が特定されたタンパク質として扱われるようになる。例えば図２の例では、微生物データベース６から読み込まれたときのタンパク質情報では細菌β由来のタンパク質Ｄは存在しなかったのに対し、アノテーション情報修正後のタンパク質情報では細菌β由来のタンパク質Ｄが存在する。したがって、従来であれば、バイオマーカーの候補として検討対象から外されていたタンパク質名がＤであるタンパク質が、本実施態様のシステムでは、バイオマーカーの候補として検討対象となる。また、バイオマーカー選定部２１は、「Uncharacterized protein」というタンパク質名を持つタンパク質はバイオマーカー候補の検討対象から外すものの、一つのグループであることが確認された「Uncharacterized protein - GroupAA」という仮のタンパク質名を持つタンパク質はバイオマーカー候補の検討対象に加える。それにより、バイオマーカーの候補を増やすことが可能となり、最終的にバイオマーカーの数を増やすことができる。

実際の微生物同定の際には、試料に対して質量分析部１で質量分析を実行することで得られたマススペクトルデータが分析データ格納部２２に格納される。微生物同定処理部２３は、バイオマーカー選定部２１で選定された複数のバイオマーカーに着目し、マススペクトルデータにおいてバイオマーカーに対応するマススペクトルピークが検出されるか否かを調べ、その結果に基づいて試料中の微生物を同定する。バイオマーカーの数が増えるとともに、近縁の微生物同士を的確に識別するのに有用なバイオマーカーが選定されることにより、バイオマーカーを用いた微生物の同定精度を上げることができる。

上記実施形態のシステムでは、アミノ酸配列の類似性のみを利用してタンパク質をグループ化していたが、タンパク質情報として与えられる別のアノテーション情報もタンパク質をグループ化する際に利用するようにしてもよい。具体的には、アミノ酸配列から計算される理論質量（分子量）の情報も利用し、例えば理論質量の差が所定の値以下である場合に同じグループに分類する等の制約を付けてもよい。

或いは、アミノ酸配列の類似性を判定する際に、単に相違するアミノ酸残基の数ではなく、その相違の内容、例えば部分配列の欠損数、部分配列の置換数などを用いた所定のアルゴリズムで類似性を判定するようにしてもよい。

また、上記実施形態や変形例はあくまでも本発明の一例にすぎず、本発明の趣旨の範囲で適宜変形、修正、追加等を行っても本願特許請求の範囲に包含されることは当然である。

［種々の態様］
上述した例示的な実施形態は、以下の態様の具体例であることが当業者により理解される。

第１の態様による微生物同定システムは、試料に対する質量分析を行い、その分析により得られたデータに基づいて該試料に含まれる微生物を同定するシステムであって、微生物の同定に利用されるバイオマーカーを探索するバイオマーカー選定支援部を有し、該バイオマーカー選定支援部は、
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集部と、
前記タンパク質情報収集部により収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定部と、
前記類似性判定部により類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加部と、
を備えるものである。

また第１の態様による微生物同定用プログラムは、試料に対する質量分析を行い、その分析により得られたデータに基づいて該試料に含まれる微生物を同定するシステムにおいて、微生物の同定に利用されるバイオマーカーを探索するものであって、コンピュータに、
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集ステップと、
前記タンパク質情報収集ステップにおいて収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定ステップと、
前記類似性判定ステップにおいて類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加ステップと、
を実行させるものである。

上記第１の態様による微生物同定システム又は微生物同定用プログラムによれば、従来はバイオマーカーの候補の検討対象から外されていた機能が特定されていないタンパク質を、バイオマーカーの候補の検討対象に加えることが可能となる。それにより、微生物同定に有用なバイオマーカーの数を増やすとともに、ごく近縁である微生物同士の識別に有用なバイオマーカーを選定することができるようになり、微生物同定の精度の向上を図ることができる。或いは、従来は十分に識別できなかったような微生物の識別が可能となる。

第２の態様による微生物同定システム又は微生物同定用プログラムは、第１の態様による微生物同定システム又は微生物同定用プログラムにおいて、
前記情報付加部はさらに、前記複数のタンパク質の全てがタンパク質名又はその機能を特定する識別情報が付与されていない場合に、該複数のタンパク質が同じタンパク質であるとしてタンパク質情報を追加する又は修正するものである。

タンパク質名やその機能を特定する識別情報が付与されていない場合であっても、複数種の微生物に由来するタンパク質においてアミノ酸配列が類似していて同一であるとみなし得るタンパク質が複数存在している場合には、これをバイオマーカーとして利用できる可能性がある。そこで、第２の態様では、こうしたタンパク質について例えば仮のタンパク質名を与えてバイオマーカーの選定対象に加える。
この第２の態様による微生物同定システム又は微生物同定用プログラムによれば、機能が特定されていないタンパク質であってもバイオマーカーの候補の検討対象となる可能性が高まるので、さらに一層、微生物同定に有用なバイオマーカーの数を増やすことができる。

第３の態様による微生物同定システム又は微生物同定用プログラムは、第１又は第２の態様による微生物同定システム又は微生物同定用プログラムにおいて、
前記類似性判定部は、タンパク質情報中の理論質量の情報をさらに利用して、タンパク質同士の類似性を判定するものとすることができる。

第３の態様による微生物同定システム又は微生物同定用プログラムによれば、アミノ酸配列に加えて理論質量を利用することで、タンパク質の類似性の判定精度を向上させることができる。それにより、バイオマーカーの候補をより精度良く選定することが可能となり、バイオマーカーの的確性を向上させることができる。

１…質量分析部
２…微生物解析処理部
２０…バイオマーカー選定支援部
２０１…タンパク質情報収集部
２０２…タンパク質類似性判定部
２０３…タンパク質アノテーション修正部
２１…バイオマーカー選定部
２２…分析データ格納部
２３…微生物同定処理部
３…入力部
４…表示部
５…通信ネットワーク
６…微生物データベース

Claims

試料に対する質量分析を行い、その分析により得られたデータに基づいて該試料に含まれる微生物を同定するシステムであって、微生物の同定に利用されるバイオマーカーを探索するバイオマーカー選定支援部を有し、該バイオマーカー選定支援部は、
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集部と、
前記タンパク質情報収集部により収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定部と、
前記類似性判定部により類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加部と、
を備える微生物同定システム。
前記情報付加部はさらに、前記類似性判定部により類似性が高いと判定された複数のタンパク質の全てがタンパク質名又はその機能を特定する識別情報が付与されていない場合に、該複数のタンパク質が同じタンパク質であるとしてタンパク質情報を追加する又は修正する、請求項１に記載の微生物同定システム。
前記類似性判定部は、タンパク質情報中の理論質量の情報をさらに利用して、タンパク質同士の類似性を判定する、請求項１又は２に記載の微生物同定システム。
試料に対する質量分析を行い、その分析により得られたデータに基づいて該試料に含まれる微生物を同定するシステムにおいて、微生物の同定に利用されるバイオマーカーを探索するものであって、コンピュータに、
同定対象である複数種の微生物に由来するタンパク質に関する情報として、少なくともタンパク質名又はその機能を特定する識別情報とアミノ酸配列情報とを含むタンパク質情報を収集するタンパク質情報収集ステップと、
前記タンパク質情報収集ステップにおいて収集されたタンパク質情報中のアミノ酸配列情報を利用して、タンパク質同士の類似性を判定する類似性判定ステップと、
前記類似性判定ステップにおいて類似性が高いと判定された複数のタンパク質について、その中の一つのタンパク質についてタンパク質名又はその機能を特定する識別情報が付与されている場合に、タンパク質名又はその機能を特定する識別情報が付与されていない他のタンパク質も同じタンパク質であるとみなしてタンパク質情報を追加する又は修正する情報付加ステップと、
を実行させる微生物同定用プログラム。
前記情報付加ステップではさらに、前記複数のタンパク質の全てがタンパク質名又はその機能を特定する識別情報が付与されていない場合に、該複数のタンパク質が同じタンパク質であるとしてタンパク質情報を追加する又は修正する、請求項４に記載の微生物同定用プログラム。
前記類似性判定ステップは、タンパク質情報中の理論質量の情報をさらに利用して、タンパク質同士の類似性を判定する、請求項４又は５に記載の微生物同定用プログラム。