JP2010204753A - 生物種同定方法及びシステム - Google Patents

生物種同定方法及びシステム Download PDF

Info

Publication number
JP2010204753A
JP2010204753A JP2009047153A JP2009047153A JP2010204753A JP 2010204753 A JP2010204753 A JP 2010204753A JP 2009047153 A JP2009047153 A JP 2009047153A JP 2009047153 A JP2009047153 A JP 2009047153A JP 2010204753 A JP2010204753 A JP 2010204753A
Authority
JP
Japan
Prior art keywords
sequence
species
database
biological species
identification method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009047153A
Other languages
English (en)
Other versions
JP5469882B2 (ja
Inventor
Ayako Fujisaki
綾子 藤崎
Ryota Eto
亮太 江藤
Shinji Murase
真治 村瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2009047153A priority Critical patent/JP5469882B2/ja
Publication of JP2010204753A publication Critical patent/JP2010204753A/ja
Application granted granted Critical
Publication of JP5469882B2 publication Critical patent/JP5469882B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】高度な技術や専門知識が無くても、様々な微生物が試料に混在している場合でも、微生物以外の生物種の品種判別においても、生物種を迅速かつ簡易的に推定及び同定することができる。
【解決手段】生物種同定システムは、配列データベースから入力データと相同性を有する配列を検索する相同性検索の機能、相同性検索の結果より、所定のフィルタリング条件を用いて、相同性が高い配列を選択する機能、フィルタリングにて得られた配列を含む生物種を生物種データベースより検索し、入力データを含む生物種を推定する機能、生物種検索の機能にて得られた配列を生物種既知の配列として設定し、入力データを生物種未知の配列として設定する機能、生物種未知の配列と生物種既知の配列を多重整列する機能、多重整列の結果に基づいて進化系統樹を作成する機能、配列データベースを作成する機能を有する。
【選択図】図2B

Description

本発明は、試料に含まれる微生物等の生物種を同定するための技術に関し、特に、試料のDNA塩基配列から生物種を同定するための迅速同定法に関する。
環境分野において水質汚染などを調べる際に、試料に含まれる微生物の種類と数を同定する必要がある。また、食品・医療分野における衛生検査等で、毒性を有する微生物、生命に危険を及ぼすような微生物等を同定する必要がある。医療及び医薬品分野においても、感染症に関連するような微生物を同定する処理が必要である。
微生物の同定法として、従来、培養法が知られている。培養法では、培養によって増殖した菌の形状等から専門家が菌種と菌数を同定する。このような従来の方法に加えて、近年、DNA塩基配列から生物種を同定する迅速同定法が用いられている。迅速同定法を用いることによって、微生物の同定時間を短縮できるほか、培養をすることができない微生物の同定も可能となる。そのため、迅速同定方は、食品の製造及び開発の分野ばかりでなく、環境分野、医療分野、及び、医薬品の開発等でも活用されている。
迅速同定法では、微生物のDNAを抽出し、進化的に保存されているリボソーマル領域の共通のプライマーを使って、DNAを増幅及びシーケンシングし、その塩基配列から生物種を同定する。そこで、シーケンシングによって塩基配列を決定する作業が必要不可欠である。シーケンスデータ(波形データ)には、実験的に失敗したデータ、波形のクオリティが悪いデータ等が含まれる。それらの中からクオリティの高いデータを選択するステップが必要である。また、迅速同定法では、微生物の片側の部分配列だけでなく全長配列を使って同定する場合がある。しかしながら、装置によっては、シーケンシングできる最大領域が約700bp以下であるため、複数の配列を連結する必要がある。また、実験データの信頼性を高めるために複数回(片側の部分配列だけでなく、反対側の部分配列を読む)実験を繰り返すことがある。この場合、複数回の実験で得られたデータを検証して取捨選択するステップが必要である。こうして得られた塩基配列データを用いて、既存のデータベースに対して相同性検索を行う。
例えば、細菌の16S リボソーマルRNAによる同定方法では、相同性検索によって90%以上の相同性のあるものは、同一の生物種であると推定することができるといわれている。既知の生物種に類似した配列を持つ、未知の生物種の塩基配列は、相同性検索によって特定される。しかしながら、類似した配列が数多く見つかった場合に、それが実際に本来の生物種を反映しているかどうかは、相同性検索の結果だけでは不明である。そこで、このような場合には、進化系統樹解析を行って、近隣の生物種であるか否かを確認する。
また、同様の技術・方法は、食品偽造などの問題で原材料や産地の特定などにも応用されている。生物種固有のユニバーサルプライマーを使って、シーケンシングを行い、同様の方法を利用して、データベースに対して相同性検索を行うことで、生物種を同定する。生物種の同定を行う際に、DNA配列を使っていることで、その原材料の明確な産地や品種を特定することが可能なのである。ただし、同定に用いる配列領域は、生物種ごとにことなるため、進化的に保存されているリボソーマル領域には限らず、ミトコンドリアDNAや、gryB遺伝子、キチン合成酵素(CHS)遺伝子、チトクロームb遺伝子など、様々なものが使われている。これらの同定に使われる配列領域は、研究の進歩によって増減し、変更される場合がある。
これらの一連の解析ステップには、(1)シーケンシングデータのクオリティチェックと連結、(2)相同性検索、(3)相同性検索の結果の検証、(4)系統樹解析、が含まれる。これらの解析ステップでは、専門家の目視などによる判断が必要となる場合がある。しかしながら、専門的な知識と解析技術の習得には、時間がかかる。従って、従来、これらの解析は別々のアプリケーションによって個別的に実行されていた。
この問題点を解決するため、これらの解析方法を一つのシステム上で実現したのが、特許文献1である。しかしながら、特許文献1では、 (1)のステップに関して、最も煩雑かつ手間のかかる作業であるという問題は、解決されていない。更に、特許文献1では、(1)から(4)のステップに関して、専門的な知識と解析技術の習得には、時間がかかるという課題は解決されていない。また、同定に使われる配列領域のデータベースは固定の情報となっており、新たな同定方法が確立された場合において、ユーザ側から対応するべき方法がない。
特開2006-191922
微生物をはじめとする生物種の同定は、先に挙げた様な分野において必要である。そこで、検出及び同定するべき対象は必ずしも既知の微生物とは限らないという問題がある。例えば、生体サンプルや食品の原材料など、同一の試料内には複数の生物種のDNAが混在する可能性がある。そのため、それらがどの生物種由来なのかを明確にする必要がある。しかしながら、システム上で用意されているデータベースが特定の微生物に関する情報に限定されている場合がある。そのようなデータベースは、その特定の微生物を同定する場合は利用できるが、それ以外の生物種由来の情報を検索すると、「不明」の結果となる。
相同性検索の結果、特定できなかった塩基配列が、本当にこれまで発見されてこなかった新規のものであるのか、それとも他の生物種由来のものであるのかは、全生物種を対象としたデータベースへの検索をすることによってでしか、特定できない。
このため、解析技術の知識が少ない利用者であっても、シーケンシングによる塩基配列データがあれば、簡単に生物種を同定できることが望ましい。更には、対象とする試料の中に、どのような生物種由来のものが混在していたとしても、生物種の同定が可能であることが求められている。
また、様々な生物種を同定するためには、同定に用いる配列領域がリボソーム領域とは限らないため、同定に用いる配列領域を臨機応変に変更できる必要がある。
本発明の目的は、高度な技術や専門知識が無くても、様々な微生物が試料に混在している場合でも、微生物以外の生物種の品種判別においても、生物種を迅速かつ簡易的に推定及び同定することができる生物種同定方法及びシステムを提供することにある。
本発明の生物種同定システムは、配列データベースから入力データと相同性を有する配列を検索する相同性検索の機能、相同性検索の結果より、所定のフィルタリング条件を用いて、相同性が高い配列を選択する機能、フィルタリングにて得られた配列を含む生物種を生物種データベースより検索し、入力データを含む生物種を推定する機能、生物種検索の機能にて得られた配列を生物種既知の配列として設定し、入力データを生物種未知の配列として設定する機能、生物種未知の配列と生物種既知の配列を多重整列する機能、多重整列の結果に基づいて進化系統樹を作成する機能、配列データベースを作成する機能を有する。
本発明によると、高度な技術や専門知識が無くても、様々な微生物が試料に混在している場合でも、微生物以外の生物種の品種判別においても、生物種を迅速かつ簡易的に推定及び同定することができる生物種同定方法及びシステムが得られる。
本発明による生物種同定システムの構成の例を示す図である。 本発明による生物種同定方法の処理の例の概要を示す図である。 本発明による生物種同定方法の処理の例の詳細を示す図である。 本発明による生物種同定システムの表示装置に表示されたメイン画面の例を示す図である。 本発明による生物種同定システムの表示装置に表示された配列データベースおよび生物種データベースの管理画面の例を示す図である。 本発明による生物種同定システムにおいてネットワークを経由して取得した配列情報よりサブデータベースを作成するための設定画面の例を示す図である。 本発明による生物種同定システムにおいて、相同性検索を行うためのデータベースの条件を設定する画面の例を示す図である。 本発明による生物種同定システムにおいて、相同性検索を行うためのデータベース条件の設定する画面の例を示す図である。 本発明による生物種同定システムにおいて、相同性検索の結果を表示する画面の例を示す図である。 相同性検索結果の詳細を示す図である。 相同性検索結果の詳細を示す図である。 本発明による生物種同定システムにおいて、相同性検索の結果より、生物種を推定するための絞込み条件を設定する画面の例を示す図である。 本発明による生物種同定システムにおいて、生物種の推定結果を表示する画面の例を示す図である。 本発明による生物種同定システムにおいて、進化系統樹を作成した結果を表示する画面の例を示す図である。
以下、本発明を実施する場合の一形態を、図面を参照して具体的に説明する。図1は本発明の生物種同定システムの構成の例の概略を示す図である。本例の生物種同定システムは、配列データを入力し、各種の操作を行うための入力装置120、各種の演算及び解析を行う中央処理装置119、演算及び解析結果を表示するための表示装置118、及び、各種のプログラムを格納したプログラムメモリ110を有する。入力装置120は例えばマウス120A及びキーボード120Bを含む。本例の生物種同定システムは、CPU、メモリ、ハードディスク等の記憶装置、入力装置及び表示装置を備えたコンピュータによって構成されてよい。本例の生物種同定システムは、更に、二つのデータベース、即ち、塩基配列情報を格納した配列データベース101と、生物種の情報を格納した生物種データベース107を有する。配列データベース101は、少なくとも1つのサブデータベース102を有する。サブデータベース102には、配列ID103、塩基配列104、及び、アノテーション105が保存されている。本例では、配列ID103は、アクセッション番号(Accession)である。通常、公共のデータベースに格納された塩基配列は、アクセッション番号という識別子を有する。アクセッション番号は、データベースに格納された塩基配列を一意的に識別するための識別子である。アノテーション105は、塩基配列に関する情報であり、本例では、デフィニション(Definition)である。
生物種データベース107には、配列IDと生物種IDの対応情報108、及び、生物分類名109が保存されている。本例では、生物種IDは、分類群(Taxonomy ID)である。生物分類名109は、生物種名(Species)である。
二つのデータベース101と107には、インターネット経由で公共のデータベース106から直接取得した、配列情報や生物分類情報を登録することができる。
プログラムメモリ110は、波形データの信頼性評価を行う波形の信頼性評価プログラム111、クオリティの低い波形データや、余分な塩基配列を除去するためのトリミングプログラム112、複数のシーケンシングデータを連結するアセンブルプログラム113、配列データベース101より、入力データに類似した塩基配列を検索するための相同性検索プログラム114、生物種データベース107より、生物種を推定する生物種推定プログラム115、生物種が未知の塩基配列と生物種が既知の塩基配列を一度に比較する多重整列(マルチプルアライメント)を実行する多重整列プログラム116、及び、多重整列の結果に基づいて進化系統樹を作成する系統樹作成プログラム117を有する。
これらのプログラムとして、既存の又は市販の解析プログラムを用いてよいが、これらの既存の又は市販の解析プログラムを改良したプログラム、又は、それに相当するアルゴリズムを用いてもよい。例えば、相同性検索プログラム114として、BLAST、FASTA等の既存の解析プログラムが知られている。また、多重整列プログラム116及び系統樹作成プログラム117として、CLUSTAL W等が知られている。
図2Aを参照して、本発明の生物種同定システムを用いた生物種同定方法の処理の概略を説明する。まず、ステップS201にて、入力装置120を介して、ユーザは、塩基配列データを入力する。ステップS202にて、入力装置120を介して、ユーザは、解析パラメータを設定する。尚、ユーザが解析パラメータを設定する代わりに、予め設定された解析パラメータのデフォルト値を用いてもよい。この場合には、ステップS202を省略してよい。ステップS203にて、解析処理を実行する。例えば、ユーザは、表示装置118に表示されたユーザインターフェースにて、入力装置120を介して、実行ボタンを選択する。実行ボタンが選択されると、一連の解析処理が開始される。ステップS203の詳細は、次に、図2Bを参照して説明する。ステップS204にて、解析処理の結果を、表示装置118に表示する。本例の生物種同定システムでは、ユーザが塩基配列データを入力した後、ユーザが高度な技術がない場合にも簡単に解析ができる。
図2Bを参照して、本発明の生物種同定システムを用いた生物種同定方法の処理の詳細を説明する。図2Bの処理は、図2AのステップS203に相当する。本例では、ステップS201にて入力された塩基配列データが複数であることを想定している。そのため、各ステップでは、複数データの処理を一度に行う。入力データは、シーケンス装置から出力された波形データ、波形のクオリティ値および塩基配列情報を含むデータ、及び、テキストベースの塩基配列情報(A、T、C、Gを含んだもの)、の三種類が可能である。
入力データが波形データの場合、ステップS205の「波形の信頼性評価」からステップS214の「系統樹作成」までの全ての処理を実行する。入力データが既に波形のクオリティ値を含んでいる場合は、ステップS206の「低クオリティ領域のNによるマスキング」からステップS214までを実行する。入力データが塩基配列情報のみの場合、ステップS207の「任意配列のトリミング処理」からステップS214までを実行する。
尚、ステップS202の解析パラメータを設定する処理では、表示装置118に表示されたユーザインターフェースにて、ステップS205からステップS214までの各解析ステップに対して、「実行する」又は「実行しない」を選択することができる。ユーザは、必要な解析ステップに対して「実行する」を選択すればよい。尚、デフォルトでは全ステップに対して「実行する」が選択されているものとする。
ステップS205〜ステップS208は、前処理と称される。前処理は、波形の信頼性評価プログラム111、トリミングプログラム112、及び、アセンブルプログラム113によって実行する。波形の信頼性評価S205では、波形データが入力された場合のみ実行し、代表的なアルゴリズムとしてPhredが挙げられるが、波形がA、T、C、Gのいずれかに該当する場合、適切な波形かどうかを数値として出力する。これが波形のクオリティ値となる。クオリティ値を算出したのち、次のステップ、低クオリティ領域のNによるマスキングS206では、ユーザが指定したクオリティ値以下の塩基(A、T、C、Gいずれか)をNで置換する。低クオリティ領域および任意配列のトリミングS207では、S206においてN塩基の領域を取り除く。例えば、ある塩基のウィンドウサイズ(10bp)内でN塩基の割合が10%以上である場合、その領域を取り除くといった条件で塩基配列をきれいな状態にする。また、任意の配列(ベクター配列やプライマー配列)を予め登録しておき、その配列が塩基配列の中に含まれているかどうかを検索し、あるマッチ率以上の相同性のある領域が見つかった場合、その領域を取り除く。
ステップS209にて、相同性検索プログラム114を用いて、相同性検索を実行する。相同性検索では、入力データ(塩基配列)に対して相同性が高い配列を、配列データベース101、又は、公共のデータベース106から検索する。ステップS210にて、相同性検索の結果をフィルタリングし、配列数を絞り込む。ステップS211にて、生物種推定プログラム115を用いて、生物種データベース107を検索し、生物種を特定する。ステップS212にて、進化系統樹を作成するための配列を決定する。即ち、生物種未知の塩基配列と生物種既知の塩基配列とを用意する。生物種未知の塩基配列として、入力データを用い、生物種既知の塩基配列として、ステップS211にて得られた、生物種が推定された配列を用いる。
ステップS213にて、多重整列(マルチプルアライメント)プログラムを用いて、生物種既知の塩基配列と生物種未知の塩基配列とを多重整列処理する。ステップS214にて、多重整列処理の結果より、進化系統樹プログラムを用いて進化系統樹を作成する。
本例の生物種同定システムでは、ステップS212の系統樹作成用の配列決定の処理において、生物種未知の塩基配列として、相同性検索でヒットはしたが相同性が低く同定することができなかった入力データを用い、生物種既知の塩基配列として、相同性のある生物種を含む近隣の生物種の配列を用いる。そのため、ステップS205からステップS214までの各解析ステップを自動的に実行することができる。しかしながら、ステップS212の系統解析用の配列決定の処理において、ユーザが手動にて、生物種既知の塩基配列と生物種未知の塩基配列とを決定してもよい。この場合、自動解析ではサポートしきれない部分も手動解析にて実行可能となる。こうして、本発明の生物種同定システムでは、試料に含まれる生物種が明確でない場合であっても、未決定の生物種の進化的に保存されている塩基配列と、既知の塩基配列との間の相同性を検出することによって、その生物種を推定する。
図3は本発明による生物種同定システムの起動時に表示装置118に表示される、メイン画面300の一例を示す図である。メイン画面300の左側部分には、実行履歴タブ3001とデータベースタブ3002が表示されている。メイン画面300の右側部分には、入力データタブ3003、前処理タブ3004、相同性検索タブ3005、生物種推定タブ3006、多重整列タブ3007、及び、系統樹タブ3008が表示されている。
実行履歴タブ3001を選択すると、その下側に、解析実行履歴が表示される。データベースタブ3002を選択すると、その下に、本例の生物種同定システムに登録されているデータベースの一覧が表示される。前処理タブ3004を選択すると、その下側に、前処理の結果が表示される。前処理は、図2Bの解析ステップ205〜208に対応する。相同性検索タブ3005を選択すると、その下側に、相同性検索の結果が表示される。相同性検索は、図2Bの解析ステップ209に対応する。生物種推定タブ3006を選択すると、その下側に、生物種推定の結果が表示される。生物種推定は、図2Bの解析ステップ210〜211に対応する。多重整列タブ3007を選択すると、その下側に、多重整列の結果が表示される。多重整列は、図2Bの解析ステップ212〜213に対応する。系統樹タブ3008を選択すると、その下側に、系統樹作成の結果が表示される。系統樹作成は、図2Bの解析ステップ214に対応する。
図示の例では、メイン画面300の左側部分にて、実行履歴タブ3001が選択されている。従って、その下側には、実行履歴の内容が表示されている。実行履歴として、実行したユーザ名3010、と、実行日時3011が表示される。ユーザ名3010及び実行日時3011の1つを選択すると、その実行日時3011に利用した入力データ3012、及び、出力データ3013のアイコンが表示される。出力データ3013のアイコンの下の階層には、前処理、相同性検索、生物種推定、多重整列、及び、系統樹のアイコン3014が表示されている。
図示の例では、メイン画面300の右側部分にて、入力データタブ3003が選択されている。従って、その下側には、入力データの内容が表示されている。本例では、入力データ320は、データ番号321、シーケンス名322、ファイル名323、塩基数324、及び、登録日時325を含む。
入力データ320の上側には、アイコン311〜314が表示されている。入力データ320の下側には、解析スタートボタン315、クリアボタン316が表示されている。
ユーザが、本例の生物種同定システムを用いて、新たに生物種同定の解析を行う場合には、先ず、入力データ320を入力する。本例の生物種同定システムでは、入力データ320を入力するための入力画面を表示してもよいが、このメイン画面300にて、入力データ320を入力するように構成してもよい。このメイン画面300にて入力データを入力する場合には、アイコン311〜314を選択して、入力データ320を入力する。アイコン311は新規にデータを追加入力する場合、アイコン312はディレクトリ単位でデータをまとめて入力する場合、アイコン313は入力データ320にある任意のデータを削除する場合、アイコン314は入力データ320にある任意のデータを表示し確認する場合に用いる。入力後に、解析スタートボタン315をクリックすると、図2Bの解析ステップが実行される。入力データ320のいずれかを削除する場合には、クリアボタン316をクリックすればよい。
図4は配列データベース101の内容を示す画面400の例を示す。この画面400は、図3のメイン画面300にて、データベースタブ3002を選択すると、表示される。この画面400の左側部分には、実行履歴タブ4001、及び、データベースタブ4002が表示されている。実行履歴タブ4001、及び、データベースタブ4002は、メイン画面300の左側部分の実行履歴タブ3001、及び、データベースタブ3002と同一である。データベースタブ4002の下側には、サブデータベース作成用のアイコン4010、4011、4012が表示されている。ファイルからサブデータベースを作成する場合にはアイコン4010を選択する。インターネットを経由して、公共データベース106から塩基配列を取り込んでサブデータベースを作成する場合には、アイコン4011を選択する。サブデータベースは、図1のサブデータベース102に該当する。これらはユーザが自由に複数のサブデータベースを構築できる。
生物種データベース107は、予めシステムに組み込んでおくデータベースであるが、ユーザが最新の情報で更新する場合に、アイコン4012を選択することで、生物種データベースファイルを読み込むことができる。
データベースタブ4002の下側には、更に、本例の生物種同定システムにて、利用可能なサブデータベースの一覧を示すアイコン4013〜4015が表示されている。ユーザは、本例の生物種同定システムの配列データベース101に登録されている全てのサブデータベースを把握することができる。サブデータベースを示すアイコン4013〜4015の1つを選択すると、右側にその内容が表示される。図示の例では、サブデータベースの一覧からサブデータベース4013が選択されている。従って、右側部分には、そのサブデータベース4013に関する情報が表示される。
この画面400の右側部分を説明する。画面400の右側部分には、入力データタブ4003、データベースタブ4004が表示されている。図示のように、データベースのタブ4004の下側に、サブデータベース4013に関する基本的情報が表示される。基本的情報として、データベース名411、作成者412、作成日413、配列数414、更新日415が表示される。更新ボタン416をクリックすると、サブデータベース4013に登録されている配列データは、最新の状態に更新される。即ち、サブデータベース4013に登録されている配列データは、配列IDをキーとして、自動更新される。編集ボタン417をクリックすると、ユーザは、データベース名などの情報を編集することができる。
サブデータベース4013は、相同性検索ができるようなフォーマットに変換される。そこで、基本的な情報の下側には、フォーマットに関する情報420が表示される。図示のように、フォーマットに関する情報420は、フォーマットされたサブデータベース421、フォーマット変換が正常に完了しているか否かの情報422、及び、更新日423が表示される。フォーマットはサブデータベースを作成時、および編集時に自動的にフォーマットされるが、改めてフォーマットを行いたい場合や、フォーマットに失敗した場合に、更新ボタン424を利用する。
本例の生物種同定システムでは、サブデータベース4013に登録された配列IDに対応する生物種の情報が必要不可欠である。そこで、生物種データベース107に含まれる、サブデータベース421に該当する生物種の情報430が表示される。図示のように、この情報430は、データベース名431、該当する生物種の中で不明のものが何件あるかの情報432、及び、更新日433を含む。ユーザは、確認ボタン434をクリックすることによって、サブデータベース4013に登録された配列IDに対応する生物種IDの情報が生物種データベース107に存在することを、別ウィンドウのダイアログでIDと生物種名と件数を確認できる。
次に、サブデータベース4013に登録された配列情報450の一覧が表示される。図示のように、配列情報450は、データ番号451、塩基配列の配列ID452、分類群(Taxonomy ID)453、種族名(phylotype)454、デフィニッション(Definition)455を含む。配列IDとして以下では、アクセッション番号(Accession)を用いる。アクセッション番号は、公共データベースが塩基配列に付与した一意の識別符号である。これらの項目については、後に図8A及び図8Bを参照して説明する。
この配列情報450に更に情報を付加するには、アイコン441、442を選択する。この配列情報450の一覧を、ファイルとして出力する場合には、アイコン443を選択し、配列情報そのものを出力する場合には、アイコン444を選択すればよい。更に、配列情報の一覧より、所望の配列を選択し、アイコン445を選択すれば、その配列が削除される。また、入力欄446に所望の配列を入力し、検索ボタン447をクリックすると、サブデータベース4013から、入力した配列を検索することができる。配列情報450の上側には、更に、配列情報の件数448、スライドバー449が表示されている。
図5を参照して、公共データベース106から塩基配列を取り込んでサブデータベースを作成する方法を説明する。図4に示す画面にてアイコン4011を選択すると、図5のサブデータベース作成画面が表示される。サブデータベース作成画面は、データベース名511、作成者512、コメント513を入力する欄を有する。
本例のサブデータベース作成画面では、ユーザは、アクセッション(Accession)番号検索と、エントレス(Entrez)検索の2つの検索方法のいずれかを指定することができる。アクセッション番号検索を選択する場合には、検索条件入力欄521に、複数のアクセッション番号を入力し、検索実行ボタン522をクリックする。
エントレス(Entrez)検索を選択する場合には、データベースと絞込み条件を指定する。先ず、公共のデータベース名531を入力する。次に、絞込み条件を入力する。即ち、キーワード532を入力し、分類群ID533、534を入力する。ここで、ボタン535、536、537を選択することにより、複数の絞込み条件に対して、AND、OR、NOTのいずれかを指定する。データベースと絞込み条件を指定したら、検索実行ボタン538をクリックする。
サブデータベース作成画面の下側部分には、検索条件を満たす塩基配列の情報550が表示される。図示のように、塩基配列の情報550は、データ番号552、アクセッション番号553、デフィニッション(Definition)554、分類群(Taxonomy)ID555、国(country)556、種(strain)557、を含む。塩基配列の情報550の上側には、ヒット件数561、ページ数562、スライドボタン563が表示されている。
塩基配列の情報550の上側には、更に、ファイル出力用アイコン541、編集用アイコン542、及び、削除用アイコン543が表示されている。
各データの先頭にチェック入力欄551が設けられている。特定の行のデータを選択する場合には、チェック入力欄551にチェックを入力すればよい。例えば、ファイル出力用アイコン541をクリックすると、選択された行の情報がファイルとして出力される。編集用アイコン542をクリックすると、選択された行の情報を編集することができる。削除用アイコン543をクリックすると、選択された行が削除される。尚、特定の行を選択しないで、ファイル出力用アイコン541をクリックすると、全ての行の情報がファイルとして出力される。
こうして、生成された塩基配列の情報の一覧はサブデータベースとして、配列データベース101に登録される。
図6A及び図6Bを参照して、本発明による生物種同定システムによる相同性検索方法について説明する。これは、図2Bのステップ209の配列データベースに対する相同性検索の処理に相当する。図6A及び図6Bは、相同性検索処理を実行する場合に、表示装置118に表示される画面の例を示す。相同性検索では、生物種同定システムに設けられた配列データベース101を用いてもよいが、公共データベース106を用いてもよい。図6Aは、公共データベース106を用いる場合の設定画面の例を示す。一方、図6Bは、生物種同定システムに設けられた配列データベース101を用いる場合の設定画面の例を示す。
図6Aの設定画面600Aについて説明する。画面600Aの左側部分には、検索対象となるデータベースのリストが表示されている。Local Blast6001は、生物種同定システムに設けられた配列データベース101を用いて相同性検索を行う場合を示す。本例では、相同性検索プログラムとして、既存のBLASTプログラムを利用する。DDBJ Blastは、データベースとして日本DNAデータバンク(DNA Data Bank of Japan)を用いて、相同性検索を行う場合を示す。NCBI Blastは、データベースとして、バイオ技術情報ナショナルセンタ(National Center for Biotechnology Information)を用いて、相同性検索を行う場合を示す。この画面の右側部分には、DB設定のタブ6004とBLAST詳細設定のタブ6005が表示されている。DB設定のタブ6004を選択すると、その下側部分に、データベースに関する詳細設定項目が表示される。BLAST詳細設定のタブ6005を選択すると、その下側部分に、相同性検索のアルゴリズムであるBLASTプログラムのパラメータに関する詳細設定項目が表示される。DB設定のタブ6004の下側部分に表示される内容、及び、BLAST詳細設定のタブ6005の下側部分に表示される内容は、画面の左側部分にて選択したデータベースによって異なる。
図6Aは、NCBI Blastボタン6003を選択し、DB設定のタブ6004を選択した場合に表示される画面の例を示す。この画面600Aは、データベース内のデータを更に絞り込むための条件を指定する欄611、612と、エントレス(Entrez)検索用のクエリ613、614、615を入力する欄を有する。クエリとして、生物種、塩基配列の長さ、塩基配列のアノテーション等を指定する。OKボタン621をクリックすると、相同性検索プログラムが実行される。キャンセルボタン622をクリックすると、入力処理がキャンセルされる。
図6Bは、Local Blastボタン6001を選択し、DB設定のタブ6006を選択した場合に表示される画面の例を示す。この画面600Bには、配列データベース101に含まれるサブデータベースに関する情報650が表示される。この情報は、データベース名652、配列数653、更新日654を含む。ユーザは、チェックボックス651にチェックを入力することにより、1つ又は複数のサブデータベースを選択することができる。OKボタン661をクリックすると、相同性検索プログラムが実行される。キャンセルボタン662をクリックすると、入力処理がキャンセルされる。
図7参照して、本発明による生物種同定システムによる相同性検索の結果の表示画面の例を説明する。図3のメイン画面300にて、相同性検索タブを選択すると、図7の相同性検索の結果の表示画面700が表示される。この画面の左側部分は、図3のメイン画面300の左側部分と同一である。
相同性検索タブの下側部分に、相同性検索の結果720が表示される。相同性検索の結果720は、データ番号722、クエリ723、アクセッション724、デフィニション725、分類群ID726、及び、生物種名727を含む。この表の下縁のスライドバー728を用いることによって、更に、他の項目を表示することができる。これらの項目については、図8A及び図8Bを参照して説明する。相同性検索の結果の各行の先頭には、チェックボックス721が表示されている。
相同性検索の結果720の上側には、サブデータベース生成用アイコン711、相同性検索の結果の出力用アイコン712、ファイル出力用アイコン713、が表示されている。チェックボックス721にチェックを入れ、アイコン711を選択すると、チェックが付された行のデータからなるサブデータベースが生成される。このサブデータベースは、配列データベース101に登録される。相同性検索の結果720の一覧そのものを出力する場合には、アイコン712を選択し、相同性検索の結果を、ファイルとして出力する場合には、アイコン713を選択すればよい。
本例の相同性検索の結果の表示画面700では、入力データに対して相同性のある配列をスコアの高い順番に並べたときの、上位X件分を表示する。表示する上位の件数を変更する場合には、入力欄714にて、数値を入力し、ビュウボタン715をクリックすればよい。図示の例では、入力欄714に上位3件分を表示することが指定されている。そこで、クエリ723の列には、同一のクエリに対して、それぞれ3件のデータが表示されている。更に、入力欄716に所望の配列を入力し、検索ボタン717をクリックすると、この相同性検索の結果から、入力した配列を検索することができる。これにより、相同性検索の結果の解析データが多く、例えば、数百件、又は、数千件であっても、必要な解析結果を迅速に呼び出すことができる。
本例では、複数の入力データに対して、相同性検索を行う。通常、このように、複数の入力データに対する相同性検索の結果を表示する場合、入力データの1件毎に、結果の表示画面を参照する必要がある。しかしながら、本例では、複数の入力データに対する相同性検索の結果を1つの画面にて表示する。そのため、ユーザは、効率的に相同性検索の結果を確認することができる。
図8A、及び、図8Bは図7の相同性検索の結果の表示画面にて表示可能な項目の詳細である。図8Aに示すように、表示項目は、入力データ(Query)801、絞込み条件(Filter)802、アクセッション番号(Accession)803、配列情報(Definition)804、分類群(Taxonomy ID)805、種族名(phylotype)806、配列長(Hit length)807、スコア値(Score)808、を含む。
入力データ(Query)801は、ユーザが入力した塩基配列である。絞込み条件(Filter)802は、図2BのステップS210の処理における生物種を同定するための条件に対応する。図2BのステップS210の処理では、相同性検索の結果として得られた塩基配列より、所定の条件に該当するものと該当しないものとをフィルタリングし、該当するものを表示する。この絞込み条件の設定方法は、図9を参照して説明する。アクセッション番号(Accession)803は、入力データに対して相同性を有する塩基配列の配列IDである。ここでは、検索対象のデータベースにおけるアクセッション番号である。データベースに格納された配列は、その配列を一意的に表すアクセッション番号という識別子を有する。配列情報(Definition)804は、アクセッション番号に対応する配列情報である。アクセッション702に対するアノテーションの一つがデフィニションである。分類群(Taxonomy ID)805は、アクセッション番号803に対応する生物種IDである。生物種IDは、生物種データベース107を検索することにより取得される。種族名(phylotype)806は、分類群(Taxonomy ID)805に対応する生物種の分類名である。配列長(Hit length)807は、アクセッション番号803に対応する塩基配列の配列長である。スコア値(Score)808は、相同性の高さを表し、高いほど類似していることを示す。
図8Bに示すように、表示項目は、更に、期待値(E-value)809、一致率(Identities:%)810、一致した領域の長さ(Identities Length)811、一致した塩基数(Overlap Length)812、挿入塩基(Gap) 813、配列の向き(Strand)814、一致した領域の開始位置(Query Start)815、終了位置(Query End)816、一致した領域に対するヒットした配列の開始位置(Subject Start)817、及び、終了位置(Subject End)819を含む。
期待値809は、相同性の信頼度を表し、低いほど相同であることが偶然でないことを示す。一致率(%)810は、入力データに対するヒット配列ID803の一致の割合を示す。一致した領域の長さ811は、入力データに対するヒット配列ID803の一致した領域の長さを示す。一致した塩基数812は、入力データに対するヒット配列ID803の一致した塩基数を示す。挿入塩基813は、一致した領域内に存在する塩基の数を示す。配列の向き814は、ヒット配列ID803の方向を正か負かで示す。
一致した領域の開始位置815及び終了位置816は、配列ID803と一致する入力データの開始位置及び終了位置を表す。一致した領域に対するヒットした配列の開始位置817及び終了位置819は、入力データと一致する配列ID803の開始位置及び終了位置を表す。
ここでは、全ての入力データに対する相同性検索の結果を表示したが、1件のQuery毎に、相同性検索の結果を表示することもできる。
図9は、相同性検索の結果から、生物種を推定するためのフィルタリング条件の設定を行うための画面の例を示す。この画面900は、図2BのステップS210の処理を行うときに表示される。
この画面900の冒頭911に、「BLAST結果の中で下記条件に当てはまる生物種を推定生物種とします。」と表示されている。その下の欄912には、1つの入力データ(1Query)当たりの検索結果の表示件数を設定する。その下側に、図7の相同性検索の結果の表示画面において表示する配列を決めるための条件920が表示される。条件920は、判定順921と基準項目922からなる。基準項目922は、例えば、スコア値808、期待値809、一致率(%)810、一致した塩基数812等である。判定順921は、これらの基準項目に対する優先度を示す。図示の例では、判定順921は、スコア値808、期待値809、一致率(%)810、一致した塩基数812の順である。従って、スコア値が最も高い配列が優先して表示される。
この画面では、基準項目922に対して更に詳細な条件を設定することができる。図示の例では、スコア値の条件931では、300以上、期待値の条件932では、0.1以下、一致率(%)の条件933では、90(%)以上、一致した塩基数の条件934では、300以上、が設定されている。更に、デフィニッションの条件935では、キーワード940を含む配列をフィルタリングすることができる。「含む/含まない」の選択欄942にて、「含む」を選択すると、ヒットした配列のデフィニッション804に、このキーワード940を含む場合に、その配列をフィルタリングすることができる。「含む/含まない」の選択欄942にて、「含まない」を選択すると、ヒットした配列のデフィニッション804に、このキーワード940を含まない場合に、その配列をフィルタリングすることができる。
ユーザは、キーワード入力欄936にキーワードを入力し、追加ボタン937をクリックすることによって、キーワードを追加することができる。キーワードを削除する場合には、チェックボックス941にチェックを入力し、削除ボタン938をクリックすればよい。
相同性検索の結果により得られた配列に対して、これらのフィルタリング条件を用いてフィルタリングしても、ヒット配列が減少しない場合には、フィルタリング条件を変更すればよい。図9のフィルタリング条件によってフィルタリングされた配列から、生物種を判定した結果は、図10に示す。
図10は、本発明の生物種同定システムによる生物種を推定した結果を示す画面の例を示す。この画面1000は、図2BのステップS211の処理によって得られる。この画面1000は、図3のメイン画面300の生物種推定タブ3006を選択することにより表示される。この画面1000には、フィルタリング条件及び結果1011と生物種の推定結果1020が表示される。フィルタリング条件及び結果1011には、図9のフィルタリング条件の設定画面900にて設定された条件931〜934と、ヒットした件数が表示される。図示の例では、105件がヒットしたことが示されている。ボタン1012をクリックすることによって、図9のフィルタリング条件の設定画面900にて設定された他の条件が表示される。
生物種の推定結果1020は、分類群(Taxonomy ID)1022、生物種の名称1023及びカウント数1024を含む。カウント数1024は、入力データの数ではなく、図9のフィルタリング条件の設定画面にて設定されたフィルタリング条件に適合する入力データ数である。即ち、フィルタリング条件1007に適合し、且つ、図9のフィルタリング条件の設定画面にて設定された上位の表示件数912に相当する配列である。
生物分類の体系は、「界(Kingdom)」「門(Division)」「網(Class)」「目(Order)」「科(Family)」「属(Genus)」「種(Species)」などに分類される。本例の生物種の判定結果1020では、生物種名1023、即ち、「種」を示している。階層選択ボタン1025をクリックすることにより、生物種名1023の代わりに、他の階層名を表示することができる。
この画面1000の上側部分には、配列情報をデータベースに登録するためのアイコン1001、生物種の判定結果1020をファイルとして出力するためのアイコン1002、生物分類体系をツリー形式で表示するためのアイコン1003、ツリー表示から表形式表示に戻すためのアイコン1004が設けられている。
生物種の判定結果1020の各行の先頭には、チェックボックス1021が表示されている。所定のチェックボックス1021にチェックを入力し、アイコン1001をクリックすると、チェックが付された生物分類に関連する配列情報からなるサブデータベースが登録される。同様に、アイコン1002をクリックすると、チェックが付された生物分類に関連する配列情報がファイルとして出力される。アイコン1003をクリックすると、チェックが付された生物分類がツリー形式で表示される。
図11は、本発明の生物種同定システムによる進化系統樹の作成結果を示す画面の例である。この画面は、図2BのステップS214の処理の結果を表示する。この画面1000は、図3のメイン画面300の系統樹タブ3008を選択することにより表示される。上述のように、進化系統樹を作成するには、図2BのステップS212にて、進化系統樹を作成するための配列を決定する。即ち、生物種既知の塩基配列と生物種未知の塩基配列とを用意する。生物種既知の塩基配列は、ステップS211にて得られた、配列であってよい。生物種未知の塩基配列は入力データであってよい。ステップS213にて、多重整列(マルチプルアライメント)プログラムを用いて、生物種既知の塩基配列と生物種未知の塩基配列とを多重整列処理する。ステップS214にて、多重整列処理の結果より、進化系統樹プログラムを用いて進化系統樹を作成する。
この画面1000には、進化系統樹1120が表示される。進化系統樹1120において、隣接する生物種は近隣の種であることを示す。また、進化系統樹1120を構成する線1121の長さが短いほど近隣の種であることを示す。進化系統樹にて付された数値1122は、線の長さである。図示の進化系統樹1120では、配列名を生物種名1123に置き換えて表示している。
進化系統樹1120の上側には、各種のアイコン1111〜1115が表示されている。アイコン1111をクリックすることにより、進化系統樹1120をファイルとして出力することができる。アイコン1112をクリックすることにより、進化系統樹1120を画像として出力することができる。アイコン1113を用いて、進化系統樹1120を拡大又は縮小表示することができる。こうして、系統樹のツリーの枝がかなり多い場合や、複雑な形を形成している場合でも、進化系統樹を詳細に理解することができる。アイコン1114を用いることによって、未知の配列データと既知の配列データを、色分け表示することができる。アイコン1115を用いることによって、表示内容を変更することができる。
以上のように本発明の生物種同定システムによれば、次のような効果がある。シーケンシング後の塩基配列データを入力するだけで、前処理、相同性検索、生物種推定、多重整列、及び、系統樹作成等の複数の処理を自動的に且つ連続的に実行することができる。従って、本発明の生物種同定システムによれば、高度な技術や専門知識が無くても、試料に含まれる複合的な生物種の内容を判定できる。また、様々な生物試料が混在している場合でも、それらの情報を同等に扱い、生物種を迅速かつ簡易的に推定及び同定することができる。
以上本発明の例を説明したが本発明は上述の例に限定されるものではなく、特許請求の範囲に記載された発明の範囲にて様々な変更が可能であることは、当業者によって容易に理解されよう。
101…配列データベース、102…サブデータベース、103…配列ID、104…塩基配列、105…アノテーション、106…公共のデータベース、107…生物種データベース、108…配列IDと生物種IDの対応情報、109…生物分類名、110…プログラムメモリ、111…波形の信頼性評価プログラム、112…トリミングプログラム、113…アセンブルプログラム、114…相同性検索プログラム、115…生物種推定プログラム、116…多重整列プログラム、117…系統樹作成プログラム、118…表示装置、119…中央処理装置、120…入力装置

Claims (18)

  1. 配列識別子、塩基配列、及び、アノテーションを格納する配列データベースと、配列識別子と生物種識別子の関係、及び、生物分類名を格納する生物種データベースを用いて、演算装置、メモリ、入力装置及び表示装置を備えたコンピュータ装置によって、生物種を同定するための生物種同定方法において、
    前記入力装置を介して入力された塩基配列を入力データとして取り込む入力データ取り込みステップと、
    前記演算装置によって、前記配列データベースから前記入力データと相同性を有する配列を検索する相同性検索ステップと、
    前記演算装置によって、前記相同性検索ステップにて検索された配列より、所定のフィルタリング条件を用いて、相同性が高い配列を選択するフィルタリングステップと、
    前記演算装置によって、前記フィルタリングステップにて得られた配列を含む生物種を前記生物種データベースより検索し、前記入力データを含む生物種を推定する生物種推定ステップと、
    前記演算装置によって、前記生物種検索ステップにて得られた配列を生物種既知の配列として設定し、前記入力データを生物種未知の配列として設定する系統樹作成用配列設定ステップと、
    前記演算装置によって、前記生物種未知の配列と前記生物種既知の配列を多重整列する多重整列ステップと、
    前記演算装置によって、前記多重整列の結果に基づいて進化系統樹を作成する系統樹作成ステップと、
    を有する生物種同定方法。
  2. 請求項1記載の生物種同定方法において、前記相同性検索ステップでは、前記配列データベースとして、前記コンピュータ装置に設けられたローカルなデータベース、又は、インターネットを介して接続された公共のデータベースを用いることを特徴とする生物種同定方法。
  3. 請求項1記載の生物種同定方法において、前記相同性検索ステップでは、複数の入力データに対して同時に相同性検索を行い、各入力データに対して相同性を有する塩基配列を検索することを特徴とする生物種同定方法。
  4. 請求項1記載の生物種同定方法において、前記相同性検索ステップは、既存の相同性検索プログラムを用いることを特徴とする生物種同定方法。
  5. 請求項1記載の生物種同定方法において、
    前記相同性検索ステップによって得られた検索結果を前記表示装置に表示する相同性検索結果表示ステップと、を有し、該相同性検索結果表示ステップでは、前記入力データ、配列識別子、デフィニッション、分類群、及び、生物種名を表示することを特徴とする生物種同定方法。
  6. 請求項5記載の生物種同定方法において、
    前記相同性検索結果表示ステップでは、前記入力装置を介して入力された、上位表示件数に基づいて、所定の数のデータを表示することを特徴とする生物種同定方法。
  7. 請求項5記載の生物種同定方法において、
    前記相同性検索結果表示ステップでは、前記入力データ、アクセッション番号、配列情報、配列長、及び、スコア値の少なくとも1つを表示することを特徴とする生物種同定方法。
  8. 請求項5記載の生物種同定方法において、
    前記相同性検索結果表示ステップでは、期待値、一致率、一致した領域の長さ、一致した塩基数、挿入塩基、配列の向き、一致した領域の開始位置及び終了位置、一致した領域に対するヒットした配列の開始位置及び終了位置の少なくとも1つを表示することを特徴とする生物種同定方法。
  9. 請求項1記載の生物種同定方法において、前記フィルタリングステップでは、スコア値、期待値、一致度、及び、一致する配列長の少なくとも1つをフィルタリング条件として選択し、前記相同性検索ステップによる検索結果より、前記フィルタリング条件を満たすものを取り出すことを特徴とする生物種同定方法。
  10. 請求項1記載の生物種同定方法において、
    前記生物種推定ステップによって得られた生物種を前記表示装置に表示する生物種表示ステップと、を有し、該生物種表示ステップでは、前記入力データを含む生物種名と、その分類群を表示することを特徴とする生物種同定方法。
  11. 請求項1記載の生物種同定方法において、
    前記系統樹作成ステップによって得られた系統樹を前記表示装置に表示する系統樹表示ステップと、を有し、該系統樹表示ステップでは、前記進化系統樹と共に、系統樹を構成する線の長さを表す数値を表示することを特徴とする生物種同定方法。
  12. 請求項1記載の生物種同定方法において、
    前記配列データベースに格納されたデータは、前記相同性検索ステップにて実行される相同性検索プログラムに対応した形式にフォーマットされていることを特徴とする生物種同定方法。
  13. 請求項1記載の生物種同定方法において、
    サブデータベースを作成するステップを有し、該サブデータベース作成ステップは、
    前記入力装置を介して入力された塩基配列を検索キーとして取り込む検索キー取り込みステップと、
    前記演算装置によって、公共のデータベースから前記検索キーに関する配列情報を検索する配列情報検索ステップと、
    前記演算装置によって、前記配列情報検索ステップによって得られた配列情報から、配列識別子、塩基配列、及び、アノテーションを格納するサブデータベースを作成するサブデータベース作成ステップと、
    該サブデータベースを前記配列データベースに格納する格納ステップと、
    を有することを特徴とする生物種同定方法。
  14. 請求項1記載の生物種同定方法において、
    サブデータベースを作成するステップを有し、該サブデータベース作成ステップは、
    前記入力装置を介して入力された公共のデータベース名とキーワードを取り込む検索条件取り込みステップと、
    前記演算装置によって、前記公共のデータベースから前記キーワードを含む配列情報を検索する配列情報検索ステップと、
    前記演算装置によって、前記配列情報検索ステップによって得られた配列情報から、配列識別子、塩基配列、及び、アノテーションを格納するサブデータベースを作成するサブデータベース作成ステップと、
    該サブデータベースを前記配列データベースに格納する格納ステップと、
    を有することを特徴とする生物種同定方法。
  15. 配列識別子、塩基配列、及び、アノテーションを格納する配列データベースと、配列識別子と生物種識別子の関係、及び、生物分類名を格納する生物種データベースと、演算装置、各種プログラムを格納したメモリ、入力装置及び表示装置を備えたコンピュータ装置を有する、生物種を同定するための生物種同定システムにおいて、
    前記入力装置は、ユーザによって入力された塩基配列を入力データとして取り込み、
    前記演算装置は、相同性検索プログラムによって、前記配列データベースから前記入力データと相同性を有する配列を検索し、フィルタリングプログラムによって、前記相同性検索プログラムによって検索された配列より、所定のフィルタリング条件を用いて、相同性が高い配列を選択し、生物種推定プログラムによって、前記フィルタリングプログラムによって得られた配列を含む生物種を前記生物種データベースより検索し、前記入力データを含む生物種を推定し、前記生物種検索プログラムによって得られた配列を生物種既知の配列として設定し、前記入力データを生物種未知の配列として設定し、多重整列プログラムによって、前記生物種未知の配列と前記生物種既知の配列を多重整列し、系統樹作成プログラムによって、前記多重整列の結果に基づいて進化系統樹を作成することを特徴とする生物種同定システム。
  16. 請求項15記載の生物種同定システムにおいて、
    前記表示装置は、前記相同性検索プログラムによって得られた検索結果の一覧を表示する相同性検索結果表示画面を表示し、該相同性検索結果表示画面では、前記入力データ、配列識別子、デフィニッション、アクセッション番号、配列情報、配列長、及び、スコア値の少なくとも1つを表示することを特徴とする生物種同定システム。
  17. 請求項15記載の生物種同定システムにおいて、
    前記配列データベースは、少なくとも1つのサブデータベースを有し、該サブデータベースは、公共のデータベースから入手した配列識別子、塩基配列、及び、アノテーションを格納していることを特徴とする生物種同定システム。
  18. 請求項15記載の生物種同定システムにおいて、
    前記配列データベースに格納されたデータは、前記相同性検索プログラムに対応した形式にフォーマットされていることを特徴とする生物種同定システム。
JP2009047153A 2009-02-27 2009-02-27 生物種同定方法及びシステム Expired - Fee Related JP5469882B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009047153A JP5469882B2 (ja) 2009-02-27 2009-02-27 生物種同定方法及びシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009047153A JP5469882B2 (ja) 2009-02-27 2009-02-27 生物種同定方法及びシステム

Publications (2)

Publication Number Publication Date
JP2010204753A true JP2010204753A (ja) 2010-09-16
JP5469882B2 JP5469882B2 (ja) 2014-04-16

Family

ID=42966199

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009047153A Expired - Fee Related JP5469882B2 (ja) 2009-02-27 2009-02-27 生物種同定方法及びシステム

Country Status (1)

Country Link
JP (1) JP5469882B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101376419B1 (ko) 2012-05-01 2014-03-19 강원대학교산학협력단 유전자 염기서열 및 주석정보 표시장치 및 표시방법
JP2014525080A (ja) * 2011-07-05 2014-09-25 コーニンクレッカ フィリップス エヌ ヴェ バイオインフォマティクス文字セット及びマップされたバイオインフォマティクスフォントを用いたゲノム/プロテオミクス配列の表現、視覚化、比較及びレポーティング
JP2016224865A (ja) * 2015-06-03 2016-12-28 株式会社日立製作所 系統樹を構築する装置、方法およびシステム
JPWO2014115747A1 (ja) * 2013-01-25 2017-01-26 国立研究開発法人国立国際医療研究センター 結核菌の菌株の同定方法及び遺伝子変異の検出方法
CN111681704A (zh) * 2020-04-21 2020-09-18 华中科技大学鄂州工业技术研究院 一种基于matK基因的未知植物物种识别数据库的构建方法及数据库

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11318441A (ja) * 1998-05-14 1999-11-24 Nagase & Co Ltd 超耐熱耐酸性アミロプルラナーゼ
JP2006003997A (ja) * 2004-06-15 2006-01-05 Hitachi Software Eng Co Ltd 核酸配列間の相関図又はマルチプルアラインメントを作成する方法及びプログラム
JP2006191922A (ja) * 2004-12-15 2006-07-27 Shimadzu Corp 微生物菌種推定システム及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11318441A (ja) * 1998-05-14 1999-11-24 Nagase & Co Ltd 超耐熱耐酸性アミロプルラナーゼ
JP2006003997A (ja) * 2004-06-15 2006-01-05 Hitachi Software Eng Co Ltd 核酸配列間の相関図又はマルチプルアラインメントを作成する方法及びプログラム
JP2006191922A (ja) * 2004-12-15 2006-07-27 Shimadzu Corp 微生物菌種推定システム及び方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CSND200500281007; 山口 学: 'COMPANY WATCH 日立ソフトウェアエンジニアリング' Bio・IT World No.2, 20030701, pp.101-106, (株)IDGジャパン *
CSNH200300278001; 鈴木 理、奈須 永典: 'バイオテクノロジー関連機器システム' 日立評論 第69巻 第4号, 19870425, pp.33-37, 日立評論社 *
CSNH200900158001; 'DNASIS ライフサイエンス技術とIT技術の融合' 日立ソフトレビュー 2004 創刊号 , 2004, pp.13-14, 日立ソフト *
JPN6013029550; 'DNASIS ライフサイエンス技術とIT技術の融合' 日立ソフトレビュー 2004 創刊号 , 2004, pp.13-14, 日立ソフト *
JPN6013029552; 山口 学: 'COMPANY WATCH 日立ソフトウェアエンジニアリング' Bio・IT World No.2, 20030701, pp.101-106, (株)IDGジャパン *
JPN6013029554; 鈴木 理、奈須 永典: 'バイオテクノロジー関連機器システム' 日立評論 第69巻 第4号, 19870425, pp.33-37, 日立評論社 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014525080A (ja) * 2011-07-05 2014-09-25 コーニンクレッカ フィリップス エヌ ヴェ バイオインフォマティクス文字セット及びマップされたバイオインフォマティクスフォントを用いたゲノム/プロテオミクス配列の表現、視覚化、比較及びレポーティング
KR101376419B1 (ko) 2012-05-01 2014-03-19 강원대학교산학협력단 유전자 염기서열 및 주석정보 표시장치 및 표시방법
JPWO2014115747A1 (ja) * 2013-01-25 2017-01-26 国立研究開発法人国立国際医療研究センター 結核菌の菌株の同定方法及び遺伝子変異の検出方法
JP2016224865A (ja) * 2015-06-03 2016-12-28 株式会社日立製作所 系統樹を構築する装置、方法およびシステム
CN111681704A (zh) * 2020-04-21 2020-09-18 华中科技大学鄂州工业技术研究院 一种基于matK基因的未知植物物种识别数据库的构建方法及数据库
CN111681704B (zh) * 2020-04-21 2022-06-17 华中科技大学鄂州工业技术研究院 一种基于matK基因的未知植物物种识别数据库的构建方法及数据库

Also Published As

Publication number Publication date
JP5469882B2 (ja) 2014-04-16

Similar Documents

Publication Publication Date Title
Jones et al. jMOTU and taxonerator: turning DNA barcode sequences into annotated operational taxonomic units
Copetti et al. RiTE database: a resource database for genus-wide rice genomics and evolutionary biology
Waterhouse et al. OrthoDB: the hierarchical catalog of eukaryotic orthologs in 2011
Worley et al. BEAUTY: an enhanced BLAST-based search tool that integrates multiple biological information resources into sequence similarity search results.
JP5469882B2 (ja) 生物種同定方法及びシステム
Ma et al. MnTEdb, a collective resource for mulberry transposable elements
Arendsee et al. phylostratr: A framework for phylostratigraphy
Shafee et al. A quantitative map of protein sequence space for the cis-defensin superfamily
Moreland et al. The Mnemiopsis Genome Project Portal: integrating new gene expression resources and improving data visualization
Dong et al. Comparative EST analyses in plant systems
Skrzypek et al. Using the Candida genome database
Kim et al. UFCG: database of universal fungal core genes and pipeline for genome-wide phylogenetic analysis of fungi
Antonescu et al. Using the DFCI gene index databases for biological discovery
Liu et al. MetazExp: a database for gene expression and alternative splicing profiles and their analyses based on 53 615 public RNA-seq samples in 72 metazoan species
JP2005176730A (ja) cDNA配列をゲノム配列にマッピングする方法
Chen et al. PRAP: an ab initio software package for automated genome-wide analysis of DNA repeats for prokaryotes
Tatusova Genomic databases and resources at the National Center for Biotechnology Information
Yang et al. FAWMine: An integrated database and analysis platform for fall armyworm genomics
Dotan et al. GenomeFLTR: filtering reads made easy
Skrzypek et al. How to use the Candida genome database
KR100513266B1 (ko) 클라이언트/서버 기반 est 서열 분석 시스템 및 방법
Herrero et al. Database: The journal of biological databases and Curation
Mochizuki et al. DNApod: DNA polymorphism annotation database from next-generation sequence read archives
Basenko et al. What is new in FungiDB: a web-based bioinformatics platform for omics-scale data analysis for fungal and oomycete species
Schwarz et al. Searching WormBase for information about Caenorhabditis elegans

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130618

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130813

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140203

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees