JP2006191922A - System for estimating strain of microorganism and method for the same - Google Patents
System for estimating strain of microorganism and method for the same Download PDFInfo
- Publication number
- JP2006191922A JP2006191922A JP2005216546A JP2005216546A JP2006191922A JP 2006191922 A JP2006191922 A JP 2006191922A JP 2005216546 A JP2005216546 A JP 2005216546A JP 2005216546 A JP2005216546 A JP 2005216546A JP 2006191922 A JP2006191922 A JP 2006191922A
- Authority
- JP
- Japan
- Prior art keywords
- database
- sequence
- gene
- base sequence
- test bacterium
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 244000005700 microbiome Species 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 title claims description 22
- 241000894007 species Species 0.000 claims abstract description 73
- 238000012360 testing method Methods 0.000 claims abstract description 68
- 241000894006 Bacteria Species 0.000 claims abstract description 67
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 31
- 230000001580 bacterial effect Effects 0.000 claims description 49
- 108091036078 conserved sequence Proteins 0.000 claims description 17
- 108020004463 18S ribosomal RNA Proteins 0.000 claims description 15
- 241000233866 Fungi Species 0.000 claims description 13
- 108700022487 rRNA Genes Proteins 0.000 claims description 13
- 241000206602 Eukaryota Species 0.000 claims description 6
- 102000042567 non-coding RNA Human genes 0.000 claims description 6
- 102000005469 Chitin Synthase Human genes 0.000 claims description 4
- 108700040089 Chitin synthases Proteins 0.000 claims description 4
- 125000006850 spacer group Chemical group 0.000 claims description 4
- 108020005096 28S Ribosomal RNA Proteins 0.000 claims description 3
- 108010085238 Actins Proteins 0.000 claims description 2
- 108010075028 Cytochromes b Proteins 0.000 claims description 2
- 108020005196 Mitochondrial DNA Proteins 0.000 claims description 2
- 108010068204 Peptide Elongation Factors Proteins 0.000 claims description 2
- 102000002508 Peptide Elongation Factors Human genes 0.000 claims description 2
- 108090000704 Tubulin Proteins 0.000 claims description 2
- 101150101373 fus gene Proteins 0.000 claims description 2
- 101150079601 recA gene Proteins 0.000 claims description 2
- 101150090202 rpoB gene Proteins 0.000 claims description 2
- 108091023242 Internal transcribed spacer Proteins 0.000 description 44
- 230000002538 fungal effect Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 230000000813 microbial effect Effects 0.000 description 7
- 241001226034 Nectria <echinoderm> Species 0.000 description 6
- 241000427940 Fusarium solani Species 0.000 description 5
- 241001231403 [Nectria] haematococca Species 0.000 description 5
- 238000013081 phylogenetic analysis Methods 0.000 description 4
- 108020004418 ribosomal RNA Proteins 0.000 description 4
- 230000009897 systematic effect Effects 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 3
- 241000235349 Ascomycota Species 0.000 description 2
- 241000221775 Hypocreales Species 0.000 description 2
- 241000257212 Hypocreomycetidae Species 0.000 description 2
- 241000147158 Nectriaceae Species 0.000 description 2
- 241001465255 Opisthokonta Species 0.000 description 2
- 241001326562 Pezizomycotina Species 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 241001326533 Sordariomycetes Species 0.000 description 2
- 241000902900 cellular organisms Species 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108020004465 16S ribosomal RNA Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 241000680806 Blastobotrys adeninivorans Species 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 241000243212 Encephalitozoon cuniculi Species 0.000 description 1
- 241001423728 Fusarium neocosmosporiellum Species 0.000 description 1
- 241000121220 Tricholoma matsutake Species 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 108010064833 guanylyltransferase Proteins 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
本発明は、塩基配列に基づく相同性比較や系統解析によって微生物の菌種を推定するシステム、及び該システムを用いた菌種推定方法に関する。 The present invention relates to a system for estimating the species of microorganisms by homology comparison based on base sequences and phylogenetic analysis, and a method for estimating the species using the system.
近年、未知の微生物(細菌及び真菌類)の菌種を推定する方法として、被検菌のリボソーマルRNA(rRNA)遺伝子やその周辺領域(本発明では、これらを総称してrRNA遺伝子関連領域、又はリボソーマルRNA遺伝子関連領域と呼ぶ)の配列を決定してGenbankやEMBL、DDBJ等の公共データベースを用いた相同性検索を行い、被検菌のものと相同性の高かった配列が由来する菌種を該被検菌と同一種又は近縁種と判定すると共に、該相同性検索の結果に基づいて被検菌種及びその近縁種の塩基配列に基づく系統樹を作成することで該被検菌の系統学的な位置を推定するといった手法が広く用いられるようになっている(非特許文献1)。 In recent years, as a method for estimating the species of unknown microorganisms (bacteria and fungi), the ribosomal RNA (rRNA) gene of a test bacterium and its peripheral region (in the present invention, these are collectively referred to as rRNA gene-related regions, or The ribosomal RNA gene-related region) is determined, and homology searches using public databases such as Genbank, EMBL, and DDBJ are performed. The test bacterium is determined to be the same or related species as the test bacterium, and a phylogenetic tree based on the base sequence of the test bacterium species and the related species is created based on the result of the homology search. A method of estimating the phylogenetic position is widely used (Non-Patent Document 1).
上記rRNA遺伝子関連領域は全生物に高い保存性で存在しているが、それらの中でも微生物の菌種推定に利用される領域は、どの程度詳細なレベルでの推定を行うかによって異なっている。一般に、カビなどの真核生物の場合、18SrRNAは、綱・目レベル、D2rRNA(28SrRNA遺伝子中の配列)やITS(Internal Transcribed Spacer)領域(18Sと26(28)SrRNAの間の配列)は、その下の属・種レベルの分類に有効とされており、予め解析するレベルを決定した上で、適当なrRNA領域のシーケンスを行い、該領域の塩基配列に基づいた相同性検索や系統解析が行われる。 The rRNA gene-related region exists in all living organisms with high conservation, but among these, the region used for estimating the species of microorganisms differs depending on how detailed the estimation is performed. In general, in the case of eukaryotes such as mold, 18SrRNA is a class / eye level, D2rRNA (sequence in 28SrRNA gene) and ITS (Internal Transcribed Spacer) region (sequence between 18S and 26 (28) SrRNA) It is effective for classification under the genus / species level. After determining the level to be analyzed in advance, the appropriate rRNA region is sequenced, and homology search and phylogenetic analysis based on the base sequence of the region are performed. Done.
また、上記のような、rRNA遺伝子関連領域の配列決定や相同性検索による、細菌や真菌類の菌種推定、及び系統解析を行うためのキットやシステムも市販されている。 In addition, kits and systems for performing bacterial species and fungal species estimation and phylogenetic analysis by sequencing and homology search of rRNA gene-related regions as described above are also commercially available.
上記のような公共のデータベースを用いた相同性検索によって微生物の同定を行う場合、該公共データベースには膨大な数の配列データが登録されており、中には解析精度の低いデータや該配列の由来する生物種が十分に同定されていないものもある。また、微生物以外の配列データを含む膨大なデータに対しても相同性検索が行われるため、必ずしも、精度の高い検索結果が得られない場合があった。 When identifying microorganisms by homology search using a public database as described above, an enormous number of sequence data is registered in the public database, including data with low analysis accuracy and Some species are not well-identified. In addition, since homology search is also performed on a large amount of data including sequence data other than microorganisms, a search result with high accuracy may not always be obtained.
そのため、相同性検索の結果得られた各配列データについて、一つ一つデータベースに登録されたデータの信憑性を確認した上で、微生物の分類表などを基に近縁の微生物のデータを収集して系統樹の作成を行う必要があり、非常に手間が掛かっていた。また、しばしば既存の分類体系と矛盾した系統樹が作成され、菌種の判断が困難となることがあった。 Therefore, for each sequence data obtained as a result of homology search, after confirming the authenticity of the data registered in the database one by one, collect the data of closely related microorganisms based on the microorganism classification table etc. Therefore, it was necessary to create a phylogenetic tree, which was very time-consuming. In addition, a phylogenetic tree that often contradicts the existing classification system was created, and it was difficult to determine the bacterial species.
更に、真核生物の菌種推定を行う場合には、予め形態学的特徴などの他の因子を基に綱・目などを絞り込んでおき、相同性検索の結果などから系統樹を作成して菌種の判断を行うため、手間が掛かる上に作業者による差が大きくなるという問題があった。 Furthermore, when estimating the species of eukaryotes, narrow down the classes and eyes based on other factors such as morphological characteristics in advance, and create a phylogenetic tree from the results of homology search. In order to determine the bacterial species, there is a problem that it takes time and increases the difference between workers.
また、上記のような現在市販されている微生物菌種推定システムでは、解析対象とする配列データが短く、十分な解析精度を得られない場合があった。 Moreover, in the microbial strain estimation systems currently on the market as described above, the sequence data to be analyzed is short, and sufficient analysis accuracy may not be obtained.
更に、ITS領域やD2rRNAによる相同性比較のみでは、全ての菌種を特定できるレベルでなく、対象となる配列が短いために精度の点で問題があるため、しばしば系統的に矛盾のある系統樹が作成されるという問題がある。また、18SrRNA、D2rRNA、ITS領域についてそれぞれ配列解析を行い、既存のデータベースを用いて相同性検索を行った場合、各領域と相同性の高い配列として、それぞれ異なる菌種に由来する配列データが得られることが多く、菌種推定の判断が困難となっていた。 Furthermore, homologies with ITS regions and D2 rRNA alone are not at a level that can identify all bacterial species, but are problematic in terms of accuracy because the target sequences are short, so there are often systematic contradictory phylogenetic trees. There is a problem that is created. In addition, when sequence analysis was performed for each of the 18SrRNA, D2rRNA, and ITS regions, and homology searches were performed using existing databases, sequence data derived from different bacterial species were obtained as sequences with high homology to each region. In many cases, it was difficult to determine the estimation of the bacterial species.
そこで、本発明が解決しようとする課題は、高精度な菌種推定を簡便に行うことができる菌種推定システム、及び菌種推定方法を提供することである。 Therefore, the problem to be solved by the present invention is to provide a bacterial species estimation system and a bacterial species estimation method capable of easily performing highly accurate bacterial species estimation.
上記課題を解決するために成された本発明に係る微生物の菌種推定システムは、被検菌由来の塩基配列と既知微生物由来の塩基配列との間に見られる相同性から、該被検菌の菌種を推定する菌種推定システムであって、
a)既知微生物の保存性の高い遺伝子について、少なくともその塩基配列及び由来生物種名を含む配列データを記載した配列データベースと、
b)被検菌の保存性の高い遺伝子の塩基配列と、上記配列データベースに記載された塩基配列とを比較し、該配列データベースの中から被検菌の塩基配列と相同性の高い配列データを検索する相同性検索手段と、
を備えることを特徴とする。
The microorganism species estimation system according to the present invention, which has been made to solve the above problems, is based on the homology observed between a base sequence derived from a test microorganism and a base sequence derived from a known microorganism. A bacterial species estimation system for estimating the bacterial species of
a) a sequence database describing sequence data including at least the base sequence and the name of the species of origin for a highly conserved gene of a known microorganism;
b) Compare the base sequence of the highly conserved gene of the test bacterium with the base sequence described in the sequence database, and use the sequence database to obtain sequence data highly homologous to the base sequence of the test bacterium. A homology search means for searching;
It is characterized by providing.
なお、上記保存性の高い遺伝子としては、上述のような16S,18S,5S, 5.8S,23S,25S, 26S,28SリボソーマルRNA遺伝子、ゲノム上のリボソーマルRNA遺伝子の間に存在するスペーサ領域(ITS領域又はIGS領域)等のリボソーマルRNA遺伝子関連領域、及びミトコンドリアDNA、gryB遺伝子、キチン合成酵素(CHS)遺伝子、チトクロームb遺伝子、recA遺伝子、elongation factor 1A遺伝子、 tubulin遺伝子、rpoB遺伝子、pks遺伝子、actin遺伝子、fus遺伝子の中から選ばれる1又は2種類以上の遺伝子を用いることが望ましい。 The highly conserved genes include the 16S, 18S, 5S, 5.8S, 23S, 25S, 26S, 28S ribosomal RNA genes as described above, and the spacer region (ITS Ribosomal RNA gene related regions such as mitochondrial DNA, gryB gene, chitin synthase (CHS) gene, cytochrome b gene, recA gene, elongation factor 1A gene, tubulin gene, rpoB gene, pks gene, actin It is desirable to use one or more genes selected from genes and fus genes.
また、本発明の微生物菌種推定システムは、更に、
c)既知微生物の種名及びその分類情報を記載した分類データベース、
を備え、上記配列データベースに記載された配列データと、該分類データベースに記載された分類情報とが互いに関連づけられているものとすることが望ましい。
Moreover, the microbial strain estimation system of the present invention further includes:
c) a classification database describing species names of known microorganisms and their classification information;
It is desirable that the sequence data described in the sequence database and the classification information described in the classification database are associated with each other.
また、本発明の微生物菌種推定システムは、更に、
d)上記分類データベースに記載された分類情報の中から任意の分類群を指定する分類群指定手段と、
e)該分類群指定手段で指定された分類群に属する菌種由来の配列データを上記配列データベースから抽出してサブデータベースを作成するサブデータベース作成手段と、
f)該サブデータベースを対象に、被検菌由来の保存性の高い遺伝子の塩基配列との相同性検索を行うサブデータベース検索手段と、
を備えるものとすることが望ましい。
Moreover, the microbial strain estimation system of the present invention further includes:
d) a classification group designating means for designating an arbitrary classification group from the classification information described in the classification database;
e) Sub-database creation means for creating a sub-database by extracting sequence data derived from bacterial species belonging to the taxon belonging to the taxon designated by the taxon designation group from the sequence database;
f) Sub-database search means for performing a homology search with a base sequence of a highly conserved gene derived from a test bacterium for the sub-database,
It is desirable to provide.
ここで、上記分類群指定手段は、上記相同性検索手段における検索によって被検菌と相同性が高いとされた分類群が自動的に指定されるものであってもよく、上記相同性検索手段による相同性検索の結果等を参考に、操作者が所定の入力手段を用いて適当な分類群を指定するものとしてもよい。これにより、例えば、上記相同性検索手段による相同性検索結果を基にサブデータベースを作成し、該サブデータベースを対象として再び相同性検索を行って菌種の絞り込みを行うことにより、精度の高い菌種推定を行うことが可能となる。 Here, the classification group designating means may be one in which a classification group having high homology with the test bacteria is automatically designated by the search in the homology retrieval means, and the homology retrieval means The operator may designate an appropriate classification group by using a predetermined input means with reference to the result of the homology search by the above. Thus, for example, by creating a sub-database based on the homology search result by the homology search means, and performing a homology search again on the sub-database to narrow down the bacterial species, a highly accurate bacterium It is possible to perform seed estimation.
上記のようなサブデータベース検索手段等を備えた菌種推定システムの場合、上記相同性検索手段においては、被検菌の保存性の高い遺伝子の塩基配列として、18SリボソーマルRNA遺伝子の塩基配列を使用し、上記サブデータベース検索手段においては、被検菌由来の保存性の高い遺伝子の塩基配列としてITS領域又はIGS(InterGenic Spacer)領域の塩基配列を使用することがより望ましい。 In the case of a strain estimation system equipped with a sub-database search means as described above, the homology search means uses the base sequence of the 18S ribosomal RNA gene as the base sequence of the highly conserved gene of the test bacterium. In the sub-database search means, it is more preferable to use the base sequence of the ITS region or IGS (InterGenic Spacer) region as the base sequence of the highly conserved gene derived from the test bacteria.
これにより、18SリボソーマルRNA遺伝子を用いた相同性検索の結果に基づいてサブデータベースを作成し、これに対して18SリボソーマルRNA遺伝子よりも多様性の頻度が比較的高いITS領域やIGS領域の塩基配列を用いた相同性検索を行うことで菌種を絞り込むことができ、より詳細な菌種推定が可能となる。 This creates a sub-database based on the results of homology searches using the 18S ribosomal RNA gene, while the base sequences of the ITS and IGS regions have a relatively high frequency of diversity compared to the 18S ribosomal RNA gene. By performing a homology search using, it is possible to narrow down the bacterial species, and more detailed bacterial species estimation is possible.
また更に、本発明の微生物菌種推定システムは、上記サブデータベースに記載された塩基配列に基づいて系統樹を作成する系統樹作成手段を備えたものとしてもよく、この場合、該系統樹作成手段が、被検菌由来の塩基配列を含む系統樹と被検菌由来の塩基配列を含まない系統樹とを作成できるものとすることがより望ましい。 Furthermore, the microbial strain estimation system of the present invention may include a phylogenetic tree creating means for creating a phylogenetic tree based on the base sequences described in the sub-database. In this case, the phylogenetic tree creating means However, it is more preferable that a phylogenetic tree containing a base sequence derived from the test bacterium and a phylogenetic tree not containing the base sequence derived from the test bacterium can be created.
上記のような菌種推定システムを用いた本発明の菌種推定方法は、被検菌由来の塩基配列と既知微生物由来の塩基配列との間に見られる相同性から、該被検菌の菌種を推定する菌種推定方法であって、
a)既知微生物の保存性の高い遺伝子の塩基配列を記載した配列データベースに対して、被検菌の保存性の高い遺伝子の塩基配列を用いた相同性検索を行って、該被検菌の属する大まかな分類群を推定するステップと、
b)既知微生物の種名及びその分類情報を記載した分類データベースの中から上記相同性検索によって推定された分類群を指定して、該分類群に関する配列データを前記配列データベースから抽出した検索用サブデータベースを作成するステップと、
c)同一被検菌に由来する上記とは異なる保存性の高い遺伝子の塩基配列を用いて、前記検索用サブデータベースを対象とした相同性検索を行って菌種の絞り込みを行うステップと、
を有することを特徴とする。
The bacterial species estimation method of the present invention using the bacterial species estimation system as described above is based on the homology observed between a base sequence derived from a test microorganism and a base sequence derived from a known microorganism. A method for estimating a species, which estimates a species,
a) A homology search using the base sequence of the highly conserved gene of the test bacterium is performed on the sequence database describing the base sequence of the highly conserved gene of the known microorganism, and the test bacterium belongs to Estimating a rough taxon; and
b) A subgroup for search in which the taxonomic group estimated by the homology search is specified from the taxonomic database describing the species name of the known microorganism and its taxonomic information, and the sequence data relating to the taxonomic group is extracted from the sequence database. Creating a database;
c) using a base sequence of a highly conserved gene different from the above derived from the same test bacterium, performing a homology search on the search sub-database to narrow down the bacterial species;
It is characterized by having.
上記のような本発明の菌種推定方法においては、被検菌として真核生物を使用し、該被検菌の18SリボソーマルRNA遺伝子の塩基配列を用いて上記配列データベースに対する相同性検索を行い、該被検菌のITS領域又はIGS領域の塩基配列を用いて上記検索用サブデータベースに対する相同性検索を行うことが望ましい。 In the bacterial species estimation method of the present invention as described above, using a eukaryote as a test bacterium, using the base sequence of the 18S ribosomal RNA gene of the test bacterium, homology search for the sequence database, It is desirable to perform a homology search with respect to the search sub-database using the base sequence of the ITS region or IGS region of the test bacteria.
また、本発明の菌種推定方法は、更に、
d)上記検索用サブデータベースを対象とした相同性検索の結果に基づき、上記分類データベースの中から適当な分類群を指定して、該分類群に関する配列データを上記配列データベースから抽出した系統樹作成用サブデータベースを作成するステップと、
e)前記系統樹作成用サブデータベースに記載された塩基配列を用いて被検菌の塩基配列を含む系統樹と被検菌の塩基配列を含まない系統樹を作成し、両者の間に矛盾がないかどうかを確認するステップ、
を有するものとすることが望ましい。
In addition, the method for estimating the bacterial species of the present invention further comprises:
d) Creation of a phylogenetic tree in which appropriate taxonomic groups are designated from the taxonomy database based on the result of homology search for the search subdatabase, and sequence data relating to the taxonomic group is extracted from the sequence database Creating a subdatabase for
e) Create a phylogenetic tree containing the base sequence of the test bacterium and a phylogenetic tree not containing the base sequence of the test bacterium using the base sequences described in the sub-database for creating the phylogenetic tree, and there is a contradiction between the two. Step to check if there is,
It is desirable to have.
本発明の菌種推定システムによれば、微生物の保存性の高い遺伝子の配列データを記載したデータベースと各微生物の分類上の関係について記載したデータベースを利用して相同性検索を行うことで、より精度の高い菌種推定が行えるようになると共に、分類表などの必要なデータを収集する手間を省くことができ、より簡便に被検菌の系統的な位置を解析することができるようになる。また、従来の市販の菌種推定システムよりも長い配列を用いて解析を行うことができるため、相同性検索の精度を向上することができる。 According to the bacterial strain estimation system of the present invention, by performing a homology search using a database describing the sequence data of genes having high conservation of microorganisms and a database describing the classification relationship of each microorganism, Highly accurate bacterial species estimation can be performed, and the trouble of collecting necessary data such as a classification table can be saved, and the systematic location of the test bacteria can be analyzed more easily. . Moreover, since analysis can be performed using a sequence longer than that of a conventional commercially available strain estimation system, the accuracy of homology search can be improved.
以下、実施例を用いて本発明の微生物菌種推定システム及び該システムを用いた菌種推定方法について説明する。 Hereinafter, the microbial species estimation system of the present invention and the microbial species estimation method using the system will be described using examples.
[実施例1]
本実施例の微生物菌種推定システムの概略構成を図2に示す。本実施例の微生物菌種推定システムは、配列データベース11a及び分類データベース11dを記憶した記憶部11と、相同性検索や系統樹作成等を実行する制御部12から成り、該制御部12にはキーボードやマウスなどの入力部13と、モニタなどの出力部14が接続されている。
[Example 1]
A schematic configuration of the microbial strain estimation system of the present embodiment is shown in FIG. The microbial strain estimation system of the present embodiment includes a
上記配列データベース11aは、微生物由来の16S,18S,5S, 5.8S,23S,25S, 26S,28SリボソーマルRNA遺伝子、ゲノム上のリボソーマルRNA遺伝子の間に存在するスペーサ領域(ITS領域及びIGS領域)等のリボソーマルRNA遺伝子関連領域の塩基配列、及び該配列に関連する情報(該配列が由来する菌種名や、該配列の生物学的特徴、遺伝子の機能など)を含む配列データを記載したものであり、細菌由来の配列データを記載した細菌データベース11bと、真菌由来の配列データを記載した真菌データベース11cから成る。 The sequence database 11a includes 16S, 18S, 5S, 5.8S, 23S, 25S, 26S, 28S ribosomal RNA genes derived from microorganisms, spacer regions (ITS regions and IGS regions) existing between ribosomal RNA genes on the genome, and the like. Describes the sequence data including the nucleotide sequence of the ribosomal RNA gene-related region and information related to the sequence (such as the name of the species from which the sequence is derived, the biological characteristics of the sequence, the function of the gene, etc.) Yes, it consists of a bacteria database 11b describing sequence data derived from bacteria and a fungus database 11c describing sequence data derived from fungi.
このような配列データベース11aは、例えば、上述のような公共データベースから、細菌及び真菌に由来するリボソーマルRNA遺伝子関連領域に関する情報を抽出することによって作成することができる。なお、本発明の配列データベース11aを作成する際には、塩基配列の解読精度の低いデータや、配列の由来する生物種が十分に特定できないものを除外し、有効性の高いデータのみでデータベースを構成するようにする。 Such a sequence database 11a can be created, for example, by extracting information on a ribosomal RNA gene-related region derived from bacteria and fungi from the public database as described above. When creating the sequence database 11a of the present invention, exclude data with low base sequence deciphering accuracy or data for which the species from which the sequence is derived cannot be specified sufficiently, and use only highly effective data to create the database. Make it up.
また、上記分類データベース11dは、配列データベース11aに記載されている各配列データが由来する菌種名と、各菌種の分類情報が記載されたものであり、例えば、上記配列データベース11aと同様に、公共のデータベース(例えば、Unified Taxonomy Database)から、細菌及び真菌に関する情報を抽出することなどによって作成することができる。上記配列データベース11aに記載された配列データと該分類データベース11dに記載された分類情報とは互いに関連づけられており、配列データベース11aにおいて特定の配列データを選択することで該配列が由来する菌種の分類情報を分類データベース11dから読み出すことができると共に、分類データベース11dに記載された微生物の分類情報の中から特定の分類群を選択することで、該分類群に属する菌種のリボソーマルRNA遺伝子関連領域の配列データを配列データベース11aから抽出することができる。 In addition, the classification database 11d is a database in which the name of the bacterial species from which each sequence data described in the sequence database 11a is derived and the classification information of each bacterial species are described. For example, the classification database 11d is similar to the sequence database 11a. It can be created by extracting information about bacteria and fungi from a public database (for example, Unified Taxonomy Database). The sequence data described in the sequence database 11a and the classification information described in the classification database 11d are associated with each other. By selecting specific sequence data in the sequence database 11a, the species of the strain from which the sequence is derived can be selected. The classification information can be read from the classification database 11d, and a specific classification group is selected from the classification information of the microorganisms described in the classification database 11d, whereby the ribosomal RNA gene-related region of the bacterial species belonging to the classification group Can be extracted from the sequence database 11a.
上記制御部12は、相同性検索部12a、分類群指定部12b、サブデータベース作成部12c、系統樹作成部12dを備えている。相同性検索部12aは上記配列データベース11a又は後述のサブデータベース11eに記載された塩基配列と被検菌由来の塩基配列とを比較することで、該被検菌の配列と相同性の高い配列を検索するためのものであり、例えば、BLASTやFASTAなどの既存の解析プログラムや、これらを改良したプログラム、あるいはこれらのアルゴリズムに相当するアルゴリズムを用いたプログラムなどを利用することができる。
The control unit 12 includes a
分類群指定部12bは上記分類データベース11dに記載された分類情報の中から任意の分類群を指定するものであり、上記相同性検索部12aによる相同性検索の結果、被検菌と相同性が高かった配列、例えば相同性スコアが250以上、もしくは連続してマッチした配列が100塩基対以上でかつ同一性(Identity)が90%以上程度の相同性、より望ましくは相同性スコアが300以上、もしくは連続してマッチした配列が150塩基対以上でかつIdentityが95%以上程度の相同性を有する配列、が由来する菌種の属する分類群、あるいは、操作者が入力部13を用いて指定した分類群を、後述のサブデータベース作成の対象として指定するものである。サブデータベース作成部12cは、上記分類群指定部12bで指定された分類群に属する菌種由来の配列データを上記配列データベース11aから抽出して検索用サブデータベース11e、又は系統樹用サブデータベース11fを作成するものである。
The classification
系統樹作成部12dは、上記系統樹用サブデータベース11fに記載された複数の配列データを用いてマルチプルアライメント(多重整列)処理を行い、その結果に基づいて系統樹を作成するものであり、例えばCLUSTAL Wなどの既存の解析プログラムや、これらを改良したプログラム、あるいはこれらのアルゴリズムに相当するアルゴリズムを用いたプログラムなどを利用することができる。なお、該系統樹作成部12dは、被検菌を含む系統樹と含まない系統樹とを作成するものとし、両者の枝の長さから解析結果に矛盾がないかどうかを確かめることができるようにする。 The phylogenetic tree creation unit 12d performs multiple alignment (multiple alignment) processing using a plurality of sequence data described in the phylogenetic tree sub-database 11f, and creates a phylogenetic tree based on the result. Existing analysis programs such as CLUSTAL W, improved programs thereof, or programs using algorithms corresponding to these algorithms can be used. The phylogenetic tree creation unit 12d creates a phylogenetic tree that includes the test bacteria and a phylogenetic tree that does not include the test bacteria, and can confirm whether there is a contradiction in the analysis results from the lengths of the branches of both. To.
続いて、本実施例の菌種推定システムを用いた菌種推定の方法について説明する。図1は、本実施例の菌種推定方法の手順を示すフローチャートである。ここでは一例として、真菌を対象とし、18SrRNA遺伝子の塩基配列とスペーサ領域(ITS又はIGS)の塩基配列を用いて菌種推定を行う方法について説明する。図15に示すように、ITS領域やIGS領域はゲノム上のrRNA遺伝子間に存在しており、配列相同性の高い18SrRNAなどのrRNA遺伝子に比べて多様性の頻度が高いといわれている。従って、このようなITS領域やIGS領域を利用することにより、変種間や株レベルでの推定等の詳細な菌種推定を行うことが可能となる。 Next, a method for estimating the bacterial species using the bacterial species estimation system of the present embodiment will be described. FIG. 1 is a flowchart showing the procedure of the method for estimating the bacterial species of this embodiment. Here, as an example, a method will be described in which fungus is the target and the bacterial species is estimated using the base sequence of the 18S rRNA gene and the base sequence of the spacer region (ITS or IGS). As shown in FIG. 15, the ITS region and the IGS region exist between rRNA genes on the genome, and it is said that the frequency of diversity is higher than that of rRNA genes such as 18S rRNA having high sequence homology. Therefore, by using such an ITS region or IGS region, it is possible to perform detailed bacterial species estimation such as estimation between variants or at the strain level.
まず、予め菌種を特定したい微生物(被検菌)の18SrRNA遺伝子及びITS領域のシーケンスを行い、これらの領域の塩基配列を取得しておく。このとき、できるだけ広い範囲の配列決定を行うことが望ましく、18SrRNAは1800塩基程度、ITS領域は250-800塩基程度とすることが望ましい。 First, the 18S rRNA gene and the ITS region of a microorganism (test bacteria) whose bacterial species are to be specified are sequenced in advance, and the base sequences of these regions are obtained. At this time, it is desirable to perform sequencing in as wide a range as possible, 18SrRNA is preferably about 1800 bases, and ITS region is preferably about 250-800 bases.
操作者によって本実施例の菌種推定システムが起動されると、図3のような相同性検索設定画面30が表示される。問い合わせ名入力欄31及び、問い合わせ配列入力欄32にはそれぞれ適当な名称と、上記によって取得された被検菌の18SrRNA配列を入力する。データベース選択欄33は、相同性検索を行うデータベースとして、上記細菌データベース11b又は真菌データベース11cのいずれかを選択するものであり、ここでは真菌データベース11cを選択する。検索パラメータ設定欄34は、Expect(期待値),WordSize(文字列の長さ),Number of hits(表示するデータの数)等の、相同性検索に関するパラメータを設定するものである。問い合わせ配列の入力及び検索パラメータの設定(S1)が完了したら操作者がOKボタン35をクリックすることにより、配列データベース11a(ここではそのうちの真菌データベース11c)に対する相同性検索が実行される(S2)。
When the operator starts the bacterial species estimation system of the present embodiment, a homology
相同性検索が完了すると、図4のようなサブデータベース選択画面40が表示される。該サブデータベース選択画面40は、検索結果を表示する検索結果欄42と、該相同性検索の結果を基に、次に検索を行うサブデータベースの選択を行うためのサブデータベース選択欄41から成る。検索結果欄42は問い合わせ配列と相同性の高かった配列をリスト表示するリスト表示欄43と、問い合わせ配列と上記リスト表示された配列とのアライメントを表示するアライメント表示欄44から成る。リスト表示欄43には、各配列データのアクセッションナンバー(登録番号)、Definition(配列の名称やその他の情報)、相同性の高さを示すスコア、及び検索の統計的な有意性を示すE-Valueが表示される。 When the homology search is completed, a sub-database selection screen 40 as shown in FIG. 4 is displayed. The sub database selection screen 40 includes a search result column 42 for displaying a search result, and a sub database selection column 41 for selecting a sub database to be searched next based on the result of the homology search. The search result column 42 includes a list display column 43 that displays a list of sequences having high homology with the query sequence, and an alignment display column 44 that displays the alignment between the query sequence and the listed sequence. The list display field 43 includes an accession number (registration number), definition (sequence name and other information) of each sequence data, a score indicating the degree of homology, and an E indicating the statistical significance of the search. -Value is displayed.
サブデータベース選択欄41は「科」選択欄41a、「属」選択欄41b、及び選択済みデータ表示欄41cから成る。「科」選択欄41aは、分類データベース11dに記載されている微生物(ここでは真菌)の科名の一覧から、後述の「属」選択欄41bに表示させるものを選択するものであり、デフォルトでは上記相同性検索の結果で最も相同性スコアの高かった配列データの由来菌種が属する科が指定されている。該「科」選択欄41aで適当な科名を選択すると、その科に含まれる属名の一覧が「属」選択欄41bに表示される。該「属」選択欄41bに表示された中から適当な属名をクリックして選択ボタン41dを押すと選択した属名が選択済みデータ表示欄41cに表示される。また選択済みデータ表示欄41cに表示されたデータ名をクリックして選択解除ボタン41eを押すことで該データを選択済みデータ表示欄41cから削除することもできる。このような属の選択(S3)が完了したら、OKボタン45を押すことによって、選択された属に含まれる菌種の配列データが配列データベース11a(ここでは真菌データベース11c)から抽出されて検索用サブデータベース11eが作成される(S4)。
The sub-database selection field 41 includes a “family” selection field 41a, a “genus”
続いて、図5のようなサブデータベース検索設定画面50が表示されるので、上記被検菌のITS領域の配列データを問い合わせ配列として入力し、検索パラメータの設定を行う(S5)。OKボタン54をクリックすると上記で作成された検索用サブデータベース11eに対して相同性検索が実行される(S6)。 Subsequently, since the sub-database search setting screen 50 as shown in FIG. 5 is displayed, the sequence data of the ITS region of the test bacteria is input as a query sequence, and the search parameters are set (S5). When the OK button 54 is clicked, a homology search is performed on the search sub-database 11e created above (S6).
このように、本実施例に係る菌種推定方法では、始めに18SrRNA遺伝子の塩基配列を用いて大まかな菌種の推定を行い、その結果を基に作成した検索用サブデータベースに対して、更に、ITS領域の塩基配列を用いた相同性検索を行うことで菌種の絞り込みを行う。なお、菌種の絞り込みには上記ITS領域のほか、IGS領域の塩基配列を使用してもよい。 Thus, in the bacterial species estimation method according to the present example, first, a rough bacterial species is estimated using the base sequence of the 18S rRNA gene, and further on the search sub-database created based on the result, Species are narrowed down by homology search using the base sequence of the ITS region. For narrowing down the bacterial species, the base sequence of the IGS region in addition to the ITS region may be used.
検索用サブデータベース11eに対する相同性検索が完了すると、図6のようなマルチプルアライメント設定画面60が表示される。該マルチプルアライメント設定画面60は、上記サブデータベース設定画面40と同様に、相同性検索の結果を示す検索結果表示欄62、及びサブデータベース選択欄61から成る。ここで、サブデータベース設定欄61は、マルチプルアライメントに使用するデータを選択するためのものであり、検索結果表示欄62に表示された相同性検索の結果に基づいて、適当な属を選択する(S7)ことにより、その属に含まれるデータをマルチプルアライメントに使用することができる。また、リスト表示欄63の各配列の前に設けられたチェックボックス63aをチェックすることで、相同性検索でヒットした配列をマルチプルアライメントの対象に加えることもできる。設定ボタン65を押すとマルチプルアライメントに使用するデータを選別する際の閾値を設定するためのウィンド(図示略)が表示される。該ウィンドで被検菌配列との相同性スコア又は同一性(Identity)の閾値を設定し、チェックボックス67でマルチプルアライメントに問い合わせ配列(被検菌の配列)を使用するか否かを選択(S8)したうえで、OKボタン66を押せば、「属」選択欄61bで選択された属に含まれるデータ、及び上記リスト表示欄63で検索結果の中から選択されたデータが配列データベース11aから抽出されて系統樹用サブデータベース11fが作成され(S9)、その中から上記閾値以上のデータが選別されてマルチプルアライメント処理が実行される(S10)。このとき、「問い合わせ配列を使用する」のチェックボックス67がチェックされていた場合には、被検菌のデータを含んだマルチプルアライメントが実行され、チェックボックス67がチェックされていなかった場合には、被検菌のデータを含まないマルチプルアライメントが実行される。
When the homology search for the search sub-database 11e is completed, a multiple alignment setting screen 60 as shown in FIG. 6 is displayed. Similar to the sub-database setting screen 40, the multiple alignment setting screen 60 includes a search result display column 62 and a
マルチプルアライメントが完了すると、図7のようなマルチプルアライメント結果表示画面70が表示され、保存ボタン71を押すことでマルチプルアライメントに使用した配列データのファイルとアライメント結果ファイルが作成されて保存される。また、入力部13で所定の操作を行うことにより、該マルチプルアライメントの結果に基づく系統樹を表示させることができ、問い合わせ配列を含む系統樹と含まない系統樹の2種類を作成しておくことで、両者を比較して系統的に矛盾がないことを確認することができる(S11)。
When the multiple alignment is completed, a multiple alignment
[実施例2]
本発明の微生物菌種推定システムの有効性を示すため、菌種未知の微生物に対し18SrDNAとITS領域の塩基配列に基づく相同性検索、及び系統樹作成を行った。
[Example 2]
In order to demonstrate the effectiveness of the microbial strain estimation system of the present invention, homology search based on the 18S rDNA and the base sequence of the ITS region and phylogenetic tree creation were carried out for microorganisms of unknown bacterial species.
カビと考えられるサンプルよりDNAを定法により抽出し、18SrDNAとITS領域を増幅するためのPCRテンプレートとした。PCRは、プライマーとして図8に示すE21f、Ef4(18SrRNA)、ITS1、ITS4(ITS)を使用し、EX Taq(Takara)を用いて行った。アガロースゲル電気泳動により、それぞれ目的の産物を確認した後、それぞれのプライマーとFung5を用いてシーケンスを行った。シーケンス反応はBigDye Terminator Ver 3.1を使用して行い、ABI3730を用いて泳動した。 DNA was extracted from a sample considered to be mold by a conventional method and used as a PCR template for amplifying 18S rDNA and the ITS region. PCR was performed using EX Taq (Takara) using E21f, Ef4 (18SrRNA), ITS1, and ITS4 (ITS) shown in FIG. 8 as primers. Each target product was confirmed by agarose gel electrophoresis, and then sequenced using each primer and Fung5. The sequencing reaction was performed using BigDye Terminator Ver 3.1, and electrophoresis was performed using ABI3730.
まず、18SrDNAのPCR産物の3本のシーケンスのアライメントを行い、全長の配列を決定した(図9)。このような配列について、BLASTによる相同性検索を行い、図10のような検索結果を得た。検索結果上位のNeocosmospora vasinfectaについて、分類上の位置を確認すると、
Lineage (full): root; cellular organisms; Eukaryota; Fungi/Metazoa group; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; class" Hypocreomycetidae; Hypocreales; Nectriaceae; Nectria
となっており、ここでは、Nectriaよりも細かい分類については、推定することができなかった。
First, three sequences of 18S rDNA PCR products were aligned to determine the full-length sequence (FIG. 9). A homology search by BLAST was performed for such a sequence, and a search result as shown in FIG. 10 was obtained. For the top search result Neocosmospora vasinfecta, confirming the position on the classification,
Lineage (full): root; cellular organisms; Eukaryota; Fungi / Metazoa group; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; class "Hypocreomycetidae;Hypocreales;Nectriaceae; Nectria
Here, we could not estimate the finer classification than Nectria.
次に、ITS1とITS4によって決定されたシーケンスデータ(図11)から、BLAST検索を行った(図12)。検索結果上位のFusarium solaniについて、分類上の位置を確認すると、
Lineage (full): root; cellular organisms; Eukaryota; Fungi/Metazoa group; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; Nectriaceae; Nectria; Nectria haematococca; mitosporic Nectria haematococca; Fusarium solani complex
となっており、これによって上記のNectriaよりも細かい分類群を知ることができた。
Next, a BLAST search was performed from the sequence data determined by ITS1 and ITS4 (FIG. 11) (FIG. 12). About Fusarium solani, the top search result, confirm the position on the classification,
Lineage (full): root; cellular organisms; Eukaryota; Fungi / Metazoa group; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; Nectriaceae; Nectria; Nectria haematococca; mitosporic Nectria haematococca;
As a result, we were able to know the taxon that was finer than the above Nectria.
上記18SrDNAとITS領域のシーケンスデータを用いた相同性検索の結果に基づき、それぞれ被検菌のデータを含む系統樹と、被検菌のデータを含まない系統樹の作成を行った(図13、14)。ITSシーケンスデータを用いたBLAST検索の上位に属する配列データを収集して系統樹作成を行った結果、Nectria haematococcaが最も近い菌種と推定された(図14a)。これはBLAST検索の結果とは異なるものであった。検体のシーケンスデータを含まずに系統解析を行い、検体を含んだものと比較すると、両者の間に相違が見られ(図14の矢印で示した箇所)、このことから、Fusarium solaniやNectria haemtococcaのそれぞれの菌種における系統的な関係は、完全に分離されているわけではなく、分子レベルでの分類がまだ整理できていないことが確認できた。 Based on the results of the homology search using the sequence data of the 18S rDNA and the ITS region, a phylogenetic tree containing the test bacteria data and a phylogenetic tree not containing the test bacteria data were prepared (FIG. 13, 14). As a result of collecting phylogenetic trees by collecting sequence data belonging to the top of the BLAST search using ITS sequence data, it was estimated that Nectria haematococca was the closest species (FIG. 14a). This was different from the BLAST search results. When the phylogenetic analysis is performed without including the sequence data of the specimen and compared with the specimen containing the specimen, there is a difference between the two (indicated by the arrow in FIG. 14). From this, Fusarium solani and Nectria haemtococca It was confirmed that the systematic relationship in each of the fungal species was not completely separated and the classification at the molecular level was not yet organized.
18SrDNAの相同性検索の結果と、サブデータベースとITSシーケンスデータを利用した系統樹の結果から、本検体は、Fusarium solaniやNectria haematococcaに近縁であると推定された。従来であれば、Nectria属という大きな分類群か、ITSでのBLAST結果上位であるFusarium solaniを検体の属する菌種と推定していた。しかしながら、この指標を用いた解析では、Fusarium solaniやNectria haematococcaの2菌種のいずれかであると推定することになり、より詳細な結果を得ることができた。このことから、18SrDNAを用いて被検菌の大まかな分類を推定し、更にITS情報に基づいて結果の絞り込みを行う本発明の菌種推定方法の有用性が確かめられた。 From the results of 18SrDNA homology search and the results of phylogenetic trees using sub-databases and ITS sequence data, this sample was presumed to be closely related to Fusarium solani and Nectria haematococca. Conventionally, it was estimated that Fusarium solani, which is a large taxon of the genus Nectria, or the BLAST result of ITS, is the bacterial species to which the specimen belongs. However, in the analysis using this index, it was estimated that it was one of two species of Fusarium solani or Nectria haematococca, and more detailed results could be obtained. From this, the usefulness of the method for estimating the bacterial species of the present invention in which the rough classification of the test bacteria was estimated using 18SrDNA and the results were further narrowed down based on ITS information was confirmed.
11…記憶部
11a…配列データベース
11b…細菌データベース
11c…真菌データベース
11d…分類データベース
11e…検索用サブデータベース
11f…系統樹用サブデータベース
12…制御部
12a…相同性検索部
12b…分類群指定部
12c…サブデータベース作成部
12d…系統樹作成部
13…入力部
14…出力部
30…相同性検索設定画面
40…サブデータベース選択画面
50…サブデータベース検索設定画面
60…マルチプルアライメント設定画面
70…マルチプルアライメント結果表示画面
DESCRIPTION OF
Claims (10)
a)既知微生物の保存性の高い遺伝子について、少なくともその塩基配列及び由来生物種名を含む配列データを記載した配列データベースと、
b)被検菌の保存性の高い遺伝子の塩基配列と、上記配列データベースに記載された塩基配列とを比較し、該配列データベースの中から被検菌の塩基配列と相同性の高い配列データを検索する相同性検索手段と、
を備えることを特徴とする菌種推定システム。 From the homology found between a base sequence derived from a test bacterium and a base sequence derived from a known microorganism, a strain estimation system for estimating the strain of the test bacterium,
a) a sequence database describing sequence data including at least the base sequence and the name of the species of origin for a highly conserved gene of a known microorganism;
b) Compare the base sequence of the highly conserved gene of the test bacterium with the base sequence described in the sequence database, and use the sequence database to obtain sequence data highly homologous to the base sequence of the test bacterium. A homology search means for searching;
A fungus species estimation system comprising:
c)既知微生物の種名及びその分類情報を記載した分類データベース、
を備え、上記配列データベースに記載された配列データと、該分類データベースに記載された分類情報とが互いに関連づけられていることを特徴とする請求項1又は2に記載の菌種推定システム。 Furthermore,
c) a classification database describing species names of known microorganisms and their classification information;
The bacterial strain estimation system according to claim 1 or 2, wherein the sequence data described in the sequence database and the classification information described in the classification database are associated with each other.
d)上記分類データベースに記載された分類情報の中から任意の分類群を指定する分類群指定手段と、
e)該分類群指定手段で指定された分類群に属する菌種由来の配列データを上記配列データベースから抽出してサブデータベースを作成するサブデータベース作成手段と、
f)該サブデータベースを対象に、被検菌由来の保存性の高い遺伝子の塩基配列との相同性検索を行うサブデータベース検索手段と、
を備えることを特徴とする請求項1〜3のいずれかに記載の菌種推定システム。 Furthermore,
d) a classification group designating means for designating an arbitrary classification group from the classification information described in the classification database;
e) Sub-database creation means for creating a sub-database by extracting sequence data derived from bacterial species belonging to the taxon belonging to the taxon designated by the taxon designation group from the sequence database;
f) Sub-database search means for performing a homology search with a base sequence of a highly conserved gene derived from a test bacterium for the sub-database,
The fungus species estimation system according to any one of claims 1 to 3, further comprising:
上記サブデータベース検索手段が、被検菌由来の保存性の高い遺伝子の塩基配列としてITS領域又はIGS領域の塩基配列を用いるものであることを特徴とする請求項4に記載の菌種推定システム。 The homology search means uses the base sequence of the 18S ribosomal RNA gene as the base sequence of the highly conserved gene of the test bacterium,
The bacterial species estimation system according to claim 4, wherein the sub-database search means uses a base sequence of an ITS region or an IGS region as a base sequence of a highly conserved gene derived from a test bacterium.
g)上記サブデータベースに記載された塩基配列に基づいて系統樹を作成する系統樹作成手段、
を備えることを特徴とする請求項4又は5に記載の菌種推定システム。 Furthermore,
g) Phylogenetic tree creation means for creating a phylogenetic tree based on the base sequences described in the sub-database,
The fungus species estimation system according to claim 4 or 5, characterized by comprising:
a)既知微生物の保存性の高い遺伝子の塩基配列を記載した配列データベースに対して、被検菌の保存性の高い遺伝子の塩基配列を用いた相同性検索を行って、該被検菌の属する大まかな分類群を推定するステップと、
b)既知微生物の種名及びその分類情報を記載した分類データベースの中から上記相同性検索によって推定された分類群を指定して、該分類群に関する配列データを前記配列データベースから抽出した検索用サブデータベースを作成するステップと、
c)同一被検菌に由来する上記とは異なる保存性の高い遺伝子の塩基配列を用いて、前記検索用サブデータベースを対象とした相同性検索を行って菌種の絞り込みを行うステップと、
を有することを特徴とする菌種推定方法。 From the homology found between a base sequence derived from a test bacterium and a base sequence derived from a known microorganism, a microbial species estimation method for estimating the microbial species of the test bacterium,
a) A homology search using the base sequence of the highly conserved gene of the test bacterium is performed on the sequence database describing the base sequence of the highly conserved gene of the known microorganism, and the test bacterium belongs to Estimating a rough taxon; and
b) A subgroup for search in which the taxonomic group estimated by the homology search is specified from the taxonomic database describing the species name of the known microorganism and its taxonomic information, and the sequence data relating to the taxonomic group is extracted from the sequence database. Creating a database;
c) using a base sequence of a highly conserved gene different from the above derived from the same test bacterium, performing a homology search on the search sub-database to narrow down the bacterial species;
A bacterial species estimation method characterized by comprising:
d)上記検索用サブデータベースを対象とした相同性検索の結果に基づき、上記分類データベースの中から適当な分類群を指定して、該分類群に関する配列データを上記配列データベースから抽出した系統樹作成用サブデータベースを作成するステップと、
e)前記系統樹作成用サブデータベースに記載された塩基配列を用いて被検菌の塩基配列を含む系統樹と被検菌の塩基配列を含まない系統樹を作成し、両者の間に矛盾がないかどうかを確認するステップと、
を有することを特徴とする請求項8又は9に記載の菌種推定方法。
Furthermore,
d) Creation of a phylogenetic tree in which appropriate taxonomic groups are designated from the taxonomy database based on the result of homology search for the search subdatabase, and sequence data relating to the taxonomic group is extracted from the sequence database Creating a subdatabase for
e) Create a phylogenetic tree containing the base sequence of the test bacterium and a phylogenetic tree not containing the base sequence of the test bacterium using the base sequences described in the sub-database for creating the phylogenetic tree, and there is a contradiction between the two. Step to check if there is,
The method according to claim 8 or 9, wherein
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005216546A JP5565991B2 (en) | 2004-12-15 | 2005-07-26 | Microbe species estimation system and method |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004363504 | 2004-12-15 | ||
JP2004363504 | 2004-12-15 | ||
JP2005216546A JP5565991B2 (en) | 2004-12-15 | 2005-07-26 | Microbe species estimation system and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006191922A true JP2006191922A (en) | 2006-07-27 |
JP5565991B2 JP5565991B2 (en) | 2014-08-06 |
Family
ID=36798455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005216546A Expired - Fee Related JP5565991B2 (en) | 2004-12-15 | 2005-07-26 | Microbe species estimation system and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5565991B2 (en) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010204753A (en) * | 2009-02-27 | 2010-09-16 | Hitachi Software Eng Co Ltd | Species identification method and system |
WO2013058280A1 (en) | 2011-10-18 | 2013-04-25 | 株式会社島津製作所 | Cell identification device and program |
JP2016525355A (en) * | 2013-07-21 | 2016-08-25 | フール・バイオーム,インコーポレーテッド | Methods and systems for microbiome characterization, monitoring, and treatment |
EP3712619A1 (en) | 2019-03-22 | 2020-09-23 | Shimadzu Corporation | Microorganism identification method |
CN113151513A (en) * | 2020-08-25 | 2021-07-23 | 西北农林科技大学 | Method for mining anti-heavy metal function of microorganism based on conservative sequence cluster analysis |
US11085928B2 (en) | 2016-03-31 | 2021-08-10 | Shimadzu Corporation | Microorganism identification method |
US11137406B2 (en) | 2016-03-31 | 2021-10-05 | Shimadzu Corporation | Method for discriminating microorganism |
US11561228B2 (en) | 2016-03-31 | 2023-01-24 | Shimadzu Corporation | Method for discriminating a microorganism |
US11747344B2 (en) | 2016-03-31 | 2023-09-05 | Shimadzu Corporation | Microorganism identification method |
WO2024043830A1 (en) * | 2022-08-26 | 2024-02-29 | Denka Life Innovation Research Pte. Ltd. | Methods for the detection and identification of fungal species |
US11931387B2 (en) | 2014-10-31 | 2024-03-19 | Pendulum Therapeutics, Inc. | Methods and compositions relating to microbial treatment and diagnosis of disorders |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11781103B2 (en) | 2017-11-10 | 2023-10-10 | Yokogawa Electric Corporation | Microorganism contamination countermeasure selection device, microorganism contamination countermeasure selection system, microorganism contamination countermeasure selection method, and non-transitory computer readable storage medium |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11341989A (en) * | 1998-03-31 | 1999-12-14 | Sanyo Electric Co Ltd | Dna fragment amplification, dna fragment amplifier, microorganism group measurement, microorganism group analysis and pollutant measurement |
JP2002000271A (en) * | 2000-06-28 | 2002-01-08 | Sanyo Electric Co Ltd | System, method, and database for analyzing microorganism |
JP2002205902A (en) * | 2001-01-09 | 2002-07-23 | Kurita Water Ind Ltd | Method for performing antibacterial treatment and method for monitoring anti-bacterial effect |
WO2003091389A2 (en) * | 2002-04-25 | 2003-11-06 | Nederlandse Organisatie Voor Toegepast- Natuurwetenschappelijk Onderzoek Tno | Microbiological information system |
JP2004348532A (en) * | 2003-05-23 | 2004-12-09 | Kigyo Kumiai Bioinformatics | Method and system for providing biological data |
-
2005
- 2005-07-26 JP JP2005216546A patent/JP5565991B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11341989A (en) * | 1998-03-31 | 1999-12-14 | Sanyo Electric Co Ltd | Dna fragment amplification, dna fragment amplifier, microorganism group measurement, microorganism group analysis and pollutant measurement |
JP2002000271A (en) * | 2000-06-28 | 2002-01-08 | Sanyo Electric Co Ltd | System, method, and database for analyzing microorganism |
JP2002205902A (en) * | 2001-01-09 | 2002-07-23 | Kurita Water Ind Ltd | Method for performing antibacterial treatment and method for monitoring anti-bacterial effect |
WO2003091389A2 (en) * | 2002-04-25 | 2003-11-06 | Nederlandse Organisatie Voor Toegepast- Natuurwetenschappelijk Onderzoek Tno | Microbiological information system |
JP2004348532A (en) * | 2003-05-23 | 2004-12-09 | Kigyo Kumiai Bioinformatics | Method and system for providing biological data |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010204753A (en) * | 2009-02-27 | 2010-09-16 | Hitachi Software Eng Co Ltd | Species identification method and system |
WO2013058280A1 (en) | 2011-10-18 | 2013-04-25 | 株式会社島津製作所 | Cell identification device and program |
US10385379B2 (en) | 2011-10-18 | 2019-08-20 | Shimadzu Corporation | Cell identification device and program |
US10550418B2 (en) | 2011-10-18 | 2020-02-04 | Shimadzu Corporation | Cell identification device and program |
JP2016525355A (en) * | 2013-07-21 | 2016-08-25 | フール・バイオーム,インコーポレーテッド | Methods and systems for microbiome characterization, monitoring, and treatment |
US10633714B2 (en) | 2013-07-21 | 2020-04-28 | Pendulum Therapeutics, Inc. | Methods and systems for microbiome characterization, monitoring and treatment |
US11931387B2 (en) | 2014-10-31 | 2024-03-19 | Pendulum Therapeutics, Inc. | Methods and compositions relating to microbial treatment and diagnosis of disorders |
US11137406B2 (en) | 2016-03-31 | 2021-10-05 | Shimadzu Corporation | Method for discriminating microorganism |
US11085928B2 (en) | 2016-03-31 | 2021-08-10 | Shimadzu Corporation | Microorganism identification method |
US11561228B2 (en) | 2016-03-31 | 2023-01-24 | Shimadzu Corporation | Method for discriminating a microorganism |
US11747344B2 (en) | 2016-03-31 | 2023-09-05 | Shimadzu Corporation | Microorganism identification method |
US11150249B2 (en) | 2019-03-22 | 2021-10-19 | Shimadzu Corporation | Microorganism identification method |
EP3712619A1 (en) | 2019-03-22 | 2020-09-23 | Shimadzu Corporation | Microorganism identification method |
CN113151513A (en) * | 2020-08-25 | 2021-07-23 | 西北农林科技大学 | Method for mining anti-heavy metal function of microorganism based on conservative sequence cluster analysis |
WO2024043830A1 (en) * | 2022-08-26 | 2024-02-29 | Denka Life Innovation Research Pte. Ltd. | Methods for the detection and identification of fungal species |
Also Published As
Publication number | Publication date |
---|---|
JP5565991B2 (en) | 2014-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5565991B2 (en) | Microbe species estimation system and method | |
Mello et al. | ITS-1 versus ITS-2 pyrosequencing: a comparison of fungal populations in truffle grounds | |
LeBlanc et al. | Soil fungal communities respond to grassland plant community richness and soil edaphics | |
Griffiths et al. | The bacterial biogeography of British soils | |
Van Geel et al. | Evaluation of six primer pairs targeting the nuclear rRNA operon for characterization of arbuscular mycorrhizal fungal (AMF) communities using 454 pyrosequencing | |
O’Donnell et al. | DNA sequence-based identification of Fusarium: current status and future directions | |
Gómez‐Rodríguez et al. | Validating the power of mitochondrial metagenomics for community ecology and phylogenetics of complex assemblages | |
Taylor et al. | Internal transcribed spacer primers and sequences for improved characterization of basidiomycetous orchid mycorrhizas | |
König et al. | TaqMan real-time PCR assays to assess arbuscular mycorrhizal responses to field manipulation of grassland biodiversity: effects of soil characteristics, plant species richness, and functional traits | |
Barge et al. | Differentiating spatial from environmental effects on foliar fungal communities of Populus trichocarpa | |
Porter et al. | Fruiting body and soil rDNA sampling detects complementary assemblage of Agaricomycotina (Basidiomycota, Fungi) in a hemlock‐dominated forest plot in southern Ontario | |
Matute et al. | Microsatellite analysis of three phylogenetic species of Paracoccidioides brasiliensis | |
Miller et al. | Metabarcoding of fungal communities associated with bark beetles | |
Zhao et al. | The scale dependence of fungal community distribution in paddy soil driven by stochastic and deterministic processes | |
Lankau et al. | Ectomycorrhizal fungal richness declines towards the host species’ range edge | |
Quinn et al. | Genome-wide sequencing of Phytophthora lateralis reveals genetic variation among isolates from Lawson cypress (Chamaecyparis lawsoniana) in Northern Ireland | |
Tan et al. | A brief overview of the size and composition of the myrtle rust genome and its taxonomic status | |
Küster et al. | Development of bioinformatic tools to support EST-sequencing, in silico-and microarray-based transcriptome profiling in mycorrhizal symbioses | |
Sun et al. | Different distribution patterns between putative ercoid mycorrhizal and other fungal assemblages in roots of Rhododendron decorum in the Southwest of China | |
Taylor et al. | A bioinformatics pipeline for sequence-based analyses of fungal biodiversity | |
Yamamoto et al. | Clustering of fungal community internal transcribed spacer sequence data obscures taxonomic diversity | |
Martin‐Sanchez et al. | Analysing indoor mycobiomes through a large‐scale citizen science study in Norway | |
Altinok et al. | Characterization of Fusarium oxysporum f. sp. melongenae isolates from Turkey with ISSR markers and DNA sequence analyses | |
Botnen et al. | Biogeography of plant root‐associated fungal communities in the North Atlantic region mirrors climatic variability | |
Gous et al. | Floral hosts of leaf-cutter bees (Megachilidae) in a biodiversity hotspot revealed by pollen DNA metabarcoding of historic specimens |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110318 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110404 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140617 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5565991 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |