JP2018518725A - サンプル中の分類単位内の微生物の量を推定する方法及び装置 - Google Patents
サンプル中の分類単位内の微生物の量を推定する方法及び装置 Download PDFInfo
- Publication number
- JP2018518725A JP2018518725A JP2017547118A JP2017547118A JP2018518725A JP 2018518725 A JP2018518725 A JP 2018518725A JP 2017547118 A JP2017547118 A JP 2017547118A JP 2017547118 A JP2017547118 A JP 2017547118A JP 2018518725 A JP2018518725 A JP 2018518725A
- Authority
- JP
- Japan
- Prior art keywords
- computer
- sample
- microorganisms
- classification
- species
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Databases & Information Systems (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Bioethics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明の実施形態は、メタゲノムサンプル内の特定分類単位(例えば種)の存在量を定量化するための改良された方法に関する。このタスクに利用可能な既存のツールは通常、リードを参照ゲノムのセットへマップするか、又はシーケンス解析を使用して特定の分類レベル(例えば、家系、属、種、亜種、株、亜株など)でリードを分類する。しかしながら、かかるツールは間違った分類単位に属するものとして一部のリードを誤ってマップするか、又は誤分類することが多い。
リード分類法の誤分類率は微生物によって異なり得るので、誤分類を定量化するためのシミュレーションプロセスは、サンプル中に存在すると予想される各微生物に対して、又はゲノムシーケンスのデータベースに存在する各微生物に対して、実行され得る。誤分類率の推定は、問題の微生物についての既知のゲノム(例えばNCBIからダウンロードされる.fastaゲノムシーケンスファイルとして得られる)及びhttp://ab.inf.uni-tuebingen.de/software/metasim/(2015年2月17日にアクセス)から入手可能なMetaSimなどのシーケンシングシミュレータを用いてリードをシミュレートすること、シミュレートされたリードを(例えば、.fastqファイルとして)実際のサンプルへ適用される分類アルゴリズム(例えばKraken)へ供すること、並びにシミュレートされたリードに対する分類アルゴリズムによる誤分類率を計算することにより、決定され得る。代替的に、誤分類率は、既知量の一つ以上の微生物でのシーケンシング実験から計算することもできる。
Claims (18)
- サンプル中に存在する分類単位内の微生物の量を推定するためのコンピュータ実装方法であって、
(a)分類単位内の微生物に対する誤分類率を推定する;
(b)分類単位のリストへ分類されるサンプル中のリードの数の測定結果を受信する;
(c)推定される前記誤分類率を用いて受信される前記測定結果を調節して、サンプル中の各分類単位に属するリードの数を推定する;
(d)推定される前記各分類単位に属するリードの数を用いて、サンプル中に存在する分類単位から微生物の数を推定する
ように構成されるコンピュータプロセッサを提供するステップを有する、方法。 - 前記コンピュータプロセッサがさらに、ゲノム長、分類単位中の微生物のゲノムのGC含量、又はその両方を用いて、分類単位内の微生物の数を推定するように構成される、請求項1に記載のコンピュータ実装方法。
- 誤分類率を推定するように構成される前記コンピュータプロセッサが、
(a‐1)実験的に決定されるリード長及びシーケンシングエラー率とともに分類単位内の微生物のゲノムを用いてリードをシミュレートする、或いは微生物の既知の組成を伴うサンプルからシーケンスリードを受信する;
(a‐2)シミュレートされたリードに対してリード分類アルゴリズムを実行する;
(a‐3)関心のある分類単位のリストへ分類されるシミュレートされたリードのパーセンテージを決定する
ように構成される、請求項1に記載のコンピュータ実装方法。 - 受信される前記測定結果を調節するように構成されるコンピュータプロセッサが、分類単位のリストへ分類されるサンプルからのリードの数及び推定される前記誤分類率により決定される連立一次方程式を解くために線形最小二乗法を適用することにより、受信される前記測定結果を調節するように構成される、請求項1に記載のコンピュータ実装方法。
- 前記サンプルが微生物の複数の種を有し、前記誤分類率が前記サンプル中の種の各々に対して計算される、請求項1に記載のコンピュータ実装方法。
- 前記誤分類率が微生物の複数の種に対するデータを有するデータベース中の種の各々に対して計算される、請求項1に記載のコンピュータ実装方法。
- 受信される前記測定結果が前記データベース中の種の各々について受信され、受信される前記測定結果が前記データベース中の種の各々について調節される、請求項6に記載のコンピュータ実装方法。
- 前記サンプルからシーケンシングデータを受信するステップをさらに有する、請求項1に記載のコンピュータ実装方法。
- 前記誤分類率が関心のある一つ以上の分類ランクから選択される分類単位について推定される、請求項1に記載のコンピュータ実装方法。
- サンプル中に存在する分類単位内の微生物の量を推定するためのコンピュータ実行可能命令を含むコンピュータ可読媒体であって、
(a)分類単位内の微生物に対する誤分類率を推定するためのコンピュータ実行可能命令と、
(b)分類単位のリストへ分類されるサンプル中のリードの数の測定結果を受信するためのコンピュータ実行可能命令と、
(c)推定される前記誤分類率を用いて受信される前記測定結果を調節して、サンプル中の各分類単位に属するリードの数を推定するためのコンピュータ実行可能命令と、(d)推定される前記各分類単位に属するリードの数を用いて、サンプル中に存在する分類単位から微生物の数を推定するためのコンピュータ実行可能命令と
を有する、コンピュータ可読媒体。 - ゲノム長、分類単位中の微生物のゲノムのGC含量、又はその両方を用いて、分類単位内の微生物の数を推定するためのコンピュータ実行可能命令をさらに有する、請求項10に記載のコンピュータ可読媒体。
- 誤分類率を推定するためのコンピュータ実行可能命令が、
(a‐1)実験的に決定されるリード長及びシーケンシングエラー率とともに分類単位内の微生物のゲノムを用いてリードをシミュレートする、又は微生物の既知の組成を伴うサンプルからシーケンスリードを受信するためのコンピュータ実行可能命令と、
(a‐2)シミュレートされたリードに対しリード分類アルゴリズムを実行するためのコンピュータ実行可能命令と、
(a‐3)関心のある分類単位のリストへ分類されるシミュレートされたリードのパーセンテージを決定するためのコンピュータ実行可能命令と
を有する、請求項10に記載のコンピュータ可読媒体。 - 受信される前記測定結果を調節するためのコンピュータ実行可能命令が、分類単位のリストへ分類されるサンプルからのリードの数及び推定される前記誤分類率により決定される連立一次方程式を解くために線形最小二乗法を適用することにより、受信される前記測定結果を調節するためのコンピュータ実行可能命令を有する、請求項10に記載のコンピュータ可読媒体。
- 前記サンプルが微生物の複数の種を有し、前記コンピュータ実行可能命令が前記サンプル中の種の各々に対して前記誤分類率を計算する、請求項10に記載のコンピュータ可読媒体。
- 前記コンピュータ実行可能命令が、微生物の複数の種に対するデータを有するデータベース中の種の各々に対して前記誤分類率を計算する、請求項10に記載のコンピュータ可読媒体。
- 前記コンピュータ実行可能命令が前記データベース中の種の各々についてリードの数の測定結果を受信し、前記コンピュータ実行可能命令が前記データベース中の種の各々について受信される前記測定結果を調節する、請求項15に記載のコンピュータ可読媒体。
- 前記サンプルに対するシーケンシングデータを受信するためのコンピュータ実行可能命令をさらに有する、請求項10に記載のコンピュータ可読媒体。
- 前記誤分類率が関心のある一つ以上の分類ランクから選択される分類単位について推定される、請求項10に記載のコンピュータ可読媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562145026P | 2015-04-09 | 2015-04-09 | |
US62/145,026 | 2015-04-09 | ||
PCT/EP2016/057799 WO2016162504A1 (en) | 2015-04-09 | 2016-04-08 | Method and apparatus for estimating the quantity of microorganisms within a taxonomic unit in a sample |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018518725A true JP2018518725A (ja) | 2018-07-12 |
JP2018518725A5 JP2018518725A5 (ja) | 2019-03-22 |
JP7023711B2 JP7023711B2 (ja) | 2022-02-22 |
Family
ID=55701971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017547118A Active JP7023711B2 (ja) | 2015-04-09 | 2016-04-08 | サンプル中の分類単位内の微生物の量を推定する方法及び装置 |
Country Status (10)
Country | Link |
---|---|
US (1) | US10998083B2 (ja) |
EP (1) | EP3281136A1 (ja) |
JP (1) | JP7023711B2 (ja) |
CN (1) | CN107533587B (ja) |
AU (2) | AU2016245213A1 (ja) |
BR (1) | BR112017021318A2 (ja) |
CA (1) | CA2981913A1 (ja) |
MX (1) | MX2017012758A (ja) |
RU (1) | RU2751241C2 (ja) |
WO (1) | WO2016162504A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200234793A1 (en) * | 2017-03-01 | 2020-07-23 | Bluedot Llc | Systems and methods for metagenomic analysis |
CN110277139B (zh) * | 2019-06-18 | 2023-03-21 | 江苏省产品质量监督检验研究院 | 一种基于互联网的微生物限度检查系统及方法 |
CN113284560B (zh) * | 2021-04-28 | 2022-05-17 | 广州微远基因科技有限公司 | 病原检测背景微生物判断方法及应用 |
CN114334004B (zh) * | 2021-12-04 | 2024-03-15 | 江苏先声医学诊断有限公司 | 一种病原微生物快速比对鉴定方法及其应用 |
CN115841847B (zh) * | 2022-12-12 | 2023-05-12 | 哈尔滨因极科技有限公司 | 一种微生物信息测定及提取系统和方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2390810A2 (en) * | 2010-05-26 | 2011-11-30 | Tata Consultancy Services Limited | Taxonomic classification of metagenomic sequences |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6780602B2 (en) * | 2001-11-01 | 2004-08-24 | Microbiosystems, Limited Partnership | Taxonomic identification of pathogenic microorganisms and their toxic proteins |
RU2517618C2 (ru) * | 2008-07-10 | 2014-05-27 | Такаунт Икзэкт Лтд. | Способ и система для определения количества культивируемых клеток |
KR101347509B1 (ko) * | 2011-06-20 | 2014-01-06 | 가톨릭대학교 산학협력단 | 섬망 고위험군 예측모형 시스템 및 그 예측모형 방법, 및 그것을 이용한 섬망 고위험군 예측 시스템 |
CN108107197B (zh) * | 2011-07-19 | 2020-05-08 | 奥维茨奥成像系统公司 | 用于检测和/或分类细胞样品中的癌细胞的方法和系统 |
US20140249037A1 (en) * | 2013-03-04 | 2014-09-04 | Fry Laboratories, LLC | Method and kit for characterizing microorganisms |
CN104252627A (zh) * | 2013-06-28 | 2014-12-31 | 广州华多网络科技有限公司 | Svm分类器训练样本获取方法、训练方法及其系统 |
CN103627800B (zh) * | 2013-11-14 | 2015-02-25 | 浙江天科高新技术发展有限公司 | 环境微生物快速检测方法 |
-
2016
- 2016-04-08 RU RU2017138867A patent/RU2751241C2/ru active
- 2016-04-08 WO PCT/EP2016/057799 patent/WO2016162504A1/en active Application Filing
- 2016-04-08 CN CN201680020777.1A patent/CN107533587B/zh active Active
- 2016-04-08 JP JP2017547118A patent/JP7023711B2/ja active Active
- 2016-04-08 CA CA2981913A patent/CA2981913A1/en not_active Abandoned
- 2016-04-08 MX MX2017012758A patent/MX2017012758A/es unknown
- 2016-04-08 BR BR112017021318-4A patent/BR112017021318A2/pt not_active Application Discontinuation
- 2016-04-08 US US15/564,216 patent/US10998083B2/en active Active
- 2016-04-08 AU AU2016245213A patent/AU2016245213A1/en not_active Abandoned
- 2016-04-08 EP EP16715525.8A patent/EP3281136A1/en active Pending
-
2021
- 2021-08-06 AU AU2021212155A patent/AU2021212155B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2390810A2 (en) * | 2010-05-26 | 2011-11-30 | Tata Consultancy Services Limited | Taxonomic classification of metagenomic sequences |
Non-Patent Citations (3)
Title |
---|
ADAM L BAZINET 他1名: "A comparative evaluation of sequence classification programs", BMC BIOINFORMATICS, vol. volume 13, Article number: 92, JPN6020015843, 10 May 2012 (2012-05-10), ISSN: 0004281838 * |
DERRICK E WOOD 他1名: "Kraken: ultrafast metagenomic sequence classification using exact alignments", GENOME BIOLOGY, vol. volume 15, Article number: R46, JPN6020015847, 3 March 2014 (2014-03-03), ISSN: 0004519443 * |
ROGAN CARR 他2名: "Reconstructing the Genomic Content of Microbiome Taxa through Shotgun Metagenomic Deconvolution", PLOS COMPUTATIONAL BIOLOGY, vol. 9, JPN6020019409, 17 October 2013 (2013-10-17), pages 1 - 15, ISSN: 0004519444 * |
Also Published As
Publication number | Publication date |
---|---|
CN107533587A (zh) | 2018-01-02 |
JP7023711B2 (ja) | 2022-02-22 |
AU2021212155B2 (en) | 2023-06-29 |
CA2981913A1 (en) | 2016-10-13 |
CN107533587B (zh) | 2021-10-08 |
RU2751241C2 (ru) | 2021-07-12 |
RU2017138867A3 (ja) | 2020-06-26 |
BR112017021318A2 (pt) | 2018-06-26 |
AU2021212155A1 (en) | 2021-08-26 |
MX2017012758A (es) | 2018-01-30 |
AU2016245213A1 (en) | 2017-11-23 |
US20180129777A1 (en) | 2018-05-10 |
US10998083B2 (en) | 2021-05-04 |
WO2016162504A1 (en) | 2016-10-13 |
RU2017138867A (ru) | 2019-05-13 |
EP3281136A1 (en) | 2018-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021212155B2 (en) | Method and apparatus for estimating the quantity of microorganisms within a taxonomic unit in a sample | |
Tierney et al. | The landscape of genetic content in the gut and oral human microbiome | |
Lindgreen et al. | An evaluation of the accuracy and speed of metagenome analysis tools | |
Anyansi et al. | Computational methods for strain-level microbial detection in colony and metagenome sequencing data | |
Whelan et al. | A comprehensive evaluation of the sl1p pipeline for 16S rRNA gene sequencing analysis | |
Lanzén et al. | CREST–classification resources for environmental sequence tags | |
Moran-Gilad et al. | Proficiency testing for bacterial whole genome sequencing: an end-user survey of current capabilities, requirements and priorities | |
Forster et al. | Improving eDNA‐based protist diversity assessments using networks of amplicon sequence variants | |
Sohn et al. | A robust approach for identifying differentially abundant features in metagenomic samples | |
Preheim et al. | Computational methods for high-throughput comparative analyses of natural microbial communities | |
Smirnova et al. | PERFect: PERmutation Filtering test for microbiome data | |
Anyansi et al. | QuantTB–a method to classify mixed Mycobacterium tuberculosis infections within whole genome sequencing data | |
Baker et al. | Whole lung tissue is the preferred sampling method for amplicon-based characterization of murine lung microbiota | |
Yu et al. | A review of bioinformatics platforms for comparative genomics. Recent developments of the EDGAR 2.0 platform and its utility for taxonomic and phylogenetic studies | |
Escalas et al. | A unifying quantitative framework for exploring the multiple facets of microbial biodiversity across diverse scales | |
Sobih et al. | Metaflow: Metagenomic profiling based on whole-genome coverage analysis with min-cost flows | |
Valverde et al. | Analysis of metagenomic data containing high biodiversity levels | |
Tonkin-Hill et al. | Robust analysis of prokaryotic pangenome gene gain and loss rates with Panstripe | |
Dimopoulos et al. | HAYSTAC: A Bayesian framework for robust and rapid species identification in high-throughput sequencing data | |
Ruan et al. | Toward accurate diagnosis and surveillance of bacterial infections using enhanced strain-level metagenomic next-generation sequencing of infected body fluids | |
Holmes et al. | Metabolically similar cohorts of bacteria exhibit strong cooccurrence patterns with diet items and eukaryotic microbes in lizard guts | |
Edgar | SINAPS: Prediction of microbial traits from marker gene sequences | |
US11473133B2 (en) | Methods for validation of microbiome sequence processing and differential abundance analyses via multiple bespoke spike-in mixtures | |
De Wolfe et al. | Multi-factorial examination of amplicon sequencing workflows from sample preparation to bioinformatic analysis | |
Olson et al. | Challenging a bioinformatic tool’s ability to detect microbial contaminants using in silico whole genome sequencing data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190207 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200611 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200817 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210603 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7023711 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |