CN104039982A - 一种分析微生物群落组成的方法和装置 - Google Patents
一种分析微生物群落组成的方法和装置 Download PDFInfo
- Publication number
- CN104039982A CN104039982A CN201280064063.2A CN201280064063A CN104039982A CN 104039982 A CN104039982 A CN 104039982A CN 201280064063 A CN201280064063 A CN 201280064063A CN 104039982 A CN104039982 A CN 104039982A
- Authority
- CN
- China
- Prior art keywords
- stack
- sequencing
- fragment
- module
- reference set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
Claims (10)
- 利 要 求1. 一种用于分析环境样品中的微生物群落组成的方法, 其包括以 下步骤:1 )测序:对来自环境样品的基因组 DNA进行构建文库和测序,从而获得由测 序片段池构成的宏基因组测序数据;2 )初级组装:2a )构建或完善参考集:对测序片段进行组装以得到组装片段, 然后去冗余, 从而构建非冗余的参考集; 或者, 可在所获得的组装片段 上预测基因, 并将预测出来的基因的集合作为参考集; 或者, 如果针对 所述环境样品, 存在已知的参考集, 那么直接将它作为参考集, 或者将 该已知的参考集与如上所述构建的参考集组合并去冗余,从而获得最终 的参考集;2b )构建元素相对丰度讲矩阵: 将所述测序片段与参考集进行 比对, 并计算参考集中的各个元素在样品中的相对丰度;3 )分栈, 即, 通过下述步骤确定参考集中的每一个元素所归属的 栈, 得到聚类的栈:3a )基于丰度的分栈: 基于元素在样品中的相对丰度, 使用聚 类算法, 例如自底向上的层次聚类方法, 确定各个元素的初始栈; 和3b )基于模型的分栈:(i) 将每一个初始栈作为一个独立的多元正态分布模型, 并基于丰度矩阵, 利用最大似然函数法计算所述模型的参数;(ϋ) 构建一个软矩阵, 用于存储每一个元素归属某一个 栈的概率; 和(i i i) 迭代运算 E步和 M步, 直至似然函数达到最大化: E步, 根据每一个栈的模型参数, 分别计算每一个元素属于某一个 栈的后验概率, 并且修改软矩阵中所述元素属于所述栈的概率;M步: 根据软矩阵, 用最大似然函数法计算每一个栈的模型参数;4 )基于栈的高级组装: 4a )通过将测序片段与已分栈的元素进行比对, 从宏基因组测 序数据中寻找对应到之前确定的各个栈的测序片段;4b )使用 SOAPdenovo或者使用其他针对微生物测序数据的组 装软件, 将对应到各个栈的测序片段分别进行组装;4c )使用基于相似度的聚类方法和 /或基于组成特征的聚类方 法, 对每一个栈所包含的元素的分栈进行校正; 任选地, 还在已获得的 栈内部进行再次聚类, 然后根据聚类的结果, 对已获得的栈进行拆分或 保持不变;4d )重复步骤 4a ) - 4c ) , 直到各个栈的基因组序列的大小无 明显变化为止(总长度增长率小于 5% ) ;5 )鉴定:利用各个栈的基因组序列, 确定各个栈所对应的微生物的类别, 从 而确定所述环境样品中的微生物群落组成。
- 2. 权利要求 1的方法, 其中,例如, 所述环境样品来源于自然环境, 例如土壤环境, 海洋环境和 河流环境; 或者所述环境样品来源于体内环境, 例如口腔环境和肠道环 境;例如,在步骤 1 )中使用第二代测序技术(例如, 454测序法, Solexa 测序法, SOLiD测序法或单分子测序法)或第三代测序技术对环境样品 所包含的微生物群落的宏基因组进行测序,从而提供来自环境样品的宏 基因组测序数据;例如, 在步骤 1 ) 中通过下列步骤来获得宏基因组测序数据:la )提供环境样品;lb )从所述环境样品中提取宏基因组 DNA;lc )利用所述宏基因组 DNA构 基因组文库;Id )对所述宏基因组文库进行测序, 优选使用 Solexa测序法 进行测序, 从而提供所述环境样品的宏基因组测序数据;例如, 所述测序片段是末端配对的测序片段; 例如, 在进行步骤 2 )之前, 对测序数据进行预处理, 即, 去除接 头序列、 测序质量低的序列和 /或宿主基因组序列;例如, 对来自相同或相似环境的多个样品进行测序, 并将所有样品 的测序数据组合在一起, 构成宏基因组测序数据;例如, 宏基因组的测序深度为至少 10 x, 优选至少 20 χ, 优选至 少 30 X, 优选至少 40 , 更优选至少 50 。
- 3. 权利要求 1或 2的方法, 其中, 在步骤 2 ) 中例如, 使用 Soapdenovo将所述测序片段组装成组装片段(例如, 连接片段和 /或拼接片段)例如, 将来自多个样品的参考集组合在一起, 并去冗余, 从而构建 最终的非冗余的参考集;例如, 使用 S0AP2或 MAQ比对软件, 将所述测序片段与参考集进行 比对;例如, 使用 S0AP2将测序片段与参考集进行比对, 并按照下列公式 计算出参考集中的各元素的相对丰度:其中元素 i在样品中的相对丰度;∑': 元素 i的长度;Xi: 元素 i在样品中被检测到的次数。
- 4. 权利要求 1-3任一项的方法, 其中,例如, 在步骤 3 ) 中, 通过下列步骤来确定元素的初始栈: 首先, 基于元素在样品中的相对丰度, 计算两两元素之间的相关性, 例如 pearson相关系数, spearman相关系数, kendal l相关系数, 欧几里得 距离, 曼哈顿距离等; 然后, 根据两两元素之间的相关性, 通过聚类算 法, 如自底向上层次聚类等, 将相关性密切的元素聚到一个类中, 从而 确定各个元素的初始栈;例如, 在步骤 4 ) 中, 使用 S0AP2来将测序片段与已分栈的元素进 行比对;例如, 在步骤 4 ) 中, 使用 GC- depth spectra class if ier和 /或 tetranucleotide frequencies (TNFs) classif ier进行校正。
- 5. 权利要求 1-4任一项的方法, 其中, 在步骤 5 ) 中,例如, 通过将各个栈的基因组序列与已知的基因组数据库进行比 对, 从而确定各个栈所对应的微生物的类别;例如, 所述基因组数据库选自下列: NCBI/IMG已测序细菌库, NCBI 的 NR库;例如, 所述比对是核酸水平和 /或蛋白水平的比对。
- 6. 一种用于分析环境样品中的微生物群落组成的装置, 其包括以 下模块:1 )测序模块, 其用于对来自环境样品的宏基因组 DNA进行测序, 提供由测序片段池构成的宏基因组测序数据;2 )初级组装模块, 其与测序模块相连, 且包括彼此相连的下列模 块:2a )组装构建模块, 其用于对测序片段进行组装以得到组装片 段, 然后去冗余, 从而构建非冗余的参考集; 任选地, 所述组装构建模 块还可在所获得的组装片段上预测基因,并将预测出来的基因的集合作 为参考集; 和2b )比对计算模块, 其用于将测序片段与参考集进行比对, 并 计算参考集中的各个元素在样品中的相对丰度;3 )分栈模块, 其与初级组装模块相连, 用于确定参考集中的每一 个元素所归属的栈, 得到聚类的栈, 且包括彼此相连的下列模块:3a )丰度分栈模块, 其基于丰度确定各个元素的初始栈; 和 3b )模型分栈模块, 其基于模型确定各个元素所归属的栈; 4 ) 高级组装模块, 其与测序模块和分栈模块相连, 其用于从宏基 因组测序数据中寻找对应到各个栈的测序片段,并将对应到各个栈的测 序片段分别进行组装, 且对组装结果进行^ £及调整; 和5 )鉴定模块, 其与高级组装模块相连, 用于通过各个栈的基因组 序列, 确定各个栈所对应的微生物的类别, 从而确定所述环境样品中的 微生物群落组成。
- 7. 权利要求 6的装置, 其中,例如, 所述环境样品来源于自然环境, 例如土壤环境, 海洋环境和 河流环境; 或者, 所述环境样品来源于体内环境, 例如口腔环境和肠道 环境;例如,所述测序模块使用第二代测序技术(例如 454测序法, Solexa 测序法, SOLiD测序法或单分子测序法)或第三代测序技术对环境样品 所包含的微生物群落的宏基因组进行测序,从而提供来自环境样品的宏 基因组测序数据;例如, 所述装置还包括彼此相连的 DNA提取模块和文库构建模块, 其中, 所述 DNA提取模块用于从所述环境样品中提取宏基因组 DNA, 并 且, 所述文库构建模块与测序模块相连, 且利用所述宏基因组 DNA构建 基因组文库;例如, 所述测序模块所获得的测序片段是末端配对的测序片段; 例如, 所述装置还包含过滤模块, 其与测序模块和初级组装模块相 连, 用于在进行初级组装之前, 去除测序片段中的接头序列、 测序质量 低的序列和 /或宿主基因组序列;例如,所述测序模块对宏基因组的测序深度为至少 10 X,优选至少20 X, 优选至少 30 X, 优选至少 40 X, 更优选至少 50 χ。
- 8. 权利要求 6或 7的装置, 其中,例如, 所述组装构建模块使用 Soapdenovo将测序片段组装成连接 片段和 /或拼接片段; 例如, 所述组装构建模块还包含接收亚模块, 其用于接收已知的参 考集; 优选地, 所述组装构建模块将所接收的已知参考集作为最终的参 考集,或者将所接收的已知参考集与利用测序片段构建的参考集组合并 去冗余, 从而提供最终的参考集;例如, 所述组装构建模块能够将来自多个样品的参考集组合在一 起, 并去冗余, 从而构建最终的非冗余的参考集;例如, 所述比对计算模块通过使用 S0AP2或 MAQ, 将测序片段与参 考集进行比对;例如,所述比对计算模块使用 S0AP2将测序片段与参考集进行比对, 并按照下列公式计算出参考集中各元素的相对丰度:其中元素 i在样品中的相对丰度;∑': 元素 i的长度;Xi: 元素 i在样品中被检测到的次数。
- 9. 权利要求 6-8任一项的装置, 其中,例如, 所述丰度分栈模块基于元素在样品中的相对丰度, 计算两两 元素之间的相关性, 然后通过聚类算法, 确定各个元素的初始栈;例如, 所述模型分栈模块通过下列来确定元素所归属的栈:(i) 将每一个初始栈作为一个独立的多元正态分布模型,并基 于丰度矩阵, 利用最大似然函数法计算所述模型的参数;(ϋ) 构建一个软矩阵, 用于存储每一个元素归属某一个栈的 概率; 和(i i i) 迭代运算 E步和 M步, 直至似然函数达到最大化:E步, 根据每一个栈的模型参数, 分别计算每一个元素属于某一个 栈的后验概率, 并且修改软矩阵中所述元素属于所述栈的概率;M步: 根据软矩阵, 用最大似然函数法计算每一个栈的模型参数; 例如, 所述高级组装模块通过下列来实现其功能:( a )通过将测序片段与已分栈的元素进行比对, 从宏基因组 测序数据中寻找对应到分栈模块所确定的各个栈的测序片段;( b )使用 SOAPdenovo或者使用其他针对微生物数据的组装软 件, 将对应到各个栈的测序片段分别进行组装;( c )使用基于相似度的聚类方法和 /或基于组成特征的聚类方 法, 对每一个栈所包含的元素的分栈进行校正; 任选地, 还在已获得的 栈内部进行再次聚类, 然后才艮据聚类的结果, 对已获得的栈进行拆分或 保持不变;( d )重复步骤(a ) - (c ) , 直到各个栈的基因组序列的大小 没有明显变化为止(总长度增长率小于 5% ) ;例如, 所述高级组装模块使用 S0AP2来将测序片段与已分栈的元素 进行比对;例如, 所述高级组装模块使用 GC- depth spectra class if ier和 / tetranucleotide frequencies (TNFs) class if ier进行校正; 例如, 所述鉴定模块通过将各个栈的基因组序列与已知的基因组数 据库进行比对, 从而确定各个栈所对应的微生物的类别; 优选地, 所述 基因组数据库选自 NCBI/IMG已测序细菌库和 /或 NCBI的 NR库;优选地, 所述鉴定模块在核酸水平和 /或蛋白水平上进行比对。
- 10. 权利要求 6-9任一项的装置用于分析环境样品中的微生物群落 组成的用途, 其中,例如, 所述环境样品来源于自然环境, 例如土壤环境, 海洋环境和 河流环境; 或者, 所述环境样品来源于体内环境, 例如口腔环境和肠道 环境。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2012/079492 WO2014019164A1 (zh) | 2012-08-01 | 2012-08-01 | 一种分析微生物群落组成的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104039982A true CN104039982A (zh) | 2014-09-10 |
CN104039982B CN104039982B (zh) | 2015-09-09 |
Family
ID=50027091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280064063.2A Active CN104039982B (zh) | 2012-08-01 | 2012-08-01 | 一种分析微生物群落组成的方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20150242565A1 (zh) |
CN (1) | CN104039982B (zh) |
HK (1) | HK1196642A1 (zh) |
WO (1) | WO2014019164A1 (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016119190A1 (en) * | 2015-01-30 | 2016-08-04 | Bgi Shenzhen | Biomarkers for colorectal cancer related diseases |
WO2017156739A1 (zh) * | 2016-03-17 | 2017-09-21 | 上海锐翌生物科技有限公司 | 分离的核酸及应用 |
CN107287332A (zh) * | 2017-08-03 | 2017-10-24 | 华子昂 | 利用smrt测序技术进行液体酵素菌种鉴定的方法 |
CN110349629A (zh) * | 2019-06-20 | 2019-10-18 | 广州赛哲生物科技股份有限公司 | 一种利用宏基因组或宏转录组检测微生物的分析方法 |
CN111261231A (zh) * | 2019-12-03 | 2020-06-09 | 康美华大基因技术有限公司 | 肠道菌群宏基因组数据库构建方法、分析方法及装置 |
CN111455021A (zh) * | 2019-01-18 | 2020-07-28 | 广州微远基因科技有限公司 | 去除宏基因组中宿主dna的方法及试剂盒 |
CN111477267A (zh) * | 2020-03-06 | 2020-07-31 | 清华大学 | 微生物的多关联网络计算方法、装置、设备及存储介质 |
CN111627500A (zh) * | 2020-04-16 | 2020-09-04 | 中国科学院生态环境研究中心 | 一种基于宏基因组技术识别水体中携带毒性因子病原菌的方法 |
CN112786102A (zh) * | 2021-01-25 | 2021-05-11 | 北京大学 | 一种基于宏基因组学分析精准识别水体中未知微生物群落的方法 |
CN113284560A (zh) * | 2021-04-28 | 2021-08-20 | 广州微远基因科技有限公司 | 病原检测背景微生物判断方法及应用 |
CN113362890A (zh) * | 2021-04-28 | 2021-09-07 | 中国科学院生态环境研究中心 | 一种评价生物滤料降解有机物潜力的方法 |
CN113611359A (zh) * | 2021-08-13 | 2021-11-05 | 江苏先声医学诊断有限公司 | 一种提高宏基因组纳米孔测序数据菌种组装效率的方法 |
WO2022028624A1 (zh) * | 2020-08-07 | 2022-02-10 | 西安中科茵康莱医学检验有限公司 | 通过测序获取微生物物种及相关信息的方法、装置、计算机可读存储介质和电子设备 |
CN114999574A (zh) * | 2022-08-01 | 2022-09-02 | 中山大学 | 一种肠道菌群大数据的并行识别分析方法及系统 |
CN111455021B (zh) * | 2019-01-18 | 2024-06-04 | 广州微远医疗器械有限公司 | 去除宏基因组中宿主dna的方法及试剂盒 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015048595A1 (en) | 2013-09-27 | 2015-04-02 | Jay Shendure | Methods and systems for large scale scaffolding of genome assemblies |
CN105095688A (zh) * | 2014-08-28 | 2015-11-25 | 吉林大学 | 检测人体肠道宏基因组的细菌群落及丰度的方法 |
CN104278091A (zh) * | 2014-09-26 | 2015-01-14 | 上海交通大学 | 以废水处理样品微生物元基因组序列拼接细菌基因组的方法 |
CN105925664A (zh) * | 2016-03-30 | 2016-09-07 | 广州精科生物技术有限公司 | 一种确定核酸序列的方法及系统 |
CN105950707A (zh) * | 2016-03-30 | 2016-09-21 | 广州精科生物技术有限公司 | 一种确定核酸序列的方法及系统 |
US20190318807A1 (en) * | 2016-10-26 | 2019-10-17 | The Joan & Irwin Jacobs Technion-Cornell Institute | Systems and methods for ultra-fast identification and abundance estimates of microorganisms using a kmer-depth based approach and privacy-preserving protocols |
CN106778078B (zh) * | 2016-12-20 | 2019-04-09 | 福建师范大学 | 基于kendall相关系数的DNA序列相似性比对方法 |
US10733214B2 (en) | 2017-03-20 | 2020-08-04 | International Business Machines Corporation | Analyzing metagenomics data |
CN107028606A (zh) * | 2017-04-21 | 2017-08-11 | 上海耐相智能科技有限公司 | 医用智能监测环系统 |
US20200160936A1 (en) * | 2017-06-28 | 2020-05-21 | Icahn School Of Medicine At Mount Sinai | Methods for high-resolution microbiome analysis |
TWI629607B (zh) * | 2017-08-15 | 2018-07-11 | 極諾生技股份有限公司 | 建立腸道菌數據庫的方法和相關檢測系統 |
CN108197434B (zh) * | 2018-01-16 | 2020-04-10 | 深圳市泰康吉音生物科技研发服务有限公司 | 去除宏基因组测序数据中人源基因序列的方法 |
CN109587001B (zh) * | 2018-11-15 | 2020-11-27 | 新华三信息安全技术有限公司 | 一种性能指标异常检测方法及装置 |
WO2020252320A1 (en) * | 2019-06-13 | 2020-12-17 | Icahn School Of Medicine At Mount Sinai | Dna methylation based high resolution characterization of microbiome using nanopore sequencing |
CN110277139B (zh) * | 2019-06-18 | 2023-03-21 | 江苏省产品质量监督检验研究院 | 一种基于互联网的微生物限度检查系统及方法 |
CN111161798B (zh) * | 2019-12-31 | 2024-03-19 | 余珂 | 宏基因组的重组装方法、重组装装置及终端设备 |
CN112071366B (zh) * | 2020-10-13 | 2024-02-27 | 南开大学 | 一种基于二代测序技术的宏基因组数据分析方法 |
WO2022222936A1 (en) * | 2021-04-20 | 2022-10-27 | Hangzhou Matridx Biotechnology Co., Ltd. | Methods, computer-readble media, and systems for filtering noises for dna sequencing data |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102517392A (zh) * | 2011-12-26 | 2012-06-27 | 深圳华大基因研究院 | 基于宏基因组16s高可变区v3的分类方法和装置 |
-
2012
- 2012-08-01 CN CN201280064063.2A patent/CN104039982B/zh active Active
- 2012-08-01 WO PCT/CN2012/079492 patent/WO2014019164A1/zh active Application Filing
- 2012-08-01 US US14/419,060 patent/US20150242565A1/en not_active Abandoned
-
2014
- 2014-10-07 HK HK14109940.6A patent/HK1196642A1/zh unknown
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107208149A (zh) * | 2015-01-30 | 2017-09-26 | 深圳华大基因研究院 | 结直肠癌相关疾病的生物标志物 |
CN107208149B (zh) * | 2015-01-30 | 2021-09-21 | 深圳华大生命科学研究院 | 结直肠癌相关疾病的生物标志物 |
WO2016119190A1 (en) * | 2015-01-30 | 2016-08-04 | Bgi Shenzhen | Biomarkers for colorectal cancer related diseases |
WO2017156739A1 (zh) * | 2016-03-17 | 2017-09-21 | 上海锐翌生物科技有限公司 | 分离的核酸及应用 |
CN109072306A (zh) * | 2016-03-17 | 2018-12-21 | 上海锐翌生物科技有限公司 | 分离的核酸及应用 |
CN107287332A (zh) * | 2017-08-03 | 2017-10-24 | 华子昂 | 利用smrt测序技术进行液体酵素菌种鉴定的方法 |
CN111455021B (zh) * | 2019-01-18 | 2024-06-04 | 广州微远医疗器械有限公司 | 去除宏基因组中宿主dna的方法及试剂盒 |
CN111455021A (zh) * | 2019-01-18 | 2020-07-28 | 广州微远基因科技有限公司 | 去除宏基因组中宿主dna的方法及试剂盒 |
CN110349629A (zh) * | 2019-06-20 | 2019-10-18 | 广州赛哲生物科技股份有限公司 | 一种利用宏基因组或宏转录组检测微生物的分析方法 |
CN111261231A (zh) * | 2019-12-03 | 2020-06-09 | 康美华大基因技术有限公司 | 肠道菌群宏基因组数据库构建方法、分析方法及装置 |
CN111477267B (zh) * | 2020-03-06 | 2022-05-03 | 清华大学 | 微生物的多关联网络计算方法、装置、设备及存储介质 |
CN111477267A (zh) * | 2020-03-06 | 2020-07-31 | 清华大学 | 微生物的多关联网络计算方法、装置、设备及存储介质 |
CN111627500A (zh) * | 2020-04-16 | 2020-09-04 | 中国科学院生态环境研究中心 | 一种基于宏基因组技术识别水体中携带毒性因子病原菌的方法 |
WO2022028624A1 (zh) * | 2020-08-07 | 2022-02-10 | 西安中科茵康莱医学检验有限公司 | 通过测序获取微生物物种及相关信息的方法、装置、计算机可读存储介质和电子设备 |
CN112786102A (zh) * | 2021-01-25 | 2021-05-11 | 北京大学 | 一种基于宏基因组学分析精准识别水体中未知微生物群落的方法 |
CN113362890A (zh) * | 2021-04-28 | 2021-09-07 | 中国科学院生态环境研究中心 | 一种评价生物滤料降解有机物潜力的方法 |
CN113284560A (zh) * | 2021-04-28 | 2021-08-20 | 广州微远基因科技有限公司 | 病原检测背景微生物判断方法及应用 |
CN113362890B (zh) * | 2021-04-28 | 2023-09-08 | 中国科学院生态环境研究中心 | 一种评价生物滤料降解有机物潜力的方法 |
CN113611359A (zh) * | 2021-08-13 | 2021-11-05 | 江苏先声医学诊断有限公司 | 一种提高宏基因组纳米孔测序数据菌种组装效率的方法 |
CN113611359B (zh) * | 2021-08-13 | 2022-08-05 | 江苏先声医学诊断有限公司 | 一种提高宏基因组纳米孔测序数据菌种组装效率的方法 |
CN114999574A (zh) * | 2022-08-01 | 2022-09-02 | 中山大学 | 一种肠道菌群大数据的并行识别分析方法及系统 |
CN114999574B (zh) * | 2022-08-01 | 2022-12-27 | 中山大学 | 一种肠道菌群大数据的并行识别分析方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104039982B (zh) | 2015-09-09 |
WO2014019164A1 (zh) | 2014-02-06 |
HK1196642A1 (zh) | 2014-12-19 |
US20150242565A1 (en) | 2015-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104039982A (zh) | 一种分析微生物群落组成的方法和装置 | |
Prior et al. | Genomic and proteomic evidence supporting the division of the plant pathogen Ralstonia solanacearum into three species | |
Wu et al. | A novel abundance-based algorithm for binning metagenomic sequences using l-tuples | |
Eren et al. | Oligotyping: differentiating between closely related microbial taxa using 16S rRNA gene data | |
Kermarrec et al. | Next‐generation sequencing to inventory taxonomic diversity in eukaryotic communities: a test for freshwater diatoms | |
CN104603283B (zh) | 确定异常状态相关生物标志物的方法及系统 | |
CN106055924B (zh) | 微生物操作分类单元确定和序列辅助分离的方法和系统 | |
EP3701533A1 (en) | Latent representations of phylogeny to predict organism phenotype | |
Preheim et al. | Computational methods for high-throughput comparative analyses of natural microbial communities | |
DK3146070T5 (en) | Sequencing Process | |
CN104540962A (zh) | 糖尿病生物标志物及其应用 | |
Froslev et al. | Algorithm for post-clustering curation of DNA amplicon data yields reliable biodiversity estimates | |
Sengupta et al. | Bacterial community dissimilarity in soils is driven by long‐term land‐use practices | |
Dextro et al. | Trends in free‐access genomic data accelerate advances in cyanobacteria taxonomy | |
CN111161795A (zh) | 肠道微生物测序数据处理方法、装置、存储介质及处理器 | |
Walters et al. | Technology and techniques for microbial ecology via DNA sequencing | |
Skotniczny et al. | Molecular Detection and Identification of Plant-Associated Lactiplantibacillus plantarum | |
CN110819704A (zh) | 用于改善基于扩增子测序的微生物群落分类学解析的方法和系统 | |
Genitsaris et al. | Marine microbial community structure assessed from combined metagenomic analysis and ribosomal amplicon deep-sequencing | |
Paulson | Normalization and differential abundance analysis of metagenomic biomarker-gene surveys | |
Lee et al. | FCMM: A comparative metagenomic approach for functional characterization of multiple metagenome samples | |
Woloszynek et al. | Analysis methods for shotgun metagenomics | |
CN211578386U (zh) | 一种宏基因组分析装置 | |
Wang | Introduction to Computational Metagenomics | |
Debras | Analysis of secondary metabolite biosynthetic gene clusters in lichen metagenomes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1196642 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1196642 Country of ref document: HK |
|
CP01 | Change in the name or title of a patent holder |
Address after: 518083 comprehensive building, Beishan Industrial Zone, Yantian District, Guangdong, Shenzhen Patentee after: BGI SHENZHEN Patentee after: Shenzhen Huada Gene Technology Co., Ltd. Address before: 518083 comprehensive building, Beishan Industrial Zone, Yantian District, Guangdong, Shenzhen Patentee before: BGI SHENZHEN Patentee before: Shenzhen Huada Gene Technology Co., Ltd. |
|
CP01 | Change in the name or title of a patent holder |