CN112071366B - 一种基于二代测序技术的宏基因组数据分析方法 - Google Patents
一种基于二代测序技术的宏基因组数据分析方法 Download PDFInfo
- Publication number
- CN112071366B CN112071366B CN202011089931.5A CN202011089931A CN112071366B CN 112071366 B CN112071366 B CN 112071366B CN 202011089931 A CN202011089931 A CN 202011089931A CN 112071366 B CN112071366 B CN 112071366B
- Authority
- CN
- China
- Prior art keywords
- species
- abundance
- annotation
- sequence
- generation sequencing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 48
- 238000005516 engineering process Methods 0.000 title claims abstract description 26
- 238000007405 data analysis Methods 0.000 title claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims abstract description 41
- 238000004458 analytical method Methods 0.000 claims abstract description 38
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 38
- 230000008569 process Effects 0.000 claims abstract description 31
- 238000007619 statistical method Methods 0.000 claims abstract description 12
- 238000003908 quality control method Methods 0.000 claims abstract description 11
- 238000001914 filtration Methods 0.000 claims description 15
- 230000000813 microbial effect Effects 0.000 claims description 10
- 238000011161 development Methods 0.000 claims description 8
- 230000018109 developmental process Effects 0.000 claims description 8
- 238000000585 Mann–Whitney U test Methods 0.000 claims description 6
- 230000033772 system development Effects 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 230000000007 visual effect Effects 0.000 claims description 6
- 238000012800 visualization Methods 0.000 claims description 6
- 102000004169 proteins and genes Human genes 0.000 claims description 4
- 238000009825 accumulation Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 claims description 3
- 230000002068 genetic effect Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000000513 principal component analysis Methods 0.000 claims 1
- 241000894007 species Species 0.000 description 54
- 230000006870 function Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000010230 functional analysis Methods 0.000 description 2
- 230000002906 microbiologic effect Effects 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于二代测序技术的宏基因组数据分析方法,包括以下步骤:1)对原始测序数据进行质量控制,得到clean reads;2)对质量控制后的clean reads进行物种注释;3)基于物种丰度矩阵对样本多样性进行统计分析;4)基于物种丰度矩阵对样本组间差异显著物种进行统计分析;5)对clean reads拼接组装得到contigs序列;6)对拼接组装得到的contigs分箱,得到bins;7)对分箱后的bins进行基因注释;8)基于基因丰度矩阵对样本组间差异显著基因进行统计分析;9)基于基因注释结果,对序列进行功能及物种注释;提供了从宏基因组二代测序数据处理到物种组成分析、基因组成分析与功能注释的全部流程,为研究人员提供准确的分析结果、全面解析宏基因组学问题。
Description
技术领域
本发明一般有关二代测序技术领域,具体为一种基于二代测序技术的宏基因组数据分析方法。
背景技术
1977年,Frederick Sanger和Walter Gilbert发明了第一台测序仪,并应用其测定了第一个基因组序列,噬菌体X174,全长5375个碱基,由此开始,人类获得了探索生命遗传本质的能力,生命科学的研究进入了基因组学的时代。Sanger所发明的测序方法被称为第一代测序技术,该技术直到现在依然被广泛使用,但是其一次只能获得一条长度在700-1000bp的序列,通量太低,导致在很多情况下成本太高,无法满足现代科学发展对生物基因序列获取的迫切需求。高通量测序是对传统Sanger测序的革命性变革,其解决了一代测序技术一次只能测一条序列的限制,一次运行即可同时得到几十万到几百万条核酸分子的序列,因此被称为第二代测序技术。第二代测序技术虽然测序的通量大大增加,但是其获得单条序列长度太短,只有200-500bp,想要得到准确的基因序列信息,依赖于较高的测序覆盖度和准确的拼接技术。
宏基因组是基因组学一个新兴的科学研究方向,宏基因组学的研究对象是整个微生物群落,宏基因组学是研究直接从环境样本中提取的基因组遗传物质的学科。传统的微生物研究依赖于实验室培养,宏基因组学的兴起填补了无法在传统实验室中培养的微生物研究的空白。DNA测序技术的不断进步以及测序通量和分析方法的改进使得人们得以一窥未知的基因组科学领域。此外,微生物通常是以群落方式共生与某一环境中,它们的很多特性是基于整个群落环境及个体间的相互影响的,因此宏基因组学相比于做单个个体的研究更能发现其特性。
由于测序技术原理的有限性,二代测序原始序列通常有较短、可能存在污染等缺点,如何有效处理原始测序数据进而得到完整准确的基因组序列,以及如何将测序数据与生物学原理相联系是生物信息领域的一直关注也一直在尽力解决的问题。随着宏基因组学的发展,越来越多针对微生物测序数据的分析工具层出不穷,但能同时完成物种分析、功能分析以及多样性分析的工具并不多见,因此整合现有的这些工具,完成上述分析模块以及使分析尽量高效准确已经成为迫切需求。
发明内容
本发明的目的在于提供一种基于二代测序技术的宏基因组数据分析方法,以解决上述背景技术中提出的需求。
为实现上述目的,本发明提供如下技术方案:一种基于二代测序技术的宏基因组数据分析方法,包括以下步骤:
1)对原始测序数据进行质量控制,得到clean reads;
2)对经过质量控制的序列clean reads进行物种注释;
3)基于物种丰度矩阵对样本多样性进行统计分析;
4)基于物种丰度矩阵对样本组间差异显著物种进行统计分析;
5)对经过质量控制的clean reads进行拼接组装得到contigs序列;
6)对拼接组装得到的contigs进行分箱,得到bins;
7)对分箱得到的bins进行基因注释;
8)基于基因丰度矩阵对样本组间差异显著基因进行统计分析;
9)基于基因注释的结果,对序列进行功能注释以及物种注释。
优选的,所述步骤1)具体过程如下:
a、根据测序实验信息与碱基质量信息对原始测序数据进行过滤,去除接头序列与低质量碱基序列以及读长太短的测序序列;
b、对上述经过质量过滤的序列,以环境中可能存在的污染源的序列作为参考序列,通过序列比对,对非微生物DNA进行过滤筛除,得到clean reads。
优选的,所述步骤2)具体过程如下:
a、使用基于kmer的参考数据库比对算法进行物种注释并得出物种丰度;
b、对物种丰度进行热图可视化;
c、基于物种丰度矩阵,可视化物种相对丰度柱状图;
d、将物种进化分支树进行可视化。
优选的,所述步骤3)具体过程如下:
a、根据各样本的物种丰度矩阵,对指定分类水平的群落组成结构进行CA主成分分析,并且以二维和三维图像描述样本间的自然分布特征;
b、根据各样本的物种丰度与群落物种的群落发育树,基于Unifrac距离计算样本间的距离矩阵,由加权及非加权距离矩阵分别进行PcoA主坐标分析,并且以二维和三维图像描述样本间基于微生物系统发育关系的群落空间分布特征;
c、根据各样本的物种丰度与群落物种的群落发育树,基于Unifrac距离计算样本间的距离矩阵,由加权及非加权距离矩阵分别进行NMDS主坐标分析,并且以二维和三维图像描述样本间基于微生物系统发育关系的群落空间分布特征。
d、根据各样本的丰度矩阵绘制Specaccum物种累积曲线;
优选的,所述步骤4)具体过程如下:
a、在多组样本间采用非参数因子Kruskal-Wallis秩和检验检测不同分组建丰度差异显著的物种;
b、利用Wilcoxon秩和检验检查对显著差异物种类中的所有亚种比较;
c、使用线性判别分析(LDA)对数据进行降维和评估差异显著的物种并将每个物种的影响程度进行量化,并提供可视化结果。
优选的,所述步骤5)具体过程如下:
a、将clean reads打断成一定长度的kmer;
b、使用基于de Bruiju图的组装算法进行组装得到contigs。
优选的,所述步骤6)具体过程如下:
a、将clean reads比对到组装得到的contigs上,统计contigs的丰度,根据contigs的丰度及其GC含量进行分箱;
b、对上述步骤a分箱结果根据完成度与污染度进行过滤;
c、将上述步骤b的过滤进过进行重组装,得到最终分箱结果bins。
优选的,所述步骤7)具体过程如下:
a、基于动态规划算法对bins进行基因结构预测;
b、计算基因丰度矩阵。
优选的,所述步骤8)具体过程如下:
a、在多组样本间采用非参数因子Kruskal-Wallis秩和检验检测不同分组建丰度差异显著的物种;
b、利用Wilcoxon秩和检验检查对显著差异物种类中的所有亚种比较;
c、使用线性判别分析(LDA)对数据进行降维和评估差异显著的物种并将每个物种的影响程度进行量化,并提供可视化结果。
优选的,所述步骤9)具体过程如下:
a、对上述基因结构预测得到的编码基因序列进行去冗余;
b、将得到的非冗余的编码基因序列与功能蛋白数据库进行比对,对编码基因序列进行功能注释以及物种注释。
c、根据功能注释的结果,统计针对每个功能的丰度,并进行柱状图可视化。
与现有技术相比,本发明的有益效果是:分析流程更加合理、全面,分析结果也更加准确,解决了当前分析工具内容不全面的问题,为研究人员提供便利。
附图说明
图1为本发明流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供一种技术方案:本发明提供如下技术方案:一种基于二代测序技术的宏基因组数据分析方法,包括以下步骤:
1)对原始测序数据进行质量控制,得到clean reads;
2)对经过质量控制的序列clean reads进行物种注释;
3)基于物种丰度矩阵对样本多样性进行统计分析;
4)基于物种丰度矩阵对样本组间差异显著物种进行统计分析;
5)对经过质量控制的clean reads进行拼接组装得到contigs序列;
6)对拼接组装得到的contigs进行分箱,得到bins;
7)对分箱得到的bins进行基因注释;
8)基于基因丰度矩阵对样本组间差异显著基因进行统计分析;
9)基于基因注释的结果,对序列进行功能注释以及物种注释。
本发明中,所述步骤1)具体过程如下:
a、根据测序实验信息与碱基质量信息对原始测序数据进行过滤,去除接头序列与低质量碱基序列以及读长太短的测序序列;
b、对上述经过质量过滤的序列,以环境中可能存在的污染源的序列作为参考序列,通过序列比对,对非微生物DNA进行过滤筛除,得到clean reads。
具体地,使用fastqc首先对原始测序数据进行评估,根据评估结果使用KneadData软件进行过滤
本发明中,所述步骤2)具体过程如下:
a、使用基于kmer的参考数据库比对算法进行物种注释并得出物种丰度,具体的使用Metatheothello软件;
b、对物种丰度进行热图可视化,具体的使用R语言实现;
c、基于物种丰度矩阵,可视化物种相对丰度柱状图,具体的使用R语言实现;
d、将物种进化分支树进行可视化,具体的步骤4使用LEfSe软件会产生该可视化结果。
本发明中,所述步骤3)具体过程如下:
a、根据各样本的物种丰度矩阵,对指定分类水平的群落组成结构进行CA主成分分析,并且以二维和三维图像描述样本间的自然分布特征,具体使用R语言实现;
b、根据各样本的物种丰度与群落物种的群落发育树,基于Unifrac距离计算样本间的距离矩阵,由加权及非加权距离矩阵分别进行PcoA主坐标分析,并且以二维和三维图像描述样本间基于微生物系统发育关系的群落空间分布特征,具体使用R语言实现;
c、根据各样本的物种丰度与群落物种的群落发育树,基于Unifrac距离计算样本间的距离矩阵,由加权及非加权距离矩阵分别进行NMDS主坐标分析,并且以二维和三维图像描述样本间基于微生物系统发育关系的群落空间分布特征,具体使用R语言实现;
d、根据各样本的丰度矩阵绘制Specaccum物种累积曲线,具体使用R语言实现。
本发明中,所述步骤4)具体过程如下:
a、在多组样本间采用非参数因子Kruskal-Wallis秩和检验检测不同分组建丰度差异显著的物种;
b、利用Wilcoxon秩和检验检查对显著差异物种类中的所有亚种比较;
c、使用线性判别分析(LDA)对数据进行降维和评估差异显著的物种并将每个物种的影响程度进行量化,并提供可视化结果。
具体地使用LEfSe软件完成上述分析过程。
本发明中,所述步骤5)具体过程如下:
a、将clean reads打断成一定长度的kmer;
b、使用基于de Bruiju图的组装算法进行组装得到contigs。
具体地,使用UDBA-UD软件实现上述分析过程。
本发明中,所述步骤6)具体过程如下:
a、将clean reads比对到组装得到的contigs上,统计contigs的丰度,根据contigs的丰度及其GC含量进行分箱;
b、对上述步骤a分箱结果根据完成度与污染度进行过滤;
c、将上述步骤b的过滤进过进行重组装,得到最终分箱结果bins。
具体地,使用MetaWrap软件实现上述分析过程。
本发明中,所述步骤7)具体过程如下:
a、基于动态规划算法对bins进行基因结构预测;
b、计算基因丰度矩阵。
具体地,使用MetaProdigal实现上述分析过程。
本发明中,所述步骤8)具体过程如下:
a、在多组样本间采用非参数因子Kruskal-Wallis秩和检验检测不同分组建丰度差异显著的物种;
b、利用Wilcoxon秩和检验检查对显著差异物种类中的所有亚种比较;
c、使用线性判别分析(LDA)对数据进行降维和评估差异显著的物种并将每个物种的影响程度进行量化,并提供可视化结果。
具体地,使用LEfSe软件实现上述分析过程。
本发明中,所述步骤9)具体过程如下:
a、对上述基因结构预测得到的编码基因序列进行去冗余;
b、将得到的非冗余的编码基因序列与功能蛋白数据库进行比对,对编码基因序列进行功能注释以及物种注释。
c、根据功能注释的结果,统计针对每个功能的丰度,并进行柱状图可视化。
具体地,使用DIAMOND软件进行比对注释,使用R语言进行可视化。
综上所述,本发明通过整合分析结果更为准确的分析方法较为全面的分析模块的方法,本发明开发基于二代测序的宏基因组数据分析方法,从而解决宏基因组同时整合物种分析、功能分析以及多样性分析的工具较少的问题,并且分析结果更为准确。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (10)
1.一种基于二代测序技术的宏基因组数据分析方法,其特征在于,包括以下步骤:
1)对原始测序数据进行质量控制,得到cleanreads;
2)对经过质量控制的序列cleanreads进行物种注释;
3)基于物种丰度矩阵对样本多样性进行统计分析;
4)基于物种丰度矩阵对样本组间差异显著物种进行统计分析;
5)对经过质量控制的clean reads进行拼接组装得到contigs序列;
6)对拼接组装得到的contigs进行分箱,得到bins;
7)对分箱得到的bins进行基因注释;
8)基于基因丰度矩阵对样本组间差异显著基因进行统计分析;
9)基于基因注释的结果,对序列进行功能注释以及物种注释。
2.根据权利要求1所述的一种基于二代测序技术的宏基组数据分析方法,其特征在于:所述步骤1)具体过程如下:
a、根据测序实验信息与碱基质量信息对原始测序数据进行过滤,去除接头序列与低质量碱基序列以及读长太短的测序序列;
b、对上述经过质量过滤的序列,以环境中可能存在的污染源的序列作为参考序列,通过序列比对,对非微生物DNA进行过滤筛除,得到clean reads。
3.根据权利要求1所述的一种基于二代测序技术的宏基因组数据分析方法,其特征在于,所述步骤2)具体过程如下:
a、使用基于kmer的参考数据库比对算法进行物种注释并得出物种丰度;
b、对物种丰度进行热图可视化;
c、基于物种丰度矩阵,可视化物种相对丰度柱状图;
d、将物种进化分支树进行可视化。
4.根据权利要求1所述的一种基于二代测序技术的宏基因组数据分析方法,其特征在于,所述步骤3)具体过程如下:
a、根据各样本的物种丰度矩阵,对指定分类水平的群落组成结构进行CCA主成分分析,并且以二维和三维图像描述样本间的自然分布特征;
b、根据各样本的物种丰度与群落物种的群落发育树,基于Unifrac距离计算样本间的距离矩阵,由加权及非加权距离矩阵分别进行PcoA主坐标分析,并且以二维和三维图像描述样本间基于微生物系统发育关系的群落空间分布特征;
c、根据各样本的物种丰度与群落物种的群落发育树,基于Unifrac距离计算样本间的距离矩阵,由加权及非加权距离矩阵分别进行NMDS主坐标分析,并且以二维和三维图像描述样本间基于微生物系统发育关系的群落空间分布特征;
d、根据各样本的丰度矩阵绘制Specaccum物种累积曲线。
5.根据权利要求1所述的一种基于二代测序技术的宏基因组数据分析方法,其特征在于,所述步骤4)具体过程如下:
a、在多组样本间采用非参数因子Kruskal-Wallis秩和检验检测不同分组间丰度差异显著的物种;
b、利用Wilcoxon秩和检验检查对显著差异物种类中的所有亚种比较;
c、使用线性判别分析LDA对数据进行降维和评估差异显著的物种并将每个物种的影响程度进行量化,并提供可视化结果。
6.根据权利要求1所述的一种基于二代测序技术的宏基因组数据分析方法,其特征在于,所述步骤5)具体过程如下:
a、将clean reads打断成一定长度的kmer;
b、使用基于de Bruiju图的组装算法进行组装得到contigs。
7.根据权利要求1所述的一种基于二代测序技术的宏基因组数据分析方法,其特征在于,所述步骤6)具体过程如下:
a、将clean reads比对到组装得到的contigs上,统计contigs的丰度,根据contigs的丰度及其GC含量进行分箱;
b、对上述步骤a分箱结果根据完成度与污染度进行过滤
c、将上述步骤b的过滤进行重组装,得到最终分箱结果bins。
8.根据权利要求1所述的一种基于二代测序技术的宏基因组数据分析方法,其特征在于,所述步骤7)具体过程如下:
a、基于动态规划算法对bins进行基因结构预测;
b、计算基因丰度矩阵。
9.根据权利要求1所述的一种基于二代测序技术的宏基因组数据分析方法,其特征在于,所述步骤8)具体过程如下:
a、在多组样本间采用非参数因子Kruskal-Wallis秩和检验检测不同分组间丰度差异显著的物种;
b、利用Wilcoxon秩和检验检查对显著差异物种类中的所有亚种比较;
c、使用线性判别分析LDA对数据进行降维和评估差异显著的物种并将每个物种的影响程度进行量化,并提供可视化结果。
10.根据权利要求8所述的一种基于二代测序技术的宏基因组数据分析方法,其特征在于,所述步骤9)具体过程如下:
a、对上述基因结构预测得到的编码基因序列进行去冗余;
b、将得到的非冗余的编码基因序列与功能蛋白数据库进行比对,对编码基因序列进行功能注释以及物种注释;
c、根据功能注释的结果,统计针对每个功能的丰度,并进行柱状图可视化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011089931.5A CN112071366B (zh) | 2020-10-13 | 2020-10-13 | 一种基于二代测序技术的宏基因组数据分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011089931.5A CN112071366B (zh) | 2020-10-13 | 2020-10-13 | 一种基于二代测序技术的宏基因组数据分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112071366A CN112071366A (zh) | 2020-12-11 |
CN112071366B true CN112071366B (zh) | 2024-02-27 |
Family
ID=73655439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011089931.5A Active CN112071366B (zh) | 2020-10-13 | 2020-10-13 | 一种基于二代测序技术的宏基因组数据分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112071366B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112669899B (zh) * | 2020-12-24 | 2023-03-03 | 广州基迪奥生物科技有限公司 | 一种16s和宏基因组测序数据关联分析方法、系统及设备 |
CN112599198A (zh) * | 2020-12-29 | 2021-04-02 | 上海派森诺生物科技股份有限公司 | 一种用于宏基因组测序数据的微生物物种与功能组成分析方法 |
CN112786102B (zh) * | 2021-01-25 | 2022-10-21 | 北京大学 | 一种基于宏基因组学分析精准识别水体中未知微生物群落的方法 |
CN112863603A (zh) * | 2021-03-12 | 2021-05-28 | 南开大学 | 细菌全基因组测序数据的自动化分析方法及系统 |
CN113257348A (zh) * | 2021-05-26 | 2021-08-13 | 南开大学 | 一种宏转录组测序数据处理方法及系统 |
CN113205856B (zh) * | 2021-06-22 | 2022-07-12 | 南开大学 | 一种微生物宏基因组分箱方法及系统 |
CN113539369B (zh) * | 2021-07-14 | 2022-03-25 | 江苏先声医学诊断有限公司 | 一种优化的kraken2算法及其在二代测序中的应用 |
CN113611359B (zh) * | 2021-08-13 | 2022-08-05 | 江苏先声医学诊断有限公司 | 一种提高宏基因组纳米孔测序数据菌种组装效率的方法 |
CN113793647A (zh) * | 2021-09-17 | 2021-12-14 | 艾德范思(北京)医学检验实验室有限公司 | 一种基于二代测序宏基因组数据分析装置及方法 |
CN113971986B (zh) * | 2021-10-12 | 2023-03-21 | 江苏先声医疗器械有限公司 | 一种通过序列相似性排查测序样本交叉污染的方法 |
CN114300055B (zh) * | 2021-12-28 | 2023-04-25 | 江苏先声医学诊断有限公司 | 优化的宏基因组纳米孔测序数据定量方法 |
CN116612820B (zh) * | 2023-07-20 | 2023-09-19 | 山东省滨州畜牧兽医研究院 | 基于数据分析的乳制品生产智能管理平台 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107002076A (zh) * | 2014-09-15 | 2017-08-01 | 阿布维特罗有限责任公司 | 高通量核苷酸文库测序 |
CN107577919A (zh) * | 2017-08-21 | 2018-01-12 | 上海派森诺生物科技股份有限公司 | 一种基于高通量测序技术的宏基因组数据分析方法 |
CN108804875A (zh) * | 2018-06-21 | 2018-11-13 | 中国科学院北京基因组研究所 | 一种利用宏基因组数据分析微生物群体功能的方法 |
CN110366596A (zh) * | 2016-12-28 | 2019-10-22 | 埃斯库斯生物科技股份公司 | 用于对复杂异质群落中的完整微生物株系进行分析、确定其功能关系及相互作用以及基于此来识别和合成生物活性改性剂的方法、设备和系统 |
CN111235142A (zh) * | 2020-01-20 | 2020-06-05 | 南京大学 | 一种强酸性条件下基质附着生物膜中微生物总dna的提取方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014019180A1 (zh) * | 2012-08-01 | 2014-02-06 | 深圳华大基因研究院 | 确定异常状态生物标记物的方法及系统 |
US20150242565A1 (en) * | 2012-08-01 | 2015-08-27 | Bgi Shenzhen | Method and device for analyzing microbial community composition |
-
2020
- 2020-10-13 CN CN202011089931.5A patent/CN112071366B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107002076A (zh) * | 2014-09-15 | 2017-08-01 | 阿布维特罗有限责任公司 | 高通量核苷酸文库测序 |
CN110366596A (zh) * | 2016-12-28 | 2019-10-22 | 埃斯库斯生物科技股份公司 | 用于对复杂异质群落中的完整微生物株系进行分析、确定其功能关系及相互作用以及基于此来识别和合成生物活性改性剂的方法、设备和系统 |
CN107577919A (zh) * | 2017-08-21 | 2018-01-12 | 上海派森诺生物科技股份有限公司 | 一种基于高通量测序技术的宏基因组数据分析方法 |
CN108804875A (zh) * | 2018-06-21 | 2018-11-13 | 中国科学院北京基因组研究所 | 一种利用宏基因组数据分析微生物群体功能的方法 |
CN111235142A (zh) * | 2020-01-20 | 2020-06-05 | 南京大学 | 一种强酸性条件下基质附着生物膜中微生物总dna的提取方法 |
Non-Patent Citations (3)
Title |
---|
元基因组学方法在环境微生物中的研究进展;刘捷孟;戚继;;生物技术通报(第11期);全文 * |
宁夏部分地区野鸟携带病毒的宏基因组分析;于春微;施建忠;王靖飞;中国预防兽医学报;第38卷(第6期);全文 * |
山麻鸭开产期和产蛋高峰期卵巢组织转录组分析;朱志明;陈红萍;林如龙;缪中纬;辛清武;李丽;张丹青;郑嫩珠;中国农业科学;第49卷(第5期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112071366A (zh) | 2020-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112071366B (zh) | 一种基于二代测序技术的宏基因组数据分析方法 | |
CN112133368B (zh) | 一种基于三代测序技术的宏基因组测序数据的自动化分析方法 | |
Marx | A dream of single-cell proteomics | |
Liu et al. | DNA methylation atlas of the mouse brain at single-cell resolution | |
Ge et al. | Correlation between transcriptome and interactome mapping data from Saccharomyces cerevisiae | |
Marsland III et al. | A minimal model for microbial biodiversity can reproduce experimentally observed ecological patterns | |
CN109273053B (zh) | 一种高通量测序的微生物数据处理方法 | |
CN109448788B (zh) | 基因组学及生物信息学的微生物组学在线分析平台架构 | |
Kose et al. | Visualizing plant metabolomic correlation networks using clique–metabolite matrices | |
Cox et al. | Integrating gene and protein expression data: pattern analysis and profile mining | |
CN110349629A (zh) | 一种利用宏基因组或宏转录组检测微生物的分析方法 | |
Lee et al. | Environmental adaptation contributes to gene polymorphism across the Arabidopsis thaliana genome | |
CN112669899B (zh) | 一种16s和宏基因组测序数据关联分析方法、系统及设备 | |
CN112151118B (zh) | 一种多时间序列肠道菌群数据分析流程控制方法 | |
CN105740650A (zh) | 一种快速准确鉴定高通量基因组数据污染源的方法 | |
CN104899474B (zh) | 基于岭回归矫正MB‑seq甲基化水平的方法及系统 | |
CN114708910B (zh) | 一种利用单细胞测序数据计算池测序中细胞亚群富集分数的方法 | |
CN114864003A (zh) | 基于混合实验组和对照组单细胞样本的差异分析方法及系统 | |
Qu et al. | Simultaneous profiling of chromatin architecture and transcription in single cells | |
CN110970091A (zh) | 标签质控的方法及装置 | |
Hyatt et al. | Exhaustive database searching for amino acid mutations in proteomes | |
JP5403563B2 (ja) | 網羅的フラグメント解析における遺伝子同定方法および発現解析方法 | |
CN108866155A (zh) | 一种下一代测序文库的制备方法 | |
Zhang et al. | OmiTrans: generative adversarial networks based omics-to-omics translation framework | |
Parikh et al. | LI Detector: a framework for sensitive colony-based screens regardless of the distribution of fitness effects |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |