CN111218518B - 微生物群落特定功能基因多样性分析引物对及分析方法 - Google Patents

微生物群落特定功能基因多样性分析引物对及分析方法 Download PDF

Info

Publication number
CN111218518B
CN111218518B CN202010054021.7A CN202010054021A CN111218518B CN 111218518 B CN111218518 B CN 111218518B CN 202010054021 A CN202010054021 A CN 202010054021A CN 111218518 B CN111218518 B CN 111218518B
Authority
CN
China
Prior art keywords
analysis
diversity
microbial community
analyzing
amplification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010054021.7A
Other languages
English (en)
Other versions
CN111218518A (zh
Inventor
夏昊强
周煌凯
高川
陶勇
艾鹏
张秋雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Gene Denovo Biotechnology Co ltd
Original Assignee
Guangzhou Gene Denovo Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Gene Denovo Biotechnology Co ltd filed Critical Guangzhou Gene Denovo Biotechnology Co ltd
Priority to CN202010054021.7A priority Critical patent/CN111218518B/zh
Publication of CN111218518A publication Critical patent/CN111218518A/zh
Application granted granted Critical
Publication of CN111218518B publication Critical patent/CN111218518B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Physics & Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于生物信息分析领域,特别是涉及微生物群落特定功能基因多样性分析引物及分析方法。本发明公开了三种微生物群落特定功能基因多样性分析引物对,以及利用这三种引物对获得对应功能基因片段的方法。本发明还公开了一种微生物群落特定功能基因多样性分析方法及其在分析上述三种微生物群落特定功能基因多样性中的应用。本发明的三种微生物群落特定功能基因多样性分析引物对具有显著地扩增优势,本发明的微生物群落特定功能基因多样性分析方法具有更全面一体化的分析流程,即针对微生物群落中具有的某种特定功能的微生物群体,能够探索功能基因更为复杂的生物信息内容,挖掘该功能群体的微生物多样性。

Description

微生物群落特定功能基因多样性分析引物对及分析方法
技术领域
本发明属于生物信息分析领域,特别是涉及一种微生物群落特定功能基因多样性分析引物对及分析方法。
背景技术
微生物普遍存在于各类环境中,在其各自的环境中发挥作用,其中有一些具有特殊功能的微生物,由于其作用的重要性或特殊性而受到人们的广泛关注和研究,此类微生物叫做功能微生物,如氨氧化细菌、硫细菌、硝化细菌等。支配这些功能细菌发挥重要功能的基因被称为功能基因,功能基因指编码催化具体生物学过程的酶的基因,微生物群落研究中主要包含碳、氮、硫等生物地球化学循环过程相关酶的编码基因,基于具有某种功能的微生物探讨不同生境、处理之间功能微生物的驱动或响应机制。
目前尚未有公开技术,只需针对某一类功能基因的保守区设计引物,扩增测序特定功能基因的序列,即可开始功能基因多样性分析,针对微生物群落中具有某种特定功能的微生物群体开展该功能群体的微生物多样性分析。
发明内容
鉴于此,有必要针对上述问题提供一种微生物群落特定功能基因多样性分析引物及分析方法,具有优点引物扩增效果好、分析内容更全面、群落功能基因多样性研究更深入。
本发明是通过以下技术方案实现的:
一种微生物群落特定功能基因多样性分析方法,步骤包括:
数据质控和拼接;OTU聚类及氨基酸序列预测;OPU聚类与分析;物种组成分析;alpha多样性分析;beta多样性分析。
进一步的,所述数据质控和拼接包括:Reads过滤、Tags拼接和Tags过滤,并将数据质控的结果以图表方式直观展示。
优选的,所述的Reads过滤包括:去除N比例过高的序列:去除reads中N碱基占比超过10%的序列;去除低质量序列:去除质量值高于20的碱基数占碱基总数的百分比小于40%的reads。
优选的,所述的Tags拼接具体包括:根据PE reads之间的重叠关系,使用FLASH将成对双端reads拼接为一条序列。拼接的条件是最小匹配长度为10bp,重叠区域允许的错配率为2%。拼接得到的序列称为Raw Tags。
优选的,所述的Tags过滤具体包括:将Raw Tags从连续低质量值(默认质量阈值为小于等于3)碱基数达到设定长度(默认长度值为3)的第一个低质量碱基位点截断,经过截取后得到的Tags数据集,进一步过滤其中连续高质量碱基长度小于Tags长度75%的Tags,过滤长度低于300bp的tag。
优选的,所述的以图表方式直观展示包括:根据拼接过滤后获得的Clean tags长度分布统计结果绘制分布图,评估功能基因扩增子长度是否接近预期范围。优选的,nifH基因扩增子长度范围约为450bp,nirS基因扩增子长度范围约为400bp,nirK基因扩增子长度范围约为450bp。
进一步的,所述OTU聚类及氨基酸序列预测包括:使用Uparse软件对所有样品的全部Clean Tags序列聚类,一般以97%的一致性将序列聚类成为OTUs(OperationalTaxonomic Units)结果,在聚类的过程中软件根据OTU序列之间的相似性对嵌合体序列进行判别及过滤,并计算出每个OTU在各个样品中的Tags绝对丰度和相对信息;根据获得的OTU序列,使用Fungene流程的framebot工具将OTU代表核酸序列转为氨基酸序列,并使用默认参数对氨基酸序列进行过滤,获得有效氨基酸序列(clean AA)。
进一步的,所述OPU聚类与分析包括:保留的有效氨基酸序列使用Uparse软件以97%的一致性(Identity)进行聚类,得到OPU,计算OPU绝对丰度和相对丰度。基于OPU丰度信息,通过韦恩图和PCA分析对样本组间情况进行分析。
进一步的,所述物种组成分析包括:使用blastP软件将OPU代表序列(氨基酸序列)比对至RefSeq version 94数据库,获得序列的物种注释信息,并对物种组成进行图示化,展示其丰度情况。
优选的,所述的图示化包括但不限于分布堆叠图、热图、circos图等。
优选的,所述的物种组成分析还可以是对物种丰富分布进行差异检验,包括但不限于:welch’s T检验、LEfSe分析、随机森林分析、三元图分析等丰富的高级分析内容。
进一步的,所述alpha多样性分析包括:alpha多样性是特定生境或者生态系统内的多样性情况,可以指示生境被物种隔离的程度,通常利用物种丰富度(种类情况)与物种均匀度(分布情况)两个重要参数来计算。本发明通过Chao1,ACE,Shannon,observed_species,Simpson和Good’s Coverage六大类常用的alpha多样性指数以及它们的相关分析结果来分析alpha多样性。
优选的,功能基因alpha多样性分析包括但不限于:稀释曲线、Rank Abundance曲线、alpha多样性差异分析等。
进一步的,所述beta多样性分析包括:beta多样性是不同生态系统之间多样性的比较,是物种组成沿环境梯度或者在群落间的变化率,用来表示生物种类对环境异质性的反应。一般来说,不同环境梯度下群落beta多样性计算包括物种改变(多少)和物种产生(有无)两部分。
优选的,功能基因beta多样性分析基于加权(Weighted Unifrac)和非加权(Unweighted Unifrac)两种算法包括但不限于:距离分析、UPGMA聚类分析、PCoA主坐标分析、NMDS分析、Adonis分组检验、Anosim分组检验等。
本发明还公开了一种微生物群落特定功能基因多样性分析系统,所述的系统具体包括:
数据质控和拼接单元;所述单元包括Reads过滤、Tags拼接、Tags过滤;
OTU聚类及氨基酸序列预测单元;所述单元完成将所有样品的全部Clean Tags序列聚类成为OTUs结果;根据OTU序列之间的相似性对嵌合体序列进行判别及过滤,并计算出每个OTU在各个样品中的Tags绝对丰度和相对信息;根据获得的OTU序列,将OTU代表的核酸序列转为氨基酸序列,并对氨基酸序列进行过滤,获得有效氨基酸序列;
OPU聚类与分析单元;所述单元将获得有效氨基酸序列进行聚类得到OPU,计算OPU绝对丰度和相对丰度;基于OPU丰度信息,通过韦恩图和PCA分析对样本组间情况进行分析。
物种组成分析单元;所述单元将OPU代表序列(氨基酸序列)比对至RefSeqversion 94数据库,获得序列的物种注释信息,并对物种组成进行图示化,展示其丰度情况;
alpha多样性分析单元;所述单元通过alpha多样性指数以及它们的相关分析结果来分析alpha多样性;
beta多样性分析单元;所述单元用于完成beta多样性分析操作。
进一步的,所述物种组成分析单元还可以是对物种丰富分布进行差异检验,包括但不限于:welch’s T检验、LEfSe分析、随机森林分析、三元图分析等丰富的高级分析内容。
本发明还公开了一种微生物群落特定功能基因多样性分析平台,所述平台包括:
处理器、存储器以及微生物群落特定功能基因多样性分析控制程序;
其中在所述的处理器执行所述的微生物群落特定功能基因多样性分析平台控制程序,所述的微生物群落特定功能基因多样性分析平台控制程序被存储在所述的存储器中,所述的微生物群落特定功能基因多样性分析平台控制程序,实现上述的微生物群落特定功能基因多样性分析方法步骤。
本发明还公开了一种计算机可读取存储介质,所述计算机可读取存储介质存储有所述微生物群落特定功能基因多样性分析平台控制程序,所述的微生物群落特定功能基因多样性分析平台控制程序,实现上述的微生物群落特定功能基因多样性分析方法步骤。
一种扩增固氮微生物群落nifH基因的引物对,具体序列为:
Primer F(nifH):aaaggyggwatcggyaartccaccac(SEQ ID NO.1)
Primer R(nifH):ttgttsgcsgcrtacatsgccatcat(SEQ ID NO.2)
一种扩增反硝化微生物群落nirS基因的引物对,具体序列为:
Primer F(Cd3a):gtsaacgtsaaggaracsgg(SEQ ID NO.3)
Primer R(R3cd):gasttcggrtgsgtcttga(SEQ ID NO.4)
一种扩增反硝化微生物群落nirK基因的引物对,具体序列为:
Primer F(nirK1aCu):atcatggtsctgccgcg(SEQ ID NO.5)
Primer R(nirKR3Cu):gcctcgatcagrttgtggtt(SEQ ID NO.6)
SEQ ID NO.1至SEQ ID NO.6所述的序列中Y表示“t/u或c”;W表示“a或t/u”;R表示“g或a”。
一种获得微生物群落特定功能基因序列数据的方法,包括:第一轮扩增;第一轮扩增产物纯化;第二轮扩增;文库定量及测序。
进一步的,所述第一轮扩增的扩增体系为:
KOD酶扩增体系 50μL
10×Buffer KOD 5μL
2mM dNTPs 5μL
25mM MgSO<sub>4</sub> 3μL
Primer F(10μΜ) 1.5μL
Primer R(10μΜ) 1.5μL
KOD酶 1μL
Template 1-5μL(即100ng)
H<sub>2</sub>O 补足50μL
扩增程序为:94℃,2min;98℃,10s;58-66℃,30s;68℃,30s;30个循环;68℃,5min。
进一步的,所述第一轮扩增产物纯化包括:利用AMPure XP Beads进行PCR产物纯化,纯化后用Qubit3.0定量。
进一步的,所述第二轮扩增的扩增体系:
Figure BDA0002372181350000061
Figure BDA0002372181350000071
第二轮扩增程序为:94℃,2min;(98℃,10s;65℃,30s;68℃,30s)12个循环;68℃,5min。
进一步的,所述文库定量及测序包括:使用AMPure XP Beads对第二轮扩增产物进行纯化,用ABI StepOnePlus Real-Time PCR System(Life Technologies,产地美国)进行定量,根据Hiseq2500的PE250模式pooling上机测序。
利用本发明的微生物群落特定功能基因多样性分析方法分析上述三种微生物群落特定功能基因的方法,步骤包括:
(1)采用上述SEQ ID NO.1至SEQ ID NO.6所述的引物扩增并测序获得基因序列数据;
(2)采用上述微生物群落特定功能基因多样性分析方法或这微生物群落特定功能基因多样性分析系统对步骤(1)获得的序列数据进行分析。
本发明有益效果:
本发明提供的固氮微生物群落nifH基因、反硝化微生物群落nirS基因、反硝化微生物群落nirK基因多样性分析的分析引物,其优势在于:功能基因的扩增引物在实际研究中具有较好的扩增效果,特异性强,可结合科学研究背景特异性扩增出相应功能基因片段。
本发明还提供一种微生物群落特定功能基因多样性分析方法,该分析方法具有更全面一体化的分析流程,能够分析更为复杂的生物信息(如随机森林分析、三元图分析),即针对微生物群落中具有的某种特定功能的微生物群体,能够探索功能基因更为复杂的生物信息内容,挖掘该功能群体的微生物多样性。
附图说明
图1为样本反硝化功能基因第一轮PCR扩增结果。
图2为样本反硝化功能基因第二轮PCR质检结果。
图3为样本固氮功能基因第一轮PCR扩增结果。
图4为样本固氮功能基因第二轮PCR质检结果。
图5为样本亚硝酸盐还原功能基因第一轮PCR扩增结果。
图6为样本固氮功能基因第二轮PCR质检结果。
具体实施方式
为了更好的说明本发明技术方案所要解决的问题、采用的技术方案和达到的有益效果,现结合具体实施方式进一步阐述。值得说明的是,本发明技术方案包含但不限于以下实施方式。
本发明实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购等途径获得的常规产品。
实施例1
本发明提供一种微生物群落特定功能基因多样性分析的三种功能基因及其引物,具体情况如下:
一种扩增固氮微生物群落nifH基因的引物对,具体序列为:
Primer F(nifH):AAAGGYGGWATCGGYAARTCCACCAC(SEQ ID NO.1)
Primer R(nifH):TTGTTSGCSGCRTACATSGCCATCAT(SEQ ID NO.2)
一种扩增反硝化微生物群落nirS基因的引物对,具体序列为:
Primer F(Cd3a):GTSAACGTSAAGGARACSGG(SEQ ID NO.3)
Primer R(R3cd):GASTTCGGRTGSGTCTTGA(SEQ ID NO.4)一种扩增反硝化微生物群落nirK基因的引物对,具体序列为:
Primer F(nirK1aCu):ATCATGGTSCTGCCGCG(SEQ ID NO.5)
Primer R(nirKR3Cu):GCCTCGATCAGRTTGTGGTT(SEQ ID NO.6)
其中,SEQ ID NO.1至SEQ ID NO.6所述的序列表中Y表示“t/u或c”;W表示“a或t/u”;R表示“g或a”。
用本发明的微生物群落特定功能基因多样性分析方法分别单独分析或同时分析上述的三种功能基因中的至少两种功能基因,具体分析方法如下:
首先,根据提取的基因组DNA(若为粪便DNA或肠道内容物等稳定环境收集的样品提取基因组DNA可采用HiPure Stool DNA Kits试剂盒、若为土壤或底泥等来自自然环境的样本提取基因组DNA可采用HiPure Soil DNA Kits)和特异引物进行扩增,反应体系和程序如下:
(1)第一轮扩增体系
Figure BDA0002372181350000091
Figure BDA0002372181350000101
(2)第一轮扩增程序:94℃,2min;
Figure BDA0002372181350000102
(3)第一轮PCR产物纯化:利用AMPure XP Beads进行PCR产物纯化,纯化后用Qubit3.0定量。
(4)第二轮扩增体系
Figure BDA0002372181350000103
(5)第二轮扩增程序
Figure BDA0002372181350000104
(6)文库定量及测序
使用AMPure XP Beads对第二轮扩增产物进行纯化,用ABI StepOnePlus Real-Time PCR System(Life Technologies,产地美国)进行定量,根据Hiseq2500的PE250模式pooling上机测序。
其次,对测序后的下机数据进行如下生物信息分析:
(1)数据质控和拼接:Reads过滤、Tags拼接、Tags过滤,并将数据质控和拼接的结果以图表和柱形图的形式直观展示。
优选的,Reads过滤包括:去除N比例过高的序列:去除reads中N碱基占比超过10%的序列;去除低质量序列:去除质量值高于20的碱基数占碱基总数的百分比小于40%的reads。
优选的,Tags拼接具体为根据PE reads之间的重叠关系,使用FLASH将成对双端reads拼接为一条序列。拼接的条件是最小匹配长度为10bp,重叠区域允许的错配率为2%。拼接得到的序列称为Raw Tags。
优选的,Tags过滤具体为将Raw Tags从连续低质量值(默认质量阈值为小于等于3)碱基数达到设定长度(默认长度值为3)的第一个低质量碱基位点截断,经过截取后得到的Tags数据集,进一步过滤其中连续高质量碱基长度小于Tags长度75%的Tags,过滤长度低于300bp的tag。
优选的,根据拼接过滤后获得的Clean tags长度分布统计结果绘制分布图,评估功能基因扩增子长度是否接近预期范围。优选的,nifH基因扩增子长度范围约为450bp,nirS基因扩增子长度范围约为400bp,nirK基因扩增子长度范围约为450bp。
(2)OTU聚类及氨基酸序列预测:使用Uparse软件对所有样品的全部Clean Tags序列聚类,一般以97%的一致性将序列聚类成为OTUs(Operational Taxonomic Units)结果,在聚类的过程中软件根据OTU序列之间的相似性对嵌合体序列进行判别及过滤,并计算出每个OTU在各个样品中的Tags绝对丰度和相对信息。根据获得的OTU序列,使用Fungene流程的framebot工具将OTU代表核酸序列转为氨基酸序列,并使用默认参数对氨基酸序列进行过滤,获得有效氨基酸序列(clean AA)。
(3)OPU聚类与分析:保留的有效氨基酸序列使用Uparse软件以97%的一致性(Identity)进行聚类,得到OPU,计算OPU绝对丰度和相对丰度。基于OPU丰度信息,通过韦恩图和PCA分析对样本组间情况进行分析。
(4)物种组成分析:使用blastP软件将OPU代表序列(氨基酸序列)比对至RefSeqversion 94数据库,获得序列的物种注释信息,并对物种组成进行图示化,展示其丰度情况。优选的,图示化包括但不限于分布堆叠图、热图、circos图等。
特别的,还可以对物种丰富分布进行差异检验,包括但不限于:welch’s T检验、LEfSe分析、随机森林分析、三元图分析等丰富的高级分析内容。
(5)alpha多样性分析:alpha多样性是特定生境或者生态系统内的多样性情况,可以指示生境被物种隔离的程度,通常利用物种丰富度(种类情况)与物种均匀度(分布情况)两个重要参数来计算。本发明通过通过Chao1,ACE,Shannon,observed_species,Simpson和Good’s Coverage六大类常用的alpha多样性指数以及它们的相关分析结果来分析alpha多样性。优选的,功能基因alpha多样性分析包括但不限于:稀释曲线、Rank Abundance曲线、alpha多样性差异分析等。
(6)beta多样性分析:beta多样性是不同生态系统之间多样性的比较,是物种组成沿环境梯度或者在群落间的变化率,用来表示生物种类对环境异质性的反应。一般来说,不同环境梯度下群落beta多样性计算包括物种改变(多少)和物种产生(有无)两部分。优选的,功能基因beta多样性分析基于加权(Weighted Unifrac)和非加权(UnweightedUnifrac)两种算法包括但不限于:距离分析、UPGMA聚类分析、PCoA主坐标分析、NMDS分析、Adonis分组检验、Anosim分组检验等。
本发明还公开了一种微生物群落特定功能基因多样性分析系统,所述的系统具体包括:
数据质控和拼接单元;所述单元包括Reads过滤、Tags拼接、Tags过滤;
OTU聚类及氨基酸序列预测单元;所述单元完成将所有样品的全部Clean Tags序列聚类成为OTUs结果;根据OTU序列之间的相似性对嵌合体序列进行判别及过滤,并计算出每个OTU在各个样品中的Tags绝对丰度和相对信息;根据获得的OTU序列,将OTU代表的核酸序列转为氨基酸序列,并对氨基酸序列进行过滤,获得有效氨基酸序列;
OPU聚类与分析单元;所述单元将获得有效氨基酸序列进行聚类得到OPU,计算OPU绝对丰度和相对丰度;基于OPU丰度信息,通过韦恩图和PCA分析对样本组间情况进行分析。
物种组成分析单元;所述单元将OPU代表序列(氨基酸序列)比对至RefSeqversion 94数据库,获得序列的物种注释信息,并对物种组成进行图示化,展示其丰度情况;
alpha多样性分析单元;所述单元通过alpha多样性指数以及它们的相关分析结果来分析alpha多样性;
beta多样性分析单元;所述单元用于完成beta多样性分析操作。
在一些延伸实施例中,所述物种组成分析单元还可以是对物种丰富分布进行差异检验,包括但不限于:welch’s T检验、LEfSe分析、随机森林分析、三元图分析等丰富的高级分析内容。
本发明还公开了一种微生物群落特定功能基因多样性分析平台,所述平台包括:
处理器、存储器以及微生物群落特定功能基因多样性分析控制程序;
其中在所述的处理器执行所述的微生物群落特定功能基因多样性分析平台控制程序,所述的微生物群落特定功能基因多样性分析平台控制程序被存储在所述的存储器中,所述的微生物群落特定功能基因多样性分析平台控制程序,实现上述的微生物群落特定功能基因多样性分析方法步骤。
本发明还公开了一种计算机可读取存储介质,所述计算机可读取存储介质存储有所述微生物群落特定功能基因多样性分析平台控制程序,所述的微生物群落特定功能基因多样性分析平台控制程序,实现上述的微生物群落特定功能基因多样性分析方法步骤。
实施例2
取土壤样本,提取DNA,加入3种相应的功能基因的引物进行对应功能基因的扩增,步骤包括:
(1)第一轮扩增:
扩增体系为:
KOD酶扩增体系 50μL
10×Buffer KOD 5μL
2mM dNTPs 5μL
25mM MgSO<sub>4</sub> 3μL
Primer F(10μΜ) 1.5μL
Primer R(10μΜ) 1.5μL
KOD酶 1μL
Template 1-5μL(即100ng)
H<sub>2</sub>O 补足50μL
扩增程序为:94℃,2min;98℃,10s;58-66℃,30s;68℃,30s;30个循环;68℃,5min。
(2)第一轮扩增产物纯化包括:利用AMPure XP Beads进行PCR产物纯化,纯化后用Qubit3.0定量。扩增结果参见图1、图3和图5,PCR扩增条带显示相应功能基因引物扩增的特异性均较好,同时可进行第二轮扩增。
(3)第二轮扩增:
第二轮扩增的扩增体系:
KOD酶扩增体系 50μL
10×Buffer KOD 5μL
2mM dNTPs 5μL
25mM MgSO<sub>4</sub> 3μL
Index Primer(10μM) 1μL
Universal PCR Primer(10μM) 1μL
KOD酶 1μL
Template 1-5μL(即100ng)
H<sub>2</sub>O 补足50μL
第二轮扩增程序为:94℃,2min;(98℃,10s;65℃,30s;68℃,30s)12个循环;68℃,5min。质检结果图参见图2、图4和图6,质检结果显示第二轮扩增特异性好,几乎不存在非特异性扩增,可以进行下一步文库定量和测序,极大提高测序数据利用率。
(4)文库定量及测序包括:使用AMPure XP Beads对第二轮扩增产物进行纯化,用ABI StepOnePlus Real-Time PCR System(Life Technologies,产地美国)进行定量,根据Hiseq2500的PE250模式pooling上机测序。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 广州基迪奥生物科技有限公司
<120> 微生物群落特定功能基因多样性分析引物对及分析方法
<160> 6
<170> SIPOSequenceListing 1.0
<210> 2
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
aaaggyggwa tcggyaartc caccac 26
<210> 2
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ttgttsgcsg crtacatsgc catcat 26
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gtsaacgtsa aggaracsgg 20
<210> 4
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gasttcggrt gsgtcttga 19
<210> 5
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atcatggtsc tgccgcg 17
<210> 6
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gcctcgatca grttgtggtt 20

Claims (6)

1.一种微生物群落特定功能基因多样性分析方法,其特征在于:包括:
获取基因序列数据,包括:第一轮扩增;第一轮扩增产物纯化;第二轮扩增;文库定量及测序;
所述第一轮扩增的扩增体系为50μL的KOD酶扩增体系,包含:5μL的10×Buffer KOD,5μL的浓度为2mM的dNTPs,3μL的浓度为25mM的MgSO4,浓度为10μΜ的功能基因引物对各1.5μL,KOD酶1μL,Template100ng,H2O补足50μL;所述功能基因引物对包括:固氮微生物群落nifH基因引物对、反硝化微生物群落nirS基因引物对和反硝化微生物群落nirK基因引物对中的至少一种;所述固氮微生物群落nifH基因引物对,具体序列如SEQ ID NO.1和SEQ IDNO.2所示;所述反硝化微生物群落nirS基因引物对,具体序列如SEQ ID NO.3和SEQ IDNO.4所示;所述反硝化微生物群落nirK基因引物对,具体序列如SEQ ID NO.5和SEQ IDNO.6所示;
所述第一轮扩增的扩增程序为:94℃,2min;98℃,10s;58-66℃,30s;68℃,30s;30个循环;68℃,5min;
所述第二轮扩增的扩增体系为50μL的KOD酶扩增体系,包含:5μL的10×Buffer KOD,5μL的浓度为2mM的dNTPs,3μL的浓度为25mM的MgSO4,浓度为10μΜ的Index Primer 1μL,浓度为10μΜ的Universal PCR Primer 1μL,KOD酶1μL,Template100ng,H2O补足50μL;
所述第二轮扩增的扩增程序为:94℃,2min;(98℃,10s;65℃,30s;68℃,30s),括号内的程序进行12个循环;再68℃,5min;
对获得的基因序列数据,进行如下分析:
数据质控和拼接;OTU聚类及氨基酸序列预测;OPU聚类与分析;物种组成分析;alpha多样性分析;beta多样性分析;
所述数据质控操作包括:Reads过滤、Tags拼接、Tags过滤,并将数据质控的结果以图表方式直观展示;
所述OTU聚类及氨基酸序列预测操作包括:将所有样品的全部Clean Tags 序列聚类成为OTUs结果;根据OTU序列之间的相似性对嵌合体序列进行判别及过滤,并计算出每个OTU在各个样品中的Tags绝对丰度和相对信息;根据获得的OTU序列,将OTU代表的核酸序列转为氨基酸序列,并对氨基酸序列进行过滤,获得有效氨基酸序列;
所述OPU聚类与分析操作包括:对所述的有效氨基酸序列进行聚类,得到OPU,计算OPU绝对丰度和相对丰度;基于得到的OPU丰度信息,对样本组间情况进行分析;
所述物种组成分析操作包括:获得所述OPU代表序列的物种注释信息,并对物种组成进行图示化,展示其丰度情况;
所述alpha多样性分析操作包括稀释曲线、Rank Abundance曲线或alpha多样性差异分析中的至少一种;
所述beta多样性分析包括距离分析、UPGMA聚类分析、PCoA主坐标分析、NMDS分析、Adonis分组检验或Anosim分组检验中的至少一种。
2.根据权利要求1所述的微生物群落特定功能基因多样性分析方法,其特征在于,所述物种组成分析还可以对物种丰富分布进行差异检验。
3.根据权利要求1所述的微生物群落特定功能基因多样性分析方法,其特征在于,所述对物种丰富分布进行差异检验包括:welch’s T检验、LEfSe分析、随机森林分析、三元图分析。
4.一种微生物群落特定功能基因多样性分析系统,其特征在于,所述的系统包括:
数据质控和拼接单元;所述单元包括Reads过滤、Tags拼接、Tags过滤;
OTU聚类及氨基酸序列预测单元;所述单元用于将所有样品的全部Clean Tags序列聚类成为OTUs结果;根据OTU序列之间的相似性对嵌合体序列进行判别及过滤,并计算出每个OTU在各个样品中的Tags绝对丰度和相对信息;根据获得的OTU序列,将OTU代表的核酸序列转为氨基酸序列,并对氨基酸序列进行过滤,获得有效氨基酸序列;
OPU聚类与分析单元;所述单元将所述有效氨基酸序列进行聚类得到OPU,计算OPU绝对丰度和相对丰度;基于OPU丰度信息,对样本组间情况进行分析;
物种组成分析单元;所述单元用于获得OPU代表序列的物种注释信息,并对物种组成进行图示化,展示其丰度情况;
alpha多样性分析单元;所述单元通过alpha多样性指数以及它们的相关分析结果来分析alpha多样性;
beta多样性分析单元;所述单元用于完成beta多样性分析操作。
5.一种微生物群落特定功能基因多样性分析平台,其特征在于,所述平台包括:处理器、存储器以及微生物群落特定功能基因多样性分析控制程序;
其中在所述的处理器执行所述的微生物群落特定功能基因多样性分析平台控制程序,所述的微生物群落特定功能基因多样性分析平台控制程序被存储在所述的存储器中,所述的微生物群落特定功能基因多样性分析平台控制程序,实现权利要求1~3任意一项所述的微生物群落特定功能基因多样性分析方法步骤。
6.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质存储有所述微生物群落特定功能基因多样性分析平台控制程序,所述的微生物群落特定功能基因多样性分析平台控制程序,实现权利要求1~3任意一项所述的微生物群落特定功能基因多样性分析方法步骤。
CN202010054021.7A 2020-01-17 2020-01-17 微生物群落特定功能基因多样性分析引物对及分析方法 Active CN111218518B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010054021.7A CN111218518B (zh) 2020-01-17 2020-01-17 微生物群落特定功能基因多样性分析引物对及分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010054021.7A CN111218518B (zh) 2020-01-17 2020-01-17 微生物群落特定功能基因多样性分析引物对及分析方法

Publications (2)

Publication Number Publication Date
CN111218518A CN111218518A (zh) 2020-06-02
CN111218518B true CN111218518B (zh) 2022-07-01

Family

ID=70826062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010054021.7A Active CN111218518B (zh) 2020-01-17 2020-01-17 微生物群落特定功能基因多样性分析引物对及分析方法

Country Status (1)

Country Link
CN (1) CN111218518B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283743B (zh) * 2021-05-21 2023-06-20 中国科学院南京地理与湖泊研究所 一种流域中不同生态修复类型生境阈值的判定方法
CN113793640B (zh) * 2021-09-17 2024-03-08 艾德范思(北京)医学检验实验室有限公司 基于二代测序的微生物16s扩增子数据分析的装置及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3064592A1 (en) * 2015-03-06 2016-09-07 Brigitte König Methods for the qualitative and quantitative detection of microbes in a sample
CN110211629A (zh) * 2018-02-11 2019-09-06 中国科学院昆明动物研究所 一种评估微生物群落宏基因(或普通生物群落宏遗传)多样性和相似性的概念和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3064592A1 (en) * 2015-03-06 2016-09-07 Brigitte König Methods for the qualitative and quantitative detection of microbes in a sample
CN110211629A (zh) * 2018-02-11 2019-09-06 中国科学院昆明动物研究所 一种评估微生物群落宏基因(或普通生物群落宏遗传)多样性和相似性的概念和方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Changes in nitrogen functional genes in soil profiles of grassland under long-term grazing prohibition in a semiarid area;Z. Song et al.;《Science of the Total Environment》;20190403(第673期);第92-101页 *
Molecular Characterization of Diazotrophic and Denitrifying Bacteria Associated with Mangrove Roots;Ana L. Flores-Mireles et al.;《APPLIED AND ENVIRONMENTAL MICROBIOLOGY》;20070907;第73卷(第22期);第7308-7321页 *
参与土壤氮素循环的微生物功能基因多样性研究进展;张晶等;《中国生态农业学报》;20090915(第05期);第1029-1034页 *
土壤微生物生态过程与微生物功能基因多样性;张晶等;《应用生态学报》;20060628(第06期);第177-180页 *

Also Published As

Publication number Publication date
CN111218518A (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
US11091813B2 (en) Multitag sequencing ecogenomics analysis
Di Bella et al. High throughput sequencing methods and analysis for microbiome research
CN107077537A (zh) 用短读测序数据检测重复扩增
CN111218518B (zh) 微生物群落特定功能基因多样性分析引物对及分析方法
CN116072218A (zh) 测序方法
CN105950707A (zh) 一种确定核酸序列的方法及系统
Kieser et al. Reverse complement PCR: a novel one-step PCR system for typing highly degraded DNA for human identification
CN105925664A (zh) 一种确定核酸序列的方法及系统
CN110129422B (zh) 基于长片段pcr和单分子测序解析多核苷酸重复突变疾病突变结构的方法
CN110894526A (zh) 一种底栖动物coi基因的高通量测序方法及其应用
CN110088840B (zh) 校正核酸序列读数的重复区域中的碱基调用的方法、系统和计算机可读媒体
Silva et al. Best practices for generating and analyzing 16S rRNA amplicon data to track coral microbiome dynamics
CN114496091A (zh) 对组装的基因组进行优化的方法
CN115867676A (zh) 细胞群的处理方法和细胞群中所含的基因的分析方法
Cai Spatial mapping of single cells in human cerebral cortex using DARTFISH: A highly multiplexed method for in situ quantification of targeted RNA transcripts
US11001880B2 (en) Development of SNP islands and application of SNP islands in genomic analysis
US7695901B2 (en) Identification of poinsettia cultivars
CN113637782B (zh) 与急性胰腺炎病程进展相关的微生物标志物及其应用
EP4289966A1 (en) Genetic information analysis system and genetic information analysis method
CN117637025A (zh) 一种内陆河突发水污染溯源方法
Barbaro Overview of NGS platforms and technological advancements for forensic applications
Sajal et al. Current Molecular Technologies for Assaying the Gut Microbiota: Next‐generation DNA Sequencing
Coate Beyond Transcript Concentrations: Quantifying Polyploid Expression Responses per Biomass, per Genome, and per Cell with RNA-Seq
CN117965748A (zh) 一种基于snv和indel甄别同卵双胞胎的鉴定方法
US20190264259A1 (en) Method for determining origin of human genomic dna of 100 pg or less, method for identifying individual, and method for analyzing level of engraftment of hematopoietic stem cells

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant