CN109943654A - 基于内参序列的细菌菌群组成与绝对含量检测的方法 - Google Patents

基于内参序列的细菌菌群组成与绝对含量检测的方法 Download PDF

Info

Publication number
CN109943654A
CN109943654A CN201910295389.XA CN201910295389A CN109943654A CN 109943654 A CN109943654 A CN 109943654A CN 201910295389 A CN201910295389 A CN 201910295389A CN 109943654 A CN109943654 A CN 109943654A
Authority
CN
China
Prior art keywords
sequence
seq
quantitation
reference sequence
qualitative reference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910295389.XA
Other languages
English (en)
Other versions
CN109943654B (zh
Inventor
姜正文
方欧
徐流凤
王滔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Genesky Bio-Tech Co Ltd
Original Assignee
Shanghai Genesky Bio-Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Genesky Bio-Tech Co Ltd filed Critical Shanghai Genesky Bio-Tech Co Ltd
Priority to CN201910295389.XA priority Critical patent/CN109943654B/zh
Publication of CN109943654A publication Critical patent/CN109943654A/zh
Application granted granted Critical
Publication of CN109943654B publication Critical patent/CN109943654B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了基于内参序列的细菌菌群组成与绝对含量检测的方法。具体地,本发明提供了一种用于细菌菌群组成与绝对含量检测的定量标准品,其包括至少3条选自R1‑R9的定量参考序列,优选地还包括指示内参。本发明提供的方法可以准确地检测细菌菌群组成和含量,有结果准确、检验快速、成本低廉等优点。

Description

基于内参序列的细菌菌群组成与绝对含量检测的方法
技术领域
本发明属于生物信息学和生物技术领域,具体地,本发明涉及基于内参序列的细菌菌群组成与绝对含量检测的方法。
背景技术
作为微生物多样性和群落结构差异研究的利器,16S rDNA扩增子测序技术自面世以来,一直是宏基因组研究重要的策略之一。然而,传统的16S rDNA扩增子测序技术仅能够对各分类单元相对丰度进行检测,因技术本身及分析方法的缘故,无法对更接近真相本质的绝对丰度进行检测,这不仅限制了16S rDNA扩增子测序技术的应用,甚至在某些研究场景中造成结论错误。应对这一现状,科研工作者陆续开发出一系列16S rDNA扩增子测序绝对定量技术,主要包括qPCR方法和内参序列方法:
基于qPCR方法。使用传统qPCR对16S总拷贝数进行绝对定量后,结合扩增子测序得出的各分类单元相对丰度计算绝对丰度的方法,其作为目前的主流,能够较简单地实现微生物的绝对定量。该方法将“扩增子测序”与“定量”完全割裂开来,优势在于实验灵活,可有选择地对样本进行绝对定量分析;但qPCR绝对定量技术对样品质量要求较高,尤其对PCR抑制剂敏感,而这却是土壤/肠道等微生物研究的主要对象无法规避的问题。此外,这种方法在保证灵活性的同时不可避免地延长了检测时间;同时因测序技术与qPCR技术依赖完全不同的实验平台,对研究者的硬件要求也较高。
基于内参序列方法。这类方法通过向样品DNA中添加一定比例的内参序列片段,与微生物16S rDNA同时构建扩增子测序文库,在数据分析过程中,以内参序列片段的绝对拷贝数计算各分类单元的绝对丰度,主要有以下两种方法:
A)浙大专利技术《土壤细菌高通量绝对定量方法》CN 107190055A,公开了一种土壤细菌高通量绝对定量方法,包括以下步骤:1)将E.coliHTAQ-GFP菌体,涡旋重悬于无菌水中,调节菌悬液在紫外分光光度计OD600nm=1.0;2)对内标菌株HTAQ-GFP进行绝对定量,获得菌液中内标菌株E.coli HTAQ-GFP绝对含量;3)添加内标菌株HTAQ-GFP菌液至土样并搅拌混匀;4)提取土壤DNA,进行16SrRNA基因扩增子高通量测序,获得细菌群落结构分类组成信息及对应相对丰度;5)根据内标菌株HTAQ-GFP绝对含量及高通量测序结果中Escherichia相对丰度计算,获得土壤土著细菌总量及各分类单元的绝对含量。该方法的缺点如下:1)上述技术使用表达荧光的活菌(E.coli HTAQ-GFP),计数需专业设备(荧光显微镜)。且活菌难以保存,在实验过程中仍有增殖的可能,造成结果不准确。2)上述技术为了避免和土壤中菌株冲突,使用了E.coli的亚种E.coli O157:H7,该菌株是一种致病菌,可能导致肠出血,使用过程中存在安全隐患。3)该方法极易受到样本中本身存在的E.coli大肠杆菌影响,虽E.coli大肠杆菌在未施用粪肥的土壤中的含量可忽略不计,但也毕竟因此限制了该方法的应用。4)E.coli大肠杆菌基因组含有7个rDNA拷贝,而不同物种中rDNA拷贝数不等,因此以内标大肠杆菌细胞数作为内标参照,检测绝对细菌总量或各分类单元的绝对含量的方法并不严谨。5)仅添加了一种内参(大肠杆菌),无法设置重复;此外,定量结果不准确,并且无法给出检出上限/下限。
B)日本的专利技术(Japanese patent application number 2014–089029,Tourlousse,Dieter M.,et al."Synthetic spike-in standards for high-throughput16S rRNA gene amplicon sequencing."Nucleic acids research 45.4(2017):e23-e23.)。该方案主要包括:1)该专利技术使用按比例混合的人工合成DNA作为内参序列作为细菌总量及各分类单元绝对定量的参照标准,且这些序列经特殊方法设计,并经过实验优化确保a)不和自然界物种16S冲突;b)扩增效率一致,重复性好;内参序列各浓度梯度与测序数据具有较好的线性关系。2)向土壤中抽提的DNA中加入一定比例的上述内参序列混合物,进行16SrDNA扩增子高通量测序,获得细菌群落结构分类组成的丰度。3)以内参序列的拷贝数为纵坐标,测序获得的对应读序条数为横坐标,绘制标准曲线,并基于此计算各分类单元的绝对rDNA绝对拷贝数。该方案在的缺陷在于:并无有效的方案控制内参序列的添加比例。虽内参序列占整体测序数据的比例对各分类水平的定量并无显著影响,但会造成1)测序成本升高;2)如过少添加内参序列,低浓度梯度无法被检测到,造成内参序列标准曲线不完整,线性范围因此变狭窄;3)如过高添加内参序列,则会导致样本中真实16S的测序数减少,无法达到预期的实验要求。
因此,本领域迫切需要开发一种能够准确检测细菌菌群组成与绝对含量的新方法。
发明内容
本发明的目的是提供一种能够准确检测细菌菌群组成与绝对含量的新方法。
本发明的第一方面,提供了一种定量标准品,所述定量标准品包括至少3条选自下组的定量参考序列:
(1)第一定量参考序列R1,所述第一定量参考序列R1是基于SEQ ID NO.:1的序列;
(2)第二定量参考序列R2,所述第二定量参考序列R2是基于SEQ ID NO.:2的序列;
(3)第三定量参考序列R3,所述第三定量参考序列R3是基于SEQ ID NO.:3的序列;
(4)第四定量参考序列R4,所述第四定量参考序列R4是基于SEQ ID NO.:4的序列;
(5)第五定量参考序列R5,所述第五定量参考序列R5是基于SEQ ID NO.:5的序列;
(6)第六定量参考序列R6,所述第六定量参考序列R6是基于SEQ ID NO.:6的序列;
(7)第七定量参考序列R7,所述第七定量参考序列R7是基于SEQ ID NO.:7的序列;
(8)第八定量参考序列R8,所述第八定量参考序列R8是基于SEQ ID NO.:8的序列;和
(9)第九定量参考序列R9,所述第九定量参考序列R9是基于SEQ ID NO.:9的序列。
在另一优选例中,所述的定量参考序列均含有以下序列区段:
C2区段:CCAGACTCCTACGGG(A/T/C/G)GGC(A/T)GCAG(SEQ ID NO.:19);
C3区段:GTGCCAGC(A/C)GCCGCGGTAA(T/C)ACG(SEQ ID NO.:20);
C4区段:GGATTAGA(A/T)ACCC(T/G/C)(A/T/G)GTAGTCC(SEQ ID NO.:21)和
C5区段:AAACT(T/C)AAA(T/G)GAATTGACGG(SEQ ID NO.:22)。
在另一优选例中,所述的定量参考序列具有式I结构:
C2-D1-C3-D2-C4-D3-C5 (式I)
式中,
C2为SEQ ID NO.:19所示的序列;
C3为SEQ ID NO.:20所示的序列;
C4为SEQ ID NO.:21所示的序列;
C5为SEQ ID NO.:22所示的序列;
D1为长度为154-160bp的第一随机序列;
D2为长度为244-250bp的第二随机序列;
D3为长度为97-103bp的第三随机序列。
在另一优选例中,所述第一、第二、第三随机序列中的GC含量为35-55%。
在另一优选例中,所述“基于SEQ ID NO.:N的序列”包括:
(a)SEQ ID NO.:N所示的序列,和/或
(b)长度为SEQ ID NO.:N所示序列长度的80%-120%,并且与SEQ ID NO.:N所示序列具有至少90%(较佳地≥95%,更佳地≥98%,更佳地100%)同一性的序列;
其中N为1、2、3、4、5、6、7、8或9。
例如,所述“基于SEQ ID NO.:1的序列”包括:
(a)SEQ ID NO.:1所示的序列,和/或
(b)长度为SEQ ID NO.:1所示序列长度的80%-120%,并且与SEQ ID NO.:1所示序列具有至少90%(较佳地≥95%,更佳地≥98%,更佳地100%)同一性的序列。
“基于SEQ ID NO.:2的序列”至“基于SEQ ID NO.:9的序列”的定义参照“基于SEQID NO.:1的序列”的定义,依次类推。
在另一优选例中,所述定量标准品包括定量参考序列R1、R2、R3、R4、R5、R6、R7、R8和R9。
在另一优选例中,所述R1-R9的长度各自独立地为600-700bp,较佳地645-675bp。
在另一优选例中,所述定量标准品中,R1:R2的摩尔比或质量比为(0.5-5):1,较佳地(0.8-2):1,较佳地1:1。
在另一优选例中,所述定量标准品中,R2:R3的摩尔比或质量比为(5-50):1,较佳地(8-20):1,较佳地10:1。
在另一优选例中,所述定量标准品中,R3:R4的摩尔比或质量比为(0.5-5):1,较佳地(0.8-2):1,较佳地1:1。
在另一优选例中,所述定量标准品中,R4:R5的摩尔比或质量比为(5-50):1,较佳地(8-20):1,较佳地10:1。
在另一优选例中,所述定量标准品中,R5:R6的摩尔比或质量比为(0.5-5):1,较佳地(0.8-2):1,较佳地1:1。
在另一优选例中,所述定量标准品中,R6:R7的摩尔比或质量比为(5-50):1,较佳地(8-20):1,较佳地10:1。
在另一优选例中,所述定量标准品中,R7:R8的摩尔比或质量比为(0.5-5):1,较佳地(0.8-2):1,较佳地1:1。
在另一优选例中,所述定量标准品中,R8:R9的摩尔比或质量比为(0.5-5):1,较佳地(0.8-2):1,较佳地1:1。
在另一优选例中,所述多条定量参考序列之间存在浓度梯度差。
在另一优选例中,所述多条定量参考序列中,2-6条(较佳地2-3条)定量参考序列浓度可以相同。
在另一优选例中,所述多条定量参考序列之间存在5-20倍的浓度梯度差。
在另一优选例中,相邻浓度的两条定量参考序列的浓度梯度差为2-50倍,较佳地,更佳地为5-20倍。
在另一优选例中,所述定量标准品还包括指示内参R0。
在另一优选例中,所述的指示内参R0含有以下序列区段:
C2区段:CCAGACTCCTACGGG(A/T/C/G)GGC(A/T)GCAG(SEQ ID No.:19);
C3区段:GTGCCAGC(A/C)GCCGCGGTAA(T/C)ACG(SEQ ID NO.:20);
C4区段:GGATTAGA(A/T)ACCC(T/G/C)(A/T/G)GTAGTCC(SEQ ID NO.:21);和
C5区段:AAACT(T/C)AAA(T/G)GAATTGACGG(SEQ ID NO.:22)。
在另一优选例中,所述的指示内参R0具有式II结构:
C2-E1-C3-E2-C4-E3-C5 (式II)
式中,
C2为SEQ ID NO.:19所示的序列;
C3为SEQ ID NO.:20所示的序列;
C4为SEQ ID NO.:21所示的序列;
C5为SEQ ID NO.:22所示的序列;
E1为长度为207-307bp的第四随机序列;
E2为长度为297-397bp的第五随机序列;
E3为长度为150-250bp的第六随机序列。
在另一优选例中,所述第四、第五、第六随机序列中的GC含量为35-55%。
在另一优选例中,所述指示内参具有如SEQ ID NO.:10所示的序列。
在另一优选例中,所述定量标准品中,指示内参R0:总定量参考序列的摩尔比或质量比为(0.1-10):1,较佳地(0.5-2):1,如1:1。
在另一优选例中,所述定量标准品包括1条指示内参。
在另一优选例中,所述定量标准品包括9条定量参考序列。
在另一优选例中,所述定量标准品中,R0:R1:R2:R3:R4:R5:R6:R7:R8:R9的摩尔比或质量比为(1111.5-4446):(500-2000):(500-2000):(50-200):(50-200):(5-20):(5-20):(0.5-2):(0.5-2):(0.5-2)。
在另一优选例中,所述定量标准品中,R0:R1:R2:R3:R4:R5:R6:R7:R8:R9的摩尔比或质量比为2223:1000:1000:100:100:10:10:1:1:1。
在另一优选例中,所述定量参考序列的总浓度为2.2×103-2.2×109拷贝/μl,以定量标准品的总体积计算。
在另一优选例中,所述定量参考序列的总浓度为2.2×103-2.2×107拷贝/μl,较佳地为2.2×104-2.2×106拷贝/μl。
在另一优选例中,所述定量标准品中,R1的浓度为1×103-1×109拷贝/μl,较佳地为1×103-1×107拷贝/μl,较佳地为1×104-1×106拷贝/μl。
在另一优选例中,所述定量标准品中,R9的浓度为1×100-1×106拷贝/μl,较佳地为1×100-1×104拷贝/μl,较佳地为1×101-1×103拷贝/μl。
在另一优选例中,所述定量标准品中,R0的浓度为2.2×103-2.2×109拷贝/μl,较佳地为2.2×103-2.2×107拷贝/μl,较佳地为2.2×104-2.2×106拷贝/μl。
在另一优选例中,所述各定量参考序列位于载体上。
在另一优选例中,所述载体为质粒。
本发明的第二方面,提供了一种试剂盒,所述试剂盒包含权利要求1所述的定量标准品。
在另一优选例中,所述定量标准品中的各定量参考序列为独立的。
在另一优选例中,所述各定量参考序列位于载体上,较佳地位于质粒(如pUC19)上。
在另一优选例中,所述定量标准品中的各定量参考序列位于不同的载体上。
在另一优选例中,所述定量标准品中的各定量参考序列位于相同或不同的容器内。
在另一优选例中,所述试剂盒中还包括引物对,所述引物对特异性扩增16srDNA。
在另一优选例中,所述试剂盒还包括选自下组的一对或多对引物对:
(1)SEQ ID NO.:11和SEQ ID NO.:12所示的引物对;
(2)SEQ ID NO.:13和SEQ ID NO.:14所示的引物对;
(3)SEQ ID NO.:15和SEQ ID NO.:16所示的引物对;和/或
(4)SEQ ID NO.:17和SEQ ID NO.:18所示的引物对。
本发明的第三方面,提供了如权利要求1所述的定量标准品、或权利要求5所述的试剂盒的用途,用于检测细菌菌群组成和含量。
在另一优选例中,所述含量为绝对含量。
在另一优选例中,所述检测为非诊断或治疗目的。
本发明的第四方面,提供了一种细菌菌群组成和含量的检测方法,包含以下步骤:
(a)提供一待测样品;
(b)从所述样品中,提取总DNA,获得总DNA样本;
(c)将上一步骤的总DNA样本与权利要求1所述的定量标准品进行混合,得到第一混合物;
(d)用上一步骤的第一混合物进行16s rDNA PCR扩增,得到16s rDNA PCR扩增产物;
(e)利用上述16s rDNA PCR扩增产物构建文库并测序,从而获得所述待测样品的16s rDNA读序和所述定量标准品的读序;
(f)将所述待测样品的16s rDNA读序与所述定量标准品的读序进行分析和比对,从而获得细菌群落结构分类组成与相对丰度信息,以及待测样品中各物种16SrDNA与所述各条定量标准品的读序条数;和
(g)根据所述定量标准品计算所述待测样本中细菌的总量和各类细菌的含量。
在另一优选例中,所述步骤(b)中,还包括对提取的总DNA样本进行标化,较佳地标化为8-12ng/μl,更佳地为10ng/μl。
在另一优选例中,所述步骤(d)中,还包括测定所述定量标准品在所述PCR扩增产物总DNA中的比例。
在另一优选例中,所述步骤(d)中,还包括测定定量参考序列和/或指示内参R0在所述PCR扩增产物总DNA中的比例。
在另一优选例中,所述定量参考序列包括:R1、R2、R3、R4、R5、R6、R7、R8、R9、或其组合。
在另一优选例中,所述步骤(d)中,还包括通过毛细管电泳,计算指示内参R0的峰面积HA与目标条带(包括样品DNA和定量参考序列)的峰面积HT的比例(HA/HT),从而计算定量参考序列在所述PCR扩增产物总DNA中的比例。
在另一优选例中,所述步骤(d)中,还包括挑选所有定量参考序列在所述PCR扩增产物总DNA中的比例和为10%-40%的混合物。
在另一优选例中,所述步骤(e)中,所述构建文库包括进行Index PCR。
在另一优选例中,所述步骤(e)中,所述测序为高通量测序。
在另一优选例中,所述步骤(f)中,在进行分析和比对前还包括:将全部读序结果(包括所述待测样品的16s rDNA读序和定量标准品的读序结果)分别按至少97%(如98%、99%或100%)一致性聚类为-OTU。
在另一优选例中,所述步骤(f)中,还包括对聚类后的OTU进行物种注释。
在另一优选例中,通过将所述待测样品的16s rDNA读序结果进行数据库比对,从而对聚类后的OTU进行物种注释。
在另一优选例中,所述步骤(f)中,所述数据库为16S数据库或NCBI nt数据库。
在另一优选例中,所述步骤(g)中,通过与标准曲线的比较或通过拟合公式的计算。
在另一优选例中,所述标准曲线以定量参考序列的读序条数为横坐标,绝对拷贝数为纵坐标。
在另一优选例中,所述步骤(g)中,通过以下公式A计算所述待测样本中细菌的总量:
N_total=n_total×N/10I (A)
式中,
N_total为单位量纲样本中细菌的拷贝数总量;
n_total为所述PCR扩增产物中总16S的拷贝数;
N为所述样品中提取出的总DNA量,单位为ng;
I为所述用于抽提DNA的待测样品总量。
在另一优选例中,所述步骤(g)中,通过以下公式B计算所述待测样本中各类细菌的含量:
N_x=n_x×N/10I (B)
式中,
N_x为单位量纲样本中特定分类单元的拷贝数;
n_x为各水平分类单元的拷贝数;
N和I的定义如上所述。
在另一优选例中,所述检测方法为非诊断或治疗目的。
在另一优选例中,所述含量为绝对含量。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了本发明检测细菌菌群组成与绝对含量的技术方案实验流程图。
图2显示了使用PeakScan软件展示的毛细管电泳结果。PCR产物以峰形式表现,产物长度对应峰所处的横坐标值,产物拷贝数绝对值对应峰面积,峰面积可由PeakScan软件计算获得。目标峰含有样品DNA与“定量参考序列”的扩增产物,无法区分;指示峰仅包含“指示内参”的扩增产物,因“指示内参”与“定量参考序列”拷贝数绝对值的比例已知(在本实施例中为1:1关系),因此可由“指示峰”的峰面积估计目标条带中由“定量参考序列”贡献的峰面积占比,其值对应“定量参考序列”占总序列数的比例。
图3显示了分别使用3种浓度的“内参序列混合物”(BSIS-4,BSIS-5,BSIS-6),检测同一份标准样品(ZymoBIOMICS Microbial Community Standard,Zymo,D6305)中的微生物16S绝对拷贝数实验结果。图A-C,添加3种浓度的BSIS检测出的16S拷贝数与理论值比较。45°斜线表示检测值与理论值完全一致,散点表示标准品中每种细菌16S实际的检出值与理论值,虚线为蓝点的线性拟合,显然,虚线越接近45°斜线,表明绝对拷贝数检测结果更准确。图D-F,添加3种浓度BSIS,测序获得的各“定量参考序列”的读序条数与对应绝对拷贝数在取对数(log10)后所绘制的标准曲线。9条“定量参考序列”拷贝数间为10倍梯度关系,因此标准曲线理论斜率应为1。
图4真实土壤样品中属水平16S的绝对拷贝数。使用本发明方法检测的真实土壤样品中微生物的16S拷贝数绝对值,_1,_2,_3分别为同一份土壤的技术重复,可见本方法检出结果具有较高的可重复性。
图5显示了定量参考序列特征示意图。其中下划线部分依次为C2区段、C3区段、C4区段和C5区段。
图6显示了指示内参序列特征示意图。其中下划线部分依次为C2区段、C3区段、C4区段和C5区段。
具体实施方式
本发明人经过广泛而深入的研究,首次意外地发现,本发明定量标准品中的9条特定的定量参考序列可以准确地检测细菌菌群组成和含量。本发明使用数条按10倍梯度比例混合的“定量参考序列”实现单个文库单次测序同时获得样本中微生物的组成信息和绝对定量数据。此外,本发明还引入了1条估算“定量参考序列”占比的“指示内参”。借助这些人工合成的序列,发明了一种基于毛细管电泳,通过荧光峰的峰面积比估算“定量参考序列”比例的方法,有效解决了现有技术中因无法控制定量参考序列的添加比例而产生的种种问题与局限。在此基础上,发明人完成了本发明。
本发明建立了一种高效检测多种类型样品中细菌总量及各分类单元绝对含量的方法。该方法能够保证添加的“定量参考序列”占总序列数比例合适,从而整体提高实验的均一性,稳定性,有效避免因添加不合适比例“定量参考序列”造成的测序数据量浪费,结果偏差甚至实验失败等问题。
术语说明
除非另外定义,否则本文中所用的全部技术与科学术语均具有如本发明所属领域的普通技术人员通常理解的相同含义。
如本文所用,在提到具体列举的数值中使用时,术语“约”意指该值可以从列举的值变动不多于1%。例如,如本文所用,表述“约100”包括99和101和之间的全部值(例如,99.1、99.2、99.3、99.4等)。
如本文所用,术语“含有”或“包括(包含)”可以是开放式、半封闭式和封闭式的。换言之,所述术语也包括“基本上由…构成”、或“由…构成”。
如本文所用,缩写OTU指Operational taxonomic unit,分类单元。
如本文所用,“同一性”、“序列同一性”可互换使用,通过沿着预定的比较窗(其可以是参考核苷酸序列或蛋白的长度的50%、60%、70%、80%、90%、95%或100%)比较两个对齐的序列,并且确定出现相同的残基的位置的数目来确定。通常地,这表示为百分比。核苷酸序列的序列同一性的测量是本领域技术人员熟知的方法。
定量标准品及检测方法
如本文所用,术语“内参序列混合物”、“定量标准品”可互换使用,缩写BSIS:Bacterial Spike-In Standards,具体如本发明第一方面所述。
在另一优选例中,所述定量标准品包括定量参考序列(又称定量内参),所述定量参考序列包括:R1、R2、R3、R4、R5、R6、R7、R8、R9、或其组合。
在另一优选例中,所述定量标准品包括定量参考序列R1、R2、R3、R4、R5、R6、R7、R8和R9。
R1的序列如下:
ACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATTACTAGCTTCGTTTCCCACCAGGATAGTTAGGAGTGCCGACCCGTTATAGAAGTGCAGTGTCCTTTCTCTGCACTCGAGTTAAGTCGACAAGTCCTCTTACGCTAGGACTCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTCATCGCGAGGCTTTATACGAGGCACCAAATAAGCACCGTAATAAGTGAGTCCCGCGGGCTTATTGTGCTGCAGTATAGCTACTATAGCGTAGGGATCGATATCAGCTATACCTAGATGAGAGCCCATTTCCGCTCGATATACCTAGGGACACGTAGATGTACTATTTCGGCGACTTGGATGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATCTACCACATCAGGCACTTGGCTATGAAGACTGCGTAAGCCATTTAGAGTTCGGGCTCCTTCTAAGGCTTAGCAGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCT(SEQ IDNO.:1)
R2的序列如下:
ACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATAATGCGACGCACGTTAGCAGGCCCTAGTTATTAGCCCGTAGCTTGAAGCACTAGATTCTACGCGGGTTCATCAGCCCAGACCCAACAATGAGGGTCCAATCCATGGCTAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTGTAAGGCGACTTCTCTTATGACCAAAGTGGGCGTCCATGGCTTAGACTCGTGTGGCTCGAACCGAAGTCTTGACGTGATCTCGGGAGGGATGGTCGAGCTACTACCACACTCTCGGCTCAATTACCGTGTGACATCGGATACTCCAACATGGCACGGCGACTGTATTACACGATCCTGGTGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGCGTTCATGATAGGTTCTCGGCAGCTAAAGGACTGCTATCTACTGGGAATAGCTGCCTTGTGACACTGTTCCTTGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCT(SEQ IDNO.:2)
R3的序列如下:
ACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATCATCTGGTCAGGTCTCCTCGACCTACCTACATGTGTGGCACGTTCGAGAGCGTGCTTTCGACCAGTATTGGCGCTCGTCCATAGCTAAGCGCCTAACTGCATAGCTACCTCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGGTTAGGCACACATGGCACCGGTCTGCGTTGTGAGCGTACCTTTCACCTCCTATCGCCGTCGTCGGCGTTATAGACAGCACTCCTTCGTTGCTACTACCTGGGTAGGTTAGCACCACGAATCATCCCGACGAAATGACACCGGATCGGGCTGATAGGTGACTCGGAAAGCTGAATCGAGGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGCTTTCCTATGGACTGGACAAGTGCCTCTCCAGCTAACTGCAACAGTCGTGGATCAGGTAATGGTAGAGCTCAGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCT(SEQ IDNO.:3)
R4的序列如下:
ACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATTGCGCTCCGAGTATCGACTCAAGCCTCACTAGGAACAGCGGGCGTTTGCACGAACCCTGTTCCGCCGGCTTTGAGTTACTGTCGTGCTGACGCCGTTGAGGCGAGGGTTGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTGAAGGCGTTGCGTTCTTCTCGCTGGACCAGACTCTAATGGCATGTCTCATTCTGTCGTGGCCTGTATTCGCGGAGTGTGTGAGTCTTTGGGCAATGTCAGCAGTGAGCTACCCTGGGAGCAGCCGGACCTCTCTTGAGCGAATGCAGACGGGTTACCGAATCACACCCACCCTCACAGCGGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATAGGCGTTCTGGTGCCCACAATCCTGATCCTGGCATGGGACTACTGTTGGGCGTTATCGAACACACGGAGAGACGTCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCT(SEQ IDNO.:4)
R5的序列如下:
ACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATTTCGGACCTGTGAGCTATGCTGCGCTATGTGCTTAGGGTCGCCTGGACGTTCACAGGATTCCGTCGTGATGCCCATCTTCGAGGTGTGGTAGCGGACGGACGCCATCCGTCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTGCCGGGTATTGTAGAGACGTCGCACTTACTTGCTCCACCCGACTCGACCCTGTTGGGTTACCGCGGAAAGTTTGGTCGTCCTCTCTGCCATCAGGCGGGATATAGGGAGCTCCGGCAAACGTGGTGCATCCGCAGAGCGGGATGCTGTGGTCAGCTTGGACTTGACGACTGTACCTCAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATACACGGGCTAATCTGTAATCTCCGGTTCCTTGACGCTGCCATGGCGTTTACGACGTTACGGACCACTTGCCAGAACCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCT(SEQ IDNO.:5)
R6的序列如下:
ACTGAGACACGGTCCAAACTCCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGGCGAGAGCCTGAAGCTATGCCACAGGTTCGGACGGCTGTTAGTGCGGACTGCGGTCCTTAAAGCCGTCAGCCATCCGTACCGTTAGCTCAGCGTCCCTAGCCTTCGCATCGAACGCGACACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGCTGGCTTGCTATGGAGTTGGATCTCACAGTGTGTGTAACATGGCAGCGCTCCCGATTTCAACAGAGGCCGTTGACGCGCCGATTGAGCCTCCCATGGCATTGGTCGACCATCAACACGAGCTCGTTGGCTGTGCTGAATAGGGTGCGAGCAGCATCTAGGCGGAATTTCCATCGTGGTGTGGGTATCAAACAGGATTAGATACCCTGGTAGTCCACACGGTAAACGATGCTTAGATGACGGGTGCAGATCCTCTAGATTCCACCGCGAATAGGTCCCGTGAACTCTGCTCCCGGTTGGTACGGCAACGGTGAAACTCAAAGGAATTGACGGGGGCCGGCACAAGCGGAGGAACATGTGGTTTAATTCGATGATACGCGAGGAACCTTACCCGGGCT(SEQ ID NO.:6)
R7的序列如下:
ACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGGGAAACCCTGATATTCCGTCAGAGCCGCACATAAGGCCAGCAGGGATGACTAGATATTCCCGCACGCCGACACTGACACTGTCAACGGGTGCAGGTACCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGATTTACTGGGCGTAAAGGGAGCGTAGGTGGATTGCCTAGCCTAGCGGTTGGAGCGGGAATACTAAGGTGCAGTGTTTCCCATGGCCGGATTTAGGCGCTTCACGGGATCGTCGAGTTCGTCTGGGCATAGGTCGCGTCACGCTTTCATTCGAAGCCGATCTCGGACCGCCACCGATAAGGCAGTAGTCGCCTGTGGCATGTGCCTCGCTGAGGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATTGTAAGGTAGCCCGTGTAAGGGTACCTCGCAGATTCGCCAAGAACGAGCAAGGGCTAGTGTGTTGACGGTTACTCTCGCAAGATTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCAGCGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCTAGACT(SEQ ID NO.:7)
R8的序列如下:
ACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCGCAATGGCCGAAAGGCTGACCCTGAACTCTTGGGATGCGACGTTGAGGGCTGCTGGCATTAGCGAACCGCAATCCCGTACTTGGTAGACAACGAACCCAACACTCCGGAGAGACTGCCTACGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTGTCCGGAATCACTGGGCGTAAAGGGCGCGTAGGCGGTCCGATACGAAACTTCTTGCACAGGCATGAGGCACGCGTGCGTACCAGACGGCCTCGGAATACACCGGAAACCTTTGAGGCCGCTCCCAGGTGTACGCGAGGCACCAAAGCGGTATTCCATGGTAGAGAACACTGCTGCGGATTACCGACATTTAGCCTCGCGTATAGCACCCTGCCGTTGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGGACAACCACGCGGTTACACGCGGAGATCCCGCCAGATGAGAGCCCAGGCATCACAGCGATCAGGCACTTGACATACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGACGCAACGCGAAGAACCTTACCCAGGCT(SEQ ID NO.:8)
R9的序列如下:
TGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGCTAAGAATATTCCGCAATGGACGAAAGTCTGACGTAAATCGCCACCTGGAATCAGGGTGCGCTGTCGTGTGCGGATCGCATGACCGCCAATTCCGTGTAGCAGGGATAGCCTCCCACCTTCGATGATGGCTCGGCATCTGCTCCAACGGCTAATTACGTGCCAGCAGCCGCGGTAACACGTAAGTTGCGAGCGTTGTTCGGAATTATTGAGCGTAAAGGGCATGTAGGCGGTTGTTTGCTCGACATGGTTCGAGCTGGTAGAGATGCGGCCGTCCTAAGAGGAGAGTAGTGCGTCGCAAAGCACCCGGGTCAAGAGCCGGAGTTGACAGCACACCTTGACTCACTCGTATGGCAATAGCAGGACCACATTCGGGTTCGCGCATTACGATTACCACGTGGTCCTTGCTCGACCCGCGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCGCACAGTCAACTATAGGGTGGCTGATGGAGGTAGAGACGACGGACTGCGAGGTGTGGTAGTTTCCTTCCGAGGGTGCACGGTTAGCCCGCAAGGGTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGGTACGCGAGGAACCTTACCTGGGTT(SEQID NO.:9)
在另一优选例中,所述定量标准品还包括指示内参R0。
R0的序列如下:
TGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGCTAAGAATATTCCGCAATGGACGAAAGTCTGACGTAAATCGCCACCTGGAATCAGGGTGCGCTGTCGTGTGCGGATCGCATGACCGCCAATTCCGTGTAGCAGGGATAGCCTCCCACCTTCGATGATGGCTCGGCATCTGCTCCAACGGCTAATTACGTGCCAGCAGCCGCGGTAACACGTAAGTTGCGAGCGTTGTTCGGAATTATTGAGCGTAAAGGGCATGTAGGCGGTTGTTTGCTCGACATGGTTCGAGCTGGTAGAGATGCGGCCGTCCTAAGAGGAGAGTAGTGCGTCGCAAAGCACCCGGGTCAAGAGCCGGAGTTGACAGCACACCTTGACTCACTCGTATGGCAATAGCAGGACCACATTCGGGTTCGCGCATTACGATTACCACGTGGTCCTTGCTCGACCCTCCCTTGTCTCCCTACCTCTGGAGGAGAAAAGTGTTGACATGGGCGCTCCCGGCGCAAGGGCCAAAGGAGTCTCCGATTTCTTATTCCCGAATGACATGCGCGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCGCACAGTCAACTATAGGGTGGCTGATGGAGGTAGAGACGACGGACTGCGAGGTGTGGTAGTTTCCTTCCGAGGGTGCACGGTTAGCCCGCAAGGGTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGGTACGCGAGGAACCTTACCTGGGTT(SEQ ID NO.:10)
在本发明中,用于16S绝对拷贝数检测的人工合成的“内参序列混合物”:
“定量参考序列”:用于绘制标准曲线并计算各分类单元16S的绝对拷贝数。自5’端向3’端依次排列有
C2序列:CCAGACTCCTACGGG(A/T/C/G)GGC(A/T)GCAG;
C3序列:GTGCCAGC(A/C)GCCGCGGTAA(T/C)ACG;
C4序列:GGATTAGA(A/T)ACCC(T/G/C)(A/T/G)GTAGTCC;
C5序列:AAACT(T/C)AAA(T/G)GAATTGACGG。且这些序列分别以长度157±3bp,247±3bp,100±3bp的GC含量介于35%-55%的随机序列分隔(如图5所示)。
“指示内参”:用于在二代测序前评估“定量参考序列”与样本中16S拷贝数的比例。为单条符合下述特征的人工合成序列。自5’端向3’端依次排列有
C2序列:CCAGACTCCTACGGG(A/T/C/G)GGC(A/T)GCAG;
C3序列:GTGCCAGC(A/C)GCCGCGGTAA(T/C)ACG;
C4序列:GGATTAGA(A/T)ACCC(T/G/C)(A/T/G)GTAGTCC;
C5序列:AAACT(T/C)AAA(T/G)GAATTGACGG。且这些序列分别以长度257±50bp,347±50bp,200±50bp的GC含量介于35%-55%的随机序列分隔(如图6所示)。
在本发明中,人工合成的定量参考序列和指示内参DNA包括但不限于质粒、化学合成DNA、PCR产物等形式。
在本发明的一个优选的实施方式中,所述定量标准品包括至少3条“定量参考序列”,1条“指示内参”按一定梯度比例混合为“内参序列混合物”。
本发明的技术方案,具有如下有益效果:
(1)本发明方法通过单个16S扩增子绝对定量测序可同时获得样本中微生物的组成信息和绝对定量数据。本发明方法结果准确、检验快速、成本低廉。
(2)本发明方法保证向各类型样本中添加“定量参考序列”的比例,有效控制因“定量参考序列”比例不当引起的风险。
(3)本发明定量标准品中的9条特定的定量参考序列可以准确地检测细菌菌群组成和含量。
(4)本发明建立了一种高效检测多种类型样品中细菌总量及各分类单元绝对含量的方法。该方法引入了1条估算“定量参考序列”占比的“指示内参”,能够保证添加的“定量参考序列”占总序列数比例合适,从而整体提高实验的均一性,稳定性,有效避免因添加不合适比例“定量参考序列”造成的测序数据量浪费,结果偏差甚至实验失败等问题。
下面结合具体实施,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold SpringHarbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。
通用材料和方法
检测细菌菌群组成与绝对含量的方法如下(图1):
1)合成并配制“内参序列混合物”BSIS;(Bacterial Spike-In Standards)
A)化学合成10条定量参考序列(“定量参考序列”Gs_BSI1~Gs_BSI9;“指示内参”Gs_BSI_Marker),并插入到载体PUC19中(本案使用质粒作为定量参考序列的载体,但内参同样可以包括但不限于化学合成DNA,PCR产物等形式存在);
B)以上质粒通过化学转化的方法转入大肠杆菌感受态细胞,挑取单克隆菌落于LB培养基中进行扩大培养;
C)从细菌培养物中抽提质粒,并使用Qubit精确测定质粒浓度,按表1中的比例将各条定量参考序列(质粒)混合,加TE(10mM Tris-Cl,1mM EDTA,pH8.0)至2700ul,标记BSIS-9(本案中使用了9条“定量参考序列”)。
表1内参序列混合物(BSIS)配方
D)使用Qubit精确测定BSIS-9浓度,独立进行3次重复,BSIS-9浓度应为约16.4ng/ul,对应总分子数约4.4×10^9拷贝/ul,若实际测定浓度差异超过10%,则需重新配制;
E)将BSIS-9进行10倍梯度稀释,命名及对应分子拷贝数见表2,其中BSIS-7~BSIS-4能够满足绝大多数实验需求;
表2 10倍梯度稀释BSIS中各定量参考序列拷贝数
2)向样品中添加BSIS并估计BSIS占比
A)以任意方法抽提样本中的total DNA,抽提时取用的各样品用量需相当,并严格记录样本的用量(如克土壤、克粪便、升污水等),记作I,以及抽提所得的DNA总量N(单位为ng);
B)使用Qubit精确测定DNA浓度,并使用1×TE将样品标化为200ng/20ul;
C)取2ul标化后的DNA进行电泳检测,判断样品间浓度的一致性,同时判断DNA的完整程度;明显浓度有偏差的样品需重新标化,降解样品作为质控失败样品不进行后续实验;
D)取1ul BSIS-6,BSIS-5,BSIS-4,BSIS-3,分别添加1ul标化后的DNA样品,使用表3中引物进行25个循环的PCR扩增;
表3本发明兼容的16S扩增区域及对应引物
E)扩增产物经电泳检测,判断是否存在大片段的指示条带;
F)取1ul经10倍稀释后的扩增产物,混合9ul HiDi与0.1ul Liz500,使用3730测序仪进行STR程序检测;
G)使用PeakScan软件(ABI),计算“指示条带的峰面积HA与目标条带的峰面积HT。比例(HA/HT),该比例即为预估的“定量参考序列”占比;
3)Index PCR以及高通量测序
A)挑取“定量参考序列”占比最合适(20%-50%)的样本,进行Index PCR,为扩增子文库两端添加用于区分样品的index序列以及Illumina测序平台所需的通用序列;
B)使用Illumina Hiseq平台进行高通量测序,读长2×250bp,每个样品要求10M测序reads数据量;
4)根据BSIS标准曲线,获得细菌群落结构分类组成(门,纲,目,科,属),相对丰度 与绝对丰度信息;
A)测序数据使用常规分析方法,将序列分别按97%以及99%一致性聚类为OTU,并进行物种注释(如通过将测序数据与数据库(如16S数据库或NCBI nt数据库)进行比对),获得样品中各物种16S rDNA的读序条数,从而获得细菌群落结构分类组成与相对丰度信息;
B)OTU代表序列与9条“定量参考序列”比对,获得9条“定量参考序列”的读序条数;
C)以“定量参考序列”读序条数为横坐标,绝对拷贝数为纵坐标,绘制标准曲线;
D)将样品中各物种总读序条数带入标准曲线,计算该体系中总16S的拷贝数,记作n_total;由此反推到单位样本中的16S的总拷贝数,公式为N_total=n_total×N/10I;
E)以样品各物种读序条数带入标准曲线,计算各水平分类单元的拷贝数n_x(为分类单元),由此反推到单位样本中特定分类单元16S的总拷贝数,公式为N_x=n_x×N/10I。
实施例1向标准品及真实样品中添加定量参考序列,展示3730测序结果能够真实反映“定量参考序列”占比
1)购买标准样品ZymoBIOMICS Microbial Community Standard(Zymo,D6305),使用Qubit精确测定浓度,并将其标化至10ng/ul,记作标准品MSTD-1。MSTD-1标准品与hela细胞基因组按质量比1:9、0.5:9.5、0.1:0.99的比例混合,分别制备MSTD-2、MSTD-3与MSTD-4。此外,取3份土壤微生物DNA,标记为MSTD-5、MSTD-6和MSTD-7。
2)取10ng MSTD(-1~-7),分别添加BSIS-4、BSIS-5与BSIS-6,使用V4V5引物进行PCR扩增。扩增产物经3730基因分析仪毛细管电泳分析后,使用PeakScan软件估算BSIS在每个反应中的占比(图2,表4)。
3)所有反应进行index PCR构建测序文库,并使用Illumina Hiseq平台进行2×250bp测序,分析测序数据中BSIS序列的占比(表4)。
4)通过上述实例,可以得出结论:基于毛细管电泳峰面积比估算的“定量参考序列”占比可真实反映最终测序文库中的内参占比。
使用PeakScan软件展示的毛细管电泳结果。结果如图2所示,PCR产物以峰形式表现,产物长度对应峰所处的横坐标值,产物拷贝数绝对值对应峰面积,峰面积可由PeakScan软件计算获得。目标峰含有样品DNA与“定量参考序列”的扩增产物,无法区分;指示峰仅包含“指示内参”的扩增产物,因“指示内参”与“定量参考序列”拷贝数绝对值的比例已知(在本实施例中为1:1关系),因此可由“指示峰”的峰面积估计目标条带中由“定量参考序列”贡献的峰面积占比,其值对应“定量参考序列”占总序列数的比例。由图可见随添加BSIS浓度的提高,指示峰逐渐可检测,符合实验预期,具体计算结果见表4。
表4“定量参考序列”占比的估算值与真实值
实施例2向标准样品中添加定量参考序列,获得标准品细菌的绝对含量
1)标准品设置
购买标准样品ZymoBIOMICS Microbial Community Standard(Zymo,D6305),使用Qubit精确测定浓度,并将其标化至10ng/ul,标准品中8种细菌的16S绝对拷贝数理论值见表5(第二列):
2)吸取1ul标化后的标准样品,分别添加1ul BSIS-6,BSIS-5,BSIS-4,以此为模板进行PCR扩增,构建16S V4-V5区域扩增子文库,进而进行高通量测序,总测序量相当(平均约8万条原始序列)。获得标准样品中各物种16S及各“定量参考序列”读序条数,并以“定量参考序列”读序条数和实际拷贝数绘制标准曲线(“定量参考序列”读序条数见表6,绘制的标准曲线,方程及R2值见图3。
3)根据标准曲线计算标准样品中,8个物种16S rDNA的绝对含量,结果见表6(3-5列),其和样品中理论值的比较见图3。
结果表明,向样品中添加已知绝对拷贝数的“定量参考序列”可以实现对样品中微生物16S拷贝数的绝对定量,且添加的“定量参考序列”比例的差异并不会显著影响绝对定量结果。然而,若“定量参考序列”数整体过低,标准曲线拟合结果较差;相反,过高序列数的“定量参考序列”虽拟合较优,但需占用更多测序数据量,导致测序成本上升,极端情况下会严重挤压微生物来源的序列数,造成实验失败。显然,“定量参考序列”占总序列的比例直接影响绝对定量实验的结果。
表5 16S标准样品中16S拷贝数理论值与检出值
表6“定量参考序列”读序条数
如图3所示,分别使用3种浓度的“内参序列混合物”(BSIS-4,BSIS-5,BSIS-6),检测同一份标准样品(ZymoBIOMICS Microbial Community Standard,Zymo,D6305)中的微生物16S绝对拷贝数实验结果。图3A-C,添加3种浓度的BSIS检测出的16S拷贝数与理论值比较。45°斜线表示检测值与理论值完全一致,散点表示标准品中每种细菌16S实际的检出值与理论值,虚线为蓝点的线性拟合,显然,虚线越接近45°斜线,表明绝对拷贝数检测结果更准确。由图可知,添加较低浓度BSIS-4时,结果较差;而添加BSIS-5,BSIS-6结果较优。图3D-F,添加3种浓度BSIS,测序获得的“定量参考序列”读序条数与对应绝对拷贝数在取对数(log10)后所绘制的标准曲线。9条“定量参考序列”拷贝数间为10倍梯度关系,因此标准曲线理论斜率应为1:由图可知,添加较低浓度BSIS-4时,线性较差,且斜率偏离1较多,而添加BSIS-5,BSIS-6,标准曲线线性较优,且斜率更接近1。该图表明使用“定量参考序列”检测16S绝对拷贝数具有良好的准确度,但若添加的“定量参考序列”浓度过低,可能会导致最终16S拷贝数绝对定量结果失真,显见本发明中使用“参照内参”预估“定量参考序列”占比方法具有必要性。
实施例3向土壤样品中添加定量参考序列,获得标准品种细菌的绝对含量
按实验条件采集12处土壤,每处土壤重复采样3次,共获得36份土壤样本,每份样本取500mg,使用FastDNA SPIN Kit for Soil DNA Extraction(MP,116560200)抽提DNA,最终DNA溶解于60ul DNA洗脱液中。DNA浓度经Qubit精确定量并标化后,每份样品分别添加BSIS-6,BSIS-5,BSIS-4,BSIS-3,并进行V4-V5区域的PCR扩增,使用3730判断最合适的添加比例。将最优添加比例的16S扩增子测序文库进行高通量测序,依据其中“定量参考序列”的标准曲线,计算每个样品中16S的总拷贝数,进而换算为16S拷贝数/克土壤;属水平16SrDNA绝对拷贝数堆积图见图4。使用本发明方法检测的真实土壤样品中微生物的16S拷贝数绝对值,_1,_2,_3分别为同一份土壤的技术重复。
结果表明,本发明方法能够有效检测土壤样本中各分类水平16S的绝对拷贝数,且重复间具有极高的一致性,即本发明方法检出结果具有较高的可重复性。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 上海天昊生物科技有限公司
<120> 基于内参序列的细菌菌群组成与绝对含量检测的方法
<130> P2019-0306
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 670
<212> DNA
<213> 人工序列(artificial sequence)
<400> 1
actgagacac ggtccagact cctacgggag gcagcagtgg ggaatattgc acaatgggcg 60
caagcctgat tactagcttc gtttcccacc aggatagtta ggagtgccga cccgttatag 120
aagtgcagtg tcctttctct gcactcgagt taagtcgaca agtcctctta cgctaggact 180
caccggctaa ctccgtgcca gcagccgcgg taatacggag ggtgcaagcg ttaatcggaa 240
ttactgggcg taaagcgcac gcaggcggtt catcgcgagg ctttatacga ggcaccaaat 300
aagcaccgta ataagtgagt cccgcgggct tattgtgctg cagtatagct actatagcgt 360
agggatcgat atcagctata cctagatgag agcccatttc cgctcgatat acctagggac 420
acgtagatgt actatttcgg cgacttggat gtggggagca aacaggatta gataccctgg 480
tagtccacgc cgtaaacgat ctaccacatc aggcacttgg ctatgaagac tgcgtaagcc 540
atttagagtt cgggctcctt ctaaggctta gcaggccgca aggttaaaac tcaaatgaat 600
tgacgggggc cgcacaagcg gtggagcatg tggtttaatt cgatgcaacg cgaagaacct 660
tacctggtct 670
<210> 2
<211> 670
<212> DNA
<213> 人工序列(artificial sequence)
<400> 2
actgagacac ggtccagact cctacgggag gcagcagtgg ggaatattgc acaatgggcg 60
caagcctgat aatgcgacgc acgttagcag gccctagtta ttagcccgta gcttgaagca 120
ctagattcta cgcgggttca tcagcccaga cccaacaatg agggtccaat ccatggctag 180
caccggctaa ctccgtgcca gcagccgcgg taatacggag ggtgcaagcg ttaatcggaa 240
ttactgggcg taaagcgcac gcaggcggtt gtaaggcgac ttctcttatg accaaagtgg 300
gcgtccatgg cttagactcg tgtggctcga accgaagtct tgacgtgatc tcgggaggga 360
tggtcgagct actaccacac tctcggctca attaccgtgt gacatcggat actccaacat 420
ggcacggcga ctgtattaca cgatcctggt gtggggagca aacaggatta gataccctgg 480
tagtccacgc cgtaaacgat gcgttcatga taggttctcg gcagctaaag gactgctatc 540
tactgggaat agctgccttg tgacactgtt ccttgccgca aggttaaaac tcaaatgaat 600
tgacgggggc cgcacaagcg gtggagcatg tggtttaatt cgatgcaacg cgaagaacct 660
tacctggtct 670
<210> 3
<211> 670
<212> DNA
<213> 人工序列(artificial sequence)
<400> 3
actgagacac ggtccagact cctacgggag gcagcagtgg ggaatattgc acaatgggcg 60
caagcctgat catctggtca ggtctcctcg acctacctac atgtgtggca cgttcgagag 120
cgtgctttcg accagtattg gcgctcgtcc atagctaagc gcctaactgc atagctacct 180
caccggctaa ctccgtgcca gcagccgcgg taatacggag ggtgcaagcg ttaatcggaa 240
ttactgggcg taaagcgcac gcaggcggtt tggttaggca cacatggcac cggtctgcgt 300
tgtgagcgta cctttcacct cctatcgccg tcgtcggcgt tatagacagc actccttcgt 360
tgctactacc tgggtaggtt agcaccacga atcatcccga cgaaatgaca ccggatcggg 420
ctgataggtg actcggaaag ctgaatcgag gtggggagca aacaggatta gataccctgg 480
tagtccacgc cgtaaacgat gctttcctat ggactggaca agtgcctctc cagctaactg 540
caacagtcgt ggatcaggta atggtagagc tcaggccgca aggttaaaac tcaaatgaat 600
tgacgggggc cgcacaagcg gtggagcatg tggtttaatt cgatgcaacg cgaagaacct 660
tacctggtct 670
<210> 4
<211> 670
<212> DNA
<213> 人工序列(artificial sequence)
<400> 4
actgagacac ggtccagact cctacgggag gcagcagtgg ggaatattgc acaatgggcg 60
caagcctgat tgcgctccga gtatcgactc aagcctcact aggaacagcg ggcgtttgca 120
cgaaccctgt tccgccggct ttgagttact gtcgtgctga cgccgttgag gcgagggttg 180
caccggctaa ctccgtgcca gcagccgcgg taatacggag ggtgcaagcg ttaatcggaa 240
ttactgggcg taaagcgcac gcaggcggtt gaaggcgttg cgttcttctc gctggaccag 300
actctaatgg catgtctcat tctgtcgtgg cctgtattcg cggagtgtgt gagtctttgg 360
gcaatgtcag cagtgagcta ccctgggagc agccggacct ctcttgagcg aatgcagacg 420
ggttaccgaa tcacacccac cctcacagcg gtggggagca aacaggatta gataccctgg 480
tagtccacgc cgtaaacgat aggcgttctg gtgcccacaa tcctgatcct ggcatgggac 540
tactgttggg cgttatcgaa cacacggaga gacgtccgca aggttaaaac tcaaatgaat 600
tgacgggggc cgcacaagcg gtggagcatg tggtttaatt cgatgcaacg cgaagaacct 660
tacctggtct 670
<210> 5
<211> 670
<212> DNA
<213> 人工序列(artificial sequence)
<400> 5
actgagacac ggtccagact cctacgggag gcagcagtgg ggaatattgc acaatgggcg 60
caagcctgat ttcggacctg tgagctatgc tgcgctatgt gcttagggtc gcctggacgt 120
tcacaggatt ccgtcgtgat gcccatcttc gaggtgtggt agcggacgga cgccatccgt 180
caccggctaa ctccgtgcca gcagccgcgg taatacggag ggtgcaagcg ttaatcggaa 240
ttactgggcg taaagcgcac gcaggcggtt gccgggtatt gtagagacgt cgcacttact 300
tgctccaccc gactcgaccc tgttgggtta ccgcggaaag tttggtcgtc ctctctgcca 360
tcaggcggga tatagggagc tccggcaaac gtggtgcatc cgcagagcgg gatgctgtgg 420
tcagcttgga cttgacgact gtacctcagc gtggggagca aacaggatta gataccctgg 480
tagtccacgc cgtaaacgat acacgggcta atctgtaatc tccggttcct tgacgctgcc 540
atggcgttta cgacgttacg gaccacttgc cagaaccgca aggttaaaac tcaaatgaat 600
tgacgggggc cgcacaagcg gtggagcatg tggtttaatt cgatgcaacg cgaagaacct 660
tacctggtct 670
<210> 6
<211> 663
<212> DNA
<213> 人工序列(artificial sequence)
<400> 6
actgagacac ggtccaaact cctacgggag gcagcagtga ggaatattgg tcaatgggcg 60
agagcctgaa gctatgccac aggttcggac ggctgttagt gcggactgcg gtccttaaag 120
ccgtcagcca tccgtaccgt tagctcagcg tccctagcct tcgcatcgaa cgcgacaccg 180
gctaactccg tgccagcagc cgcggtaata cggagggtgc aagcgttaat cggaattact 240
gggcgtaaag cgcacgcagg cggtttgctg gcttgctatg gagttggatc tcacagtgtg 300
tgtaacatgg cagcgctccc gatttcaaca gaggccgttg acgcgccgat tgagcctccc 360
atggcattgg tcgaccatca acacgagctc gttggctgtg ctgaataggg tgcgagcagc 420
atctaggcgg aatttccatc gtggtgtggg tatcaaacag gattagatac cctggtagtc 480
cacacggtaa acgatgctta gatgacgggt gcagatcctc tagattccac cgcgaatagg 540
tcccgtgaac tctgctcccg gttggtacgg caacggtgaa actcaaagga attgacgggg 600
gccggcacaa gcggaggaac atgtggttta attcgatgat acgcgaggaa ccttacccgg 660
gct 663
<210> 7
<211> 646
<212> DNA
<213> 人工序列(artificial sequence)
<400> 7
actgagacac ggcccagact cctacgggag gcagcagtgg ggaatattgc acaatggggg 60
aaaccctgat attccgtcag agccgcacat aaggccagca gggatgacta gatattcccg 120
cacgccgaca ctgacactgt caacgggtgc aggtaccacg gctaactacg tgccagcagc 180
cgcggtaata cgtaggtggc aagcgttgtc cggatttact gggcgtaaag ggagcgtagg 240
tggattgcct agcctagcgg ttggagcggg aatactaagg tgcagtgttt cccatggccg 300
gatttaggcg cttcacggga tcgtcgagtt cgtctgggca taggtcgcgt cacgctttca 360
ttcgaagccg atctcggacc gccaccgata aggcagtagt cgcctgtggc atgtgcctcg 420
ctgaggtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa acgattgtaa 480
ggtagcccgt gtaagggtac ctcgcagatt cgccaagaac gagcaagggc tagtgtgttg 540
acggttactc tcgcaagatt aaaactcaaa ggaattgacg ggggcccgca caagcagcgg 600
agcatgtggt ttaattcgaa gcaacgcgaa gaaccttacc tagact 646
<210> 8
<211> 664
<212> DNA
<213> 人工序列(artificial sequence)
<400> 8
actgagatac ggcccagact cctacgggag gcagcagtgg ggaatattgc gcaatggccg 60
aaaggctgac cctgaactct tgggatgcga cgttgagggc tgctggcatt agcgaaccgc 120
aatcccgtac ttggtagaca acgaacccaa cactccggag agactgccta cgcaccggct 180
aactccgtgc cagcagccgc ggtaatacgg agggtgcgag cgttgtccgg aatcactggg 240
cgtaaagggc gcgtaggcgg tccgatacga aacttcttgc acaggcatga ggcacgcgtg 300
cgtaccagac ggcctcggaa tacaccggaa acctttgagg ccgctcccag gtgtacgcga 360
ggcaccaaag cggtattcca tggtagagaa cactgctgcg gattaccgac atttagcctc 420
gcgtatagca ccctgccgtt gcgtggggag caaacaggat tagataccct ggtagtccac 480
gccgtaaacg atggacaacc acgcggttac acgcggagat cccgccagat gagagcccag 540
gcatcacagc gatcaggcac ttgacatacc gcaaggttga aactcaaagg aattgacggg 600
ggcccgcaca agcggtggag catgtggttt aattcgacgc aacgcgaaga accttaccca 660
ggct 664
<210> 9
<211> 672
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
tgggactgag atacggccca gactcctacg ggaggcagca gctaagaata ttccgcaatg 60
gacgaaagtc tgacgtaaat cgccacctgg aatcagggtg cgctgtcgtg tgcggatcgc 120
atgaccgcca attccgtgta gcagggatag cctcccacct tcgatgatgg ctcggcatct 180
gctccaacgg ctaattacgt gccagcagcc gcggtaacac gtaagttgcg agcgttgttc 240
ggaattattg agcgtaaagg gcatgtaggc ggttgtttgc tcgacatggt tcgagctggt 300
agagatgcgg ccgtcctaag aggagagtag tgcgtcgcaa agcacccggg tcaagagccg 360
gagttgacag cacaccttga ctcactcgta tggcaatagc aggaccacat tcgggttcgc 420
gcattacgat taccacgtgg tccttgctcg acccgcgggg agcaaacagg attagatacc 480
ctggtagtcc gcacagtcaa ctatagggtg gctgatggag gtagagacga cggactgcga 540
ggtgtggtag tttccttccg agggtgcacg gttagcccgc aagggtgaaa ctcaaaggaa 600
ttgacggggg cccgcacaag cggtggagca tgtggtttaa ttcgatggta cgcgaggaac 660
cttacctggg tt 672
<210> 10
<211> 772
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
tgggactgag atacggccca gactcctacg ggaggcagca gctaagaata ttccgcaatg 60
gacgaaagtc tgacgtaaat cgccacctgg aatcagggtg cgctgtcgtg tgcggatcgc 120
atgaccgcca attccgtgta gcagggatag cctcccacct tcgatgatgg ctcggcatct 180
gctccaacgg ctaattacgt gccagcagcc gcggtaacac gtaagttgcg agcgttgttc 240
ggaattattg agcgtaaagg gcatgtaggc ggttgtttgc tcgacatggt tcgagctggt 300
agagatgcgg ccgtcctaag aggagagtag tgcgtcgcaa agcacccggg tcaagagccg 360
gagttgacag cacaccttga ctcactcgta tggcaatagc aggaccacat tcgggttcgc 420
gcattacgat taccacgtgg tccttgctcg accctccctt gtctccctac ctctggagga 480
gaaaagtgtt gacatgggcg ctcccggcgc aagggccaaa ggagtctccg atttcttatt 540
cccgaatgac atgcgcgggg agcaaacagg attagatacc ctggtagtcc gcacagtcaa 600
ctatagggtg gctgatggag gtagagacga cggactgcga ggtgtggtag tttccttccg 660
agggtgcacg gttagcccgc aagggtgaaa ctcaaaggaa ttgacggggg cccgcacaag 720
cggtggagca tgtggtttaa ttcgatggta cgcgaggaac cttacctggg tt 772
<210> 11
<211> 54
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
tcgtcggcag cgtcagatgt gtataagaga cagccagact cctacgggag gcag 54
<210> 12
<211> 53
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
gtctcgtggg ctcggagatg tgtataagag acagcgtatt accgcggctg ctg 53
<210> 13
<211> 52
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
tcgtcggcag cgtcagatgt gtataagaga caggtgccag cmgccgcggt aa 52
<210> 14
<211> 54
<212> DNA
<213> 人工序列(artificial sequence)
<400> 14
gtctcgtggg ctcggagatg tgtataagag acagggacta chvgggtwtc taat 54
<210> 15
<211> 50
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<221> misc_feature
<222> (42)..(42)
<223> n is a, c, g, or t
<400> 15
tcgtcggcag cgtcagatgt gtataagaga cagcctacgg gnggcwgcag 50
<210> 16
<211> 55
<212> DNA
<213> 人工序列(artificial sequence)
<400> 16
gtctcgtggg ctcggagatg tgtataagag acaggactac hvgggtatct aatcc 55
<210> 17
<211> 52
<212> DNA
<213> 人工序列(artificial sequence)
<400> 17
tcgtcggcag cgtcagatgt gtataagaga caggtgccag cmgccgcggt aa 52
<210> 18
<211> 54
<212> DNA
<213> 人工序列(artificial sequence)
<400> 18
gtctcgtggg ctcggagatg tgtataagag acagccgtca attcmtttra gttt 54
<210> 19
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, or t
<400> 19
ccagactcct acgggnggcw gcag 24
<210> 20
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<400> 20
gtgccagcmg ccgcggtaay acg 23
<210> 21
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 21
ggattagawa cccbdgtagt cc 22
<210> 22
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 22
aaactyaaak gaattgacgg 20

Claims (10)

1.一种定量标准品,其特征在于,所述定量标准品包括至少3条选自下组的定量参考序列:
(1)第一定量参考序列R1,所述第一定量参考序列R1是基于SEQ ID NO.:1的序列;
(2)第二定量参考序列R2,所述第二定量参考序列R2是基于SEQ ID NO.:2的序列;
(3)第三定量参考序列R3,所述第三定量参考序列R3是基于SEQ ID NO.:3的序列;
(4)第四定量参考序列R4,所述第四定量参考序列R4是基于SEQ ID NO.:4的序列;
(5)第五定量参考序列R5,所述第五定量参考序列R5是基于SEQ ID NO.:5的序列;
(6)第六定量参考序列R6,所述第六定量参考序列R6是基于SEQ ID NO.:6的序列;
(7)第七定量参考序列R7,所述第七定量参考序列R7是基于SEQ ID NO.:7的序列;
(8)第八定量参考序列R8,所述第八定量参考序列R8是基于SEQ ID NO.:8的序列;和
(9)第九定量参考序列R9,所述第九定量参考序列R9是基于SEQ ID NO.:9的序列。
2.如权利要求1所述的定量标准品,其特征在于,所述定量标准品还包括指示内参R0。
3.如权利要求1所述的定量标准品,其特征在于,所述的指示内参R0含有以下序列区段:
C2区段:CCAGACTCCTACGGG(A/T/C/G)GGC(A/T)GCAG(SEQ ID No.:19);
C3区段:GTGCCAGC(A/C)GCCGCGGTAA(T/C)ACG(SEQ ID NO.:20);
C4区段:GGATTAGA(A/T)ACCC(T/G/C)(A/T/G)GTAGTCC(SEQ ID NO.:21);和
C5区段:AAACT(T/C)AAA(T/G)GAATTGACGG(SEQ ID NO.:22)。
4.如权利要求2所述的定量标准品,其特征在于,所述定量标准品中,R0:R1:R2:R3:R4:R5:R6:R7:R8:R9的摩尔比或质量比为(1111.5-4446):(500-2000):(500-2000):(50-200):(50-200):(5-20):(5-20):(0.5-2):(0.5-2):(0.5-2)。
5.如权利要求1所述的定量标准品,其特征在于,所述定量参考序列的总浓度为2.2×103-2.2×109拷贝/μl,以定量标准品的总体积计算。
6.一种试剂盒,其特征在于,所述试剂盒包含权利要求1所述的定量标准品。
7.如权利要求6所述的试剂盒,其特征在于,所述试剂盒还包括选自下组的一对或多对引物对:
(1)SEQ ID NO.:11和SEQ ID NO.:12所示的引物对;
(2)SEQ ID NO.:13和SEQ ID NO.:14所示的引物对;
(3)SEQ ID NO.:15和SEQ ID NO.:16所示的引物对;和/或
(4)SEQ ID NO.:17和SEQ ID NO.:18所示的引物对。
8.如权利要求1所述的定量标准品、或权利要求5所述的试剂盒的用途,其特征在于,用于检测细菌菌群组成和含量。
9.一种细菌菌群组成和含量的检测方法,其特征在于,包含以下步骤:
(a)提供一待测样品;
(b)从所述样品中,提取总DNA,获得总DNA样本;
(c)将上一步骤的总DNA样本与权利要求1所述的定量标准品进行混合,得到第一混合物;
(d)用上一步骤的第一混合物进行16s rDNA PCR扩增,得到16s rDNA PCR扩增产物;
(e)利用上述16s rDNA PCR扩增产物构建文库并测序,从而获得所述待测样品的16srDNA读序和所述定量标准品的读序;
(f)将所述待测样品的16s rDNA读序与所述定量标准品的读序进行分析和比对,从而获得细菌群落结构分类组成与相对丰度信息,以及待测样品中各物种16S rDNA与所述各条定量标准品的读序条数;和
(g)根据所述定量标准品计算所述待测样本中细菌的总量和各类细菌的含量。
10.如权利要求9所述的检测方法,其特征在于,所述步骤(f)中,在进行分析和比对前还包括:将所述待测样品的16s rDNA读序和定量标准品的读序结果分别按至少97%一致性聚类为-OTU。
CN201910295389.XA 2019-04-12 2019-04-12 基于内参序列的细菌菌群组成与绝对含量检测的方法 Active CN109943654B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910295389.XA CN109943654B (zh) 2019-04-12 2019-04-12 基于内参序列的细菌菌群组成与绝对含量检测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910295389.XA CN109943654B (zh) 2019-04-12 2019-04-12 基于内参序列的细菌菌群组成与绝对含量检测的方法

Publications (2)

Publication Number Publication Date
CN109943654A true CN109943654A (zh) 2019-06-28
CN109943654B CN109943654B (zh) 2023-06-30

Family

ID=67015066

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910295389.XA Active CN109943654B (zh) 2019-04-12 2019-04-12 基于内参序列的细菌菌群组成与绝对含量检测的方法

Country Status (1)

Country Link
CN (1) CN109943654B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112111588A (zh) * 2020-09-22 2020-12-22 中国疾病预防控制中心传染病预防控制所 一种定量16s宏基因组测序方法
CN112159856A (zh) * 2020-11-04 2021-01-01 江苏宏众百德生物科技有限公司 一种基于二代测序技术在属水平实现蓝藻绝对定量的方法
CN113403367A (zh) * 2021-07-01 2021-09-17 苏州赛福医学检验有限公司 一种宏基因组绝对定量的检测方法及其应用
CN113652476A (zh) * 2021-08-05 2021-11-16 上海天昊生物科技有限公司 羟甲基化分析中dna整体转化效率的评估方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102399900A (zh) * 2011-12-16 2012-04-04 上海天昊生物科技有限公司 基因多态检测方法及试剂盒
WO2016119448A2 (zh) * 2015-01-28 2016-08-04 中国医科大学附属第一医院 不同种属微生物间种类和丰度比较的人工外源性参照分子
CN105937053A (zh) * 2015-12-02 2016-09-14 广州赛哲生物科技股份有限公司 一种基于高通量基因测序建立粪便菌群基因文库的方法
CN107190055A (zh) * 2017-04-28 2017-09-22 浙江大学 土壤细菌高通量绝对定量方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102399900A (zh) * 2011-12-16 2012-04-04 上海天昊生物科技有限公司 基因多态检测方法及试剂盒
WO2016119448A2 (zh) * 2015-01-28 2016-08-04 中国医科大学附属第一医院 不同种属微生物间种类和丰度比较的人工外源性参照分子
CN105937053A (zh) * 2015-12-02 2016-09-14 广州赛哲生物科技股份有限公司 一种基于高通量基因测序建立粪便菌群基因文库的方法
CN107190055A (zh) * 2017-04-28 2017-09-22 浙江大学 土壤细菌高通量绝对定量方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
ANDRZEJ TKACZ ET AL.: "Absolute quantitation of microbiota abundance in environmental samples", 《MICROBIOME》 *
ANDRZEJ TKACZ ET AL.: "Absolute quantitation of microbiota abundance in environmental samples", 《MICROBIOME》, 31 December 2018 (2018-12-31), pages 1 - 13 *
DIETER M. TOURLOUSSE ET AL.: "Synthetic spike-in standards for high-throughput 16S rRNA gene amplicon sequencing", 《NUCLEIC ACIDS RESEARCH》 *
DIETER M. TOURLOUSSE ET AL.: "Synthetic spike-in standards for high-throughput 16S rRNA gene amplicon sequencing", 《NUCLEIC ACIDS RESEARCH》, 31 December 2017 (2017-12-31), pages 1 - 14 *
FRANK STÄMMLER ET AL.: "Adjusting microbiome profiles for differences in microbial load by spike-in bacteria", 《MICROBIOME》 *
FRANK STÄMMLER ET AL.: "Adjusting microbiome profiles for differences in microbial load by spike-in bacteria", 《MICROBIOME》, 31 December 2016 (2016-12-31), pages 1 - 13 *
SIMON A. HARDWICK ET AL.: "Synthetic microbe communities provide internal reference standards for metagenome sequencing and analysis", 《NATURE COMMUNICATIONS》 *
SIMON A. HARDWICK ET AL.: "Synthetic microbe communities provide internal reference standards for metagenome sequencing and analysis", 《NATURE COMMUNICATIONS》, 31 December 2018 (2018-12-31), pages 1 - 10 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112111588A (zh) * 2020-09-22 2020-12-22 中国疾病预防控制中心传染病预防控制所 一种定量16s宏基因组测序方法
CN112159856A (zh) * 2020-11-04 2021-01-01 江苏宏众百德生物科技有限公司 一种基于二代测序技术在属水平实现蓝藻绝对定量的方法
CN113403367A (zh) * 2021-07-01 2021-09-17 苏州赛福医学检验有限公司 一种宏基因组绝对定量的检测方法及其应用
CN113403367B (zh) * 2021-07-01 2023-10-13 苏州赛福医学检验有限公司 一种宏基因组绝对定量的检测方法及其应用
CN113652476A (zh) * 2021-08-05 2021-11-16 上海天昊生物科技有限公司 羟甲基化分析中dna整体转化效率的评估方法
CN113652476B (zh) * 2021-08-05 2024-05-03 上海天昊生物科技有限公司 羟甲基化分析中dna整体转化效率的评估方法

Also Published As

Publication number Publication date
CN109943654B (zh) 2023-06-30

Similar Documents

Publication Publication Date Title
CN109943654A (zh) 基于内参序列的细菌菌群组成与绝对含量检测的方法
Theron et al. Molecular techniques for determining microbial diversity and community structure in natural environments
CN106048009B (zh) 一种用于超低频基因突变检测的标签接头及其应用
CN107653306B (zh) 一种基于高通量测序的双歧杆菌快速检测方法及应用
CN108441565B (zh) 人类y染色体37个str基因座的荧光标记复合扩增试剂盒及其应用
CN110305979A (zh) 一种基于多内标系统的微生物群落绝对定量方法
CN110904250B (zh) 用于检测多种菌的多重荧光定量pcr引物、试剂盒及检测方法
CN109715827A (zh) 分析标准品及其使用方法
CN111534622A (zh) 一种基于高通量测序的拟杆菌快速检测方法及应用
KR20170135351A (ko) 엔테로코커스 종들 중 특정 종 특이적인 프라이머 및 이를 이용한 해당 균주 분리 및 동정 방법 및 그 조성물
CN116814821A (zh) 一种检测微生态四联活菌制品中4种活菌的引物探针组合、试剂盒及应用
CN110684854A (zh) 用于检测幽门螺杆菌耐药突变位点的引物和探针组及应用
CN110423835A (zh) 用于下呼吸道病原微生物检测的引物组合物
CN116219040A (zh) 用于检测植物乳杆菌s58的分子标记、引物探针组和检测方法
Felske et al. DNA fingerprinting of microbial communities
Thies Molecular methods for studying soil ecology
CN113373248A (zh) 一种检测致病性细菌的探针组合、芯片、试剂盒及方法
CN109355412A (zh) 一种用于测定细菌与真菌种类和丰度比较的人工合成外源性参照分子
CN113736894B (zh) 四种肠道保护菌的检测方法及核酸检测试剂盒
CN113186262B (zh) 用于mgi平台高通量测序文库快速定量的方法及试剂盒
Wang et al. Optimization of 6-carboxy-X-rhodamine concentration for real-time polymerase chain reaction using molecular beacon chemistry
Saini et al. Molecular Tools for Microbial Diversity Analysis
JPH0690796A (ja) カンピロバクター ジェジュニ及びコリ検出用プローブ及び検出方法
Mahmod Novel methods to study intestinal microbiota
CN117844939A (zh) 一种微生物种群绝对丰度定量的内参组合物、试剂盒及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant