CN109797438A

CN109797438A - 一种用于16S rDNA可变区定量测序文库构建的接头元件及文库构建方法

Info

Publication number: CN109797438A
Application number: CN201910042474.5A
Authority: CN
Inventors: 吴启家; 王琳; 贾晓; 吴志坤
Original assignee: Wuhan Kang Test Technology Co Ltd
Current assignee: Wuhan Kang Test Technology Co Ltd
Priority date: 2019-01-17
Filing date: 2019-01-17
Publication date: 2019-05-24

Abstract

本发明公开了一种用于16S rDNA可变区定量测序文库构建的接头元件及文库构建方法。首先，将双链DNA片段进行平末端修复、5’末端添加磷酸基团、3’末端添加腺嘌呤A，通过连接反应，在处理的DNA片段上连接接头元件，该接头元件为两条互补配对的DNA寡核苷酸链，其中一条链的序列从5’到3’依次为固定序列FS、可变序列VS、铰链序列B，3’末端为一个突出的碱基T；与另一条互补序列形成一端具有单个突出碱基T的双链结构。所述接头元件为含有不同随机排列组合核苷酸序列的可变序列VS的双链DNA的混合物。采用接头元件可对细菌16S rDNA的可变区构建定量测序文库，定量检测样品中的微生物、实现细菌株系的鉴定。

Description

一种用于16S rDNA可变区定量测序文库构建的接头元件及文库构建方法

技术领域

本发明属于高通量测序领域，具体涉及一种用于高通量测序平台的16S rDNA可变区定量测序文库构建的接头元件及16S rDNA可变区定量测序文库的构建方法。

背景技术

原核生物细菌的rRNA(核糖体RNA)按沉降系数可分为3种，分别为5S、16S以及23SrRNA。16S rRNA为核糖体RNA的一个亚基，16S rDNA即编码该亚基的基因。16S rDNA序列包含相互间隔的10个保守区和9个可变区，保守区在细菌间差异不大，而可变区具有属或种的特异性。使用二代高通量测序技术对可变区进行测序，可一次性对样品中的所有细菌种属进行鉴定，全面分析环境(如土壤、水源、皮肤、肠道等)的微生物种群结构和丰度等信息，被广泛应用于环境微生物群落多样性研究。

目前的16S rDNA可变区文库构建方法主要为扩增子文库构建方法，即使用靶向扩增引物对V3或V4可变区进行PCR扩增构建测序文库。构建文库过程通常包括两轮PCR扩增，第一轮PCR针对目标片段进行扩增，然后通过第二轮PCR扩增加上测序所需的通用接头。由于PCR扩增存在偏好性、不均一性，文库中的所有片段并非等量的被扩增，通过二轮PCR扩增，这种偏差更是被指数放大，严重影响对细菌种群结构和丰度的准确分析，更不可能实现细菌丰度的定量检测。

在PCR扩增过程和测序过程中，均会产生碱基的错配，即使使用高保真聚合酶也无法避免错误的产生。而16S rDNA的测序数据分析是基于可操作分类单元(OperationalTaxonomic Units，OTU)，它是在系统发生学研究或群体遗传学研究中，为了便于进行分析，人为给某一个分类单元(品系、种、属、分组等)设置的同一标志。由于无法过滤PCR扩增和测序中引入的错误、无法区分细菌突变与测序错误，数据分析时通常将97％的序列一致性作为OTU分类的阈值，即把相似度大于97％的序列划分为同一个OTU，可以区分细菌的种属，但是不能对细菌的菌株进行鉴定、也不能对某一菌株的变化机制进行研究分析。

在微生物的研究中，通常可以观察到不同时刻菌群比例发生的变化，但却无法确定这种变化是由于菌群中所有菌株等量增殖，还是其中某一优势菌株优势增殖导致？抑或是引入了同种外来细菌导致？对菌株的鉴定则有助于研究菌群的变化机制、筛选突变菌株、研究相关疾病或感染的发病机制，进而研制出针对某一菌株的靶向药物。这些都必须依赖更加精细的OTU划分，即更加准确的测序数据。

因此，目前的16S rDNA高通量测序方法仍需要改进，以获得更加准确的数据、实现对细菌的定量检测和菌株鉴定。

发明内容

为了解决现有技术中存在的问题，本发明的目的是提供一种用于高通量测序平台的16S rDNA可变区定量测序文库构建的接头元件及16S rDNA可变区定量测序文库的构建方法，旨在解决16S rDNA测序无法准确定量分析细菌丰度、无法去除测序错误、无法鉴定细菌菌株等一系列问题。

为了实现上述目的，本发明采用如下技术方案：

第一方面，提供一种用于高通量测序平台的16S rDNA可变区定量测序文库构建的接头元件，所述接头元件为两条互补配对的DNA寡核苷酸链，其中一条链的序列从5’到3’依次为固定序列FS(Fixed sequence，FS)、可变序列VS(variable sequence，VS)、铰链序列B(Hinge B，HB)，3’末端为一个突出的碱基T；与另一条互补序列形成一端具有单个突出碱基T的双链结构；所述接头元件中铰链序列HB为6～15个互补配对的碱基；可变序列VS包含4～15个随机排列组合的核苷酸，固定序列FS为文库扩增时PCR引物的识别序列；所述接头元件为含有不同随机排列组合核苷酸序列的可变序列VS的双链DNA的混合物。

优选地，固定序列FS为Illumina/Life文库PCR引物的识别序列。

优选地，所述接头元件其中一条链的核苷酸序列为SEQ ID NO.1:(5’→3’)GTTCAGAGTTCTACAGTCCGACGATCNNNNNNNNNNCACTGGATACACT，其中，斜体部分为固定序列FS，NNNNNNNNNN表示可变序列，由随机排列组合的核苷酸构成，N为A、T、C、G中任意一种碱基，不同位置的N为相同或不同的碱基；加粗部分为铰链序列HB；3’末端为一个突出的碱基T；所述接头元件的另一条互补序列的核苷酸序列为SEQ ID NO.2:(5’→3’)GTGTATCCAGTGNNNNNNNNNNGATCGTCGGACTGTAGAACTCTGAAC。

优选地，所述接头元件由与HB互补配对的引物HA(5’→3’：GTGTATCCA GTG)与序列SEQ ID NO.1经高温变性、退火、延伸和纯化步骤获得。

第二方面，本发明提供一种16S rDNA可变区定量测序文库的构建方法，包含如下步骤：

S1：将细菌宏基因组双链DNA进行片段化处理；

所述双链DNA可以由样本提取DNA得到，所述片段化为利用物理或化学方法，对样本进行随机打断；

优选地，使用超声波物理破碎或酶切反应进行所述片段化；

S2：双链DNA片段进行平末端修复、5’末端添加磷酸基团、3’末端添加腺嘌呤A；

所述平末端修复是利用T4DNA聚合酶完成；所述磷酸化是用T4多核苷酸激酶进行；所述3’末端加腺嘌呤A是利用无3’-5’外切酶活性的Klenow聚合酶进行；

S3：通过连接反应，将所获得的DNA片段连接上述接头元件；

所述连接反应是用T4DNA连接酶完成的；

S4：使用特异性靶向扩增引物对目标区域进行线性扩增；

上述引物从5’端到3’端包含通用序列CS(Common Sequence)和特异性靶向序列，所述特异性靶向序列靶向位于可变区下游靠近可变区的保守区序列，长度为18-30nt；所述线性扩增可以用具备链置换活性的DNA聚合酶完成；

优选地，所述通用序列CS为Illumina/Life文库PCR引物的识别序列；

优选地，所述引物的特异性靶向序列靶向位于V4可变区下游靠近V4可变区的保守区序列或V3可变区下游靠近V3可变区的保守区序列，或为这两种靶向序列组成的混合物；

进一步优选地，所述特异性靶向扩增引物序列为SEQ ID NO.3：(5’→3’)GCCTTGGCACCCGAGAATTCCAGGACTACHVGGGTWTCTAAT，其中加粗部分为Illumina文库PCR引物的识别序列CS，GGACTACHVGGGTWTCTAAT为16S rDNA的V4区靶向扩增序列(H为A、C或T中的任意一个，V为A、C或G中的任意一个，W为A或T中的任意一个)；

优选地，所述DNA聚合酶为Bst DNA聚合酶；

S5：将S4步获得的PCR产物进行纯化；

采用核酸纯化试剂盒(Beckman，Agencourt AMPure XP，A63880)进行PCR产物的纯化；

S6：使用与接头元件的固定序列FS互补配对的引物，和与特异性靶向扩增引物通用序列CS互补配对的引物，进行PCR扩增，获得16S rDNA定量测序文库；

优选地，所用引物为Illumina/Life测序通用序列；

进一步优选地，PCR扩增引物为SEQ ID NO.4所示：(5’→3’)AATGATACGGCGACCACCGAGATCTACACGTTCAGAGTTCTACAGTCCGA(F)，其中加粗部分与接头元件中的固定序列FS结合，SEQ ID NO.5：(5’→3’)CAAGCAGAAGACGGCATACGAGATTCGCCTTAGTGACTGGAGTTGCCTTGGCACCCGAGAATTCCA(R)，其中加粗部分与特异性靶向扩增引物中的CS序列结合，CTGGAGTT为index序列；

经上述一步扩增步骤后，使用核酸纯化试剂盒(Beckman，Agencourt AMPure XP，A63880)进行PCR产物的纯化；

经过纯化后，使用Illumina高通量测序平台MiSeq PE250进行测序；

测序数据分析流程：

S1：对原始测序数据raw data进行质量控制，去除低质量的碱基；

S2：对双末端fastq文件进行合并；

S3：根据样品的index序列对样品进行拆分，获得单个样本的序列；

S4：对每个样本的序列进行聚类：如果可变序列_VS相同且其他部分仅有4个碱基的错配mismatch则去除reads数目少的序列，选用reads数目多的序列合并为1个唯一的uniq序列；大于4个碱基的mismatch则同时保留两条序列作为两个uniq序列；如果可变序列VS不同，但是其他都相同的序列则认为是同一个uniq序列，VS序列的种类数目记录为该uniq序列的数量；

S5：对uniq序列的嵌合体进行过滤；

S6：将uniq序列比对至微生物物种分类数据库，对序列所属的可操作分类单元OTU进行分类；

S7：对样品中uniq序列进行聚类，序列相似度大于99％的为一个簇，选择已经分类的序列作为该簇的代表序列，该簇中代表序列之外的序列根据其OTU水平可能与代表序列处于同属不同种或者同种不同菌株；

S8：根据uniq序列的数量对菌落的遗传多样性进行分析，分析内容主要包括：样品菌落及其含量组成、样本的相关性、稀释性曲线、物种累计曲线、alpha多样性、beta多样性、样本PCA分析、菌群的系统发生进化树、样品间菌群含量的差异分析等。

与现有16S rDNA高通量测序建库方法相比较，本发明有以下进步和优势：

本发明提供的建库接头包含一段固定序列和一段可变序列，文库构建时，每个DNA片段可连接上带有不同可变序列的接头，该可变序列即为每个DNA片段唯一的条码标记。在文库构建和测序完成后，可通过该可变序列追溯每个扩增产物的来源。从而避免PCR扩增偏好性带来的菌群丰度检测失真，同时还可发现并纠正PCR扩增错误、测序错误，提高测序准确性、提高OTU分类精确度(现行16S rDNA的OTU分类标准为相似度95％或97％，本发明将OTU分类标准提高至99％相似度)，获得更准确的菌种组成、甚至是菌株组成信息。为微生物群落结构分析及群落结构变化机制的研究提供强有力的帮助。

附图说明

图1为接头元件制备的流程图；

图2为本发明16S rDNA可变区定量测序文库构建流程图；

图3为文库构建结果图；

图4为利用可变序列去除重复的分析原理图；

图5为利用可变序列纠错提高OTU分辨率的分析原理图；

图6为利用可变序列处理后reads的序列聚类统计结果；

图7为常规16S rDNA建库测序分析方法和本专利所述方法分析实际样本的相关性和聚类结果对比；

具体实施方式

通过以下详细说明结合附图可以进一步理解本发明的特点和优点。所提供的实施例仅是对本发明方法的说明，而不以任何方式限制本发明揭示的其余内容。【实施例1】构建16S rDNA V4区定量测序文库所需的接头元件、特异性靶向扩增引物、PCR扩增引物的设计

1、接头元件的其中一条序列SEQ ID NO.1:(5’→3’)GTTCAGAGTTCTACAGTCCGACGATCNNNNNNNNNNCACTGGATACACT，其中，斜体部分为固定序列FS，NNNNNNNNNN表示可变序列，由随机排列组合的核苷酸构成，N为A、T、C、G中任意一种碱基，不同位置的N为相同或不同的碱基；加粗部分为铰链序列HB；3’末端为一个突出的碱基T。所述接头元件的序列SEQ IDNO.2:(5’→3’)

GTGTATCCAGTGNNNNNNNNNNGATCGTCGGACTGTAGAACTC TGAAC，SEQ ID NO.1和SEQ IDNO.2两条链互补配对形成一端具有单个突出碱基T的双链结构接头元件。

2、接头元件的制备：使用序列为HA(5’→3’：GTGTATCCAGTG)的引物与序列SEQ IDNO.1经高温变性、退火、延伸和纯化步骤，获得接头元件，如图1所示，具体步骤如下。

配制如下体系：

PCR仪中进行如下反应：

Temp	Time
		94℃	5min
58℃	30s
		72℃	5min

接头纯化：

提前取出核酸纯化试剂盒(Beckman，Agencourt AMPure XP，A63880)中的NGS磁珠，充分涡旋使磁珠混匀，室温平衡30min以上；向上一步获得的产物中加入1.8倍体积的1×NGS磁珠，充分混匀，室温结合10min；将产物置于磁力架上约5min(待溶液澄清)，小心用移液器吸出上清，保持样品始终处于磁力架中，向NGS磁珠中加入200uL新鲜配制的80％乙醇，室温放置30s后小心吸去乙醇(注意不要吹散磁珠)；

重复上述步骤一次；保持样品始终处于磁力架中，打开管盖约7min，室温晾干磁珠(以磁珠刚刚出现龟裂为最佳)；

回溶接头：向磁珠中加入11uL的ddH₂O，吸打混匀后室温放置2min后轻轻涡旋20s，再室温放置2min；

瞬离磁珠置磁力架，待溶液澄清后小心吸取10uL上清(纯化后接头)至一个新的nuclease free PCR管中。

3、特异性靶向扩增引物序列SEQ ID NO.3：(5’→3’)

GCCTTGGCACCCGAGA ATTCCAGGACTACHVGGGTWTCTAAT，其中GCCTTGGCACCCGAGAATTCCA为Illumina文库PCR引物识别的通用序列(Common sequence，CS)，GGACTACHVGGGTWTCTAAT为16S rDNA的V4区靶向扩增引物序列(H为A、C或T中的任意一个，V为A、C或G中的任意一个，W为A或T中的任意一个)。

4、PCR扩增引物SEQ ID NO.4：(5’→3’)AATGATACGGCGACCACCGAGATCTACACGTTCAGAGTTCTACAGTCCGA(F)，其中GTTCAGAGTTCTACAG TCCGA与接头中的固定序列FS结合；SEQ IDNO.5(5’→3’)CAAGCAGAAGACGGCATACGAGATTCGCCTTAGTGACTGGAGTTGCCTTGGCACCCGAGAATTCCA(R)，其中GCCTTGGCACCCGAGAATTCCA与靶向扩增引物中的通用序列CS结合。

本实施例中的接头元件包含的可变序列VS为10个随机排列组合的碱基，当然也可以多于或少于10个，但都在本发明的包含范围内。

【实施例2】16S rDNA可变区定量测序文库构建构建流程如图2所示。

S1：宏基因组DNA片段化

取1μg提取的宏基因组DNA，进行超声波片段化处理(超声仪：宁波新芝，JY92-IIN)；750W，20％功率，1s ON，1s OFF,超声8min。

S2：DNA末端修复

5’末端添加磷酸基团，3’末端添加腺嘌呤A；

配制如下体系：

组分	体积(μL)
		End Rep mix(Vazyme，ND604-01)	7.5
打断后的宏基因组DNA	7.4(100ng)
		ddH<sub>2</sub>O	17.6
total	32.5

在PCR仪中进行如下反应

Temp	Time
		20℃	30min
65℃	30min
		4℃	hold

S3：接头连接

将实施例1中制备的接头元件与DNA片段(End Repair DNA)连接；

配制如下体系：

组分	体积(μL)
		End Repair DNA	32.5
10x T4 ligase buffer(Thermo Scientific，EL0014)	5
		PEG4000(Sigma，95904-250G-F)	7.5
T4ligase(5U/μL)(Thermo Scientific，EL0014)	2.5
		接头元件(20uM)	2.5
总体积	50

在PCR仪中进行如下反应

Temp	Time
		20℃	30min
4℃	hold

S4：靶向扩增

使用实施例1中的靶向扩增引物对16S rDNA的V4区进行线性扩增；

配制如下体系：

在PCR仪中进行如下反应

PCR产物纯化：

提前取出核酸纯化试剂盒(Beckman，Agencourt AMPure XP，A63880)，充分涡旋使试剂盒中的NGS磁珠混匀，室温平衡30min以上；向连接产物中加入1.8倍体积的1×NGS磁珠，充分混匀，室温结合10min；将产物置于磁力架上约5min(待溶液澄清)，小心用移液器吸出上清，保持样品始终处于磁力架中，向NGS磁珠中加入200ul新鲜配制的80％乙醇，室温放置30s后小心吸去乙醇(注意不要吹散磁珠)；

回溶DNA：向磁珠中加入24ul的ddH₂O，吸打混匀后室温放置2min后轻轻涡旋20s，再室温放置2min；

瞬离磁珠置磁力架，待溶液澄清后小心吸取23uL上清(纯化后DNA)至一个新的nuclease free PCR管中。

S5：使用Illumina测序引物，进行PCR扩增，获得16S rDNA定量测序文库。

配制如下体系：

PCR仪中进行如下反应

PCR产物纯化：

提前取出核酸纯化试剂盒(Beckman，Agencourt AMPure XP，A63880)中的NGS磁珠，充分涡旋使磁珠混匀，室温平衡30min以上；向连接产物中加入1.8倍体积的1×NGS磁珠，充分混匀，室温结合10min；将产物置于磁力架上约5min(待溶液澄清)，小心用移液器吸出上清，保持样品始终处于磁力架中，向NGS磁珠中加入200ul新鲜配制的80％乙醇，室温放置30s后小心吸去乙醇(注意不要吹散磁珠)；

回溶DNA：向磁珠中加入25ul的ddH₂O，吸打混匀后室温放置2min后轻轻涡旋20s，再室温放置2min；

瞬离磁珠置磁力架，待溶液澄清后小心吸取24uL上清(纯化后DNA)至一个新的nuclease free PCR管中。取1～2uL PCR产物进行琼脂糖凝胶电泳检测，结果如图3所示。

S6：使用Illumina高通量测序平台MiSeq PE250进行测序。

【实施例3】测序数据分析

S1：根据样品的index序列对样品进行拆分，获得单个样本的序列；

S2：对raw data进行质量控制，去除低质量的碱基；

S3：根据可变序列对每个样本的reads的序列进行聚类(如图4、5所示)。情况一：如果可变序列VS相同且其他部分序列仅有少于或等于4个碱基的错配(mismatch)，则将所有这些reads聚为一类(cluster)，其中完全一样的reads数目大于一半时将其作为该cluster的唯一序列(unique序列)，其他情况则根据碱基质量值对碱基进行修正得到unique序列；情况二：如果可变序列VS相同且其他部分序列有大于4个碱基的mismatch，则聚为不同的cluster，同时保留序列作为各cluster的unique序列；情况三：如果可变序列VS不同，但是其他部分序列都相同的序列，则聚为不同的cluster，但认为是同一个unique序列，VS序列的种类数目记为cluster的数目。

reads的序列聚类统计结果如图6所示，图中横坐标为重复reads数目，表示一个cluster内的reads的数目，纵坐标表示这种类型的cluster的数目。44.1％的cluster中reads的数目大于1，这些reads来源于PCR扩增。

S4：截取unique序列中R2端作为unique tag，计算样品中unique tag的丰度值；

S5：对样品中unique序列进行聚类，序列相似度大于99％(默认阈值)的为一个簇，选择已经分类的序列作为该簇的代表序列，该簇中代表序列外的序列根据其可操作分类单元(OTU)水平可能与代表序列处于同属不同种或者同种不同菌株。

S6：将unique序列比对至微生物物种分类数据库，对序列所属的OTU进行分类，将物种注释到种，如在种水平无法判断则归属至属水平；

S7：根据unique tag含量和物种丰度值对菌落的遗传多样性进行分析，分析内容主要包括：样品菌落及其含量组成、样本的相关性、稀释性曲线、物种累计曲线、alpha多样性、beta多样性、样本PCA分析、菌群的系统发生进化树、样品间菌群含量的差异分析等。

【实施例4】样品测序分析

3组样品，每组3个生物学重复。具体分组如下表所示：

组别	样品
		A	A_1、A_2、A_3
B	B_1、B_2、B_3
		C	C_1、C_2、C_3

分别使用常规16S rDNA建库测序分析方法和本专利所述建库测序分析方法，对上述9个样品进行建库测序分析。对样品进行相关性和聚类分析，用以检验各组中的生物学重复能否聚为一类、组间差异是否显著大于组内差异，从而判断测序结果能否反映真实样本情况。相关性分析首先利用各样品的物种丰度值计算样品间的Bray-Curtis距离，然后计算样品间Pearson相关性并且进行聚类。Pearson相关r表示两个样品间线性相关强弱的程度，r的绝对值越大表明相关性越强。

相关性和聚类分析结果如图7所示，普通16S rDNA测序无法区分A组和B组样品，本专利所述方法能将A、B、C组内的所有样品较好的聚类，组间差异显著，说明该方法更能反映样品真实分组情况，且样品重复性效果较好。

以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围之内。

序列表

<110> 武汉康测科技有限公司

<120> 一种用于16S rDNA可变区定量测序文库构建的接头元件及文库构建方法

<160> 6

<170> SIPOSequenceListing 1.0

<210> 1

<211> 49

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (27)..(36)

<223> n为a、t、c、g中任意一种碱基

<400> 1

gttcagagtt ctacagtccg acgatcnnnn nnnnnncact ggatacact 49

<210> 2

<211> 48

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (13)..(22)

<223> n为a、t、c、g中任意一种碱基

<400> 2

gtgtatccag tgnnnnnnnn nngatcgtcg gactgtagaa ctctgaac 48

<210> 3

<211> 42

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (30)

<223> h为a、c、t中任意一种碱基

<220>

<221> misc_feature

<222> (31)

<223> v为a、c、g中任意一种碱基

<220>

<221> misc_feature

<222> (36)

<223> w为a或t

<400> 3

gccttggcac ccgagaattc caggactach vgggtwtcta at 42

<210> 4

<211> 50

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

aatgatacgg cgaccaccga gatctacacg ttcagagttc tacagtccga 50

<210> 5

<211> 66

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

caagcagaag acggcatacg agattcgcct tagtgactgg agttgccttg gcacccgaga 60

attcca 66

<210> 6

<211> 12

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

gtgtatccag tg 12

Claims

1.一种用于高通量测序平台的16S rDNA可变区定量测序文库构建的接头元件，其特征在于，所述接头元件为两条互补配对的DNA寡核苷酸，其中一条链的序列从5’到3’依次为固定序列FS、可变序列VS、铰链序列HB，3’末端为一个突出的碱基T；与另一条互补序列形成一端具有单个突出碱基T的双链结；所述接头元件中铰链序列HB为6～15个互补配对的碱基；可变序列VS包含4～15个随机排列组合的核苷酸，固定序列FS为文库扩增时PCR引物的识别序列；所述接头元件为含有不同随机排列组合核苷酸序列的可变序列VS的双链DNA的混合物。

2.根据权利要求1所述的用于高通量测序平台的16S rDNA可变区定量测序文库构建的接头元件，其特征在于，固定序列FS为Illumina/Life文库PCR引物的识别序列。

3.根据权利要求1或2所述的用于高通量测序平台的16S rDNA可变区定量测序文库构建的接头元件，其特征在于，所述接头元件其中一条链的核苷酸序列为SEQ ID NO.1:(5’→3’)GTTCAGAGTTCTACAGTCCGACGATCNNNNNNNNNN CACTG GATACA CT，其中，斜体部分为固定序列FS，NNNNNNNNNN表示可变序列VS，由随机排列组合的核苷酸构成，N为A、T、C、G中任意一种碱基，不同位置的N为相同或不同的碱基；加粗部分为铰链序列HB；3’末端为一个突出的碱基T；所述接头元件的另一条互补序列的核苷酸序列为SEQ ID NO.2:(5’→3’)GTGTATCCAGTGNNNNNNNNNNGATCGTCGGACTGTAGAA CTCTGA AC。

4.根据权利要求1或2所述的用于高通量测序平台的16S rDNA可变区定量测序文库构建的接头元件，其特征在于，所述接头元件由与HB互补配对的引物HA(5’→3’：GTGTATCCAGTG)与序列SEQ ID NO.1经高温变性、退火、延伸和纯化步骤获得。

5.一种16S rDNA可变区定量测序文库的构建方法，其特征在于，包含如下步骤：

S1：将细菌宏基因组双链DNA进行片段化处理；

所述平末端修复是利用T4 DNA聚合酶完成；所述磷酸化是用T4多核苷酸激酶进行；所述3’末端加腺嘌呤A是利用无3’-5’外切酶活性的Klenow聚合酶进行；

S3：通过连接反应，将所获得的DNA片段连接权利要求1-3任一项所述的接头元件；

所述连接反应是用T4 DNA连接酶完成的；

S4：使用特异性靶向扩增引物对目标区域进行线性扩增；

特异性靶向扩增引物从5’端到3’端包含通用序列CS和特异性靶向序列，通用序列CS为Illumina/Life文库PCR引物的识别序列，所述特异性靶向序列靶向位于V4可变区下游靠近V4可变区的保守区序列或V3可变区下游靠近V3可变区的保守区序列，或为这两种引物组成的混合物；长度为18-30nt；

所述线性扩增可以用具备链置换活性的DNA聚合酶完成；

S5：将S4步获得的PCR产物进行纯化；

采用NGS磁珠进行PCR产物的纯化；

S6：使用与接头元件的固定序列FS互补配对的引物，和与特异性靶向扩增引物通用序列CS互补配对的引物，进行PCR扩增，获得16S rDNA定量测序文库。

6.根据权利要求5所述的16S rDNA可变区定量测序文库的构建方法，其特征在于，步骤S1使用超声波物理破碎或酶切反应对双链DNA进行片段化。

7.根据权利要求5或6所述的16S rDNA可变区定量测序文库的构建方法，其特征在于，步骤S3的接头元件为权利要求3所述的接头元件，步骤S4所述特异性靶向序列为位于V4可变区下游靠近V4可变区的保守区序列，或靶向位于V3可变区下游靠近V3可变区的保守区序列，或为这两种靶向序列组成的混合物；优选的，所述特异性靶向扩增引物序列为SEQ IDNO.3：(5’→3’)GCCTTGGCACCCGAGAAT TCCAGGACTACHVGGGTWTCTAAT，其中加粗部分为Illumina文库PCR引物的识别序列CS，GGACTACHVGGGTWTCTAAT为16S rDNA的V4区靶向扩增引物序列，其中H为A、C或T中的任意一个，V为A、C或G中的任意一个，W为A或T中的任意一个；步骤S4所述DNA聚合酶为Bst DNA聚合酶；步骤S6所述的PCR扩增上游引物为SEQ ID NO.4所示：(5’→3’)AATGATACGGCGACCACCGAGATCTACACGTTCAGAGTTCTACAGTCCGA，其中加粗部分与接头元件中的固定序列FS结合，下游引物为SEQ ID NO.5：(5’→3’)CAAGCAGAAGACGGCATACGAGATTCGCCTTAGTGACTGGAGTTGCCTTG GCACCCGAGAATTCCA，其中加粗部分与特异性靶向扩增引物中的CS序列结合；CTGGAGTT为index序列。

8.一种由权利要求5或6或7任一项所述的方法构建的16S rDNA可变区定量测序文库测序数据分析方法，其特征在于，包括如下步骤：

S2：对双末端fastq文件进行合并；

S4：对每个样本的序列进行聚类：如果可变序列VS相同且其他部分仅有5个碱基的错配mismatch则去除reads数目少的序列，选用reads数目多的序列合并为1个唯一的uniq序列；大于4个碱基的mismatch则同时保留两条序列作为两个uniq序列；如果可变序列VS不同，但是其他都相同的序列则认为是同一个uniq序列，VS序列的种类数目记录为该uniq序列的数量；

S5：对uniq序列的嵌合体进行过滤；