CN115354398A

CN115354398A - 一种使宏基因组测序文库片段大小集中的文库构建方法

Info

Publication number: CN115354398A
Application number: CN202211187624.XA
Authority: CN
Inventors: 曹德盼; 李东东; 程珂燕; 康亮亮; 李立锋; 李杜衡
Original assignee: Jinshi Zhizao Tianjin Medical Technology Co ltd; Tianjin Jinke Medical Technology Co ltd; Beijing Jinshao Medical Laboratory Co ltd
Current assignee: Jinshi Zhizao Tianjin Medical Technology Co ltd; Tianjin Jinke Medical Technology Co ltd; Beijing Jinshao Medical Laboratory Co ltd
Priority date: 2022-09-27
Filing date: 2022-09-27
Publication date: 2022-11-18

Abstract

本申请提供了一种使宏基因组文库片段大小集中的文库构建方法，所述方法使用优化的酶切消化法搭配反应增强液来构建文库体系，具有样本兼容性高和体系稳定性好等优势，能够提高文库定量准确性，提高混样均一性和数据均一性。

Description

一种使宏基因组测序文库片段大小集中的文库构建方法

技术领域

本申请涉及基因测序技术领域，具体涉及一种可以使宏基因组文库片段大小集中的建库方法及其应用。

背景技术

高通量测序(NGS)的数据产出和数据质量跟多个因素息息相关，其中主要影响因素是文库质量、测序试剂和仪器状况，由于测序试剂和仪器状况不易控制，因此，为了保证测序质量，需要严格把控文库质量。文库的质量对于高通量测序(NGS)产出的数据质量至关重要。

评价文库质量，通常可从三方面衡量：文库片段、文库碱基复杂度和文库浓度。完整的文库除了目的片段，还可能存在二聚体、小片段、大片段等非目的片段的存在，这些非目的片段会导致文库定量不准确，同时还可能影响后续的上机测序，降低测序数据的产出和测序的质量。因此文库片段指标是浓度定量准确性的前提，是测序数据量产出均一性的根本。

文库片段分析通常都使用微流控芯片技术的仪器进行检测，一般有以下3种情况：1.大片段拖尾现象：①片段化过程中打断的条件不合适，残留部分较长的片段；②文库分选过程磁珠比例不当导致；③文库的扩增循环数太高，文库过度扩增自我互联形成多聚体。大片段在上机测序时，可能会跨孔长簇，测序仪会过滤掉这部分的数据，降低产出。2.宽峰现象：①打断条件不合适，②文库没有进行分选或分选条件不合适。宽峰的文库由于片段分布广，难以进行文库浓度的准确定量，因此文库的数据产出不好控制。3.片段过大现象：①插入片段过长，打断条件不合适，②文库没有进行分选或分选条件不合适。测序的文库长度太长，一方面会影响文库浓度的荧光定量，另一方面，在上机测序时可能会跨孔长簇，产生index hopping，降低测序数据的产出和质量，还有长的文库片段也会形成较大的簇，导致荧光信号减弱，机器在碱基识别时，准确率降低，Q30降低，同时也会影响数据量。

宏基因组测序能够对样本中的所有核酸进行无偏向测序，包括人源和微生物的核酸。因此文库质量对于宏基因组测序来说影响极大，文库质量直接关系到目标病原数据产出的占比与整个测序质量进而影响微生物含量分析，影响病原微生物的检出。鉴于此，特提出本申请。

发明内容

本申请针对宏基因组样本，使用酶切消化法搭配低浓度反应增强液来构建文库体系，通过对时间、温度、核酸洗脱液(pH)、样本类型、input量、循环数等影响文库片段大小的多种因素进行优化探索，保证了在相对较高的扩增循环数下宏基因组文库片段大小集中不拖尾，低起始量的样本能达到出库标准，体现了样本兼容性高和体系稳定性好等优势。

因此本申请的核心目的是寻求一种针对宏基因组样本的、具有样本兼容性高和体系稳定性的新型建库方法及体系。

为实现上述目的，本申请具体采用的技术方案如下：

本申请首先提供一种使宏基因组文库片段大小集中的文库构建方法，其特征在于，所述方法包括：

1)核酸提取：取感染宏基因组样本进行核酸提取；

2)文库构建：a、核酸片段化；b、接头连接；c、接头产物纯化；d、纯化产物扩增。

进一步的，所述核酸提取可采用金匙1901R核酸提取和纯化试剂盒进行。

进一步的，所述a、核酸片段化步骤具体为：取一定起始量的核酸提取样本，加入片段化酶、EB洗脱液和反应增强液进行酶切反应。

进一步的，所述反应增强液终浓度为1-50nmol，所述反应增强液中包括Tris-HCl、C₆H₅O₇Na₃、BSA、Mg(CH₃COO)₂.4H₂O、MgCl₂、CaCl₂、BaCl₂、MnCl₂、NaCl、KCl、Na₂HPO₄、KH₂PO₄和NH₄H₂PO₄。

预测该反应增强液能够使DNA构象发生变化，形成网状结构，增加与片段化酶有效碰撞的机会和让片段化打断酶保持高活性的反应环境。

进一步的，所述反应增强液中部分组分的浓度如下：

进一步的，所述一定起始量的核酸提取样本为1-60ng的核酸提取样本；所述反应增强液终浓度为1-50nmol；所述酶切反应的温度为35-37℃，反应时间为15-20min。

更进一步的，所述一定起始量的核酸提取样本为1-30ng的核酸提取样本；所述反应增强液终浓度为30nmol；所述酶切反应的温度为37℃，反应时间为20min。

在一些具体的实施方式中，所述片段化步骤具体为：

将片段化酶(FEA Enzyme mix-C2)使用时从冰箱取出轻弹混匀离心，于灭菌PC R管中配制如下反应：

备注：1ng≤input DNA≤60ng。

使用移液器轻轻吹打混匀，短暂离心将反应液收集至管底。

将PCR管暂时置于冰上，在PCR仪上设置下述程序，将PCR管放入PCR仪，然后继续运行程序：

反应结束后，立即进行接头连接步骤。

在一些具体的实施方式中，所述接头连接步骤具体为：

将连接酶Buffer解冻后混匀离心，置于冰上备用。连接酶使用时从冰箱取出轻弹混匀离心，在末端修复产物的PCR管中配制如下反应：

使用移液器轻轻吹打10次混匀(请勿振荡混匀)，并短暂离心将反应液收集至管底。

将PCR管置于PCR仪中，进行下述反应：

热盖 Off

20℃ 15min

4℃ Hold

反应结束后，立即进行后续步骤。

进一步的，所述纯化产物扩增中扩增循环数为6-12个，优选10-12个；更优选的，所述扩增反应如下：

在一些具体的实施方式中，纯化产物的扩增具体为：

配制PCR反应混合液：

按下表条件进行PCR反应：

反应结束后瞬时离心将反应液收集至管底。

进一步的，所述文库构建以金匙2102/2037病原微生物核酸检测试剂盒为基础。

进一步的，所述文库构建方法使片段大小保持在300-400bp范围内，文库峰形稳定。

进一步的，所述文库构建是针对二代MGI测序平台的文库构建。

进一步的，所述感染宏基因组样本选自肺泡灌洗液、血液、痰液和脑脊液。

本申请还提供一种宏基因组测序分析方法，包括上述任一所述的文库构建方法，并进一步包括测序和生信分析步骤。

本申请有益的技术效果：

1)本申请在常规酶切法文库构建的组分中加入反应增强液NB，同时通过优化建库体系中的时间、温度、pH、样本类型、核酸洗脱液、input量等，获得一种使宏基因组文库片段大小集中的文库构建方法，该方法至少具有体系兼容性高优势，同时稳定性好，无论什么样本类型或核酸类型的文库都能使文库片段稳定在200-400bp的范围内，另外还具有操作简单、成本低等优势。

2)本申请能够提高产出数据质量：本申请构建的可以使宏基因组文库片段大小集中的方法，使文库片段大小稳定在200-400bp的范围之内，能提高文库定量的准确性，提高混样均一性、产出数据量更均一，有利于测序检出结果的解读。

附图说明

为了更清楚地说明本申请具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1、不同酶切温度的文库峰形图，其中，a为对照组30℃文库峰形图，b为实验组37℃的文库峰形图；

图2、不同样本类型、不同酶切时间的文库峰形图，其中，a为临床样本15min文库峰形，b为临床样本20min文库峰形，c为临床样本25和30min文库峰形，d为gDNA 15min文库峰形，e为gDNA 20min文库峰形，f为gDNA 25min文库峰形；

图3、1-60ng input量文库峰形图；

图4、不同PH值洗液文库峰形图；

图5、相同起始量不同溶液的文库峰形图；

图6、不同EB量的文库峰形图；

图7、不同含量反应增强液的文库峰形图，其中，a为1ng起始量不同增强液量的文库峰形，b为10ng起始量不同增强液量的文库峰形，c为30ng起始量不同增强液量的文库峰形，d为60ng起始量不同增强液量的文库峰形；

图8、不同循环数的文库峰形图，其中，a为6cycles文库峰形，b为9cycles文库峰形，c为10cycles文库峰形，d为12cycles文库峰形，e为14cycles文库峰形，f为16cycles文库峰形；

图9、原流程和新流程产出数据偏差比较。

具体实施方式

下面将结合实施例对本申请的实施方案进行详细描述，但是本领域技术人员将会理解，下列实施例仅用于说明本申请，而不应视为限制本申请的范围，并且所述实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

部分术语定义

除非在下文中另有定义，本申请具体实施方式中所用的所有技术术语和科学术语的含义意图与本领域技术人员通常所理解的相同。虽然相信以下术语对于本领域技术人员很好理解，但仍然阐述以下定义以更好地解释本申请。

如本申请中所使用，术语“包括”、“包含”、“具有”、“含有”或“涉及”为包含性的(inclusive)或开放式的，且不排除其它未列举的元素或方法步骤。术语“由…组成”被认为是术语“包含”的优选实施方案。如果在下文中某一组被定义为包含至少一定数目的实施方案，这也应被理解为揭示了一个优选地仅由这些实施方案组成的组。

本申请中的术语“大约”、“大体”表示本领域技术人员能够理解的仍可保证论及特征的技术效果的准确度区间。该术语通常表示偏离指示数值的±10％，优选±5％。在提及单数形式名词时使用的不定冠词或定冠词例如“一个”或“一种”，“所述”，包括该名词的复数形式。

此外，说明书和权利要求书中的术语第一、第二、第三、(a)、(b)、(c)以及诸如此类，是用于区分相似的元素，不是描述顺序或时间次序必须的。应理解，如此应用的术语在适当的环境下可互换，并且本申请描述的实施方案能以不同于本申请描述或举例说明的其它顺序实施。

本申请的方法，从影响文库片段大小的因素入手进行筛选：1.从酶学特性角度出发选择酶适宜的反应温度，来选择对应温度下的反应时间；2.从酶活性角度出发研究建库流程中可能影响酶活性的因素：反应环境PH、温度，根据核酸稳定性、试剂背景及稳定来源，选择合适的核酸洗脱液；3.研究选择的洗脱液在反应体系中的含量变化对文库片段大小的影响；4.解决洗脱液对片段化反应的影响，筛选反应增强液并确立其在反应体系中的最适浓度。

以下结合具体的实施例来证明本申请所产生的技术效果。

实施例1本申请体系优化

宏基因组检测过程中，文库片段大小会影响文库定量结果的准确性；华大测序平台文库的DNB制备所需的体积是根据文库片段的大小来计算的，V＝80*N*2*327/C*10^6(N表示文库总片段长度，单个脱氧核糖核苷酸的平均分子量为327，C表示混合文库浓度ng/μL，dsDNA文库投入量为80fmol)，若临床文库片段大小有较大差异，则导致DNB体积有偏差，有效的DNB的量也会出现偏差，数据产出不均一，可能会有漏检的风险。鉴于此，本实施例从影响文库片段大小的因素，包括时间、温度、核酸洗脱液(pH)、样本类型、input量、反应增强液、循环数等出发，以每一个条件作为单因素可变量进行文库峰形稳定性的优化。

具体的，以文库构建体系条件不改变作为阴性对照，通过建立包括如下6方面的体系优化，以期使宏基因组文库片段大小集中。

1)不同片段化温度对文库峰形的影响；

2)不同酶切时间对文库峰形的影响；

3)不同的建库起始量对文库峰形的影响；

4)不同PH值的核酸洗脱液(NFW、EB、TB)对文库峰形的影响；

4.1EB对峰形的影响；

4.2EB含量对文库峰形的影响；

5)反应增强液的选择和优化；

6)循环数的调整优化。

一、详细实验方法和步骤

1.样本制备

1)配置临床样本，为探索各种类型样本环境下的宏基因组建库，本申请将不同类型临床样本制成1个混合样本(血浆、脑脊液、肺泡灌洗液、痰液各1mL混成1个样本)，其中除血浆外，其它3种类型的样本均使用破壁仪进行样本处理后吸取相应的体积进行混合；作为补充，本申请同时采购商品化gDNA核酸样本用于部分实验的平行对照。

2)混合后的样本按照核酸提取和纯化试剂盒说明书进行核酸提取3份，提取过程中分别用EB(Elution buffer)、TB(Tris盐酸buffer)、NFW(无核酸酶水)来洗脱核酸。

表1制备的样本的核酸信息

2、建库处理

根据设计的变量参数进行文库构建。

3、文库片段分析

采用Agilent 2100Bioanalyzer进行文库片段分析

制胶：试剂室温平衡30min,15μL高灵敏度DNA染色溶液加到高灵敏度DNA胶混合物中，涡旋混匀，胶、染色液混合物全部转移至过滤管中，室温2240g(6000rpm)离心15min,弃过滤管，留胶备用。

装胶：按照说明书，往芯片的相应位置加9μL胶，注意不要产生气泡；压胶、继续向芯片对应位置加入胶。

加样：除了胶孔外的其它12个孔中加入5μL高灵敏度DNA Markers，每个样品孔不能空置，ladder的孔加入1μL DNA Ladder，其它11个孔中加入1μL样品，样品加到底，以防涡旋混合的时候飞溅出来。

打开仪器，安装芯片进行检测。

4、结果分析

1)根据文库主峰的位置及片段大小，判断文库峰形是否一致。

2)计算改变文库构建条件后整run产出的CV值与未变条件时整run产出的CV值比较，查看文库产出均一性。

3)扩增循环数与文库片段大小的关系。

二、实验结果：

1.以温度为变量进行研究

实验设计如下：

用2100片段分析仪进行对照组与实验组文库片段大小的分析，回收后的高浓度文库都统一稀释到3ng/μL左右，制胶、灌胶、点样1μL、仪器运行分析。

酶切温度变化对文库峰形的影响如图1所示，a为对照组30℃文库峰形图，b为实验组37℃的文库峰形图。根据酶学特性选择酶适宜的反应温度，可见，同样建库起始量，37℃左右温度(比如35-37℃)，片段化的文库片段大小主峰300-400bp之间，文库峰形更集中，而较低温度表现较差。

2.以不同酶切时间为变量进行研究

实验设计如下：

酶切时间变化对文库峰形的影响如图2所示，a-c分别代表临床样本在15min、20min、25和30min酶切条件下的文库峰形(图c中同时包含25min和30min下的峰形)，d-e代表gDNA样本在15min、20min和25min酶切条件下的文库峰形。图2可见，无论是临床样本还是商品化的gDNA核酸样本，在37℃条件下片段化，随着反应时间的增加，文库片段都变小，但之后文库会出现过度扩增的大片段，整体而言15-20min(最优选20min)时文库主峰片段大小在300-400bp之间，文库峰形更集中。

3.以不同DNA起始量为变量研究

实验设计如下：

针对临床样本的不同建库起始量对文库峰形的影响结果如图3所示。可见，建库起始量在1-60ng之间，随着起始量的增加，文库片段主峰逐渐右移(文库片段增大)，但文库主峰在300-400bp之间，文库峰形集中，超60ng后不利于峰形(60ng刚出现拖尾，箭头处)，因此DNA样本起始量为1-60ng，优选为1-30ng。

4.添加不同核酸洗脱液为变量研究

实验设计如下：

体系中添加不同洗脱液对文库峰形影响如图4所示(图中仅体现EB和NFW)。不同洗脱液对应不同的pH值，可见缓冲体系中pH值对片段化酶有影响，同样量的核酸，溶解在不同pH值溶液中，不同洗脱液文库片段都分布在300-400bp之间，但EB文库片段较大，峰形分布比较宽，TB和NFW对文库峰形影响较小。

此外，关于洗脱液的选择：首先，核酸在碱性的环境中能稳定贮存，EB相对更适合；其次，EB的洗脱效率通常是优于NFW；另外，TB通常是提取试剂盒中的洗脱组分，为不受限于提取试剂盒的选取，本申请综合选择EB溶液作为片段化过程的缓冲体系。

4.1进一步研究EB对文库片段的影响(DNA起始量为变量)

实验设计如下：

在不同核酸起始量下，EB缓冲液对文库峰形的影响如图5所示：1ng起始量的核酸，EB影响文库的片段大小，文库峰形比较宽；30ng起始量的核酸，EB影响文库的片段大小，主峰在500bp。

4.2进一步研究EB对文库峰形的影响(EB含量为变量)

实验设计如下：

不同EB含量对文库峰形的影响如图6所示。看得出，相同起始量的核酸，用不同体积的EB溶液稀释，在50ul的反应体系中EB含量越高，文库的峰形越宽，当反应体系中EB含量≤10ul时，文库的片段大小趋于稳定，峰形保持一致。

综合4.1和4.2可见，EB的相对含量对文库的峰形影响非常大，这在实践中非常不利，需要进一步优化。

5.1片段化过程中，探寻反应增强液以及以不同添加量的为变量的研究

实验设计如下：

本申请通过预实验筛选到一种反应增强液NB，其组分包括：Tris-HCl和Mg(CH3COO)₂.4H₂O、MgCl₂、CaCl₂、BaCl₂、MnCl₂、NaCl、KCl、Na₂HPO₄、KH₂PO₄、NH₄H₂PO₄、BSA、C₆H₅O₇Na₃(柠檬酸三钠)等。

各组分的主要成分浓度见下表：

离子名称	离子终浓度
		C<sub>6</sub>H<sub>5</sub>O<sub>7</sub>Na<sub>3</sub>	0.25-0.1mg/mL
Mg<sup>2+</sup>	10-30mM
		Ca<sup>2+</sup>	5-15mM
Ba<sup>2+</sup>	0.05-1.5mM
		Mn<sup>2+</sup>	0.05-1.5mM
Na<sup>+</sup>	15-40mM
		K<sup>+</sup>	0.1-0.5mM
NH<sup>4+</sup>	0.3-0.6mM
		BSA	0.075-0.15mg/ml

不同添加量的为变量实验设计如下：

片段化过程中，反应增强液含量对文库峰形的影响如图7所示，其中，a为1ng起始量不同NB量的文库峰形，b为10ng起始量不同NB量的文库峰形，c为30ng起始量不同NB量的文库峰形，d为60ng起始量不同NB量的文库峰形。

较令人惊奇的是，在建库起始量为1-60ng时，当加了一系列低浓度的反应增强液后体系不再受EB用量影响，即低浓度反应增强液加入，能够显著降低了EB对峰形的影响；尤其在体系中加入1-5ul(1-50nmol)时，最优3ul(30nmol终浓度)反应增强液时，能促进片段化的反应，使文库峰形都维持在300bp-400bp左右的一个稳定范围内。

6.以循环数为变量研究

实验设计如下：

扩增循环数对文库峰形的影响如图8所示，其中，a为6cycles文库峰形，b为9cycles文库峰形，c为10cycles文库峰形，d为12cycles文库峰形，e为14cycles文库峰形，f为16cycles文库峰形。可见，随着扩增循环数的增加，文库出现过度扩增的大片段拖尾现象。在起始量1-60ng的范围内，扩增循环数为6-12cycles时(最优选10和12cycles)，文库峰形稳定，片段在200-400bp之间。

综上所述，在样本起始量为1-60ng，片段化体系中加入1-50nmol的反应增强液，酶切35-37℃左右，15-20min左右，扩增循环数为6-12cycles时文库的片段大小保持在300-400bp的范围之内，文库峰形保持稳定。

最优选的方案为：样本起始量为1-30ng，片段化体系中加入30nmol的反应增强液，酶切37℃20min，扩增10-12cycles时，既能保证文库出库量达到华大平台上机要求，同时文库的片段大小保持在300-400bp的范围之内，文库峰形保持稳定，据此建立本申请的文库构建方法体系。

实施例2本申请方法步骤建立

基于上述确立最优化参数，建立本申请的文库构建和测序方法，具体如下：

1.核酸提取纯化

取临床样本，采用诸如商品化的金匙1901R核酸提取和纯化试剂盒进行核酸提取和纯化，获得纯化后的核酸溶液

2.文库构建

文库构建的基础步骤不作限制，以商品化的金匙2102/2037病原微生物核酸检测试剂盒(MGI-DNA)为例。

1)片段化&末端修复

备注：1ng≤input DNA≤60ng；

使用移液器轻轻吹打10次混匀，并短暂离心将反应液收集至管底。

待PCR仪反应结束后，立即进行步骤(2)。

2)接头连接

将PCR管置于PCR仪中，进行下述反应：

热盖 Off

20℃ 15min

4℃ Hold

反应结束后，立即进行步骤(3)。

3)接头连接产物纯化

注：DNA Clean Beads提前拿出涡旋震荡混匀，平衡至室温。

吸取60μL即0.6×DNA Clean Beads至100μL接头连接反应产物中，涡旋振荡或使用移液器吹打10次充分混匀。室温孵育5min。

将PCR管短暂离心并置于磁力架中分离磁珠和液体，待溶液澄清后(约5min)，小心移除上清。

加入200μL新鲜配制的80％乙醇漂洗磁珠，转动PCR管使磁珠穿过乙醇漂洗液3-4次，待磁珠完全吸附后小心移除上清。

保持PCR管置于磁力架中，加入200μL新鲜配制的80％乙醇漂洗磁珠，再次转动PCR管使磁珠穿过漂洗液3-4次，待磁珠完全贴近磁条的管壁后小心移除上清。尽量吸干管内液体，有少量残留在管壁时可将离心管瞬时离心，在磁力架上分离后，用小量程的移液器将管底液体吸干。

保持PCR管始终置于磁力架中，开盖干燥磁珠至刚刚出现龟裂。

将PCR管从磁力架中取出，加入23μL EB洗脱，涡旋振荡或使用移液器吹打充分混匀，于室温静置5min，将PCR管短暂离心并置于磁力架上静置，待溶液澄清后吸取20μL上清至新的PCR管中，切勿触碰磁珠。停止点：连接产物纯化后可置-20℃冰箱储存。

4)纯化产物的扩增(25min)

在冰上配制PCR反应混合液：

注：UDB-XX*:双端index文库扩增引物，XX为index序号，每个样品对应一个的Index prime编号。

移液器吹打混匀或涡旋震荡3次，每次3s，瞬时离心将反应液收集至管底。

将步骤4.2所述PCR管置于PCR仪上，按下表的条件进行PCR反应。

反应结束后瞬时离心将反应液收集至管底。

5)PCR产物纯化

提前30min取出Beads置于室温，使用前充分震荡混匀。

吸取45μL即0.9X Beads至50μL PCR产物中，用移液器轻轻吹打至少10次至完全混匀，最后一次应确保将吸头中所有液体及磁珠都打入离心管中。

室温孵育5min。

将离心管瞬时离心后置于磁力架，静置2-5min至液体澄清，用移液器小心吸取上清并丢弃。

保持离心管置于磁力架上，加入200μL新鲜配制的80％乙醇漂洗磁珠及管壁，转动PCR管使磁珠穿过乙醇漂洗液3-4次待磁珠完全吸附后小心吸取并丢弃上清。

重复上步，尽量吸干管内液体，有少量残留在管壁时可将离心管瞬时离心，在磁力架上分离后，用小量程的移液器将管底液体吸干。

保持离心管置于磁力架上，打开离心管管盖，室温干燥，直至磁珠表面无反光、无开裂。

将离心管从磁力架上取下，加入35μL EB进行DNA洗脱，用移液器轻轻吹打至少10次至完全混匀。

室温下孵育5min。

将离心管瞬时离心后置于磁力架上，静置5min至液体澄清，将30μL上清液转移到新的1.5mL离心管中。停止点：PCR纯化后产物，可置-20℃冰箱储存。

3.测序和生信分析。

MGI平台上机测序和下机数据生信分析。

实施例3临床样本检测

采用上述实施例确定的步骤，挑选不同类型临床研本样本进行检测，分别采用传统未优化的基础流程和本申请优化后流程体系分别建库，在MGI平台上机测序，分析整张芯片的产出和产出均一性。

原流程结果如下表：

本申请流程结果如下表和图9：

结合上表和图9可知，相同样本相同上机流程，在不同建库流程中，整张芯片的产出均一性，本申请优化后流程结果具有极其显著优势，产出偏差呈正态分布，无论是针对何种感染宏基因组样本，本申请的实际产出/理论产出值都优于未优化流程，CV值10％远小于传统流程33％，具有深远意义。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，但本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

1.一种使宏基因组文库片段大小集中的文库构建方法，其特征在于，所述方法包括：

1)核酸提取：取感染宏基因组样本进行核酸提取；

2)文库构建：

a、核酸片段化；

b、接头连接；

c、接头产物纯化；

d、纯化产物扩增。

2.根据权利要求1所述文库构建方法，其特征在于，所述a、核酸片段化步骤具体为：取一定起始量的核酸提取样本，加入片段化酶、EB洗脱液和反应增强液进行酶切反应。

3.根据权利要求2所述文库构建方法，其特征在于，所述反应增强液中包括Tris-HCl、C₆H₅O₇Na₃、BSA、Mg(CH₃COO)₂.4H₂O、MgCl₂、CaCl₂、BaCl₂、MnCl₂、NaCl、KCl、Na₂HPO₄、KH₂PO₄和NH₄H₂PO₄。

4.根据权利要求3所述文库构建方法，其特征在于，所述反应增强液中部分组分浓度如下：

离子名称离子终浓度 C6H5O7Na3 0.25-0.1mg/mL Mg2+ 10-30mM Ca2+ 5-15mM Ba2+ 0.05-1.5mM Mn2+ 0.05-1.5mM Na+ 15-40mM K+ 0.1-0.5mM NH4+ 0.3-0.6mM BSA 0.075-0.15mg/ml

5.根据权利要求2所述文库构建方法，其特征在于，所述一定起始量的核酸提取样本为1-60ng的核酸提取样本；所述反应增强液终浓度为1-50nmol；所述酶切反应的温度为35-37℃，反应时间为15-20min。

6.根据权利要求1-5任一所述文库构建方法，其特征在于，所述纯化产物扩增中扩增循环数为6-12个，优选为10-12个。

7.根据权利要求1-8所述的文库构建方法，其特征在于，所述文库构建方法使片段大小保持在300-400bp范围内，使文库峰形稳定。

8.一种宏基因组测序分析方法，其特征在于，包括权利要求1-7任一所述的文库构建方法，并进一步包括测序和生信分析步骤。

9.根据权利要求1-8任一所述方法，其特征在于，所述文库构建是针对二代MGI测序平台的文库构建。

10.根据权利要求1-8任一所述方法，其特征在于，所述感染宏基因组样本选自肺泡灌洗液、血液、痰液和脑脊液。