CN115354398A - 一种使宏基因组测序文库片段大小集中的文库构建方法 - Google Patents
一种使宏基因组测序文库片段大小集中的文库构建方法 Download PDFInfo
- Publication number
- CN115354398A CN115354398A CN202211187624.XA CN202211187624A CN115354398A CN 115354398 A CN115354398 A CN 115354398A CN 202211187624 A CN202211187624 A CN 202211187624A CN 115354398 A CN115354398 A CN 115354398A
- Authority
- CN
- China
- Prior art keywords
- library
- library construction
- nucleic acid
- reaction
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000012634 fragment Substances 0.000 title claims description 55
- 238000010276 construction Methods 0.000 title claims description 30
- 238000012163 sequencing technique Methods 0.000 title claims description 28
- 238000006243 chemical reaction Methods 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 33
- 230000002708 enhancing effect Effects 0.000 claims abstract description 28
- 238000001976 enzyme digestion Methods 0.000 claims abstract description 15
- 108020004707 nucleic acids Proteins 0.000 claims description 43
- 102000039446 nucleic acids Human genes 0.000 claims description 43
- 150000007523 nucleic acids Chemical class 0.000 claims description 43
- 108090000790 Enzymes Proteins 0.000 claims description 16
- 102000004190 Enzymes Human genes 0.000 claims description 16
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 16
- 230000003321 amplification Effects 0.000 claims description 15
- 238000006062 fragmentation reaction Methods 0.000 claims description 15
- 239000003480 eluent Substances 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 13
- 238000013467 fragmentation Methods 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 11
- 239000000047 product Substances 0.000 claims description 10
- 239000012264 purified product Substances 0.000 claims description 7
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 claims description 6
- 230000035484 reaction time Effects 0.000 claims description 5
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 claims description 4
- 239000012530 fluid Substances 0.000 claims description 4
- 150000002500 ions Chemical class 0.000 claims description 4
- 206010036790 Productive cough Diseases 0.000 claims description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 3
- 208000015181 infectious disease Diseases 0.000 claims description 3
- 239000011780 sodium chloride Substances 0.000 claims description 3
- 210000003802 sputum Anatomy 0.000 claims description 3
- 208000024794 sputum Diseases 0.000 claims description 3
- 210000004369 blood Anatomy 0.000 claims description 2
- 239000008280 blood Substances 0.000 claims description 2
- 239000012141 concentrate Substances 0.000 claims description 2
- 238000002156 mixing Methods 0.000 abstract description 6
- 230000008901 benefit Effects 0.000 abstract description 3
- 239000000243 solution Substances 0.000 description 40
- 239000011324 bead Substances 0.000 description 20
- 230000000694 effects Effects 0.000 description 19
- 239000007788 liquid Substances 0.000 description 17
- 108020004414 DNA Proteins 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 239000003292 glue Substances 0.000 description 11
- 239000000203 mixture Substances 0.000 description 11
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 10
- 238000013401 experimental design Methods 0.000 description 9
- 239000006228 supernatant Substances 0.000 description 8
- 238000001514 detection method Methods 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 108091092584 GDNA Proteins 0.000 description 6
- 102000003960 Ligases Human genes 0.000 description 6
- 108090000364 Ligases Proteins 0.000 description 6
- 239000000872 buffer Substances 0.000 description 5
- 238000007664 blowing Methods 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 238000010828 elution Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000010009 beating Methods 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 239000010931 gold Substances 0.000 description 3
- 229910052737 gold Inorganic materials 0.000 description 3
- 244000000010 microbial pathogen Species 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 239000012295 chemical reaction liquid Substances 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 239000011259 mixed solution Substances 0.000 description 2
- 230000010355 oscillation Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000012192 staining solution Substances 0.000 description 2
- 238000010257 thawing Methods 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108091060592 XDNA Proteins 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 241000264288 mixed libraries Species 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 238000013386 optimize process Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 239000012487 rinsing solution Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Immunology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本申请提供了一种使宏基因组文库片段大小集中的文库构建方法,所述方法使用优化的酶切消化法搭配反应增强液来构建文库体系,具有样本兼容性高和体系稳定性好等优势,能够提高文库定量准确性,提高混样均一性和数据均一性。
Description
技术领域
本申请涉及基因测序技术领域,具体涉及一种可以使宏基因组文库片段大小集中的建库方法及其应用。
背景技术
高通量测序(NGS)的数据产出和数据质量跟多个因素息息相关,其中主要影响因素是文库质量、测序试剂和仪器状况,由于测序试剂和仪器状况不易控制,因此,为了保证测序质量,需要严格把控文库质量。文库的质量对于高通量测序(NGS)产出的数据质量至关重要。
评价文库质量,通常可从三方面衡量:文库片段、文库碱基复杂度和文库浓度。完整的文库除了目的片段,还可能存在二聚体、小片段、大片段等非目的片段的存在,这些非目的片段会导致文库定量不准确,同时还可能影响后续的上机测序,降低测序数据的产出和测序的质量。因此文库片段指标是浓度定量准确性的前提,是测序数据量产出均一性的根本。
文库片段分析通常都使用微流控芯片技术的仪器进行检测,一般有以下3种情况:1.大片段拖尾现象:①片段化过程中打断的条件不合适,残留部分较长的片段;②文库分选过程磁珠比例不当导致;③文库的扩增循环数太高,文库过度扩增自我互联形成多聚体。大片段在上机测序时,可能会跨孔长簇,测序仪会过滤掉这部分的数据,降低产出。2.宽峰现象:①打断条件不合适,②文库没有进行分选或分选条件不合适。宽峰的文库由于片段分布广,难以进行文库浓度的准确定量,因此文库的数据产出不好控制。3.片段过大现象:①插入片段过长,打断条件不合适,②文库没有进行分选或分选条件不合适。测序的文库长度太长,一方面会影响文库浓度的荧光定量,另一方面,在上机测序时可能会跨孔长簇,产生index hopping,降低测序数据的产出和质量,还有长的文库片段也会形成较大的簇,导致荧光信号减弱,机器在碱基识别时,准确率降低,Q30降低,同时也会影响数据量。
宏基因组测序能够对样本中的所有核酸进行无偏向测序,包括人源和微生物的核酸。因此文库质量对于宏基因组测序来说影响极大,文库质量直接关系到目标病原数据产出的占比与整个测序质量进而影响微生物含量分析,影响病原微生物的检出。鉴于此,特提出本申请。
发明内容
本申请针对宏基因组样本,使用酶切消化法搭配低浓度反应增强液来构建文库体系,通过对时间、温度、核酸洗脱液(pH)、样本类型、input量、循环数等影响文库片段大小的多种因素进行优化探索,保证了在相对较高的扩增循环数下宏基因组文库片段大小集中不拖尾,低起始量的样本能达到出库标准,体现了样本兼容性高和体系稳定性好等优势。
因此本申请的核心目的是寻求一种针对宏基因组样本的、具有样本兼容性高和体系稳定性的新型建库方法及体系。
为实现上述目的,本申请具体采用的技术方案如下:
本申请首先提供一种使宏基因组文库片段大小集中的文库构建方法,其特征在于,所述方法包括:
1)核酸提取:取感染宏基因组样本进行核酸提取;
2)文库构建:a、核酸片段化;b、接头连接;c、接头产物纯化;d、纯化产物扩增。
进一步的,所述核酸提取可采用金匙1901R核酸提取和纯化试剂盒进行。
进一步的,所述a、核酸片段化步骤具体为:取一定起始量的核酸提取样本,加入片段化酶、EB洗脱液和反应增强液进行酶切反应。
进一步的,所述反应增强液终浓度为1-50nmol,所述反应增强液中包括Tris-HCl、C6H5O7Na3、BSA、Mg(CH3COO)2.4H2O、MgCl2、CaCl2、BaCl2、MnCl2、NaCl、KCl、Na2HPO4、KH2PO4和NH4H2PO4。
预测该反应增强液能够使DNA构象发生变化,形成网状结构,增加与片段化酶有效碰撞的机会和让片段化打断酶保持高活性的反应环境。
进一步的,所述反应增强液中部分组分的浓度如下:
进一步的,所述一定起始量的核酸提取样本为1-60ng的核酸提取样本;所述反应增强液终浓度为1-50nmol;所述酶切反应的温度为35-37℃,反应时间为15-20min。
更进一步的,所述一定起始量的核酸提取样本为1-30ng的核酸提取样本;所述反应增强液终浓度为30nmol;所述酶切反应的温度为37℃,反应时间为20min。
在一些具体的实施方式中,所述片段化步骤具体为:
将片段化酶(FEA Enzyme mix-C2)使用时从冰箱取出轻弹混匀离心,于灭菌PC R管中配制如下反应:
备注:1ng≤input DNA≤60ng。
使用移液器轻轻吹打混匀,短暂离心将反应液收集至管底。
将PCR管暂时置于冰上,在PCR仪上设置下述程序,将PCR管放入PCR仪,然后继续运行程序:
反应结束后,立即进行接头连接步骤。
在一些具体的实施方式中,所述接头连接步骤具体为:
将连接酶Buffer解冻后混匀离心,置于冰上备用。连接酶使用时从冰箱取出轻弹混匀离心,在末端修复产物的PCR管中配制如下反应:
使用移液器轻轻吹打10次混匀(请勿振荡混匀),并短暂离心将反应液收集至管底。
将PCR管置于PCR仪中,进行下述反应:
热盖 Off
20℃ 15min
4℃ Hold
反应结束后,立即进行后续步骤。
进一步的,所述纯化产物扩增中扩增循环数为6-12个,优选10-12个;更优选的,所述扩增反应如下:
在一些具体的实施方式中,纯化产物的扩增具体为:
配制PCR反应混合液:
按下表条件进行PCR反应:
反应结束后瞬时离心将反应液收集至管底。
进一步的,所述文库构建以金匙2102/2037病原微生物核酸检测试剂盒为基础。
进一步的,所述文库构建方法使片段大小保持在300-400bp范围内,文库峰形稳定。
进一步的,所述文库构建是针对二代MGI测序平台的文库构建。
进一步的,所述感染宏基因组样本选自肺泡灌洗液、血液、痰液和脑脊液。
本申请还提供一种宏基因组测序分析方法,包括上述任一所述的文库构建方法,并进一步包括测序和生信分析步骤。
本申请有益的技术效果:
1)本申请在常规酶切法文库构建的组分中加入反应增强液NB,同时通过优化建库体系中的时间、温度、pH、样本类型、核酸洗脱液、input量等,获得一种使宏基因组文库片段大小集中的文库构建方法,该方法至少具有体系兼容性高优势,同时稳定性好,无论什么样本类型或核酸类型的文库都能使文库片段稳定在200-400bp的范围内,另外还具有操作简单、成本低等优势。
2)本申请能够提高产出数据质量:本申请构建的可以使宏基因组文库片段大小集中的方法,使文库片段大小稳定在200-400bp的范围之内,能提高文库定量的准确性,提高混样均一性、产出数据量更均一,有利于测序检出结果的解读。
附图说明
为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1、不同酶切温度的文库峰形图,其中,a为对照组30℃文库峰形图,b为实验组37℃的文库峰形图;
图2、不同样本类型、不同酶切时间的文库峰形图,其中,a为临床样本15min文库峰形,b为临床样本20min文库峰形,c为临床样本25和30min文库峰形,d为gDNA 15min文库峰形,e为gDNA 20min文库峰形,f为gDNA 25min文库峰形;
图3、1-60ng input量文库峰形图;
图4、不同PH值洗液文库峰形图;
图5、相同起始量不同溶液的文库峰形图;
图6、不同EB量的文库峰形图;
图7、不同含量反应增强液的文库峰形图,其中,a为1ng起始量不同增强液量的文库峰形,b为10ng起始量不同增强液量的文库峰形,c为30ng起始量不同增强液量的文库峰形,d为60ng起始量不同增强液量的文库峰形;
图8、不同循环数的文库峰形图,其中,a为6cycles文库峰形,b为9cycles文库峰形,c为10cycles文库峰形,d为12cycles文库峰形,e为14cycles文库峰形,f为16cycles文库峰形;
图9、原流程和新流程产出数据偏差比较。
具体实施方式
下面将结合实施例对本申请的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本申请,而不应视为限制本申请的范围,并且所述实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
部分术语定义
除非在下文中另有定义,本申请具体实施方式中所用的所有技术术语和科学术语的含义意图与本领域技术人员通常所理解的相同。虽然相信以下术语对于本领域技术人员很好理解,但仍然阐述以下定义以更好地解释本申请。
如本申请中所使用,术语“包括”、“包含”、“具有”、“含有”或“涉及”为包含性的(inclusive)或开放式的,且不排除其它未列举的元素或方法步骤。术语“由…组成”被认为是术语“包含”的优选实施方案。如果在下文中某一组被定义为包含至少一定数目的实施方案,这也应被理解为揭示了一个优选地仅由这些实施方案组成的组。
本申请中的术语“大约”、“大体”表示本领域技术人员能够理解的仍可保证论及特征的技术效果的准确度区间。该术语通常表示偏离指示数值的±10%,优选±5%。在提及单数形式名词时使用的不定冠词或定冠词例如“一个”或“一种”,“所述”,包括该名词的复数形式。
此外,说明书和权利要求书中的术语第一、第二、第三、(a)、(b)、(c)以及诸如此类,是用于区分相似的元素,不是描述顺序或时间次序必须的。应理解,如此应用的术语在适当的环境下可互换,并且本申请描述的实施方案能以不同于本申请描述或举例说明的其它顺序实施。
本申请的方法,从影响文库片段大小的因素入手进行筛选:1.从酶学特性角度出发选择酶适宜的反应温度,来选择对应温度下的反应时间;2.从酶活性角度出发研究建库流程中可能影响酶活性的因素:反应环境PH、温度,根据核酸稳定性、试剂背景及稳定来源,选择合适的核酸洗脱液;3.研究选择的洗脱液在反应体系中的含量变化对文库片段大小的影响;4.解决洗脱液对片段化反应的影响,筛选反应增强液并确立其在反应体系中的最适浓度。
以下结合具体的实施例来证明本申请所产生的技术效果。
实施例1本申请体系优化
宏基因组检测过程中,文库片段大小会影响文库定量结果的准确性;华大测序平台文库的DNB制备所需的体积是根据文库片段的大小来计算的,V=80*N*2*327/C*10^6(N表示文库总片段长度,单个脱氧核糖核苷酸的平均分子量为327,C表示混合文库浓度ng/μL,dsDNA文库投入量为80fmol),若临床文库片段大小有较大差异,则导致DNB体积有偏差,有效的DNB的量也会出现偏差,数据产出不均一,可能会有漏检的风险。鉴于此,本实施例从影响文库片段大小的因素,包括时间、温度、核酸洗脱液(pH)、样本类型、input量、反应增强液、循环数等出发,以每一个条件作为单因素可变量进行文库峰形稳定性的优化。
具体的,以文库构建体系条件不改变作为阴性对照,通过建立包括如下6方面的体系优化,以期使宏基因组文库片段大小集中。
1)不同片段化温度对文库峰形的影响;
2)不同酶切时间对文库峰形的影响;
3)不同的建库起始量对文库峰形的影响;
4)不同PH值的核酸洗脱液(NFW、EB、TB)对文库峰形的影响;
4.1EB对峰形的影响;
4.2EB含量对文库峰形的影响;
5)反应增强液的选择和优化;
6)循环数的调整优化。
一、详细实验方法和步骤
1.样本制备
1)配置临床样本,为探索各种类型样本环境下的宏基因组建库,本申请将不同类型临床样本制成1个混合样本(血浆、脑脊液、肺泡灌洗液、痰液各1mL混成1个样本),其中除血浆外,其它3种类型的样本均使用破壁仪进行样本处理后吸取相应的体积进行混合;作为补充,本申请同时采购商品化gDNA核酸样本用于部分实验的平行对照。
2)混合后的样本按照核酸提取和纯化试剂盒说明书进行核酸提取3份,提取过程中分别用EB(Elution buffer)、TB(Tris盐酸buffer)、NFW(无核酸酶水)来洗脱核酸。
表1制备的样本的核酸信息
2、建库处理
根据设计的变量参数进行文库构建。
3、文库片段分析
采用Agilent 2100Bioanalyzer进行文库片段分析
制胶:试剂室温平衡30min,15μL高灵敏度DNA染色溶液加到高灵敏度DNA胶混合物中,涡旋混匀,胶、染色液混合物全部转移至过滤管中,室温2240g(6000rpm)离心15min,弃过滤管,留胶备用。
装胶:按照说明书,往芯片的相应位置加9μL胶,注意不要产生气泡;压胶、继续向芯片对应位置加入胶。
加样:除了胶孔外的其它12个孔中加入5μL高灵敏度DNA Markers,每个样品孔不能空置,ladder的孔加入1μL DNA Ladder,其它11个孔中加入1μL样品,样品加到底,以防涡旋混合的时候飞溅出来。
打开仪器,安装芯片进行检测。
4、结果分析
1)根据文库主峰的位置及片段大小,判断文库峰形是否一致。
2)计算改变文库构建条件后整run产出的CV值与未变条件时整run产出的CV值比较,查看文库产出均一性。
3)扩增循环数与文库片段大小的关系。
二、实验结果:
1.以温度为变量进行研究
实验设计如下:
用2100片段分析仪进行对照组与实验组文库片段大小的分析,回收后的高浓度文库都统一稀释到3ng/μL左右,制胶、灌胶、点样1μL、仪器运行分析。
酶切温度变化对文库峰形的影响如图1所示,a为对照组30℃文库峰形图,b为实验组37℃的文库峰形图。根据酶学特性选择酶适宜的反应温度,可见,同样建库起始量,37℃左右温度(比如35-37℃),片段化的文库片段大小主峰300-400bp之间,文库峰形更集中,而较低温度表现较差。
2.以不同酶切时间为变量进行研究
实验设计如下:
酶切时间变化对文库峰形的影响如图2所示,a-c分别代表临床样本在15min、20min、25和30min酶切条件下的文库峰形(图c中同时包含25min和30min下的峰形),d-e代表gDNA样本在15min、20min和25min酶切条件下的文库峰形。图2可见,无论是临床样本还是商品化的gDNA核酸样本,在37℃条件下片段化,随着反应时间的增加,文库片段都变小,但之后文库会出现过度扩增的大片段,整体而言15-20min(最优选20min)时文库主峰片段大小在300-400bp之间,文库峰形更集中。
3.以不同DNA起始量为变量研究
实验设计如下:
针对临床样本的不同建库起始量对文库峰形的影响结果如图3所示。可见,建库起始量在1-60ng之间,随着起始量的增加,文库片段主峰逐渐右移(文库片段增大),但文库主峰在300-400bp之间,文库峰形集中,超60ng后不利于峰形(60ng刚出现拖尾,箭头处),因此DNA样本起始量为1-60ng,优选为1-30ng。
4.添加不同核酸洗脱液为变量研究
实验设计如下:
体系中添加不同洗脱液对文库峰形影响如图4所示(图中仅体现EB和NFW)。不同洗脱液对应不同的pH值,可见缓冲体系中pH值对片段化酶有影响,同样量的核酸,溶解在不同pH值溶液中,不同洗脱液文库片段都分布在300-400bp之间,但EB文库片段较大,峰形分布比较宽,TB和NFW对文库峰形影响较小。
此外,关于洗脱液的选择:首先,核酸在碱性的环境中能稳定贮存,EB相对更适合;其次,EB的洗脱效率通常是优于NFW;另外,TB通常是提取试剂盒中的洗脱组分,为不受限于提取试剂盒的选取,本申请综合选择EB溶液作为片段化过程的缓冲体系。
4.1进一步研究EB对文库片段的影响(DNA起始量为变量)
实验设计如下:
在不同核酸起始量下,EB缓冲液对文库峰形的影响如图5所示:1ng起始量的核酸,EB影响文库的片段大小,文库峰形比较宽;30ng起始量的核酸,EB影响文库的片段大小,主峰在500bp。
4.2进一步研究EB对文库峰形的影响(EB含量为变量)
实验设计如下:
不同EB含量对文库峰形的影响如图6所示。看得出,相同起始量的核酸,用不同体积的EB溶液稀释,在50ul的反应体系中EB含量越高,文库的峰形越宽,当反应体系中EB含量≤10ul时,文库的片段大小趋于稳定,峰形保持一致。
综合4.1和4.2可见,EB的相对含量对文库的峰形影响非常大,这在实践中非常不利,需要进一步优化。
5.1片段化过程中,探寻反应增强液以及以不同添加量的为变量的研究
实验设计如下:
本申请通过预实验筛选到一种反应增强液NB,其组分包括:Tris-HCl和Mg(CH3COO)2.4H2O、MgCl2、CaCl2、BaCl2、MnCl2、NaCl、KCl、Na2HPO4、KH2PO4、NH4H2PO4、BSA、C6H5O7Na3(柠檬酸三钠)等。
各组分的主要成分浓度见下表:
离子名称 | 离子终浓度 |
C<sub>6</sub>H<sub>5</sub>O<sub>7</sub>Na<sub>3</sub> | 0.25-0.1mg/mL |
Mg<sup>2+</sup> | 10-30mM |
Ca<sup>2+</sup> | 5-15mM |
Ba<sup>2+</sup> | 0.05-1.5mM |
Mn<sup>2+</sup> | 0.05-1.5mM |
Na<sup>+</sup> | 15-40mM |
K<sup>+</sup> | 0.1-0.5mM |
NH<sup>4+</sup> | 0.3-0.6mM |
BSA | 0.075-0.15mg/ml |
不同添加量的为变量实验设计如下:
片段化过程中,反应增强液含量对文库峰形的影响如图7所示,其中,a为1ng起始量不同NB量的文库峰形,b为10ng起始量不同NB量的文库峰形,c为30ng起始量不同NB量的文库峰形,d为60ng起始量不同NB量的文库峰形。
较令人惊奇的是,在建库起始量为1-60ng时,当加了一系列低浓度的反应增强液后体系不再受EB用量影响,即低浓度反应增强液加入,能够显著降低了EB对峰形的影响;尤其在体系中加入1-5ul(1-50nmol)时,最优3ul(30nmol终浓度)反应增强液时,能促进片段化的反应,使文库峰形都维持在300bp-400bp左右的一个稳定范围内。
6.以循环数为变量研究
实验设计如下:
扩增循环数对文库峰形的影响如图8所示,其中,a为6cycles文库峰形,b为9cycles文库峰形,c为10cycles文库峰形,d为12cycles文库峰形,e为14cycles文库峰形,f为16cycles文库峰形。可见,随着扩增循环数的增加,文库出现过度扩增的大片段拖尾现象。在起始量1-60ng的范围内,扩增循环数为6-12cycles时(最优选10和12cycles),文库峰形稳定,片段在200-400bp之间。
综上所述,在样本起始量为1-60ng,片段化体系中加入1-50nmol的反应增强液,酶切35-37℃左右,15-20min左右,扩增循环数为6-12cycles时文库的片段大小保持在300-400bp的范围之内,文库峰形保持稳定。
最优选的方案为:样本起始量为1-30ng,片段化体系中加入30nmol的反应增强液,酶切37℃20min,扩增10-12cycles时,既能保证文库出库量达到华大平台上机要求,同时文库的片段大小保持在300-400bp的范围之内,文库峰形保持稳定,据此建立本申请的文库构建方法体系。
实施例2本申请方法步骤建立
基于上述确立最优化参数,建立本申请的文库构建和测序方法,具体如下:
1.核酸提取纯化
取临床样本,采用诸如商品化的金匙1901R核酸提取和纯化试剂盒进行核酸提取和纯化,获得纯化后的核酸溶液
2.文库构建
文库构建的基础步骤不作限制,以商品化的金匙2102/2037病原微生物核酸检测试剂盒(MGI-DNA)为例。
1)片段化&末端修复
将片段化酶(FEA Enzyme mix-C2)使用时从冰箱取出轻弹混匀离心,于灭菌PC R管中配制如下反应:
备注:1ng≤input DNA≤60ng;
使用移液器轻轻吹打10次混匀,并短暂离心将反应液收集至管底。
将PCR管暂时置于冰上,在PCR仪上设置下述程序,将PCR管放入PCR仪,然后继续运行程序:
待PCR仪反应结束后,立即进行步骤(2)。
2)接头连接
将连接酶Buffer解冻后混匀离心,置于冰上备用。连接酶使用时从冰箱取出轻弹混匀离心,在末端修复产物的PCR管中配制如下反应:
使用移液器轻轻吹打10次混匀(请勿振荡混匀),并短暂离心将反应液收集至管底。
将PCR管置于PCR仪中,进行下述反应:
热盖 Off
20℃ 15min
4℃ Hold
反应结束后,立即进行步骤(3)。
3)接头连接产物纯化
注:DNA Clean Beads提前拿出涡旋震荡混匀,平衡至室温。
吸取60μL即0.6×DNA Clean Beads至100μL接头连接反应产物中,涡旋振荡或使用移液器吹打10次充分混匀。室温孵育5min。
将PCR管短暂离心并置于磁力架中分离磁珠和液体,待溶液澄清后(约5min),小心移除上清。
加入200μL新鲜配制的80%乙醇漂洗磁珠,转动PCR管使磁珠穿过乙醇漂洗液3-4次,待磁珠完全吸附后小心移除上清。
保持PCR管置于磁力架中,加入200μL新鲜配制的80%乙醇漂洗磁珠,再次转动PCR管使磁珠穿过漂洗液3-4次,待磁珠完全贴近磁条的管壁后小心移除上清。尽量吸干管内液体,有少量残留在管壁时可将离心管瞬时离心,在磁力架上分离后,用小量程的移液器将管底液体吸干。
保持PCR管始终置于磁力架中,开盖干燥磁珠至刚刚出现龟裂。
将PCR管从磁力架中取出,加入23μL EB洗脱,涡旋振荡或使用移液器吹打充分混匀,于室温静置5min,将PCR管短暂离心并置于磁力架上静置,待溶液澄清后吸取20μL上清至新的PCR管中,切勿触碰磁珠。停止点:连接产物纯化后可置-20℃冰箱储存。
4)纯化产物的扩增(25min)
在冰上配制PCR反应混合液:
注:UDB-XX*:双端index文库扩增引物,XX为index序号,每个样品对应一个的Index prime编号。
移液器吹打混匀或涡旋震荡3次,每次3s,瞬时离心将反应液收集至管底。
将步骤4.2所述PCR管置于PCR仪上,按下表的条件进行PCR反应。
反应结束后瞬时离心将反应液收集至管底。
5)PCR产物纯化
提前30min取出Beads置于室温,使用前充分震荡混匀。
吸取45μL即0.9X Beads至50μL PCR产物中,用移液器轻轻吹打至少10次至完全混匀,最后一次应确保将吸头中所有液体及磁珠都打入离心管中。
室温孵育5min。
将离心管瞬时离心后置于磁力架,静置2-5min至液体澄清,用移液器小心吸取上清并丢弃。
保持离心管置于磁力架上,加入200μL新鲜配制的80%乙醇漂洗磁珠及管壁,转动PCR管使磁珠穿过乙醇漂洗液3-4次待磁珠完全吸附后小心吸取并丢弃上清。
重复上步,尽量吸干管内液体,有少量残留在管壁时可将离心管瞬时离心,在磁力架上分离后,用小量程的移液器将管底液体吸干。
保持离心管置于磁力架上,打开离心管管盖,室温干燥,直至磁珠表面无反光、无开裂。
将离心管从磁力架上取下,加入35μL EB进行DNA洗脱,用移液器轻轻吹打至少10次至完全混匀。
室温下孵育5min。
将离心管瞬时离心后置于磁力架上,静置5min至液体澄清,将30μL上清液转移到新的1.5mL离心管中。停止点:PCR纯化后产物,可置-20℃冰箱储存。
3.测序和生信分析。
MGI平台上机测序和下机数据生信分析。
实施例3临床样本检测
采用上述实施例确定的步骤,挑选不同类型临床研本样本进行检测,分别采用传统未优化的基础流程和本申请优化后流程体系分别建库,在MGI平台上机测序,分析整张芯片的产出和产出均一性。
原流程结果如下表:
本申请流程结果如下表和图9:
结合上表和图9可知,相同样本相同上机流程,在不同建库流程中,整张芯片的产出均一性,本申请优化后流程结果具有极其显著优势,产出偏差呈正态分布,无论是针对何种感染宏基因组样本,本申请的实际产出/理论产出值都优于未优化流程,CV值10%远小于传统流程33%,具有深远意义。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,但本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (10)
1.一种使宏基因组文库片段大小集中的文库构建方法,其特征在于,所述方法包括:
1)核酸提取:取感染宏基因组样本进行核酸提取;
2)文库构建:
a、核酸片段化;
b、接头连接;
c、接头产物纯化;
d、纯化产物扩增。
2.根据权利要求1所述文库构建方法,其特征在于,所述a、核酸片段化步骤具体为:取一定起始量的核酸提取样本,加入片段化酶、EB洗脱液和反应增强液进行酶切反应。
3.根据权利要求2所述文库构建方法,其特征在于,所述反应增强液中包括Tris-HCl、C6H5O7Na3、BSA、Mg(CH3COO)2.4H2O、MgCl2、CaCl2、BaCl2、MnCl2、NaCl、KCl、Na2HPO4、KH2PO4和NH4H2PO4。
4.根据权利要求3所述文库构建方法,其特征在于,所述反应增强液中部分组分浓度如下:
5.根据权利要求2所述文库构建方法,其特征在于,所述一定起始量的核酸提取样本为1-60ng的核酸提取样本;所述反应增强液终浓度为1-50nmol;所述酶切反应的温度为35-37℃,反应时间为15-20min。
6.根据权利要求1-5任一所述文库构建方法,其特征在于,所述纯化产物扩增中扩增循环数为6-12个,优选为10-12个。
7.根据权利要求1-8所述的文库构建方法,其特征在于,所述文库构建方法使片段大小保持在300-400bp范围内,使文库峰形稳定。
8.一种宏基因组测序分析方法,其特征在于,包括权利要求1-7任一所述的文库构建方法,并进一步包括测序和生信分析步骤。
9.根据权利要求1-8任一所述方法,其特征在于,所述文库构建是针对二代MGI测序平台的文库构建。
10.根据权利要求1-8任一所述方法,其特征在于,所述感染宏基因组样本选自肺泡灌洗液、血液、痰液和脑脊液。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211187624.XA CN115354398A (zh) | 2022-09-27 | 2022-09-27 | 一种使宏基因组测序文库片段大小集中的文库构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211187624.XA CN115354398A (zh) | 2022-09-27 | 2022-09-27 | 一种使宏基因组测序文库片段大小集中的文库构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115354398A true CN115354398A (zh) | 2022-11-18 |
Family
ID=84008279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211187624.XA Pending CN115354398A (zh) | 2022-09-27 | 2022-09-27 | 一种使宏基因组测序文库片段大小集中的文库构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115354398A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060147944A1 (en) * | 2005-01-04 | 2006-07-06 | Piotr Chomczynski | Reagents and methods for storage and processing of biological samples for DNA analysis |
CN106574266A (zh) * | 2014-08-14 | 2017-04-19 | 雅培分子公司 | 用于下一代测序的文库生成 |
CN106567133A (zh) * | 2016-11-09 | 2017-04-19 | 上海派森诺生物科技股份有限公司 | 一种宏转录组文库的建库方法 |
CN111394486A (zh) * | 2020-04-09 | 2020-07-10 | 复旦大学附属儿科医院 | 基于宏基因组测序的儿童感染性疾病病原检测及鉴定方法 |
US20200399636A1 (en) * | 2019-06-20 | 2020-12-24 | Yan Wang | Method, system and device for automated NGS library preparation |
CN113337487A (zh) * | 2021-02-09 | 2021-09-03 | 南京诺唯赞生物科技股份有限公司 | 一种用于核酸片段化的酶组合物及其应用 |
-
2022
- 2022-09-27 CN CN202211187624.XA patent/CN115354398A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060147944A1 (en) * | 2005-01-04 | 2006-07-06 | Piotr Chomczynski | Reagents and methods for storage and processing of biological samples for DNA analysis |
CN106574266A (zh) * | 2014-08-14 | 2017-04-19 | 雅培分子公司 | 用于下一代测序的文库生成 |
CN106567133A (zh) * | 2016-11-09 | 2017-04-19 | 上海派森诺生物科技股份有限公司 | 一种宏转录组文库的建库方法 |
US20200399636A1 (en) * | 2019-06-20 | 2020-12-24 | Yan Wang | Method, system and device for automated NGS library preparation |
CN111394486A (zh) * | 2020-04-09 | 2020-07-10 | 复旦大学附属儿科医院 | 基于宏基因组测序的儿童感染性疾病病原检测及鉴定方法 |
CN113337487A (zh) * | 2021-02-09 | 2021-09-03 | 南京诺唯赞生物科技股份有限公司 | 一种用于核酸片段化的酶组合物及其应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103014137B (zh) | 一种分析基因表达定量的方法 | |
CN111254190B (zh) | 一种血浆病毒组学的纳米孔三代测序检测方法 | |
CN113249457B (zh) | 一种一步法构建dna纳米球的试剂盒和方法 | |
CN106480178B (zh) | DLO Hi-C染色体构象捕获方法 | |
CN111676277A (zh) | 一种基于二代测序技术测定基因组不稳定的方法及试剂盒 | |
CN111304300B (zh) | 一种检测待测样品中各个微生物物种的基因组dna拷贝数的方法 | |
CN111748637A (zh) | 一种用于亲缘关系分析鉴定的snp分子标记组合、多重复合扩增引物组、试剂盒及方法 | |
CN112646859B (zh) | 一种基于宏基因组学的呼吸道咽拭子样本的建库方法和病原检测方法 | |
CN116790718B (zh) | 一种多重扩增子文库的构建方法及其应用 | |
CN115354398A (zh) | 一种使宏基因组测序文库片段大小集中的文库构建方法 | |
CN111748628B (zh) | 一种用于检测甲状腺癌预后相关基因变异的引物及试剂盒 | |
CN111979353A (zh) | 一种针对新型冠状病毒SARS-CoV-2全长基因组测序的文库构建方法 | |
CN116463408A (zh) | 一种abo基因扩增引物、扩增体系、扩增方法、测序文库构建方法及测序方法 | |
CN111926394B (zh) | 基于宏基因组学的建库方法和检测试剂盒 | |
Guifang et al. | Research progress on common measurement methods of nucleic acid reference materials | |
CN113817804B (zh) | 一种测序文库自连接头消除的方法及应用 | |
CN117821574A (zh) | 一种dna高效高通量测序方法 | |
CN113588392B (zh) | 一种改善测序混样均匀性的定量混样方法 | |
CN114480373A (zh) | 一种富集孕妇血浆中胎儿dna的方法和试剂盒 | |
CN117126921B (zh) | 一种检测t细胞和b细胞免疫组库的建库方法及其引物和试剂盒 | |
CN115807103B (zh) | 36个红细胞血型系统基因全编码区序列同步检测基因分型方法、探针集及试剂盒 | |
CN114836415B (zh) | 一种mgi平台转座酶双端标签文库的制备 | |
CN117247998A (zh) | 一种基于连接酶反应的多位点基因突变检测方法 | |
CN117070509A (zh) | 宿主细胞残留dna检测样本前处理试剂盒及其使用方法 | |
US20090148957A1 (en) | Platelet-free analyte assay method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |