CN111455470A - 一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法 - Google Patents
一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法 Download PDFInfo
- Publication number
- CN111455470A CN111455470A CN202010275275.1A CN202010275275A CN111455470A CN 111455470 A CN111455470 A CN 111455470A CN 202010275275 A CN202010275275 A CN 202010275275A CN 111455470 A CN111455470 A CN 111455470A
- Authority
- CN
- China
- Prior art keywords
- dna
- library
- small fragment
- data quality
- ligation product
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000012634 fragment Substances 0.000 title claims abstract description 51
- 238000010276 construction Methods 0.000 title abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 31
- 239000000463 material Substances 0.000 claims abstract description 11
- 239000008280 blood Substances 0.000 claims abstract description 8
- 210000004369 blood Anatomy 0.000 claims abstract description 8
- 238000012408 PCR amplification Methods 0.000 claims abstract description 7
- 238000001712 DNA sequencing Methods 0.000 claims abstract description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 20
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000013467 fragmentation Methods 0.000 claims description 6
- 238000006062 fragmentation reaction Methods 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 6
- 108090000790 Enzymes Proteins 0.000 claims description 5
- 102000004190 Enzymes Human genes 0.000 claims description 5
- 230000008439 repair process Effects 0.000 claims description 5
- 239000013014 purified material Substances 0.000 claims description 4
- 108010067770 Endopeptidase K Proteins 0.000 claims description 3
- 238000007259 addition reaction Methods 0.000 claims description 2
- 238000004440 column chromatography Methods 0.000 claims description 2
- 238000000746 purification Methods 0.000 abstract description 13
- 238000005516 engineering process Methods 0.000 abstract description 12
- 230000008569 process Effects 0.000 abstract description 8
- 210000001519 tissue Anatomy 0.000 abstract description 6
- 210000003855 cell nucleus Anatomy 0.000 abstract description 3
- 238000002474 experimental method Methods 0.000 abstract description 3
- 238000005457 optimization Methods 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 53
- 239000011324 bead Substances 0.000 description 30
- 239000000047 product Substances 0.000 description 24
- 239000006228 supernatant Substances 0.000 description 15
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 12
- 238000012163 sequencing technique Methods 0.000 description 12
- 238000002156 mixing Methods 0.000 description 10
- 239000000243 solution Substances 0.000 description 8
- 238000009826 distribution Methods 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 229960002685 biotin Drugs 0.000 description 6
- 235000020958 biotin Nutrition 0.000 description 6
- 239000011616 biotin Substances 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 235000019441 ethanol Nutrition 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- 238000012165 high-throughput sequencing Methods 0.000 description 5
- 108010077544 Chromatin Proteins 0.000 description 4
- 241000252212 Danio rerio Species 0.000 description 4
- 210000003483 chromatin Anatomy 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 210000001671 embryonic stem cell Anatomy 0.000 description 3
- 210000005229 liver cell Anatomy 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000012148 binding buffer Substances 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- AUTOLBMXDDTRRT-JGVFFNPUSA-N (4R,5S)-dethiobiotin Chemical group C[C@@H]1NC(=O)N[C@@H]1CCCCCC(O)=O AUTOLBMXDDTRRT-JGVFFNPUSA-N 0.000 description 1
- 238000001353 Chip-sequencing Methods 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 108700005075 Regulator Genes Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000007605 air drying Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000005772 establishment of chromosome localization Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biochemistry (AREA)
- Health & Medical Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种可以提升Hi‑C文库数据质量的小片段DNA文库构建方法,具体包括以下步骤:S1、首先使用DNeasy Blood&Tissue Kit回收Hi‑C连接产物细胞核或者对已有Hi‑C连接产物DNA进行纯化,S2、对回收片段进行片段化、末端修复与加A获得末端修复后DNA,S3、对所述末端修复后的DNA进行Index连接获得连接物料,S4、再对所述连接物料进行纯化获得DNA纯化物料,S5、最后将DNA纯化物料进行PCR扩增获得DNA测序文库,本发明涉及基因测序技术领域。该可以提升Hi‑C文库数据质量的小片段DNA文库构建方法,对现有DNA小片段文库构建实验技术进行了多项优化,使得文库构建成功率大大提升,成本显著降低,该方法操作流程简单,可以复制到其他具备分子生物学基础的其它实验室。
Description
技术领域
本发明涉及基因测序技术领域,具体为一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法。
背景技术
高通量测序技术又称为下一代测序技术、以能一次并行对几十万到几百万条DNA分子进行序列测定和读长较短等为标志,第二代高通量illumina测序平台具有测序通量高、准确度高和成本低等优点,并广泛应用于多个领域。
染色体构象捕获(Chromosome Conformation Capture,3C)技术是一种研究染色体和蛋白互作和染色体构象的技术,可以提供遥远的基因位点之间的关联性的详细信息,此关联性可以从甲醛固定的细胞核中捕获,并且可以从染色体的三维折叠方式被推断。近年来,在第二代测序技术的迅速发展下,由3C技术衍生出来的Hi-C则是以整个细胞核为研究对象,研究整个基因组范围内基因位点之间的关联性。在Hi-C技术中,以整个细胞系为研究对象,利用高通量测序技术,结合生物信息学方法,研究全基因组范围内整个染色质DNA在空间位置上的关系;通过对染色质内全部DNA相互作用模式进行捕获,获得高分辨率的染色质三维结构信息。将通过第二代测序得到的DNA序列对映射到参考基因组后,如果一对序列对应于不同的n段酶切片段,那么就认为这两个片段之间有n次相互作用,从而能够构建一个全基因组中所有酶切片段之间接合频率的矩阵。利用这个频率矩阵,将基因组组装过程中形成的contig、scaffold进行染色体定位、方向没定位,延长拼接结果,辅助基因组组装,尤其对于获得群体困难无法构建遗传图谱的物种意义重大。
Hi-C互作分析应用方向广泛但不局限于以下研究:(1)构建全基因组互作图谱,寻找线性距离远而空间邻近的调控元件,研究基因组空间结构(compartment、TAD、loop结构)可揭示基因组空间结构调控基因表达的机制;(2)研究病理细胞或组织的基因组三维结构,与WGS、RNA-seq、ATAC-seq、ChIP-seq等多组学联合分析,可深度解析疾病和癌症的发生机理;(3)比较细胞生长发育或分化阶段的染色质空间结构变化,可揭示环境变化或生长发育过程中基因组三维结构的适应性变化。
基于高通量进行染色体构象捕获的Hi-C技术,是染色体相互作用研究领域的一个巨大的飞跃。但是距离研究普遍揭示生物学功能的目标还很遥远,Hi-C交互数据包含相当高的随机噪声。同时,实验发现,现有Hi-C高通量测序文库的构建也存在着信息丢失、捕获方法存在一定偏好性造成的获得的有效数据率不高的问题。这些问题其中一个重要的表现在DanglingEnds率过高影响有效数据率,Dangling Ends是指标记上生物素的末端未能正常连接形成嵌合片段而进入测序步骤的DNA片段,Dangling Ends的高低直接影响有效数据率的高低。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法,该方法包含生物素捕获步骤,可用于Hi-C的小片段文库构建;同时该方法使用Qiagen的回收柱纯化连接产物,能明显改善DNA纯度,对杂质较多的材料明显可提升其建库成功率。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法,具体包括以下步骤:
S1、首先使用DNeasy Blood&Tissue Kit回收Hi-C连接产物细胞核或者对已有Hi-C连接产物DNA进行纯化;
S2、对回收片段进行片段化、末端修复与加A获得末端修复后DNA;
S3、对所述末端修复后的DNA进行Index连接获得连接物料;
S4、再对所述连接物料进行纯化获得DNA纯化物料;
S5、最后将DNA纯化物料进行PCR扩增获得DNA测序文库。
优选的,所述步骤S1中DNeasy Blood&Tissue Kit回收Hi-C连接产物DNA的操作为:
T1、取Hi-C连接产物,按照DNeasy Blood&Tissue Kit操作说明加蛋白酶K进行解交联;
T2、解交联完成后,按照操作说明加入无水乙醇沉淀DNA;
T3、按照操作说明将DNA过柱并清洗,回收纯化好的连接产物DNA。
优选的,所述步骤S2中片段化、末端修复与加A反应体系包括以下用量的各组分:DNA26μL、NEBNext Ultra II FS Enzyme Mix 2μL和NEBNext Ultra II FS ReactionBuffer7.0μL,且反应体系为37℃孵育10min,65℃灭活30min,4℃保温。
优选的,所述步骤S3中Index连接反应体系包括以下用量的各组分:片段化、末端修复与加A后的DNA35μL、NEBNext Ultra II Ligation Master Mix30μL、NEBNextLigation Enhancer1μL和NEBNext Adaptor for Illumina2.5μL,且反应体系混匀,20℃孵育15min后,加入3μLUSER酶,37℃孵育15min。
优选的,所述步骤S5中PCR扩增体系包括以下用量的各组分:DNA纯化物料20μL、NEBNext Ultra II Q5 Master Mix 25μL、Index Primer/i7Primer2.5μL、Universal PCRPrimer/i5 Primer 2.5μL,且PCR程序为:98℃,30s、98℃,10s、65℃,75s、6-12cycle、65℃,5min和降至4℃保存。
本发明还公开了一种小片段DNA文库,该文库由上述任一项所述的方法构建。
(三)有益效果
本发明提供了一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法。与现有技术相比具备以下有益效果:
(1)、该可以提升Hi-C文库数据质量的小片段DNA文库构建方法,对现有DNA小片段文库构建实验技术进行了多项优化,使得文库构建成功率大大提升,成本显著降低,本发明的技术适用于绝大数物种,该方法操作流程简单,可以复制到其他具备分子生物学基础的其它实验室。
(2)、该可以提升Hi-C文库数据质量的小片段DNA文库构建方法,通过在现有DNA小片段文库构建的基础上,增加生物素捕获步骤,使该方法可用于Hi-C小片段文库构建。
(3)、该可以提升Hi-C文库数据质量的小片段DNA文库构建方法,通过在建库前增加Qiagen柱纯化步骤,纯化了DNA,对杂质较多的材料可显著提升其建库存成功率,对于物种的适应性大大增加,利用 UltraTM IIFS DNA Library Prep Kit forIllumina附带的试剂将基因组大片段酶解至主带400bp左右,覆盖全基因组范围信息。
(4)、该可以提升Hi-C文库数据质量的小片段DNA文库构建方法,通过在PCR扩增文库前进行磁珠分选,缩小目标片段范围至300-500bp,可显著减少非特异性扩增,有效提高有效数据率。
附图说明
图1为本发明实施例1构建的小鼠胚胎干细胞Hi-C的小片段DNA文库的Agilent2100大小检测图;
图2为本发明实施例2构建的斑马鱼肝脏细胞Hi-C的小片段DNA文库的Agilent2100大小检测图;
图3为本发明斑马鱼与小鼠样本DNA小片段文库数据分析结果说明示意图;
图4为本发明Hi-C建库过程个步骤质控琼脂糖凝胶电泳图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-4,本发明实施例提供两种技术方案:一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法,具体包括以下实施例:
实施例1
本实施例以Hi-C连接产物为起始物料,需提供现有技术制备小鼠胚胎干细胞Hi-C连接产物的方法。
本实施例提供小鼠胚胎干细胞Hi-C的小片段DNA文库构建方法,其方法具体包括以下步骤:
1.目的片段回收
1)参考DNeasy Blood&Tissue Kit操作说明修改了部分步骤进行;
2)Hi-C连接产物离心弃上清加入180μL ATL和20μL Proteinase K至样品管中,56℃解交联2h,过程中颠倒离心管2-3次,混合样品;
3)加入200μL缓冲液AL充分混匀,56℃孵育10min,过程中颠倒离心管2-3次,混合样品;
4)加入200μL96-100%乙醇,充分混匀;
5)移取650μL混合液至过滤柱DNeasy Mini Spin Column中,置于一新的2ml离心收集管上;
6)6000g,离心1min,弃掉离心液体;
7)将过滤柱放置在一新的2ml离心收集管上,加入500μL AW1,6000g,离心1min,弃掉离心液体和收集管;
8)将过滤柱放置在一新的2mL离心收集管上,加入500μL AW2,20000g,离心3min,弃掉离心液体;
9)20000g离心1min,弃掉离心液体和收集管;
10)将过滤柱置于一新的1.5ml或2ml离心收集管上;
11)加入50μL Buffer AE洗脱DNA,室温孵育1min,6000g,离心1min;
12)为增加DNA回收量,再次加入50μL Buffer AE洗脱DNA,室温孵育1min,6000g,离心1min;
13)Qubti测定浓度。
2.末端去生物素
1)取1μg样品用于末端去生物素(若不足1μg则全部取用86.67μL),如表1所示;
表1去末端体系数据表
2)关闭热盖,12℃反应4h,2μL0.5M EDTA终止反应;
3)提前半小时取出VAHTS DNA Clean Beads,平衡至室温;
4)将100μL去末端体系用1×beads回收DNA;
5)吸取100μL VAHTS DNA Clean Beads(1×Beads)至上述100μL产物中,涡旋振荡或使用移液器轻轻吹打10次充分混匀,旋转混匀仪上室温孵育5min;
6)将离心管短暂离心并置于磁力架中分离磁珠和液体,待溶液澄清后(约3min),小心移除上清,保留磁珠;
7)保持1.5mL离心管始终置于磁力架中,加入200μl新鲜配制的80%乙醇漂洗磁珠,室温孵育30sec,小心移除上清;
8)重复上一步步骤,总计漂洗两次;
9)保持1.5mL离心管始终置于磁力架中,开盖空气干燥磁珠1min至无乙醇残留;
10)加入15μL水洗脱,充分混匀,旋转混匀仪上室温孵育5min,将1.5mL离心管短暂离心并置于磁力架中静置,待溶液澄清后(约3min),小心移取15μL上清至新1.5mL离心管中,切勿触碰磁珠;
11)使用Qubit定量;
3.目的片段的片段化、末端修复与接头连接
1)DNA片段化、末端修复与加A,参照如表2体系依次加入试剂,
表2试剂信息表
反应体系37℃孵育10min,65℃灭活30min,4℃保温;
2)接头连接,参照如表3体系依次加入试剂,
表3试剂信息表
混匀,20℃孵育15min后,加入3μLUSER酶,37℃孵育15min。
4.Ampure XP beads片段分选
1)加入28.5μL0.1×TE补足体系至100μL;
2)加DNA连接产物的0.25倍体积磁珠溶液(25μL)到上一步100μL DNA连接产物中,振荡数秒混匀,室温孵育5min;
3)瞬时离心,将离心管放在磁力架上静置2min,将上清转移至一新的1.5mL离心管中,丢弃磁珠;
4)加DNA连接产物的0.1倍体积磁珠溶液(10μL)到上一步上清中,振荡数秒混匀,室温孵育5min;
5)瞬时离心,将离心管放在磁力架上静置2min,吸弃上清,保留磁珠;
6)离心管保持在磁力架上,加入1mL的75%乙醇清洗磁珠,弃乙醇,
7)重复上一步乙醇清洗磁珠步骤一次;
8)打开管盖,室温风干30s;加入52μL去离子水,振荡将磁珠重新混悬,室温孵育5min;
9)瞬时离心,将离心管放到磁力架上静置1min,吸取50μL上清转移至新离心管中,若感觉吸到磁珠,可再用磁力架吸附一次,保证磁珠完全去除,文库可进行下步操作或保存于-20℃冰箱。
5.目标片段富集
1)配置Streptaridin Beads结合液及洗涤液,如表4所示;
表4结合液及洗涤液信息表
2)涡旋磁珠,取10μL加入1.5mLLoBind离心管中;使用100μL1×TWB(TweenWashing Buffer)清洗,室温震荡3min;磁力架吸附磁珠,弃上清;
3)再次使用100μL1×TWB清洗磁珠,室温震荡3min;磁力架吸附磁珠,弃上清;
4)50μL2×BB(Binding Buffer)和50μL Hi-CDNA重悬磁珠,室温震荡15min;磁力架吸附磁珠2-3min,弃上清;
5)使用100μL1×TWB清洗磁珠并转移至一新LoBind离心管中,磁力架吸附磁珠,弃上清;
6)重复2次1×TWB清洗磁珠;
7)加入25μL水,70℃温浴5min洗脱DNA,磁力架吸附,回收上清;
8)加入20μL水,70℃温浴5min洗脱DNA,磁力架吸附,回收上清;
9)总体积45μL,4μL用于跑圈,20μL用于PCR扩增切胶,剩余2μL文库可于-20℃长期保存。
6.扩增嵌合片段
1)将PCR仪设置如表5参数,并预热PCR仪;
表5 PCR仪设置数据表
2)参照如表6体系依次加入试剂;
表6体系信息表
3)将各个循环数分别取2.5μL电泳检测确定最佳循环数(推荐6,8,10,12个循环),使用最佳循环数重新PCR50μL体系;
4)回收产物使用Agilent 2100对文库大小分布进行检测,文库大小合适分布均匀,可以进行高通量测序,测序结果如图1所示,结果表明各个文库主峰都在500bp左右,是良好的文库大小分布峰图。
实施例2
本实施例以Hi-C连接产物DNA为起始物料,需提供现有技术制备斑马鱼肝脏细胞Hi-C连接产物DNA的方法。
本实施例以斑马鱼肝脏细胞Hi-C连接产物DNA为研究对象,对连接产物进行Qiagen柱纯化,然后进行文库构建,构建文库的中间步骤增加一步生物素捕获步骤,即可获得含有生物素标记的片段,再进行文库的PCR扩增,即可获得可上机测序的文库,在上机测序前进行Agilent 2100对文库大小分布进行检测,文库大小合适分布均匀,可以进行高通量测序,测序结果如图2所示,结果表明各个文库主峰都在500bp左右,是良好的文库大小分布峰图。
测序完成后,对质控得到的clean data,使用ICE3软件对数据进行迭代比对,并进行噪音reads过滤,分析结果如图3所示,结果显示:相对于普通纯化方式纯化Hi-C连接产物后构建的文库(ZF_PCI,MC1_PCI,MC2_PCI),Hi-C连接产物经过Qiagen柱纯化后构建的文库(ZF_Q,MC1_Q,MC2_Q),Dangling Ends率可以降低至少7.97%-16.84%,有效数据率可以提升至少6.62%-18.15%,经过Qiagen柱纯化后建库的文库可以有效提升文库数据质量。
数据分析验证内容:
如图4所示为Qiagen柱纯化电泳胶图,结合凝胶电泳图谱和Qubit定量结果(未列出),Hi-C连接产物使用常规提取方法可以获得更多量的DNA(ZF_PCI,MC1_PCI,MC2_PCI),Qiagen柱回收的连接产物小片段更少(ZF_Q,MC1_Q,MC2_Q),对数据进行插入片段大小分析结果发现,Dangling Ends片段会明显偏小,正常测序片段大小应该在300-500bp,而Dangling Ends片段大小集中在200bp甚至更小。
综合电泳、文库数据分析结果和Dangling Ends大小分布结果可以得出结论,Qiagen柱纯化试剂盒可以提升Hi-C文库数据质量的原因可能有几下几个方面:
1)Qiagen柱纯化试剂盒在核酸提取纯化领域是金标准的存在,大多数样本使用Qiagen柱纯化试剂盒都可以获得纯度最好的DNA,包括Hi-C连接产物;
2)Qiagen柱纯化试剂盒纯化样本时会倾向于将小片段去除,由于Dangling Ends都是偏小的片段,所以可以提升Hi-C文库数据质量。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (6)
1.一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法,其特征在于:具体包括以下步骤:
S1、首先使用DNeasy Blood&Tissue Kit回收Hi-C连接产物细胞核或者对已有Hi-C连接产物DNA进行纯化;
S2、对回收片段进行片段化、末端修复与加A获得末端修复后DNA;
S3、对所述末端修复后的DNA进行Index连接获得连接物料;
S4、再对所述连接物料进行纯化获得DNA纯化物料;
S5、最后将DNA纯化物料进行PCR扩增获得DNA测序文库。
2.根据权利要求1所述的一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法,其特征在于:所述步骤S1中DNeasy Blood&Tissue Kit回收Hi-C连接产物DNA的操作为:
T1、取Hi-C连接产物,按照DNeasy Blood&Tissue Kit操作说明加蛋白酶K进行解交联;
T2、解交联完成后,按照操作说明加入无水乙醇沉淀DNA;
T3、按照操作说明将DNA过柱并清洗,回收纯化好的连接产物DNA。
3.根据权利要求1所述的一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法,其特征在于:所述步骤S2中片段化、末端修复与加A反应体系包括以下用量的各组分:DNA26μL、NEBNext Ultra II FS Enzyme Mix 2μL和NEBNext Ultra II FS Reaction Buffer7.0μL,且反应体系为37℃孵育10min,65℃灭活30min,4℃保温。
4.根据权利要求1所述的一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法,其特征在于:所述步骤S3中Index连接反应体系包括以下用量的各组分:片段化、末端修复与加A后的DNA 35μL、NEBNext Ultra II Ligation Master Mix 30μL、NEBNext LigationEnhancer 1μL和NEBNext Adaptor for Illumina 2.5μL,且反应体系混匀,20℃孵育15min后,加入3μL USER酶,37℃孵育15min。
5.根据权利要求1所述的一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法,其特征在于:所述步骤S5中PCR扩增体系包括以下用量的各组分:DNA纯化物料20μL、NEBNext Ultra II Q5 Master Mix 25μL、Index Primer/i7 Primer 2.5μL、UniversalPCR Primer/i5 Primer 2.5μL,且PCR程序为:98℃,30s、98℃,10s、65℃,75s、6-12cycle、65℃,5min和降至4℃保存。
6.一种小片段DNA文库,其特征在于:该文库由权利要求1-5任一项所述的方法构建。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010275275.1A CN111455470A (zh) | 2020-04-09 | 2020-04-09 | 一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010275275.1A CN111455470A (zh) | 2020-04-09 | 2020-04-09 | 一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111455470A true CN111455470A (zh) | 2020-07-28 |
Family
ID=71674927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010275275.1A Pending CN111455470A (zh) | 2020-04-09 | 2020-04-09 | 一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111455470A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000063415A1 (en) * | 1999-04-15 | 2000-10-26 | Ortho-Mcneil Pharmaceutical, Inc. | Dna encoding the human vanilloid receptor vr1 |
CN108026538A (zh) * | 2015-12-28 | 2018-05-11 | 财团法人农业科技研究院 | 猪圆环病毒2型的外鞘蛋白质的制备方法及含该外鞘蛋白质的医药组合物 |
CN109735900A (zh) * | 2019-03-20 | 2019-05-10 | 嘉兴菲沙基因信息有限公司 | 一种适用于Hi-C的小片段DNA文库构建方法 |
CN110157791A (zh) * | 2019-04-19 | 2019-08-23 | 刘伟 | 扩张型心肌病致病基因ttn75250位点突变及其应用 |
CN110846382A (zh) * | 2019-11-29 | 2020-02-28 | 北京科迅生物技术有限公司 | 胎儿游离dna的富集方法 |
-
2020
- 2020-04-09 CN CN202010275275.1A patent/CN111455470A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000063415A1 (en) * | 1999-04-15 | 2000-10-26 | Ortho-Mcneil Pharmaceutical, Inc. | Dna encoding the human vanilloid receptor vr1 |
CN108026538A (zh) * | 2015-12-28 | 2018-05-11 | 财团法人农业科技研究院 | 猪圆环病毒2型的外鞘蛋白质的制备方法及含该外鞘蛋白质的医药组合物 |
CN109735900A (zh) * | 2019-03-20 | 2019-05-10 | 嘉兴菲沙基因信息有限公司 | 一种适用于Hi-C的小片段DNA文库构建方法 |
CN110157791A (zh) * | 2019-04-19 | 2019-08-23 | 刘伟 | 扩张型心肌病致病基因ttn75250位点突变及其应用 |
CN110846382A (zh) * | 2019-11-29 | 2020-02-28 | 北京科迅生物技术有限公司 | 胎儿游离dna的富集方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107190329B (zh) | 基于dna的融合基因定量测序建库、检测方法及其应用 | |
CN110129415B (zh) | 一种ngs建库分子接头及其制备方法和用途 | |
CN105368930B (zh) | 测序基因分型技术中测序酶切组合的确定方法 | |
CN114317762B (zh) | 用于检测早期肝癌的三标记物组合物及其试剂盒 | |
CN109641933A (zh) | 染色质相互作用的全基因组鉴定 | |
CN108517567A (zh) | 用于cfDNA建库的接头、引物组、试剂盒和建库方法 | |
CN106834492B (zh) | 一种低成本的bcr/abl融合基因快速检测探针及其制备方法和应用 | |
CN111909983A (zh) | 一种适用于微生物宏基因组学Hi-C高通量测序建库方法及应用 | |
CN107354207B (zh) | 基于双链探针的液相杂交捕获试剂盒、洗涤试剂盒及其应用 | |
CN105803054A (zh) | 试剂盒及其在检测唇腭裂相关基因中的用途 | |
CN109735900A (zh) | 一种适用于Hi-C的小片段DNA文库构建方法 | |
CN106815491B (zh) | 一种用于检测ffpe样本基因融合的装置 | |
CN107513560B (zh) | 一种低成本的igh基因断裂快速检测探针及其制备方法和应用 | |
CN103695419B (zh) | 一种病毒核酸提取试剂 | |
CN111455470A (zh) | 一种可以提升Hi-C文库数据质量的小片段DNA文库构建方法 | |
CN111549034A (zh) | 与趋化因子配体-5特异性结合的核酸适配体及其应用 | |
CN110273028A (zh) | 病毒整合型dna的富集方法、测序数据分析方法和装置 | |
JP7034299B2 (ja) | ハイスループットシークエンシングに基づくオリゴヌクレオチド配列不純物の分析方法及び使用 | |
CN106834493B (zh) | 一种低成本的aml1-eto融合基因快速检测探针及其制备方法和应用 | |
CN116536308A (zh) | 测序封闭剂及其应用 | |
CN111484976A (zh) | 肺癌循环肿瘤细胞检测试剂盒及检测系统 | |
CN106520978B (zh) | 靶dna富集探针的制备方法 | |
CN115612746A (zh) | 一种用于肉鸡亲缘关系鉴定的靶向捕获测序芯片 | |
CN115197997A (zh) | 一种应用于植物花粉的CUT&Tag方法 | |
CN110564818A (zh) | 针对含有indel区域的dna样本的捕获探针、试剂盒及文库构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200728 |