CN118064551A - 染色质构象捕获in situeHi-C 3.0测序文库制备方法及应用 - Google Patents
染色质构象捕获in situeHi-C 3.0测序文库制备方法及应用 Download PDFInfo
- Publication number
- CN118064551A CN118064551A CN202410455218.XA CN202410455218A CN118064551A CN 118064551 A CN118064551 A CN 118064551A CN 202410455218 A CN202410455218 A CN 202410455218A CN 118064551 A CN118064551 A CN 118064551A
- Authority
- CN
- China
- Prior art keywords
- dna
- library
- enzyme
- enzyme digestion
- hpych4iv
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 37
- 108010077544 Chromatin Proteins 0.000 title claims abstract description 36
- 210000003483 chromatin Anatomy 0.000 title claims abstract description 36
- 238000002360 preparation method Methods 0.000 title claims abstract description 19
- 102000004190 Enzymes Human genes 0.000 claims abstract description 50
- 108090000790 Enzymes Proteins 0.000 claims abstract description 50
- 238000000034 method Methods 0.000 claims abstract description 42
- 210000004027 cell Anatomy 0.000 claims abstract description 41
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims abstract description 32
- 238000005520 cutting process Methods 0.000 claims abstract description 28
- 238000011065 in-situ storage Methods 0.000 claims abstract description 21
- 229960002685 biotin Drugs 0.000 claims abstract description 16
- 235000020958 biotin Nutrition 0.000 claims abstract description 16
- 239000011616 biotin Substances 0.000 claims abstract description 16
- 238000004132 cross linking Methods 0.000 claims abstract description 11
- 238000012165 high-throughput sequencing Methods 0.000 claims abstract description 7
- 238000011160 research Methods 0.000 claims abstract description 7
- 108020004414 DNA Proteins 0.000 claims description 71
- 238000001976 enzyme digestion Methods 0.000 claims description 63
- 238000003776 cleavage reaction Methods 0.000 claims description 51
- 230000007017 scission Effects 0.000 claims description 51
- 108010042407 Endonucleases Proteins 0.000 claims description 42
- 102000004533 Endonucleases Human genes 0.000 claims description 42
- 239000012634 fragment Substances 0.000 claims description 37
- 239000000203 mixture Substances 0.000 claims description 33
- 239000011324 bead Substances 0.000 claims description 30
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 claims description 28
- 239000000499 gel Substances 0.000 claims description 20
- 239000000243 solution Substances 0.000 claims description 14
- 238000003908 quality control method Methods 0.000 claims description 13
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 claims description 12
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 12
- 239000000872 buffer Substances 0.000 claims description 11
- 239000013612 plasmid Substances 0.000 claims description 11
- 108060002716 Exonuclease Proteins 0.000 claims description 9
- 102000013165 exonuclease Human genes 0.000 claims description 9
- 238000001962 electrophoresis Methods 0.000 claims description 8
- 238000013467 fragmentation Methods 0.000 claims description 8
- 238000006062 fragmentation reaction Methods 0.000 claims description 8
- 108010061982 DNA Ligases Proteins 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 102000012410 DNA Ligases Human genes 0.000 claims description 6
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 claims description 6
- 102100029075 Exonuclease 1 Human genes 0.000 claims description 6
- 239000005547 deoxyribonucleotide Substances 0.000 claims description 6
- 125000002637 deoxyribonucleotide group Chemical group 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 6
- 239000011780 sodium chloride Substances 0.000 claims description 6
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 claims description 5
- 108010088751 Albumins Proteins 0.000 claims description 5
- 102000009027 Albumins Human genes 0.000 claims description 5
- 238000010586 diagram Methods 0.000 claims description 5
- 108010052305 exodeoxyribonuclease III Proteins 0.000 claims description 5
- 238000011084 recovery Methods 0.000 claims description 5
- OZFAFGSSMRRTDW-UHFFFAOYSA-N (2,4-dichlorophenyl) benzenesulfonate Chemical compound ClC1=CC(Cl)=CC=C1OS(=O)(=O)C1=CC=CC=C1 OZFAFGSSMRRTDW-UHFFFAOYSA-N 0.000 claims description 4
- 239000012591 Dulbecco’s Phosphate Buffered Saline Substances 0.000 claims description 4
- 239000013504 Triton X-100 Substances 0.000 claims description 4
- 229920004890 Triton X-100 Polymers 0.000 claims description 4
- 210000000170 cell membrane Anatomy 0.000 claims description 4
- 210000003855 cell nucleus Anatomy 0.000 claims description 4
- 238000007363 ring formation reaction Methods 0.000 claims description 4
- JYCQQPHGFMYQCF-UHFFFAOYSA-N 4-tert-Octylphenol monoethoxylate Chemical compound CC(C)(C)CC(C)(C)C1=CC=C(OCCO)C=C1 JYCQQPHGFMYQCF-UHFFFAOYSA-N 0.000 claims description 3
- 239000003153 chemical reaction reagent Substances 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 108010016389 GTAC-specific type II deoxyribonucleases Proteins 0.000 claims description 2
- 238000012408 PCR amplification Methods 0.000 claims description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 claims description 2
- 108091092356 cellular DNA Proteins 0.000 claims description 2
- 238000001514 detection method Methods 0.000 claims description 2
- 239000006166 lysate Substances 0.000 claims description 2
- 230000002934 lysing effect Effects 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 238000000926 separation method Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 31
- 230000007547 defect Effects 0.000 abstract description 2
- 230000003993 interaction Effects 0.000 description 53
- 239000000523 sample Substances 0.000 description 29
- 239000006228 supernatant Substances 0.000 description 24
- 230000029087 digestion Effects 0.000 description 21
- 101500006448 Mycobacterium bovis (strain ATCC BAA-935 / AF2122/97) Endonuclease PI-MboI Proteins 0.000 description 18
- 238000002156 mixing Methods 0.000 description 18
- 238000005516 engineering process Methods 0.000 description 14
- 239000000047 product Substances 0.000 description 13
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 12
- 238000007664 blowing Methods 0.000 description 12
- 238000010276 construction Methods 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 12
- 229910052751 metal Inorganic materials 0.000 description 11
- 239000002184 metal Substances 0.000 description 11
- 238000012360 testing method Methods 0.000 description 11
- 230000008030 elimination Effects 0.000 description 8
- 238000003379 elimination reaction Methods 0.000 description 8
- 238000011534 incubation Methods 0.000 description 8
- 210000000349 chromosome Anatomy 0.000 description 7
- 235000019441 ethanol Nutrition 0.000 description 7
- 238000012177 large-scale sequencing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- 108020004638 Circular DNA Proteins 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 210000004940 nucleus Anatomy 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 239000002096 quantum dot Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 102100036263 Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Human genes 0.000 description 3
- 101001001786 Homo sapiens Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Proteins 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 108010067770 Endopeptidase K Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 2
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004064 recycling Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000003239 susceptibility assay Methods 0.000 description 2
- 238000010257 thawing Methods 0.000 description 2
- 230000007306 turnover Effects 0.000 description 2
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 241001330002 Bambuseae Species 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 108091036333 Rapid DNA Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000002390 adhesive tape Substances 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000007605 air drying Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000012864 cross contamination Methods 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 239000012154 double-distilled water Substances 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000011010 flushing procedure Methods 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000003426 interchromosomal effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000008823 permeabilization Effects 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000010414 supernatant solution Substances 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种新的染色质构象捕获in situeHi‑C 3.0测序文库制备方法,该方法克服了现有技术染色质交联不充分、酶切片段不完全、酶切对温度和实验条件的依赖高、背景噪音大、超声打断不均匀且成本较高、生物素使用量大、酶切效果不可控等因素,经过改良和优化的in situ eHi‑C 3.0测序文库制备方法除了克服上述问题,还适用于样品量小的微量细胞建库,更具有普适性和可控性,且制备的文库质量好,数据产出率高。本发明还公开了该方法制备的in situ eHi‑C 3.0测序文库和该文库在细胞高通量测序或基因组组装或功能基因组学研究中的应用。
Description
技术领域
本发明涉及基因组文库构建及基因组测序技术领域,特别涉及一种染色质构象捕获in situe Hi-C 3.0测序文库制备方法及应用。
背景技术
三维基因组学(Hi-C)是一门新兴的学科方向和后基因组学时代研究的一个热门领域。如何更高效、准确地捕获基因组/基因三维互作对于阐明真核生物细胞核中染色质空间构象、基因组三维折叠模式、基因组DNA相互协作以及基因表达的精准转录调控等具有重要意义,是基因组学和精准生物学领域的重要课题(Kong and Zhang, 2019)。三维基因组学技术的研发为3D基因组学带来了理论创新,可以描述真核基因组中的全局染色质相互作用。
从经典Hi-C诞生至今,三维基因组学系列技术(C-技术)如雨后春笋般蓬勃涌现,以技术创新推动理论创新,染色质高级结构和基因组三维互作的详细阐释让我们对细胞核内基因组的折叠和功能产生了更为全面的了解。除了新近报道的单分子多路条形码连接标记(SPRITE)(Quinodoz et al., 2022)和单分子流式磁珠条形码扩增(ChIA-Drop)技术(Zheng et al., 2019),目前广泛应用的依然是基于“邻近连接”的三维基因组学技术。溶液内或细胞核内基因组-蛋白因子单分子互作小体的获得是三维基因组技术捕获“有效互作”的前提和关键。酶切和连接是关键步骤,通过酶切和连接,可以将空间位置临近的DNA片段连接在一起,形成新的嵌合DNA分子(如图3)。染色质构象技术(C-技术)就是通过这个原理来抓取基因组互作信息。然而目前常用的Hi-C技术采用单一内切酶酶切不完全不充分,导致互作小体包裹的基因组DNA在核内没有完全切开,互作小体伸出的悬垂DNA短片段不足,以致有效互作连接效率低,分辨率不足(如图3)。酶切完全是提高分辨率潜力的有效手段。酶切的片段末端及片段大小会直接影响连接效率。互作频率热图分辨率通常用于评估所得到的三维结构的精度。较小的酶切片段可以重构更高分辨率的结构。较大的酶切片段则会限制结构的分辨率。因此,在使用酶切技术进行三维基因组技术研发时,需要选择适当的内切酶和条件,以达到最佳的研究效果。
筛选出合适的内切酶及其组合,同时优化建库流程,提高测序效率,旨在提高三维基因组技术的效率和精度,是三维基因组学技术的有效改良方向之一。因此,有必要改良优化出一种解决染色质片段化不完全的三维基因组学技术Hi-C的升级技术。
发明内容
本发明通过改良出一种新的全基因组染色质构象捕获in situ eHi-C 3.0测序文库制备方法,不仅筛选了最适的内切酶组合,还优化了建库流程,以解决上述问题。
根据本发明的第一个方面,提供了一种全基因组染色质构象捕获in situ eHi-C3.0测序文库制备方法,该方法包括如下步骤:
S1:收集细胞,进行甲醛及EGS双交联;
S2:透化裂解细胞膜和细胞核,得到完整包裹的染色质;所述透化裂解细胞膜和细胞核的裂解液为1% PI、0.2% Igepal CA630、10mM Tris-HCl pH8.0和10mM NaCl;
S3:采用内切酶组合进行酶切,所述内切酶组合为DpnII+HpyCH4IV、Sau3AI+HpyCh4IV、CviAII+ CviQI三组中的任意一组;
S4:酶切产物进行质量控制,检测染色质片段化完全程度;
S5:将所述的酶切后DNA片段再经过带有生物素标记的脱氧核糖核苷酸进行标记;
S6:邻近连接,得到环化后的嵌合DNA产物;
S7:向S6步骤中环化产物中引入内参环状质粒,得到混合物,采用限制性外切酶组合处理得到的混合物,所述限制性外切酶组合为Exonuclease I和Exonuclease III;
S8:对S7步骤中的混合物进行酶切打断,并结合磁珠分选,优化片段范围;
S9:免疫磁珠抓取带有生物素标记的互作DNA片段,再进行加接头、PCR扩增、E-gel胶切胶回收,制备in situ eHi-C 3.0测序文库。
该方法具备以下优点:
1)通过甲醛及EGS双交联可以捕获更多的互作信息,将蛋白-DNA近端和远端互作尽可能完全捕获,从源头上增加可捕获的染色质互作,提高建库质量;
2)筛选了最优的三组内切酶组合,可根据细胞及实验条件的具体情况,选择相应的酶切组合,适宜内切酶的选择可以保证酶切效率,可以利用高效双酶切进行动物细胞基因组片段化,进一步提高酶切效率,增加可用于邻近连接的互作片段比例,提高建库有效数据和质量;
3)引入酶切质量控制流程,检测染色质片段化完全程度,并可以对酶切效果进行评估,避免盲目的进入下一步骤及后面的建库,避免有大片段没有被切断,而影响整个文库的质量。当酶切不完全时,会有很多大片段存在,不仅影响互作结果,还会影响后面的切胶回收,直接影响文库的数据产出;
4)向环化产物中引入内参环状质粒,引入的内参环状质粒作为伴侣DNA先进行背景消除(即可以保障背景消除比较充分,又防止把邻近连接的环化DNA产物消除掉),再背景消除的纯化,然后进行酶切打断,打断结束后进行凝胶电泳实验:内参环状DNA质粒除了在背景消除环节发挥作用,其还有显示条带的作用,电泳跑胶从202 μL溶液中取2μL跑胶,不引入环状DNA分子,取2μL胶条带很淡甚至不显示,如果跑胶的量取多了,又会影响后续试验,因此可以参考引入内参环状质粒的样品电泳条带结果有效判断酶打断过程是否充分;
5)采用限制性外切酶组合为Exonuclease I和Exonuclease III对环化DNA进行酶切,可以快速消除连接过程未正确连接环化的DNA末端,该末端会对后续分析形成较大的背景噪音,由此来提高文库数据产出及文库质量;
6)采用E-gel胶切胶回收,E-gel胶对样品的上样量低,切胶回收率高,在对微量样品进行建库时,更有优势。
在某些实施方式中,甲醛及EGS双交联采用37%的甲醛和3 mM EGS的DPBS溶液。由此,可以高效的实现交联,捕获更多的互作信息,将蛋白-DNA近端和远端互作尽可能完全捕获,从源头上增加可捕获的染色质互作,提高建库质量。
在某些实施方式中,步骤S3中,室温条件下选用CviAII+ CviQI内切酶组合进行酶切,在37℃条件下选用DpnII+HpyCH4IV或Sau3AI+ HpyCh4IV内切酶组合进行酶切。由此,当实验条件不允许时,提供了一种可在室温条件下使用的酶切组合,减少了对酶切温度的依赖,当实验条件不具备金属浴、水浴锅、烘箱等情况下具有重大优势。
在某些实施方式中,步骤S4中,所述酶切产物进行质量控制是通过将1.2倍XP磁珠纯化细胞DNA,再进行浓度测定和0.8% 琼脂糖凝胶电泳检测,根据电泳结果图判断酶切是否完全。由此,可以对酶切结果进行质控,不仅可以保障酶切完全,还可以避免因酶切不完全造成的片段浪费,以及对互作结果的影响和文库的质量。
在某些实施方式中,步骤S5中,所述的酶切后DNA片段再经过带有生物素标记的脱氧核糖核苷酸进行标记时,是采用混有生物素标记的碱基试剂Fill-in Master Mix,所述Fill-in Master Mix使用量为每0.05~0.3million细胞3.3μL。在现有技术生物素使用量为50μL,本申请优化流程后,在保证生物素标记位点与脱氧核糖核苷酸足够连接进行后续实验的基础下,通过调整dNTP混合物的用量,达到比之前更少的试剂消耗量以减少实验成本,由于整个实验体系庞杂且步骤甚多,用到的化学试剂也相当多,其中biotin-14-dCTP更是价格昂贵,故调整了试剂用量,既保证了最后的实验结果,又降低了实验成本。
在某些实施方式中,步骤S6中,邻近连接采用的连接反应液含重组白蛋白,所述连接反应液由NEB T4 DNA ligase buffer、Triton X-100、重组白蛋白、T4 DNA ligase和水组成。由此,可以保障更好的连接效果。
在某些实施方式中,步骤S8中,所述酶切打断时采用的酶为Fragmentation、EndPreparation&dA-tailing Enzyme Mix。由此,采用该酶切组合进行酶切打断,该酶切组合不识别特异的酶切位点,而是对DNA进行随机地、非特异地切割,较超声打断,酶切打断温和且不会随机破坏互作小体结构。该酶解法打断操作方便,打断、末端修复和加A一步完成,减少了实验步骤,便于同时操作多个样本。另外酶解法打断不需要专门的超声波打断仪,也不需要使用打断管等耗材,因此酶解法打断能够显著降低实验门槛和成本。
根据本发明的第二个方面,提供了一种采用上述方法制备的in situ eHi-C 3.0测序文库。
根据本发明的第三个方面,提供了一种含有上述测序文库的高通量测序试剂盒。
根据本发明的第四个方面,提供了上述in situ eHi-C 3.0测序文库在细胞高通量测序或基因组组装或功能基因组学研究中的应用。
综上所述,本申请的有益效果:
1、本申请公开了一种新的全基因组染色质构象技术in situ eHi-C 3.0测序文库制备方法,该方法克服了现有技术染色质酶切片段不完全、酶切对温度和实验条件的依赖高、背景噪音大、超声打断不均匀且成本较高、生物素使用量大、酶切效果不可控等因素,经过改良和优化的in situ eHi-C 3.0测序文库制备方法除了克服上述问题,还适用于样品量小的微量细胞建库,更具有普适性和可控性,且制备的文库质量好,数据产出率高;
2、本申请还公开了采用上述方法制备的in situ eHi-C 3.0测序文库及含有该文库高通量测序试剂盒;
3、本申请还公开了采用上述方法制备的in situ eHi-C 3.0测序文库在细胞高通量测序或基因组组装或功能基因组学研究中的应用。
附图说明
图1为实施例三中内切酶及其内切酶组合理论消化基因组后的片段长度分布预测结果图:其中,H代表HindIII,D代表DpnII,M代表MboI,Hp代表HpyCH4IV,MH代表同时用MboI&HpyCH4IV进行双酶切,DH代表同时用DpnII&HpyCH4IV进行双酶切;
图2为实施例三中高效内切酶组合片段化小鼠基因组(mm9)理论结果和试验结果图,其中,A图为内切酶、及其内切酶组合理论消化(片段化)基因组后的片段长度分布预测图,B图为酶切后电泳结果图;
图3为三维基因组学技术核心步骤“邻近连接”中酶切打断的染色质不完全影响互作抓取效果的模式图:A图为DNA-蛋白因子互作小体较大时,酶切程度对互作抓取的影响;B图为DNA-蛋白因子互作小体较小时,更充分酶切对互作抓取效果的影响;S为单酶切,D为高效双酶切;
图4为内切酶以及高效内切酶组合在in situ Hi-C体系中片段化染色质效果结果图:其中,M, DNA ladder为1kb和100bp等量混合Ladder;第2道,Genome,基因组对照;第3道,HindIII单酶切;第4道,DpnII单酶切;第5道,Sau3AI单酶切;第6道,HpyCH4IV单酶切;第7道,MboI单酶切;第8道,MboI+HpyCH4IV双酶切;第9道,DpnII和HpyCH4IV双酶切;第10道,Sau3AI和HpyCH4IV双酶切;第11道,Sau3AI和HpyCH4IV双酶切;
图5为in situ eHi-C 3.0文库构建技术路线图;
图6为in situ eHi-C 3.0文库样品C2C12-DHE-1构建过程结果图:A图为实施例1双酶切酶切结果;B图为实施例1正式PCR 实验胶图;C图为实施例1正式PCR 实验切胶后胶图;M, DNA ladder为1kb和100bp等量混合Ladder;Genome,基因组对照;
图7为实施例1文库样品C2C12-DHE-1小样本量测序和大样本量测序(DHMax1)的HiC-Pro结果:A为Hi-C试验目标序列比例(占双端唯一配对序列比率)(Valid_interaction_pairs(%)=Valid_interaction_pairs /Unique_paired_ alignments)比较结果图;B为顺反式互作比例;
图8为实施例1文库样品DHMax1_C2C12-DHE-1第8号染色体Compartment和互作频率展示结果图;
图9为实施例1文库样品DHMax1_C2C12-DHE-1的APA结果展示(5kb bin分辨率、10kb bin分辨率、25kb bin分辨率);
图10为实施例2文库样品HiC-Pro结果:A为Hi-C试验目标序列比例(Valid_interaction _pairs(%))比较结果图;B为顺反式互作比例。
具体实施方式
下面结合附图对发明作进一步详细的说明。
实施例一 全基因组染色质构象技术(以下简称“in situ eHi-C 3.0”技术)本技术采用37℃烘箱高效完全酶切方案,技术路线如图5所示。
1、细胞收集与双交联固定
1)当培养皿(10 cm)中小鼠胚胎干细胞ESC细胞汇合率达到70%~90%的时候进行交联,同时对平行重复的培养皿进行细胞计数;
2)吸弃培养基,加入10 ml 1×DPBS缓冲液,再加入280 μL 37%甲醛水溶液(HCHO),使其终浓度为1%,并将培养皿放置在37 ℃培养箱中孵育10 min;
3)吸弃上清,加入10 ml EGS(3 mM)室温交联45 min;通过甲醛和EGS双交联可以捕获更多的互作信息;将蛋白-DNA近端和远端互作尽可能完全捕获,从源头上增加可捕获的染色质互作,在建库效果上终取得了显著的进步(如最终建库后的唯一比对率、有效数据产出率、Hi-C试验目标序列比例、多重比对率、未比对率等结果都优于现有技术公开资料);
4)在培养基中加入2.5 M甘氨酸水溶液(1.9 ml,使其终浓度为0.4 M)猝灭交联,十字震荡摇晃5 min;
5)去除上清溶液,用10 ml预冷的1× DPBS洗细胞两次;
6)去除大部分1× DPBS并在皿中剩余0.5 ml DPBS,用细胞铲刀将细胞刮下,用移液器将细胞吸入新1.5 ml离心管中,放在冰上保存,用1 ml质量百分含量0.5%BSA/PBS冲洗皿中细胞,迅速操作,收集剩余的细胞到该离心管中;
7)800 × g,4 ℃离心15 min。弃上清,-80 ℃冷存细胞或进行下一步。
2、细胞透化裂解
1)解冻-80℃保存的细胞,放于冰上,加入预冷的1× DPBS吹打混匀分装成0.3million个cell/管;
2)向每管加入500 μL预冷的Hi-C Lysis Buffer(质量百分含量1% PI,体积百分含量0.2% Igepal CA630,10 mM NaCl,10 mM pH 8.0 Tris-HCl),置于冰上避光孵育30min;2500 × g 4℃离心5 min,弃去上清;
3)再次加入预冷的500 μL Hi-C Lysis Buffer,颠倒冲洗细胞团,2500 × g, 4℃离心5 min,弃去上清;
4)在含有细胞团的EP离心管中加入50 μL 0.5% SDS,轻柔吹打混匀到游离的单个细胞状态,置于金属浴上62 ℃孵育10 min后,加入145 μL ddH2O和25 μL质量百分含量10%Triton X-100,吹打混匀37 ℃水浴锅孵育15 min。
3、高效内切酶组合酶切染色质
在上述溶液中加入26 μL 1×或10× Cutsmart酶切缓冲液和高效内切酶组合8~16 μL DpnII+8~16 μL HpyCH4IV或Sau3AI+ HpyCH4IV,吹打混匀后,样品放在翻转混匀仪上放入37℃烘箱中进行颠倒过夜(8~16 h)酶切,中间吹打混匀4次。
4、染色质酶切片段化质量控制QC
1)吸取经过酶切反应的体系样品溶液22 μL (总体积的1/15-1/20)到新的EP离心管中而后用于质检(QC样品);剩下的样品62℃金属浴20min,酶灭活后放4℃暂存;
2) 加入4.4 μL 10% SDS,即加入即吹打混合均匀;加入4μL Proteinase K (20mg/ml)混匀。65℃(金属浴)孵育1h 20min;
3) 提前把Ampure XP beads (Beckman Coulter, A63881) 或VAHTS DNA CleanBeads (Vazyme,N411-02)混匀,室温静置30 min。每管QC样品加入1.2倍 (36.48 μL) 磁珠beads,吹打混合均匀后室温静置5min;
4) 放在磁力架上5 min,使其变澄清,去上清。用500 μL新鲜配制的体积百分含量80%乙醇洗涤两遍:EP管置于磁力架上,在室温下孵育30秒,然后除去上清液体,晾干3 min;
5) 加入16 μL ddH2O,通过吹打混合均匀,在室温下孵育5 min。放回磁力架3 min至澄清,转移15 μL的上清液到一个新的1.5 ml离心管中;
6) Qubit dsDNA High Sensitivity Assay测定浓度。取200ng的DNA跑0.8%琼脂糖胶,样品C2C12-DHE-1的双酶切电泳结果如图6A,结果表明:酶切后的样品在基因组位置(12Kb处)不存在条带,整个条带均匀弥散分布,说明DNA被片段化的比较彻底,酶切成功。
通过酶切质量控制,可以对酶切效果进行评估,避免盲目的进入下一步骤及后面的建库,避免有大片段没有被切断,而影响整个文库的质量。当酶切不完全时,会有很多大片段存在,不仅影响互作结果,还会影响后面的切胶回收,直接影响文库的数据产出。
5、DNA末端高效标记和邻近DNA互作连接
1)在经酶切质量控制合格后,将酶切后的DNA中加入25 μL Fill-in Master Mix((37.5 μL 0.4 mM biotin-dCTP,1.5 μL 10 mM dATP,1.5 μL 10 mM dGTP,1.5 μL 10 mMdTTP,8 μL 5U/μL Klenow (NEB, M0210))和25 μL与所用酶一致的Buffer,混匀后,置于37℃水浴锅中震荡孵育1.5 h;
2)再加入900 μL Ligation Master Mix混匀后,300 rpm 室温震荡4h,该Ligation Master Mix连接反应液由NEB T4 DNA ligase buffer,Triton X-100,重组白蛋白,T4 DNA ligase和水组成;
3)再加入50 μL的20mg/ml proteinase K和120μL的10% SDS 金属浴55℃孵育30min;
4)再加入130 μL的5M NaCl,置于金属浴68℃过夜;
5)第二天从金属浴取出降至室温,一份样品分装成两管,每管750 μL转移到2 ml离心管中,每管加入1200 μL无水乙醇和75 μL 3M醋酸钠混匀,放置-80℃冰箱孵育15 min;
6)21000 × g 2℃离心15 min,离心管放在冰上并小心去除上清;
7)用400 μL 80%酒精吹打底部,两管合并转移到新的1.5ml离心管中,21000 × g4℃离心10 min,去上清;
8)再用400 μL 80%酒精复洗原管,转移到步骤7)的1.5ml离心管中,21000 × g 4℃离心10min,去上清。置于4℃冰箱风干1~3h;
9)待酒精风干后加41 μL ddH2O,置于37℃ 水浴锅中孵育20 min,取出吹打混匀几次之后再次在水浴锅中孵育20min,Qubit dsDNA High Sensitivity Assay检测文库DNA浓度。
6、背景“噪音”消除
1)加入200 ng内参环状质粒(加入的是PGL4.23环状质粒DNA(只要是环状就可以),作为一个内参,其可以提高DNA浓度,防止过度背景消除。因为邻近连接后所要的是环化DNA,背景消除主要消除线性DNA及错误连接的DNA,如果要消除过度,就会消除部分环化DNA,如果加入内参环状,则有可能消除的是引入的内参环状DNA。如果没有引入环状DNA质粒,过度背景消除,就会消除大量所要的环化DNA产物)补齐溶液体积到41μL,再加入10 ×Cutsmart buffer 5μL,Exonuclease I 2μL和Exonuclease III 2μL,吹打混匀放入37℃水浴锅孵育1 min~1h。核酸外切酶是一种在其末端切割核酸链的水解酶。 Exonuclease I具有从3’-5’方向降解单链 DNA 的外切酶活性,能够逐步释放脱氧核糖核酸5'单磷酸,并留下完整的5'端二核苷酸。此处的目的是为了快速消除连接过程未正确连接环化的DNA末端,该末端会对后续分析形成较大的背景噪音。由此,采用Exonuclease I 和Exonuclease III限制性核酸外切酶,可以1 min进行背景噪音消除,提高文库数据产出及文库质量;
2)加入60 μL Ampure XP beads (Beckman Coulter, A63881) 或VAHTS DNAClean Beads (Vazyme,N411-02)磁珠进行常规磁珠纯化文库DNA;
3)加35μL ddH2O混匀,常温静置5 min,放回磁力架5 min,将上清转移至新的离心管。
7、无损失DNA打断和磁珠片段分选
1)加入5 μL Fragmentation, End Preparation&dA-tailing Buffer,10μLFragmentation, End Preparation& dA-tailing Enzyme Mix 吹打混匀,立刻转移到金属浴,程序设置:37℃ 12min,65℃ 30min,4℃ ∞,通过Fragmentation, End Preparation&dA-tailing Enzyme Mix酶对DNA进行酶切打断,取代了常用的超声打断,常用的超声波打断仪分为接触式和非接触式,其中接触式打断仪价格较低,但是需要将超声波探头插入到样本中进行打断,容易造成打断不均匀,样本损失以及交叉污染等问题,非接触式打断仪不需要将探头插入到样品中,因此可以有效的避免上述问题,但是非接触打断仪价格较贵,非接触式的打断仪以Covaris超声波破碎系统最为常用,配合专门的Covaris打断管,可以将DNA精确打断成100-1500 bp或者2-5 kb,超声打断会使得DNA的末端产生寡核苷酸突出,这些末端突出需要通过末端修复过程将其补平,之后才能进行加A和加接头等后续步骤,酶解法打断是利用片段化酶对基因组DNA进行随机打断,和分子克隆中常用的限制性内切酶不同,用于DNA打断的片段化酶并不识别特异的酶切位点,而是对DNA进行随机地、非特异地切割,酶解法打断操作方便,打断、末端修复和加A一步完成,减少了实验步骤,便于同时操作多个样本,另外酶解法打断不需要专门的超声波打断仪,也不需要使用打断管等耗材,因此酶解法打断能够显著降低实验门槛和成本;
2)加152 μL水补齐到202 μL,吸2 μL DNA溶液2% E-gel检测打断效果;
3)使用前将磁珠放至常温,剩余200 μL样品(磁珠分选的文库起始体积)加入110μL 磁珠(是文库起始体积的0.55倍)吹打混匀室温孵育5 min;
4)置于磁力架5min,将上清转移到新的离心管,避免吸到磁珠;
5)再加入30 μL 磁珠(是文库起始体积的0.15倍)吹打混匀,室温孵育5min;
6)置于磁力架5min,去上清,保留磁珠;
7)用700 μL 80% 新配酒精清洗两次,之后静置5min待酒精挥发;
8)加入310 μL 1 × Tris buffer,温柔的吹打混匀,室温孵育5 min,置于磁力架5 min,上清转移至新的1.5ml离心管;
9)Qubit检测文库DNA浓度。吸10 μL DNA溶液2% E-gel检测片段分选效果。
8、生物素标记互作文库富集、illumina测序文库制备
1)使用前将Dynabeads MyOne Streptavidin T1 Beads(链霉亲和素磁珠)放至室温,在新的1.5ml离心管中加入50 μL磁珠和400 μL 1 × Tween Washing Buffer (1 ×TWB: 5 mM Tris-HCl (pH 7.5); 0.5 mM EDTA; 1 M NaCl; 0.05% Tween 20),吹打混匀后,置于磁力架3min,弃上清;
2) 加入300 μL 2 × Biotin Binding Buffer(10 mM pH 7.5 Tris-HCl,1 mMEDTA,2 M NaCl)重悬磁珠,将DNA溶液加入到磁珠中,置于震荡仪350 rpm 室温震荡15min,使生物素化的DNA与链霉亲和素磁珠结合;
3)将DNA和磁珠混合后的样品置于磁力架上5 min,弃去上清;
4)再加入600 μL 1 × TWB吹打混匀,金属浴55 ℃ 2 min,置于磁力架3 min,吸弃上清;
5)重复步骤4)吸弃上清后32.5 μL ddH2O于磁珠混匀放置于4 ℃保存。
9、“一步法”快速接头连接文库构建
1)根据DNA文库的量,将Adapter稀释至适当的浓度。解冻快速连接缓冲液RapidLigation Buffer和快速DNA连接酶Rapid DNA Ligase,并倒置混匀,瞬离置于冰上备用;
2)制备快速接头连接反应体系,向样品中加入12.5 μL Rapid Ligation Buffer,2.5μL Rapid DNA Ligase,1.5 μL Adapter,1 μL water。用移液枪轻轻混合(不要摇晃混合),不要短暂离心,将反应液收集到管底;
3)置于金属浴20 ℃孵育15 min,4℃保存;
4)瞬离,加150 μL 1×TE,轻轻拨弹混匀,磁力架上静置3 min,弃上清,重复一次。然后,加150 μL 1×B/W buffer,轻轻拨弹混匀,磁力架3 min,弃上清,重复一次,弃上清后晾干3min,加入40 μL ddH2O洗脱。
10、PCR QC质控和正式文库扩增、上机测序
1)按如下制备PCR QC 混合物:10μL 2× HiFi Amp预混液,1 μL 10× 文库扩增引物预混液,得到的洗接头后产物1μL,超纯水8μL,彻底混匀,简单离心;
按程序设置PCR,预变性:98℃ 1 min;12个循环(变性:98℃ 15s;退火:60℃ 30s;延伸:72℃ 30s);完全延伸:72℃ 5min;保存:4℃∞min,
2)取19μL PCR产物跑E-gel,进行Smear条带观察质量控制;
3) 正式PCR,制备正式PCR混合物:20 μL 2× HiFi Amp预混液,2 μL 10× 文库扩增引物预混液,得到的洗接头后产物18 μL;混匀,简单离心,PCR程序和PCR QC相同,具体循环数根据QC决定,设置的循环数可以满足文库回收的需求,得到正式PCR产物;
4)将PCR后的产物转移至新的1.5 ml离心管中,按1:1比例加入DNA Clean Beads,混匀后常温放置5 min,上磁力架5 min后弃去上清,用新鲜配置的80%乙醇溶液洗两遍,晾干3 min后,用20 μL ddH2O复溶,上磁力架5 min,取19 μL上清跑E-gel,结果如图6B,结果表明:主带分布在700bp左右,适合上机测序;
5)切胶回收,回收片段的样品400-900 bp左右(根据带型微调,结果如图6C),Qubit检测文库浓度,进行illumina Nova-seq 6000上机测序;
6)将下机数据进行处理后通过HiC-Pro 软件进行评估,结果如图7所示,为文库样品C2C12-DHE-1小规模测序(0.3million细胞数,测序量为2G)测序和对应的大规模测序(DHMax1,0.3million细胞数,测序量为150G)的HiC-Pro结果,其中图7A为Hi-C试验目标序列比例(占双端唯一配对序列比率)(Valid_interaction _pairs(%)=Valid_interaction_pairs /Unique_paired_alignments)比较结果图,7B为顺反式互作比例结果图,合格的Hi-C文库对于提升有效数据量具有重要作用,因此,有效Hi-C数据量的高低会直接反映Hi-C文库建库质量的高低,主要从Invalid Interaction Pairs和Valid Interaction Pairs含量对Hi-C数据进行评估,Invalid Interaction Pairs主要主要包含自连类型(Self-cycleLigation),末端悬挂类型(Dangling Ends)、相邻连接类型(Re-ligation)和其他丢弃的类型(Dumped),Valid Interaction Pairs在30%以上即认为数据合格,本申请中C2C12-DHE-1小规模测序(0.3million细胞数)测序数据中Valid Interaction Pairs几乎达到95%+(图7A左),对应大规模测序的水平(90%左右)(图7A右),说明采用本申请中方法建造的文库具有极高的质量数据,判断Hi-C的文库是否合格的一个重要的指标是cis/trans的比值,cis指的是paired reads在同一条染色体上(intra-chromosomal interactions),trans指的是paired reads在不同染色体上(inter-chromosomal interactions),一般认为cisinteraction比例越高,表明该数据的质量越好,在图7B中可见采用本申请建库方法时,即使小规模测序(0.3million细胞数,测2G raw bases)也可以到达与大规模测序(0.3million细胞数,测150G raw bases)相当的水平,说明本申请的建库方法非常高效。
对文库样品DHMax1_C2C12-DHE-1分析第8号染色体Compartment和互作频率,结果如图8所示,结果表明:图上蓝红相间的峰代表染色体Compartment,蓝色峰值代表compartment A为开放染色质区域,基因丰富且表达活跃,红色峰代表compartment B为封闭染色质区域,基因缺乏且表达不活跃,图上红色热图表示8号染色体范围内的全部互作,绿色框内明显对应横纵坐标compartment A的交互处,证明这里产生了染色质较强互作;并分析DHMax1_C2C12-DHE-1的APA结果(5kb bin分辨率、10kb bin分辨率、25kb bin分辨率),结果如图9所示,结果表明:Hi-C数据具有明显且理想的全基因组DNA-Loops互作信号强度,in situ eHi-C 3.0测序文库构建成功。
综上所述,采取上述升级方案的in situ eHi-C 3.0技术,相较于现有技术,有如下技术效果:
1、增加了EGS交联步骤和酶打断步骤;
2、捕获更多互作信息的同时减少实验成本和实验过程中的DNA损失:通过双交联提高捕获基因互作的数量;通过降低细胞量,生物素用量以及超声打断更替为酶打断以减低实验成本;通过加入内参环状质粒和无损失打断等步骤减低损失;
3、引入酶切质量控制(RE-QC),检测染色质片段化完全程度;
4、“减量降本保效”调整后的带有生物素标记的脱氧核糖核苷酸进行标记;
5、向环化产物中引入内参环状质粒;
6、限制性外切酶组合处理所述混合物,1 min即可进行背景消除;
7、细胞起始量降低至0.05-0.3 mllion个细胞。
实施例二、室温in situ eHi-C 3.0技术(室温酶切)
实施例二中除部分步骤调整外,其他步骤与实施例一中一致,即细胞为小鼠胚胎干细胞ESC细胞,细胞量为0.3 mllion,其余不同步骤处理如下:
3、室温高效内切酶组合酶切染色质
在上述溶液中加入26 μL 1×或10× Cutsmart酶切缓冲液和高效内切酶组合8~16 μL CviAII和8~16 μL CviQI,吹打混匀后,样品放在实验室内(室温)试验台斡旋仪上进行颠倒过夜即可,由此,可以解决酶切对温度的依赖,在室温条件下就可以进行充分的酶切,满足建库要求,当实验条件不具备金属浴、水浴锅、烘箱等情况下具有重大优势。
5、“减量降本保效”DNA末端高效标记和邻近DNA互作连接
1)酶切后的DNA中加入3.3 μL dNTP混合物(1.5μL 10mM dATP,1.5μL 10mM dGTP,1.5μL 10mM dTTP和37.5μL 0.4mM biotin-14-dCTP)和1μL 5U/μL Klenow酶加入酶切后DNA中,加45.7 μL ddH2O,混匀,37℃烘箱中旋转孵育75 min,每10 min吹打一次,补齐并标记DNA末端,之后放于冰上,得到标记后DNA分子。
10、PCR QC质控和正式文库扩增、上机测序
6)将下机数据进行处理后通过HiC-Pro 软件进行评估,结果如图10所示,为文库样品C12-CC-A、C12-CC-B小规模测序和大规模测序(C12-CC-BE2,是C12-CC-B的扩大测序样品)的HiC-Pro结果,其中10A为Hi-C试验目标序列比例(占双端唯一配对序列比率)(Valid_interaction _pairs(%)=Valid_interaction_pairs /Unique_paired_ alignments)结果图,结果表明:C12-CC-A、C12-CC-B小规模测序数据量组达到了85%左右,同时大规模测序数据量组也达到了90%以上;10B为顺反式互作比例,结果表明:C12-CC-A、C12-CC-B小规模测序数据量结果相当,说明小规模测序数据量也可以达到大规模测序数据量组的下机效果,说明本申请的建库方法高效。
除以上步骤,其他步骤与实施例一中一致。
实施例三 高效内切酶及其组合的筛选
1、内切酶及内切酶组合理论酶切基因组
当前Hi-C中常见的为HindIII和MboI酶,HindIII,是六位内切酶,酶切位点为“AAGCTT”;MboI,是四位内切酶,酶切位点为“GATC”,不同的内切酶,单一作用的时候因为识别序列的差异导致酶切效果的不同,本申请中我们进行了理论酶切模拟,利用HiC-Pro自带的digest_genome.py脚本,根据酶切位点将基因组进行片段化,再根据得到的片段文件,计算片段大小,画图看片段大小的分布。
首先,选择了一个小的基因组果蝇基因组Drosophila (dm6_rm),选择了HindIII(H)、HpyCH4IV(Hp)、MboI(M)、DpnII(D)和内切酶组合MboI&HpyCH4IV(MH)、DpnII&HpyCH4IV(DH)。其中,HpyCH4IV是四位内切酶,酶切位点为“ACGT”;DpnII是MboI同列酶,酶切位点也为“GATC”;理论酶切结果如图1所示,图1中横坐标代表酶切后DNA片段的数量,纵坐标为DNA片段大小的分布情况。由图1可知H(HindIII)酶作为六位内切酶,酶切后DNA片段主要分布与1300-3000bp左右;Hp(HpyCH4IV)、M(MboI)、D(DpnII)均为四位点内切酶,整体酶切片段大小分布在250-800bp左右,且Hp酶切的更集中得到的片段更多;MH代表同时用MboI&HpyCH4IV进行双酶切;DH代表同时用DpnII&HpyCH4IV进行双酶切,可以看到双酶切的片段更下移,分布在100-700bp左右,也是比较理想的片段的大小,两种酶切组合片段数量没有太大区别。
然后还测试了一个大的基因组——小鼠基因组(mm9),选择了HindIII(H)、HpyCH4IV(Hp)、MboI(M)和内切酶组合MboI&HpyCH4IV(MH),理论酶切结果如图2 A所示:HindIII和HpyCH4IV酶对小鼠基因组酶切效果较差,MboI单酶酶切不完全有基因组条带,主要片段分布在250-500bp左右;MboI&HpyCH4IV酶切组合表现出比单酶更好的效果,得到的片段更多。
以上结果均得出,无论在小基因组和大基因组情况下,内切酶组合优于四位内切酶,优于六位内切酶。
2、酶切纯基因组DNA测试
利用实施例三的步骤中采用HindIII(H)、MboI(M)、DpnII(D)、HpyCH4IV(Hp)、Sau3AI(S)和内切酶组合DpnII&HpyCH4IV(DH)、MboI&HpyCH4IV(MH)、Sau3AI&HpyCH4IV(SH),进行酶切纯的基因组DNA(300 ng),测试了这几种内切酶、内切酶组合,对基因组DNA实际酶切效果,做了如下实验:
组1:HindIII单酶切组,加4μL HindIII (5U/μL,NEB R0104L);
组2:MboI单酶切组,加4μL MboI (5U/μL,NEB R0147L);
组3:DpnII单酶切组,加4μL DpnII (5U/μL,NEB R0543L);
组4:HpyCH4IV单酶切组:加4μL HpyCH4IV (10U/μL,NEB R0619L);
组5:Sau3AI单酶切组,加4μL Sau3AI (5U/μL,NEB R0169L);
组6:DpnII&HpyCH4IV双酶切组:加2μL DpnII (5U/μL,NEB R0543L)和2μL的HpyCH4IV (10U/μL,NEB R0619L);
组7:MboI&HpyCH4IV双酶切组:加2μL MboI (5U/μL,NEB R0147L)和2μL的HpyCH4IV (10U/μL,NEB R0619L);
组8:Sau3AI&HpyCH4IV双酶切组:加2μL Sau3AI (5U/μL,NEB R0169L)和2μL的HpyCH4IV (10U/μL,NEB R0619L);
过夜酶切后进行实施例一中步骤4的操作,得到酶切结果,如图2B所示:图2B中M表示DNA ladder为1kb和100bp等量混合Ladder,上样量100 ng,由图2B可知HindIII酶切条带的结果与理论分析基本保持一致,有未完全切割的基因组条带;MboI和DpnII作为同列酶获得了一样的条带,主带在1Kb至250bp之间,但有未完全切割的基因组条带;HpyCH4IV酶切条带也再次验证了图2A理论分析的准确性,但也有未完全切割的基因组条带;Sau3AI酶切条带表现出较好的酶切效果,但也隐约有未完全切割的基因组条带;而3组组合酶则酶切效果更好,没有未完全切割的基因组条带。
综上所述,可以得出如下结论:
①整体双酶切组合比单酶切组合切割更彻底更完全,几乎不存在基因组条带。
②单酶切组中除HindIII外均为“四位”酶切位点,但是依然出现不同的酶切结果,HpyCH4IV主带在4Kb左右,MboI和DpnII主带在500bp至1Kb左右,Sau3AI在200bp至500bp左右,虽然同为四位点“GATC”。由于酶的特性不一样且存在“位点优势效应”,因此,酶切结果不同,观察到尽管还存在部分基因组条带,被切割的部分展示Sau3AI、MboI和DpnII比HindIII、HpyCH4IV切割的更充分。
③双酶切组合的胶图结果显示内切酶组合DpnII&HpyCH4IV(DH)、MboI&HpyCH4IV(MH)、Sau3AI&HpyCH4IV(SH)对比对应的单酶切,效果更充分,趋势上与②中单酶切组合的结果一致,且突破了酶的特性且“位点优势效应”的影响,酶切完全、不存在部分未完全酶切的基因组,因此,这三种高效双酶切组合可能是较为最佳的选择。
3、在insitu Hi-C体系中酶切染色质测试
引入实施例三中8种酶切组合(组A-H)进行在insitu Hi-C体系中酶切染色质测试。选择实施例一中经过甲醛交联的细胞,加入冷的1×DPBS重悬后,分装到1.5ml EP管中,每管细胞~0.3 million。在实施例一的步骤2中3)步骤时,尽可能在不吸到细胞的情况下完全洗弃上清。
组A:HindIII单酶切组,加16μL HindIII(5U/μL,NEB R0104L);
组B:DpnII单酶切组,加16μL DpnII(5U/μL,NEB R0543L);
组C:Sau3AI单酶切组,加16μL Sau3AI(5U/μL,NEB R0169L);
组D:HpyCH4IV单酶切组:加16μL HpyCH4IV(10U/μL,NEB R0619L);
组E:MboI单酶切组,加16μL MboI (5U/μL,NEB R0147L);
组F:MboI&HpyCH4IV双酶切组:加8μL MboI(5U/μL,NEB R0147L)和8μL的HpyCH4IV(10U/μL, NEB R0619L);
组G:DpnII&HpyCH4IV双酶切组:加8μL DpnII(5U/μL,NEB R0543L)和8μL的HpyCH4IV(10U/μL, NEB R0619L);
组H:Sau3AI&HpyCH4IV双酶切组:加8μL Sau3AI(5U/μL,NEB R0169L)和8μL的HpyCH4IV(10U/μL, NEB R0619L);
上述各组酶切过夜16h,且中间吹打次数不低于4次,以保证酶切均匀获得更好的酶切效果。
酶切后进行实施例一中步骤4的操作,得到酶切结果,结果如图4所示,经过多次酶切测试可以得出:
①在insitu Hi-C中依然保持着双酶切组合效果优于单酶切组合的验证结果。
②在insitu Hi-C体系中,酶切染色质时,单酶切组合在相同酶切位点的情况下出现更明显的差异,DpnII和Sau3AI的主带在500bp左右,在具有接近的酶切主带范围下,优于MboI,DpnII和Sau3AI参与的片段化染色质,观察到尽管还存在部分基因组条带,这可能在后续的数据分析中获得更多的互作结果。
③在insitu Hi-C体系中,三组双酶切均取得较好的酶切效果,Sau3AI&HpyCH4IV(SH)双酶切组的主带更靠下,另外两组DpnII&HpyCH4IV(DH)、MboI&HpyCH4IV(MH)分布更均匀。
因此,可以根据研究的互作大小、成本、研究目的需要,选择合适的酶切组合进行实验:Sau3AI&HpyCH4IV(SH)、DpnII&HpyCH4IV(DH)和MboI&HpyCH4IV(MH)的理论识别位点,一样,但是在不同细胞中“位点优势效应”、基因组的修饰情况、包裹基因组的反式作用因子分布不一样,因此,在不同细胞中往往三个高效内切酶组合的酶切效果不一样。什么情况筛选哪个酶切组合,需要根据细胞的预实验而定。
以上所述的仅是本发明的一些实施方式。对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于发明的保护范围。
Claims (10)
1.染色质构象捕获in situeHi-C 3.0测序文库制备方法,其中,所述方法包括如下步骤:
S1:收集细胞,进行甲醛及EGS双交联;
S2:透化裂解细胞膜和细胞核,得到完整包裹的染色质;所述透化裂解细胞膜和细胞核的裂解液为1% PI、0.2% Igepal CA630、10mM Tris-HCl pH8.0和10mM NaCl;
S3:采用内切酶组合进行酶切,所述内切酶组合为DpnII+HpyCH4IV、Sau3AI+HpyCh4IV、CviAII+ CviQI三组中的任意一组;
S4:酶切产物进行质量控制,检测染色质片段化完全程度;
S5:将酶切后DNA片段再经过带有生物素标记的脱氧核糖核苷酸进行标记;
S6:邻近连接,得到环化后的嵌合DNA产物,逆转交联;
S7:向S6步骤中环化产物中引入内参环状质粒,得到混合物,采用限制性外切酶组合处理得到的混合物,所述限制性外切酶组合为Exonuclease I和Exonuclease III;
S8:对S7步骤中的混合物进行酶切打断,并结合磁珠分选,优化片段范围;
S9:免疫磁珠抓取带有生物素标记的互作DNA片段,再进行加接头、PCR扩增、E-gel胶切胶回收,制备in situ eHi-C 3.0测序文库。
2.根据权利要求1中所述制备方法,其中,所述甲醛及EGS双交联采用37%的甲醛和3 mMEGS的DPBS溶液。
3.根据权利要求1中所述制备方法,其中,所述步骤S3中,室温条件下选用CviAII+CviQI内切酶组合进行酶切,在37℃条件下选用DpnII+HpyCH4IV或Sau3AI+ HpyCh4IV内切酶组合进行酶切。
4.根据权利要求1中所述制备方法,其中,所述步骤S4中,所述酶切产物进行质量控制是通过将1.2倍XP磁珠纯化细胞DNA,再进行浓度测定和0.8% 琼脂糖凝胶电泳检测,根据电泳结果图判断酶切是否完全:酶切电泳图在基因组位置12Kb处不存在条带,且整个电泳条带均匀弥散分布,说明DNA被片段化的比较彻底,酶切成功。
5.根据权利要求1中所述制备方法,其中,所述步骤S5中,所述的酶切后DNA片段再经过带有生物素标记的脱氧核糖核苷酸进行标记时是采用混有生物素标记的碱基试剂Fill-inMaster Mix,所述Fill-in Master Mix使用量为每0.05~0.3million细胞3.3μL。
6.根据权利要求1中所述制备方法,其中,所述步骤S6中,邻近连接采用的连接反应液含重组白蛋白,所述连接反应液由NEB T4 DNA ligase buffer、Triton X-100、重组白蛋白、T4 DNA ligase和水组成。
7.根据权利要求1中所述制备方法,其中,所述步骤S8中,所述酶切打断时采用的酶为Fragmentation、End Preparation & dA-tailing Enzyme Mix。
8.采用权利要求1-7任一项中所述制备方法制备的in situ eHi-C 3.0测序文库。
9.含有权利要求8中所述的in situ eHi-C 3.0测序文库的高通量测序试剂盒。
10.权利要求8中所述的in situ eHi-C 3.0测序文库在细胞高通量测序或基因组组装或功能基因组学研究中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410455218.XA CN118064551A (zh) | 2024-04-16 | 2024-04-16 | 染色质构象捕获in situeHi-C 3.0测序文库制备方法及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410455218.XA CN118064551A (zh) | 2024-04-16 | 2024-04-16 | 染色质构象捕获in situeHi-C 3.0测序文库制备方法及应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118064551A true CN118064551A (zh) | 2024-05-24 |
Family
ID=91107723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410455218.XA Pending CN118064551A (zh) | 2024-04-16 | 2024-04-16 | 染色质构象捕获in situeHi-C 3.0测序文库制备方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118064551A (zh) |
-
2024
- 2024-04-16 CN CN202410455218.XA patent/CN118064551A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109797436B (zh) | 一种测序文库构建方法 | |
CN106566828B (zh) | 一种高效的全基因组染色质构象技术eHi-C | |
CN107475394B (zh) | 一种基于少量细胞全基因组染色质高分辨率构象技术eHi-C 2.0 | |
JP7232643B2 (ja) | 腫瘍のディープシークエンシングプロファイリング | |
WO2017181880A1 (zh) | 构建待测基因组的dna测序文库的方法及其应用 | |
JPH09501321A (ja) | 核酸配列の選択法 | |
CN102971434A (zh) | 一种甲基化dna的高通量测序方法及其应用 | |
CN112522382B (zh) | 一种基于液相探针捕获的y染色体测序方法 | |
CN109641933B (zh) | 染色质相互作用的全基因组鉴定 | |
CN107893100A (zh) | 一种单细胞mRNA逆转录与扩增的方法 | |
WO2019006975A1 (zh) | 极小量细胞原位全基因组染色质构象捕获方法 | |
WO2017066907A1 (zh) | 一种构建高可利用数据率的Hi-C文库的方法 | |
CN113249439A (zh) | 一种简化dna甲基化文库及转录组共测序文库的构建方法 | |
CN111394801A (zh) | 基于Illumina测序平台的多重单细胞简化代表性甲基化文库的构建方法 | |
CN112410331A (zh) | 带分子标签和样本标签的接头及其单链建库方法 | |
CN108265104B (zh) | 染色体构型捕捉文库及其构建方法 | |
WO2022161294A1 (zh) | 一种中通量单细胞拷贝数文库构建的方法及其应用 | |
CN113528612B (zh) | 用于检测染色质开放位点间染色质相互作用的NicE-C技术 | |
WO2016045105A1 (zh) | Pf快速建库方法及其应用 | |
CN111560651B (zh) | 一种制备双链rna测序文库的方法 | |
CN118064551A (zh) | 染色质构象捕获in situeHi-C 3.0测序文库制备方法及应用 | |
CN114032287A (zh) | Dna甲基化测序文库及其构建方法和检测方法 | |
CN109280663B (zh) | 一种全自动核酸单链制备方法 | |
CN116497105B (zh) | 基于末端转移酶的单细胞转录组测序试剂盒及测序方法 | |
CN111455021B (zh) | 去除宏基因组中宿主dna的方法及试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |