CN116004768A - 染色质和/或染色体构象捕获方法及其所用试剂 - Google Patents
染色质和/或染色体构象捕获方法及其所用试剂 Download PDFInfo
- Publication number
- CN116004768A CN116004768A CN202310145150.0A CN202310145150A CN116004768A CN 116004768 A CN116004768 A CN 116004768A CN 202310145150 A CN202310145150 A CN 202310145150A CN 116004768 A CN116004768 A CN 116004768A
- Authority
- CN
- China
- Prior art keywords
- dna
- ortho
- target cell
- cell nucleus
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 108010077544 Chromatin Proteins 0.000 title claims abstract description 32
- 210000003483 chromatin Anatomy 0.000 title claims abstract description 32
- 210000000349 chromosome Anatomy 0.000 title claims abstract description 24
- 239000003153 chemical reaction reagent Substances 0.000 title claims abstract description 7
- 108020004414 DNA Proteins 0.000 claims abstract description 119
- 239000012634 fragment Substances 0.000 claims abstract description 47
- 210000004027 cell Anatomy 0.000 claims abstract description 40
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 34
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 34
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 22
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 22
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims abstract description 18
- 238000012163 sequencing technique Methods 0.000 claims abstract description 16
- 108091008146 restriction endonucleases Proteins 0.000 claims abstract description 14
- 229960002685 biotin Drugs 0.000 claims abstract description 9
- 235000020958 biotin Nutrition 0.000 claims abstract description 9
- 239000011616 biotin Substances 0.000 claims abstract description 9
- 238000004132 cross linking Methods 0.000 claims abstract description 9
- 238000001976 enzyme digestion Methods 0.000 claims abstract description 7
- 238000003776 cleavage reaction Methods 0.000 claims abstract description 6
- 238000000338 in vitro Methods 0.000 claims abstract description 6
- 210000003855 cell nucleus Anatomy 0.000 claims description 72
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 claims description 21
- 102000012410 DNA Ligases Human genes 0.000 claims description 18
- 108010061982 DNA Ligases Proteins 0.000 claims description 18
- 239000006166 lysate Substances 0.000 claims description 13
- 239000002773 nucleotide Substances 0.000 claims description 12
- 125000003729 nucleotide group Chemical group 0.000 claims description 12
- 229920004890 Triton X-100 Polymers 0.000 claims description 11
- 239000013504 Triton X-100 Substances 0.000 claims description 11
- 238000011065 in-situ storage Methods 0.000 claims description 11
- 239000007853 buffer solution Substances 0.000 claims description 10
- 239000013592 cell lysate Substances 0.000 claims description 10
- 108010090804 Streptavidin Proteins 0.000 claims description 6
- 239000007787 solid Substances 0.000 claims description 5
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 claims description 4
- 239000003795 chemical substances by application Substances 0.000 claims description 4
- 229910001425 magnesium ion Inorganic materials 0.000 claims description 4
- 102000053602 DNA Human genes 0.000 claims description 3
- 108010067770 Endopeptidase K Proteins 0.000 claims description 3
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 claims description 3
- 238000002525 ultrasonication Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims 1
- 230000003993 interaction Effects 0.000 abstract description 21
- 238000004458 analytical method Methods 0.000 abstract description 6
- 230000001404 mediated effect Effects 0.000 abstract description 4
- 230000007017 scission Effects 0.000 abstract description 4
- 239000011324 bead Substances 0.000 description 25
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 24
- 239000000243 solution Substances 0.000 description 17
- 239000000872 buffer Substances 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 13
- 239000000203 mixture Substances 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 12
- 239000002904 solvent Substances 0.000 description 12
- 210000004940 nucleus Anatomy 0.000 description 11
- 239000011534 wash buffer Substances 0.000 description 11
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 11
- 239000011780 sodium chloride Substances 0.000 description 10
- 239000006228 supernatant Substances 0.000 description 9
- 239000007788 liquid Substances 0.000 description 8
- ATHGHQPFGPMSJY-UHFFFAOYSA-N spermidine Chemical compound NCCCCNCCCN ATHGHQPFGPMSJY-UHFFFAOYSA-N 0.000 description 8
- 238000002156 mixing Methods 0.000 description 7
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 6
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 6
- QRLVDLBMBULFAL-UHFFFAOYSA-N Digitonin Natural products CC1CCC2(OC1)OC3C(O)C4C5CCC6CC(OC7OC(CO)C(OC8OC(CO)C(O)C(OC9OCC(O)C(O)C9OC%10OC(CO)C(O)C(OC%11OC(CO)C(O)C(O)C%11O)C%10O)C8O)C(O)C7O)C(O)CC6(C)C5CCC4(C)C3C2C QRLVDLBMBULFAL-UHFFFAOYSA-N 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 239000007995 HEPES buffer Substances 0.000 description 6
- 239000012148 binding buffer Substances 0.000 description 6
- UVYVLBIGDKGWPX-KUAJCENISA-N digitonin Chemical compound O([C@@H]1[C@@H]([C@]2(CC[C@@H]3[C@@]4(C)C[C@@H](O)[C@H](O[C@H]5[C@@H]([C@@H](O)[C@@H](O[C@H]6[C@@H]([C@@H](O[C@H]7[C@@H]([C@@H](O)[C@H](O)CO7)O)[C@H](O)[C@@H](CO)O6)O[C@H]6[C@@H]([C@@H](O[C@H]7[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O7)O)[C@@H](O)[C@@H](CO)O6)O)[C@@H](CO)O5)O)C[C@@H]4CC[C@H]3[C@@H]2[C@@H]1O)C)[C@@H]1C)[C@]11CC[C@@H](C)CO1 UVYVLBIGDKGWPX-KUAJCENISA-N 0.000 description 6
- UVYVLBIGDKGWPX-UHFFFAOYSA-N digitonine Natural products CC1C(C2(CCC3C4(C)CC(O)C(OC5C(C(O)C(OC6C(C(OC7C(C(O)C(O)CO7)O)C(O)C(CO)O6)OC6C(C(OC7C(C(O)C(O)C(CO)O7)O)C(O)C(CO)O6)O)C(CO)O5)O)CC4CCC3C2C2O)C)C2OC11CCC(C)CO1 UVYVLBIGDKGWPX-UHFFFAOYSA-N 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 6
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 5
- LRMHFDNWKCSEQU-UHFFFAOYSA-N ethoxyethane;phenol Chemical compound CCOCC.OC1=CC=CC=C1 LRMHFDNWKCSEQU-UHFFFAOYSA-N 0.000 description 5
- -1 polyoxyethylene octyl phenol Polymers 0.000 description 5
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- UQLDLKMNUJERMK-UHFFFAOYSA-L di(octadecanoyloxy)lead Chemical compound [Pb+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O UQLDLKMNUJERMK-UHFFFAOYSA-L 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 229940063673 spermidine Drugs 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 238000001353 Chip-sequencing Methods 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 101001066268 Homo sapiens Erythroid transcription factor Proteins 0.000 description 3
- 108010012306 Tn5 transposase Proteins 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 238000005336 cracking Methods 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000008098 formaldehyde solution Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 239000002244 precipitate Substances 0.000 description 3
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 3
- FCEHFCFHANDXMB-UMEYXWOPSA-N tocosimplex Chemical compound OS(O)(=O)=O.C1N2CCCC[C@@H]2[C@@H]2CN3CCCC[C@H]3[C@H]1C2 FCEHFCFHANDXMB-UMEYXWOPSA-N 0.000 description 3
- JYCQQPHGFMYQCF-UHFFFAOYSA-N 4-tert-Octylphenol monoethoxylate Chemical group CC(C)(C)CC(C)(C)C1=CC=C(OCCO)C=C1 JYCQQPHGFMYQCF-UHFFFAOYSA-N 0.000 description 2
- 241000220451 Canavalia Species 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102100031690 Erythroid transcription factor Human genes 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 2
- 125000004430 oxygen atom Chemical group O* 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 125000004434 sulfur atom Chemical group 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- NVKAWKQGWWIWPM-ABEVXSGRSA-N 17-β-hydroxy-5-α-Androstan-3-one Chemical compound C1C(=O)CC[C@]2(C)[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CC[C@H]21 NVKAWKQGWWIWPM-ABEVXSGRSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 101150084579 GATA1 gene Proteins 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 101710085938 Matrix protein Proteins 0.000 description 1
- 101710127721 Membrane protein Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000007259 addition reaction Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical group O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种染色质和/或染色体构象捕获的方法及其所用试剂,属于三维基因组学领域。该方法包括:将目的细胞进行体外交联、裂解、利用平末端限制性内切酶进行酶切在末端添加A碱基,用BP Linker连接邻位DNA末端;特异性抗体标记目的蛋白后利用Tn5融合蛋白靶向富集目的蛋白质介导的DNA相互作用,利用生物素标记富集“DNA‑标签‑DNA”的目的片段,得到邻位连接DNA片段,对邻位连接DNA片段进行测序分析,确定与目的蛋白结合的邻位连接DNA。本发明相较于传统方法,该方法具有使用常规实验器材和稀少细胞数量、高效、短周期、低数据信噪比低、低成本的优势。
Description
技术领域
本发明涉及三维基因组学领域,具体为一种染色质和/或染色体构象捕获方法及其所用试剂。
背景技术
越来越多的研究表明,基因的表达不仅仅受线性调控元件的影响,基因表达的调控也受到染色质的空间相互作用的影响。自从第一项染色质构象捕获3C技术(chromosomeconformation capture 3C)出现以来已经过去了十多年,染色质空间相互作用检测技术在捕获质量和数量上都得到了大幅提升。诸如环状染色体构象捕获(4C),源自3C文库的3C-拷贝(5C)等技术为研究染色质之间的长距离相互作用提供了可能性;Hi-C的出现是生物基因组空间结构研究的重大突破,结合高通量测序技术实现了全基因组染色质构象的整体绘图;HiChIP和ChIA-PET更是向检测特定蛋白介导的空间互作迈出了重要的一步。但是,目前对三维染色质相互作用的整体分析依然缺乏高效、高分辨率以及高灵敏度的捕获技术。像Hi-C、ChIA-PET、HiChIP以及PLAC-seq等技术,不仅需要大量的细胞,而且捕获效率低、操作繁琐,无法很好的运用在稀疏细胞以及组织样品中。
发明内容
本发明所要解决的技术问题是如何更便捷有效、短周期和/或低数据信噪比进行染色质和/或染色体构象捕获,和/或如何对细胞数量稀少的试验样品进行染色质和/或染色体构象捕获。
为解决上述技术问题,本发明提供了一种染色质和/或染色体构象捕获的方法,命名为Hi-Tag。
本发明所提供的染色质和/或染色体构象捕获的方法,包括以下步骤:
S1、将目的细胞进行体外交联,使目的细胞内与DNA结合的蛋白固定,得到固定后的目的细胞,收集固定后的目的细胞并用细胞裂解液裂解得到裂解物,从所述裂解物中获取目的细胞核;
S2、利用限制性内切酶将所述目的细胞核中的DNA进行酶切,使得目的细胞核具有平末端的DNA,在平末端的DNA的3’末端添加A碱基,得到具有A碱基末端的DNA的目的细胞核;
S3、用T4 DNA连接酶连接具有A碱基末端的DNA与BP Linker,得到含有邻位连接DNA的目的细胞核;
所述BP Linker是3’末端具有突出核苷酸T的粘性末端的双链DNA,所述BP Linker的一条链的核苷酸序列为5`-CGCGATATCTTATCTGACT-3`(序列1),另一条链的核苷酸序列为5`-GTCAGATAAGATATCGCGT-3`(序列2),序列1的第10位的脱氧胸苷酸T被生物素修饰,所述BP Linker的两条链的每条链的两个核苷酸之间的3`,5`-磷酸二酯键(图2中下图左图箭头所示)均被替换为3`,5`-硫代磷酸二酯键(图2中下图右图箭头所示,硫原子取代了磷酸二酯键中的一个氧原子);
S4、捕获所述含有邻位连接DNA的目的细胞核,使抗目的蛋白的特异性抗体与所述含有邻位连接DNA的目的细胞核进行反应,得到结合一抗的目的细胞核,使所述结合一抗的目的细胞核与抗所述特异性抗体的二抗结合,得到结合一抗二抗的目的细胞核,使所述结合一抗二抗的目的细胞核与Tn5融合蛋白进行反应,得到原位标签化目的细胞核,所述原位标签化目的细胞核为结合所述Tn5融合蛋白的细胞核,用镁离子激活所述原位标签化目的细胞核中的所述Tn5融合蛋白,使与所述目的蛋白结合的邻位连接DNA被片段化,得到含有邻位连接DNA片段的目的细胞核,从所述含有邻位连接DNA片段的目的细胞核中提取纯化DNA,得到含有邻位连接DNA片段的混合DNA,从所述混合DNA中捕获所述邻位连接DNA片段,得到所述邻位连接DNA片段;
S5、对所述邻位连接DNA片段进行测序分析,确定与所述目的蛋白结合的邻位连接DNA。
上述方法中,所述S3中可用T4 DNA连接酶连接所述具有A碱基末端的DNA与BPLinker在连接体系中进行,所述连接体系中,所述BP-Linker的含量为0.8ng/μl,T4 DNA连接酶的含量为2U/μl。所述S3中,所述连接体系可由0.8ng/μl所述BP-Linker、2U/μl T4 DNA连接酶、0.1mg/ml BSA、10g/L Trition X-100和1×T4 DNA ligase Buffer组成。所述S3中,用T4 DNA连接酶连接所述具有A碱基末端的DNA与BP Linker可在25℃反应4h。
所述S1中,所述体外交联采用甲醛进行交联。如可将目的细胞在1%的甲醛溶液中处理10min。所述甲醛溶液的溶剂为PBS,溶质为甲醛。所述PBS的组成为1mM KH2PO4,155mMNaCl,3mM Na2HPO4-7H2O,其余为水;所述PBS的pH为7.4。所述S1包括采用甲醛进行交联后用0.125M的甘氨酸溶液(溶剂为水)终止交联。所述细胞的数目可为1×104-1×106个,可以根据实验样本进行自由调整。
所述S1中,所述细胞裂解液由溶质和溶剂组成,溶剂为水,溶质由Tris-HCl、NaCl、聚氧乙烯辛烷基苯酚醚和蛋白酶抑制剂组成。所述细胞裂解液中,Tris-HCl的含量为10mM、NaCl的含量可为10mM、聚氧乙烯辛烷基苯酚醚的含量可为2mL/L和蛋白酶抑制剂的含量可为10g/L。所述S1中,从所述裂解物中获取目的细胞核可包括将所述裂解物加入含SDS的缓冲溶液在62℃孵育松散染色质后再加入Triton X-100中和SDS,所述含SDS的缓冲溶液中SDS的含量为3-5g/L。
所述S1中,所述含SDS的缓冲溶液的组成可为1×rCutsmart缓冲液、3-5g/L SDS和水。Triton X-100的加入量满足所述Triton X-100在反应体系中的含量可为1.67g/L。
所述S1中,所述松散染色质的时间为10分钟。所述中和可为在20-25℃孵育5分钟再转至冰上孵育10分钟。
上述方法不包括超声破碎的步骤。
所述S2中,所述限制性内切酶为产生平末端的限制性内切酶,如可为HeaIII和AluI中的任一种。所述酶切可为37℃反应6-8h。所述酶切可在所述限制性内切酶的含量为1.0U/μl的反应体系中进行。所述反应体系由溶质和溶剂组成,溶质为1×rCutSmart缓冲液、10g/L Trition X-100和1.0U/μl所述限制性内切酶,溶剂为水。
所述在平末端的DNA的3’末端添加A碱基使用Klenow Exo-5’-3’酶进行。所述在平末端的DNA的3’末端添加A碱基具体可在加A反应体系中37℃孵育1小时。所述加A反应体系的组成可为:1×NEB Buffer 2,0.2mM dATP,10g/L Trition X-100、1.0U/μl Klenow Exo-5’→3’(NEB公司,M0212L)和水。
所述S3中,用T4 DNA连接酶连接所述具有A碱基末端的DNA与BP Linker在连接体系中进行,所述连接体系中,所述BP-Linker的含量为0.8ng/μl,T4 DNA连接酶的含量为2U/μl。
所述S3中,所述连接体系可由0.8ng/μl所述BP-Linker、2U/μl T4 DNA连接酶、0.1mg/ml BSA、10g/L Trition X-100和1×T4 DNA连接酶缓冲液组成。
所述S3中,用T4 DNA连接酶连接所述具有A碱基末端的DNA与BP Linker可在25℃反应4h或者16℃反应8-10小时。
所述S4中,所述Tn5融合蛋白可为ProteinG-Tn5、ProteinA-Tn5或proteinAG-Tn5,所述ProteinG-Tn5是由proteinG和Tn5转座酶组成的融合蛋白;所述ProteinA-Tn5是由proteinA和Tn5转座酶组成的融合蛋白;所述ProteinAG-Tn5是由proteinA、proteinG和Tn5转座酶组成的融合蛋白。
所述S4中,从所述含有邻位连接DNA片段的目的细胞核中提取纯化DNA之前包括用蛋白酶K和SDS终止所述Tn5融合蛋白的切割反应并消化蛋白质的步骤。
所述S4中,从所述混合DNA中捕获所述邻位连接DNA片段包括用链霉亲和素修饰的固体富集所述邻位连接DNA片段。
所述链霉亲和素修饰的固体可为链霉亲和素磁珠(链霉亲和素修饰的磁珠)。
本发明还提供一种用于染色质和/或染色体构象捕获的试剂,上述试剂包括权任一上述的BP Linker和下述至少一种物质:上述Tn5融合蛋白、甲醛、细胞裂解液、产生平末端的限制性内切酶、Klenow Exo-5’→3’和链霉亲和素修饰的固体。
本发明还保护上述的BP Linker。
本发明还保护上述的BP Linker在染色质和/或染色体构象捕获中的应用,或用于染色质和/或染色体构象捕获的试剂在染色质和/或染色体构象捕获中的应用。
如图1所示,本发明的Hi-Tag染色质和/或染色体构象捕获方法,首先利用产生平末端的限制性内切酶切割染色质,然后在切割后的DNA末端加上A碱基,随后本发明创新性地使用了同时带有生物素和硫代修饰的桥式DNA linker(BP Linker)在T4 DNA连接酶的作用下连接邻位的DNA末端。特异性抗体标记目的蛋白后创新性的利用Tn5融合蛋白靶向富集目的蛋白质介导的DNA相互作用,随后利用生物素标记富集“DNA-标签-DNA”的目的片段,最后只需经过一步文库扩增即可得到测序文库。
本发明相较于传统的HiChIP、ChIA-PET以及PLAC-seq方法的优势在于:本发明不需要借助超声破碎仪等任何复杂仪器,常规实验器材器即可完成所有操作;本发明可以在10000-1000000个细胞中进行,对于细胞数量稀少的试验样品有着显著优势;本发明可以高效的捕获特定蛋白介导的DNA空间相互作用,并且通过Tn5融合蛋白可以直接获得测序样品使得实验周期大大缩短仅用1.5天即可获得待测序样本;本发明用相对较少的数据量即可获得与传统技术相等同的染色质空间结构图谱,大大节约了测序成本;本发明产出的数据信噪比相对于传统方法更高,借助于生物素和硫代双重修饰的BP Linker保证了Tn5在原位切割时不会对linker产生切割,因此大大提升了数据中有效数据比例。
附图说明
图1为构建Hi-Tag测序文库流程图。
图2为带有生物素和硫代修饰的桥式DNA linker。箭头示取代的原子。
图3为Agilent2100仪器检测限制内切酶AluI片段化基因组后的DNA片段分布。
图4为刀豆蛋白包被磁珠吸附的细胞核。
图5为Hi-Tag方法与HiC,HiChIP数据的相关性分析。
图6为可视化展示,HiChIP技术和Hi-Tag技术鉴定的GATA1基因位置的染色质相互作用图谱。
图7为Hi-Tag技术鉴定得到的loop anchor内部与随机区域(5kb)的CUT&Tag信号的富集情况(左侧线图);Hi-Tag技术鉴定得到的峰与CUT&Tag的重叠情况(右侧条形图)。
图8为Hi-Tag技术鉴定得到的峰与CUT&Tag的结果重叠部分以及不重叠部分可信度(Macs2 score)情况。
图9为以CUT&Tag峰为参考和以Hi-Tag的1D峰为参考鉴定得到的loop anchor覆盖组蛋白结合位点的情况。
图10为以CUT&Tag峰为参考和以Hi-Tag的1D峰为参考时,染色质相互作用距离分布。
图11为可视化展示,以CUT&Tag峰为参考和以Hi-Tag的1D峰为参考鉴定得到的与GATA1相关联的loop。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、Hi-Tag染色质和/或染色体构象捕获方法
下面以50万个K562细胞、以组蛋白H3K27ac作为目的蛋白为例阐明本发明的Hi-Tag染色质和/或染色体构象捕获的方法,该方法包括以下步骤:
S1、将目的细胞进行体外交联,使目的细胞内与DNA结合的蛋白固定,得到固定后的目的细胞,收集固定后的目的细胞并用裂解液裂解得到裂解物,从所述裂解物中获取目的细胞核。该步骤所需时间为1小时。具体如下:
S11、离心收集培养后的K562细胞,将50万个K562细胞重悬于30ml体积百分含量为1%的甲醛溶液(由溶质和溶剂组成,溶质为甲醛,溶剂为PBS)中25℃孵育5分钟,随后立即加入甘氨酸水溶液使反应体系中甘氨酸的浓度为0.125M,在25℃孵育10分钟终止交联反应,2500g,4℃离心5分钟收集固定后的目的细胞,并用4℃预冷的PBS清洗一遍,得到固定后的目的细胞。固定后的目的细胞可以立即进行实验也可以置于-80℃保存。上述PBS的组成为1mM KH2PO4,155mM NaCl,3mM Na2HPO4·7H2O,其余为水;所述PBS的pH为7.4。
S12、向固定后的目的细胞加入用冰预冷的细胞裂解液,在冰上反应15分钟对细胞进行裂解得到裂解物,按照如下步骤从裂解物中获取目的细胞核:将裂解物重悬于1ml含SDS的缓冲溶液(由5g/L SDS,1×rcutSmart缓冲液(NEB公司,货号为B6004S)和水组成)62℃孵育10分钟以松散染色质,随后立即加入200μL 10% TritionX-100水溶液25℃孵育5分钟再转至冰上孵育10分钟以中和体系中的SDS。离心收集目的细胞核,用1×rCutSamrt缓冲液和PBST(PBST是由溶质和溶剂组成的缓冲溶液,溶剂为上述PBS,溶质为Tween-20,PBST中Tween-20的含量为1g/L)各清洗一遍,得到目的细胞核。
其中,细胞裂解液的pH是8.0,是由溶质和溶剂组成的溶液,溶剂为水,溶质由Tris-HCl、NaCl、聚氧乙烯辛烷基苯酚醚和蛋白酶抑制剂组成。细胞裂解液中,Tris-HCl的含量为10mM,NaCl的含量为10mM、聚氧乙烯辛烷基苯酚醚的含量为2mL/L和蛋白酶抑制剂的含量为10g/L。其中,聚氧乙烯辛烷基苯酚醚为Igepal CA630(Beyotime公司产品编号为ST2045-500ml,CAS号为9002-93-1)。蛋白酶抑制剂为sigma公司,产品编号为11873580001的产品。
S2、利用限制性内切酶将所述目的细胞核中的DNA进行酶切,使得目的细胞核具有平末端的DNA,在平末端的DNA的3’末端添加A碱基,得到具有A碱基末端的DNA的目的细胞核。该步骤所需时间为5小时。具体如下:
S21、将目的细胞核重悬于1ml酶切体系中,37℃旋转孵育4小时,可以通过抽取少量样品提取DNA来检测限制性内切酶对基因组的切割是否充分,以AluI为例切割后的基因组片段应该在2kb左右。具体如下:将目的细胞核重悬于1ml酶切体系(酶切体系由1×rCutSamrt缓冲液、10g/L Trition X-100和1.0U/μl AluI组成)中,37℃旋转孵育4小时,切割后的基因组片段在2kb左右(如图3所示)。
S22、离心收集目的细胞核,用1×NEB Buffer 2(NEB公司,B0212L)清洗一遍,将目的细胞核重悬于250μl的加A反应体系中,37℃旋转孵育1小时,得到具有A碱基末端的DNA的目的细胞核。250μl加A反应体系的组成为:1×NEB Buffer 2,0.2mM dATP,10g/L TritionX-100、1.0U/μl Klenow Exo-5’→3’(NEB公司,M0212L)。
S3、用T4 DNA连接酶连接具有A碱基末端的DNA与BP Linker,得到含有邻位连接DNA的目的细胞核。该步骤所需时间为4小时。具体如下:
离心收集目的细胞核,用PBST和1×T4 DNA连接酶缓冲液(NEB公司,B0202L)各清洗一遍。将目的细胞核重悬于1ml连接体系中,16℃旋转孵育4小时,得到含有邻位连接DNA的目的细胞核。
其中,连接体系由0.8ng/μl BP-Linker、2U/μl T4 DNA连接酶(NEB公司,M0202L)、0.1mg/ml BSA、10g/L Trition X-100和1×T4 DNA ligase缓冲液组成。
其中,BP-Linker的结构如图2所示,BP Linker是3’末端具有突出核苷酸T的粘性末端的双链DNA,BP Linker的一条链的核苷酸序列为5`
-CGCGATATCTTATCTGACT-3`(序列1),另一条链的核苷酸序列为5`
-GTCAGATAAGATATCGCGT-3`(序列2),序列1的第10位的脱氧胸苷酸T(dT)被生物素修饰。BP Linker的两条链的每条链的两个核苷酸之间的3`,5`-磷酸二酯键(图2中下图左图箭头所示)均被替换为3`,5`-硫代磷酸二酯键(图2中下图右图箭头所示,硫原子取代了磷酸二酯键中的一个氧原子)。
S4、捕获所述含有邻位连接DNA的目的细胞核,使抗目的蛋白的特异性抗体与所述含有邻位连接DNA的目的细胞核进行反应,得到结合一抗的目的细胞核,使所述结合一抗的目的细胞核与抗所述特异性抗体的二抗结合,得到结合一抗二抗的目的细胞核,使所述结合一抗二抗的目的细胞核与Tn5融合蛋白进行反应,得到原位标签化目的细胞核,所述原位标签化目的细胞核为结合所述Tn5融合蛋白的细胞核,用镁离子激活所述原位标签化目的细胞核中的所述Tn5融合蛋白,使与所述目的蛋白结合的邻位连接DNA被片段化,得到含有邻位连接DNA片段的目的细胞核,从所述含有邻位连接DNA片段的目的细胞核中提取纯化DNA,得到含有邻位连接DNA片段的混合DNA,从所述混合DNA中捕获所述邻位连接DNA片段,得到所述邻位连接DNA片段。该步骤所需时间为7小时。具体如下:
S41、捕获所述含有邻位连接DNA的目的细胞核,具体操作如下:离心收集目的细胞核,用清洗缓冲液清洗一遍,然后用500μl清洗缓冲液重悬转移至新的1.5ml低吸付EP管中,将50μl的ConA beads液加入其中轻柔吹打混匀,25℃孵育10分钟,让ConA beads充分与细胞核结合(这一步可以取出部分样品置于显微镜观察,正常情况下会有98%以上的细胞核被beads捕获,如图4所示),捕获含有邻位连接DNA的目的细胞核。
其中,清洗缓冲液由pH 7.5,0.02M HEPES缓冲液、0.15M NaCl、0.5mM Spermidine(亚精胺)和1×蛋白酶抑制剂(sigma公司,11873580001)组成。
ConA beads液的制备方法如下:将50ul的ConA beads(BioMap公司,BP531)(刀豆蛋白A(ConA)包被的磁珠)放置25℃平衡30分钟,混匀后取出50μl并加入500μl结合缓冲液吹打混匀后置于磁力架上静置2分钟,移除上清后重复操作一次,加入50μl结合缓冲液重悬备用,得到ConA beads液。结合缓冲液是由HEPES(pH 7.5,0.02M)、KCl(0.01M)、NaCl(0.01M)和MnCl2(0.01M)组成的缓冲溶液。
S42、使抗目的蛋白的特异性抗体与含有邻位连接DNA的目的细胞核进行反应,得到结合一抗的目的细胞核。具体操作如下:将EP管置于磁力架上静置2分钟,移除上清,用500μl预混了特异性抗体的抗体缓冲液(抗体的稀释比例可以参考抗体说明书中免疫荧光的稀释比例,本次稀释比例为1:100)重悬,置于25℃旋转孵育1小时,得到结合一抗的目的细胞核。
其中,预混了特异性抗体的抗体缓冲液的组成为:20mM HEPES pH 7.5,150mMNaCl,12.5μL 0.5mM spermidine,0.05% Digitonin,2mM EDTA、0.1% BSA和2μg/100μL抗H3K27ac(abcam,ab4729)。
S43、使结合一抗的目的细胞核与抗特异性抗体的二抗结合,得到结合一抗二抗的目的细胞核。具体操作如下:将EP管置于磁力架上静置2分钟,移除上清后用500μl预混了二抗的Dig-wash buffer重悬,置于25℃旋转孵育1小时,得到结合一抗二抗的目的细胞核。
其中,Dig-wash buffer的组成为:pH 7.5,0.02M HEPES缓冲液、0.15M NaCl
、0.5mM Spermidine(亚精胺)、0.5g/L Digitonin(洋地黄皂苷)和1×蛋白酶抑制剂(sigma公司,11873580001)。预混了二抗的Dig-wash buffer是由山羊抗兔IgG H&L(abcam,ab6702)和Dig-wash buffer组成的液体,预混了二抗的Dig-wash buffer中,山羊抗兔IgG H&L的含量为0.02μg/μL。
S44、使结合一抗二抗的目的细胞核与Tn5融合蛋白进行反应,得到原位标签化目的细胞核。具体操作如下:将EP管置于磁力架上静置2分钟,移除上清后1ml Dig-washbuffer清洗三遍。用500μl预混了终浓度为0.8μM ProteinG/A-Tn5融合蛋白(诺唯赞TD901)的Dig-300buffer重悬,室温旋转孵育1小时,得到原位标签化目的细胞核。
其中,Dig-300buffer的组成为:pH 7.5,0.02M HEPES缓冲液、0.3M NaCl、0.5mMSpermidine(亚精胺)、0.1g/L Digitonin(洋地黄皂苷)、0.8μM ProteinG/A-Tn5融合蛋白和1×蛋白酶抑制剂(sigma公司,11873580001)。
S45、用镁离子激活原位标签化目的细胞核中的Tn5融合蛋白,使与目的蛋白结合的邻位连接DNA被片段化,得到含有邻位连接DNA片段的目的细胞核。具体操作如下:将EP管置于磁力架上静置2分钟,移除上清后1ml Dig-300buffer清洗三遍。用500μlTagmentation buffer重悬后置于37℃恒温箱旋转孵育1小时,得到含有邻位连接DNA片段的目的细胞核。
其中,Tagmentation buffer的组成为20mM HEPES pH 7.5,300mM NaCl,12.5μMspermidine,0.01% Digitonin和0.1mM MgCl2组成。
S46、从含有邻位连接DNA片段的目的细胞核中提取纯化DNA,得到含有邻位连接DNA片段的混合DNA。具体操作如下:加入10μl 100g/L SDS溶液和10μl蛋白酶K溶液55℃孵育30分钟以终止转座酶反应的同时对蛋白质进行消化。在反应结束后加入等体积的苯酚-氯仿-异戊溶液(苯酚:氯仿:异戊醇=25:24:1),剧烈颠倒混匀后15000rpm室温离心5分钟,将上清转移到新的1.5ML EP管。依次加入50μl 3M醋酸钠溶液、2μl 10mg/ml Glycogen(糖原)溶液、550μl预冷的异丙醇溶液,上下颠倒混匀后置于-20℃沉淀1小时。15000rpm 4℃离心30分钟,去除上清,用1ml75%乙醇(现配现用)溶液清洗沉淀,15000rpm 4℃离心5分钟,尽可能移除全部上清,将沉淀置于超净台晾干至透明,加入200μl无核酸酶水溶解沉淀,置于冰上备用,得到含有邻位连接DNA片段的混合DNA溶液。
S47、从所述混合DNA中捕获所述邻位连接DNA片段,得到所述邻位连接DNA片段。具体操作如下:取30μl M-280Streptavidin磁珠(链霉亲和素磁珠)(ThermoFisher公司,11205D)置于磁力架上静置2分钟弃去液体后加入200μl Binding Buffer(由10mM Tris-HCl pH7.5、1mM EDTA和2M NaCl组成)重悬,25℃旋转孵育5分钟。弃去Binding buffer后用200μl Wash Buffer(由5mM Tris-HCl pH7.5、0.5mM EDTA、和1M NaCl组成)清洗链霉亲和素磁珠两遍,将S46中的含有邻位连接DNA片段的混合DNA溶液与等体积的Binding Buffer混匀重悬清洗后的链霉亲和素磁珠,25℃旋转孵育30分钟以富集被生物素标记的目的片段(邻位连接DNA片段)。将反应体系置于磁力架上静置2分钟后弃去所有液体,用500μl 0.5%SDS/2×SSC buffer(ThermoFisher,15557044)清洗三遍、200μl Wash buffer清洗一遍。清洗后的磁珠用30μl无核酸酶水重悬置于冰上备用,得到固定有邻位连接DNA片段的磁珠。
S5、对所述邻位连接DNA片段进行测序分析,确定与所述目的蛋白结合的邻位连接DNA。具体方法如下:
S51、取10μl S47的固定有邻位连接DNA片段的磁珠加入扩增体系中,PCR循环数目控制在15个以内。
引物序列如下:
P5 PCR Primer for Illumina:
5’-AATGATACGGCGACCACCGAGATCTACACNNNNNNNNTCGTCGGCAGCGTC-3’,
P7 PCR Primer for Illumina:
5’-CAAGCAGAAGACGGCATACGAGATNNNNNNNNGTCTCGGGGCTCGG-3’,N为N为A、T、C或G;8个N为index。
1)将AMPure XP beads平衡至室温,扩增完成后的PCR体系中转入低吸附的1.5mlEP管中并加入1.5倍体积的AMPure XP beads涡旋混匀后室温孵育10分钟。将EP管置于磁力架上静置5分钟,待液体澄清后移除全部液体,保持EP管在磁力架上不动加入500μl新配置的80%乙醇溶液孵育1分钟后移除(重复操作一次),移除全部液体后让beads自然晾干,待beads表面无反光加入30μl无核酸酶洗脱DNA。用Qubit 3.0荧光定量仪对洗脱后的DNA溶液进行浓度测定。根据测序要求决定剩余20μl磁珠的扩增循环数目。
2)应二代测序要求,利用AMPure XP beads对最终测序文库进行200-1000bp的片段筛选。首先在DNA溶液中加入0.6倍体积的AMPure XP beads涡旋混匀后室温孵育10分钟,随后将反应体系置于磁力架上静置5分钟,待液体澄清后将上清转移至新的1.5ML EP管中并加入初始体积0.15倍的AMPure XP beads涡旋混匀后室温孵育10分钟,后续清洗和DNA洗脱步骤和S47中一致。在上机测序前对文库进行有效片段比例预估,取少量文库加入限制性核酸内切酶EcoRV,由于linker序列中存在该酶切位点,被linker连接的DNA被切成两端,片段分布会发生明显改变。得到测序原始数据。
S52、Hi-Tag数据分析
1Hi-Tag数据分析流程
1.1adapter以及linker的过滤
将S51得到的测序原始数据进行质控,去除低质量的测序读段。随后针对单个样本,利用P5、P7及10X条形码序列,获得细胞对应的barcode。之后,使用trim_galore将adapter去除,具体的命令是trim_galore-q 20--phred33--paired--Nextera--trim-n--gzip${reads[0]}${reads[1]},之后使用trimLinker命令(ChIA-PET2)将原始序列和linker进行比对,具体的命令是trimLinker-e 2-t 12-m 1-k 1-l16-o$RESULTS-n$SAMPLE-A ACGCGATATCTTATC-B AGTCAGATAAGATAT,提取出linker两侧的序列,以下称为PETs(Pair-End-Tags)。双端序列中至少有一端包含linker,则去除linker,并保留5’端到linker开始的位置的序列。使用非嵌合PETs(筛分的linker两端的DNA序列)进行下一步分析。
1.2序列比对
使用BWA软件对上一步得到的PETs比对到GRCh38参考基因组上,所使用的参数是bwa mem-SP5M,具体的命令是bwa mem-SP5M-t 20${params.bwa_index_prefix}${reads[0]}${reads[1]}>${sample_id}_mem.sam,进一步得到比对之后的结果bam 文件。
1.3 数据后处理
首先将上一步比对得到的PETs比对结果解析为交互对,以下称为交互对(pairs)。由于实验中的PCR扩增步骤,pairs中存在信息冗余,在分析的过程中需要将其去除。随后,为了过滤数据中存在的噪声(多比对,单端比对等),结合酶切位点信息对上一步比对得到的bam文件进行解析和分类。保留有效且唯一的比对(“unique-unique(UU)”pairs)且MAPQ值大于30的交互序列,输出得到一个符合4D Nucleome(4DN)联盟的.pairs文件用于后续分析。以上步骤使用pairtools工具完成,解析具体的命令是pairtools parse-c$GENOME_SZ-o$RESULTS/${SAMPLE}.pairs.gz
--drop-sam$RESULTS/${SAMPLE}.sam。选取UU pairs的具体命令是pairtoolsselect'(pair_type=="UU")'-o$RESULTS/${SAMPLE}.sorted.dedup.UU.pairs.gz$RESULTS/${SAMPLE}.sorted.dedup.pairs.gz。输出的交互对.pairs文件为标准格式,包含了readID信息,互作的位置信息,正负链信息等。
1.4鉴定显著互作
上一步得到的pairs的分布可能会受到酶切位点以及目标蛋白结合区域分布的影响,会导致互作区域的鉴定存在偏差。借助FitHiChIP软件并采用FitHiChIP(L)和FitHiChIP(L+M)的覆盖率偏差回归对其进行校正并鉴定显著互作,具体的命令是bashFitHiChIP_HiCPro.sh-C configfile_BiasCorrection_CoverageBias.txt。显著系数设置为默认值(FDRThr:FDR threshold for FitHiChIP loop significance(default=0.01))。该软件鉴定得到的loop两端至少一端富集了与CUT&Tag(ChIP-seq)峰的互作区域,因而得到的loop更为准确可靠,降低了假阳性。
2通过Hi-Tag技术对K562细胞系进行交互捕获
2.1K562细胞系Hi-Tag数据结果统计
通过对Hi-Tag数据进行随机下采样得到的不同数量级数据进行分析,发现含有linker的有效reads数占原始数据总reads数的82%。唯一比对的有效数据约占原始数据的30%,顺式互作(cis互作)比例约为74%,反式互作(trans互作)比例约为25%(表1)。鉴定得到的loop的数量随原始数据的数量增加而增多。
表1.K562细胞系Hi-Tag数据结果统计
3和现有的HiChIP技术进行比较
在K562细胞系中,即使使用较低的细胞量和测序深度,Hi-Tag也能获得与HiC以及HiChIP数据极为相似的染色质相互作用图谱(如图5所示)。其中一个例子是与K562细胞系的标记基因GATA1关联的loop(如图6所示)。
通过比较loop anchor内部和随机5kb区域的CUT&Tag富集信号发现,loop anchor内部的信号远高于随机区域(如图7所示)。并且,Hi-Tag鉴定得到的峰接近有90%与CUT&Tag的峰值重叠,并且重叠峰的可信度远高于不重叠的部分(如图8和9所示)。因此,使用Hi-Tag的数据能获得和CUT&Tag或者ChIP-seq类似的全基因组蛋白质结合位点。
另外,Hi-Tag数据在不考虑交互的情况下,可以视为与ChIP-seq类似的一维数据,并以此鉴定峰。通过对比发现,Hi-Tag技术在不同数量级的数据中均能够表现稳定。使用自身数据鉴定的峰作为参考的情况下,能够得到较为准确的互作对。并且,loop anchor的特征与使用CUT&Tag峰作为参考的结果相似。90%以上的loop anchor两端都存在峰(如图10所示),同时loop的距离分布也极为相似(如图10所示)。使用可视化工具也能够找到上述GATA1例子中类似的交互模式(如图11所示)。综上所述Hi-Tag可以同时产出全基因组范围内的特定蛋白结合位点图谱与染色质相互作用图谱。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
Claims (10)
1.染色质和/或染色体构象捕获的方法,其特征在于:所述方法包括以下步骤:
S1、将目的细胞进行体外交联,使目的细胞内与DNA结合的蛋白固定,得到固定后的目的细胞,收集固定后的目的细胞并用细胞裂解液裂解得到裂解物,从所述裂解物中获取目的细胞核;
S2、利用限制性内切酶将所述目的细胞核中的DNA进行酶切,使得目的细胞核具有平末端的DNA,在平末端的DNA的3’末端添加A碱基,得到具有A碱基末端的DNA的目的细胞核;
S3、用T4 DNA连接酶连接具有A碱基末端的DNA与BP Linker,得到含有邻位连接DNA的目的细胞核;
所述BP Linker是3’末端具有突出核苷酸T的粘性末端的双链DNA,所述BP Linker的一条链的核苷酸序列为序列表中的序列1,另一条链的核苷酸序列为序列表中的序列2,序列1的第10位的脱氧胸苷酸T被生物素修饰,所述BP Linker的两条链的每条链的两个核苷酸之间的3`,5`-磷酸二酯键均被替换为3`,5`-硫代磷酸二酯键;
S4、捕获所述含有邻位连接DNA的目的细胞核,使抗目的蛋白的特异性抗体与所述含有邻位连接DNA的目的细胞核进行反应,得到结合一抗的目的细胞核,使所述结合一抗的目的细胞核与抗所述特异性抗体的二抗结合,得到结合一抗二抗的目的细胞核,使所述结合一抗二抗的目的细胞核与Tn5融合蛋白进行反应,得到原位标签化目的细胞核,所述原位标签化目的细胞核为结合所述Tn5融合蛋白的细胞核,用镁离子激活所述原位标签化目的细胞核中的所述Tn5融合蛋白,使与所述目的蛋白结合的邻位连接DNA被片段化,得到含有邻位连接DNA片段的目的细胞核,从所述含有邻位连接DNA片段的目的细胞核中提取纯化DNA,得到含有邻位连接DNA片段的混合DNA,从所述混合DNA中捕获所述邻位连接DNA片段,得到所述邻位连接DNA片段;
S5、对所述邻位连接DNA片段进行测序分析,确定与所述目的蛋白结合的邻位连接DNA。
2.根据权利要求1所述的方法,其特征在于:所述S3中用T4 DNA连接酶连接所述具有A碱基末端的DNA与BP Linker在连接体系中进行,所述连接体系中,所述BP-Linker的含量为0.8ng/μl,T4 DNA连接酶的含量为2U/μl。
3.根据权利要求1或2所述的方法,其特征在于:所述S1中,所述体外交联采用甲醛进行。
4.根据权利要求1-3中任一所述的方法,其特征在于:所述S1中,从所述裂解物中获取目的细胞核包括将所述裂解物加入含SDS的缓冲溶液在62℃孵育松散染色质后再加入Triton X-100中和SDS,所述含SDS的缓冲溶液中SDS的含量为3-5g/L。
5.根据权利要求1-4中任一所述的方法,其特征在于:所述S4中,从所述含有邻位连接DNA片段的目的细胞核中提取纯化DNA之前包括用蛋白酶K和SDS终止所述Tn5融合蛋白的切割反应并消化蛋白质的步骤。
6.根据权利要求1-5中任一所述的方法,其特征在于:所述S4中,从所述混合DNA中捕获所述邻位连接DNA片段包括用链霉亲和素修饰的固体富集所述邻位连接DNA片段。
7.根据权利要求1-6中任一所述的方法,其特征在于所述方法不包括超声破碎的步骤。
8.用于染色质和/或染色体构象捕获的试剂,其特征在于:所述试剂包括权利要求1中所述的BP Linker和下述至少一种物质:权利要求1中所述的Tn5融合蛋白、甲醛、细胞裂解液、产生平末端的限制性内切酶、Klenow Exo-5’→3’和链霉亲和素修饰的固体。
9.权利要求1中所述的BP Linker。
10.权利要求9所述的BP Linker在染色质和/或染色体构象捕获中的应用,或权利要求8所述的试剂在染色质和/或染色体构象捕获中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310145150.0A CN116004768A (zh) | 2023-02-21 | 2023-02-21 | 染色质和/或染色体构象捕获方法及其所用试剂 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310145150.0A CN116004768A (zh) | 2023-02-21 | 2023-02-21 | 染色质和/或染色体构象捕获方法及其所用试剂 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116004768A true CN116004768A (zh) | 2023-04-25 |
Family
ID=86027163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310145150.0A Pending CN116004768A (zh) | 2023-02-21 | 2023-02-21 | 染色质和/或染色体构象捕获方法及其所用试剂 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116004768A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116200367A (zh) * | 2023-04-28 | 2023-06-02 | 南京诺唯赞生物科技股份有限公司 | 一种组合物及研究蛋白质-dna互作基因文库的构建方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101015703A (zh) * | 2007-01-30 | 2007-08-15 | 北京大学第一医院 | 一种反义显像剂及其反义寡核苷酸 |
US20170314014A1 (en) * | 2015-10-19 | 2017-11-02 | Dovetail Genomics, Llc | Methods for Genome Assembly, Haplotype Phasing, and Target Independent Nucleic Acid Detection |
US20180340939A1 (en) * | 2015-10-28 | 2018-11-29 | The Broad Institute, Inc. | Multiplex analysis of single cell constituents |
WO2020041148A1 (en) * | 2018-08-20 | 2020-02-27 | 10X Genomics, Inc. | Methods and systems for detection of protein-dna interactions using proximity ligation |
CN113466444A (zh) * | 2021-06-18 | 2021-10-01 | 中山大学 | 一种染色质构象捕获方法 |
-
2023
- 2023-02-21 CN CN202310145150.0A patent/CN116004768A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101015703A (zh) * | 2007-01-30 | 2007-08-15 | 北京大学第一医院 | 一种反义显像剂及其反义寡核苷酸 |
US20170314014A1 (en) * | 2015-10-19 | 2017-11-02 | Dovetail Genomics, Llc | Methods for Genome Assembly, Haplotype Phasing, and Target Independent Nucleic Acid Detection |
US20180340939A1 (en) * | 2015-10-28 | 2018-11-29 | The Broad Institute, Inc. | Multiplex analysis of single cell constituents |
WO2020041148A1 (en) * | 2018-08-20 | 2020-02-27 | 10X Genomics, Inc. | Methods and systems for detection of protein-dna interactions using proximity ligation |
CN113466444A (zh) * | 2021-06-18 | 2021-10-01 | 中山大学 | 一种染色质构象捕获方法 |
Non-Patent Citations (2)
Title |
---|
XIAOLONG QI等: "Hi-Tag: a simple and efficient method for identifying protein-mediated long-range chromatin interactions with low cell numbers", 《SCIENCE CHINA LIFE SCIENCES》, vol. 67, no. 5, 23 January 2024 (2024-01-23), pages 1027 - 1034 * |
费嘉: "《小核酸药物开发技术》", 31 August 2011, 军事医学科学出版社, pages: 153 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116200367A (zh) * | 2023-04-28 | 2023-06-02 | 南京诺唯赞生物科技股份有限公司 | 一种组合物及研究蛋白质-dna互作基因文库的构建方法 |
CN116200367B (zh) * | 2023-04-28 | 2023-08-08 | 南京诺唯赞生物科技股份有限公司 | 一种组合物及研究蛋白质-dna互作基因文库的构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7553947B2 (en) | Method for gene identification signature (GIS) analysis | |
EP1250463B1 (en) | Sensitive, multiplexed diagnostic assays for protein analysis | |
AU2014405969B2 (en) | Method for constructing nucleic acid single-stranded cyclic library and reagents thereof | |
US8574832B2 (en) | Methods for preparing sequencing libraries | |
US8071296B2 (en) | Nucleic acid interaction analysis | |
JP3251291B2 (ja) | ヌクレオチド配列集団の分類方法 | |
CN112553695B (zh) | 鉴定靶蛋白染色质结合图谱的快速建库方法 | |
EP3885448B1 (en) | Analysis of chromatin using a nicking enzyme | |
CN113466444B (zh) | 一种染色质构象捕获方法 | |
JP7140754B2 (ja) | クロマチン相互作用のゲノムワイドな同定 | |
CN108220394A (zh) | 基因调控性染色质相互作用的鉴定方法、系统及其应用 | |
CN116004768A (zh) | 染色质和/或染色体构象捕获方法及其所用试剂 | |
WO2019153851A1 (zh) | 一种融合蛋白、试剂盒以及CHIP-seq检测方法 | |
CN114544925A (zh) | 一种利用CUT&Tag技术鉴定植物中转录因子与染色质互作的试剂盒及方法 | |
CN109750086B (zh) | 单链环状文库的构建方法 | |
CN113005145B (zh) | 不依赖于特异性抗体的捕获tf在全基因组上结合位点的方法 | |
CN113528612B (zh) | 用于检测染色质开放位点间染色质相互作用的NicE-C技术 | |
GB2412170A (en) | A method for enriching for target nucleic acids in a sample | |
CN115197997A (zh) | 一种应用于植物花粉的CUT&Tag方法 | |
CN111440843A (zh) | 一种利用微量临床穿刺样本进行染色质免疫共沉淀文库制备的方法及其应用 | |
Powell | The Serial Analysis of Gene Expression | |
CN110904212B (zh) | 性发育异常相关基因捕获试剂盒及其应用 | |
CN104774923B (zh) | 一种测定转录调控复合体的方法 | |
JP2008263961A (ja) | Dnaメチル化測定方法 | |
Yi et al. | RIPiT-Seq: A tandem immunoprecipitation approach to reveal global binding landscape of multisubunit ribonucleoproteins |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |