CN110997931A

CN110997931A - 单核和单分子染色质相互作用测定

Info

Publication number: CN110997931A
Application number: CN201880053100.7A
Authority: CN
Inventors: 阮一骏; 郑梅珍; E·皮库克
Original assignee: Jackson Laboratory
Current assignee: Jackson Laboratory
Priority date: 2017-06-16
Filing date: 2018-06-18
Publication date: 2020-04-10
Also published as: KR20200018651A; SG11201912142TA; AU2018285916A1; JP2020523993A; WO2018232396A1; US20200123590A1; EP3638811A1; CA3067549A1; SG10201913337UA

Abstract

本发明提供了一种基于单分子蛋白质检测和DNA测序平台在单分子和单核单分子水平上用于下一代染色质相互作用测定的方法。本发明具有单核中的单分子分辨率和消除近端连接和PCR扩增步骤的优点。本发明在3D基因组的组织及其调节方面提供了革命性的生物学见解。

Description

单核和单分子染色质相互作用测定

相关申请的交叉引用

本申请要求2017年6月16日提交的美国临时申请号62/520,665的优先权，其全部内容通过引用并入本文。

技术领域

本公开总体上涉及三维(3D)基因组组织映射(organizational mapping)和染色质相互作用的领域。本公开具有在固相上的单分子分辨率和单核分辨率，和消除近端连接和PCR扩增步骤，避免技术噪音的优点。具体地，本公开提供了一组染色质相互作用测定，其可以检测单染色质复合物中和单核中超过两个基因座之间的相互作用。该方法是基于单分子蛋白质检测和商用平台DNA测序。本公开的染色质相互作用测定在3D基因组组织及其调节方面提供了革命性的生物学见解。

背景技术

人类基因组被广泛折叠成3D蛋白质介导的染色质环，这为基因组功能(包括转录调节)提供了拓扑基础。3D基因组组织的当前知识主要基于来自数百万个细胞的染色质分子的群体水平研究，因此当前视角是许多个体细胞的平均值。尽管这样的观察已揭示了3D基因组组织的原理，但它们未能提供人类基因组如何在个体染色质复合物和个体核中的分子水平折叠的精确视图，从而掩盖了重要的分子动力学和细胞至细胞异质性。例如，先前报道的通过成对末端标记(ChIA-PET)数据进行染色质相互作用测定揭示了多个基因启动子和增强子可以结合在一起以形成复杂的染色质环，启示基因共调控的拓扑机制(Li,G.等Cell(2012)148(1-2):84-98,PMJX>:22265404)；Tang,Z.等Cell(2015)163(7):1611-1627,PMID:26686651)。然而，尚不清楚个体核是否包含这样的多重染色质环或者个体环是否在核之间不同地发生并在整个细胞分析中共同显示为联合成环复合物。这是因为ChIA-PET和其他常用的确定染色质相互作用的技术Hi-C所基于的近端连接和成对末端标签测序只可揭示两个基因座之间的成对染色质相互作用，而不是涉及超过两个基因座的联系关系。

对于广泛的基因组结构随机性和转录异质性在表型相同的细胞中的存在的越来越多的证据进一步使我们对更高层次的基因组组织和功能的解释混乱。

实际上，在开发单细胞3D基因组映射技术方面已经做出了积极的努力，例如单细胞Hi-C(Nagano,T.,等,Nature(2013)502(7469):59-64,PMID:24067610)。然而，当前基于单细胞分离或个体细胞条形码化的策略继续以依赖于用于DNA操纵的常规分子方法，包括近端连接、DNA扩增和测序文库制备。这样的策略不太可能打破当前对单细胞中染色质相互作用的真正单分子分析的技术障碍。新的技术是迫切需要的。特别需要的是能够识别超过两个基因座之间的相互作用，提供来自单染色质复合物(单分子)的数据，提供来自单核的染色质复合物的单分子数据，并将该数据映射以提供整个基因组中染色质相互作用的视图的染色质相互作用测定。

发明内容

本公开提供了一种用于检查单染色质复合物中的染色质相互作用的新技术，包括超过两个染色质基因座之间的相互作用，然后使用来自单染色质复合物的数据以生成染色质相互作用的全基因组地图。本公开提供了一种称为单分子染色质相互作用分析(smChIA)的测定，其可以方便地利用用于单分子蛋白质检测和DNA测序的商业平台。SEQ LL是这样的平台的一个实例。

在一个方面，本发明提供了用于单分子染色质相互作用分析的新型顺序测序方法。具体地，smChIA包括将染色质材料固定到流动池表面上用于单分子蛋白质检测，并对通过每个染色质复合物中的蛋白质束缚在一起的DNA片段进行直接顺序单分子测序。值得注意的是，顺序测序在没有染色质近端连接或DNA扩增的情况下完成。

本公开提供了一种用于确定多个蛋白质和RNA因子在每个基因座处的共定位的方法。因此，smChIA具有改变染色质相互作用分析和3D基因组生物学的领域的潜力。

本公开提供了smChIA，一种在单分子水平上确定染色质相互作用的方法。SmChIA包括以下步骤：

a)交联细胞中的基因组DNA和蛋白质；

b)使所交联的基因组DNA片段化以提供染色质复合物，所述染色质复合物包含DNA和一种或多种特定蛋白质；

c)将两个或更多个不同的条形码化接头连接至所述染色质复合物中的所述DNA以形成条形码化染色质复合物；

d)将所述条形码化染色质复合物固定到表面上；

e)使用TIRF显微镜在单分子水平上对所述条形码化染色质复合物成像；

f)在单分子水平上对所述条形码化染色质复合物中的所述DNA进行顺序地测序以产生多个序列读取结果；和

g)将所述多个序列读取结果映射至参比基因组以产生所述测序读取结果的基因组位置以产生3D基因组联系图，

其中所述联系图指示所述染色质复合物中存在的所述基因组DNA和蛋白质在单分子水平上的物理相互作用。

在将条形码化染色质复合物固定到表面上之前，条形码化染色质复合物可以通过能够结合条形码化染色质复合物中的特定蛋白质的第一抗体而免疫沉淀，从而富集所述染色质复合物用于smChIA分析。

成像步骤e)可包括用能够结合条形码化染色质复合物中的特定蛋白质的第二抗体对条形码化染色质复合物进行免疫染色。在成像步骤之后，smChIA方法可包括通过用针对染色质复合物中存在的特定蛋白质的荧光标记抗体进行免疫染色而顺序地检测特定蛋白质。smChIA方法还可包括从染色质复合物中去除蛋白质组分，并保留固定在表面上的染色质复合物的DNA模板。

本公开还提供了一种确定单核中的染色质相互作用的方法，所述方法包括以下步骤：

a)提供单核，所述核包含基因组DNA和蛋白质；

b)交联所述核中的基因组DNA和蛋白质；

c)使所交联的基因组DNA原位片段化以提供多个染色质复合物，每个染色质复合物包含基因组DNA和一种或多种特定蛋白质；

d)将两个或更多个不同的条形码化接头连接至所述染色质复合物中的所述DNA以形成条形码化染色质复合物；

e)将所述单核固定到表面上；

f)裂解所述单核使得所述核中含有的所述条形码化染色质复合物分散在所述表面上；

g)用能够结合所述条形码化染色质复合物中存在的蛋白质的抗体对所述条形码化染色质复合物进行免疫染色；

h)使用TIRF显微镜对所免疫染色的条形码化染色质复合物成像；

i)重复g)和h)以连续监测两种或更多种抗体；

j)在单分子水平上对所述条形码化染色质复合物进行顺序地测序以产生多个序列读取结果；和

1)将所述多个序列读取结果映射至参比基因组以产生所述测序读取结果的基因组位置以产生3D基因组联系图；

其中所述联系图指示所述染色质复合物中的基因组DNA和蛋白质在单分子水平上的物理相互作用。在某些实施方式中，可以重复本方法中的步骤g)和h)用于采用两种或更多种抗体的顺序检测。

当根据附图和权利要求书阅读时，根据优选的实施方式的以下详细描述，本公开的各种目的和优点对于本领域技术人员将变得明显。

附图说明

图1是smChIA方法的示意图。

图1A描绘了染色质复合物制备的过程。

图1B显示了染色质复合物加载到流动池表面上。

图1C描述了使用全内反射荧光(TIRF)显微镜用于单分子蛋白质检测和DNA测序的SEQ LL平台。

图1D描述了与连接在每个染色质复合物中的不同条形码化接头连接的DNA片段是簇集在直径约400nm的分散点中(TIRF的光学分辨率极限)用于顺序引物测序。

图2说明了出于smChIA的目的获得染色质复合物所需的步骤。

图3描绘了染色质复合物加载到流动池以及个体染色质复合物的顺序测序所需的关键步骤。

图4A描绘了通过单分子测序从两次测试smChIP实验获得的smChIP测序的读取结果长度分布。两个数据集的峰值读取结果长度为28-29bp。

图4B描绘了smChIP读取结果至果蝇参比基因(dm3)的映射。显示了示例基因组区域。上面的两个图是来自两个smChIP实验的smChIP读取结果的映射比对，其显示了由ChIA-PET(下面两个图)识别的涉及染色质相互作用的RNAPII结合峰。

图5A描绘了来自SEQ LL仪器的smChIA测序的快照图。每个点代表流动池上的光学点，在那里对于测序过程中的每个核苷酸添加，捕获荧光信号。每个点可包含由不同引物顺序地测序的多个DNA片段，每个引物与不同的条形码化接头互补。

图5B描绘了通过两个引物进行的连续测序运行的荧光信号点。显示了接头的特定核苷酸指数。

图5C描绘了特定smChIA测序读取结果、其核苷酸组成、其在参比基因中的映射比对、和对应的ChIA-PET数据的实例。

图6描述了用于smChIA方法中的条形码化生物素化接头和测序引物。每个接头的6bp随机条形码化区域出现在生物素化DNA寡核苷酸的5'末端。与染色质复合物的基因组DNA中含有的"A尾"互补，促进接头连接的"T"核苷酸突出端是以粗体突出显示。在生物素化接头上方显示了每个条形码化接头的相应测序引物。末端3'连接的生物素显示为"/3Bio"，任选末端连接的ALEXA FLUOR 647荧光团显示为"/iThioMC6D//NAlexa647-5"。寡核苷酸被设计为包含尿嘧啶核苷酸(U)，其允许特定的USER消化。寡核苷酸被设计使得寡核苷酸的非模板链的每5个核苷酸包含U碱基。该设计允许显式去除非模板链的一部分，促进引物退火并允许顺序测序。条形码化接头在权利要求中由SEQ ID编号表示。SmChIA接头1是SEQ IDNO:1；SmChIA接头2是SEQ ID NO:2；SmChIA接头3是SEQ ID NO:3；SmChIA接头4是SEQ IDNO:4；SmChIA接头5是SEQ ID NO:5；SmChIA接头6是SEQ ID NO:6；SmChIA接头7是SEQ IDNO:7；SmChIA接头8是SEQ ID NO:8。

图7显示了smChIA方法的框图。

图8显示了将smChIA应用于单核所需的步骤。简而言之，将细胞交联并除去其细胞膜。核保持完整，并透化核膜以便允许限制性酶消化，末端修复，加A尾，和接头连接在原位进行。然后将完整的核分散在链霉抗生物素蛋白涂覆的流动池上，允许杂交，并记录它们在流动池表面上的独特二维位置。然后将核溶解在载玻片上，允许染色质复合物分散得相距足够远，以被观察为是离散复合物(＞400nm)，同时保持相对接近流动池上的核的原始位置。重要地，来自特定核的染色质复合物保持彼此紧密成组，允许来自一个核的内容物与另一个核的内容物区分开。

图9提供了应用于单核(单核smChIA)的smChIA的示例图。

图9A显示了在完整核内进行的成功的原位接头连接，在限制性酶消化、末端修复和加A尾步骤进行后，将ALEXA 647荧光团标记的生物素化接头应用于全基因组。

图9B标记有ALEXA 647荧光团和生物素化接头的染色质复合物在链霉抗生物素蛋白涂覆的流动池上被分辨并彼此区分。

图9C包含ALEXA 647荧光团标记的生物素化接头和RNAPII(或任何其他感兴趣的转录因子，通过抗体染色识别的)的染色质复合物通过TIRF显微镜识别并与独特单核区分。

具体实施方式

通过以下实施方式的描述结合附图，可以更好地理解本公开。对于本领域技术人员应当明显的是，所描述的实施方式仅仅是说明性的而不是限制性的。

定义

以下术语用于说明书和权利要求中。

符号"～"用于指示近似数值。该值的近似水平对于相关领域的普通技术人员将是明显的。

"加A尾"是基于酶的方法，用于将非模板核苷酸添加至钝的双链核苷酸分子的3'端。

"条形码化接头"是连接至染色质复合物中所含的染色质DNA的自由端的短的(例如10-50bp)DNA序列。条形码化接头包含6-16个核苷酸的"条形码"。条形码用作分类标签，用于有效识别单染色质复合物中的多个基因组DNA序列。条形码化接头的剩余部分是可跨越条形码和荧光标记或衬底配体(例如生物素)的接头DNA。

"ChIA-PET"是染色质捕捉技术，其结合基于染色质免疫沉淀(ChIP)的富集、染色质的近端连接、PCR扩增、高通量测序、和参比基因映射以确定全基因组的长距离染色质相互作用。

"染色质"是在细胞中发现的基因组DNA和蛋白质的天然复合物。染色质还可包含RNA。

"染色质复合物"指染色质的功能单位，其包含DNA，蛋白质，和任选地，RNA。某些染色质复合物具有基因调节意义。

"染色质免疫沉淀(ChIP)是涉及染色质交联的过程，用于确定体内特定蛋白质是否结合或定位于特定DNA序列。

"交联"是一种聚合物与另一种聚合物的化学键合；在这种情况下，交联用于化学地连接染色质复合物内的DNA以在另外的步骤中维持染色质复合物的结构。

在本公开的上下文中，"染色质加载(chromatin loading)"是将染色质复合物添加至流动池的动作。流动池可以用链霉抗生物素蛋白涂覆以便通过染色质中所含的生物素分子使染色质和链霉抗生物素蛋白杂交。

"果蝇S2细胞"是Schneider 2细胞，源自晚期黑腹果蝇胚胎的原代培养。

"DPBS"是Dulbecco磷酸盐缓冲盐水，其是在25℃下的pH为7.2-7.6并含有氯化钾、磷酸二氢钾、氯化钠、磷酸氢二钠，和任选地，氯化钙或氯化镁的缓冲液。

"EGS"是乙二醇双(琥珀酰亚胺基琥珀酸酯)，其是在12个原子的隔离臂周围含有胺反应性NHS酯末端的交联剂。

"荧光团"是在光激发时特定地再发射光的单荧光分子。

"流动池"是用于DNA测序目的的具有多个通道的专用显微镜载玻片。

"甲醛"("FA")是具有式CH₂O的化学物质。它可用作化学交联剂，以使DNA与染色质复合物内的蛋白质交联或使DNA与染色质复合物内的DNA交联以维持染色质结构。

"基因组"是生物体内的DNA的整个集合，其包括基因和非编码调节区。

"基因组DNA"是生物的染色质内的内源DNA。

"GM12878"是人淋巴母细胞样细胞系。

"Hi-C"是全对全(all-vs-all)染色质构象捕获方法。Hi-C方法依靠PCR扩增以检测在基因组中相互作用的所有基因组位点。

"克列诺(Klenow)片段(3'-＞5'exo-)"是DNA聚合酶I的N端截短，其用于染色质复合物中的游离钝DNA末端的加A尾。

"LiCl"是氯化锂。

在本公开的上下文中，"接头"是能够与染色质DNA的一端结合的短双链核酸分子。接头可具有"T"突出核苷酸，其用作基因组DNA中产生的"A"突出端的底物。为了本申请的目的，接头包含在其3'端共价地连接的配体，例如生物素，和在其5'端共价地连接的荧光团，例如ALEXA 647荧光团。生物素促进与链霉抗生物素蛋白涂覆的流动池的结合。最后，ALEXA647荧光团揭示染色质复合物的存在。

"MES"是6-8pH范围内，在25℃下的pK_a为6.10的2-(N-吗啉代)乙磺酸缓冲液。

"寡核苷酸"是单链多核苷酸(～30个核酸碱基)。

"PAGE"是聚丙烯酰胺凝胶电泳，其是用于根据其电泳迁移率分离生物大分子，通常是蛋白质或核酸的方法。

"PBS"是磷酸盐缓冲盐水，其是在生物学研究中用于模拟生理条件的缓冲溶液。

"PI"指蛋白酶抑制剂，其是抑制蛋白酶(消化蛋白质的酶)的功能的分子。

"RNAPII"是RNA聚合酶II全酶，其被募集到活真核细胞中蛋白质编码基因的启动子以催化DNA的转录以合成mRNA的前体。

"SEQ LL"是进行称为真正单分子测序(tSMS)的单分子测序的测序平台。SEQ LL(Woburn，MA)平台的特征包括链霉抗生物素蛋白涂覆的流动池和基于TIRF的成像。

"顺序测序"指在同一流动池上顺序地发生的多轮测序。具体而言，首先将独特的DNA序列(例如条形码化接头)连接到染色质DNA上。将条形码化接头的互补测序引物一次添加至流动池中，从而允许从同一流动池上的染色质复合物进行多轮DNA测序。

"测序引物"是用于顺序测序反应中的单链DNA寡核苷酸引物。测序引物与存在于条形码化接头中的模板链序列互补，并引发测序反应。

"T4 DNA连接酶"是催化双链核酸的并置的5'磷酸酯和3'羟基末端之间的磷酸二酯键形成的酶。

"T4 DNA聚合酶"是催化5'至3'方向的DNA合成并且需要模板和引物存在的酶。"TBST"是含有聚山梨醇酯20(吐温20，Sigma-Aldrich)的tris缓冲盐水。例如，TBST可含有0.05M Tris，0.15M NaCl，0.1％吐温20，在25℃下pH为7.6。

"TCEP"是三(2-羧乙基)膦，是还原剂。

"TE"是包含Tris和EDTA的缓冲液。

"TIRF"指全内反射荧光(TIRF)显微镜。TIRF允许对荧光标记的分子例如蛋白质或核酸进行单分子检测。

"TNE"是含有Tris-HCl、NaCl和EDTA的缓冲液。

"USER"是尿嘧啶特异性切除试剂，其是尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂解酶内切核酸酶VIII的混合物，其在尿嘧啶的位置处产生单核苷酸间隙。USER特异性地除去见于生物素化接头的非模板链中的尿嘧啶核苷酸，从而产生DNA接头的单链区，从而允许测序引物结合。

本公开提供了单分子DNA测序揭示功能上重要的3D DNA空间近端的新型应用。

测定描述

(I)单分子染色质相互作用测定(smChIA)方法。

在一个方面，本公开提供了smChIA，一种用于确定单染色质分子中的基因座之间的接触相互作用的方法。

与用于测定染色质复合物中DNA基因座之间的相互作用的早期方法相比，smChIA方法具有多个优点。SmChIA可以确定超过两个染色质基因座之间的染色质相互作用，提供来自单染色质复合物(单分子)的数据，并映射该数据以提供整个基因组中染色质相互作用的视图。smChIA方法可以在没有近端连接或DNA扩增的情况下完成。smChIA方法的延伸，即单核smChIA，可以提供有关来自单核的单染色质复合物内的相互作用的数据。在本发明的smChIA方法中，通过使用交联剂例如甲醛(FA)和乙二醇双(琥珀酰亚胺基琥珀酸酯)(EGS)进行双交联，生成了数千种染色质复合物(每个由DNA和蛋白质的多个分子组成)。

然后通过超声或基于限制性酶的片段化产生染色质复合物。片段化染色质复合物包含例如约3kb-8kb DNA。然后通过ChIP对染色质复合物富集含有感兴趣的蛋白质的复合物。然后使复合物内的DNA的自由端准备连接至条形码化接头。例如，DNA的自由端可以使用T4 DNA聚合酶进行末端钝化，使用克列诺片段(3'-5'exo-)进行加A尾，和使用条形码化接头连接到暴露的末端。条形码化接头是独特的DNA片段，在其末端的每条链上均包含生物素分子。双链条形码化接头的一条DNA链也可以包含共价地结合的荧光标记。然后将染色质复合物与链霉抗生物素蛋白涂覆的表面(例如流动池)杂交，以特异性地结合含有DNA条形码化接头的生物素。最后，复合物通过基于TIRF显微镜的测序分辨，使用荧光抗体免疫染色(例如在SEQ LL平台上)进行蛋白质成像。然后可以将从具有固定物理位置的每种复合物获得的基因组DNA序列读取结果映射回到参比基因组，以确定基因组中DNA基因座之间的相互作用，并确定哪些染色质蛋白质参与这些相互作用。

与现有的3D基因组映射技术例如ChIA-PET和Hi-C相比(这两种技术都是基于群体的技术)，smChIA方法具有许多重要优点。ChiA-PET和Hi-C检测以足够频率发生以产生信号的相互作用。SmChIA是基于单分子蛋白质检测和DNA测序平台并提供单分子分辨率。检测不是统计学偏倚的；不太常见的相互作用与频繁的相互作用一样容易地检测到。在另一个实施方式中，smChIA平台还允许同时检测个体核小体的组蛋白修饰和基因组位置。组蛋白修饰可通过使用针对特定组蛋白修饰表位的荧光标记抗体来检测。

不像ChiA-PET和Hi-C，smChIA不使用近端连接，该技术是将染色质复合物中DNA的两个自由端连接至DNA测序引物的每个末端，使得染色质DNA片段之间的成对相互作用被检测。在smChIA中，将染色质复合物固定到流动池表面。复合物通过免疫染色可视化，例如用转录因子特异性抗体或组蛋白特异性抗体。连接到染色质复合物中DNA的自由端的条形码化接头用作引物结合位点。进行每轮测序使用不同引物的单分子测序，以产生源自流动池表面上的相同光点的顺序读取结果。从这些测序读取结果检测到的序列代表参与染色质相互作用的基因组基因座。

smChIA方法还具有避免PCR扩增的优点。反而分析个体染色质复合物。smChIA方法可以连续地检测每个染色质复合物中的多种蛋白质。方法包括通过染色质复合物中的蛋白质束缚在一起的DNA片段的顺序轮次的单分子测序。

smChIA技术可用于创建全基因组单分子染色质相互作用地图，并且还确定多种蛋白质和RNA因子在每个基因座处的共定位。

本公开提供了用于从散装细胞制备染色质样品以用于smChIA分析的方法。

smChIA允许检测完整的染色质相互作用复合物，从而允许接触的DNA片段的单分子分辨率。本方法允许在3D核空间中彼此物理相关的两个或更多个DNA序列的同时检测，以及复合物的蛋白质组分的检测。

SmChIA在4个主要步骤中完成了对单染色质复合物内的多种相互作用的检测。

首先，交联细胞以允许染色质保持完整，透化核以允许原位消化。另外，染色质可以使用超声来准备。

第二，限制性酶消化用于产生染色质复合物。为了允许连接条形码化接头，进行末端钝化和加A尾。

第三，将生物素化和荧光标记的条形码化接头连接到全基因组。

第四，将染色质复合物结合至表面，例如链霉抗生物素蛋白涂覆的表面，并使用TIRF显微镜(例如SEQ LL平台)进行成像和测序。染色质复合物充分地分散在表面上以允许通过TIRF显微镜进行分辨。在某些实施方式中，染色质复合物应相距(by)至少400nm以允许分辨。

除了在本发明内容中提出的用于smChIA的步骤之外，本公开提供具有以下特征的smChIA。

本公开提供了smChIA，其中用于免疫沉淀的第一抗体和用于免疫染色的第二抗体是相同的或不同的。在某些实施方式中，第一和第二抗体是相同的。

在smChIA中使交联的基因组DNA片段化的步骤可提供多个染色质复合物。免疫沉淀在多个染色质复合物中富集包含第一抗体结合的蛋白质的染色质复合物。与免疫沉淀之前的多个染色质复合物相比，包含第一抗体结合的蛋白质的染色质复合物的富集可以是至少2倍、4倍、10倍、20倍。

在某些实施方式中，条形码化接头可包含荧光标记，例如ALEXA FLUOR标记，或任何具有适用于TIRF显微镜的激发和发射波长的荧光标记。在某些实施方式中，条形码化接头结合至生物素分子，并且染色质复合物固定在其上的表面是链霉抗生物素蛋白涂覆的表面。染色质DNA可以在连接条形码化接头之前进行末端修复和加A尾。在一些实施方式中，将至少2个、至少4个、或2至8个不同的条形码化接头连接至染色质复合物中的基因组DNA。条形码化接头可包含选自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8的条形码化寡核苷酸。在某些实施方式中，条形码化接头包含模板DNA链和非模板链，所述模板DNA链包含在3'端共价结合生物素分子的10-100、10-70或10-50个核苷酸，所述非模板链包含在多个基因座处的尿嘧啶和5'端处标记的荧光。条形码本身是6-16nt、6-12nt或约8-12nt的短的、独特的序列。

SmChIA可包括在将条形码化染色质复合物固定到表面上之后将条形码化染色质复合物去交联以释放染色质复合物中的蛋白质的进一步步骤。

交联可以在细胞中进行，以使染色质复合物在细胞中保持完整，随后可以透化细胞。交联可以是化学交联或UV交联。化学交联可以使用合适的化学交联剂例如甲醛、甲醇或EGS等进行。在某些实施方式中，甲醛(0.5至3.0％v/v，或1.0％v/v)和EGS(0.5mM至5.0mM或1.5mM)的组合用于交联。

透化细胞的步骤可以机械地进行，例如通过超声或通过使用化学膜破坏剂，例如去污剂，如TRITON、吐温、NP40、SDS等，或在特定情况下SDS，例如可使用0.1％至3.0％w/vSDS或1.0％SDS。

片段化步骤可通过限制性酶消化进行，例如MboI限制性酶消化。

在另一个实施方式中，本公开提供了smChIA，其包括以下步骤：

a)交联细胞中的基因组DNA和蛋白质；

d)将所述条形码化染色质复合物固定到表面上；

f)通过用针对所述条形码化复合物中存在的特定蛋白质的荧光标记抗体进行免疫染色而顺序地检测蛋白质；

g)从所述染色质复合物中去除蛋白质，并保留固定在表面上的所述条形码化染色质复合物的DNA模板；

h)在单分子水平上对所述条形码化染色质复合物中的所述DNA进行顺序地测序以产生多个序列读取结果；和

i)将所述多个序列读取结果映射至参比基因组以产生所述测序读取结果的基因组位置以产生3D基因组联系图，

(II)单核单分子染色质相互作用测定(单核smChIA)

在另一方面，本公开提供了单核smChIA。公开了用于从固体表面上的单核制备染色质样品用于smChIA分析的方法。单核smChIA是为散装细胞样品开发的smChIA方案的扩展，但分辨和分析是在单核水平上进行。

在单核smChIA中，纯化的核通过限制性酶进行原位染色质消化，然后用条形码化接头连接。每个条形码化接头是生物素标记的，并且还用荧光标记物标记。将核在稀释中加载到表面上，例如链霉抗生物素蛋白涂覆的表面(例如流动池)，使得核在缓冲溶液(例如PBS溶液)层中稀疏地安置在表面上。然后，在温和的裂解条件下，例如0.5％SDS，将核在链霉抗生物素蛋白涂覆的表面上透化15分钟。核可以通过合适的去污剂例如SDS、TRITON例如TRITON X-100、洋地黄皂苷、皂苷，或吐温例如吐温20、或NP40，或使用酶例如蛋白酶K和链球菌溶血素O等透化。生物素标记的染色质复合物从透化的核释放，径向分散，并固定在玻璃表面上的限定微区域内。效果是将染色质复合物对于smChIA充分地分离，但将来自每个核的复合物贴附在小区域内，使得它们容易地被识别为来自同一核。接下来，如上所述(图4A)，将固定在流动池表面上的染色质复合物进行smChIA。将smChIA方法应用于单核有两个关键问题。首先，生物素标记的条形码化接头需要与片段化染色质DNA原位连接。其次，单核必须对于smChIA测序足够地分散，同时保持与其来源足够接近以区分个体核。

除了在本发明内容部分中提出的用于单核smChIA的步骤之外，本公开还提供了具有以下特征的单核smChIA。在某些实施方式中，交联步骤可通过上述用于smChIA的任何手段进行。在某些实施方式中，条形码化接头可具有上述用于smChIA的条形码化接头的任何限定。使染色质DNA片段化以产生染色质复合物的步骤也可通过smChIA描述的任何方法进行。像smChIA一样，单核smChIA可包括免疫染色。免疫染色步骤中使用的抗体可以是描述用于smChIA的免疫染色的任何抗体。如在smChIA中，单核smChIA中的染色质复合物可以固定在链霉抗生物素蛋白涂覆的表面上

核裂解步骤可使用去污剂例如吐温、TRITON、NP40、SDS等，或在某些情况下SDS，例如0.1％至3.0％w/v SDS，或0.5％w/v SDS，或ExM如下所述进行。

在另一个实施方式中，本公开提供了单核smChIA，其包括以下步骤：

a)提供单核，所述核包含基因组DNA和蛋白质；

b)交联所述核中的基因组DNA和蛋白质；

e)将所述单核固定到表面上；

g)用能够结合所述条形码化染色质复合物中存在的所述特定蛋白质的抗体对所述条形码化染色质复合物进行免疫染色；

i)重复步骤g)和h)以连续监测两种或更多种抗体；

其中所述联系图指示所述染色质复合物中的基因组DNA和蛋白质在单分子水平上的物理相互作用。

应用于单核(SN)/单细胞(SC)的smChIA的替代方法

在又一方面，本公开通过提供将染色质复合物可靠地分散在流动池表面上足够分开每个染色质复合物单元，而又将染色质复合物定位为彼此离核足够近以保留核边界的手段，提供了单核染色质制备的替代方法。该方法使用扩展显微镜(ExM)来裂解核(Chen,F.,等,Science(2015)347(6221):543-548；DOI:10.1126/science.1260088)。ExM使用可膨胀的(可溶胀的)聚电解质凝胶基质以将细胞物质(包括蛋白质和核苷酸)固定在细胞中，然后是细胞-凝胶复合物的渗透溶胀。ExM保留原始细胞结构。它已被应用于组织切片和单细胞，用于使用常规显微镜以超高分辨率检测蛋白质和RNA(Chen,F.等,Nature Methods(2016)13:679-684；DOL 10.1038/NMETH.3899)。这种方法的最新进展称为迭代扩展显微镜(iExM)，已被用于扩展样品至多22倍(Chang,J-B.,等,Nature Methods(2017)14:593-599；DOI:10.1038/nmeth.4261)。

iExM用于用聚电解质凝胶注入核(原位消化的和DNA寡核苷酸连接的)，因此将所有消化的染色质复合物原位化学锚定在相对位置。改变渗透条件以使核-凝胶复合物膨胀，以将每个个体染色质复合物分开约20倍的距离。应用盖玻片将膨胀核(3维)向下压在流动池表面(2维)上。然后使用配体/衬底系统例如生物素/链霉抗生物素蛋白，将染色质复合物固定在流动池表面上。在某些实施方式中，生物素可共价地结合至与染色质DNA结合的条形码化接头，并且链霉抗生物素蛋白可以引入到流动池表面上。将iExM整合到单细胞smChIA方案中将促进天然核结构的保存，并充分地扩展有区别的染色质复合物用于单分子蛋白质检测和DNA测序。考虑到平均人核是5-10mm³，iExM扩展将在3维上扩大核至200mm³，并有可能在流动池表面上压成2维后扩大至400mm²。普通显微镜载玻片(75mm×25mm)将包含至少5000个核用于smChIA分析。

细胞收获和交联

约1×10⁸个细胞可以使用1％甲醛和1.5mM EGS单或双交联。交联的细胞可以储存在-80℃。

细胞裂解

为了进行细胞裂解，将细胞在室温下用缓冲液例如PBC(具有PI)洗涤两次。细胞裂解和核裂解可以在无TRITON X-100的10ml 0.1％细胞裂解缓冲液(50mM Tris pH 7.5，150mM NaCl，1mM EDTA)中室温(RT)进行6分钟。然后在37℃加入900μl 10％SDS，将细胞在INTELLI-MIXER(Elmi Ltd.,Riga,Latvia)上以10rpm旋转10分钟。裂解通过在显微镜下视觉观察裂解的标志性视觉指标来确定。如果细胞裂解不好，可以重复该过程。然后将细胞用含蛋白酶抑制剂(PI)的0.1％细胞裂解缓冲液洗涤两次，悬浮于含TRITON X-100(PI)的10ml冰冷0.1％细胞裂解缓冲液中用于超声。当样品在4℃时，将TRITON加入以防止染色质沉淀。

染色质复合物产生

染色质DNA可以被剪切成约3kb，或者包含至少3kb DNA、至少5kb DNA、3kb-10kbDNA、5kb-10kb DNA、约8kb DNA或8-10kb DNA的片段。染色质可以用超声、限制性酶消化或其他合适的方法剪切。用于限制性酶消化的合适的酶包括Mbo I和Pvu II。如果使用超声，等分染色质DNA至试管中用于超声，例如使用Branson Digital Sonifer Cell Distrupter以38％振幅，20秒打开/30秒关闭，进行6分钟。保持样品是冷的以避免过热。然后将染色质DNA以1700×g离心至少5分钟。

复合物的ChIP富集

染色质复合物可通过染色质免疫沉淀(ChIP)获得。

ChIP可用于在染色质复合物的样品中富集包含感兴趣的特定蛋白质的复合物。在染色质复合物的样品中富集特定蛋白质允许识别与该蛋白质相关的基因组区域，例如组蛋白和与核酸蛋白质复合物中的核酸结合的其他蛋白质(在Taverner等,Genome Biol,2004.5(3):p.210中综述)。在ChIP中，蛋白质在其相互作用部位与DNA交联。交联可通过直接向培养物中的活细胞中添加合适的固定剂例如甲醛、戊二醛、EGS或甲醇而快速且有效地完成。

然后制备这些固定细胞的粗提取物，并通过超声、水力剪切、用皮下注射器针头反复抽吸，或通过限制性酶消化将染色质剪切至通常约1kb的平均尺寸，然后与针对感兴趣的DNA相关蛋白质(例如转录因子或组蛋白)的抗体一起用于免疫沉淀反应。然后将每次免疫沉淀中富集的DNA片段脱联并纯化以允许通过多种方法识别。使用ChIP的优势是该方法能够通过染色质和其他非组蛋白的快速交联来"冻结"体内基因调节网络，从而在任何时间点提供调节系统的图画，而没有例如由异源表达施加的潜在人为现象。

为了制备含有感兴趣的蛋白(例如RNAPII)的染色质复合物，可通过在4℃下孵育和旋转将蛋白G磁珠以RNAPII抗体涂覆。

抗体涂覆孵育可提前至多24小时完成，但应进行至少6小时。如下将RNAPII抗体与蛋白G珠一起孵育。首先，将1ml蛋白G磁珠用PBS/0.1％TRITON X-100洗涤两次，将珠用7mlPBS/0.1％TRITON X-100悬浮，并与感兴趣的抗体在4℃孵育并以12rpm旋转约6-8小时。蛋白质珠可以是来自Thermo Fisher Scientific,Waltham,MA，产品目录号10003D的用于免疫沉淀的DYNABEADS蛋白G。

染色质可以从感兴趣的细胞制备，例如GM12878细胞或果蝇S2细胞。在使用GM12878细胞的实施例中，1×10⁸个GM12878细胞用室温PBS(PI)洗涤两次。

为了实现细胞和核裂解，将GM12878细胞在室温下悬浮于10ml不含蛋白酶抑制剂的0.1％细胞裂解缓冲液中6分钟。然后在37℃下将900μl 10％SDS加入并将细胞以10rpm旋转10分钟。在显微镜下观察细胞以确定裂解是否已经发生。如果细胞裂解不充分，则重复裂解程序。然后将细胞用0.1％细胞裂解缓冲液(无TRITON，PI)洗涤两次，悬浮于含TRITON X-100(PI)的10ml冰冷0.1％细胞裂解缓冲液中用于超声。将细胞等分至试管中用于超声。将细胞使用Branson Digital Sonifer Cell Disrupter以38％的振幅，20秒打开/30秒关闭超声处理6分钟，然后以1700g旋下5分钟。

可以预先清洁染色质以去除染色质与珠的背景结合。这可以通过将1ml蛋白G磁珠与超声处理的染色质复合物在4℃下在转子上孵育至少2小时来完成。孵育后，上清液包含预先清洁的染色质，并可以转移至新试管中。RNAPII抗体结合珠可以用0.1％Triton/PBS洗涤三次以去除未结合的抗体。

为了建立ChIP，丢弃抗体结合珠的上清液，将预先清洁的染色质复合物上清液转移到具有抗体结合珠的试管中，并在4℃下旋转孵育过夜。然后进行ChIP洗涤步骤以去除复合物的非特异性结合。保留20μl染色质用于片段大小质量控制。ChIP洗涤步骤包括高盐缓冲液洗涤，例如用0.1％SDS/.35M NaCl(PI)细胞裂解缓冲液洗涤一次，LiCl缓冲液洗涤一次，然后用TE(PI)缓冲液洗涤。

条形码化接头的制备和连接

合成了SmChIA条形码化接头(寡核苷酸)例如图6中所示的那些。生物素修饰是共价地结合至模板链的3'端。胸腺嘧啶在非模板链中的多个位置处被尿嘧啶替代，非模板链是荧光标记的，例如用ALEXA FLUOR 647，或用于DNA测序的其他合适的荧光标记。除了ALEXA FLUOR 647以外，可以使用任何具有可由TIRF显微镜检测到的发射波长的荧光染料，例如具有约350nm至约740nm的吸收波长，和比吸收波长长约15至50nm，或约350nm至约370nm至约770nm的发射波长。可由TIRF检测的荧光标记可具有约480nm至约680nm的吸收波长和比吸收波长长约15至50nm的发射波长。除了ALEXA FLOUR 647以外，可以使用的其他荧光标记包括ALEXA FLUOR 488、532、546、568和594、CY2、CY3、CY3B、CY5、CY5.5、CY7、DYLIGHT488、550、594、633和650(Thermo Fisher Scientific)、ATTO 488、532、565、590、647N和680。ATTO RHO3B、ATTO RHO11、ATTO RHO3B和Rhodamine 6G。

生物素化条形码化接头，一旦设计，可以从商业来源获得，例如Integrated DNATechnologies(www.idtdna.com)。

将单链smChIA条形码化接头寡核苷酸溶解于l×TNE缓冲液中并在4℃下孵育过夜以制备双链接头。将smChIA条形码化接头的链退火以形成双链条形码化接头并运行PAGE进行质量控制。用于以下实验前将smChIA条形码化接头稀释至200ng/μl。

在条形码化接头的连接之前，需要修复位于抗体富集的染色质复合物内的基因组DNA片段末端。接头连接可以设计为钝末端连接或粘性末端连接。在这个实例中，使用了粘性末端连接。首先，进行末端修复以钝化基因组DAN的所有末端。在末端修复步骤后，对现已钝化的基因组DNA片段的3'端进行加A尾。接头包含将与基因组DNA片段末端互补结合的"T"突出端。生物素化条形码化接头(例如具有10-50bp、20-40bp、30-35bp或33bp)可通过单链寡核苷酸的杂交产生。接头可通过基于互补T/A突出端的连接连接至基因组DNA。将2个、超过2个、3-20个、4-10个、4-8个、6-8个或8个条形码化接头连接至染色质复合物以产生包含多个不同条形码化接头的染色质复合物以允许从每个染色质复合物获得的多个序列读取结果。

染色质加载到流动池

将染色质复合物加载并通过它们的生物素化接头特异性地结合至链霉抗生物素蛋白涂覆的流动池。染色质复合物的浓度必须通过实验确定，并将取决于文库的DNA片段分布以及样品的蛋白质含量。

基于TIRF的蛋白质成像

染色质复合物的蛋白质组分的成像可通过使用斑点印迹法(dot-blot styleassay)进行。染色质复合物加载之后，将流动池用4ml封闭缓冲液(含5％脱脂干奶粉的TBST)封闭4小时以减少荧光抗体的非特异性结合。接着，将流动池用TBST洗涤3次，并加入一抗。一抗可在4℃下在转子上孵育过夜。将阵列在TBST中洗涤3次以去除过量的一抗。将二抗加入至流动池并在室温下孵育1小时。然后将流动池在TBST中再洗涤3次以去除未结合的二抗，并且通过FLUORCHEM Q(Protein Simple,San Jose,CA)检测信号。预吸附的驴抗小鼠IgG H&L(ALEXA FLUOR 647，ThermoFisher Scientific)是一种合适的二抗检测系统。

将抗体在成像缓冲液中稀释至50-100ng/ml的终浓度，并且每15分钟拍摄图像，总孵育时间3小时。(对于需要对多个蛋白质靶标成像的实验，流动池用成像缓冲液普遍地洗涤(对于每次洗涤，10次洗涤×5分钟孵育))。再次对所有位置成像，并从进一步分析中排除残差斑点。然后可以如对一抗所述的那样施用和成像另外的抗体。

顺序DNA测序

单分子脚本适于在随时间对流动池成像抗体结合和解离事件时禁用流体学。

可以进行去交联以从染色质复合物中释放蛋白质。流动池可用2M NaCl洗涤10分钟，并升温至37℃。去交联过程可用以下两种方法进行。

方法1：在37℃-65℃下，在含有0.5％SDS缓冲液的TE缓冲液中与蛋白酶K孵育过夜或至少4小时。

方法2：与含有0.5％SDS缓冲液的TE缓冲液在65℃下孵育2小时，然后在含有0.5％SDS缓冲液的TE缓冲液中与蛋白酶K孵育4小时或过夜。

使用USER限制性酶，并允许在流动池上于37℃孵育1小时以去除接头的一条链中的尿嘧啶核苷酸，从而允许测序引物到达并与模板链杂交。

然后流动池可以用H₂O洗涤多次并预热至55℃以准备测序反应。一次使用一种引物进行顺序DNA测序，以10nM的终浓度添加到流动池中。允许测序引物杂交20分钟，随后封闭以终止测序反应并洗涤以去除未结合的引物。每次使用独特的条形码化引物通过多轮测序进行单分子测序，以一次对一个条形码化DNA模板进行特异性测序。

参比基因映射

使用一种引物(P1)对衬底表面上的固定DNA片段进行测序。在每次测序运行中，对于P1引物产生了多个片段序列(读取结果)。已经发现大多数读取结果为约30bp，但是可以是10-15bp、20-100bp、30-80bp或40-50bp(图4A)。这些读取结果被映射到参比基因组。果蝇参比基因(dm3)用于图4B所示的地图。在一个方面，本公开提供了用于识别由长距离上和不同染色体之间的特定DNA结合蛋白例如组蛋白介导的染色质相互作用事件的方法。在另一个方面，本公开提供了分离的寡核苷酸，其包含至少一个第一标签和至少一个第二标签，其中所述第一标签是从第一多核苷酸获得，所述第二标签是从第二多核苷酸获得，所述第一和第二多核苷酸从核酸-蛋白质复合物获得。标签对应于核酸-蛋白质复合物中染色质的区域。然后可以对这些标签进行测序以分析、识别和/或检测染色质相互作用事件(图3和5)。

接头

接头可以是任何DNA寡核苷酸。接头可包含能够选择性结合至衬底的肽或其他分子，例如接头可包含与链霉抗生物素蛋白或抗生物素蛋白涂覆的衬底结合的生物素。接头还包含荧光标记。图6显示了8个条形码化接头，生物素与接头的连接以及对这些接头特异的引物，其可用于smChIA方法。条形码化接头的5'-3'序列(其在3'端生物素化)提供为SEQID NO:1-8，互补链的序列(图6中所示3'-5'并在5'端用ALEXA FLUOR 647荧光团标记)提供为SEQ ID NO:9-16。这些序列在多个基因座处掺入尿嘧啶代替胸腺嘧啶。条形码化接头的引物序列提供为SEQ ID NO:17-24。

smChIA系统的开发

我们估计每个染色质复合物可能束缚至多8个DNA片段，其代表参与与染色质蛋白质例如RNAPII的染色质相互作用的多个基因组基因座。每个DNA簇的大小约为直径400nm，并且400nm是TIRF显微镜的光学分辨率限度，这对如何区分从每个簇内的不同DNA模板衍生的测序读取结果提出了技术挑战。从簇内的离散DNA模板区分测序读取结果的技术问题被顺序测序策略(图1)克服。这种测序策略包括条形码化DNA接头的使用。将每个染色质复合物中的多个DNA片段随机地进行连接至每个独特的条形码化接头。

一旦用其条形码化接头标记的DNA片段被固定，DNA片段可以使用接头特异性引物一次一个连续进行离散测序。将每个簇中的DNA序列的这样的顺序读取结果(由TIRF检测的光学斑点)映射到参比基因组，发现反映染色质相互作用，涉及通过免疫染色识别的蛋白质介导的多个基因座，免疫染色可以在测序之前或之后进行。

图1描绘了smChIA系统的开发及其多个步骤。

(i)染色质制备：图1A描绘了染色质制备的过程。染色质样品是通过细胞/核裂解、片段化、ChIF和末端修复加上加A尾，然后DNA接头连接而制备。每个接头可包含在3'端带有T突出端的dsDNA、生物素基团、独特DNA序列条形码、分布在非模板链内的多个尿嘧啶(U)碱基，和荧光标记。通常，至少两个或多达八个不同的条形码化接头连接到染色质样品。

(ii)染色质加载和连续的抗体(Ab)特异性免疫染色：图1B描绘了染色质加载到流动池上。将染色质样品加载到链霉抗生物素蛋白涂覆的流动池表面，并且将每个染色质复合物通过生物素-链霉抗生物素蛋白缀合固定。将染色质复合物充分地稀释使得相邻复合物之间的距离＞1μm。然后通过直接在流动池上用对感兴趣的蛋白特异的抗体进行连续免疫染色，使染色质复合物中的蛋白质可视化。

在某些实施方式中，免疫染色程序重复多次以检测许多不同的染色质结合蛋白质，其包括通用转录因子(TF)例如RNAPII(RNA聚合酶II)、特定TF例如RARA(视黄酸受体)、ER(雌激素受体)等，以及染色质结构因子例如CTCF(CTCC结合因子)、黏连蛋白等。可以检测ChIP级抗体对其可用的任何染色质蛋白。可通过此程序免疫染色的另外的染色质结合蛋白包括与以下ChIP级抗体结合的染色质蛋白，其可见于https://www.diagenode.com/en/categories/chip-grade-antibodies：H3R2me2、AF9、AML1-ETO、BRD4、C/EBP、CBFb、CBX2、CBX8、CHD1、CHD7、CRISPR/Cas9、CTCF、CXXC1、DNMT3B、E2F6、ERR、ETO、EZH2、FOXA1、FOXA2、FOXM1、FUBP1、GR、GTF2E2、组蛋白H2A.X、H2A.Z、H2A.Zac、H2A.ZK4ac、H2A.ZK7ac、H2AK119ub、H2AK5ac、H2BK12ac、H2BK15ac、H2BK20ac、H2BK123ub、H2Bpan、H3.3、H3K14ac、H3K18ac、H3K18me1、H3K18me2、H3K23me2、H3K27ac、H3K27me1、H3K27me2、H3K27me3、H3K27me3S28p、H3K36me1、H3K36me2、H3K36me3、H3K4ac、H3K4me1、H3K4me2、H3K4me3、H3K4me3T6p、H3k4un、H3K56ac、H3K56me1、H3K64me3、H3K79ac、H3K79me1、H3K79me3、H3K9/14ac、H3K9ac、H3K9acS10p、H3K9me1、H3K9me2、H3K9me3、H3Kme3S10p、H3K9un、H3pan、H3R17me2、H3R17me2(asym)、H3R17me2(asym)K18ac、H3R2me2K4me2、H3T6pK9me3、H4K12ac、H4K16ac、H4K20ac、H4K20me1、H4K20me2、H4K20me3、H4K5,8,12ac、H4K5ac、H4K8ac、H4pan、H4S1p、HDAC1、HDAC2、HDAC3、HIF1α、HP1、JARID1C、JMJ2a、JMJD6、KAP1、KAT2B、KDM6A、LSD1、MBD1、MBD1、MeCP2、MYH11、NCOR1、NF-E2、NFKB、NFYB、NRF1、NRF2、OCT4、p300、p53、PARP1、PAX8、Po1 II、Po1 II S2p、PPARG、RbAp48、RBBP5、RFX-AP、RNF2、SAP30、SIN3A、Ski3、Ski8、SMAD1、SMAD2、SMYD3、Suz12、TAL1、TARDBP、TRP、TFIIF、THOC1、TIP5、TRRAP、Ty1、UHRF1、YY1、ZHX2和ZMYM3。连续免疫染色允许在每个染色质复合物处的个体和多个共定位蛋白质的识别。感兴趣的蛋白的免疫染色可在顺序测序步骤之前或之后进行。

染色质复合物的蛋白质组分可在测序之前通过反向交联去除。去交联导致染色质复合物的DNA组分的纯化，其先前被染色质蛋白质束缚在一起。被条形码化接头中包含的末端生物素基团束缚的基因组DNA保留在流动池表面上，作为DNA片段的独特簇。在个体簇内，每个DNA片段代表个体基因组基因座，并且每个簇内的不同DNA片段代表多个基因组基因座，其通过染色质蛋白质介导的长距离染色质相互作用集合在一起。

(iii)SEQ LL平台：图1C描绘了SEQ LL平台，其使用全内反射荧光(TIRF)显微镜用于单分子蛋白质检测和DNA测序。SEQ LL平台不需要PCR扩增。图1D描绘了束缚在离散染色质复合物中的DNA片段。离散染色质复合物直径为～400nm，是TIRF的光学分辨率限度。离散染色质复合物充分地分散在流动池表面上使得不重叠。为了从单染色质复合物中簇集的每个DNA读取多个DNA片段，实施顺序测序策略，其中连续应用与每个DNA接头相对应的特异性引物(P1、P2、P3等)以允许对来自单染色质复合物的多个DNA片段被测序，从而促进单分子测序。每条虚线表示顺序接头特异性测序运行。

果蝇S2细胞的使用

果蝇S2细胞用于smChIA的开发。果蝇具有相对小的基因组，并且已有大量果蝇S2细胞的3D基因组组织数据(Hi-C和ChIA-PET)，允许容易地比较初步结果。研究了RNAPII介导的染色质相互作用，并将现有的RNAPII ChIA-PET数据与收集的smChIA数据进行比较用于技术验证。

使用SEQ LL系统(Shema,E.,等,Science(2016)352(6286):717-721,PMID:27151869)，对固定在链霉抗生物素蛋白涂覆的玻璃表面上的染色质复合物上的RNAPII进行免疫染色，提供了与对个体核小体的组蛋白修饰标记的那些相当的出色结果。

实施例

提供了以下实施例以进一步说明本发明的各种优选的实施方式和技术。然而，应理解，然而这些实施例不限制权利要求中描述的本发明的范围。许多变化和改变旨在是在本发明的精神和范围内。

实施例1.smChIA条形码化接头制备

合成了smChIA条形码化接头寡核苷酸(例如图6中所示的序列)。模板链的3'端是生物素化的。非模板链在多个基因座处的胸腺嘧啶被尿嘧啶(U)取代。非模板链是荧光标记的，例如用ALEXA FLUOR 647。用于以下实验的条形码化接头由Integrated DNATechnologies,IDT合成(https://www.idtdna.com/)。

将干燥的单链smChIA条形码化接头寡核苷酸溶解在1×TNE缓冲液中并在4℃下孵育过夜以制备双链条形码化接头。条形码化接头链可以在热循环仪中通过在10分钟内从95℃渐变至20℃退火，并运行PAGE以进行质量控制。将smChIA条形码化接头稀释至200ng/μl用于以下实验。

实施例2.通过ChIP从富集RNAP II的GM12878细胞生成染色质复合物

GM12878或果蝇S2细胞是用EGS和1％FA单或双交联的，并储存在-80℃直至需要。

RNAPII抗体通过两次用PBS/0.1％TRITON-100洗涤1ml蛋白G珠两次与蛋白G珠结合。将珠子用7ml PBS/0.1％TRITON X-100悬浮并在4℃旋转孵育6-8小时。

将1×10⁸个GM12878细胞用室温PBS(PI)洗涤两次。细胞和核裂解是通过在室温下将细胞加入至10ml 0.1％细胞裂解缓冲液(PI)6分钟实现的。然后将900μl 10％SDS在37℃下加入并将细胞在10rpm旋转10分钟。细胞在显微镜下观察。如果裂解未充分完成，则重复裂解程序。一旦裂解充分完成，将细胞用0.1％细胞裂解缓冲液(无TRITON或PI)洗涤两次并悬浮于含TRITON X-100(PI)的10ml冰冷0.1％细胞裂解缓冲液中用于超声。

将细胞等分至试管中用于超声。将细胞以38％振幅，20秒打开/30秒关闭超声处理6分钟，然后以1700g离心5分钟。

染色质通过将1ml蛋白G磁珠与超声处理的染色质复合物一起在4℃下旋转孵育至少2小时来预清洁。将超声处理的染色质和蛋白G磁珠在4℃下低速(～100×g)离心1分钟。上清液包含预清洁的染色质。

过量的RNAPII通过用0.1％triton/PBS洗涤RNAPII结合抗体珠三次而从蛋白G磁珠中去除。

为了进行ChIP，丢弃抗体结合珠的上清液。将预清洁的染色质转移至抗体结合珠并在4℃下孵育过夜。保留20μl等分试样的染色质用于片段大小质量控制。

在染色质和RNAPII抗体结合珠孵育过夜后，珠子用0.1％细胞裂解缓冲液(PI)洗涤三次；0.1％细胞裂解缓冲液/350mM NaCl(PI)洗涤一次，LiCl缓冲液洗涤一次，和TE(PI)洗涤三次。

实施例3.末端钝化超声处理的DNA片段

结合至抗体结合珠的染色质用洗涤缓冲液洗涤，然后用冰冷的TE缓冲液(Ambion，AM9849，无核酸酶)洗涤。

将T4聚合酶主混合物(所需体积的1.2倍)在冰上在新的试管中制备。主混合物需要615.8μl无核酸酶水，用于T4 DNA聚合酶的170μl 0x缓冲液，和170μl 10mM dNTP。

将TE缓冲液从抗体结合珠丢弃，并且将692.8μl T4 DNA聚合酶主混合物等分到4个含有珠的试管的每一个中。将0.2μl T4 DNA聚合酶(Promega，M4215)添加到磁珠。将DNA聚合酶和磁珠混合并在37℃下在INTELLI-MIXER上旋转孵育40分钟(程序：F8，30rpm；U＝50，u＝60)(http://www.elminorthamerica.com/collections/intelli-mixers/products/e lmi-rm-21-intelli mixers-large-includes-mix-rack)。40分钟后，将试管从37℃培养箱中取出。将T4 DNA聚合酶主混合物丢弃。将珠用冰冷的洗涤缓冲液[PI]洗涤三次，然后用TE洗涤一次。

实施例4.染色质片段的加dA尾

克列诺(3'-5'exo-)主混合物包含以下组分：无核酸酶水(616μl)、10×NEB缓冲液2(70μl)，和10mM dATP(7μl)。将7μl克列诺片段(3'-5'exo-)和克列诺主混合物加入至含有染色质片段的珠。将珠在37℃下孵育50分钟。将含有染色质片段的试管从37℃培养箱中取出。将克列诺主混合物从珠倾析出并丢弃。将珠用冰冷的洗涤缓冲液[PI]洗涤三次，然后用TE洗涤一次。

实施例5.将生物素和荧光标记连接至条形码化接头

制备连接缓冲液，其包含1,110μl无核酸酶的水，4μl混合接头和280μl 5×T4 DNA连接酶缓冲液。将连接酶缓冲液加入至含染色质的珠中并通过轻弹混合。将6μl T4 DNA连接酶加入至混合物，轻弹混合，然后短暂旋转并轻轻涡旋。将混合物在16℃下孵育过夜。

实施例6.从蛋白G磁珠释放染色质

将珠用缓冲液洗涤三次以去除过量的接头。制备含有％SDS(100μl 10％SDS+900μl Buffer TE)的洗脱缓冲液。将200μl洗脱缓冲液加入至蛋白G珠中。将试管放在INTELLI-MIXER上，室温旋转(F8,30rpm,U＝50,u＝60)30分钟。将来自蛋白G珠的含染色质DNA复合物的200μl洗脱缓冲液转移到新鲜试管中。该释放反应通过加入1.6％triton X-100缓冲液并在37℃孵育1小时来终止。

实施例7.SEQ LL平台上的样品分析

在添加染色质复合物之前，SEQ LL流动池表面用四盐酸精胺封闭1小时，用成像缓冲液洗涤，然后用链霉抗生物素蛋白(0.2mg/ml)涂覆10分钟。流动池表面用成像缓冲液洗涤。成像缓冲液包含pH 6.5的10mM MES、60mM KC1、0.32mM EDTA、3mM MgCl₂、10％甘油、0.1mg/ml乙酰化BSA，和0.02％Igepal。染色质复合物杂交到SEQ LL流动池表面上。

实施例8.单分子成像(SEQ LL)

具有用于荧光激发的两个激光器，532nm/75mW和640nm/40mW的TIRF显微镜(Compass 215M Cube-40C,Coherent)用于单分子测序。这两个激光束通过带通滤光片(Chroma)过滤，并通过二向色镜(T:640nm，R:532nm)光谱分离。然后激光束穿过TIRF透镜，并通过折射率为1.49的60×TIRF油物镜(Nikon)实现全内反射，并成像到CCD相机上。对染色质复合物成像后，在接头处标记的荧光团通过在成像缓冲液中添加1:10稀释的TCEP来剪切。与TCEP一起孵育10分钟后，流动池用成像缓冲液洗涤。再次对所有位置成像，并从进一步分析中排除残差斑点(留下的斑点中的少于2％)。

实施例9.免疫染色

抗体特异性斑点印迹测定(RNAPII，ChIP级)通过用4ml封闭缓冲液(含5％脱脂干奶粉的TBST)封闭与流动池阵列结合的染色质4小时来进行。然后，流动池阵列用TBST洗涤3次，并加入一抗。抗体在转子上在4℃下孵育过夜。然后将阵列在TBST中洗涤3次。将二抗在室温下加入1小时。将阵列在TBST中再洗涤3次，并通过预吸附的FluorChem Q(驴抗小鼠IgGH&L(ALEXA FLUOR 647)(ab150111)检测信号。

将抗体在成像缓冲液中稀释至50-100ng/ml的终浓度，并且每15分钟拍摄图像，总孵育时间3小时。(对于需要对超过两个标记成像的实验，流动池用成像缓冲液普遍地洗涤(对于每次洗涤，10次洗涤×5分钟孵育)。再次对所有位置成像，并从进一步分析中排除残差斑点。然后，像第一轮中那样应用和成像第二轮抗体。

实施例10.单分子测序

单分子脚本适于在随时间对流动池成像抗体结合和解离事件时禁用流体学。流动池用2M NaCl洗涤10分钟，并升温至37℃。smChIA的去交联从染色质复合物中释放蛋白质。去交联过程可以用以下两种方法进行。

方法1.将流动池与在含0.5％SDS缓冲液的TE缓冲液中的蛋白酶K一起在50℃下孵育过夜或至少4小时。

方法2.将流动池与含0.5％SDS缓冲液的TE缓冲液一起在65℃下孵育2小时，然后与在含0.5％SDS缓冲液的TE缓冲液中的蛋白酶K一起孵育4小时或过夜。

去交联后，应用USER限制性酶，并在37℃下孵育1小时。将流动池用预热至55℃的H₂O洗涤多次。加入终浓度为10nM的引物，使引物杂交20分钟，然后洗涤。然后进行单分子测序。

实施例11.使用SEQ LL平台的单分子ChIP测序(smChIP)

在本研究中，RNAPII ChIP富集的染色质材料是从果蝇S2细胞制备的。来自固定染色质的单分子DNA测序是在SEQ LL平台上进行的，并将获得的smChIP数据与先前生成的RNAPII ChIA-PET数据进行比较。

对于smChIA实验，GM12878或果蝇S2细胞是用1％甲醛和1.5mM EGS单或双交联的。进行以下步骤前，交联的细胞可任选地储存在-80℃。交联的S2细胞进行细胞和核裂解。将染色质纤维通过超声处理成约3kb片段而剪切成染色质复合物。对于超声处理的染色质复合物材料，将混合的条形码化接头连接至剪切的染色质复合物中的DNA(每个都有独特的条形码和生物素)，然后将染色质样品加载到链霉抗生物素蛋白涂覆的流动池表面上，使复合物杂交并成像以确定流动池上的染色质密度。进一步地，蛋白质通过去交联而去除，留下固定的基因组DNA片段在表面上用于使用一个引物(P1)进行测序。在一次测试运行中，生成16,579个优质读取结果。

我们进一步测试了DNA是否可以使用SEQ LL平台直接从染色质复合物测序，而不去除蛋白质组分。smChIA产生48,777个读取结果，证实高质量smChIP读取结果确实是直接从染色质复合物稳健地产生，而不首先去交联蛋白质。smChIP读取结果的大多数是～30bp(图4A)。

这些smChIP读取结果映射到果蝇参比基因组(dm3)显示在RNAPII结合峰处的显著富集，该RNAPII结合峰先前已知与染色质相互作用有关，如通过RNAPII ChIA-PET识别的(图4B)。

从染色质复合物直接进行smChIP测序的能力大大简化了整个smChIA程序并避免了蛋白质去除可引入的技术人为现象。

实施例12.单分子染色质相互作用分析(smChIA)

在成功的smChIP程序之后，测试了使用SEQ LL平台作为核心的染色质复合物的顺序测序。染色质样品如上所述制备。我们没有使用一个引物进行测序，而是连续使用两个引物(P1和P2)。这些引物对应于连接到固定在流动池表面上的染色质DNA片段的接头中的两个。因为对应于染色质复合物的每个DNA簇是直径为～400nm，接近TIRF显微镜的光学分辨率，所以来自相同光学斑点的预期单分子测序读取结果具有与多种测序引物一致的核苷酸组成。图3显示了四个DNA模板，其连续使用第一引物(P1)之后是第二引物(P2)通过顺序测序而单独地测序，P1测序阶段产生16nt读取结果，6nt来自第一引物P1，10nt来自染色质DNA，P2测序也产生16nt读取结果，6nt来自第二引物P2，10nt来自第二染色质DNA片段。得益于小的果蝇基因组大小，大多数10nt染色质序列可以独特地映射到果蝇参比基因组，允许序列读取结果实际上是基因组的的验证，并阐明了配对相互作用基因座的基因组位置。

使用传统的ChIA-PET数据作为参考，我们发现smChIA读取结果中的许多落入预先限定的相互作用基因座内，如RNAPII ChIA-PET先前识别的(图5C)。

实施例13.用于smChIA的原型仪器的开发

基于上述smChIA，我们针对smChIA特定需求改变了当前SEQ LL平台。当前SEQ LL平台设计用于全基因组单分子DNA和RNA测序，其跨越50个流动池通道并使用单激光进行荧光激发。该系统已经被改变用于同时检测个体核小体的组蛋白标记和基因组位置(Shema,等,(2016)PMID:27151869)。

在smChIA特异性原型中，减小了流动池足迹大小以能够快速实验并降低实验成本。对于流体学模块，减少了死体积和足迹大小。使用～250mW功率激光的多色成像已合并到光学部件中。这些改变通过使用目前在SEQ LL生产的成对标记的C/T、A/G可逆终止子，显著地降低了成本并允许减少的测序化学时间。该设计是灵活的，允许将来合并另外的彩色激光。最后，配制了控制软件用于成像和数据分析。该软件允许成像/测序一系列视场并以行业标准FASTQ格式生成数据。

实施例14.smChIA应用于单核(SN)/单细胞(SC)

smChIA方法不确定多个不同的染色质复合物是否同时共存于个体单核或不同核中。因此我们将smChIA技术扩展到单核水平(即单核smChIA)。因为单细胞包含单核，单核smChIA技术也被称为单细胞smChIA技术。

smChIA方法的单核应用利用了用于进行原位透化和限制性酶消化随后接头连接的现存技术(图8)。这允许全基因组通过接头标记的核的产生，直接与链霉抗生物素蛋白涂覆的流动池表面杂交。重要的是，核的特定稀释度必须由实验确定以确保单细胞彼此分离，使得它们可以区分为不同的个体核(图8)。

一旦单核与流动池杂交，核可以被裂解并且内容物分散，使得单染色质复合物可以被分辨。该方法允许适当分离个体染色质复合物而不破坏个体核的空间区分，使得分析提供了它们各自的单核中包含的许多单染色质复合物的序列和蛋白质组成(图9)。

优化的原位染色质消化程序用于单核smChIA。首先将细胞通过甲醛(1％)处理交联。然后将细胞与低盐缓冲液一起孵育以进行细胞裂解。分离的核通过在SDS(0.5％)中孵育来溶解。为了防止SDS影响限制性酶功效，将核用DPSB/0.1％triton X-100洗涤。然后将核与MboI(4bp切割器)一起在37℃下孵育过夜。

洗涤后，将核中的消化的染色质片段进行末端修复和加A尾，然后连接至具有额外荧光标记的DNA条形码化接头1(P1)，例如用ALEXA 647标记的。共聚焦显微镜检查显示具有强ALEXA 647荧光信号的完整核，表明染色质消化和接头连接的原位操纵是成功的(图9A)。

因为核已经被透化用于原位消化和接头连接，连接至染色质片段的生物素基团中的一些暴露在核表面，因此允许个体核半固定在链霉抗生物素蛋白涂覆的载玻片上。

将单核的所得染色质制备物用DPBS/0.1％triton X-100溶液洗涤，并通过TIRF荧光显微镜检查(图4C)。

在本说明书中引用的所有出版物和专利均通过引用全文并入本文。在不脱离本发明的范围和精神的情况下，本发明所述的组合物、方法和系统的各种修改和变化对本领域技术人员是明显的。尽管已经结合特定的优选实施方式和某些工作实施例对本发明进行了描述，但应理解，要求保护的本发明不应不当地受限于这样的特定实施方式。

Claims

1.一种确定单分子水平上的染色质相互作用的方法，所述方法包括以下步骤：

a)交联细胞中的基因组DNA和蛋白质；

d)将所述条形码化染色质复合物固定到表面上；

2.根据权利要求1所述的方法，其中在将所述条形码化染色质复合物固定到表面上之前，所述条形码化染色质复合物通过能够结合所述条形码化染色质复合物中的所述特定蛋白质的第一抗体而免疫沉淀。

3.根据权利要求1所述的方法，其中对所述条形码化染色质复合物成像包括用能够结合所述条形码化染色质复合物中的所述特定蛋白质的第二抗体对所述条形码化染色质复合物进行免疫染色。

4.根据权利要求2或3所述的方法，其中所述第一抗体和所述第二抗体相同。

5.根据权利要求2至4中任一项所述的方法，其中使所交联的基因组DNA片段化提供了多个染色质复合物，并且所述免疫沉淀使所述多个染色质复合物富集含有所述第一抗体结合的蛋白质的染色质复合物。

6.根据权利要求5所述的方法，其中所述免疫沉淀使所述多个染色质复合物与所述免疫沉淀之前的所述多个染色质复合物相比富集所述含有所述第一抗体结合的蛋白质的染色质复合物至少2倍。

7.根据权利要求1至6中任一项所述的方法，其中所述条形码化接头包含荧光标记。

8.根据权利要求1至7中任一项所述的方法，其中所述条形码化接头还包含生物素分子，并且所述表面是链霉抗生物素蛋白涂覆的表面。

9.根据权利要求1至8中任一项所述的方法，其中所述交联是在细胞中进行，以使所述染色质复合物在所述细胞中保持完整，随后透化所述细胞。

10.根据权利要求1至9中任一项所述的方法，其中所述交联步骤是使用甲醛、EGS或两者进行。

11.根据权利要求10所述的方法，其中所述交联步骤是使用0.5至3.0％v/v甲醛和0.5mM至5mM EGS或两者进行。

12.根据权利要求10所述的方法，其中所述交联步骤是使用1.0％v/v甲醛和1.5mM EGS进行。

13.根据权利要求1至12中任一项所述的方法，其中所述透化步骤是使用洗涤剂进行。

14.根据权利要求13所述的方法，其中所述透化步骤是使用0.1％至3.0％w/v SDS进行。

15.根据权利要求13所述的方法，其中所述透化步骤是使用0.5％w/v SDS进行。

16.根据权利要求1至15中任一项所述的方法，其中所述片段化步骤是通过超声进行。

17.根据权利要求1至15中任一项所述的方法，其中所述片段化步骤是通过限制性酶消化进行。

18.根据权利要求2至17中任一项所述的方法，其中所述条形码化染色质复合物被能够结合转录因子或染色质结构因子的抗体免疫沉淀。

19.根据权利要求18所述的方法，其中所述抗体能够结合RNAPII、RARA、ER、CTCF或黏连蛋白。

20.根据权利要求2至17中任一项所述的方法，其中所述第一抗体是ChIP抗体，其选自H3R2me2、AF9、AML1-ETO、BRD4、C/EBP、CBFb、CBX2、CBX8、CHD1、CHD7、CRISPR/Cas9、CTCF、CXXC1、DNMT3B、E2F6、ERR、ETO、EZH2、FOXA1、FOXA2、FOXM1、FUBP1、GR、GTF2E2、组蛋白H2A.X、H2A.Z、H2A.Zac、H2A.ZK4ac、H2A.ZK7ac、H2AK119ub、H2AK5ac、H2BK12ac、H2BK15ac、H2BK20ac、H2BK123ub、H2Bpan、H3.3、H3K14ac、H3K18ac、H3K18me1、H3K18me2、H3K23me2、H3K27ac、H3K27me1、H3K27me2、H3K27me3、H3K27me3S28p、H3K36me1、H3K36me2、H3K36me3、H3K4ac、H3K4me1、H3K4me2、H3K4me3、H3K4me3T6p、H3k4un、H3K56ac、H3K56me1、H3K64me3、H3K79ac、H3K79me1、H3K79me3、H3K9/14ac、H3K9ac、H3K9acS10p、H3K9me1、H3K9me2、H3K9me3、H3Kme3S10p、H3K9un、H3pan、H3R17me2、H3R17me2(asym)、H3R17me2(asym)K18ac、H3R2me2K4me2、H3T6pK9me3、H4K12ac、H4K16ac、H4K20ac、H4K20me1、H4K20me2、H4K20me3、H4K5,8,12ac、H4K5ac、H4K8ac、H4pan、H4S1p、HDAC1、HDAC2、HDAC3、HIF1α、HP1、JARID1C、JMJ2a、JMJD6、KAP1、KAT2B、KDM6A、LSD1、MBD1、MBD1、MeCP2、MYH11、NCOR1、NF-E2、NFKB、NFYB、NRF1、NRF2、OCT4、p300、p53、PARP1、PAX8、Po1 II、Po1 II S2p、PPARG、RbAp48、RBBP5、RFX-AP、RNF2、SAP30、SIN3A、Ski3、Ski8、SMAD1、SMAD2、SMYD3、Suz12、TAL1、TARDBP、TRP、TFIIF、THOC1、TIP5、TRRAP、Ty1、UHRF1、YY1、ZHX2和ZMYM3。

21.根据权利要求3至20中任一项所述的方法，其中所述条形码化染色质复合物被能够结合转录因子或染色质结构因子的抗体免疫染色。

22.根据权利要求21所述的方法，其中所述抗体能够结合RNAPII、RARA、ER、CTCF或黏连蛋白。

23.根据权利要求3至20中任一项所述的方法，其中所述第二抗体是ChIP抗体，其选自H3R2me2、AF9、AML1-ETO、BRD4、C/EBP、CBFb、CBX2、CBX8、CHD1、CHD7、CRISPR/Cas9、CTCF、CXXC1、DNMT3B、E2F6、ERR、ETO、EZH2、FOXA1、FOXA2、FOXM1、FUBP1、GR、GTF2E2、组蛋白H2A.X、H2A.Z、H2A.Zac、H2A.ZK4ac、H2A.ZK7ac、H2AK119ub、H2AK5ac、H2BK12ac、H2BK15ac、H2BK20ac、H2BK123ub、H2Bpan、H3.3、H3K14ac、H3K18ac、H3K18me1、H3K18me2、H3K23me2、H3K27ac、H3K27me1、H3K27me2、H3K27me3、H3K27me3S28p、H3K36me1、H3K36me2、H3K36me3、H3K4ac、H3K4me1、H3K4me2、H3K4me3、H3K4me3T6p、H3k4un、H3K56ac、H3K56me1、H3K64me3、H3K79ac、H3K79me1、H3K79me3、H3K9/14ac、H3K9ac、H3K9acS10p、H3K9me1、H3K9me2、H3K9me3、H3Kme3S10p、H3K9un、H3pan、H3R17me2、H3R17me2(asym)、H3R17me2(asym)K18ac、H3R2me2K4me2、H3T6pK9me3、H4K12ac、H4K16ac、H4K20ac、H4K20me1、H4K20me2、H4K20me3、H4K5,8,12ac、H4K5ac、H4K8ac、H4pan、H4S1p、HDAC1、HDAC2、HDAC3、HIF1α、HP1、JARID1C、JMJ2a、JMJD6、KAP1、KAT2B、KDM6A、LSD1、MBD1、MBD1、MeCP2、MYH11、NCOR1、NF-E2、NFKB、NFYB、NRF1、NRF2、OCT4、p300、p53、PARP1、PAX8、Po1 II、Po1 II S2p、PPARG、RbAp48、RBBP5、RFX-AP、RNF2、SAP30、SIN3A、Ski3、Ski8、SMAD1、SMAD2、SMYD3、Suz12、TAL1、TARDBP、TRP、TFIIF、THOC1、TIP5、TRRAP、Ty1、UHRF1、YY1、ZHX2和ZMYM3。

24.根据权利要求1至23中任一项所述的方法，其中所述染色质DNA在连接所述条形码化接头之前进行末端修复和加A尾。

25.根据权利要求1至24中任一项所述的方法，其中2至8个不同的条形码化接头连接至所述染色质复合物中的所述基因组DNA。

26.根据权利要求1至25中任一项所述的方法，其中所述条形码化接头包含选自SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8的寡核苷酸。

27.根据权利要求1至26中任一项所述的方法，其中所述条形码化接头包含模板链和非模板链，所述模板链包含在3'端处共价结合生物素分子的10-50个核苷酸，所述非模板链包含在多个基因座处的尿嘧啶和在5'端处标记的荧光。

28.根据权利要求1至27中任一项所述的方法，其还包括在将所述条形码化染色质复合物固定到所述表面上之后将所述条形码化染色质复合物去交联以释放所述染色质复合物中的所述蛋白质的步骤。

29.一种确定单核中的染色质相互作用的方法，所述方法包括以下步骤：

a)提供单核，所述核包含基因组DNA和蛋白质；

b)交联所述核中的基因组DNA和蛋白质；

e)将所述单核固定到表面上；

i)在单分子水平上对所述条形码化染色质复合物进行顺序地测序以产生多个序列读取结果；和

j)将所述多个序列读取结果映射至参比基因组以产生所述测序读取结果的基因组位置以产生3D基因组联系图；

30.根据权利要求29所述的方法，其中所述交联步骤是使用甲醛、EGS或两者进行。

31.根据权利要求29所述的方法，其中所述交联步骤是使用0.5至5.0％v/v甲醛、0.5mM至5.0mM EGS或两者进行。

32.根据权利要求29所述的方法，其中所述交联步骤是使用1％甲醛和1.5mM EGS进行。

33.根据权利要求29至32中任一项所述的方法，其中所述条形码化接头包含荧光标记。

34.根据权利要求29至33中任一项所述的方法，其中所述条形码化接头包含生物素分子，并且所述表面是链霉抗生物素蛋白涂覆的表面。

35.根据权利要求29至34中任一项所述的方法，其中所述核裂解步骤是使用ExM进行。

36.根据权利要求29至34中任一项所述的方法，其中所述核裂解步骤是使用洗涤剂进行。

37.根据权利要求36所述的方法，其中所述洗涤剂是0.1％至3.0％w/v SDS。

38.根据权利要求36所述的方法，其中所述洗涤剂是0.5％w/v SDS。

39.根据权利要求29至38中任一项所述的方法，其中使所交联的基因组DNA片段化是通过限制性酶消化。

40.根据权利要求39所述的方法，其中所述限制性酶是MboI。

41.根据权利要求24至40中任一项所述的方法，其中所述染色质DNA在连接所述条形码化接头之前进行末端修复和加A尾。

42.根据权利要求24至41中任一项所述的方法，其中2或更多个不同的条形码化接头连接至所述染色质复合物中的所述基因组DNA。

43.根据权利要求42所述的方法，其中2至8个不同的条形码化接头连接至所述染色质复合物中的所述基因组DNA。

44.根据权利要求24至43中任一项所述的方法，其中所述条形码化接头包含选自SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7和SEQ ID NO:8的寡核苷酸。

45.根据权利要求24至44中任一项所述的方法，其中所述条形码化接头包含模板链和非模板链，所述模板链包含在3'端处共价结合生物素分子的10-50个核苷酸，所述非模板链包含在多个基因座处的尿嘧啶和在5'端处标记的荧光。

46.根据权利要求24至45所述的方法，其中所述免疫染色步骤是使用针对所述核中的所述蛋白质中的任一种的抗体进行。

47.根据权利要求46所述的方法，其中所述蛋白质是转录因子或染色质结构因子。

48.根据权利要求46所述的方法，其中所述蛋白质是RNAPII、RARA、ER、CTCF或黏连蛋白。

49.根据权利要求29至48中任一项所述的方法，其还包括在将所述条形码化染色质复合物固定到链霉抗生物素蛋白涂覆的基底上之后将所述条形码化染色质复合物去交联以释放所述染色质复合物中的所述蛋白质的步骤。

50.根据权利要求29至49中任一项所述的方法，其中所述条形码化染色质复合物被能够结合转录因子或染色质结构因子的抗体免疫染色。

51.根据权利要求50所述的方法，其中所述抗体能够结合RNAPII、RARA、ER、CTCF或黏连蛋白。

52.根据权利要求29至49中任一项所述的方法，其中所述抗体是ChIP抗体，其选自H3R2me2、AF9、AML1-ETO、BRD4、C/EBP、CBFb、CBX2、CBX8、CHD1、CHD7、CRISPR/Cas9、CTCF、CXXC1、DNMT3B、E2F6、ERR、ETO、EZH2、FOXA1、FOXA2、FOXM1、FUBP1、GR、GTF2E2、组蛋白H2A.X、H2A.Z、H2A.Zac、H2A.ZK4ac、H2A.ZK7ac、H2AK119ub、H2AK5ac、H2BK12ac、H2BK15ac、H2BK20ac、H2BK123ub、H2Bpan、H3.3、H3K14ac、H3K18ac、H3K18me1、H3K18me2、H3K23me2、H3K27ac、H3K27me1、H3K27me2、H3K27me3、H3K27me3S28p、H3K36me1、H3K36me2、H3K36me3、H3K4ac、H3K4me1、H3K4me2、H3K4me3、H3K4me3T6p、H3k4un、H3K56ac、H3K56me1、H3K64me3、H3K79ac、H3K79me1、H3K79me3、H3K9/14ac、H3K9ac、H3K9acS10p、H3K9me1、H3K9me2、H3K9me3、H3Kme3S10p、H3K9un、H3pan、H3R17me2、H3R17me2(asym)、H3R17me2(asym)K18ac、H3R2me2K4me2、H3T6pK9me3、H4K12ac、H4K16ac、H4K20ac、H4K20me1、H4K20me2、H4K20me3、H4K5,8,12ac、H4K5ac、H4K8ac、H4pan、H4S1p、HDAC1、HDAC2、HDAC3、HIF1α、HP1、JARID1C、JMJ2a、JMJD6、KAP1、KAT2B、KDM6A、LSD1、MBD1、MBD1、MeCP2、MYH11、NCOR1、NF-E2、NFKB、NFYB、NRF1、NRF2、OCT4、p300、p53、PARP1、PAX8、Po1 II、Po1 II S2p、PPARG、RbAp48、RBBP5、RFX-AP、RNF2、SAP30、SIN3A、Ski3、Ski8、SMAD1、SMAD2、SMYD3、Suz12、TAL1、TARDBP、TRP、TFIIF、THOC1、TIP5、TRRAP、Ty1、UHRF1、YY1、ZHX2和ZMYM3。

53.根据权利要求29至52中任一项所述的方法，其中所述染色质DNA在连接所述条形码化接头之前进行末端修复和加A尾。

54.根据权利要求29至53中任一项所述的方法，其中2至8个不同的条形码化接头连接至所述染色质复合物中的所述基因组DNA。

55.根据权利要求1至54中任一项所述的方法，其中所述条形码化接头包含选自SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8的寡核苷酸。

56.根据权利要求29至55中任一项所述的方法，其中所述条形码化接头包含模板链和非模板链，所述模板链包含在3'端处共价结合生物素分子的10-50个核苷酸，所述非模板链包含在多个基因座处的尿嘧啶和在5'端处标记的荧光。

57.根据权利要求29至56中任一项所述的方法，其还包括在将所述条形码化染色质复合物固定到所述表面上之后将所述条形码化染色质复合物去交联以释放所述染色质复合物中的所述蛋白质的步骤。