WO2021027236A1

WO2021027236A1 - 构建dna文库的方法及其应用

Info

Publication number: WO2021027236A1
Application number: PCT/CN2019/130250
Authority: WO
Inventors: 陈晓丹; 徐护朝; 潘伟业; 李志民; 李大为; 玄兆伶; 王海良; 王娟
Original assignee: 安诺优达基因科技(北京)有限公司; 浙江安诺优达生物科技有限公司
Priority date: 2019-08-12
Filing date: 2019-12-31
Publication date: 2021-02-18
Also published as: CN110607352A

Abstract

本发明提供构建DNA文库的方法及其应用，所述方法包括：提供嵌合标记物的DNA；将所述嵌合标记物的DNA进行转座处理，得到转座产物；对所述转座产物进行捕获处理，得到捕获后的DNA；以及将所述捕获后的DNA进行扩增处理，获得所述DNA文库。

Description

构建DNA文库的方法及其应用

技术领域

本发明涉及生物技术领域，具体地，涉及构建DNA文库的方法及其应用，更具体地，涉及构建DNA文库的方法，一种获得个体细胞内染色质相互作用信息的方法，一种获得个体生物信息的方法、一种三维基因组研究方法，一种产前诊断或癌症筛查的方法，一种试剂盒，以及该试剂盒在三维基因组建库或产前诊断或癌症筛查中的用途。

背景技术

现有二代测序文库构建技术步骤繁多，尤其是最后的末端修复到PCR之前的多步操作都很可能造成有效片段的丢失。在三维基因组Hi-C建库中更为显著，标记生物素的嵌合体DNA作为建库模板是相对微量的，所以钓取后有效片段丢失会直接影响最终文库质量。并且，片段筛选步骤，这一步是为了使文库可以适应illumina的边合成边测序原理而设定，但片段过长会导致测序数据质量较差。同时，也会使相当一部分可用文库片段因为片段长度问题被筛选掉，尤其是纳克级别模板的条件下，筛选会导致有效文库数量减少，直接影响有效数据比例。

由此，现有的文库构建方法有待改进。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此，本发明的一个目的在于提出一种构建DNA文库的方法，该方法在建库过程中引入了转座酶，简化了DNA片段化和加接头的步骤，无需末端修复、3’端加碱基A，建库时间短，文库产物的片段长度适宜，无需进行片段筛选即可直接上机测序，并且测序的有效数据比例高。

需要说明的是，本发明是基于发明人的下列工作而完成的：

发明人在Hi-C建库中引入转座酶。由于转座酶上带有两段短的核酸，其即为适应于illunima测序的接头，当转座酶随机片段化DNA时，会同时给DNA小片段两端连接上接头，再使用特定的引物扩增即可得到可以测序的文库，如图1所示，显著简化了建库流程，缩短了建库时间，并且使Hi-C文库的有效数据比例显著提升。

因而，根据本发明的第一方面，本发明提供了一种构建DNA文库的方法。根据本发明的实施例，该方法包括：提供嵌合标记物的DNA，其中，所述嵌合标记物的DNA具有三维结构信息；将所述嵌合标记物的DNA进行转座处理，以便得到转座产物；对所述转座产物进行捕获处理，以便得到捕获后的DNA；以及将所述捕获后的DNA进行扩增处理，以便获得所述DNA文库。

根据本发明实施例的构建DNA文库的方法，在建库过程中，尤其是Hi-C建库过程中，通过转座处理简化了DNA片段化和加接头的步骤，无需末端修复和3’端加碱基A步骤，建库时间显著缩短，文库产物的片段长度适宜，无需进行片段筛选即可直接上机测序，尤其适用于痕量DNA样本Hi-C文库的构建，并且测序的有效数据比例高，噪音单末端悬挂值低。

进一步地，基于上述构建DNA文库的方法，根据本发明的第二方面，本发明提供了一种获得个体细胞内染色质相互作用信息的方法。根据本发明的实施例，该方法包括：利用前述的方法，以便得到所述个体的DNA文库；对所述DNA文库进行测序和分析，以便获得所述个体细胞内染色质相互作用信息。由此，获得个体细胞内染色质相互作用信息的方法的步骤简化，操作时间缩短，尤其适用于痕量DNA样本的Hi-C文库构建，并且测序的有效数据比例高，噪音单末端悬挂值低，获得的细胞内染色质相互作用信息有利于三维基因组领域的研究。其中，需要说明的是，该构建DNA文库的方法具有前述构建DNA文库的方法的全部技术特征和效果，在此不再一一赘述。

进一步地，基于上述构建DNA文库的方法，根据本发明的第三方面，本发明提供了一种获得个体生物信息的方法。根据本发明的实施例，该方法包括：利用前述的构建DNA文库的方法，以便得到所述个体的DNA文库；对所述DNA文库进行测序和分析，以便获得所述个体生物信息。由此，获得个体生物信息的方法的步骤简化，操作时间缩短，尤其适用于痕量DNA样本的Hi-C文库构建，并且测序的有效数据比例高，噪音单末端悬挂值低，获得的生物信息的有利于用于三维基因组领域的研究和临床诊断。其中，需要说明的是，该构建DNA文库的方法具有前述构建DNA文库的方法的全部技术特征和效果，在此不再一一赘述。

进一步地，根据本发明的第四方面，本发明提供了一种三维基因组研究方法。根据本发明的实施例，所述方法是通过前述的构建DNA文库的方法或前述的获得个体细胞内染色质相互作用信息的方法或前述的获得个体生物信息的方法进行的。由此，构建DNA文库的方法和获得个体生物信息的方法的步骤简化，操作时间缩短，尤其适用于痕量DNA样本的文库构建，并且测序的有效数据比例高，噪音dangling值低，获得的生物信息适于用于三维基因组研究。其中，需要说明的是，该构建DNA文库的方法具有前述构建DNA文库的方法的全部技术特征和效果，在此不再一一赘述。

进一步地，根据本发明的第五方面，本发明提供了一种产前诊断或癌症筛查的方法。根据本发明的收视率，所述方法是通过前述的构建DNA文库的方法或前述的获得个体生物信息的方法或者前述的三维基因组研究方法进行的。由此，构建DNA文库的方法和获得个体生物信息的方法的步骤简化，操作时间缩短，尤其适用于痕量DNA样本的文库构建，并且测序的有效数据比例高，噪音dangling值低，获得的生物信息的有利于用于临床诊断，尤其是产前诊断和癌症筛查。其中，需要说明的是，该构建DNA文库的方法具有前述构建DNA文库的方法的全部技术特征和效果，在此不再一一赘述。

进一步地，根据本发明的第六方面，本发明提供了一种试剂盒，根据本发明的实施例，该试剂盒包括：前述的构建DNA文库的方法中所使用的试剂、引物、介导片段或其中至少一项的组合。由此，该试剂盒构建DNA文库的方法和获得个体细胞内染色质相互作用信息以及生物信息的方法的步骤简化，操作时间缩短，尤其适用于痕量DNA样本的文库构建，并且测序的有效数据比例高，噪音dangling值低，获得的生物信息有利于用于临床诊断，尤其是产前诊断和癌症筛查。其中，需要说明的是试剂盒具有前述构建DNA文库的方法的全部技术特征和效果，在此不再一一赘述。

进一步地，根据本发明的第七方面，本发明提供了前述的试剂盒在三维基因组建库或产前诊断或癌症筛查中的用途。由此，该试剂盒构建DNA文库的方法和获得个体细胞内染色质相互作用信息以及生物信息的方法的步骤简化，操作时间缩短，尤其适用于痕量DNA样本的文库构建，并且测序的有效数据比例高，噪音dangling值低，适于用于三维基因组建库，并且获得的生物信息的有利于用于临床诊断，尤其是产前诊断和癌症筛查。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1显示了根据本发明一个实施例的构建DNA文库的方法的流程比对示意图；

图2显示了根据本发明一个实施例的Tn5转座酶去除噪音数据单末端悬挂值原理示意图；

图3显示了根据本发明一个实施例的文库酶切质控琼脂糖凝胶电泳示意图；

图4显示了根据本发明一个实施例的文库Agilent HS2100峰示意图；

图5显示了根据本发明一个对比例的文库Agilent HS2100峰示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

需要说明的是，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

构建DNA文库的方法

根据本发明的第一方面，本发明提供了一种构建DNA文库的方法。根据本发明实施例的构建DNA文库的方法，在建库过程中，尤其是Hi-C建库过程中，通过转座处理简化了DNA片段化和加接头的步骤，无需末端修复和3’端加碱基A步骤，建库时间显著缩短，根据本发明的实施例，提取DNA后，能够实现3小时快速建库。并且，文库产物的片段长度适宜，无需进行片段筛选即可直接上机测序，尤其适用于痕量DNA样本的Hi-C文库构建，并且测序的有效数据比例高，在一些实施例中，有效数据比例达35％以上，相对于现有技术提高了近10％，噪音单末端悬挂值低。在一些实施例中，无效噪音数据单末端悬挂值仅0.6％。

根据本发明实施例的构建DNA文库的方法，通过转座处理简化了DNA片段化和加接头的步骤，并且转座处理不会作用于DNA小片段的末端，从而使单链末端有生物素的小片段不会被加上接头，进而无法进行PCR反应，从而显著降低甚至去除Hi-C文库的噪音单末端悬挂值。

根据本发明实施例的构建DNA文库的方法，转座处理使DNA被剪切为200-500bp的小片段，此时PCR后的文库产物片段长度主峰也位于约300-600bp以内，无需进行片段筛选即可直接上机测序，进一步简化了实验步骤。

根据本发明实施例的构建DNA文库的方法，简化了实验步骤，降低了实验过程中样本的损失，样本量可降低至10 ³数量细胞。

为了便于理解根据本发明实施例的构建DNA文库的方法，根据本发明的实施例，对该方法进行解释说明，该方法包括：

S100：提供DNA

根据本发明的实施例，提供嵌合标记物的DNA，其中，所述嵌合标记物的DNA具有三维结构信息。具体地，本发明实施例的建库方法以具有三维结构的嵌合标记物的DNA构建Hi-C高通量测序文库，利用高通量测序技术，结合生物信息学方法，研究染色质DNA在空间位置上的关系；通过对DNA相互作用模式进行捕获，获得高分辨率的染色质三维结构信息。

根据本发明的实施例，所述标记物为生物素。由此，以生物素标记DNA，便于后续对DNA的钓取和纯化。

根据本发明的实施例，该嵌合标记物的DNA含有空间上相邻的DNA区段的部分。也就是说，该嵌合标记物的DNA在原细胞核内的染色质上并不是一段连续完整的DNA片段，而是由空间上相邻近的至少两段DNA区段嵌合得到的。进而，利用基于邻近连接的DNA相互作用分析和蛋白质特异性DNA结合对远程染色质相互作用进行分析，有利于定义顺式调控元件的靶基因和注释与各种生理和病理条件相关的非编码序列变体的功能，从而用于临床疾病的病理研究，尤其是癌症机理的探索。

具体地，根据本发明的实施例，获得该嵌合标记物的DNA的方法包括：将细胞内的染色质进行固定交联处理，以形成DNA-蛋白质交联物；将DNA-蛋白质交联物进行酶切处理，以生成含有粘性末端的DNA-蛋白质复合物；用一种或多种含有生物素标记物的核苷酸和无生物素的普通核苷酸补平所述粘性末端，产生平末端随后使平末端连接在一起，形成邻近连接的DNA，如果对于细胞内的全部染色质进行固定，则该邻近连接的DNA为基因组DNA；将所述基因组DNA进行片段化处理，得到所述嵌合标记物的DNA。

S200：转座处理

根据本发明的实施例，将该嵌合标记物的DNA进行转座处理，得到转座产物。由此，仅需一步转座处理即可对嵌合标记物的DNA进行片段化和加接头，取代现有技术中的DNA片段化、末端修复、3’加“A”、加接头等步骤，显著简化了实验流程，缩短了建库时间。

根据本发明的实施例，利用转座酶进行转座处理。在此，以Tn5转座酶为例对建库过程中的转座处理进行解说说明。本发明的一些实施例中，采用的Tn5转座酶是Epicentre公司研发出的Tn5转座酶试剂，由于转座酶上带有两段短的核酸，为了建库的需要，可以为illunima测序的接头，当转座酶随机片段化DNA时，会同时给片段化后的DNA片段两端连接上接头，再使用特定的引物扩增即可得到可以测序的文库。

发明人发现，在Hi-C建库过程中引入转座酶进行转座处理，尤其是Tn5转座酶，至少具有以下优点之一：

第一、简化文库构建步骤：使用转座酶，尤其是Tn5转座酶建库，可取代现有技术中的DNA片段化、末端修复、3’加“A”和加接头等步骤，仅需一步转座处理，可直接将DNA片段化，并给片段加上接头，加接头后的DNA片段长度适宜，直接PCR扩增即可得到文库。本发明实施例的构建DNA文库的方法与现有技术构建DNA文库的方法的对比如图2所示，本申请的实验流程得到明显简化，建库时间显著缩短。根据本发明的实施例，提取DNA后，本发明实施例的方法仅需3小时即可完成快速建库。

第二、增加有效文库比例：现有的Hi-C建库流程中，影响可用数据比例的一个重要原因就是文库的噪音数值单末端悬挂值过高，源自生物素标记后的平末端连接效率太低，导致一些连接失败的单链末端标记生物素的DNA片段也会被链霉亲和素磁珠最终钓取出来，这部分数据占比太高说明文库构建效率是比较低的，甚至导致文库构建失败。Tn5转座酶的特性可使文库减少单末端悬挂的产生，原理在于Tn5不会作用于长度过短DNA片段的末端，例如，长度小于200bp的DNA片段，这样一来单链末端有生物素的小片段DNA就不会被加上接头，进而无法进行PCR反应。而加上接头但中间不含生物素标记的小片段，可以正常PCR，但无法被链霉亲和素磁珠钓取，如图3所示。由此，利用Tn5转座酶的特性即可显著降低甚至去除Hi-C文库的噪音单末端悬挂值。根据本发明的实施例，有效数据比例提升约10％。

第三、不进行文库的片段筛选：Tn5转座酶的特性可使DNA被剪切为200-500bp的小片段，此时PCR后的文库产物片段长度主峰也位于约300-600bp以内，无需进行片段筛选即可直接上机测序，无需再进行片段化处理，简化了实验流程。

根据本发明的实施例，该嵌合标记物的DNA与所述转座酶的比例为10ng：50-100nM。由此，有利于嵌合标记物的DNA重复进行转座处理。发明人经测试发现，转座酶投入量过高时，如加入200nM时，会导致文库片段过小，主峰位于约290bp。因Hi-C文库为两个DNA片段的嵌合，测序数据的基因组比对是将文库两端各截取一个片段来进行的，所以如果文库偏小会导致测序数据的有效部分唯一基因组位置比对率过低，无效部分多重基因组位置比对率过高。所以经过测试发明人发现当DNA与转座酶的比例为10ng：50-100nM时，文库片段长度更适宜(主峰300-600bp)。

根据本发明的实施例，基于10ng所述嵌合标记物的DNA，所述转座处理的反应体系包括：8-12μL转座缓冲液；0.2-1μL 10％吐温20；7-10μL水；0.5-3μL所述转座酶，其中，该转座缓冲液包括10mM Tris-HCl pH 7.6和5mM MgCl ₂。由此，在该反应体系中，转座处理的DNA片段大小适宜。

根据本发明的实施例，该转座处理的温度为50-60℃，时间为5-15分钟。由此，在该温度调节下，有利于DNA片段化至适宜的长度区间。

S300：捕获处理

根据本发明的实施例，对所述转座产物进行捕获处理，得到捕获后的DNA。由此，从转座处理后的反应体系中，捕获加标记物标记的加接头后的DNA进行后续的扩增，减少杂质DNA对扩增的干扰。

根据本发明的实施例，该捕获处理为钓取处理。根据本发明优选的实施例，该钓取处理是利用链霉亲和素磁珠进行的。具体地，通过链霉亲和素磁珠与DNA上标记的生物素相结合，从转座产物中钓取有生物素标记的两端加接头的嵌合DNA片段。

根据本发明的实施例，基于1ng所述提取后的DNA，所述链霉亲和素磁珠的加入量为5-10μL。由此，既有利于从产物中充分捕获生物素标记的两端加接头的DNA，又避免试剂过量造成浪费。

S400：扩增处理

根据本发明的实施例，将提取后的DNA进行扩增处理，获得所述DNA文库。具体地，可以通过PCR扩增提取后的DNA以获得足够的材料。根据本发明的实施例，还可以进一步纯化经PCR扩增的文库。

建库方法的应用

进一步地，基于上述构建DNA文库的方法，根据本发明的第二方面，本发明提供了一种获得个体细胞内染色质相互作用的方法。根据本发明的实施例，该方法包括：利用前述的方法，以便得到所述个体的DNA文库；对所述DNA文库进行测序和分析，以便获得个体细胞内染色质相互作用等生物信息。由此，获得个体细胞内染色质相互作用等生物信息的方法的步骤简化，操作时间缩短，尤其适用于痕量DNA样本的文库构建，并且测序的有效数据比例高，噪音单末端悬挂值低，获得的生物信息的有利于用于临床疾病的病理研究及三维基因组的科学研究。其中，需要说明的是，该构建DNA文库的方法具有前述构建DNA文库的方法的全部技术特征和效果，在此不再一一赘述。

根据本发明的实施例，测序可以通过以下方法来完成：经典的Sanger测序、大规模平行测序、下一代测序、polony测序、454焦磷酸测序、Illumina测序、SOLEXA测序、SOLiD测序、离子半导体测序、DNA纳米球测序、Heliscope单分子测序、单分子实时测序、纳米孔DNA测序、隧穿电流DNA测序、杂交测序、质谱测序、微流体Sanger测序、基于显微镜的测序、RNA聚合酶测序、体外病毒高通量测序、Maxam-Gibler测序、单端测序、配对末端测序、深度测序、超深度测序，尤其适于Illumina测序。

然后，根据本发明的实施例，可以使用生物信息学管道处理测序的读取以绘制长程和/或全基因组范围的染色质相互作用，从而获得个体细胞内染色质相互作用等生物信息。

进一步地，基于上述构建DNA文库的方法，根据本发明的第三方面，本发明提供了一种获得个体生物信息的方法。根据本发明的实施例，该方法包括：利用前述的方法，以便得到所述个体的DNA文库；对所述DNA文库进行测序和分析，以便获得所述个体生物信息。由此，获得个体生物信息的方法的步骤简化，操作时间缩短，尤其适用于痕量DNA样本的Hi-C文库构建，并且测序的有效数据比例高，噪音单末端悬挂值低，获得的生物信息的有利于用于三维基因组领域的研究和临床诊断。其中，需要说明的是，该构建DNA文库的方法具有前述构建DNA文库的方法的全部技术特征和效果，在此不再一一赘述。

进一步地，根据本发明的第四方面，本发明提供了一种产前诊断或癌症筛查的方法。根据本发明的收视率，所述方法是通过前述的构建DNA文库的方法或前述的获得个体生物信息的方法或者前述的三维基因组研究方法进行的。由此，构建DNA文库的方法和获得个体生物信息的方法的步骤简化，操作时间缩短，尤其适用于痕量DNA样本的文库构建，并且测序的有效数据比例高，噪音dangling值低，获得的生物信息的有利于用于临床诊断，尤其是产前诊断和癌症筛查。其中，需要说明的是，该构建DNA文库的方法具有前述构建DNA文库的方法的全部技术特征和效果，在此不再一一赘述。

进一步地，根据本发明的第四方面，本发明提供了一种试剂盒，根据本发明的实施例，该试剂盒包括：前述的构建DNA文库的方法中所使用的试剂、引物、介导片段或其中至少一项的组合。由此，该试剂盒构建DNA文库的方法和获得个体细胞内染色质相互作用信息以及生物信息的方法的步骤简化，操作时间缩短，尤其适用于痕量DNA样本的文库构建，并且测序的有效数据比例高，噪音dangling值低，获得的生物信息的有利于用于临床诊断，尤其是产前诊断和癌症筛查。其中，需要说明的是试剂盒具有前述构建DNA文库的方法的全部技术特征和效果，在此不再一一赘述。

进一步地，根据本发明的第五方面，本发明提供了前述的试剂盒在三维基因组建库或产前诊断或癌症筛查中的用途。由此，该试剂盒构建DNA文库的方法和获得个体细胞内染色质相互作用信息以及生物信息的方法的步骤简化，操作时间缩短，尤其适用于痕量DNA样本的文库构建，并且测序的有效数据比例高，噪音dangling值低，适于用于三维基因组建库，并且获得的生物信息的有利于用于临床诊断，尤其是产前诊断和癌症筛查。

在此需要说明书的是，试剂盒可以用于对本领域技术人员显而易见的任何应用。试剂盒可以包含例如多种缔合分子、亲和标签、固定剂、限制性内切核酸酶、连接酶和/或其组合。在一些情况下，缔合分子可以为蛋白质，包括例如DNA结合蛋白(例如组蛋白或转录因子)。在一些情况下，固定剂可以为甲醛或任何其他DNA交联剂。在一些情况下，试剂盒还可以包含多种珠子。珠子可以是顺磁性的和/或可以是经捕获剂涂覆的。例如，珠子可以是经链霉抗生物素蛋白和/或抗体涂覆的。在一些情况下，试剂盒可以包含衔接子寡核苷酸和/或测序引物。此外，试剂盒可以包含能够使用衔接子寡核苷酸和/或测序引物扩增读取对的装置。在一些情况下，试剂盒还可以包含其他试剂，包括但不限于裂解缓冲液、连接试剂(例如，dNTP、聚合酶、多核苷酸激酶和/或连接酶缓冲液等)和PCR试剂(例如，dNTP、聚合酶、和/或PCR缓冲液等)。该试剂盒还可以包括使用试剂盒组分和/或产生读取对的说明书。

下面参考具体实施例，对本发明进行说明，需要说明的是，这些实施例仅仅是说明性的，而不能理解为对本发明的限制。

下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解，下面的实施例仅用于说明本发明，而不应视为限定本发明的范围。实施例中未注明具体技术或条件的，按照本领域内的文献所描述的技术或条件(例如参考J.萨姆布鲁克等著，黄培堂等译的《分子克隆实验指南》，第三版，科学出版社)或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者，均为可以通过市购获得的常规产品，例如可以采购自Illumina公司。

实施例1

利用本发明实施例的方法，对小鼠细胞为样本，构建DNA文库，并进行测序和质控，具体如下：

一、实验方法

1.实验材料准备

使用小鼠3T3-NIH细胞系为实验材料。冻存的3T3-NIH细胞在37℃水浴中快速融化，在生物安全柜中转入9ml细胞培养液中混匀，细胞培养液包括15％胎牛血清、84％的DMEM培养液及1％的链霉素青霉素抗体(均为V/V)。置于23℃1000rpm的条件下离心10min，弃上清后加入5ml细胞培养液，重悬细胞后转入细胞培养瓶中，置于细胞培养箱中37℃5％CO ₂静置培养。

待细胞长至8成满的时候(约1-2天)，取出培养瓶，在生物安全柜中倒掉培养液，加入5ml PBS轻轻晃动清洗细胞一次。加入1ml胰蛋白酶消化细胞1min，再加入5ml细胞培养液，充分的吹吸细胞使其脱离细胞培养瓶。将细胞悬液转入1.5ml离心管中，23℃1000rpm离心10min，弃上清。加入1ml PBS重悬清洗细胞1次，再次使用上述条件离心，去上清。加入500μL PBS重悬细胞，使用血球计数板技术细胞浓度，计算浓度后取1000个细胞于1.5ml离心管中,标记为“3T3-1K-4”。

2.细胞交联

用PBS将细胞悬液补至100μL，轻微的吹打均匀。加入2.78μL的37％甲醛于细胞悬液中，吹打均匀，室温10min，中间偶尔晃动几次。加入11μL的2.5M甘氨酸于上步液体中，吹打均匀，室温10min，冰上15min彻底终止交联。4℃离心机1000×g离心10min，注意标记离心角度，离心结束后弃掉上清留存沉淀，加入100μL PBS缓慢吹打10次重悬细胞。4℃离心机1000×g离心10min，去上清。沉淀即为交联完成的细胞材料。

3.细胞裂解

向交联好的细胞中加入45μL的细胞裂解液，包括10nM Tris-HCl pH7.4、10mM NaCl、0.1mM EDTA、0.5％NP-40，及5μL蛋白酶抑制剂，吹吸混匀后置于冰上静置裂解1h。裂解完成后置于4℃2500g离心5min，去上清。加入20μL细胞裂解液及10μL 0.5％SDS，置于62℃恒温混匀仪中反应10min。然后加入5μL 10％Trition X-100，置于37℃恒温混匀仪中反应30min。

4.染色质酶切

向上一步反应混合液中加入5μL 10X NEbuffer2、50U Mbo I，用ddH ₂O补至50μL，置于37℃恒温混匀仪中反应4h，伴随15s/2min的1400rpm摇晃。

5.末端生物素标记10mM dATP10mM dGTP10mM dTTP

向酶切产物中分别加入1.5μL的1mM dATP、1mM dGTP、1mM dTTP、3.75μL 0.4mM biotin-14-dCTP及10U的Klenow Fragment，置于37℃恒温混匀仪中反应90min，伴随15s/2min的1400rpm摇晃。

6.平末端连接

向生物素标记产物中加入60μL连接buffer，包括26.5μL ddH ₂O、7μL 10％Trition X-100、24μL 5X T4 ligase buffer、1.2μL 10mg/ml的BSA及400U T4 DNA ligase。置于16℃恒温混匀仪中反应6h以上，伴随15s/2min的1400rpm摇晃。

7.去交联

向连接产物中加入5μL 20mg/ml的蛋白酶K、12μL 10％SDS，置于55℃恒温混匀仪中反应30min。再加入13μL 5M NaCl，置于65℃恒温混匀仪中反应4h，伴随15s/2min的1400rpm摇晃。

8.DNA提取

解交联结束后置于冰上降温，加入2μL 5mg/ml Glycogen，充分吹打混匀。此时总体积约为150μL，加入2倍体积的无水乙醇，混匀后短暂离心，置于-80℃30min沉淀DNA。沉淀结束后4℃18000g离心15min，弃上清。使用80％乙醇清洗沉淀两次后溶于30μL 10mM Tris-HCl pH7.4中，定量。

9.Tn5转座加接头

使用诺唯赞公司的试剂盒TruePrep ^TMDNA Library Prep Kit V2进行转座反应。向DNA溶液中分别加入10μL TTBL、0.5μL 10％Tween20、8.5μL ddH ₂0及1μL转座酶TTE Mix V50，混匀后置于55℃反应10min。产物用1.8X磁珠纯化，洗脱于20μL 10mM Tris-HCl pH7.4中，即为转座产物。

10.生物素钓取

取链霉亲和素磁珠10μL，清洗后与转座产物混合，常温结合40min，置于磁力架上去上清，使用200μL磁珠清洗Washing buffer洗1次，再使用50μL 0.1MNaOH清洗磁珠2次，取100μL的10mM Tris-HCl pH7.4清洗磁珠2次。加入20μL10mM Tris-HCl pH7.4重悬磁珠。

11.PCR扩增

使用诺唯赞公司的试剂盒TruePrep ^TMDNA Library Prep Kit V2配置PCR反应混合试剂，包括10μL 5X TAD、5μL PPM、5μL N5 index、5μL N7 index、4μLddH ₂O及1μL TAE。将上一步钓取产物加入PCR混合试剂，混匀后置于PCR仪中执行如下程序：72℃，5min；98℃，30s；(98℃，15s；60℃，30s；72℃，30s)15Cycles；72℃，5min。产物使用0.9X磁珠纯化即得最终文库。

12.文库质控

将文库使用通用引物扩增后取200ng，用ddH ₂O补至25μL，加入3μL的10X

CutSmart buffer，混匀后分为14μL的两份，标记“-”和“+”，“-”号中加入1μLddH ₂O用于阴性对照，“+”号中加入1μL BspDI，混匀后均置于37℃恒温混匀仪中反应2h。产物使用2％琼脂糖凝胶电泳分离，根据BspDI是否可以把文库切割作为判定文库效率的标准。

文库取3μL分别测定Qpcr浓度和agilent HS2100查看片入片段长度。

13.测序

在Illumina的HiSeq XTen平台进行测序，具体操作均按照官方标准进行。

14.数据质控

使用HiC-pro软件进行数据的比对、文库分子类型的鉴定划分。

二、实验结果

1.过程中定量浓度

表1建库过程中定量浓度

各步浓度如表1所示，数据均正常。

2.文库酶切质控

文库酶切质控琼脂糖凝胶电泳图如图4所示，其中“+”泳道条带对比“-”明显下移，说明BspD I可将文库片段切开，表明文库效率较高。

3.文库Agilent HS2100峰图

文库Agilent HS2100峰图如图4所示，峰图显示文库片段长度为200-1000bp之间，主峰位于400bp处，符合正常Hi-C文库特征。

4.文库测序数据分析结果

本实施例的文库数据分析结果如表2所示，其中，有效数据Valid为36.33％，较现有技术(有效数据Valid多为29％左右)提高约10.33％；无效噪音数据单末端悬挂值仅0.6％，显著低于现有的Hi-C文库的噪音数据值；Cis与Dup与现有技术持平。

表2文库最终数据分析结果

对比例1

按照实施例1的方法，对小鼠细胞为样本，构建DNA文库，并进行测序和质控，其区别在于添加5μL转座酶TTE Mix V50，结果如下所示：

表3文库最终数据分析结果

本对比例的文库峰图如图5所示，主峰在275bp左右，实施例1通过调整转座酶的加入量，调整了文库长度，使主峰在409bp左右，使多重比对显著降低；与实施例1相比，本对比例的唯一比对率和有效数据率显著降低，而重复片段率显著增加

综上所述，本发明实施例的构建DNA文库的方法，在Hi-C建库过程中，通过转座处理简化了DNA片段化和加接头的步骤，无需末端修复和3‘端加碱基A步骤，建库时间显著缩短，文库产物的片段长度适宜，无需进行片段筛选即可直接上机测序，尤其适用于痕量DNA样本的文库构建(10 ³数量细胞的建库)，并且测序的有效数据比例高，噪音单末端悬挂值低，建库效率高。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

一种构建DNA文库的方法，其特征在于，包括：

提供嵌合标记物的DNA，其中，所述嵌合标记物的DNA具有三维结构信息；

将所述嵌合标记物的DNA进行转座处理，以便得到转座产物；

对所述转座产物进行捕获处理，以便得到捕获后的DNA；以及

将所述捕获后的DNA进行扩增处理，以便获得所述DNA文库。
根据权利要求1所述的方法，其特征在于，所述标记物为生物素。
根据权利要求1所述的方法，其特征在于，所述嵌合标记物的DNA含有空间上相邻近的DNA区段的部分。
根据权利要求1所述的方法，其特征在于，获得所述嵌合标记物的DNA的方法包括：

将细胞内的染色质进行固定交联处理，以形成DNA-蛋白质交联物；

将DNA-蛋白质交联物进行酶切处理，以生成含有粘性末端的DNA-蛋白质复合物；以及

用含有一种或多种所述标记物的核苷酸补平所述粘性末端，产生平末端随后使平末端连接在一起，形成邻近连接的基因组DNA。
根据权利要求1所述的方法，其特征在于，利用转座酶进行所述转座处理。
根据权利要求4所述的方法，其特征在于，所述转座酶为Tn5转座酶。
根据权利要求4所述的方法，其特征在于，所述嵌合标记物的DNA与所述转座酶的比例为10ng：50-100nM。
根据权利要求4所述的方法，其特征在于，基于10ng所述嵌合标记物的DNA，所述转座处理的反应体系包括：

8-12μL转座缓冲液；

0.2-1μL 10％吐温20；

7-10μL水；以及

0.5-3μL所述转座酶。
根据权利要求4所述的方法，其特征在于，所述转座处理的温度为50-60℃，时间为5-15分钟。
根据权利要求2所述的方法，其特征在于，所述提取处理为钓取处理，优选地，为链霉亲和素磁珠。
根据权利要求10所述的方法，其特征在于，基于1ng所述提取后的DNA，所述链霉亲和素磁珠的加入量为5-10μL。
一种获得个体细胞内染色质相互作用信息的方法，其特征在于，包括：

利用权利要求1-11任一项所述的构建DNA文库的方法，以便得到所述个体的DNA文库；以及

对所述DNA文库进行测序和分析，以便获得所述个体细胞内染色质相互作用信息。
一种获得个体生物信息的方法，其特征在于，包括：

利用权利要求1-11任一项所述的构建DNA文库的方法，以便得到所述个体的DNA文库；以及

对所述DNA文库进行测序和分析，以便获得所述个体生物信息。
一种三维基因组研究方法，其特征在于，所述方法是通过权利要求1-11所述的构建DNA文库的方法或权利要求12所述的获得个体细胞内染色质相互作用信息的方法或权利要求13所述的获得个体生物信息的方法进行的。
一种产前诊断或癌症筛查的方法，其特征在于，所述方法是通过权利要求1-11所述的构建DNA文库的方法或权利要求12所述的获得个体细胞内染色质相互作用信息的方法或权利要求13所述的获得个体生物信息的方法或者权利要求14所述的三维基因组研究方法进行的。
一种试剂盒，其特征在于，包括：权利要求1-11所述的构建DNA文库的方法中所使用的试剂、引物、介导片段或其中至少一项的组合。
权利要求16所述的试剂盒在三维基因组建库或产前诊断或癌症筛查中的用途。