CN111349690B

CN111349690B - 检测蛋白质dna结合位点的方法

Info

Publication number: CN111349690B
Application number: CN201811584980.9A
Authority: CN
Inventors: 李舟; 徐讯; 章文蔚; 李卓坤; 徐东洋; 杨晋; 徐崇钧; 陈奥
Original assignee: BGI Shenzhen Co Ltd
Current assignee: BGI Shenzhen Co Ltd
Priority date: 2018-12-24
Filing date: 2018-12-24
Publication date: 2024-05-10
Anticipated expiration: 2038-12-24
Also published as: CN111349690A

Abstract

本发明提出了检测蛋白质DNA结合位点的方法。包括：将DNA片段库进行测序；去除测序后的DNA片段库中的新生链；以DNA片段库的DNA片段为模板，将不带有荧光标记的dNTP依次聚合在测序接头的3’端，将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位；记录聚合反应后的DNA片段库中的荧光点位置和所述荧光点的荧光强度；将目标蛋白与所述聚合反应后的DNA片段库进行杂交，所述目标蛋白具有荧光修饰；记录杂交后的DNA片段库中的荧光点位置和所述荧光点的荧光强度；基于杂交后的DNA片段库中的荧光点与聚合反应后的DNA片段库中荧光点的荧光强度或荧光种类的差异，确定目标蛋白质DNA结合位点。

Description

检测蛋白质DNA结合位点的方法

技术领域

本发明涉及生物技术领域，具体地，本发明涉及检测蛋白质DNA结合位点的方法。

背景技术

生物体内众多生物学过程诸如染色体组装，DNA复制，转录，重组，修复，RNA翻译等都会涉及到DNA与蛋白质的相互作用。而这些蛋白质往往都是通过特异的序列与DNA相互作用的。因此研究清楚蛋白质的与DNA的结合位点对于理解生物的生长、发育和调控具有重要意义，能为基础科学研究提供便利，为医疗服务提供参考。

现有的研究蛋白质与DNA相互作用较为经典的方法有EMSA(凝胶阻滞迁移实验)，即在体外用放射性同位素标记DNA，该DNA与蛋白质结合后进行非变性聚丙烯凝胶电泳，结合有蛋白质的DNA迁移速度会比没有结合蛋白质的DNA慢，从而鉴定与蛋白质结合的DNA(Hellman L M,Fried M G.Electrophoretic mobility shift assay(EMSA)fordetecting protein–nucleic acid interactions[J].Nature protocols,2007,2(8):1849.)。

另外一个较为经典的方法是DNase I footprinting(DNase I足迹法)，即利用DNase I分别对结合和未结合蛋白质的DNA进行酶切，结合有蛋白质的DNA会由于位阻效应而在结合位点附近不被DNaseI酶切，没有结合蛋白质的DNA则会被DNaseI完全降解，DNaseI处理后经电泳检测获得较为精确的与蛋白质结合的DNA信息(Brenowitz,M.,Senear,D.F.,Shea,M.A.,and Ackers,G.K.1986b.Quantitative DNase I footprint titration:Amethod for studying protein-DNA interactions.Meth.Enzymol.130:132-181.)。

然而，蛋白质DNA结合位点的检测方法仍需要进一步开发和改进。

发明内容

本申请是基于发明人对以下事实和问题的发现和认识作出的：

现有技术中，EMSA法可以鉴定蛋白质结合的DNA片段但是不能确定具体的结合位点，DNase I foorprinting是在已知能结合的片段中确定大致的DNA结合位点，其检测的位点由于空间位阻效应会比实际的结合位点大8-10个碱基(Carey M F,Peterson C L,SmaleS T.DNase I footprinting[J].Cold Spring Harbor Protocols,2013,2013(5):pdb.prot074328.)。且目前这两种方法都不是高通量的。

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本发明提出了一种能够高通量检测蛋白质的DNA结合位点的方法。

在本发明的第一方面，本发明提出了一种检测蛋白质DNA结合位点的方法。根据本发明的实施例，所述方法包括：将DNA片段库进行测序，以便获得DNA片段库的DNA序列，所述DNA片段库的DNA片段在测序接头互补位后的序列是随机的，所述DNA片段库中的DNA片段预先与所述测序接头互补配对结合；去除测序后的DNA片段库中的新生链；以DNA片段库的DNA片段为模板，将所述测序接头与所述模板进行第二互补配对结合，将不带有荧光标记的dNTP依次聚合在所述测序接头的3’端，将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位；记录聚合反应后的DNA片段库中的荧光点位置和所述荧光点的荧光强度；将目标蛋白与所述聚合反应后的DNA片段库进行杂交，所述目标蛋白具有荧光修饰；记录杂交后的DNA片段库中的荧光点位置和所述荧光点的荧光强度；基于杂交后的DNA片段库中的荧光点与聚合反应后的DNA片段库中荧光点的荧光强度或荧光种类的差异，确定目标蛋白质DNA结合位点。根据本发明实施例的检测方法中，以DNA片段为模板，将不带有荧光标记的dNTP依次聚合在测序接头的3’端，将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位，既保证了新生成的DNA产物与自然界的DNA结构基本一致，而不会影响蛋白质的识别、结合和切割，又起到荧光标记DNA的作用。根据本发明实施例的检测方法能够安全高效且高通量地筛选蛋白质的DNA结合位点，精确确定蛋白质具体的DNA结合片段，相对于现有技术，精准度得到大大提升，时间和成本大大节省。

根据本发明的实施例，上述方法还可以进一步包括如下附加技术特征至少之一：

根据本发明的实施例，所述带有荧光修饰的dNTP的荧光与带有荧光修饰的目标蛋白的荧光相同，所述杂交后的DNA片段库中的荧光点的荧光强度强于聚合反应后的DNA片段库中荧光点的荧光强度，是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示。能够理解的是，当目标蛋白结合于DNA片段库某一DNA片段后，如果目标蛋白荧光与碱基荧光在同一通道，目标蛋白所携带的荧光与聚合反应后的DNA片段库中的荧光点重合，目标蛋白的荧光信号与DNA片段库某一DNA片段的荧光信号叠加，使得结合位点处的荧光信号的强度显著高于杂交前DNA片段库中此位点处的荧光信号的强度，如果目标蛋白荧光与碱基荧光在不同的通道，则蛋白通道的荧光强度，结合目标蛋白后比结合目标蛋白前也显著增强，进而可基于杂交后DNA片段库中的荧光点的荧光强度是否强于聚合反应后的DNA片段库中荧光点的荧光强度，来精确判定杂交后的DNA片段库中的荧光点是否为目标蛋白质DNA结合位点。

根据本发明的实施例，所述带有荧光修饰的dNTP的荧光与带有荧光修饰的目标蛋白的荧光不同，所述杂交后的DNA片段库中的荧光点的荧光不同于聚合反应后的DNA片段库中荧光点的荧光，是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示。能够理解的是，当带有荧光修饰的dNTP的荧光与带有荧光修饰的目标蛋白的荧光不同，如果杂交后的DNA片段库中的荧光点的荧光不同于聚合反应后的DNA片段库中荧光点的荧光，则说明有蛋白质结合到DNA片段库某一DNA片段，则可定性判断杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点。需要说明的是，此处的“荧光不同”是指荧光种类不同，可以理解成荧光物质被激发后所发出的荧光颜色不同。

根据本发明的实施例，进一步基于所确定的目标蛋白质DNA结合位点，确定所述目标蛋白质DNA结合位点的DNA序列。根据本发明实施例的检测方法，可进一步通过生物信息学分析统计得到目标蛋白质DNA结合位点的DNA序列信息。

根据本发明的实施例，所述DNA片段库是以装载在芯片上的DNB(DNA NanoBall)形式存在的。进而利用DNB芯片上DNA片段库进行蛋白质的DNA结合位点的高通量筛选。

根据本发明的具体实施例，所述带有荧光修饰的dNTP的荧光与带有荧光修饰的目标蛋白的荧光相同，所述杂交后的DNA片段库中的荧光点的荧光强度是所述聚合反应后的DNA片段库中荧光点的荧光强度的至少1.5倍或2倍，是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示。发明人发现，若目标蛋白荧光与碱基荧光在同一通道，则通道荧光强度，结合目标蛋白后比结合目标蛋白之前的比值大于1.5，若目标蛋白荧光与碱基荧光在不同的通道，则蛋白通道的荧光强度，结合目标蛋白后比结合目标蛋白之前的比值大于2，则认为该DNB有可能结合蛋白质。

根据本发明的实施例，所述DNA片段库具有18亿个DNA片段。根据发明的具体实施例，所述DNB芯片上最大可以装载18亿个DNA片段，进而可利用DNB(DNA NanoBall)芯片上18亿个DNA片段进行蛋白质的DNA结合位点的高通量筛选。

根据本发明的实施例，所述第一测序和/或聚合反应是在BGISEQ-500测序平台上进行的。

根据本发明的实施例，通过甲酰胺去除第一测序后的DNA片段库中的新生链。发明发现，甲酰胺能有效降低DNA的Tm值，从而达到变性的目的以去除新生链。

根据本发明的实施例，将不带有荧光标记的dNTP依次聚合在所述测序接头3’端是通过35～45个循环的DNA聚合反应实现的，优选地，通过40个循环的DNA聚合反应实现。发明人发现，DNA聚合反应的循环次数不可以少于蛋白质识别DNA序列的长度，否则蛋白质结合不紧密，不利于准确检测DNA结合位点，如本实施例中的cas9，其在测序接头后只要有9bp的DNA长度即可识别，但是cas9蛋白结合实则需要更长的跨度，这样才能使得cas9与目标序列结合更紧密；同时发明人发现，DNA聚合反应的循环次数也不可以长于测序的长度，因为如果超出测序长度，而蛋白质正好结合到了超出的部分则无法进行序列分析。通过35～45个循环的DNA聚合反应将不带有荧光标记的dNTP依次聚合在所述测序接头3’端既可保证目标蛋白与目标序列的紧密结合，又可保证聚合产物不长于测序长度，使得检测结果更加精确和真实可靠。

根据本发明的实施例，将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位是通过一个循环的DNA聚合反应实现的，进而通过单循环将带有荧光标记的碱基聚合在聚合产物的3’端的最后一位，实现DNB的荧光标记，由于每个DNB的位置是固定的，进而可根据这个荧光信号反知该DNB处所对应的DNA片段的序列。

所述目标蛋白的荧光修饰的方式不受特别限制，只要能够实现目标蛋白的荧光修饰即可。根据本发明的具体实施例，所述目标蛋白的荧光修饰是通过荧光二抗修饰、荧光蛋白融合表达或体外荧光标记实现的。

在本发明的第二方面，本发明提出了一种检测蛋白质DNA结合位点的方法。根据本发明的实施例，所述方法包括：将DNA片段以DNA纳米球的形式装载在芯片上，以便获得DNA片段库，所述DNA片段库的DNA片段在测序接头互补位后的序列是随机的，所述DNA片段库中的DNA片段预先与所述测序接头互补配对结合；在BGISEQ-500测序平台上，将所述DNA片段库进行测序，以便获得DNA片段库的DNA序列；利用甲酰胺去除第一测序后的DNA片段库中的新生链；以DNA片段库的DNA片段为模板，将所述测序接头与所述模板进行第二互补配对结合，将不带有荧光标记的dNTP依次聚合在所述测序接头的3’端，聚合反应的循环次数为35～45，优选40；将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位，聚合反应的循环次数为1；记录聚合反应后的DNA片段库中的荧光点的位置和所述荧光点的荧光强度；将目标蛋白与所述聚合反应后的DNA片段库进行杂交，所述目标蛋白具有荧光修饰；记录杂交后的DNA片段库中的荧光点位置和所述荧光点的荧光强度；基于杂交后的DNA片段库中的荧光点与聚合反应后的DNA片段库中荧光点的荧光种类或荧光强度的差异，确定目标蛋白质DNA结合位点；其中，当所述带有荧光修饰的dNTP的荧光与带有荧光修饰的目标蛋白的荧光相同，所述杂交后的DNA片段库中的荧光点的荧光强度强于聚合反应后的DNA片段库中荧光点的荧光强度，是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示；当所述带有荧光修饰的dNTP的荧光与带有荧光修饰的目标蛋白的荧光不同，所述杂交后的DNA片段库中的荧光点的荧光不同于聚合反应后的DNA片段库中荧光点的荧光，是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示；进一步基于所确定的目标蛋白质DNA结合位点，确定所述目标蛋白质DNA结合位点的DNA序列。根据本发明实施例的检测方法，利用DNB(DNA NanoBall)芯片上成千上万个DNA进行蛋白质的DNA结合位点的高通量筛选，既能精确确定蛋白质的具体结合片段，又能通过生物信息分析得出具体的蛋白质特异性结合位点序列信息，大大节省时间和成本，为DNA结合蛋白研究提供了良好的平台。

附图说明

图1是根据本发明实施例的检测蛋白质DNA结合位点的方法的原理图；以及

图2是根据本发明实施例2的生物信息学分析结果。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

实施例1

为了便于理解，申请人将根据本发明实施例的检测蛋白质DNA结合位点的方法的原理展现在图1中，即DNB片段库经过正常的DNA测序、经处理重新变成单链状态后，用不带荧光标记的dNTP聚合生成DNA双链，再用一个循环的荧光dNTP进行荧光标记，加入荧光修饰的蛋白质，进而根据荧光信号的增强判断哪个DNB被结合，从而分析出蛋白质特征序列。

下面将根据本发明实施例的检测蛋白质DNA结合位点的方法具体描述如下：

一.制备DNB并装载到芯片上

使用大肠杆菌基因组文库或其他随机DNA库，根据BGISEQ-500的制备和装载方法制备DNB并装载到芯片上。

二.SE50测序

按照操作手册使用BGISEQ-500的SE50试剂盒进行单端50bp的测序。

三.用甲酰胺去除新生链并杂交测序接头

1、往芯片中泵入300μL PPS缓冲液；

2、泵入300μL 100％的甲酰胺溶液，并于37℃孵育10分钟；

3、泵入300μL PPS缓冲液；

4、泵入300μL WB2缓冲液进行清洗；

5、泵入300μL Block缓冲液并在55℃孵育5分钟；

6、依次泵入300μL WB1，300μL WB2缓冲液进行清洗；

7、泵入300μL PAW缓冲液，再泵入200μL测序接头，室温孵育20min。

四.用不带荧光的dNTP做40个循环的聚合反应

将BGISEQ-500的SE50试剂盒的5号孔位试剂换成6号孔位试剂，6号孔位保持不变，进行40个循环的无拍照聚合，即完成40个循环的聚合反应。

五.做一个循环的带荧光dNTP测序反应

按照操作手册使用BGISEQ-500的SE50试剂盒进行单端1bp的聚合，并拍照记录下每个DNB的位置。

六.杂交荧光修饰的目标蛋白

依次泵入300μL WB1、WB2缓冲液清洗后，泵入200μL溶于其活性缓冲液的标记荧光的待测蛋白，37℃孵育过夜后用WB2缓冲液清洗三遍。若使用荧光二抗则在清洗后泵入荧光二抗，37℃孵育2小时后用WB2缓冲液清洗三遍。

其中，PPS缓冲液包括0.1％Tween 80，0.1mM Na₂EDTA；

WB1缓冲液包括5xSSC，0.05％Tween 20，0.002M胱胺；

WB2缓冲液包括0.05M Tris，0.05M NaCl，0.001M EDTA，0.05％Tween 20；

PAW缓冲液包括10mM柠檬酸；

ICB缓冲液包括0.05M Tris，0.05M NaCl，0.01M EDTA，3mM MgSO4，0.05％Tween20，0.1M(NH₄)₂SO₄；

Block缓冲液是由ICB缓冲液中加入了ddNTP和BG9DNA聚合酶获得的，其中Block缓冲液中包括0.05mM ddNTP和4％BG9DNA。

七.拍照，并根据前后两次拍照结果进行生物信息学分析。

对上述杂交待测蛋白的芯片进行拍照，记录杂交有蛋白质的位点。

数据分析过程：

1.数据过滤，删选出潜在含有蛋白结合位点序列的高丰度测序数据集。

1.1粗过滤，将加入蛋白质前对同于cycle测序反应的3次拍照图片，利用basecall软件判定芯片上每个位置DNB的碱基信息，将3次call base一致的那部分DNB数据保留下来，进入下一轮过滤

1.2细过滤，根据加入蛋白质后所做2次拍照反应获取的DNB荧光亮度信息，计算加入蛋白前后同一DNB同一位点在ACGT 4个通道的荧光强度变化比值，若call base为A,T且A通道光强加蛋白后比加之前的比值大于1.5，或者call base为G,C且光强比值大于2，认为该DNB有较大可能结合蛋白质

将通过上述2步过滤保留下来的DNB ID记录下来，并根据ID获取最初做SE50测序所得50bp的测序序列的前40bp组成长度为40bp的序列数据集，该集合中有相当比例的序列含有蛋白结合位点序列

2.蛋白结合位点探寻

2.1从数据集中寻找高富集的4～8bp长的短序列片段。根据数据集中有大量reads含有蛋白结合序列这一特征，可以推断在4～8bp的短序列里面，一定有一部分因为包含或者包含于结合序列而在数据集里面丰度明显偏高，于是统计所有类型4～8bp序列在数据集中所出现的频率，再统计这些序列在对应参考基因组上出现的频率作为背景，然后计算每种序列频率与背景频率的比值，从每种长度挑选出top25且比值大于1.5的序列作为种子。

2.2种子拼接.对每种长度的短序列分别用挑选出来的top25条做拼接操作，取top1为固定种子，其反向互补序列作为另一个种子，然后从剩余的短序列里面按照频率高低依次尝试与2个种子序列做一个base长度的延伸，若没有延伸成功则退回作为下一轮候选，延伸成功则不退回，直至所有候选序列用光或者剩余序列都无法构成延伸，如此可获得由初始的2条反向互补种子延伸所得的较长序列，然后将其作为正负义链做碱基互补配对，截取其中配对上的最长双链区域，一般认为这段双链序列很有可能就是酶切识别序列。

2.3锁定识别序列：由于蛋白结合序列长短是未知的，上述4～8组合各自所拼接出的双链序列不一定都包含真正的结合位点序列，因此将各mer所预测的序列集合在一起，求最高频的最大共有序列。认为该序列就是蛋白结合序列。

2.4对中间含有非固定序列的结合位点的探究：对于中间含有若干非固定碱基的识别位点，上述2.3过程往往得不到最大共有序列，当出现该种结果时，启动另一条预测通路，用上述2.2，2.3的方法来分别对识别位点2端的固定序列各自做拼接预测获得2个短固定序列，再针对过滤数据做统计，记录那些40bp长reads中以上述2个固定序列作为2端的片段，统计出符合该特征的所有序列的频率，取排在top1的序列长度作为识别位点长度，上述2固定序列分别作为识别序列2端的特有固定序列，中间则是非固定序列，用N表示

2.4粗验证：根据上一步骤所预测出的结合位点序列，统计过滤数据集里与预测序列等长的所有类型序列的频率，从高到低排序，验证预测序列是否排top1。

其中使系统带上荧光标记可以是直接的也可以是间接的，例如使用荧光二抗，荧光蛋白融合表达，体外荧光标记等。

实施例2

在本实施例中，发明人以dcas9(dead-cas9，去除切割活性的cas9)及相应的sgRNA(single guide RNA)在BGISEQ-500平台验证为例，检测能否分析得出该sgRNA的序列信息。Cas9是一种RNA引导的DNA靶向核酸酶，它的特异性识别位点PAM(Protospacer AdjacentMotif)序列为NGG位于sgRNA的下游。

本实施例中所用到的dcas9以及荧光标记试剂盒如下表1所示：

表1：

该实施例所用的sgRNA的序列为CTACGATCCGACTTACAGAT，其中前14个碱基与接头末尾的14个碱基一致。用表1所提到的SNAP-Surface试剂盒预先对dcas9蛋白进行AlexaFluor546的荧光标记。分为Lane1实验组(加荧光标记的dcas9)和Lane2对照组(加不带荧光标记的dcas9)进行平行实验，其他实验条件及步骤均一致。具体实验过程如实施例1所述。

结果：生物信息分析的荧光信号增强的DNB插入序列前9位的碱基分布如图2所示，其中，横坐标是插入序列的碱基位置，接头下面第一位记为1，纵坐标为荧光信号增强的DNB中各位置各碱基所占的比例，碱基高度越高，表明所占比例越大。结果显示，共有序列为ACAGATNGG，与原本的sgRNA序列的后六位一致，其中NGG也符合cas9识别的PAM序列原则。

结论：根据本发明实施例的检测系统能准确地筛选出蛋白质的DNA结合位点，并能通过该生物信息分析方法得出精确的DNA结合位点序列。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种检测蛋白质DNA结合位点的方法，其特征在于，包括：

将DNA片段库进行测序，以便获得DNA片段库的DNA序列，所述DNA片段库的DNA片段在测序接头互补位后的序列是随机的，所述DNA片段库中的DNA片段预先与所述测序接头互补配对结合；

去除测序后的DNA片段库中的新生链；

以DNA片段库的DNA片段为模板，再将测序接头与所述模板进行第二互补配对结合，将不带有荧光标记的dNTP依次聚合在测序接头的3’端，将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位；

记录聚合反应后的DNA片段库中的荧光点位置和所述荧光点的荧光强度；

将目标蛋白与所述聚合反应后的DNA片段库进行杂交，所述目标蛋白具有荧光修饰；

记录杂交后的DNA片段库中的荧光点位置和所述荧光点的荧光强度；

基于杂交后的DNA片段库中的荧光点与聚合反应后的DNA片段库中荧光点的荧光强度或荧光种类的差异，确定目标蛋白质DNA结合位点；

其中，当所述带有荧光标记的dNTP的荧光与带有荧光修饰的目标蛋白的荧光相同，所述杂交后的DNA片段库中的荧光点的荧光强度强于聚合反应后的DNA片段库中荧光点的荧光强度，是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示；

当所述带有荧光标记的dNTP的荧光与带有荧光修饰的目标蛋白的荧光不同，所述杂交后的DNA片段库中的荧光点的荧光不同于聚合反应后的DNA片段库中荧光点的荧光，是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示；

将不带有荧光标记的dNTP依次聚合在测序接头的3’端是通过35~45个循环的DNA聚合反应实现的；

将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位是通过一个循环的DNA聚合反应实现的。

2.根据权利要求1所述的方法，其特征在于，所述杂交后的DNA片段库中的荧光点的荧光强度是所述聚合反应后的DNA片段库中荧光点的荧光强度的2倍或1.5倍，是杂交后的DNA片段库中的荧光点为目标蛋白质DNA结合位点的指示。

3.根据权利要求1所述的方法，其特征在于，进一步基于所确定的目标蛋白质DNA结合位点，确定所述目标蛋白质DNA结合位点的DNA序列。

4.根据权利要求1所述的方法，其特征在于，所述DNA片段库是以装载在芯片上的DNA纳米球形式存在的。

5.根据权利要求1所述的方法，其特征在于，所述DNA片段库具有18亿个DNA片段。

6.根据权利要求1所述的方法，其特征在于，所述测序和/或聚合反应是在BGISEQ-500测序平台上进行的。

7.根据权利要求1所述的方法，其特征在于，通过甲酰胺去除测序后的DNA片段库中的新生链。

8.根据权利要求1所述的方法，其特征在于，将不带有荧光标记的dNTP依次聚合在测序接头的3’端是通过40个循环的DNA聚合反应实现的。

9.根据权利要求1所述的方法，其特征在于，所述目标蛋白的荧光修饰是通过荧光二抗修饰、荧光蛋白融合表达或体外荧光标记实现的。

10.一种检测蛋白质DNA结合位点的方法，其特征在于，包括:

将DNA片段以DNA纳米球的形式装载在芯片上，以便获得DNA片段库，所述DNA片段库的DNA片段在测序接头互补位后的序列是随机的，所述DNA片段库中的DNA片段预先与所述测序接头互补配对结合；

在BGISEQ-500测序平台上，将所述DNA片段库进行测序，以便获得DNA片段库的DNA序列；

利用甲酰胺去除测序后的DNA片段库中的新生链；

以DNA片段库的DNA片段为模板，再将测序接头与所述模板进行第二互补配对结合，将不带有荧光标记的dNTP依次聚合在测序接头的3’端，聚合反应的循环次数为35~45；

将带有荧光标记的dNTP聚合在聚合产物3’端的最后一位，聚合反应的循环次数为1；

记录聚合反应后的DNA片段库中的荧光点的位置和所述荧光点的荧光强度；

基于杂交后的DNA片段库中的荧光点与聚合反应后的DNA片段库中荧光点的荧光种类或荧光强度的差异，确定目标蛋白质DNA结合位点；

进一步基于所确定的目标蛋白质DNA结合位点，确定所述目标蛋白质DNA结合位点的DNA序列。

11.根据权利要求10所述的方法，其特征在于，将不带有荧光标记的dNTP依次聚合在测序接头的3’端是通过40个循环的DNA聚合反应实现的。