WO2016008120A1

WO2016008120A1 - 基于核酸序列的蛋白质相互作用检测方法

Info

Publication number: WO2016008120A1
Application number: PCT/CN2014/082331
Authority: WO
Inventors: 吴家睿; 梁治; 骆斯伟
Original assignee: 中国科学技术大学
Priority date: 2014-07-16
Filing date: 2014-07-16
Publication date: 2016-01-21

Abstract

本发明公开了基于DNA序列检测蛋白质间相互作用的方法（称为蛋白质二聚化足迹法，Protein Dimerization footprinting，简称PDf），试剂盒及其用途。其基本原理是基于目的蛋白质间相互作用强度对其融合的DNA结合结构域与相应特异性DNA序列间结合动力学的影响，实现将目的蛋白质间相互作用由相应特异性DNA序列表示，而目的蛋白质间相互作用强度则由该特异性DNA序列的拷贝数给出。

Description

基于核酸序列的蛋白质相互作用检测方法技术领域

本发明属于蛋白质研究技术领域，具体涉及蛋白质相互作用的检测，尤其涉及利用 DNA编码蛋白质相互作用信息进行蛋白质相互作用的在体检测方法，试剂盒及其用途。背景技术

传统在体蛋白质间相互作用检测技术尽管已被广泛应用于生物学研究，但存在诸多不足。例如，酵母双杂交技术 (Y2H)虽然实现简单，但是其动态检测和定量检测能力明显不足，而荧光共振能量转移技术 (FRET)虽然有较好的时空分辨率以及定量能力，但其受限于荧光蛋白的荧光强度以及蛋白质的空间结构等性质。并且，这些传统检测技术仅能针对单一蛋白质相互作用对进行检测，不能在同一个细胞内对包含有多对相互作用的蛋白质相互作用网络进行同时检测。

为此，我们通过发明蛋白质二聚化足迹法 (Protein Dimerization footprinting, 简称 PDf)检测技术，将基于核酸序列的检测技术与蛋白质间相互作用检测相结合，从而实现在体地、定性和 /或定量地、动态地检测蛋白质相互作用，并使直接对蛋白质相互作用网络进行检测成为可能。发明内容

本方法利用目的蛋白质间相互作用强度对与其融合的 DNA结合结构域与相应特异性 DNA结合位点间结合动力学的改变，来实现将目的蛋白质间相互作用由相应特异性 DNA序列表示，而目的蛋白质间相互作用强度则由该序列的拷贝数给出。

具体的，本发明涉及以下各项：

1. 获取蛋白质间相互作用信息的方法，其包括如下步骤：

(1)在宿主细胞中表达融合有 DNA结合结构域的目的蛋白质，所述 DNA结合结构域二聚化时对相应特异性 DNA序列的亲和力显著高于单体时；

(2)在生理状态下用交联剂处理，将宿主细胞中的目的蛋白质二聚体和 DNA交联形成复合体；

(3)将 DNA打碎成小片段；

(4)分离提取所述小片段，并用 DNase I消化；

(5)使用去交联剂处理，将步骤 (4)的产物去交联，并纯化得到 DNA片段；

(6)检测步骤 (5)得到的 DNA片段。

2. 根据 1所述的方法，所述宿主细胞包括大肠杆菌、酵母、哺乳动物细胞。

3. 根据 1所述的方法，所述 DNA结合结构域包括 λ噬菌体蛋白质 CI的 DNA结合结构域及其符合权利要求 1步骤 (1)中所述 DNA结合结构域性质的突变体， λ噬菌体蛋白质 CRO的 DNA结合结构域及其符合权利要求 1步骤 (1)中所述 DNA结合结构域性质的突变体;所述相应特异性 DNA序列包括 CI结合序列及它们的突变序列， CRO 结合序列及它们的突变序列。

4. 根据 1所述的方法，所述步骤 (2)中使用的交联剂为甲醛。

5. 根据 1所述的方法，所述步骤 (3)中使用 MNase或者超声处理打碎 DNA为小片段。

6. 根据 1所述的方法，所述步骤 (5)中使用的去交联剂为蛋白酶 K。

7. 根据 1所述的方法，所述步骤 (6)中的检测包括基于核酸序列的定性和 /或定量检测，所述定量检测包括定量 PCR、高通量测序和 /或 DNA微阵列，所述定性检测包括 PCR和 /或琼脂糖凝胶电泳。

8. 一种用于获取蛋白质相互作用信息的试剂盒，包括：

(1) 带有 DNA结合结构域和相应特异性 DNA序列的表达载体，所述 DNA结合结构域二聚化时对相应特异性 DNA序列的亲和力显著高于单体时；

(2) 宿主细胞；

(3) 交联剂及其反应终止液；

(4) 打碎 DNA的装置或试剂及其反应缓冲液；

(5) DNase I及其反应缓冲液；

(6) 去交联剂；

(7) DNA检测装置。

9. 根据 8所述的试剂盒，所述交联剂为甲醛，所述交联反应终止液为甘氨酸溶液，所述去交联剂为蛋白酶 K，所述打碎 DNA的试剂为 MNase。

10. 根据 8所述的试剂盒，所述 DNA检测装置包括定性和 /或定量检测装置，所述定量检测装置包括定量 PCR装置、高通量测序装置或 DNA微阵列检测装置，所述定性检测装置包括 PCR装置或琼脂糖凝胶电泳装置。

将本发明的方法与荧光共振能量转移 (FRET)技术以及酵母双杂交 (Y2H)技术的结果相比较，本发明的方法能够很好地对不同强度的蛋白质间相互作用进行在体地、定量地、动态地检测。更进一步，本方法将基于核酸序列的检测技术与蛋白质相互作用检测相结合，能够大大提高检测的通量，而通过使用不同且互不交叉的 DNA结合结构域-特异性 DNA序列对，使得该方法能够在系统层次上直接定量地、动态地同时检测多条蛋白质相互作用构成的蛋白质相互作用网络。

本发明的方法能够帮助生物学家从系统层面上直接定量研究蛋白质相互作用组，而非简单利用单一蛋白质相互作用的数据通过构建相应的网络模型来分析蛋白质相互作用网络。发明详述

以下对本发明的技术方案做进一步详细阐述。应当指出，本发明的各实施方案可以根据需要以任何方式组合。

本发明的第一个方面提供一种获取蛋白质间相互作用信息的蛋白质二聚化足迹法 (PDf)，其原理为基于目的蛋白质间相互作用强度对其融合的 DNA结合结构域与相应特异性 DNA序列间结合动力学的影响，实现将目的蛋白质间相互作用由相应特异性 DNA序列表示，而目的蛋白质间相互作用强度则由该特异性 DNA序列的拷贝数给出。

在一个实施方案中，所述方法包括以下步骤：

(1)在宿主细胞中表达融合有 DNA结合结构域的目的蛋白质，所述 DNA结合结构域二聚化时对相应特异性 DNA的亲和力远高于单体时；

(3)将 DNA打碎成小片段；

(4)分离提取所述小片段，并用 DNase I消化；

(6)定量检测步骤 (5)得到的 DNA片段。

在一个优选的实施方案中，只要二聚化时对相应特异性 DNA的亲和力远高于单体时的 DNA结合结构域都可以用于本发明，此种 DNA结合结构域和相应特异性 DNA 序列包括但不限于 λ噬菌体蛋白质 CI的 DNA结合结构域和 CI结合序列， λ噬菌体蛋白质 CRO的 DNA结合结构域和 CRO结合序列。在此种情况下，当目的蛋白之间发生相互作用时， DNA结合结构域形成二聚体，该二聚体与相应特异性 DNA结合，从而在交联过程中由于距离足够近而形成 DNA-蛋白质二聚体复合物；相反，当目的蛋白之间不发生相互作用时， DNA结合结构域以单体形式存在，由于单体形式的 DNA 结合结构域与特异性 DNA不结合或结合很弱，从而不能有效交联，在后续过程中将与二聚体区分开。

在一个优选的实施方案中，本文所述的交联是指将距离足够近的分子固定在一起以利于后续分析。在一个更优选的实施方案中，所述交联剂包括但不限于甲醛，戊二醛等。

在一个优选的实施方案中，打碎 DNA为小片段的方法是本领域技术人员已知的，包括超声和酶处理等，优选用 MNase处理。

在一个优选的实施方案中，检测去交联后分离的 DNA片段的方法包括但不限于 PCR、琼脂糖凝胶电泳、定量 PCR、高通量测序以及 DNA微阵列等基于核酸序列的定性和 \或定量检测技术。

本发明的第二个方面提供一种用于获取蛋白质相互作用信息的试剂盒，包括：

(1) 带有 DNA结合结构域和相应特异性 DNA序列的表达载体，所述 DNA结合结构域二聚化时对相应特异性 DNA的亲和力远高于单体时；

(2) 宿主细胞；

(3) 交联剂及其反应终止液；

(4) 打碎 DNA的装置和试剂及其反应缓冲液；

(5) DNase I及其反应缓冲液；

(6) 去交联剂；

(7) DNA检测装置。

在一个优选的实施方案中，所述宿主细胞包括但不限于细菌，酵母，哺乳动物细胞等，所述交联剂、去交联剂、打碎 DNA的装置和试剂、定量检测装置等都如前所述。附图说明

图 1.载体 pPIDAl禾 P pPIDKl结构示意图，其中 (A)为 pPIDAl , (B)为 pPIDKl , Plac 为启动子， CI(N)为蛋白质 CI的 DNA结合结构域， MCS为多克隆位点， Ter为转录终止序列， BR为特异性 DNA结合序列， AmpR为氨苄亲霉素抗性基因， KanR为卡那霉素抗性基因， Ori为载体的复制起点。

图 2.蛋白质二聚化足迹法 (PDf)工作原理图。

图 3. 以蛋白质 CI的二聚化结构域 CI(C)为目的蛋白质验证 PDf检测方法。（a)为构建的载体的示意图，其中 BR-pSP73为空白对照，仅含有 CI蛋白质的 DNA结合结构域 CI(N)相应的特异性 DNA序列 BR; pPIDAl为阴性对照，含有 CI蛋白质的 DNA结合结构域 CI(N 不能二聚化)和相应的特异性 DNA序列 BR; CI(C)-pPIDAl为阳性对照，含有可以二聚化的 CI蛋白质二聚化结构域 CI(C)和 CI蛋白质的 DNA结合结构域 CI(N) 的融合蛋白质及相应的特异性 DNA序列 BR。（b)通过 12小时 DNase I充分消化, PDf 方法能够很好地区分空白组、阴性组和阳性组，从而验证了 PDf检测方法的正确性。 (c)PDf方法中双载体体系的特异性 DNA序列 (BR)数量随诱导时间的变化情况。

图 4. PDf检测方法的反应动力学模型的实验验证与分析。（a)PDf实验测定值与基于动力学模型计算值的高度一致性，证明了模型的可靠性；（b)通过动力学模型计算，当目的蛋白质单体浓度 Cs在 0.01-100倍间变化时， PDf信号的变化情况； (c) 对比阳性和阴性实验组，即蛋白质二聚化时 DNA结合结构域与特异性 DNA序列结合和蛋白质单体状态时 DNA结合结构域与特异性 DNA序列结合的 PDf信号。

图 5. 基于 PDf方法的静态和动态蛋白质相互作用检测与现有蛋白质间相互作用检测技术的比较。（a)分别使用酵母双杂交 (Y2H)、荧光共振能量转移 (FRET)和 PDf 方法，对大肠杆菌趋化系统中的静态蛋白质相互作用进行检测。 (b)大肠杆菌 PhoR/PhoB磷酸信号传导系统中 PhoB二聚化强度在不同磷酸浓度的环境下随时间的动态变化。（c)利用 FRET方法测得的 PhoR/PhoB磷酸信号传导系统在不同磷酸浓度的环境下经过充分反应后 PhoB的二聚化强度。

图 6.互不交叉的 DNA结合结构域-特异性 DNA序列相互作用对的设计与测试。（a)基于 PDB结构 1LMB的结构信息，通过 FoldX软件计算野生型 CI蛋白质的 DNA结合结构域 Cl^f¹和突变体 CI(N)^mutl与不同特异性 DNA序列的相互作用能，在遍历所有可能的特异性 DNA序列的条件下，相对于野生型 DNA结合结构域 (α(Ν),二聚体与野生型特异性 DNA序列 (BR1)相互作用能的变化量。其中正值表示相互作用能增加，负值表示相互作用能下降。 (b)基于 DNA结合结构域 Cl^f¹和 CI(N)^mutl及不同 BR序列的 PDf检测结果，其中虚线表示标准值。图中横坐标 (^^^-81 1(1=1,4,5,6,7,8,9,10) 表示双载体中的 DNA 结合结构域均为 CliNf¹ , 特异性 DNA 序列均为 BRi ; CI(N)^mutl-BRi (1=1,4,5,6,7,8,9,10) 表示双载体中的 DNA结合结构域均为 CKKT", 特异性 DNA序列均为 BRi;

(1=1,4,5,6,7,8,9,10) 表示双载体中一个 DNA结合结构域为 C^Nf¹, 另一个为 CI(N)^mutl，特异性 DNA序列均为 BRi。（c)利用 PDf技术同时在体检测多对蛋白质相互作用的原理图。具体实施方式材料与方法

(1) 菌株与载体

a. 克隆菌株：大肠杆菌 K12菌株 DH5a (生工生物， SD8411)

b. 表达菌株：大肠杆菌 K12菌株 JM109 (Takara， D9052A)

c. 载体： pSP73(Promega, P2221), pSB lK3(iGEM Distribution)

(2) 培养基与试剂

a. 培养基：

LB 液体培养基：

氯化钠 lg，酵母提取物 0.5g，蛋白胨 lg，双蒸水 100ml

LB固体培养基：

氯化钠 lg，酵母提取物 0.5g，蛋白胨 lg，琼脂 1.2g，双蒸水 100ml

M9组氨酸缺陷培养基：

溶液 1 : 20%葡萄糖溶液 2ml， 20mM腺嘌吟溶液 lml， 10X组氨酸缺陷氨基酸补充液 10ml

溶液 2: 1M硫酸镁溶液 0.1ml, 1M盐酸硫胺素溶液 0.1ml, 10mM硫酸锌溶液 0.1ml, lOOmM氯化钙溶液 0.1ml, lOOmM异丙基硫代半乳糖苷 (IPTG) 0.05ml，向溶液 1中加入溶液 2并混匀，并向其中加入 10ml 10X M9盐后，用双蒸水定容至 100ml。

b. 试剂

10X组氨酸缺陷氨基酸补充液：

腺嘌吟 200mg，盐酸精氨酸 200mg，异亮氨酸 300mg，盐酸赖氨酸 300mg，甲硫氨酸 200mg，苯丙氨酸 500mg，苏氨酸 2000mg，酪氨酸 300mg，尿嘧啶 200mg，缬氨酸 1500mg，亮氨酸 lOOOmg, 色氨酸 200mg，双蒸水 1L。

10X M9 盐：

磷酸氢二钠 67.8g，磷酸二氢钾 30g，氯化钠 5g，氯化铵 10g，双蒸水 1L。抗生素溶液：氨苄亲霉素溶液,卡那霉素溶液

Pierce Chromatin Prep Module (Thermo Scientific, 26158)

UNIQ-10柱式寡聚核苷酸纯化试剂盒（生工生物， SK1144)

SanPrep柱式质粒 DNA小量抽提试剂盒（；生工生物， SK8192)

AxyPrep PCR清洁试剂盒（Axygen, AP-PCR-50)

In-Fusion HD Cloning Kit(CloneTech, 639648)

脱氧核糖核酸酶 I (DNase I) (2,000U/mL， New England BioLabs, M0303 S) PrimeSTAR Max DNA Polymerase(Takara,R045 A)

SYBR Premix EX Tag II (Takara， RR820A)

限制性内切酶：

EcoRI,BamHI, Kpnl, SpeI,NheI, Xhol, Dpnl

37%甲醛溶液

Lysis Buffer I:

按每 lOOul Membrane Extraction Buffer (Pierce Chromatin Prep Module)中力口入 lul 蛋白酶和磷酸酶抑制剂混合液的比例配制 MNase酶切缓冲工作液

按每 lOOul MNase酶切缓冲液 (Pierce Chromatin Prep Module)中加入 O. lul 1M二硫苏糖醇 (DTT)溶液比例配制。

去交联混合液 (10ul)_:

去核酸酶水 6.6μ1， 5Μ氯化钠溶液 2.4μ1, 蛋白酶 Κ 1μ1。

(3) 载体构建

a. pPIDAl和 pPIDKl检测载体的构建

(i) MCS-pSP73 MCS-pSBlK3以及 BR-pSP73载体构建

将 SEQ ID NO: 1所示的多克隆位点 MCS序列

SEQ ID NO: 1

GTCGACCTGC ATGCTAGC AGCGGCCG-3 '

通过 Clal和 Xhol两个限制性内切酶插入到 pSP73载体中，得到 MCS-pSP73。将 SEQ ID NO: 2所示多克隆位点 MCS序列

SEQ ID NO: 2

GTCGACCTGC ATGCTAGCAGCGGCCGCTCGAG-3'

通过 Aatll和 Pstl两个限制性内切酶插入到 pSBlK3载体中，得到 MCS-pSBlK3。此外，将 DNA结合结构域 CICN)相应的特异性 DNA序列 BR(SEQ ID NO: 21) 插入到 MCS-pSP73载体的 Nhel和 Xhol位点间得到 BR-pSP73载体。

(ii) CI(N)的克隆以及 CI(N)-MCS-pSP73和 CI(N)-MCS-pSBlK3载体构建利用以下引物以 λ噬菌体基因组为模版克隆蛋白质 CI的 DNA结合结构域 CI(N)。克隆正向引物 (SEQ ID NO: 3)：

ACAAGAG-3'

克隆反向引物 (SEQ ID NO: 4)：

AT-3'

GG-3'

将以上克隆产物通过限制性内切酶 Kpnl 和 Nhel 插入到 MCS-pSP73 和 MCS-pSBlK3 载体的 Kpnl 禾 P Spel 位点间得到 CI(N)-MCS-pSP73 和 CI(N)-MCS-pSBlK3载体。

(iii) pPIDAl和 pPIDKl载体构建

将核糖体结合位点 RBS 和启动子 Plac 序列依次插入到 CI(N)-MCS-pSP73 和 CI(N)-MCS-pSBlK3的 Kpnl和 Spel位点间，将转录终止序列 Ter和 cI(N)相应的特异性 DNA序列 BR依次插入到 CI(N)-MCS-pSP73和 CI(N)-MCS-pSB 1K3的 Nhel和 Xhol 位点间，最后得到 pPIDAl和 pPIDKl载体。其中 Plac、 RBS以及 Ter序列如下：

CGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACA-3'

RBS(SEQ ID NO: 7):

5 ' -ATTAAAGAGGAGAAA-3 '

CGGGTGGGCCTTTCTGCGTTTATA-3 '

b. 基因克隆：

用以下引物克隆目的基因，将得到的聚合酶链式反应 (PCR)产物用 AxyPrep PCR 清洁试剂盒进行纯化，得到产物可用于后续步骤或于 -20°C保存。

克隆正向引物 (SEQ ID NO: 9)：

5'-CATGGAGGCCGAATTC111222333444555666777888-3，（其中 111 为目的基因的起始密码即第 1个密码子，其余数字表示目的基因的后续密码子序列）

克隆反向引物 (SEQ ID NO: 10)：

5 ' -GCAGGTCGACGGATCCLLL NNNNNNNNNNNNNNNNNNNN-3 ' (其中 LLL 为目的基因的最后一个密码子，其中 N表示目的基因的前续密码子序列）

c 同源重组

利用限制性内切酶 EcoRI和 BamHI对载体 pPIDAl和 pPIDKl进行双酶切处理后，将酶切产物用 AxyPrep PCR清洁试剂盒进行纯化，进而得到线性化载体，再将目的基因分别与线性化载体利用 In-Fusion HD Cloning Kit在 50°C下反应 15分钟后，转化于大肠杆菌 DH5(x感受态中，在含有相应抗生素 (氨苄亲霉素或卡那霉素)的 LB固体培养基上 37°C过夜培养。最后得到含有目的蛋白质 X的 X-pPIDAl和含有目的蛋白质 Y 的 Y-pPIDKl。

d. 载体抽提与检验

挑取转化得到的重组载体的单克隆菌落于含有相应抗生素 (氨苄青霉素或卡那霉素)的 LB液体培养基中， 37°C， 250rpm振摇过夜培养。

次日，取出过夜培养菌液并用 SanPrep柱式质粒 DNA小量抽提试剂盒提取重组载体。提取出的载体可通过测序检验其正确性。

(4)共转化与表达 a. 共转化

将重组得到的 X-pPIDAl与 Y-pPIDKl载体共转化到大肠杆菌 JM109感受态中，在含有氨苄青霉素和卡那霉素的 LB固体培养基上 30°C过夜培养。挑取过夜培养得到的单克隆菌落于含有氨苄青霉素和卡那霉素的 M9组氨酸缺陷培养基中， 37°C， 250rpm 振摇过夜培养。

b. 表达

取以上过夜培养的菌液接种到新的含有氨苄青霉素和卡纳霉素的 M9组氨酸缺陷培养基中，并将 OD600值调整至 0.03 0.04后，加入终浓度为 ΙΟμΜ的异丙基硫代半乳糖苷 CIPTG；)，然后于 37°C， 250rpm振摇培养 8h后，测定并记录 OD600。

(5) 蛋白质二聚化足迹法检测 (PDf)

a.染色质交联与细菌分离

取以上 8h诱导表达的大肠杆菌 JM109菌液 1ml于 15ml离心管中，加入 27μ1的 37%甲醛溶液，并于 25 °C， 300rpm振摇反应 8分钟，然后加入 10X甘氨酸溶液至终浓度为 IX，并于 25 °C， 300rpm振摇反应 5分钟。将反应液转移至 1.5ml离心管中， 4°C， 12000rpm离心 4min后，弃上清，并用 lml IX PBS溶液 4°C， 12000rpm离心 2min清洗细菌沉淀两次，然后用加入了 ΙΟμΙ蛋白酶和磷酸酶抑制剂混合液的 lml IX PBS溶液重悬细菌沉淀，并于 4°C， 12000rpm离心 4min后弃上清，得到的细菌沉淀可用于后续试验或于 -20°C保存。

b.样品裂解与 MNase酶消化

用 200μ1 Lysis Buffer I重悬菌体沉淀，振荡混匀 15秒后，置于冰上反应 10分钟，再 9000rpm离心 3分钟并移除上清。然后，用 200μ1 MNase酶切缓冲工作液重悬以上沉淀，并取 ΙΟΟμΙ用于后续检测。

每 18μ1 MNase 酶切缓冲液中加入 2μ1 MNase并混匀，取 4μ1加入以上 ΙΟΟμΙ重悬液中，于 37°C反应 15分钟，其中每过 5分钟振荡混匀一次。然后，向以上反应液中加入 2(^lMnase反应种终止液，并置于冰上放置 5分钟后， 9000rpm离心 5分钟并移净上清。

c 蛋白质 -DNA复合物的提取与 DNase I酶消化

用 50μ1核提取缓冲液重悬上一步中得到的沉淀，并置于冰上反应 15分钟，每过 5分钟振荡混匀一次。然后 9000rpm离心 5分钟，并保留上清，将其转移至 1.5ml 离心管中，然后向其中加入 2μ1 DNase I 过夜消化 (至少 12小时)。

d. 去交联与 DNA片段的纯化

将过夜反应液于 75 反应 10分钟后置于冰上冷却，并向其中加入 ΙΟμΙ去交联混合液并混匀，然后于 65 °C反应 1.5小时。将以上反应液用 UNIQ-10柱式寡聚核苷酸纯化试剂盒进行纯化，进而得到纯化后的 DNA片段溶液。

(6) 目的 DNA片段的定量 PCR检测

取 Ι μΐ以上 DNA片段溶液利用 SYBR Premix EX Tag II试剂盒对其中目的 DNA 片段进行定量检测。反应条件为 95 °C,反应 30s，然后 95 °C, 5s; 67.5 °C, 30s，反应 30 个循环， CI(N)特异性结合序列 BR的检测引物为：

正向引物 (SEQ ID NO: 11)： 5 ' - AGC AAAATC AGGGTGTTATCTACCTCTGGCGGTGATAACTTC-3 ' 反向引物 (SEQ ID NO: 12)：

5 ' -CCGCTGCTAGC ACC AC AGGGC AGAG-3 '

此夕卜，定量结果均以 CI蛋白质二聚化结构域 Ci )在 CICC pPIDAl+CICC pPIDKl 体系中测定的 PDf信号值为基准，并用 8小时诱导表达后细菌生长的 OD600值进行修正得到。

GGCTGA-3'

(7) DNA结合结构域 CI(N)突变体的构建以及相应特异性 DNA序列的改造 (i) DNA结合结构域 CI(N)突变体的构建

以突变体 CI(N)^mutl为例，利用以下引物：

正向引物 (SEQ ID NO: 14)：

CATCAATGC-3'

反向引物 (SEQ ID NO: 15)：

TGTCTGC-3'

以包含野生型 DNA结合结构域 CKNf^SEQ ID NO: 5)的 CI(C)-pPIDAl为模版进行 PCR，得到 PCR产物为线性化载体。用限制性内切酶 Dpnl对该 PCR产物进行充分消化，在经由转化和载体提取，即得到 DNA结合结构域为突变体 CI(N)^mutl的载体。

(ii)相应特异性 DNA序列的改造

以制备 DNA结合结构域 Cl^f¹和 CI(N)^mutl互不交叉的特异性 DNA序列为例。为了设计能够与不同 DNA结合结构域特异性结合而不发生交叉反应的特异性 DNA序列，我们利用从 PDB数据库中下载得到的 CI(N)^wt-DNA复合体的 X射线衍射结构 1LMB的结构信息，通过 FoldX软件计算 DNA结合结构域与 DNA序列的相互作用能，并遍历 DNA序列的所有组合形式并计算和评估其相对于野生型特异性 DNA序列的相互作用能变化。以这一计算结果为基础，我们设计相应的 DNA序列，利用以上定点突变方法对 CI(C)-pPIDAl进行改造，并利用 PDf方法检测不同 CI(N)突变体与不同 DNA序列的特异性结合能力。

对于 CliNf¹和 CI(N)^mutl而言就是要得到三种 DNA序列：特异地与 CliNf^-CIiNf¹ 同二聚体结合的 DNA序列，特异地与 CI(N)^mutl-CI(N)^mutl同二聚体结合的 DNA序列，以及特异性地与 CliNf^-CIiNr¹"异二聚体结合的 DNA序列。此外，与前述相同，在此处的 PDf 检测方法中，均利用 CI 蛋白质二聚化结构域 CI(C)在 CI(C)-pPIDAl+ CI(C)-pPIDKl双载体体系中的 PDf检测信号为基准值进行比较。该体系中每个载体上的 DNA结合结构域均为野生型 CliNf¹, BR序列均为野生型特异性 DNA序列。实施例 1蛋白质二聚化足迹法检测 (PDf)工作原理

本发明中蛋白质二聚化足迹法检测 (PDf)工作原理如图 2所示。目的蛋白在大肠杆菌中表达后，会通过其融合的 DNA结合结构域和载体上的特异性 DNA序列相互作用。如果两蛋白质发生相互作用，其二聚体可与 DNA以很高的亲和力结合，反之不能结合或者以很低的亲和力结合。然后，经过甲醛处理， DNA及与其结合的蛋白质二聚体相交联形成复合体。在 MNase酶作用下，载体被打碎成小片段，将这些小片段分离提取后，用 DNase I对其进行充分消化，从而将未与蛋白质结合的 DNA片段清除。用蛋白酶 K对消化后的样品进行去交联，并进行纯化即得到相应目的 DNA片段。对这些 DNA片段进行定量 PCR、高通量测序和 DNA微阵列等基于核酸序列的定量检测或者 PCR及琼脂糖凝胶电泳等基于核酸序列的定性检测，即可得到基于目的蛋白质的相互作用网络信息。

实施例 2以蛋白质 CI的二聚化结构域 CI(C)为目的蛋白质验证蛋白质二聚化足迹法检测 (PDf)方法

为了验证 PDf 检测结果是否能够反应蛋白质相互作用的不同强度，通过 BR-pSP73(空白对照)， pPIDAl (阴性对照)以及 CI(C)-pPIDAl (阳性对照)三组对照实验 (图 3a)，可证明经由 DNase I酶 12小时消化，能将未被蛋白质结合保护的 DNA片段除净，从而使 PDf检测结果能够反应不同蛋白质相互作用强度 (结果如图 3b所示)。实施例 3PDf检测的反应动力学模型的建立

为了讨论 PDf对蛋白质相互作用强度的定量检测能力及 DNA结合结构域单体与特异性 DNA序列的结合对蛋白质间相互作用检测的影响，我们从蛋白质单体与特异性 DNA序列结合的动力学过程出发，讨论了蛋白质二聚化即蛋白质相互作用过程的相关参数对 DNA结合动力学的影响。

1. 蛋白质单体 DNA结合动力学模型

设为结合了蛋白质单体的特异性 DNA片段的比例， ^θ' '为未结合蛋白质单体的特异性 DNA片段的比例，为蛋白质单体的浓度， ^¾ "'为蛋白质单体与特异性 DNA序列结合反应的速率常数，为蛋白质单体与特异性 DNA序列复合物解离反应的速率常数。

根据以上定义有：

的变化率为:

结合方程 (1)和方程 (2), 可以得到模型的边界条件: -0 、， ei 当 t=0时，即未发生交联时，体系处于平衡态，可得 ^ ，设此时的值为可得：

而当交联开始后，以上平衡态被破坏，

在 t=∞ 时其达到最大：

— 1

" (4)

将方程 (2)对时间进行微分，并结合方程 (1)可得到：

十 H fc )^ =。（₅₎ 以上微分方程有以下通解：

其中' =₀, -(k。'A+k 然后根据模型的边界条件式和式 (₄)得： e_b = 1 ^ ~ _e-t(k_D1IC_s+k_cff_}

k_m,C_;+k_eff (7) 方程 (7)描述了在 PDf方法的交联过程中蛋白质单体与特异性 DNA结合的过程。考虑到在实验过程中特异性 DNA序列的不饱和性以及特异性 DNA序列总数目为恒定值 (见图 3c)，可以得到蛋白质单体结合特异性 DNA序列的 PDf信号为：

l_s― εΚΘ,

(8) 其中 ^fA '为特异性 DNA序列的最大结合数， ""为常数， =^k。' ^cff，将 (7)带入 (8) 则可得到/信号的完整形式：

I； = εΚ(1

2. 蛋白质二聚化过程的 DNA结合动力学模型

蛋白质二聚化过程的 PDf信号包括两个部分的贡献，一个是蛋白质单体与特异性 DNA序列的结合，另一个是蛋白质二聚体与特异性 DNA序列的结合。因此，可以得到蛋白质二聚化或者蛋白质相互作用的 PDf信号为：

^ sd ~ *s d (10) 其中， A为蛋白质单体与特异性 DNA序列结合的贡献，其形式如 (9)所示， I_d为蛋白质二聚体与特异性 DNA序列结合的贡献。在蛋白质单体的 DNA结合模型基础上，可扩展得到蛋白质二聚体的 DNA结合动力学模型。定义为蛋白质二聚体的浓度， ^feff"^rf为蛋白质二聚体与特异性 DNA序列结合反应的速率常数，为蛋白质二聚体与特异性 DNA序列复合物解离反应的速率常数。根据以上定义，蛋白质二聚化或者蛋白质相互作用的强度可以表示为：

^di er = Q ^s " ( 考虑到特异性 DNA序列的不饱和性，可得到蛋白质二聚体与特异性 DNA序列结合所贡献的 PDf信号

其中 ^k ，为常数。因此，蛋白质二聚化或者蛋白质相互作用过程的 PDf信号为:

结合方程 (11)，可进一步得到方程 (14):

此即为蛋白质二聚化或者相互作用过程的 PDf信号。

实施例 4 PDf检测的反应动力学模型的实验验证与分析

在上述模型的基础上，利用双载体表达体系 X-pPIDAl+GFP-pPIDKl，对 PDf的反应动力学模型进行实验验证和分析。如图 4(a)所示， pPIDAl和 pPIDKl具有相同的蛋白质单体检测性能和相同的蛋白质表达能力，因此蛋白质 X和 GFP有近似的表达量。由于 GFP在细胞中几乎以单体形式存在，所以，可以利用仅表达 GFP的系统的 PDf信号来近似目的蛋白 X的 PDf信号 l_s , 从而能够利用 GFP的报告基因性质来检测蛋白质单体结合对蛋白 X二聚化相互作用 PDf检测结果的影响。

为了进一步说明和验证以上原理：

首先，通过比较 PDf 实验测定值与基于以上动力学模型的理论计算值 (见图 4a)，说明该动力学模型能够与实验结果相吻合，证实了该模型的可靠性。

然后，继续考察蛋白质单体浓度波动对 PDf信号的影响。根据动力学模型，设蛋白质单体浓度变化倍数为气当蛋白质浓度由 Cs变为 ^Δ' 时， PDf检测信号/为：

= εΚ- // e

(15)

于是 PDf检测信号 Λ的变化倍数为 (16)

当蛋白质浓度 Cs在 0.01-100倍间变化时，结果显示 PDf信号的变化倍数上限约为 i(H见图 4b)。于是，当 ^{ίζ <}1ϊ时，能够认为 Λ对/ _srf的影响可忽略不计，即 ^ ^¾Λ 此时可得到方程 (17):

J_sd ¾ J_d = £■''{ _d(l Z2l£A_ _e - 1( k _td K di er s ·· ⁺ f fd)-'!

k ii^Kd tm _er ^€s'^+k offd " (17) 基于该方程，可得到对于两待测 A和 B，其 PDf检测信号具有以下关系：

即两蛋白质各自的二聚化强度之比可约等于其 PDf检测信号之比。换句话说，就是蛋白质相互作用强度可以用相应的特异性 DNA序列拷贝数来表示。而通过对比阳性和阴性实验组的 PDf信号，发现诱导表达时间为 8小时时，阳性组的数值 ( )要显著大于 10倍阴性组的数值见图 4c)，即满足以上关系，因此选定该诱导表达时间为 PDf的实验条件。同时，以 CI蛋白质二聚化结构域 CI(C)的 PDf检测信号 I_sd ^ref为基准，定义当某目的蛋白 X的 PDf信号 ^ ^{< <11} ^时，可以认为 ^{(X) = Q}，以此作为判断蛋白质间是否发生相互作用的标准。

实施例 5基于 PDf方法的静态和动态蛋白质相互作用检测与现有蛋白质相互作用检测技术的比较

为了验证 PDf方法定性和定量检测蛋白质相互作用的性能，我们选择了大肠杆菌趋化系统中的 4个蛋白质 cheA、 cheB、 cheZ和 cheY对其进行 PDf检测，结果如图 5a所示。通过与酵母双杂交 (Y2H)和荧光共振能量转移 (FRET)实验结果相比较， PDf 方法能够很好地实现对蛋白质相互作用的定性和定量检测。

cheA序列（SEQIDNO: 16)：

>gi|49175990:cl973348-1971384 Escherichia coli str. K-12 substr. MG1655 chromosome, complete genome

GCGAACACCGCCGCCTGA

CheB序列（SEQ ID NO: 17)：

>gi|49175990:cl966525-1965476 Escherichia coli str. K-12 substr. MG1655 chromosome, complete genome

GGACAGGCGATACGTATTTAA

CheY序列（SEQ ID NO: 18)：

> gi|49175990:cl965072-1965461 Escherichia

MG 1655 chromo some, complete genome

AACTGGGCATGTGA

CheZ序列（SEQ ID NO: 19)：

>gi|49175990:cl965061-1964417 Escherichia coli str. K-12 substr. MG1655 chromosome, complete genome

为了检验 PDf方法对动态蛋白相互作用检测的性能，即其时间分辨率，我们选取了大肠杆菌 PhoR/PhoB磷酸信号传导系统中的 PhoB蛋白质，检测在不同磷酸浓度的生长环境下，其二聚化强度随反应时间的变化情况，结果如图 5b和图 5c所示。通过与 FRET结果相比较， PDf能够检测出在不同磷酸浓度下 PhoB二聚化的强度及其随时间的演化，体现出 PDf方法在检测动态蛋白质相互作用中具有很好的时间分辨率。

PhoB序列（SEQ ID NO: 20)：

>gi|388476123:416366-417055 Escherichia coli str. K-12 substr. W3110, complete genome

GACCGTGCGCGGTACAGGATATCGTTTTTCAACCCGCTTTTAA

实施例 6蛋白质相互作用网络的直接动态检测

在之前实验的基础上，考虑到 DNA序列除了能够实现高效检测外，还具有可编程的特性，即通过改变序列中特异性 DNA序列的碱基排列，来改变 DNA结合结构域对特异性 DNA序列的识别能力，进而可以通过设计互不交叉的 DNA结合结构域-特异性 DNA序列相互作用对，来实现 PDf方法对多对蛋白质相互作用在同一体系中的同时检测，即第一次使得对蛋白质相互作用网络的直接检测成为可能。

为了验证以上构想的可行性，对野生型 CI蛋白质的 DNA结合结构域 CKNf¹中的 DNA识别螺旋的氨基酸做以下定点突变：将 QSGVGAL定点突变为 QSAINKA, 从而得到突变体 CI(N)^mutl。然后，基于 FoldX软件计算出的 CliNf¹和 CI(N)^mutl与 DNA 相互作用能的信息 (见图 6a)，设计了以下 DNA序列：

BR1 (即 C Nf*相应的特异性 DNA序列 )(SEQ ID NO: 21)： TGTGG

BR4(SEQ ID NO: 22)：

AG(

TGTGG

BR5(SEQ ID NO: 23)：

AG(

TGTGG

BR6(SEQ ID NO: 24)：

AG(

TGTGG

BR7(SEQ ID NO: 25)：

AG(

TGTGG

BR8(SEQ ID NO: 26)：

AG(

TGTGG

BR9(SEQ ID NO: 27)：

AG(

TGTGG

BR10(SEQ ID NO: 28)：

TGTGG

其中 BR1、 4、 5、 6、 8为分别针对 CKNf^CKNf¹和 CI(N)^mutl-CI(N)^mutl同二聚体设计的序列， BR7、 9、 10为针对 CliNf^-CIiN)¹^¹异二聚体设计的序列。利用前述 PDf方法进行检测，如图 6b所示，序列 BR4能够特异性识别 CliNf^-CIiNf¹同二聚体，序列 BR6能够特异性识别 CI(N)^mutl-CI(N)^mutl同二聚体，而序列 BRIO更倾向于和 CKNr^CKNr¹"异二聚体结合，而这三者之间互不交叉。

基于以上结果，如果要检测蛋白质 A和蛋白质 B之间可能存在的三对相互作用（即 A-A的二聚化、 B-B的二聚化以及 A-B的二聚化），就可以在一个包含有 CKNf^-A和 CI(N)^mutl-B 融合蛋白的检测体系中，利用 BR4、 BR6 以及 BRIO三个不同的特异性 DNA序列实现对以上三对相互作用同时进行 PDf定量检测。而在上述序列设计和检测方法的基础上进行优化 (包括 DNA结合结构域与相应特异性 DNA序列的结合能力以及蛋白质表达量)和扩展 (互不交叉的 DNA结合结构域-特异性 DNA序列作用对），就可以将直接检测蛋白质相互作用网络的能力扩展到更大的规模 (原理图如图 6c所示

Claims

权利要求

1. 获取蛋白质间相互作用信息的方法，其包括如下步骤：

(1) 在宿主细胞中表达融合有 DNA结合结构域的目的蛋白质，所述 DNA结合结构域二聚化时对相应特异性 DNA序列的亲和力显著高于单体时；

(2) 在生理状态下用交联剂处理，将宿主细胞中的目的蛋白质二聚体和 DNA交联形成复合体；

(3) 将 DNA打碎成小片段；

(4) 分离提取所述小片段，并用 DNase l消化；

(5) 使用去交联剂处理，将步骤 (4)的产物去交联，并纯化得到 DNA片段；

(6) 检测步骤 (5)得到的 DNA片段。

2. 根据权利要求 1 所述的方法，所述宿主细胞包括大肠杆菌、酵母、哺乳动物细胞。

3. 根据权利要求 1所述的方法，所述 DNA结合结构域包括 λ噬菌体蛋白质 CI 的 DNA结合结构域及其符合权利要求 1步骤 (1)中所述 DNA结合结构域性质的突变体， λ噬菌体蛋白质 CRO的 DNA结合结构域及其符合权利要求 1步骤 (1)中所述 DNA 结合结构域性质的突变体；所述相应特异性 DNA序列包括 CI结合序列及它们的突变序列， CRO结合序列及它们的突变序列。

4. 根据权利要求 1所述的方法，所述步骤 (2)中使用的交联剂为甲醛。

5. 根据权利要求 1 所述的方法，所述步骤 (3)中使用 MNase 或者超声处理打碎 DNA为小片段。

6. 根据权利要求 1所述的方法，所述步骤 (5)中使用的去交联剂为蛋白酶 K。

7. 根据权利要求 1所述的方法，所述步骤 (6)中的检测包括基于核酸序列的定性和 /或定量检测，所述定量检测包括定量 PCR、高通量测序和 /或 DNA微阵列，所述定性检测包括 PCR和 /或琼脂糖凝胶电泳。

8. 一种用于获取蛋白质相互作用信息的试剂盒，包括：

(2) 宿主细胞；

(3) 交联剂及其反应终止液；

(4) 打碎 DNA的装置或试剂及其反应缓冲液； (5) DNase I及其反应缓冲液；

(6) 去交联剂；

(7) DNA检测装置。

9. 根据权利要求 8所述的试剂盒，所述交联剂为甲醛，所述交联反应终止液为甘氨酸溶液，所述去交联剂为蛋白酶 K，所述打碎 DNA的试剂为 MNase。

10. 根据权利要求 8所述的试剂盒，所述 DNA检测装置包括定性和 /或定量检测装置，所述定量检测装置包括定量 PCR装置、高通量测序装置或 DNA微阵列检测装置，所述定性检测装置包括 PCR装置或琼脂糖凝胶电泳装置。