WO2016008120A1 - 基于核酸序列的蛋白质相互作用检测方法 - Google Patents

基于核酸序列的蛋白质相互作用检测方法 Download PDF

Info

Publication number
WO2016008120A1
WO2016008120A1 PCT/CN2014/082331 CN2014082331W WO2016008120A1 WO 2016008120 A1 WO2016008120 A1 WO 2016008120A1 CN 2014082331 W CN2014082331 W CN 2014082331W WO 2016008120 A1 WO2016008120 A1 WO 2016008120A1
Authority
WO
WIPO (PCT)
Prior art keywords
dna
protein
binding domain
sequence
detection
Prior art date
Application number
PCT/CN2014/082331
Other languages
English (en)
French (fr)
Inventor
吴家睿
梁治
骆斯伟
Original Assignee
中国科学技术大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中国科学技术大学 filed Critical 中国科学技术大学
Priority to PCT/CN2014/082331 priority Critical patent/WO2016008120A1/zh
Publication of WO2016008120A1 publication Critical patent/WO2016008120A1/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids

Definitions

  • the invention belongs to the technical field of protein research, and particularly relates to the detection of protein interactions, in particular to an in-vivo detection method, a kit and a use thereof for protein interaction using DNA-encoded protein interaction information. Background technique
  • the method utilizes the change of the binding kinetics between the DNA binding domain of the fusion protein and the corresponding specific DNA binding site by the intensity of the interaction between the target proteins, thereby realizing that the interaction between the target proteins is represented by the corresponding specific DNA sequence, and the purpose is The strength of the interaction between proteins is given by the copy number of the sequence.
  • the present invention relates to the following:
  • a method of obtaining information on interaction between proteins comprising the steps of:
  • the product of the step (4) is decrosslinked, and purified to obtain a DNA fragment
  • the DNA binding domain comprises a DNA binding domain of lambda phage protein CI and a mutant thereof conforming to the nature of the DNA binding domain described in step (1) of claim 1, ⁇ phage protein a DNA binding domain of CRO and a mutant thereof which conforms to the nature of the DNA binding domain described in step (1) of claim 1; said corresponding specific DNA sequence comprises CI binding sequences and their mutated sequences, CRO Binding sequences and their mutated sequences.
  • step (3) uses MNase or sonication to break up the DNA into small fragments.
  • the detecting in the step (6) comprises qualitative and/or quantitative detection based on a nucleic acid sequence, the quantitative detection comprising quantitative PCR, high-throughput sequencing and/or DNA microarray, Descriptive assays include PCR and/or agarose gel electrophoresis.
  • a kit for obtaining protein interaction information comprising:
  • an expression vector having a DNA-binding domain and a corresponding specific DNA sequence, wherein the affinity of the DNA-binding domain for dimerization to the corresponding specific DNA sequence is significantly higher than that of the monomer;
  • the crosslinking agent is formaldehyde
  • the crosslinking reaction stop solution is a glycine solution
  • the decrosslinking agent is protease K
  • the reagent for breaking DNA is MNase.
  • the DNA detecting device comprises a qualitative and/or quantitative detecting device, the quantitative detecting device comprising a quantitative PCR device, a high-throughput sequencing device or a DNA microarray detecting device, the qualitative detection
  • the device includes a PCR device or an agarose gel electrophoresis device.
  • the method of the present invention can well perform the physical and quantitative interaction of protein intensities of different intensities. Dynamic detection. Furthermore, the method combines a nucleic acid sequence-based detection technique with protein interaction detection to greatly increase the throughput of detection, and by using different and non-intersecting DNA binding domain-specific DNA sequence pairs, The method can directly and quantitatively and simultaneously detect the protein interaction network composed of multiple protein interactions at the system level.
  • FRET fluorescence resonance energy transfer
  • Y2H yeast two-hybrid
  • the method of the present invention enables biologists to directly quantify protein interaction groups at the system level, rather than simply utilizing data from a single protein interaction to construct a corresponding network model to analyze protein interaction networks. Detailed description of the invention
  • a first aspect of the present invention provides a protein dimerization footprint method (PDf) for obtaining information on interaction between proteins, the principle of which is based on the strength of the interaction between the proteins of interest and the DNA binding domain to which it is fused and the corresponding specific DNA
  • PDf protein dimerization footprint method
  • the method comprises the steps of:
  • the product of the step (4) is decrosslinked, and purified to obtain a DNA fragment
  • the DNA binding domain can be used in the present invention as long as the affinity for the corresponding specific DNA at the time of dimerization is much higher than that of the monomer, such DNA binding domain and corresponding specific DNA sequence
  • DNA binding domain and corresponding specific DNA sequence include, but are not limited to, the DNA binding domain of the lambda phage protein CI and the CI binding sequence, the DNA binding domain of the lambda phage protein CRO and the CRO binding sequence.
  • the DNA-binding domain forms a dimer which binds to the corresponding specific DNA, thereby forming DNA in the cross-linking process due to a sufficiently close distance.
  • cross-linking as described herein refers to immobilizing molecules that are close enough to facilitate subsequent analysis.
  • the crosslinking agent includes, but is not limited to, formaldehyde, glutaraldehyde, and the like.
  • the method of breaking up DNA into small fragments is known to those skilled in the art, including sonication and enzymatic treatment, etc., preferably with MNase.
  • methods for detecting DNA fragments isolated after decrosslinking include, but are not limited to, nucleic acid sequence-based qualitative and PCR, such as PCR, agarose gel electrophoresis, quantitative PCR, high throughput sequencing, and DNA microarrays. Or quantitative detection technology.
  • a second aspect of the invention provides a kit for obtaining protein interaction information, comprising:
  • the host cell includes, but is not limited to, bacteria, yeast, mammalian cells, etc., the cross-linking agent, the de-crosslinking agent, the device and reagent for breaking the DNA, the quantitative detecting device, and the like.
  • the cross-linking agent includes, but is not limited to, bacteria, yeast, mammalian cells, etc., the cross-linking agent, the de-crosslinking agent, the device and reagent for breaking the DNA, the quantitative detecting device, and the like.
  • Figure 1 Schematic diagram of the vector pPIDAl and P pPIDKl, wherein (A) is pPIDAl, (B) is pPIDKl, Plac is the promoter, CI(N) is the DNA binding domain of protein CI, MCS is the multiple cloning site, Ter For the transcription termination sequence, BR is a specific DNA binding sequence, AmpR is an ampicillin resistance gene, KanR is a kanamycin resistance gene, and Ori is an origin of replication of the vector.
  • FIG. 1 Schematic diagram of the protein dimerization footprint method (PDf).
  • FIG. 3 Protein verification for protein CI dimerization domain CI (C) PDf detection method.
  • (a) is a schematic diagram of the constructed vector, wherein BR-pSP73 is a blank control, containing only the DNA-binding domain CI(N) of the CI protein corresponding to the specific DNA sequence BR; pPIDAl is a negative control, DNA binding containing CI protein Domain CI (N cannot dimerize) and the corresponding specific DNA sequence BR; CI(C)-pPIDAl is a positive control containing CI protein dimerization domain CI (C) and CI protein which can be dimerized The fusion protein of the DNA binding domain CI(N) and the corresponding specific DNA sequence BR.
  • Figure 4 Experimental verification and analysis of the reaction kinetics model of the PDf detection method.
  • (a) The high consistency of the measured values of the PDf experiment with the calculated values based on the kinetic model, which proves the reliability of the model;
  • (b) Calculated by the kinetic model, when the target protein monomer concentration Cs varies between 0.01 and 100 times , changes in PDf signal;
  • FIG. 5 Comparison of static and dynamic protein interaction detection based on PDf method with existing protein-protein interaction detection techniques.
  • (a) Detection of static protein interactions in E. coli chemotaxis systems using yeast two-hybrid (Y2H), fluorescence resonance energy transfer (FRET) and PDf methods, respectively.
  • Figure 6 Design and testing of DNA-binding domain-specific DNA sequence interaction pairs that do not cross each other.
  • (a) Based on the structural information of the PDB structure 1LMB, the interaction energy of the DNA-binding domain Cl ⁇ f 1 and the mutant CI(N) mutl of the wild-type CI protein with different specific DNA sequences was calculated by FoldX software, traversing all The amount of change in the interaction energy of the wild-type DNA binding domain ( ⁇ ( ⁇ ), dimer and wild-type specific DNA sequence (BR1) relative to the wild-type DNA binding domain under the condition of a specific DNA sequence. Can increase, negative value indicates that the interaction energy decreases.
  • Solution 1 20% glucose solution 2ml, 20mM adenine solution lml, 10X histidine-deficient amino acid supplement 10ml
  • Solution 2 0.1 ml of 1 M magnesium sulfate solution, 0.1 ml of 1 M thiamine hydrochloride solution, 0.1 ml of 10 mM zinc sulfate solution, 0.1 ml of 100 mM calcium chloride solution, 100 mM isopropyl thiogalactoside (IPTG) 0.05 ml, Solution 2 was added to solution 1 and mixed, and 10 ml of 10X M9 salt was added thereto, and then made up to 100 ml with double distilled water.
  • IPTG isopropyl thiogalactoside
  • Antibiotic solution ampicillin solution, kanamycin solution
  • AxyPrep PCR Cleaning Kit (Axygen, AP-PCR-50)
  • DNase I Deoxyribonuclease I (DNase I) (2,000 U/mL, New England BioLabs, M0303 S) PrimeSTAR Max DNA Polymerase (Takara, R045 A)
  • the ribosome binding site RBS and the promoter Plac sequence were sequentially inserted between the Kpnl and Spel sites of CI(N)-MCS-pSP73 and CI(N)-MCS-pSB1K3, and the transcription termination sequences Ter and cI(N) were inserted.
  • the corresponding specific DNA sequence BR was sequentially inserted between the Nhel and Xhol sites of CI(N)-MCS-pSP73 and CI(N)-MCS-pSB 1K3, and finally the pPIDAl and pPIDKl vectors were obtained.
  • the Plac, RBS and Ter sequences are as follows:
  • RBS (SEQ ID NO: 7):
  • the gene was cloned using the following primers, and the obtained polymerase chain reaction (PCR) product was purified using an AxyPrep PCR cleaning kit to obtain a product which can be used in the subsequent step or stored at -20 °C.
  • PCR polymerase chain reaction
  • the restriction enzymes EcoRI and BamHI were used to double-cut the vector pPIDAl and pPIDKl, and then the enzyme digestion product was purified by AxyPrep PCR cleaning kit to obtain a linearized vector, and the target gene was separately utilized with the linearized vector.
  • the In-Fusion HD Cloning Kit was reacted at 50 ° C for 15 minutes and transformed into E. coli DH5 (x competent form, 37° on LB solid medium containing the corresponding antibiotic (ampicillin or kanamycin). C overnight culture. Finally, X-pPIDAl containing the protein of interest X and Y-pPIDKl containing the protein of interest Y were obtained.
  • Monoclonal colonies of the recombinant vector obtained by the transformation were picked up in LB liquid medium containing the corresponding antibiotic (ampicillin or kanamycin), and cultured overnight at 37 ° C, shaking at 250 rpm.
  • the overnight culture solution was taken out and the recombinant vector was extracted using a SanPrep column plasmid DNA miniprep kit.
  • the extracted vector can be verified for correctness by sequencing.
  • the recombinantly obtained X-pPIDAl and Y-pPIDKl vector were co-transformed into E. coli JM109 competent state, and cultured overnight at 30 ° C in LB solid medium containing ampicillin and kanamycin.
  • the monoclonal colonies obtained by overnight culture were picked up in M9 histidine-deficient medium containing ampicillin and kanamycin, and cultured overnight at 37 ° C with shaking at 250 rpm.
  • the reaction solution was transferred to a 1.5 ml centrifuge tube, centrifuged at 12000 rpm for 4 min at 4 ° C, the supernatant was discarded, and the bacterial pellet was washed twice with 1 ml of IX PBS solution at 4 ° C, 12000 rpm for 2 min, and then ⁇ protease and phosphoric acid were added.
  • the bacterial inhibitor was resuspended in a 1 ml IX PBS solution of the enzyme inhibitor mixture, and centrifuged at 12000 rpm for 4 min at 4 ° C, and the supernatant was discarded, and the resulting bacterial pellet was used for subsequent experiments or stored at -20 ° C.
  • the cell pellet was resuspended in 200 ⁇ l Lysis Buffer I, vortexed and mixed for 15 seconds, then placed on ice for 10 minutes, centrifuged at 9000 rpm for 3 minutes, and the supernatant was removed. Then, the above precipitate was resuspended in 200 ⁇ l MNase digestion buffer, and ⁇ was used for subsequent detection.
  • 2 ⁇ 1 MNase was added to each 18 ⁇ 1 MNase digestion buffer and mixed. 4 ⁇ 1 was added to the above ⁇ resuspension and reacted at 37 °C for 15 minutes, and the mixture was shaken once every 5 minutes. Then, 2 (1l Mnase reaction species stop solution) was added to the above reaction solution, and placed on ice for 5 minutes, centrifuged at 9000 rpm for 5 minutes, and the supernatant was removed.
  • the pellet obtained in the previous step was resuspended in 50 ⁇ l of nuclear extraction buffer, and placed on ice for 15 minutes, and shaken once every 5 minutes. Then, centrifugation was carried out at 9000 rpm for 5 minutes, and the supernatant was retained, transferred to a 1.5 ml centrifuge tube, and then 2 ⁇ l of DNase I was added thereto for overnight digestion (at least 12 hours).
  • the reaction mixture was allowed to react at 75 for 10 minutes, and then cooled on ice, and ⁇ was added thereto to crosslink the mixture and mix, and then reacted at 65 ° C for 1.5 hours.
  • the above reaction solution was purified by a UNIQ-10 column oligonucleotide purification kit to obtain a purified DNA fragment solution.
  • PCR was carried out using CI(C)-pPIDAl containing the wild type DNA binding domain CKNf ⁇ SEQ ID NO: 5) as a template to obtain a PCR product as a linearized vector.
  • the PCR product was sufficiently digested with restriction endonuclease Dpnl, and a vector in which the DNA-binding domain was a mutant CI (N) mutl was obtained by extraction and vector extraction.
  • a specific DNA sequence in which the DNA-binding domain Cl ⁇ f 1 and CI(N) mutl do not cross each other is prepared.
  • PDf protein dimerization footprint detection
  • the DNA-based interaction network information can be obtained. .
  • Fig. 3a Three control experiments (Fig. 3a) can be performed by BR-pSP73 (blank control), pPIDAl (negative control) and CI (C)-pPIDAl (positive control). It was demonstrated that the DNA fragment not protected by protein binding can be removed by 12-hour digestion with DNase I enzyme, so that the PDf detection result can reflect the intensity of different protein interactions (results shown in Figure 3b).
  • ⁇ '' is the ratio of specific DNA fragments that are not bound to protein monomers, is the concentration of protein monomers, 3 ⁇ 4 "' is protein monomer and specific DNA
  • the rate constant of the sequence binding reaction is the rate constant for the dissociation reaction of the protein monomer with the specific DNA sequence complex.
  • the rate of change is:
  • Equation (2) is differentiated from time and combined with equation (1) to get:
  • Equation (7) describes the process by which a protein monomer binds to specific DNA during the crosslinking process of the PDf method. Considering the unsaturation of specific DNA sequences during the experiment and the total number of specific DNA sequences being constant (see Figure 3c), the PDf signal of the protein monomer binding specific DNA sequence can be obtained as:
  • the PDf signal of the protein dimerization process consists of two partial contributions, one is the binding of the protein monomer to the specific DNA sequence, and the other is the binding of the protein dimer to the specific DNA sequence. Therefore, the PDf signal that can be obtained by protein dimerization or protein interaction is:
  • A is a contribution of a protein monomer to binding to a specific DNA sequence, and its form is as shown in (9), and I d is a contribution of protein dimer binding to a specific DNA sequence.
  • the DNA binding kinetics model of the protein dimer can be extended. Defined as the concentration of protein dimers, feff " rf is the rate constant for the binding reaction of protein dimers to specific DNA sequences, and is the rate constant for the dissociation reaction between protein dimers and specific DNA sequence complexes.
  • the strength of protein dimerization or protein interaction can be expressed as:
  • the dual-vector expression system X-pPIDAl+GFP-pPIDKl was used to verify and analyze the reaction kinetics model of PDf.
  • pPIDAl and pPIDKl have the same protein monomer detection performance and the same protein expression ability, so protein X and GFP have approximate expression levels. Since GFP exists almost in a monomeric form in cells, the PDf signal of the system expressing only GFP can be used to approximate the PDf signal l s of the target protein X, thereby being able to detect the protein monomer binding pair using the reporter gene properties of GFP. The effect of protein X dimerization on PDf detection results.
  • J sd 3 ⁇ 4 J d £ ⁇ '' ⁇ d (l Z2l£A_ e - 1( k td K di er s ⁇ + f fd)-'!
  • the PDf detection signal has the following relationship:
  • the ratio of the dimerization intensity of each of the two proteins may be approximately equal to the ratio of the PDf detection signals.
  • the strength of protein interactions can be expressed in terms of the corresponding specific DNA sequence copy number.
  • PhoB sequence (SEQ ID NO: 20):
  • BR1 (ie the corresponding specific DNA sequence of C Nf*) (SEQ ID NO: 21): TGTGG
  • BR1, 4, 5, 6, and 8 are sequences designed for CKNf ⁇ CKNf 1 and CI(N) mutl -CI (N) mutl homodimers respectively, and BR7, 9, and 10 are for CliNf ⁇ -CIiN) 1 ⁇ 1 Sequence of heterodimer design.
  • the sequence BR4 can specifically recognize the CliNf ⁇ -CIiNf 1 homodimer
  • the sequence BR6 can specifically recognize the CI(N) mutl -CI (N) mutl homodimer.
  • the sequence BRIO is more likely to bind to the CKNr ⁇ CKNr 1 "heterodimer, and the three do not cross each other.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了基于DNA序列检测蛋白质间相互作用的方法(称为蛋白质二聚化足迹法,Protein Dimerization footprinting,简称PDf),试剂盒及其用途。其基本原理是基于目的蛋白质间相互作用强度对其融合的DNA结合结构域与相应特异性DNA序列间结合动力学的影响,实现将目的蛋白质间相互作用由相应特异性DNA序列表示,而目的蛋白质间相互作用强度则由该特异性DNA序列的拷贝数给出。

Description

基于核酸序列的蛋白质相互作用检测方法 技术领域
本发明属于蛋白质研究技术领域, 具体涉及蛋白质相互作用的检测, 尤其涉及利 用 DNA编码蛋白质相互作用信息进行蛋白质相互作用的在体检测方法, 试剂盒及其 用途。 背景技术
传统在体蛋白质间相互作用检测技术尽管已被广泛应用于生物学研究, 但存在诸 多不足。 例如, 酵母双杂交技术 (Y2H)虽然实现简单, 但是其动态检测和定量检测能 力明显不足, 而荧光共振能量转移技术 (FRET)虽然有较好的时空分辨率以及定量能力, 但其受限于荧光蛋白的荧光强度以及蛋白质的空间结构等性质。 并且, 这些传统检测 技术仅能针对单一蛋白质相互作用对进行检测, 不能在同一个细胞内对包含有多对相 互作用的蛋白质相互作用网络进行同时检测。
为此, 我们通过发明蛋白质二聚化足迹法 (Protein Dimerization footprinting, 简称 PDf)检测技术, 将基于核酸序列的检测技术与蛋白质间相互作用检测相结合, 从而实 现在体地、 定性和 /或定量地、动态地检测蛋白质相互作用, 并使直接对蛋白质相互作 用网络进行检测成为可能。 发明内容
本方法利用目的蛋白质间相互作用强度对与其融合的 DNA结合结构域与相应特 异性 DNA结合位点间结合动力学的改变, 来实现将目的蛋白质间相互作用由相应特 异性 DNA序列表示, 而目的蛋白质间相互作用强度则由该序列的拷贝数给出。
具体的, 本发明涉及以下各项:
1. 获取蛋白质间相互作用信息的方法, 其包括如下步骤:
(1)在宿主细胞中表达融合有 DNA结合结构域的目的蛋白质, 所述 DNA结合结 构域二聚化时对相应特异性 DNA序列的亲和力显著高于单体时;
(2)在生理状态下用交联剂处理,将宿主细胞中的目的蛋白质二聚体和 DNA交联 形成复合体;
(3)将 DNA打碎成小片段;
(4)分离提取所述小片段, 并用 DNase I消化;
(5)使用去交联剂处理, 将步骤 (4)的产物去交联, 并纯化得到 DNA片段;
(6)检测步骤 (5)得到的 DNA片段。
2. 根据 1所述的方法, 所述宿主细胞包括大肠杆菌、 酵母、 哺乳动物细胞。
3. 根据 1所述的方法,所述 DNA结合结构域包括 λ噬菌体蛋白质 CI的 DNA结 合结构域及其符合权利要求 1步骤 (1)中所述 DNA结合结构域性质的突变体, λ噬菌 体蛋白质 CRO的 DNA结合结构域及其符合权利要求 1步骤 (1)中所述 DNA结合结构 域性质的突变体;所述相应特异性 DNA序列包括 CI结合序列及它们的突变序列, CRO 结合序列及它们的突变序列。
4. 根据 1所述的方法, 所述步骤 (2)中使用的交联剂为甲醛。
5. 根据 1所述的方法, 所述步骤 (3)中使用 MNase或者超声处理打碎 DNA为小 片段。
6. 根据 1所述的方法, 所述步骤 (5)中使用的去交联剂为蛋白酶 K。
7. 根据 1所述的方法, 所述步骤 (6)中的检测包括基于核酸序列的定性和 /或定量 检测, 所述定量检测包括定量 PCR、 高通量测序和 /或 DNA微阵列, 所述定性检测包 括 PCR和 /或琼脂糖凝胶电泳。
8. 一种用于获取蛋白质相互作用信息的试剂盒, 包括:
(1) 带有 DNA结合结构域和相应特异性 DNA序列的表达载体, 所述 DNA结合 结构域二聚化时对相应特异性 DNA序列的亲和力显著高于单体时;
(2) 宿主细胞;
(3) 交联剂及其反应终止液;
(4) 打碎 DNA的装置或试剂及其反应缓冲液;
(5) DNase I及其反应缓冲液;
(6) 去交联剂;
(7) DNA检测装置。
9. 根据 8所述的试剂盒,所述交联剂为甲醛,所述交联反应终止液为甘氨酸溶液, 所述去交联剂为蛋白酶 K, 所述打碎 DNA的试剂为 MNase。
10. 根据 8所述的试剂盒, 所述 DNA检测装置包括定性和 /或定量检测装置, 所 述定量检测装置包括定量 PCR装置、 高通量测序装置或 DNA微阵列检测装置, 所述 定性检测装置包括 PCR装置或琼脂糖凝胶电泳装置。
将本发明的方法与荧光共振能量转移 (FRET)技术以及酵母双杂交 (Y2H)技术的结 果相比较, 本发明的方法能够很好地对不同强度的蛋白质间相互作用进行在体地、 定 量地、 动态地检测。 更进一步, 本方法将基于核酸序列的检测技术与蛋白质相互作用 检测相结合, 能够大大提高检测的通量, 而通过使用不同且互不交叉的 DNA结合结 构域-特异性 DNA序列对, 使得该方法能够在系统层次上直接定量地、 动态地同时检 测多条蛋白质相互作用构成的蛋白质相互作用网络。
本发明的方法能够帮助生物学家从系统层面上直接定量研究蛋白质相互作用组, 而非简单利用单一蛋白质相互作用的数据通过构建相应的网络模型来分析蛋白质相 互作用网络。 发明详述
以下对本发明的技术方案做进一步详细阐述。 应当指出, 本发明的各实施方案可 以根据需要以任何方式组合。
本发明的第一个方面提供一种获取蛋白质间相互作用信息的蛋白质二聚化足迹 法 (PDf), 其原理为基于目的蛋白质间相互作用强度对其融合的 DNA结合结构域与相 应特异性 DNA序列间结合动力学的影响, 实现将目的蛋白质间相互作用由相应特异 性 DNA序列表示,而目的蛋白质间相互作用强度则由该特异性 DNA序列的拷贝数给 出。
在一个实施方案中, 所述方法包括以下步骤:
(1)在宿主细胞中表达融合有 DNA结合结构域的目的蛋白质, 所述 DNA结合结 构域二聚化时对相应特异性 DNA的亲和力远高于单体时;
(2)在生理状态下用交联剂处理,将宿主细胞中的目的蛋白质二聚体和 DNA交联 形成复合体;
(3)将 DNA打碎成小片段;
(4)分离提取所述小片段, 并用 DNase I消化;
(5)使用去交联剂处理, 将步骤 (4)的产物去交联, 并纯化得到 DNA片段;
(6)定量检测步骤 (5)得到的 DNA片段。
在一个优选的实施方案中, 只要二聚化时对相应特异性 DNA的亲和力远高于单 体时的 DNA结合结构域都可以用于本发明,此种 DNA结合结构域和相应特异性 DNA 序列包括但不限于 λ噬菌体蛋白质 CI的 DNA结合结构域和 CI结合序列, λ噬菌体蛋 白质 CRO的 DNA结合结构域和 CRO结合序列。 在此种情况下, 当目的蛋白之间发 生相互作用时, DNA结合结构域形成二聚体, 该二聚体与相应特异性 DNA结合, 从 而在交联过程中由于距离足够近而形成 DNA-蛋白质二聚体复合物; 相反, 当目的蛋 白之间不发生相互作用时, DNA结合结构域以单体形式存在, 由于单体形式的 DNA 结合结构域与特异性 DNA不结合或结合很弱, 从而不能有效交联, 在后续过程中将 与二聚体区分开。
在一个优选的实施方案中, 本文所述的交联是指将距离足够近的分子固定在一起 以利于后续分析。 在一个更优选的实施方案中, 所述交联剂包括但不限于甲醛, 戊二 醛等。
在一个优选的实施方案中,打碎 DNA为小片段的方法是本领域技术人员已知的, 包括超声和酶处理等, 优选用 MNase处理。
在一个优选的实施方案中, 检测去交联后分离的 DNA片段的方法包括但不限于 PCR、 琼脂糖凝胶电泳、 定量 PCR、 高通量测序以及 DNA微阵列等基于核酸序列的 定性和 \或定量检测技术。
本发明的第二个方面提供一种用于获取蛋白质相互作用信息的试剂盒, 包括:
(1) 带有 DNA结合结构域和相应特异性 DNA序列的表达载体, 所述 DNA结合 结构域二聚化时对相应特异性 DNA的亲和力远高于单体时;
(2) 宿主细胞;
(3) 交联剂及其反应终止液;
(4) 打碎 DNA的装置和试剂及其反应缓冲液;
(5) DNase I及其反应缓冲液;
(6) 去交联剂;
(7) DNA检测装置。
在一个优选的实施方案中, 所述宿主细胞包括但不限于细菌, 酵母, 哺乳动物细 胞等, 所述交联剂、 去交联剂、 打碎 DNA的装置和试剂、 定量检测装置等都如前所 述。 附图说明
图 1.载体 pPIDAl禾 P pPIDKl结构示意图, 其中 (A)为 pPIDAl , (B)为 pPIDKl , Plac 为启动子, CI(N)为蛋白质 CI的 DNA结合结构域, MCS为多克隆位点, Ter为转录 终止序列, BR为特异性 DNA结合序列, AmpR为氨苄亲霉素抗性基因, KanR为卡 那霉素抗性基因, Ori为载体的复制起点。
图 2.蛋白质二聚化足迹法 (PDf)工作原理图。
图 3. 以蛋白质 CI的二聚化结构域 CI(C)为目的蛋白质验证 PDf检测方法。 (a)为构建 的载体的示意图, 其中 BR-pSP73为空白对照, 仅含有 CI蛋白质的 DNA结合结构域 CI(N)相应的特异性 DNA序列 BR; pPIDAl为阴性对照,含有 CI蛋白质的 DNA结合 结构域 CI(N 不能二聚化)和相应的特异性 DNA序列 BR; CI(C)-pPIDAl为阳性对照, 含有可以二聚化的 CI蛋白质二聚化结构域 CI(C)和 CI蛋白质的 DNA结合结构域 CI(N) 的融合蛋白质及相应的特异性 DNA序列 BR。 (b)通过 12小时 DNase I充分消化, PDf 方法能够很好地区分空白组、 阴性组和阳性组, 从而验证了 PDf检测方法的正确性。 (c)PDf方法中双载体体系的特异性 DNA序列 (BR)数量随诱导时间的变化情况。
图 4. PDf检测方法的反应动力学模型的实验验证与分析。(a)PDf实验测定值与基于动 力学模型计算值的高度一致性, 证明了模型的可靠性; (b)通过动力学模型计算, 当目 的蛋白质单体浓度 Cs在 0.01-100倍间变化时, PDf信号的变化情况; (c) 对比阳性和 阴性实验组,即蛋白质二聚化时 DNA结合结构域与特异性 DNA序列结合和蛋白质单 体状态时 DNA结合结构域与特异性 DNA序列结合的 PDf信号。
图 5. 基于 PDf方法的静态和动态蛋白质相互作用检测与现有蛋白质间相互作用检测 技术的比较。 (a)分别使用酵母双杂交 (Y2H)、 荧光共振能量转移 (FRET)和 PDf 方法, 对大肠杆菌趋化系统中的静态蛋白质相互作用进行检测。 (b)大肠杆菌 PhoR/PhoB磷酸 信号传导系统中 PhoB二聚化强度在不同磷酸浓度的环境下随时间的动态变化。 (c)利 用 FRET方法测得的 PhoR/PhoB磷酸信号传导系统在不同磷酸浓度的环境下经过充分 反应后 PhoB的二聚化强度。
图 6.互不交叉的 DNA结合结构域-特异性 DNA序列相互作用对的设计与测试。 (a)基 于 PDB结构 1LMB的结构信息, 通过 FoldX软件计算野生型 CI蛋白质的 DNA结合 结构域 Cl^f1和突变体 CI(N)mutl与不同特异性 DNA序列的相互作用能,在遍历所有 可能的特异性 DNA序列的条件下, 相对于野生型 DNA结合结构域 (α(Ν),二聚体与 野生型特异性 DNA序列 (BR1)相互作用能的变化量。 其中正值表示相互作用能增加, 负值表示相互作用能下降。 (b)基于 DNA结合结构域 Cl^f1和 CI(N)mutl及不同 BR序 列的 PDf检测结果,其中虚线表示标准值。图中横坐标 (^^^-81 1(1=1,4,5,6,7,8,9,10) 表示双载体中的 DNA 结合结构域均为 CliNf1 , 特异性 DNA 序列均为 BRi ; CI(N)mutl-BRi (1=1,4,5,6,7,8,9,10) 表示双载体中的 DNA结合结构域均为 CKKT", 特异性 DNA序列均为 BRi;
Figure imgf000006_0001
(1=1,4,5,6,7,8,9,10) 表示双载体中一个 DNA结合结构域为 C^Nf1, 另一个为 CI(N)mutl, 特异性 DNA序列均为 BRi。(c)利用 PDf技术同时在体检测多对蛋白质相互作用的原理图。 具体实施方式 材料与方法
(1) 菌株与载体
a. 克隆菌株: 大肠杆菌 K12菌株 DH5a (生工生物, SD8411)
b. 表达菌株: 大肠杆菌 K12菌株 JM109 (Takara, D9052A)
c. 载体: pSP73(Promega, P2221), pSB lK3(iGEM Distribution)
(2) 培养基与试剂
a. 培养基:
LB 液体培养基:
氯化钠 lg, 酵母提取物 0.5g, 蛋白胨 lg, 双蒸水 100ml
LB固体培养基:
氯化钠 lg, 酵母提取物 0.5g, 蛋白胨 lg, 琼脂 1.2g, 双蒸水 100ml
M9组氨酸缺陷培养基:
溶液 1 : 20%葡萄糖溶液 2ml, 20mM腺嘌吟溶液 lml, 10X组氨酸缺陷氨基酸补 充液 10ml
溶液 2: 1M硫酸镁溶液 0.1ml, 1M盐酸硫胺素溶液 0.1ml, 10mM硫酸锌溶液 0.1ml, lOOmM氯化钙溶液 0.1ml, lOOmM异丙基硫代半乳糖苷 (IPTG) 0.05ml, 向溶 液 1中加入溶液 2并混匀,并向其中加入 10ml 10X M9盐后,用双蒸水定容至 100ml。
b. 试剂
10X组氨酸缺陷氨基酸补充液:
腺嘌吟 200mg, 盐酸精氨酸 200mg, 异亮氨酸 300mg, 盐酸赖氨酸 300mg, 甲 硫氨酸 200mg, 苯丙氨酸 500mg, 苏氨酸 2000mg, 酪氨酸 300mg, 尿嘧啶 200mg, 缬氨酸 1500mg, 亮氨酸 lOOOmg, 色氨酸 200mg, 双蒸水 1L。
10X M9 盐:
磷酸氢二钠 67.8g, 磷酸二氢钾 30g, 氯化钠 5g, 氯化铵 10g, 双蒸水 1L。 抗生素溶液: 氨苄亲霉素溶液,卡那霉素溶液
Pierce Chromatin Prep Module (Thermo Scientific, 26158)
UNIQ-10柱式寡聚核苷酸纯化试剂盒 (生工生物, SK1144)
SanPrep柱式质粒 DNA小量抽提试剂盒 (;生工生物, SK8192)
AxyPrep PCR清洁试剂盒 (Axygen, AP-PCR-50)
In-Fusion HD Cloning Kit(CloneTech, 639648)
脱氧核糖核酸酶 I (DNase I) (2,000U/mL, New England BioLabs, M0303 S) PrimeSTAR Max DNA Polymerase(Takara,R045 A)
SYBR Premix EX Tag II (Takara, RR820A)
限制性内切酶:
EcoRI,BamHI, Kpnl, SpeI,NheI, Xhol, Dpnl
37%甲醛溶液
Lysis Buffer I:
按每 lOOul Membrane Extraction Buffer (Pierce Chromatin Prep Module)中力口入 lul 蛋白酶和磷酸酶抑制剂混合液的比例配制 MNase酶切缓冲工作液
按每 lOOul MNase酶切缓冲液 (Pierce Chromatin Prep Module)中加入 O. lul 1M二 硫苏糖醇 (DTT)溶液比例配制。
去交联混合液 (10ul):
去核酸酶水 6.6μ1, 5Μ氯化钠溶液 2.4μ1, 蛋白酶 Κ 1μ1。
(3) 载体构建
a. pPIDAl和 pPIDKl检测载体的构建
(i) MCS-pSP73 MCS-pSBlK3以及 BR-pSP73载体构建
将 SEQ ID NO: 1所示的多克隆位点 MCS序列
SEQ ID NO: 1
GTCGACCTGC ATGCTAGC AGCGGCCG-3 '
通过 Clal和 Xhol两个限制性内切酶插入到 pSP73载体中, 得到 MCS-pSP73。 将 SEQ ID NO: 2所示多克隆位点 MCS序列
SEQ ID NO: 2
GTCGACCTGC ATGCTAGCAGCGGCCGCTCGAG-3'
通过 Aatll和 Pstl两个限制性内切酶插入到 pSBlK3载体中,得到 MCS-pSBlK3。 此外, 将 DNA结合结构域 CICN)相应的特异性 DNA序列 BR(SEQ ID NO: 21) 插入到 MCS-pSP73载体的 Nhel和 Xhol位点间得到 BR-pSP73载体。
(ii) CI(N)的克隆以及 CI(N)-MCS-pSP73和 CI(N)-MCS-pSBlK3载体构建 利用以下引物以 λ噬菌体基因组为模版克隆蛋白质 CI的 DNA结合结构域 CI(N)。 克隆正向引物 (SEQ ID NO: 3):
ACAAGAG-3'
克隆反向引物 (SEQ ID NO: 4):
AT-3'
Figure imgf000008_0001
GG-3'
将以上克隆产物通过限制性内切酶 Kpnl 和 Nhel 插入到 MCS-pSP73 和 MCS-pSBlK3 载体 的 Kpnl 禾 P Spel 位 点 间 得 到 CI(N)-MCS-pSP73 和 CI(N)-MCS-pSBlK3载体。
(iii) pPIDAl和 pPIDKl载体构建
将核糖体结合位点 RBS 和启动子 Plac 序列依次插入到 CI(N)-MCS-pSP73 和 CI(N)-MCS-pSBlK3的 Kpnl和 Spel位点间, 将转录终止序列 Ter和 cI(N)相应的特异 性 DNA序列 BR依次插入到 CI(N)-MCS-pSP73和 CI(N)-MCS-pSB 1K3的 Nhel和 Xhol 位点间, 最后得到 pPIDAl和 pPIDKl载体。 其中 Plac、 RBS以及 Ter序列如下:
Figure imgf000009_0001
CGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACA-3'
RBS(SEQ ID NO: 7):
5 ' -ATTAAAGAGGAGAAA-3 '
Figure imgf000009_0002
CGGGTGGGCCTTTCTGCGTTTATA-3 '
b. 基因克隆:
用以下引物克隆目的基因, 将得到的聚合酶链式反应 (PCR)产物用 AxyPrep PCR 清洁试剂盒进行纯化, 得到产物可用于后续步骤或于 -20°C保存。
克隆正向引物 (SEQ ID NO: 9):
5'-CATGGAGGCCGAATTC111222333444555666777888-3,(其中 111 为目的基因 的起始密码即第 1个密码子, 其余数字表示目的基因的后续密码子序列)
克隆反向引物 (SEQ ID NO: 10):
5 ' -GCAGGTCGACGGATCCLLL NNNNNNNNNNNNNNNNNNNN-3 ' (其中 LLL 为目的基因的最后一个密码子, 其中 N表示目的基因的前续密码子序列)
c 同源重组
利用限制性内切酶 EcoRI和 BamHI对载体 pPIDAl和 pPIDKl进行双酶切处理后, 将酶切产物用 AxyPrep PCR清洁试剂盒进行纯化, 进而得到线性化载体, 再将目的基 因分别与线性化载体利用 In-Fusion HD Cloning Kit在 50°C下反应 15分钟后, 转化于 大肠杆菌 DH5(x感受态中,在含有相应抗生素 (氨苄亲霉素或卡那霉素)的 LB固体培养 基上 37°C过夜培养。 最后得到含有目的蛋白质 X的 X-pPIDAl和含有目的蛋白质 Y 的 Y-pPIDKl。
d. 载体抽提与检验
挑取转化得到的重组载体的单克隆菌落于含有相应抗生素 (氨苄青霉素或卡那霉 素)的 LB液体培养基中, 37°C, 250rpm振摇过夜培养。
次日, 取出过夜培养菌液并用 SanPrep柱式质粒 DNA小量抽提试剂盒提取重组 载体。 提取出的载体可通过测序检验其正确性。
(4)共转化与表达 a. 共转化
将重组得到的 X-pPIDAl与 Y-pPIDKl载体共转化到大肠杆菌 JM109感受态中, 在含有氨苄青霉素和卡那霉素的 LB固体培养基上 30°C过夜培养。 挑取过夜培养得到 的单克隆菌落于含有氨苄青霉素和卡那霉素的 M9组氨酸缺陷培养基中, 37°C, 250rpm 振摇过夜培养。
b. 表达
取以上过夜培养的菌液接种到新的含有氨苄青霉素和卡纳霉素的 M9组氨酸缺陷 培养基中, 并将 OD600值调整至 0.03 0.04后, 加入终浓度为 ΙΟμΜ的异丙基硫代半 乳糖苷 CIPTG;), 然后于 37°C, 250rpm振摇培养 8h后, 测定并记录 OD600。
(5) 蛋白质二聚化足迹法检测 (PDf)
a.染色质交联与细菌分离
取以上 8h诱导表达的大肠杆菌 JM109菌液 1ml于 15ml离心管中, 加入 27μ1的 37%甲醛溶液, 并于 25 °C, 300rpm振摇反应 8分钟, 然后加入 10X甘氨酸溶液至终 浓度为 IX,并于 25 °C, 300rpm振摇反应 5分钟。将反应液转移至 1.5ml离心管中, 4°C, 12000rpm离心 4min后, 弃上清, 并用 lml IX PBS溶液 4°C, 12000rpm离心 2min清 洗细菌沉淀两次, 然后用加入了 ΙΟμΙ蛋白酶和磷酸酶抑制剂混合液的 lml IX PBS溶 液重悬细菌沉淀, 并于 4°C, 12000rpm离心 4min后弃上清, 得到的细菌沉淀可用于 后续试验或于 -20°C保存。
b.样品裂解与 MNase酶消化
用 200μ1 Lysis Buffer I重悬菌体沉淀,振荡混匀 15秒后,置于冰上反应 10分钟, 再 9000rpm离心 3分钟并移除上清。 然后, 用 200μ1 MNase酶切缓冲工作液重悬以上 沉淀, 并取 ΙΟΟμΙ用于后续检测。
每 18μ1 MNase 酶切缓冲液中加入 2μ1 MNase并混匀,取 4μ1加入以上 ΙΟΟμΙ重悬 液中, 于 37°C反应 15分钟, 其中每过 5分钟振荡混匀一次。 然后, 向以上反应液中 加入 2(^lMnase反应种终止液, 并置于冰上放置 5分钟后, 9000rpm离心 5分钟并移 净上清。
c 蛋白质 -DNA复合物的提取与 DNase I酶消化
用 50μ1核提取缓冲液重悬上一步中得到的沉淀, 并置于冰上反应 15分钟, 每过 5分钟振荡混匀一次。 然后 9000rpm离心 5分钟, 并保留上清, 将其转移至 1.5ml 离 心管中, 然后向其中加入 2μ1 DNase I 过夜消化 (至少 12小时)。
d. 去交联与 DNA片段的纯化
将过夜反应液于 75 反应 10分钟后置于冰上冷却, 并向其中加入 ΙΟμΙ去交联混 合液并混匀,然后于 65 °C反应 1.5小时。将以上反应液用 UNIQ-10柱式寡聚核苷酸纯 化试剂盒进行纯化, 进而得到纯化后的 DNA片段溶液。
(6) 目的 DNA片段的定量 PCR检测
取 Ι μΐ以上 DNA片段溶液利用 SYBR Premix EX Tag II试剂盒对其中目的 DNA 片段进行定量检测。 反应条件为 95 °C,反应 30s, 然后 95 °C, 5s; 67.5 °C, 30s, 反应 30 个循环, CI(N)特异性结合序列 BR的检测引物为:
正向引物 (SEQ ID NO: 11): 5 ' - AGC AAAATC AGGGTGTTATCTACCTCTGGCGGTGATAACTTC-3 ' 反向引物 (SEQ ID NO: 12):
5 ' -CCGCTGCTAGC ACC AC AGGGC AGAG-3 '
此夕卜,定量结果均以 CI蛋白质二聚化结构域 Ci )在 CICC pPIDAl+CICC pPIDKl 体系中测定的 PDf信号值 为基准, 并用 8小时诱导表达后细菌生长的 OD600值 进行修正得到。
Figure imgf000011_0001
GGCTGA-3'
(7) DNA结合结构域 CI(N)突变体的构建以及相应特异性 DNA序列的改造 (i) DNA结合结构域 CI(N)突变体的构建
以突变体 CI(N)mutl为例, 利用以下引物:
正向引物 (SEQ ID NO: 14):
CATCAATGC-3'
反向引物 (SEQ ID NO: 15):
TGTCTGC-3'
以包含野生型 DNA结合结构域 CKNf^SEQ ID NO: 5)的 CI(C)-pPIDAl为模版 进行 PCR, 得到 PCR产物为线性化载体。 用限制性内切酶 Dpnl对该 PCR产物进行 充分消化, 在经由转化和载体提取, 即得到 DNA结合结构域为突变体 CI(N)mutl的载 体。
(ii)相应特异性 DNA序列的改造
以制备 DNA结合结构域 Cl^f1和 CI(N)mutl互不交叉的特异性 DNA序列为例。 为了设计能够与不同 DNA结合结构域特异性结合而不发生交叉反应的特异性 DNA序 列, 我们利用从 PDB数据库中下载得到的 CI(N)wt-DNA复合体的 X射线衍射结构 1LMB的结构信息,通过 FoldX软件计算 DNA结合结构域与 DNA序列的相互作用能, 并遍历 DNA序列的所有组合形式并计算和评估其相对于野生型特异性 DNA序列的相 互作用能变化。 以这一计算结果为基础, 我们设计相应的 DNA序列, 利用以上定点 突变方法对 CI(C)-pPIDAl进行改造, 并利用 PDf方法检测不同 CI(N)突变体与不同 DNA序列的特异性结合能力。
对于 CliNf1和 CI(N)mutl而言就是要得到三种 DNA序列:特异地与 CliNf^-CIiNf1 同二聚体结合的 DNA序列,特异地与 CI(N)mutl-CI(N)mutl同二聚体结合的 DNA序列, 以及特异性地与 CliNf^-CIiNr1"异二聚体结合的 DNA序列。 此外, 与前述相同, 在 此处的 PDf 检测方法中, 均利用 CI 蛋白质二聚化结构域 CI(C)在 CI(C)-pPIDAl+ CI(C)-pPIDKl双载体体系中的 PDf检测信号 为基准值进行比较。 该体系中每个 载体上的 DNA结合结构域均为野生型 CliNf1, BR序列均为野生型特异性 DNA序列。 实施例 1蛋白质二聚化足迹法检测 (PDf)工作原理
本发明中蛋白质二聚化足迹法检测 (PDf)工作原理如图 2所示。目的蛋白在大肠杆 菌中表达后,会通过其融合的 DNA结合结构域和载体上的特异性 DNA序列相互作用。 如果两蛋白质发生相互作用, 其二聚体可与 DNA以很高的亲和力结合, 反之不能结 合或者以很低的亲和力结合。然后, 经过甲醛处理, DNA及与其结合的蛋白质二聚体 相交联形成复合体。在 MNase酶作用下, 载体被打碎成小片段, 将这些小片段分离提 取后, 用 DNase I对其进行充分消化, 从而将未与蛋白质结合的 DNA片段清除。 用 蛋白酶 K对消化后的样品进行去交联, 并进行纯化即得到相应目的 DNA片段。 对这 些 DNA片段进行定量 PCR、 高通量测序和 DNA微阵列等基于核酸序列的定量检测 或者 PCR及琼脂糖凝胶电泳等基于核酸序列的定性检测,即可得到基于目的蛋白质的 相互作用网络信息。
实施例 2以蛋白质 CI的二聚化结构域 CI(C)为目的蛋白质验证蛋白质二聚化足迹法检 测 (PDf)方法
为了验证 PDf 检测结果是否能够反应蛋白质相互作用的不同强度, 通过 BR-pSP73(空白对照), pPIDAl (阴性对照)以及 CI(C)-pPIDAl (阳性对照)三组对照实验 (图 3a), 可证明经由 DNase I酶 12小时消化, 能将未被蛋白质结合保护的 DNA片段 除净, 从而使 PDf检测结果能够反应不同蛋白质相互作用强度 (结果如图 3b所示)。 实施例 3PDf检测的反应动力学模型的建立
为了讨论 PDf对蛋白质相互作用强度的定量检测能力及 DNA结合结构域单体与 特异性 DNA序列的结合对蛋白质间相互作用检测的影响, 我们从蛋白质单体与特异 性 DNA序列结合的动力学过程出发, 讨论了蛋白质二聚化即蛋白质相互作用过程的 相关参数对 DNA结合动力学的影响。
1. 蛋白质单体 DNA结合动力学模型
设 为结合了蛋白质单体的特异性 DNA片段的比例, θ' '为未结合蛋白质单体的特 异性 DNA片段的比例, 为蛋白质单体的浓度, ¾ "'为蛋白质单体与特异性 DNA序列 结合反应的速率常数, 为蛋白质单体与特异性 DNA序列复合物解离反应的速率常 数。
根据以上定义有:
的变化率为:
Figure imgf000012_0001
结合方程 (1)和方程 (2), 可以得到模型的边界条件: -0 、, ei 当 t=0时,即未发生交联时,体系处于平衡态,可得 ^ ,设此时的 值为 可得:
而当交联开始后, 以上平衡态被破坏,
Figure imgf000013_0001
在 t=∞ 时其达到最大:
— 1
" (4)
将方程 (2)对时间进行微分, 并结合方程 (1)可得到:
十 H fc )^ =。 (5) 以上微分方程有以下通解:
其中' =0, -(k。'A+k 然后根据模型的边界条件式 和式 (4)得: eb = 1 ^ ~ e-t(kD1ICs+kcff}
km,C;+keff (7) 方程 (7)描述了在 PDf方法的交联过程中蛋白质单体与特异性 DNA结合的过程。 考虑到在实验过程中特异性 DNA序列的不饱和性以及特异性 DNA序列总数目为恒定 值 (见图 3c), 可以得到蛋白质单体结合特异性 DNA序列的 PDf信号为:
ls― εΚΘ,
(8) 其中 fA '为特异性 DNA序列的最大结合数, ""为常数, =k。' cff, 将 (7)带入 (8) 则可得到/信号的完整形式:
I; = εΚ(1
Figure imgf000013_0002
2. 蛋白质二聚化过程的 DNA结合动力学模型
蛋白质二聚化过程的 PDf信号包括两个部分的贡献, 一个是蛋白质单体与特异性 DNA序列的结合, 另一个是蛋白质二聚体与特异性 DNA序列的结合。 因此, 可以得 到蛋白质二聚化或者蛋白质相互作用的 PDf信号为:
^ sd ~ *s d (10) 其中, A为蛋白质单体与特异性 DNA序列结合的贡献, 其形式如 (9)所示, Id为 蛋白质二聚体与特异性 DNA序列结合的贡献。 在蛋白质单体的 DNA结合模型基础上,可扩展得到蛋白质二聚体的 DNA结合动 力学模型。 定义 为蛋白质二聚体的浓度, feff"rf为蛋白质二聚体与特异性 DNA序列 结合反应的速率常数, 为蛋白质二聚体与特异性 DNA序列复合物解离反应的速 率常数。 根据以上定义, 蛋白质二聚化或者蛋白质相互作用的强度可以表示为:
^di er = Q ^s " ( 考虑到特异性 DNA序列的不饱和性,可得到蛋白质二聚体与特异性 DNA序列结 合所贡献的 PDf信号
Figure imgf000014_0001
其中 k , 为常数。 因此, 蛋白质二聚化或者蛋白质相互作用过程的 PDf信号为:
Figure imgf000014_0002
结合方程 (11), 可进一步得到方程 (14):
Figure imgf000014_0003
此即为蛋白质二聚化或者相互作用过程的 PDf信号。
实施例 4 PDf检测的反应动力学模型的实验验证与分析
在上述模型的基础上, 利用双载体表达体系 X-pPIDAl+GFP-pPIDKl, 对 PDf的 反应动力学模型进行实验验证和分析。如图 4(a)所示, pPIDAl和 pPIDKl具有相同的 蛋白质单体检测性能和相同的蛋白质表达能力, 因此蛋白质 X和 GFP有近似的表达 量。 由于 GFP在细胞中几乎以单体形式存在, 所以, 可以利用仅表达 GFP的系统的 PDf信号 来近似目的蛋白 X的 PDf信号 ls , 从而能够利用 GFP的报告基因性质来 检测蛋白质单体结合对蛋白 X二聚化相互作用 PDf检测结果的影响。
为了进一步说明和验证以上原理:
首先, 通过比较 PDf 实验测定值与基于以上动力学模型的理论计算值 (见图 4a), 说明该动力学模型能够与实验结果相吻合, 证实了该模型的可靠性。
然后, 继续考察蛋白质单体浓度波动对 PDf信号的影响。 根据动力学模型, 设蛋 白质单体浓度变化倍数为气 当蛋白质浓度由 Cs变为 Δ' 时, PDf检测信号/为:
= εΚ- // e
(15)
于是 PDf检测信号 Λ的变化倍数为 (16)
当蛋白质浓度 Cs在 0.01-100倍间变化时, 结果显示 PDf信号的变化倍数上限约 为 i(H见图 4b)。于是, 当 ίζ <1ϊ时, 能够认为 Λ对/ srf的影响可忽略不计, 即 ^ ¾Λ 此时可得到方程 (17):
Jsd ¾ Jd = £■''{ d(l Z2l£A_ e - 1( k td K di er s ·· + f fd)-'!
k iiKd tm er s'+k offd " (17) 基于该方程, 可得到对于两待测 A和 B, 其 PDf检测信号具有以下关系:
Figure imgf000015_0001
即两蛋白质各自的二聚化强度之比可约等于其 PDf检测信号之比。 换句话说, 就 是蛋白质相互作用强度可以用相应的特异性 DNA序列拷贝数来表示。 而通过对比阳 性和阴性实验组的 PDf信号, 发现诱导表达时间为 8小时时, 阳性组的数值 ( )要显 著大于 10倍阴性组的数值 见图 4c), 即满足以上关系, 因此选定该诱导表达时间 为 PDf的实验条件。 同时, 以 CI蛋白质二聚化结构域 CI(C)的 PDf检测信号 Isd ref为 基准, 定义当某目的蛋白 X的 PDf信号 ^ < <11 ^时, 可以认为 (X) = Q, 以 此作为判断蛋白质间是否发生相互作用的标准。
实施例 5基于 PDf方法的静态和动态蛋白质相互作用检测与现有蛋白质相互作用检测 技术的比较
为了验证 PDf方法定性和定量检测蛋白质相互作用的性能, 我们选择了大肠杆菌 趋化系统中的 4个蛋白质 cheA、 cheB、 cheZ和 cheY对其进行 PDf检测, 结果如图 5a所示。 通过与酵母双杂交 (Y2H)和荧光共振能量转移 (FRET)实验结果相比较, PDf 方法能够很好地实现对蛋白质相互作用的定性和定量检测。
cheA序列(SEQIDNO: 16):
>gi|49175990:cl973348-1971384 Escherichia coli str. K-12 substr. MG1655 chromosome, complete genome
Figure imgf000016_0001
GCGAACACCGCCGCCTGA
CheB序列(SEQ ID NO: 17):
>gi|49175990:cl966525-1965476 Escherichia coli str. K-12 substr. MG1655 chromosome, complete genome
GGACAGGCGATACGTATTTAA
CheY序列(SEQ ID NO: 18):
> gi|49175990:cl965072-1965461 Escherichia
MG 1655 chromo some, complete genome
Figure imgf000017_0001
AACTGGGCATGTGA
CheZ序列(SEQ ID NO: 19):
>gi|49175990:cl965061-1964417 Escherichia coli str. K-12 substr. MG1655 chromosome, complete genome
Figure imgf000017_0002
为了检验 PDf方法对动态蛋白相互作用检测的性能, 即其时间分辨率, 我们选取 了大肠杆菌 PhoR/PhoB磷酸信号传导系统中的 PhoB蛋白质, 检测在不同磷酸浓度的 生长环境下, 其二聚化强度随反应时间的变化情况, 结果如图 5b和图 5c所示。 通过 与 FRET结果相比较, PDf能够检测出在不同磷酸浓度下 PhoB二聚化的强度及其随 时间的演化, 体现出 PDf方法在检测动态蛋白质相互作用中具有很好的时间分辨率。
PhoB序列(SEQ ID NO: 20):
>gi|388476123:416366-417055 Escherichia coli str. K-12 substr. W3110, complete genome
Figure imgf000018_0001
GACCGTGCGCGGTACAGGATATCGTTTTTCAACCCGCTTTTAA
实施例 6蛋白质相互作用网络的直接动态检测
在之前实验的基础上, 考虑到 DNA序列除了能够实现高效检测外, 还具有可编 程的特性, 即通过改变序列中特异性 DNA序列的碱基排列,来改变 DNA结合结构域 对特异性 DNA序列的识别能力, 进而可以通过设计互不交叉的 DNA结合结构域-特 异性 DNA序列相互作用对, 来实现 PDf方法对多对蛋白质相互作用在同一体系中的 同时检测, 即第一次使得对蛋白质相互作用网络的直接检测成为可能。
为了验证以上构想的可行性, 对野生型 CI蛋白质的 DNA结合结构域 CKNf1中 的 DNA识别螺旋的氨基酸做以下定点突变: 将 QSGVGAL定点突变为 QSAINKA, 从而得到突变体 CI(N)mutl。然后,基于 FoldX软件计算出的 CliNf1和 CI(N)mutl与 DNA 相互作用能的信息 (见图 6a), 设计了以下 DNA序列:
BR1 (即 C Nf*相应的特异性 DNA序列 )(SEQ ID NO: 21): TGTGG
BR4(SEQ ID NO: 22):
AG(
TGTGG
BR5(SEQ ID NO: 23):
AG(
TGTGG
BR6(SEQ ID NO: 24):
AG(
TGTGG
BR7(SEQ ID NO: 25):
AG(
TGTGG
BR8(SEQ ID NO: 26):
AG(
TGTGG
BR9(SEQ ID NO: 27):
AG(
TGTGG
BR10(SEQ ID NO: 28):
TGTGG
其中 BR1、 4、 5、 6、 8为分别针对 CKNf^CKNf1和 CI(N)mutl-CI(N)mutl同二聚 体设计的序列, BR7、 9、 10为针对 CliNf^-CIiN)1^1异二聚体设计的序列。 利用前述 PDf方法进行检测, 如图 6b所示, 序列 BR4能够特异性识别 CliNf^-CIiNf1同二聚 体, 序列 BR6能够特异性识别 CI(N)mutl-CI(N)mutl同二聚体, 而序列 BRIO更倾向于 和 CKNr^CKNr1"异二聚体结合, 而这三者之间互不交叉。
基于以上结果,如果要检测蛋白质 A和蛋白质 B之间可能存在的三对相互作用(即 A-A的二聚化、 B-B的二聚化以及 A-B的二聚化), 就可以在一个包含有 CKNf^-A和 CI(N)mutl-B 融合蛋白的检测体系中, 利用 BR4、 BR6 以及 BRIO三个不同的特异性 DNA序列实现对以上三对相互作用同时进行 PDf定量检测。 而在上述序列设计和检 测方法的基础上进行优化 (包括 DNA结合结构域与相应特异性 DNA序列的结合能力 以及蛋白质表达量)和扩展 (互不交叉的 DNA结合结构域-特异性 DNA序列作用对), 就可以将直接检测蛋白质相互作用网络的能力扩展到更大的规模 (原理图如图 6c所示

Claims

权 利 要 求
1. 获取蛋白质间相互作用信息的方法, 其包括如下步骤:
(1) 在宿主细胞中表达融合有 DNA结合结构域的目的蛋白质,所述 DNA结合结 构域二聚化时对相应特异性 DNA序列的亲和力显著高于单体时;
(2) 在生理状态下用交联剂处理,将宿主细胞中的目的蛋白质二聚体和 DNA交联 形成复合体;
(3) 将 DNA打碎成小片段;
(4) 分离提取所述小片段, 并用 DNase l消化;
(5) 使用去交联剂处理, 将步骤 (4)的产物去交联, 并纯化得到 DNA片段;
(6) 检测步骤 (5)得到的 DNA片段。
2. 根据权利要求 1 所述的方法, 所述宿主细胞包括大肠杆菌、 酵母、 哺乳动物 细胞。
3. 根据权利要求 1所述的方法, 所述 DNA结合结构域包括 λ噬菌体蛋白质 CI 的 DNA结合结构域及其符合权利要求 1步骤 (1)中所述 DNA结合结构域性质的突变 体, λ噬菌体蛋白质 CRO的 DNA结合结构域及其符合权利要求 1步骤 (1)中所述 DNA 结合结构域性质的突变体;所述相应特异性 DNA序列包括 CI结合序列及它们的突变 序列, CRO结合序列及它们的突变序列。
4. 根据权利要求 1所述的方法, 所述步骤 (2)中使用的交联剂为甲醛。
5. 根据权利要求 1 所述的方法, 所述步骤 (3)中使用 MNase 或者超声处理打碎 DNA为小片段。
6. 根据权利要求 1所述的方法, 所述步骤 (5)中使用的去交联剂为蛋白酶 K。
7. 根据权利要求 1所述的方法,所述步骤 (6)中的检测包括基于核酸序列的定性和 /或定量检测, 所述定量检测包括定量 PCR、 高通量测序和 /或 DNA微阵列, 所述定性 检测包括 PCR和 /或琼脂糖凝胶电泳。
8. 一种用于获取蛋白质相互作用信息的试剂盒, 包括:
(1) 带有 DNA结合结构域和相应特异性 DNA序列的表达载体, 所述 DNA结合 结构域二聚化时对相应特异性 DNA序列的亲和力显著高于单体时;
(2) 宿主细胞;
(3) 交联剂及其反应终止液;
(4) 打碎 DNA的装置或试剂及其反应缓冲液; (5) DNase I及其反应缓冲液;
(6) 去交联剂;
(7) DNA检测装置。
9. 根据权利要求 8所述的试剂盒, 所述交联剂为甲醛, 所述交联反应终止液为甘 氨酸溶液, 所述去交联剂为蛋白酶 K, 所述打碎 DNA的试剂为 MNase。
10. 根据权利要求 8所述的试剂盒, 所述 DNA检测装置包括定性和 /或定量检测 装置, 所述定量检测装置包括定量 PCR装置、 高通量测序装置或 DNA微阵列检测装 置, 所述定性检测装置包括 PCR装置或琼脂糖凝胶电泳装置。
PCT/CN2014/082331 2014-07-16 2014-07-16 基于核酸序列的蛋白质相互作用检测方法 WO2016008120A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2014/082331 WO2016008120A1 (zh) 2014-07-16 2014-07-16 基于核酸序列的蛋白质相互作用检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2014/082331 WO2016008120A1 (zh) 2014-07-16 2014-07-16 基于核酸序列的蛋白质相互作用检测方法

Publications (1)

Publication Number Publication Date
WO2016008120A1 true WO2016008120A1 (zh) 2016-01-21

Family

ID=55077818

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2014/082331 WO2016008120A1 (zh) 2014-07-16 2014-07-16 基于核酸序列的蛋白质相互作用检测方法

Country Status (1)

Country Link
WO (1) WO2016008120A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107841533A (zh) * 2017-11-13 2018-03-27 深圳先进技术研究院 一种染色质破碎方法及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101236209A (zh) * 2007-09-03 2008-08-06 博奥生物有限公司 基于生物芯片检测核酸结合蛋白-靶标蛋白之间是否存在相互作用的方法
CN101512016A (zh) * 2006-06-30 2009-08-19 埃姆比特生物科学公司 可检测的核酸标签

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101512016A (zh) * 2006-06-30 2009-08-19 埃姆比特生物科学公司 可检测的核酸标签
CN101236209A (zh) * 2007-09-03 2008-08-06 博奥生物有限公司 基于生物芯片检测核酸结合蛋白-靶标蛋白之间是否存在相互作用的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107841533A (zh) * 2017-11-13 2018-03-27 深圳先进技术研究院 一种染色质破碎方法及其应用
CN107841533B (zh) * 2017-11-13 2021-11-05 深圳先进技术研究院 一种染色质破碎方法及其应用

Similar Documents

Publication Publication Date Title
Kato et al. Molecular characterization of the PhoP-PhoQ two-component system in Escherichia coli K-12: identification of extracellular Mg2+-responsive promoters
Gaida et al. Expression of heterologous sigma factors enables functional screening of metagenomic and heterologous genomic libraries
Faner et al. Identifying and characterizing Hfq–RNA interactions
JP5787298B2 (ja) 膜に提示したタンパク質を特異的に認識するポリペプチドの調製方法
CN113583996A (zh) Bst DNA聚合酶重组突变体、其编码DNA及超快磁珠LAMP检测方法
US20220307009A1 (en) Isolated nucleic acid binding domains
Peixeiro et al. Structure and function of AvtR, a novel transcriptional regulator from a hyperthermophilic archaeal lipothrixvirus
Sheppard et al. Structure and mechanisms of viral transcription factors in archaea
JP6013470B2 (ja) タンパク質ディスプレイの方法
WO2016008120A1 (zh) 基于核酸序列的蛋白质相互作用检测方法
Odegrip et al. The interaction of bacteriophage P2 B protein with Escherichia coli DnaB helicase
CN111363758A (zh) 新加坡石斑鱼虹彩病毒主要衣壳蛋白多克隆抗体的制备和应用
WO2018189639A1 (en) Escherichia coli o157:h7 aptamer and applications thereof
Tran et al. Control of a gene transfer agent cluster in Caulobacter crescentus by transcriptional activation and anti-termination
CN112760308B (zh) LdCsm-dCsm3突变型复合物、含该复合物的检测系统及其在RNA检测中的应用
WO2015131302A1 (zh) 一种具有持续合成能力和盐耐受度的dna聚合酶
CN110564744B (zh) Dna聚合酶及其制备方法、表达基因、表达载体、宿主细胞及试剂盒
US20220221458A1 (en) Norovirus-binding peptide
Jacob et al. Distinct interaction mechanism of RNA polymerase and ResD at proximal and distal subsites for transcription activation of nitrite reductase in Bacillus subtilis
US20080248958A1 (en) System for pulling out regulatory elements in vitro
Pilalis et al. Escherichia coli genome-wide promoter analysis: Identification of additional AtoC binding target elements
Lawrie et al. A high throughput approach for the generation of orthogonally interacting protein pairs
Zhao et al. A method to introduce an internal tag sequence into a salmonella chromosomal gene
CN110938610B (zh) 一种转座酶突变体、融合蛋白、其制备方法和应用
Iosub et al. Hfq CLASH uncovers sRNA-target interaction networks enhancing adaptation to nutrient availability

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14897747

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14897747

Country of ref document: EP

Kind code of ref document: A1