CN118146334A - 单结构域荧光蛋白索烃及其构建和在制备融合蛋白索烃中的应用 - Google Patents
单结构域荧光蛋白索烃及其构建和在制备融合蛋白索烃中的应用 Download PDFInfo
- Publication number
- CN118146334A CN118146334A CN202211561433.5A CN202211561433A CN118146334A CN 118146334 A CN118146334 A CN 118146334A CN 202211561433 A CN202211561433 A CN 202211561433A CN 118146334 A CN118146334 A CN 118146334A
- Authority
- CN
- China
- Prior art keywords
- protein
- fluorescent protein
- gfp
- cord
- sheet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000034287 fluorescent proteins Human genes 0.000 title claims abstract description 143
- 108091006047 fluorescent proteins Proteins 0.000 title claims abstract description 143
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 69
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 69
- 239000004215 Carbon black (E152) Substances 0.000 title claims abstract description 38
- 229930195733 hydrocarbon Natural products 0.000 title claims abstract description 38
- 150000002430 hydrocarbons Chemical class 0.000 title claims abstract description 38
- 238000010276 construction Methods 0.000 title claims abstract description 24
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 159
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 125
- 102000006533 chordin Human genes 0.000 claims abstract description 77
- 108010008846 chordin Proteins 0.000 claims abstract description 77
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000006243 chemical reaction Methods 0.000 claims abstract description 35
- 238000005859 coupling reaction Methods 0.000 claims abstract description 26
- 239000005090 green fluorescent protein Substances 0.000 claims description 92
- 239000002243 precursor Substances 0.000 claims description 54
- 108010043121 Green Fluorescent Proteins Proteins 0.000 claims description 52
- 102000004144 Green Fluorescent Proteins Human genes 0.000 claims description 52
- 230000017730 intein-mediated protein splicing Effects 0.000 claims description 41
- 210000004027 cell Anatomy 0.000 claims description 32
- 108090000279 Peptidyltransferases Proteins 0.000 claims description 31
- 238000000338 in vitro Methods 0.000 claims description 27
- 230000000694 effects Effects 0.000 claims description 25
- 238000003776 cleavage reaction Methods 0.000 claims description 23
- 230000007017 scission Effects 0.000 claims description 23
- 238000013461 design Methods 0.000 claims description 22
- 238000007363 ring formation reaction Methods 0.000 claims description 21
- 230000014509 gene expression Effects 0.000 claims description 19
- 102000004190 Enzymes Human genes 0.000 claims description 17
- 108090000790 Enzymes Proteins 0.000 claims description 17
- 238000000746 purification Methods 0.000 claims description 17
- 210000004899 c-terminal region Anatomy 0.000 claims description 15
- 230000003834 intracellular effect Effects 0.000 claims description 14
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 claims description 11
- 239000013604 expression vector Substances 0.000 claims description 10
- 108091005804 Peptidases Proteins 0.000 claims description 8
- 239000004365 Protease Substances 0.000 claims description 8
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims description 8
- 238000010168 coupling process Methods 0.000 claims description 7
- 241000208125 Nicotiana Species 0.000 claims description 6
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 6
- 241000700605 Viruses Species 0.000 claims description 6
- 230000008878 coupling Effects 0.000 claims description 6
- 238000001742 protein purification Methods 0.000 claims description 6
- 108010054624 red fluorescent protein Proteins 0.000 claims description 6
- 229910052759 nickel Inorganic materials 0.000 claims description 5
- 108091005957 yellow fluorescent proteins Proteins 0.000 claims description 5
- 238000001042 affinity chromatography Methods 0.000 claims description 4
- 238000001976 enzyme digestion Methods 0.000 claims description 3
- 108010010779 glutamine-pyruvate aminotransferase Proteins 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 abstract description 21
- 238000005556 structure-activity relationship Methods 0.000 abstract description 2
- 238000012512 characterization method Methods 0.000 description 34
- 239000000047 product Substances 0.000 description 21
- 150000001413 amino acids Chemical group 0.000 description 20
- 241000723792 Tobacco etch virus Species 0.000 description 15
- 229940039781 leptin Drugs 0.000 description 15
- 238000002514 liquid chromatography mass spectrum Methods 0.000 description 15
- 238000006798 ring closing metathesis reaction Methods 0.000 description 14
- 108010022394 Threonine synthase Proteins 0.000 description 13
- 102000004419 dihydrofolate reductase Human genes 0.000 description 13
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- 230000015572 biosynthetic process Effects 0.000 description 12
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- 238000005804 alkylation reaction Methods 0.000 description 10
- 230000004186 co-expression Effects 0.000 description 10
- 125000004122 cyclic group Chemical group 0.000 description 10
- 238000004949 mass spectrometry Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 241000723790 Tobacco vein mottling virus Species 0.000 description 8
- 230000029936 alkylation Effects 0.000 description 8
- 125000001183 hydrocarbyl group Chemical group 0.000 description 8
- 238000001542 size-exclusion chromatography Methods 0.000 description 8
- 108050004114 Monellin Proteins 0.000 description 7
- 230000002255 enzymatic effect Effects 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 238000002189 fluorescence spectrum Methods 0.000 description 7
- 238000011534 incubation Methods 0.000 description 7
- 238000005215 recombination Methods 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- 238000010257 thawing Methods 0.000 description 7
- 239000000872 buffer Substances 0.000 description 6
- 238000000113 differential scanning calorimetry Methods 0.000 description 6
- 238000010438 heat treatment Methods 0.000 description 6
- 238000011065 in-situ storage Methods 0.000 description 6
- 239000011347 resin Substances 0.000 description 6
- 229920005989 resin Polymers 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 102000016267 Leptin Human genes 0.000 description 5
- 108010092277 Leptin Proteins 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 238000000502 dialysis Methods 0.000 description 5
- NRYBAZVQPHGZNS-ZSOCWYAHSA-N leptin Chemical compound O=C([C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)CCSC)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CS)C(O)=O NRYBAZVQPHGZNS-ZSOCWYAHSA-N 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 239000007983 Tris buffer Substances 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 108010076818 TEV protease Proteins 0.000 description 3
- 239000007795 chemical reaction product Substances 0.000 description 3
- 239000013078 crystal Substances 0.000 description 3
- 238000001952 enzyme assay Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 238000001506 fluorescence spectroscopy Methods 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 229910000403 monosodium phosphate Inorganic materials 0.000 description 3
- 235000019799 monosodium phosphate Nutrition 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 241000251556 Chordata Species 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000012043 crude product Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- GFWRVVCDTLRWPK-KPKJPENVSA-N sofalcone Chemical compound C1=CC(OCC=C(C)C)=CC=C1\C=C\C(=O)C1=CC=C(OCC=C(C)C)C=C1OCC(O)=O GFWRVVCDTLRWPK-KPKJPENVSA-N 0.000 description 2
- 229950004782 sofalcone Drugs 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 239000012224 working solution Substances 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 235000014653 Carica parviflora Nutrition 0.000 description 1
- 241000243321 Cnidaria Species 0.000 description 1
- SNRUBQQJIBEYMU-UHFFFAOYSA-N Dodecane Natural products CCCCCCCCCCCC SNRUBQQJIBEYMU-UHFFFAOYSA-N 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 102000018389 Exopeptidases Human genes 0.000 description 1
- 108010091443 Exopeptidases Proteins 0.000 description 1
- 235000001018 Hibiscus sabdariffa Nutrition 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- 240000000599 Lentinula edodes Species 0.000 description 1
- 235000001715 Lentinula edodes Nutrition 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 235000005291 Rumex acetosa Nutrition 0.000 description 1
- 240000007001 Rumex acetosella Species 0.000 description 1
- 241000242583 Scyphozoa Species 0.000 description 1
- 108060008539 Transglutaminase Proteins 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 238000012412 chemical coupling Methods 0.000 description 1
- 238000003508 chemical denaturation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001938 differential scanning calorimetry curve Methods 0.000 description 1
- OZRNSSUDZOLUSN-LBPRGKRZSA-N dihydrofolic acid Chemical compound N=1C=2C(=O)NC(N)=NC=2NCC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OZRNSSUDZOLUSN-LBPRGKRZSA-N 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- DNJIEGIFACGWOD-UHFFFAOYSA-N ethyl mercaptane Natural products CCS DNJIEGIFACGWOD-UHFFFAOYSA-N 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 238000000703 high-speed centrifugation Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 239000005457 ice water Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000003402 intramolecular cyclocondensation reaction Methods 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 150000002678 macrocyclic compounds Chemical class 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 125000002950 monocyclic group Chemical group 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- LWIHDJKSTIGBAC-UHFFFAOYSA-K potassium phosphate Substances [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 235000003513 sheep sorrel Nutrition 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 108091005946 superfolder green fluorescent proteins Proteins 0.000 description 1
- 239000003764 sweet protein Substances 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000006276 transfer reaction Methods 0.000 description 1
- 102000003601 transglutaminase Human genes 0.000 description 1
- VJMNBTXNKDIRQB-UHFFFAOYSA-N trioxole Chemical compound O1OC=CO1 VJMNBTXNKDIRQB-UHFFFAOYSA-N 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Peptides Or Proteins (AREA)
Abstract
本发明公开了一种单结构域荧光蛋白索烃及其构建和在制备融合蛋白索烃中的应用。本发明对荧光蛋白序列进行拆分和重组,结合蛋白质偶联反应对,通过组装‑反应协同的策略实现了单结构域荧光蛋白索烃以及融合蛋白索烃的制备。本发明的方法能够提升蛋白质的热稳定性、机械稳定性以及重折叠能力,可用于探究拓扑重构对于蛋白质构效关系的影响。
Description
技术领域
本发明涉及蛋白质索烃,特别涉及单结构域荧光蛋白索烃以及融合蛋白索烃的设计、制备和应用。
背景技术
受限于核糖体的翻译机制,大多数天然蛋白质分子链具有严格的线性结构。这些线性新生多肽链可以通过进一步折叠以及翻译后修饰的方法获得多样化的非线性拓扑结构(Cascales,L.,et al.Org.Biomol.Chem.2010,22,5053)。研究表明,这些非线性拓扑结构在多个层面提升了蛋白质的稳定性,对于拓展蛋白质的应用意义重大。近年来随着蛋白质拓扑工程的发展,可基因编码的化学工具箱也被逐步完善。利用天然缠结基元p53二聚体介导的被动模板法、谍反应介导的主动模板法以及异质二聚体介导的方法,研究人员构建了一系列多结构域拓扑蛋白(Wang,X.W.and Zhang,W.-B.,Angew.Chem.Int.Ed.2016,55,3442;Wang,X.W.and Zhang,W.-B.,Angew.Chem.Int.Ed.2017,56,13985;Da,X.D.andZhang,W.-B.,Angew.Chem.Int.Ed.2019,58,11097;Liu,Y.,et al,Angew.Chem.Int.Ed.2020,59,19153;Wu,W.H.,et al,J.Am.Chem.Soc.2021,143,18029.)。研究结果表明,经过索烃化的蛋白质表现出了更强的抗热变性、抗化学变性和酶解耐受性等稳定性特征,具有重要的实用意义。但是它们的缠结结构是由额外的缠结基元介导的,因此最终的产物中存在冗余的序列,合成方法不够简洁,性能易受额外基元影响。因此,本发明旨在发展单结构域蛋白质索烃的构建方法,实现无痕蛋白质索烃的构建,进而拓展蛋白质索烃的实际应用。
绿色荧光蛋白(GFP)是一种从维多利亚多管发光水母中分离的蛋白质,能够在蓝光到紫外光的激发下发射绿色荧光(Shimomura,O.,et al.J.Cell Comp.Physiol.1962,59,223)。其较高的稳定性来自于由11个β折叠片按一定顺序连接形成的β-桶状结构(图1)。GFP序列中的三肽基元Ser65-Tyr66-Gly67通过分子内环化和氧化的翻译后修饰作用熟化形成生色团,给GFP带来了独特的荧光性质(Cody,C.W.,et al.Biochemistry 1993,32,1212)。研究表明,GFP生色团的荧光性质依赖于β-桶状结构提供的疏水环境,其中折叠片4、7、10和11中的氨基酸残基对于维持GFP的生色团周围的疏水环境有重要作用(Romei,M.G.,et al.Annu.Rev.Biophys.2019,48,19)。为了提高GFP的溶解性和重折叠效率,研究人员发展了众多GFP变体。其中通过DNA洗牌的方式发展出了sfGFP OPT变体(OPT)(Cabantous,S.,et al.Nat.Biotechnol.2005,24,79)。近年来,研究人员通过将GFP拆分为可以自发重组的二组分,发展了多种基于分离型GFP(split GFP)的蛋白质重组系统,用于蛋白质相互作用的检测(Romei,M.G.,et al.Annu.Rev.Biophys.2019,48,19)。目前研究表明,将GFP在β折叠片7和8之间(Ghosh,I.,et al.J.Am.Chem.Soc.2000,122,5658)、9和10之间(Nguyen,H.B.,et al.Acta.Crystallogr.D.Biol.Crystallogr.2013,69,2513)以及10和11之间(Koker,T.,et al.Sci.Rep.2018,8,5344)拆分后得到的二部分可以实现较为有效的重组。而split GFP的这种较高的自发重组倾向性为单结构域索烃的合成提供了可能。此外,荧光蛋白(FP)的种类十分丰富,尽管来自于不同的物种或具有不同的生色团,它们都具有相对保守的β-桶状结构(Kremers,G.J.,et al.J.Cell Sci.2011,124,157)。其中,应用比较广泛的有来自香菇珊瑚的红色荧光蛋白(mCherry)(Shaner,N.C.,etal.Nat.Biotechnol.2004,22,1567),来自羽珊瑚的绿色荧光蛋白(mWasabi)(Ai,H.W.,etal.BMC Biol.2008,6,13)和来自于维多利亚水母的黄色荧光蛋白(YPet)(Nguyen,A.W.,etal.Nat.Biotechnol.2005,23,355)。因此将类似的单结构域索烃构建方法应用到其他荧光蛋白上就可以实现单结构域荧光蛋白索烃家族的构建。同时,单结构域荧光蛋白也提供了一种独特的缠结基元,可被应用于构建融合蛋白质索烃,进而借助荧光蛋白索烃的构象限制效应,实现融合蛋白质的稳定性提升。
发明内容
本发明的目的是通过对荧光蛋白结构域拆分和重新接线的方法构建单结构域荧光蛋白索烃,并将这种构建单结构域索烃的方式拓展到荧光蛋白家族的多种变体中,构建单结构域荧光蛋白索烃家族,从而提供了一种新的构建单结构域索烃的方法。本发明进一步发展了基于荧光蛋白的索烃骨架,实现了多种融合蛋白索烃结构的制备。本发明构建索烃的方法对目标蛋白质的结构及活性没基本有影响,并在一定程度上提升了目标蛋白质的热稳定性以及耐冻融变性的能力。
单结构域荧光蛋白索烃的设计过程中需要最大程度地保证荧光蛋白两部分的重组效率和荧光性质。本发明从对荧光蛋白生色团扰动较小的部分入手,在不具有折叠结构的环区位置将其拆分成两部分,然后通过对这两部分进行重新接线的方式制造新的缠结。通过本方法合成得到的单结构域荧光蛋白索烃均保持与野生型一致的荧光性质。单结构域荧光蛋白索烃还可以作为提供缠结的索烃化基元:在荧光蛋白索烃的一个环上融合表达功能蛋白,可实现人工设计的链缠结,制备得到融合蛋白索烃结构。基于单结构域荧光蛋白索烃的骨架进一步对功能蛋白提供了构象限制,可有效提升功能蛋白的热稳定性和机械稳定性。因此,本发明不仅提供了一种无痕构建单结构域蛋白质索烃的方法,也拓展了索烃蛋白的应用。
本发明的研究包括以下几方面内容:
A.通过对野生型荧光蛋白重新接线的方式设计单结构域荧光蛋白索烃。
B.利用组装偶联策略,引入可基因编码的化学偶联工具分离型内含肽和转肽酶识别位点,通过胞内表达和胞外反应实现单结构域荧光蛋白索烃和融合蛋白索烃的构建。
C.单结构域荧光蛋白索烃的基本结构表征与证明。
D.设计基于单结构域荧光蛋白索烃的索烃化基元,引入目标蛋白质(如折叠蛋白质二氢叶酸还原酶【DHFR】,瘦素【leptin】,甜蛋白【monellin】以及红色荧光蛋白【mCherry】
等),实现不同折叠结构目标蛋白质的索烃化。
E.融合蛋白索烃结构的基本结构表征。
F.融合蛋白索烃的性质测试。
G.利用共表达体系实现单结构域荧光蛋白索烃的直接细胞表达制备。
H.单结构域荧光蛋白索烃的热孵育纯化方法。
根据上述研究,本发明提供了如下技术方案:
一种单结构域荧光蛋白索烃的构建方法,包括以下步骤:
1)将荧光蛋白拆分为两部分FP1和FP2,分别用于构建蛋白质索烃的两个环;
2)构建基因卡带,其编码的蛋白质序列从N端到C端包括LN1-FP1-LC1-LN2-FP2-LC2,其中LN1和LC1、LN2和LC2代表两对正交的蛋白质偶联反应对的反应基元;
3)将步骤2)构建的基因卡带引入表达载体中并转入细胞进行表达,得到蛋白质前驱体;
4)蛋白质前驱体在胞内完成环化得到单结构域荧光蛋白索烃,或者,通过胞内环化和体外关环反应相结合得到单结构域荧光蛋白索烃。
上述步骤1)首先需要选择合适的位点对荧光蛋白进行拆分,最大程度保证拆分得到的两部分可以实现有效重组。优选的,可从现有技术中选择已报道的拆分方法入手,将荧光蛋白拆分成大小相近的两个环。例如,将荧光蛋白的第7个和第8个β折叠片之间的连接链断开,拆分为包含β折叠片1-7和包含β折叠片8-11的两部分,其中,可以是β折叠片1-7对应FP1,β折叠片8-11对应FP2,反之亦可。
在步骤2)中,对于基因卡带(gene cassette)的构建,基本结构从N端到C端包括LN1-FP1-LC1-LN2-FP2-LC2,其中LN1和LC1、LN2和LC2为两对正交的蛋白质偶联反应对的反应基元,FP1为构成荧光蛋白索烃的第一个环,FP2为构成荧光蛋白索烃的第二个环。
优选的,所述蛋白质偶联反应对为分离型内含肽。分离型内含肽可以使用NpuDnaE内含肽(简称Npu),也可以使用与NpuDnaE内含肽正交的Vidal内含肽(简称Vid)等。除了分离型内含肽外,环化过程也可以利用其他可基因编码的蛋白质偶联反应对和偶联策略,例如转肽酶和谷氨酰胺转胺酶介导的偶联反应等。转肽酶能够结合特定序列(亮氨酸-脯氨酸-任意氨基酸-苏氨酸-甘氨酸),并切断其中苏氨酸和甘氨酸之间的肽键,再催化苏氨酸与另一端的多甘氨酸序列形成肽键,从而实现共价偶联。谷氨酰胺转氨酶可催化蛋白质分子内或分子间的酰基转移反应,实现蛋白质之间的共价交联,也可以被用来实现多肽或蛋白的环化。例如,一个环序列的N端和C端分别融合Npu的C端部分IntC和N端部分IntN,另一个环序列的N端和C端分别融合转肽酶识别序列GGG和LPETG。又如,一个环序列的N端和C端分别融合Npu的C端部分IntC和N端部分IntN,另一个环序列的两端分别融合与之正交的Vid的C端部分VidC和N端部分VidN。
进一步的,为便于纯化,步骤2)在基因卡带上设计His标签序列,在步骤4)通过镍亲和层析进行蛋白纯化。
根据步骤2)设计的基因卡带中蛋白质偶联反应对的不同,索烃蛋白可以是通过步骤3)表达过程中经胞内反应实现荧光蛋白两个环的环化,后续纯化后直接得到;也可以是通过步骤3)表达得到未关环的蛋白质前驱体,纯化后经过体外反应得到索烃蛋白。
一种选择是,在设计基因卡带时,两个环的两端修饰可以原位在胞内完成反应的相互正交的蛋白质偶联反应对,比如正交分离型内含肽。这样索烃的两部分就可以在胞内完成结构重组,进而原位关环后实现蛋白质索烃的制备,直接纯化得到蛋白质索烃。
另一种选择是,在设计基因卡带时,两个环的两端修饰上可以实现体外蛋白质偶联的工具酶识别位点,比如转肽酶识别位点。步骤3)表达完成后在步骤4)直接纯化出来,并在体外加入可以催化偶联反应的工具酶,进而关环后实现蛋白质索烃的制备。
还有一种选择是,在其中一个环的两端修饰上可以原位在胞内完成反应的蛋白质偶联反应对,另外一个环的两端修饰上可以实现体外蛋白质偶联的工具酶识别位点,索烃的两部分在胞内发生结构重组和其中一个环的关环反应,纯化后在体外完成另外一个环的关环反应。
基于上述单结构域荧光蛋白索烃的构建方法,本发明还提供了一种融合蛋白索烃的制备方法,即在上述步骤2)构建基因卡带时,在荧光蛋白索烃的一个环或两个环中引入目标蛋白,基本结构为LN1-(POI1)-FP1-(POI1')-LC1-LN2-(POI2)-FP2-(POI2')-LC2,其中LN1和LC1、LN2和LC2代表两对正交的蛋白质偶联反应对的反应基元,POI1、POI1'、POI2和POI2'代表融合蛋白索烃中引入的目标蛋白,可以多个目标蛋白同时引入或者只引入其中的一个,即POI1、POI1'、POI2和POI2'同时引入或只引入其中的一个或多个。其他步骤同上述单结构域荧光蛋白索烃的构建方法。
在本发明的实施例中,单结构域荧光蛋白索烃的设计是将荧光蛋白在第7个和第8个β折叠片之间的连接链断开,并在第7个β折叠片的C末端和第1个β折叠片的N末端以及第11个β折叠片的C末端和β第8个折叠片的N末端引入新的连接链得到的。该索烃结构的两个环分别由荧光蛋白的β折叠片1-7和β折叠片8-11组成,环化两个环的反应基元分别选择分离型内含肽和转肽酶。对于单结构域荧光蛋白索烃的设计,构建了IntC-FP1-IntN-GGG-FP2-LPETG-H6的基因卡带。这种拆分方法得到的构成索烃的两部分在胞内可以实现有效重组并形成稳定的缠结。这种构建中,一个环的关环反应在胞内原位完成,另外一个环的关环反应在体外完成,从而实现单结构域索烃结构的制备。绿色荧光蛋白单结构域索烃前体的氨基酸序列以及野生型绿色荧光蛋白序列分别如序列表中SEQ ID No:1和SEQ ID No:2所示。基于类似的拆分方法构建的其他荧光蛋白(mCherry、mWasabi、YPet)单结构域索烃前体的氨基酸序列分别如序列表中SEQ ID No:3,SEQ ID No:4和SEQ ID No:5所示。荧光蛋白的两部分对氨基酸序列的改变可以通过本领域的常规技术来实现。此外,还可根据需要对荧光蛋白进行多种方式的重新接线。
在单结构域荧光蛋白索烃的基础上,可在连接区域引入其他蛋白,包括天然无序蛋白或具有不同折叠结构的蛋白质等,用于实现目标蛋白质的索烃化。如在第二个环中引入具有α/β折叠结构的DHFR和monellin、具有全α结构的leptin以及具有全β折叠结构的mCherry,构建得到IntC-GFP1-IntN-GGG-GFP2-POI-LPETG-H6(其中POI代表引入的目标蛋白质),实现融合蛋白的索烃化,它们前驱体序列分别如序列表中SEQ ID No:6,SEQ ID No:7,SEQ IDNo:8,SEQ ID No:9所示。该方法是一种高度模块化的方法,其中的目标蛋白质也可以是不具有折叠结构的蛋白质或多肽。这种基于荧光蛋白的融合蛋白索烃构建方法并不影响目标蛋白的结构和活性,并且可以有效提升目标蛋白的耐热诱导解折叠能力以及抗机械变性能力。
本发明方法所构建的单结构域荧光蛋白索烃和融合蛋白索烃也在本发明的保护范围内。
本发明构建的单结构域荧光蛋白索烃,至少包括两个相互缠结的索烃单元环,这两个环分别包含将荧光蛋白拆分后可自发重组的两部分。例如,将荧光蛋白的第7个和第8个β折叠片之间的连接链断开,拆分为包含β折叠片1-7和包含β折叠片8-11的两部分,这两部分分别位于两个相互缠结的索烃单元环中。
利用荧光蛋白拆分后可自发重组的两部分作为缠结基元所构建的融合蛋白索烃中,目标蛋白融合在荧光蛋白部分的N端和/或C端,可以在两个索烃单元环的一个或两个中融合一个或多个目标蛋白。
下边通过具体的例子来说明用于制备蛋白质索烃的轮烷前体结构:
(a)IntC-GFP1-IntN-GGG-GFP2-LPETG-H6:其原始的经翻译后得到的氨基酸序列是SEQ ID NO:1。从N端到C端分别为分离型内含肽C端部分(IntC)、GFP索烃的第一个环(包含β折叠片1-7,GFP1)、分离型内含肽N端部分(IntN)、转肽酶识别位点1(GGG)、GFP索烃的第二个环(包含β折叠片8-11,GFP2)、转肽酶识别位点2(LPETG)、6×His标签(H6),其中分离型内含肽C端部分与GFP索烃的第一个环的连接部分中插入了烟草蚀纹病毒(TEV)的酶切位点用于后续拓扑结构证明,分离型内含肽N端部分与转肽酶识别位点1的连接部分中插入了烟草叶斑病病毒蛋白酶(TVMV)的酶切位点,6×His标签被放置在转肽酶识别位点2之后,以实现体外关环反应之后的选择性纯化。本设计中选择pMCSG19/pRK1037的共表达体系,其中pRK1037可以组成型的表达TVMV蛋白酶,对pMCSG19质粒所表达的目标蛋白进行酶切。使用pMCSG19作为载体,将构成绿色荧光蛋白索烃的两个环融合在同一条基因卡带上进行表达。表达得到的新生肽链经过初步组装后,分离型内含肽会在胞内完成对GFP的第一个环的环化。随后,由于蛋白质折叠结构之间存在的疏水以及氢键相互作用,经拆分和重新接线得到的GFP两个部分在细胞内完成组装,得到轮烷前体。由pRK1037编码表达出的TVMV蛋白酶可以在位于两个环之间的TVMV识别位点(ETVRFQG)处进行特异性酶切,从而暴露出转肽酶反应的识别位点GGG,胞内合成部分由此完成。随后经过步骤3)和步骤4)的蛋白表达和初步纯化,就可以分离得到绿色荧光蛋白轮烷前体rot-GFP,然后通过转肽酶体外关环得到索烃产物cat-GFP。
(b)IntC-mCherry1-IntN-GGG-mCherry2-LPETG-H6:其原始的经翻译后得到的氨基酸序列是SEQ ID NO:3。其设计思路与(a)中GFP轮烷前体的设计思路类似,将GFP1和GFP2的序列分别替换为mCherry1(包含mCherry的β折叠片1-7)和mCherry2(包含mCherry的β折叠片8-11)即可。其基因序列经类似于(a)所述的翻译和组装后,将得到的轮烷前体rot-mCherry纯化分离,经转肽酶体外关环,即可得到荧光蛋白索烃cat-mCherry。
(c)IntC-mWasabi1-IntN-GGG-mWasabi2-LPETG-H6:其原始的经翻译后得到的氨基酸序列是SEQ ID NO:4。其设计思路与(a)中GFP轮烷前体的设计思路类似,将GFP1和GFP2的序列分别替换为mWasabi1(包含mWasabi的β折叠片1-7)和mWasabi2(包含mWasabi的β折叠片8-11)即可。其基因序列经类似于(a)所述的翻译和组装后,将得到的轮烷前体rot-mWasabi纯化分离,经转肽酶体外关环,即可得到荧光蛋白索烃cat-mWasabi。
(d)IntC-YPet1-IntN-GGG-YPet2-LPETG-H6:其原始的经翻译后得到的氨基酸序列是SEQ ID NO:5。其设计思路与(a)中GFP轮烷前体的设计思路类似,将GFP1和GFP2的序列分别替换为YPet1(包含YPet的β折叠片1-7)和YPet2(包含YPet的β折叠片8-11)即可。其基因序列经类似于(a)所述的翻译和组装后,将得到的轮烷前体rot-YPet纯化分离,经转肽酶体外关环,即可得到荧光蛋白索烃cat-YPet。
(e)IntC-GFP1-IntN-GGG-GFP2-DHFR-LPETG-H6:其原始的经翻译后得到的氨基酸序列是SEQ ID NO:6,其设计思路与(a)中GFP轮烷前体的设计思路类似,在GFP2的序列后添加DHFR的序列即可。其基因序列经类似于(a)所述的翻译和组装后,将得到的轮烷前体rot-GFP-DHFR纯化分离,经转肽酶体外关环,即可得到融合蛋白索烃cat-GFP-DHFR。
(f)IntC-GFP1-IntN-GGG-GFP2-monellin-LPETG-H6:其原始的经翻译后得到的氨基酸序列是SEQ ID NO:7,其设计思路与(a)中GFP轮烷前体的设计思路类似,在GFP2的序列后添加monellin的序列即可。其基因序列经类似于(a)所述的翻译和组装后,将得到的轮烷前体rot-GFP-monellin纯化分离,经转肽酶体外关环,即可得到融合蛋白索烃cat-GFP-monellin。
(g)IntC-GFP1-IntN-GGG-GFP2-leptin-LPETG-H6:其原始的经翻译后得到的氨基酸序列是SEQ ID NO:8,其设计思路与(a)中GFP轮烷前体的设计思路类似,在GFP2的序列后添加leptin的序列即可。其基因序列经类似于(a)所述的翻译和组装后,将得到的轮烷前体rot-GFP-leptin纯化分离,经转肽酶体外关环,即可得到融合蛋白索烃cat-GFP-leptin。
(h)IntC-GFP1-IntN-GGG-GFP2-mCherry-LPETG-H6:其原始的经翻译后得到的氨基酸序列是SEQ ID NO:9,其设计思路与(a)中GFP轮烷前体的设计思路类似,在GFP2的序列后添加mCherry的序列即可。其基因序列经类似于(a)所述的翻译和组装后,将得到的轮烷前体rot-GFP-mCherry纯化分离,经转肽酶体外关环,即可得到融合蛋白索烃cat-GFP-mCherry。
本发明利用常规表征手段,如十二烷基磺酸钠-聚丙烯酰氨凝胶电泳(SDS-PAGE)、液相色谱质谱(LC-MS)以及酶解反应对所得到的索烃结构进行基本表征及其拓扑结构间接证明。
本发明利用荧光光谱探究了索烃化对目标蛋白质的性能影响,利用示差扫描量热法(DSC)对所得到的索烃结构进行熔融温度(Tm)测试,探究索烃化对目标蛋白质的热稳定性的影响。之后,测试了索烃cat-GFP-DHFR的酶活性,并探究了50℃加热一定时间后索烃结构的酶活性保持能力,以及通过冻融手段探究索烃耐受机械变性的能力。
本发明还构建了IntC1-GFP1-IntN1-VidC-GFP2-VidN的序列,其原始的经翻译后得到的氨基酸序列是SEQ ID NO:10。本构建使用了与Npu内含肽正交的Vidal内含肽,两部分简写为VidC和VidN。从N端到C端分别为Npu分离型内含肽C端部分、GFP索烃的第一个环(包含β折叠片1-7)、Npu分离型内含肽N端部分、Vidal分离型内含肽C端部分、GFP索烃的第一个环(包含β折叠片8-11)、6×His标签、Vidal分离型内含肽N端部分,其中分离型内含肽C端部分与GFP索烃的第一个环的连接部分中插入了烟草蚀纹病毒(TEV)的酶切位点用于后续拓扑结构证明,Npu分离型内含肽N端部分与Vidal分离型内含肽C端部分的连接部分中插入了烟草叶斑病病毒蛋白酶(TVMV)的酶切位点。将其插入pMCSG共表达载体中,得到荧光蛋白索烃共表达体系,将其转化到大肠杆菌BL21(DE3)感受态细胞中可实现荧光蛋白索烃的直接细胞合成得到Vidal-cat-GFP。
本发明还基于细胞内次序关环的方法发展了单结构域索烃蛋白的胞内直接合成及高效纯化方法。利用索烃蛋白和单环组装体副产物的热稳定性以及分子量差异,通过高温孵育结合透析的方法实现了单结构域索烃蛋白的高效纯化。
本发明对荧光蛋白序列进行拆分和重组,结合蛋白质偶联反应对,通过组装-反应协同的策略实现了单结构域荧光蛋白索烃以及融合蛋白索烃的制备,包括首先在细胞内合成轮烷前体,然后在体外使用转肽酶等偶联方法进行环化的两步法,以及直接在细胞内次序关环,然后通过热孵育结合透析的方法进行纯化的一步法,所得单结构域荧光蛋白索烃以及融合蛋白索烃具有大大改进的热稳定性以及机械稳定性。本发明的方法可用于探究拓扑重构对于蛋白质构效关系的影响,具有广泛的应用前景。
附图说明
图1显示了荧光蛋白的三维结构(A)以及平面结构(B),由11个β折叠片按一定顺序连接形成的β-桶状结构。
图2显示了单结构域荧光蛋白索烃的设计。
图3显示了实施例1单结构域荧光蛋白索烃的合成过程。
图4显示了实施例2中融合蛋白索烃的设计(A)和合成过程(B)。
图5显示了实施例4中用于制备单结构域荧光蛋白索烃的轮烷前体质谱数据:(A)rot-GFP,(B)rot-mCherry,(C)rot-mWasabi,(D)rot-YPet。
图6显示了实施例4中用于制备融合蛋白索烃的轮烷前体质谱数据:(A)rot-GFP-DHFR,(B)rot-GFP-monellin,(C)rot-GFP-leptin,(D)rot-GFP-mCherry。
图7显示了实施例5中rot-GFP的反应结果的SDS-PAGE表征(A),尺寸排阻色谱表征(B)以及质谱表征(C)。
图8显示了实施例5中单结构域荧光蛋白索烃cat-mCherry(A),cat-mWasabi(B),cat-YPet(C)的质谱表征数据。
图9显示了实施例5中rot-GFP-DHFR的反应结果的SDS-PAGE表征(A),尺寸排阻色谱表征(B)以及质谱表征数据(C)。
图10显示了实施例5中融合蛋白索烃cat-GFP-monellin(A),cat-GFP-leptin(B),cat-GFP-mCherry(C)的质谱表征数据。
图11显示了实施例6中cat-GFP的TEV蛋白酶酶切实验结果的SDS-PAGE表征(B),质谱表征(C)和(D)以及酶切结构预测示意图(A)。
图12显示了实施例6中单结构域荧光蛋白的TEV酶切结果的SDS-PAGE表征(A)以及cat-mCherry(B)、cat-mWasabi(C)以及cat-YPet(D)的质谱表征。
图13显示了实施例6中融合蛋白索烃cat-GFP-DHFR的TEV蛋白酶酶切实验结果的SDS-PAGE表征(A)以及质谱表征数据(B)。
图14显示了实施例6中融合蛋白索烃的TEV酶切结果的SDS-PAGE表征cat-GFP-monellin(A),cat-GFP-leptin(C),cat-GFP-mCherry(E)以及质谱表征cat-GFP-monellin(B),cat-GFP-leptin(D),cat-GFP-mCherry(F)。
图15显示了实施例7中wt-GFP、[2]cat-GFP以及[3]cat-GFP的荧光光谱图。
图16显示了实施例7中cat-mCherry(A)、cat-mWasabi(B)以及cat-YPet(C)的荧光光谱图。
图17显示了实施例8中c-GFP(A),l-GFP(B),c-GFP-DHFR(C),l-GFP-DHFR(D),c-GFP-monellin(E),l-GFP-monellin(F)的质谱表征数据。
图18显示了实施例9中用于检测蛋白质样品热回弹性的变温程序(A)以及l-GFP(实线)、c-GFP(虚线)以及[2]cat-GFP(点线)的实时荧光恢复数据(B)。
图19显示了实施例10中GFP-DHFR系列融合蛋白(A)以及GFP-monellin系列融合蛋白(B)的DSC数据图。
图20显示了实施例11中cat-GFP-DHFR、c-GFP-DHFR、l-GFP-DHFR以及wt-DHFR在50℃加热一定时间后酶活性情况(A)以及冻融前后DHFR酶活性情况(B)。
图21显示了实施例13中胞内直接表达单结构域荧光蛋白索烃的热孵育以及透析纯化结果。
图22显示了实施例12和实施例13中胞内表达以及纯化制备蛋白质索烃结构的尺寸排阻色谱数据图(A)及质谱数据图(B),TEV酶切结果(C)及TEV酶切产物的质谱数据图(D)。
具体实施方式
下面通过实施例进一步对本发明进行详细说明,但不以任何方式限制本发明的范围。
制备单结构域荧光蛋白索烃以及融合蛋白索烃的轮烷前体的具体步骤为:利用重组基因工程技术构建含有His6标签(用于蛋白质纯化)、分离型内含肽(反应基元)、目标蛋白质、转肽酶识别位点(反应基元)的融合蛋白,即InC-FP1-InN-GGG-FP2-(POI)-LPETG-H6,其中POI可以是DHFR、monellin、leptin、mCherry等目标蛋白质,亦或者不加入目标蛋白质。将该融合蛋白的基因序列插入表达载体pMCSG中。然后将该表达载体转化到大肠杆菌中进行表达,利用Ni亲和层析等蛋白提纯方法获得纯化的蛋白质轮烷前体。所述融合蛋白例如:IntC-GFP1-IntN-GGG-GFP2-LPETG-H6、IntC-mCherry1-IntN-GGG-mCherry 2-LPETG-H6、IntC-mWasabi1-IntN-GGG-mWasabi2-LPETG-H6、IntC-YPet1-IntN-GGG-YPet2-LPETG-H6、IntC-GFP1-IntN-GGG-GFP2-DHFR-LPETG-H6、IntC-GFP1-IntN-GGG-GFP2-monellin-LPETG-H6、IntC-GFP1-IntN-GGG-GFP2-leptin-LPETG-H6、IntC-GFP1-IntN-GGG-GFP2-mCherry-LPETG-H6等。
利用十二烷基磺酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)、液相质谱联用(LC-MS)以及尺寸排阻色谱(SEC)对前驱体蛋白质及所制备得到的索烃结构进行初步表征;利用TEV酶酶切实验结合十二烷基磺酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)间接证明蛋白质索烃的拓扑结构;利用荧光光谱测试表征单结构域荧光蛋白索烃的荧光性质;利用示差扫描量热法(DSC)对所得到的索烃结构进行Tm测试,探究索烃化对目标蛋白质的热稳定性的影响。随后本发明测试了cat-GFP-DHFR的酶活性,并探究了50℃加热一定时间后索烃结构的酶活性保持能力,以及通过冻融手段,探究冻融引入的机械变性对酶活性的影响。
实施例1:通过拆分和重新接线设计单结构域荧光蛋白索烃
参见图2,首先将序列上β折叠片7和8之间的连接链断开,将荧光蛋白拆分成由β折叠片1-7和8-11构成的两部分。然后如果在β折叠片1的N端和β折叠片7的C端之间引入长度合适的连接链,就能得到荧光蛋白索烃的第一个环。类似地,如果在β折叠片8的N端和β折叠片11的C端也引入长度合适的连接链,就得到了荧光蛋白索烃的第二个环。在基因设计中,为了避免关环反应在缠结发生之前完成,本发明首先利用内含肽在细胞内完成对第一个环的环化,得到轮烷前体,然后通过在体外使用转肽酶完成对第二个环的环化,从而合成荧光蛋白索烃(图3)。
基因卡带的设计如下:分别在β折叠片1的N端和β折叠片7的C端引入分离型内含肽的两部分IntC和IntN,通过胞内原位反应得到索烃的第一个环;分别在β折叠片8的N端和β折叠片11的C端修饰转肽酶识别序列GGG和LPETG,用于后续转肽酶体外关环,得到构成索烃的另一个环。由此构建的单结构域荧光蛋白轮烷前体rot-GFP、rot-mCherry、rot-mWasabi以及rot-YPet的氨基酸序列分别如序列表中SEQ ID No:1,3,4和5所示。蛋白质结构域中天然存在的相互作用和新引入的连接链之间构成了索烃的机械键,由此完成了单结构域荧光蛋白索烃的设计。最终获得的单结构域荧光蛋白索烃由两个互锁的环组成,以cat-GFP为例,其中第一个环(GFP1)的氨基酸序列如序列表中SEQ ID No:11所示,第二个环(GFP2)的氨基酸序列如序列表中SEQ ID No:12所示。
实施例2:基于单结构域荧光蛋白索烃的融合蛋白设计
通过对荧光蛋白晶体结构的观察发现,用于合成单结构域荧光蛋白索烃的轮烷前体的关环位点位于β-桶状结构的同一侧,并且具有相对较大的距离,因此可以耐受其他具有稳定结构的目标蛋白(POI)的插入(见图4中(A))。基因卡带的设计如图4中(B)所示。与实施例1中的构建和合成方法类似,FP1在胞内原位完成关环反应后,通过TVMV酶切得到暴露出转肽酶识别位点的融合蛋白轮烷前体,最后使用转肽酶体外关环即可得到融合蛋白索烃。由此构建的融合蛋白索烃的轮烷前体rot-GFP-DHFR、rot-GFP-monellin、rot-GFP-leptin以及rot-GFP-mCherry的氨基酸序列如序列表中SEQ ID No:6,7,8和9所示。蛋白质结构域中天然存在的相互作用和新引入的连接链之间构成了索烃的机械键,由此完成了融合蛋白索烃的设计。最终获得的融合蛋白索烃由两个互锁的环组成,以cat-GFP-DHFR为例,其中第一个环(GFP1)的氨基酸序列如序列表中SEQ ID No:11所示,第二个环(GFP2-DHFR)的氨基酸序列如序列表中SEQ ID No:13所示。
实施例3:用于制备单结构域荧光蛋白索烃和融合蛋白索烃的轮烷前体的表达和纯化
通过基因工程构建得到的用于制备单结构域荧光蛋白索烃和融合蛋白索烃的轮烷前体序列即IntC-FP1-IntN-GGG-FP2-(POI)-LPETG-H6导入到pMCSG19载体中。随后将载体转化到含有pRK1037质粒的大肠杆菌BL21(DE3)感受态细胞中涂板,37℃培养12h。挑选单克隆接种到10mL含有100μg/mL氨苄霉素和50μg/mL卡那霉素的2×YT液体培养基中,以37℃,220rpm的培养条件振荡培养过夜。将过夜培养的菌液按照1:100的比例接种到含有同样剂量抗生素的1L体积的2×YT培养基中,在37℃,220rpm的培养条件下培养直至体系OD600值达到0.8-1.0。此时向培养体系中加入0.5mM IPTG进行诱导,诱导后继续在16℃,220rpm下表达12h。表达结束后将所培养的菌液在4℃,5000rpm条件下离心20min分离菌体和培养基溶液,弃去培养基废液并用非变性的裂解液(20mM磷酸二氢钠,300mM氯化钠,10mM咪唑,pH=8.0)重悬下层的菌体。重悬后的菌液置于冰水浴中超声破碎30min,超声条件为工作5s,停止10s,功率35%。将超声破碎液在4℃,10000g条件下离心30min分离上清液和细胞破碎物沉淀。取上清液与平衡好的镍亲和树脂(Ni-NTA)混合并在在4℃孵育约1h,以保证树脂与蛋白质中组氨酸标签的充分结合,随后将蛋白树脂混合液倒入纯化柱中进行纯化。通过10倍树脂体积的清洗液(20mM磷酸二氢钠,300mM氯化钠,20mM咪唑,pH=8.0)进行洗脱以除去吸附在树脂上的杂蛋白,随后利用2倍树脂体积的洗脱液(20mM磷酸二氢钠,300mM氯化钠,250mM咪唑,pH=8.0)洗脱得到目的蛋白质。洗脱液利用AKTA蛋白纯化系统(AKTAAvant,GEHealthcare)进行进一步分离纯化,Tris缓冲液(pH 7.4)作为流动相,流速为0.5mL/min,收集样品用于下一步表征。
实施例4:用于制备荧光蛋白单结构域索烃和融合蛋白索烃的轮烷前体的轮烷前体表征
纯化后的轮烷前体利用LC-MS进行初步表征。图5显示了用于制备单结构域荧光蛋白索烃的轮烷前体质谱数据:(A)rot-GFP,(B)rot-mCherry,(C)rot-mWasabi,(D)rot-YPet。图6显示了用于制备融合蛋白索烃的轮烷前体质谱数据:(A)rot-GFP-DHFR,(B)rot-GFP-monellin,(C)rot-GFP-leptin,(D)rot-GFP-mCherry。实验数据与理论计算数据基本吻合。
实施例5:单结构域荧光蛋白索烃和融合蛋白索烃的制备和表征
将纯化后的rot-FP-(POI)稀释为50μM,在蛋白质样品中加入0.1当量的转肽酶(储存在10%甘油,50mM Tris,150mM氯化钠,pH=8.0的溶液中),加入10mM氯化钙引发反应。在16℃反应1h左右,然后加入10mM EDTA终止反应。粗产物使用镍柱纯化,使用洗脱缓冲液(20mM Tris,500mM氯化钠,20mM咪唑,pH=8.0)淋洗并逐管收集流穿组分。反应结束后,取10μL反应混合物与5×蛋白质上样缓冲液混合,随后98℃加热10min,利用十二烷基磺酸钠-聚丙烯酰胺凝胶电泳进行结果分析。
对于单结构域荧光蛋白索烃的制备,以cat-GFP的合成为例进行详尽说明。GFP轮烷前体的反应结果如图7中(A)所示,变性SDS-PAGE的结果显示,从体内分离出的产物两部分之间不具有共价连接,说明TVMV酶可以在体内效率较高完成酶切。而图7的(B)中轮烷前体的流出体积则证明非共价连接的两个组分可以效率较高的实现有效重组。体外关环反应结果如图7中(A)所示,值得注意的是,由于每个GFP轮烷分子的两端都含有GGG和LPETG的转肽酶识别序列,因此它们既可以通过分子内反应形成二索烃也可以通过分子间反应形成三索烃。图7中(B)展示了轮烷前体、反应产物,即二索烃和三索烃产物的流出体积。反应后产物在SEC上呈现出的两个峰分别为二索烃和三索烃产物,它们可以通过SEC的方法较为方便的分离。图中可以看出反应后的二索烃相比较于轮烷前体具有更小的流出体积,表明其具有更大的流体力学体积,说明轮烷的构象不及索烃紧凑。而由于分子量是二索烃的二倍,三索烃的流出体积明显大于二索烃。随后,又通过LC-MS的实验验证了二索烃和三索烃产物的分子量(见图7中(C)),均与预期相符。其他单结构域荧光蛋白索烃cat-mCherry、cat-mWasabi以及cat-YPet的制备过程与cat-GFP类似,但是由于三种蛋白的序列中氨基酸种类和连接顺序有所不同,因此分子内反应和分子间反应的选择性也略有不同,主产为二索烃。LC-MS的实验验证了它们的分子量(图8),均与预期相符。
对于融合蛋白索烃的制备,以cat-GFP-DHFR的合成为例进行详尽说明。rot-GFP-DHFR的反应结果如图9中(A)所示,变性SDS-PAGE的结果显示,从体内分离出的产物两部分之间不具有共价连接,说明TVMV酶可以在体内效率较高完成酶切。但是由于DHFR本身具有折叠结构,造成了一定的位阻,因此融合蛋白的合成中通过分子内反应获得的二索烃为主产(见图9(A))。图9中(B)展示出融合蛋白轮烷前体的流出体积没有大于反应产物,而是具有类似的流出体积。这可能是因为具有折叠结构的活性蛋白限制了轮烷前体的链末端,是使得轮烷前体也具有了相对紧凑的构象。随后,又通过LC-MS的实验验证了二索烃产物的分子量(见图9中(C)),与预期相符。其他融合蛋白索烃cat-GFP-monellin、cat-GFP-leptin以及cat-GFP-mCherry的制备过程与cat-GFP-DHFR类似,LC-MS的实验验证了它们的分子量(图10),均与预期相符。
实施例6:单结构域荧光蛋白索烃和融合蛋白索烃的拓扑结构表征
为了对拓扑结构进行验证,在基因卡带的设计过程中,在单结构域荧光蛋白索烃的环1(GFP1、mCherry1、mWasabi1、YPet1)和融合蛋白索烃的环1(GFP1)的N端引入了TEV酶切位点(ENLYFQG)。取10μM,20μL反应前蛋白质样品于PCR管中,按酶/底物浓度比为1:20分别加入TEV蛋白酶,30℃反应48小时。反应产物利用SDS-PAGE和LC-MS进行分析。
对于单结构域荧光蛋白索烃的拓扑结构验证,以cat-GFP为例进行详尽说明。如图11中(A)所示,经过TEV酶切后,二索烃将会得到分子量为19211Da的线性产物和10196Da的环状产物,三索烃将会得到分子量为19211Da的线性产物和20392Da的环状产物。TEV酶切胶图表征结果如图11中(B)所示,LC-MS表征结果如图11中(C)和(D)所示,可以观察到相应分子量的酶切产物条带,与预测结果相吻合。cat-mCherry、cat-mWasabi以及cat-YPet的TEV酶切胶图表征结果如图12中(A)所示,可以观察到相应分子量的酶切产物条带。LC-MS表征结果如图12中(B)、(C)和(D)所示,与预测结果相吻合。因此,证明了单结构域荧光蛋白索烃的拓扑结构。
对于融合蛋白索烃的拓扑结构验证,以cat-GFP-DHFR为例进行详尽说明。酶切后将会获得19211Da的线性产物和28323Da的环状产物。TEV酶切结果如图13中(A)所示,可以观察到相应分子量的酶切产物条带。随后,又通过LC-MS的实验验证了索烃产物的分子量(图13中(B)),与预期相符。其他融合蛋白索烃cat-GFP-monellin、cat-GFP-leptin以及cat-GFP-mCherry的TEV酶切胶图表征结果如图14中(A)、(C)以及(E)所示,LC-MS表征结果如图14中(B)、(D)以及(F)所示,可以观察到相应分子量的酶切产物条带,与预测结果相吻合。因此,证明了融合蛋白索烃的拓扑结构。
实施例7:单结构域荧光蛋白索烃的荧光性质表征
随后,本发明利用荧光光谱探究了索烃化对单结构域荧光蛋白荧光性质的影响,此处以GFP系列样品为例进行详尽说明。纯化得到的wt-GFP、[2]cat-GFP以及[3]cat-GFP用于荧光光谱测试。样品经缓冲液(20mM Tris,150mM氯化钠,pH 8.0)稀释后加入到黑色96孔板中,利用酶标仪(PerkinElmer公司)扫描模式进行数据获取。测试过程中,固定410nm为激发波长,扫描440-600nm发射光谱。图15为wt-GFP、[2]cat-GFP以及[3]cat-GFP三个样品的荧光光谱叠加谱图,三者谱图基本吻合,说明这种单结构域索烃化过程不会影响荧光蛋白的基本荧光性质。其他荧光蛋白单结构域索烃cat-mCherry、cat-mWasabi以及cat-YPet的荧光检测过程与cat-GFP类似,但是根据相应野生型荧光光谱的不同采用了不同的激发波长。图16中(A)、(B)以及(C)分别为cat-mCherry、cat-mWasabi以及cat-YPet三个样品的荧光光谱,与文献中报道的野生型荧光光谱类似(Shaner,N.C.,etal.Nat.Biotechnol.2004,22,1567;Ai,H.W.,et al.BMC Biol.2008,6,13;Nguyen,A.W.,et al.Nat.Biotechnol.2005,23,355),说明这种单结构域索烃化过程不会影响荧光蛋白的基本荧光性质。
实施例8:单结构域荧光蛋白索烃和融合蛋白索烃线性对照和环状对照的合成与表征
为了更清晰的阐述索烃化对目标蛋白性质造成的影响,本发明中还合成了相应的线性对照(l-GFP-【POI】)和环状对照(c-GFP-【POI】)。wt-GFP具有线性拓扑结构即为单结构域荧光蛋白索烃的线性对照,融合蛋白索烃的线性对照通过将目标蛋白POI的序列接在wt-GFP序列的C末端获得。而单结构域荧光蛋白索烃和融合蛋白索烃的环状对照则是通过将分离型内含肽的两部分分别修饰在线性对照的N端和C端的方式合成。c-GFP-DHFR、l-GFP-DHFR、c-GFP-monellin、l-GFP-monellin以及c-GFP的序列依次为SEQ ID No:14-18。将通过基因工程构建得到的环状对照和线性对照的序列导入到pET-15b或pET-22b载体中,按照实施例3中的方法表达纯化。随后将纯化得到的产物进行LC-MS表征,表征结果如图17所示,均符合预期。
实施例9:单结构域荧光蛋白索烃的热回弹性表征
本发明还利用荧光恢复实验探究了索烃化对单结构域荧光蛋白热回弹性的影响,此处以GFP系列样品为例进行详尽说明。热回弹性描述了蛋白质变性后恢复其功能构象的能力,是表征蛋白质动力学稳定性的重要参数。将纯化得到的l-GFP(wt-GFP)、c-GFP以及[2]cat-GFP样品稀释成1mg/mL,取10μL加入不透光八联排中。使用实时定量PCR仪(AppliedBiosystems公司)实时监测各样品在如图18中(A)所示的变温程序下的荧光强度变化,最后所有数据都按照最大值归一化。检测结果如图18中(B)所示,在高温加热,缓慢梯度降温后,[2]cat-GFP表现出快速荧光恢复的性质,其荧光强度可以迅速恢复至接近100%,而c-GFP的荧光强度仅能恢复到原来的70%左右,荧光恢复速度也更慢。l-GFP的荧光强度在相应的时间内仅能恢复到原来的7%左右。以上数据表明,单结构域荧光蛋白索烃相较于其环状对照和线性对照均表现出更强的热回弹性。
实施例10:融合蛋白索烃的热稳定性表征
利用示差扫描量热法(DSC)探究融合蛋白索烃的热稳定性。将测试样品用稀释至1mg/mL,利用MicroCal PEAQ-DSC进行测试,测试过程中,样品以每分钟90或120℃的速率从30或50℃扫描到110℃,所得数据通过MicroCal Analysis Launcher software进行分析处理。
图19为所得到的DSC曲线,表1为所得到的结构的Tm数据表,以及文献中报道的DHFR以及monellin的数据。图19的DSC数据图表明,融合蛋白样品都显示出两个结构域的峰,分别对应GFP和POI。这表明在融合蛋白解折叠过程中,两个结构域不能完全耦合在一起。但是值得注意的是,在索烃结构中GFP对POI的机械互锁作用对POI组分的热稳定性有一定影响。在环状样品和索烃样品中,由于环化及组分间机械互锁的限制,DHFR组分的Tm值从线性的52.9摄氏度提升到环状的56.2摄氏度再到索烃中的58.2摄氏度。而monellin组分的Tm值从线性的69.9摄氏度提升到环状的70.1摄氏度再到索烃中的72.1摄氏度。这说明了在线性样品中二者的解折叠是相对独立的,但是由于环状末端的限制作用,二者的解折叠过程有相互影响,而索烃中更加紧凑的结构则加大了这种影响幅度。
表1
a指Tm数据由变温CD测试得到,b指Tm数据由DSC测试得到,c指Tm数据由文献报道。
[1]Da,X.D.and Zhang,W.-B.,Angew.Chem.Int.Ed.2019,58,11097.
[2]Leone,S.;Pica,A.;Merlino,A.;Sannino,F.;Temussi,P.A.;Picone,D.,Sci.Rep.2016,6,34045.
实施例11:融合蛋白索烃的耐热诱导变性能力以及耐机械变性能力表征
最后,本发明对索烃结构中的目标蛋白质二氢叶酸还原酶(DHFR)的活性进行探究。将cat-GFP-DHFR、c-GFP-DHFR、l-GFP-DHFR以及wt-DHFR稀释到KHP缓冲液(40.1mM磷酸氢二钾,9.9mM磷酸二氢钠,5mM巯基乙醇,pH 7.4)中至终浓度为100nM,得到底物的工作液。工作液与100μM NADPH(KHP缓冲液)以及100μM二氢叶酸(KHP缓冲液)混合置于96孔板中,随即利用酶标仪(PerkinElmer公司)动力学模式实时跟踪340nm处吸光度变化情况。此外,测试含有不同浓度的NADPH(10,20,30,40,50,60,100nmol)的KHP缓冲液在340nm处的吸光度用于绘制标准曲线。所得的样品吸光度-时间曲线,取其中线性部分进行分析,结合标准曲线计算酶活性。从图20可得知cat-GFP-DHFR、c-GFP-DHFR、l-GFP-DHFR以及wt-DHFR活性基本相同。之后将样品cat-GFP-DHFR、c-GFP-DHFR、l-GFP-DHFR以及wt-DHFR工作液与50℃加热一定的时间(10,20,30,40min)后,立即放入4℃,随后按上述步骤进行酶活分析,所得结果如图20中(A)所示。c-GFP-DHFR、l-GFP-DHFR、wt-DHFR加热后有一定酶活下降,而索烃结构则最大程度的保持了活性。此外,本发明也探究了冻融对目标蛋白质活性的影响。将样品cat-GFP-DHFR、c-GFP-DHFR、l-GFP-DHFR以及wt-DHFR工作液放入-80℃冷冻,随后在室温下快速融化,之后按上述活性测试步骤进行酶活分析,所得结果如图20中(B)所示,索烃结构和环状结构较大程度的保持了酶活性,而野生型和线性DHFR活性则有大幅度降低。
以上结果表明,利用融合蛋白索烃的构建不仅不会影响蛋白质的结构和活性,反而相比较于线性结构以及环状结构,在一定情况下会具有更好的耐热诱导变性能力,以及耐受由冻融引入的机械变性能力。
实施例12:胞内直接表达制备单结构域荧光蛋白索烃
在实现蛋白质索烃结构的胞外合成后,本发明还构建了IntC1-GFP1-IntN1-VidC-GFP2-VidN的序列,其原始的经翻译后得到的氨基酸序列是SEQ IDNO:10。本构建使用了与Npu内含肽正交的Vidal内含肽,两部分简写为VidC和VidN。将其插入pMCSG共表达载体中,得到荧光蛋白索烃共表达体系,将其转化到大肠杆菌BL21(DE3)感受态细胞中,采用实施例3中的方法表达和纯化,可实现荧光蛋白索烃的直接细胞合成得到Vidal-cat-GFP。
实施例13:胞内直接表达单结构域荧光蛋白索烃的热孵育纯化
由于体内一步制备方式无法像体外制备方式一样精确调控索烃两部分的组装和反应的时序性,一部分关环反应在组装完成前发生,导致了单环副产物的产生(图21)。进一步利用索烃和单环组装体的热稳定性不同,发展了高温孵育的纯化方法。将样品粗产物在较高温度下孵育3小时以上,组装体中的大环会由于不稳定而形成沉淀,经高速离心后就可以除去大环杂质。而小环由于体积小,溶解度高,无法通过高温孵育的方法除去。因此,使用截留分子量为15kDa的透析袋,将蛋白质样品透析到较低盐浓度的缓冲液的过程中就除去了小环杂质,得到纯度很高的蛋白质索烃,纯化结果如图21所示。尺寸排阻色谱(见图22中(A))表明体系经纯化后得到主产物为索烃结构。随后所得到的索烃结构进行了LC-MS测试,如图22中(B)所示,测试数据与理论计算数据吻合。进一步的酶切实验也证明了索烃的拓扑结构(见图22中(C))。
Claims (18)
1.一种单结构域荧光蛋白索烃的构建方法,包括以下步骤:
1)将荧光蛋白拆分为两部分FP1和FP2,分别用于构建蛋白质索烃的两个环;
2)构建基因卡带,其编码的蛋白质序列从N端到C端包括LN1-FP1-LC1-LN2-FP2-LC2,其中LN1和LC1、LN2和LC2代表两对正交的蛋白质偶联反应对的反应基元;
3)将步骤2)构建的基因卡带引入表达载体中并转入细胞进行表达,得到蛋白质前驱体;
4)蛋白质前驱体在胞内完成环化得到单结构域荧光蛋白索烃,或者,通过胞内环化和体外关环反应相结合得到单结构域荧光蛋白索烃。
2.如权利要求1所述的构建方法,其特征在于,步骤1)将荧光蛋白的第7个和第8个β折叠片之间的连接链断开,拆分为FP1和FP2两部分,其中,FP1包含β折叠片1-7而FP2包含β折叠片8-11,或者,FP1包含β折叠片8-11而FP2包含β折叠片1-7。
3.如权利要求1所述的构建方法,其特征在于,步骤2)中所述两对正交的蛋白质偶联反应对包括两对正交的分离型内含肽,或者由一对分离型内含肽和一对其他可基因编码的蛋白质偶联反应对组成。
4.如权利要求3所述的构建方法,其特征在于,所述分离型内含肽选自NpuDnaE内含肽和Vidal内含肽;所述其他可基因编码的蛋白质偶联反应对为体外实现蛋白质偶联的工具酶识别位点,所述工具酶选自转肽酶和谷氨酰胺转氨酶。
5.如权利要求1所述的构建方法,其特征在于,步骤2)在基因卡带上设计His标签序列,在步骤4)中通过镍亲和层析进行蛋白纯化。
6.如权利要求1所述的构建方法,其特征在于,所述荧光蛋白为绿色荧光蛋白GFP、红色荧光蛋白mCherry、绿色荧光蛋白mWasabi或黄色荧光蛋白YPet,在步骤1)将荧光蛋白拆分为FP1和FP2两部分,其中FP1包含β折叠片1-7而FP2包含β折叠片8-11,或者,FP1包含β折叠片8-11而FP2包含β折叠片1-7;步骤2)构建基本结构为IntC-FP1-IntN-GGG-FP2-LPETG-H6的基因卡带,其中IntC和IntN分别代表分离型内含肽的C端部分和N端部分,GGG和LPETG是转肽酶识别位点,H6代表6×His标签,并在IntN和GGG之间插入烟草叶斑病病毒蛋白酶的酶切位点;步骤3)基因卡带表达后在胞内完成第一个环的环化,同时在细胞中表达烟草叶斑病病毒蛋白酶对其识别位点进行特异性酶切,纯化后得到荧光蛋白轮烷前体;然后通过转肽酶体外关环得到单结构域荧光蛋白索烃。
7.一种融合蛋白索烃的制备方法,包括以下步骤:
1)将荧光蛋白拆分为两部分FP1和FP2,分别用于构建蛋白质索烃的两个环;
2)构建基因卡带,其编码的蛋白质序列从N端到C端包括LN1-(POI1)-FP1-(POI1')-LC1-LN2-(POI2)-FP2-(POI2')-LC2,其中LN1和LC1、LN2和LC2代表两对正交的蛋白质偶联反应对的反应基元,POI1、POI1'、POI2和POI2'代表融合蛋白索烃中引入的目标蛋白,同时引入多个目标蛋白或者只引入其中的一个,即POI1、POI1'、POI2和POI2'同时引入或只引入其中的一个或多个;
3)将步骤2)构建的基因卡带引入表达载体中并转入细胞进行表达,得到蛋白质前驱体;
4)蛋白质前驱体在胞内完成环化得到融合蛋白索烃,或者,通过胞内环化和体外关环反应相结合得到融合蛋白索烃。
8.如权利要求7所述的制备方法,其特征在于,步骤1)将荧光蛋白的第7个和第8个β折叠片之间的连接链断开,拆分为FP1和FP2两部分,其中FP1包含β折叠片1-7而FP2包含β折叠片8-11,或者,FP1包含β折叠片8-11而FP2包含β折叠片1-7。
9.如权利要求7所述的制备方法,其特征在于,步骤2)中所述两对正交的蛋白质偶联反应对包括两对正交的分离型内含肽,或者由一对分离型内含肽和一对其他可基因编码的蛋白质偶联反应对组成。
10.如权利要求9所述的制备方法,其特征在于,所述分离型内含肽选自NpuDnaE内含肽和Vidal内含肽;所述其他可基因编码的蛋白质偶联反应对为体外实现蛋白质偶联的工具酶识别位点,所述工具酶选自转肽酶和谷氨酰胺转氨酶。
11.如权利要求7所述的制备方法,其特征在于,步骤2)在基因卡带上设计His标签序列,在步骤4)中通过镍亲和层析进行蛋白纯化。
12.如权利要求7所述的制备方法,其特征在于,步骤1)中所述荧光蛋白为绿色荧光蛋白GFP、红色荧光蛋白mCherry、绿色荧光蛋白mWasabi或黄色荧光蛋白YPet,将荧光蛋白拆分为FP1和FP2两部分,其中FP1包含β折叠片1-7而FP2包含β折叠片8-11,或者,FP1包含β折叠片8-11而FP2包含β折叠片1-7;步骤2)构建基本结构为IntC-(POI1)-FP1-(POI1')-IntN-GGG-(POI2)-FP2-(POI2')-LPETG-H6的基因卡带,其中IntC和IntN分别代表分离型内含肽的C端部分和N端部分,GGG和LPETG是转肽酶识别位点,H6代表6×His标签,并在IntN和GGG之间插入烟草叶斑病病毒蛋白酶的酶切位点;步骤3)基因卡带表达后在胞内完成第一个环的环化,同时在细胞中表达烟草叶斑病病毒蛋白酶对其识别位点进行特异性酶切,纯化后得到融合蛋白轮烷前体;然后通过转肽酶体外关环得到融合蛋白索烃。
13.一种单结构域荧光蛋白索烃,至少包括两个相互缠结的索烃单元环,这两个环分别包含将荧光蛋白拆分后可自发重组的两部分。
14.如权利要求13所述的单结构域荧光蛋白索烃,其特征在于,将所述荧光蛋白的第7个和第8个β折叠片之间的连接链断开,拆分为包含β折叠片1-7和包含β折叠片8-11的两部分,这两部分分别位于所述两个相互缠结的索烃单元环中。
15.如权利要求13所述的单结构域荧光蛋白索烃,其特征在于,所述荧光蛋白为绿色荧光蛋白GFP、红色荧光蛋白mCherry、绿色荧光蛋白mWasabi或黄色荧光蛋白YPet。
16.一种融合蛋白索烃,至少包括两个相互缠结的索烃单元环,这两个环分别包含将荧光蛋白拆分后可自发重组的两部分作为缠结基元,在所述索烃单元环的一个或两个中,荧光蛋白部分的N端和/或C端融合有目标蛋白。
17.如权利要求16所述的融合蛋白索烃,其特征在于,将所述荧光蛋白的第7个和第8个β折叠片之间的连接链断开,拆分为包含β折叠片1-7和包含β折叠片8-11的两部分,这两部分分别位于所述两个相互缠结的索烃单元环中。
18.如权利要求16所述的融合蛋白索烃,其特征在于,所述荧光蛋白为绿色荧光蛋白GFP、红色荧光蛋白mCherry、绿色荧光蛋白mWasabi或黄色荧光蛋白YPet。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211561433.5A CN118146334A (zh) | 2022-12-07 | 2022-12-07 | 单结构域荧光蛋白索烃及其构建和在制备融合蛋白索烃中的应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211561433.5A CN118146334A (zh) | 2022-12-07 | 2022-12-07 | 单结构域荧光蛋白索烃及其构建和在制备融合蛋白索烃中的应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118146334A true CN118146334A (zh) | 2024-06-07 |
Family
ID=91297378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211561433.5A Pending CN118146334A (zh) | 2022-12-07 | 2022-12-07 | 单结构域荧光蛋白索烃及其构建和在制备融合蛋白索烃中的应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118146334A (zh) |
-
2022
- 2022-12-07 CN CN202211561433.5A patent/CN118146334A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7290305B2 (ja) | 例外的なスプライシング活性を有するスプリットインテイン | |
CN111560391B (zh) | 一种蛋白质异质索烃的生物合成方法 | |
KR101782790B1 (ko) | 혈청 알부민에 결합하는 설계된 반복 단백질 | |
Koerber et al. | An improved single-chain Fab platform for efficient display and recombinant expression | |
CN105061581B (zh) | 可基因编码的全蛋白质索烃的制备方法 | |
CN110272913B (zh) | 一种基于索烃化的蛋白质偶联方法 | |
JPH11501008A (ja) | 改変−アフィニティーストレプトアビジン | |
EP2161278B1 (en) | Single-chain coiled coil scaffold | |
Tang et al. | A minimal phycobilisome: Fusion and chromophorylation of the truncated core-membrane linker and phycocyanin | |
US20210355175A1 (en) | Orthogonal protein heterodimers | |
Tian et al. | Development and characterization of a camelid single domain antibody–urease conjugate that targets vascular endothelial growth factor receptor 2 | |
WO2011018665A1 (en) | Complexing system | |
CN113045633B (zh) | 蛋白质异质缠结基元的设计与复杂索烃结构的制备方法 | |
EP3750911A1 (en) | Cysteine-free inteins | |
WO2015120548A1 (en) | Genetically encoded photocleavable proteins | |
CN118146334A (zh) | 单结构域荧光蛋白索烃及其构建和在制备融合蛋白索烃中的应用 | |
JP2016518855A (ja) | 融合プロテアーゼ | |
ES2674983T3 (es) | Método para la separación de proteínas que contienen un dominio que se une a albúmina | |
EP3740584A1 (en) | Biological synthesis of amino acid chains for preparation of peptides and proteins | |
Song et al. | Effect of SpyTag/SpyCatcher cyclization on stability and refolding of green fluorescent protein | |
WO2019190022A1 (ko) | 단백질-단백질 결합체를 형성 매개 펩타이드 및 이를 이용한 단백질-단백질 결합체 형성 방법 | |
JP4160864B2 (ja) | 融合蛋白質、その製造方法及びそれを用いた評価方法 | |
New | Analysis of Tha4 Function and Organization in Chloroplast Twin Arginine Transport | |
CN116621947B (zh) | 一种基于索烃骨架的拓扑蛋白质、制备方法及应用 | |
Liu | Engineering of polychromatic photosystems for expanded solar energy conversion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |