CN113853384A - 用于蛋白质降解的可调整控制的蛋白质开关的全新设计 - Google Patents
用于蛋白质降解的可调整控制的蛋白质开关的全新设计 Download PDFInfo
- Publication number
- CN113853384A CN113853384A CN202080016464.5A CN202080016464A CN113853384A CN 113853384 A CN113853384 A CN 113853384A CN 202080016464 A CN202080016464 A CN 202080016464A CN 113853384 A CN113853384 A CN 113853384A
- Authority
- CN
- China
- Prior art keywords
- seq
- key
- polypeptide
- cage
- gfp11
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims description 131
- 102000004169 proteins and genes Human genes 0.000 title claims description 123
- 230000017854 proteolysis Effects 0.000 title claims description 8
- 238000013461 design Methods 0.000 title description 110
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 593
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 532
- 229920001184 polypeptide Polymers 0.000 claims abstract description 487
- 238000006731 degradation reaction Methods 0.000 claims abstract description 210
- 230000015556 catabolic process Effects 0.000 claims abstract description 191
- 230000000694 effects Effects 0.000 claims abstract description 24
- 150000007523 nucleic acids Chemical class 0.000 claims description 91
- 230000027455 binding Effects 0.000 claims description 85
- 102000039446 nucleic acids Human genes 0.000 claims description 82
- 108020004707 nucleic acids Proteins 0.000 claims description 82
- 210000004027 cell Anatomy 0.000 claims description 72
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 63
- 150000001413 amino acids Chemical class 0.000 claims description 62
- 239000013604 expression vector Substances 0.000 claims description 38
- 125000000539 amino acid group Chemical group 0.000 claims description 35
- 230000000975 bioactive effect Effects 0.000 claims description 32
- 210000004899 c-terminal region Anatomy 0.000 claims description 31
- 108090000848 Ubiquitin Proteins 0.000 claims description 22
- 102000044159 Ubiquitin Human genes 0.000 claims description 22
- 230000011664 signaling Effects 0.000 claims description 21
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 claims description 19
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 19
- 102000034285 signal transducing proteins Human genes 0.000 claims description 17
- 108091006024 signal transducing proteins Proteins 0.000 claims description 17
- 102000005962 receptors Human genes 0.000 claims description 16
- 108020003175 receptors Proteins 0.000 claims description 16
- 230000000670 limiting effect Effects 0.000 claims description 15
- 230000008685 targeting Effects 0.000 claims description 11
- 108091023040 Transcription factor Proteins 0.000 claims description 10
- 102000040945 Transcription factor Human genes 0.000 claims description 10
- 108091008874 T cell receptors Proteins 0.000 claims description 9
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 claims description 9
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 claims description 9
- 230000006907 apoptotic process Effects 0.000 claims description 9
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims description 8
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 claims description 7
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 claims description 7
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 claims description 7
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 claims description 7
- 230000003213 activating effect Effects 0.000 claims description 7
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 6
- 102000004190 Enzymes Human genes 0.000 claims description 6
- 108090000790 Enzymes Proteins 0.000 claims description 6
- HAYVTMHUNMMXCV-UHFFFAOYSA-N Cysteinyl-Alanine Chemical compound OC(=O)C(C)NC(=O)C(N)CS HAYVTMHUNMMXCV-UHFFFAOYSA-N 0.000 claims description 5
- -1 LOCKR switch Proteins 0.000 claims description 5
- 108091006047 fluorescent proteins Proteins 0.000 claims description 5
- 102000034287 fluorescent proteins Human genes 0.000 claims description 5
- 108091000080 Phosphotransferase Proteins 0.000 claims description 4
- 102100030264 Pleckstrin Human genes 0.000 claims description 4
- 102000020233 phosphotransferase Human genes 0.000 claims description 4
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 claims description 4
- 108010026735 platelet protein P47 Proteins 0.000 claims description 4
- 102000010170 Death domains Human genes 0.000 claims description 3
- 108050001718 Death domains Proteins 0.000 claims description 3
- 101000617830 Homo sapiens Sterol O-acyltransferase 1 Proteins 0.000 claims description 3
- 102100021993 Sterol O-acyltransferase 1 Human genes 0.000 claims description 3
- 101000697584 Streptomyces lavendulae Streptothricin acetyltransferase Proteins 0.000 claims description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 3
- 239000003795 chemical substances by application Substances 0.000 claims description 3
- 230000002503 metabolic effect Effects 0.000 claims description 3
- 230000007115 recruitment Effects 0.000 claims description 3
- 239000011701 zinc Substances 0.000 claims description 3
- 229910052725 zinc Inorganic materials 0.000 claims description 3
- 108010031480 Artificial Receptors Proteins 0.000 claims description 2
- 108091033409 CRISPR Proteins 0.000 claims description 2
- 108010021064 CTLA-4 Antigen Proteins 0.000 claims description 2
- 102000008203 CTLA-4 Antigen Human genes 0.000 claims description 2
- 229940045513 CTLA4 antagonist Drugs 0.000 claims description 2
- 230000004568 DNA-binding Effects 0.000 claims description 2
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 claims description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 claims description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 claims description 2
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 claims description 2
- 230000030833 cell death Effects 0.000 claims description 2
- 108091008034 costimulatory receptors Proteins 0.000 claims description 2
- 108010057085 cytokine receptors Proteins 0.000 claims description 2
- 102000003675 cytokine receptors Human genes 0.000 claims description 2
- 230000017074 necrotic cell death Effects 0.000 claims description 2
- 230000028973 vesicle-mediated transport Effects 0.000 claims description 2
- 230000014759 maintenance of location Effects 0.000 claims 1
- 108010091718 peptide L Proteins 0.000 claims 1
- 235000018102 proteins Nutrition 0.000 description 114
- 230000037361 pathway Effects 0.000 description 93
- 230000019491 signal transduction Effects 0.000 description 87
- 235000001014 amino acid Nutrition 0.000 description 65
- 229940024606 amino acid Drugs 0.000 description 64
- 230000014509 gene expression Effects 0.000 description 63
- 230000006870 function Effects 0.000 description 52
- 230000015572 biosynthetic process Effects 0.000 description 45
- 238000001994 activation Methods 0.000 description 38
- 230000004913 activation Effects 0.000 description 34
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 32
- 239000001257 hydrogen Substances 0.000 description 30
- 229910052739 hydrogen Inorganic materials 0.000 description 30
- 230000001939 inductive effect Effects 0.000 description 30
- 230000003993 interaction Effects 0.000 description 30
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 29
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 28
- 238000000034 method Methods 0.000 description 28
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 24
- 230000006698 induction Effects 0.000 description 24
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 23
- 238000004519 manufacturing process Methods 0.000 description 23
- 230000001404 mediated effect Effects 0.000 description 23
- 108091005948 blue fluorescent proteins Proteins 0.000 description 18
- 230000004927 fusion Effects 0.000 description 18
- 108010054624 red fluorescent protein Proteins 0.000 description 18
- 102100021569 Apoptosis regulator Bcl-2 Human genes 0.000 description 17
- 239000013078 crystal Substances 0.000 description 17
- 230000001419 dependent effect Effects 0.000 description 17
- 101150017888 Bcl2 gene Proteins 0.000 description 15
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 15
- 239000012636 effector Substances 0.000 description 14
- 238000005070 sampling Methods 0.000 description 14
- 239000011780 sodium chloride Substances 0.000 description 14
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 13
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 13
- 238000012575 bio-layer interferometry Methods 0.000 description 13
- 238000012360 testing method Methods 0.000 description 13
- 102000003390 tumor necrosis factor Human genes 0.000 description 13
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 12
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 12
- 239000007983 Tris buffer Substances 0.000 description 12
- 230000008859 change Effects 0.000 description 12
- 230000000875 corresponding effect Effects 0.000 description 12
- 108020001507 fusion proteins Proteins 0.000 description 12
- 102000037865 fusion proteins Human genes 0.000 description 12
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 12
- 239000004471 Glycine Substances 0.000 description 11
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 11
- 230000002209 hydrophobic effect Effects 0.000 description 11
- 230000017730 intein-mediated protein splicing Effects 0.000 description 11
- 238000005259 measurement Methods 0.000 description 11
- 230000004044 response Effects 0.000 description 11
- 102000004127 Cytokines Human genes 0.000 description 10
- 108090000695 Cytokines Proteins 0.000 description 10
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 10
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 10
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 10
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 10
- 230000004060 metabolic process Effects 0.000 description 10
- 230000035772 mutation Effects 0.000 description 10
- VOXZDWNPVJITMN-ZBRFXRBCSA-N 17β-estradiol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 VOXZDWNPVJITMN-ZBRFXRBCSA-N 0.000 description 9
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 9
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 9
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 9
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 9
- 230000003834 intracellular effect Effects 0.000 description 9
- 239000013612 plasmid Substances 0.000 description 9
- 239000000186 progesterone Substances 0.000 description 9
- 229960003387 progesterone Drugs 0.000 description 9
- 230000004043 responsiveness Effects 0.000 description 9
- 239000000243 solution Substances 0.000 description 9
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 8
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 8
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 238000000684 flow cytometry Methods 0.000 description 8
- 238000001727 in vivo Methods 0.000 description 8
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 238000000235 small-angle X-ray scattering Methods 0.000 description 8
- 108020004414 DNA Proteins 0.000 description 7
- 241000588724 Escherichia coli Species 0.000 description 7
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 7
- 102000052812 Ornithine decarboxylases Human genes 0.000 description 7
- 108700005126 Ornithine decarboxylases Proteins 0.000 description 7
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 7
- 241000700605 Viruses Species 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 230000008045 co-localization Effects 0.000 description 7
- 229930182833 estradiol Natural products 0.000 description 7
- 229960005309 estradiol Drugs 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 230000012010 growth Effects 0.000 description 7
- 229940088597 hormone Drugs 0.000 description 7
- 239000005556 hormone Substances 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 108010040168 Bcl-2-Like Protein 11 Proteins 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 101100533701 Rattus norvegicus Smad1 gene Proteins 0.000 description 6
- 210000001744 T-lymphocyte Anatomy 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 239000003446 ligand Substances 0.000 description 6
- 229920000642 polymer Polymers 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 235000004400 serine Nutrition 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 239000011534 wash buffer Substances 0.000 description 6
- 108010016626 Dipeptides Proteins 0.000 description 5
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 5
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 5
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 5
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 5
- 108010090804 Streptavidin Proteins 0.000 description 5
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 5
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 5
- 235000004279 alanine Nutrition 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 238000005119 centrifugation Methods 0.000 description 5
- 230000001276 controlling effect Effects 0.000 description 5
- 229940088598 enzyme Drugs 0.000 description 5
- 230000008863 intramolecular interaction Effects 0.000 description 5
- 239000006166 lysate Substances 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 239000000178 monomer Substances 0.000 description 5
- 238000002887 multiple sequence alignment Methods 0.000 description 5
- 229920001223 polyethylene glycol Polymers 0.000 description 5
- 238000010379 pull-down assay Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 description 5
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 5
- PLQMEXSCSAIXGB-SAXRGWBVSA-N (+)-artemisinic acid Chemical compound C1=C(C)CC[C@H]2[C@H](C)CC[C@@H](C(=C)C(O)=O)[C@H]21 PLQMEXSCSAIXGB-SAXRGWBVSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 101100351811 Caenorhabditis elegans pgal-1 gene Proteins 0.000 description 4
- 108091006146 Channels Proteins 0.000 description 4
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 4
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 4
- 102000004877 Insulin Human genes 0.000 description 4
- 108090001061 Insulin Proteins 0.000 description 4
- 102000043136 MAP kinase family Human genes 0.000 description 4
- 108091054455 MAP kinase family Proteins 0.000 description 4
- 102000038030 PI3Ks Human genes 0.000 description 4
- 108091007960 PI3Ks Proteins 0.000 description 4
- 102000035195 Peptidases Human genes 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 102000001253 Protein Kinase Human genes 0.000 description 4
- 108010028230 Trp-Ser- His-Pro-Gln-Phe-Glu-Lys Proteins 0.000 description 4
- 239000012131 assay buffer Substances 0.000 description 4
- 210000003719 b-lymphocyte Anatomy 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000002983 circular dichroism Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000002425 crystallisation Methods 0.000 description 4
- 230000008025 crystallization Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000004069 differentiation Effects 0.000 description 4
- 238000010790 dilution Methods 0.000 description 4
- 239000012895 dilution Substances 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 229940126864 fibroblast growth factor Drugs 0.000 description 4
- 125000001165 hydrophobic group Chemical group 0.000 description 4
- 210000002865 immune cell Anatomy 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 229940125396 insulin Drugs 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 239000012139 lysis buffer Substances 0.000 description 4
- 238000000569 multi-angle light scattering Methods 0.000 description 4
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 4
- 210000002997 osteoclast Anatomy 0.000 description 4
- 238000012856 packing Methods 0.000 description 4
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 4
- 230000026731 phosphorylation Effects 0.000 description 4
- 238000006366 phosphorylation reaction Methods 0.000 description 4
- 210000001778 pluripotent stem cell Anatomy 0.000 description 4
- 239000013641 positive control Substances 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 108060006633 protein kinase Proteins 0.000 description 4
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 4
- QZAYGJVTTNCVMB-UHFFFAOYSA-N serotonin Chemical compound C1=C(O)C=C2C(CCN)=CNC2=C1 QZAYGJVTTNCVMB-UHFFFAOYSA-N 0.000 description 4
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 4
- 230000007730 Akt signaling Effects 0.000 description 3
- 102000001765 Bcl-2-Like Protein 11 Human genes 0.000 description 3
- 101150023944 CXCR5 gene Proteins 0.000 description 3
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 3
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 description 3
- 108010049207 Death Domain Receptors Proteins 0.000 description 3
- 102000009058 Death Domain Receptors Human genes 0.000 description 3
- 102000001301 EGF receptor Human genes 0.000 description 3
- 108060006698 EGF receptor Proteins 0.000 description 3
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 description 3
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 description 3
- 230000004163 JAK-STAT signaling pathway Effects 0.000 description 3
- 150000008575 L-amino acids Chemical class 0.000 description 3
- 241001529936 Murinae Species 0.000 description 3
- 108700005078 Synthetic Genes Proteins 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 108090000190 Thrombin Proteins 0.000 description 3
- 230000029936 alkylation Effects 0.000 description 3
- 238000005804 alkylation reaction Methods 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 229940088710 antibiotic agent Drugs 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 3
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 3
- 230000003376 axonal effect Effects 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 230000008827 biological function Effects 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000002860 competitive effect Effects 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000000593 degrading effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000010494 dissociation reaction Methods 0.000 description 3
- 230000005593 dissociations Effects 0.000 description 3
- 229940011871 estrogen Drugs 0.000 description 3
- 239000000262 estrogen Substances 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 125000000524 functional group Chemical group 0.000 description 3
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 3
- 230000011132 hemopoiesis Effects 0.000 description 3
- 102000034345 heterotrimeric G proteins Human genes 0.000 description 3
- 108091006093 heterotrimeric G proteins Proteins 0.000 description 3
- 210000000987 immune system Anatomy 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000029226 lipidation Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000011987 methylation Effects 0.000 description 3
- 238000007069 methylation reaction Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000006337 proteolytic cleavage Effects 0.000 description 3
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 3
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 229960000268 spectinomycin Drugs 0.000 description 3
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 3
- 238000003756 stirring Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 230000035322 succinylation Effects 0.000 description 3
- 238000010613 succinylation reaction Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 239000007222 ypd medium Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- GRWCNLYJHUHBOD-XVSDJDOKSA-N 2-hydroxyethylazanium;(5z,8z,11z,14z)-icosa-5,8,11,14-tetraenoate Chemical compound [NH3+]CCO.CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC([O-])=O GRWCNLYJHUHBOD-XVSDJDOKSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 208000024827 Alzheimer disease Diseases 0.000 description 2
- 102100022014 Angiopoietin-1 receptor Human genes 0.000 description 2
- 101100350750 Arabidopsis thaliana PAH2 gene Proteins 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 208000034628 Celiac artery compression syndrome Diseases 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 206010051392 Diapedesis Diseases 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 230000006782 ER associated degradation Effects 0.000 description 2
- 102100030013 Endoribonuclease Human genes 0.000 description 2
- 101710199605 Endoribonuclease Proteins 0.000 description 2
- 108010092674 Enkephalins Proteins 0.000 description 2
- 101150064015 FAS gene Proteins 0.000 description 2
- 102000001267 GSK3 Human genes 0.000 description 2
- 108060006662 GSK3 Proteins 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 2
- 108060005986 Granzyme Proteins 0.000 description 2
- 102000001398 Granzyme Human genes 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- 101150009006 HIS3 gene Proteins 0.000 description 2
- NTYJJOPFIAHURM-UHFFFAOYSA-N Histamine Chemical compound NCCC1=CN=CN1 NTYJJOPFIAHURM-UHFFFAOYSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000753291 Homo sapiens Angiopoietin-1 receptor Proteins 0.000 description 2
- 101000971171 Homo sapiens Apoptosis regulator Bcl-2 Proteins 0.000 description 2
- 101000611023 Homo sapiens Tumor necrosis factor receptor superfamily member 6 Proteins 0.000 description 2
- 102100037852 Insulin-like growth factor I Human genes 0.000 description 2
- 102000014150 Interferons Human genes 0.000 description 2
- 108010050904 Interferons Proteins 0.000 description 2
- 102000000588 Interleukin-2 Human genes 0.000 description 2
- 108010002350 Interleukin-2 Proteins 0.000 description 2
- 102000004889 Interleukin-6 Human genes 0.000 description 2
- 108090001005 Interleukin-6 Proteins 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- URLZCHNOLZSCCA-VABKMULXSA-N Leu-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 URLZCHNOLZSCCA-VABKMULXSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 101001041236 Mus musculus Ornithine decarboxylase Proteins 0.000 description 2
- 102000014415 Muscarinic acetylcholine receptor Human genes 0.000 description 2
- 108050003473 Muscarinic acetylcholine receptor Proteins 0.000 description 2
- 230000005913 Notch signaling pathway Effects 0.000 description 2
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 2
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 2
- 108090000430 Phosphatidylinositol 3-kinases Proteins 0.000 description 2
- 101100029356 Pichia angusta PEX5 gene Proteins 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- 102000014128 RANK Ligand Human genes 0.000 description 2
- 108010025832 RANK Ligand Proteins 0.000 description 2
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 101710113029 Serine/threonine-protein kinase Proteins 0.000 description 2
- 239000012505 Superdex™ Substances 0.000 description 2
- 230000006044 T cell activation Effects 0.000 description 2
- 239000006180 TBST buffer Substances 0.000 description 2
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 2
- 102000002689 Toll-like receptor Human genes 0.000 description 2
- 108020000411 Toll-like receptor Proteins 0.000 description 2
- 108010009583 Transforming Growth Factors Proteins 0.000 description 2
- 102000009618 Transforming Growth Factors Human genes 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- 108060008683 Tumor Necrosis Factor Receptor Proteins 0.000 description 2
- 102100024584 Tumor necrosis factor ligand superfamily member 12 Human genes 0.000 description 2
- 101710097155 Tumor necrosis factor ligand superfamily member 12 Proteins 0.000 description 2
- 102100040403 Tumor necrosis factor receptor superfamily member 6 Human genes 0.000 description 2
- 101150103933 VMAC gene Proteins 0.000 description 2
- 241000545067 Venus Species 0.000 description 2
- 230000004156 Wnt signaling pathway Effects 0.000 description 2
- 241000269370 Xenopus <genus> Species 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- POJWUDADGALRAB-UHFFFAOYSA-N allantoin Chemical compound NC(=O)NC1NC(=O)NC1=O POJWUDADGALRAB-UHFFFAOYSA-N 0.000 description 2
- 239000003098 androgen Substances 0.000 description 2
- 230000033115 angiogenesis Effects 0.000 description 2
- 230000000844 anti-bacterial effect Effects 0.000 description 2
- 230000030741 antigen processing and presentation Effects 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 239000002246 antineoplastic agent Substances 0.000 description 2
- 230000001640 apoptogenic effect Effects 0.000 description 2
- 230000005775 apoptotic pathway Effects 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- KBZOIRJILGZLEJ-LGYYRGKSSA-N argipressin Chemical compound C([C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSC[C@@H](C(N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)=O)N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(N)=O)C1=CC=CC=C1 KBZOIRJILGZLEJ-LGYYRGKSSA-N 0.000 description 2
- LZMOBPWDHUQTKL-RWMBFGLXSA-N artemisinic acid Natural products CC1=C[C@@H]2[C@@H](CCC[C@H]2C(=C)C(=O)O)CC1 LZMOBPWDHUQTKL-RWMBFGLXSA-N 0.000 description 2
- PLQMEXSCSAIXGB-UHFFFAOYSA-N artemisininic acid Natural products C1=C(C)CCC2C(C)CCC(C(=C)C(O)=O)C21 PLQMEXSCSAIXGB-UHFFFAOYSA-N 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000000035 biogenic effect Effects 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 230000008512 biological response Effects 0.000 description 2
- 230000001851 biosynthetic effect Effects 0.000 description 2
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 2
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 2
- 229960003669 carbenicillin Drugs 0.000 description 2
- 230000024245 cell differentiation Effects 0.000 description 2
- 229940044683 chemotherapy drug Drugs 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 230000015271 coagulation Effects 0.000 description 2
- 238000005345 coagulation Methods 0.000 description 2
- 230000001447 compensatory effect Effects 0.000 description 2
- 230000008876 conformational transition Effects 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 230000000368 destabilizing effect Effects 0.000 description 2
- 239000008121 dextrose Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 210000003038 endothelium Anatomy 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000002523 gelfiltration Methods 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 210000003714 granulocyte Anatomy 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 210000002443 helper t lymphocyte Anatomy 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000007654 immersion Methods 0.000 description 2
- 230000002519 immonomodulatory effect Effects 0.000 description 2
- 230000005934 immune activation Effects 0.000 description 2
- 230000008629 immune suppression Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000006882 induction of apoptosis Effects 0.000 description 2
- 208000027866 inflammatory disease Diseases 0.000 description 2
- 206010022000 influenza Diseases 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 102000006495 integrins Human genes 0.000 description 2
- 108010044426 integrins Proteins 0.000 description 2
- 229940079322 interferon Drugs 0.000 description 2
- 230000009878 intermolecular interaction Effects 0.000 description 2
- ZXEKIIBDNHEJCQ-UHFFFAOYSA-N isobutanol Chemical compound CC(C)CO ZXEKIIBDNHEJCQ-UHFFFAOYSA-N 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 210000003712 lysosome Anatomy 0.000 description 2
- 230000001868 lysosomic effect Effects 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- NFVJNJQRWPQVOA-UHFFFAOYSA-N n-[2-chloro-5-(trifluoromethyl)phenyl]-2-[3-(4-ethyl-5-ethylsulfanyl-1,2,4-triazol-3-yl)piperidin-1-yl]acetamide Chemical compound CCN1C(SCC)=NN=C1C1CN(CC(=O)NC=2C(=CC=C(C=2)C(F)(F)F)Cl)CCC1 NFVJNJQRWPQVOA-UHFFFAOYSA-N 0.000 description 2
- 210000000822 natural killer cell Anatomy 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N nickel Substances [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 230000009635 nitrosylation Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000020477 pH reduction Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 229930001119 polyketide Natural products 0.000 description 2
- 150000003881 polyketide derivatives Chemical class 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 230000000770 proinflammatory effect Effects 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 230000004063 proteosomal degradation Effects 0.000 description 2
- 235000007682 pyridoxal 5'-phosphate Nutrition 0.000 description 2
- 239000011589 pyridoxal 5'-phosphate Substances 0.000 description 2
- RADKZDMFGJYCBB-UHFFFAOYSA-N pyridoxal hydrochloride Natural products CC1=NC=C(CO)C(C=O)=C1O RADKZDMFGJYCBB-UHFFFAOYSA-N 0.000 description 2
- 229960001327 pyridoxal phosphate Drugs 0.000 description 2
- 102000027426 receptor tyrosine kinases Human genes 0.000 description 2
- 108091008598 receptor tyrosine kinases Proteins 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 206010039073 rheumatoid arthritis Diseases 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 238000009738 saturating Methods 0.000 description 2
- 230000008684 selective degradation Effects 0.000 description 2
- 238000002922 simulated annealing Methods 0.000 description 2
- 238000001542 size-exclusion chromatography Methods 0.000 description 2
- 235000020183 skimmed milk Nutrition 0.000 description 2
- 230000008410 smoothened signaling pathway Effects 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 150000003505 terpenes Chemical class 0.000 description 2
- 235000007586 terpenes Nutrition 0.000 description 2
- 235000019157 thiamine Nutrition 0.000 description 2
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 2
- 229960003495 thiamine Drugs 0.000 description 2
- 239000011721 thiamine Substances 0.000 description 2
- 229960004072 thrombin Drugs 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004102 tricarboxylic acid cycle Effects 0.000 description 2
- 102000003298 tumor necrosis factor receptor Human genes 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 235000019158 vitamin B6 Nutrition 0.000 description 2
- 239000011726 vitamin B6 Substances 0.000 description 2
- 229940011671 vitamin b6 Drugs 0.000 description 2
- OGNSCSPNOLGXSM-UHFFFAOYSA-N (+/-)-DABA Natural products NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 1
- SNICXCGAKADSCV-JTQLQIEISA-N (-)-Nicotine Chemical compound CN1CCC[C@H]1C1=CC=CN=C1 SNICXCGAKADSCV-JTQLQIEISA-N 0.000 description 1
- WTFXTQVDAKGDEY-UHFFFAOYSA-N (-)-chorismic acid Natural products OC1C=CC(C(O)=O)=CC1OC(=C)C(O)=O WTFXTQVDAKGDEY-UHFFFAOYSA-N 0.000 description 1
- SFLSHLFXELFNJZ-QMMMGPOBSA-N (-)-norepinephrine Chemical compound NC[C@H](O)C1=CC=C(O)C(O)=C1 SFLSHLFXELFNJZ-QMMMGPOBSA-N 0.000 description 1
- JARGNLJYKBUKSJ-KGZKBUQUSA-N (2r)-2-amino-5-[[(2r)-1-(carboxymethylamino)-3-hydroxy-1-oxopropan-2-yl]amino]-5-oxopentanoic acid;hydrobromide Chemical compound Br.OC(=O)[C@H](N)CCC(=O)N[C@H](CO)C(=O)NCC(O)=O JARGNLJYKBUKSJ-KGZKBUQUSA-N 0.000 description 1
- KUHSEZKIEJYEHN-BXRBKJIMSA-N (2s)-2-amino-3-hydroxypropanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.OC[C@H](N)C(O)=O KUHSEZKIEJYEHN-BXRBKJIMSA-N 0.000 description 1
- MSTNYGQPCMXVAQ-RYUDHWBXSA-N (6S)-5,6,7,8-tetrahydrofolic acid Chemical compound C([C@H]1CNC=2N=C(NC(=O)C=2N1)N)NC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 MSTNYGQPCMXVAQ-RYUDHWBXSA-N 0.000 description 1
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 1
- UCTWMZQNUQWSLP-VIFPVBQESA-N (R)-adrenaline Chemical compound CNC[C@H](O)C1=CC=C(O)C(O)=C1 UCTWMZQNUQWSLP-VIFPVBQESA-N 0.000 description 1
- 229930182837 (R)-adrenaline Natural products 0.000 description 1
- PHIQHXFUZVPYII-ZCFIWIBFSA-N (R)-carnitine Chemical compound C[N+](C)(C)C[C@H](O)CC([O-])=O PHIQHXFUZVPYII-ZCFIWIBFSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- YUTUUOJFXIMELV-UHFFFAOYSA-N 2-Hydroxy-2-(2-methoxy-2-oxoethyl)butanedioic acid Chemical compound COC(=O)CC(O)(C(O)=O)CC(O)=O YUTUUOJFXIMELV-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- PQDRWMYDXMMMBP-UHFFFAOYSA-N 2-oxoicosanoic acid Chemical compound CCCCCCCCCCCCCCCCCCC(=O)C(O)=O PQDRWMYDXMMMBP-UHFFFAOYSA-N 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- 102100036009 5'-AMP-activated protein kinase catalytic subunit alpha-2 Human genes 0.000 description 1
- PQGCEDQWHSBAJP-TXICZTDVSA-N 5-O-phosphono-alpha-D-ribofuranosyl diphosphate Chemical compound O[C@H]1[C@@H](O)[C@@H](O[P@](O)(=O)OP(O)(O)=O)O[C@@H]1COP(O)(O)=O PQGCEDQWHSBAJP-TXICZTDVSA-N 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- 101150028668 APO1 gene Proteins 0.000 description 1
- 230000002407 ATP formation Effects 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 102000005606 Activins Human genes 0.000 description 1
- 108010059616 Activins Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- POJWUDADGALRAB-PVQJCKRUSA-N Allantoin Natural products NC(=O)N[C@@H]1NC(=O)NC1=O POJWUDADGALRAB-PVQJCKRUSA-N 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 108010043324 Amyloid Precursor Protein Secretases Proteins 0.000 description 1
- 102000002659 Amyloid Precursor Protein Secretases Human genes 0.000 description 1
- 102000009091 Amyloidogenic Proteins Human genes 0.000 description 1
- 108010048112 Amyloidogenic Proteins Proteins 0.000 description 1
- 102000009840 Angiopoietins Human genes 0.000 description 1
- 108010009906 Angiopoietins Proteins 0.000 description 1
- 102400000345 Angiotensin-2 Human genes 0.000 description 1
- 101800000733 Angiotensin-2 Proteins 0.000 description 1
- 101100107610 Arabidopsis thaliana ABCF4 gene Proteins 0.000 description 1
- 101710117251 Aurein-1.2 Proteins 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 108091008875 B cell receptors Proteins 0.000 description 1
- 230000003844 B-cell-activation Effects 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 108010023063 Bacto-peptone Proteins 0.000 description 1
- 102000000806 Basic-Leucine Zipper Transcription Factors Human genes 0.000 description 1
- 108010001572 Basic-Leucine Zipper Transcription Factors Proteins 0.000 description 1
- 108091071247 Beta family Proteins 0.000 description 1
- 102100040794 Beta-1 adrenergic receptor Human genes 0.000 description 1
- 102100039705 Beta-2 adrenergic receptor Human genes 0.000 description 1
- 102100034159 Beta-3 adrenergic receptor Human genes 0.000 description 1
- 102000015735 Beta-catenin Human genes 0.000 description 1
- 108060000903 Beta-catenin Proteins 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- 102000007350 Bone Morphogenetic Proteins Human genes 0.000 description 1
- 108010007726 Bone Morphogenetic Proteins Proteins 0.000 description 1
- OBMZMSLWNNWEJA-XNCRXQDQSA-N C1=CC=2C(C[C@@H]3NC(=O)[C@@H](NC(=O)[C@H](NC(=O)N(CC#CCN(CCCC[C@H](NC(=O)[C@@H](CC4=CC=CC=C4)NC3=O)C(=O)N)CC=C)NC(=O)[C@@H](N)C)CC3=CNC4=C3C=CC=C4)C)=CNC=2C=C1 Chemical compound C1=CC=2C(C[C@@H]3NC(=O)[C@@H](NC(=O)[C@H](NC(=O)N(CC#CCN(CCCC[C@H](NC(=O)[C@@H](CC4=CC=CC=C4)NC3=O)C(=O)N)CC=C)NC(=O)[C@@H](N)C)CC3=CNC4=C3C=CC=C4)C)=CNC=2C=C1 OBMZMSLWNNWEJA-XNCRXQDQSA-N 0.000 description 1
- 210000001239 CD8-positive, alpha-beta cytotoxic T lymphocyte Anatomy 0.000 description 1
- 108060001826 COP1 Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 102000000905 Cadherin Human genes 0.000 description 1
- 108050007957 Cadherin Proteins 0.000 description 1
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 102100025634 Caspase recruitment domain-containing protein 16 Human genes 0.000 description 1
- 102000011727 Caspases Human genes 0.000 description 1
- 108010076667 Caspases Proteins 0.000 description 1
- 102000005600 Cathepsins Human genes 0.000 description 1
- 108010084457 Cathepsins Proteins 0.000 description 1
- 108050004290 Cecropin Proteins 0.000 description 1
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 1
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 1
- 102000009410 Chemokine receptor Human genes 0.000 description 1
- 108050000299 Chemokine receptor Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- HCVBQXINVUFVCE-UHFFFAOYSA-N Citronensaeure-beta-methylester Natural products COC(=O)C(O)(CC(O)=O)CC(O)=O HCVBQXINVUFVCE-UHFFFAOYSA-N 0.000 description 1
- 101710141307 Citropin-1.1 Proteins 0.000 description 1
- 108010060434 Co-Repressor Proteins Proteins 0.000 description 1
- 102000008169 Co-Repressor Proteins Human genes 0.000 description 1
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 1
- 108010056643 Corticotropin-Releasing Hormone Receptors Proteins 0.000 description 1
- 102100038018 Corticotropin-releasing factor receptor 1 Human genes 0.000 description 1
- 102000006311 Cyclin D1 Human genes 0.000 description 1
- 108010058546 Cyclin D1 Proteins 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000022963 DNA damage response, signal transduction by p53 class mediator Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- 108700022150 Designed Ankyrin Repeat Proteins Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 102000015554 Dopamine receptor Human genes 0.000 description 1
- 108050004812 Dopamine receptor Proteins 0.000 description 1
- 101100179813 Drosophila melanogaster Actbeta gene Proteins 0.000 description 1
- 102000012199 E3 ubiquitin-protein ligase Mdm2 Human genes 0.000 description 1
- 108050002772 E3 ubiquitin-protein ligase Mdm2 Proteins 0.000 description 1
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 1
- 108050009340 Endothelin Proteins 0.000 description 1
- 102000002045 Endothelin Human genes 0.000 description 1
- 241000709661 Enterovirus Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010007457 Extracellular Signal-Regulated MAP Kinases Proteins 0.000 description 1
- LLQPHQFNMLZJMP-UHFFFAOYSA-N Fentrazamide Chemical compound N1=NN(C=2C(=CC=CC=2)Cl)C(=O)N1C(=O)N(CC)C1CCCCC1 LLQPHQFNMLZJMP-UHFFFAOYSA-N 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 102000017934 GABA-B receptor Human genes 0.000 description 1
- 108060003377 GABA-B receptor Proteins 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 102100033851 Gonadotropin-releasing hormone receptor Human genes 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 102000003834 Histamine H1 Receptors Human genes 0.000 description 1
- 108090000110 Histamine H1 Receptors Proteins 0.000 description 1
- 102000003710 Histamine H2 Receptors Human genes 0.000 description 1
- 108090000050 Histamine H2 Receptors Proteins 0.000 description 1
- 102100038970 Histone-lysine N-methyltransferase EZH2 Human genes 0.000 description 1
- 102100032742 Histone-lysine N-methyltransferase SETD2 Human genes 0.000 description 1
- 101000783681 Homo sapiens 5'-AMP-activated protein kinase catalytic subunit alpha-2 Proteins 0.000 description 1
- 101000882127 Homo sapiens Histone-lysine N-methyltransferase EZH2 Proteins 0.000 description 1
- 101000654725 Homo sapiens Histone-lysine N-methyltransferase SETD2 Proteins 0.000 description 1
- 101000852870 Homo sapiens Interferon alpha/beta receptor 1 Proteins 0.000 description 1
- 101001008919 Homo sapiens Kallikrein-10 Proteins 0.000 description 1
- 101001045824 Homo sapiens Kelch-like protein 3 Proteins 0.000 description 1
- 101000603420 Homo sapiens Nuclear pore complex-interacting protein family member A1 Proteins 0.000 description 1
- 101000974356 Homo sapiens Nuclear receptor coactivator 3 Proteins 0.000 description 1
- 101001059454 Homo sapiens Serine/threonine-protein kinase MARK2 Proteins 0.000 description 1
- 101000642268 Homo sapiens Speckle-type POZ protein Proteins 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- CZGUSIXMZVURDU-JZXHSEFVSA-N Ile(5)-angiotensin II Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=[NH2+])NC(=O)[C@@H]([NH3+])CC([O-])=O)C(C)C)C1=CC=C(O)C=C1 CZGUSIXMZVURDU-JZXHSEFVSA-N 0.000 description 1
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 1
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 1
- 102000013463 Immunoglobulin Light Chains Human genes 0.000 description 1
- 108010065825 Immunoglobulin Light Chains Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 206010022489 Insulin Resistance Diseases 0.000 description 1
- 102100036714 Interferon alpha/beta receptor 1 Human genes 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 102000006541 Ionotropic Glutamate Receptors Human genes 0.000 description 1
- 108010008812 Ionotropic Glutamate Receptors Proteins 0.000 description 1
- 208000012659 Joint disease Diseases 0.000 description 1
- 102100027613 Kallikrein-10 Human genes 0.000 description 1
- 102100022101 Kelch-like protein 3 Human genes 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- 108010021290 LHRH Receptors Proteins 0.000 description 1
- 108090000543 Ligand-Gated Ion Channels Proteins 0.000 description 1
- 102000004086 Ligand-Gated Ion Channels Human genes 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 102100025169 Max-binding protein MNT Human genes 0.000 description 1
- 108010036176 Melitten Proteins 0.000 description 1
- 108091006372 Metabotropic glutamate receptors group I Proteins 0.000 description 1
- 108091006371 Metabotropic glutamate receptors group II Proteins 0.000 description 1
- 108091006373 Metabotropic glutamate receptors group III Proteins 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 102100024193 Mitogen-activated protein kinase 1 Human genes 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- MSFSPUZXLOGKHJ-UHFFFAOYSA-N Muraminsaeure Natural products OC(=O)C(C)OC1C(N)C(O)OC(CO)C1O MSFSPUZXLOGKHJ-UHFFFAOYSA-N 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 1
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 1
- 206010028851 Necrosis Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 102000019315 Nicotinic acetylcholine receptors Human genes 0.000 description 1
- 108050006807 Nicotinic acetylcholine receptors Proteins 0.000 description 1
- 102100029438 Nitric oxide synthase, inducible Human genes 0.000 description 1
- 101710089543 Nitric oxide synthase, inducible Proteins 0.000 description 1
- XOJVVFBFDXDTEG-UHFFFAOYSA-N Norphytane Natural products CC(C)CCCC(C)CCCC(C)CCCC(C)C XOJVVFBFDXDTEG-UHFFFAOYSA-N 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 102100038845 Nuclear pore complex-interacting protein family member A1 Human genes 0.000 description 1
- 102100022883 Nuclear receptor coactivator 3 Human genes 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 102100028139 Oxytocin receptor Human genes 0.000 description 1
- 108090000876 Oxytocin receptors Proteins 0.000 description 1
- 101800000628 PDH precursor-related peptide Proteins 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 101710176384 Peptide 1 Proteins 0.000 description 1
- 108010013639 Peptidoglycan Proteins 0.000 description 1
- BHHGXPLMPWCGHP-UHFFFAOYSA-N Phenethylamine Chemical compound NCCC1=CC=CC=C1 BHHGXPLMPWCGHP-UHFFFAOYSA-N 0.000 description 1
- 102000003993 Phosphatidylinositol 3-kinases Human genes 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 241000425347 Phyla <beetle> Species 0.000 description 1
- 102100038124 Plasminogen Human genes 0.000 description 1
- 108010051456 Plasminogen Proteins 0.000 description 1
- 229920002556 Polyethylene Glycol 300 Polymers 0.000 description 1
- 229920002562 Polyethylene Glycol 3350 Polymers 0.000 description 1
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 1
- 108010030975 Polyketide Synthases Proteins 0.000 description 1
- 102000015499 Presenilins Human genes 0.000 description 1
- 108010050254 Presenilins Proteins 0.000 description 1
- 108010069820 Pro-Opiomelanocortin Proteins 0.000 description 1
- 239000000683 Pro-Opiomelanocortin Substances 0.000 description 1
- 102100027467 Pro-opiomelanocortin Human genes 0.000 description 1
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-M Propionate Chemical compound CCC([O-])=O XBDQKXXYIPTUBI-UHFFFAOYSA-M 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 108091008611 Protein Kinase B Proteins 0.000 description 1
- 101710192597 Protein map Proteins 0.000 description 1
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 1
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 1
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 1
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 description 1
- 102000017143 RNA Polymerase I Human genes 0.000 description 1
- 108010013845 RNA Polymerase I Proteins 0.000 description 1
- 230000010799 Receptor Interactions Effects 0.000 description 1
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 1
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 1
- 108091007354 SIAHs Proteins 0.000 description 1
- 101100068078 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GCN4 gene Proteins 0.000 description 1
- 101710204410 Scaffold protein Proteins 0.000 description 1
- 102100028904 Serine/threonine-protein kinase MARK2 Human genes 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 102100036422 Speckle-type POZ protein Human genes 0.000 description 1
- 235000019892 Stellar Nutrition 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 230000024932 T cell mediated immunity Effects 0.000 description 1
- 230000006052 T cell proliferation Effects 0.000 description 1
- 108010076818 TEV protease Proteins 0.000 description 1
- 108010065917 TOR Serine-Threonine Kinases Proteins 0.000 description 1
- 102000013530 TOR Serine-Threonine Kinases Human genes 0.000 description 1
- 101710165174 Temporin-1Lb Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 102000004852 Thyrotropin-releasing hormone receptors Human genes 0.000 description 1
- 108090001094 Thyrotropin-releasing hormone receptors Proteins 0.000 description 1
- 230000028980 Toll signaling pathway Effects 0.000 description 1
- 108091032917 Transfer-messenger RNA Proteins 0.000 description 1
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 1
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 1
- GXBMIBRIOWHPDT-UHFFFAOYSA-N Vasopressin Natural products N1C(=O)C(CC=2C=C(O)C=CC=2)NC(=O)C(N)CSSCC(C(=O)N2C(CCC2)C(=O)NC(CCCN=C(N)N)C(=O)NCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(CCC(N)=O)NC(=O)C1CC1=CC=CC=C1 GXBMIBRIOWHPDT-UHFFFAOYSA-N 0.000 description 1
- 108010004977 Vasopressins Proteins 0.000 description 1
- 102000002852 Vasopressins Human genes 0.000 description 1
- 101000776133 Viola hederacea Leaf cyclotide 1 Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 229930003316 Vitamin D Natural products 0.000 description 1
- QYSXJUFSXHHAJI-XFEUOLMDSA-N Vitamin D3 Natural products C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C/C=C1\C[C@@H](O)CCC1=C QYSXJUFSXHHAJI-XFEUOLMDSA-N 0.000 description 1
- 102000013814 Wnt Human genes 0.000 description 1
- 108050003627 Wnt Proteins 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000000370 acceptor Substances 0.000 description 1
- IPBVNPXQWQGGJP-UHFFFAOYSA-N acetic acid phenyl ester Natural products CC(=O)OC1=CC=CC=C1 IPBVNPXQWQGGJP-UHFFFAOYSA-N 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000000488 activin Substances 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 229960001570 ademetionine Drugs 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- OFHCOWSQAMBJIW-AVJTYSNKSA-N alfacalcidol Chemical compound C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C\C=C1\C[C@@H](O)C[C@H](O)C1=C OFHCOWSQAMBJIW-AVJTYSNKSA-N 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 229960000458 allantoin Drugs 0.000 description 1
- 230000003281 allosteric effect Effects 0.000 description 1
- 108090000861 alpha Adrenergic Receptors Proteins 0.000 description 1
- 102000004305 alpha Adrenergic Receptors Human genes 0.000 description 1
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 1
- 229940067621 aminobutyrate Drugs 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 229950006323 angiotensin ii Drugs 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000003110 anti-inflammatory effect Effects 0.000 description 1
- 238000003782 apoptosis assay Methods 0.000 description 1
- 230000009925 apoptotic mechanism Effects 0.000 description 1
- 229940072107 ascorbate Drugs 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000010310 bacterial transformation Effects 0.000 description 1
- 108010014494 beta-1 Adrenergic Receptors Proteins 0.000 description 1
- 108010014499 beta-2 Adrenergic Receptors Proteins 0.000 description 1
- 108010014502 beta-3 Adrenergic Receptors Proteins 0.000 description 1
- 102000000072 beta-Arrestins Human genes 0.000 description 1
- 108010080367 beta-Arrestins Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008236 biological pathway Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 230000006287 biotinylation Effects 0.000 description 1
- 238000007413 biotinylation Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 229940112869 bone morphogenetic protein Drugs 0.000 description 1
- 230000010072 bone remodeling Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- SNPPWIUOZRMYNY-UHFFFAOYSA-N bupropion Chemical compound CC(C)(C)NC(C)C(=O)C1=CC=CC(Cl)=C1 SNPPWIUOZRMYNY-UHFFFAOYSA-N 0.000 description 1
- 229960001058 bupropion Drugs 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 229960004203 carnitine Drugs 0.000 description 1
- 108010046237 cecropin P1-LI Proteins 0.000 description 1
- PRIVBYDFWSFUFP-RJLJEYQFSA-N cecropin p1 Chemical compound O=C([C@H](CCC(N)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](N)CO)[C@@H](C)O)[C@@H](C)CC)[C@@H](C)CC)NCC(=O)NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRIVBYDFWSFUFP-RJLJEYQFSA-N 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000006721 cell death pathway Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000004637 cellular stress Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000013522 chelant Substances 0.000 description 1
- 238000003508 chemical denaturation Methods 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 230000010252 chemokine signaling pathway Effects 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- WTFXTQVDAKGDEY-HTQZYQBOSA-N chorismic acid Chemical compound O[C@@H]1C=CC(C(O)=O)=C[C@H]1OC(=C)C(O)=O WTFXTQVDAKGDEY-HTQZYQBOSA-N 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000001142 circular dichroism spectrum Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- ASARMUCNOOHMLO-WLORSUFZSA-L cobalt(2+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2s)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+2].[N-]([C@@H]1[C@H](CC(N)=O)[C@@]2(C)CCC(=O)NC[C@H](C)OP([O-])(=O)O[C@H]3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)\C2=C(C)/C([C@H](C\2(C)C)CCC(N)=O)=N/C/2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O ASARMUCNOOHMLO-WLORSUFZSA-L 0.000 description 1
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 1
- 239000005516 coenzyme A Substances 0.000 description 1
- 229940093530 coenzyme a Drugs 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000002577 cryoprotective agent Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 230000010250 cytokine signaling pathway Effects 0.000 description 1
- 108091007930 cytoplasmic receptors Proteins 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 1
- 238000004807 desolvation Methods 0.000 description 1
- 230000001687 destabilization Effects 0.000 description 1
- 235000019524 disodium tartrate Nutrition 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008753 endothelial function Effects 0.000 description 1
- ZUBDGKVDJUIMQQ-UBFCDGJISA-N endothelin-1 Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)NC(=O)[C@H]1NC(=O)[C@H](CC=2C=CC=CC=2)NC(=O)[C@@H](CC=2C=CC(O)=CC=2)NC(=O)[C@H](C(C)C)NC(=O)[C@H]2CSSC[C@@H](C(N[C@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N2)=O)NC(=O)[C@@H](CO)NC(=O)[C@H](N)CSSC1)C1=CNC=N1 ZUBDGKVDJUIMQQ-UBFCDGJISA-N 0.000 description 1
- 230000006718 epigenetic regulation Effects 0.000 description 1
- 229960005139 epinephrine Drugs 0.000 description 1
- 210000002304 esc Anatomy 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- 108010044804 gamma-glutamyl-seryl-glycine Proteins 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000007674 genetic toxicity Effects 0.000 description 1
- 231100000025 genetic toxicology Toxicity 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000007946 glucose deprivation Effects 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 108700026078 glutathione trisulfide Proteins 0.000 description 1
- 230000034659 glycolysis Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 229960000789 guanidine hydrochloride Drugs 0.000 description 1
- 150000003278 haem Chemical class 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 239000008241 heterogeneous mixture Substances 0.000 description 1
- 230000017945 hippo signaling cascade Effects 0.000 description 1
- 229960001340 histamine Drugs 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 239000003688 hormone derivative Substances 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 210000005007 innate immune system Anatomy 0.000 description 1
- 239000000077 insect repellent Substances 0.000 description 1
- 230000004155 insulin signaling pathway Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 108091008582 intracellular receptors Proteins 0.000 description 1
- 102000027411 intracellular receptors Human genes 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000003367 kinetic assay Methods 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 230000037356 lipid metabolism Effects 0.000 description 1
- AGBQKNBQESQNJD-UHFFFAOYSA-M lipoate Chemical compound [O-]C(=O)CCCCC1CCSS1 AGBQKNBQESQNJD-UHFFFAOYSA-M 0.000 description 1
- 235000019136 lipoic acid Nutrition 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000001320 lysogenic effect Effects 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- OFIZOVDANLLTQD-ZVNXOKPXSA-N magainin i Chemical compound C([C@H](NC(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 OFIZOVDANLLTQD-ZVNXOKPXSA-N 0.000 description 1
- 240000004308 marijuana Species 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- VDXZNPDIRNWWCW-JFTDCZMZSA-N melittin Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(N)=O)CC1=CNC2=CC=CC=C12 VDXZNPDIRNWWCW-JFTDCZMZSA-N 0.000 description 1
- 230000034217 membrane fusion Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 239000003226 mitogen Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 229950006780 n-acetylglucosamine Drugs 0.000 description 1
- 230000009527 neddylation Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000006654 negative regulation of apoptotic process Effects 0.000 description 1
- 229960002715 nicotine Drugs 0.000 description 1
- SNICXCGAKADSCV-UHFFFAOYSA-N nicotine Natural products CN1CCCC1C1=CC=CN=C1 SNICXCGAKADSCV-UHFFFAOYSA-N 0.000 description 1
- 230000009935 nitrosation Effects 0.000 description 1
- 238000007034 nitrosation reaction Methods 0.000 description 1
- 229960002748 norepinephrine Drugs 0.000 description 1
- SFLSHLFXELFNJZ-UHFFFAOYSA-N norepinephrine Natural products NCC(O)C1=CC=C(O)C(O)=C1 SFLSHLFXELFNJZ-UHFFFAOYSA-N 0.000 description 1
- 108020004017 nuclear receptors Proteins 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 102000002574 p38 Mitogen-Activated Protein Kinases Human genes 0.000 description 1
- 108010068338 p38 Mitogen-Activated Protein Kinases Proteins 0.000 description 1
- 229940014662 pantothenate Drugs 0.000 description 1
- 235000019161 pantothenic acid Nutrition 0.000 description 1
- 239000011713 pantothenic acid Substances 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000006320 pegylation Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 230000004108 pentose phosphate pathway Effects 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000003285 pharmacodynamic effect Effects 0.000 description 1
- DYUMLJSJISTVPV-UHFFFAOYSA-N phenyl propanoate Chemical compound CCC(=O)OC1=CC=CC=C1 DYUMLJSJISTVPV-UHFFFAOYSA-N 0.000 description 1
- 229940049953 phenylacetate Drugs 0.000 description 1
- WLJVXDMOQOGPHL-UHFFFAOYSA-N phenylacetic acid Chemical compound OC(=O)CC1=CC=CC=C1 WLJVXDMOQOGPHL-UHFFFAOYSA-N 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 230000004983 pleiotropic effect Effects 0.000 description 1
- 108700000096 poliovirus 2B Proteins 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 210000004896 polypeptide structure Anatomy 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 210000004986 primary T-cell Anatomy 0.000 description 1
- 230000005522 programmed cell death Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 230000004144 purine metabolism Effects 0.000 description 1
- 230000004147 pyrimidine metabolism Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 102000016914 ras Proteins Human genes 0.000 description 1
- 108010014186 ras Proteins Proteins 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 239000003507 refrigerant Substances 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000009711 regulatory function Effects 0.000 description 1
- 238000005067 remediation Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000011506 response to oxidative stress Effects 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 102000007268 rho GTP-Binding Proteins Human genes 0.000 description 1
- 108010033674 rho GTP-Binding Proteins Proteins 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 108700002783 roundabout Proteins 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000009758 senescence Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000009919 sequestration Effects 0.000 description 1
- 150000003355 serines Chemical class 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- HELHAJAZNSDZJO-OLXYHTOASA-L sodium L-tartrate Chemical compound [Na+].[Na+].[O-]C(=O)[C@H](O)[C@@H](O)C([O-])=O HELHAJAZNSDZJO-OLXYHTOASA-L 0.000 description 1
- IHQKEDIOMGYHEB-UHFFFAOYSA-M sodium dimethylarsinate Chemical compound [Na+].C[As](C)([O-])=O IHQKEDIOMGYHEB-UHFFFAOYSA-M 0.000 description 1
- 239000001433 sodium tartrate Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000001370 static light scattering Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000021966 synaptic vesicle transport Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 239000005460 tetrahydrofolate Substances 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 229960002663 thioctic acid Drugs 0.000 description 1
- 230000009258 tissue cross reactivity Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 102000027257 transmembrane receptors Human genes 0.000 description 1
- 108091008578 transmembrane receptors Proteins 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- DCXXMTOCNZCJGO-UHFFFAOYSA-N tristearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(OC(=O)CCCCCCCCCCCCCCCCC)COC(=O)CCCCCCCCCCCCCCCCC DCXXMTOCNZCJGO-UHFFFAOYSA-N 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000005740 tumor formation Effects 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 230000002476 tumorcidal effect Effects 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
- 230000006663 ubiquitin-proteasome pathway Effects 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 229960003726 vasopressin Drugs 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 235000019166 vitamin D Nutrition 0.000 description 1
- 239000011710 vitamin D Substances 0.000 description 1
- 150000003710 vitamin D derivatives Chemical class 0.000 description 1
- 229940046008 vitamin d Drugs 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002578 wasp venom Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 238000002424 x-ray crystallography Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/001—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof by chemical synthesis
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/06—Linear peptides containing only normal peptide links having 5 to 11 amino acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Peptides Or Proteins (AREA)
Abstract
本文公开的是非自然存在的笼多肽、包括该笼多肽的试剂盒和降解决定子LOCKR及其用途,其中所述笼多肽包括:(a)螺旋束,其包含2至7个α‑螺旋,其中所述螺旋束包括:(i)结构区域;和(ii)闩锁区域,其中所述闩锁区域构成位于所述闩锁区域内的降解决定子,其中所述结构区域与所述闩锁区域相互作用以阻止所述降解决定子的活性;和(b)氨基酸接头,其连接每个α‑螺旋。
Description
交叉引用
本申请要求于2019年1月7日提交的美国临时专利申请序列号62/789351和2019年5月20日提交的美国临时专利申请序列号62850336的优先权,其各自以引用的方式整体并入本文。
联邦资助声明
本发明根据由美国国防部高级研究项目署(Defense Advanced ResearchProjects Agency)授予的批准号HR0011-16-2-0045在政府支持下进行。美国政府享有本发明的一定权利。
对经由EFS-Web电子递交的序列表的引用
与本申请一起提交的ASCII文本文件(名称:18-1783-PCT_Sequence-Listing_ST25.txt;大小:34,384kB kb;以及创建日期:2020年1月6日)中的电子递交的序列表的内容以引用的方式整体并入本文。
背景技术
基于蛋白质折叠成其最低自由能状态的原理,在稳定蛋白质结构的全新设计方面已经取得了相当大的进展。这些努力集中在最大化所需折叠结构与所有其他结构之间的自由能间隙。设计可以转换构象的蛋白质更具挑战性,因为相对于未折叠状态,多个状态必须具有足够低的自由能来填充,并且状态之间的自由能差异必须足够小,以使状态占用率可以通过外部输入来切换。尚未实现在外部输入的存在下转换构象状态的蛋白质系统的全新设计。
发明内容
在一个方面,本公开提供了非天然存在的笼多肽,其包含:
(a)螺旋束,其包含2至7个α-螺旋,其中所述螺旋束包含:
(i)结构区域;和
(ii)闩锁区域,其中所述闩锁区域包含位于所述闩锁区域内的降解决定子,其中所述结构区域与所述闩锁区域相互作用以阻止所述降解决定子的活性;和
(b)氨基酸接头,其连接每个α-螺旋。
在一个实施方式中,闩锁区域在结构区域的C-末端,并且降解决定子位于闩锁区域的C-末端的约100、95、90、85、80、75、70、65、60、55、50、45、40、35、30、25、20、15、10、5、4、3、2、1或0个氨基酸残基内和/或笼多肽的C-末端的约100、95、90、85、80、75、70、65、60、55、50、45、40、35、30、25、20、15、10、5、4、3、2、1或0个氨基酸残基内。
在一个实施方式中,降解决定子包括位于距笼多肽的C-末端的10-30个残基之间的CA二肽;在各种实施方式中,降解决定子包含肽MSCAQES(SEQ ID NO:28468)和/或L(X)MSCAQES(SEQ ID NO:28467),其中X可为任何氨基酸残基,其中X任选地不为脯氨酸。在另一个实施方式中,降解决定子包含选自由以下组成的组中的氨基酸残基或肽
(a)GG;RG;KG;QG;WG;PG;AG;RxxG;EE;R;Rxx;Vx;Ax;A,其中“x”可为任何氨基酸残基,并且其中所述降解决定子在所述闩锁区域的末端的10-30个氨基酸内和/或在所述笼多肽的末端的10-30个氨基酸内;
(b)募集泛素连接酶的氨基酸残基或肽,所述泛素连接酶泛素化所述笼多肽和/或可操作地连接的功能多肽;
(c)靶向蛋白质水解的嵌合分子(PROTAC);和
(d)本文所述的任何其他降解决定子。
在另一个实施方式中,闩锁区域在结构区域的N-末端,并且其中降解决定子位于闩锁区域的N-末端的约100、95、90、85、80、75、70、65、60、55、50、45、40、35、30、25、20、15、10、5、4、3、2、1或0个氨基酸残基内和/或笼多肽的N-末端的约100、95、90、85、80、75、70、65、60、55、50、45、40、35、30、25、20、15、10、5、4、3、2、1或0个氨基酸残基内。
在其他实施方式中,降解决定子包含选自由以下组成的组中的肽(括号内的残基为任选的):
[[KTRGVEEVAEGVVLL]]RRRG[[NK(FAM)KKK]](SEQ ID NO:28469);
[[KPFLNGGPY]]HSREQSTDSG[[LGLGSYK(FAM)KKK]](SEQ ID NO:28470);
ASADLDLEALAPYIPADDDFQLRK(FAM)KKK(SEQ ID NO:28471);
[[K-(PEG)-KEEK]]DINNN[[VKKTK(FAM)KKK]](SEQ ID NO:28472);
[[K-(PEG)]]DVQKADVSST[[GQGIDSK(FAM)KKK]](SEQ ID NO:28487);
KAAEEEEVSLASTPTDVRDVDIK(FAM)KKK(SEQ ID NO:28473);
[[KKYSSQTSQ]]DSGNYS[[NK(FAM)KKK]](SEQ ID NO:28474);
KPLSSSVPSQKTYQGSYGFRLGK(FAM)KKK(SEQ ID NO:28475);
[[KAWQQQSYL]]DSGIHSG[[ATTTAPK(FAM)KKK]](SEQ ID NO:28476);
[[KTRGVEEVAEGVVLL]]RRRG[[NKKKK]](SEQ ID NO:28488);
[[KPFLNGGPY]]HSREQSTDSG[[LGLGSYKKKK]](SEQ ID NO:28489);
ASADLDLEALAPYIPADDDFQLRKKKK(SEQ ID NO:28490);
[[KKEEK]]DINNN[[VKKTKKKK]](SEQ ID NO:28491);
[[K]]DVQKADVSST[[GQGIDSKKKK]](SEQ ID NO:28492);
KAAEEEEVSLASTPTDVRDVDIKKKK(SEQ ID NO:28493);
[[KKYSSQTSQ]]DSGNYS[[NKKKK]](SEQ ID NO:28494);
KPLSSSVPSQKTYQGSYGFRLGKKKK(SEQ ID NO:28495);
[[KAWQQQSYL]]DSGIHSG[[ATTTAPKKKK]](SEQ ID NO:28496);
RRRG(SEQ ID NO:28497);
HSREQSTDSG(SEQ ID NO:28498);
DINNN(SEQ ID NO:28499);
DVQKADVSST(SEQ ID NO:28500);
DSGNYS(SEQ ID NO:28501);和
DSGIHSG(SEQ ID NO:28502)。
在另一个实施方式中,笼多肽还包含一个或多个功能多肽结构域。在各种实施方式中,一个或多个功能多肽结构域可位于笼多肽的与闩锁区域相同的末端或不同的末端。在一个实施方式中,一个或多个功能多肽结构域位于笼多肽的N-末端,并且闩锁区域位于结构区域的C-末端。在另一个实施方式中,一个或多个功能多肽结构域位于笼多肽的C-末端,并且闩锁区域位于结构区域的N-末端。在另一个实施方式中,闩锁区域包含除降解决定子之外的一种或多种额外生物活性肽,其中结构区域与闩锁区域相互作用以阻止一种或多种额外生物活性肽的活性。
在一个实施方式中,笼多肽包含沿着选自由以下组成的组中的笼多肽的氨基酸序列的全长在不包括任选的残基的情况下具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列:(a)SEQ ID NO:27359-28465或表7中列出的笼多肽(在(a)实施方式中,降解决定子包括在多肽序列中);和(b)SEQ ID NO:1-49、51-52、54-59、61、65、67-91、92-2033、SEQ ID NO:2034-14317、27094-27117、27120-27125、27278至27321和表2(在SEQ ID NO:27126与27276之间偶数编号的SEQ ID NO的多肽)、表3和/或表4中列出的笼多肽(即,在(b)实施方式中,降解决定子不包括在氨基酸序列中且将添加在闩锁区域内,包括但不限于本文所公开的那些降解决定子氨基酸序列)。
在另一方面,本公开提供了试剂盒或降解决定子LOCKR开关,其包含:
(a)本文所公开的任何实施方式或实施方式组合的笼多肽;和
(b)钥匙多肽,其能够结合笼多肽结构区域,从而置换闩锁区域并激活一个或多个降解决定子。
在试剂盒或降解决定子LOCKR开关的一个实施方式中,钥匙多肽包含沿着本文所公开的钥匙蛋白;或选自由SEQ ID NO:26602-27050和27322至27358和28477-28486组成的组中的钥匙多肽的氨基酸序列的全长在不包括任选的残基的情况下具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在试剂盒或降解决定子LOCKR开关的另一个实施方式中,笼多肽包含沿着选自由SEQ ID NO:27359-28465或表7中列出的笼多肽组成的组中的氨基酸序列的全长在不包括任选的残基的情况下具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在试剂盒或降解决定子LOCKR开关的另一个实施方式中,一种或多种笼多肽和一种或多种钥匙多肽包含至少一种笼多肽和至少一种钥匙多肽,其包含分别沿着表2、3、4、5、6或7的同一行中的笼多肽和钥匙多肽的全长在不包括任选的残基的情况下具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在各种方面,本公开提供了编码本公开的任何实施方式或实施方式组合的笼多肽的核酸;包含可操作地连接到启动子的核酸的表达载体;试剂盒,其包含:
(a)编码本公开的实施方式或实施方式组合的多肽的一种或多种核酸;和
(b)编码能够结合笼多肽结构区域的一种或多种钥匙多肽的一种或多种核酸;试剂盒包含:
(a)本公开的一种或多种表达载体;和
(b)一种或多种表达载体,其包含编码能够结合笼多肽结构区域的一种或多种钥匙多肽的一种或多种核酸,其中编码一种或多种钥匙多肽的一种或多种核酸可操作地连接到启动子;和包含编码本公开的任何实施方式或实施方式组合的多肽的一种或多种核酸的宿主细胞,和/或本公开的一种或多种表达载体,其任选地还包含能够结合笼多肽结构区域的一种或多种钥匙多肽的一种或多种核酸。在一个实施方式中,编码一种或多种钥匙多肽的一种或多种核酸包含沿着本文所公开的钥匙蛋白或选自SEQ ID NO:26602-27050、27322-27358和28477-28486特别地SEQ ID NO:28477-28486的钥匙多肽的氨基酸序列的全长在不包括任选的残基的情况下具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在试剂盒或宿主细胞的另一个实施方式中,编码任何实施方式或实施方式组合的笼多肽的一种或多种核酸编码以下多肽,其包含沿着选自由SEQ ID NO:27359-28465组成的组中的笼多肽或表7中列出的笼多肽的氨基酸序列的全长在不包括任选的残基的情况下具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在试剂盒和宿主细胞的另一个实施方式中,一种或多种笼多肽和一种或多种钥匙多肽包含至少一种笼多肽和至少一种钥匙多肽,其包含分别沿着表2、3、4、5、6或7,特别是表6或表7的同一行中的笼多肽和钥匙多肽的全长在不包括任选的残基的情况下具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在另一方面,本公开提供了本文所公开的笼多肽、LOCKR开关、核酸、表达载体或宿主细胞螯合笼多肽中的降解决定子直至钥匙被表达并激活所述笼多肽并且所述降解决定子靶向所述笼多肽和与其融合的任何功能多肽以便降解的用途。
附图说明
图1a-1f.LOCKR开关系统的设计。图1a示出了描述我们的设计目标的热力学模型。笼中的结构区域和闩锁区域形成开关,其在打开和关闭状态下具有一定的平衡。钥匙可以结合笼以促进打开状态,从而允许靶标结合到闩锁。图1b示出了来自(a)中的模型的两个KLT值的图,示出了级分靶标结合如何受到添加钥匙的影响(KCK=1nM);不同颜色的曲线示出了K打开=[打开]/[关闭]的对数递减值的效果。图1c示出了将环添加到同三聚体5L6HC3_15以形成单体五螺旋和六螺旋框架;双突变体V217S/I232S削弱了闩锁,使其可以被钥匙置换,从而导致能够结合外源钥匙的LOCKR系统。图1d示出了用氯化胍(Gdm)监测222nM处的平均残基椭圆率(MRE)的化学变性。图1e示出了小角度x射线散射(SAXS),其显示单体框架表现出彼此和原始均三聚体彼此非常一致的光谱。图1f.下拉测定显示钥匙结合到截短的五螺旋框架和LOCKR(V217S/I232S),但未结合到六螺旋单体;经由六组氨酸标签将游离的GFP-钥匙添加到固定在板上的单体框架;在一系列洗涤步骤后,通过GFP荧光测量结合(n=2,误差条表示标准偏差)。
图2a-2d.BimLOCKR设计和活性图2a.通过次优的Bim-笼相互作用(左,显示为改变的疏水性堆积和掩埋的氢键)并通过暴露接口末端处的疏水残基(右)作为托底来调整闩锁-笼接口的自由能。图2b.引入托底允许经由生物层干涉法激活250nM BimLOCKR,并添加5μM钥匙(“开”杆)。图2c.生物层干涉法显示,用250nM BimLOCKR与Bcl2的钥匙依赖性结合。0-500s缔合,然后500-1700s解离。图2d.每个点为拟合I中的数据并提取平衡时的反应的结果。曲线用较短的钥匙显示相似的数据,表明能够调整LOCKR的KCK并影响其激活范围。
图3a-c.正交BimLOCKR的设计和验证。图3a.左:卡通表示的LOCKR。具有叠加的三个不同闩锁的笼和由标记物标记的氢键网络。右:正交LOCKR接口的氢键网络。图3b.在Octet上BimLOCKR响应于其同源钥匙与Bcl2的结合。一次重复。图3c.每个开关(250nM)和钥匙(5μM)对在500秒后Octet上的响应。两次重复的平均值。
图4a-b.实验确定的非对称LOCKR开关设计的X射线晶体结构。图4a.设计1-fix-short-BIM-t0的晶体结构,其含有编码的BIM肽。图4b.设计1fix-short-noBim(AYYA)-t0的晶体结构在(左)骨架、(中间)氢键网络和(右)疏水性堆积方面与设计模型非常一致;示出了将对Bim和Gfp11进行编码的闩锁区域;电子密度图示出了网络和疏水截面(中间和右)。
图5a-d.在没有钥匙的情况下,可以防止分拆式GFP11与GFP1-10互补的LOCKR开关。图5a.示出了具有链11的GFP(pdb 2y0g)的晶体结构。图5b.GFP11稳定为螺旋的原型开关的晶体结构(网格是电子密度)。图5c.计算设计模型以的均方根偏差匹配晶体结构。实验确定设计的LOCKR开关1fix-short-GFP-t0的X射线晶体结构,显示编码的GFP的第11链(GFP11)是α螺旋,并且与设计模型非常一致。图5d.GFP荧光仅在钥匙肽的存在下被观察到,表明所述开关具有功能(在不存在钥匙的情况下为关,并且在存在钥匙的情况下为开)。
图6a-c.来自图4的设计的GFP11-LOCKR开关,调整为共定位依赖性。图6a.测试系统的示意图,其中共定位依赖性由连接的SpycatcherTM/SpytagTM融合控制。在此模型中,当与Spytag融合时,钥匙仅应激活LOCKR开关(产生荧光),这将使钥匙与笼共定位(右)。当单独添加钥匙时,其不应该能够激活LOCKR开关(中间)。图6b-c.荧光数据表明遵循图6a中示意图的设计的LOCKR开关的共定位依赖性。与SpycatcherTM融合的设计1fix-latch和1fix-short在与它们融合到SpytagTM的同源钥匙混合时显示出更多的激活;缺少SpytagTM的钥匙显示出明显较少的激活。
图7a-b.笼式内含肽LOCKR开关。图7a.当与融合到sfGFP和VMAn内含肽的设计的钥匙混合时,带有编码VMAc内含肽的笼组件的设计的LOCKR开关显示成功激活。图7b.SDS-PAGE显示成功的VMAc-VMAn反应,其条带对应于预期的剪接蛋白产物的正确分子量。
图8.多序列比对(MSA),其将原始LOCKR_a笼支架设计与其非对称(1fix-short–noBim(AYYA)-t0)和正交(LOCKRb-f)设计对应物进行比较。在整个MSA中,仅150个(40.8%)位点相同,其中成对同一性%为69.4%。闩锁区域(此MSA中在标记为311的位置处开始的C-末端区域)具有非常小的序列同一性/相似性(自上而下SEQ ID NO:17、39、7、8、9、10、11)。
图9.1fix-short-noBim(AYYA)-t0(图4B)的晶体结构(白色)在用于制备LOCKRa(图1)的基础支架5L6HC3_15(黑色)的x射线晶体结构上的叠加表明,不对称突变(图8MSA中显示的可变位置)不影响蛋白质的三维结构。两种蛋白质之间的骨架RMSD为0.85埃(来自链A之间所有骨架原子的叠加)。
图10:GFP板测定法,用于发现LOCKR的突变。经由6x-His标签将不同的推定LOCKR构建体粘附到Ni涂覆的96孔板,施加钥匙-GFP,并过量洗涤。所得的荧光代表结合到LOCKR构建体的钥匙-GFP。将截短用作阳性对照,因为钥匙结合到开放接口。单体作为阴性对照,因为其不结合钥匙。误差条代表三次重复的标准偏差。
图11a-b:正交LOCKR GFP测定。图11a.在五个重新设计的LOCKR构建体(b至f)中,闩锁从6x-His标记的笼被截短。对应的钥匙被GFP标记。通过笼的Ni下拉并测量所得的GFP荧光来测量钥匙-笼结合。误差条是三次重复的标准偏差。图11b.对每个结合来自(a)的钥匙的完整LOCKR构建体给予九个残基托底,并在GFP下拉测定中测试其与所有四个功能钥匙(a至d)的结合。误差条是五次重复的标准偏差。钥匙a被怀疑是混杂的结合,但不是激活的,因为从同三聚体伪对称产生LOCKR。考虑到来自(a)和图3B的结果,LOCKRb显示未结合到其自身钥匙,这归因于闩锁强度。
图12a-d:设计的Mad1-SID LOCKR开关,用于钥匙依赖性转录抑制。图12a.Mad1-SID结构域(白色)与mSin3A转录阻遏物的PAH2结构域(黑色)之间相互作用的晶体结构(PDBID:1E91)。Mad1-SID结构域的锁定应能够实现转录阻遏物mSin3A的钥匙依赖性募集,从而实现精确的表观遗传调控。图12b.设计的Mad1-LOCKR开关,其笼组件在不同位置(深灰色)处编码Mad1-SID序列。图12c.SDS-PAGE凝胶,其显示成功纯化的1fix_302_Mad1(1)、1fix_309_Mad1(2)和MBP_Mad1(3)。图12d.Mad1-LOCKR开关与纯化的mSin3A-PAH2结构域的钥匙激活结合的生物层干涉分析。MBP-Mad1是mSin3a-PAH2结合的阳性对照。1fix_309_Mad1(309)在与设计的钥匙a混合时显示成功激活。1fix_302_Mad1(302)显示了对Mad1-SID结构域的非常严格的锁定,但在钥匙a的存在下未激活。通过将0.1μg生物素-mSin3A-PAH2蛋白固定在链霉亲和素生物传感器尖端(ForteBio)上进行动力学测定。在存在或不存在500nM钥匙a的情况下,以50nM测试蛋白笼。
图13a-d.笼式STREPII标签LOCKR开关;新的2plus1和3plus1 LOCKR开关的演示。图13a.设计的2+1(左)和3+1(中间)LOCKR开关被设计为编码STREPII序列WSHPQFEK(SEQ IDNO:63)。图13b-d.证明STREPII-LOCKR设计的功能的生物层干涉法(Octet)数据:将抗链霉亲和素抗体固定在抗小鼠FC尖端上,以评估STREPII标签的结合:图13b.设计的蛋白质显示出比阳性对照更少的结合,表明STREPII已按预期至少部分地螯合。图13c.通过3plus1_KEY_3激活设计STREPII-3plus1_Lock_3:曲线为250nM笼,无钥匙,相比之下,在范围从121nM至6000nM的增加浓度的钥匙存在下,为250nM笼。图13d.在370nM、1111nM和3333nM的钥匙存在下的250nM STREPII-3plus1_Lock_3;没有钥匙的250nM笼为250nM,并且其他图为相同浓度(370nM、1111nM和3333nM)但没有笼时的钥匙。在所有Octet图中,左半部分是缔合(结合)步骤,并且右半部分是解离步骤。
图14.3plus1 LOCKR开关响应于钥匙的表达激活GFP荧光。设计了LOCKR开关,其中将3plus1笼用于螯合处于非活性构象的GFP的链11(GFP11),从而防止了分拆式GFP(由GFP1-10和GFP11构成)的重构,从而产生了荧光。制备了表达质粒以诱导表达笼(p15a复制起点、壮观霉素抗性、控制GFP1-10和LOCKR笼式GFP11表达的阿拉伯糖诱导型启动子)和钥匙(colE1复制起点、卡那霉素抗性和IPTG诱导型启动子)。根据制造商的方案,使用单独的笼质粒或使用笼和钥匙质粒两者转化化学活性大肠杆菌Stellar细胞(Takarabio)。将这些转化在补充有壮观霉素(单独的笼)或壮观霉素+卡那霉素(笼和钥匙)的液体LB培养基中于37℃下过夜生长。将所得培养物以1/100稀释到新鲜的LB培养基中,所述LB培养基补充有适当的抗生素和单独的阿拉伯糖(诱导笼和GFP1-10的表达)或阿拉伯糖和IPTG两者(诱导笼、GFP1-10和钥匙的表达),然后使其在37℃下生长16小时。将200uL每种表达培养物在200uLPBS中洗涤一次,重悬于200uL PBS中,并转移到黑壁96孔板。在Biotek Synergy H1MF读板仪上评估GFP荧光(激发/发射479/520nM)。单独的笼的荧光极少,这证实了在没有钥匙的情况下,LOCKR蛋白阻止了分拆式GFP的激活。钥匙表达的诱导导致SEQ ID NO 27192、27198、27194、27202、27206和27210的荧光大大增加。这些结果证明3plus1 LOCKR体系结构能够控制生物活性肽GFP11的功能。
图15a-e.降解决定子LOCKR的设计和体内测试。图15a.在酿酒酵母(S.cerevisiae)中用于测试降解决定子LOCKR功能性的双诱导型系统的示意图。孕酮(Pg)诱导产生钥匙-BFP,并且雌二醇(E2)诱导产生YFP-降解决定子开关。图15b.如通过流式细胞术所测量,YFP荧光随全长钥匙(左)和截短12个残基的钥匙(右)的E2(0-50nM)和Pg(0-100nM)而变化的热图。图15c.比较YFP-降解决定子开关a(SEQ ID No:27362)和钥匙a-BFP(SEQ ID No:28477)在最大剂量E2下((b)中的黑色矩形)的荧光随Pg诱导而变化的线图。YFP荧光被归一化为无Pg值,并且BFP荧光被归一化为最大Pg值。误差条代表三次生物重复的标准偏差。图15d.使用自动流式细胞术平台对活性降解决定子LOCKR进行的动态测量结果。E2被诱导以激活YFP-降解决定子开关a的表达,并且Pg在t4小时被诱导以激活钥匙a-BFP的表达。每24分钟取得测量结果。图15e.同一细胞中正交LOCKR的共同表达。YFP-降解决定子开关a(SEQ ID No:27362)和RFP-降解决定子开关c(SEQ ID No:27376)使用组成型启动子表达,并且钥匙a-BFP(左)或钥匙c-BFP(右)使用pZ3诱导型启动子表达。YFP-降解决定子开关a(SEQ ID No:27362)、RFP-降解决定子开关c(SEQ ID No:27376)和钥匙a-BFP(SEQ ID No:28477)或钥匙c-BFP(28483)的归一化荧光以随Pg诱导而变化的形式被绘制。误差条代表生物重复的标准偏差。
图16a-f.使用降解决定子LOCKR控制基因表达。图16a.确定降解决定子LOCKRa对合成转录因子(SynTF)的作用的双诱导测定的示意图。Pg诱导钥匙a-BFP的表达,并且E2诱导SynTF-RFP-降解决定子开关a融合的表达。pSynTF启动子被SynTF激活并表达YFP。图16b.通过流式细胞术测量,YFP和RFP荧光随E2(0-125nM)和Pg(0-100nM)而变化的热图。图16c.比较YFP、SynTF-RFP-降解决定子开关a和钥匙a-BFP在31.25nM E2(5b中的黑色矩形)下的荧光随Pg诱导而变化的线图。YFP和RFP荧光被归一化为无Pg值,并且BFP荧光被归一化为最大Pg值。误差条代表三次生物重复的标准偏差。图16d.确定降解决定子LOCKRa对通过组成型地表达的sgRNA(未示出)靶向pTet7x启动子的dCas9-VP64的作用的双诱导测定的示意图。Pg诱导钥匙a-BFP的表达,并且E2诱导dCas9-VP64-RFP-降解决定子开关a融合的表达。pTet7x启动子被dCas9-VP64激活并表达YFP。图16e.通过流式细胞术测量,YFP和RFP荧光随E2(0-125nM)和Pg(0-100nM)而变化的热图。图16f.比较YFP、dCas9-VP64-RFP-降解决定子开关a和钥匙a-BFP在31.25nM E2(5d中的黑色矩形)下的荧光随Pg诱导而变化的线图。YFP和RFP荧光被归一化为无Pg值,并且BFP荧光被归一化为最大Pg值。误差条代表三次生物重复的标准偏差。误差条代表三次生物重复的标准偏差。
图17a-b.锁定cODC序列。图17a.cODC降解决定子到笼的三种变化(cODC全为SEQID NO:28466;cODC noPro为SEQ ID NO:28467)。变化意指通过去除去稳定脯氨酸(noPro)和最小化闩锁的突变(仅CA)来调整K打开。图17b.全和noPro cODC序列的预测模型(橙色)拧在闩锁(深蓝色)上。线头位置经过选择使得降解所需的半胱氨酸残基被螯合于笼(浅蓝色)。在全cODC中用红色突出的脯氨酸在noPro变体中突变为异亮氨酸。
图18.将与锁定于Switcha中的cODC变体融合的YFP的稳定性与空Switcha和bimSwitcha相比较。使用图15a中的双诱导型系统来通过pGal1和E2表达各种YFP-Switcha融合(实线和点)并且通过pZ3和Pg表达Keya-BFP。使用pGal1和E2表达单独YFP(Venus)、与WTcODC(cODC)融合的YFP或与去除脯氨酸的cODC(cODC noPro)融合的YFP。用饱和剂量的E2(50nM)诱导细胞,并且以0-100nM滴定Pg。使用流式细胞仪在稳定状态下测量荧光,并且误差条代表生物重复的标准偏差。针对全cODC变体观察到YFP荧光随Pg变化的适度降低,而针对去除脯氨酸和仅CA变体观察到仅少量降低。针对单独YFP、Switcha或bimSwitcha没有观察到荧光随钥匙诱导的变化而降低。
图19a-b.调整降解决定子LOCKRa的托底长度。使用图15a的双诱导型系统来通过pGal1和E2表达各种YFP-Switcha融合并且通过pZ3和Pg表达钥匙a-BFP。还使用pGal1和E2(虚线)表达了与去除脯氨酸的cODC(cODC noPro)融合的YFP。用饱和剂量的E2(50nM)诱导细胞,并且以0-100nM滴定Pg。使用流式细胞仪在稳定状态下测量荧光,并且误差条代表生物重复的标准偏差。图19a.示出全cODC的动态范围的单独图17的cODC变体。图19b.将去除脯氨酸的型式上的托底从9aa延伸至12和16aa去除脯氨酸12aa托底示出测试的所有开关的最大动态范围。
图20a-b.对应于图15b的BFP表达。使用E2和Pg分别诱导YFP-降解决定子开关a和钥匙a(全长图20a或截短图20b)-BFP的表达。使用流式细胞仪在稳定状态下测量荧光。BFP表达不依赖于开关的表达,表明钥匙不与开关共同降解。
图21a-b.正交YFP-降解决定子开关和钥匙-CFP的表达。使用强pTDH3启动子表达四个不同开关(图21a)和钥匙(A、B、C、D)(图21b)。使用流式细胞仪在稳定状态下测量荧光,并且误差条代表生物重复的标准偏差。
图22.降解决定子LOCKRa-d(SEQ ID NO:27376、27374、27376、27383为降解决定子开关,并且SEQ ID NO:28477、28482、28483、28484为钥匙)正交性。测试了pTDH3-YFP-降解决定子开关和pTDH3-钥匙-CFP的所有组合。使用流式细胞仪在稳定状态下测量荧光。百分比降解是通过以下计算的:从无钥匙表达的YFP-降解决定子开关荧光减去有给定Key-CFP共表达的YFP-降解决定子开关荧光并且通过无任何钥匙表达的YFP-降解决定子开关荧光归一化。降解决定子开关a(SEQ ID NO:27376)被钥匙a(SEQ ID NO:28477)强激活并且被钥匙b(SEQ ID NO:28482)弱激活。降解决定子开关c(SEQ ID NO:27376)被钥匙c(SEQ ID NO:28483)强激活并且被钥匙b(SEQ ID NO:28482)弱激活。因为降解决定子开关a和降解决定子开关c分别不被钥匙c和钥匙a激活,我们认为这两个为正交对。
图23a-b.图15e的个别降解决定子LOCKR控制。图23a.使用pTEF1组成型启动子表达YFP-降解决定子开关a,并且图23b.使用pTEF1组成型启动子表达RFP-降解决定子开关c。使用pZ3和Pg表达与BFP融合的相应钥匙。使用流式细胞仪在稳定状态下测量荧光,并且误差条代表生物重复的标准偏差。
图24编码到闩锁中的示例性cODC变体概述在序列标识图中。
图25a-b提供了HEK293T细胞中不同降解决定子开关变体的比较。各自与mCherryTMRFP融合的降解决定子开关a和不对称1fix-short_cODC开关在人HEK293T细胞中表达,并且在存在(蓝色)和不存在(红色)钥匙的情况下测量RFP荧光。指示了托底的长度(t5,t8,t9,t12)。图25a.LOCKR-mCherryTM RFP融合蛋白的平均荧光强度。图25b.用于生成图A中条形图的原始mCherryTM RFP柱状图。
图26a-b详述了人原代CD4+T细胞中的示例性降解决定子开关变体。图26a.与钥匙翻译融合的tagBFP的荧光柱状图。图26b.与不对称短支架降解决定子开关翻译融合的mCherryTM的荧光柱状图,其中t8托底和cODC降解决定子嵌入在闩锁中(1fix-short_cODC_t8(SEQ ID NO:27372))。此数据表明,钥匙能够触发降解决定子开关并激活mCherryTM的降解。
具体实施方式
引用的所有参考文献均以引用的方式整体并入本文。在本申请中,除非另有说明,否则所利用的技术可以在诸如以下的若干篇熟知的参考文献中找到:Molecular Cloning:A Laboratory Manual(Sambrook等人,1989,Cold Spring Harbor Laboratory Press);Gene Expression Technology(Methods in Enzymology,第185卷,由D.Goeddel编辑,1991.Academic Press,San Diego,CA);“Guide to Protein Purification”in Methodsin Enzymology(M.P.Deutshcer编辑,(1990)Academic Press,Inc.);PCR Protocols:AGuide to Methods and Applications(Innis等人1990.Academic Press,San Diego,CA);Culture of Animal Cells:A Manual of Basic Technique,第2版(R.I.Freshney.1987.Liss,Inc.New York,NY);Gene Transfer and ExpressionProtocols,第109-128页,E.J.Murray编辑,The Humana Press Inc.,Clifton,N.J.);以及Ambion 1998Catalog(Ambion,Austin,TX)。
除非上下文另有明确规定,否则如本文所用,单数形式“一个”、“一种”和“所述”包括复数指示物。如本文所用,“和”与“或”可互换使用,除非另外明确说明。
如本文所用,氨基酸残基缩写如下:丙氨酸(Ala;A)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、精氨酸(Arg;R)、半胱氨酸(Cys;C);谷氨酸(Glu;E)、谷氨酰胺(Gln;Q)、甘氨酸(Gly;G);组氨酸(His;H)、异亮氨酸(Ile;I)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、蛋氨酸(Met;M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P)、丝氨酸(Ser;S)、苏氨酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)和缬氨酸(Val;V)。
除非上下文另有明确规定,否则本公开任何方面的所有实施方式均可以组合使用。
除非上下文清楚地另外要求,否则在整个说明书和权利要求中,词语“包括”、“包含”等应在包括性的意义上解释,而不是在排他性或穷举的意义上;也就是说,在“包括但不限于”的意义上解释。使用单数或复数的词语也分别包括复数和单数。另外,词语“本文”、“以上”和“以下”和类似含义的词语在本申请中使用时应是指整个本申请而非本申请的任何特定部分。
本公开的实施方式的描述并非旨在穷举或将本公开限制为所公开的精确形式。虽然本文出于说明性目的描述了本公开的具体实施方式和实施例,但是如相关领域的技术人员将认识到的,在本公开的范围内可以进行各种等同性修改。
在第一方面,本公开提供了非天然存在的笼多肽,其包含:
(a)螺旋束,其包含2至7个α-螺旋,其中所述螺旋束包含:
(i)结构区域;和
(ii)闩锁区域,其中闩锁区域包含降解决定子,其中结构区域与闩锁区域相互作用以阻止降解决定子的活性;和
(b)氨基酸接头,其连接每个α-螺旋。
本公开的第一方面的非天然存在的笼多肽(在此也可称为“锁”)可用作例如本文详细公开的新型蛋白质开关的组件。蛋白质开关可以例如用于螯合笼多肽中的生物活性肽,保持它们处于非活性(“关闭”)状态,直到与本文公开的新型蛋白质开关的第二种组件(“钥匙”多肽)组合;钥匙多肽诱导激活(“开启”)生物活性肽的构象变化(参见图1a)。本文所述的多肽包括首个全新设计的多肽,其可以响应于蛋白质结合而经历构象转换。此外,还没有已知的天然蛋白质能够像本文公开的多肽那样以模块化、可调的方式进行转换。笼和钥匙多肽的组合使用在本文中在以下的实施例中更详细地描述了,并被称为LOCKR开关。LOCKR代表闩锁正交笼-钥匙蛋白;每个LOCKR设计均由笼多肽和钥匙多肽组成,它们是两条独立的多肽链。正交LOCKR设计(参见图3)用小写字母下标表示:LOCKRa由笼a和钥匙a组成,并且LOCKRb由笼b和钥匙b组成等,使得笼a仅被钥匙a激活,并且笼b仅被钥匙b激活等。多肽和LOCKR名称中的前缀表示由LOCKR开关编码和控制的官能团。例如,BimLOCKR是指编码Bim肽的设计的开关,而GFP11-LOCKR是指编码GFP11(GFP的第11链)的设计的开关。参见图8的序列比对,其将原始LOCKR_a笼支架设计与其非对称(1fix-short–noBim(AYYA)-t0)和正交(LOCKRb-f)设计对应物进行比较。在另一个实施方式中,笼的命名法由1fix-short和1fix-latch标识,表明如上文所定义的笼a的相似但不同的实施方式。它们全部由钥匙a激活。闩锁中编码的官能团由名称的第三部分标识,而后缀表示存在托底。例如,1fix-short-Bim-t0在没有托底的1fix-short支架上编码Bim。在另一实例中,1fix-latch_Mad1SID_T0_2表示1fix-latch支架用于编码无残基的Mad1SID。后缀2表示存在两个版本,其中功能序列在闩锁区域的不同位置被编码。
如本文所用,“降解决定子”为能够靶向笼多肽和融合以便降解的任何功能多肽结构域的单一氨基酸或多肽。例如,降解决定子可以通过靶向蛋白酶体(包括泛素依赖性降解决定子(泛素蛋白酶促连接在蛋白质,标志其降解/靶向蛋白酶体)和泛素无关降解决定子(在无泛素的情况下将蛋白质靶向蛋白酶体的降解决定子)),靶向溶酶体或募集蛋白酶来靶向多肽以便降解。
正如以下实例所证明,当钥匙被表达并通过与结构区域相互作用而激活笼多肽时,降解决定子便靶向笼多肽以及与笼多肽融合的任何功能多肽结构域和/或额外生物活性结构域以便降解。以此方式,与具有降解决定子的笼多肽融合的感兴趣的功能多肽结构域可以通过钥匙的表达以可滴定的方式进行条件性降解。这在本文中有时称为降解决定子LOCKR。
所述多肽是“非天然存在的”,因为在任何天然存在的多肽中都找不到所述完整的多肽。应理解,所述多肽的组件可以是天然存在的,包括但不限于可以包括在一些实施方式中的生物活性肽。
笼多肽包含螺旋束,所述螺旋束包含2至7个α-螺旋。在各种实施方式中,螺旋束包含3-7、4-7、5-7、6-7、2-6、3-6、4-6、5-6、2-5、3-5、4-5、2-4、3-4、2-3、2、3、4、5、6或7个α螺旋。
本公开的螺旋束笼多肽的设计可通过任何合适的方式进行。在一个非限制性实施方式中,可以基于盘绕线圈的Crick表达,使用RosettaTM程序中的BundleGridSamplerTM来产生骨架几何形状,并允许对盘绕线圈表达参数值的规则网格进行有效的并行采样,所述规则网格对应于肽骨架构象的连续体。这可通过使用包括但不限于如Boyken等人(Science352,680-687(2016))所述的任何合适的方式设计氢键网络来补充,随后是RosettaTM侧链设计。在另一个非限制性实施方式中,可以选择基于总得分、不满意的氢键的数目和蛋白质核心中缺少空隙的最佳得分设计用于螺旋束笼多肽设计。
每个α螺旋可具有任何合适的长度和适合于预期用途的氨基酸组成。在一个实施方式中,每个螺旋的长度独立地为38至58个氨基酸。在各种实施方式中,每个螺旋的长度独立地为18-60、18-55、18-50、18-45、22-60、22-55、22-50、22-45、25-60、25-55、25-50、25-45、28-60、28-55、28-50、28-45、32-60、32-55、32-50、32-45、35-60、35-55、35-50、35-45、38-60、38-55、38-50、38-45、40-60、40-58、40-55、40-50或40-45个氨基酸。
在一些方面,使用一个或多个接头来连接两个或更多个多肽,例如,α螺旋、结构区域、闩锁区域、降解决定子或其任何组合。连接每个α螺旋的氨基酸接头可以具有任何合适的长度或适合于预期用途的氨基酸组成。在一个非限制性实施方式中,每个氨基酸接头的长度独立地为2至10个氨基酸,其中不包括可以与所述接头融合的任何其他功能序列。在各种非限制性实施方式中,每个氨基酸接头的长度独立地为3-10、4-10、5-10、6-10、7-10、8-10、9-10、2-9、3-9、4-9、5-9、6-9、7-9、8-9、2-8、3-8、4-8、5-8、6-8、7-8、2-7、3-7、4-7、5-7、6-7、2-6、3-6、4-6、5-6、2-5、3-5、4-5、2-4、3-4、2-3、2、3、4、5、6、7、8、9或10个氨基酸。在所有实施方式中,接头可以是结构化的或柔性的(例如聚-GS)。这些接头可以编码其他功能序列,包括但不限于蛋白酶切割位点或分裂内含肽系统的一半(参见以下序列)。如本文所述,接头可还包含一个或多个功能多肽结构域,在此实施方式中,接头可为适于包括一个或多个功能多肽结构域的任何大小,同时维持结构区域和闩锁区域的相互作用能力。
合适的接头可以容易地选择并且可为许多合适的长度中的任一个,诸如1个氨基酸(例如,Gly)至20个氨基酸、2个氨基酸至15个氨基酸、3个氨基酸至12个氨基酸,包括4个氨基酸至10个氨基酸、5个氨基酸至9个氨基酸、6个氨基酸至8个氨基酸或7个氨基酸至8个氨基酸,并且可为1、2、3、4、5、6或7个氨基酸。
示例性接头包括甘氨酸聚合物(G)n、甘氨酸-丝氨酸聚合物(包括例如,(GS)n、(GSGGS)n(SEQ ID NO:28503)和(GGGS)n(SEQ ID NO:28504),其中n是至少为1的整数)、甘氨酸丙氨酸聚合物、丙氨酸-丝氨酸聚合物和本领域已知的其他柔性接头。可以使用甘氨酸和甘氨酸-丝氨酸聚合物;Gly和Ser都是相对非结构化的,因此可充当组件之间的中性栓系物。可以使用甘氨酸聚合物;甘氨酸获得的phi-psi空间甚至比丙氨酸多得多,并且比具有较长侧链的残基受到的限制少得多(参见Scheraga,Rev.Computational Chem.11173-142(1992))。示例性接头可包含包括但不限于以下的氨基酸序列:GGSG(SEQ ID NO:28505)、GGSGG(SEQ ID NO:28506)、GSGSG(SEQ ID NO:28507)、GSGGG(SEQ ID NO:28508)、GGGSG(SEQ ID NO:28509)、GSSSG(SEQ ID NO:28510)、GSEGSE(SEQ ID NO:28547)、GSGSE(SEQ IDNO:28548)、GGGSGSE(SEQ ID NO:28549)等。
此第一方面的多肽包括被称为“闩锁区域”的区域,用于插入生物活性肽。因此,笼多肽包含闩锁区域和结构区域(即:笼多肽的不是闩锁区域的其余部分)。当闩锁区域被修饰以包括一种或多种生物活性肽时,笼多肽的结构区域与闩锁区域相互作用以阻止生物活性肽的活性。在被钥匙多肽激活后,闩锁区域与其与结构区域的相互作用解离,以暴露出生物活性肽,从而使肽发挥功能。
闩锁区域可以存在于笼多肽的任一末端附近。在一个实施方式中,将闩锁区域放置在C-末端螺旋处,以便定位生物活性肽用于最大程度地掩埋需要螯合的功能残基,以将生物活性肽保持在非活性状态,同时掩埋疏水性残基并促进极性残基的溶剂暴露/补偿性氢键。
在各种实施方式中,闩锁区域可以笼多肽的在N-末端或C-末端部分处包含单个α螺旋的一部分或全部。在各种其他实施方式中,闩锁区域可以包含笼多肽中的第一、第二、第三、第四、第五、第六或第七个α螺旋的一部分或全部。在其他实施方式中,闩锁区域可以包含笼多肽中的两个或更多个不同α螺旋的全部或部分;例如,一个α螺旋的C-末端部分和下一个α螺旋的N-末端部分或所有两个连续的α螺旋。在一个实施方式中,闩锁区域包含单个α螺旋,其在不存在钥匙多肽的情况下与结构区的α螺旋相互作用;在一个这样的实施方式中,结构区域包含五个α螺旋,并且与闩锁区域的相互作用得到六个螺旋束的笼多肽。在一个实施方式中,结构区域和闩锁区域的α螺旋可以通过疏水性接触和螺旋接口之间形成的氢键网络的组合而相互作用。
任何合适的降解决定子都可以使用,因为基于本公开,它被认为适合于预期用途。降解决定子包括蛋白质的部分,其发信号和/或出于降解而靶向降解决定子所连接或以其他方式缔合(例如,移植)的蛋白质(或以其他方式增加其降解率)。降解决定子的非限制性实例包括短氨基酸序列、结构基序、暴露的氨基酸等。降解决定子可以是原核细胞或真核细胞衍生的,并且可以呈自然存在或非自然存在(即,重组)的形式采用。降解决定子可以进行翻译后修饰,以靶向蛋白质以便降解,其中这种翻译后修饰包括但不限于例如泛素化、蛋白水解裂解、磷酸化、甲基化、ADP-核糖基化、AMP化、脂化、烷基化、亚硝化、琥珀酸化、苏木酰化、拟素化(neddylation)、ISG化等等。有用的降解决定子包括泛素依赖性降解决定子和泛素无关的降解决定子。例如,在一些情况下,蛋白质可以通过连接鸟氨酸脱羧酶(ODC)降解决定子,包括但不限于例如哺乳动物的ODC,如例如啮齿动物的ODC,包括但不限于例如C-末端的小鼠ODC(cODC),而被靶向以便泛素依赖性蛋白酶体降解。在一些情况下,有用的降解决定子包括在Takeuchi等人,Biochem.J(2008)410:401-407和/或Matsuzawa等人,PNAS(2005)102(42):14982-7中所述的那些;其公开以引用的方式整体并入本文。在一些情况下,蛋白质可以通过降解决定子的翻译后修饰(包括但不限于例如蛋白水解裂解、磷酸化、甲基化、ADP-核苷酸化、AMP化、脂化、烷基化、亚硝基化、琥珀酸化、苏木酰化、拟素化、ISG化等)来被靶向以便泛素无关的蛋白酶体降解,其中此类修饰直接或间接导致蛋白的部分或完全展开或导致蛋白降解的其他机制。
降解决定子存在于闩锁区域内。闩锁区域可以存在于笼多肽的任一末端附近。因此,在各种实施方式中,闩锁区域可以在结构区域的C-末端或在结构区域的N-末端。因此,在一些实施方式中,降解决定子可存在于闩锁区域的N-末端或C-末端的约100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0个氨基酸内和/或在笼多肽的N-末端或C-末端的约100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0个氨基酸内。在一些实施方式中,在闩锁区域在笼多肽的末端的情况下,降解决定子距末端和距闩锁区域末端的所述距离(以氨基酸为单位)可均满足。在其他实施方式中,例如向笼多肽的N-末端或C-末端增加一个或多个多肽功能结构域的情况下(如下文所述),降解决定子可以在距闩锁区域末端而不是距笼多肽末端的所述距离(以氨基酸为单位)内。
在一个实施方式中,闩锁区域在结构区域的N-末端,并且降解决定子可位于闩锁区域的N-末端的约100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0个氨基酸残基内。在一个这样的实施方式中,降解决定子可位于笼多肽的N-末端的约100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0个氨基酸残基内。
在另一个实施方式中,闩锁区域在结构区域的C-末端,并且降解决定子可位于闩锁区域的C-末端的约100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0个氨基酸残基或更少氨基酸残基内。在一个这样的实施方式中,降解决定子可位于笼多肽的C-末端的约100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0个氨基酸残基内。在一个实施方式中,降解决定子可包含泛素无关的降解信号。在一个实施方式中,降解决定子包括位于距笼多肽C-末端10-30个残基之间的CA二肽,在此实施方式中,CA二肽中的“C”残基距笼多肽C-末端10-30个残基。CA二肽为鼠鸟氨酸脱羧酶(cODC)降解决定子降解活性的最小结构域,如下文实施例2所述。在cODC降解决定子的其他实施方式中,降解决定子包含肽MSCAQES(SEQ ID NO:28468)或L(X)MSCAQES(SEQ IDNO:28467)(“cODC noPro”),其中X可为任何氨基酸残基,其中X任选地不为脯氨酸。
在其他非限制性实施方式中,降解决定子可包含选自由以下组成的组中的氨基酸残基或肽:-GG、-RG、-KG、-QG、-WG、-PG、-AG、-RxxG、-EE、-R、-Rxx、-Vx、-Ax、-A,其中“x”可为任何氨基酸残基。在一个这样的实施方式中,降解决定子可位于笼多肽的C-末端约10-30个氨基酸残基内或约20个氨基酸残基内。
在其他非限制性实施方式中,降解决定子包含选自由以下组成的组中的肽或由其组成(括号内的残基为任选的):
[[KTRGVEEVAEGVVLL]]RRRG[[NK(FAM)KKK]](SEQ ID NO:28469);
[[KPFLNGGPY]]HSREQSTDSG[[LGLGSYK(FAM)KKK]](SEQ ID NO:28470);
ASADLDLEALAPYIPADDDFQLRK(FAM)KKK(SEQ ID NO:28471);
[[K-(PEG)-KEEK]]DINNN[[VKKTK(FAM)KKK]](SEQ ID NO:28472);
[[K-(PEG)]]DVQKADVSST[[GQGIDSK(FAM)KKK]](SEQ ID NO:28487);
KAAEEEEVSLASTPTDVRDVDIK(FAM)KKK(SEQ ID NO:28473);
[[KKYSSQTSQ]]DSGNYS[[NK(FAM)KKK]](SEQ ID NO:28474);
KPLSSSVPSQKTYQGSYGFRLGK(FAM)KKK(SEQ ID NO:28475);
[[KAWQQQSYL]]DSGIHSG[[ATTTAPK(FAM)KKK]](SEQ ID NO:28476);
[[KTRGVEEVAEGVVLL]]RRRG[[NKKKK]](SEQ ID NO:28488);
[[KPFLNGGPY]]HSREQSTDSG[[LGLGSYKKKK]](SEQ ID NO:28489);
ASADLDLEALAPYIPADDDFQLRKKKK(SEQ ID NO:28490);
[[KKEEK]]DINNN[[VKKTKKKK]](SEQ ID NO:28491);
[[K]]DVQKADVSST[[GQGIDSKKKK]](SEQ ID NO:28492);
KAAEEEEVSLASTPTDVRDVDIKKKK(SEQ ID NO:28493);
[[KKYSSQTSQ]]DSGNYS[[NKKKK]](SEQ ID NO:28494);
KPLSSSVPSQKTYQGSYGFRLGKKKK(SEQ ID NO:28495);
[[KAWQQQSYL]]DSGIHSG[[ATTTAPKKKK]](SEQ ID NO:28496);
RRRG(SEQ ID NO:28497);
HSREQSTDSG(SEQ ID NO:28498);
DINNN(SEQ ID NO:28499);
DVQKADVSST(SEQ ID NO:28500);
DSGNYS(SEQ ID NO:28501);和
DSGIHSG(SEQ ID NO:28502)。
在其他非限制性实施方式中,降解决定子可包含募集泛素连接酶的多肽序列。此类降解决定子(例如,靶向蛋白质水解的嵌合分子,PROTAC)先前已由Sakamoto等人(2001)PNAS(15)8554-8559和Schneekloth等人(2004)JACS126(12):3748-54描述。
有用的降解决定子包括泛素依赖性降解决定子和泛素无关的降解决定子。例如,在一些情况,蛋白质可通过连接鸟氨酸脱羧酶(ODC)降解决定子、包括但不限于例如哺乳动物的ODC、如例如啮齿动物的ODC、包括但不限于例如C-末端的小鼠ODC(cODC),而被靶向以便泛素依赖性蛋白酶体降解。在一些情况下,有用的降解决定子包括在Takeuchi等人,Biochem.J(2008)410:401-407和/或Matsuzawa等人,PNAS(2005)102(42):14982-7中所述的那些;其公开以引用的方式整体并入本文。在一些情况下,蛋白质可以通过降解决定子的翻译后修饰(包括但不限于例如蛋白水解裂解、磷酸化、甲基化、ADP-核苷酸化、AMP化、脂化、烷基化、亚硝基化、琥珀酸化、苏木酰化、拟素化、ISG化等)来被靶向以便泛素无关的蛋白酶体降解,其中此类修饰直接或间接导致蛋白的部分或完全展开或导致蛋白降解的其他机制。
在一些方面,降解决定子可包括泛素无关的降解信号,其中此类信号可以不同。例如,在一些情况下,泛素无关的降解信号可以包括二肽图案,例如,半胱氨酸-丙氨酸(即,CA)二肽基序。在一些情况下,泛素无关的降解信号可仅包括二肽基序。在一些情况下,泛素UCSF无关的降解信号可包括除二肽基序外的氨基酸残基,例如但不限于例如LXMSCAQE(SEQID NO:28511)基序,其中X可为任何氨基酸;或LXMSCAQES(SEQ ID NO:28467)基序,其中X可为任何氨基酸。在一些情况下,LXMSCAQE(SEQ ID NO:28511)基序或LXMSCAQES(SEQ ID NO:28467)可包括X为除脯氨酸以外的任何氨基酸的情况。
因此,在一些情况下,降解决定子的降解信号可包括选自以下的序列:LPMSCAQES(SEQ ID NO:28466),其中最后的S存在或不存在;LAMSCAQES(SEQ ID NO:28512),其中最后的S存在或不存在;LVMSCAQES(SEQ ID NO:28513),其中最后的S存在或不存在;LSMSCAQES(SEQ ID NO:28514),其中最后的S存在或不存在;LEMSCAQES(SEQ ID NO:28515),其中最后的S存在或不存在;和LKMSCAQES(SEQ ID NO:28516),其中最后的S存在或不存在。在一些情况下,降解决定子的降解信号可以包括MSCAQE(SEQ ID NO:28517)序列或MSCAQES(SEQ IDNO:28468)序列。
泛素依赖性降解决定子包括但不限于例如含有PEST(SEQ ID NO:28518)(脯氨酸(P)、谷氨酸(E)、丝氨酸(S)和苏氨酸(T))序列的降解决定子,以及Melvin等人(PLoS One.(2013)29;8(10):e78082)中所述的那些降解决定子;其公开以引用的方式整体并入本文,包括鉴别为Bonger的降解决定子和描述为衍生自TAZ、HIF-1α、iNOS、SRC3、周期素D1、IFNAR1、p53和β-连环蛋白的那些。
有用的降解决定子也可以包括E3泛素连接酶结构域。此类降解决定子通常被定义为由E3泛素连接酶识别的底物位点,并且多种此类降解决定子已被表征,包括短肽基序和特定的结构元件。E3连接酶/降解决定子和对应基序模式的非限制性实例包括:
APC/C(DBOX),一级基序.R..L..[LIVM];(SEQ ID NO:28519)
APC/C(KEN),一级基序.KEN.;(SEQ ID NO:28520)
APC/C(ABBA),一级基序[FIVL].[ILMVP][FHY].[DE].{0,3}[DEST];(SEQ ID NO:28521)
APCC_TPR_1,一级基序.[ILM]R$;(SEQ ID NO:28522)
CBL(PTK),一级基序[DN].Y[ST]..P;(SEQ ID NO:28523)
CBL(MET),一级基序DYR;(SEQ ID NO:28524)
COP1,一级基序[DE][DE].{2,3}VP[DE];(SEQ ID NO:28525)
CRL4_CDT2_1,一级基序[NQ]{0,1}..[ILMV][ST][DEN][FY][FY].{2,3}[KR]{2,3}[^DE];(SEQ ID NO:28526)
CRL4_CDT2_2,一级基序[NQ]{0,1}..[ILMV]T[DEN][HMFY][FMY].{2,3}[KR]{2,3}[^DE];(SEQ ID NO:28527)
Kelch_KEAP1_1,一级基序[DNS].[DES][TNS]GE;(SEQ ID NO:28528)
Kelch_KEAP1_2,一级基序QD.DLGV;(SEQ ID NO:28529)
Kelch_actinfilin,一级基序[AP]P[MV][IM]V;(SEQ ID NO:28530)
Kelch_KLHL3,一级基序E.EE.E[AV]DQH;(SEQ ID NO:28531)
MDM2_SWIB,一级基序F[^P]{3}W[^P]{2,3}[VIL];(SEQ ID NO:28532)
Nend_Nbox_1,一级基序^M{0,1}[FYLIW][^P];(SEQ ID NO:28533)
Nend_UBRbox_1,一级基序^M{0,1}[RK][^P].;(SEQ ID NO:28534)
Nend_UBRbox_2,一级基序^M{0,1}([ED]).;(SEQ ID NO:28535)
Nend_UBRbox_3,一级基序^M{0,1}([NQ]).;(SEQ ID NO:28536)
Nend_UBRbox_4,一级基序^M{0,1}(C).;(SEQ ID NO:28537)
ODPH_VHL_1,一级基序[IL]A(P).{6,8}[FLIVM].[FLIVM];(SEQ ID NO:28538)
SCF_COI1_1,一级基序..[RK][RK].SL..F[FLM].[RK]R[HRK].[RK].;(SEQ ID NO:28539)
SCF_FBW7_1,一级基序[LIVMP].{0,2}(T)P..([ST]);(SEQ ID NO:28540)
SCF_FBW7_2,一级基序[LIVMP].{0,2}(T)P..E;(SEQ ID NO:28541)
SCF_SKP2-CKS1_1,一级基序..[DE].(T)P.K;(SEQ ID NO:28542)
SCF_TIR1_1,一级基序.[VLIA][VLI]GWPP[VLI]...R.;(SEQ ID NO:28543)
SCF-TRCP1,一级基序D(S)G.{2,3}([ST]);(SEQ ID NO:28544)
SIAH,一级基序.P.A.V.P[^P](SEQ ID NO:28545);或
SPOP,一级基序[AVP].[ST][ST][ST](SEQ ID NO:28546);
在上述所有情况,‘.’指定任何氨基酸类型,‘[X]’指定在这个位置允许的氨基酸类型,模式开头的‘^X’指定序列以氨基酸类型X开始,‘[^X]’意指那个位置可具有除类型X外的任何氨基酸,数字指定为以下‘X{x,y}’,其中x和y指定那个位置所需‘X’氨基酸类型的最小和最大数量。‘$’符号意味蛋白链的C-末端。包括E3泛素连接酶结构域的降解决定子描述于Guharoy等人,Nature Communications(2016)7:10239;其公开以引用的方式整体并入本文。
在一些方面,有用的降解决定子可以包括含有ER相关降解(ERAD)的信号的那些降解决定子,包括但不限于例如Maurer等人,Genes Genomes&Genetics(2016)6:1854-1866中所述的那些;其公开以引用的方式整体并入本文。在一些情况下,有用的降解决定子还可以包括药物诱导型降解决定子,例如但不限于例如利用特定E3泛素连接酶的生长素诱导型降解决定子(AID)(例如,如Nishimura等人,Nature Methods(2009)6(12):917-922中所述;其公开以引用的方式整体并入本文)。如将容易理解的,包括E3泛素连接酶结构域的降解决定子将有所不同并且可能不限于使用本文特定描述的那些E3泛素降解决定子。
在适合用于本公开的诱导型降解策略中可以采用的其他有用的降解决定子的实例包括但不限于例如:N-末端降解决定子(例如但不限于例如Tasaki和Kwon,Trends inBiochemical Sciences(2007)32(11):520-528中所述的那些,其公开以引用的方式整体并入本文);未结构化区域(例如但不限于例如,Chung等人,Nat Chem Biol.2015;11(9):713–720中所述的那些,其公开以引用的方式整体并入本文);配体诱导的降解(LID)和去稳定结构域(DD)结构域(例如但不限于例如,Bonger等人,Nat Chem Biol.2012;7(8):531–537;Grimley等人,Bioorg.Med.Chem.Lett.(2008)18:759-761;和Chu等人Bioorg.Med.Chem.Lett.(2008)18:5941-5944;Iwamoto等人,Chemistry&Biology(2010)17:981-988中所述的那些;其公开以引用方式整体并入本文);原核蛋白酶体识别序列,例如ssrA和mf-Lon(例如Cameron等人,(2014)Nature biotechnology 32(12):1276-1281中所述的那些,其公开以引用的方式整体并入本文);等等。
在另一个实施方式中,笼多肽可还包含一个或多个功能多肽结构域,其中功能多肽结构域可与笼多肽的N-末端、C-末端融合或插入到笼多肽的接头中。如上所述,当钥匙被表达并通过与结构区域相互作用而激活笼多肽时,降解决定子靶向笼多肽以及与笼多肽融合的任何功能多肽结构域以便通过例如靶向溶酶体、靶向蛋白酶体或招募蛋白酶来进行降解。以此方式,与具有降解决定子的笼多肽融合的感兴趣的功能多肽结构域可以通过钥匙的表达以可滴定的方式进行条件性降解。在各个实施方式中:
-一个或多个功能多肽结构域可位于笼多肽的N-末端并且闩锁区域可位于结构区域的C-末端或N-末端;
-一个或多个功能多肽结构域可位于笼多肽的C-末端并且闩锁区域可位于结构区域的N-末端;和/或
-一个或多个功能多肽结构域可位于氨基酸接头中并且闩锁区域可位于结构区域的N-末端或C-末端。
感兴趣的任何功能多肽或其结构域都可以表达为与笼多肽的融合蛋白,使得其可以通过钥匙的表达以可滴定的方式进行条件性降解。在非限制性实施方式中,一个或多个功能多肽结构域可包括但不限于:代谢酶;转录因子;激酶;磷酸酶;嵌合抗原受体(CAR);T细胞受体(TCR);SynNotch;TCR模拟物;细胞因子受体;G蛋白偶联受体(GPCR);共刺激受体(包括但不限于CD28、CTLA-4、ICOS);共抑制受体(例如,PD-1);内源性信号传导结构域(包括但不限于Pleckstrin同源(PH)、Src同源2(SH2)、Src同源3(SH3)、WW、C1、PDZ、CARD、磷酸酪氨酸、富含脯氨酸的区域、卷曲螺旋和假激酶结构域);合成受体或合成信号传导蛋白,其包含一个或多个信号传导结构域(包括但不限于Pleckstrin同源(PH)、Src同源2(SH2)、Src同源3(SH3)、WW、C1、PDZ、CARD、磷酸酪氨酸、富含脯氨酸的区域、卷曲螺旋和假激酶结构域);含有ITAM或ITIM基序的工程化或内源性受体;JAK/STAT结合基序;DNA结合结构域(包括但不限于Cas9、dCas9、TALE和锌指);囊泡运输结构域;蛋白质降解结构域(包括但不限于泛素募集结构域和蛋白酶体靶向结构域);细胞死亡结构域(包括但不限于参与凋亡、坏死和细胞焦亡的那些);荧光蛋白;全新设计的蛋白质;本文所述的第二笼多肽,诸如结合与所述笼多肽所结合的钥匙多肽不同的钥匙多肽的笼多肽;本文所述的钥匙多肽,诸如不与所述笼多肽结合的钥匙多肽;和其活性结构域。如本文使用,“结构域”是指保留一种或多种特定功能的多肽的一部分。功能多肽结构域可为合成的或自然存在的,并且可以包含全蛋白质或拥有特定功能的蛋白质结构域。
在另一个实施方式中,笼多肽可还包含除降解决定子之外的一种或多种额外生物活性肽,其中结构区域与闩锁区域相互作用以阻止一种或多种额外生物活性肽的活性。如本文所用,“生物活性肽”是具有任何长度或氨基酸组成的任何肽,其能够选择性地结合到限定的靶标(即:能够结合到“效应”多肽)。此类生物活性肽可包含处于非活性构象的所有三种类型的二级结构的肽:α螺旋、β链和环。此方面的多肽可以用于控制大范围功能肽的活性。使用严格的诱导型控制来利用这些生物学功能的能力可用于例如工程化细胞(功能的诱导型激活、工程化复杂的逻辑行为和电路等)、开发传感器、开发基于诱导型蛋白质的治疗剂以及创造新的生物材料。
如本领域的技术人员将理解的,降解决定子为“生物活性肽”。因此,此实施方式是指在闩锁区域中纳入一种或多种额外生物活性肽,如上文在本公开早前方面所述。当闩锁区域被修饰以包括一种或多种额外生物活性肽时,笼多肽的结构区域与闩锁区域相互作用以阻止一种或多种额外生物活性肽的活性。在被钥匙多肽激活后,闩锁区域与其与结构区域的相互作用解离,以暴露出一种或多种额外生物活性肽,从而使一种或多种额外生物活性肽发挥功能。因此,在没有额外生物活性肽的实施方式中,仅降解决定子在钥匙多肽与笼多肽结合时激活。在闩锁中有一种或多种额外生物活性肽的实施方式中,通过钥匙多肽与笼多肽的结合激活降解决定子和一种或多种额外生物活性肽,在一个示例性这样的实施方式中,降解决定子可以通过例如诱导一种或多种额外生物活性肽的降解并因此关闭其功能来修饰额外生物活性肽来起作用。此实施方式可特别可用于例如使一种或多种额外生物活性肽的功能搏动,然后快速降解一种或多种额外生物活性肽,使得功能是短暂的,或者使一种或多种额外生物活性肽依赖于效应蛋白的结合而降解。
在此实施方式中,一种或多种额外生物活性肽可以替代闩锁区域中的一个或多个氨基酸,或者可以被添加到闩锁区域中,而不从闩锁区域去除任何氨基酸残基。在各种非限制性实施方式中,生物活性肽可包含氨基酸序列SEQ ID NO:50、60、62-64、66、27052-27093和27118-27119或其变体:
·GFP11荧光肽和GFP1-10的结合肽:RDHMVLHEYVNAAGIT。(SEQ ID NO:27052)
·BIM结合肽和BCL-2的凋亡肽:IxxxLRxIGDxFxxxY(SEQ ID NO:50),其中x是任何氨基酸;在一个实施方式中,所述肽是EIWIAQELRRIG DEFNAYYA(SEQ ID NO:60)
·设计用于与BCL-2结合的肽:KMAQELIDKVRAASLQINGDA FYAILRAL(SEQ ID NO:62)
·链霉亲和素的StreptagII结合肽或抗体:(N)WSHPQFEK(SEQ ID NO:63)
·TEV蛋白酶裂解位点:ENLYFQ(G)-X(SEQ ID NO:64),其中(G)也可以是S,最后一位,-X可以是除脯氨酸之外的任何东西
·凝血酶蛋白酶裂解位点:LVPRGS(SEQ ID NO:66)
·组织蛋白酶裂解位点:RLVGFE(SEQ ID NO:27053)
·spycatcher的Spytag共价交联肽:AHIVMVDAYK(PTK)(SEQ ID NO:27054)
·将蛋白质靶向细胞核的NLS肽:AAAKRARTS(SEQ ID NO:27055)
·将蛋白质从细胞核中排除的NES1肽:LALKLAGLDIN(SEQ ID NO:27056)
·将蛋白质从细胞核中排除的NES2肽:ELAEKLAGLDIN(SEQ ID NO:27057)
·将蛋白质从细胞核中排除的NES3肽:ELAEKLRAGLDLN(SEQ ID NO:27058)
·募集DNA-甲基化酶的EZH2结合肽:TMFSSNRQKILERTETLN QEWKQRRIQ(SEQ IDNO:27059)
·募集p53的MDM2结合肽:ETFSDLWKLL(SEQ ID NO:27060)
·CP5结合肽:GELDELVYLLDGPGYDPIHSDVVTRGGSHLFNF(SEQ ID NO:27061)
·转录激活的9aaTAD1:TMDDVYNYLFDD(SEQ ID NO:27062)
·转录激活的9aaTAD2:LLTGLFVQYLFDD(SEQ ID NO:27063)
·转录激活的9aaTAD3:DDAVVESFFSS(SEQ ID NO:27064)
·转录激活的9aaTAD4:GDFLSDLFD(SEQ ID NO:27065)
·转录激活的9aaTAD5:GDVLSDLVD(SEQ ID NO:27066)
·Mad1-SID-表观遗传修饰:NIQMLLEAADYLE(SEQ ID NO:27067)
·Mad1-SID(3A突变体)-表观遗传修饰:NIAMLLAAAAYLE(SEQ ID NO:27068)
·ZBP1的RHIM结构域1:IQIG(SEQ ID NO:27069)
·ZBP1的RHIM结构域2:VQLG(SEQ ID NO:27070)
·nanoBit Split荧光素酶:VSGWRLFKKIS(SEQ ID NO:27071)
·CC-A:GLEQEIAALEKENAALEWEIAALEQGG(SEQ ID NO:27072)
·CC-B:GLKQKIAALKYKNAALKKKIAALKQGG(SEQ ID NO:27073)
·GCN4:RMKQLEDKVEELLSKNYHLENEVARLKKLVGER(SEQ ID NO:27074)
·CC-Di:GEIAALKQEIAALKKENAALKWEIAALKQG(SEQ ID NO:27075)
·破坏膜/穿透细胞的肽:
·破坏膜的GALA:WEAALAEALAEALAEHLAEALAEALEALAA(SEQ ID NO:27076)
·Aurein 1.2:GLFDIIKKIAESF(SEQ ID NO:27077)
·爪蟾抗菌肽-1:GIGKFLHSAGKFGKAFVGEIMKS(SEQ ID NO:27078)
·爪蟾抗菌肽-2:GIGKFLHSAKKFGKAFVGEIMNS(SEQ ID NO:27079)
·蜂毒肽:GIGAVLKVLTTGLPALISWIKRKRQQ(SEQ ID NO:27080)
·黄蜂毒素X:INWKGIAAMAKKLL(SEQ ID NO:27081)
·天蚕素A:KWKLFKKIEKVGQNIRDGIIKAGPAVAVVGQATQIAK(SEQ ID NO:27082)
·天蚕素P1:SWLSKTAKKLENSAKKRISEGIAIAIQGGPR(SEQ ID NO:27083)
·Citropin 1.1:GLFDVIKKVASVIGGL(SEQ ID NO:27084)
·Temporin-1Lb:NFLGTLINLAKKIL(SEQ ID NO:27085)
·HPV33 L2肽:SYFILRRRRKRFPYFFTDVRVAA(SEQ ID NO:27086)
·腺病毒pVI膜融合结构域:AFSWGSLWSGIKNFGSTVKNY(SEQ ID NO:27087)
·兽棚病毒的γ-1肽:ASMWERVKSIIKSSLAAASNI(SEQ ID NO:27088)
·脊髓灰质炎病毒2B成孔肽:VTSTITEKLLKNLIKIISSLVIITRNYEDTTTVLATLALLGCDASPWQWL(SEQ ID NO:27089)
·鼻病毒成孔肽:IAQNPVENYIDEVLNEVLVVPNIN(SEQ ID NO:27090)
·流感HA2成孔肽:FLGIAEAIDIGNGWEGMEFG(SEQ ID NO:27091)
·流感HA2衍生物:GLFGAIAGFIENGWEGMIDG(SEQ ID NO:27092)
·HA衍生的INF6:GLFGAIAGFIENGWEGMIDGWYG。(SEQ ID NO:27093)
·KRAB结构域-表观遗传修饰:(SEQ ID NO:27118)MDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPWLV
·最小Krab结构域(KOX1 11-55)-表观遗传修饰:(SEQ ID NO:27119)RTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGY
在一个实施方式中,可以通过以下来调整由钥匙多肽激活的动态范围:截短闩锁区域长度使其短于结构区域中的α-螺旋,同时减弱笼多肽-闩锁区域的相互作用,并在笼多肽上打开暴露区域,钥匙多肽可以结合到所述区域以作为“托底”(图2)。类似地,还可以通过在闩锁中设计减弱笼多肽-闩锁区域相互作用的突变,以类似的方式来调整由钥匙多肽激活的动态范围(图1-2和10)。在其他实施方式中,闩锁区域可以是一个或多个螺旋,其总长度在18-150个氨基酸之间、18-100个氨基酸之间、18-58个氨基酸之间或这些范围所涵盖的任何范围。在其他实施方式中,闩锁区域可以由螺旋二级结构、β链二级结构、环二级结构或其组合组成。
在另一个实施方式中,笼多肽包含沿着选自由以下组成的组中的笼多肽的氨基酸序列的长度具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列:(a)SEQID NO:27359-28465或表7中列出的笼多肽(在(a)实施方式中,降解决定子包括在多肽序列中);和(b)SEQ ID NO:1-49、51-52、54-59、61、65、67-91、92-2033、SEQ ID NO:2034-14317、27094-27117、27120-27125、27278至27321和表2或5(在SEQ ID NO:27126与27276之间偶数编号的SEQ ID NO的多肽)、表3和/或表4中列出的笼多肽(即,在(b)实施方式中,降解决定子不包括在氨基酸序列中且将添加在闩锁区域内,包括但不限于本文所公开的那些降解决定子氨基酸序列)。
降解决定子LOCKR(degonLOCKR)开关的氨基酸序列
·降解决定子序列带下划线
·闩锁由[括号]指示
>degonLOCKR_a_327(SEQ ID NO:27359)
SKEAVTKLQALNIKLAEKLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPDVARLQELNIELARELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTDP[DEARKAIARVKRESKRIVEDAERLPMSCAQESEKISREAERLIREAA]
>degonLOCKR_a_327_noPro(SEQ ID NO:27360)
SKEAVTKLQALNIKLAEKLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPDVARLQELNIELARELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTDP[DEARKAIARVKRESKRIVEDAERLAMSCAQESEKISREAERLIREAA]
>degonLOCKR_a_CAonly(SEQ ID NO:27361)
SKEAVTKLQALNIKLAEKLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPDVARLQELNIELARELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTDP[DEARKAIARVKRESKRIVEDAERLIRECAAASEKISREAERLIREAA]
>degonLOCKR_a_324_t12(SEQ ID NO:27362)
SKEAVTKLQALNIKLAEKLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPDVARLQELNIELARELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTDP[DEARKAIARVKRESKRIVEDLIMSCAQESAASEKISREAERLIR]
>degonLOCKR_a_320_t16(SEQ ID NO:27363)
SKEAVTKLQALNIKLAEKLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPDVARLQELNIELARELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTDP[DEARKAIARVKRESKRLVMSCAQESREAAAASEKISREAE]
>degon-miniLOCKRa_1_t9(SEQ ID NO:27364)
NKEDATEAQKKAIRAAEELLKDVTRIQERAIREAEKALERLARVQEEAIRRVYEAVESKNKEELKKVKEEIEELLRRLKRELDELEREIRELLKEIKEKADRLEKEIRDLIERIRRDRNASDEVVTRLARLNEELIRELREDVRRLAELNKELLRELERAARELARLNEKLLELADRVETE[EEARKAIARVKRESKRIVEDAERLAMSCAQESEKISREAERLIREAA]
>degon-miniLOCKRa_1_t12(SEQ ID NO:27365)
NKEDATEAQKKAIRAAEELLKDVTRIQERAIREAEKALERLARVQEEAIRRVYEAVESKNKEELKKVKEEIEELLRRLKRELDELEREIRELLKEIKEKADRLEKEIRDLIERIRRDRNASDEVVTRLARLNEELIRELREDVRRLAELNKELLRELERAARELARLNEKLLELADRVETE[EEARKAIARVKRESKRIVEDLIMSCAQESAASEKISREAERLIR]
>degon-miniLOCKRa_2_t9(SEQ ID NO:27366)
DERLKRLNERLADELDKDLERLLRLNEELARELTRAAEELRELNEKLVELAKKLQGGRSREVAERAEKEREKIRRKLEEIKKEIKEDADRIKKRADELRRRLEKTLEDAARELEKLKREPRTEELKRKATELQKEAIRRAEELLKEVTDVQRRAIERAEELLEKLARLQEEAIRTVYLLVELNKV[DRARKAIARVKRESKRIVEDAERLAMSCAQESEKISREAERLIREAA]
>degon-miniLOCKRa_t12(SEQ ID NO:27367)
DERLKRLNERLADELDKDLERLLRLNEELARELTRAAEELRELNEKLVELAKKLQGGRSREVAERAEKEREKIRRKLEEIKKEIKEDADRIKKRADELRRRLEKTLEDAARELEKLKREPRTEELKRKATELQKENIRRAEELLKEVTDVQRRNIERAEELLEKLARLQEENIRTVYLLVELNKV[DRARKAIARVKRESKRIVEDLIMSCAQESAASEKISREAERLIR]
>1fix-short_cODC_mut(SEQ ID NO:27368)
SKEAAKKLQDLNIELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESKKILEEARKAIRDAAEESRKILEEGSGSGSDALDELQKLNLELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIRRALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKAKEESERIIREGSGSGDPDIKKLQDLNIELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDPDEARKAIARVKRESKRIVEDAERLSREAAALSMSCAQESERSIREAAAASEKISRE]
>1fix-short_cODC_mut_t6(SEQ ID NO:27369)
SKEAAKKLQDLNIELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESKKILEEARKAIRDAAEESRKILEEGSGSGSDALDELQKLNLELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIRRALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKAKEESERIIREGSGSGDPDIKKLQDLNIELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDP[DEARKAIARVKRESKRIVEDAERLSMSCAQESEKISREAERSIREAAAAS]
>1fix-short_cODC(SEQ ID NO:27370)
SELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESEKILEEAREAISGSGSELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIREALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKGSGSGSELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDP[DEARKAIARVKRESKRIVEDLEMSCAQESAASEKISREAERLIR]
>1fix-short_cODC_t5(SEQ ID NO:27371)
SELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESEKILEEAREAISGSGSELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIREALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKGSGSGSELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDP[DEARKAIARVKRESKRLVMSCAQESREAAAASEKISREA]
>1fix-short_cODC_t8(SEQ ID NO:27372)
SELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESEKILEEAREAISGSGSELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIREALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKGSGSGSELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDP[DEARKAIARVKRLSMSCAQESERLIREAAAASEKIK]
>1fix-short_cODC_t11(SEQ ID NO:27373)
SELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESEKILEEAREAISGSGSELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIREALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKGSGSGSELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDP[DEARKAIARLKMSCAQESEDAERLIREAAAASE]
>degonLOCKRb(SEQ ID NO:27374)
SHAAVIKLSDLNIRLLDKLLQAVIKLTELNAELNRKLIEALQRLFDLNVALVHLAAELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSNDPQVAQNQETFIELARDALRLVAENQEAFIEVARLTLRAAALAQEVAIKAVEAASEGGSGSGP[NKEEIEKLAKEAREKLKKAEKEHKMSCAQERKKNKKAREDLKKKADK]
>degonLOCKRb_t13(SEQ ID NO:27375)
SHAAVIKLSDLNIRLLDKLLQAVIKLTELNAELNRKLIEALQRLFDLNVALVHLAAELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSNDPQVAQNQETFIELARDALRLVAENQEAFIEVARLTLRAAALAQEVAIKAVEAASEGGSGSGP[NKEEIEKLAKEAREKLKKAEMSCAQEHDKLRKKNKKAREDLKK]
>degonLOCKRc_t9(SEQ ID NO:27376)
SLEAVLKLAELNLKLSDKLAEAVQKLAALLNKLLEKLSEALQRLFELNVALVTLAIELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSNDPLVARLQELLIEHARELLRLVATSQEIFIELARAFLANAAQLQEAAIKAVEAASENGSGSGP[SSEKVRRELKESLKENHKQNQKLLMSCAQEQEKLNRELEELKKKHKK]
>degonLOCKRc_t13(SEQ ID NO:27377)
SLEAVLKLAELNLKLSDKLAEAVQKLAALLNKLLEKLSEALQRLFELNVALVTLAIELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSNDPLVARLQELLIEHARELLRLVATSQEIFIELARAFLANAAQLQEAAIKAVEAASENGSGSGP[SSEKVRRELKESLKENHKQNMSCAQEHKRAQEKLNRELEELKK]
>degon-miniLOCKRc_1_t9(SEQ ID NO:27378)
LIERLTRLEKEHVRELKRLLDTSLEILRRLVEAFETNLRQLKEALKRALEAANLHNEEVEEVLRKLEEDLRRLEEELRKTLDDVRKEVKRLKEELDKRIKEVEDELRKIKEKLKKGDKNEKRVLEEILRLAEDVLKKSDKLAKDVQERARELNEILEELSRKLQELFERVVEEVTRNVPTTE[RIEKVRRELKESLKENHKQNQKLLMSCAQEQEKLNRELEELKKKHKK]
>degon-miniLOCKRc_1_t13(SEQ ID NO:27379)
LIERLTRLEKEHVRELKRLLDTSLEILRRLVEAFETNLRQLKEALKRALEAANLHNEEVEEVLRKLEEDLRRLEEELRKTLDDVRKEVKRLKEELDKRIKEVEDELRKIKEKLKKGDKNEKRVLEEILRLAEDVLKKSDKLAKDVQERARELNEILEELSRKLQELFERVVEEVTRNVPTTE[RIEKVRRELKESLKENHKLNMSCAQEHKRAQEKLNRELEELKK
>degon-miniLOCKRc_2_t9(SEQ ID NO:27380)
SEERVLELAEEALRLSDEAAKEIQELARRLNEELEKLSKELQDLFERIVETVTRLIDADEETLKRAAEEIKKRLEDARKKAKEAADKAREELDRARKKLKELVDEIRKKAKDALEKAGADEELVARLLRLLEEHARELERLLRTSARIIERLLDAFRRNLEQLKEAADKAVEAAEEAVRRVEDVRV[WSEKVRRELKESLKENHKQNQKLLMSCAQEQEKLNRELEELKKKHKK]
>degon-miniLOCKRc_t13(SEQ ID NO:27381)
SEERVLELAEEALRLSDEAAKEIQELARRLNEELEKLSKELQDLFERIVETVTRLIDADEETLKRAAEEIKKRLEDARKKAKEAADKAREELDRARKKLKELVDEIRKKAKDALEKAGADEELVARLLRLLEEHARELERLLRTSARIIERLLDAFRRNLEQLKEAADKAVEAAEEAVRRVEDVRV[WSEKVRRELKESLKENHKLNMSCAQEHKRAQEKLNRELEELKK]
>degonLOCKRc_1fix_t13(SEQ ID NO:27382)
SLEAALKLAELNLKLSDKLAEASQKLAALLNKLLEKLSEAIQRLFELNLALVTLAIELTDPKRIADEIKKVKDKSKEIIERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDALAELQALNLKLAELLLEAIAETQALNLKAAEAFLEAAAKLQELNIKAVELLVKLTDPATIREALRKAKEDSERIIAEAERAIAAAKAESERIIREAERLIAAAKAESERIIREGSGSNDPLIARLQELLIEHARELLRLHATSQEIFVELLRAFLANLAQLQEAALKALEAASENGSGSGP[SSEKVRRELKESLKENHKQNQKLLMSCAQEQEKLNRELEELKKKHKK]
>degonLOCKRd(SEQ ID NO:27383)
SLEAVLKLFELNHKLSEKLLEAVLKLHALNQKLSQKLLEALARLLELNVALVELAIELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPEVARLQEAFIEQAREILRNVAAAQEALIEQARRLLALAALAQEAAIKAVELASEHGSGSGP[DTVKRILEELRRRFEKLAKDLDDIAMSCAQEHKKHNKELKDKQRKIK]
其他示例性笼多肽(也参见SEQ ID NO:92-14317、27094-27117、27120-27125、27728-27321,以及表2、表3、表4和/或表5中列出的笼多肽):在这些实施方式中,降解决定子不包括在氨基酸序列中并且将被添加在闩锁区域内,包括但不限于本文所公开的那些降解决定子氨基酸序列。
1)示例性参考笼多肽;由括号[]表示的闩锁区域
·6His-MBP-TEV、6His-TEV和柔性接头序列是带下划线的文本
融合的功能结构域(DARPin、分裂内含肽的组分和荧光蛋白)是粗体文本
·功能肽是斜体带下划线的文本
·已突变为任何氨基酸以调整响应性的示例性位置是带下划线的加粗文本。这些位置是示例性的,而不是能够调整响应性的残基的详尽列表。
·括号中包含了可以被去除以调整响应性的C-末端序列。从C-末端开始,并去除其中的连续残基,可以去除括号中一(1)至所有残基的范围。
·括号中的所有序列均是任选的
>SB76L(SEQ ID NO:1)
>SB76L_17(SEQ ID NO:2)
(MGSSHHHHHHSSGLVPRGSHM)GSKEAVTKLMALNLKLAEKLLEAIARLQELNIALVYLATELTDPERIREEIRKVKEESARIVEEAEEEIRRAAARSEDILREGSGSGSDAVAELQRLNLELAELLLRAAAKLQELNIDLVRLLTELTDPKTIRDAIERVKAESERIVREAERLIREAKADSERILREGSGSGDPDVARLQELFIELARELLEALARLQELNIDLVRLASELTDP[DTIRDAIRRVKEESARIVEDARRLIKEAAEEAEKISRE]
>SB76L_18(SEQ ID NO:3)
(MGSSHHHHHHSSGLVPRGSHM)GSKRAVTELQKLNIELARKLLRALAELMELNIALVYLAVELTDPRRIREEIRKVKEKSDEIVKRAEDEIRKAAAESEKILREGSGSGSDAVAELQRLNLELAKLLLEAIAKLQALNIDLVRLLTELTDPETIRRAIKRVKDESARIVEEAEKLIRAAKDKAREIIDKGSGSGDPDVARLQELNIELARELLEAAARLQELFIDLVRLASELTDP[DEARKAIERVKREAERIVREAERLIREAKRASKEISDE]
>LOCKR_extend5(SEQ ID NO:4)
(MGSSHHHHHHSSGLVPRGSHM)KLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEGSGSGSELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLAGSGSGSRELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTDP[DEARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLI]
>LOCKR_extend9(SEQ ID NO:5)
(MGSSHHHHHHSSGLVPRGSHM)KLAEKLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAGSGSGSLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAAGSGSGSIELARELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTDP[DEARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLIREAA]
>LOCKR_extend18(SEQ ID NO:6)
(MGSSHHHHHHSSGLVPRGSHM)SKEAVTKLQALNIKLAEKLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPDVARLQELNIELARELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTDP[DEARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLIREAAAASEKISRE]
>LOCKRb(SEQ ID NO:7)
(MGSSHHHHHHSSGLVPRGSHM)SHAAVIKLSDLNIRLLDKLLQAVIKLTELNAELNRKLIEALQRLFDLNVALVHLAAELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSNDPQVAQNQETFIELARDALRLVAENQEAFIEVARLTLRAAALAQEVAIKAVEAASEGGSGSG[NKEEIEKLAKEAREKLKKAEKEHKEIHDKLRKKNKKAREDLKKKADELRETNKRVN]
>LOCKRc(SEQ ID NO:8)
(MGSSHHHHHHSSGLVPRGSHM)SLEAVLKLAELNLKLSDKLAEAVQKLAALLNKLLEKLSEALQRLFELNVALVTLAIELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSNDPLVARLQELLIEHARELLRLVATSQEIFIELARAFLANAAQLQEAAIKAVEAASENGSGSG[SSEKVRRELKESLKENHKQNQKLLKDHKRAQEKLNRELEELKKKHKKTLDDIRRES]
>LOCKRd(SEQ ID NO:9)
(MGSSHHHHHHSSGLVPRGSHM)SLEAVLKLFELNHKLSEKLLEAVLKLHALNQKLSQKLLEALARLLELNVALVELAIELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPEVARLQEAFIEQAREILRNVAAAQEALIEQARRLLALAALAQEAAIKAVELASEHGSGSG[DTVKRILEELRRRFEKLAKDLDDIARKLLEDHKKHNKELKDKQRKIKKEADDAARS]
>LOCKRe(SEQ ID NO:10)
(MGSSHHHHHHSSGLVPRGSHM)SLEAVLKLQDLNSKLSEKLSEAQLKLQALNNKLLRKLLEALLRLQDLNQALVNLALQLTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPDVAKSQEHLIEHARELLRQVAKSQELFIELARQLLRLAAKSQELAIKAVELASEAGSGSG[DDVERRLRKANKESKKEAEELTEEAKKANEKTKEDSKELTKENRKTNKTIKDEARS]
>LOCKRf(SEQ ID NO:11)
(MGSSHHHHHHSSGLVPRGSHM)SREAVEKLAELNHKLSHKLQQAQQKLQALNLKLLQKLLEALDRLQDLNNALVKLAQRLTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPDVARQQETLIEQARRLLRNVAESQELFIEAARTVLRLAAKLQEINIKQVELASEAGSGSG[DDEERRSEKTVQDAKREIKKVEDDLQRLNEEQKKKVKKQEDENQKTLKKHKDDARS]
>miniLOCKRa_1(SEQ ID NO:12)
(MGSSHHHHHHSSGLVPRGSHM)NKEDATEAQKKAIRAAEELLKDVTRIQERAIREAEKALERLARVQEEAIRRVYEAVESKNKEELKKVKEEIEELLRRLKRELDELEREIRELLKEIKEKADRLEKEIRDLIERIRRDRNASDEVVTRLARLNEELIRELREDVRRLAELNKELLRELERAARELARLNEKLLELADRVETE[EEARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLIREAAAASEKISRE]
>miniLOCKRa_2(SEQ ID NO:13)
(MGSSHHHHHHSSGLVPRGSHM)DERLKRLNERLADELDKDLERLLRLNEELARELTRAAEELRELNEKLVELAKKLQGGRSREVAERAEKEREKIRRKLEEIKKEIKEDADRIKKRADELRRRLEKTLEDAARELEKLKREPRTEELKRKATELQKEAIRRAEELLKEVTDVQRRAIERAEELLEKLARLQEEAIRTVYLLVELNKV[DRARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLIREAAAASEKISRE]
>miniLOCKRc_1(SEQ ID NO:14)
(MGSSHHHHHHSSGLVPRGSHM)LIERLTRLEKEHVRELKRLLDTSLEILRRLVEAFETNLRQLKEALKRALEAANLHNEEVEEVLRKLEEDLRRLEEELRKTLDDVRKEVKRLKEELDKRIKEVEDELRKIKEKLKKGDKNEKRVLEEILRLAEDVLKKSDKLAKDVQERARELNEILEELSRKLQELFERVVEEVTRNVPT[TERIEKVRRELKESLKENHKQNQKLLKDHKRAQEKLNRELEELKKKHKKTLDDIRRES]
>miniLOCKRc_2(SEQ ID NO:15)
(MGSSHHHHHHSSGLVPRGSHM)SEERVLELAEEALRLSDEAAKEIQELARRLNEELEKLSKELQDLFERIVETVTRLIDADEETLKRAAEEIKKRLEDARKKAKEAADKAREELDRARKKLKELVDEIRKKAKDALEKAGADEELVARLLRLLEEHARELERLLRTSARIIERLLDAFRRNLEQLKEAADKAVEAAEEAVRRVED[VRVWSEKVRRELKESLKENHKQNQKLLKDHKRAQEKLNRELEELKKKHKKTLDDIRRES]
>1fix-short-noBim-t0(SEQ ID NO:16)
(MGSHHHHHHGSGSENLYFQGSGG)SELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESEKILEEAREAISGSGSELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIREALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKGSGSGS[ELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDPDEARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLIR]
>1fix-short-noBim(AYYA)-t0(SEQ ID NO:17)
(MGSHHHHHHGSGSENLYFQGSGG)SELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESEKILEEAREAISGSGSELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIREALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKGSGSGS[ELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDPDEARKAIARVKRESNAYYADAERLIREAAAASEKISREAERLIR]
“(3)具有编码到闩锁中的生物活性肽的功能性LOCKR笼式设计”,
>aBcl2LOCKR(SEQ ID NO:18)
>pBimLOCKR(SEQ ID NO:19)
>BimLOCKR_extend5(SEQ ID NO:20)
>BimLOCKR_extend9(SEQ ID NO:21)
(MGSSHHHHHHSSGLVPRGSHM)KLAEKLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAGSGSGSLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAAGSGSGSIELARELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTD[EIWIAQELRRIGDEFNAYYADAERLIREAAAASEKISREAERLIREAA]
>BimLOCKR_extend18(SEQ ID NO:22)
>BimLOCKRb(SEQ ID NO:23)
>BimLOCKRc(SEQ ID NO:24)
>BimLOCKRd(SEQ ID NO:25)
>StrepLOCKRa_300(SEQ ID NO:26)
>strepLOCKRa_306(SEQ ID NO:27)
>strepLOCKRa_309(SEQ ID NO:28)
>strepLOCKRa_312(SEQ ID NO:29)
>strepLOCKRa_313(SEQ ID NO:30)
>strepLOCKRa_317(SEQ ID NO:31)
>strepLOCKRa_320(SEQ ID NO:32)
>strepLOCKRa_323(SEQ ID NO:33)
>strepLOCKRa_329(SEQ ID NO:34)
>SB13_LOCKR(SEQ ID NO:35)
>ZCX12_LOCKR(SEQ ID NO:36)
>SB13_LOCKR_extend18(SEQ ID NO:37)
>ZCX12_LOCKR_extend18(SEQ ID NO:38)
>fretLOCKRa(SEQ ID NO:39)
>fretLOCKRb(SEQ ID NO:40)
>fretLOCKRc(SEQ ID NO:41)
>fretLOCKRd(SEQ ID NO:42)
>tevLOCKR(SEQ ID NO:43)
>spyLOCKR(SEQ ID NO:44)
>1_nesLOCKR(SEQ ID NO:45)
>2_nesLOCKR(SEQ ID NO:46)
>3_nesLOCKR(SEQ ID NO:47)
>nlsLOCKR(SEQ ID NO:48)
>ezh2LOCKR(SEQ ID NO:49)
>1fix_VMAc_C_BIMlatcht9(SEQ ID NO:51)
>sfGFP_VMAn_1fix_BIM_t0_latch(SEQ ID NO:52)
编码Bim和GFP11的非对称功能笼(即:生物活性肽)
(6His-MBP-TEV、6His-TEV和柔性接头序列是带下划线的文本)
(共定位结构域是粗体文本)
(功能肽是斜体带下划线的文本)
(可以突变为任何氨基酸以调整响应性的位置是带下划线的加粗文本)
(可以被去除以调整响应性的C-末端序列是斜体文本)
(括号中的所有序列均是任选的)
>1fix-long-BIM-t0(SEQ ID NO:54)
>1fix-long-GFP-t0(SEQ ID NO:55)
>1fix-short-BIM-t0(SEQ ID NO:56)
>1fix-short-GFP-t0(SEQ ID NO:57)
>Spycatcher-1fix-long-GFP-t0(SEQ ID NO:58)
>Spycatcher-1fix-short-GFP-t0(SEQ ID NO:59)
>1fix-latch_Mad1SID_t0_1(SEQ ID NO:61)
>1fix-latch_Mad1SID_T0_2(SEQ ID NO:65)
>1fix-short-Bim-t0-relooped(SEQ ID NO:67)
>1fix-short-spytag-t0_2(SEQ ID NO:68)
>1fix-short-spytag-t0_8(SEQ ID NO:69)
>1fix-short-TEV-t0_1(SEQ ID NO:70)
>1fix-short-TEV-t0_6(SEQ ID NO:71)
>1fix-short-nanoBit-t0_1(SEQ ID NO:72)
>1fix-short-nanoBit-t0_3(SEQ ID NO:73)
>1fix-short-RHIM-t0_8(SEQ ID NO:74)
>1fix-short-RHIM-t0_19(SEQ ID NO:75)
>1fix-short-RHIM-t0_22(SEQ ID NO:76)
>1fix-short-gcn4-t0_4(SEQ ID NO:77)
(MGSSHHHHHHSSGLVPRGSHM)SELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESEKILEEAREAISGSGSELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIREALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKGSGSGSELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDP[DESVKE(LEDKVEELLSKNYHLENEVARLKKLVGER)SREAERLIR]
>1fix-short-ccDi-t0_6(SEQ ID NO:78)
>1fix-short-cc-a-t0_6(SEQ ID NO:79)
>1fix-short-cc-b-t0_6(SEQ ID NO:80)
STREPII-LOCKR功能笼:
>STREPII-2plus1_LOCK_1(SEQ ID NO:81)
>STREPII-2plus1_LOCK_2(SEQ ID NO:82)
>STREPII-2plus1_LOCK_3(SEQ ID NO:83)
>STREPII-2plus1_LOCK_4C(SEQ ID NO:84)
>STREPII-2plus1_LOCK_4N(SEQ ID NO:85)
>STREPII-3plus1_LOCK_1(SEQ ID NO:86)
>STREPII-3plus1_LOCK_2(SEQ ID NO:87)
>STREPII-3plus1_LOCK_3(SEQ ID NO:88)
>STREPII-3plus1_LOCK_4(SEQ ID NO:89)
>STREPII-3plus1_LOCK_3-relooped(SEQ ID NO:90)
>STREPII-2plus1_LOCK_3-relooped(SEQ ID NO:91)
>BimLOCKR_a_short_Nterm(SEQ ID NO:27094)
>BimLOCKR_g(SEQ ID NO:27095)
>reloop_strepLOCKRh(SEQ ID NO:27096)
>reloop_strepLOCKRi(SEQ ID NO:27097)
>spyLOCKRa_2(SEQ ID NO:27098)
>spyLOCKRa_8(SEQ ID NO:27099)
>tevLOCKRa_1(SEQ ID NO:27100)
>tevLOCKRa_6(SEQ ID NO:27101)
>lucLOCKRa_1(SEQ ID NO:27102)
>lucLOCKRa_3(SEQ ID NO:27103)
>rhimLOCKRa_8(SEQ ID NO:27104)
>rhimLOCKRa_19(SEQ ID NO:27105)
>rhimLOCKRa_22(SEQ ID NO:27106)
>gcn4LOCKRa_4(SEQ ID NO:27107)
>cc-DiLOCKRa_6(SEQ ID NO:27108)
>cc-aLOCKRa_6(SEQ ID NO:27109)
>cc-bLOCKRa_6(SEQ ID NO:27110)
>tev-spyLOCKRa_short_40(SEQ ID NO:27111)
>tev-spyLOCKRa_short_57(SEQ ID NO:27112)
>tev-spyLOCKRa_short_63(SEQ ID NO:27113)
>tev-spyLOCKRa_29(SEQ ID NO:27114)
>tev-spyLOCKRa_32(SEQ ID NO:27115)
>Bim-fretLOCKRa_short(SEQ ID NO:27116)
>fretLOCKRa_short(SEQ ID NO:27117)
E18_KRAB_full(SEQ ID NO:27120)
E18_KRAB_N13t(SEQ ID NO:27121)
E18_KRAB_C9t(SEQ ID NO:27122)
E18_KRAB_Cterm1(SEQ ID NO:27123)
E18_KRAB_Cterm2(SEQ ID NO:27124)
E18_KRAB_Cterm3(SEQ ID NO:27125)
>3plus1_Cage_Nterm_GFP11_668(SEQ ID NO:27278)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRDHMVLHEYVNAAGITLEELRRGSLDAKELLKTLEDLLREVLEVARRVVETLKELNRRVLEVVREDIEANERLLRRVLDTLRRGGVDERRIKDLERLIRESLKKAEEVLREAAEKSREIVDEIREVLKRADEALKRIIKKIRETRGADALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_Cage_Cterm_GFP11_668(SEQ ID NO:27279)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRLEKELRDLKRRIEEKLEELRRGSLDAKELLKTLEDLLREVLEVARRVVETLKELNRRVLEVVREDIERNERLLRRVLDTLRRGGVDERRIKDLERLIRESLKKAEEVLREAAEKSREIVDEIREVLKRADEALKRIIKKIRETRGADADHMVLHEYVNAAGITIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_Cage_Cterm_GFP11_668(SEQ ID NO:27280)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRLEKELRDLKRRIEEKLEELRRGSLDAKELLKTLEDLLREVLEVARRVVETLKELNRRVLEVVREDIERNERLLRRVLDTLRRGGVDERRIKDLERLIRESLKKAEEVLREAAEKSREIVDEIREVLKRADEALKRIIKKIRETRGADARDHMVLHEYVNAAGITRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_Cage_Cterm_GFP11_668(SEQ ID NO:27281)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRLEKELRDLKRRIEEKLEELRRGSLDAKELLKTLEDLLREVLEVARRVVETLKELNRRVLEVVREDIERNERLLRRVLDTLRRGGVDERRIKDLERLIRESLKKAEEVLREAAEKSREIVDEIREVLKRADEALKRIIKKIRETRGADALSRDHMVLHEYVNAAGITLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_Cage_Cterm_GFP11_668(SEQ ID NO:27282)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRLEKELRDLKRRIEEKLEELRRGSLDAKELLKTLEDLLREVLEVARRVVETLKELNRRVLEVVREDIERNERLLRRVLDTLRRGGVDERRIKDLERLIRESLKKAEEVLREAAEKSREIVDEIREVLKRADEALKRIIKKIRDHMVLHEYVNAAGITLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_Cage_Nterm_GFP11_669(SEQ ID NO:27283)
SEKEKLLKESEEEVRRLRRTLEELLRKYREVLERLRDHMVLHEYVNAAGITRLKEVLDRSGLDIDTIIKEVEDLLKTVLDRLRELLDKIARLTKEAIEVVREIIERIVRHAERVKDELRKGGADKRKLDRVDRLIKENTRHLKEILDRIEDLVRRSEKKLRDIIREVRRLIEELRKKAEEIKKDPDERLVKTLIEDVERVIKRILELITRVAEDNERVLERIIRELTDNLERHLKIVREIVK
>3plus1_Cage_Nterm_GFP11_670(SEQ ID NO:27284)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIERDHMVLHEYVNAAGITISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_Cage_Cterm_GFP11_670(SEQ ID NO:27285)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLREISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEARDHMVLHEYVNAAGITRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_Cage_Cterm_GFP11_670(SEQ ID NO:27286)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLREISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDERDHMVLHEYVNAAGITIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_Cage_Cterm_GFP11_670(SEQ ID NO:27287)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLREISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGRDHMVLHEYVNAAGITRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_Cage_Nterm_GFP11_670(SEQ ID NO:27288)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIRDHMVLHEYVNAAGITEISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_Cage_Cterm_GFP11_670(SEQ ID NO:27289)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLREISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTRDHMVLHEYVNAAGITRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_Cage_Nterm_GFP11_670(SEQ ID NO:27290)
SEKEDLARKLRKLVEELTREYEELVKKLERLIERDHMVLHEYVNAAGITLREISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_Cage_Nterm_GFP11_670(SEQ ID NO:27291)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKRDHMVLHEYVNAAGITSEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_Cage_Nterm_GFP11_670(SEQ ID NO:27292)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESRDHMVLHEYVNAAGITKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_Cage_Nterm_GFP11_670(SEQ ID NO:27293)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRDHMVLHEYVNAAGITLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_Cage_Cterm_GFP11_671(SEQ ID NO:27294)
SEEEDLLERVKRVLDELIEIVDRNHELNRRVVETSAALVERLLEEVERALETLEREIPGSSLLDKAIKDLRDVLRRVKEKVKRSIEELKEVLEESRRVLEEVVRKLREVIDRVRRLVEKGVDLRDLIRELKRVLEEAVKLIERLVRLNTRAAEKDNESLRELVRAIKEALKRAVDAVRKGGLDSRAVKKLDRDHMVLHEYVNAAGITNEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_Cage_Cterm_GFP11_671(SEQ ID NO:27295)
SEEEDLLERVKRVLDELIEIVDRNHELNRRVVETSAALVERLLEEVERALETLEREIPGSSLLDKAIKDLRDVLRRVKEKVKRSIEELKEVLEESRRVLEEVVRKLREVIDRVRRLVEKGVDLRDLIRELKRVLEEAVKLIERLVRLNTRAAEKDNESLRELVRAIKEALKRAVDAVRKGGLDSRARDHMVLHEYVNAAGITDVVRRNEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_Cage_Cterm_GFP11_671(SEQ ID NO:27296)
SEEEDLLERVKRVLDELIEIVDRNHELNRRVVETSAALVERLLEEVERALETLEREIPGSSLLDKAIKDLRDVLRRVKEKVKRSIEELKEVLEESRRVLEEVVRKLREVIDRVRRLVEKGVDLRDLIRELKRVLEEAVKLIERLVRLNTRAAEKDNESLRELVRAIKEALKRAVDAVRKGGLDSRRDHMVLHEYVNAAGITEDVVRRNEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_Cage_Cterm_GFP11_671(SEQ ID NO:27297)
SEEEDLLERVKRVLDELIEIVDRNHELNRRVVETSAALVERLLEEVERALETLEREIPGSSLLDKAIKDLRDVLRRVKEKVKRSIEELKEVLEESRRVLEEVVRKLREVIDRVRRLVEKGVDLRDLIRELKRVLEEAVKLIERLVRLNTRAAEKDNESLRELVRAIKEALKRAVDAVRKGGLRDHMVLHEYVNAAGITKKLEDVVRRNEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_Cage_Cterm_GFP11_672(SEQ ID NO:27298)
DETEEVIKKIAKLIDELIETLKKIVEDSAKLIKELIDLLEEIIKRSADLIRELEKVSKRGDRDRLKKLIDRMRRETERALEELRRVIEELKEATERALKTIEDLIREIEEAIRRELGDEDLAREILEVIRRILELLREDMELNLRALEEILRLLEEVIKLNKDAIDEILELLKRDHMVLHEYVNAAGITESKKLVRDVVEEAKRLLKENRDSTRKIIEDIRRLLRKIEDSTR
>3plus1_Cage_Cterm_GFP11_672(SEQ ID NO:27299)
DETEEVIKKIAKLIDELIETLKKIVEDSAKLIKELIDLLEEIIKRSADLIRELEKVSKRGDRDRLKKLIDRMRRETERALEELRRVIEELKEATERALKTIEDLIREIEEAIRRELGDEDLAREILEVIRRILELLREDMELNLRALEEILRLLEEVIKLNKDAIDEILELLKGRDHMVLHEYVNAAGITSKKLVRDVVEEAKRLLKENRDSTRKIIEDIRRLLRKIEDSTR
>3plus1_Cage_Nterm_GFP11_67>3(SEQ ID NO:27300)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLARDHMVLHEYVNAAGITEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEAAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_Cage_Nterm_GFP11_67>3(SEQ ID NO:27301)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRRDHMVLHEYVNAAGITGVPEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEAAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_Cage_Cterm_GFP11_67>3(SEQ ID NO:27302)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGVPEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEARDHMVLHEYVNAAGITRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_Cage_Nterm_GFP11_67>3(SEQ ID NO:27303)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERARDHMVLHEYVNAAGITELREKGVPEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEAAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_Cage_Nterm_GFP11_67>3(SEQ ID NO:27304)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDHMVLHEYVNAAGITKGVPEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEAAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_Cage_Nterm_GFP11_67>3(SEQ ID NO:27305)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLRDHMVLHEYVNAAGITEKGVPEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEAAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_Cage_Nterm_GFP11_67>3(SEQ ID NO:27306)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLRDHMVLHEYVNAAGITPEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEAAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_Cage_Nterm_GFP11_674(SEQ ID NO:27307)
SEREEVKEKLDRLLEEVEKTVRELKREHDELLKEVEKLVRDLKRDHMVLHEYVNAAGITKEILDVIREHVRTNKEILDRVLEVVEEHLRRNKEILDKLLDDIRKVVEDAKRILGIGDDETLRRAVRRILEELRKLVEDIRKKVKDSLETLERALEEAEERIRRSLEDLKRVLKEAKDKTKDKDRLDKVEELVKKLLEDTKRTVDRVRELVRKILKKSRETLEELERLIEKILRELEKDAR
>3plus1_Cage_Cterm_GFP11_674(SEQ ID NO:27308)
SEREEVKEKLDRLLEEVEKTVRELKREHDELLKEVEKLVRDLKKEHDELLKKVKDDGVPKEILDVIREHVRTNKEILDRVLEVVEEHLRRNKEILDKLLDDIRKVVEDAKRILGIGDDETLRRAVRRILEELRKLVEDIRKKVKDSLETLERALEEAEERIRRSLEDLKRVLKEAKDKTKDKDRDHMVLHEYVNAAGITKRTVDRVRELVRKILKKSRETLEELERLIEKILRELEKDAR
>3plus1_Cage_Nterm_GFP11_675(SEQ ID NO:27309)
SERETVKRRLEELLKEVKRTLDKLKEEHDRLLEDVRRVVEELRDHMVLHEYVNAAGITPEELLRVIAKVLETNKRILDDLLRVVKKHVDLNKEILDRILEMIKEIVERVKRVLGDGDEKTLRDKIRDIIRRLEDAAREAEERVRRSLEELKKAVEKIRKKIEDSLRELEEALKRVRDKEEDDKRLEDISRLVKRLLDESRRVLRELEETIRKRAEESKRVLEEVKRLVEKLIRELRKEAE
>3plus1_Cage_Nterm_GFP11_676(SEQ ID NO:27310)
SEDEIIKKIIEDLRRVLKEVEEIHKEVEERLDKRDHMVLHEYVNAAGITDRVLDEVKRIGDVETVLRLAIEAVRRALEIVRKVTEDLIRVVRKLLEIVDAVNKRVKKAVEDVLKLLRDTLKGSKDVERVLDEARRLLEKLHRDSRRILKRIAELLDELKELSERILERIKRLLEEVERRGSDDERLLEELIEELKDLIRRHIELLRRLIERLKELLKKHIEDLRRLLEEIEKLLEEARK
>3plus1_Cage_Nterm_GFP11_677(SEQ ID NO:27311)
SREEVLRELEEVIEDNRRLLEELIEKSKKVLDESLKLIDELLRRDHMVLHEYVNAAGITSKGDDEETARRIVTKIRKELEDVLDEVRRIVKEILDRDRRVAEDLKRVVDENLEKLKKVLDELDKKLGDRRLVEILRDIVRLLIEINERALRELLKLHEEHTRIVAELLRELERVVEELRRLVELIARGEISEDDLKRVVDEVEKKLRELKRRYKEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_Cage_Cterm_GFP11_677(SEQ ID NO:27312)
SREEVLRELEEVIEDNRRLLEELIEKSKKVLDESLKLIDELLRRLEEVLERVLRLLEELSKGDDEETARRIVTKIRKELEDVLDEVRRIVKEILDRDRRVAEDLKRVVDENLEKLKKVLDELDKKLGDRRLVEILRDIVRLLIEINERALRELLKLHEEHTRIVAELLRELERVVEELRRLVELIARGEISEDDRDHMVLHEYVNAAGITRRYKEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_Cage_Cterm_GFP11_677(SEQ ID NO:27313)
SREEVLRELEEVIEDNRRLLEELIEKSKKVLDESLKLIDELLRRLEEVLERVLRLLEELSKGDDEETARRIVTKIRKELEDVLDEVRRIVKEILDRDRRVAEDLKRVVDENLEKLKKVLDELDKKLGDRRLVEILRDIVRLLIEINERALRELLKLHEEHTRIVAELLRELERVVEELRRLVELIARGERDHMVLHEYVNAAGITLRELKRRYKEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_Cage_Nterm_GFP11_678(SEQ ID NO:27314)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRDHMVLHEYVNAAGITLDDLRRGGIREELLKRIADVIRDIMRLLKELHDHTAEVIKTIKKLLKELHDINKEIIERLKRLKDGNVPKEELLKRVEELVRTSARLTTEVLKTVEKLIRDDKRLSEEILKRVKELIEELKRGVDSERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_Cage_Cterm_GFP11_678(SEQ ID NO:27315)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGIREELLKRIADVIRDIMRLLKELHDHTAEVIKTIKKLLKELHDINKEIIERLKRLKDGNVPKEELLKRVEELVRTSARLTTEVLKTVEKLIRDDKRLSEEILKRVKELIEELRDHMVLHEYVNAAGITLRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_Cage_Nterm_GFP11_678(SEQ ID NO:27316)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDRDHMVLHEYVNAAGITRRGGIREELLKRIADVIRDIMRLLKELHDHTAEVIKTIKKLLKELHDINKEIIERLKRLKDGNVPKEELLKRVEELVRTSARLTTEVLKTVEKLIRDDKRLSEEILKRVKELIEELKRGVDSERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_Cage_Cterm_GFP11_678(SEQ ID NO:27317)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGIREELLKRIADVIRDIMRLLKELHDHTAEVIKTIKKLLKELHDINKEIIERLKRLKDGNVPKEELLKRVEELVRTSARLTTEVLKTVEKLIRDDKRLSEEILKRVKELIEELKRGRDHMVLHEYVNAAGITVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_Cage_Nterm_GFP11_678(SEQ ID NO:27318)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKRDHMVLHEYVNAAGITLRRGGIREELLKRIADVIRDIMRLLKELHDHTAEVIKTIKKLLKELHDINKEIIERLKRLKDGNVPKEELLKRVEELVRTSARLTTEVLKTVEKLIRDDKRLSEEILKRVKELIEELKRGVDSERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_Cage_Nterm_GFP11_678(SEQ ID NO:27319)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRDHMVLHEYVNAAGITGGIREELLKRIADVIRDIMRLLKELHDHTAEVIKTIKKLLKELHDINKEIIERLKRLKDGNVPKEELLKRVEELVRTSARLTTEVLKTVEKLIRDDKRLSEEILKRVKELIEELKRGVDSERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_Cage_Cterm_GFP11_679(SEQ ID NO:27320)
SRVEELKKLIEDILRISREVVERIKRVAEDIHRINRRVLDDLRKLIEDILRTVEEILARKVGDTEIAERLRDTIARVVDEIAKLLEEHEKRSRELLEEIRKLLEDILRRSERAVEEIRELLKKGVSTKDVLRIIEEILREHLELLERVVRRIEEILRELLKTIEEIVKRIKEILEELKEVLKRGRVKDDEVERDHMVLHEYVNAAGITYRRLLEEIKRKLEEILRRVEELHRRLRRKLEEIDR
>3plus1_Cage_Nterm_GFP11_679(SEQ ID NO:27321)
SRVEELKKLIEDILRISREVVERIKRVAEDIHRINRRVRDHMVLHEYVNAAGITEILARKVGDTEIAERLRDTIARVVDEIAKLLEEHEKRSRELLEEIRKLLEDILRRSERAVEEIRELLKKGVSTKDVLRIIEEILREHLELLERVVRRIEEILRELLKTIEEIVKRIKEILEELKEVLKRGRVKDDEVEREIRRVKEDLDRILEEYRRLLEEIKRKLEEILRRVEELHRRLRRKLEEIDR
在每个实施方式中,每个笼多肽的N-末端和/或C-末端60个氨基酸可以是任选的,因为末端60个氨基酸残基可以包含可以诸如通过替代全部或部分具有生物活性肽的闩锁而被修饰的闩锁区域。在一个实施方式中,N-末端60个氨基酸残基是任选的;在另一个实施方式中,C-末端60个氨基酸残基是任选的;在另一个实施方式中,N-末端60个氨基酸残基和C-末端60个氨基酸残基中的每一个均是任选的。在一个实施方式中,这些任选的N-末端和/或C-末端60个残基在确定序列同一性百分比中不包括。在另一个实施方式中,任选的残基可以在确定序列同一性百分比中包括。
如本文所公开的,将被本公开的多肽螯合的生物活性肽位于闩锁区域内。闩锁区域在每个笼多肽的序列中用括号表示。可以将生物活性肽添加到闩锁区域而不去除闩锁区域的任何残基,或者可以替代笼支架闩锁区域中的一个或多个(1、2、3、4、5、6、7、8、9、10或更多个)氨基酸残基以产生最终多肽。因此,当包含生物活性肽时,闩锁区域可以被显著修饰。在一个实施方式中,任选的残基在确定序列同一性百分比中不包括。在另一个实施方式中,闩锁区域残基可以在确定序列同一性百分比中包括。在另一个实施方式中,任选的残基和闩锁残基中的每个均在确定序列同一性百分比中不包括。
包括降解决定子的笼多肽可以是笼支架多肽(即:没有生物活性肽),例如,参见SEQ ID NO:1-17、2034-14317、27359-28465,以及表2、表3、表4和/或表5中列出的某些笼多肽,或者可以进一步在笼支架多肽的闩锁区域中包括螯合生物活性肽(作为与笼支架多肽的融合体存在),如本文中更详细描述的(例如,参见SEQ ID NO:18-49、51-52、54-59、61、65、67-2033、27094-27117、27120-27125,以及表2、3、4和/或5中列出的某些笼多肽)。在一个具体实施方式中,笼多肽沿着其长度与表2、表表4和/或表5中笼多肽的氨基酸序列共享40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性并且还包含一个或多个降解决定子。
在另一个具体实施方式中,笼多肽包含沿着其长度与表3中笼多肽的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的多肽并且包括一个或多个降解决定子。在另一个具体实施方式中,笼多肽沿着其长度与表4中笼多肽的氨基酸序列共享40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性并且包括一个或多个降解决定子。在这些实施方式中的每个的一个实施方式中,任选的N-末端和/或C-末端60个残基在确定序列同一性百分比中不包括。在另一个实施方式中,任选的残基可以在确定序列同一性百分比中包括。
在另一个具体实施方式中,笼多肽包含沿着其长度与由SEQ ID NO:27359-28465组成的组中的笼多肽或表7中列出的笼多肽的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的多肽。
在一些方面,闩锁区域和钥匙多肽两者均可以结合到对应笼多肽中的结构区域或与其相互作用。笼多肽中的闩锁区域与结构区域之间的相互作用可以是分子内相互作用,而钥匙多肽与对应笼多肽的结构区域之间的相互作用可以是分子间相互作用。然而,在一些方面,在不存在效应多肽的情况下,闩锁区域对笼多肽的结构区域的亲和力高于钥匙多肽对笼多肽的结构区域的亲和力。
在一些方面,在不存在效应多肽的情况下,闩锁区域对笼多肽的结构区域的亲和力比钥匙多肽对笼多肽的结构区域的亲和力高至少约1.5倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约16倍、至少约17倍、至少约18倍、至少约19倍、至少约20倍、至少约21倍、至少约22倍、至少约23倍、至少约24倍、至少约25倍、至少约26倍、至少约27倍、至少约28倍、至少约29倍或至少约30倍。在一些方面,在不存在效应多肽的情况下,闩锁区域对笼多肽的结构区域的亲和力比钥匙多肽对笼多肽的结构区域的亲和力高至少约1.1倍、至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2.0倍、至少约2.1倍、至少约2.2倍、至少约2.3倍、至少约2.4倍、至少约2.5倍、至少约2.6倍、至少约2.7倍、至少约2.8倍、至少约2.9倍或至少约3.0倍。在一些方面,在不存在效应多肽的情况下,闩锁区域对笼多肽的结构区域的亲和力比钥匙多肽对笼多肽的结构区域的亲和力高至少约30倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍、至少约100倍、至少约110倍、至少约120倍、至少约130倍、至少约140倍、至少约150倍、至少约160倍、至少约170倍、至少约180倍、至少约190倍、至少约200倍、至少约210倍、至少约220倍、至少约230倍、至少约240倍、至少约250倍、至少约260倍、至少约270倍、至少约280倍、至少约290倍、至少约300倍,例如约30倍至约300倍、例如约100倍至约300倍、约50倍至约100倍。
在其他实施方式中,分子内闩锁-笼亲和力高于分子间钥匙-笼亲和力,并且在效应蛋白的存在下,分子间钥匙-笼亲和力高于分子内闩锁-笼亲和力。因此,生物活性肽的功能取决于笼、钥匙和效应蛋白的存在。
在某些实施方式中,在不存在效应蛋白的情况下,分子间钥匙-笼相互作用可以胜过闩锁-笼相互作用。在不存在钥匙的情况下,闩锁-笼亲和力高于闩锁-效应蛋白亲和力(经由生物活性肽与效应蛋白的结合),并且在存在钥匙的情况下,闩锁-效应蛋白亲和力(经由生物活性肽与效应蛋白的结合)高于闩锁-笼亲和力。因此,生物活性肽的功能取决于笼、钥匙和效应蛋白的存在。
如以下实施例中所公开的,已经鉴定了本公开的示例性笼(和钥匙)多肽并进行了突变分析。此外,从相同的示例性笼和钥匙多肽开始的不同设计产生了不同的氨基酸序列,同时保持了相同的预期功能。在各种实施方式中,给定的氨基酸可以被具有相似生理化学特征的残基替代,例如,用一个脂肪族残基取代另一个(诸如Ile、Val、Leu或Ala彼此间的取代),或用一个极性残基取代另一个(诸如在Lys与Arg之间;Glu与Asp之间;或Gln与Asn之间)。其他此类保守取代(例如,具有相似疏水性特征的整个区域的取代)是已知的。可以在本文所述的任一种测定中测试包含保守氨基酸取代的多肽,以确认保留了所需活性。氨基酸可以根据其侧链特性的相似特性被分组(A.L.Lehninger,Biochemistry第二版,第73-75页,Worth Publishers,New York(1975)):(1)非极性:Ala(A)、Val(V)、Leu(L)、Ile(I)、Pro(P)、Phe(F)、Trp(W)、Met(M);(2)不带电荷极性:Gly(G)、Ser(S)、Thr(T)、Cys(C)、Tyr(Y)、Asn(N)、Gln(Q);(3)酸性Asp(D)、Glu(E);(4)碱性Lys(K)、Arg(R)、His(H)。可选地,天然存在的残基可以基于常见的侧链特性被分成组:(1)疏水性:正亮氨酸、Met、Ala、Val、Leu、Ile;(2)中性亲水性:Cys、Ser、Thr、Asn、Gln;(3)酸性:Asp、Glu;(4)碱性:His、Lys、Arg;(5)影响链取向的残基:Gly、Pro;(6)芳族:Trp、Tyr、Phe。非保守取代将需要将这些类别中的一类的成员更换成另一类别。特定的保守取代包括例如:Ala变为Gly或变为Ser;Arg变为Lys;Asn变为Gln或变为His;Asp变为Glu;Cys变为Ser;Gln变为Asn;Glu变为Asp;Gly变为Ala或变为Pro;His变为Asn或变为Gln;Ile变为Leu或变为Val;Leu变为Ile或变为Val;Lys变为Arg、变为Gln或变为Glu;Met变为Leu、变为Tyr或变为Ile;Phe变为Met、变为Leu或变为Tyr;Ser变为Thr;Thr变为Ser;Trp变为Tyr;Tyr变为Trp;和/或Phe变为Val、变为Ile或变为Leu。
在第二方面,本公开提供了试剂盒,其包含:
(a)根据第一方面的任何实施方式或实施方式组合的笼多肽;和
(b)钥匙多肽,其能够结合笼多肽结构区域,从而置换闩锁区域并激活一个或多个降解决定子。
在第三方面,本公开提供了降解决定子LOCKR开关,其包含:
(a)第十一方面的任何实施方式或实施方式组合的笼多肽;和
(b)钥匙多肽,其能够结合笼多肽结构区域,从而置换闩锁区域并激活一个或多个降解决定子。
如本文所详细公开,当钥匙被表达并且通过与结构区域相互作用并用从与结构区域的相互作用(即,通过比闩锁区域高的亲和力结合)置换出闩锁来激活笼多肽,降解决定子靶向笼多肽和与笼多肽融合的任何功能多肽结构域以便降解。以此方式,与具有降解决定子的笼多肽融合的感兴趣的功能多肽结构域可以通过钥匙的表达以可滴定的方式进行条件性降解。
在第二和第三方面的试剂盒和降解决定子LOCKR开关的一个实施方式中,钥匙多肽包含沿着选自SEQ ID NO:14318-26601、26602-27015、27016-27050、27322至27358的钥匙蛋白(不包括任选的氨基酸残基)和表2或5(在SEQ ID NO:27127与27277之间奇数编号的多肽)、表3和/或表4中的钥匙多肽(不包括任选的氨基酸残基)的氨基酸序列的长度具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。如所指出的,钥匙多肽可以包括任选的残基;这些残基在括号中提供,并且在一个实施方式中在确定序列同一性百分比中不包括。在另一个实施方式中,任选的残基可以在确定序列同一性百分比中包括。
在另一个实施方式中,钥匙多肽包含沿着其长度与选自由SEQ ID NO:26602-27050和27322-27358和28477-28486组成的组中的钥匙多肽的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的多肽,如下详述。
降解决定子LOCKR(degronLOCKR)的额外钥匙的氨基酸序列
(SEQ ID NO:28477-28486)
>key_a(SEQ ID NO:28477)
EARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLIREAAAASEKISRE
>key_a_m4(SEQ ID NO:28478)
DEARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLIREAAAASEK
>key_a_m9(SEQ ID NO:28479)
DEARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLIREAAK
>key_a_m12(SEQ ID NO:28480)
DEARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLIR
>key_a_m15(SEQ ID NO:28481)
DEARKAIARVKRESKRIVEDAERLIREAAAASEKISREAER
>key_b(SEQ ID NO:28482)
NKEEIEKLAKEAREKLKKAEKEHKEIHDKLRKKNKKAREDLKKKADELRETNKRVN
>key_c(SEQ ID NO:28483)
SSEKVRRELKESLKENHKQNQKLLKDHKRAQEKLNRELEELKKKHKKTLDDIRRES
>key_d(SEQ ID NO:28484)
DTVKRILEELRRRFEKLAKDLDDIARKLLEDHKKHNKELKDKQRKIKKEADDAARS
>key_d_m4(SEQ ID NO:28485)
RILEELRRRFEKLAKDLDDIARKLLEDHKKHNKELKDKQRKIKKEADDAARS
>key_d_m7(SEQ ID NO:28486)
EELRRRFEKLAKDLDDIARKLLEDHKKHNKELKDKQRKIKKEADDAARS
·钥匙序列是普通文本
·6His-MBP-TEV、6His-TEV和柔性接头序列是带下划线的文本
·以粗体、斜体显示的序列是MBP_钥匙生物素化所必需的任选残基
·括号中的所有序列均是任选的
·可以去除非任选钥匙序列中N或C-末端的任何数量的连续氨基酸,以调整响应性
>SB76_C-helix(SEQ ID NO:27016)
DEARKAIARVKRESKRIVEDAERLIREAAAASEKIS
>SB76_C-helix-biotin(SEQ ID NO:27017)
DEARKAIARVKRESKRIVEDAERLIREAAAASEKISGSGK-Biotin
>p5_MBP(SEQ ID NO:27018)
>p9_MBP(SEQ ID NO:27019)
>p18_MBP(SEQ ID NO:27020)
>MBP_p18(aka.p76)(SEQ ID NO:27021)
>key_b(SEQ ID NO:27022)
(M)NKEEIEKLAKEAREKLKKAEKEHKEIHDKLRKKNKKAREDLKKKADELRETNKRVN(GSENLYFQ GSGSGKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYA QSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSAL MFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETA MTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPL GAVALKSYEEELVKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTNLEHHHHHH)
>key_c(SEQ ID NO:27023)
(M)SSEKVRRELKESLKENHKQNQKLLKDHKRAQEKLNRELEELKKKHKKTLDDIRRES(GSENLYFQ GSGSGKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYA QSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSAL MFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETA MTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPL GAVALKSYEEELVKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTNLEHHHHHH)
>key_d(SEQ ID NO:27024)
(M)DTVKRILEELRRRFEKLAKDLDDIARKLLEDHKKHNKELKDKQRKIKKEADDAARS(GSENLYFQ GSGSGKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYA QSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSAL MFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETA MTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPL GAVALKSYEEELVKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTNLEHHHHHH)
>key_e(SEQ ID NO:27025)
(M)DDVERRLRKANKESKKEAEELTEEAKKANEKTKEDSKELTKENRKTNKTIKDEARS(GSENLYFQ GSGSGKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYA QSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSAL MFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETA MTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPL GAVALKSYEEELVKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTNLEHHHHHH)
>key_f(SEQ ID NO:27026)
(M)DDEERRSEKTVQDAKREIKKVEDDLQRLNEEQKKKVKKQEDENQKTLKKHKDDARS(GSENLYFQ GSGSGKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYA QSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSAL MFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETA MTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPL GAVALKSYEEELVKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTNLEHHHHHH)
额外钥匙:
钥匙序列是普通文本
(6His-MBP-TEV、6His-TEV和柔性接头序列是带下划线的文本)
(共定位结构域是粗体文本)
(可以突变为任何氨基酸以调整响应性的位置是带下划线的加粗文本。这些是示例性的,但并不详尽。)
(可以去除非任选钥匙序列中N或C-末端的任何数量的连续氨基酸,以调整响应性)
(括号中的所有序列均是任选的)
>p76-long(SEQ ID NO:27027)
>p76-short(SEQ ID NO:27028)
>k76-long(SEQ ID NO:27029)
>k76-short(SEQ ID NO:27030)
>p76_GLISE(SEQ ID NO:27031)
(MGSHHHHHHGSGSENLYFQGSGGS)DEARKAIARVKRESKRIVEDAEGLISEAAAASEKISREAERLIREAAAASEKISRE
>p76_GSSEKIS(SEQ ID NO:27032)
(MGSHHHHHHGSGSENLYFQGSGGS)DEARKAIARVKRESKRIVEDAERLIREAAGSSEKISREAERLIREAAAASEKISRE
>p76_R26G(SEQ ID NO:27033)
(MGSHHHHHHGSGSENLYFQGSGGS)DEARKAIARVKRESKRIVEDAERLIGEAAAASEKISREAERLIREAAAASEKISRE
>p76-short_E19G(SEQ ID NO:27034)
(MGSHHHHHHGSGSENLYFQGSGGS)DEARKAIARVKRESKRIVGDAERLIREAAAASEKISREAERLIR
>p76-short_GLISE_E01_EGFR(SEQ ID NO:27035)
(MGSHHHHHHGSGSENLYFQGSGGS)DEARKAIARVKRESKRIVEDAEGLISEAAAASEKISREAERLIR
>p76-short_AE_EGFR(SEQ ID NO:27036)
(MGSHHHHHHGSGSENLYFQGSGGS)DEARKAIARVAEESKRIVEDAERLIREAAAASEKISREAERLIR
>p76-short_AAE_EGFR(SEQ ID NO:27037)
(MGSHHHHHHGSGSENLYFQGSGGS)DEAAKAIARVAEESKRIVEDAERLIREAAAASEKISREAERLIR
>p76-short_EE_EGFR(SEQ ID NO:27038)
(MGSHHHHHHGSGSENLYFQGSGGS)DEARKAIARVKRESKRIVEDAERLIREAAEASEEISREAERLIR
>p76-spytag(SEQ ID NO:27039)
>p76-short-spytag(SEQ ID NO:27040)
>sfGFP_VMAn_p18(SEQ ID NO:27041)
>p18_VMAc_mCherry(SEQ ID NO:27042)
(用于2plus1和3plus1 STREPII-LOCKR功能笼设计的同源钥匙):
>2plus1_KEY_100000.fasta alt_STREP_2plus1_1(SEQ ID NO:27043)
DKVRKVAEVAEKVLRDIDKLDRESKEAFRRTNGEISKLDEDTRRVAERVKKAIEDLAK
>2plus1_KEY_2(SEQ ID NO:27044)
SEVDEIIADNERALDEVRREVEEIDKENAERLKEWVEEAREILDRLAKALEEIR
>2plus1_KEY_3(SEQ ID NO:27045)
PEEALSKAIKDVRDIVKKVKDELKEWRDRNKELVDRLSEELKEWLKDVERVLKELTDKDR
>2plus1_KEY_4(SEQ ID NO:27046)
DERVREELKKLLTRVEEEHRKVLETDKKILKEAHKESKEVNDRDRELLERLEESVR
>3plus1_KEY_1(SEQ ID NO:27047)
SRLVKKLDEIVKEVAKKLEDVVRANEELWRKLVELNKESVARLREAVERVARDLEETAR
>3plus1_KEY_2(SEQ ID NO:27048)
SDEERLEKVVKDVIEKVRRILEKWKKDIDKVVKELRRILEEWEKIIREVLDKVR
>3plus1_KEY_3(SEQ ID NO:27049)
DKDAVIKVIEKLIRANAAVWDALLKINEDLVRVNKTVWKELLRVNEKLARDLERVVK
>3plus1_KEY_4(SEQ ID NO:27050)
SLVDELRKSLERNVRVSEEVARRLKEALKRWVDVVRKVVEDLIRLNEDVVRVVEK
SEQ ID NO:26602-27015:
>3plus1_GFP11_KEY_Cterm_1(SEQ ID NO:26602)
SGSKEVLDILERAVEVVRRVIKALKEVLERHVDATREVIERVKRVNKRLLEAVREVVT
>3plus1_GFP11_KEY_Cterm_2(SEQ ID NO:26603)
GVPEEIDRELKRVVEELRRLHEEIKERLDDVARRSEEELRRIIKKLKEVVKEIRKKLK
>3plus1_GFP11_KEY_Cterm_3(SEQ ID NO:26604)
DLLRKLEEELRRIKEKLRKALEELEREHRELEKELDKLHDESRKEHERIEEELRR
>3plus1_GFP11_KEY_Cterm_4(SEQ ID NO:26605)
DEDLLEKIKRVIREHIKALEKLARDLKEILRRHIEALKELARDLAEVIRKLLEDVKR
>3plus1_GFP11_KEY_Cterm_5(SEQ ID NO:26606)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_KEY_Cterm_6(SEQ ID NO:26607)
DLEDILRKNLDRLRKLLERLREILRENLEALKKTLKRLEDVVREILEDLKRERK
>3plus1_GFP11_KEY_Cterm_7(SEQ ID NO:26608)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_KEY_Cterm_8(SEQ ID NO:26609)
SGSKEVLDILERAVEVVRRVIKALKEVLERHVDATREVIERVKRVNKRLLEAVREVVT
>3plus1_GFP11_KEY_Cterm_9(SEQ ID NO:26610)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_KEY_Cterm_10(SEQ ID NO:26611)
RLIEEVVRLLRENLDVVRRILEALAKLIKELLEALEEVLRRNKELIRELLRVLDEALK
>3plus1_GFP11_KEY_Cterm_11(SEQ ID NO:26612)
DIVRAMEEVIRRLIEILRRDVELNLDVAKKLLELLKEDSKLNLDVARELLELLDR
>3plus1_GFP11_KEY_Cterm_12(SEQ ID NO:26613)
DIVRAMEEVIRRLIEILRRDVELNLDVAKKLLELLKEDSKLNLDVARELLELLDR
>3plus1_GFP11_KEY_Cterm_13(SEQ ID NO:26614)
RLIEEVVRLLRENLDVVRRILEALAKLIKELLEALEEVLRRNKELIRELLRVLDEALK
>3plus1_GFP11_KEY_Cterm_14(SEQ ID NO:26615)
RLIEEVVRLLRENLDVVRRILEALAKLIKELLEALEEVLRRNKELIRELLRVLDEALK
>3plus1_GFP11_KEY_Cterm_15(SEQ ID NO:26616)
DLLRKLEEELRRIKEKLRKALEELEREHRELEKELDKLHDESRKEHERIEEELRR
>3plus1_GFP11_KEY_Cterm_16(SEQ ID NO:26617)
DLLRKLEEELRRIKEKLRKALEELEREHRELEKELDKLHDESRKEHERIEEELRR
>3plus1_GFP11_KEY_Cterm_17(SEQ ID NO:26618)
ELAREVERVIKELLDKSKEILERIERAIDELLKVSEEILKLSEDASEELLKILREFAK
>3plus1_GFP11_KEY_Cterm_18(SEQ ID NO:26619)
DVKDIIRTILEVARDLLRLLEEDSRTNSEVVKRLLDLLREDSKANSEVVKRLLDVLRE
>3plus1_GFP11_KEY_Cterm_19(SEQ ID NO:26620)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_KEY_Cterm_20(SEQ ID NO:26621)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_KEY_Cterm_21(SEQ ID NO:26622)
RLIEEVVRLLRENLDVVRRILEALAKLIKELLEALEEVLRRNKELIRELLRVLDEALK
>3plus1_GFP11_KEY_Cterm_22(SEQ ID NO:26623)
DLEDILRKNLDRLRKLLERLREILRENLEALKKTLKRLEDVVREILEDLKRERK
>3plus1_GFP11_KEY_Cterm_23(SEQ ID NO:26624)
DLLRKLEEELRRIKEKLRKALEELEREHRELEKELDKLHDESRKEHERIEEELRR
>3plus1_GFP11_KEY_Cterm_24(SEQ ID NO:26625)
DEDLLEKIKRVIREHIKALEKLARDLKEILRRHIEALKELARDLAEVIRKLLEDVKR
>3plus1_GFP11_KEY_Cterm_25(SEQ ID NO:26626)
ELVRIAIEVLKRLLEIIEELVRLNNEILERLLKIVRELHKDNIKILEDLLRIIEEVLR
>3plus1_GFP11_KEY_Cterm_26(SEQ ID NO:26627)
ELVRIAIEVLKRLLEIIEELVRLNNEILERLLKIVRELHKDNIKILEDLLRIIEEVLR
>3plus1_GFP11_KEY_Cterm_27(SEQ ID NO:26628)
RLARLLKALADKLIRVLEEILKINEELNRKIIKFARENLERNRRVNKKVIEVLREAAR
>3plus1_GFP11_KEY_Cterm_28(SEQ ID NO:26628)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_KEY_Cterm_29(SEQ ID NO:26630)
ELVRIAIEVLKRLLEIIEELVRLNNEILERLLKIVRELHKDNIKILEDLLRIIEEVLR
>3plus1_GFP11_KEY_Cterm_30(SEQ ID NO:26631)
ELVRIAIEVLKRLLEIIEELVRLNNEILERLLKIVRELHKDNIKILEDLLRIIEEVLR
>3plus1_GFP11_KEY_Cterm_31(SEQ ID NO:26632)
DIVRAMEEVIRRLIEILRRDVELNLDVAKKLLELLKEDSKLNLDVARELLELLDR
>3plus1_GFP11_KEY_Cterm_32(SEQ ID NO:26633)
RKIAKIIEELKRLLEDLARDTRRVIEEAKRLLKEWRDRNKEVADTLKKLLEDLIRKIR
>3plus1_GFP11_KEY_Cterm_33(SEQ ID NO:26634)
DLLRKLEEELRRIKEKLRKALEELEREHRELEKELDKLHDESRKEHERIEEELRR
>3plus1_GFP11_KEY_Cterm_34(SEQ ID NO:26635)
DLLRKLEEELRRIKEKLRKALEELEREHRELEKELDKLHDESRKEHERIEEELRR
>3plus1_GFP11_KEY_Cterm_35(SEQ ID NO:26636)
RKIAKIIEELKRLLEDLARDTRRVIEEAKRLLKEWRDRNKEVADTLKKLLEDLIRKIR
>3plus1_GFP11_KEY_Cterm_36(SEQ ID NO:26637)
ELVRIAIEVLKRLLEIIEELVRLNNEILERLLKIVRELHKDNIKILEDLLRIIEEVLR
>3plus1_GFP11_KEY_Cterm_37(SEQ ID NO:26638)
TVRRLREALKKLEDDLRKIERDAEREYKKLKDELEELTERYRREIRKLKEELKADRK
>3plus1_GFP11_KEY_Cterm_38(SEQ ID NO:26639)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_KEY_Cterm_39(SEQ ID NO:26640)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_KEY_Cterm_40(SEQ ID NO:26641)
DLEDILRKNLDRLRKLLERLREILRENLEALKKTLKRLEDVVREILEDLKRERK
>3plus1_GFP11_KEY_Cterm_41(SEQ ID NO:26642)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_KEY_Cterm_42(SEQ ID NO:26643)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_KEY_Cterm_43(SEQ ID NO:26644)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_KEY_Cterm_44(SEQ ID NO:26645)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_KEY_Cterm_45(SEQ ID NO:26646)
DKAVEELEKALEEIKRRLKEVIDRYEDELRKLRKEYKEKIDKYERKLEEIERRERT
>3plus1_GFP11_KEY_Cterm_46(SEQ ID NO:26647)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_KEY_Cterm_47(SEQ ID NO:26648)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_KEY_Cterm_48(SEQ ID NO:26649)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_KEY_Cterm_49(SEQ ID NO:26650)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_KEY_Cterm_50(SEQ ID NO:26651)
EVKRRLEEKERRIRTRYEELRRRLRKRVKDYEDKLREIEKKVRRDAERIEEELERAKK
>3plus1_GFP11_KEY_Cterm_51(SEQ ID NO:26652)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_KEY_Cterm_52(SEQ ID NO:26653)
KIAEEIERELEELRRMIKRLHEDLERKLKESEDELREIEARLEEKIRRLEEKLERKRR
>3plus1_GFP11_KEY_Cterm_53(SEQ ID NO:26654)
KIAEEIERELEELRRMIKRLHEDLERKLKESEDELREIEARLEEKIRRLEEKLERKRR
>3plus1_GFP11_KEY_Cterm_54(SEQ ID NO:26655)
DKAVEELEKALEEIKRRLKEVIDRYEDELRKLRKEYKEKIDKYERKLEEIERRERT
>3plus1_GFP11_KEY_Cterm_55(SEQ ID NO:26656)
KIAEEIERELEELRRMIKRLHEDLERKLKESEDELREIEARLEEKIRRLEEKLERKRR
>3plus1_GFP11_KEY_Cterm_56(SEQ ID NO:26657)
ELVRIAIEVLKRLLEIIEELVRLNNEILERLLKIVRELHKDNIKILEDLLRIIEEVLR
>3plus1_GFP11_KEY_Cterm_57(SEQ ID NO:26658)
DEVEREIRRVKEDLDRILEEYRRLLEEIKRKLEEILRRVEELHRRLRRKLEEIDR
>3plus1_GFP11_KEY_Cterm_58(SEQ ID NO:26659)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_KEY_Cterm_59(SEQ ID NO:26660)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_KEY_Cterm_60(SEQ ID NO:26661)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_KEY_Cterm_61(SEQ ID NO:26662)
TLREVVRKVLEEAKRLLDELEEVHKRVKKELEDIIEENRRVVKRVRDELREIKRELDE
>3plus1_GFP11_KEY_Cterm_62(SEQ ID NO:26663)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_KEY_Cterm_63(SEQ ID NO:26664)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_KEY_Cterm_64(SEQ ID NO:26665)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_KEY_Cterm_65(SEQ ID NO:26666)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_KEY_Cterm_66(SEQ ID NO:26667)
KIAEEIERELEELRRMIKRLHEDLERKLKESEDELREIEARLEEKIRRLEEKLERKRR
>3plus1_GFP11_KEY_Cterm_67(SEQ ID NO:26668)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_KEY_Nterm_68(SEQ ID NO:26669)
SEAERLADEVRKAVKKSEEDNETLVREVEKAVRELKKNNKTWVDEVRKLMKRLVDLLR
>3plus1_GFP11_KEY_Nterm_69(SEQ ID NO:26670)
SEAERLADEVRKAVKKSEEDNETLVREVEKAVRELKKNNKTWVDEVRKLMKRLVDLLR
>3plus1_GFP11_KEY_Nterm_70(SEQ ID NO:26671)
DKDKRLEELLKRLKELNDKTFEELERILEELKRANEASLREAERILEELRARIEGGNL
>3plus1_GFP11_KEY_Nterm_71(SEQ ID NO:26672)
SEAEDLEELIKELAELLKDVIRKLEKINRRLVKILEDIIRRLKEISKEAEEELRKGTV
>3plus1_GFP11_KEY_Nterm_72(SEQ ID NO:26673)
SDKEEIKRRVEKTARDLETEHDKIKKRLEDTVRDIKRELDELLEKYERVLRKIEKTLR
>3plus1_GFP11_KEY_Nterm_73(SEQ ID NO:26674)
SEAEKIREALETNLRLLEELIKRLKEILDTHNELLRRVIETLERLLKELLELLEEGGL
>3plus1_GFP11_KEY_Nterm_74(SEQ ID NO:26675)
SEAEKIREALETNLRLLEELIKRLKEILDTHNELLRRVIETLERLLKELLELLEEGGL
>3plus1_GFP11_KEY_Nterm_75(SEQ ID NO:26676)
SKEERLREVAEKHKKDLEDIVKRVDEAAKETARRLEEILKRLEEVLKKILDDLEKGPD
>3plus1_GFP11_KEY_Nterm_76(SEQ ID NO:26677)
SLEEITKRLLELVEENLARHEEILRELLELAKRLAKEDRDILEEVLKLIEELLKLLED
>3plus1_GFP11_KEY_Nterm_77(SEQ ID NO:26678)
SKEETLKRLLDELEKRNRETVERLERLLKELEDRNRASLEELEAVLEELERKIEESGL
>3plus1_GFP11_KEY_Nterm_78(SEQ ID NO:26679)
SKEETLKRLLDELEKRNRETVERLERLLKELEDRNRASLEELEAVLEELERKIEESGL
>3plus1_GFP11_KEY_Nterm_79(SEQ ID NO:26680)
SKEETLKRLLDELEKRNRETVERLERLLKELEDRNRASLEELEAVLEELERKIEESGL
>3plus1_GFP11_KEY_Nterm_80(SEQ ID NO:26681)
STREKAKKVLDTLRADNEDMKRVVEKILRALKRTNERAEKLAREITEEIKRILKEVGV
>3plus1_GFP11_KEY_Nterm_81(SEQ ID NO:26682)
DAEEVVKRLADVLRENDETIRKVVEDLVRIAEENDRLWKKLVEDIAEILRRIVELLRR
>3plus1_GFP11_KEY_Nterm_82(SEQ ID NO:26683)
SKEETLKRLLDELEKRNRETVERLERLLKELEDRNRASLEELEAVLEELERKIEESGL
>3plus1_GFP11_KEY_Nterm_83(SEQ ID NO:26684)
STREKAKKVLDTLRADNEDMKRVVEKILRALKRTNERAEKLAREITEEIKRILKEVGV
>3plus1_GFP11_KEY_Nterm_84(SEQ ID NO:26685)
SKEEEVEKVLRKWEEILRRLIEENKRANDKIRREYEELVKEIRRVLEEIKEVAERLGV
>3plus1_GFP11_KEY_Nterm_85(SEQ ID NO:26686)
DREKSVRDIEEDLKRVLDKLRRRVETSKEELKKVLKADKENADELEKTLRDVVRELDR
>3plus1_GFP11_KEY_Nterm_86(SEQ ID NO:26687)
SDKEEIKRRVEKTARDLETEHDKIKKRLEDTVRDIKRELDELLEKYERVLRKIEKTLR
>3plus1_GFP11_KEY_Nterm_87(SEQ ID NO:26688)
STREKAKKVLDTLRADNEDMKRVVEKILRALKRTNERAEKLAREITEEIKRILKEVGV
>3plus1_GFP11_KEY_Nterm_88(SEQ ID NO:26689)
SKDEELARLLEELVERWRKIVEDLERDHRRLVKEIRELVERIRKKLEELVDRIRKNGI
>3plus1_GFP11_KEY_Nterm_89(SEQ ID NO:26690)
SEAERLADEVRKAVKKSEEDNETLVREVEKAVRELKKNNKTWVDEVRKLMKRLVDLLR
>3plus1_GFP11_KEY_Nterm_90(SEQ ID NO:26691)
SKDEELARLLEELVERWRKIVEDLERDHRRLVKEIRELVERIRKKLEELVDRIRKNGI
>3plus1_GFP11_KEY_Nterm_91(SEQ ID NO:26692)
KEIEETLKELEDLNREMVETNRRVLEETRRLNKETVDRVKATLDELAKMLKKLVDDVR
>3plus1_GFP11_KEY_Nterm_92(SEQ ID NO:26693)
SEAERLADEVRKAVKKSEEDNETLVREVEKAVRELKKNNKTWVDEVRKLMKRLVDLLR
>3plus1_GFP11_KEY_Nterm_93(SEQ ID NO:26694)
SKEETLKRLLDELEKRNRETVERLERLLKELEDRNRASLEELEAVLEELERKIEESGL
>3plus1_GFP11_KEY_Nterm_94(SEQ ID NO:26695)
DKAEVLREALKLLKDLLEELIKIHEESLKRILDLIDTLVKVHEDALRALKELLERSGL
>3plus1_GFP11_KEY_Nterm_95(SEQ ID NO:26696)
SKEEEVEKVLRKWEEILRRLIEENKRANDKIRREYEELVKEIRRVLEEIKEVAERLGV
>3plus1_GFP11_KEY_Nterm_96(SEQ ID NO:26697)
SKEETLKRLLDELEKRNRETVERLERLLKELEDRNRASLEELEAVLEELERKIEESGL
>3plus1_GFP11_KEY_Cterm_97(SEQ ID NO:26698)
SERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_GFP11_KEY_Cterm_98(SEQ ID NO:26699)
SERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_GFP11_KEY_Cterm_99(SEQ ID NO:26700)
DERRIAERIRELLRESKKLVRDVVEEAKRLLKENRDSTRKIIEDIRRLLRKIEDSTR
>3plus1_GFP11_KEY_Cterm_100(SEQ ID NO:26701)
DALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_GFP11_KEY_Cterm_101(SEQ ID NO:26702)
DERRIAERIRELLRESKKLVRDVVEEAKRLLKENRDSTRKIIEDIRRLLRKIEDSTR
>3plus1_GFP11_KEY_Cterm_102(SEQ ID NO:26703)
EALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_GFP11_KEY_Cterm_103(SEQ ID NO:26704)
EALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_GFP11_KEY_Cterm_104(SEQ ID NO:26705)
AAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_GFP11_KEY_Cterm_105(SEQ ID NO:26706)
EALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_GFP11_KEY_Cterm_106(SEQ ID NO:26707)
EALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_GFP11_KEY_Cterm_107(SEQ ID NO:26708)
DALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_GFP11_KEY_Cterm_108(SEQ ID NO:26709)
DALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_GFP11_KEY_Cterm_109(SEQ ID NO:26710)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_GFP11_KEY_Cterm_110(SEQ ID NO:26711)
DRLDKVEELVKKLLEDTKRTVDRVRELVRKILKKSRETLEELERLIEKILRELEKDAR
>3plus1_GFP11_KEY_Cterm_111(SEQ ID NO:26712)
DALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_GFP11_KEY_Cterm_112(SEQ ID NO:26713)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_GFP11_KEY_Cterm_113(SEQ ID NO:26714)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_GFP11_KEY_Cterm_114(SEQ ID NO:26715)
SEDDLKRVVDEVEKKLRELKRRYAEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_GFP11_KEY_Cterm_115(SEQ ID NO:26716)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_GFP11_KEY_Cterm_116(SEQ ID NO:26717)
DEVEREIRRVKEDLDRILEEYRRLLEEIKRKLEEILRRVEELHRRLRRKLEEIDR
>3plus1_GFP11_KEY_Cterm_117(SEQ ID NO:26718)
SEDDLKRVVDEVEKKLRELKRRYAEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_GFP11_KEY_Nterm_118(SEQ ID NO:26719)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRLEKELRDLKRRIEEKLEELRRGSL
>3plus1_GFP11_KEY_Nterm_119(SEQ ID NO:26720)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_GFP11_KEY_Nterm_120(SEQ ID NO:26721)
SEDEIIKKIIEDLRRVLKEVEEIHKEVEERLDKVLKEAEEMHKEVLKELDRVLDEVKR
>3plus1_GFP11_KEY_Nterm_121(SEQ ID NO:26722)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_GFP11_KEY_Nterm_122(SEQ ID NO:26723)
SEKEKLLKESEEEVRRLRRTLEELLRKYREVLERLRKELREIEERVRDVVRRLKEVLD
>3plus1_GFP11_KEY_Nterm_123(SEQ ID NO:26724)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_GFP11_KEY_Nterm_124(SEQ ID NO:26725)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_GFP11_KEY_Nterm_125(SEQ ID NO:26726)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_GFP11_KEY_Nterm_126(SEQ ID NO:26727)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_GFP11_KEY_Nterm_127(SEQ ID NO:26728)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_GFP11_KEY_Nterm_128(SEQ ID NO:26729)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_GFP11_KEY_Nterm_129(SEQ ID NO:26730)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_GFP11_KEY_Nterm_130(SEQ ID NO:26731)
SRVEELKKLIEDILRISREVVERIKRVAEDIHRINRRVLDDLRKLIEDILRTVEEILA
>3plus1_GFP11_KEY_Nterm_131(SEQ ID NO:26732)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_GFP11_KEY_Nterm_132(SEQ ID NO:26733)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_GFP11_KEY_Nterm_133(SEQ ID NO:26734)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_GFP11_KEY_Nterm_134(SEQ ID NO:26735)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_GFP11_KEY_Nterm_135(SEQ ID NO:26736)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_GFP11_KEY_Nterm_136(SEQ ID NO:26737)
SERETVKRRLEELLKEVKRTLDKLKEEHDRLLEDVRRVVEELKREHDKLLKEVKDSGV
>3plus1_GFP11_KEY_Nterm_137(SEQ ID NO:26738)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_GFP11_KEY_Nterm_138(SEQ ID NO:26739)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_GFP11_KEY_Nterm_139(SEQ ID NO:26740)
KEREEVKEKLDRLLEEVEKTVRELKREHDELLKEVEKLVRDLKKEHDELLKKVKDDGV
>3plus1_GFP11_KEY_Nterm_140(SEQ ID NO:26741)
SREEVLRELEEVIEDNRRLLEELIEKSKKVLDESLKLIDELLRRLEEVLERVLRLLEE
>2plus1_GFP11_KEY_Cterm_1(SEQ ID NO:26742)
DEVVKRVRDLLDTVRRRNEKVNEDVKRMNDKLRRDNEDVIRRVEKLLRELEEKRRT
>2plus1_GFP11_KEY_Cterm_2(SEQ ID NO:26743)
SEDSVERIARELERNLDDLARVLKESEDDLAEILRRLKEVLEESERDLERVEREVRK
>2plus1_GFP11_KEY_Cterm_3(SEQ ID NO:26744)
SKELLEKAKAVVDEIKRLAEESLKRLEDLSRDHKRRAKELNDEIAKVVDELAKRAT
>2plus1_GFP11_KEY_Cterm_4(SEQ ID NO:26745)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_KEY_Cterm_5(SEQ ID NO:26746)
DEVVKRVRDLLDTVRRRNEKVNEDVKRMNDKLRRDNEDVIRRVEKLLRELEEKRRT
>2plus1_GFP11_KEY_Cterm_6(SEQ ID NO:26747)
DIKTLLDRVRKLAEEDAERLDRLRRESEELNERVRRVDKKLLEEIRRKAKKVEDDTR
>2plus1_GFP11_KEY_Cterm_7(SEQ ID NO:26748)
DAETLLRELEKLSRDNKELLKKIEKEIRDLIKEDKERNIELSERLRKLVEELKKKAT
>2plus1_GFP11_KEY_Cterm_8(SEQ ID NO:26749)
DEVVKRVRDLLDTVRRRNEKVNEDVKRMNDKLRRDNEDVIRRVEKLLRELEEKRRT
>2plus1_GFP11_KEY_Cterm_9(SEQ ID NO:26750)
DIKTLLDRVRKLAEEDAERLDRLRRESEELNERVRRVDKKLLEEIRRKAKKVEDDTR
>2plus1_GFP11_KEY_Cterm_10(SEQ ID NO:26751)
SEELSAEVKKLLDEVRKALARHKDENDKLLKEIEDSLRRHKEENDRLLEKLKESTR
>2plus1_GFP11_KEY_Cterm_11(SEQ ID NO:26752)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_KEY_Cterm_12(SEQ ID NO:26753)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_KEY_Cterm_13(SEQ ID NO:26754)
DEVVKRVRDLLDTVRRRNEKVNEDVKRMNDKLRRDNEDVIRRVEKLLRELEEKRRT
>2plus1_GFP11_KEY_Cterm_14(SEQ ID NO:26755)
SEELSAEVKKLLDEVRKALARHKDENDKLLKEIEDSLRRHKEENDRLLEKLKESTR
>2plus1_GFP11_KEY_Cterm_15(SEQ ID NO:26756)
DAETVLRSAEDIVAKNRKLAEEVLRRVKKIVEENRKIASEVLDDVRKLVEDVLARAS
>2plus1_GFP11_KEY_Cterm_16(SEQ ID NO:26757)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_KEY_Cterm_17(SEQ ID NO:26758)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_KEY_Cterm_18(SEQ ID NO:26759)
DEEKLKDLIRKLRDILRRAAEAHKKLIDDARESLERAKREHEKLIDRLKKILEELER
>2plus1_GFP11_KEY_Cterm_19(SEQ ID NO:26760)
DIKTLLDRVRKLAEEDAERLDRLRRESEELNERVRRVDKKLLEEIRRKAKKVEDDTR
>2plus1_GFP11_KEY_Cterm_20(SEQ ID NO:26761)
DATRVIEEAKRILDEARKLNEETIRRSEELVRRIERVIEEIIKRSEKLLEDVARESK
>2plus1_GFP11_KEY_Cterm_21(SEQ ID NO:26762)
SEELSAEVKKLLDEVRKALARHKDENDKLLKEIEDSLRRHKEENDRLLEKLKESTR
>2plus1_GFP11_KEY_Cterm_22(SEQ ID NO:26763)
DAETVLRSAEDIVAKNRKLAEEVLRRVKKIVEENRKIASEVLDDVRKLVEDVLARAS
>2plus1_GFP11_KEY_Cterm_23(SEQ ID NO:26764)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_KEY_Cterm_24(SEQ ID NO:26765)
SKELLEKAKAVVDEIKRLAEESLKRLEDLSRDHKRRAKELNDEIAKVVDELAKRAT
>2plus1_GFP11_KEY_Cterm_25(SEQ ID NO:26766)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_KEY_Cterm_26(SEQ ID NO:26767)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_KEY_Cterm_27(SEQ ID NO:26768)
DKLLKEARDLIREIEKRLEELLKRVEKLTEDAKRDLERSNREHKELADRIKETAR
>2plus1_GFP11_KEY_Cterm_28(SEQ ID NO:26769)
DKDSARELERIVKENAELAERVFREVEKIVRENTKLAEDSVRELKRLVEELKKRAK
>2plus1_GFP11_KEY_Cterm_29(SEQ ID NO:26770)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_KEY_Cterm_30(SEQ ID NO:26771)
DEEKLKDLIRKLRDILRRAAEAHKKLIDDARESLERAKREHEKLIDRLKKILEELER
>2plus1_GFP11_KEY_Cterm_31(SEQ ID NO:26772)
DEVVKRVRDLLDTVRRRNEKVNEDVKRMNDKLRRDNEDVIRRVEKLLRELEEKRRT
>2plus1_GFP11_KEY_Cterm_32(SEQ ID NO:26773)
DEEVLRTLEEIIRRLTKELEDVLREYERELRRLEEENKRVIDKTEEEIRRLADRLRR
>2plus1_GFP11_KEY_Cterm_33(SEQ ID NO:26774)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_KEY_Cterm_34(SEQ ID NO:26775)
SEELSAEVKKLLDEVRKALARHKDENDKLLKEIEDSLRRHKEENDRLLEKLKESTR
>2plus1_GFP11_KEY_Cterm_35(SEQ ID NO:26776)
LPEEVLRELEELLKESEERIKRIEEEIKKIIDKSREDIKRVLEEIERLNAKAADDLRK
>2plus1_GFP11_KEY_Cterm_36(SEQ ID NO:26777)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_KEY_Cterm_37(SEQ ID NO:26778)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_KEY_Cterm_38(SEQ ID NO:26779)
DKLLKEARDLIREIEKRLEELLKRVEKLTEDAKRDLERSNREHKELADRIKETAR
>2plus1_GFP11_KEY_Cterm_39(SEQ ID NO:26780)
DEEVLRTLEEIIRRLTKELEDVLREYERELRRLEEENKRVIDKTEEEIRRLADRLRR
>2plus1_GFP11_KEY_Cterm_40(SEQ ID NO:26781)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_KEY_Cterm_41(SEQ ID NO:26782)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_KEY_Cterm_42(SEQ ID NO:26783)
SEELSAEVKKLLDEVRKALARHKDENDKLLKEIEDSLRRHKEENDRLLEKLKESTR
>2plus1_GFP11_KEY_Cterm_43(SEQ ID NO:26784)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_KEY_Cterm_44(SEQ ID NO:26785)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_KEY_Cterm_45(SEQ ID NO:26786)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_KEY_Cterm_46(SEQ ID NO:26787)
TLRELARSIRKLSAENKERLKELLRELKKLSDENKERIKKLLSDAEKIIEDVARRAK
>2plus1_GFP11_KEY_Cterm_47(SEQ ID NO:26788)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_KEY_Cterm_48(SEQ ID NO:26789)
EKLKELRDVIAEVAKRIDELDEYTRESIRRAKKEIERLNRETKKVIEEVVKRIEEERK
>2plus1_GFP11_KEY_Cterm_49(SEQ ID NO:26790)
DERVREELKKLLTRVEEEHRKVLETDKKILKEAHKESKEVNDRDRELLERLEESVR
>2plus1_GFP11_KEY_Cterm_50(SEQ ID NO:26791)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_KEY_Cterm_51(SEQ ID NO:26792)
TVKRLLDELRELLERLKRTIEELLKRNRDLLADAEEKARRLLEENRKLLKAARDTAT
>2plus1_GFP11_KEY_Cterm_52(SEQ ID NO:26793)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_KEY_Cterm_53(SEQ ID NO:26794)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_KEY_Cterm_54(SEQ ID NO:26795)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_KEY_Cterm_55(SEQ ID NO:26796)
DATRVIEEAKRILDEARKLNEETIRRSEELVRRIERVIEEIIKRSEKLLEDVARESK
>2plus1_GFP11_KEY_Cterm_56(SEQ ID NO:26797)
EAAREIIKRLREVNKRTKEKLDELIKHSEEVLERVKRLIDELRKHSEEVLEDLRRRAK
>2plus1_GFP11_KEY_Cterm_57(SEQ ID NO:26798)
EKLKELRDVIAEVAKRIDELDEYTRESIRRAKKEIERLNRETKKVIEEVVKRIEEERK
>2plus1_GFP11_KEY_Cterm_58(SEQ ID NO:26799)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_KEY_Cterm_59(SEQ ID NO:26800)
SKAIKDVRDIVKKVKDELKEWRDRNKELVDRLSEELKEWLKDVERVLKELTDKDR
>2plus1_GFP11_KEY_Cterm_60(SEQ ID NO:26801)
DERVREELKKLLTRVEEEHRKVLETDKKILKEAHKESKEVNDRDRELLERLEESVR
>2plus1_GFP11_KEY_Cterm_61(SEQ ID NO:26802)
DIDKLLKELRDLVEKIKKDLKELLERYEEIVRRIKELLKDLNREAEEVVRRLKEELR
>2plus1_GFP11_KEY_Cterm_62(SEQ ID NO:26803)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_KEY_Cterm_63(SEQ ID NO:26804)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_KEY_Cterm_64(SEQ ID NO:26805)
EREEELKEVADRVKEKLDRLNRENEKSSEELKRELDKINDENRETSERLKREIDETTR
>2plus1_GFP11_KEY_Cterm_65(SEQ ID NO:26806)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_KEY_Cterm_66(SEQ ID NO:26807)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_KEY_Cterm_67(SEQ ID NO:26808)
TKDLLDENSKRSNEISREVKKDLERTVRENKKIVDEVAKALEDTVDKNRRIVEEVTT
>2plus1_GFP11_KEY_Cterm_68(SEQ ID NO:26809)
DEVVKRVRDLLDTVRRRNEKVNEDVKRMNDKLRRDNEDVIRRVEKLLRELEEKRRT
>2plus1_GFP11_KEY_Cterm_69(SEQ ID NO:26810)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_KEY_Cterm_70(SEQ ID NO:26811)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_KEY_Cterm_71(SEQ ID NO:26812)
SEELSAEVKKLLDEVRKALARHKDENDKLLKEIEDSLRRHKEENDRLLEKLKESTR
>2plus1_GFP11_KEY_Cterm_72(SEQ ID NO:26813)
DIDKLLKELRDLVEKIKKDLKELLERYEEIVRRIKELLKDLNREAEEVVRRLKEELR
>2plus1_GFP11_KEY_Cterm_73(SEQ ID NO:26814)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_KEY_Cterm_74(SEQ ID NO:26815)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_KEY_Cterm_75(SEQ ID NO:26816)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_KEY_Cterm_76(SEQ ID NO:26817)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_KEY_Cterm_77(SEQ ID NO:26818)
SEELREELKKLERKIEKVAKEIHDHDKEVTERLEDLLRRITEHARKSDREIEETAR
>2plus1_GFP11_KEY_Cterm_78(SEQ ID NO:26819)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_KEY_Cterm_79(SEQ ID NO:26820)
DATRVIEEAKRILDEARKLNEETIRRSEELVRRIERVIEEIIKRSEKLLEDVARESK
>2plus1_GFP11_KEY_Cterm_80(SEQ ID NO:26821)
EKLKELRDVIAEVAKRIDELDEYTRESIRRAKKEIERLNRETKKVIEEVVKRIEEERK
>2plus1_GFP11_KEY_Cterm_81(SEQ ID NO:26822)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_KEY_Cterm_82(SEQ ID NO:26823)
DIDKLLKELRDLVEKIKKDLKELLERYEEIVRRIKELLKDLNREAEEVVRRLKEELR
>2plus1_GFP11_KEY_Cterm_83(SEQ ID NO:26824)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_KEY_Cterm_84(SEQ ID NO:26825)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_KEY_Cterm_85(SEQ ID NO:26826)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_KEY_Cterm_86(SEQ ID NO:26827)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_KEY_Cterm_87(SEQ ID NO:26828)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_KEY_Cterm_88(SEQ ID NO:26829)
DLKRVEERAREVSRRNEESMRRVKEDADRVSEANKEVLDRVREEVKRLIEEVRETLR
>2plus1_GFP11_KEY_Cterm_89(SEQ ID NO:26830)
EKLKELRDVIAEVAKRIDELDEYTRESIRRAKKEIERLNRETKKVIEEVVKRIEEERK
>2plus1_GFP11_KEY_Cterm_90(SEQ ID NO:26831)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_KEY_Cterm_91(SEQ ID NO:26832)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_KEY_Cterm_92(SEQ ID NO:26833)
LPEEVLRELEELLKESEERIKRIEEEIKKIIDKSREDIKRVLEEIERLNAKAADDLRK
>2plus1_GFP11_KEY_Cterm_93(SEQ ID NO:26834)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_KEY_Cterm_94(SEQ ID NO:26835)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_KEY_Cterm_95(SEQ ID NO:26836)
DKLLKEARDLIREIEKRLEELLKRVEKLTEDAKRDLERSNREHKELADRIKETAR
>2plus1_GFP11_KEY_Cterm_96(SEQ ID NO:26837)
DKLLKEARDLIREIEKRLEELLKRVEKLTEDAKRDLERSNREHKELADRIKETAR
>2plus1_GFP11_KEY_Cterm_97(SEQ ID NO:26838)
DIVRKIERIVETIEREVRESVKKVEEIARDIRRKVDESVKNVEKLLRDVDKKARDRKK
>2plus1_GFP11_KEY_Cterm_98(SEQ ID NO:26839)
DEIKRIVDEVRERLKRIVDENAKIVEDARRALEKIVKENEEILRRLKKELRELRK
>2plus1_GFP11_KEY_Cterm_99(SEQ ID NO:26840)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_KEY_Cterm_100(SEQ ID NO:26841)
DLKRVEERAREVSRRNEESMRRVKEDADRVSEANKEVLDRVREEVKRLIEEVRETLR
>2plus1_GFP11_KEY_Cterm_101(SEQ ID NO:26842)
DATRVIEEAKRILDEARKLNEETIRRSEELVRRIERVIEEIIKRSEKLLEDVARESK
>2plus1_GFP11_KEY_Cterm_102(SEQ ID NO:26843)
DAETIERVVRELLEENKEVLRKTEEAVKRSTETNKRLLEASKEVADRLRERIKEAAK
>2plus1_GFP11_KEY_Cterm_103(SEQ ID NO:26844)
EKLKELRDVIAEVAKRIDELDEYTRESIRRAKKEIERLNRETKKVIEEVVKRIEEERK
>2plus1_GFP11_KEY_Cterm_104(SEQ ID NO:26845)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_KEY_Cterm_105(SEQ ID NO:26846)
DEVVERAERISEENKRRVEDVARKSKELVEDVRRHSEEVVRRVEELVKEVEERVR
>2plus1_GFP11_KEY_Cterm_106(SEQ ID NO:26847)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_KEY_Cterm_107(SEQ ID NO:26848)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_KEY_Cterm_108(SEQ ID NO:26849)
EAVRRLKEILERLKEEVRRSLEELRKEVERLKKEVEDSLRELKKSLEEWVKSLEEATR
>2plus1_GFP11_KEY_Cterm_109(SEQ ID NO:26850)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_KEY_Cterm_110(SEQ ID NO:26851)
DATRVIEEAKRILDEARKLNEETIRRSEELVRRIERVIEEIIKRSEKLLEDVARESK
>2plus1_GFP11_KEY_Cterm_111(SEQ ID NO:26852)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_KEY_Cterm_112(SEQ ID NO:26853)
EKLKELRDVIAEVAKRIDELDEYTRESIRRAKKEIERLNRETKKVIEEVVKRIEEERK
>2plus1_GFP11_KEY_Cterm_113(SEQ ID NO:26854)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_KEY_Cterm_114(SEQ ID NO:26855)
DKVERVVREVEKLHEEDRKRLEESTRSVRKLLEELKRELEKSTRSVKALVDELRERVR
>2plus1_GFP11_KEY_Cterm_115(SEQ ID NO:26856)
DEVVERAERISEENKRRVEDVARKSKELVEDVRRHSEEVVRRVEELVKEVEERVR
>2plus1_GFP11_KEY_Cterm_116(SEQ ID NO:26857)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_KEY_Cterm_117(SEQ ID NO:26858)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_KEY_Cterm_118(SEQ ID NO:26859)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_KEY_Cterm_119(SEQ ID NO:26860)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_KEY_Cterm_120(SEQ ID NO:26861)
DLKRVEERAREVSRRNEESMRRVKEDADRVSEANKEVLDRVREEVKRLIEEVRETLR
>2plus1_GFP11_KEY_Cterm_121(SEQ ID NO:26862)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_KEY_Cterm_122(SEQ ID NO:26863)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_KEY_Cterm_123(SEQ ID NO:26864)
SKAIKDVRDIVKKVKDELKEWRDRNKELVDRLSEELKEWLKDVERVLKELTDKDR
>2plus1_GFP11_KEY_Cterm_124(SEQ ID NO:26865)
DKVERVVREVEKLHEEDRKRLEESTRSVRKLLEELKRELEKSTRSVKALVDELRERVR
>2plus1_GFP11_KEY_Cterm_125(SEQ ID NO:26866)
DIDKLLKELRDLVEKIKKDLKELLERYEEIVRRIKELLKDLNREAEEVVRRLKEELR
>2plus1_GFP11_KEY_Cterm_126(SEQ ID NO:26867)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_KEY_Cterm_127(SEQ ID NO:26868)
DKLLKEARDLIREIEKRLEELLKRVEKLTEDAKRDLERSNREHKELADRIKETAR
>2plus1_GFP11_KEY_Cterm_128(SEQ ID NO:26869)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_KEY_Cterm_129(SEQ ID NO:26870)
DEIKRIVDEVRERLKRIVDENAKIVEDARRALEKIVKENEEILRRLKKELRELRK
>2plus1_GFP11_KEY_Cterm_130(SEQ ID NO:26871)
DRIEEELKRLIDTLREKNREVEKRARDSNRDLKRTNDEIAKEVRELIKKLREDLK
>2plus1_GFP11_KEY_Cterm_131(SEQ ID NO:26872)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_KEY_Cterm_132(SEQ ID NO:26873)
DAETIERVVRELLEENKEVLRKTEEAVKRSTETNKRLLEASKEVADRLRERIKEAAK
>2plus1_GFP11_KEY_Cterm_133(SEQ ID NO:26874)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_KEY_Cterm_134(SEQ ID NO:26875)
DKVERVVREVEKLHEEDRKRLEESTRSVRKLLEELKRELEKSTRSVKALVDELRERVR
>2plus1_GFP11_KEY_Cterm_135(SEQ ID NO:26876)
DIERILRELEAVLKKLTDESERLNREVERVSRDTKKKSKELNEELKAVLDEVKRKAD
>2plus1_GFP11_KEY_Cterm_136(SEQ ID NO:26877)
DEVVERAERISEENKRRVEDVARKSKELVEDVRRHSEEVVRRVEELVKEVEERVR
>2plus1_GFP11_KEY_Cterm_137(SEQ ID NO:26878)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_KEY_Cterm_138(SEQ ID NO:26879)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_KEY_Cterm_139(SEQ ID NO:26880)
DEIKRIVDEVRERLKRIVDENAKIVEDARRALEKIVKENEEILRRLKKELRELRK
>2plus1_GFP11_KEY_Cterm_140(SEQ ID NO:26881)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_KEY_Cterm_141(SEQ ID NO:26882)
DLKRVEERAREVSRRNEESMRRVKEDADRVSEANKEVLDRVREEVKRLIEEVRETLR
>2plus1_GFP11_KEY_Cterm_142(SEQ ID NO:26883)
DAETIERVVRELLEENKEVLRKTEEAVKRSTETNKRLLEASKEVADRLRERIKEAAK
>2plus1_GFP11_KEY_Cterm_143(SEQ ID NO:26884)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_KEY_Cterm_144(SEQ ID NO:26885)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_KEY_Cterm_145(SEQ ID NO:26886)
DKVERVVREVEKLHEEDRKRLEESTRSVRKLLEELKRELEKSTRSVKALVDELRERVR
>2plus1_GFP11_KEY_Cterm_146(SEQ ID NO:26887)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_KEY_Cterm_147(SEQ ID NO:26888)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_KEY_Cterm_148(SEQ ID NO:26889)
DEIKRIVDEVRERLKRIVDENAKIVEDARRALEKIVKENEEILRRLKKELRELRK
>2plus1_GFP11_KEY_Cterm_149(SEQ ID NO:26890)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_KEY_Cterm_150(SEQ ID NO:26891)
DEVTKVKKVADDVLAEIKKLDDETRRVIEDTNKKIADLDKATRDVVRKVLEEVKKLEK
>2plus1_GFP11_KEY_Cterm_151(SEQ ID NO:26892)
DIDKLLKELRDLVEKIKKDLKELLERYEEIVRRIKELLKDLNREAEEVVRRLKEELR
>2plus1_GFP11_KEY_Cterm_152(SEQ ID NO:26893)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_KEY_Cterm_153(SEQ ID NO:26894)
DEIKRIVDEVRERLKRIVDENAKIVEDARRALEKIVKENEEILRRLKKELRELRK
>2plus1_GFP11_KEY_Cterm_154(SEQ ID NO:26895)
RLVREVEDLVRRLVRRSEKSNEEVKRTVEELVRRMEESNDRVRDLVRRLVEELKRAVD
>2plus1_GFP11_KEY_Cterm_155(SEQ ID NO:26896)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_KEY_Cterm_156(SEQ ID NO:26897)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_KEY_Cterm_157(SEQ ID NO:26898)
RLVREVEDLVRRLVRRSEKSNEEVKRTVEELVRRMEESNDRVRDLVRRLVEELKRAVD
>2plus1_GFP11_KEY_Cterm_158(SEQ ID NO:26899)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_KEY_Cterm_159(SEQ ID NO:26900)
DEVTKVKKVADDVLAEIKKLDDETRRVIEDTNKKIADLDKATRDVVRKVLEEVKKLEK
>2plus1_GFP11_KEY_Cterm_160(SEQ ID NO:26901)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_KEY_Cterm_161(SEQ ID NO:26902)
DLKRVEERAREVSRRNEESMRRVKEDADRVSEANKEVLDRVREEVKRLIEEVRETLR
>2plus1_GFP11_KEY_Cterm_162(SEQ ID NO:26903)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_KEY_Cterm_163(SEQ ID NO:26904)
DEVTKVKKVADDVLAEIKKLDDETRRVIEDTNKKIADLDKATRDVVRKVLEEVKKLEK
>2plus1_GFP11_KEY_Cterm_164(SEQ ID NO:26905)
DKVERVVREVEKLHEEDRKRLEESTRSVRKLLEELKRELEKSTRSVKALVDELRERVR
>2plus1_GFP11_KEY_Cterm_165(SEQ ID NO:26906)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_KEY_Cterm_166(SEQ ID NO:26907)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_KEY_Cterm_167(SEQ ID NO:26908)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_KEY_Cterm_168(SEQ ID NO:26909)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_KEY_Cterm_169(SEQ ID NO:26910)
DEVTKVKKVADDVLAEIKKLDDETRRVIEDTNKKIADLDKATRDVVRKVLEEVKKLEK
>2plus1_GFP11_KEY_Cterm_170(SEQ ID NO:26911)
DKVERVVREVEKLHEEDRKRLEESTRSVRKLLEELKRELEKSTRSVKALVDELRERVR
>2plus1_GFP11_KEY_Cterm_171(SEQ ID NO:26912)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_KEY_Cterm_172(SEQ ID NO:26913)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_KEY_Cterm_173(SEQ ID NO:26914)
RLVREVEDLVRRLVRRSEKSNEEVKRTVEELVRRMEESNDRVRDLVRRLVEELKRAVD
>2plus1_GFP11_KEY_Nterm_174(SEQ ID NO:26915)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_KEY_Nterm_175(SEQ ID NO:26916)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_KEY_Nterm_176(SEQ ID NO:26917)
SVDEVLKEIEDALRRLKEEVERVLKENEDELRRLEEEVRRVLKEDEELLESLKRGVGE
>2plus1_GFP11_KEY_Nterm_177(SEQ ID NO:26918)
SEVDEIIKELERLLAEIARENERIIRESRKLADEVRKRNEDAIRKLEELVARLADAVR
>2plus1_GFP11_KEY_Nterm_178(SEQ ID NO:26919)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_KEY_Nterm_179(SEQ ID NO:26920)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_KEY_Nterm_180(SEQ ID NO:26921)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_KEY_Nterm_181(SEQ ID NO:26922)
KEVEDAVKELEDLLRANEDKTRSIVEDMRASNKDLEDHSRASEEEVRKLLDDLRRAGV
>2plus1_GFP11_KEY_Nterm_182(SEQ ID NO:26923)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_KEY_Nterm_183(SEQ ID NO:26924)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_KEY_Nterm_184(SEQ ID NO:26925)
SESDDVIRKLRELLEELRTHVEKSIRDLRKILEDSTRHAKRSIEELERLLEEVRKKPG
>2plus1_GFP11_KEY_Nterm_185(SEQ ID NO:26926)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_KEY_Nterm_186(SEQ ID NO:26927)
SEAEKAKETIDRLADRVRKLLEEIKRSLDDSRRKSKETVEENEKTLDRMRKEVDAAKR
>2plus1_GFP11_KEY_Nterm_187(SEQ ID NO:26928)
SEAEKAKETIDRLADRVRKLLEEIKRSLDDSRRKSKETVEENEKTLDRMRKEVDAAKR
>2plus1_GFP11_KEY_Nterm_188(SEQ ID NO:26929)
SEVEELIKRLAKVLKELVDKVRKVIEDTKELLERLKRRSEDHIRKLREVLKEAKDQPI
>2plus1_GFP11_KEY_Nterm_189(SEQ ID NO:26930)
SELEEIEKKVRELTKRHRELVERVRKTVKELIETNRRLLETLTERIKRVLEEVRDLER
>2plus1_GFP11_KEY_Nterm_190(SEQ ID NO:26931)
SSEERLRAVIEDLKRLAEESRKRHKELIDELAKAVERIERRHKKLLDEIKAVVDDIRR
>2plus1_GFP11_KEY_Nterm_191(SEQ ID NO:26932)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_KEY_Nterm_192(SEQ ID NO:26933)
STAETVAEEVERVLKHSDDLIKEVEDVNRRVEEEIKRVIRELEEENERLVAEVRKGVK
>2plus1_GFP11_KEY_Nterm_193(SEQ ID NO:26934)
SEVDEIIKELERLLAEIARENERIIRESRKLADEVRKRNEDAIRKLEELVARLADAVR
>2plus1_GFP11_KEY_Nterm_194(SEQ ID NO:26935)
SEIDEVLTRLRKISKDLNETSDRVNERARKIIDDIKKESKRVNDEAREIVERLKREID
>2plus1_GFP11_KEY_Nterm_195(SEQ ID NO:26936)
SEDEDLDRVAEKLAREHKKSVEEIKRVLKSADEESKKLVRDTERVIEEIKREVEEARR
>2plus1_GFP11_KEY_Nterm_196(SEQ ID NO:26937)
SSVEELLERLRRISEENKRRIEKLLREVEKVLRELKDRHRKLLKRVEEIIRKVKEEIK
>2plus1_GFP11_KEY_Nterm_197(SEQ ID NO:26938)
SAADEVVERMKELVATVKRENDEVVKELKKLVKELEDDNRRVVEESKKSVEDLARRVG
>2plus1_GFP11_KEY_Nterm_198(SEQ ID NO:26939)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_KEY_Nterm_199(SEQ ID NO:26940)
KEVEDAVKELEDLLRANEDKTRSIVEDMRASNKDLEDHSRASEEEVRKLLDDLRRAGV
>2plus1_GFP11_KEY_Nterm_200(SEQ ID NO:26941)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_KEY_Nterm_201(SEQ ID NO:26942)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_KEY_Nterm_202(SEQ ID NO:26943)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_KEY_Nterm_203(SEQ ID NO:26944)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_KEY_Nterm_204(SEQ ID NO:26945)
SKLEEVEKAVRKVIEDSRRVNEEVNRRSEEVVRELEKVHREVNDASRRVVEKARRVLK
>2plus1_GFP11_KEY_Nterm_205(SEQ ID NO:26946)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_KEY_Nterm_206(SEQ ID NO:26947)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_KEY_Nterm_207(SEQ ID NO:26948)
SESDDVIRKLRELLEELRTHVEKSIRDLRKILEDSTRHAKRSIEELERLLEEVRKKPG
>2plus1_GFP11_KEY_Nterm_208(SEQ ID NO:26949)
DEVRELLERNRRLLEEIKKTVKDLIRANEELLKRIEDDAKRLIDRNEELLDELEKGLS
>2plus1_GFP11_KEY_Nterm_209(SEQ ID NO:26950)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_KEY_Nterm_210(SEQ ID NO:26951)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_KEY_Nterm_211(SEQ ID NO:26952)
DEEEDLERAIKKLLDENRELLKRIAEELRRLLEELRRLTEESADRLRRLLKELKDRGV
>2plus1_GFP11_KEY_Nterm_212(SEQ ID NO:26953)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_KEY_Nterm_213(SEQ ID NO:26954)
SKEDRLREELKKLLARLAEEIERLKRALEESNKDLKRTIDASEKHLRDVNEDVKRGGV
>2plus1_GFP11_KEY_Nterm_214(SEQ ID NO:26955)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_KEY_Nterm_215(SEQ ID NO:26956)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_KEY_Nterm_216(SEQ ID NO:26957)
SESDDVIRKLRELLEELRTHVEKSIRDLRKILEDSTRHAKRSIEELERLLEEVRKKPG
>2plus1_GFP11_KEY_Nterm_217(SEQ ID NO:26958)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_KEY_Nterm_218(SEQ ID NO:26959)
SEVDEIIKELERLLAEIARENERIIRESRKLADEVRKRNEDAIRKLEELVARLADAVR
>2plus1_GFP11_KEY_Nterm_219(SEQ ID NO:26960)
SSVEELLERLRRISEENKRRIEKLLREVEKVLRELKDRHRKLLKRVEEIIRKVKEEIK
>2plus1_GFP11_KEY_Nterm_220(SEQ ID NO:26961)
SELEEVLRRIEALVRKAHKENEDVLREIERLVRTAHRLNKKVDDDSAKIAEDLKRGGR
>2plus1_GFP11_KEY_Nterm_221(SEQ ID NO:26962)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_KEY_Nterm_222(SEQ ID NO:26963)
SESDDVIRKLRELLEELRTHVEKSIRDLRKILEDSTRHAKRSIEELERLLEEVRKKPG
>2plus1_GFP11_KEY_Nterm_223(SEQ ID NO:26964)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_KEY_Nterm_224(SEQ ID NO:26965)
DEVRELLERNRRLLEEIKKTVKDLIRANEELLKRIEDDAKRLIDRNEELLDELEKGLS
>2plus1_GFP11_KEY_Nterm_225(SEQ ID NO:26966)
STEEVLDEIRKLHKTLTEDIKRVLREIEELHRRTIEENKEVLDKIAEDYKRVIDDVRT
>2plus1_GFP11_KEY_Nterm_226(SEQ ID NO:26967)
SEIEKILKEIEDLARRDEEVSKKIVEDIRRLAKEVEDTSRDIVRKIEELAKRVLDRLR
>2plus1_GFP11_KEY_Nterm_227(SEQ ID NO:26968)
SEAERLEARARELLRANEELMDDLRAKAEELLKRNDRLVKEIEKKVREVLAAIEELKR
>2plus1_GFP11_KEY_Nterm_228(SEQ ID NO:26969)
DDLERAREEVADLIRKHEEKTRRILEESRRLNERHRELSARILDEIRKLAERIEELIK
>2plus1_GFP11_KEY_Nterm_229(SEQ ID NO:26970)
DEEEDLERAIKKLLDENRELLKRIAEELRRLLEELRRLTEESADRLRRLLKELKDRGV
>2plus1_GFP11_KEY_Nterm_230(SEQ ID NO:26971)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_KEY_Nterm_231(SEQ ID NO:26972)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_KEY_Nterm_232(SEQ ID NO:26973)
STAETVEKKVEEVIRENEKSMRESEEKVDRSTKRIEDVLRRLEETIRKTSDDIAKGVK
>2plus1_GFP11_KEY_Nterm_233(SEQ ID NO:26974)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_KEY_Nterm_234(SEQ ID NO:26975)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_KEY_Nterm_235(SEQ ID NO:26976)
REVEEMIKELEELLKDLKEKNERASKRNRELVRRLEEENKRVIEELKKLVKELEDLVR
>2plus1_GFP11_KEY_Nterm_236(SEQ ID NO:26977)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_KEY_Nterm_237(SEQ ID NO:26978)
SKLEEVEKAVRKVIEDSRRVNEEVNRRSEEVVRELEKVHREVNDASRRVVEKARRVLK
>2plus1_GFP11_KEY_Nterm_238(SEQ ID NO:26979)
DEVEDVLRKIEKILDDHRKRIEKNSRDMARIIDEHRRKVEENSREMKKLVDDLKKAVD
>2plus1_GFP11_KEY_Nterm_239(SEQ ID NO:26980)
SSVEELLERLRRISEENKRRIEKLLREVEKVLRELKDRHRKLLKRVEEIIRKVKEEIK
>2plus1_GFP11_KEY_Nterm_240(SEQ ID NO:26981)
DEVEKVLEEIKRALDDLRKKVEESKREIKEALKAVEKHTRDSDTANKRTLAEIERGVK
>2plus1_GFP11_KEY_Nterm_241(SEQ ID NO:26982)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_KEY_Nterm_242(SEQ ID NO:26983)
KEVEDAVKELEDLLRANEDKTRSIVEDMRASNKDLEDHSRASEEEVRKLLDDLRRAGV
>2plus1_GFP11_KEY_Nterm_243(SEQ ID NO:26984)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_KEY_Nterm_244(SEQ ID NO:26985)
STAETVAEEVERVLKHSDDLIKEVEDVNRRVEEEIKRVIRELEEENERLVAEVRKGVK
>2plus1_GFP11_KEY_Nterm_245(SEQ ID NO:26986)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_KEY_Nterm_246(SEQ ID NO:26987)
SEVDEIIKELERLLAEIARENERIIRESRKLADEVRKRNEDAIRKLEELVARLADAVR
>2plus1_GFP11_KEY_Nterm_247(SEQ ID NO:26988)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_KEY_Nterm_248(SEQ ID NO:26989)
SKLEEVEKAVRKVIEDSRRVNEEVNRRSEEVVRELEKVHREVNDASRRVVEKARRVLK
>2plus1_GFP11_KEY_Nterm_249(SEQ ID NO:26990)
SAEEVKEELKRIATKLKEEIKENIRRLEESVEKIAKELAENIKRLEDILRDVKRGLRD
>2plus1_GFP11_KEY_Nterm_250(SEQ ID NO:26991)
SDVDRVLEEIRKLLEDLKRHSEKVSEENEDLLRANTELNKRVSEDNERLLEELKRLRE
>2plus1_GFP11_KEY_Nterm_251(SEQ ID NO:26992)
DEVEDVLRKIEKILDDHRKRIEKNSRDMARIIDEHRRKVEENSREMKKLVDDLKKAVD
>2plus1_GFP11_KEY_Nterm_252(SEQ ID NO:26993)
SSVEELLERLRRISEENKRRIEKLLREVEKVLRELKDRHRKLLKRVEEIIRKVKEEIK
>2plus1_GFP11_KEY_Nterm_253(SEQ ID NO:26994)
DREREVKKRLDEVRERIERLLRRVEEESRRVAEEIRRLIEEVRRRNKKVTEEIRELLK
>2plus1_GFP11_KEY_Nterm_254(SEQ ID NO:26995)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_KEY_Nterm_255(SEQ ID NO:26996)
SEIEKILKEIEDLARRDEEVSKKIVEDIRRLAKEVEDTSRDIVRKIEELAKRVLDRLR
>2plus1_GFP11_KEY_Nterm_256(SEQ ID NO:26997)
SEAEKAKETIDRLADRVRKLLEEIKRSLDDSRRKSKETVEENEKTLDRMRKEVDAAKR
>2plus1_GFP11_KEY_Nterm_257(SEQ ID NO:26998)
SEVEELIKRLAKVLKELVDKVRKVIEDTKELLERLKRRSEDHIRKLREVLKEAKDQPI
>2plus1_GFP11_KEY_Nterm_258(SEQ ID NO:26999)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_KEY_Nterm_259(SEQ ID NO:27000)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_KEY_Nterm_260(SEQ ID NO:27001)
STAETVEKKVEEVIRENEKSMRESEEKVDRSTKRIEDVLRRLEETIRKTSDDIAKGVK
>2plus1_GFP11_KEY_Nterm_261(SEQ ID NO:27002)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_KEY_Nterm_262(SEQ ID NO:27003)
REVEEMIKELEELLKDLKEKNERASKRNRELVRRLEEENKRVIEELKKLVKELEDLVR
>2plus1_GFP11_KEY_Nterm_263(SEQ ID NO:27004)
DAVEEAEKLIRKVIADSEKLLRDLADLNAKSIRRSEKLVEDDRRANEDVIRKLEELRR
>2plus1_GFP11_KEY_Nterm_264(SEQ ID NO:27004)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_KEY_Nterm_265(SEQ ID NO:27006)
SEIERVKKRLEELLAEVEESTRRLEERLKRLLEEAKRSSEEVEKELRRLLEAVRRGLS
>2plus1_GFP11_KEY_Nterm_266(SEQ ID NO:27007)
SDVDRVLEEIRKLLEDLKRHSEKVSEENEDLLRANTELNKRVSEDNERLLEELKRLRE
>2plus1_GFP11_KEY_Nterm_267(SEQ ID NO:27008)
DEVEDVLRKIEKILDDHRKRIEKNSRDMARIIDEHRRKVEENSREMKKLVDDLKKAVD
>2plus1_GFP11_KEY_Nterm_268(SEQ ID NO:27009)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_KEY_Nterm_269(SEQ ID NO:27010)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_KEY_Nterm_270(SEQ ID NO:27011)
DEEEDLERAIKKLLDENRELLKRIAEELRRLLEELRRLTEESADRLRRLLKELKDRGV
>2plus1_GFP11_KEY_Nterm_271(SEQ ID NO:27012)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_KEY_Nterm_272(SEQ ID NO:27013)
DAVEEAEKLIRKVIADSEKLLRDLADLNAKSIRRSEKLVEDDRRANEDVIRKLEELRR
>2plus1_GFP11_KEY_Nterm_273(SEQ ID NO:27014)
SEDEDLDRVAEKLAREHKKSVEEIKRVLKSADEESKKLVRDTERVIEEIKREVEEARR
>2plus1_GFP11_KEY_Nterm_274(SEQ ID NO:27015)
SKEDRLREELKKLLARLAEEIERLKRALEESNKDLKRTIDASEKHLRDVNEDVKRGGV
>3plus1_KEY_668_Nterm(SEQ ID NO:27322)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRLEKELRDLKRRIEEKLEELRRGSL
>3plus1_KEY_668_Cterm(SEQ ID NO:27323)
RGADALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_KEY_668_Cterm(SEQ ID NO:27324)
SEKEKLLKESEEEVRRLRRTLEELLRKYREVLERLRKELREIEERVRDVVRRLKEVLD
>3plus1_KEY_668_Cterm(SEQ ID NO:27325)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_KEY_668_Cterm(SEQ ID NO:27326)
EALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_KEY_669_Nterm(SEQ ID NO:27327)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_KEY_670_Nterm(SEQ ID NO:27328)
SDERRIAERIRELLRESKKLVRDVVEEAKRLLKENRDSTRKIIEDIRRLLRKIEDSTR
>3plus1_KEY_670_Cterm(SEQ ID NO:27329)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_KEY_670_Cterm(SEQ ID NO:27330)
AAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_KEY_670_Cterm(SEQ ID NO:27331)
KEREEVKEKLDRLLEEVEKTVRELKREHDELLKEVEKLVRDLKKEHDELLKKVKDDGV
>3plus1_KEY_670_Nterm(SEQ ID NO:27332)
DRLDKVEELVKKLLEDTKRTVDRVRELVRKILKKSRETLEELERLIEKILRELEKDAR
>3plus1_KEY_670_Cterm(SEQ ID NO:27333)
SERETVKRRLEELLKEVKRTLDKLKEEHDRLLEDVRRVVEELKREHDKLLKEVKDSGV
>3plus1_KEY_670_Nterm(SEQ ID NO:27334)
SEDEIIKKIIEDLRRVLKEVEEIHKEVEERLDKVLKEAEEMHKEVLKELDRVLDEVKR
>3plus1_KEY_670_Nterm(SEQ ID NO:27335)
SREEVLRELEEVIEDNRRLLEELIEKSKKVLDESLKLIDELLRRLEEVLERVLRLLEE
>3plus1_KEY_670_Nterm(SEQ ID NO:27336)
ISEDDLKRVVDEVEKKLRELKRRYAEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_KEY_670_Nterm(SEQ ID NO:27337)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_KEY_671_Cterm(SEQ ID NO:27338)
VDSERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_KEY_671_Cterm(SEQ ID NO:27339)
VKDDEVEREIRRVKEDLDRILEEYRRLLEEIKRKLEEILRRVEELHRRLRRKLEEIDR
>3plus1_KEY_671_Cterm(SEQ ID NO:27340)
SRVEELKKLIEDILRISREVVERIKRVAEDIHRINRRVLDDLRKLIEDILRTVEEILA
>3plus1_KEY_671_Cterm(SEQ ID NO:27341)
RGADALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_KEY_672_Cterm(SEQ ID NO:27342)
RGADALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_KEY_67>3_Nterm(SEQ ID NO:27343)
EALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_KEY_67>3_Cterm(SEQ ID NO:27344)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_KEY_67>3_Nterm(SEQ ID NO:27345)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_KEY_674_Nterm(SEQ ID NO:27346)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_KEY_674_Cterm(SEQ ID NO:27347)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_KEY_675_Nterm(SEQ ID NO:27348)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_KEY_676_Nterm(SEQ ID NO:27349)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_KEY_677_Nterm(SEQ ID NO:27350)
SDERRIAERIRELLRESKKLVRDVVEEAKRLLKENRDSTRKIIEDIRRLLRKIEDSTR
>3plus1_KEY_677_Cterm(SEQ ID NO:27351)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_KEY_678_Nterm(SEQ ID NO:27352)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_KEY_678_Cterm(SEQ ID NO:27353)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_KEY_678_Cterm(SEQ ID NO:27354)
ISEDDLKRVVDEVEKKLRELKRRYAEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_KEY_678_Nterm(SEQ ID NO:27355)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_KEY_678_Nterm(SEQ ID NO:27356)
VDSERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_KEY_679_Cterm(SEQ ID NO:27357)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_KEY_679_Nterm(SEQ ID NO:27358)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
在另一个具体实施方式中,钥匙多肽包含沿着其长度与表2或5(具有SEQ ID NO:27127和27277之间的奇数SEQ ID NO的多肽)、表3和/或表4中钥匙多肽的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的多肽。在另一个具体实施方式中,钥匙多肽包含沿着其长度与表3中的钥匙多肽的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的多肽。在另一个具体实施方式中,钥匙多肽包含沿着其长度与表4中的钥匙多肽的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的多肽。在上述各项的一个实施方式中,可以在没有任选的N-末端和C-末端60个氨基酸的情况下确定鉴定百分比;在另一个实施方式中,可以用任选的N和C-末端60个氨基酸确定鉴定百分比。
在一个具体实施方式中,所述多肽包含沿着其长度与选自由SEQ ID NO:28477-28486组成的组中的钥匙多肽的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的多肽。
本公开的多肽(即:笼多肽和钥匙多肽)可以在多肽的N-末端、C-末端、内部或其组合处包括另外的残基;这些另外的残基不包括在确定本发明多肽相对于参考多肽的同一性百分比中。此类残基可以是适用于预期用途的任何残基,包括但不限于标签。如本文所用,“标签”包括一般的可检测部分(即:荧光蛋白、抗体表位标签等)、治疗剂、纯化标签(His标签等)、接头、适用于纯化目的的配体、驱动多肽定位的配体、为多肽增加功能的肽结构域等。本文提供了实例。
在一个实施方式中,所述多肽是融合蛋白,其包含与本文公开的钥匙多肽融合的本文公开的笼多肽。在一个实施方式中,所述融合蛋白包含与钥匙多肽融合的笼多肽,其中所述笼多肽未被所述钥匙多肽激活。如本文所指出的,正交LOCKR设计(参见图3)由小写字母下标表示:LOCKRa由笼a和钥匙a组成,并且LOCKRb由笼b和钥匙b组成等,使得笼a仅被钥匙a激活,并且笼b仅被钥匙b激活等。因此,例如,融合蛋白可包含与钥匙b多肽融合的笼a多肽。可例如组合使用此类实施方式以改善正交LOCKR设计的控制(例如:LOCKR 1包含笼a-钥匙b融合多肽,并且LOCKR 2包含笼b-钥匙a融合多肽,然后可以在同一细胞中表达)。
如本文所用,“正交地”或“正交”意指特定钥匙多肽和笼多肽可一起发挥作用,而其他多肽则不可以。因此,钥匙多肽和笼多肽的两个或更多个不同的正交系统可独立地在同一系统、细胞或生物体种发挥作用,而不彼此干扰。然而,如本文明确指出的,多个单独的钥匙多肽可以与多种不同的笼多肽一起发挥作用,并且,多个单独的笼多肽可以与多种不同的钥匙多肽一起发挥作用。
在本文公开的融合蛋白的一个实施方式中,融合蛋白的笼多肽和钥匙多肽组件包含至少一种笼多肽和至少一种钥匙多肽,其包含沿着其长度分别与表2、表3、表4和/或表5的不同行中的笼多肽和钥匙多肽具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列(即:表第1行第1列中的每种笼多肽可以与第1行第2列中的任何钥匙多肽融合,依此类推)。在实施方式中,与表2、3、4和5相关,降解决定子不包括在笼多肽的氨基酸序列中并且将被添加在闩锁区域内,包括但不限于本文所公开的那些降解决定子氨基酸序列。
表2
在第二和第三方面的试剂盒和降解决定子LOCKR开关的其他实施方式中,一种或多种笼多肽和一种或多种钥匙多肽包含至少一种笼多肽和至少一种钥匙多肽,其包含分别沿着表6或表7的同一行中的笼多肽和钥匙多肽的长度具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列(即:第1列中列出的所有笼多肽可连同第1列中的所有钥匙多肽一起使用;等):
在一些方面,本公开的多肽还包含一种或多种信号传导蛋白,例如,信号传导途径的输入接收构件、中间构件和/或输出产生构件。如本文所用,术语“信号传导蛋白”通常是指信号途径的蛋白质,包括天然和合成信号传导途径,下文更详细地描述。可以采用任何方便的信号传导途径的任何方便且适当的信号传导蛋白。一般来说,信号传导蛋白包括可被与信号传导蛋白有关的信号传导途径的输入激活的蛋白质。信号传导途径可生成依赖于信号传导蛋白功能至少受其影响的输出。此类输出可以是信号传导蛋白对输入的反应的直接或间接结果。有用的信号传导蛋白包括来自信号传导途径的任何方便且适当的点的构件,包括输入接收构件、中间构件和输出产生构件。
如本文所用,“输入接收构件”通常意指信号传导的初始组件,其接收输入以起始沿着途径的信号传导。输入接收构件的实例包括但不限于例如细胞外受体(例如,G蛋白偶联受体、蛋白激酶、整联蛋白、toll样受体、配体门控离子通道等)和细胞内受体(例如,核受体、细胞质受体等)。在一些方面,输入接收构件可为直接结合信号传导途径的输入的蛋白质,诸如信号传导途径的配体输入。在一些方面,包括本公开的笼多肽中的降解决定子的信号传导蛋白可为输入接收构件。在一些方面,包括本公开的多肽中笼多肽中的降解决定子的信号传导蛋白可不为输入接收构件,例如其可为中间构件或输出产生构件。
如本文所用,“中间构件”通常意指信号转导所需或至少涉及但不直接接收初始输入或直接产生或导致信号传导途径的最终输出的信号传导途径的组件。信号传导途径的中间构件的实例包括但不限于例如酶、结合配偶体、蛋白复合物亚单元、支架蛋白、转运蛋白、共激活因子、共阻遏因子等等。在一些方面,包括本公开的笼多肽中的降解决定子的信号传导蛋白可为中间构件。在一些方面,包括本公开的笼多肽中的降解决定子的信号传导蛋白可不为中间构件,例如其可为输入接收构件或输出产生构件。
如本文所用,“输出产生构件”通常意指直接产生信号传导途径的输出或以其他方式导致产生信号传导途径的输出的信号传导途径的组件。信号传导途径的输出产生构件的实例包括但不限于例如DNA结合蛋白,例如转录因子、酶等等。在一些方面,包括本公开的笼多肽中的降解决定子的信号传导蛋白可为输出产生构件。在一些方面,包括本公开的笼多肽中的降解决定子的信号传导蛋白可不为输出产生构件,例如其可为输入接收构件或中间构件。
如上所概述,各种信号传导途径,包括天然和合成信号传导途径,都可使用本文所述的分子电路进行调节。合适的信号传导途径包括被一个或多个输入调节(例如,激活、阻遏等)以产生一个或多个输出的那些。信号传导途径的输入和输出可以不同并且可以包括信号传导途径的内源性(例如,天然)输入或输出和异源性(例如,工程化或合成)信号传导途径输入和输出。
在一些方面,与本公开的多肽相关的信号传导途径的输入可以包括细胞内信号,包括例如途径的输出可为细胞内或细胞间的情况。在一些方面,与本公开的多肽相关的信号传导途径的输出可以包括细胞内信号,包括例如途径的输入可为细胞内或细胞间的情况。在一些方面,与本公开的多肽相关的信号传导途径的输入可以包括细胞间信号,包括例如途径的输出可为细胞内或细胞间的情况。在一些方面,与本公开的多肽相关的信号传导途径的输出可以包括细胞间信号,包括例如途径的输入可为细胞内或细胞间的情况。
在一些方面,与本公开的多肽相关的信号传导途径的输入和输出都可以包括细胞内信号。在一些方面,与本公开的多肽相关的信号传导途径的输入和输出都可以包括细胞间信号。
可以使用本公开的多肽调节的天然信号传导途径的合适的非限制性实例包括但不限于例如:AKT信号传导途径、Akt/PKB信号传导途径、AMPK信号传导途径、凋亡信号传导途径、BMP信号传导途径、cAMP依赖性途径、雌激素信号传导途径、hedgehog信号传导途径、hippo信号传导途径、免疫激活途径、免疫抑制途径、免疫细胞分化途径、胰岛素信号转导途径、JAK-STAT信号传导途径、MAPK/ERK信号传导途径、mTOR信号传导途径、NF-B信号传导途径、nodal信号传导途径、notch信号传导途径、p53信号传导途径、PI3K信号传导途径、TGFβ信号传导途径、TLR信号传导途径、TNF信号传导途径、VEGF信号传导途径、Wnt信号传导途径等等。
途径(其组件可被修饰以包括如本文所述的笼多肽中的降解决定子)的合适的非限制性实例还包括作为基因本体系统发育注释项目(Gene Ontology PhylogeneticAnnotation Project)的一部分描述的那些PANTHER(通过进化关系的蛋白质分析),其描述(包括此类途径的组件的描述)可在www.pantherdb.org线上获得。非限制性实例包括2-花生四烯酸甘油生物合成、5HT1型受体介导的信号传导途径、5HT2型受体介导的信号传导途径、5HT3型受体介导的信号传导途径、5HT4型受体介导的信号传导途径、5-羟基色胺生物合成、5-羟基色胺降解、乙酸盐利用、活化素β信号传导途径、腺嘌呤和次黄嘌呤补救途径、肾上腺素和去甲肾上腺素生物合成、丙氨酸生物合成、尿囊素降解、ALP23B信号传导途径、α肾上腺素能受体信号传导途径、阿尔茨海默氏病淀粉样蛋白分泌酶途径、阿尔茨海默氏病早老素途径、氨基丁酸盐降解、花生四烯乙醇胺生物合成、花生四烯乙醇胺降解、雄激素/雌激素/孕酮生物合成、血管生成途径、通过G蛋白和β-抑制蛋白的血管紧张素II刺激的信号传导、凋亡信号传导途径、精氨酸生物合成、抗坏血酸盐降解、天冬酰胺和天冬氨酸盐生物合成、ATP合成、由纺锤蛋白介导的轴突导向、由脑信号蛋白介导的轴突导向、由Slit/Robo介导的轴突导向、B细胞激活途径、β1肾上腺素能受体信号传导途径、β2肾上腺素能受体信号传导途径、β3肾上腺素能受体信号传导途径、生物素生物合成、凝血、BMP/活化素信号传导途径、安非他酮降解、钙粘着蛋白信号传导途径、辅酶A连接的肉碱代谢、肉碱代谢、CCKR信号传导、细胞周期、胆固醇生物合成、分支酸生物合成、生物钟系统、钴胺素生物合成、辅酶A生物合成、促肾上腺皮质激素释放因子受体信号传导途径、半胱氨酸生物合成、通过RhoGTP酶的细胞骨调控、全新嘌呤生物合成、全新嘧啶脱氧核糖核苷酸生物合成、全新嘧啶核糖核苷酸生物合成、DNA复制、多巴胺受体介导的信号传导途径、DPP-SCW信号传导途径、DPP信号传导途径、EGF受体信号传导途径、内源性大麻酯信号传导、内皮素信号传导途径、脑啡肽释放、FAS信号传导途径、FGF信号传导途径、黄素生物合成、四氢叶酸生物合成、甲酰基四氢甲酸盐生物合成、果糖半乳糖代谢、GABA-B受体II信号传导、γ-氨基丁酸合成、GBB信号传导途径、通过RNA聚合酶I的通用转录、通用转录调控、谷氨酰胺谷氨酸盐转化、糖酵解、促性腺激素释放激素受体途径、Hedgehog信号传导途径、Heme生物合成、异三聚体G蛋白信号传导途径-Giα和Gsα介导的途径、异三聚体G蛋白信号传导途径-Gqα和Goα介导的途径、异三聚体G蛋白信号传导途径-杆外段光传导、组织胺H1受体介导的信号传导途径、组织胺H2受体介导的信号传导途径、组织胺合成、组氨酸生物合成、亨廷顿病途径、通过HIF激活的缺氧反应、由趋化因子和细胞因子信号传导途径介导的炎症、胰岛素/IGF途径-丝裂原激活的蛋白质激酶激酶/MAP激酶级联、胰岛素/IGF途径-蛋白激酶B信号传导级联、整联蛋白信号传导途径、干扰素γ信号传导途径、白介素信号传导途径、离子移变谷氨酸盐受体途径、异亮氨酸生物合成、JAK/STAT信号传导途径、亮氨酸生物合成、硫辛酸生物合成、赖氨酸生物合成、甘露糖代谢、代谢型谷氨酸盐受体III组途径、代谢型谷氨酸盐受体II组途径、代谢型谷氨酸盐受体I组途径、蛋氨酸生物合成、甲基柠檬酸循环、甲基丙二酰途径、mRNA剪接、毒蕈碱乙酰胆碱受体1和3信号传导途径、毒蕈碱乙酰胆碱受体2和4信号传导途径、MYO信号传导途径、N-乙酰基葡糖胺代谢、烟碱降解、烟碱药效动力学途径、烟碱型乙酰胆碱受体信号传导途径、Notch信号传导途径、O-抗原生物合成、阿片样强啡肽原途径、阿片样脑啡肽原途径、阿片样阿黑皮素原途径、鸟氨酸降解、氧化应激反应、催产素受体介导的信号传导途径、p38 MAPK途径、p53途径、通过葡萄糖剥夺的p53途径、泛酸盐生物合成、帕金森氏病、PDGF信号传导途径、戊糖磷酸途径、肽聚糖生物合成、苯基乙酸盐降解、苯基丙氨酸生物合成、苯基乙胺降解、苯基丙酸盐降解、PI3激酶途径、纤溶酶原激活级联、吡哆醛-5-磷酸盐生物合成、脯氨酸生物合成、PRPP生物合成、嘌呤代谢、吡哆醛磷酸盐补救途径、嘧啶代谢、丙酮酸盐代谢、Ras途径、S-腺苷蛋氨酸生物合成、补救嘧啶脱氧核糖核苷酸、补救嘧啶核糖核苷酸、SCW信号传导途径、丝氨酸甘氨酸生物合成、琥珀酸酯向丙酸酯的转化、硫酸酯同化、突触囊泡转运、TCA循环、T细胞激活途径、TGFβ信号传导途径、硫胺素生物合成、硫胺素代谢、苏氨酸生物合成、促甲状腺素释放激素受体信号传导途径、Toll途径、Toll受体信号传导途径、通过bZIP转录因子的转录调控、三酰甘油代谢、色氨酸生物合成、酪氨酸生物合成、泛素蛋白酶体途径、缬氨酸生物合成、加压素合成、VEGF信号传导途径、维生素B6生物合成、维生素B6代谢、维生素D代谢和途径、Wnt信号传导途径、黄嘌呤和鸟嘌呤补救途径等等。
信号传导途径的其他非限制性实例及其描述包括以下:AKT信号传导途径(AKT为参与介导各种生物反应(如抑制细胞凋亡)的丝氨酸/苏氨酸激酶)、血管生成素-TIE2信号传导(血管生成素为结合TIE2/TEK RTK(受体酪氨酸激酶)的新生长因子配体家族)、通过MHC的抗原加工和呈递(抗原加工和呈递为导致蛋白质与主要组织相容性复合物(MHC)分子缔合以便被T细胞识别的过程)、通过死亡受体的凋亡(某些细胞具有独特的传感器,被称为死亡受体(DR),其检测细胞外死亡信号的存在并快速引发细胞内在凋亡机制)、APRIL途径(在免疫反应中,APRIL用作B细胞和T细胞增殖的共刺激物并支持类别切换)、B细胞发展途径(B细胞受体(BCR)复合物通常由抗原结合亚单元组成,所述抗原结合亚单元由两条Ig重链、两条Ig轻链和信号传导亚单元构成)、BMP途径(骨形态发生蛋白(BMP)为转化生长因子β(TGFβ)超家族的大亚类)、癌症免疫编辑(免疫系统试图限制肿瘤的生长,但有时肿瘤细胞可能逃避或减弱这种免疫压力)、巨噬细胞中的CCR5途径(C-C基序趋化因子受体5型(CCR5)为G蛋白偶联受体(GPCR)超家族中的趋化因子受体亚类的成员)、CD4和CD8 T细胞谱系(每个成熟的T细胞通常保留了共受体分子(CD4或CD8)的表达,所述共受体分子具有与其T细胞受体(TCR)匹配的主要组织相容性复合物(MHC)结合特性)、细胞凋亡途径(凋亡为自然存在的过程,细胞通过这个过程被引导至程序性细胞死亡)、CTL介导的凋亡(细胞毒性T淋巴细胞(CTL),也被称为杀手T细胞,是在细胞介导的免疫期间产生的,其被设计成除去显示外来表位的身体细胞)、CTLA4信号传导途径(共刺激CTLA4途径减弱或下调T细胞激活,CTLA4被设计成除去显示外来表位的体细胞)、细胞因子网络(细胞因子基于其生物反应被分类为促炎性或消炎性细胞因子,这取决于它们对免疫细胞的作用)、ErbB家族途径(跨膜受体酪氨酸激酶(RTK)的ErbB家族的在器官的生长和发育过程中起着重要作用)、Fas信号传导(FAS(也称为APO1或CD95)为有肿瘤坏死因子(TNF)受体超家族的含有死亡结构域的成员)、FGF途径(血管生成的表征最好的调节剂之一为肝素结合成纤维细胞生长因子(FGF))、粒细胞粘附和血球渗出(粒细胞的粘附和血球渗出大多在非淋巴样内皮的情况下分析)、颗粒酶途径(颗粒酶A(GzmA)激活具有凋亡的形态学特征的caspase无关的细胞死亡途径)、GSK3信号传导(GSK3为普遍表达的、高度保守的丝氨酸/苏氨酸蛋白激酶,其在所有真核生物中存在)、多潜能干细胞的造血作用(造血干细胞基于其自我更新能力的程度被分类为长期、短期和多潜能祖细胞)、多能干细胞的造血作用(多能干细胞能够形成在人类中存在的几乎所有可能的组织类型)、在激活和静止T细胞中的IL-2基因表达(IL-2为刺激T细胞、B细胞、NK细胞和其他免疫细胞的生长、增殖和分化的细胞因子)、IL-6途径(IL-6为影响各种器官中免疫系统和许多生理事件的多态性细胞因子)、IL-10途径(IL-10为具有重要免疫调节功能的多效细胞因子并且其活性影响许多免疫细胞类型)、IL-22途径(IL-22为细胞因子的IL-10家族的成员并且对免疫系统产生多种影响)、干扰素途径(干扰素为多能细胞因子,以其诱导细胞抵抗病毒感染的能力最为著名)、JAK/STAT途径(JAK/STAT途径为信号传导级联,其进化保守的作用包括细胞增殖和造血作用)、MAPK家族途径(丝裂原激活的蛋白激酶(MAPK)属于丝氨酸/苏氨酸蛋白激酶家族的大家族,其在酵母和人等不同生物体中都是保守的)、哺乳动物ESC多能性中的Nanog(NANOG为在多能干细胞中转录的转录因子并且在细胞分化时下调)、p53介导的细胞凋亡途径(肿瘤蛋白p53为核转录因子,其响应于遗传毒性或细胞应激来调控参与凋亡、生长停滞或衰老的多种基因的表达)、类风湿性关节炎的发病机制(类风湿性关节炎(RA)为慢性对称性多关节的关节疾病,其主要影响手和脚的小关节)、B淋巴细胞中的PI3K信号(磷酸肌醇3-激酶(PI3K)调控许多生物过程,包括细胞生长、分化、存活、增殖、迁移和代谢)、RANK途径(RANKL及其受体RANK为骨重建的关键调控因子并且对破骨细胞的发育和激活至关重要)、破骨细胞中的RANK信号传导(RANKL诱导破骨细胞前体细胞的分化并且刺激成熟破骨细胞的吸收功能和存活)、TGFβ途径(转化生长因子(TGF)β家族的成员在大多数组织的发育、稳态和修复中发挥重要作用)、破骨细胞中的RANK信号传导(RANKL诱导破骨细胞前体细胞的分化并且刺激成熟破骨细胞的吸收功能和存活)、TGFβ途径(转化生长因子(TGF)β家族的成员在大多数组织的发育、稳态和修复中发挥重要作用)、THC分化途径(1型(TH1)和2型(TH2)T辅助细胞衍生自T辅助细胞并且为先天和适应性免疫系统的细胞提供帮助)、TNF信号传导途径(肿瘤坏死因子(TNF)为多功能促炎性细胞因子,其对脂质代谢、凝血、胰岛素抵抗和内皮功能起作用)、TNF超家族途径(肿瘤坏死因子(TNF)超家族由19个成员组成,其通过29种受体发出信号,所述受体为TNF受体(TNFR)超家族的成员)、白细胞的跨内皮迁移(血浆蛋白和溶质跨内皮的运输涉及两种不同的途径:跨细胞和细胞旁连接)、肝脏NK细胞的杀瘤作用(肝为肿瘤的形成和转移的主要场所)、TWEAK途径(TWEAK为属于肿瘤坏死因子(TNF)超家族的细胞表面相关蛋白并且具有多种生物活性)、配体和受体相互作用的VEGF家族(血管内皮生长因子(VEGF)为从简单到复杂系统的高度保守的遗传途径)等等。
如上所概述,信号传导途径的组件,包括但不限于本文所述的途径,可以被修饰改成包括笼多肽中的降解决定子,使得信号传导途径成员的降解可以通过钥匙多肽的表达来控制。可以采用的合适的途径组件包括例如输入接收构件、中间构件和输出产生构件,包括但不限于例如上文列出的途径的对应构件。
相似地,基本上任何合成途径都可以用如本文所述的笼多肽中的降解决定子进行调节。可以使用本公开的笼多肽中的降解决定子调节的合成信号传导途径的合适的非限制性实例包括但不限于通过合成或工程化受体(例如但不限于例如CAR、工程化TCR、synNotch等)控制的那些途径。
在一些方面,使用本公开的笼多肽中的降解决定子调节的途径可以包括免疫调节途径,例如,免疫激活途径或免疫抑制途径。此类免疫调节途径可为天然或合成的并且可为采用笼多肽的降解决定子的细胞内源的或为采用笼多肽中的降解决定子的细胞异源的。
可使用本公开的笼多肽中的降解决定子调节的合成信号传导途径的合适的非限制性实例还包括生物合成和/或生物产生途径。生物合成和/或生物产生途径可为天然或合成的,并且可以在途径为内源或异源的细胞和/或生物体内采用。
可以使用本公开的笼多肽中的降解决定子来调节的生物合成途径的非限制性实例包括但不限于激素产生途径(例如,胰岛素产生途径、雌激素/孕酮产生途径、雄激素产生途径、生长激素产生途径等等)、阿片类产生途径、异丁醇产生途径、非核糖体多酮合成酶(NRPS)产生途径、抗生素产生途径、化疗药产生途径、青蒿酸产生途径、萜类产生途径、聚酮产生途径等等。
合成生物合成途径的非限制性实例包括但不限于例如合成激素产生途径、合成阿片类产生途径、合成抗生素产生途径、合成化疗药产生途径、合成青蒿酸产生途径、合成萜类产生途径、合成聚酮产生途径等等。
正如在整个本申请中所使用的那样,术语“多肽”以其最广泛的含义用于指亚单位氨基酸序列。本发明的多肽可以包含L-氨基酸+甘氨酸、D-氨基酸+甘氨酸(其在体内对L-氨基酸特异性蛋白酶具有抗性)或D-和L-氨基酸+甘氨酸的组合。本文所述的多肽可以化学合成或重组表达。所述多肽可以连接到其他化合物,以诸如通过聚乙二醇化、糖基化、磷酸化、糖基化促进体内半衰期的增加,或者可以作为Fc融合体或去免疫化变体产生。如本领域技术人员所理解的,这种连接可以是共价或非共价的。
在第四方面,本公开提供了编码本文公开的每个方面的任何实施方式或实施方式组合的多肽的核酸。核酸序列可以包含为基因组或cDNA形式的单链或双链RNA或DNA、或DNA-RNA杂合体,其中每个均可以包括化学或生物化学修饰的、非天然的或衍生的核苷酸碱基。此类核酸序列可以包含用于促进编码的多肽的表达和/或纯化的附加序列,包括但不限于polyA序列、修饰的Kozak序列以及编码表位标签、输出信号和分泌信号、核定位信号和质膜定位信号的序列。基于本文的教导,对于本领域技术人员而言清楚的是,何种核酸序列将编码本公开的多肽。
在第五方面,本公开提供了表达载体,其包含可操作地连接到合适的控制序列的本公开任何方面的核酸。“表达载体”包括将核酸编码区域或基因可操作地连接到能够实现基因产物表达的任何控制序列的载体。可操作地连接到本公开的核酸序列的“控制序列”是能够影响核酸分子的表达的核酸序列。控制序列不必与核酸序列邻接,只要所述控制序列起作用以引导所述核酸序列的表达即可。因此,例如,在启动子序列与核酸序列之间可以存在中间的未翻译但被转录的序列,并且仍然可以认为所述启动子序列“可操作地连接”到所述编码序列。其他此类控制序列包括但不限于聚腺苷酸化信号、终止信号和核糖体结合位点。此类表达载体可以是任何类型,包括但不限于质粒和基于病毒的表达载体。用于驱动所公开的核酸序列在哺乳动物系统中表达的控制序列可以是组成型的(由多种启动子中的任一种驱动,所述启动子包括但不限于CMV、SV40、RSV、肌动蛋白、EF)或诱导型的(由许多诱导型启动子中的任一种驱动,所述诱导型启动子包括但不限于四环素、蜕皮激素、类固醇响应性)。表达载体必须可作为附加体或通过整合到宿主染色体DNA中在宿主生物体中复制。在各种实施方式中,表达载体可以包括质粒、基于病毒的载体或任何其他合适的表达载体。
在第六方面,本公开提供了宿主细胞,其包含本文公开的核酸或表达载体(即:游离的或染色体整合的),其中所述宿主细胞可以是原核的或真核的。可以使用包括但不限于细菌转化、磷酸钙共沉淀、电穿孔或脂质体介导的、DEAE葡聚糖介导的、聚阳离子介导的或病毒介导的转染的技术,将细胞瞬时或稳定地工程化以掺入本公开的表达载体。在一个实施方式中,重组宿主细胞包含:
(a)可操作地连接到第一启动子的编码本公开的笼多肽的任何实施方式或实施方式组合的多肽的第一核酸;和
(b)编码本公开的钥匙多肽的任何实施方式或实施方式组合的多肽的第二核酸,其中所述钥匙多肽能够结合到所述笼多肽的结构区域以诱导所述笼多肽的构象变化,其中所述第二核酸可操作地连接到所述第二启动子。
重组宿主细胞可以包含编码核酸的单个笼多肽和编码核酸的单个钥匙多肽,或者可以包含多个(即:2、3、4、5、6、7、8、9、10或更多个)第一和第二核酸—在一个这样的实施方式中,每个第二核酸可以编码能够结合到结构区域并诱导由所述多个第一核酸编码的不同笼多肽的构象变化的钥匙多肽。在另一个实施方式中,每个第二核酸可以编码能够结合到结构区域并诱导由所述多种第一核酸编码的多于一种笼多肽的构象变化的钥匙多肽。
因此,在一个实施方式中,第一核酸包括编码多种不同笼多肽的多种第一核酸。在一个这样的实施方式中,第二核酸包括编码多种不同钥匙多肽的多种第二核酸,其中所述多种不同钥匙多肽包括能够结合并诱导所述多种不同笼多肽的仅子集中构象变化的一种或多种钥匙多肽。在另一个这样的实施方式中,第二核酸编码能够结合并诱导每种不同笼多肽中构象变化的单个钥匙多肽。
在另一个实施方式中,宿主细胞包含编码能够表达本文公开的融合蛋白的表达载体的核酸和/或所述表达载体,其中宿主细胞包含:
(a)编码连接到第一启动子的第一融合蛋白(即:与钥匙多肽融合的笼多肽)的第一核酸;和
(b)编码可操作地连接到第二启动子的第二融合蛋白的第二核酸,其中:
(i)由第一核酸编码的笼多肽被由第二核酸编码的钥匙多肽激活;
(ii)由第一核酸编码的笼多肽未被由第一核酸编码的钥匙多肽激活;
(iii)由第二核酸编码的笼多肽被由第一核酸编码的钥匙多肽激活;并且
(iv)由第二核酸编码的笼多肽未被由第二核酸编码的钥匙多肽激活。
在所有这些实施方式中,第一和/或第二核酸可以例如是表达载体的形式。在其他实施方式中,第一和/或第二核酸可以是整合到宿主细胞基因组中的核酸的形式。
产生根据本公开的多肽的方法是本公开的另外部分。在一个实施方式中,所述方法包括以下步骤:(a)在有利于多肽表达的条件下培养根据本公开这一方面的宿主,和(b)任选地,回收表达的多肽。表达的多肽可以从无细胞提取物中回收,或者从培养基中回收。在另一个实施方式中,所述方法包括化学合成所述多肽。
在第七方面,本公开提供了试剂盒。在一个实施方式中,所述试剂盒包含:
(a)本公开的任何实施方式或实施方式组合的一种或多种笼多肽;
(b)本公开的任何实施方式或实施方式组合的一种或多种钥匙多肽;和
(c)任选地,本文公开的任何实施方式的一种或多种融合蛋白。
在另一个实施方式中,所述试剂盒包含:
(a)编码本公开的任何实施方式或实施方式组合的笼多肽的第一核酸;
(b)编码本公开的任何实施方式或实施方式组合的钥匙多肽的第二核酸;和
(c)任选地,编码本文公开的任何实施方式的融合蛋白的第三核酸。
在另一个实施方式中,所述试剂盒包含:
(a)第一表达载体,其包含编码本公开的任何实施方式或实施方式组合的笼多肽的第一核酸,其中所述第一核酸可操作地连接到第一启动子;和
(b)第二表达载体,其包含编码本公开的任何实施方式或实施方式组合的钥匙多肽的第二核酸,其中所述第二核酸可操作地连接到第二启动子。
在每个试剂盒实施方式中,第一核酸、第二核酸、第一表达载体和/或第二表达载体可以包含编码能够表达笼或钥匙多肽的表达载体的单个核酸或所述表达载体,或者可以包含多个(即:2、3、4、5、6、7、8、9、10或更多个)第一核酸、第二核酸、第一表达载体和/或第二表达载体。在各种这样的实施方式中,每个第二核酸可以编码,或者每个第二表达载体可以能够表达钥匙多肽,所述钥匙多肽能够结合到结构区域并诱导由所述多个第一核酸编码的不同笼多肽的构象变化,或者能够由所述多个第一表达载体表达。在其他实施方式中,每个第二核酸可以编码,或者每个第二表达载体可以能够表达钥匙多肽,所述钥匙多肽能够结合到结构区域并诱导由所述多个第一核酸编码的多于一种笼多肽的构象变化,或者能够由所述多个第一表达载体表达。
在一个实施方式中,可操作地连接到编码笼多肽的核酸的启动子(第一启动子)不同于可操作地连接到编码钥匙多肽的核酸的启动子(第二启动子),从而允许通过控制钥匙多肽的表达来可调节地控制笼多肽和任何功能多肽结构域。在其他实施方式中,可操作地连接到编码笼多肽的核酸的启动子(第一启动子)与可操作地连接到编码钥匙多肽的核酸的启动子(第二启动子)相同。在其他实施方式中,第一启动子和/或第二启动子可以是诱导型启动子。
在第八方面,本公开提供了笼多肽、试剂盒、降解决定子LOCKR开关、核酸、表达载体或包含笼多肽的宿主细胞螯合笼多肽中的降解决定子直至钥匙被表达并激活所述笼多肽并且所述降解决定子靶向所述笼多肽和与其融合的任何功能多肽以便降解的用途。正如本文所详细公开,当钥匙被表达并通过与结构区域相互作用而激活笼多肽时,降解决定子便靶向笼多肽以及与笼多肽融合的任何功能多肽结构以便降解。以此方式,与具有降解决定子的笼多肽融合的感兴趣的功能多肽结构域可以通过钥匙的表达以可滴定的方式进行条件性降解。这在本文中有时称为降解决定子LOCKR。本文公开的试剂盒和降解决定子LOCKR开关与天然蛋白质分开激活并在任何真核细胞中起作用。此外,目前没有用依赖于控制肽的表达的条件降解决定子模块标记感兴趣的任何功能多肽结构域的方法。因此,本文公开的试剂盒和降解决定子LOCKR开关可用作多种生物技术应用中的模块化调控中心,如本文所述。
实施例1
概述:
我们已经开发了一种通用方法来设计新型蛋白质开关,其可以螯合生物活性肽和/或结合结构域,使它们保持非活性(“关闭”)状态,直到与第二种称为钥匙的设计的多肽组合,从而诱导激活(“开启”)所述生物活性肽或结合结构域的构象变化。
定义LOCKR开关的命名和结构特征:
·LOCKR代表闩锁正交笼-钥匙蛋白;每个LOCKR设计均由笼蛋白和钥匙蛋白质组成,它们是两条独立的多肽链。
·笼在笼支架表示为闩锁的区域中编码螯合的生物活性肽或结合结构域。一般策略是优化编码的肽或结合结构域的位置,用于最大程度地掩埋需要螯合的功能残基,同时优化掩埋疏水性残基,并用于极性残基的溶剂暴露/补偿性氢键。
·所述钥匙通过诱导构象变化的竞争性分子间结合置换闩锁,从而暴露编码的生物活性肽或结构域并激活系统(图1)。
·正交LOCKR设计(图3)用小写字母下标表示:LOCKRa由笼a和钥匙a组成,并且LOCKRb由笼b和钥匙b组成等,使得笼a仅被钥匙a激活,并且笼b仅被钥匙b激活等。
·前缀表示由LOCKR开关编码和控制的官能团。例如,BimLOCKR是指编码Bim肽的设计的开关,而GFP11-LOCKR是指编码GFP11(GFP的第11链)的设计的开关。
·托底:可以通过以下来调整由钥匙激活LOCKR的动态范围:截短闩锁长度,同时减弱笼-闩锁相互作用,并在笼上打开暴露区域,钥匙可以结合到所述区域以作为“托底”(图2。还可以通过在闩锁中设计减弱笼-闩锁相互作用的突变,以类似的方式来调整LOCKR(图1-2、图10)。托底的长度作为设计名称的后缀被包括:例如,“-t0”意指无托底,而“-t9”意指9个残基的托底(即闩锁被9个残基截短)。
·如果术语“锁”是指单条多肽链(而不是指LOCKR首字母缩略词),则假定与“笼”同义。
这些设计包括首个全新设计的蛋白质,其可以响应于蛋白质结合而经历构象转换。它们是模块化的,因为它们可以编码处于非活性构象的所有三种类型的二级结构的生物活性肽:α螺旋、β链、环,并且是可调整的,因为它们的响应性可以通过改变长度(笼支架和/或闩锁托底的长度)和/或使笼-闩锁接口中的残基突变来在较大的动态范围内进行调整。设计的LOCKR开关可以用于控制大范围功能肽的活性。使用严格的诱导型控制来利用这些生物学功能的能力可用于例如工程化细胞(功能的诱导型激活、工程化复杂的逻辑行为和电路)、开发传感器、开发基于诱导型蛋白质的治疗剂以及创造新的生物材料。
LOCKR开关的设计
我们开始设计全新的可转换蛋白质系统,遵循以下一般考虑。首先,在由相同位点而不是远端位点(如在变构生物系统中常见的那样)处的分子间与分子内相互作用之间的竞争所支配的系统中,添加开关触发输入后实现最大动态范围所需的自由能调整更为直接。其次,具有可用于竞争性相互作用的扩展结合表面的稳定蛋白质框架比仅在结合时才变得有序的框架具有优势,因为前者的可编程性更高,并且不太可能参与非靶标相互作用。这些特征由图1a中描绘的抽象系统描述,所述系统经历了结合不胜任状态与结合胜任状态之间的热力学驱动的切换。除非被与笼(蓝绿色)的分子内相互作用阻断,闩锁(蓝色)含有可以结合靶标(黄色)的肽序列(橙色);结合更紧密的钥匙(品红色)胜过闩锁,从而允许肽结合靶标。这种系统的行为由单个子反应的结合平衡常数支配(图1a):K打开,闩锁与笼的解离;KLT,闩锁与靶标的结合;和KCK,钥匙与笼的结合。这组方程的解表明,当闩锁-笼相互作用太弱时(红色和橙色曲线),所述系统是泄漏的,并且由钥匙诱导的折叠较低;而当闩锁-笼相互作用太强时(紫色曲线),即使在高钥匙浓度下,所述系统仅被部分激活。给出最佳切换的闩锁-笼相互作用亲和力(图1b,左蓝色曲线,右绿色曲线)是闩锁-靶标结合亲和力的函数。我们使用此模型来指导最佳可切换蛋白质系统的设计,如以下各节所述。
LOCKR设计策略
为了设计这样的可切换系统,我们选择了能够在宽动态范围内调整笼-闩锁和笼-钥匙相互作用的亲和力的结构特征。α螺旋比β链具有优势,因为螺旋间接口受侧链-侧链相互作用的支配,与β折叠所需的协作骨架氢键相比,所述侧链-侧链相互作用更容易调整。为了更好地控制笼-闩锁和笼-钥匙相互作用的相对亲和力,我们选择设计含有掩埋氢键网络的接口:如Watson Crick碱基配对所示,可以用氢键供体和受体位置的相对较小变化获得相当大的特异性4,5。我们选择了具有氢键网络介导的亚基-亚基相互作用特异性(5L6HC3_1)的设计的α-螺旋发夹同源三聚体作为起点5。通过设计连接亚基的短的非结构化环,我们产成了具有五个或六个螺旋和每个螺旋40个残基的单体蛋白质框架(图1c)。在五螺旋框架中,存在反式添加的第六螺旋的开放结合位点,而在六螺旋框架中此位点由顺式的第六螺旋填充。
当在大肠杆菌中重组表达时,五个螺旋(笼)和六个螺旋(笼加闩锁)设计是可溶的,并且通过具有多角度光散射的尺寸排阻色谱法,纯化的蛋白质大部分为单体,并且非常耐热,在95℃和5M盐酸胍下保持折叠(图1d)。小角度X射线散射(SAXS)光谱与设计模型和先前的原始三聚体非常一致(图1e),表明结构没有被环改变。在下拉测定法中,五螺旋框架而不是六螺旋框架结合了融合到GFP的第六个螺旋(图1f);后一种结果是预期的,因为如果接口相同,则分子内相互作用K打开应胜过其分子间对应物KCK,因为形成分子内相互作用的熵成本降低了。为了调整Kopen,我们筛选了闩锁中的去稳定突变(较大疏水性至氨酸或丝氨酸,以及丙氨酸残基至较大疏水性或丝氨酸),并使用GFP下拉测定法,鉴定了对钥匙具有一定亲和力的突变体。双突变体V223S/I238S与没有闩锁的五螺旋笼一样牢固地结合了钥匙(图1e,10);两个丝氨酸可能会减弱笼-闩锁相互作用,因为与掩埋侧链羟基相关的去溶剂化损失,以及因为它们降低了闩锁的螺旋倾向。SAXS和CD光谱表明,在不存在钥匙的情况下,V223S、I238S是折叠良好的六螺旋束,其结构与原始单体相似(图1d)。我们将这种笼-闩锁-钥匙系统称为LOCKR,用于闩锁正交笼-钥匙蛋白。
控制Bim-Bcl2结合,并调整激活的动态范围:
为将功能安装到LOCKR中,我们选择凋亡中心的Bim-Bcl2相互作用作为模型系统,试图将Bim锁定,使与Bcl2的结合仅在存在钥匙的情况下发生。我们设计了在闩锁上设计了两种可能的Bim相关序列的构建体:一种设计的Bcl2结合肽(aBcl2LOCKR)或仅对Bcl2结合至关重要的Bim残基(pBimLOCKR)。每个对Bcl2具有不同的亲和力,这使我们可以在最初的一系设计中采样一系列KLT值。通过对不同的螺旋寄存器进行采样,将Bim相关的序列移植到闩锁上,使得将与Bcl2结合所涉及的残基螯合在笼-闩锁接口中(数据未示出),从而优化了疏水性残基的掩埋和极性残基的表面暴露。可以通过笼与Bim残基之间的非最佳相互作用或通过改变闩锁的长度来调整K打开(图2a)。通过生物层干涉法测试了初始设计与Bcl2的结合,并且显示即使在存在钥匙的情况下,Bcl2结合也很少,或者甚至在不存在钥匙的情况下Bcl2结合也很少。在这种情况下,此系统可获得的Kopen和KCK值的范围显然与KLT不匹配:钥匙诱导的响应距离图1b中的理想曲线很远。
我们假设可以通过扩展笼上呈现的接口区域来改进系统:扩展闩锁可以增加对笼的亲和力(减小K打开),从而在不存在钥匙的情况下使系统更加“关闭”,而将钥匙扩展到更长可以使其胜过闩锁(相对于K打开降低KCK),从而使系统更具诱导性。利用全新参数螺旋束的模块化性质,笼、闩锁和钥匙各自扩展了5、9或18个残基。为了使钥匙能够胜过闩锁,后者被四至九个残基截短以实现一系列K打开值;这在笼上形成了“托底”以供钥匙结合。具有9个残基托底的18个残基的延伸导致强烈诱导的结合(图2b,c;生物层干涉法上的信号不是由于钥匙结合Bcl2,也不是由于钥匙增加了非活性LOCKR体积。钥匙的结合激活是大约40倍(图2c),相当于或优于许多由蛋白质相互作用调节的天然发生的过程。
由于相互作用能与相互作用残基的总表面积大致成正比,因此通过改变钥匙的长度来调整KCK可以控制BimLOCKR被激活的钥匙浓度范围。58长度设计的钥匙的EC50为55.6+/-34nM(图2c,d),而45残基钥匙的EC50为230+/-58nM。截短另外五个残基完全抵消钥匙激活,这表明平衡对自由能的小变化非常敏感,正如我们的模型所预期(图2d)。为在三个数量级的KLT范围内检查BimLOCKR的功能,我们研究了与Bcl2同系物BclB和Bak(结合Bim的Kd分别为0.17nM(Bcl2)、20nM(BclB)和500nM(Bak))的钥匙诱导结合6。生物层干涉法实验是用在溶液中有或没有钥匙的情况下针对开关固定化测定的靶标进行,以及用单独或在溶液中具有靶标的情况下针对开关固定并测定的钥匙进行。从这些结果,我们可获得作为开关、钥匙和靶标浓度的函数的靶标或钥匙结合的分数。该模型对K打开、KCK和KLT的这些数据进行的全局拟合得出K打开=.01+/-0.0033、KCK=2.1+/-1.1nM、KLT(Bcl2)=28+/-7.8nM和KLT(BclB)=32+/-22nM的估计值,其中KLT(Bak)没有估计值,因为观察到很少的开关激活。这种拟合与观察到的BLI数据的RMSE(均方根误差)为0.072nM。这些估计值与Bim结合Kd(在拟合中未使用)大致上一致,表明热力学模型(图1a)很好地表示了所述系统,但可能缺少所述系统影响靶结合的小特征。
接下来,我们旨在设计一系列正交LOCKR系统,其目的是工程化能够在异质混合物中被选择性激活的多种开关。特异性是为在笼-钥匙接口处使用不同的氢键网络而设计的。从原始扩展的LOCKRa模型删除了闩锁螺旋,并通过对新闩锁/钥匙螺旋的半径、螺旋相位和z偏移进行参数采样来产生新的第六个螺旋的骨架。扫描所得结构以寻找新的氢键网络,所述网络跨越新的第六个螺旋与笼之间的接口,其中所有掩埋的极性原子均参与氢键;使用RosettaTM设计对网络周围的剩余接口进行全序列和侧链旋转异构体优化。基于堆积质量、序列差异和缺乏不参与氢键的掩埋极性原子,选择了五种设计。使用来自图1c的GFP下拉测定分析了截短和托底变体的同源和非靶标钥匙结合。发现三种新设计结合了它们的同源钥匙(图11),并且彼此正交。所有结合的钥匙a在某种程度上还未知。与原始设计BimLOCKRa一样,将Bim序列拧在这三种设计的闩锁上(图2)。BimLOCKRb和BimLOCKRc在其同源钥匙在闩锁上给出九个残基托底的情况下,分别显示22倍和8倍的激活(图3a,b)。BimLOCKRa、BimLOCKRb和BimLOCKRc也是正交的;每个均仅被其浓度高达5uM的同源钥匙激活(图3c)。六种设计的BimLOCKR蛋白中,有三种成功切换并可以被正交激活,从单个支架开始的成功率为50%,这一事实说明了掩埋的氢键网络方法实现特异性的能力。
非对称LOCKR开关
原始LOCKR开关设计(图1-2)是从全新设计的对称同型三聚体5L6HC3_1(其含有6个螺旋)开始构建的5。对称的重复序列基序为错折叠和聚集创造了机会。为了减轻这些影响,我们将原始LOCKR开关重新设计为非对称的(序列在本文档末尾处列出)。非对称设计表现得更好、更具单体性,并且我们通过实验解决了带有编码的BIM肽(图4a)和没有所述BIM肽(图4b)的X射线晶体结构(图4)。没有BIM的实验结构几乎与计算设计模型相同(图4b),证明了我们设计策略的原子级准确性。在方法中提供了计算设计和实验测试的详细信息。对于将1fix-short-noBim(AYYA)-t0的晶体结构(图4b)叠加到用于制备LOCKRa的基础支架5L6HC3_15(深色)的x射线晶体结构(图1)上,参见图9。
gfpLOCKR(GFP11-LOCKR)
使用非对称设计作为起点,我们成功地将GFP的第11链编码到设计的LOCKR开关中(图5)。常见的分拆式GFP由两部分组成:链1-10和链11;当混合时,1-10与11组合,以产生荧光。在这里,我们证明了第11链在不存在钥匙的情况下被螯合,无法与GFP-1-10组合,但在存在GFP-1-10的情况下与钥匙混合时容易地产生荧光(图5)。我们通过实验确定了设计的蛋白质的x射线晶体结构,这表明GFP-11在结构上被编码为α螺旋,其构象与计算设计模型几乎相同(图5);此结果突出了LOCKR系统的功能和模块化,表明我们可以编码具有非螺旋二级结构倾向的生物活性肽。
针对共定位依赖性进行调整
图1-2显示可以预测性地调整LOCKR激活的动态范围,这表明仅当笼和钥匙共同定位时,才可以对系统进行调制以做出响应,这对于多种功能将是有利的。使用来自图4的GFP11-LOCKR,我们证明了的确是这种情况,并且可以使用SpycatcherTM/SpytagTM融合将设计的LOCKR开关调整为共定位依赖性(图6)。SpycatcherTM与SpytagTM共价融合;当SpycatcherTM融合笼与其SpytagTM融合钥匙混合时,其显示出与它的未融合到SpytagTM的钥匙混合时明显更多的荧光(图6)。
笼式内含肽LOCKR开关
当与融合到sfGFP和VMAn内含肽的设计的钥匙混合时,带有编码VMAc内含肽的笼组件的设计的LOCKR开关显示成功激活(图7)。SDS-PAGE显示成功的VMAc-VMAn反应,其条带对应于预期的剪接蛋白产物的正确分子量(图7)。
LOCKR开关的大规模高通量设计
原始LOCKR开关设计(图1-2)是从全新设计的对称同型三聚体5L6HC3_1(其含有6个螺旋)开始构建的5。我们认为我们应该制备更小的LOCKR开关,其由3或4个螺旋组成。利用我们从原始LOCKR开关的测试和实验验证中学到的一切,我们创建了一个计算流程,通过对Crick螺旋参数进行彻底采样,从头开始自动设计成千上万种新LOCKR开关支架4,9。
这些2plus1和3plus1 LOCKR开关的有效负载比原始设计更小(有利于电池工程化工作),并且由于缺乏对称性,可能表现良好且不容易聚集。(计算设计和实验测试的详细信息,参见方法部分)。
strepLOCKR(STREPII-LOCKR)
我们使用来自大规模高通量设计的新2+1和3+1LOCKR支架,设计并测试了编码和控制STREPII序列(N)WSHPQFEK(SEQ ID NO:63)的新LOCKR支架(详细信息,参见方法部分)。与阳性对照(图13B)相比,所述设计(图13A)螯合了STREPII标签,并且可以在存在钥匙(图13c-d)的情况下被激活,如通过生物层干涉法(Octet)数据所确定。
图12中的数据证明了mSin3A转录阻遏物的PAH2结构域的锁定。详细信息,参见图例。
图14中的数据表明3plus1 LOCKR开关响应于钥匙的表达激活GFP荧光。详细信息,参见图例
讨论
在这里,我们通过锁定可以被钥匙诱导激活的蛋白质-蛋白质相互作用,展示了LOCKR平台的能力。我们显示了体外数据,其锁定Bim肽结合其家族成员、GFP链11完成截短的1-10构建体,以及抗StrepTagTMII抗体结合锁定的StrepTagTMII。全新设计的蛋白的模块化和超稳定性使得能够通过调整竞争性笼-钥匙和笼-闩锁接口的强度,在广泛的动态范围内调整开关激活。使用这种方法,我们现在可以设计超越这些概念验证设计的开关,以用于更复杂的应用。LOCKR可用于控制天然信号网络,并且通常可用于通过全新信号分子的完全合成网络来控制生物学功能。
LOCKR为蛋白质带来了DNA转换技术的模块化,但具有能够控制和偶联可以由蛋白质和生物活性肽(比核酸更多样和更广泛)执行的广泛生化功能的优势。
方法
PCR诱变和等温组装
所有诱变引物均购自Integrated DNA Technologies(IDT)。设计诱变引物,使其在位点的任一侧上退火>18bp,以诱变引物中编码的所需突变。将PCR用于在突变位点的上游和下游产生与所需pET载体重叠>20bp的片段。将所得扩增子等温组装到用XhoI和NdeI限制性消化的pET21b、pET28b或pET29b中,并转化到化学活性大肠杆菌XL1-Blue细胞中。用Sanger测序对单克隆菌落进行测序。经序列验证的质粒使用Qiagen miniprep试剂盒纯化,并转化到化学活性大肠杆菌BL21(DE3)Star、BL21(DE3)Star-pLysS细胞(Invitrogen)或Lemo21(DE3)细胞(NEB)中进行蛋白表达。
合成基因构建
合成基因购自Genscript Inc.(美国新泽西州皮斯卡塔韦(Piscataway,NJ,USA)),并在pET 28b+、pET21b+或pET29b+大肠杆菌表达载体中递送,插入每个载体的NdeI和XhoI位点处。对于pET28b+构建体,将合成的DNA克隆在具有N-末端六组氨酸标签和凝血酶裂解位点的框架中,并在C-末端处添加终止密码子。对于pET21b+构建体,在C-末端添加终止密码子,使得所述蛋白质表达时没有六组氨酸标签。对于pET29b+构建体,将合成的DNA克隆在具有C-末端六组氨酸标签的框架中。将质粒转化到化学活性大肠杆菌BL21(DE3)Star、BL21(DE3)Star-pLysS细胞(Invitrogen)或Lemo21(DE3)细胞(NEB)中进行蛋白表达。
细菌蛋白的表达与纯化
在50μg/mL羧苄青霉素(pET21b+)或30μg/mL(对于LB)至60μg/mL(对于TBII)卡那霉素(pET28b+和pET29b+)的存在下,将起始培养物在溶源性肉汤(LB)或TerrificTM肉汤II(TBII)中生长过夜。将起始培养物用于接种500mL含有抗生素的Studier TBM-5052自诱导培养基,并在37℃下生长24小时。通过在4℃下以4000rcf离心20分钟来收获细胞,并将其重悬于裂解缓冲液(20mM Tris、300mM NaCl、20mM咪唑,室温下pH 8.0)中,然后在1mM PMSF存在下通过微流化裂解。通过在4℃下以24000rcf离心至少30分钟来清除裂解物。将上清液应用于在裂解缓冲液中预先平衡的Ni-NTA(Qiagen)柱。用15个柱体积(CV)的洗涤缓冲液(20mM Tris、300mM NaCl、40mM咪唑,室温下pH 8.0),随后是15CV高盐洗涤缓冲液(20mMTris、1M NaCl、40mM咪唑,室温下pH 8.0),然后是15CV洗涤缓冲液洗涤所述柱两次。用室温下pH 8.0的20mM Tris、300mM NaCl、250mM咪唑洗脱蛋白质。使用FPLC和SuperdexTM 75增加10/300GL(GE)尺寸排阻柱通过凝胶过滤进一步纯化蛋白质,合并含有单体蛋白质的级分。
尺寸排阻色谱法,多角度光散射(SEC-MALS)
SEC-MALS实验使用了与miniDAWNTM TREOS多角度静态光散射连接的SuperdexTM75增加10/300GL(GE)尺寸排阻柱和Optilab T-rEXTM(具有扩展范围的折射计)检测器(美国加利福尼亚州圣巴巴拉的Wyatt Technology公司)。在TBS(pH 8.0)中以3-5mg/mL的浓度注射蛋白质样品。使用ASTRATMTM(Wyatt Technologies)软件分析了数据,以评估洗脱物质的重均摩尔质量(Mw),以及数均摩尔质量(Mn),以通过多分散指数(PDI)=Mw/Mn评估单分散性。
圆二色性(CD)测量
使用AVIV模型420CD光谱仪测量了CD波长扫描(260至195nM)和温度熔融(25至95℃)。温度熔融监测222nM处的吸收信号,并且以4℃/min的加热速率进行。蛋白质样品在0.1cm比色皿中的PBS pH 7.4中为0.3mg/mL。氯化胍(GdmCl)滴定在同一光谱仪上用自动滴定仪在pH 7.4的PBS中于25℃下进行,在222nM处用0.03mg/mL的蛋白质样品在带有搅拌棒的1cm比色皿中进行监测。每次滴定由至少40个均匀分布的浓度点组成,其中每一步混合时间为一分钟。滴定剂溶液由PBS+GdmCl中相同浓度的蛋白质组成。GdmCl浓度由折射率确定。
小角度X射线散射(SAXS)
经由凝胶过滤将样品交换到SAXS缓冲液(20mM Tris、150mM NaCl、2%甘油,室温下pH 8.0)中。散射测量是在先进光源的SIBYLSTM 12.3.1光束线处进行的。X射线波长(λ)为并且Mar165检测器的样品到检测器距离为1.5m,对应于0.01至的散射矢量q(q=4π*sin(θ/λ),其中2θ是散射角)范围。使用34次0.2秒的暴露在11keV的7秒钟内收集数据集,其中蛋白质浓度为6mg/mL。还以3mg/mL的浓度收集数据,以确定浓度依赖性;所有提出的数据均以更高浓度收集,因为未观察到浓度依赖性聚集。根据每个区域和框架上的信号质量,分别对Gunier、Parod和Wide-q区域的32次曝光数据进行平均。使用软件包分析平均值,以分析数据和报告统计数据。FoXS用于将设计模型与实验性散射曲线进行比较,并计算拟合质量(X)值。使用Rosetta RemodelTM对LOCKR蛋白的N-端上的六组氨酸标签和凝血酶切割位点进行建模,使得设计序列与实验测试的蛋白相匹配。为了捕获这些残基的构象灵活性,产生了100个独立的模型,进行了聚类,并选择了最大聚类的聚类中心作为无偏差FoXS拟合的代表性模型。
GFP下拉测定
按照上述方案,从pET28b+表达了His标记的LOCKR,而将钥匙表达融合到pET21b+中没有His标签的超折叠GFP(sfGFP)。将his标记的LOCKR纯化至完全,并透析到TBS(20mMTris、150mM NaCl,室温下pH 8.0)中;钥匙-GFP仍为此测定的裂解物。将>1uM的100μLLOCKR施加到96孔黑色镍涂层板(ThermoFisher)上,并在室温下孵育1小时。从板丢弃样品,并用200μL TBST(TBS+0.05%Tween-20)洗涤3次。向每个孔中加入100μL含钥匙-GFP的裂解物,并在室温下孵育1小时。从板丢弃样品,并用200μL TBST(TBS+0.05%Tween-20)洗涤3次。将板用TBS洗涤1次,并将100μL的TBS加入到每个孔中。sfGFP荧光在MolecularDevices SpectraMaxTM M5板读数器或BioTek Synergy Neo2板读数器上测量;在485nm激发和530nm发射下测量荧光,其中激发和发射的带宽为20nm。
生物层干涉法(BLI)
BLI测量是在带有链霉亲和素(SA)涂层生物传感器的RED96系统(ForteBio)上进行的,并且所有分析都在ForteBio Data Analysis Software版本9.0.0.10中进行。用稀释到来自GE的HBS-EP+缓冲液(10mM HEPES、150mM NaCl、3mM EDTA、0.05%v/v表面活性剂P20、0.5%脱脂奶粉,室温下pH7.4)中的蛋白质进行测定。将生物素化的Bcl2加载到SA吸头上,使得阈值为0.5nM,被编程到机器方案中。通过将装载的生物传感器浸入HBS-EP+缓冲液中获得基线;通过浸入含有确定浓度的LOCKR和钥匙的孔中观察缔合动力学,然后通过浸入用于获得基线的缓冲液中观察解离动力学。动力学常数和平衡时的反应通过拟合1:1结合模型进行计算。
热力学LOCKR模型
图1a中的热力学模型说明了五个平衡区的三个自由参数。这定义了三个方程,它们将平衡状态下所有物种(打开或关闭的开关、钥匙、靶标、开关-钥匙、开关-靶标和开关-钥匙-靶标)的浓度联系起来。
K打开=[开关打开]/[开关关闭]
KCK=[开关打开][钥匙]/[开关-钥匙]=[开关-靶标][钥匙]/[开关-钥匙-靶标]
KLT=[开关-钥匙][靶标]/[开关-钥匙-靶标]=[开关打开][靶标]/[开关-靶标]
每种组件(开关、钥匙和靶标)的总量也是恒定的,并且限制了处于平衡状态的每种物种的值。这将以下方程引入模型。
[开关]总计=[开关打开]+[开关关闭]+[开关-钥匙]+[开关-靶标]+[开关-钥匙-靶标]
[钥匙]总计=[钥匙]+[开关-钥匙]+[开关-钥匙-靶标]
[靶标]总计=[靶标]+[开关-靶标]+[开关-钥匙-靶标]
将这六个方程送入sympy.nsolve()中,以找到给定六个常数(三个平衡常数、三个总浓度)的溶液。从此溶液提取馏分结合,并绘制相应的图。
使用Rosetta将功能序列移植到LOCKR上
通过将生物活性序列移植到闩锁上来制备功能性LOCKR的模型,其使用RosettaTMXML设计以从闩锁上的每个螺旋寄存器开始对移植物进行采样。此方案使用两个Rosetta移动器,SimpleThreadingMover用于更改闩锁上的氨基酸序列,以及具有默认设置的FastRelaxTM用于在给定功能突变下找到最低的能量结构。在PyMolTM 2.0中通过眼睛选择了设计,并且高质量的移植物具有与笼相互作用的重要结合残基,并最大程度地减少了掩埋的不满意氢键结合残基的数量。
正交LOCKR的Rosetta设计
使用具有计分功能β_nov16的Rosetta,将LOCKRa重新设计为正交的笼-钥匙对。我们从扩展的LOCKR模型提取了五螺旋笼的模型,并使用RosettaTM BundleGridSampler模块为新的闩锁几何体产生了骨架集成。BundleGridSampler基于盘绕线圈的Crick数学表达产生骨架几何结构,并允许对盘绕线圈表达参数值的规则网格进行有效的并行采样,所述规则网格对应于肽骨架构象的连续体。对于所采样的每个参数化产生的闩锁构象,RosettaTM残基选择器都指定了笼和闩锁的接口,以用于设计氢键网络(HBNet),随后进行RosettaTM侧链设计。通过经由InterfaceByVector残基选择器选择闩锁和笼的接口,通过Rosetta残基选择器选择残基进行设计。此残基选择被传递到HBNet和侧链设计两者中,以严格设计转换接口,同时使笼保持其原始LOCKR序列。使用HBNetStapleInterface在接口处选择的残基上设计氢键网络。输出包含带有两个或三个氢键网络的设计,这些氢键网络跨越构成接口的三个螺旋。然后,使用PackRotamersMover设计HBNet的所有输出,以将残基放置在接口处,同时保持氢键网络。进行了两轮设计。第一轮使用β_soft积极地用潜在的碰撞旋转异构体填充接口,同时优化接口处的相互作用能,然后根据完整的Rosetta评分功能使用β来解决潜在的碰撞原子,从而最小化结构。最后一轮设计将转子与完整的βRosetta评分功能功能相结合,以最终优化笼-闩锁接口的相互作用。
基于缺乏不满意的掩埋氢键残基、丙氨酸残基的计数作为堆积质量的代表,以及序列不相似性作为寻找极性/疏水模式不相似到足以正交的度量,选择候选正交LOCKR设计。使用BuriedUnsatHbonds过滤器过滤掉不满意的氢键原子,根据过滤器的度量,不允许出现不满意的极性原子。通过对接口处的丙氨酸残基进行计数来确定堆积质量,因为高丙氨酸计数意味着残基的交叉性较差。在整个三个螺旋接口中最多允许15个丙氨酸残基。如seq_alignment.py所示,使用来自BioPython的Bio.pairwise2包通过比对序列,用BLOSUM62对每个设计的闩锁的成对序列差异进行评分。通过大的开放和延伸罚分而不允许在序列内产生间隙进行比对,这类似于两个螺旋的结构比对,以基于疏水性极性图案找到最相似的叠加。从最大得分中减去每个得分,以将得分转换为距离度量;最多样化的序列具有最低的BLOSUM62得分,可转换为最大距离。然后使用HeirClust_fromRMSD.py对所述序列进行聚类,并以170为截止值进行聚类,从而得到13个聚类。通过最大化选择的13个中心之间的距离来选择每个聚类的中心。然后在PyMolTM 2.0中通过眼睛过滤这13个候选物,以获得不满意的氢键原子和定性的堆积质量。这三种度量的五种最佳设计被定为LOCKRb-f。
非对称LOCKR开关
使用带有HBNet的RosettaTM重新设计原始LOCKRa开关;已知对LOCKR功能重要的残基保持固定,并优化剩余的残基以保留疏水性堆积,同时引入最大程度减少重复氨基酸序列和基序数量的序列多样性。如前所述地获得编码所述设计的合成DNA,并如前所述对设计进行表达、纯化和生物物理表征。如下一节所述,进行结晶试验。
X射线晶体学
蛋白质样品的结晶
将纯化蛋白样品在20mM Tris pH 8.0和100mM NaCl中浓缩至12-50mg/ml。利用以下结晶筛,用带有主动湿度室的5位甲板蚊式晶体(ttplabtech)筛选样品:JCSG+(Qiagen)、JCSG Core I-IV(Qiagen)、PEG/Ion(Hampton Research)和Morpheus(MolecularDimensions)。发现了不同设计的结晶的最佳条件如下:
·1-fix-short-BIM-t0:0.1M Tris pH 8.5、5%(w/v)PEG 8000、20%(v/v)PEG300、10%(v/v)甘油(无需冷冻)
·1fix-short-GFP-t0:0.2M氯化钠、0.1M二甲胂酸钠pH 6.5、2.0M硫酸铵(加20%甘油用于冷冻)
·1fix-short-noBim(AYYA)-t0:0.2M酒石酸二钠、20%(w/v)PEG 3350(不添加冷冻剂)
X射线数据收集和结构确定
将设计的蛋白质的晶体环化,并放入相应的储库溶液中,如果所述储库溶液不含有冷冻保护剂,则含有20%(v/v)甘油,并在液氮中速冻。X射线数据集是在LawrenceBerkeley国家实验室的先进光源下用光束线8.2.1和8.2.2收集的。使用XDS35或HKL200036对数据集进行索引和缩放。使用设计模型作为初始搜索模型,用PhenixTM软件套件38中的程序PHASERTM 37,通过分子置换法产生初始模型。通过使用Phenix.refine进行模拟退火细化,或者,如果分辨率足够,通过使用Phenix.autobuild 40将就地重建设置为false、模拟退火以及灌注和切换定相,努力减少模型偏差。使用COOT中的手动构建和PhenixTM中的细化的迭代轮次来产生最终模型。由于盘绕线圈样蛋白具有高度的自相似遗传性,因此所报告结构的数据集具有高度的伪平移非晶体对称性,正如Phenix所报告。XtriageTM,使结构细化变得复杂,并且可能解释了报告的R值高于预期的原因。使用PhenixTM计算了理想几何构型的键长、角度和二面角的RMSD。使用程序MOLPROBITYTM评估了所有最终模型的总体质量。
gfpLOCKR:(GFP11-LOCKR)开关设计与表征
使用非对称LOCKRa设计支架,如上一节“使用RosettaTM将功能序列移植到LOCKR上”所述,将GFP的第11链编码到笼的闩锁序列中,并如上所述获得编码设计蛋白的合成基因。如上所述纯化蛋白质并进行生物物理表征。为了测试加入钥匙后的荧光诱导,将蛋白质通过移液混合,并立即在黑色96孔板上使用Biotek Synergy Neo2板读取器进行测定,以监测相对的GFP荧光(例如:488,Em:508,读取间隔10分钟)。通过在不存在钥匙的情况下随时间推移测量GFP荧光来评估笼泄漏
与gfpLOCKR(GFP11-LOCKR)的体外共定位依赖性切换
经由软盘接头用与其N-末端融合的SpyCatcherTM克隆fpLOCKR笼,经由软盘接头用与其C-末端融合的SpyTagTM克隆gfpLOCKR钥匙,并将GFP1-10克隆到其自身的pET21载体中。在18C下Studier自诱导培养基过夜的情况下,这些蛋白质在大肠杆菌Lemo21细胞中表达。在表达之后,通过离心收获生产细胞并通过微流化器进行裂解。通过Ni-NTA亲和色谱从澄清的裂解物纯化所需的蛋白质,并在nanodrop上通过A280进行定量。将蛋白质在PBS中稀释至最终浓度(GFP1-10:所有样品中均为1.9uM;笼:1.5uM、0.8uM、0.4uM、0.2uM、0.094uM;钥匙:1.5uM、0.8uM、0.4uM、0.2uM、0.094uM),并汇总如下:单独的SpyCatcherTM-笼(无钥匙)、使用裸钥匙的SpyCatcherTM-笼(无SpyTagTM)和使用SpyTag-钥匙的SpyCatcher-笼。将蛋白质通过移液混合,并立即在黑色96孔板上使用Biotek Synergy Neo2板读取器进行测定,以监测相对的GFP荧光(例如:488,Em:508,读取间隔10分钟)。通过在不存在钥匙的情况下随时间推移测量GFP荧光来评估笼泄漏。通过显示SpyTagTM-钥匙比裸钥匙更快地激活GFP荧光,证实了共定位依赖性。
笼式内含肽LOCKR开关
VMA内含肽序列被设计为编码到LOCKRa的闩锁中。VMAn内含肽序列与钥匙a融合。按照上述先前的LOCKR设计克隆和纯化构建体。通过SDS-PAGE评估内含肽活性(剪接)。
LOCKR开关的大规模高通量设计
从头开始设计成千上万种新LOCKR开关支架的计算流程如下:使用Crick螺旋参数对3-螺旋束(由于2-螺旋支架加上1-螺旋闩锁,表示为2plus1或2+1)和4-螺旋束(由于3-螺旋加上1-螺旋闩锁,表示为3plus1或3+1)的骨架进行了详尽的采样;采样的参数包括z偏移(-1.51、0和1.51)、0与100之间每10度的螺旋相位,以及每个螺旋距中心超螺旋轴(z轴)的超螺旋半径范围为5-10埃;基于原始LOCKR设计的成功,我们专注于具有直螺旋和无超螺旋(超螺旋扭曲固定为0.0)的设计。每个产生的螺旋的长度为58个残基;将Rosetta环闭合方法用于添加将所有螺旋连接成单个多肽链(笼支架)的环。使用HBNet、MC-HBNet和RosettaDesignTM进行序列和侧链设计。通过将螺旋束截短成较短的支架、制备具有闩锁作为N-末端或C-末端螺旋的形式,并通过尝试不同的托底长度(截短以极性残基结尾的闩锁螺旋,并从原始设计中去除至少一个或两个疏水性堆积残基)来产生另外的设计。基于从先前的LOCKR支架和HBNet螺旋束的迭代测试和设计中学到的计算方法选择设计:重要度量包括二级结构形状互补性(ss_sc)>0.65(最佳设计的ss_sc>0.7);RosettaHolesTM在氢键网络周围区域中进行过滤,以消除在支架核心中氢键网络附近具有大空洞的设计;要求设计具有至少2个跨越设计模型的所有螺旋的不同氢键网络(即每个螺旋必须为网络贡献至少一个氨基酸侧链);与Ala(较小的氨基酸)相比,Ile、Leu和Val残基的数量以及由这些氨基酸类型形成的接触数量也作为与具有紧密的、相互交叉的疏水性堆积(这对于产生稳定的蛋白质支架是重要的)的设计良好相关的代表。
strepLOCKR(STREPII-LOCKR)计算设计:
使用来自大型高通量LOCKR设计集的2plus1和3plus1开关设计了编码STREPII标签(N)WSHPQFEK(SEQ ID NO:63)的LOCKR开关。此序列难以编码,因为Pro(其使α螺旋扭结)和Trp和His(如果被掩埋,则必须有可能参与氢键)。为了解决这些问题,没有对所有螺旋残基进行采样,而是挖掘了大型设计集,以找到已经包含预组织成所述设计的氢键网络的Trp(W)、His(H)的LOCKR支架。还考虑了具有预先组织的Phe(F)的设计。
strepLOCKR(STREPII-LOCKR)实验测试:
使用生物层干涉法(RED96System,PALL ForteBio)测试了纯化蛋白质在不存在钥匙的情况下螯合STREPII序列和在钥匙的存在下激活的能力:将THETM NWSHPQFEK(SEQ ID NO:63)标签抗体(mAb小鼠,Genscript A01732-200)装载到抗小鼠IgG Fc捕获(AMC)生物传感器(PALL ForteBio)上;通过在pH 1.65的甘氨酸和Octet测定缓冲液之间循环来对尖端进行预处理:来自GE的HBS-EP+缓冲液(10mM HEPES、150mM NaCl、3mM EDTA、0.05%v/v表面活性剂P20、0.5%脱脂奶粉,室温下pH7.4)。将蛋白质样品稀释到Octet测定缓冲液中,保持稀释因子一致,以最大程度地减少噪声。使用推荐的在甘氨酸pH 1.65与Octet测定缓冲液之间循环的再生方案,将装载了抗体的尖端重复使用多达8次(当尖端为前提条件时,观察到最小的装载损失,并设置了信号阈值以确保每次尖端的装载一致)。
在Octet测定缓冲液中,以5ug/mL的浓度使用THETM NWSHPQFEK(SEQ ID NO:63)标签抗体(mAb小鼠,Genscript A01732-200);用400ul mqH2O补足抗体储备液至0.5mg/mL,等分并在-80℃下储存,在使用前立即融化。
上文尚未描述的从细菌制备物纯化蛋白质:
在50μg/ml羧苄青霉素(pET21-NESG)或50μg/ml卡那霉素(pET-28b+)的存在下,使起始培养物在37℃下在Luria-Bertani(LB)培养基中生长过夜,或在Terrific肉汤中生长8小时。将起始培养物用于接种500mL LB(用0.2mM IPTG在约0.6-0.9的OD600下诱导)或含有抗生素的Studier自诱导培养基。使培养物在18℃下表达过夜(许多设计后来也在37℃下表达4小时,但收率没有明显差异)。通过在4℃下以5000rcf离心15分钟来收获细胞,并将其重悬于裂解缓冲液(20mM Tris、300mM NaCl、20mM咪唑,室温下pH 8.0)中,然后在溶菌酶、DNAse和不含EDTA的鸡尾酒蛋白酶抑制剂(Roche)或1mM PMSF存在下通过微流化裂解。通过在4℃下以18000rpm离心至少30分钟来清除裂解物,并将其应用于在裂解缓冲液中预先平衡的Ni-NTA(Qiagen)柱。用5个柱体积(CV)的洗涤缓冲液(20mM Tris、300mM NaCl、40mM咪唑,室温下pH 8.0),随后是3-5CV高盐洗涤缓冲液(20mM Tris、1M NaCl、40mM咪唑,室温下pH 8.0),并且然后是5CV洗涤缓冲液洗涤所述柱三次。用室温下pH 8.0的20mM Tris、300mMNaCl、250mM咪唑洗脱蛋白质。由于设计的蛋白质均不含半胱氨酸,因此未添加还原剂。
参考文献
1.Huang,P.-S.,Boyken,S.E.&Baker,D.The coming of age of de novoprotein design.Nature 537,320–327(2016).
2.Joh,N.H.等人,De novo design of a transmembrane Zn2+-transportingfour-helix bundle.Science 346,1520–1524(2014).
3.Davey,J.A.,Damry,A.M.,Goto,N.K.&Chica,R.A.Rational design ofproteins that exchange on functional timescales.Nat.Chem.Biol.13,1280–1285(2017).
4.Huang,P.-S.等人,High thermodynamic stability of parametricallydesigned helical bundles.Science 346,481–485(2014).
5.Boyken,S.E.等人,De novo design of protein homo-oligomers withmodular hydrogen-bond network-mediated specificity.Science 352,680–687(2016).
6.Berger,S.等人,Computationally designed high specificity inhibitorsdelineate the roles of BCL2 family proteins in cancer.Elife 5,1422(2016).
7.Leaver-Fay,A.等人,ROSETTA3:an object-oriented software suite forthe simulation and design of macromolecules.Meth Enzymol 487,545–574(2011).
8.Kuhlman,B.&Baker,D.Native protein sequences are close to optimalfor their structures.Proc Natl Acad Sci USA 97,10383–10388(2000).
9.Crick,F.H.C.The packing of[alpha]-helices:simple coiled-coils.ActaCryst(1953).Q6,689-697[doi:10.1107/S0365110X53001964]6,1–9(1953).
10.Glantz,S.T.等人,Functional and topological diversity of LOV domainphotoreceptors.Proc Natl Acad Sci USA 113,E1442–51(2016).
11.Dueber,J.E.,Mirsky,E.A.&Lim,W.A.Engineering synthetic signalingproteins with ultrasensitive input/output control.25,660–662(2007).
12.Dueber,J.E.,Yeh,B.J.,Chak,K.&Lim,W.A.Reprogramming control of anallosteric signaling switch through modular recombination.Science 301,1904–1908(2003).
13.Huang,P.-S.等人,RosettaRemodel:A Generalized Framework forFlexible Backbone Protein Design.PLoS ONE 6,e24109(2011).
14.Schneidman-Duhovny,D.,Hammel,M.&Sali,A.FoXS:a web server for rapidcomputation and fitting of SAXS profiles.Nucleic Acids Res 38,W540–4(2010).
15.Maguire,J.B.,Boyken,S.E.,Baker,D.&Kuhlman,B.Rapid Sampling ofHydrogen Bond Networks for Computational Protein Design.J.Chem.Theory Comput14,2751–2760(2018).
实施例2:蛋白质降解的可调节控制的降解决定子LOCKR
概述:
此实施例建立在上文公开的闩锁正交笼钥匙蛋白(LOCKR)技术之上,所述蛋白为全新设计的蛋白质开关。降解决定子LOCKR为(例如)在用锁定的降解决定子的修饰型式(包括但不限于鼠鸟氨酸脱羧酶(cODC)的C-末端)细胞工程化中所使用的LOCKR。当钥匙被表达并激活开关时,降解决定子靶向开关可与其融合以便降解的任何蛋白质(在下文中为“货物”)。以此方式,具有与C-末端融合的降解决定子开关的感兴趣的货物可以通过钥匙的表达以可滴定的方式进行条件性降解。这有时称为降解决定子LOCKR。此实施方式提供了显著的益处,包括但不限于以下:
○降解决定子LOCKR与天然蛋白质分开激活并在任何真核细胞中起作用。
○天然蛋白质不可调节到LOCKR可做到的程度。我们实现了体内蛋白质降解的动态范围和特异性的严格控制。
○目前没有在单细胞中使用正交作用降解决定子的方法。
○目前用依赖于控制肽的表达的条件降解决定子模块标记任何细胞蛋白质的方法
○可以通过改变长度、改变cODC降解决定子内的残基和/或使接口中的残基突变来调节大动态范围内的反应性
○降解决定子LOCKR可用作生物技术应用中的模块化调控中心。通过将降解决定子LOCKR标记到(例如)代谢酶、转录因子、激酶或磷酸酶,可以控制通过不同生物途径的通量。
○标记到工程化细胞类型的功能模块,例如CAR、SynNotch和激酶,本发明可改善保真性并调节治疗相关工程化细胞的功能。
○dCas9具有已知的脱靶效应,所以在降解决定子LOCKR的控制下使其选择性地降解为控制依赖于精确基因编辑的基因疗法的手段。
降解决定子LOCKR设计
我们锁定了cODC降解决定子,来自鼠鸟氨酸脱羧酶C-末端的泛素无关的降解信号,作为控制活细胞中任意蛋白质稳定性的策略。我们的目标是获得可被钥匙诱导的开关和与其融合的任何蛋白质的降解。使用了用于Bim使用的锁定策略来将cODC的三种变体嵌入开关a中:野生型序列、去除脯氨酸的野生型(因为脯氨酸使α螺旋不稳定)和二肽序列CA(据信,其为降解决定子的最小功能残基)(图17)。我们在芽殖酿酒酵母中测试了每种开关变体,使用双诱导型系统2独立地用黄色荧光蛋白(YFP)N-末端融合滴定开关的浓度并且用蓝色荧光蛋白(BFP)C-末端融合滴定钥匙的浓度(图15a)。为了评估开关激活的动态范围,我们使用一系列孕酮(Pg)浓度以固定量的YFP-降解决定子开关a(在单一浓度的雌二醇(E2)下)滴定不同量的钥匙,并使用流式细胞术测量稳态荧光。针对这些初始构建体观察到的钥匙诱导的降解取决于开关中cODC降解决定子的存在,并且当YFP与Bim开关a或开关a融合时未观察到(图18)。为了优化诱导型降解的量,我们改变了开关托底长度来调节K打开。动态范围最大的开关为去除脯氨酸的cODC和12个残基的托底(在下文中称为降解决定子开关a)。使用这种变体,在完全诱导钥匙ya后,与降解决定子开关a融合的YFP荧光减少了多达73%(图19)。
我们通过测试全范围的E2和Pg组合,探索了针对两种不同的钥匙长度,降解决定子LOCKRa在不同浓度的YFP-降解决定子开关a和钥匙a-BFP下的动态范围(图15b)。钥匙a诱导的降解决定子开关a降解的程度随两种蛋白质的浓度而变化。钥匙a荧光随着降解决定子开关a浓度变化是稳定的(图20),表明钥匙不与降解决定子开关共降解。使用截短钥匙a(43个残基对55个残基),观察到相同的开关激活的动态范围,但最大激活需要较高的钥匙浓度(图15c)。这类似于用BimLOCKR观察到的行为(图16d),并表明我们的笼/钥匙相互作用模型在活细胞内是成立的。为了评估降解决定子LOCKRa激活的动力学,我们使用自动流式细胞仪平台来测量随时间变化的YFP荧光。使细胞在恒定浓度的E2下生长,直到YFP-降解决定子开关a达到稳态,然后用Pg诱导以激活钥匙a-BFP的产生。我们发现活性降解决定子LOCKRa的体内半衰期为24分钟,这与报告的组成型cODC降解决定子的半衰期11-30分钟非常相似。
接下来,我们试图通过在LOCKRb、LOCKRc和LOCKRd中安装去除脯氨酸的cODC降解决定子来增强降解决定子LOCKR触发同一细胞中不同蛋白质的正交降解的功能。我们组成型地表达每个与YFP融合的正交开关变体(图21),并用每个与青色荧光蛋白(CFP)融合的钥匙变体的组成型表达测量YFP的降解。降解决定子LOCKRa和降解决定子LOCKRc通过它们的同源钥匙强激活,但不通过彼此的钥匙激活(其他构建体在体内不激活;图22)。为了测试降解决定子LOCKR的正交性,我们组成型地共表达了在同一细胞中与YFP和红色荧光蛋白(RFP)融合的降解决定子LOCKRa和降解决定子LOCKRc,并使用Pg诱导型系统滴定每种钥匙变体在单独菌株中的表达。钥匙a的表达导致YFP而不是RFP的选择性降解,并且钥匙c的表达导致RFP而不是YFP的选择性降解(图15d)。这表明双降解决定子LOCKR系统可以在活细胞中正交地并同时地发挥作用。
体内基因表达的降解决定子LOCKR控制
为了证明降解决定子LOCKR的实用性,我们将其用作调节合成转录因子和dCas9的细胞内浓度的工具。我们首先将与RFP和降解决定子开关a融合的基于锌指的合成转录因子(SynTF)置于E2诱导型启动子的控制下,并将钥匙a-BFP-NLS置于Pg诱导型启动子的控制下。为了监测SynTF活性,我们测量了同一细胞中的pSynTF-YFP荧光(图16a)。SynTF-RFP-降解决定子开关a表达的增加增加了RFP和YFP荧光,而钥匙表达的增加降低了两种输出(图16b)。例如,在31.25nM E2下(图16b),最大钥匙诱导导致RFP减少61%并且YFP减少82%(图16c)。值得注意的是,降解决定子LOCKR导致YFP荧光随钥匙浓度变化的分级不变化,这与合成生物学应用5中通常使用的转录因子的更多数字行为形成对比。为了进一步将降解决定子LOCKR确立为转录控制的通用方法,接下来,我们测试了激活dCas9-VP64融合的降解。dCas9以有组成型地表达的sgRNA靶向pTet7x的tet操纵子位点以诱导YFP的表达(图16d),并在不同浓度的dCas9下滴定钥匙表达(图16e)。我们观察到在31.25nM E2下诱导钥匙后,RFP减少78%并且YFP减少41%(图16f)。总之,这些结果证明了降解决定子LOCKR作为控制体内蛋白质稳定性的工具的模块性和功能性。
方法
DNA电路的构建
使用Lee等人7中的方法,使用分层金门组装来组装用于酵母菌株构建的质粒。将单个零件的BsaI、BsmBI和NotI切割位点除去,以促进下游组装和线性化。零件通过PCR生成或者作为gBlock从IDT购买。这些零件在盒质粒上组装成转录单元(启动子-基因-终止子)。然后将这些盒组装在一起以形成多基因质粒,以便插入到酵母基因组中。
酵母菌株和生长培养基
所有实验中使用的基础酿酒酵母菌株是BY4741(MATa his3Δ1 leu2Δ0 met15Δ0 ura3Δ0)。将所有酵母培养物在YPD培养基(10g/L Bacto酵母提取物、20g/L Bacto蛋白胨、20g/L右旋糖)或合成完全培养基(SDC)(6.7g/L无氨基酸的Bacto-酵母氮源基础、2g/L完全补充氨基酸混合物、20g/L右旋糖)中生长。在具有适当缺氨基酸混合物的合成完全培养基上进行营养缺陷型标记物(URA3、LEU2和/或HIS3)的选择。
雌二醇和孕酮诱导
通过从板中挑取单个菌落到YPD培养基中,使酵母菌株生长过夜。将饱和培养物在新鲜的SDC中1:500稀释,并分装到2mL 96孔储存块(Corning)的单个孔中,以便在Multitron摇动器(Infors HT)中在30℃和900RPM下生长三小时。通过将3.6mM雌二醇和3.2mM孕酮储备溶液适当稀释到SDC中,以10倍的浓度制备雌二醇(Sigma-Aldrich)和孕酮(Fisher Scientific)。生长三小时之后,将50μl雌二醇和孕酮诱导剂以适当的组合添加到96孔块中,并将块放回摇动器中。
自动流式细胞术和连续培养系统的描述
硬件
我们采用现有的自动化实验平台3来进行可变浓度小分子诱导和长期培养。使酵母培养物在50mL光学透明的锥形管(Falcon)中生长,所述锥形管固持在八个定制的温控磁力搅拌室中。使用14位流选择器(VICI Cheminert)和BD高通量采样器的两个注射泵(CavroXCalibur Pump,TECAN)完成液体处理。使用LABVIEW 2013控制HTS的命令。这种设置允许对单个培养物进行定期采样和稀释。每个采样周期包括三个主要步骤:1)将样品送至流式细胞仪以便测量,2)提取培养物并送至废液箱,以及3)用所需激素浓度的新鲜培养基补充培养物。可以指定每个采样周期以将培养物诱导至新的更高激素浓度或维持所需的激素浓度。使用24分钟的采样频率和3mL的稀释体积。
酵母培养
通过从板中挑取单个菌落到YPD培养基,使酵母菌株生长过夜。将饱和培养物1:200稀释到新鲜的SDC中。使培养物在Innova 44摇动器(New Brunswick)中在30C和250RPM下在玻璃管中生长2小时。然后在新鲜SDC中将培养物稀释至0.01OD600,并以30mL YPD的总体积等分到单个50mL光学透明的锥形管(Falcon)中。在具有磁控搅拌棒的生物反应器中在30C下进行另外一小时的生长。所有SDC培养基都补充有5000U/mL青霉素链霉素(Thermo-Fisher)。
雌二醇和孕酮诱导以测试降解决定子LOCKR动力学
通过测试菌株所需的最高激素浓度确定1倍浓度(分别为30nM E2和50nM Pg)。以10倍浓度产生E2和SDC培养基的溶液,以在一个采样周期内使预诱导的培养物达到所需的浓度。在deg开关-YFP表达达到稳态后,以10倍浓度产生Pg和SDC培养基的第二溶液,以诱导钥匙表达。以三种不同浓度的激素制备SDC培养基:(1)10倍E2/无Pg,(2)1倍E2/无Pg,(3)1倍E2/10倍Pg,和(4)1倍E2/1倍Pg。在生物反应器中生长一小时后(t=-6h),通过从所有培养物中提取出3mL并补充(1),进行第一次诱导以达到E2浓度。E2诱导之后,如上文所述进行采样(参见硬件)。第一诱导时间点之后的所有采样周期包括将样品送到细胞仪以便测量,从所有培养物中提取出3mL,并用(2)补充培养物。在第二诱导时间点(t=0h)期间,用(3)诱导培养物以激活钥匙表达。此诱导后进行与第一次诱导相同的程序,不同的是激素浓度通过(4)来维持。对照(无激活的钥匙表达)未进行第二次诱导,而是继续由(2)补充。
流式细胞术
使用配备高通量采样器的BD LSRII流式细胞仪(BD Biosciences)进行荧光蛋白表达的分析。将培养物稀释于TE中,之后通过仪器进行实验,以获得可接受的细胞密度。使用FITC通道测量YFP(Venus)荧光,使用PE-Texas Red通道测量RFP(mScarlet),并且使用DAPI通道测量BFP(mTagBFP2)。针对稳态测量,每个样品收集5000-10000个事件。针对动态测量,每个样品收集2000-10000个事件。荧光值计算为适当通道的高度(H)测量值,并通过除以侧向散射(SSC-H)归一化为细胞大小。流式细胞术数据的所有分析都是在Python 2.7中使用FlowCytometryTool包和定制脚本进行的。
附录
拧入的cODC降解决定子的氨基酸序列:“X”表示可为任何氨基酸的序列位置
>cODC
LPMSCAQES(SEQ ID NO:28466)
>cODC_noPro
LXMSCAQES(SEQ ID NO:28467)
>cODC_CA_only
----CA---
降解决定子LOCKR开关的氨基酸序列
·降解决定子序列带下划线
·闩锁由[括号]指示
>degonLOCKR_a_327(SEQ ID NO:27359)
SKEAVTKLQALNIKLAEKLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPDVARLQELNIELARELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTDP[DEARKAIARVKRESKRIVEDAERLPMSCAQESEKISREAERLIREAA]
>degonLOCKR_a_327_noPro(SEQ ID NO:27360)
SKEAVTKLQALNIKLAEKLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPDVARLQELNIELARELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTDP[DEARKAIARVKRESKRIVEDAERLAMSCAQESEKISREAERLIREAA]
>degonLOCKR_a_CAonly(SEQ ID NO:27361)
SKEAVTKLQALNIKLAEKLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPDVARLQELNIELARELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTDP[DEARKAIARVKRESKRIVEDAERLIRECAAASEKISREAERLIREAA]
>degonLOCKR_a_324_t12(SEQ ID NO:27362)
SKEAVTKLQALNIKLAEKLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPDVARLQELNIELARELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTDP[DEARKAIARVKRESKRIVEDLIMSCAQESAASEKISREAERLIR]
>degonLOCKR_a_320_t16(SEQ ID NO:27363)
SKEAVTKLQALNIKLAEKLLEAVTKLQALNIKLAEKLLEALARLQELNIALVYLAVELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPDVARLQELNIELARELLRDVARLQELNIELARELLRAAAELQELNIKLVELASELTDP[DEARKAIARVKRESKRLVMSCAQESREAAAASEKISREAE]
>degon-miniLOCKRa_1_t9(SEQ ID NO:27364)
NKEDATEAQKKAIRAAEELLKDVTRIQERAIREAEKALERLARVQEEAIRRVYEAVESKNKEELKKVKEEIEELLRRLKRELDELEREIRELLKEIKEKADRLEKEIRDLIERIRRDRNASDEVVTRLARLNEELIRELREDVRRLAELNKELLRELERAARELARLNEKLLELADRVETE[EEARKAIARVKRESKRIVEDAERLAMSCAQESEKISREAERLIREAA]
>degon-miniLOCKRa_1_t12(SEQ ID NO:27365)
NKEDATEAQKKAIRAAEELLKDVTRIQERAIREAEKALERLARVQEEAIRRVYEAVESKNKEELKKVKEEIEELLRRLKRELDELEREIRELLKEIKEKADRLEKEIRDLIERIRRDRNASDEVVTRLARLNEELIRELREDVRRLAELNKELLRELERAARELARLNEKLLELADRVETE[EEARKAIARVKRESKRIVEDLIMSCAQESAASEKISREAERLIR]
>degon-miniLOCKRa_2_t9(SEQ ID NO:27366)
DERLKRLNERLADELDKDLERLLRLNEELARELTRAAEELRELNEKLVELAKKLQGGRSREVAERAEKEREKIRRKLEEIKKEIKEDADRIKKRADELRRRLEKTLEDAARELEKLKREPRTEELKRKATELQKEAIRRAEELLKEVTDVQRRAIERAEELLEKLARLQEEAIRTVYLLVELNKV[DRARKAIARVKRESKRIVEDAERLAMSCAQESEKISREAERLIREAA]
>degon-miniLOCKRa_t12(SEQ ID NO:27367)
DERLKRLNERLADELDKDLERLLRLNEELARELTRAAEELRELNEKLVELAKKLQGGRSREVAERAEKEREKIRRKLEEIKKEIKEDADRIKKRADELRRRLEKTLEDAARELEKLKREPRTEELKRKATELQKENIRRAEELLKEVTDVQRRNIERAEELLEKLARLQEENIRTVYLLVELNKV[DRARKAIARVKRESKRIVEDLIMSCAQESAASEKISREAERLIR]
>1fix-short_cODC_mut(SEQ ID NO:27368)
SKEAAKKLQDLNIELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESKKILEEARKAIRDAAEESRKILEEGSGSGSDALDELQKLNLELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIRRALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKAKEESERIIREGSGSGDPDIKKLQDLNIELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDPDEARKAIARVKRESKRIVEDAERLSREAAALSMSCAQESERSIREAAAASEKISRE]
>1fix-short_cODC_mut_t6(SEQ ID NO:27369)
SKEAAKKLQDLNIELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESKKILEEARKAIRDAAEESRKILEEGSGSGSDALDELQKLNLELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIRRALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKAKEESERIIREGSGSGDPDIKKLQDLNIELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDP[DEARKAIARVKRESKRIVEDAERLSMSCAQESEKISREAERSIREAAAAS]
>1fix-short_cODC(SEQ ID NO:27370)
SELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESEKILEEAREAISGSGSELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIREALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKGSGSGSELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDP[DEARKAIARVKRESKRIVEDLEMSCAQESAASEKISREAERLIR]
>1fix-short_cODC_t5(SEQ ID NO:27371)
SELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESEKILEEAREAISGSGSELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIREALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKGSGSGSELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDP[DEARKAIARVKRESKRLVMSCAQESREAAAASEKISREA]
>1fix-short_cODC_t8(SEQ ID NO:27372)
SELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESEKILEEAREAISGSGSELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIREALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKGSGSGSELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDP[DEARKAIARVKRLSMSCAQESERLIREAAAASEKIK]
>1fix-short_cODC_t11(SEQ ID NO:27373)
SELARKLLEASTKLQRLNIRLAEALLEAIARLQELNLELVYLAVELTDPKRIRDEIKEVKDKSKEIIRRAEKEIDDAAKESEKILEEAREAISGSGSELAKLLLKAIAETQDLNLRAAKAFLEAAAKLQELNIRAVELLVKLTDPATIREALEHAKRRSKEIIDEAERAIRAAKRESERIIEEARRLIEKGSGSGSELARELLRAHAQLQRLNLELLRELLRALAQLQELNLDLLRLASELTDP[DEARKAIARLKMSCAQESEDAERLIREAAAASE]
>degonLOCKRb(SEQ ID NO:27374)
SHAAVIKLSDLNIRLLDKLLQAVIKLTELNAELNRKLIEALQRLFDLNVALVHLAAELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSNDPQVAQNQETFIELARDALRLVAENQEAFIEVARLTLRAAALAQEVAIKAVEAASEGGSGSGP[NKEEIEKLAKEAREKLKKAEKEHKMSCAQERKKNKKAREDLKKKADK]
>degonLOCKRb_t13(SEQ ID NO:27375)
SHAAVIKLSDLNIRLLDKLLQAVIKLTELNAELNRKLIEALQRLFDLNVALVHLAAELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSNDPQVAQNQETFIELARDALRLVAENQEAFIEVARLTLRAAALAQEVAIKAVEAASEGGSGSGP[NKEEIEKLAKEAREKLKKAEMSCAQEHDKLRKKNKKAREDLKK]
>degonLOCKRc_t9(SEQ ID NO:27376)
SLEAVLKLAELNLKLSDKLAEAVQKLAALLNKLLEKLSEALQRLFELNVALVTLAIELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSNDPLVARLQELLIEHARELLRLVATSQEIFIELARAFLANAAQLQEAAIKAVEAASENGSGSGP[SSEKVRRELKESLKENHKQNQKLLMSCAQEQEKLNRELEELKKKHKK]
>degonLOCKRc_t13(SEQ ID NO:27377)
SLEAVLKLAELNLKLSDKLAEAVQKLAALLNKLLEKLSEALQRLFELNVALVTLAIELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSNDPLVARLQELLIEHARELLRLVATSQEIFIELARAFLANAAQLQEAAIKAVEAASENGSGSGP[SSEKVRRELKESLKENHKQNMSCAQEHKRAQEKLNRELEELKK]
>degon-miniLOCKRc_1_t9(SEQ ID NO:27378)
LIERLTRLEKEHVRELKRLLDTSLEILRRLVEAFETNLRQLKEALKRALEAANLHNEEVEEVLRKLEEDLRRLEEELRKTLDDVRKEVKRLKEELDKRIKEVEDELRKIKEKLKKGDKNEKRVLEEILRLAEDVLKKSDKLAKDVQERARELNEILEELSRKLQELFERVVEEVTRNVPTTE[RIEKVRRELKESLKENHKQNQKLLMSCAQEQEKLNRELEELKKKHKK]
>degon-miniLOCKRc_1_t13(SEQ ID NO:27379)
LIERLTRLEKEHVRELKRLLDTSLEILRRLVEAFETNLRQLKEALKRALEAANLHNEEVEEVLRKLEEDLRRLEEELRKTLDDVRKEVKRLKEELDKRIKEVEDELRKIKEKLKKGDKNEKRVLEEILRLAEDVLKKSDKLAKDVQERARELNEILEELSRKLQELFERVVEEVTRNVPTTE[RIEKVRRELKESLKENHKLNMSCAQEHKRAQEKLNRELEELKK]
>degon-miniLOCKRc_2_t9(SEQ ID NO:27380)
SEERVLELAEEALRLSDEAAKEIQELARRLNEELEKLSKELQDLFERIVETVTRLIDADEETLKRAAEEIKKRLEDARKKAKEAADKAREELDRARKKLKELVDEIRKKAKDALEKAGADEELVARLLRLLEEHARELERLLRTSARIIERLLDAFRRNLEQLKEAADKAVEAAEEAVRRVEDVRV[WSEKVRRELKESLKENHKQNQKLLMSCAQEQEKLNRELEELKKKHKK]
>degon-miniLOCKRc_t13(SEQ ID NO:27381)
SEERVLELAEEALRLSDEAAKEIQELARRLNEELEKLSKELQDLFERIVETVTRLIDADEETLKRAAEEIKKRLEDARKKAKEAADKAREELDRARKKLKELVDEIRKKAKDALEKAGADEELVARLLRLLEEHARELERLLRTSARIIERLLDAFRRNLEQLKEAADKAVEAAEEAVRRVEDVRV[WSEKVRRELKESLKENHKLNMSCAQEHKRAQEKLNRELEELKK]
>degonLOCKRc_1fix_t13(SEQ ID NO:27382)
SLEAALKLAELNLKLSDKLAEASQKLAALLNKLLEKLSEAIQRLFELNLALVTLAIELTDPKRIADEIKKVKDKSKEIIERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDALAELQALNLKLAELLLEAIAETQALNLKAAEAFLEAAAKLQELNIKAVELLVKLTDPATIREALRKAKEDSERIIAEAERAIAAAKAESERIIREAERLIAAAKAESERIIREGSGSNDPLIARLQELLIEHARELLRLHATSQEIFVELLRAFLANLAQLQEAALKALEAASENGSGSGP[SSEKVRRELKESLKENHKQNQKLLMSCAQEQEKLNRELEELKKKHKK]
>degonLOCKRd(SEQ ID NO:27383)
SLEAVLKLFELNHKLSEKLLEAVLKLHALNQKLSQKLLEALARLLELNVALVELAIELTDPKRIADEIKKVKDKSKEIVERAEEEIARAAAESKKILDEAEEEIARAAAESKKILDEGSGSGSDAVAELQALNLKLAELLLEAVAELQALNLKLAELLLEAIAKLQELNIKLVELLTKLTDPATIREAIRKVKEDSERIVAEAERLIAAAKAESERIIREAERLIAAAKAESERIIREGSGSGDPEVARLQEAFIEQAREILRNVAAAQEALIEQARRLLALAALAQEAAIKAVELASEHGSGSGP[DTVKRILEELRRRFEKLAKDLDDIAMSCAQEHKKHNKELKDKQRKIK]
降解决定子LOCKR的钥匙的氨基酸序列
>key_a(SEQ ID NO:28477)
EARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLIREAAAASEKISRE
>key_a_m4(SEQ ID NO:28478)
DEARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLIREAAAASEK
>key_a_m9(SEQ ID NO:28479)
DEARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLIREAAK
>key_a_m12(SEQ ID NO:28480)
DEARKAIARVKRESKRIVEDAERLIREAAAASEKISREAERLIR
>key_a_m15(SEQ ID NO:28481)
DEARKAIARVKRESKRIVEDAERLIREAAAASEKISREAER
>key_b(SEQ ID NO:28482)
NKEEIEKLAKEAREKLKKAEKEHKEIHDKLRKKNKKAREDLKKKADELRETNKRVN
>key_c(SEQ ID NO:28483)
SSEKVRRELKESLKENHKQNQKLLKDHKRAQEKLNRELEELKKKHKKTLDDIRRES
>key_d(SEQ ID NO:28484)
DTVKRILEELRRRFEKLAKDLDDIARKLLEDHKKHNKELKDKQRKIKKEADDAARS
>key_d_m4(SEQ ID NO:28485)
RILEELRRRFEKLAKDLDDIARKLLEDHKKHNKELKDKQRKIKKEADDAARS
>key_d_m7(SEQ ID NO:28486)
EELRRRFEKLAKDLDDIARKLLEDHKKHNKELKDKQRKIKKEADDAARS
将开关定位至激活它的钥匙:参见上文表6
cODC降解决定子序列
编码到闩锁中的所有cODC变体概述在图24中示出的此序列标识图中。降解活性的最小基序为在第五和第六位的CA,其距离C-末端10-30个残基。多个设计的残基3-8固定在MSCAQE,仅CA设计除外。第一和最后一个位置的多样性是由于LOCKRb、LOCKRc和LOCKRd的结构考虑,其中在cODC序列上选择来自基础支架的残基。第二个位置的多样性是由于脯氨酸破坏了螺旋构象的稳定性,如上述文字所述。在这种情况下,在所述位置选择来自基础支架的残基。
为了评估降解决定子LOCKR在哺乳动物细胞中的功能,将与mCherryTMRFP融合的降解决定子开关a在人HEK293T细胞中表达,并在存在和不存在钥匙的情况下测量RFP荧光。重新设计的具有8个残基的托底的不对称降解决定子开关a(1fix-short_cODC_t8(SEQ IDNO:27372))(参见图25)在存在钥匙的情况下触发平均RFP荧光的11倍减少。这些数据证明了降解决定子LOCKR系统在哺乳动物细胞中的功能。
通过诱导降解mCherryTM荧光蛋白,证明了降解决定子LOCKR在人初级T细胞中发挥作用的能力。构建了慢病毒转移构建体,其含有与具有t8托底的不对称短支架降解决定子开关融合的mCherryTM和嵌入在闩锁中的cODC降解决定子(1fix-short_cODC_t8(SEQ IDNO:27372))。使用pPGK组成型启动子表达mCherryTM-降解决定子开关融合。在第二慢病毒构建体中,使用四种不同的组成型启动子(pPGK、pSFFV、pCMV(G)、pCMV(D))表达了钥匙与tagBFP的融合。
实验是在人初级CD4+T细胞中进行的。用前述慢病毒的不同组合对细胞进行转导。在一个示例中,仅用mCherryTM-降解决定子开关对细胞进行转导。在其他示例中,细胞接受mCherryTM-降解决定子开关病毒以及表达钥匙-tagBFP的病毒。慢病毒转导之后,使用流式细胞仪测量荧光。分布示于图26。我们观察到,当细胞与含有任何量的钥匙产生的病毒共转导时,mCherryTM荧光几乎完全被废除(钥匙产生使用tagBFP荧光进行量化)。此数据表明,钥匙能够触发降解决定子开关并激活mCherryTM的降解。
参考文献
1.Takeuchi,J.,Chen,H.,Hoyt,M.A.&Coffino,P.Structural elements of theubiquitin-independent proteasome degron of ornithine decarboxylase.Biochem.J410,401–407(2008).
2.Aranda-Díaz,A.,Mace,K.,Zuleta,I.,Harrigan,P.&El-Samad,H.RobustSynthetic Circuits for Two-Dimensional Control of Gene Expression inYeast.ACS Synth.Biol.6,545–554(2017).
3.Harrigan,P.,Madhani,H.&El-Samad,H.Real time genetic compensationoperationally defines the dynamic demands of feedback control.bioRxiv 244020(2018).doi:10.1101/244020
4.Khalil,A.S.等人,A synthetic biology framework for programmingeukaryotic transcription functions.Cell 150,647–658(2012).
5.Nielsen,A.A.K.等人,Genetic circuit design automation.Science 352,aac7341(2016).
6.Perez-Pinera,P.等人,RNA-guided gene activation by CRISPR-Cas9-basedtranscription factors.Nat.Methods 10,973–976(2013).
7.Lee,M.E.,DeLoache,W.C.,Cervantes,B.&Dueber,J.E.A highlycharacterized yeast toolkit for modular,multipart assembly.ACS Synth.Biol.4,975–986(2015).
Claims (34)
1.一种非天然存在的笼多肽,其包含:
(a)螺旋束,其包含2至7个α-螺旋,其中所述螺旋束包含:
(i)结构区域;和
(ii)闩锁区域,其中所述闩锁区域包含位于所述闩锁区域内的降解决定子,其中所述结构区域与所述闩锁区域相互作用以阻止所述降解决定子的活性;和
(b)氨基酸接头,其连接每个α-螺旋。
2.根据权利要求1所述的笼多肽,其中所述闩锁区域在所述结构区域的C-末端,并且其中所述降解决定子位于所述闩锁区域的C-末端的约100、95、90、85、80、75、70、65、60、55、50、45、40、35、30、25、20、15、10、5、4、3、2、1或0个氨基酸残基内和/或所述笼多肽的C-末端的约100、95、90、85、80、75、70、65、60、55、50、45、40、35、30、25、20、15、10、5、4、3、2、1或0个氨基酸残基内。
3.根据权利要求2所述的笼多肽,其中所述降解决定子包含位于所述笼多肽的C-末端的10-30个残基之间的CA二肽。
4.根据权利要求3所述的笼多肽,其中所述降解决定子包含肽MSCAQES(SEQ ID NO:28468)。
5.根据权利要求3所述的笼多肽,其中所述降解决定子包含肽L(X)MSCAQES(SEQ IDNO:28467),其中X可为任何氨基酸残基,其中X可选地不为脯氨酸。
6.根据权利要求1或2所述的笼多肽,其中所述降解决定子包含选自由以下组成的组中的氨基酸残基或肽:
(a)GG;RG;KG;QG;WG;PG;AG;RxxG;EE;R;Rxx;Vx;Ax;A,其中“x”可为任何氨基酸残基,并且其中所述降解决定子在所述闩锁区域的末端的10-30个氨基酸内和/或在所述笼多肽的末端的10-30个氨基酸内;
(b)募集泛素连接酶的氨基酸残基或肽,所述泛素连接酶泛素化所述笼多肽和/或可操作地连接的功能多肽;
(c)靶向蛋白质水解的嵌合分子(PROTAC);和
(d)本文所述的任何其他降解决定子。
7.根据权利要求1所述的笼多肽,其中所述闩锁区域在所述结构区域的N-末端,并且其中所述降解决定子位于所述闩锁区域的N-末端的约100、95、90、85、80、75、70、65、60、55、50、45、40、35、30、25、20、15、10、5、4、3、2、1或0个氨基酸残基内和/或所述笼多肽的N-末端的约100、95、90、85、80、75、70、65、60、55、50、45、40、35、30、25、20、15、10、5、4、3、2、1或0个氨基酸残基内。
8.根据权利要求1或2所述的笼多肽,其中所述降解决定子包含选自由以下组成的组中的肽(括号内的残基为任选的):
[[KTRGVEEVAEGVVLL]]RRRG[[NK(FAM)KKK]](SEQ ID NO:28469);
[[KPFLNGGPY]]HSREQSTDSG[[LGLGSYK(FAM)KKK]](SEQ ID NO:28470);
ASADLDLEALAPYIPADDDFQLRK(FAM)KKK(SEQ ID NO:28471);
[[K-(PEG)-KEEK]]DINNN[[VKKTK(FAM)KKK]](SEQ ID NO:28472);
[[K-(PEG)]]DVQKADVSST[[GQGIDSK(FAM)KKK]](SEQ ID NO:28487);
KAAEEEEVSLASTPTDVRDVDIK(FAM)KKK(SEQ ID NO:28473);
[[KKYSSQTSQ]]DSGNYS[[NK(FAM)KKK]](SEQ ID NO:28474);
KPLSSSVPSQKTYQGSYGFRLGK(FAM)KKK(SEQ ID NO:28475);
[[KAWQQQSYL]]DSGIHSG[[ATTTAPK(FAM)KKK]](SEQ ID NO:28476);
[[KTRGVEEVAEGVVLL]]RRRG[[NKKKK]](SEQ ID NO:28488);
[[KPFLNGGPY]]HSREQSTDSG[[LGLGSYKKKK]](SEQ ID NO:28489);
ASADLDLEALAPYIPADDDFQLRKKKK(SEQ ID NO:28490);
[[KKEEK]]DINNN[[VKKTKKKK]](SEQ ID NO:28491);
[[K]]DVQKADVSST[[GQGIDSKKKK]](SEQ ID NO:28492);
KAAEEEEVSLASTPTDVRDVDIKKKK(SEQ ID NO:28493);
[[KKYSSQTSQ]]DSGNYS[[NKKKK]](SEQ ID NO:28494);
KPLSSSVPSQKTYQGSYGFRLGKKKK(SEQ ID NO:28495);
[[KAWQQQSYL]]DSGIHSG[[ATTTAPKKKK]](SEQ ID NO:28496);
RRRG(SEQ ID NO:28497);
HSREQSTDSG(SEQ ID NO:28498);
DINNN(SEQ ID NO:28499);
DVQKADVSST(SEQ ID NO:28500);
DSGNYS(SEQ ID NO:28501);和
DSGIHSG(SEQ ID NO:28502)。
9.根据权利要求1-8中任一项所述的笼多肽,其还包含一个或多个功能多肽结构域。
10.根据权利要求9所述的笼多肽,其中所述一个或多个功能多肽结构域位于所述笼多肽的N-末端,并且所述闩锁区域位于所述结构区域的C-末端,或其中所述一个或多个功能多肽结构域位于所述笼多肽的C-末端,并且所述闩锁区域位于所述结构区域的N-末端。
11.根据权利要求9所述的笼多肽,其中所述一个或多个功能多肽结构域位于所述笼多肽的与所述闩锁区域相同的末端。
12.根据权利要求9-11中任一项所述的笼多肽,其中所述一个或多个功能多肽结构域包括但不限于:代谢酶;转录因子;激酶;磷酸酶;嵌合抗原受体(CAR);T细胞受体(TCR);SynNotch;TCR模拟物;细胞因子受体;G蛋白偶联受体(GPCR);共刺激受体(包括但不限于CD28、CTLA-4、ICOS);共抑制受体(例如,PD-1);内源性信号传导结构域(包括但不限于Pleckstrin同源(PH)、Src同源2(SH2)、Src同源3(SH3)、WW、C1、PDZ、CARD、磷酸酪氨酸、富含脯氨酸的区域、盘绕线圈和假激酶结构域);合成受体或合成信号传导蛋白,其包含一个或多个信号传导结构域(包括但不限于Pleckstrin同源(PH)、Src同源2(SH2)、Src同源3(SH3)、WW、C1、PDZ、CARD、磷酸酪氨酸、富含脯氨酸的区域、盘绕线圈和假激酶结构域);含有ITAM或ITIM基序的工程化或内源性受体;JAK/STAT结合基序;DNA结合结构域(包括但不限于Cas9、dCas9、TALE和锌指);囊泡运输结构域;蛋白质降解结构域(包括但不限于泛素募集结构域和蛋白酶体靶向结构域);细胞死亡结构域(包括但不限于参与凋亡、坏死和细胞焦亡的那些);荧光蛋白;全新设计的蛋白质;本文所述的第二笼多肽,诸如结合与所述笼多肽所结合的钥匙多肽不同的钥匙多肽的笼多肽;本文所述的钥匙多肽,诸如不与所述笼多肽结合的钥匙多肽;和其活性结构域。
13.根据权利要求1-12中任一项所述的笼多肽,其中所述闩锁区域包含除所述降解决定子之外的一种或多种额外生物活性肽,其中所述结构区域与所述闩锁区域相互作用以阻止所述一种或多种额外生物活性肽的活性。
14.根据权利要求13所述的笼多肽,其中所述一种或多种额外生物活性肽可包含具有选自SEQ ID NO:50、60、62-64、66、27052-27093和27118-27119组成的非限制性组中的氨基酸序列的一种或多种额外生物活性肽。
15.根据权利要求1-14中任一项所述的笼多肽,其中每个螺旋的长度独立地为18-60、18-55、18-50、18-45、22-60、22-55、22-50、22-45、25-60、25-55、25-50、25-45、28-60、28-55、28-50、28-45、32-60、32-55、32-50、32-45、35-60、35-55、35-50、35-45、38-60、38-55、38-50、38-45、40-60、40-58、40-55、40-50或40-45个氨基酸。
16.根据权利要求1-15中任一项所述的笼多肽,其中每个氨基酸接头的长度独立地为3-10、4-10、5-10、6-10、7-10、8-10、9-10、2-9、3-9、4-9、5-9、6-9、7-9、8-9、2-8、3-8、4-8、5-8、6-8、7-8、2-7、3-7、4-7、5-7、6-7、2-6、3-6、4-6、5-6、2-5、3-5、4-5、2-4、3-4、2-3、或者2、3、4、5、6、7、8、9或10个氨基酸,其中不包括与所述接头融合的任何功能多肽结构域。
17.根据权利要求1-16中任一项所述的笼多肽,其中所述笼多肽包含沿着选自由以下组成的组中的笼多肽的氨基酸序列的全长在不包括任选的残基的情况下具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列:(a)SEQ ID NO:27359-28465或表7中列出的笼多肽(在(a)实施方式中,所述降解决定子包括在所述多肽序列中);和(b)SEQ IDNO:1-49、51-52、54-59、61、65、67-91、92-2033、SEQ ID NO:2034-14317、27094-27117、27120-27125、27278-27321和表2(在SEQ ID NO:27126与27276之间偶数编号的SEQ ID NO的多肽)、表3和/或表4中列出的笼多肽((在(b)实施方式中,降解决定子不包括在氨基酸序列中且将添加在所述闩锁区域内,包括但不限于本文所公开的那些降解决定子氨基酸序列。
18.一种试剂盒,其包括:
(a)根据权利要求1-17中任一项所述的笼多肽;和
(b)钥匙多肽,其能够结合所述笼多肽结构区域,从而置换所述闩锁区域并激活所述一个或多个降解决定子。
19.一种降解决定子LOCKR开关,其包括:
(a)根据权利要求1-17中任一项所述的笼多肽;和
(b)钥匙多肽,其能够结合所述笼多肽结构区域,从而置换所述闩锁区域并激活所述一个或多个降解决定子。
20.根据权利要求18所述的试剂盒或根据权利要求19所述的降解决定子LOCKR开关,其中所述钥匙多肽包含沿着本文所公开的钥匙蛋白;或选自由SEQ ID NO:26602-27050和27322至27358和28477-28486组成的组中的钥匙多肽;或表7中列出的钥匙多肽的氨基酸序列的全长在不包括任选的残基的情况下具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
21.根据权利要求18-20中任一项所述的试剂盒或降解决定子LOCKR开关,其中所述笼多肽包含沿着选自由SEQ ID NO:27359-28465或表7中列出的笼多肽组成的组中的氨基酸序列的全长在不包括任选的残基的情况下具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
22.根据权利要求18-21中任一项所述的试剂盒或降解决定子LOCKR开关,其中所述一种或多种笼多肽和所述一种或多种钥匙多肽包含至少一种笼多肽和至少一种钥匙多肽,其包含分别沿着表2、3、4、5、6或7、特别是表6或表7的同一行中的笼多肽和钥匙多肽的全长在不包括任选的残基的情况下具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
23.一种核酸,其编码根据权利要求1-17中任一项所述的笼多肽。
24.一种表达载体,其包含可操作地连接到启动子的根据权利要求23所述的核酸。
25.一种试剂盒,其包含:
(a)编码根据权利要求1-17中任一项所述的笼多肽的一种或多种核酸;和
(b)编码能够结合所述笼多肽结构区域的一种或多种钥匙多肽的一种或多种核酸。
26.一种试剂盒,其包含:
(a)根据权利要求24所述的一种或多种表达载体;和
(b)包含编码能够结合所述笼多肽结构区域的一种或多种钥匙多肽的一种或多种核酸的一种或多种表达载体,其中编码一种或多种钥匙多肽的所述一种或多种核酸可操作地连接到启动子。
27.一种宿主细胞,其包含编码根据权利要求1-17中任一项所述的笼多肽的一种或多种核酸和/或根据权利要求24所述的一种或多种表达载体。
28.根据权利要求27所述的宿主细胞,其还包含:编码能够结合所述笼多肽结构区域的一种或多种钥匙多肽的一种或多种核酸,其中编码能够结合所述笼多肽结构区域的一种或多种钥匙多肽的所述一种或多种核酸可操作地连接到启动子;和/或包括编码能够结合所述笼多肽结构区域的一种或多种钥匙多肽的一种或多种核酸的一种或多种表达载体,其中编码一种或多种钥匙多肽的所述一种或多种核酸可操作地连接到启动子。
29.根据权利要求28所述的宿主细胞,其中根据权利要求24所述的一种或多种表达载体可操作地连接到第一启动子,并且包含编码一种或多种钥匙多肽的一种或多种核酸的所述一种或多种表达载体可操作地连接到第二启动子,其中所述第一启动子和所述第二启动子是不同的。
30.根据权利要求25或26所述的试剂盒或根据权利要求28和29中任一项所述的宿主细胞,其中编码所述一种或多种钥匙多肽的所述一种或多种核酸包含沿着本文所公开的钥匙蛋白;或选自SEQ ID NO:26602-27050、27322-27358和28477-28486的钥匙多肽的氨基酸序列的全长在不包括任选的残基的情况下具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
31.根据权利要求25或26所述的试剂盒或根据权利要求28和29中任一项所述的宿主细胞,其中编码所述一种或多种钥匙多肽的所述一种或多种核酸包含沿着选自由SEQ ID NO:28477-28486组成的组中的钥匙多肽的氨基酸序列的全长在不包括任选的残基的情况下具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
32.根据权利要求25或26所述的试剂盒或根据权利要求28和29中任一项所述的宿主细胞,其中编码根据权利要求1-17中任一项所述的多肽的所述一种或多种核酸编码以下多肽,所述多肽包含沿着选自由SEQ ID NO:27359-28465组成的组中的笼多肽或表7中列出的笼多肽的氨基酸序列的全长在不包括任选的残基的情况下具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
33.根据权利要求24、25、31或32所述的试剂盒或根据权利要求27和28中任一项所述的宿主细胞,其中所述一种或多种笼多肽和所述一种或多种钥匙多肽包含至少一种笼多肽和至少一种钥匙多肽,其包含分别沿着表2、3、4、5、6或7、特别是表6或表7的同一行中的笼多肽和钥匙多肽的全长在不包括任选的残基的情况下具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
34.本文所公开的多肽、LOCKR开关、核酸、表达载体或宿主细胞用于螯合笼多肽中的降解决定子直至钥匙被表达并激活所述笼多肽并且所述降解决定子靶向所述笼多肽和与其融合的任何功能多肽以便降解的用途。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962789351P | 2019-01-07 | 2019-01-07 | |
US62/789,351 | 2019-01-07 | ||
US201962850336P | 2019-05-20 | 2019-05-20 | |
US62/850,336 | 2019-05-20 | ||
PCT/US2020/012372 WO2020146260A1 (en) | 2019-01-07 | 2020-01-06 | De novo design of protein switches for tunable control of protein degradation |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113853384A true CN113853384A (zh) | 2021-12-28 |
Family
ID=70476312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080016464.5A Pending CN113853384A (zh) | 2019-01-07 | 2020-01-06 | 用于蛋白质降解的可调整控制的蛋白质开关的全新设计 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20220073565A1 (zh) |
EP (1) | EP3908592A1 (zh) |
JP (1) | JP2022517566A (zh) |
KR (1) | KR20210112347A (zh) |
CN (1) | CN113853384A (zh) |
AU (1) | AU2020207211A1 (zh) |
CA (1) | CA3125912A1 (zh) |
WO (1) | WO2020146260A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114058641A (zh) * | 2022-01-17 | 2022-02-18 | 苏州大学 | 一种载体系统和应用及通过其降解目的蛋白的方法 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020093043A1 (en) * | 2018-11-02 | 2020-05-07 | Chen Zibo | Orthogonal protein heterodimers |
EP4093752A2 (en) * | 2020-01-22 | 2022-11-30 | Outpace Bio, Inc. | Chimeric polypeptides |
EP4093751A1 (en) * | 2020-01-22 | 2022-11-30 | Outpace Bio, Inc. | Chimeric polypeptides |
WO2022155153A1 (en) * | 2021-01-12 | 2022-07-21 | The Regents Of The University Of California | Controlling cellular behavior using feed-forward circuits |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102510755A (zh) * | 2009-07-13 | 2012-06-20 | 哈佛大学校长及研究员协会 | 双功能钉接多肽和其用途 |
US20180179509A1 (en) * | 2015-06-29 | 2018-06-28 | The Board Of Trustees Of The Leland Stanford Junior University | Degron fusion constructs and methods for controlling protein production |
CN108239656A (zh) * | 2016-12-27 | 2018-07-03 | 天津天锐生物科技有限公司 | 一种小分子药物控制的蛋白功能开关系统 |
WO2018191032A1 (en) * | 2017-04-10 | 2018-10-18 | The Regents Of The University Of California | Generation of haploid plants |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018206791A1 (en) * | 2017-05-12 | 2018-11-15 | Cellectis | Protease based switch chimeric antigen receptors for safer cell immunotherapy |
GB201710620D0 (en) * | 2017-07-03 | 2017-08-16 | Glaxosmithkline Intellectual Property Ltd | Targeted protein degradation |
WO2020018935A2 (en) * | 2018-07-19 | 2020-01-23 | University Of Washington | De novo design of protein switches |
-
2020
- 2020-01-06 KR KR1020217024623A patent/KR20210112347A/ko active Search and Examination
- 2020-01-06 EP EP20722696.0A patent/EP3908592A1/en active Pending
- 2020-01-06 CN CN202080016464.5A patent/CN113853384A/zh active Pending
- 2020-01-06 AU AU2020207211A patent/AU2020207211A1/en active Pending
- 2020-01-06 WO PCT/US2020/012372 patent/WO2020146260A1/en unknown
- 2020-01-06 CA CA3125912A patent/CA3125912A1/en active Pending
- 2020-01-06 US US17/419,413 patent/US20220073565A1/en active Pending
- 2020-01-06 JP JP2021538945A patent/JP2022517566A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102510755A (zh) * | 2009-07-13 | 2012-06-20 | 哈佛大学校长及研究员协会 | 双功能钉接多肽和其用途 |
US20180179509A1 (en) * | 2015-06-29 | 2018-06-28 | The Board Of Trustees Of The Leland Stanford Junior University | Degron fusion constructs and methods for controlling protein production |
CN108239656A (zh) * | 2016-12-27 | 2018-07-03 | 天津天锐生物科技有限公司 | 一种小分子药物控制的蛋白功能开关系统 |
WO2018191032A1 (en) * | 2017-04-10 | 2018-10-18 | The Regents Of The University Of California | Generation of haploid plants |
Non-Patent Citations (1)
Title |
---|
ROBERT A. LANGAN: "De novo design of bioactive protein switches", 《NATURE》, pages 205 - 210 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114058641A (zh) * | 2022-01-17 | 2022-02-18 | 苏州大学 | 一种载体系统和应用及通过其降解目的蛋白的方法 |
CN114058641B (zh) * | 2022-01-17 | 2022-04-01 | 苏州大学 | 一种载体系统和应用及通过其降解目的蛋白的方法 |
Also Published As
Publication number | Publication date |
---|---|
EP3908592A1 (en) | 2021-11-17 |
WO2020146260A1 (en) | 2020-07-16 |
AU2020207211A9 (en) | 2021-09-23 |
KR20210112347A (ko) | 2021-09-14 |
US20220073565A1 (en) | 2022-03-10 |
JP2022517566A (ja) | 2022-03-09 |
CA3125912A1 (en) | 2020-07-16 |
AU2020207211A1 (en) | 2021-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10851135B2 (en) | De novo design of protein switches | |
CN113853384A (zh) | 用于蛋白质降解的可调整控制的蛋白质开关的全新设计 | |
US20220119467A1 (en) | Caged-degron-based molecular feedback circuits and methods of using the same | |
US20240101615A1 (en) | Orthogonal protein heterodimers | |
CA3121172A1 (en) | Reagents and methods for controlling protein function and interaction | |
Patel et al. | Selection of a high-affinity WW domain against the extracellular region of VEGF receptor isoform-2 from a combinatorial library using CIS display | |
US9150897B2 (en) | Expression and purification of fusion protein with multiple MBP tags | |
Zahradník et al. | An enhanced yeast display platform demonstrates the binding plasticity under various selection pressures | |
WO2018148215A1 (en) | Use of microbial consortia in the production of multi-protein complexes | |
EP2593478B1 (en) | Rnf8-fha domain-modified protein and method of producing the same | |
Lee et al. | Expanding the chemogenetic toolbox by circular permutation | |
Langan | De Novo Design of Bioactive Protein Switches, and Applications Thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20211228 |