CN114401996A - 模块化二聚化热开关和相关单体、二聚体、构建体、二聚复合体、载体、细胞、表面、装置组合物、方法和系统 - Google Patents
模块化二聚化热开关和相关单体、二聚体、构建体、二聚复合体、载体、细胞、表面、装置组合物、方法和系统 Download PDFInfo
- Publication number
- CN114401996A CN114401996A CN202080064194.5A CN202080064194A CN114401996A CN 114401996 A CN114401996 A CN 114401996A CN 202080064194 A CN202080064194 A CN 202080064194A CN 114401996 A CN114401996 A CN 114401996A
- Authority
- CN
- China
- Prior art keywords
- thermal compound
- compound monomer
- thermal
- monomer
- temperature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000178 monomer Substances 0.000 title claims abstract description 459
- 239000000539 dimer Substances 0.000 title claims abstract description 173
- 238000000034 method Methods 0.000 title claims abstract description 98
- 239000013598 vector Substances 0.000 title claims abstract description 37
- 238000006471 dimerization reaction Methods 0.000 title claims description 28
- 239000000203 mixture Substances 0.000 title abstract description 27
- 150000001875 compounds Chemical class 0.000 claims abstract description 664
- 230000014509 gene expression Effects 0.000 claims abstract description 54
- 230000027455 binding Effects 0.000 claims abstract description 33
- 230000001105 regulatory effect Effects 0.000 claims abstract description 24
- 230000001276 controlling effect Effects 0.000 claims abstract description 11
- 108090000623 proteins and genes Proteins 0.000 claims description 162
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 158
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 150
- 229920001184 polypeptide Polymers 0.000 claims description 143
- 102000004169 proteins and genes Human genes 0.000 claims description 132
- 210000004027 cell Anatomy 0.000 claims description 113
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 80
- 150000001413 amino acids Chemical class 0.000 claims description 80
- 230000002209 hydrophobic effect Effects 0.000 claims description 38
- 238000002844 melting Methods 0.000 claims description 35
- 230000008018 melting Effects 0.000 claims description 35
- 239000000126 substance Substances 0.000 claims description 29
- 102000040430 polynucleotide Human genes 0.000 claims description 26
- 108091033319 polynucleotide Proteins 0.000 claims description 26
- 239000002157 polynucleotide Substances 0.000 claims description 26
- 125000000539 amino acid group Chemical group 0.000 claims description 25
- 230000001419 dependent effect Effects 0.000 claims description 19
- 108091023040 Transcription factor Proteins 0.000 claims description 16
- 102000040945 Transcription factor Human genes 0.000 claims description 16
- 108091033409 CRISPR Proteins 0.000 claims description 14
- 230000007423 decrease Effects 0.000 claims description 11
- 238000010459 TALEN Methods 0.000 claims description 10
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 10
- 239000012530 fluid Substances 0.000 claims description 8
- 238000010354 CRISPR gene editing Methods 0.000 claims description 7
- 125000001165 hydrophobic group Chemical group 0.000 claims description 7
- 238000012856 packing Methods 0.000 claims description 7
- 210000000130 stem cell Anatomy 0.000 claims description 7
- 239000011324 bead Substances 0.000 claims description 6
- 238000010438 heat treatment Methods 0.000 claims description 6
- 230000036961 partial effect Effects 0.000 claims description 6
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 4
- 108010001515 Galectin 4 Proteins 0.000 claims description 4
- 102100039556 Galectin-4 Human genes 0.000 claims description 4
- 239000005711 Benzoic acid Substances 0.000 claims description 3
- 239000004230 Fast Yellow AB Substances 0.000 claims description 3
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 claims description 3
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 claims description 3
- 239000004231 Riboflavin-5-Sodium Phosphate Substances 0.000 claims description 3
- 239000004191 allura red AC Substances 0.000 claims description 3
- 239000001639 calcium acetate Substances 0.000 claims description 3
- 239000004295 calcium sulphite Substances 0.000 claims description 3
- 239000004316 dimethyl dicarbonate Substances 0.000 claims description 3
- 239000004403 ethyl p-hydroxybenzoate Substances 0.000 claims description 3
- 239000004309 nisin Substances 0.000 claims description 3
- 239000013607 AAV vector Substances 0.000 claims description 2
- 240000007019 Oxalis corniculata Species 0.000 claims description 2
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 2
- 210000005260 human cell Anatomy 0.000 claims description 2
- 210000002865 immune cell Anatomy 0.000 claims description 2
- 210000003061 neural cell Anatomy 0.000 claims description 2
- 210000002569 neuron Anatomy 0.000 claims description 2
- 230000004807 localization Effects 0.000 abstract description 25
- 235000018102 proteins Nutrition 0.000 description 123
- 235000001014 amino acid Nutrition 0.000 description 101
- 229940024606 amino acid Drugs 0.000 description 97
- 125000005647 linker group Chemical group 0.000 description 78
- 230000003993 interaction Effects 0.000 description 60
- 108010054624 red fluorescent protein Proteins 0.000 description 32
- 230000000875 corresponding effect Effects 0.000 description 29
- 239000012528 membrane Substances 0.000 description 28
- 230000015572 biosynthetic process Effects 0.000 description 22
- 238000006467 substitution reaction Methods 0.000 description 22
- 239000000833 heterodimer Substances 0.000 description 20
- 238000002983 circular dichroism Methods 0.000 description 18
- 108020004414 DNA Proteins 0.000 description 17
- 230000004568 DNA-binding Effects 0.000 description 16
- 210000000170 cell membrane Anatomy 0.000 description 15
- 238000005734 heterodimerization reaction Methods 0.000 description 15
- 238000001142 circular dichroism spectrum Methods 0.000 description 14
- 238000010494 dissociation reaction Methods 0.000 description 14
- 230000005593 dissociations Effects 0.000 description 14
- 230000021615 conjugation Effects 0.000 description 13
- 102000004190 Enzymes Human genes 0.000 description 12
- 108090000790 Enzymes Proteins 0.000 description 12
- 241000588724 Escherichia coli Species 0.000 description 12
- 230000008859 change Effects 0.000 description 12
- 238000004132 cross linking Methods 0.000 description 12
- 230000007704 transition Effects 0.000 description 12
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 12
- 239000005090 green fluorescent protein Substances 0.000 description 11
- 239000000710 homodimer Substances 0.000 description 11
- 230000035772 mutation Effects 0.000 description 11
- 229920000642 polymer Polymers 0.000 description 11
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 10
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 230000002068 genetic effect Effects 0.000 description 10
- 238000010362 genome editing Methods 0.000 description 10
- 229910052739 hydrogen Inorganic materials 0.000 description 10
- 230000007935 neutral effect Effects 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 241000894007 species Species 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 239000001257 hydrogen Substances 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 108700026244 Open Reading Frames Proteins 0.000 description 8
- 210000004899 c-terminal region Anatomy 0.000 description 8
- 230000001413 cellular effect Effects 0.000 description 8
- 210000000805 cytoplasm Anatomy 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 230000001404 mediated effect Effects 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- 238000010186 staining Methods 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 230000008045 co-localization Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 102000034287 fluorescent proteins Human genes 0.000 description 6
- 108091006047 fluorescent proteins Proteins 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 239000006166 lysate Substances 0.000 description 6
- 210000004962 mammalian cell Anatomy 0.000 description 6
- 238000002703 mutagenesis Methods 0.000 description 6
- 231100000350 mutagenesis Toxicity 0.000 description 6
- 230000026792 palmitoylation Effects 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000001262 western blot Methods 0.000 description 6
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 5
- 239000004472 Lysine Substances 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 230000004913 activation Effects 0.000 description 5
- 125000004429 atom Chemical group 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- -1 cells Substances 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 238000002073 fluorescence micrograph Methods 0.000 description 5
- 108020001507 fusion proteins Proteins 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 230000003834 intracellular effect Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 210000004940 nucleus Anatomy 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 108020001580 protein domains Proteins 0.000 description 5
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 4
- 229910021592 Copper(II) chloride Inorganic materials 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 4
- 238000005481 NMR spectroscopy Methods 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 238000000978 circular dichroism spectroscopy Methods 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 230000001086 cytosolic effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 235000013922 glutamic acid Nutrition 0.000 description 4
- 239000004220 glutamic acid Substances 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 150000002500 ions Chemical class 0.000 description 4
- 238000011068 loading method Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 229910021591 Copper(I) chloride Inorganic materials 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- 239000012981 Hank's balanced salt solution Substances 0.000 description 3
- 102000001554 Hemoglobins Human genes 0.000 description 3
- 108010054147 Hemoglobins Proteins 0.000 description 3
- 101000979249 Homo sapiens Neuromodulin Proteins 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- 241000713666 Lentivirus Species 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 102100023206 Neuromodulin Human genes 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 150000001412 amines Chemical class 0.000 description 3
- 125000003277 amino group Chemical group 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 125000002843 carboxylic acid group Chemical group 0.000 description 3
- 230000004186 co-expression Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- OXBLHERUFWYNTN-UHFFFAOYSA-M copper(I) chloride Chemical compound [Cu]Cl OXBLHERUFWYNTN-UHFFFAOYSA-M 0.000 description 3
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000009792 diffusion process Methods 0.000 description 3
- 230000009881 electrostatic interaction Effects 0.000 description 3
- 238000011067 equilibration Methods 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 229920006395 saturated elastomer Polymers 0.000 description 3
- 230000002195 synergetic effect Effects 0.000 description 3
- 230000010512 thermal transition Effects 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- HIQYTCYQOKMFPP-WNQIDUERSA-N (2r)-2-amino-3-sulfanylpropanoic acid;pyrrole-2,5-dione Chemical compound SC[C@H](N)C(O)=O.O=C1NC(=O)C=C1 HIQYTCYQOKMFPP-WNQIDUERSA-N 0.000 description 2
- PRDFBSVERLRRMY-UHFFFAOYSA-N 2'-(4-ethoxyphenyl)-5-(4-methylpiperazin-1-yl)-2,5'-bibenzimidazole Chemical compound C1=CC(OCC)=CC=C1C1=NC2=CC=C(C=3NC4=CC(=CC=C4N=3)N3CCN(C)CC3)C=C2N1 PRDFBSVERLRRMY-UHFFFAOYSA-N 0.000 description 2
- OYIFNHCXNCRBQI-UHFFFAOYSA-N 2-aminoadipic acid Chemical compound OC(=O)C(N)CCCC(O)=O OYIFNHCXNCRBQI-UHFFFAOYSA-N 0.000 description 2
- 241000606125 Bacteroides Species 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 102000000844 Cell Surface Receptors Human genes 0.000 description 2
- 108010001857 Cell Surface Receptors Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 230000008836 DNA modification Effects 0.000 description 2
- 241000195623 Euglenida Species 0.000 description 2
- 238000001327 Förster resonance energy transfer Methods 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 102000004005 Prostaglandin-endoperoxide synthases Human genes 0.000 description 2
- 108090000459 Prostaglandin-endoperoxide synthases Proteins 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 239000012980 RPMI-1640 medium Substances 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 239000006146 Roswell Park Memorial Institute medium Substances 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 102000005937 Tropomyosin Human genes 0.000 description 2
- 108010030743 Tropomyosin Proteins 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 239000004411 aluminium Substances 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 125000000129 anionic group Chemical group 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010256 biochemical assay Methods 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 150000007942 carboxylates Chemical class 0.000 description 2
- 150000001732 carboxylic acid derivatives Chemical group 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 229940106189 ceramide Drugs 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 230000009918 complex formation Effects 0.000 description 2
- 238000004624 confocal microscopy Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000002050 diffraction method Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000013401 experimental design Methods 0.000 description 2
- UHBYWPGGCSDKFX-VKHMYHEASA-N gamma-carboxy-L-glutamic acid Chemical compound OC(=O)[C@@H](N)CC(C(O)=O)C(O)=O UHBYWPGGCSDKFX-VKHMYHEASA-N 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 238000003633 gene expression assay Methods 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 238000011005 laboratory method Methods 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 238000002595 magnetic resonance imaging Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000034217 membrane fusion Effects 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 230000009149 molecular binding Effects 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 239000012454 non-polar solvent Substances 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 210000004789 organ system Anatomy 0.000 description 2
- 150000002894 organic compounds Chemical class 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 229920000136 polysorbate Polymers 0.000 description 2
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000006916 protein interaction Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 235000007682 pyridoxal 5'-phosphate Nutrition 0.000 description 2
- 239000011589 pyridoxal 5'-phosphate Substances 0.000 description 2
- 229960001327 pyridoxal phosphate Drugs 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000000087 stabilizing effect Effects 0.000 description 2
- 239000012192 staining solution Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000003146 transient transfection Methods 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 238000002424 x-ray crystallography Methods 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- ISULLEUFOQSBGY-UHFFFAOYSA-N 4-phenyl-1,2,4-triazole-3,5-dione Chemical compound O=C1N=NC(=O)N1C1=CC=CC=C1 ISULLEUFOQSBGY-UHFFFAOYSA-N 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241000700682 Bugula Species 0.000 description 1
- YDNKGFDKKRUKPY-JHOUSYSJSA-N C16 ceramide Natural products CCCCCCCCCCCCCCCC(=O)N[C@@H](CO)[C@H](O)C=CCCCCCCCCCCCCC YDNKGFDKKRUKPY-JHOUSYSJSA-N 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 108010084185 Cellulases Proteins 0.000 description 1
- 102000005575 Cellulases Human genes 0.000 description 1
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 241000195649 Chlorella <Chlorellales> Species 0.000 description 1
- 241000223782 Ciliophora Species 0.000 description 1
- 239000004971 Cross linker Substances 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000408659 Darpa Species 0.000 description 1
- 241000199914 Dinophyceae Species 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 241000224421 Heterolobosea Species 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical group C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 108010054278 Lac Repressors Proteins 0.000 description 1
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 102000003505 Myosin Human genes 0.000 description 1
- 108060008487 Myosin Proteins 0.000 description 1
- CRJGESKKUOMBCT-VQTJNVASSA-N N-acetylsphinganine Chemical compound CCCCCCCCCCCCCCC[C@@H](O)[C@H](CO)NC(C)=O CRJGESKKUOMBCT-VQTJNVASSA-N 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241000223785 Paramecium Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 241001466487 Phaeocystis Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241000083513 Punctum Species 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000235342 Saccharomycetes Species 0.000 description 1
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 1
- 241000248459 Stentor Species 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Chemical group CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Chemical group 0.000 description 1
- 102000002689 Toll-like receptor Human genes 0.000 description 1
- 108020000411 Toll-like receptor Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 150000001370 alpha-amino acid derivatives Chemical class 0.000 description 1
- 235000008206 alpha-amino acids Nutrition 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 210000003001 amoeba Anatomy 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000007940 bacterial gene expression Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- HPMLGNIUXVXALD-UHFFFAOYSA-N benzoyl fluoride Chemical compound FC(=O)C1=CC=CC=C1 HPMLGNIUXVXALD-UHFFFAOYSA-N 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000009933 burial Methods 0.000 description 1
- 238000007707 calorimetry Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- ZVEQCJWYRWKARO-UHFFFAOYSA-N ceramide Natural products CCCCCCCCCCCCCCC(O)C(=O)NC(CO)C(O)C=CCCC=C(C)CCCCCCCCC ZVEQCJWYRWKARO-UHFFFAOYSA-N 0.000 description 1
- 230000009920 chelation Effects 0.000 description 1
- 238000012650 click reaction Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 230000002153 concerted effect Effects 0.000 description 1
- 238000010226 confocal imaging Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000011243 crosslinked material Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000023280 cytochrome c-heme linkage Effects 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 239000012954 diazonium Substances 0.000 description 1
- IJGRMHOSHXDMSA-UHFFFAOYSA-O diazynium Chemical compound [NH+]#N IJGRMHOSHXDMSA-UHFFFAOYSA-O 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 239000002532 enzyme inhibitor Substances 0.000 description 1
- 229940125532 enzyme inhibitor Drugs 0.000 description 1
- 238000011124 ex vivo culture Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000003269 fluorescent indicator Substances 0.000 description 1
- 210000005095 gastrointestinal system Anatomy 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 210000002288 golgi apparatus Anatomy 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 125000002795 guanidino group Chemical group C(N)(=N)N* 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 102000027596 immune receptors Human genes 0.000 description 1
- 108091008915 immune receptors Proteins 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000004068 intracellular signaling Effects 0.000 description 1
- 239000012948 isocyanate Substances 0.000 description 1
- 150000002513 isocyanates Chemical class 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 108010062085 ligninase Proteins 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 238000002714 localization assay Methods 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 210000003712 lysosome Anatomy 0.000 description 1
- 230000001868 lysosomic effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 125000001570 methylene group Chemical group [H]C([H])([*:1])[*:2] 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 125000001419 myristoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 239000002086 nanomaterial Substances 0.000 description 1
- VVGIYYKRAMHVLU-UHFFFAOYSA-N newbouldiamide Natural products CCCCCCCCCCCCCCCCCCCC(O)C(O)C(O)C(CO)NC(=O)CCCCCCCCCCCCCCCCC VVGIYYKRAMHVLU-UHFFFAOYSA-N 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 230000012223 nuclear import Effects 0.000 description 1
- 210000004492 nuclear pore Anatomy 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 210000001428 peripheral nervous system Anatomy 0.000 description 1
- 108010083127 phage repressor proteins Proteins 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 238000013492 plasmid preparation Methods 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000002731 protein assay Methods 0.000 description 1
- 239000013636 protein dimer Substances 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 229940121649 protein inhibitor Drugs 0.000 description 1
- 239000012268 protein inhibitor Substances 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000007398 protein translocation Effects 0.000 description 1
- 230000006432 protein unfolding Effects 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- WHMDPDGBKYUEMW-UHFFFAOYSA-N pyridine-2-thiol Chemical compound SC1=CC=CC=N1 WHMDPDGBKYUEMW-UHFFFAOYSA-N 0.000 description 1
- 239000010453 quartz Substances 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000006903 response to temperature Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 230000007781 signaling event Effects 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 238000012306 spectroscopic technique Methods 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000008866 synergistic binding Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000028016 temperature homeostasis Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000001931 thermography Methods 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 238000010396 two-hybrid screening Methods 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/24—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K14/255—Salmonella (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/73—Fusion polypeptide containing domain for protein-protein interaction containing coiled-coiled motif (leucine zippers)
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Peptides Or Proteins (AREA)
Abstract
本文中提供了热化合物单体、热化合物二聚体、热化合物单体构建体、热化合物二聚复合体和相关的基因表达盒载体、细胞、表面装置、组合物方法和系统,其提供了适合于以温度调节方式控制目的载物部分的定位和/或结合的热生物开关。
Description
相关申请的交叉引用
本申请要求于2019年7月12日提交的标题为“Modular Temperature DependentProtein Association Domains”、案卷编号CIT-8308-P的美国临时申请No.62/873,482的优先权,其以引用的方式整体并入本文。
利益声明
本发明是在美国陆军授予的资助号W911NF-19-D-0001和DARPA授予的资助号HR0011-14-1-0780(DOI:D14AP0050)的政府支持下完成的。政府对本发明享有一定的权利。
技术领域
本公开内容涉及模块化二聚化热开关和相关的单体、二聚体、构建体、二聚复合体(dimeric complex)、载体、细胞、表面和装置以及相关的组合物、方法和系统,以通过热调节的二聚化来在时空上控制二聚复合体的形成。
背景技术
合成生物学的最新进展正在推动用于多种应用中的生物开关的开发,其中期望受控地形成目的分子的缔合。
例如,用于与测定以及治疗和/或诊断应用结合使用的生物开关的重要能力是控制分子如蛋白质或其他部分彼此之间的结合和定位的能力。
尽管开发了控制分子缔合的方法,但在包括生物医学和工业应用的广泛应用中,开发高性能和/或可调控的生物开关以以时空调节方式控制复合体形成仍然存在挑战。
发明概述
本文中提供了模块化温度感测二聚体(本文中还提供了二聚化热开关、热化合物(thermomer)或热化合物二聚体)和相关的单体构建体、二聚复合体、载体、细胞、表面、装置,以及相关的组合物、方法和系统,其在数个实施方案中允许受控、热调节的分子复合体形成。
根据第一方面,描述了热化合物单体或其任何衍生物,其包含具有以下温度感测序列的温度感测区域:
A1E2E3V4K5A6V7S8A9A10L11S12E13R14I15T16Q17L18A19T20E21L22N23D24K25A26V27R28A29A39E31R3 2R33V34A35E36V37T38R39A40A41G42E43Q44T45A46Q47A48E49R50E51L52A53D54A55A56Q57T58V59D60D61L62E63E6 4K65L66D67E68L69Q70D71R72Y73D74S75L76T77L78A79La0E81S82E83R84S85L86R87Q88Q89H90D91V92E93M94A95Q9 6L97K98E99R100L101A102A103A104E105E106N107T108R109Q110X111X112E113R114Y115Q116E117Q118K119T120V121L12 2Q123D124A125L126N127A128E129Q130A131Q132H132K134N135T136R137E138D139L140Q141K142R143L144E145Q146I14 7S148A149E150A151N152A153R154T155E156E157L158K159S160X161X162D163K164V165N166T167L168L169T170R171Li7 2E173S174Q175E176N177A178L179A180S18iX182X183Q184Q185H186L187A188T189R190E191T192L194Q194Q195R196L19 7E198Q199A200I201A202D203T204Q205A206R207A208G209E210I211A212L213E214R215D216R217V218S219S220L221T22 2A223R224L225E226S227Q228E229K230A231S232S233E234Q235L236V237R238M239G240S241E242I243A244S245L246T24 7E248R249C250T251Q252L253E254N255Q256R257D258D259A260R261L262E263T264M265G266E267K268E269T270V271A27 2A273L274R275G276E277A278E279A280L281K282R283Q284N285Q286S287L288M289A290A291(SEQ ID NO:1)
其中X111 X112、X161 X162 X182和X183独立地是带负电荷的氨基酸,优选E和/或D,或者带正电荷的氨基酸,优选K和/或R,
所述热化合物单体或其任何衍生物被配置为以温度依赖性方式在目标环境中在低于生物开关温度Tbs的目标环境温度Te下二聚化以形成卷曲螺旋温度感测结构域。
根据第二方面,描述了热化合物二聚体。热化合物二聚体由本公开内容的具有第一温度感测区域的第一热化合物单体和本公开内容的具有第二温度感测区域的第二热化合物单体形成。
在所述热化合物二聚体中,所述第一热化合物单体和所述第二热化合物单体被配置为以大于15的热希尔系数在目标环境中在目标温度Te<Tbs下二聚化,以形成包含所述第一温度感测区域和所述第二温度感测区域并且熔融温度Tm=Tbs-0℃至5℃的卷曲螺旋温度感测结构域。
在一些优选实施方案中,在所述第一温度感测区域与所述第二温度感测区域之间形成非共价键的至少一对相应残基选自
所述第一热化合物单体的X111和所述第二热化合物单体的X112,
所述第一热化合物单体的X161和所述第二热化合物单体的X162,和
所述第一热化合物单体的X182和所述第二热化合物单体的X183,由带有相反电荷的氨基酸形成。
在一些优选实施方案中,
-所述第一热化合物单体的X111和X112具有相同的电荷,并且所述第二热化合物单体的X111和X112具有与所述第一热化合物单体的X111和X112的相同电荷相反的电荷;
-所述第一热化合物单体的X161和X162具有相同的电荷,并且所述第二热化合物单体的X161和X162具有与所述第一热化合物单体的X161和X162的相同电荷相反的电荷;以及
-所述第一热化合物单体的X182和X183具有相同的电荷,并且所述第二热化合物单体的X182和X183具有与所述第一热化合物单体的X182和X183的相同电荷相反的电荷。
根据第三方面,描述了热化合物单体构建体,其包含本公开内容的热化合物单体,所述热化合物单体被配置为在目标环境中在目标环境温度Te<Tbs下二聚化以形成卷曲螺旋温度感测结构域,所述卷曲螺旋温度感测结构域的熔融温度为Tm=Tbs-0℃至5℃。
在所述热化合物单体构建体中,所述热化合物单体具有N末端和C端并且连接至具有N末端和C端的接头多肽和/或连接至由直径最大1微米的化学部分形成的载物部分。
特别地,在所述热化合物单体构建体中,通过将所述热化合物单体的N末端或C端中的一者与所述接头多肽的C末端或N端中的一者连接来将所述热化合物单体连接至所述接头多肽。
替代地,在所述热化合物单体构建体中,通过以下将所述热化合物单体连接至所述载物部分:
将所述热化合物单体的N末端或C端中的一者与所述载物部分直接连接,或者
通过将所述热化合物单体的N末端或C端中的一者与所述接头多肽的C末端或N端中的一者连接来将所述热化合物单体的N末端或C端中的一者与所述载物部分间接连接。
根据第四方面,描述了热化合物二聚复合体。所述热化合物二聚复合体包含
-本文中所述的第一热化合物单体构建体,其包含连接至第一接头多肽和/或第一载物部分的本公开内容的第一热化合物单体,
和
-本文中所述的第二热化合物单体构建体,其包含连接至第二接头多肽和/或第二载物部分的本公开内容的第二热化合物单体,
在所述热化合物二聚复合体中,所述第一热化合物单体和所述第二热化合物单体被配置为以大于15的热希尔系数在目标环境中在目标温度Te<Tbs下二聚化,以形成包含所述第一温度感测区域和所述第二温度感测区域并且熔融温度Tm=Tbs-0℃至5℃的卷曲螺旋温度感测结构域。
在包含第一载物部分和/或第二载物部分的所述热化合物二聚复合体中,所述第一载物部分和所述第二载物部分中的至少一者被配置为与所述目标环境具有经受最高50pN、优选最高20pN、更优选10pN或甚至更优选6至7pN或更低的斯托克斯曳力(Stokes′sdrag force)的界面。
根据第五方面,描述了热化合物载体,其包含热化合物基因表达盒,所述基因表达盒包含编码本文中所述的热化合物单体或热化合物单体构建体的多核苷酸,所述热化合物单体构建体包含所述接头多肽和/或载物部分,其中所述化学部分包含多肽。在所述热化合物基因表达盒中,所述多核苷酸在启动子和另外的调控区的控制之下,所述启动子和另外的调控区的构型允许本公开内容的所述热化合物单体或热化合物单体构建体在目标环境中表达。
根据第六方面,描述了热化合物细胞,其在生物细胞内包含本文中所述的热化合物单体、热化合物二聚体、热化合物单体构建体、热化合物二聚构建体和热化合物载体中的至少一者。
根据第七方面,描述了热化合物表面,其包含热化合物单体、热化合物二聚体、热化合物单体构建体、热化合物二聚构建体中的至少一者,连接至被配置为直接或间接连接包含在所述接头多肽和/或所述载物部分中的多肽的表面。
根据第八方面,描述了热化合物装置,其包含本文中所述的至少一种热化合物表面,并且被配置为允许本文中所述的任何一种方法进行,其中至少一种热化合物单体构建体和/或热化合物二聚构建体连接至所述热化合物表面。
根据第九方面,描述了提供本公开内容的热化合物单体构建体的方法和系统;所述方法包括
提供本公开内容的热化合物单体,所述热化合物单体具有N末端和C端,
A)提供本公开内容的热化合物单体;
B)提供以下中的至少一者
a)具有N端和C端的接头多肽;和
b)由直径最大1微米的化学部分形成的载物部分;
B)将所述热化合物单体部分
a)通过以下连接至所述接头多肽:
将所述热化合物单体的N末端或C端中的一者与所述接头多肽的C末端或N端中的一者连接
或者
b)通过以下连接至所述载物部分:
i)将所述热化合物单体的N末端或C端中的一者与所述载物部分直接连接,
或者
ii)通过将所述热化合物单体的N末端或C端中的一者与所述接头多肽的C末端或N端中的一者连接来将所述热化合物单体的N末端或C端中的一者与所述载物部分间接连接,
以提供本公开内容的热化合物单体构建体。
提供本公开内容的热化合物单体构建体的系统,其包含
本公开内容的热化合物单体、热化合物基因表达盒和热化合物载体中的至少一者,
本公开内容的接头多肽或编码其的多核苷酸中的至少一者,以及
载物部分
所述系统用于在本公开内容的提供热化合物单体构建体的方法中同时组合地或顺序地使用。
在一些实施方案中,其中所述载物部分由多肽形成,所述系统还可以包含作为所述载物部分的补充或替代的编码所述载物部分的多核苷酸,如技术人员将理解的。
根据第十方面,描述了提供本公开内容的热化合物二聚复合体的方法和系统。所述方法包括
提供本文中所述的第一热化合物单体构建体,其包含连接至第一接头多肽和/或由直径最大1微米的化学部分形成的第一载物部分的本公开内容的第一热化合物单体
以及
提供本文中所述的第二热化合物单体构建体,其包含连接至第二接头多肽和/或由直径最大1微米的化学部分形成的第二载物部分的本公开内容的第二热化合物单体
在所述方法中,所述第一热化合物单体和所述第二热化合物单体被配置为以大于15的热希尔系数在目标环境中在目标温度Te<Tbs下二聚化,以形成包含所述第一温度感测区域和所述第二温度感测区域并且熔融温度Tm=Tbs-0℃至5℃的卷曲螺旋温度感测结构域。
在所述提供热化合物二聚复合体的方法中,所述第一载物部分和所述第二载物部分中的至少一者具有作用在所述目标环境的水性流体与所述载物之间的界面上的等于或低于6至7pN的斯托克斯曳力。
本公开内容的提供热化合物二聚复合体的方法还包括
使所述第一热化合物单体构建体与所述第二热化合物单体构建体在目标环境中在目标温度Tbs下接触,以允许所述第一热化合物单体与所述第二热化合物单体发生二聚化,以提供热化合物二聚复合体。
在一些实施方案中,所述方法还可以包括将所述第一单体构建体和第二单体构建体中至少一者的接头多肽或载物部分的N端或C端连接至被配置为在所述接触之前或之后允许相关结合的表面。
本公开内容的提供热化合物二聚复合体的系统,其包含
-本文中所述的第一热化合物单体构建体,其包含连接至所述第一接头多肽和/或所述第一载物部分的本公开内容的第一热化合物单体,和
-本文中所述的第二热化合物单体构建体,其包含连接至所述第二接头多肽和/或所述第二载物部分的本公开内容的第二热化合物单体,所述系统用于在本公开内容的提供热化合物二聚复合体的方法中同时组合地或顺序地使用。
根据第十一方面,描述了控制第一载物部分和/或第二载物部分在具有目标环境温度Te的目标环境中的定位的方法和系统。在所述方法和系统中,所述第一载物部分和任选地所述第二载物部分具有作用在所述目标环境的水性流体与所述载物之间的界面上的最高50pN的斯托克斯曳力。控制载物部分和任选地第二载物部分的定位的方法,其包括
向所述目标环境施用本文中所述的第一热化合物单体构建体,其包含直接连接至或通过第一接头多肽间接连接至所述第一载物部分的本公开内容的第一热化合物单体,和
向所述目标环境施用本文中所述的第二热化合物单体构建体,其包含本公开内容的第二热化合物单体,所述第二热化合物单体
连接至第二接头多肽,或
通过所述第二接头多肽连接至所述第二载物部分。
在所述热化合物二聚复合体中,所述第一热化合物单体和所述第二热化合物单体被配置为以大于15的热希尔系数在目标环境中在目标温度Te<Tbs下二聚化,以形成包含所述第一温度感测区域和所述第二温度感测区域并且熔融温度Tm=Tbs-0℃至5℃的卷曲螺旋温度感测结构域。
所述方法还包括改变温度Te以获得Te<Tbs,进行所述改变以使所述第一热化合物单体与所述第二热化合物单体发生二聚化,从而在所述目标环境中获得所述热化合物二聚体复合体(dimer complex)。
在一些实施方案中,本文中所述的第二热化合物单体构建体包含连接至所述第二接头多肽的本公开内容的第二热化合物单体,并且所述第二接头多肽连接至被配置为结合所述接头多肽的表面。
控制第一载物部分和任选地第二载物部分在目标环境中的定位的系统,其包含
-本文中所述的第一热化合物单体构建体,其包含直接连接至或通过所述第一接头多肽连接至所述第一载物部分的本公开内容的第一热化合物单体
和
-本文中所述的第二热化合物单体构建体,其包含本公开内容的第二热化合物单体,所述第二热化合物单体
连接至所述第二接头多肽
或者
通过所述第二接头多肽连接至所述第二载物部分,
所述系统用于在本文中所述的控制所述第一载物部分和所述第二载物部分在目标环境中的定位的方法的施用中同时组合地或顺序地使用。
根据第十二方面,描述了改变本公开内容的热化合物二聚体在目标环境中的生物开关温度Tbs0的方法和系统,以及由此获得的变体。
在改变本公开内容的热化合物二聚体的生物开关温度Tbs0的方法中,所述热化合物二聚体具有熔融温度Tm0,其中Tbs0=Tm+0℃至5℃。
在改变本公开内容的热化合物二聚体的生物开关温度Tbs0的方法中,所述热化合物二聚体的每个热化合物单体具有相应的温度感测序列的所排列的残基A1至A291,其排列成七肽重复(heptad repeat)a、b、c、d、e、f或g的连续不间断系列,其中所述七肽重复中的至少两个肽具有其中没有氨基酸缺失的局部结构(register),并且最多49个七肽重复具有其中最多5个连续氨基酸残基任选地缺失的局部结构,
改变所述热化合物二聚体的生物开关温度Tbs的方法包括
提供本文中所述的热化合物二聚体,所述热化合物二聚体在所述目标环境中具有起始生物开关温度Tbs0,并且包含被配置为在所述目标环境中以大于15的热希尔系数在起始熔融温度Tm0下形成二聚体的本公开内容的两个热化合物单体;
在形成所述热化合物二聚体的所述两个热化合物单体中的至少一个热化合物单体中,
将至少一个单体的温度敏感性氨基酸序列中至少一个七肽重复的位置a处的疏水氨基酸和位置d处的疏水氨基酸中的至少一个替换为被配置为提高或降低所述温度感测结构域的单体蛋白中相应七肽重复的位置a和/或d处的相应氨基酸残基之间的疏水堆积的残基,
将至少一个单体的温度敏感性氨基酸序列中至少一个七肽重复的位置b处的极性或带电荷氨基酸、位置e处的极性或带电荷氨基酸和位置g处的极性或带电荷的氨基酸中的至少一个替换为疏水残基,和/或
将至少一个单体的温度敏感性氨基酸序列中至少一个七肽重复的位置e处的极性或带电荷氨基酸和位置g处的极性或带电荷氨基酸中的至少一个替换为被配置为提高或降低所述温度感测结构域的单体蛋白中相应七肽重复的位置a、d、e和/或g处的相应氨基酸残基之间的库伦排斥的残基,
进行所述替换以获得温度感测结构域的熔融温度Tmm低于或高于所述目标环境中的Tm0的卷曲螺旋温度敏感性转录因子的变体,所获得的变体具有低于或高于所述目标环境中的Tbs0的生物开关温度Tbsm。
另外的方面可以包括,i)编码热化合物单体、热化合物二聚体、热化合物单体构建体和/或热化合物二聚复合体的多核苷酸,ii)包含热化合物单体、热化合物二聚体、热化合物单体构建体和/或热化合物二聚复合体与合适的载剂的组合物,iii)使用热化合物单体、热化合物二聚体、热化合物单体构建体和/或热化合物二聚复合体的另外的方法,和iv)包含热化合物单体、热化合物二聚体、热化合物单体构建体和/或热化合物二聚复合体的另外的系统,以及技术人员可识别的另外的方面。
本公开内容的热化合物单体、热化合物二聚体、热化合物单体构建体、热化合物二聚复合体以及本文中所述的相关载体、细胞、表面、装置、组合物、方法和系统,在数个实施方案中允许以热调节的方式控制目标环境中载物部分的空间和/或时间定位。
本公开内容的热化合物单体、热化合物二聚体、热化合物单体构建体、热化合物二聚复合体以及本文中所述的相关载体、细胞、表面、装置、组合物、方法和系统,在数个实施方案中允许热控制目标环境中载物部分的相互作用和结合。
本公开内容的热化合物单体、热化合物二聚体、热化合物单体构建体、热化合物二聚复合体以及本文中所述的相关载体、细胞、表面、装置、组合物、方法和系统,在数个实施方案中允许以热调节的方式触发二聚体复合体的形成和解离。
本公开内容的热化合物单体、热化合物二聚体、热化合物单体构建体、热化合物二聚复合体以及本文中所述的相关载体、细胞、表面、装置、组合物、方法和系统可以与多种应用结合使用,其中载物部分的受控的定位、相互作用和/或结合以及相关复合体的受控的形成和解离是期望的。例如,本公开内容的热化合物单体、热化合物二聚体、热化合物单体构建体、热化合物二聚复合体以及本文中所述的相关载体、细胞组合物、方法和系统,可用于在以下中提供空间上和/或时间上受控的治疗剂定位:医学应用、药物研究和制造、化学品和蛋白质(例如酶或催化剂或聚合物)的生物合成、以及诊断和/或临床应用。在另一实例中,本公开内容的热化合物单体、热化合物二聚体、热化合物单体构建体、热化合物二聚复合体以及本文中所述的相关载体、细胞组合物、方法和系统可用于控制脱落蛋白(splitprotein)和/或蛋白质抑制剂复合体的活性以以温度依赖性方式调节蛋白质功能。
其他示例性应用包括本公开内容的单体、热化合物二聚体、热化合物单体构建体、热化合物二聚复合体以及本文中所述的相关载体、细胞、表面、装置、组合物、方法和系统在包括基础生物学研究、应用生物学、生物工程、生物能源、医学研究、医学诊断学、治疗学、生物燃料在内的数个领域中的使用,以及在技术人员在阅读本公开内容后可识别的另外领域中的使用。
本公开内容的一个或更多个实施方案的细节在附图和以下描述中阐述。从描述和附图以及从权利要求书中,其他特征、目的和优点将是显而易见的。
附图简述
并入到本说明书中并构成本说明书的一部分的附图举例说明了本公开内容的一个或更多个实施方案,并且与详细描述和实施例一起,用于解释本公开内容的原理和实施。
图1举例说明了在一些实施方案中通过电荷-电荷互补改造异二聚体TlpA变体。图1,图a)基于TlpA的热化合物系统的图解。异二聚体卷曲螺旋结构域使得融合配偶体能够作为温度的sharp函数可逆的缔合和解离。图1,图b)基于在相邻α螺旋之间的e-至-g′界面处引入或改变静电接触的异二聚体卷曲螺旋设计的图。P、H、+和-分别表示极性残基、疏水残基和带电荷残基。WT表示野生型蛋白质,而A和B表示经改造的突变体。图1,图c)沿以非常规e-至-d’构型出现的TlpA界面的所预测静电接触的图。图1,图d)分离的或作为等摩尔混合物的经纯化TlpA卷曲螺旋结构域变体的归一化椭圆率,其在222nm峰处针对α螺旋谱测量,作为温度的函数。示出的数据在每个样品的基础上在0至1之间归一化。
图2示出了在一些实施方案中通过细菌中启动子抑制的重构来评价TlpA异二聚化。图2,图a)含有两个TlpA基因的细菌遗传回路(genetic circuit)的图,每个基因都可以编码一种经改造变体。含有G1A/G1A和G1B/G1B回路的细菌只能产生同二聚体螺旋,而G1A/G1B回路可以产生同二聚体螺旋或异二聚体螺旋。图2,图b)经改造异二聚体构建体的操作子结合的图解;只有表达异二聚体TlpA变体的两个配偶体的细胞才能在高于一定温度时抑制报告基因。图2,图c)大肠杆菌(E.coli)的作为温度的函数的OD归一化的荧光表达谱(n=3),所述大肠杆菌含有a中所示的质粒构建体,在A和B位置处具有单一突变体G1A和G1B变体。误差棒代表±s.e.m。NFU代表归一化的荧光单位。图2,图d)含有质粒的大肠杆菌的OD归一化的温度依赖性荧光表达谱,所述质粒带有G1变体和两种另外的候选单突变体的四种可能的双突变体组合,所有这些都在异二聚体配对中(n=3)。误差棒代表±s.e.m。
图3示出了在一些实施方案中通过电泳验证TlpA异二聚化。图3,图a)左图:用于生化测定的TlpA的经改造异二聚体的同时共表达的基因构建体的图。一个开放阅读框表达全长TlpA蛋白,而另一个ORF产生截短的版本,其缺少全长TlpA蛋白的所预测的N端DNA结合结构域(ΔNTD)。每个位置都可以被TlpA的任何变体,包括野生型蛋白质和经改造突变体占据。右图:从该构建体表达的TlpA产物的共价二聚交联产生的可能的SDS-PAGE条带的图。左侧泳道中的实例对应于野生型同二聚体TlpA。右侧泳道中的实例对应于异二聚体TlpA变体对。图3,图b)大肠杆菌裂解物中CuCl2催化的野生型TlpA交联反应的western印迹,然后是SDS-PAGE。交联在37℃、45℃下或在于45℃下孵育10分钟之后评估重退火(reannealing,Re)的37℃下进行。每个条件都与未交联对照进行比较。凝胶的底部条带显示未交联的单体。图3,图c)含有野生型TlpA(wt)、第一代单突变体异二聚体(G1)或G2-n双突变体异二聚体的图3图a)中构建体的CuCl2交联、SDS-PAGE和Western印迹。交联在37℃下进行。图3,图d)在不存在和存在CuCl2的情况下,在37℃、45℃下或在于45℃下孵育10分钟之后在37℃下重退火的情况下,分析G1和G2-3异二聚体构建体的热响应。
图4示出了示例性遗传回路的遗传构建体和哺乳动物细胞中TlpA活性的膜定位测定的结果。图4,图a)用于RFP在质膜处的温度依赖性定位的遗传构建体(顶部图)和示意图(底部图)。TlpA39-G2A3链与GAP43棕榈酰化基序融合,导致其束缚至脂质膜。配偶体TlpA39-G2B3链与RFP融合。在低温下,这些链的异二聚化会导致RFP定位在膜处。加热之后,RFP融合的链应与膜解离。图4,图b)用图4图a)中所示的构建体转染的代表性K562细胞的荧光图像。在25℃和37℃下观察到RFP荧光的稳健膜定位。在40℃下,RFP开始从膜上解离,并且到42℃时荧光分布在整个细胞质中。细胞中心的球状荧光形式代表用Hoechst 33342染料染色的细胞核。图4,图c)直接棕榈酰化的RFP对照的遗传构建体(顶部图)和实验示意图(底部图)。图4,图d)用图4图c中所示的构建体转染的代表性K562细胞的荧光图像,其在整个测试的温度范围内显示出稳健的膜定位。图4,图e)在慢病毒递送的TlpA介导的RFP定位构建体(示于图4,图a)和膜染色染料CellBrite Fix 488的情况下,K562细胞的代表性荧光图像。图4,图f)在稳定表达直接棕榈酰化的RFP(示于图4图b中,n=8)、TlpA介导的膜定位构建体(示于图4图a中,n=15)和游离细胞质RFP(n=8)的K562细胞中,作为温度的函数的在CellBrite488染料的情况下的RFP像素共定位。误差棒代表±s.e.m。图4,图g)代表性的K562热报道细胞系在加热之前、加热至42℃之后和重新平衡至37℃之后的时间序列的荧光图像。每隔15分钟追踪RFP在质膜处的再积累。像素强度相对于每个图像的最大值归一化。图4,图h)作为温度的函数的在CellBrite 488染料的情况下然后在37℃下孵育(重缔合)一段时间的TlpA-RFP信号的像素共定位(解离);n=12。误差棒代表±s.e.m。
图5举例说明了示例性经改造TlpA变体的圆二色性熔融曲线。从大肠杆菌中纯化对应于TlpA第69-359位残基的卷曲螺旋片段并通过CD谱进行测定。在222nm处监测椭圆率,其对应于α螺旋谱的原型峰,使得能够追踪TlpA从二聚卷曲螺旋状态转变为单体无规卷曲构型时的构象。
图6示出了代表图2图b中所示构建体的热RFP表达谱的图(n=3)。误差棒代表±s.e.m。不可见的地方表示其比符号小。
图7示出了表示含有两个TlpA变体(TlpA-G1A和TlpA-G1B)的构建体的热GFP(顶部图)和RFP(底部图)表达谱的图,其中交换了图2图b中异二聚体共表达构建体中TlpA-G1A和TlpA-G1B的位置。结果表明了TlpA共表达构建体的位置独立性。确定了热GFP(顶部图)和RFP(底部图)表达谱(n=4)。在基因表达谱中没有观察到显著差异,从而排除了对回路内TlpA行为的位置依赖性作用。误差棒代表±s.e.m。不可见的地方表示其比符号小。
图8示出了在一些实施方案中的通过细菌热基因表达测定筛选的合理设计的突变体组(panel)。选择了TlpA卷曲螺旋中的四个位置进行诱变,这是基于其离子相互作用模式与G1A/G1B突变对的所预测的相似性、根据Koski et al的七肽重复局部结构预测进行的。检查了以下突变:图8,图a)E151R和R152E图8,图b)E229R和R230E,图8,图c)E250R和R251E,和图8,图d)E331K/E335K和K336E。描绘了野生型蛋白质的所预测的相互作用模式(顶部图),并报告了热GFP表达谱(底部图)。N=3。选择E229R/R230E和E250R/R251E对用于引入到TlpA-G1A和G1B变体中。误差棒代表±S.e.m。不可见的地方表示其比符号小。所指示的突变位置是相对于全长TlpA蛋白的。热化合物部分从“A69”开始。
图9示出了代表图2图c中所示的第一代和第二代异二聚体的热RFP表达谱的图(n=3)。仅描述了含有每个异二聚体链的一个拷贝的构建体,因为XnA/XnB同二聚体构建体在TlpA启动子或荧光蛋白开放阅读框中没有累积缺失突变的情况下无法繁殖。误差棒代表±s.e.m。不可见的地方表示其比符号小。
图10示出了代表图3图c中共表达的完整和截短的TlpA链的Western印迹条带强度谱的图。请注意,缺少对应于截短的同二聚体(3)的明显条带的样品(例如TlpA-G1),不论是否相对于全长未交联物质(4)显示出更高的截短的未交联链(5)的条带强度,都证实了在位置3处缺乏低分子量同二聚体是由于同二聚体亲和力降低而不是通过异二聚体配对完全耗竭轻TlpA链引起的。这与在37℃下具有不同同二聚化亲和力的阳离子型和阴离子型TlpA变体一致。
图11示出了在一些实施方案中的蓝色荧光蛋白(图11,图a)、绿色荧光蛋白(图11,图b)和红色荧光蛋白(图11,图c)的组的热稳定性。以等摩尔浓度制备蛋白质,并在rtPCR热循环仪中在从25℃到50℃的热升温和随后重退火到25℃的情况下测量它们的荧光,并在1分钟的间隔内连续获得读取。对于每个给定的实验,将信号强度相对于最大值归一化。因为三类蛋白质使用了不同的过滤器组,所以红色、绿色和蓝色通道之间的相对亮度不相关。虽然一些蛋白质例如FF-GFP在测试的温度范围内表现出更稳定的信号,但整体亮度在mScarlet-I和TGP中最大。然而,当在哺乳动物细胞中作为未标记的细胞质蛋白表达时,TGP表现出显著的聚集,因此选择mScarlet-I作为后续实验的报道子。
图12示出了图4图b中TlpA膜定位实验的另外重复。像素强度相对于每个图像的最大值归一化。
图13示出了用图4图a中所示构建体转染的K562细胞用BODIPY-C5-神经酰胺染色以标记高尔基体转运途径。染色形态类似于mScarlet-I TlpA载物蛋白的定位。示出了四种代表性细胞。像素强度相对于每个图像的最大值归一化。
图14示出了如图4图d中所示的用具有直接棕榈酰化的mScarlet-I的构建体转染的K562细胞的另外的重复。在大多数细胞中在高至45℃情况下观察到稳健的膜定位。所提供的数据代表两个独立的实验。像素强度相对于每个图像的最大值归一化。
图15示出了用于膜定位RFP递送的含有非同源TlpA39-G2A3的慢病毒构建体(顶部图)和用非同源TlpA介导的膜定位系统进行慢病毒转导的K562细胞在不同温度下的荧光图像(底部图)。像素强度相对于每个图像的最大值归一化。
图16示出了用图15中描述的慢病毒构建体转导的K562细胞系的共焦成像。将细胞沉淀,沉积在载玻片上,用盖玻片密封,并在具有Plan-Apochromat 63x/1.4Oil DIC M27油浸物镜的LSM880上成像。请注意所有细胞,无论局部细胞质亮度或膜亮度如何,都会沿质膜显示可见的RFP积累。
图17示出了代表对图4图f中的直接膜融合曲线有贡献的两个数据组的CellProfiler量化的图。在44℃下单独获得的数据点显示为较浅的正方形。误差棒代表±s.e.m。
图18示出了数个原型蛋白质圆二色性谱,包括在208nm+/-3nm和222nm+/-3nm处特点为局部最小值的特征性α螺旋谱。图来自[1]。
图19示出了热开关评价的验证过程,其使用野生型TlpA卷曲螺旋结构域作为原型实例。首先,圆二色性谱是在低于预期Tbs(在本例中为25℃)的温度下获得的。卷曲螺旋结构是通过在208nm+/-3nm和222nm+/-3nm处存在局部最小值而建立的。随后,在一定的温度范围内追踪样品在222nm处的椭圆率,温度范围两端延伸至低于和高于预期Tbs至少5℃。椭圆率朝向零提高表明α螺旋结构的展开,其作为卷曲螺旋未二聚化的代表。
图20至22示出了根据本公开内容的示例性表面和装置的示意图。
发明详述
本文中提供了由两种单体蛋白形成的模块化温度感测二聚体(本文中还提供了二聚化热开关、热化合物或热化合物二聚体)和相关单体构建体、二聚复合体、载体、细胞、组合物、方法和系统,其在数个实施方案中允许受控、热调节的分子复合体形成。
本文中使用的术语“二聚体”表示由两个聚合物并且特别是两个蛋白质形成的大分子复合体。
本文中使用的术语“蛋白质”表示具有特定二级和三级结构的多肽,其可以与另外的分子,并且特别是与其他生物分子,包括其他蛋白质、DNA、RNA、脂质、代谢物、激素、趋化因子、和/或小分子相互作用。本文中使用的术语“多肽”表示由两个或更多个氨基酸单体和/或其类似物构成的有机线性、环状或支链聚合物。术语“多肽”包括任何长度的氨基酸聚合物,包括全长蛋白质和肽以及它们的类似物和片段。三个或更多个氨基酸的多肽也称为蛋白质寡聚体、肽或寡肽。特别地,术语“肽”和“寡肽”通常表示具有少于100个氨基酸单体的多肽。特别地,在蛋白质中,多肽提供蛋白质的一级结构,其中术语蛋白质的“一级结构”是指多肽链中共价连接以形成多肽聚合物的氨基酸的序列。蛋白质“序列”表示形成一级结构的氨基酸的顺序。一级结构内氨基酸之间的共价键可以包括肽键或二硫键,以及技术人员可识别的另外的键。在本公开内容的意义上,多肽通常由通过肽键或合成的共价键共价连接的α-氨基酸残基的线性链构成。基于每个末端上游离基团的性质,将涵盖末端残基和相邻区段的线性多肽链的两个末端称为羧基端(C端)和氨基端(N端)。除非另有说明,否则多肽中残基的计数是从N末端(NH2-基团)(N末端是其中氨基不参与肽键的末端)至C末端(-COOH基团)(C末端是其中COOH基团不参与肽键的末端)进行的。蛋白质和多肽可以通过X射线晶体学、直接测序、免疫沉淀和本领域技术人员理解的多种其他方法来识别。蛋白质可以通过技术人员可识别的数种方法在体外或体内提供。在蛋白质是聚合物的至少一部分中的合成蛋白质的一些情况下,两个或更多个氨基酸单体和/或其类似物通过有机酸(-COOH)和胺(-NH2)的化学介导的缩合连接以形成酰胺键或“肽”键。
基于每个末端上游离基团的性质,将涵盖末端氨基酸残基和相邻区段的线性多肽链的两个末端称为羧基端(C端)和氨基端(N端)。除非另有说明,否则多肽中残基的计数是从N末端(NH2-基团)(N末端是其中氨基不参与肽键的末端)至C末端(-COOH基团)(C末端是其中COOH基团不参与肽键的末端)进行的。多肽的C末端可以包含在蛋白质的“尾”内,其指示由蛋白质C端处的氨基酸形成的区段。
本文中使用的术语“氨基酸”、“氨基酸单体”或“氨基酸残基”是指由胺和羧酸官能团以及对每个氨基酸具有特异性的侧链构成的有机化合物。特别地,α-(alpha)或α-氨基酸是指由胺(-NH2)和羧酸(-COOH)以及对与α碳相连的每个氨基酸具有特异性的侧链构成的有机化合物。不同的氨基酸具有不同的侧链并具有不同的特性,例如电荷、极性、芳香性、还原电位、疏水性和pKa。通过由第一氨基酸的胺基和第二氨基酸的羧酸基团之间的反应形成的肽键,氨基酸可以共价连接以形成聚合物。在本公开内容的意义上,氨基酸是指二十种天然存在的氨基酸、非天然氨基酸中的任一种,并且包括D和L旋光异构体。
在本公开内容的意义上的“二聚体”中,两个蛋白质单体通过共价和/或非共价相互作用彼此结合,如本领域技术人员将理解的。非共价相互作用的实例包括离子键、范德华相互作用(Van der Waals interaction)、极性相互作用、盐桥、库仑吸引、库仑排斥、疏水相互作用以及技术人员可识别的其他相互作用。非共价结合的蛋白质二聚体的一个实例是酶逆转录酶。共价相互作用的实例包括涉及在例如二硫键之间共享电子对的任何化学键。
在本公开内容的意义上的二聚体可以是同二聚体和异二聚体。术语“同二聚体”意指由具有相同聚合物序列的两个单体组成的二聚体,并且特别是由具有相同氨基酸序列的两个多肽或蛋白质单体组成的二聚体。蛋白质同二聚体的实例包括酶环氧合酶(COX)、甲硫氨酸阻遏物MetJ、TlpA、λ阻遏物cI和技术人员可识别的其他物质。术语“异二聚体”意指具有不同聚合物序列的两个单体的二聚体,并且特别是具有不同氨基酸序列的两个多肽或蛋白质单体的二聚体。蛋白质异二聚体的实例包括酶逆转录酶和技术人员可识别的其他物质。
因此,在本公开内容的意义上,术语“单体”表示能够与具有相同或不同序列的另一单体可逆地形成二聚体的多肽分子。特别地,在本公开内容的意义上的单体包括具有N端和C端的多肽,并且被配置为通过二聚化区域二聚化。
根据本公开内容的“热化合物单体”是多肽单体,其中二聚化区域是具有如下残基的温度感测区域,所述残基被配置为与另一热化合物单体的相应残基形成非共价键,以在目标温度Te=Tm±10℃下形成二聚体蛋白质的温度感测结构域,其中Tm是二聚体蛋白质的熔融温度,熔融温度“Tm”温度是二聚体的温度感测结合结构域变性的温度,如技术人员将理解的。
在本文中所述的一些实施方案中,根据本公开内容的热化合物单体是包含具有以下温度感测序列的温度感测区域的单体,或者是其包含温度感测区域的至少一个残基的中性替换的衍生物:
A1E2E3V4K5A6V7S8A9A10L11S12E13R14I15T16Q17L18A19T20E21L22N23D24K25A26V27R28A29A39E31R3 2R33V34A35E36V37T38R39A40A41G42E43Q44T45A46Q47A48E49R50E51L52A53D54A55A56Q57T58V59D60D61L62E63E6 4K65L66D67E68L69Q70D71R72Y73D74S75L76T77L78A79L80E81S82E83R84S85L86R87Q88Q89H90D91V92E93M94A95Q9 6L97K98E99R100L101A102A103A104E105E106N107T108R109Q11oX111X112E113R114Y115Q116E117Q118K119T120V121L12 2Q123D124A125L126N127A128E129Q130A131Q132H132K134N135T136R137E138D139L140Q141K142R143L144E145Q146I14 7S148A149E150A151N152A153R154Ti55E156E157L158K159S160X161X162D163K164V165N166T167L168L169T170R171L17 2E173S174Q175E176N177A178L179A180S181X182X183Q184Q185H186L187A188T189R190E191T192L194Q194Q195R196L197E198Q199A200I201A202D203T204Q205A206R207A208G209E210I211A212L213E214R215D216R217V218S219S220L221T22 2A223R224L225E226S227Q228E229K230A231S232S233E234Q235L236V237R238M239G240S241E242I243A244S245L246T24 7E248R249C250T251Q252L253E254N255Q256R257D258D259A260R261L262E263T264M265G266E267K268E269T270V271A27 2A273L274R275G276E277A278E279A280L281K282R283Q284N285Q286S287L288M289A290A291
其中X111 X112、X161 X162 X182和X183独立地是带负电荷的氨基酸,优选E和/或D,或者带正电荷的氨基酸,优选K和/或R。
本文中使用的术语“带电荷的”意指分子,并且特别是氨基酸,在目标环境的pH值下(例如在细胞或胞内细胞环境的生理pH下)具有带离子电荷的侧链,如技术人员所理解的。
特别地,在本公开内容的意义上的带电荷的氨基酸可以考虑以下事实进行选择:在氨基酸中氨基酸的α-羧酸基团是弱酸,意指其在中等pH值下释放质子。换言之,羧酸基团(-CO2H)可以去质子化以成为负性羧酸根(-CO2-)。带负电荷的羧酸根离子在大于羧酸基团的pKa的pH值下占优势。此外,在细胞或胞内细胞环境中,以补充的形式,氨基酸的α-胺是弱碱,意指它在中等pH值下接受质子。换言之,α-氨基(NH2-)可以质子化为正性α-铵基(+NH3-)。带正电荷的α-铵基在小于α-铵基的pKa的pH值下占优势。
因此,在本公开内容的意义上的带正电荷的氨基酸具有由目标环境限定的pH下带正电荷的侧链,在所述目标环境中配置热化合物单体以进行操作。
在本公开内容的意义上的带负电荷的氨基酸是具有由目标环境限定的pH下带正电荷的侧链的氨基酸,在所述目标环境中配置热化合物单体以进行操作。
本文中使用的措辞“目标环境”是指结构和流体的任何组合,在所述目标环境中配置本公开内容的热化合物单体、二聚体、构建体和复合体以进行操作。通常,目标环境包括介电常数为约80的流体(本文中也称为介质)和结构的组合。特别地,示例性环境可以具有的介电常数范围为40至150、50至80、30至60和高于15。
示例性目标环境包括无细胞反应混合物,体外、体内或离体的细胞、组织、器官,体外微生物的集合,以及在体外培养物中生长的细胞,包括原代哺乳动物细胞、永生化细胞系、肿瘤细胞、干细胞等。另外的示例性目标环境包括离体培养物中的组织和器官以及对象中的组织、器官或器官系统,例如个体体内的肺、脑、肾、肝、心脏、中枢神经系统、外周神经系统、胃肠系统、循环系统、免疫系统、骨骼系统、感觉系统,和技术人员可识别的另外的环境。本文在本公开内容的上下文中使用的术语“个体”或“对象”或“患者”包括单一植物、真菌或动物,并且特别是高等植物或动物,并且特别是脊椎动物,例如哺乳动物,并且更特别是人。
本文中所述的示例性目标环境的示例性pH值包括pH 7.2(大多数细胞的细胞质)、6.8至7.2(哺乳动物骨骼肌的细胞质)、5(溶酶体)和7.4(标准PBS缓冲液)。
天然氨基酸的电荷可以在识别目标环境后由技术人员确定。例如,在20种常见的天然氨基酸中,在pH=7.4时(例如在细胞或胞内细胞环境中),有5种具有可以带电荷的侧链。在pH=7.4时,有两种带负电荷:天冬氨酸(Asp,D)和谷氨酸(Glu,E)(酸性侧链),并且有三种带正电荷:赖氨酸(Lys,K),精氨酸(Arg,R)和组氨酸(His,H)(碱性侧链)。
具有在其环境pH下带电荷的侧链的非天然氨基酸例如非典型氨基酸的带电也可以由技术人员基于相关侧链确定。示例性带电荷的非典型氨基酸包括α-氨基己二酸(Aad)和γ-羧基谷氨酸(Gla)。其他非典型氨基酸可以含有技术人员已知具有正电荷的部分(例如伯胺或胍基)中具有的正电荷,或者可以含有技术人员已知具有负电荷的部分(例如羧酸盐/酯基团)中具有的负电荷,例如技术人员将理解的那样。
因此,在本公开内容的意义上的带正电荷和带负电荷的氨基酸被配置为在以下条件下具有电相互作用:在两种物质都带电荷的pH条件下(例如在大多数细胞的细胞质中为7.2),和在允许库仑相互作用的介电常数下(例如在大多数细胞的细胞质中为76),以及在允许带电荷部分之间的显著力传递的带电部分之间的距离(例如在介电常数为76的情况下<4埃,如在大多数细胞的细胞质中)>如本领域技术人员将理解的那样下。
本文中使用的术语“库仑相互作用”或“静电相互作用”是指静态带电粒子之间的相互作用,并且特别是氨基酸之间的相互作用,其中根据库仑定律,氨基酸可以是库仑吸引或库仑排斥的,在所述库仑定律中,ε0是真空介电常数,εr是介质的介电常数,并且q1和q2是参与原子上各自的电荷。
静电相互作用包括离子相互作用、氢键合、卤素键合、范德华力、偶极-偶极、偶极诱导的偶极、疏水作用以及技术人员理解的其他相互作用。
特别地,根据本公开内容的热化合物单体,温度感测区域被配置为在目标环境中在目标温度Te<Tbs下以温度依赖性方式二聚化,以形成卷曲螺旋温度感测结构域。优选地,根据本公开内容,温度感测区域被配置为在目标环境中在目标温度Te=Tbs-2℃至10℃下二聚化。
与蛋白质相关的术语“结构域”表示从单个氨基酸到与蛋白质内可识别结构相关的完整蛋白质的蛋白质序列的任何连续部分。在本公开内容的意义上,“可识别结构”表示一级结构或其部分的空间排列,其可以通过技术如晶体学、疏水性分析或技术人员已知的另外技术来检测。在许多情况下,蛋白质结构域包含蛋白质的一个或更多个二级结构,它们一起形成蛋白质的三级或四级结构。
蛋白质的“二级结构”是指具有在蛋白质的晶体结构、圆二色性内或通过技术人员可识别的另外技术可识别的重复几何形状的局部亚结构。在一些情况下,蛋白质的二级结构可以通过骨架氨基和羧基之间的氢键的模式来识别。二级结构也可以基于规则的、重复的几何形状来定义,其被限制于拉氏图(Ramachandran plot)上二级结构单元中氨基酸的二面角ψ和的近似值。二级结构的两种主要类型是α螺旋和β链或β折叠,如技术人员可识别的。α螺旋和β折叠二者都代表了在肽骨架的成分之间建立非共价氢键从而形成二级结构特征的方式。二级结构形成可以通过在骨架原子之间形成氢键来促进。可以通过使氢键合相互作用的结构不稳定来使二级结构的形成最小化的氨基酸被称为二级结构破坏剂(breaker)。可以通过使氢键合相互作用的形成稳定来促进二级结构的形成的氨基酸被称为结构制造者(maker)。
术语“三级结构”是指蛋白质的三维结构,其通过蛋白质的非相邻区段之间的非共价相互作用和任选地通过一种或更多种另外的化合物或离子与蛋白质的一个或更多个区段的通过共价或非共价相互作用的相互作用来稳定。稳定蛋白质的三维结构的示例性非共价相互作用包括非特异性疏水相互作用、从水中埋入(burial)疏水残基、特异性三级相互作用,例如盐桥、氢键、侧链的紧密堆积、螯合和二硫键以及技术人员可识别的另外的相互作用。化合物或离子与蛋白质区段之间的示例性共价相互作用包括N-连接的糖基化、细胞色素C血红素连接和技术人员可识别的另外的相互作用。
当提及复合体时,术语“四级结构”是指蛋白质复合体的三维结构,也称为多聚体,通过形成复合体的两个或更多个蛋白质之间的非瞬时性相互作用来稳定。因此,可以通过与三级结构相同类型的非共价和共价相互作用中的一些来稳定四级结构,如技术人员将理解的。由相同亚基构成的多聚体用前缀“同-”(homo-)表示(例如同四聚体),并且由不同亚基构成的多聚体用前缀“异-”(hetero-)表示(例如异四聚体),例如血红蛋白的两条α链和两条β链。本文中使用的“非瞬时性相互作用”表示蛋白质或相关区段之间的相互作用,其可通过例如以下的实验室技术检测:免疫沉淀、交联和福斯特共振能量转移(ForsterResonance Energy Transfer,FRET)测量、晶体学、核磁共振(Nuclear MagneticResonance,NMR)和由技术人员可识别的另外的技术。
三维二级、三级或四级蛋白质结构的检测可以使用技术例如X射线晶体学、NMR谱学、双偏振干涉以及技术人员已知的其他技术进行。使用这样的技术,可以检测蛋白质的N端至C端一级序列内的结构特征的位置,所述结构特征包括α螺旋、β链、转角、β桥、弯曲、环、螺旋、卷曲螺旋和技术人员可识别的其他结构特征。
特别地,在本公开内容的意义上的蛋白质结构域中重复基序的检测可以使用结构预测服务器COILS[2]、Paircoil2[3]、LOGICOIL[4]和JPred[5]来进行。多肽和蛋白质的结构也可以从可公开获得的来源获得,例如从蛋白质数据库[6]和技术人员已知的其他来源获得。
术语“温度感测结构域”是指具有被配置为响应于温度变化而提供结构不稳定性的序列的蛋白质或其部分。这种结构不稳定性导致开关在“低于阈值”和“高于阈值”温度之间的行为发生变化,其中行为意指由开关控制的系统的输出。在一个实施方案中,输出是mRNA转录物,其的产生通过在低温下开关与DNA的结合而被阻断,并且通过在高温下从DNA上解离开关来实现。
本公开内容意义上的卷曲螺旋温度感测结构域表示包含α螺旋二级结构的温度感测超螺旋基序的温度感测结构域。特别地,术语“卷曲螺旋”表示蛋白质中的结构基序,其中两至七个α螺旋像绳索一样卷曲在一起,并与一种或更多种其他蛋白质中的卷曲螺旋结构基序相互作用。二聚体和三聚体是最常见的类型。
卷曲螺旋通常含有疏水(h)和带电荷或极性(c)氨基酸残基的重复模式“hxxhcxc”(SEQ ID NO:2),称为七肽重复。七肽重复中的位置可以标记为“abcdefg”,根据局部结构,其中“a”和“d”通常是疏水位置,通常被异亮氨酸、亮氨酸或缬氨酸占据。
本文中使用的与七肽重复相关的术语“局部结构”表示α-螺旋卷曲螺旋中的七肽重复内的位置a、b、c、d、e、f、g的序列。特别地,局部结构指示可能的连续的a、b、c、d、e、f和g位置中的一系列连续位置,其从位置a、b、c、d、e、f或g中的任一个处开始,并且可以被序列的变化(例如缺失或插入)打断。可以基于先前文献[7]和包括COILS[2]、Paircoil2[3]、LOGICOIL[4]和Jpred[5]在内的结构预测服务器之间的一致性来分配七肽螺旋局部结构。将具有这种重复模式的序列折叠成α螺旋二级结构导致通常疏水的“a”和“d”残基呈现为围绕α螺旋卷曲的条带,形成技术人员将理解的两亲结构。
在卷曲螺旋温度感测结构域中,卷曲螺旋基序的α螺旋在充满水的环境(例如细胞质)中形成三级或四级结构,并且特别地疏水链相互缠绕并夹在亲水氨基酸之间。α螺旋可以是平行的或反平行的,并且可以采用左旋或右旋卷曲螺旋。卷曲螺旋可以使用“螺旋轮(helical wheel)”图来描绘,其中卷曲螺旋是沿着α螺旋的轴从N端到C端显示的,例如于2016年12月19日提交的并以公开号US2017/0928425公开的美国申请S/N 15,384,254的图16中示意性示出的示例性结构,其涉及TlpA的卷曲螺旋结构域,所述卷曲螺旋结构域显示了同二聚体卷曲螺旋的一系列螺旋轮表现,其中每个单体螺旋由七肽重复构成。
在本文中所述的实施方案中,二聚化涉及形成两个热化合物单体的热化合物二聚体的动态过程,其涉及两个热化合物单体在它们各自的温度感测区域中的相应残基之间的相互作用,所述温度感测区域形成本文中所述的热化合物二聚体的温度感测结构域。
本文中使用的术语“相应残基”表示在蛋白质复合体内能够相互作用并且通常通过共价或非共价结合或连接形成的残基。
本文中使用的术语“共价键”、“共价结合”或“共价连接”表示这样的相互作用:通过该相互作用,两个部分通过形成共价化学键而缔和。示例性共价键包括肽或蛋白质的氨基酸侧链的酰胺键和二硫键。
本文中使用的术语“非共价键”、“非共价结合”或“非共价连接”表示这样的相互作用:通过该相互作用,两个部分通过非共价吸引力缔和。非共价相互作用包括疏水相互作用例如芳基的π-π相互作用(pi-pi interaction)、或氨基酸侧链疏水基团的范德华相互作用、静电相互作用例如极性相互作用、带相反电荷基团的库仑吸引、带相同电荷基团的库仑排斥和技术人员可识别的其他作用。
在本文中所述的实施方案中,热化合物单体的二聚化涉及形成热化合物二聚体的卷曲螺旋温度感测结构域的动态过程,其涉及在每个单体蛋白的温度感测区域中的七肽重复的位置a至g处的相应残基之间的非共价相互作用,如技术人员将理解的。
特别地,在本文中所述的热化合物单体的二聚化中,在位置a和d处的相应疏水残基与彼此相互作用并形成卷曲螺旋的疏水核或界面,并且主要负责卷曲螺旋的形成和稳定性。在位置d至e和g至e处的相应残基之间的静电吸引可以通过促进两个螺旋之间的盐桥形成来为系统提供另外的稳定性。
这些链间盐桥的形成还可以保护非极性核免受溶剂影响,进一步稳定卷曲螺旋。七肽重复的位置e和g位于卷曲螺旋的疏水界面的侧翼,并且可以通过在界面上折叠以通过其侧链亚甲基与疏水残基相互作用来促进核的疏水性,从而保护核免受水影响。包括卷曲螺旋温度结构域的蛋白质的实例包括二聚体,例如lac阻遏物、TlpA蛋白、KfrA和技术人员可识别的其他蛋白质,以及不参与基因表达调节的其他蛋白质,例如肌球蛋白、原肌球蛋白和其他将被技术人员识别的蛋白质。
结构预测服务器例如COILS[2]、Paircoil2[3]和LOGICOIL[4]和Jpred以及技术人员将理解的其他服务器可以另外用于分析卷曲螺旋结构域。可以使用软件例如DrawCoil1.0[8]产生卷曲螺旋的图形描述。
使用这些程序对从TlpA卷曲螺旋结构域衍生的热化合物的结构分析结果的实例示于图8中,其中卷曲螺旋区域和七肽局部结构通过COILS、Paircoil2和LOGICOIL之间的一致性预测,并且使用DrawCoil 1.0预测包括所得的预测的电荷-电荷相互作用的所得氨基酸空间排列。特别地,在图8的示例性图解中,示出了预测的α螺旋七肽重复(标记为a-b-c-d-e-f-g),其由从N端到C端方向示出的逐渐变细的直线连接。在七肽重复的一部分中,在七肽的最后一个残基和下一个七肽的第一个残基之间示出了一条直虚线。单字母氨基酸符号在七肽中的每个位置带圆圈显示。从N端到C端方向的氨基酸序列示出在七肽的每个位置处,其中七肽重复的一部分中的第一个七肽示出在每个大圆圈的线上,代表α螺旋,并且连续七肽的氨基酸示出在离大圆圈更远的地方。弯曲的虚线表示所预测的离子相互作用。螺旋局部结构是基于Www.ch.embnet.org/cgi-bin/COILS_form_parser网页中的COILS服务器分配的。图像是使用DrawCoil1.0[8]产生的。
根据本公开内容的热化合物单体和相关构型是基于温度感测转录因子TlpA的温度感测结构域的。
在本文中本公开内容的意义上,温度敏感性转录因子”“热转录生物开关”或“转录生物开关”也表示为“转录生物开关”,是具有DNA结合状态或构象和DNA未结合状态或构象的转录因子,在DNA结合状态或构象中,转录因子通过DNA结合结构域与相应的DNA调控序列特异性结合,并且特别地在DNA未结合状态或构象中,转录因子不与相应的DNA调控序列结合。
温度敏感性转录因子包含DNA结合结构域和温度感测结构域。在温度感测转录因子中,通过在生物开关温度Tbs下转录因子的温度感测结构域的结合和解离,在生物开关温度Tbs下,参照相应的DNA调控序列,所述因子可以从DNA结合状态转变为DNA非结合状态。
本公开内容的热化合物是基于如下令人惊讶的发现的:温度感测结构域或温度感测转录因子TlpA在生物开关温度Tbs下以温度受控的方式维持二聚化和解离的能力,即使在不存在相关DNA结合的情况下也是如此。
因此,包含来自TlpA的温度感测区域并且特别是SEQ ID NO:1的温度感测区域的热化合物单体可以在生物开关温度Tbs下以温度受控的方式二聚化和解离,从而形成在生物开关温度Tbs下具有作为生物开关的能力的热化合物二聚体,如技术人员将理解的。
在一些示例性实施方案中,生物开关温度为39℃至42℃的范围,优选40℃。因此,目标环境温度可以为25℃至40℃,优选36℃至38℃,并且优选Te为37℃。
特别地,在本公开内容的热化合物二聚体的温度感测结构域中,第一热化合物单体的卷曲螺旋温度感测区域和第二热化合物单体的卷曲螺旋温度感测区域通过包含以下的相应残基的非共价结合连接:
第一热化合物单体的X111和第二热化合物单体的X112
第一热化合物单体的X162和第二热化合物单体的X161,和
第一热化合物单体的X183和第二热化合物单体的X182以及通过具有非共价键的其他相应残基的非共价结合连接,其可用于诱导第一热化合物单体和第二热化合物单体之间的相互作用。
如本文其他地方所讨论的,这些相应的残基和相关的相互作用可以使用卷曲螺旋七肽局部结构预测软件(例如COILS)和可视化软件(例如DrawCoil 1.0)来预测,并且它们的功能可以通过圆二色光谱术来验证,如图19中所例示的,并且如本领域技术人员在阅读本公开内容之后将理解的(也参见实施例部分)。
在本文中所述的热化合物二聚体的卷曲螺旋温度感测结构域中,两个单体的二聚化或去二聚化表现出协同行为,也称为“协同性”。协同性发生在含有多个结合位点的分子结构中。通常,协同性描述了当这些结构之一的结合位点被激活或失活从而影响同一分子中的其他结合位点时发生的构象或结合能的变化。它也可以描述为对受原始结合位点影响的其他位点的结合的亲和力提高(正协同性)或降低(负协同性)。协同性可以发生在酶、受体、DNA和许多由相同或几乎相同的亚基构成的分子中。正协同性的一个实例可见于氧与血红蛋白结合形成氧合血红蛋白时。另一个实例是DNA的解旋,其中DNA片段首先解旋,然后是另一组相邻核苷酸的解旋过程。类似的过程也适用于其他类型的链分子,例如温度感测结构域的卷曲螺旋中α螺旋的折叠和解折叠。
在本文中所述的一些实施方案中,温度感测结构域的协同性可以通过称为“希尔系数”的单个参数来量化。希尔系数是温度感测结构域去二聚化转变的协同性的度量。高希尔系数伴随着急剧的去二聚化转变,而低希尔系数表明从折叠的二聚体逐渐转变为解折叠的两个单体构象。希尔系数可以从拟合圆二色性(CD)熔融曲线进行数学计算,如下所示:
其中,Tm是热化合物二聚体的温度感测结构域的熔融温度,a是振幅,T是以摄氏度为单位的温度,并且b是希尔系数。
温度感测结合结构域的熔融温度“Tm”是温度感测结合结构域去饱和的温度。伴随有蛋白质变性的大小或结构变化可以使用DLS技术、CD技术和技术人员可识别的其他技术来识别。影响温度感测结构域的Tm的因素包括氨基酸的一级序列和环境条件(例如pH和盐浓度),以及翻译后修饰(例如糖基化),以及与其他分子(蛋白质或DNA)形成复合体,或者可影响蛋白质结构的稳定性并因此影响熔融温度的其他因素,如技术人员将理解的。
如本领域技术人员将理解的,测量作为温度的函数收集的吸收和荧光的变化的CD和其他光谱法测量可以确定蛋白质解折叠和结合相互作用的热力学。例如,测量作为温度的函数的CD可用于确定突变对蛋白质稳定性的影响,以及相互作用的蛋白质和蛋白质-配体复合体的结合常数。
在一些实施方案中,CD熔融曲线可以使用光谱技术记录以用于跟随作为温度函数的温度感测结构域的去二聚化和二聚化,如本领域技术人员将理解的。
在本公开内容的意义上的卷曲螺旋温度感测结构域含有双链α螺旋卷曲螺旋结构,其具有希尔系数高于15的急剧解螺旋转变。在一些实施方案中,卷曲螺旋温度感测结构域的两个单体蛋白还被配置为在目标环境中在热希尔系数为15到40的情况下相互结合以以温度依赖性方式形成二聚体。例如,本文中所述的热化合物二聚体的卷曲螺旋结构域可具有约15至25的希尔系数。
例如,每个单体的卷曲螺旋结构域之间的热化合物二聚化的急剧转变以协同性结合为特征,如希尔系数所指示的。希尔系数可以通过将任何热化合物的圆二色性熔融曲线数据集拟合至热希尔方程来识别,其中Y轴上的信号在0至1之间归一化,并且x轴上的温度以℃为单位。作为代表性的实例,图1d中G1A/G1B热化合物的热希尔系数使用GraphPadPrism软件包中的“以希尔斜率特异性结合(Specific binding with Hill Slope)”曲线拟合函数计算为17.85。可以使用包括圆二色(CD)光谱术的技术和从拟合圆二色性(CD)熔融曲线计算希尔系数来进行具有相似协同二聚体结合的蛋白质的识别,如前所述。
在卷曲螺旋温度感测二聚体中,温度感测结构域的Tm还控制目标环境的温度,在所述温度下温度敏感性单体彼此特异性结合形成二聚体,所述温度在本文中也称为生物开关温度或Tbs),由温度敏感性结合结构域的熔融温度Tm确定。
特别地,在基本上由超螺旋的α螺旋结构组成的温度感测卷曲螺旋相互作用结构域中,螺旋的协同性解折叠导致丧失正确定位在每个蛋白质链的N端处存在的DNA结合结构域的两半的能力。
特别地,在卷曲螺旋温度感测结构域中,温度感测结构域的Tm定义了温度敏感性二聚体的生物开关温度(Tbs),其在本文中也表示为阈值温度,Tbs是目标环境的温度,在所述温度下温度敏感性单体结合以形成二聚体,其中Tbs=Tm+0℃至5℃。特别地,在单体蛋白的净浓度为2至20uM的情况下,在目标环境中Tbs=Tm+0℃至5℃。
在一些实施方案中,本文中所述的卷曲螺旋温度感测结构域的熔融温度Tm可以是Tm=20至80℃。在一些实施方案中,本文中所述的卷曲螺旋温度感测结构域的熔融温度Tm可以是Tm=25至60℃。在一些实施方案中,本文中所述的卷曲螺旋温度感测结构域的熔融温度Tm可以是Tm=30至50℃。在一些实施方案中,本文中所述的卷曲螺旋温度感测结构域的熔融温度Tm可以是Tm=32至46℃。
在一些实施方案中,Tbs可以是Tbs=Tm+2.5至5℃,其中温度敏感性二聚体在目标环境中由每细胞100至1000个拷贝数的多核苷酸编码。在一些实施方案中,Tbs可以是Tbs=Tm+1至3.5℃,其中温度敏感性二聚体在目标环境中由每细胞10至100个拷贝数的多核苷酸编码。在一些实施方案中,Tbs可以是Tbs=Tm+0至1.5℃,其中温度敏感性二聚体在目标环境中由每细胞低于10个拷贝数的多核苷酸编码。
在一些实施方案中,相邻热化合物载物的缔和可以将Tbs提高到高于由独立热开关设置的值。载物1和载物2之间的亲和力可以稳定整个结构,导致Tbs偏移最多10℃,如技术人员将理解的。
因此,技术人员在阅读本公开内容之后将理解本公开内容的热化合物单体不仅涵盖SEQ ID NO:1的多肽,还涵盖其任何衍生物。
与温度敏感性区域有关的本文中使用的术语“衍生物”是指与温度敏感性区域具有相同长度并且包含温度感测区域的至少一个氨基酸残基的中性替换的多肽。
本文中使用的术语“中性替换”表示多肽中的氨基酸替换,其将给定的氨基酸改变为不同的氨基酸,从而导致多肽结构特性的维持。因此,本文中所述的热化合物单体的温度敏感性区域中的一个或更多个中性替换导致多肽具有SEQ ID NO:1的温度感测区域的相同结构特性,如技术人员将理解的。
因此,在具有SEQ ID NO:1的热化合物单体中,温度感测区域的一个或更多个残基的中性替换是不干扰热化合物的结构稳定性(例如它们对彼此的亲和力,和所得二聚体的Tm)的氨基酸替换。如果替换产物的圆二色性谱(与与原始热化物的配偶体相同的配偶体热化合物复合,并且与原始热化合物的浓度相同)可与原始热化合物在其原始配偶体的情况下的圆二色性谱重叠(对于任何给定数据点,在5%误差范围内,当从最小值到最大值进行归一化时,将边界分别设置为0和1),则替换相对于原始热化合物可被定义为“中性的”。另外,在相同条件下,中性替换在222nm处确实显示出熔融曲线,所述曲线可与原始热化合物在其原始配偶体的情况下的圆二色性谱重叠(对于任何给定数据点,在5%误差范围内,当从最小值到最大值进行归一化时,将边界分别设置为0和1)。
鉴于它们以温度依赖性方式缔合和解离的能力,本公开内容的热化合物单体和相关的热化合物二聚体可以用作模块化二聚化热开关,其中卷曲螺旋温度感测二聚体的生物开关温度影响目标环境中的相关热开关特性,其中热化合物从单体状态到异二聚体状态的转换可用于控制载物部分的时空定位,如技术人员在阅读本公开内容之后将理解的。
特别地,在本公开内容的热化合物单体和相关热化合物二聚体用作二聚化热开关的应用中,热化合物二聚体的卷曲螺旋温度感测结构域被配置为使得卷曲螺旋温度感测二聚体在特定的目的温度范围内呈现开或关状态而同时仍保持急剧的热转变,从而导致活性发生很大变化。例如,本公开内容的热化合物二聚体在开启和关闭状态之间可以具有>100倍的差异,并且在小于5℃的温度范围内可以具有10倍的转换。在一些示例性实施方案中,倍数转换低于10倍转换,并且特别地4倍转换,或甚至更低,例如2倍转换。(参见图4f,在约5℃范围内的相关系数从约0.5下降至约0.1),如技术人员将理解的。
在一个优选的实施方案中,第一热化合物单体和第二热化合物单体具有X111=R、X112=E、X161=E、X162=R、X182=E、X183=R,并且所述热化合物单体包含野生型TlpA的序列。
在一些优选的实施方案中,本公开内容的热化合物还基于以下令人惊讶的发现:在形成本文中所述的热化合物二聚体的第一热化合物单体和第二热化合物单体的温度感测区域中,将以下相应残基对中的至少一对改造成由带相反电荷的氨基酸形成的至少一对将产生在目标环境中优选异二聚化的热化合物单体:
第一热化合物单体的X111和第二热化合物单体的X112
第一热化合物单体的X161和第二热化合物单体的X162,和
第一热化合物单体的X182和第二热化合物单体的X183。
在一些优选实施方案中,
-第一热化合物单体的X111和X112具有相同的电荷,并且第二热化合物单体的X111和X112具有与第一热化合物单体的X111和X112的相同电荷相反的电荷;
-第一热化合物单体的X161和X162具有相同的电荷,并且第二热化合物单体的X161和X162具有与第一热化合物单体的X161和X162的相同电荷相反的电荷;以及
-第一热化合物单体的X182和X183具有相同的电荷,并且第二热化合物单体的X182和X183具有与第一热化合物单体的X182和X183的相同电荷相反的电荷。
在本文中所述的热化合物单体和二聚体中使用的示例性带相反电荷的残基包括谷氨酸(E,负)和精氨酸(R,正),以及谷氨酸(E,负)和赖氨酸(K,正)。另外的可能的带相反电荷的残基相互作用可以由天冬氨酸(D,负)和精氨酸(R,正)、天冬氨酸(D,负)和赖氨酸(K,正)以及技术人员可识别的另外组合组成。
因此,在本公开内容的热化合物中,在具有SEQ ID NO:1的热化合物单体中包含上述相应残基,本公开内容的热化合物生物开关是异二聚化的。
当两个不同热化合物对彼此的亲和力超过同一热化合物的两个拷贝对彼此的亲和力时,会形成异二聚体。在热化合物在单独的围场(enclosure)(例如细胞)中产生并且同二聚体相互作用能量超过储存温度下的环境能量的情况下,可以将同二聚体以等摩尔比率混合,加热至高于其Tm并冷却回到其环境储存温度以摆脱其动力学受限制(kineticallytrapped)的构象并缓和至其热力学有利的构象。
异二聚体的形成可以通过在222nm处获得圆二色性谱和熔融曲线来检测,如图19中对于野生型TlpA卷曲螺旋所例示的。含有仅热化合物A或仅热化合物B的溶液无法表明特征性α螺旋CD谱以及热化合物A和热化合物B的等摩尔溶液能够表明特征性α螺旋CD谱使能够检测专性异二聚化。在热希尔系数>15的情况下,圆二色性信号(椭圆率)以S形方式升高接近于零表明了热化合物开关功能的保留。在热化合物A的分离溶液和/或热化合物B的分离溶液表现出特征性α螺旋CD谱的情况下,优先异二聚化可以通过相对于仅热化合物A或仅热化合物B的分离溶液,在热化合物A和热化合物B的等摩尔混合物中,在222nm处的熔融曲线的Tm向更高温度的移动来检测,如图5中对于E180R和R179E变体所例示的。
在一个优选的实施方案中,异二聚体热化合物二聚体包含其中第一热化合物单体是(R179)并且第二热化合物单体是(E180R)的热化合物二聚体,在第一热化合物单体中,X111=E,X112=E,X161=E,X162=R,X182=E,并且X183=R,并且在第二热化合物单体中,X111=R,X112=R,X161=E,X162=R,X182=E,X183=R。
在另一个优选的实施方案中,异二聚体热化合物二聚体包含其中第一热化合物单体是(E229R)并且第二热化合物单体是(R230E)的热化合物二聚体,在第一热化合物单体中,X111=R,X112=E,X161=R,X162=R,X182=E,X183=R,并且在第二热化合物单体中,X111=R,X112=E,X161=E,X162=E,X182=E,X183=R。
在另一个优选的实施方案中,异二聚体热化合物二聚体包含其中第一热化合物单体是(E250R)并且第二热化合物单体是(R251E)的热化合物二聚体,在第一热化合物单体中,X111=R,X112=E,X161=E,X162=R,X182=R,X183=R,并且在第二热化合物单体中,X111=R,X112=E,X161=E,X162=R,X182=E,X183=E。
在另一个优选的实施方案中,异二聚体热化合物二聚体包含其中第一热化合物单体是(E180R,E229R)并且第二热化合物单体是(R179E,R230E)的热化合物二聚体,在第一热化合物单体中,X111=R,X112=R,X161=R,X162=R,X182=E,X183=R,G2A1,并且在第二热化合物单体中,X111=E,X112=E,X161=E,X162=E,X182=E,X183=R,G2B1。
在另一个优选的实施方案中,异二聚体热化合物二聚体包含其中第一热化合物单体是(E180R,R230E)并且第二热化合物单体是(R179E)E229R)的热化合物二聚体,在第一热化合物单体中,X111=R,X112=R,X161=E,X162=E,X182=E,X183=R,G2A2,并且在第二热化合物单体中,X111=E,X112=E,X161=R,X162=R,X182=E,X183=R,G2B2。
在另一个优选的实施方案中,异二聚体热化合物二聚体包含其中第一热化合物单体是(E180R,E250R)并且第二热化合物单体是(R179E,R251E)的热化合物二聚体,在第一热化合物单体中,X111=R,X112=R,X161=E,X162=R,X182=R,X183=R,G2A3,并且在第二热化合物单体中,X111=E,X112=E,X161=E,X162=R,X182=E,X183=E,G2B3。
在另一个优选的实施方案中,异二聚体热化合物二聚体包含其中第一热化合物单体是(E180R,R251E)并且第二热化合物单体是(R179E),E250R)的热化合物二聚体,在第一热化合物单体中,X111=R,X112=R,X161=E,X162=R,X182=E,X183=E,G2A4,并且在第二热化合物单体中,X111=E,X112=E,X161=E,X162=R,X182=R,X183=R,G2B4。
在另一个优选的实施方案中,异二聚体热化合物二聚体包含其中第一热化合物单体是(E229R,E250R)并且第二热化合物单体是(R230E,R251E)的热化合物二聚体,在第一热化合物单体中,X111=R,X112=E,X161=R,X162=R,X182=R,X183=R,G2A5,并且在第二热化合物单体中,X111=R,X112=E,X161=E,X162=E,X182=E,X183=E,G2B5。
在另一个优选的实施方案中,异二聚体热化合物二聚体包含其中第一热化合物单体是(E229R,R251E)并且第二热化合物单体是(R230E,E250R)的热化合物二聚体,在第一热化合物单体中,X111=R,X112=E,X161=R,X162=R,X182=E,X183=E,G2A6,并且在第二热化合物单体中,X111=R,X112=E,X161=E,X162=E,X182=R,X183=R,G2B6。
特别地,在本公开内容的热化合物单体和相关热化合物二聚体用作二聚化热开关的应用中,热化合物单体和二聚体的出乎意料的模块性允许构建其中热化合物单体与载物部分连接的热化合物构建体,并且允许使用本文中所述的热化合物二聚体用作以热调节方式控制以下的热开关:载物部分的时空定位以及包含载物部分的二聚体复合体的形成和解离。
特别地,已出乎意料地发现,如果TlpA温度感测区域通过连接在所述TlpA温度感测区域的N端或C端处的接头多肽与构建体连接,则TlpA单体的温度感测区域也在构建体中保持以温度受控方式二聚化的能力。
本文中使用的术语“接头多肽”表示出现在蛋白结构域之间的短肽序列。根据本公开内容的接头多肽可以具有可以鉴于目标环境和其中将包括本公开内容的热化合物单体的构建体以及实验设计而选择的长度。
本文中使用的术语“连接”或“连接的”是指通过键、链(link)、力或带(tie)连接或联接以将两个或更多个组件保持在一起,其涵盖直接连接或间接连接。例如,“直接连接”是指第一分子与第二分子或材料直接结合,而“间接连接”是指在第一分子与第二分子或材料之间设置有一个或更多个中间分子。因此,两个提及的分子之间的连接包括通过以下来将两个提及的分子连接或联接:通过引入的在两个分子之间的共价键或非共价键,以及通过分子的化学修饰(例如具有马来酰亚胺-半胱氨酸缀合),或者通过两个分子的前体的反应(其将提供彼此连接的两个分子)(例如,通过产生包含编码待连接的两个多肽的多核苷酸的融合基因)。
在本文中所述的热化合物单体中,接头多肽的连接可以出现在热化合物单体的N端、C端处,在本文中所述的一些实施方案中,N端和C端通常独立地为5至12个氨基酸长,如技术人员将理解的。特别地,N端或C端中的一者可以与接头多肽的C端和N端中的一者连接以在目标环境中形成稳定的构建体,如技术人员将理解的。
在在此所述的一些实施方案中,接头多肽允许将本公开内容的热化合物单体与被配置为结合多肽的载物和/或表面连接。在一些实施方案中,接头多肽可以为载物的一部分,如技术人员在阅读本公开内容之后将理解的。
术语“载物”是指被配置为直接或通过本文中所述的接头与多肽连接的直径最大1微米的任何化学部分。如技术人员在阅读本公开内容之后将理解的,示例性载物部分的直径可以为100nm至200nm或低于100nm。因此,本文中使用的术语“载物”表示彼此连接以形成可以与多肽或其任何部分连接的化合物分子物质或材料的任何原子团。
在本公开内容的意义上的载物部分通常具有与其相关的可识别的化学特性或物理特性。特别地,形成根据本公开内容的载物的化学部分可以具有化学特性如化学反应性(例如与硫醇基(-SH)形成S-Au键的金纳米颗粒)以及物理特性如放射性(例如放射性同位素部分)、荧光(例如荧光团部分)、化学发光(例如化学发光染料部分)、光吸收(发色团部分)、催化活性(例如酶活性)、结合活性(例如scFv或Fab)、信号传导活性(例如衔接蛋白结构域,如SH2和SH3)、或其组合(例如抗体、纳米抗体、天然细胞表面受体、嵌合细胞表面受体、及类似物)、或如本申请中所使用的载物部分(包括珠)的斯托克斯曳力。
在一些实施方案中,载物的分子量可以小于500kD。典型的载物和相关分子量包括蛋白质(5kD至100kD)、大蛋白质和蛋白质复合体(100kD至500kD)、小分子(0.05kDa至1.5kDa)、以及肽(1kDa至5kDa)、<100kD的寡核苷酸、以及技术人员可识别的另外的载物。
在本公开内容的意义上的示例性载物部分包括多肽、多核苷酸纳米材料(例如珠)。
在一些实施方案中,载物可以通过共价键如肽键或非共价键与热化合物连接。
在一些实施方案中,载物可以是通过化学修饰(例如具有马来酰亚胺-半胱氨酸缀合)与热开关共价融合的蛋白质、多核苷酸或大分子复合体(例如珠)。
在本文中所述的一些实施方案中,本公开内容的热化合物单体直接或通过接头多肽与合适的载物部分共价连接以提供本文中所述的热化合物单体构建体。
在其中载物包含在热化合物单体构建体中的实施方案中,可以通过以下来帮助选择恰当的接头:基于关于载物的已知结构信息将载物近似为流体动力学半径R的球体,绘制两个球体使其相切地彼此接触,并从载物上的预期连接位点向空间中的相同点(其代表卷曲螺旋上的连接位点)绘制直线。所得线的长度表示接头所需的最小长度,并且可以通过关系1aa=3.5埃转换为氨基酸数。通常,本文中所述的热化合物单体构建体的接头多肽可以短于50个氨基酸并且最常短于30个氨基酸。
在一些实施方案中,热化合物单体构建体中的接头多肽可以是柔性接头多肽,因此可以是使用本领域技术人员已知的软件如Jpred被预测为是非结构化的多肽,或者选自这样的接头序列的所公布列表的多肽。接头可以分类为用于将棕榈酰化结构域与示例性热开关的一条链(本公开内容的G2A3)融合的短的接头(例如代表性实例GGSGGS(sEQ ID NO:3)),或用于将RFP与本公开内容的示例性热开关的另一条链(图4a中的G2B3)融合的长的接头(例如代表性实例GGGGSGGGGSGGGGSGGGGSGGGGS(SEQ ID NO:34))。接头通常由柔性残基如甘氨酸和丝氨酸构成,使得相邻的蛋白质结构域相对于彼此自由移动。特别地,如技术人员在阅读本公开内容之后将理解的,在本公开内容的经改造的微区室蛋白质中,接头通常是2至5个残基与蛋白酶切割位点、靶蛋白和/或标签组合的肽。
示例性接头还包括
GGGGS(SEQ ID NO:4),GSGSG(SEQ ID NO:5),GGGG(SEQ ID NO:6),GGG(SEQ IDNO:7),GG(SEQ ID NO 8),GS(SEQ ID NO:9),GSGS(SEQ ID NO:10),GGGS(SEQ ID NO:11),GGS(SEQ ID NO:12),GTS(SEQ ID NO:13)GGSGGS(SEQ ID NO 14:),GGG(SEQ ID NO:15),GGGGGG(SEQ ID NO:16),
GGGGGGGGG(SEQ ID NO:17),GGGGGGGGGGGG(SEQ ID NO:18),GGGGGGGGGGGGGGG(SEQ ID NO:19),GGS(SEQ ID NO:20),GGSGGS(SEQ ID NO:21),GGSGGSGGS(SEQ ID NO22:),GGSGGSGGSGGS(SEQ ID NO:23),GGSGGSGGSGGSGGS(SEQ ID NO:24),GSG(SEQ ID NO:25),GSGGSG(SEQ ID NO:26),GSGGSGGSG(SEQ ID NO:27),GSGGSGGSGGSG(SEQ ID NO:28),GSGGSGGSGGSGGSG(SEQ ID NO:29),GGGGS(SEQ ID NO:30),GGGGSGGGGS(SEQID NO:31),GGGGSGGGGSGGGGS(SEQ ID NO:32),GGGGSGGGGSGGGGSGGGGS(SEQ ID NO:33),GGGGSGGGGSGGGGSGGGGSGGGGS(SEQ ID NO:34)
和技术人员可识别的另外的多肽接头。
在一些实施方案中,热化合物单体构建体中的接头多肽可以是刚性接头多肽,因此可以包含被预测为组装成刚性序列(最常为α螺旋)的氨基酸。刚性接头的实例包含折叠成α螺旋的基序EAAAK(SEQ ID NO:35)的一个或更多个(通常<10个)重复。
在其中使用接头多肽来提供本公开内容的热化合物单体构建体的一些实施方案中,载物和接头的组合使得卷曲螺旋末端的恰当间距成为可能。可以由任何卷曲螺旋的晶体结构估计卷曲螺旋末端的间距。例如,对于卷曲螺旋原肌球蛋白,N端至N端的距离为6.5埃。可以选择载物的尺寸和接头融合的位置以维持这样的距离。
在另一些示例性实施方案中,例如对于某些其中化学部分由蛋白质形成的载物部分,载物可以与热化合物直接连接,而无需间插接头序列。这可在载物本身包含可用作接头的柔性区域时发生。例如,在全长TlpA蛋白的背景下,在棕榈酰化基序与热化合物的N端融合的情况下,推测通过Jpred被预测为是非结构化的残基SQSTVVTEPVAELPVEV(SEQ ID NO36)在折叠的结构域与热化合物之间包含接头。
因此,在热化合物单体构建体中,载物部分可以与热化合物单体的N末端或C端中的一者连接。在替代方案中,在热化合物单体构建体中,载物部分可以与接头多肽的N末端或C端中的一者连接,并且热化合物单体与接头多肽的N末端和C端中的另一者连接。
本文中所述的热化合物可以与包含转录因子结构域的载物连接。在本公开内容的意义上,与热化合物的一个单体偶联或连接的载物可以包含转录因子或其功能片段的反式激活结构域,而与热化合物的另一单体偶联或连接的载物可以包含转录因子或其功能片段的DNA结合结构域。
本文中所述的热化合物还可以与包含通过增殖途径(例如P13K或AKT途径)介导信号传导的分子的载物(例如胞内信号传导结构域)连接。因此,在一些实施方案中,载物可以是蛋白激酶。
本文中所述的热化合物还可以与包含调节蛋白质易位至细胞膜的分子的载物连接。因此,在一些实施方案中,热化合物可以与膜锚定结构域(例如定位于质膜的分子,如豆蔻酰基、或豆蔻酰化位点、或跨膜结构域)偶联或融合。
本文中所述的热化合物还可以与包含调节蛋白质易位至或远离细胞核的分子的载物连接。因此,在一些实施方案中,热化合物可以与用于核输入的核定位信号传导序列或用于输出的核输出信号传导序列偶联或融合,以形成通过核孔复合体的转运复合体。
本文中所述的热化合物还可以与包含基因编辑系统的载物连接,所述基因编辑系统可以通过修饰靶基因的核酸和/或调节靶基因的表达来调节基因编辑。基因编辑系统通常包含DNA结合结构域和DND修饰结构域。例如,在一些实施方案中,热化合物的两个单体中的一者可以与DNA结合结构域偶联或融合,而另一单体可以与DNA修饰结构域偶联或融合。
本发明的“DNA修饰结构域”是能够引起DNA分子共价结构的改变的分子或分子结构域。在一些方面中,DNA分子共价结构的改变为切割(DNA分子共价骨架的断裂)。两个单体的缔合将导致DNA结合结构域和DNA修饰结构域的缔合,从而实现基因编辑功能。示例性基因编辑系统包括TALEN基因编辑系统、CRISPR/Cas基因编辑系统、锌指核酸酶基因编辑系统、兆核酸酶基因编辑系统、和本领域技术人员可识别的另外的基因编辑系统。
在本公开内容的意义上的示例性载物部分还包括嵌合抗原受体、经改造的GPCR(例如TangGo)、经改造的酶(例如纤维二糖水解酶、纤维素酶、木质酶)、免疫受体(例如Toll样受体)、抗体及其片段、病毒和外排体、以及蛋白质气囊泡(protein Gas vesicle)。
可与本文中所述的热化合物偶联或融合的另外的载物分子可见于通过引用整体并入本文的WO 2016/098078的表5和技术人员可识别的另外的载物部分。
另外的优选载物包括选自以下的载物部分:嵌合抗原受体、Cas9、split Cas9、dCas9、split dCas9、抗CRISPR、Cpfl、split Cpfl、dCpfl、split dCpfl、TALEN和splitTALEN、以及嵌合GPCR(例如TanGo、DREADD)。
在本文中所述的一些实施方案中,可以通过鉴于载物、热化合物单体构建体将在其中进行操作的目标环境和目标温度Tbs选择合适的热化合物单体来提供热化合物单体构建体。任选地通过接头多肽与载物部分连接。
在那些实施方案中,可以提供第一热化合物单体,所述第一热化合物单体被配置为以大于15的热希尔系数在目标环境中在目标温度Tbs下与第二热化合物单体二聚化,以形成本公开内容的熔融温度Tm=Tbs-0℃至5℃的热化合物二聚体。
如技术人员将理解的,在本公开内容的提供热化合物单体构建体的方法中,所述方法包括将载物部分直接或通过接头多肽与热化合物单体连接。
在一些实施方案中,连接可以通过以下进行:经由生成融合蛋白基因的翻译缀合、例如经由(马来酰亚胺、碘乙酰胺、2-硫代吡啶、3-芳基丙腈)与一个或更多个半胱氨酸残基结合的非靶向化学缀合、(NHS、异氰酸酯、异硫氰酸酯或苯甲酰基氟化物)与一个或更多个赖氨酸残基的缀合、(重氮盐、PTAD或曼尼希反应物)与一个或更多个酪氨酸残基的缀合、经由NaIO4的N端丝氨酸或苏氨酸缀合、经由碘乙酰胺的N端半胱氨酸缀合、经由吡哆醛磷酸盐(PLP)的N端缀合、天然化学连接。
在一些实施方案中,连接还可以通过经由点击反应与在任何位置处引入的非经典氨基酸的靶向化学缀合来进行,所述靶向化学缀合被证明是如本文中所述的中性替换的证据。
在一些实施方案中,连接还可以通过[9]中所述的任何其他缀合方法、通过引入用于化学反应的特定序列如FlAsH和ReAsH和/或通过融合生物素化序列以经由BirA进行修饰来进行。
在一些实施方案中,连接还可以通过与抗体或其他二聚/寡聚结构域的翻译融合和/或与SpyTag或SpyCatcher(或相关系统,如SnoopTag-SnoopCatcher和SpyLigase或SnoopLigase)的融合来进行以形成共价键。
在提供的一些实施方案中,连接可以通过提供包含多核苷酸的热化合物基因表达盒来进行,所述多核苷酸在启动子和另外的调节区的控制之下编码本文中所述的热化合物单体,所述启动子和另外的调节区的构型允许在目标环境中表达本公开内容的单体。
如技术人员将理解的,在其中包含接头多肽和/或载物部分的构建体由蛋白质形成或包含蛋白质的那些实施方案中,编码本文中所述的热化合物单体的多核苷酸可以是包含热化合物单体、载物和/或接头多肽的融合基因,其构型允许表达形成热化合物单体构建体的多肽。
本文中使用的术语“基因盒”表示包含至少一个基因和重组位点的移动遗传元件。因此,基因盒可以包含单个基因或可能以操纵子结构组织的多个基因。基因盒可以通过使用限制酶或转座酶、cripr酶、病毒酶和/或重组酶以及其他核酸酶“切割”出片段并将其“粘贴(paste)”回新背景或其他分子生物学技术和克隆技术(例如pcr、CRISPR、TALEN、ZFN)而从一个DNA序列(通常在载体上)转移至另一个。基因盒可以在生物体的基因组内四处移动,或者可以通过水平基因转移被转移到环境中的另一生物体。
“基因表达盒”是包含将由转染的细胞表达的调节序列的基因盒。在转化之后,表达盒指导细胞的机器(cell’s machinery)制造RNA和蛋白质。一些表达盒被设计成用于模块化克隆蛋白质编码序列,使得可以容易地改变相同的盒以制造不同的蛋白质。表达盒由一个或更多个基因和控制其表达的序列构成。表达盒通常包含至少三个组件:启动子序列、开放阅读框和3’非翻译区,其真核生物中通常包含多腺苷酸化位点。表达盒可以由携带并能够表达任选地位于一组或更多组限制性位点之间的一种或更多种目的基因的DNA的可操作片段形成。本文中使用的基因表达盒除启动子之外通常还包含另外的调节序列,以调节一种或更多种基因在开放阅读框(本文中也表示为盒的编码区)内的表达。
本文中所述的术语“调节序列”或“调节区”表示核酸分子的能够在体外或体内提高或降低生物体内基因的转录或翻译的区段。特别地,本文中所述的GV基因的编码区包含在转录和翻译时产生多肽的一个或更多个蛋白质编码区。本文中所述的基因的调节区包含启动子、转录因子结合位点、操纵子、激活子结合位点、阻遏子结合位点、增强子、蛋白质-蛋白质结合结构域、RNA结合结构域、DNA结合结构域、沉默子、绝缘子、以及如本领域技术人员将认识到的可以响应于发育和/或外部刺激而改变基因表达的另外的调节区。
本文中使用的术语“有效连接”表示能够产生适当效果的组合中的元件布置。对于基因和调节序列,有效连接表示基因相对于调节序列的允许调节序列直接或间接地提高或降低基因的转录或翻译的构型。
因此,在一些实施方案中,在具有或不具有间插接头的情况下,热化合物单体构建体可以包含以融合蛋白的形式与其载物连接的热化合物单体。本文中使用的术语“融合蛋白”是指通过最初编码单独的蛋白质的连接的两个或更多个基因或基因片段而表达的蛋白质。连接的两个或更多个基因的翻译产生具有来源于每种原始蛋白质的保留的功能特性的单个融合蛋白。
在其中通过基因表达盒来提供和/或连接本公开内容的热化合物单体的一些实施方案中,所述盒可以包含在含有热化合物基因表达盒的热化合物载体中,所述热化合物基因表达盒包含在启动子和另外的调节区的控制之下编码本文中所述的热化合物单体的多核苷酸,所述启动子和另外的调节区的构型允许在目标环境中表达本公开内容的单体。
术语“载体”表示被配置为用作将外源遗传物质人工携带到细胞中的载剂的分子,在所述细胞中所述外源遗传物质可以被复制和/或表达。表达载体被配置为在适当条件下向细胞中携带物质和在细胞中表达物质。在一些实施方案中,合适的载体可以包括重组质粒、重组非病毒载体或重组病毒载体。本文中所述的载体可以包括本领域技术人员可识别的用于在哺乳动物中表达的合适的启动子、增强子、转录后元件和翻译后元件。适用于哺乳动物细胞转导的载体是本领域技术人员已知的。
用于建立异二聚体性能的载体可以由控制一种或更多种荧光蛋白的表达的一个或更多个TlpA DNA结合结构域-热化合物开放阅读框以及TlpA启动子组成,如图2a所示。用于建立异二聚体性能的另外的载体可以由与载物融合的一种热化合物和缺乏载物的另一种热化合物组成,如图3a所示。另外的载体可以由携带不同载物的两种热化合物组成,如图4a所示。载体还可以包含任选地携带载物的单种热化合物变体。
在一些实施方案中,载体可以选自慢病毒载体、AAV载体、Sleeping Beauty和PiggyBac。
在本文中所述的一些实施方案中,可以将热化合物单体构建体在一定条件下施用于目标环境持续一定时间,以形成热化合物二聚复合体。特别地,在以下那些实施方案中:
-提供本文中所述的第一热化合物单体构建体,所述第一热化合物单体构建体包含本公开内容的与第一接头多肽和/或第一载物部分连接的第一热化合物单体
以及
-提供本文中所述的第二热化合物单体构建体,所述第二热化合物单体构建体包含本公开内容的与第二接头多肽和/或第二载物连接的第二热化合物单体
特别地,可以选择第一热化合物单体和第二热化合物单体,所述第一热化合物单体和第二热化合物单体被配置为以大于15的热希尔系数在目标环境中在目标温度Tbs下二聚化,以形成本公开内容的熔融温度Tm=Tbs-0℃至5℃的热化合物二聚体。
在本公开内容的一些实施方案中,可以根据实验设计来修改目标环境的温度Te。特别地,可以将目标环境的温度Te改变为使Te=Tbs以进行二聚化和/或使Te<Tbs以使复合体在目标环境中解离。降低Te可以使用佩尔捷冷却器(peltier cooler)、冰箱或者将介质与较冷的介质接触来实现。升高Te可以通过微波、暴露于可被环境吸收的其他形式的辐射(包括太阳能、射频和超声波)或者通过将介质与较热的介质接触来实现。
在本公开内容的热化合物二聚复合体中,第一载物部分和第二载物部分中的至少一者由化学部分形成,所述化学部分被配置为与目标环境具有经受最高50pN、优选等于或低于6pN至7pN的斯托克斯曳力的界面。
本文中使用的措辞“斯托克斯曳力”表示以速度v移动通过黏度为μ的流体的半径R的球体上的曳力F,其由下式得出:
Fd=6πμRv[Eq.3]
其中Fd为作用在流体与球形物体之间的界面上的称为斯托克斯拽力的摩擦力;μ为动态黏度;R为球形物体的半径;并且ν为相对于球形物体的流速。
特别地,选择载物以确保当分子移动通过其周围环境时,热化合物的卷曲螺旋结构将不会由于斯托克斯拽力而被拉开。如本领域技术人员将理解的,施加至卷曲螺旋的力可以由其载物的斯托克斯拽力来估计。在一些实施方案中,与一个单体偶联或融合的载物和与另一个单体偶联或融合的载物的组合斯托克斯拽力不能超过最高50pN,优选6pN至7pN。
因此,在一个示例性实施方案中,第一载物部分是产生1000pN的珠,并且第二热化合物构建体不包含第二载物部分。
在另一个示例性实施方案中,第一载物部分是产生1000pN的珠,并且第二载物部分可以是产生1pN的力的小蛋白质,在相反方向上牵拉的最大力为1pN。
因此,在一些实施方案中,不超过一个载物(或N端载物和C端载物的组合)可以引起最高50pN的SDF,优选地引起6pN至7pN或更低的斯托克斯拽力。
在一些实施方案中,目标环境为细胞并且所述细胞包含本文中所述的热化合物单体、热化合物二聚体、热化合物单体构建体和热化合物二聚构建体以及热化合物载体中的至少一者。
在一些实施方案中,通过磁共振成像(magnetic resonance imaging,MRI)在空间上引导激活热化合物二聚体的热能沉积。此外,MRI可以用于监测靶区域的温度并调节能源以达到期望的局部温度(20176年12月19日提交并以公开号US2017/0928425公开的美国申请S/N 15,384,254的图9b,其通过引用整体并入本文)。
在一个示例性实施方案中,荧光蛋白与热化合物的一个多肽共价融合,而质膜定位信号与热化合物的另一条链共价融合,导致荧光指示剂在低温下定位于质膜,并在高温下释放以在细胞中自由扩散。
在另一个示例性实施方案中,热化合物的一条链可以与酶共价融合,而另一条链可以与抑制剂共价融合,导致在温度升高后该酶活化。
在另一个示例性实施方案中,热化合物的一条链可以与任意分子结合结构域(定义为可与生物或非生物大分子如DNA、RNA或蛋白质结合的结构域)融合,而另一条链可以与另一个任意分子结合结构域融合,从而产生温度依赖性桥接系统,该系统在低温下使两个分子紧密靠近,并在高温下将其释放以自由扩散。该实施方案可以用于产生仅当DNA结合结构域的两半紧密靠近时可以与特定DNA序列结合的新的温度敏感性转录反式激活因子或阻遏子。仅当DNA结合结构域的两半紧密靠近时可以与特定DNA序列结合的阻遏子的一个天然存在的实例为TlpA。该实施方案的另一个潜在用途是使完整的DNA结合结构域与热化合物的一条多肽链共价融合,并使反式激活结构域(例如VP16)或阻遏结构域(例如KRAB)与热化合物的另一条链共价融合,本领域技术人员将可以将其确定为具有由热化合物赋予的温度介导的控制的“双杂合体(two hybrid)系统”。
在本文中所述的热化合物二聚体的一个示例性实施方案中,荧光蛋白与异二聚体卷曲螺旋生物开关中的两个生物开关多肽中的一者共价融合。异二聚体中的另一个多肽与使用内源性细胞机器进行酶促棕榈酰化的肽区域共价融合,导致其通过疏水相互作用插入细胞膜中。所得生物开关在低温下将荧光蛋白限制于质膜附近,并在高温下将其释放以扩散到整个细胞中。
在一些实施方案中,卷曲螺旋温度感测二聚体的蛋白质的每个单体可以直接或通过接头序列与另一个蛋白质、蛋白结构域或蛋白基序融合。与蛋白质相关的术语“基序”表示蛋白质序列的可以与功能强烈相关的任何连续部分,无论其是否折叠成限定的三级结构。基序通常是短的(<50个氨基酸)。代表性基序是被内源性哺乳动物细胞机器所识别并与脂质大分子共价融合的GAP43棕榈酰化序列MLCCMRRTKQVEKNDEDQKI。可热开关的蛋白质系统(其包含通过N端或C端与卷曲螺旋生物开关融合的两个或更多个蛋白质、结构域和/或基序)响应于温度进行调节。这种调节通过与生物开关融合的一个或更多个结构域的活性的变化(例如与生物开关融合的酶蛋白或结构域的催化速率的变化)、或者通过与生物开关融合的一个或更多个结构域的胞内定位的变化(例如与生物开关融合的荧光蛋白的表观膜定位的变化)而变得明显。
另外的示例性实施方案包括温度依赖性重构催化活性Cas9、非催化活性Cas9(dCas9)、另外的Cas蛋白的类似变体。另外的潜在实例包括分裂酶(split enzyme)的温度依赖性重构。另外的实例包括通过从酶温度诱导型地释放抑制剂而进行的温度依赖性活化。另外的实例包括分裂信号传导分子如嵌合抗原受体的温度依赖性重构。
在一些实施方案中,在本文中所述的热化合物二聚复合体中,第一载物部分为split CAR(N端的一半),并且第二载物部分为split CAR(C端的一半)。
在一些实施方案中,在本文中所述的热化合物二聚复合体中,第一载物部分为Cas9,并且第二载物部分为抗CRISPR。
在一些实施方案中,在本文中所述的热化合物二聚复合体中,第一载物部分为split Cas9(N端的一半),并且第二载物部分为split Cas9(C端的一半)。
在一些实施方案中,在本文中所述的热化合物二聚复合体中,第一载物部分为Cpfl,并且第二载物部分为抗CRISPR。
在一些实施方案中,在本文中所述的热化合物二聚复合体中,第一载物部分为split Cpfll(N端的一半),并且第二载物部分为split Cpfl(C端的一半)。
在一些实施方案中,在本文中所述的热化合物二聚复合体中,第一载物部分为split dCpfl(N端的一半),并且第二载物部分为split Cpfl(C端的一半)。
在一些实施方案中,在本文中所述的热化合物二聚复合体中,第一载物部分为split TALEN(N端的一半),并且第二载物部分为+split TALEN(C端的一半)。
在一些实施方案中,在本文中所述的热化合物二聚复合体中,第一载物部分为Gal4 DBD,并且第二载物部分为VP16。
在一些实施方案中,在本文中所述的热化合物二聚复合体中,第一载物部分为Gal4 DBD,并且第二载物部分为VP64。
如技术人员将理解的,热化合物单体、热化合物单体构建体和/或热化合物二聚复合体可以与装置的表面连接和/或为装置的一部分。
如技术人员在阅读本公开内容之后将理解的,合适的表面涵盖被配置为结合多肽的任何表面。这样的表面可以用化学手段官能化以促进与生物或和/或有机分子的反应,包括与热化合物或其载物直接缀合,或者通过用于将经官能化的表面与热化合物或其载物化学连接的桥接部分缀合。此外,热化合物可以与表面非共价连接,例如通过将热化合物与链霉亲和素融合并用生物素包被表面。此外,热化合物可以与表面非特异性地连接,例如通过吸附。
本文中结合图20至图22的示意图提供了对根据本公开内容的热化合物表面和热化合物装置的另外的描述。
图20示出了热化合物单体构建体的一个实例。负载(load bearing)构建体2001可以由载物部分2010、热化合物单体2030以及将载物2010与热化合物单体2030连接的接头多肽2020构成。相应的连接构建体2002至少由接头多肽2021以及可在适当的热条件下与负载构建体2001的热化合物单体2030偶联2035(或去偶联)的热化合物单体2031构成。在一些实施方案中,连接构建体2002与表面2040连接,例如通过其接头2021连接。
图21示出了热化合物单体构建体的另一个实例。负载构建体2101可以由载物部分2010、热化合物单体2130以及将载物2110与热化合物单体2130连接的接头多肽2120构成。相应的连接构建体2102由至少一个接头多肽2121以及可在适当的热条件下与负载构建体2101的热化合物单体2130偶联2135(或去偶联)的热化合物单体2131构成。在该实施方案中,连接构建体还包含其自己的载物部分2111。在一些实施方案中,连接构建体2102与表面2140连接,例如通过其接头2121中的一者连接。
图22示出了根据本公开内容的使用热化合物单体构建体的示例性装置。该装置可以是具有至腔室2240的输入2220和输出2230的微流控芯片2210。该装置可以是其中存在将装置的层分开的断裂2250的滑动芯片(SlipChip)装置。腔室2240的放大图2260示出了与腔室2240的表面2270连接的连接构建体2280。负载构建体2290可以装载在腔室2240中并与连接构建体2280预连接以在适当的热条件下释放,或者可以在装置的运行期间与连接构建体2280连接(仅在适当的热条件下连接)。
在一些实施方案中,可以通过修饰温度感测结构域的氨基酸序列来提高或降低本文中所述的卷曲螺旋温度感测二聚体的生物开关温度,以获得可在受控温度下操作的温度敏感性二聚体。
特别地,在受控温度下操作的卷曲螺旋温度感测二聚体可以通过修饰热化合物以使温度响应曲线调节至更高或更低温度以及使曲线从协同性的、开关样诱导变为线性“模拟”转变来产生。
在那些实施方案中的一些中,在本公开内容的意义上,卷曲螺旋温度感测二聚体可以突变和“调整”,以提高或降低其生物开关温度Tbs并在不同的转变温度下激活。特别地,在一些实施方案中,卷曲螺旋温度感测二聚体可以被调整为在新的温度下激活,同时保持敏锐、稳健的开关性能。
特别地,可用本文中所述的方法获得的卷曲螺旋温度感测二聚体的温度感测结构域可以被配置为使得卷曲螺旋温度感测二聚体可被调整以在特定温度范围下表现出开启或关闭状态,同时仍保持导致活性大的变化的敏锐的热转变。例如,可以对热化合物进行修饰,以在开启状态与关闭状态之间获得>100倍的差异,以及在低于5℃的温度范围内获得10倍的转换。
可以对本文中所述的卷曲螺旋温度感测二聚体进行修饰以获得具有为特定应用选择的Tbs生物开关温度(例如在32℃至46℃的生物医学相关范围内的可调阈值)的二聚体。因此,可以提供一种或更多种卷曲螺旋温度感测二聚体,其起始于可以提供用于细胞内的卷曲螺旋温度感测二聚体,所述用于细胞内的卷曲螺旋温度感测二聚体与内源性细胞机器正交并且与其他热响应组分相容并且Tbs与细胞生理温度相容以允许多重热逻辑。
在一些实施方案中,热响应曲线的调整通过调节两条卷曲螺旋链对彼此的亲和力来实现。在那些实施方案中,卷曲螺旋温度感测二聚体的生物开关温度Tbs的修饰可以通过以下进行:提供本文中所述的在目标环境中具有起始生物开关温度Tbs0的卷曲螺旋温度感测二聚体,以及被配置为在目标环境中形成具有起始熔融温度Tm0的卷曲螺旋温度感测二聚体的两个单体蛋白;以及在用于形成的两个单体蛋白中的至少一个单体蛋白中替换所提供的卷曲螺旋温度感测二聚体的温度感测氨基酸序列中的七肽重复的位置a、b、d、e和g处的一个或更多个残基。
特别地,在一些实施方案中,替换可以通过将温度感测结构域的温度敏感性氨基酸序列的七肽重复的位置a和/或d处的疏水氨基酸中的至少一个替换为被配置为提高或降低形成温度感测结构域的两个单体的位置a和/或d处的相应氨基酸残基之间疏水堆积的残基来进行。
本文中使用的术语“疏水堆积”涉及使非极性分子特别是氨基酸聚集在一起,以减少暴露于水的表面积并使其破坏作用最小化。疏水堆积的效率可以通过测量水与非极性溶剂之间的非极性分子的分配系数来量化。分配系数可以转换为包括焓和熵分量的转移自由能:
ΔG=ΔH-TΔS Eq.4
其中G为蛋白质折叠的吉布斯自由能,H为系统的总焓,T为温度,并且S为熵。这些分量可以使用诸如量热学、圆二色性或NMR的技术来实验确定,其中ΔG的增加表示疏水堆积效率的降低。
疏水性是指与水的热力学上不利的相互作用的特性。相反,亲水性是指与水的热力学上有利的相互作用的特性。
因此,疏水效应代表水排斥非极性分子的趋势。该效应源于水分子之间氢键的破坏。疏水分子往往是非极性的,因此更喜欢其他中性分子和非极性溶剂。由于水分子是极性的,因此疏水分子在其中不能很好地溶解。水中的疏水分子通常聚集在一起。
基于对水分子之间氢键破坏水平的测量,例如,如于2016年12月19日提交并作为US 2017/0298425公开的美国申请15/384,254(其通过引用整体并入本文)的图24中所示的Kyte和Doolittle[10]的测量,存在氨基酸残基的不同疏水性等级(或替代地,亲水性指数)。
示例性疏水氨基酸包括丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、色氨酸、半胱氨酸和甲硫氨酸。
疏水性等级或亲水性指数是可用于定义氨基酸残基的相对疏水性或相反地相对极性(亲水性)的值,其中值越正,氨基酸越疏水,相反地值越负,氨基酸越具极性。
测量氨基酸疏水性或极性的技术包括湿实验室方法,例如在两个不混溶相之间分配或反相液相色谱法;或者基于计算机的方法,例如计算溶剂可及表面积。
在一些实施方案中,替换可以通过将温度感测结构域氨基酸序列的至少一个七肽重复的位置b、e和/或g处的至少一个极性或带电荷氨基酸替换为疏水残基来进行。
在一些实施方案中,替换可以通过将温度感测结构域氨基酸序列的至少一个七肽重复的位置e和/或g处的至少一个极性或带电荷氨基酸替换为被配置为提高或降低形成温度感测结构域的两个单体的温度感测结构域氨基酸序列的至少一个七肽重复的位置a、d、e和/或g处的相应残基之间的库仑排斥的残基来进行。
在一些实施方案中,替换可以通过将如上所示的温度感测结构域氨基酸序列的至少一个七肽重复的位置a、b、d、e和/或g处的任一者中的一个或更多个氨基酸残基与另外的残基组合替换来进行。
在本文中所述的修饰卷曲螺旋温度感测二聚体的温度感测结构域的氨基酸序列的方法的一些实施方案中,进行替换以获得温度感测结构域的熔融温度Tmm低于或高于目标环境中的Tm0的卷曲螺旋温度感测二聚体的变体,所获得的变体具有低于或高于目标环境中的Tbs0的生物开关温度Tbsm。
特别地,本公开内容的卷曲螺旋温度感测二聚体的那些实施方案中的一些可以被改造为降低起始卷曲螺旋温度感测二聚体的生物开关温度Tbs,其通过以下进行:
将温度感测结构域氨基酸序列的至少一个七肽重复的位置b处的极性氨基酸替换为疏水氨基酸,
将温度感测结构域氨基酸序列的至少一个七肽重复的位置d处的疏水氨基酸替换为极性氨基酸,
将温度感测结构域氨基酸序列的至少一个七肽重复的位置e处的带电荷氨基酸替换为pKa与原始的差异等于或高于0.5的带电荷氨基酸,或者
将温度感测结构域氨基酸序列的至少一个七肽重复的位置a处的疏水氨基酸、位置d处的疏水氨基酸、位置e处的带电荷氨基酸和位置g处的带电荷氨基酸中的至少一者替换为如下氨基酸残基:所述氨基酸残基使得由两个单体蛋白上的位置a、d、e和g处的相应残基形成的对以库仑力F≥1pN相互作用,其中
其中ke为库仑常数(ke=8.99×109N m2C-2),q1和q2为残基对的每个氨基酸残基上电荷的符号量值(signed magnitude),并且标量r为电荷之间的距离。
因此,通过从正变为负或从负变为正改变两个氨基酸残基之间的库仑力(以pN计)或者增加任一方向上的库仑力的氨基酸替换可以改变多肽或蛋白质的结构、或蛋白质-蛋白质相互作用、以及多肽或蛋白质的相关功能特征。
相对于起始卷曲螺旋温度敏感性二聚体具有较低生物开关温度的本文中所述的卷曲螺旋温度感测二聚体的示例性变体以及本文中所述的可获得的方法包括其中每个单体具有序列
在一些实施方案中,本文中所述的卷曲螺旋温度感测二聚体可以被改造为提高起始卷曲螺旋温度感测二聚体的生物开关温度Tbs,其通过以下进行:
将温度感测氨基酸序列的至少一个七肽重复的位置a处的疏水氨基酸和位置d处的疏水氨基酸中的至少一者替换为极性氨基酸或带电荷氨基酸,和/或
将温度感测氨基酸序列的至少一个七肽重复的位置a处的疏水氨基酸、位置d处的疏水氨基酸、位置e处的带电荷氨基酸和位置g处的带电荷氨基酸中的至少一者替换为如下氨基酸残基:所述氨基酸残基使得由两个单体上的位置a、d、e和g处的相应残基形成的对以根据方程式3计算的库仑力F≤1pN相互作用。
相对于起始卷曲螺旋温度感测二聚体具有较高生物开关温度的本文中所述的卷曲螺旋温度感测二聚体的示例性变体以及本文中所述的可获得的方法包括这样的二聚体:其包含可能具有0%至20%变异的序列SEQ ID NO:1的卷曲螺旋温度感测结构域,并且包括在所述序列中的至少一个七肽重复的位置a、b、d、e和g处的一个或更多个氨基酸残基处的本文中所述替换中提高卷曲螺旋转录生物开关二聚体的生物开关温度Tbs的至少一个替换。
可以对本文中所述的温度感测结构域的所得变体的结构和相关温度敏感性氨基酸序列的结构进行检测以验证变体形成卷曲螺旋二聚化结构域的能力的维持,所述结构可以排列成七肽重复,每个重复具有以a、b、c、d、e、f或g开始的局部结构。因此,以位置a开始的不修饰a至g位置中的任一者的七肽重复不间断系列具有[a,b,c,d,e,f,g]n七肽重复局部结构;以位置b开始的具有[b,c,d,e,f,g,a]n七肽重复局部结构;以位置c开始的具有[c,d,e,f,g,a,b]n七肽重复局部结构;以位置d开始的具有[d,e,f,g,a,b,c]n七肽重复局部结构;以位置e开始的具有[e,f,g,a,b,c,d]n七肽重复局部结构;以位置f开始的具有[f,g,a,b,c,d,e,]n七肽重复局部结构;以及以位置g开始的具有[g,a,b,c,d,e,f]n七肽重复局部结构。
可以使用结构预测服务器COILS[2]、Paircoil2[3]、LOGICOIL[4]以及技术人员可识别的另外的结构预测服务器来进行卷曲螺旋氨基酸序列内的七肽重复的检测。特别地,COILS[2]检测氨基酸序列内所预测的七肽重复,并提供每个氨基酸相对于七肽内位置a、b、c、d、e、f或g的概率评分。
在本文中所述的热化合物变体中,鉴于序列中在0%至20%变异百分数范围内的可能的缺失或插入,七肽重复在局部结构中可以具有多达5个连续氨基酸残基缺失。
本文中使用的术语“变异百分数”或“变异百分比”意指两个氨基酸残基序列之间以百分比表示的差异,其中两个氨基酸序列之间的差异通过包括以下步骤的方法测量:比对两个氨基酸序列,然后检测所比对的序列之间的一个或更多个差异,并计算每个氨基酸序列中差异总数除以所比对的氨基酸总数(包括空位),并且结果以百分比表示。本文中使用的术语“比对”意指比对两个氨基酸序列之间统计学上显著的结构相似性的结构特征的位置,其中“统计学上显著的结构相似性”意指两个结构特征结构同源(例如,α-螺旋)的概率大于95%。术语“差异”表示两个氨基酸序列中的结构特征的位置中的结构特征的位置错配,由此包含错配的结构特征的一部分的每个氨基酸被计为两个所比对的氨基酸序列之间的一个差异。如技术人员将理解的,所比对的序列之间的错配可以包括一个氨基酸序列相比于另一个所比对的氨基酸序列的一个或更多个结构特征的插入、缺失和/或替换。数个公开可用的在线服务器可以用于检测蛋白质结构比对并计算变异百分比,所述服务器例如FATCAT[11]、SuperPose[12]、iPBA[13]、MAPSCI[14]和本领域技术人员已知的另外的服务器。
在一些实施方案中,温度感测氨基酸序列SEQ ID NO:1中的变异可以导致在温度感测氨基酸序列中在0%至20%变异范围内共有2至49个连续的不间断七肽重复。
在一些实施方案中,温度感测氨基酸序列SEQ ID NO:1中的变异可以导致在温度感测氨基酸序列中在0%至20%变异范围内共有10至30个连续的不间断七肽重复。
在一些实施方案中,温度感测氨基酸序列SEQ ID NO:1中的变异可以导致七肽重复被不均匀地分布在整个系统中的一个或更多个插入中断。
在一些实施方案中,可以在卷曲螺旋温度敏感性氨基酸序列中插入最小数目和最大数目的氨基酸残基(其中最小值=1,最大值=氨基酸的最大数目-(七肽重复的最小数目*7)),以向温度敏感性氨基酸序列提供可不均匀分布在整个螺旋中的断裂,以及长的七肽区段和短的七肽点(punctum)。因此,基于TlpA的一致性卷曲螺旋预测,在一些实施方案中卷曲螺旋温度敏感性氨基酸序列中的不间断七肽重复的数目可以为2至30,在一些实施方案中卷曲螺旋温度敏感性氨基酸序列中的不间断七肽重复的数目可以为5至20。
另外的一些实施方案可以包括热化合物细胞,所述热化合物细胞被描述为在生物细胞内包括本文中所述的热化合物单体、热化合物二聚体、热化合物单体构建体、热化合物二聚构建体和热化合物载体中的至少一者。
本文中使用的“生物细胞”或“细胞”表示所有已知生物体的基础结构、功能和生物单位。细胞由包封在膜内的细胞质组成,其包含许多生物分子如蛋白质和核酸并且具有通常为1微米至100微米的尺寸。示例性细胞包括技术人员可识别的真核细胞、原核细胞。
在本公开内容的意义上的示例性细胞包括多个细菌细胞,例如大肠杆菌(E.coli)、沙门氏菌(Salmonella)、拟杆菌属(Bacteroides)、乳杆菌属(Lactobacillus)。细胞可以是天然细胞,或者其可以是经基因修饰的细胞,所述经基因修饰的细胞已被改造以增强疾病归巢、增殖和技术人员可识别的另外的特性。
在本公开内容的意义上的示例性细胞可以包括多种真核细胞。在一些实施方案中,真核细胞是单细胞生物体。示例性单细胞真核生物包括:原虫,例如纤毛虫(ciliate)如草履虫(paramecium)、喇叭虫(Stentor)和钟形虫(Vorticella),变形虫(amoeba)如绒胞菌属(Physarum)和内变形虫(Entamoeba),单细胞藻类(unicellular algae)如裸藻门(euglenophyta)、绿藻(chlorophyte)、硅藻(diatom)、甲藻(dinoflagellate),单细胞真菌如酵母菌(yeast)(如酵母属(Saccharomyces)和念珠菌属(candida)物种)。
在本公开内容的意义上的示例性细胞包括多细胞真核物种中的细胞或分离自多细胞真核物种的细胞。多细胞真核物种包括哺乳动物物种,例如动物、植物和多细胞真菌。在一些实施方案中,多细胞真核生物包括诸如智人(Homo sapiens)和小家鼠(Musmusculus)等的物种。在一些实施方案中,细胞包括干细胞、祖细胞、诱导多能干细胞和技术人员可识别的另外的细胞。在一些实施方案中,细胞包括经基因改造的哺乳动物干细胞,例如,被设计成在引入到宿主(例如人)中之后分泌治疗性物质的经基因改造的干细胞。
示例性细胞还包括植物细胞和动物细胞,例如人细胞、免疫细胞、神经细胞、干细胞、T细胞、神经元细胞和技术人员可识别的另外的细胞。
如上所述,本文中所述的热化合物单体、接头多肽、载物部分、热化合物二聚体、热化合物单体构建体、热化合物二聚复合体、以及相关的多肽、多核苷酸构建体、载体、细胞和组合物可以作为系统的一部分提供以执行任何上述方法。系统可以以套件的形式提供。在套件中,一种或更多种热化合物单体、接头多肽、载物部分、热化合物二聚体、热化合物单体构建体、热化合物二聚复合体、以及相关的多肽、多核苷酸构建体、载体和细胞、以及执行本文中所述的方法的另外的试剂独立地包含在套件中。热化合物单体、接头多肽、载物部分、热化合物二聚体、热化合物单体构建体、热化合物二聚复合体、以及相关的多肽、多核苷酸构建体、载体和细胞、以及另外的试剂可以包含在一种或更多种组合物中,并且每种热化合物单体、接头多肽、载物部分、热化合物二聚体、热化合物单体构建体、热化合物二聚复合体、以及相关的多肽、多核苷酸构建体、载体、细胞和试剂与合适的载剂一起在组合物中。
另外的组分可以包括经标记的多核苷酸、经标记的抗体、标签、微流控芯片、参考标准物和技术人员在阅读本公开内容之后可识别的另外的组分。
本文中使用的术语“标签”和“经标记的分子”是指能够检出的分子,包括但不限于放射性同位素、荧光团、化学发光染料、发色团、酶、酶底物、酶辅因子、酶抑制剂、染料、金属离子、纳米颗粒、金属溶胶、配体(例如生物素、亲和素、链霉亲和素或半抗原)等。术语“荧光团”是指能够在可检测图像中表现出荧光的物质或其部分。因此,本文中使用的措辞“标记信号(labeling signal)”表示从标签发射的允许检测到标签的信号,包括但不限于放射性、荧光、化学发光、酶促反应的结果中化合物的产生等。
在本文中所述的一些实施方案中,可以为套件的组分提供合适的说明和其他必要的试剂,以执行在此公开的方法。套件通常将在独立的容器中包含组合物。套件中通常将包含说明,例如纸质或电子载体(如磁带、CD-ROM、闪存驱动器)上的书面说明或音频说明、或者通过统一资源定位符(Uniform Resource Locator,URL)指示的包含用于进行测定的说明的pdf拷贝的说明。根据所使用的具体方法,套件还可以包含其他包装试剂和材料(即洗涤缓冲液等)。
在下文中,参照实验部分仅通过举例说明的方式根据以下实施例的详细公开内容,关于本公开内容的热生物开关以及相关的热遗传回路、治疗性细胞、系统和方法的更多细节将变得更加明显。
实施例
本文中公开的热生物开关以及相关的系统和方法在以下实施例中进一步举例说明,这些实施例通过举例说明的方式提供并且不旨在限制。
特别地,以下实施例示出了用于制备多核苷酸组和多肽组、测试和表征这些多核苷酸组和多肽组、构建遗传回路、以及体内和体外测试遗传回路的示例性方法和方案。本领域技术人员将理解对根据本公开内容的一些实施方案的另外的可调节热生物开关、遗传回路和治疗性细胞、以及相关的方法和系统所进行的以适应本节中详细描述的特征的适用性和必要性修改。
质粒构建和分子生物学.所有质粒均使用SnapGene(GSL Biotech)设计,并使用来自New England Biolabs的酶通过KLD诱变或Gibson组装进行组装。所有质粒和序列都将存放于Addgene。在组装之后,将构建体转化到NEB Turbo和NEB Stable大肠杆菌(NewEngland Biolabs)中,以用于生长和质粒制备。使用NEB Stable使含有长同源区的构建体,例如包括含有两个TlpA ORF的所有质粒繁殖。在NEB Stable大肠杆菌中进行热基因表达测定。文本中称为GFP和RFP的细菌基因表达报道子分别为mWasabi[15]和mCherry[16]。文本和附图中称为RFP的哺乳动物融合蛋白荧光团为mScarlet-I[17]。TlpA、mCherry和mWasabi从我们先前的工作中获得[18]。mScarlet-I从Addgene(pmScarlet-i_C1,质粒#85044)中获得。使用软件DrawCoil 1.0进行卷曲螺旋结构预测和螺旋轮图注释[8]。在创建如图1e中所述的双表达GFP/RFP热报道子质粒时,在每个pTlpA启动子的上游放置另外的终止子,以抑制先前从该元件观察到的来自弱的上游转录的串扰[18]。使用自制脚本设计nhTlpA,以使密码子同源性最小化,同时保持蛋白质序列同一性。随后,手动改变11个核苷酸,以使阻碍自定制(custom)基因合成的短重复最小化。由Integrated DNA Technologies合成nhTlpA39gBlock。
细菌热调节测定.如先前所述进行温度依赖性基因表达的确定[18]。简而言之,如通过Nanodrop 2000c(Thermo Scientific)所测量的,将饱和的预培养物稀释至OD600=0.1并在30℃下繁殖,直至达到OD600=0.3,此时将25uL等分试样分配到带有透明盖的PCR管(Bio-Rad)中并使用Bio-Rad C1000 Touch热循环仪以热梯度孵育12小时。在热刺激之后,使用Stratagene MX3005p qPCR(Agilent)测量荧光,然后将培养物稀释4x,转移到微孔板(Costar黑色/透明底部)中,并使用Molecular Devices SpectraMax M5读板器测量OD600。如先前所述报告经背景校正的F/OD[18]。
用于CD光谱的蛋白质表达和纯化.将基于pET26b的表达构建体转化到BL21-DE3大肠杆菌中并在卡那霉素选择性板上生长。将1mL饱和的过夜培养物稀释到400mL表达培养物中,并在OD600=0.6下用终浓度为1mM的IPTG(Sigma Aldrich)进行诱导。在25℃下表达24小时之后,通过使用JLA-16.250转子(Beckman Coulter)在6,000rpm和4℃下离心8分钟来收获培养物。使用Tris缓冲液中的洗涤剂Solulyse(Genlantis)裂解沉淀物,并通过以JS-24.38转子(Beckman Coulter)以35,343rcf进行离心使碎片沉淀。在AKTA纯化器(GEHealthcare)上使用1mL完整柱(Roche)将经多组氨酸标记的蛋白质纯化,并将缓冲液更换为1x PBS(Coming)使用Zeba旋转脱盐柱进行纯化。使用Pierce 660nm蛋白质测定(ThermoFisher Scientific)确定浓度,并将蛋白质储存在4℃下直至使用。随后在纯化的24小时内分析蛋白质。
圆二色光谱术.使用Aviv圆二色性分光光度计(型号60DS)在222nm下以0.1分钟的平衡时间和5秒的均化时间(averaging time)获取CD熔融曲线。将经纯化的蛋白质在1xPBS中稀释至3μM,并在1mm石英比色皿中进行测量。
温度依赖性蛋白质荧光测量.将荧光蛋白如上所述纯化并稀释至1μM以用于分析。将25μL样品以N=3个重复放置在带有光学透明盖的PCR条带(Bio Rad)中,放入StratageneMX3005pqPCR(Agilent)中进行强度测量。用于红色、绿色和蓝色蛋白质的滤光器组分别为ROX、FAM和ATTO。随着温度以1℃的增量从25℃上升至50℃,连续测量样品荧光,其中在每个增量下具有1分钟的平衡时间。
异二聚化的基于质量的验证.将双TlpA表达构建体转化为BL21-DE3细胞(NEB),并在Infors Multitron中在以250rpm摇动的情况下在30℃下在2xYT/氨苄青霉素中作为1mL预培养物生长20小时至24小时。将10μL饱和的培养物稀释到4mL 2xYT/氨苄青霉素中并恢复到30℃。在OD600为0.6至0.7下,用4μL 1M IPTG(Sigma Aldrich)诱导培养物并恢复到30℃持续12小时,此时将其转移到2mL离心管(USA Scientific)中并在Beckman Microfuge20中以最大速度沉淀1分钟。用移液管仔细且完全地吸出上清液,将沉淀物称重并在-20℃下冷冻至少20分钟。在解冻之后,以10μL/1mg添加Tris缓冲液中的Solulyse(Genlantis)。通过移液并在室温下在Eppendorf ThermoMixer中摇动(800rpm持续20分钟)来使沉淀物轻轻地重悬。随后将管以13,000rcf旋转10分钟,并将裂解物在Tris缓冲液中的Solulyse中稀释5倍。进行试验性Western印迹,并对每个变体的总TlpA条带强度进行量化,之后通过在Solulyse中稀释将所有变体的负载量相对于野生型的负载量归一化。对于交联,在Eppendorf微量离心管中将1μL 50mM CuCl2(Sigma Aldrich)添加至10μL裂解物。将裂解物和CuCl2溶液分别预热5分钟,然后进行共孵育。随后,将裂解物和交联剂混合物在Eppendorf ThermoMixer中在期望温度下以800rpm摇动10分钟。在进行经CuCl2催化的交联10分钟之后,用11μL Laemmli缓冲液(Bio Rad)淬灭反应。对于未交联的样品,在适当的温度下将10uL Laemmli缓冲液添加至裂解物。使用7.5%预制聚丙烯酰胺凝胶(Bio Rad)进行SDS-PAGE,在75V下运行140分钟。使用Transblot Turbo装置和硝酸纤维素膜试剂盒(BioRad)进行Western印迹。在25V下进行转移,持续7分钟。在室温下用0.05%TBS-吐温中的5%w/v Blotto乳(Santa Cruz Biotechnology)将膜封闭1小时。使用小鼠抗HA sc-7392抗体(Santa Cruz Biotech)在4℃下进行初级染色过夜。然后在4℃下用0.05%TBS-吐温洗涤印迹三次,持续15分钟,并在室温下用山羊抗小鼠IgG-HRP sc-2005(Santa Cruz Biotech)染色4小时。在三次15分钟的洗涤之后,使用Supersignal West Pico PLUS试剂(ThermoFisher Scientific)进行HRP可视化。在Bio-Rad ChemiDoc MP凝胶成像仪中进行成像。
哺乳动物细胞培养.将K562细胞(D.Baltimore的赠物)在具有1x青霉素/链霉素(Coming)的RPMI1640培养基(Thermo Fisher Scientific)中培养。在SF细胞系缓冲液和预编程的K562方案的情况下使用Lonza 4D核转染进行瞬时转染。使用第三代病毒载体和辅助质粒(D.Baltimore的赠物)制备慢病毒。在转染2天之后,将病毒包装到在10em培养皿中生长的HEK293T细胞中,并通过Lenti-X试剂(Takara Bio)进行浓缩。通过将病毒沉淀物重悬于250uL RPMI中并在800xg、30℃下旋转感染(spinfect)具有10μL病毒的1mL RPMI中的1E6K562细胞90分钟来进行感染。在感染之后进行至少五代实验。
活细胞显微术.用400μL 0.1mg/mL聚-D赖氨酸(Sigma Aldrich)将Delta-T培养皿(Bioptechs)包被30分钟。同时,将1E6 K562细胞以300rcf沉淀5分钟并重悬于染色溶液(具有2.5μg/mL Hoechst 33342的1x PBS或HBSS,Thermo Fisher Scientific)中。对于高尔基染色,溶液(HBSS中)还含有与BSA(Thermo Fisher Scientific,50nM终浓度)复合的BODIPYFL C5-神经酰胺。将细胞在室温下染色10分钟,然后沉淀并重悬于1mL RPMI 1640中。对于共定位实验,染色溶液(HBSS中)还含有如产品手册中所述的1x浓度的CellBrite Fix 488,并且在37℃下进行染色持续10分钟。在包被至少20分钟之后,从Delta-T培养皿中吸出PDL,然后将其用1x PBS冲洗一次并干燥。然后将细胞转移到Delta-T培养皿中,在Delta-T培养皿中其将黏附固定至带有SX4750转子的Allegra X-12离心机(Beckman Coulter)的摆动板,并在30℃下以300rcf离心15分钟。在California Institute of Technology共焦显微术设施中使用带有Airyscan的LSM880(Zeiss)进行成像。对具有足够整体亮度以辨别膜对比度的细胞进行成像;调光细胞(dimmer cell)的膜定位可能在我们的热成像配置中无法辨别,但其在常规载玻片上在较高放大倍率下可观察到(图16)。将Delta-T培养皿安装在连接有Bioptechs Delta T4培养皿控制器的热镜台上,并使用1080-378C-Achroplan 40x/0.80W物镜成像。使用默认设置在2D模式下进行Airyscan处理。
图像分析.使用用于预处理的Zeiss Zen Black软件和用于相关量化的CellProfiler[19]进行图像分析。将图像手动裁切为每个ROI仅包含单个细胞,FOV为约408x408像素。对于与板附着不良的细胞,在红色通道、蓝色通道与绿色通道之间产生位置偏移,并且在Zen Black中进行红色通道与绿色通道之间的帧对齐。对所有可用的转化进行采样,并使用基于每个细胞的最佳对齐的转化。在CellProfiler中,基于每个细胞,使用互信息模块、将蓝色通道图像与反向的红色通道图像相关联来对细胞核明显位移的图像进行蓝色通道对齐。然后将导出的图像加载到CellProfiler中,并使用自定义途径进行分析。简而言之,使用经Hoescht 33342染色的细胞核作为主要籽源对象由红色通道确定细胞边界。计算外细胞膜与细胞核之间限定的ROI的共定位。细胞核被排除在外,因为其充当TlpA-RFP的扩散屏障,但不充当游离mScarlet-I的扩散屏障。对于图4图f中的游离mScarlet-I细胞系,使用CellBrite Fix488染色进行的用于细胞边界确定的经修改途径被用于改善细胞边缘的检测。对于图4图f中的直接膜融合数据集,在使用相同细胞系的单独的实验中获取44℃的点,并且其与原始数据集的43℃数据点和45℃数据点一致(图17)。
实施例1:将野生型TlpA重新设计为异二聚体卷曲螺旋物种对(第一代变体)
诱导型二聚化系统的大多数应用要求相互作用的模块为异二聚化的,以强制执行两个期望的分子配偶体之间的选择性结合[20]。为了将野生型TlpA重新设计为异二聚体卷曲螺旋物种对(图1a),申请人使用了由TlpA二聚化结构域结构的生物信息学预测指导的合理诱变。
卷曲螺旋结构域通常由重复性的七氨基酸残基的序列(称为七肽重复)组成[21]。申请人使用公开的TlpA序列注释[7],与来自COILS[2]预测服务器的计算注释交叉引用,以确定TlpA一级序列内的七肽重复的局部结构。然后引入在常规g至e’接触处或替代的g至d’界面处预测的电荷互补残基对[22]以不利于同二聚化而有利于异二聚化(图1,图b至c)。后一种架构当在核心处的大的离子侧链外围地暴露其带电荷端时出现,如针对Fos-Jun卷曲螺旋相互作用所描述的[23]。
为了维持TlpA的高度开关样热解离行为,申请人推断,诱变的最小扰动位置将在野生型蛋白质中的现有界面离子相互作用位点处,其由于平行卷曲螺旋结构的C2对称性而存在。所有这样的位置都一一突变,将阳离子残基替换为谷氨酸,并且将阴离子侧链替换为精氨酸或赖氨酸。在大肠杆菌中表达所得卷曲螺旋结构域,通过亲和色谱法纯化蛋白质,并使用圆二色光谱术在相关热范围内测定其螺旋含量(图5)。
由该初始筛选获得了称为TlpA-G1A(E180R)和TlpA-G1B(R179E)的电荷互补突变体对,其表现出急剧的S形热响应曲线,其中相对于任一物种的纯溶液,等摩尔突变体对混合物的温度阈值显著上移(图1,图d)。
实施例2:TlpA-G1A和TlpA-G1B突变体的细胞内(in cellulo)功能的验证
为了验证TlpA-G1A和TlpA-G1B突变体的细胞内功能,利用TlpA的能力来调节大肠杆菌中荧光报道子基因的表达[18]。
构建了温度诱导型回路,其包含两个单独的TlpA基因拷贝,其中TlpA操纵子位于绿色荧光蛋白(GFP)和红色荧光蛋白(RFP)的上游。为了比较G1A/G1A和G1B/G1B同二聚体的抑制效率与G1A/G1B异二聚体的抑制效率,生成包含两个TlpA-G1A拷贝、两个TlpA-G1B拷贝、或者包含每种TlpA变体的一个拷贝的回路变体(图2,图a至b)。
GFP的热基因表达谱显示出所有三个回路都产生高度开关样协同激活。然而,与包含两种TlpA变体的异二聚体构建体相比,两个同二聚体构建体在其转变温度方面具有明显下移(图2,图c),证实两条卷曲螺旋链之间的稳定化的异型缔合。RFP输出显示出相似的激活曲线(图6)。在载体内交换两个TlpA拷贝的位置未显著影响表达谱,其控制偶然的化学计量效应(图7)。
实施例3:第二代变体的设计及其细胞内功能的验证
虽然实施例1至2中所示的第一代变体证明了改造异二聚化偏好的能力,但注意到G1A/G1A和G1B/G1B回路构建体仍然具有高于37℃的转变设定点,表明这些突变体保留了在典型的哺乳动物稳态条件下同二聚化的能力。
因此,使用热GFP表达测定来评价选自原始图的另外的合理突变体对的子集(图8)。从该子集中选择两对表现最好的替换以与TlpA G1A和TlpA G1B以所有可能的排列组合。这产生被称为TlpA G2-1至TlpA G2-4的第二代卷曲螺旋对,其各自包含G2An和G2Bn单体(表1)。表1列出了本实施例中使用的第二代TlpA突变体。
在细菌生物开关测定中,所有将G2An与其互补体G2Bn组合的异二聚化回路都显示出报道子荧光的开关样激活(图2,图d;图9)。相比之下,包含两个G2An拷贝或两个G2Bn拷贝的同二聚体构建体不能以稳定的方式繁殖,始终显示出TlpA启动子或荧光报道子基因的缺失,即使在30℃下在重组缺陷型大肠杆菌中生长时也是如此。这些结果表明,第二代变体不能在由回路限定的浓度下形成同二聚体相互作用,从而形成来自TlpA启动子的组成型表达和对宿主细胞而言难以承受的代谢负担[24,25]。
实施例4:通过电泳对TlpA异二聚化的验证
为了确定经改造的卷曲螺旋的二聚化偏好,基于共价交联和基于尺寸的凝胶分离设计了生化测定。
TlpA二聚体可以通过蛋白质的单个半胱氨酸残基的经CuCl2催化的氧化进行交联[26]。为了区分异二聚化与同二聚化,将两个TlpA序列中的一者通过去除其DNA结合结构域而截短,从而改变其在聚丙烯酰胺凝胶上的电泳迁移率,而不破坏其二聚化能力(图3,图a)。在两个蛋白质的C端均添加HA标签,以促进通过Western印迹进行的特异性检测。在大肠杆菌中表达所得经截短的TlpA变体和全长TlpA变体的对。为了验证该测定,申请人表达了野生型TlpA螺旋对并在37℃下、或在热升高至45℃之后、或在恢复至37℃之后使其交联。在37℃下交联之后,可见对应于两种类型的同二聚体和一种类型的异二聚体的预期混合物的三个条带,而在较高温度下交联导致可以通过使温度回落至37℃来重新退火的单体占优势(图3,图b)。
将野生型卷曲螺旋替换为第一代异二聚化突变体导致TlpA异二聚体在37℃下优先积累(图3,图c)。包含第二代变体的构建体表现出同二聚体条带强度的更多的降低,其有利于中等分子量的异二聚体,其中TlpA G2-3表现出最强的异二聚体富集(图3,图c;图10)。第一代异二聚体和第二代异二聚体二者在45℃下均显示出可逆解离(图3,图d)。基于这些结果,选择TlpA G2-3对作为“热化合物”构建体以进行另外的实验。
实施例5:哺乳动物细胞中TlpA变体的温度依赖性膜定位的证明在验证了经改造的异二聚体TlpA热化合物的温度依赖性缔合之后,申请人着手证明其如下的能力:在哺乳动物细胞中与另外的蛋白质融合并赋予受控的蛋白质-蛋白质缔合。
设计了其中一条TlpA-G2-3链与GAP43的棕榈酰化序列N端地融合从而将其分隔至质膜的构建体。互补的TlpA-G2-3链在C端处与mScarlet-I融合(图4,图a),所述mScarlet-I是因其在升高的温度下的稳健的荧光而被选择的RFP(图11)。为了使该系统与哺乳动物稳态条件相容,将TlpA-G2-3异二聚化突变与三种先前描述的将卷曲螺旋解离温度降低至约39℃的氨基酸替换[18]相结合。
利用经瞬时转染的K562细胞的活细胞共焦显微术,观察到在生理温度下荧光向质膜(图4,图b;和图12)以及还向高尔基装置(图13)的强定位。使用电阻加热将细胞的温度提高至高于40℃阈值导致膜荧光重新分布到胞质溶胶中。作为非特异性热解离的对照,其中RFP直接棕榈酰化的细胞在此温度范围内未显示出膜荧光的重新分布(图4,图c至d;和图14)。这证实了RFP从膜上的解离由TlpA介导的结合转变驱动,而不是由膜完整性的破坏驱动。
为了能够使用具有病毒基因递送和基因组整合的热化合物系统,申请人生成了TlpA G2A3链的非同源变体(nhTlpA G2A3),其中所有简并密码子被诱变成与其原始序列具有最小同一性的同义三联体。这种诱变有助于在高同源性构建体的病毒递送期间避免模板转换介导的重组[27]。所得开放阅读框与亲本序列具有57.48%序列同一性,并且连续同源核苷酸不超过5个。包含棕榈酰化的nhTlpA G2A3和mScarlet融合的TlpA G2B3的构建体的慢病毒递送导致荧光从质膜稳健地温度诱导地解离(图15),这与瞬时转染的结果类似。
使用这种经病毒改造的K562细胞系来量化RFP荧光强度与来自质膜的信号的共定位,如CellBrite Fix488染色所描绘的(图4,图e)。具有靶向膜的热化合物介导的RFP的细胞在生理温度下表现出与染料的共定位,随后在高于40℃时失去像素相关性(图4,f)。相比之下,具有直接棕榈酰化的RFP的对照细胞在整个测试温度范围内表现出与膜染色的稳健的共定位,而游离细胞质RFP显示出与CellBrite染料没有相关性(图4,图f)。
还使用TlpA报道子细胞系来评价加热之后TlpA介导的膜定位的可逆性。通过在42℃下孵育5分钟释放膜定位。在冷却回37℃之后,TlpA重新分配至质膜,表明可逆性,尽管动力学比针对解离所观察到的慢(图4,图g至h)。
实施例6:示例性热化合物单体和热化合物单体构建体
示例性单体和单体构建体列于下表2中,其中载物部分用灰色阴影表示,接头用带下划线字体表示,并且热化合物单体用斜体字体表示。
表2
表2
表2
表2
表2
表2
表2
表2
表2
表2
表2
表2
表2
表2
表2
另外的单体列于下表3中,其中
表3
表3
表3
表3
表3
表3
表3
表3
表3
表3
根据与图5中所示结果的比较,表3的单体看起来没有表现出热开关行为。
然而,申请人预期这种明显的负面结果是由于特定单体和用于产生图5中所示的圆二色性谱的方案(其需要在单独的细菌(例如细菌培养物)中产生各个单体)的组合所引起的聚集产生的。
如技术人员将理解的,鉴于热化合物中带电荷残基的位置,本方案对SEQ ID NO:1的热化合物而言存在溶解度挑战。
特别地,带电荷的残基在热化合物二聚体的每个热化合物单体中的一系列疏水性的相应残基内,所述残基通过非共价键彼此连接以提供卷曲螺旋温度敏感性结构域的相互连接的四级结构。
因此,如技术人员将理解的,根据具体的实验设置,分开产生热化合物单体随后进行组装可以引起单体聚集。
申请人预期不同的方案(例如在同一细菌中共表达)将克服该问题,并且鉴于表3的单体与表2的单体相关的结构和结果,显示出表3的单体作为异二聚体的功能。
申请人还指出,当通过细胞中表达或无细胞表达提供本公开内容的热化合物单体时,应使用避免单体分开表达的方案来提供本文中所述的热化合物二聚体,以及筛选中性替换和变体,如技术人员将理解的。
实施例7:评价本公开内容的衍生物和变体的性能标准
可以执行以下步骤以评价根据本公开内容的热化合物单体和二聚体的衍生物或变体的结构特性。
首先,测试卷曲螺旋构建体的α螺旋含量。如果构建体包含所预测的异二聚化突变,则制备每条链的等摩尔组合。此外,如果构建体包含所预测的异二聚化突变,并且两种多肽在单独的细胞中表达(由于不存在其他多肽而允许可能的同二聚体形成),则将混合物加热至Tbs+10℃,然后冷却至至少Tbs-10℃以促进链交换和最稳定产物(例如异二聚体产物)的生成。
如果构建体来源于TlpA或其要求保护的变体之一(例如TlpA或包含有限数目的通过定向进化或合理诱变产生的温度变化突变、异二聚化突变或中性突变的变体),则将α螺旋含量解释为二聚化的指示,因为当卷曲螺旋解体时,其无法保持α螺旋二级结构(其转变为无规螺旋)。在比所预测的Tbs低至少10℃的温度下通过圆二色光谱术进行二级结构的评价。208nm+/-3nm和222nm+/-3nm二者处峰的存在(注意:本人在此估计了误差,但3nm看起来是合理的)指示α螺旋二级结构。
图18中示出了圆二色性谱的代表性实例(图像来自DOI:10.1038/nprot.2006.202)。
接下来,在至少Tbs-5℃至Tbs+5℃的温度范围(更大的范围是期望的)下孵育相同的样品。在整个该范围内追踪222nm处的圆二色性,并将所得数据拟合至希尔方程。如果希尔系数>15,则该开关被视为功能性热化合物。以下示出此过程的解释说明(样品=野生型TlpA)。注意,在Tbs之上,222nm处的值接近0,如图19中所示图表中的“扩展”(非结构化)蛋白质的情况那样。
注意,在一些情况下,候选卷曲螺旋将无法采用α螺旋CD光谱。在这样的情况下,不需要进行温度扫描。在另一些情况下,我们观察到候选卷曲螺旋采用α螺旋CD光谱,但具有非开关样(例如低希尔系数)的热转变。任何失败都会使候选物失去成为热化合物的资格。这是我们用来确定热化合物的功能的主要测试。可以如通过如图2a所例示的将热化合物插入到热基因调节载体中并如图2c和图2d所示的测试所得基因表达谱所描述的那样,或者如通过如图3a所例示的将热化合物插入到SDS-PAGE可视化构建体中并如图3c和图3d所示的测试所得条带图案所描述的那样来进行更严格的测试,但该过程是最低限度的,并且应该是必要且充分的。
总之,本文中描述了热化合物单体、热化合物二聚体、热化合物单体构建体、热化合物二聚复合体、以及相关的基因表达盒载体、细胞、表面装置、组合物、方法和系统,其提供了适合于以温度调节方式控制目的载物部分的定位和/或结合的热生物开关。
提供上述实施例以向本领域普通技术人员提供如何制造和使用本公开内容的材料、组合物、系统和方法的实施方案的完整公开内容和描述,并且不旨在限制发明人视作其公开内容的范围。根据权利要求的多个实施方案和范围,本领域技术人员将认识到如何使示例性方法和布置的特征适应另外的遗传回路、相关的节点、分子组分、多核苷酸组、多肽组和/或代谢物组。
说明书中提及的所有专利和出版物表示本公开内容所属领域技术人员的技术水平。
背景技术、发明内容、具体实施方式和实施例中引用的每个文件(包括专利、专利申请、期刊文章、文摘、实验室手册、书籍或其他公开内容)的全部公开内容在此通过引用并入本文。本公开内容中引用的所有参考文献均通过引用并入,其程度如同每篇参考文献单独地通过引用整体并入。然而,如果在引用的参考文献与本公开内容之间出现任何不一致,则以本公开内容为准。
本文中已采用的术语和表述作为描述而非限制的术语使用,并且使用这样的术语和表述不旨在排除所示出和所描述的特征的任何等同形式或其部分,而是应认识到,在所要求保护的公开内容的范围内可进行多种修改。因此,应当理解,尽管已经通过一些实施方案、示例性实施方案和任选的特征具体公开了本公开内容,但是本领域技术人员可以对本文中公开的概念进行修改和变化,并且这样的修改和变化被认为在如由所附权利要求限定的本公开内容的范围内。
还应理解,本文中使用的术语仅出于描述特定实施方案的目的,并不旨在进行限制。除非内容另外明确指出,否则如本说明书和所附权利要求中所使用的没有数量词修饰的名词包括一个/种或更多个/种。除非内容另外明确指出,否则“多个”包括两个或更多个指示物。除非另有定义,否则本文中使用的所有技术和科学术语具有与本公开内容所属领域的普通技术人员通常所理解的相同的含义。
当在本文中使用马库什(Markush)组或其他分组时,该组的所有单独成员以及该组的所有组合和可能的子组合旨在单独地包括在本公开内容中。除非另有说明,否则本文中描述或例示的组分或材料的每种组合都可以用于实施本公开内容。本领域普通技术人员将理解,可以在本公开内容的实践中采用除那些具体例示的方法、装置元件和材料之外的方法、装置元件和材料,而无需借助过度的实验。任何这样的方法、装置元件和材料的所有本领域已知的功能等同物都旨在包括在本公开内容中。无论何时在说明书中给出范围,例如温度范围、频率范围、时间范围或组成范围,包括在给定范围内的所有中间范围和所有子范围以及所有单独的值都旨在包括在本公开内容中。本文中公开的范围或组中的任何一个或更多个单独成员可以从本公开内容的权利要求中排除。本文中举例说明性地描述的公开内容可以在不存在本文中未具体公开的任何一个或更多个要素、一个或更多个限制的情况下适当地实践。
已经描述了本公开内容的多个实施方案。本文中提供的具体实施方案是本发明的有用实施方案的实例,并且对于本领域技术人员将显而易见的是,可以使用本说明书中阐述的装置、装置组件、方法步骤的大量变化形式来实施本公开内容。对于本领域技术人员将显而易见的是,可用于本方法的方法和装置可以包括大量任选的组成以及处理元件和步骤。
特别地,将理解的是,在不脱离本公开内容的精神和范围的情况下,可以做出多种修改。因此,另一些实施方案在所附权利要求书的范围内。
参考文献
1.Greenfield,N.J.,Using circular dichroism collected as a function oftemperature to determine the thermodynamics of protein unfolding and bindinginteractions.Nat Protoc,2006.1(6):p.2527-35.
2.Lupas,A.,M.Van Dyke,and J.Stock,Predicting coiled coils fromprotein sequences.Science,1991.252(5009):p.1162-4.
3.McDonnell,A.V.,et al.,Paircoil2:improved prediction of coiled coilsfrom sequence.Bioinformatics,2006.22(3):p.356-8.
4.Vincent,T.L.,P.J.Green,and D.N.Woolfson,LOGICOIL--multi-stateprediction of coiled-coil oligomeric state.Bioinformatics,2013.29(1):p.69-76.
5.Drozdetskiy,A.,et al.,JPred4:a protein secondary structureprediction server.Nucleic Acids Res,2015.43(W1):p.W389-94.
6.Berman,H.M.,et al.,The protein data bank.Acta CrystallographicaSection D:Biological Crystallography,2002.58(6):p.899-907.
7.Koski,P.,et al.,A new alpha-helical coiled coil protein encoded bythe Salmonella typhimurium virulence plasmid.J Biol Chem,1992.267(17):p.12258-65.
8.Grigoryan,G.and A.E.Keating,Structural specificity in coiled-coilinteractions.Curr Opin Struct Biol,2008.18(4):p.477-83.
9.可获取自:https://en.wikipedia.org/wiki/Bioconjugation
10.Kyte,J.and R.F.Doolittle,A simple methodfor displaying thehydropathic character of a protein.Journal of molecular biology,1982.157(1):p.105-132.
11.Ye,Y.and A.Godzik,Flexible structure alignment by chainingalignedfragment pairs allowing twists.Bioinformatics,2003.19(suppl 2):p.ii246-ii255.
12.Maiti,R.,et al.,SuperPose:a simple server for sophisticatedstructural superposition.Nucleic acids research,2004.32(suppl2):p.W590-W594.
13.Gelly,J.-C.,et al.,iPBA:a tool for protein structure comparisonusing sequence alignment strategies.Nucleic acids research,2011.39(suppl 2):p.W18-W23.
14.llinkin,l.,J.Ye,and R.Janardan,Multiple structure alignment andconsensus identification for proteins.BMC bioinformatics,2010.11(1):p.1.
15.Ai,H.W.,et al.,Hue-shifted monomeric variants of Clavulariacyanfluorescent protein:identification of the molecular determinants of colorand applications influorescence imaging.BMC Biol,2008.6:p.13.
16.Shaner,N.C.,et al.,Improved monomeric red,orange and yellowfluorescent proteins derived from Discosoma sp.redfluorescent protein.NatBiotechnol,2004.22(12):p.1567-72.
17.Mastop,M.,et al.,Characterization of a spectrally diverse set offluorescent proteins as FRET acceptors for mTurquoise2.Sci Rep,2017.7(1):p.11999.
18.Piraner,D.I.,et al.,Tunable thermal bioswitches for in vivocontrol of microbial therapeutics.Nat Chem Biol,2017.13(1):p.75-80.
19.Carpenter,A.E.,et al.,CellProfiler:image analysis software foridentifying and quantifying cell phenotypes.Genome Biol,2006.7(10):p.R100.
20.Stanton,B.Z.,E.J.Chory,and G.R.Crabtree,Chemically inducedproximity in biology and medicine.Science,2018.359(6380).
21.Mason,J.M.and K.M.Arndt,Coiled coil domains:stability,specificity,and biological implications.Chembiochem,2004.5(2):p.170-6.
22.Tripet,B.,et a1.,Engineering a de novo-designed coiled-coilheterodimerization domain off the rapid detection,purification andcharacterization of recombinantly expressed peptides and proteins.ProteinEng,1996.9(11):p.1029-42.
23.Azuma,Y.,et al.,Controlling leucine-zipper partner recognition incells through modification of a-g interactions.Chem Commun(Camb),2014.50(48):p.6364-7.
24.Kawe,M.,U.Horn,and A.Pluckthun,Facile promoter deletion inEscherichia colli in response to leaky expression of very robust and benignproteins from common expression vectors.Microb Cell Fact,2009.8:p.8.
25.Silva,F.,J.A.Queiroz,and F.C.Domingues,Evaluating metabolic stressand plasmid stability in plasmid DNA production by Escherichiacoli.Biotechnol Adv,2012.30(3):p.691-708.
26.Hurme,R.,et al.,Intermediate filament-like network formed in vitroby a bacterial coiled coil protein.J Biol Chem,1994.269(14):p.10675-82.
27.Delviks,K.A.and V.K.Pathak,Effect of Distance between HomologousSequences and 3′Homology on the Frequency of Retroviral Reverse TranscriptaseTemplate Switching.Journal of Virology,1999.73(10):p.7923-7932.
Claims (53)
1.描述了热化合物单体或其任何衍生物,其包含具有以下温度感测序列的温度感测区域:
A1E2E3V4K5A6V7S8A9A10L11S12E13R14I15T16Q17L18A19T20E21L22N23D24K25A26V27R28A29A39E31R32R33V3 4A35E36V37T38R39A40A41G42E43Q44T45A46Q47A48E49R50E51L52A53D54A55A56Q57T58V59D60D61L62E63E64K65L6 6D67E68L69Q70D71R72Y73D74S75L76T77L78A79L80E81S82E83R84S85L86R87Q88Q89H90D91V92E93M94A95Q96L97K9 8E99R100L101A102A103A104E105E106N107T108R109Q110X111X112E113R114Y115Q116E117Q118K119T120V121L122Q12 3D124A125L126N127A128E129Q130A131Q132H132K134N135T136R137E138D139L140Q141K142R143L144E145Q146I147S14 8A149E150A151N152A153R154T155E156E157L158K159S160X161X162D163K164V165N166T167L168L169T170R171L172E17 3S174Q175E176N177A178L179A180S181X182X183Q184Q185H186L187A188T189R190E191T192L194Q194Q195R196L197E19 8Q199A200I201A202D203T204Q205A206R207A208G209E210I211A212L213E214R215D216R217V218S2198220L221T222A22 3R224L225E2268227Q228E229K230A231S232S233E234Q235L236V237R238M239G240S241E242I243A244S245L246T247E24 8R249C250T251Q252L253E254N255Q256R257D258D259A260R261L262E263T264M265G266E267K268E269T270V271A272A27 3L274R275G276E277A278E279A280L281K282R283Q284N285Q286S287L288M289A290A291
其中X111 X112、X161 X162 X182和X183独立地是带负电荷的氨基酸或带正电荷的氨基酸,
所述热化合物单体或其任何衍生物被配置为以温度依赖性方式在目标环境中在低于生物开关温度Tbs的目标环境温度Te下二聚化以形成卷曲螺旋温度感测结构域。
2.权利要求1中任一项所述的热化合物单体,其中所述带负电荷的氨基酸是E和/或D并且所述带正电荷的氨基酸是K和/或R。
3.权利要求1或2中任一项所述的热化合物单体,其中在所述热化合物单体中具有独立地为E或R的X111 X112、X161 X162 X182和X183...。
4.权利要求1至3中任一项所述的热化合物单体,其中在所述热化合物单体中X111=R、X112=E、X161=E、X162=R、X182=E并且X183=R。
5.热化合物二聚体,其由具有第一温度感测区域的根据权利要求1至4中任一项所述的第一热化合物单体和具有第二温度感测区域的根据权利要求1至4中任一项所述的第二热化合物单体形成,
其中,所述第一热化合物单体和所述第二热化合物单体被配置为以大于15的热希尔系数在目标环境中在目标温度Te<Tbs下二聚化,以形成包含所述第一温度感测区域和所述第二温度感测区域并且熔融温度Tm=Tbs-0℃至5℃的卷曲螺旋温度感测结构域。
6.权利要求5所述的热化合物二聚体,其中所述生物开关温度范围为39℃至42度。
7.权利要求5或6所述的热化合物二聚体,其中所述目标环境温度Te范围为25℃至40℃。
8.权利要求5至7中任一项所述的热化合物二聚体,其中所述第一热化合物单体和所述第二热化合物单体具有相同的序列。
9.权利要求8所述的热化合物二聚体,其中所述第一热化合物单体和所述第二热化合物单体具有X111=R、X112=E、X161=E、X162=R、X182=E、X183=R。
10.权利要求5至8中任一项所述的热化合物二聚体,其中在所述第一温度感测区域与所述第二温度感测区域之间形成非共价键的至少一对相应残基选自
所述第一热化合物单体的X111和所述第二热化合物单体的X112,
所述第一热化合物单体的X161和所述第二热化合物单体的X162,和
所述第一热化合物单体的X182和所述第二热化合物单体的X183,其中
-所述第一热化合物单体的X111和X112具有相同的电荷,并且所述第二热化合物单体的X111和X112具有与所述第一热化合物单体的X111和X112的相同电荷相反的电荷;
-所述第一热化合物单体的X161和X162具有相同的电荷,并且所述第二热化合物单体的X161和X162具有与所述第一热化合物单体的X161和X162的相同电荷相反的电荷;以及
-所述第一热化合物单体的X182和X183具有相同的电荷,并且所述第二热化合物单体的X182和X183具有与所述第一热化合物单体的X182和X183的相同电荷相反的电荷。
11.权利要求10所述的热化合物二聚体,其中在所述第一热化合物单体中X111=E、X112=E、X161=E、X162=R、X182=E并且X183=R,并且在所述第二热化合物单体中,X111=R、X112=R、X161=E、X162=R、X182=E并且X183=R。
12.权利要求10所述的热化合物二聚体,其中在所述第一热化合物单体中X111=R、X112=E、X161=R、X162=R、X182=E并且X183=R,并且在所述第二热化合物单体中X111=R、X112=E、X161=E、X162=E、X182=E并且X183=R。
13.权利要求10所述的热化合物二聚体,其中在所述第一热化合物单体中X111=R、X112=E、X161=E、X162=R、X182=R并且X183=R,并且在所述第二热化合物单体中X111=R、X112=E、X161=E、X162=R、X182=E并且X183=E。
14.权利要求10所述的热化合物二聚体,其中在所述第一热化合物单体中X111=R、X112=R、X161=R、X162=R、X182=E并且X183=R,并且在所述第二热化合物单体中X111=E、X112=E、X161=E、X162=E、X182=E并且X183=R。
15.权利要求10所述的热化合物二聚体,其中在所述第一热化合物单体中X111=R、X112=R、X161=E、X162=E、X182=E并且X183=R,并且在所述第二热化合物单体中X111=E、X112=E、X161=R、X162=R、X182=E并且X183=R。
16.权利要求10所述的热化合物二聚体,其中在所述第一热化合物单体中X111=R、X112=R、X161=E、X162=R、X182=R并且X183=R,并且在所述第二热化合物单体中X111=E、X112=E、X161=E、X162=R、X182=E并且X183=E。
17.权利要求10所述的热化合物二聚体,其中在所述第一热化合物单体中X111=R、X112=R、X161=E、X162=R、X182=E并且X183=E,并且在所述第二热化合物单体中X111=E、X112=E、X161=E、X162=R、X182=R并且X183=R。
18.权利要求10所述的热化合物二聚体,其中在所述第一热化合物单体中X111=R、X112=E、X161=R、X162=R、X182=R并且X183=R,并且在所述第二热化合物单体中X111=R、X112=E、X161=E、X162=E、X182=E并且X183=E。
19.权利要求10所述的热化合物二聚体,其中在所述第一热化合物单体中X111=R、X112=E、X161=R、X162=R、X182=E并且X183=E、G2A6,并且在所述第二热化合物单体中X111=R、X112=E、X161=E、X162=E、X182=R并且X183=R。
20.热化合物单体构建体,其包含权利要求1至4中任一项所述的热化合物单体,所述热化合物单体被配置为在目标环境中在目标环境温度Te<Tbs下二聚化以形成卷曲螺旋温度感测结构域,所述卷曲螺旋温度感测结构域的熔融温度为Tm=Tbs-0℃至5℃,
其中,所述热化合物单体具有N末端和C端并且连接至具有N末端和C端的接头多肽和/或连接至由直径最大1微米的化学部分形成的载物部分,并且
其中在所述热化合物单体构建体中,
-通过将所述热化合物单体的N末端或C端中的一者与所述接头多肽的C末端或N端中的一者连接来将所述热化合物单体连接至所述接头多肽,
或者
通过以下将所述热化合物单体连接至所述载物部分:
将所述热化合物单体的N末端或C端中的一者与所述载物部分直接连接,或者
通过将所述热化合物单体的N末端或C端中的一者与所述接头多肽的C末端或N端中的一者连接来将所述热化合物单体的N末端或C端中的一者与所述载物部分间接连接。
21.权利要求20所述的热化合物单体构建体,其中所述多肽接头选自
GGSGGS(SEQ ID NO 14:),GGG(SEQ ID NO:15),GGGGGG(SEQ ID NO:16),GGGGGGGGG(SEQ ID NO:17),GGGGGGGGGGGG(SEQ ID NO:18),GGGGGGGGGGGGGGG(SEQ ID NO:19),GGS(SEQ ID NO:20),GGSGGS(SEQ ID NO:21),GGSGGSGGS(SEQ ID NO22:),GGSGGSGGSGGS(SEQID NO:23),GGSGGSGGSGGSGGS(SEQ ID NO:24),GSG(SEQ ID NO:25),GSGGSG(SEQ ID NO:26),GSGGSGGSG(SEQ ID NO:27),GSGGSGGSGGSG(SEQ ID NO:28),GSGGSGGSGGSGGSG(SEQ IDNO:29),GGGGS(SEQ ID NO:30),GGGGSGGGGS(SEQ ID NO:31),GGGGSGGGGSGGGGS(SEQ IDNO:32),GGGGSGGGGSGGGGSGGGGS(SEQ ID NO:33),和GGGGSGGGGSGGGGSGGGGSGGGGS(SEQ IDNO:34)。
22.权利要求20或21所述的热化合物单体构建体,其中所述载物部分选自多肽、多核苷酸或珠。
23.权利要求20至权利要求22中任一项所述的热化合物单体构建体,其中所述载物部分是多肽。
24.权利要求20至23中任一项所述的热化合物单体构建体,其中所述载物部分选自嵌合抗原受体、Cas9、split Cas9、dCas9、split dCas9、抗CRISPR、Cpf1、split Cpf1、dCpfl、split dCpf1、TALEN和split TALEN,以及嵌合GPCR。
25.热化合物二聚复合体,其包含
-权利要求20至24中任一项所述的第一热化合物单体构建体,其包含连接至第一接头多肽和/或第一载物部分的本公开内容的第一热化合物单体,
和
-权利要求20至24中任一项所述的第二热化合物单体构建体,其包含连接至第二接头多肽和/或第二载物部分的本公开内容的第二热化合物单体,
其中,所述第一热化合物单体和所述第二热化合物单体被配置为以大于15的热希尔系数在目标环境中在目标温度Te<Tbs下二聚化,以形成包含所述第一温度感测区域和所述第二温度感测区域并且熔融温度Tm=Tbs-0℃至5℃的卷曲螺旋温度感测结构域;并且
其中,在包含第一载物部分和/或第二载物部分的所述热化合物二聚复合体中,所述第一载物部分和所述第二载物部分中的至少一者被配置为与所述目标环境具有经受最高50pN斯托克斯曳力的界面。
26.权利要求25所述的热化合物二聚复合体,其中所述第一载物部分是split CAR(N端的一半)并且所述第二载物部分是split CAR(C端的一半)。
27.权利要求25所述的热化合物二聚复合体,其中所述第一载物部分是Cas9并且所述第二载物部分是抗CRISPR。
28.权利要求265所述的热化合物二聚复合体,其中所述第一载物部分是split Cas9(N端的一半)并且所述第二载物部分是split Cas9(C端的一半)。
29.权利要求25所述的热化合物二聚复合体,其中所述第一载物部分是Cpf1并且所述第二载物部分是抗CRISPR。
30.权利要求25所述的热化合物二聚复合体,其中所述第一载物部分是split Cpf1(N端的一半)并且所述第二载物部分是split Cpf1(C端的一半)。
31.权利要求25所述的热化合物二聚复合体,其中所述第一载物部分是split dCpf1(N端的一半)并且所述第二载物部分是split Cpfl(C端的一半)。
32.权利要求25所述的热化合物二聚复合体,其中所述第一载物部分是split TALEN(N端的一半)并且所述第二载物部分是+split TALEN(C端的一半)。
33.权利要求25所述的热化合物二聚复合体,其中所述第一载物部分是Gal4 DBD并且所述第二载物部分是VP16。
34.权利要求25所述的热化合物二聚复合体,其中所述第一载物部分是Gal4 DBD并且所述第二载物部分是VP64。
35.热化合物载体,其包含热化合物基因表达盒,所述基因表达盒包含编码权利要求1至4中任一项所述的热化合物单体或权利要求20至24中任一项所述的热化合物单体构建体的多核苷酸,所述热化合物单体构建体包含所述接头多肽和/或载物部分,其中所述化学部分包含多肽,其中,所述多核苷酸在启动子和另外的调控区的控制之下,所述启动子和另外的调控区的构型允许本公开内容的所述热化合物单体或热化合物单体构建体在目标环境中表达。
36.权利要求35所述的热化合物载体,其中所述载体选自慢病毒载体、AAV载体、Sleeping Beauty和PiggyBac。
37.热化合物细胞,其在生物细胞中包含权利要求1至4中任一项所述的热化合物单体、权利要求5至19中任一项所述的热化合物二聚体、权利要求20至24中任一项所述的热化合物单体构建体、权利要求25至34中任一项所述的热化合物二聚复合体和根据权利要求35或36中任一项所述的热化合物载体中的至少一者。
38.权利要求37所述的热化合物细胞,其中所述生物细胞选自人细胞、免疫细胞、神经细胞、干细胞、T细胞、神经元。
39.描述了热化合物表面,其包含权利要求1至4中任一项所述的热化合物单体、权利要求5至19中任一项所述的热化合物二聚体、权利要求20至24中任一项所述的热化合物单体构建体、权利要求25至34中任一项所述的热化合物二聚复合体和根据权利要求35或36中任一项所述的热化合物载体中的至少一者,连接至被配置为直接或间接连接包含在所述接头多肽和/或所述载物部分中的多肽的表面。
40.提供热化合物单体构建体的方法;所述方法包括
A)提供权利要求1至4中任一项所述的热化合物单体;
B)提供以下中的至少一者
a)具有N端和C端的接头多肽;和
b)由直径最大1微米的化学部分形成的载物部分;
C)将所述热化合物单体
c)通过以下连接至所述接头多肽:
将所述热化合物单体的N末端或C端中的一者与所述接头多肽的C末端或N端中的一者连接
或者
d)通过以下连接至所述载物部分:
i)将所述热化合物单体的N末端或C端中的一者与所述载物部分直接连接,
或者
ii)通过将所述热化合物单体的N末端或C端中的一者与所述接头多肽的C末端或N端中的一者连接来将所述热化合物单体的N末端或C端中的一者与所述载物部分间接连接,
以提供权利要求20至24中任一项所述的热化合物单体构建体。
41.提供热化合物单体构建体的系统,所述系统包含
权利要求1至4中任一项所述的热化合物单体、包含编码其的多核苷酸的热化合物基因表达盒和包含所述热化合物基因表达盒的相应的热化合物载体中的至少一者,
接头多肽或编码其的多核苷酸中的至少一者,以及
载物部分
所述系统用于在权利要求40所述的提供热化合物单体构建体的方法中同时组合地或顺序地使用。
42.权利要求41所述的系统,其中所述载物部分由多肽形成,所述系统还可以包含作为所述载物部分的补充或替代的编码所述载物部分的多核苷酸。
43.提供热化合物二聚复合体的方法,所述方法包括
提供权利要求20至24中任一项所述的第一热化合物单体构建体,其包含连接至第一接头多肽和/或由直径最大1微米的化学部分形成的第一载物部分的本公开内容的第一热化合物单体
以及
提供权利要求20至24中任一项所述的第二热化合物单体构建体,其包含连接至第二接头多肽和/或由直径最大1微米的化学部分形成的第二载物部分的本公开内容的第二热化合物单体
其中,所述第一热化合物单体和所述第二热化合物单体被配置为以大于15的热希尔系数在目标环境中在目标温度Te<Tbs下二聚化,以形成包含所述第一温度感测区域和所述第二温度感测区域并且熔融温度Tm=Tbs-0℃至5℃的卷曲螺旋温度感测结构域;以及
其中所述第一载物部分和所述第二载物部分中的至少一者具有作用在所述目标环境的水性流体与所述载物之间的界面上的最高50pN的斯托克斯曳力;
所述方法还包括
使所述第一热化合物单体构建体与所述第二热化合物单体构建体在目标环境中在目标温度Tbs下接触,以允许所述第一热化合物单体与所述第二热化合物单体发生二聚化,以提供权利要求25至34中任一项所述的热化合物二聚复合体。
44.权利要求43所述的方法,其还包括将所述第一单体构建体和第二单体构建体中至少一者的接头多肽或载物部分的N端或C端连接至被配置为在所述接触之前或之后允许相关结合的表面。
45.提供热化合物二聚复合体的系统,其包含
-权利要求20至24中任一项所述的第一热化合物单体构建体,其包含连接至所述第一接头多肽和/或所述第一载物部分的本公开内容的第一热化合物单体,
和
-权利要求20至24中任一项所述的第二热化合物单体构建体,其包含连接至所述第二接头多肽和/或所述第二载物部分的本公开内容的第二热化合物单体,
所述系统用于在权利要求44所述的方法中同时组合地或顺序地使用。
46.控制第一载物部分和/或第二载物部分在具有目标环境温度Te的目标环境中的定位的方法,所述第一载物部分和任选地所述第二载物部分具有作用在所述目标环境的水性流体与所述载物之间的界面上的最高50pN的斯托克斯曳力;
所述方法包括
向所述目标环境施用权利要求20至24中任一项所述的第一热化合物单体构建体,其包含直接连接至或通过第一接头多肽间接连接至所述第一载物部分的本公开内容的第一热化合物单体,和
向所述目标环境施用权利要求20至24中任一项所述的第二热化合物单体构建体,其包含本公开内容的第二热化合物单体,所述第二热化合物单体
连接至第二接头多肽或
通过所述第二接头多肽连接至所述第二载物部分
以形成热化合物二聚复合体,
其中,所述第一热化合物单体和所述第二热化合物单体被配置为以大于15的热希尔系数在目标环境中在目标温度Te<Tbs下二聚化,以形成包含所述第一温度感测区域和所述第二温度感测区域并且熔融温度Tm=Tbs-0℃至5℃的卷曲螺旋温度感测结构域
所述方法还包括改变温度Te以获得Te<Tbs,进行所述改变以使所述第一热化合物单体与所述第二热化合物单体发生二聚化,从而在所述目标环境中获得所述热化合物二聚体复合体。
47.权利要求46所述的方法,其中所述第二热化合物单体构建体包含连接至所述第二接头多肽的权利要求1至4中任一项所述的第二热化合物单体,并且所述第二接头多肽连接至被配置为结合所述接头多肽的表面。
48.控制第一载物部分和任选地第二载物部分在目标环境中的定位的系统,其包含
-权利要求20至24中任一项所述的第一热化合物单体构建体,其包含直接连接至或通过所述第一接头多肽连接至所述第一载物部分的本公开内容的第一热化合物单体
和
-权利要求20至24中任一项所述的第二热化合物单体构建体,其包含本公开内容的第二热化合物单体,所述第二热化合物单体
连接至所述第二接头多肽
或者
通过所述第二接头多肽连接至所述第二载物部分,
所述系统用于在权利要求46或47所述的控制所述第一载物部分和所述第二载物部分在目标环境中的定位的方法的施用中同时组合地或顺序地使用。
49.改变权利要求5至19中任一项所述的热化合物二聚体的生物开关温度Tbs0的方法,所述热化合物二聚体具有熔融温度Tm0,其中Tbs0=Tm+0℃至5℃,所述热化合物二聚体的每个热化合物单体具有相应的温度感测序列的所排列的残基M1至A91,其排列成七肽重复a、b、c、d、e、f或g的连续不间断系列,其中所述七肽重复中的至少两个肽具有其中没有氨基酸缺失的局部结构,并且最多49个七肽重复具有其中最多5个连续氨基酸残基任选地缺失的局部结构,
所述方法包括
提供权利要求5至19中任一项所述的热化合物二聚体,所述热化合物二聚体在所述目标环境中具有起始生物开关温度Tbs0,并且包含被配置为在所述目标环境中以大于15的热希尔系数在起始熔融温度Tm0下形成二聚体的本公开内容的两个热化合物单体;
在形成所述热化合物二聚体的所述两个热化合物单体中的至少一个热化合物单体中,
将至少一个单体的温度敏感性氨基酸序列中至少一个七肽重复的位置a处的疏水氨基酸和位置d处的疏水氨基酸中的至少一个替换为被配置为提高或降低所述温度感测结构域的单体蛋白中相应七肽重复的位置a和/或d处的相应氨基酸残基之间的疏水堆积的残基,
将至少一个单体的温度敏感性氨基酸序列中至少一个七肽重复的位置b处的极性或带电荷氨基酸、位置e处的极性或带电荷氨基酸和位置g处的极性或带电荷的氨基酸中的至少一个替换为疏水残基,和/或
将至少一个单体的温度敏感性氨基酸序列中至少一个七肽重复的位置e处的极性或带电荷氨基酸和位置g处的极性或带电荷氨基酸中的至少一个替换为被配置为提高或降低所述温度感测结构域的单体蛋白中相应七肽重复的位置a、d、e和/或g处的相应氨基酸残基之间的库伦排斥的残基,
进行所述替换以获得温度感测结构域的熔融温度Tmm低于或高于所述目标环境中的Tm0的卷曲螺旋温度敏感性转录因子的变体,所获得的变体具有低于或高于所述目标环境中的Tbs0的生物开关温度Tbsm。
50.权利要求50所述的方法,其中所述目标环境温度Te选自34至41。
53.热化合物装置,其包含至少一个权利要求39所述的热化合物表面,被配置为允许权利要求40或43所述的方法的执行,并且具有至少一个连接至所述热化合物表面的热化合物单体构建体和/或热化合物二聚构建体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962873482P | 2019-07-12 | 2019-07-12 | |
US62/873,482 | 2019-07-12 | ||
PCT/US2020/041812 WO2021011474A1 (en) | 2019-07-12 | 2020-07-13 | Modular dimerization thermoswitches and related monomers, dimers, constructs, dimeric complexes, vectors, cells, surfaces, devices compositions, methods and systems |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114401996A true CN114401996A (zh) | 2022-04-26 |
Family
ID=74211257
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080064194.5A Pending CN114401996A (zh) | 2019-07-12 | 2020-07-13 | 模块化二聚化热开关和相关单体、二聚体、构建体、二聚复合体、载体、细胞、表面、装置组合物、方法和系统 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11965001B2 (zh) |
EP (1) | EP3997110A4 (zh) |
CN (1) | CN114401996A (zh) |
WO (1) | WO2021011474A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11959127B2 (en) | 2015-12-18 | 2024-04-16 | California Institute Of Technology | Thermal bioswitches and related genetic circuits, vectors, cells, compositions, methods and systems |
US11965001B2 (en) | 2019-07-12 | 2024-04-23 | California Institute Of Technology | Modular dimerization thermoswitches and related monomers, dimers, constructs, dimeric complexes, vectors, cells, surfaces, devices compositions, methods and systems |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070037133A1 (en) * | 2001-12-06 | 2007-02-15 | Brott Lawrence L | Method and apparatus for use of thermally switching proteins in sensing and detecting devices |
US20170298425A1 (en) * | 2015-12-18 | 2017-10-19 | California Institute Of Technology | Thermal bioswitches and related genetic circuits, vectors, cells, compositions, methods and systems |
CN116917483A (zh) * | 2020-12-02 | 2023-10-20 | 新加坡国立大学 | 应用于生物技术的高敏感热阻遏型分裂t7聚合酶(热t7rnap) |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8173792B2 (en) | 2007-02-09 | 2012-05-08 | The Board Of Trustees Of The Leland Stanford Junior University | Method for regulating protein function in cells using synthetic small molecules |
US9284562B2 (en) | 2009-11-30 | 2016-03-15 | Trustees Of Boston University | Biological circuit chemotactic converters |
WO2011073738A1 (en) | 2009-12-14 | 2011-06-23 | Metabolic Explorer | Use of inducible promoters in the production of methionine |
WO2011130540A1 (en) | 2010-04-14 | 2011-10-20 | Duke University | Light stimulated protein interaction molecules and methods of use |
EP2582828B1 (en) | 2010-06-15 | 2015-07-15 | Metabolic Explorer | Use of inducible promoters in the production of glycolic acid |
WO2012088461A2 (en) | 2010-12-23 | 2012-06-28 | Biogen Idec Inc. | Linker peptides and polypeptides comprising same |
AU2013309488A1 (en) | 2012-08-29 | 2015-03-05 | Nature Technology Corporation | DNA plasmids with improved expression |
US9688967B2 (en) | 2014-12-05 | 2017-06-27 | Synlogic, Inc. | Bacteria engineered to treat diseases associated with hyperammonemia |
US20190054117A1 (en) | 2014-12-19 | 2019-02-21 | Novartis Ag | Dimerization switches and uses thereof |
US10041067B2 (en) | 2015-04-27 | 2018-08-07 | California Institute Of Technology | Methods and compositions for rapid assembly of genetic modules |
WO2016201380A1 (en) | 2015-06-10 | 2016-12-15 | Synlogic, Inc. | Bacteria engineered to treat disorders involving the catabolism of a branched chain amino acid |
US10892034B2 (en) | 2016-07-01 | 2021-01-12 | Microsoft Technology Licensing, Llc | Use of homology direct repair to record timing of a molecular event |
WO2021011474A1 (en) | 2019-07-12 | 2021-01-21 | California Institute Of Technology | Modular dimerization thermoswitches and related monomers, dimers, constructs, dimeric complexes, vectors, cells, surfaces, devices compositions, methods and systems |
-
2020
- 2020-07-13 WO PCT/US2020/041812 patent/WO2021011474A1/en unknown
- 2020-07-13 CN CN202080064194.5A patent/CN114401996A/zh active Pending
- 2020-07-13 EP EP20840339.4A patent/EP3997110A4/en active Pending
- 2020-07-13 US US16/927,590 patent/US11965001B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070037133A1 (en) * | 2001-12-06 | 2007-02-15 | Brott Lawrence L | Method and apparatus for use of thermally switching proteins in sensing and detecting devices |
US20170298425A1 (en) * | 2015-12-18 | 2017-10-19 | California Institute Of Technology | Thermal bioswitches and related genetic circuits, vectors, cells, compositions, methods and systems |
CN116917483A (zh) * | 2020-12-02 | 2023-10-20 | 新加坡国立大学 | 应用于生物技术的高敏感热阻遏型分裂t7聚合酶(热t7rnap) |
Non-Patent Citations (7)
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11959127B2 (en) | 2015-12-18 | 2024-04-16 | California Institute Of Technology | Thermal bioswitches and related genetic circuits, vectors, cells, compositions, methods and systems |
US11965001B2 (en) | 2019-07-12 | 2024-04-23 | California Institute Of Technology | Modular dimerization thermoswitches and related monomers, dimers, constructs, dimeric complexes, vectors, cells, surfaces, devices compositions, methods and systems |
Also Published As
Publication number | Publication date |
---|---|
US20210040161A1 (en) | 2021-02-11 |
US11965001B2 (en) | 2024-04-23 |
WO2021011474A1 (en) | 2021-01-21 |
EP3997110A4 (en) | 2023-05-31 |
EP3997110A1 (en) | 2022-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220283171A1 (en) | Methods and systems for producing nanolipoprotein particles | |
Kohler et al. | YidC and Oxa1 form dimeric insertion pores on the translating ribosome | |
JP2008516210A (ja) | 治療、診断およびクロマトグラフィーに使用するためのタンパク質複合体 | |
JP2020180162A (ja) | 可溶性インテイン融合タンパク質、及び生体分子を精製する方法 | |
Fernandez‐Rodriguez et al. | Induced heterodimerization and purification of two target proteins by a synthetic coiled‐coil tag | |
US20150099271A1 (en) | Fluorescent proteins, split fluorescent proteins, and their uses | |
Speltz et al. | Design of protein–peptide interaction modules for assembling supramolecular structures in vivo and in vitro | |
CN114401996A (zh) | 模块化二聚化热开关和相关单体、二聚体、构建体、二聚复合体、载体、细胞、表面、装置组合物、方法和系统 | |
Lyon et al. | Imaging translational and post-translational gene regulatory dynamics in living cells with antibody-based probes | |
Windisch et al. | Structural role of the conserved cysteines in the dimerization of the viral transmembrane oncoprotein E5 | |
Edgell et al. | De novo designed protein-interaction modules for in-cell applications | |
Xie et al. | A split-GFP gateway cloning system for topology analyses of membrane proteins in plants | |
Adlakha et al. | Characterization of MCU-binding proteins MCUR1 and CCDC90B—representatives of a protein family conserved in prokaryotes and eukaryotic organelles | |
Adase et al. | The residue composition of the aromatic anchor of the second transmembrane helix determines the signaling properties of the aspartate/maltose chemoreceptor Tar of Escherichia coli | |
CN106715709A (zh) | 用于调节mTORC1的组合物和方法 | |
Hilditch et al. | Assembling membraneless organelles from de novo designed proteins | |
Alborghetti et al. | Human FEZ1 protein forms a disulfide bond mediated dimer: implications for cargo transport | |
Moghimianavval et al. | Engineering functional membrane–membrane interfaces by InterSpy | |
Hong Lim et al. | Biotin‐assisted folding of streptavidin on the yeast surface | |
Bathe et al. | The complex interplay between the neck and hinge domains in kinesin-1 dimerization and motor activity | |
Thakur et al. | Over-expression and purification strategies for recombinant multi-protein oligomers: A case study of Mycobacterium tuberculosis σ/anti-σ factor protein complexes | |
Mann et al. | Cell labeling and proximity dependent biotinylation with engineered monomeric streptavidin | |
Bookwalter et al. | Essential features of the class V myosin from budding yeast for ASH1 mRNA transport | |
Tariq et al. | Phosphorylation, disorder, and phase separation govern the behavior of Frequency in the fungal circadian clock | |
Sztatelman et al. | Heterodimerizing helices as tools for nanoscale control of the organization of protein-protein and protein-quantum dots |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |