CN115003805A - 工程化的α-1,3分支酶 - Google Patents
工程化的α-1,3分支酶 Download PDFInfo
- Publication number
- CN115003805A CN115003805A CN202080061413.4A CN202080061413A CN115003805A CN 115003805 A CN115003805 A CN 115003805A CN 202080061413 A CN202080061413 A CN 202080061413A CN 115003805 A CN115003805 A CN 115003805A
- Authority
- CN
- China
- Prior art keywords
- amino acid
- residue
- glucosyltransferase
- position corresponding
- ile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000004190 Enzymes Human genes 0.000 title abstract description 51
- 108090000790 Enzymes Proteins 0.000 title abstract description 51
- 108010055629 Glucosyltransferases Proteins 0.000 claims abstract description 225
- 102000000340 Glucosyltransferases Human genes 0.000 claims abstract description 225
- 125000003275 alpha amino acid group Chemical class 0.000 claims abstract description 126
- 238000000034 method Methods 0.000 claims abstract description 85
- 229920002307 Dextran Polymers 0.000 claims abstract description 55
- 230000000694 effects Effects 0.000 claims abstract description 55
- 238000006243 chemical reaction Methods 0.000 claims abstract description 53
- 125000000539 amino acid group Chemical group 0.000 claims description 149
- 150000001413 amino acids Chemical class 0.000 claims description 114
- 238000006467 substitution reaction Methods 0.000 claims description 110
- 229920001503 Glucan Polymers 0.000 claims description 68
- 108091033319 polynucleotide Proteins 0.000 claims description 67
- 102000040430 polynucleotide Human genes 0.000 claims description 67
- 239000002157 polynucleotide Substances 0.000 claims description 67
- 239000000203 mixture Substances 0.000 claims description 53
- 108090000623 proteins and genes Proteins 0.000 claims description 51
- 229930006000 Sucrose Natural products 0.000 claims description 31
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 claims description 31
- 239000005720 sucrose Substances 0.000 claims description 30
- 230000001105 regulatory effect Effects 0.000 claims description 22
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 20
- 102000004169 proteins and genes Human genes 0.000 claims description 19
- 239000002773 nucleotide Substances 0.000 claims description 18
- 125000003729 nucleotide group Chemical group 0.000 claims description 18
- 229920000310 Alpha glucan Polymers 0.000 claims description 13
- 239000000758 substrate Substances 0.000 claims description 13
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 7
- 238000005094 computer simulation Methods 0.000 claims description 6
- 238000000126 in silico method Methods 0.000 claims description 5
- 238000007899 nucleic acid hybridization Methods 0.000 claims description 5
- 238000000734 protein sequencing Methods 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 5
- 238000004088 simulation Methods 0.000 claims description 4
- 235000001014 amino acid Nutrition 0.000 description 146
- 229940024606 amino acid Drugs 0.000 description 87
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 42
- 239000008103 glucose Substances 0.000 description 40
- 239000000370 acceptor Substances 0.000 description 39
- 210000004027 cell Anatomy 0.000 description 30
- 108020004414 DNA Proteins 0.000 description 24
- 239000000047 product Substances 0.000 description 23
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 20
- 150000007523 nucleic acids Chemical class 0.000 description 20
- 229920001542 oligosaccharide Polymers 0.000 description 18
- 108091028043 Nucleic acid sequence Proteins 0.000 description 17
- 229920001282 polysaccharide Polymers 0.000 description 16
- 239000005017 polysaccharide Substances 0.000 description 16
- 235000018102 proteins Nutrition 0.000 description 16
- 108091026890 Coding region Proteins 0.000 description 15
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 15
- 230000014509 gene expression Effects 0.000 description 15
- 235000014633 carbohydrates Nutrition 0.000 description 14
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 14
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 14
- 239000000178 monomer Substances 0.000 description 14
- 150000002482 oligosaccharides Chemical class 0.000 description 14
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 14
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 13
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 13
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 13
- 150000001720 carbohydrates Chemical class 0.000 description 13
- 102000039446 nucleic acids Human genes 0.000 description 13
- 108020004707 nucleic acids Proteins 0.000 description 13
- 108090000765 processed proteins & peptides Proteins 0.000 description 13
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 12
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 12
- 229920001184 polypeptide Polymers 0.000 description 11
- 102000004196 processed proteins & peptides Human genes 0.000 description 11
- -1 saccharide compound Chemical class 0.000 description 11
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 11
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 10
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 10
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 10
- 150000004676 glycans Chemical class 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- 108010076504 Protein Sorting Signals Proteins 0.000 description 9
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 9
- 150000002016 disaccharides Chemical class 0.000 description 9
- 229920000642 polymer Polymers 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 229930091371 Fructose Natural products 0.000 description 8
- 239000005715 Fructose Substances 0.000 description 8
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 8
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 8
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 8
- 238000003752 polymerase chain reaction Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 108010042194 dextransucrase Proteins 0.000 description 7
- 150000002772 monosaccharides Chemical class 0.000 description 7
- 241000588724 Escherichia coli Species 0.000 description 6
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- 108010000954 dextran receptor Proteins 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 229930182817 methionine Natural products 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 229920002498 Beta-glucan Polymers 0.000 description 5
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 5
- 241000192132 Leuconostoc Species 0.000 description 5
- 241001468192 Leuconostoc citreum Species 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 5
- 238000006911 enzymatic reaction Methods 0.000 description 5
- 238000000855 fermentation Methods 0.000 description 5
- 230000004151 fermentation Effects 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000002194 synthesizing effect Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 241000193830 Bacillus <bacterium> Species 0.000 description 4
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 4
- 125000000998 L-alanino group Chemical group [H]N([*])[C@](C([H])([H])[H])([H])C(=O)O[H] 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 4
- 238000005481 NMR spectroscopy Methods 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 238000006116 polymerization reaction Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 3
- 241000192130 Leuconostoc mesenteroides Species 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 229920000856 Amylose Polymers 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- 125000000773 L-serino group Chemical group [H]OC(=O)[C@@]([H])(N([H])*)C([H])([H])O[H] 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- 101000931108 Mus musculus DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 2
- 241000320412 Ogataea angusta Species 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- DLRVVLDZNNYCBX-UHFFFAOYSA-N Polydextrose Polymers OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(O)O1 DLRVVLDZNNYCBX-UHFFFAOYSA-N 0.000 description 2
- 241000589540 Pseudomonas fluorescens Species 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 241000194019 Streptococcus mutans Species 0.000 description 2
- 101100125907 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) ilvC1 gene Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 241000223259 Trichoderma Species 0.000 description 2
- 241000499912 Trichoderma reesei Species 0.000 description 2
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 2
- WQZGKKKJIJFFOK-DVKNGEFBSA-N alpha-D-glucose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-DVKNGEFBSA-N 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 229930182830 galactose Natural products 0.000 description 2
- 238000005227 gel permeation chromatography Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 101150090497 ilvC gene Proteins 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 229920005640 poly alpha-1,3-glucan Polymers 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 238000001542 size-exclusion chromatography Methods 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 238000012916 structural analysis Methods 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- FYGDTMLNYKFZSV-URKRLVJHSA-N (2s,3r,4s,5s,6r)-2-[(2r,4r,5r,6s)-4,5-dihydroxy-2-(hydroxymethyl)-6-[(2r,4r,5r,6s)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1[C@@H](CO)O[C@@H](OC2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-URKRLVJHSA-N 0.000 description 1
- DXALOGXSFLZLLN-WTZPKTTFSA-N (3s,4s,5r)-1,3,4,6-tetrahydroxy-5-[(2r,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyhexan-2-one Chemical compound OCC(=O)[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O DXALOGXSFLZLLN-WTZPKTTFSA-N 0.000 description 1
- 108090000344 1,4-alpha-Glucan Branching Enzyme Proteins 0.000 description 1
- 102000003925 1,4-alpha-Glucan Branching Enzyme Human genes 0.000 description 1
- MSWZFWKMSRAUBD-IVMDWMLBSA-N 2-amino-2-deoxy-D-glucopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O MSWZFWKMSRAUBD-IVMDWMLBSA-N 0.000 description 1
- AKXKFZDCRYJKTF-UHFFFAOYSA-N 3-Hydroxypropionaldehyde Chemical compound OCCC=O AKXKFZDCRYJKTF-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241001513093 Aspergillus awamori Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 241000252867 Cupriavidus metallidurans Species 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- 229920002444 Exopolysaccharide Polymers 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- 125000003290 L-leucino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000192005 Leuconostoc fallax Species 0.000 description 1
- JPFGFRMPGVDDGE-UHFFFAOYSA-N Leucrose Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)(CO)OC1 JPFGFRMPGVDDGE-UHFFFAOYSA-N 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 229920001100 Polydextrose Polymers 0.000 description 1
- 101710184309 Probable sucrose-6-phosphate hydrolase Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 102400000472 Sucrase Human genes 0.000 description 1
- 101710112652 Sucrose-6-phosphate hydrolase Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- MSWZFWKMSRAUBD-UHFFFAOYSA-N beta-D-galactosamine Natural products NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 239000003518 caustics Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000013681 dietary sucrose Nutrition 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229960002442 glucosamine Drugs 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 150000002840 non-reducing disaccharides Chemical class 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 239000001259 polydextrose Substances 0.000 description 1
- 235000013856 polydextrose Nutrition 0.000 description 1
- 229940035035 polydextrose Drugs 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 150000004804 polysaccharides Polymers 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 239000007974 sodium acetate buffer Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 229910001220 stainless steel Inorganic materials 0.000 description 1
- 239000010935 stainless steel Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/04—Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
- C12P19/08—Dextran
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/18—Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本文公开了具有经修饰的氨基酸序列的葡糖基转移酶。此类工程化的酶具有经修饰的α‑1,3‑分支活性。进一步公开了反应和方法,其中工程化的葡糖基转移酶可以用于将一个或多个α‑1,3分支添加至适合的受体,如葡聚糖。
Description
本申请要求美国临时申请号62/871,796(2019年7月9日提交)的权益,所述申请通过引用以其全文并入本文。
技术领域
本公开属于酶催化领域。例如,本公开涉及具有经修饰的氨基酸序列的α-1,3分支酶。此类经修饰的酶可以用于合成例如具有至少一个α-1,3分支的葡聚糖产物。
以电子方式递交的序列表的引用
所述序列表的官方副本经由EFS-Web以ASCII格式的序列表以电子方式提交,文件名为20200702_CL6645PCT_SequenceListing.txt,创建于2020年7月2日,且具有约91千字节的大小,并与本说明书同时提交。包含在此ASCII格式的文件中的序列表是本说明书的一部分并且通过引用以其全文并入本文。
背景技术
已经报道了将α-1,3分支酶促添加到受体分子中。对肠膜状明串珠菌(Leuconostoc mesenteroides)和变异链球菌(Streptococcus mutans)的早期生物化学研究表明α-1,3-分支酶存在并在例如外泌多糖的分支中并起作用(例如,Vote和Robyt,1983,Carb.Res.[碳水化合物研究]119:141-156;Remaud等人,1992,J.Carb.Chem.[碳水化合物化学杂志]11:359-378;Walker,1980,Carb.Res.[碳水化合物研究]82:404-410)。最近,Vuillemin等人(2016,J.Biol.Chem.[生物化学杂志]14:7687-7702)和Remaud-Simeon等人(美国专利申请公开号2016/0136199)直接鉴定了柠檬明串珠菌(Leuconostoc citreum)和谲诈明串珠菌(Leuconostoc fallax)的α-1,3-分支酶及其将α-1,3分支引入右旋糖酐的用途。这些酶被表征为葡糖基转移酶的GH70家族(蔗糖酶)成员,所述葡糖基转移酶的GH70家族包括具有其他活性(如α-1,2-分支或α-葡聚糖聚合反应)的酶(Vuillemin等人,同上)。
虽然已经在理解和使用α-1,3-分支酶方面取得了进展,但似乎很少关注调节这些酶的活性。可以证明此类经调节的酶是用于为特定应用提供具有定义结构的葡聚糖产物的有价值工具。为解决这一技术差距,本文公开了具有改变的α-1,3-分支活性的具有经修饰的氨基酸序列的α-1,3-分支酶。
发明内容
在一个实施例中,本公开涉及包含非天然葡糖基转移酶的组合物,所述非天然葡糖基转移酶在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处包含至少一个氨基酸取代,其中所述非天然葡糖基转移酶能够从受体分子形成至少一个α-1,3分支。
在另一个实施例中,本公开涉及包含编码如本文公开的非天然葡糖基转移酶的核苷酸序列的多核苷酸,任选地其中一个或多个调节序列有效地连接到所述核苷酸序列,并且优选地其中所述一个或多个调节序列包括启动子序列。
在另一个实施例中,本公开涉及反应组合物,所述反应组合物包含水、蔗糖、受体分子,和如本文公开的非天然葡糖基转移酶。
在另一个实施例中,本公开涉及生产包含至少一个α-1,3分支的葡聚糖组合物的方法,所述方法包括:(a)使至少水、蔗糖、葡聚糖底物、和如权利要求1所述的非天然葡糖基转移酶接触,从而产生包含至少一个α-1,3分支的葡聚糖组合物;和(b)任选地,分离在步骤(a)中产生的所述葡聚糖组合物。
在另一个实施例中,本公开涉及制备编码非天然葡糖基转移酶的多核苷酸序列的方法,所述方法包括:(a)鉴定编码亲本葡糖基转移酶的多核苷酸序列,所述亲本葡糖基转移酶(i)包含与SEQ ID NO:3或SEQ ID NO:2的位置477-1322至少约40%同一的氨基酸序列,并且(ii)能够从受体分子形成至少一个α-1,3分支;和(b)修饰步骤(a)中鉴定的多核苷酸序列以在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处取代所述亲本葡糖基转移酶的至少一个氨基酸,从而提供编码非天然葡糖基转移酶的多核苷酸序列,所述非天然葡糖基转移酶从受体分子形成至少一个α-1,3分支。
序列简述
表1.核酸和蛋白质SEQ
ID号的汇总
具体实施方式
所有引用的专利和非专利文献的公开内容通过引用以其全文并入本文。
除非另外公开,否则如本文所使用的术语“一个/一种(a/an)”旨在涵盖一个/一种或多个/多种(即,至少一个/一种)所引用的特征。
如果存在,所有范围是包含性的和可组合的,除非另有说明。例如,当列举“1至5”(即,1-5)的范围时,所列举的范围应当解释为包括范围“1至4”、“1至3”、“1-2”、“1-2和4-5”、“1-3和5”等。
除非另有说明,否则术语“糖类”和其他类似术语在本文中是指单糖和/或二糖/寡糖。本文的“二糖”是指具有通过糖苷键连接的两个单糖的碳水化合物。本文的“寡糖”可指具有例如通过糖苷键连接的3至15个单糖的碳水化合物。寡糖也可以被称为“低聚物”。包含在二糖/寡糖(或任何更大的葡聚糖聚合物)内的单糖(例如,葡萄糖和/或果糖)可以被称为“单体单元”、“单糖单元”、“糖基基团”或其他类似术语。
本文的术语“葡聚糖”、“葡聚糖聚合物”等是指葡萄糖聚合物(即,聚葡萄糖),其中组成葡萄糖单体单元(葡糖基基团)通过糖苷键连接。本文的葡聚糖的实例包括α-葡聚糖(例如,右旋糖酐、具有混合的α-1,3和α-1,6键的葡聚糖、交替糖(alternan)[具有交替的α-1,3和α-1,6键的葡聚糖]、淀粉/直链淀粉、罗伊氏糖(reuteran))和β-葡聚糖(例如,β-1,3-葡聚糖、β-1,6-葡聚糖、纤维素)。本文的“α-葡聚糖”等术语是指包含通过α-糖苷键连接在一起的葡萄糖单体单元的葡聚糖。在典型的实施例中,至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的本文的α-葡聚糖的键是α-糖苷键。本文的“β-葡聚糖”等术语是指包含通过β-糖苷键连接在一起的葡萄糖单体单元的葡聚糖。在典型的实施例中,至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的本文的β-葡聚糖的键是β-糖苷键。
本文的术语“右旋糖酐”、“右旋糖酐聚合物”、“右旋糖酐分子”等是指包含至少50%α-1,6糖苷键的水溶性α-葡聚糖(其余键典型地为α-1,3)。能够从蔗糖合成右旋糖酐的酶可以描述为“右旋糖酐蔗糖酶”(EC 2.4.1.5)。
本文的“基本上直链的”右旋糖酐在任选地经修饰以含有α-1,3分支之前具有5%或更少的分支。“完全直链的”右旋糖酐在任选地经修饰以含有α-1,3分支之前没有分支。右旋糖酐分支如果在经α-1,3分支修饰之前存在,则典型地为短的,长度为一个(侧链)至三个葡萄糖单体,并且占右旋糖酐聚合物所有葡萄糖单体的少于约10%。
本文的术语“键”、“糖苷键(glycosidic linkage)”、“糖苷键(glycosidic bond)”等是指连接糖类化合物(例如,寡糖、多糖)内的糖单体的共价键。本文的糖苷键的实例是α-糖苷键和β-糖苷键。本文的α-糖苷键的实例包括1,6-α-D-糖苷键、1,3-α-D-糖苷键、1,4-α-D-糖苷键、和1,2-α-D-糖苷键,所述α-糖苷键在本文中还分别指α-1,6键、α-1,3键、α-1,4键、和α-1,2键。本文的葡聚糖聚合物的糖苷键(glycosidic linkage)也可以称为“糖苷键(glucosidic linkage)”。本文中,“α-D-葡萄糖”被称为“葡萄糖”。
本文的“α-1,3分支”(和类似术语)包含与葡聚糖α-1,3连接的葡萄糖单元;这种葡聚糖可以任选地在本文中被称为主链。典型地,为了在本文中被视为“分支”,与分支葡萄糖单元连接的主链葡萄糖单元不是非还原端葡萄糖单元(即,本文的分支典型地不是与葡聚糖的非还原端连接的键)。本文中,“α-1,3,6”是指如下分支点,其中分支葡萄糖与主链(例如,右旋糖酐)的α-1,6-连接的葡萄糖单体α-1,3连接。本文中,“α-1,3,4”是指如下分支点,其中分支葡萄糖与主链(例如,淀粉或直链淀粉)的α-1,4-连接的葡萄糖单体α-1,3连接。本文的α-1,3分支典型地包含与主链α-1,3连接的单个(侧链)葡萄糖单元或由其组成。
本文的葡聚糖中的分支百分比是指其中代表分支点的所有糖苷键的百分比。分支百分比可以关于分支的一种类型。例如,葡聚糖中的α-1,3-分支百分比是指其中所有糖苷键(是α-1,3分支点)的百分比。关于分支的一种类型(例如,α-1,3),最多仅可以有50%分支。
能够从受体分子形成至少一个α-1,3分支的葡糖基转移酶(GTF)在本文中还可以称为“α-1,3-分支酶”、“α-1,3-分支葡糖基转移酶”、“α-1,3-分支葡聚糖蔗糖酶”、或其他类似术语。本文的α-1,3-分支酶是具有催化活性的葡糖基转移酶(或其活性片段),其能够将至少一个α-1,3糖苷键作为分支引入葡聚糖(葡聚糖主链)(即,在这样的方面葡聚糖是受体)。在典型的方面,α-1,3-分支酶通过将葡萄糖单元从蔗糖转移至葡聚糖主链来形成α-1,3分支,从而经由糖苷键将葡萄糖连接至葡聚糖主链。果糖(衍生自蔗糖底物)是此反应的副产物。除了能形成α-1,3分支外,据信本文中的α-1,3-分支酶还能将葡萄糖连接至葡聚糖主链的非还原端;然而,这种键不被视为如上定义的分支。本文的α-1,3-分支酶典型地每个分支添加一个葡萄糖单元(即,形成侧链葡萄糖单元作为每个分支)。本文的α-1,3-分支酶分类在糖苷水解酶家族70(GH70)下,并且在结构上是有组织的,如Vuillemin等人(2016,J.Biol.Chem.[生物化学杂志]14:7687-7702)和Remaud-Simeon等人(美国专利申请公开号2016/0136199)所公开的,将二者通过引用并入本文。
本文中的术语“蔗糖”是指由α-1,2-糖苷键连接的α-D-葡萄糖分子和β-D-果糖分子构成的非还原性二糖。通常,蔗糖被称为食用糖。蔗糖可替代地可以称为“α-D-吡喃葡萄糖基-(1→2)-β-D-呋喃果糖苷”。“α-D-吡喃葡萄糖基”和“葡糖基”在本文可互换地使用。
术语“受体”、“受体分子”、“受体化合物”等在本文中可互换地使用。设想本文的适合的受体是包含至少一个羟基部分(-OH)的有机分子,所述羟基部分能够参与经由α-1,3-分支酶的催化活性与葡糖基基团(由蔗糖产生)的1-位置形成糖苷键(涉及羟基部分的氧原子)。本文的适合的受体可以是碳水化合物或非碳水化合物。本文的碳水化合物受体的实例包括二糖、寡糖和多糖;在一些实施例中,碳水化合物受体的所有或部分单体单元可以是葡萄糖单元和/或由α-糖苷键连接(例如,α-葡聚糖)。当本文的受体包含葡萄糖时,受体的葡萄糖单元的3-位置羟基参与与添加的分支葡萄糖单元形成糖苷键。术语“初始受体”可以任选地在本文中用于表征在首先准备α-1,3-分支反应时按原样使用的受体。尚未通过即将准备的分支反应来向初始受体添加任何α-1,3分支。在随后的分支反应过程中,受体典型地反复充当用于随后通过非天然葡糖基转移酶添加葡萄糖(例如,典型地形成新的侧链葡萄糖)的受体。
本文的葡聚糖的键谱图可以使用本领域已知的任何方法确定。例如,可以使用采用核磁共振(NMR)波谱法(例如,13C NMR或1H NMR)的方法确定键谱图。可以使用的这些和其他方法公开于例如,Food Carbohydrates:Chemistry,Physical Properties,and Applications[食品碳水化合物:化学、物理特性和应用](S.W.Cui编,第3章,S.W.Cui,Structural Analysis of Polysaccharides[多糖的结构分析],Taylor&Francis GroupLLC[泰勒弗朗西斯集团有限公司],佛罗里达州波卡拉顿,2005)中,将其通过引用并入本文。
本文的大葡聚糖的“分子量”可以表示为重均分子量(Mw)或数均分子量(Mn),其单位为道尔顿或克/摩尔。可替代地,这种分子量可以表示为DPw(重均聚合度)或DPn(数均聚合度)。较小聚合物(如寡糖)的分子量可以典型地以“DP”(聚合度)提供,DP仅指葡聚糖内包含的葡萄糖的数量;“DP”还可以表征基于单个分子的聚合物的分子量。可以采用各种方法来计算这些各种分子量测量值,如高压液相色谱法(HPLC)、尺寸排阻色谱法(SEC)、或凝胶渗透色谱法(GPC)。
本文的术语“酶促反应”、“葡糖基转移酶反应”、“反应组合物”、“反应配制品”、“分支酶反应”、“分支反应”等通常是指最初包含水、蔗糖、受体分子(例如,葡聚糖)、如目前公开的至少一种非天然葡糖基转移酶、和任选地其他组分的反应。可以进一步存在于本文的酶促反应中的组分包括果糖、葡萄糖、明串珠菌二糖、和可溶性葡寡糖,其中的一种或多种典型地在反应开始后存在。在本文的酶促反应,进行了使水、蔗糖、受体分子、和非天然葡糖基转移酶接触的步骤。如本文所使用的术语“在适合的反应条件下”是指支持通过葡糖基转移酶活性将蔗糖和受体分子转化为产物果糖和α-1,3-分支受体的反应条件。
术语“水性条件”、“水性反应条件”、“水性设置”、“水性体系”等在本文中可互换地使用。本文中的水性条件是指其中溶剂为例如至少约60wt%的水的溶液或混合物。本文的分支反应在水性条件下进行。
本文的“不溶性”、“水性不溶性(aqueous-insoluble)”、“水不溶性(water-insoluble)”(和类似术语)的葡聚糖(例如,DP为8或更高的α-1,3-葡聚糖)不溶于(或不明显地溶于)水或其他水性条件中,任选地其中所述水性条件进一步表征为具有4-9的pH(例如,pH 6-8)(即非苛性)和/或约1℃至85℃(例如,20℃-25℃)的温度。相反,本文的“可溶性”、“水性可溶性”、“水可溶性”等的葡聚糖(例如,具有小于8的DP的右旋糖酐、α-1,3-葡聚糖)在这些条件下明显地溶解。
术语“按体积计百分比(percent by volume)”、“体积百分比(volume percent)”、“体积%(vol%)”、“体积/体积%(v/v%)”等在本文中可互换地使用。溶质在溶液中的按体积计百分比可以使用以下公式确定:[(溶质体积)/(溶液体积)]x 100%。
术语“按重量计百分比(percent by weight)”、“重量百分比(weightpercentage,wt%)”、“重量-重量百分比(weight-weight percentage,%w/w)”等在本文中可互换地使用。按重量计百分比是指当材料包含在组合物、混合物、或溶液中时,所述材料在质量基础上的百分比。
术语“重量/体积百分比”、“w/v%”等在本文中可互换地使用。重量/体积百分比可以计算为:((材料的质量[g])/(材料加将材料置于其中的液体的总体积[mL]))x 100%。材料可以不溶于液体(即,是液相中的固相,如在分散体的情况下),或可溶于液体(即,是溶于液体中的溶质)。
术语“多核苷酸”、“多核苷酸序列”、“核酸分子”等在本文中可互换地使用。这些术语涵盖核苷酸序列等。多核苷酸可以是单链或双链的DNA或RNA的聚合物,其任选地含有合成的、非天然的或改变的核苷酸碱基。多核苷酸可以由cDNA、基因组DNA、合成DNA或其混合物的一个或多个区段构成。
如本文所使用的,术语“基因”是指从编码区表达RNA(RNA转录自DNA多核苷酸序列)的DNA多核苷酸序列,所述RNA可以是信使RNA(编码蛋白质)或非蛋白质编码RNA。基因可以是指单独的编码区,或者可以包括编码区上游和/或下游的调节序列(例如启动子、5’-非翻译区、3’-转录终止子区)。可替代地,编码蛋白质的编码区在本文中可以被称为“可读框”(ORF)。“天然”或“内源”的基因是指自然界中发现的具有其自身调节序列的基因;这种基因位于宿主细胞的基因组中的其天然位置。“嵌合”基因是指不是天然基因的任何基因,所述基因包括在自然界中未一起发现的调节序列和编码序列(即,调节区和编码区彼此是异源的)。因此,嵌合基因可以包含衍生自不同来源的调节序列和编码序列,或者包含衍生自同一来源但以不同于天然存在的方式排列的调节序列和编码序列。“外来”或“异源”的基因可能是指通过基因转移引入宿主生物体的基因。外来/异源基因可以包含插入非天然生物体内的天然基因、引入天然宿主内的新位置的天然基因、或嵌合基因。在某些实施例中,本文公开的多核苷酸序列是异源的。“转基因”是通过基因递送程序(例如,转化)已经引入基因组中的基因。“密码子优化的”可读框的密码子使用频率被设计为模拟宿主细胞的优选密码子使用的频率。
如本文所使用的,术语“多肽”被定义为氨基酸残基链,通常具有确定的序列。如本文所使用的,术语多肽可与术语“肽”和“蛋白质”互换。在本文的多肽中包含的典型氨基酸包括(括号中显示了相应的三字母和单字母代码):丙氨酸(Ala,A)、精氨酸(Arg,R)、天冬酰胺(Asn,N)、天冬氨酸(Asp,D)、半胱氨酸(Cys,C)、谷氨酸(Glu,E)、谷氨酰胺(Gln,Q)、甘氨酸(Gly,G)、组氨酸(His,H)、异亮氨酸(Ile,I)、亮氨酸(Leu,L)、赖氨酸(Lys,K)、甲硫氨酸(Met,M)、苯丙氨酸(Phe,F)、脯氨酸(Pro,P)、丝氨酸(Ser,S)、苏氨酸(Thr,T)、色氨酸(Trp,W)、酪氨酸(Tyr,Y)、缬氨酸(Val,V)。
术语“异源”意指不是天然地在目的位置发现的。例如,异源基因可以不是天然地在宿主生物体中发现的基因,而是通过基因转移引入所述宿主生物体中的基因。作为另一个实例,存在于嵌合基因中的核酸分子可以表征为异源的,因为这种核酸分子不与所述嵌合基因的其他区段天然相关(例如,启动子对于编码序列可以是异源的)。
本文中包含在细胞或生物体中的“非天然”氨基酸序列或多核苷酸序列不会在这种细胞或生物体的天然的(自然的)对应物中存在。这种氨基酸序列或多核苷酸序列也可以被称为是与细胞或生物体异源的。
如本文所使用的,“调节序列”是指位于基因转录起始位点(例如启动子)上游的核苷酸序列、5’非翻译区、内含子和3’非编码区,并且所述调节序列可以影响转录、加工或稳定性、和/或从所述基因转录的RNA的翻译。本文中,调节序列可以包括启动子、增强子、沉默子、5’非翻译前导序列、内含子、聚腺苷酸化识别序列、RNA加工位点、效应子结合位点、茎环结构以及涉及基因表达调节的其他元件。本文中的一个或多个调节元件可以与本文中的编码区异源。
如本文所使用的,“启动子”是指能够控制从基因转录RNA的DNA序列。通常,启动子序列位于基因的转录起始位点的上游。启动子可以全部衍生自天然基因,或者由衍生自在自然界发现的不同启动子的不同元件构成,或者甚至包含合成的DNA区段。在所有情况下在多数时候引起基因在细胞中表达的启动子通常称为“组成型启动子”。可替代地,启动子可以是诱导型的。本文中的一个或多个启动子可以与本文中的编码区异源。
如本文所使用的,“强启动子”是指可以指导每单位时间相对大量的生产性启动的启动子,和/或是驱动比在细胞中基因的平均转录水平更高的基因转录水平的启动子。
如本文所使用的,术语“3’非编码序列”、“转录终止子”、“终止子”等是指位于编码序列下游的DNA序列。这包括聚腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。
如本文所使用的,当在适合的退火条件下(例如,温度、溶液离子强度)单链形式的第一核酸序列可以退火为第二核酸序列时,第一核酸序列可与第二核酸序列“杂交”。杂交和洗涤条件是熟知的,并且例示于Sambrook J、Fritsch EF和Maniatis T,Molecular Cloning:A Laboratory Manual[分子克隆:实验手册],第2版,Cold Spring HarborLaboratory[冷泉港实验室]:冷泉港,纽约州(1989),特别是第11章和表11.1中,将其通过引用并入本文。
术语“DNA操作技术”是指其中将DNA多核苷酸序列的序列进行修饰的任何技术。尽管可以将经修饰的DNA多核苷酸序列用作用于修饰的底物本身,但是对于某些技术,无需有形存在(例如,可以将存储在计算机中的序列用作操作技术的基础)。可以将DNA操作技术用于在更长的序列中使一个或多个DNA序列缺失和/或突变。DNA操作技术的实例包括重组DNA技术(限制和连接,分子克隆),聚合酶链式反应(PCR)和合成DNA的方法(例如寡核苷酸合成和连接)。关于合成DNA技术,DNA操作技术可能需要经由计算机模拟观察DNA序列,确定DNA序列的所希望的修饰,并合成含有所希望的修饰的DNA序列。
本文的术语“经由计算机模拟”意指在诸如计算机的信息存储和/或处理设备中或其上,和/或使用计算机软件或模拟来完成或产生,即虚拟现实。
如本文所使用的,关于多核苷酸的术语“上游”和“下游”分别是指“5’的”和“3’的”。
如本文所使用的,术语“表达”是指(i)由编码区转录RNA(例如,mRNA或非蛋白质编码RNA),和/或(ii)由mRNA翻译多肽。在某些实施例中,可以对多核苷酸序列的编码区域的表达进行上调或下调。
如本文所使用的,术语“有效地连接”是指两种或更多种核酸序列的缔合,这样使得其中一种核酸序列的功能受到另一种核酸序列的影响。例如,当启动子能够影响(affecting和/或effecting)编码序列的表达时,所述启动子与所述编码序列有效地连接。即,编码序列处于启动子的转录控制下。例如,编码序列可以有效地连接到一种(例如,启动子)或多种(例如,启动子和终止子)调节序列。
当本文中用于表征DNA序列例如质粒、载体或构建体时,术语“重组”是指例如通过化学合成和/或通过用基因工程技术操纵分离的核酸区段来将两个原本分离的序列区段进行人工组合。
如本文所使用的,术语“转化”是指通过任何方法将核酸分子转移到宿主生物体或宿主细胞中。已经转化到生物体/细胞中的核酸分子可以是在生物体/细胞中自主复制、或整合到生物体/细胞的基因组中、或瞬时存在于细胞中而不进行复制或整合的核酸分子。在本文中公开了适合于转化的核酸分子的非限制性实例,如质粒和线性DNA分子。本文中含有转化核酸序列的宿主生物体/细胞可以被称为例如“转基因的”、“重组的”、“转化的”、“工程化的”、被称为“转化体”、和/或被称为“经修饰以用于外源基因表达”。
如本文所使用的,关于多核苷酸或多肽序列的术语“序列同一性”、“同一性”等是指在两个序列中的核酸残基或氨基酸残基当在指定的比较窗口上比对最大对应度时是相同的。因此,“序列同一性百分比”、“百分比同一性”等是指通过在比较窗口上比较两个最佳比对的序列所确定的值,其中与参比序列(其不包含添加或缺失)比较两个序列的最佳比对时,所述多核苷酸或多肽序列在比较窗口中的部分可以包含添加或缺失(即空位)。通过以下方式计算所述百分比:确定在两个序列中存在相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数目,然后将所述结果乘以100以产生序列同一性的百分比。应当理解的是,当计算DNA序列和RNA序列之间的序列同一性时,DNA序列的T残基与RNA序列的U残基比对,并且可以被认为与其“具有同一性”。出于确定第一多核苷酸和第二多核苷酸的“百分比互补性”的目的,可以通过确定(i)第一多核苷酸与第二多核苷酸的补体序列之间的百分比同一性(或反之亦然),例如和/或(ii)将产生规范的沃森和克里克碱基对的第一多核苷酸与第二多核苷酸之间的碱基百分比来获得。
可以通过任何已知方法容易地确定百分比同一性,所述方法包括但不限于以下文献中所述的那些:1)Computational Molecular Biology[计算分子生物学](Lesk,A.M.编辑)牛津大学出版社(Oxford University):纽约州(1988);2)Biocomputing:Informatics and Genome Projects[生物计算:信息学和基因组项目](Smith,D.W.编辑)Academic[学术出版社]:纽约州(1993);3)Computer Analysis of Sequence Data,Part I[序列数据的计 算机分析,第一部分](Griffin,A.M.和Griffin,H.G.编辑)Humana[胡玛纳出版社]:新泽西州(1994);4)Sequence Analysis in Molecular Biology[分子生物学中的序列分析](vonHeinje,G.编辑)Academic[学术出版社](1987);和5)Sequence Analysis Primer[序列分 析引物](Gribskov,M.和Devereux,J.编辑)Stockton Press[斯托克顿出版社],纽约州(1991),将所述文献全部通过引用并入本文。
用于确定百分比同一性的优选方法被设计为在测试序列之间给出最佳匹配。例如,确定同一性和相似性的方法被编入公共可用的计算机程序中。例如,序列比对和百分比同一性计算可以使用LASERGENE生物信息学计算套件(DNASTAR公司,麦迪逊(Madison),威斯康星州)的MEGALIGN程序进行。序列的多重比对可以例如使用Clustal比对方法进行,所述比对方法涵盖几不同的算法,包括Clustal V比对方法(通过Higgins和Sharp,CABIOS.[计算机在生物学中的应用]5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.[生物科学中的计算机应用],8:189-191(1992)描述)并且存在于LASERGENE生物信息学计算套件(DNASTAR公司)的MEGALIGN v8.0程序中。对于多重比对,默认值可能对应于空位罚分(GAP PENALTY)=10和空位长度罚分(GAP LENGTH PENALTY)=10。使用Clustal方法进行逐对比对和蛋白质序列的百分比同一性计算的默认参数可以为KTUPLE=1、空位罚分=3、窗口(WINDOW)=5、以及存储的对角线(DIAGONALS SAVED)=5。对于核酸,这些参数可以是KTUPLE=2、空位罚分=5、窗口=4、以及存储的对角线=4。另外,可以使用Clustal W比对方法(通过Higgins和Sharp,CABIOS.[计算机在生物学中的应用]5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.[生物科学中的计算机应用]8:189-191(1992);Thompson,J.D.等人,Nucleic Acids Research[核酸研究],22(22):4673-4680,1994描述)并且存在于LASERGENE生物信息学计算套件(DNASTAR公司)的MEGALIGN v8.0程序中。多重比对(蛋白质/核酸)的默认参数可以是:空位罚分=10/15、空位长度罚分=0.2/6.66、延迟发散序列(%)=30/30、DNA转换权重=0.5、蛋白质权重矩阵=Gonnet系列、DNA权重矩阵=IUB。
作为某些实施例的特征,本文公开了各种多肽氨基酸序列和多核苷酸序列。可以使用或引用与本文公开的序列至少约70%-85%、85%-90%、或90%-95%同一的这些序列的变体。可替代地,变体氨基酸序列或多核苷酸序列可以与本文公开的序列至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或99.5%同一。本文的变体氨基酸序列或多核苷酸序列具有所公开的序列的相同功能/活性,或具有所公开的序列的功能/活性的至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的功能/活性。典型地,本文公开的不以甲硫氨酸开始的任何多肽氨基酸序列可以在氨基酸序列的N末端进一步包含至少一个起始甲硫氨酸。相反,本文公开的以甲硫氨酸开始的任何多肽氨基酸序列可以任选地缺少这种甲硫氨酸残基。
术语“与……比对”、“与……相对应”等在本文中可互换地使用。本文的一些实施例涉及在与SEQ ID NO:4的至少一个特定氨基酸残基相对应的位置处包含至少一个氨基酸取代的非天然葡糖基转移酶。非天然葡糖基转移酶的氨基酸位置或其子序列(例如,催化结构域)(可以将这种氨基酸位置或序列称为“查询”位置或序列)可以被表征为与SEQ ID NO:4的特定氨基酸残基(可以将这种氨基酸位置或序列称为“主题”位置或序列)相对应,如果(1)可以将所述查询序列与所述主题序列比对(例如,其中比对表明所述查询序列和所述主题序列[或主题序列的子序列]至少约30%、40%、50%、60%、70%、80%或90%同一),并且(2)如果直接将所述查询氨基酸位置与在(1)的比对下的主题氨基酸位置进行比对(直接排列对比)。通常,可以使用本文公开所述的任何比对算法、工具和/或软件(例如,BLASTP、ClustalW、ClustalV、Clustal-Omega、EMBOSS)将查询氨基酸序列与主题序列(SEQ ID NO:4或SEQ ID NO:4的子序列)进行比对以确定百分比同一性。仅用于其他实例,可以使用Needleman-Wunsch算法(Needleman和Wunsch,J.Mol.Biol.[分子生物学杂志]48:443-453,1970)将查询序列与本文的主题序列进行比对,如在欧洲分子生物学开放软件包(EuropeanMolecular Biology Open Software Suite,EMBOSS[例如,版本5.0.0或更新],Rice等人,Trends Genet.[遗传学趋势]16:276-277,2000)的Needle程序中所执行。这种EMBOSS比对的参数可以包含,例如:空位开放罚分10、空位扩展罚分0.5、EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。
本文中SEQ ID NO:4的特定氨基酸残基(例如,Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237)的编号是相对于SEQ ID NO:4的全长氨基酸序列的。SEQ ID NO:4的第一个氨基酸(即,位置1,Met-1)位于信号肽的起始处。除非另有公开,否则本文的取代是相对于SEQ ID NO:4的全长氨基酸序列的。
本文中的“非天然葡糖基转移酶”(“突变体”、“变体”、“经修饰的”等术语同样可用于描述这种葡糖基转移酶)在与SEQ ID NO:4的特定氨基酸残基相对应的位置处具有至少一个氨基酸取代。这样的至少一种氨基酸取代典型地代替正常地(天然地)发生在非天然葡糖基转移酶的天然对应物(亲本)中的相同位置的一个或多个氨基酸残基(即,尽管SEQ IDNO:4被用作位置的参考,但本文中的氨基酸取代是相对于非天然葡糖基转移酶的天然对应物)(考虑另一种方式,当将非天然葡糖基转移酶的序列与SEQ ID NO:4比对时,确定在特定位置是否存在取代本身并不取决于SEQ ID NO:4中的各自的氨基酸残基,而是取决于在非天然葡糖基转移酶的天然对应物的主题位置上存在什么氨基酸)。正常地出现在天然对应物葡糖基转移酶的相关位点的氨基酸通常(但不总是)与进行比对的SEQ ID NO:4的特定氨基酸残基相同(或与之保持一致)。相对于其天然对应物序列,非天然葡糖基转移酶任选地可以具有其他氨基酸变化(突变、缺失和/或插入)。
在本文中阐明取代/比对可能是有益的。SEQ ID NO:15(GTF BRS-B)是全长成熟的柠檬明串珠菌α-1,3-分支酶。应注意,SEQ ID NO:15的Ser-628与SEQ ID NO:4的Ser-734相对应(比对未显示)。例如,如果SEQ ID NO:15在位置628处突变以用不同的残基(例如,Gly)取代Ser残基,那么可以这样说SEQ ID NO:15的位置628突变的版本表示在与SEQ ID NO:4的Ser-734相对应的位置处具有氨基酸取代的非天然葡糖基转移酶。
本文的术语“基序”是指如在氨基酸序列内的独特且重现的结构单元。“重现”意指基序在例如多个相关多肽中存在。
术语“分离的”意指呈自然界中不存在的形式或在自然界中不存在的环境中的物质(或过程)。分离的物质的非限制性实例包括(1)任何非天然存在的物质(例如,本文的非天然葡糖基转移酶),(2)任何物质,包括但不限于,从与其天然相关联的天然存在的成分中的一种或多种中或所有中至少部分地除去的任何宿主细胞、酶、变体、核酸、蛋白质、肽、辅因子、或碳水化合物/糖类;(3)相对于自然界中发现的物质,经人手修饰的任何物质(例如,本文的非天然葡糖基转移酶);或(4)相对于与其天然相关的其他成分,通过增加物质的量进行修饰的任何物质。据信本文公开的实施例(例如,酶和反应组合物)是合成的/人造的(除了人为干预/参与之外不可能制造),和/或具有非天然存在的特性。
如本文所使用的,术语“增加的”可以是指比所述增加的量或活性与之进行比较的量或活性多至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、50%、100%、或200%的量或活性。术语“增加的”、“提高的”、“增强的”、“大于”、“改进的”等在本文中可互换地使用。例如,可以将这些术语用于表征编码蛋白质的多核苷酸的“过表达”或“上调”。
虽然已经在理解和使用α-1,3-分支酶方面取得了进展,但似乎很少关注调节这些酶的活性。可以证明此类经调节的酶是用于为特定应用提供具有定义结构的葡聚糖产物的有价值工具。为解决这一技术差距,本文公开了具有改变的α-1,3-分支活性的具有经修饰的氨基酸序列的α-1,3-分支酶。
本公开的某些实施例涉及非天然葡糖基转移酶,所述非天然葡糖基转移酶在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处包含至少一个氨基酸取代,其中所述非天然葡糖基转移酶能够从受体分子形成至少一个α-1,3分支。与仅在一个或多个取代位置处与非天然葡糖基转移酶不同的第二葡糖基转移酶相比,这种非天然葡糖基转移酶典型地具有经修饰的α-1,3分支活性(增加的或降低的)。可以利用此修饰活性来例如更好地控制葡聚糖受体的α-1,3分支。
本公开的非天然葡糖基转移酶可以,例如,(i)在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处包含至少一个氨基酸取代,并且(ii)包含与SEQ ID NO:2(或SEQ ID NO:2的残基477-1322)、3、4、13、14(即,SEQ ID NO:13的残基446-1313)、或15至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或99.5%同一的氨基酸序列,或由其组成。在一些方面,非天然葡糖基转移酶(i)包含至少一个前述氨基酸取代,并且(ii)包含与多肽序列至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或99.5%同一的氨基酸序列,或由其组成以具有α-1,3-分支活性,所述多肽序列如Vuillemin等人(2016,J.Biol.Chem.[生物化学杂志]14:7687-7702)或Remaud-Simeon等人(美国专利申请公开号2016/0136199)(将两篇文献均通过引用并入本文)所公开的。
尽管本文通常公开了非天然葡糖基转移酶中的关于SEQ ID NO:4中相应位置的氨基酸取代,但是这种取代可以可替代地关于非天然葡糖基转移酶本身的序列中的位置编号而简单地陈述,按方便可以这样规定。
非天然葡糖基转移酶的仍进一步的实例可以是如本文公开的任何酶并且包括在N末端和/或C末端的1-300(或之间的任何整数[例如,10、15、20、25、30、35、40、45、或50])个残基。例如,此类额外的残基可以来自衍生出葡糖基转移酶的相应的野生型序列,或可以是异源序列例如如表位标签(在N末端或C末端)或异源信号肽(在N末端)。本文中非天然葡糖基转移酶典型地缺少N-末端信号肽;如果在分泌过程中去除其信号肽,则这种酶可任选地被表征为是成熟的。
本文的非天然葡糖基转移酶可以衍生/可衍生(derived/derivable)自任何适合的微生物来源,例如如细菌。具有α-1,3-分支活性的细菌葡糖基转移酶的实例可以衍生/可衍生自明串珠菌属(Leuconostoc)物种,如谲诈明串珠菌和柠檬明串珠菌。在一些方面,非天然葡糖基转移酶可以包含如在GenBank登录号WP_010006776.1、TDG68566.1、WP_080984265.1、WP_040190490.1、WP_040177263.1、OSP81041.1、或TDM37010.1中公开的氨基酸序列,但除了所述非天然葡糖基转移酶在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处包含至少一个氨基酸取代。在一些方面,这种非天然葡糖基转移酶(i)具有前述取代中的至少一个,并且(ii)包含与不具有所述至少一个取代的各自对应物/亲本葡糖基转移酶的氨基酸序列至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或99.5%同一的氨基酸序列。
在一些方面,非天然葡糖基转移酶仅在其一个或多个取代位置处与第二葡糖基转移酶(或,仅,“另一个”葡糖基转移酶)(例如,亲本葡糖基转移酶)不同,其中所述第二葡糖基转移酶是包含以下基序的α-1,3-分支酶:(i)与SEQ ID NO:9或5至少80%同一的氨基酸序列,(ii)与SEQ ID NO:10或6至少80%同一的氨基酸序列,(iii)与SEQ ID NO:11或7至少80%同一的氨基酸序列,和(iv)与SEQ ID NO:12或8至少80%同一的氨基酸序列。在一些方面,第二葡糖基转移酶包含分别与SEQ ID NO:9-12(或5-8)至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一的这些基序中的每一种。在这些方面中的一些方面,例如,基序(ii)可以包含在其位置5处的Asp残基,基序(iii)可以包含在其位置6处的Glu残基,并且基序(iv)可以包含在其位置6处的Asp残基。如存在于第二葡糖基转移酶中,基序的顺序典型地是(ii)-(iii)-(iv)-(i)。本文的第二葡糖基转移酶例如可以由天然氨基酸序列的全部或大部分组成。因此,当本文的第二葡糖基转移酶在一些方面可以是天然葡糖基转移酶时,所述第二葡糖基转移酶在其他方面可以是修饰前的(或以其他方式为变体)葡糖基转移酶(例如,具有与本公开的一个或多个取代不同的一个或多个其他氨基酸取代的葡糖基转移酶)。在一些实施例中,与非天然葡糖基转移酶相比的第二葡糖基转移酶在一个或多个取代位置处具有一个或多个天然氨基酸残基。可以通过将第二葡糖基转移酶氨基酸序列与衍生/可衍生出所述第二葡糖基转移酶的天然/野生型葡糖基转移酶氨基酸序列进行比较来确定氨基酸残基是否是天然的。本文的非天然葡糖基转移酶典型地衍生/可衍生自如上公开的第二葡糖基转移酶。
在一些方面,非天然葡糖基转移酶包含具有与SEQ ID NO:9-12(或5-8)小于95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、或70%同一(所述百分比同一性相对于单独考虑每个序列而言),但与SEQ ID NO:9-12(或5-8)大于60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、或93%同一(所述百分比同一性相对于单独考虑每个序列而言)的氨基酸序列的基序。应注意,公开的氨基酸取代发生在SEQ ID NO:9-12(或5-8)的保守基序上。非天然葡糖基转移酶中的基序的顺序典型地与其发生在第二葡糖基转移酶(以上)上一样。
例如,本文的非天然葡糖基转移酶可以通过适当工程化的微生物菌株的发酵来制备。通过发酵进行重组酶生产是本领域熟知的,使用微生物种类如大肠杆菌、芽孢杆菌(Bacillus)菌株(例如,枯草芽孢杆菌(B.subtilis))、富养罗尔斯通氏菌(Ralstoniaeutropha)、荧光假单胞菌(Pseudomonas fluorescens)、酿酒酵母(Saccharomycescerevisiae)、巴斯德毕赤酵母(Pichia pastoris)、多形汉逊酵母(Hansenulapolymorpha)、以及曲霉属(Aspergillus)(例如,泡盛曲霉(A.awamori))和木霉属(Trichoderma)(例如,里氏木霉(T.reesei))的物种(例如,参见Adrio和Demain,Biomolecules[生物分子]4:117-139,2014,将其通过引用并入本文)。将编码非天然葡糖基转移酶氨基酸序列的核苷酸序列典型地与异源启动子序列连接以产生所述酶的表达盒,和/或因此被密码子优化。可以使用本领域熟知的方法将这种表达盒并入到适合的质粒上或整合到微生物宿主染色体中。表达盒可以包括在氨基酸编码序列之后的转录终止子核苷酸序列。表达盒还可以在启动子序列和葡糖基转移酶氨基酸编码序列之间包括编码信号肽(例如,异源信号肽)的核苷酸序列,所述信号肽被设计用于指导葡糖基转移酶的分泌。在发酵结束时,细胞可以相应地破裂(通常当不使用用于分泌的信号肽时),并且可以使用如沉淀、过滤和/或浓缩等方法分离葡糖基转移酶。可替代地,可以使用包含葡糖基转移酶的裂解物或提取物而无需进一步分离。如果葡糖基转移酶被分泌(即,它存在于发酵液中),则所述葡糖基转移酶可以任选地与发酵液分离来使用或包含在发酵液中使用。
本文的非天然葡糖基转移酶可以在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处包含至少一个氨基酸取代。在一些方面,在与氨基酸残基Ser-734相对应的位置处的氨基酸被Cys、Asp、Gly、His、Lys、Leu、Met、Asn、Thr、或Val残基取代。在一些方面,在与氨基酸残基Ile-735相对应的位置处的氨基酸被Ala、Leu、或Val残基取代。在一些方面,在与氨基酸残基Ile-737相对应的位置处的氨基酸被Ala、Cys、Asp、Gly、His、Leu、Met、Asn、Ser、Val、Trp、或Tyr残基取代。在一些方面,在与氨基酸残基Ile-740相对应的位置处的氨基酸被Ala、Leu、或Val残基取代。在一些方面,在与氨基酸残基Asp-744相对应的位置处的氨基酸被Ala、Cys、Glu、Phe、Gly、His、Lys、Met、Asn、Pro、Gln、Arg、Ser、Thr、Val、Trp、或Tyr残基取代。在一些方面,在与氨基酸残基His-771相对应的位置处的氨基酸被Ala残基取代。在一些方面,在与氨基酸残基Val-772相对应的位置处的氨基酸被Ala或Leu残基取代。在一些方面,在与氨基酸残基Ser-773相对应的位置处的氨基酸被Ala或Asn残基取代。在一些方面,在与氨基酸残基Val-775相对应的位置处的氨基酸被Ala残基取代。在一些方面,在与氨基酸残基Ser-778相对应的位置处的氨基酸被Trp残基取代。在一些方面,在与氨基酸残基Ala-779相对应的位置处的氨基酸被Asp、Gly、或Ser残基取代。在一些方面,在与氨基酸残基Asp-780相对应的位置处的氨基酸被Ala、Gln、或Tyr残基取代。在一些方面,在与氨基酸残基Ile-845相对应的位置处的氨基酸被Ala或Phe残基取代。在一些方面,在与氨基酸残基Val-846相对应的位置处的氨基酸被Ala、Ile、或Thr残基取代。在一些方面,在与氨基酸残基Asp-852相对应的位置处的氨基酸被Ala、Glu、Leu、或Asn残基取代。在一些方面,在与氨基酸残基Ile-853相对应的位置处的氨基酸被Val残基取代。在一些方面,在与氨基酸残基Asp-855相对应的位置处的氨基酸被Ala、Gly、或Ser残基取代。在一些方面,在与氨基酸残基Ser-858相对应的位置处的氨基酸被Ala、Gly、Gln、或Arg残基取代。在一些方面,在与氨基酸残基Asn-859相对应的位置处的氨基酸被Ala、Asp、Glu、Lys、Ser、或Thr残基取代。在一些方面,在与氨基酸残基Ala-1232相对应的位置处的氨基酸被Cys、Asp、Glu、Phe、Gly、His、Leu、Met、Asn、Pro、Gln、Ser、Thr、Val、或Tyr残基取代。在一些方面,在与氨基酸残基Tyr-1234相对应的位置处的氨基酸被Cys、Glu、His、Leu、Met、Thr、Val、或Trp残基取代。在一些方面,在与氨基酸残基Asn-1237相对应的位置处的氨基酸被Asp或Gly残基取代。
在一些实施例中,非天然葡糖基转移酶仅包含前述氨基酸取代中的一个。在一些情况下,非天然葡糖基转移酶不包含以下氨基酸,所述氨基酸(i)在与SEQ ID NO:4的氨基酸残基Ser-734相对应的位置处被Ile、Arg、Trp、Pro、或Tyr残基取代;(ii)在与SEQ ID NO:4的氨基酸残基Ile-737相对应的位置处被Glu或Thr残基取代;(iii)在与SEQ ID NO:4的氨基酸残基His-847相对应的位置处被Arg残基取代;(iv)在与SEQ ID NO:4的氨基酸残基Ala-1232相对应的位置处被Lys残基取代;和/或(v)在与SEQ ID NO:4的氨基酸残基Asn-1237相对应的位置处被Phe、Ile、或Leu残基取代。
适合的取代位点、以及在这些位点的特定取代的实例可以包括在实例1表3(以下)中列出的那些。例如,适合的取代位点、以及在这些位点的特定取代的实例可以是表3中的那些中的任一个,所述取代与α-1,3-分支活性增加约或至少约10%、25%、50%、75%、100%、150%、200%、250%、300%、325%、10%-325%、25%-325%、50%-325%、100%-325%、10%-200%、25%-200%、50%-200%、或100%-200%相关。作为另一个实例,适合的取代位点、以及在这些位点的特定取代的实例可以是表3中的那些中的任一个,所述取代与α-1,3-分支活性降低约或至少约10%、25%、50%、75%、10%-75%、25%-75%、或50%-75%相关。如在表3中列出的前述取代与SEQ ID NO:4中列出的残基位置编号相对应;前述百分比变化是相对于SEQ ID NO:2的活性而言的。
在一些方面,非天然葡糖基转移酶包含两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或更多个氨基酸取代,其中所述取代中的至少一个在SEQ IDNO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处。如上列出了在这些位点的特定取代的实例。在这些和其他方面中的任一个,所述取代中的至少一个在SEQ IDNO:4的氨基酸残基Ser-734、Ile-735、Ser-778、Asp-780、Ile-845、Asp-852、Ile-853、Asp-855、Ala-1232、或Tyr-1234相对应的位置处,任选地其中在与氨基酸残基Ser-734相对应的位置处的氨基酸被Cys残基取代,在与氨基酸残基Ile-735相对应的位置处的氨基酸被Val残基取代,在与氨基酸残基Ser-778相对应的位置处的氨基酸被Trp残基取代,在与氨基酸残基Asp-780相对应的位置处的氨基酸被Tyr残基取代,在与氨基酸残基Ile-845相对应的位置处的氨基酸被Phe残基取代,在与氨基酸残基Asp-852相对应的位置处的氨基酸被Glu残基取代,在与氨基酸残基Ile-853相对应的位置处的氨基酸被Val残基取代,在与氨基酸残基Asp-855相对应的位置处的氨基酸被Gly残基取代,在与氨基酸残基Ala-1232相对应的位置处的氨基酸被Gly、Met、Ser、或Val残基取代,和/或在与氨基酸残基Tyr-1234相对应的位置处的氨基酸被Trp残基取代。
本文的非天然葡糖基转移酶可以包含目前公开的氨基酸取代中的例如一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或更多个。例如,非天然葡糖基转移酶可以在与以下相对应的位置处包含取代:
(i)SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-740、和/或Asp-744;
(ii)SEQ ID NO:4的氨基酸残基Val-775、Ser-778、和/或Asp-780;
(iii)SEQ ID NO:4的氨基酸残基Ile-845、Asp-852、Ile-853、Asp-855;和/或
(iv)SEQ ID NO:4的氨基酸残基Ala-1232和/或Tyr-1234。
在一些方面,氨基酸取代位置可以是(i)、(ii)、(iii)、(iv)、(i)+(ii)、(i)+(iii)、(i)+(iv)、(ii)+(iii)、(ii)+(iv)、(iii)+(iv)、(i)+(ii)+(iii)、(i)+(ii)+(iv)、(i)+(iii)+(iv)、(ii)+(iii)+(iv)、或(i)+(ii)+(iii)+(iv)。在这些组合的任一个中的取代的实例包括S734(C)、I735(L或V)、I740(A或L)、D744(T或N)、V775(A)、S778(W)、D780(Y)、I845(F)、D852(E)、I853(V)、D855(G)、A1232(G、M、S、或V)、Y1234(W)、和Y1237(G),其中取代的氨基酸残基作为实例附带列出。
仅出于说明目的,本文的非天然葡糖基转移酶可以包含如表A(i-xxvii)所示的位置处的氨基酸取代的组合,其中每个取代位置与在SEQ ID NO:4中的各自氨基酸位置数量相对应。表A中的取代的氨基酸残基作为实例附带列出。在一些方面,非天然葡糖基转移酶可以包含如表A所示的氨基酸取代的组合,其中取代的氨基酸是在表A中附带显示的那些。
表A.氨基酸取代组合的实例
a附带列出的氨基酸残基是取代的氨基酸残基的实例。
例如,具有一个或多个本文的氨基酸取代的非天然葡糖基转移酶可以基于如目前公开的多个葡糖基转移酶氨基酸序列中的任一个。仅出于说明目的,这种非天然葡糖基转移酶的实例包括具有至少一个氨基酸取代(例如,在SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处)或氨基酸取代的组合(例如,表A的实施例i-xxvii中的任一个),并且包含与SEQ ID NO:2(任选地不具有SEQ ID NO:2的起始甲硫氨酸和/或6xHis标签)、SEQ ID NO:3、SEQ ID NO:2的残基477-1322、SEQ ID NO:15、或SEQ ID NO:13的残基446-1313至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或99.5%同一的氨基酸序列,或由其组成的那些。
在一些方面,一个或多个取代是保守取代或非保守取代;这种保守(或不保守)可以是例如相对于衍生出非天然葡糖基转移酶的天然葡糖基转移酶中存在的氨基酸而言的。
如目前公开的非天然葡糖基转移酶能够从适合的受体分子形成至少一个α-1,3分支。本文的受体典型地是水性可溶性的,或至少其部分(大于10、20、30、40、50、60、70、80、90、或95wt%)是可溶性的。在一些方面,受体包含葡聚糖(例如,葡聚糖的寡糖和/或多糖形式),如α-葡聚糖(例如,右旋糖酐),或由其组成。
在一些方面,受体分子包含单糖、二糖或寡糖。然而在一些方面,受体由单糖、二糖或寡糖组成(例如,糖类受体不是化学衍生的/取代的)。二糖或寡糖受体分子典型地包含一个或多个葡萄糖单体单元(例如,至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、或95%的单体单元是葡萄糖),或仅包含葡萄糖单体单元。二糖或寡糖可以任选地包含典型地除了一个或多个葡萄糖单体单元之外的一个或多个非葡萄糖单体单元。在一些方面,二糖或寡糖(或非葡萄糖单糖受体)的非葡萄糖单体单元可以是果糖、阿拉伯糖、木糖或半乳糖。在一些方面,受体不是(不由以下组成)葡萄糖、果糖、甘露糖、或葡萄糖胺。受体可以是例如线性的(无分支)或分支的。
本文的二糖或寡糖受体分子可以包含α-糖苷键和/或β-糖苷键。受体的键可以是例如100%α-糖苷键或至少约50%、60%、70%、80%、90%、或95%α-糖苷键。二糖或寡糖受体的葡萄糖单体之间的α-糖苷键或β-糖苷键可以包括以下键中的一种类型或多于一种类型:1,1、1,2、1,3、1,4、和/或1,6。仅出于说明的目的,键可以全部是α-1,6糖苷键或全部是α-1,4糖苷键,或α-1,6糖苷键和α-1,6糖苷键的混合物。还出于说明的目的,键可以是至少50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%α-1,6糖苷键,其中其余键可以是α-1,3、α-1,4、α-1,2、或其混合物;这些类型的寡糖可以任选地被表征为右旋糖酐的形式。本文的二糖或寡糖受体典型地是水性可溶性的。
本文的寡糖受体可以具有、具有至少、或具有多达例如3、4、5、6、7、8、9、10、11、12、13、14、或15个单体单元。这种寡糖受体分子的具体实例可以仅包含葡萄糖单体单元和/或通过α-1,6键连接的葡萄糖单体单元。
在一些方面,受体分子包含多糖。然而在一些方面,受体由多糖组成(例如,多糖受体不是化学衍生的/取代的)。多糖受体分子典型地包含一个或多个葡萄糖单体单元(例如,至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、或95%的单体单元是葡萄糖),或仅包含葡萄糖单体单元(即,葡聚糖的形式)。多糖可以任选地包含典型地除了一个或多个葡萄糖单体单元之外的一个或多个非葡萄糖单体单元。在一些方面,多糖的非葡萄糖单体单元可以是果糖、阿拉伯糖、木糖、或半乳糖。
本文的多糖受体分子可以包含α-糖苷键和/或β-糖苷键。多糖受体的键可以是例如100%α-糖苷键(例如,α-葡聚糖)或至少约50%、60%、70%、80%、90%、或95%α-糖苷键。多糖受体的葡萄糖单体之间的α-糖苷键或β-糖苷键可以包含以下键中的一种类型或多于一种类型:1,1、1,2、1,3、1,4、和/或1,6。仅出于说明的目的,键可以全部是α-1,6糖苷键、全部是α-1,4糖苷键、或α-1,6糖苷键和α-1,6糖苷键的混合物。还出于说明的目的,键可以是至少50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%α-1,6糖苷键,其中其余键可以是α-1,3、α-1,4、α-1,2、或其混合物;这些类型的多糖可以任选地被表征为右旋糖酐的形式。本文的多糖受体典型地是水性可溶性的。
本文的多糖受体的DP或DPw可以为例如约或至少约16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75、100、150、200、225、250、275、300、350、400、450、500、550、575、600、625、650、或700。此DP/DPw可以任选地表示为这些值中任两个之间的范围(例如,200-300、225-275、550-650、575-625)。
在一些方面,受体是右旋糖酐。右旋糖酐可以包含例如约100%α-1,6-糖苷键(即,完全直链的右旋糖酐主链),或约或至少约95%、96%、97%、98%、99%或99.5%α-1,6-糖苷键(即,基本上直链的右旋糖酐主链)。这种百分比的α-1,6键谱图是考虑了右旋糖酐中所有键的总和(主链和分支部分(如果存在)的组合)的谱图。在一些方面,基本上直链的右旋糖酐受体可以包含5%、4%、3%、2%、1%、0.5%或更少分支。如果存在,则右旋糖酐分支典型地为短的,长度为一个(侧链)至三个葡萄糖单体,并且包含右旋糖酐受体所有葡萄糖单体的少于约10%、9%、8%、7%、6%、5%、4%、3%、2%或1%。所有前述右旋糖酐键信息均与经α-1,3分支修饰之前的右旋糖酐受体有关。
在一些方面,右旋糖酐受体的DP或DPw可以为约或至少约、或不大于约3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、85、90、95、100、105、110、150、200、225、250、275、300、350、400、450、500、550、575、600、625、650、或700。此DP或DPw可以任选地表示为这些值中任两个之间的范围。仅作为实例,DP或DPw可以为约8-20、8-30、8-100、或8-500、3-4、3-5、3-6、3-7、3-8、4-5、4-6、4-7、4-8、5-6、5-7、5-8、6-7、6-8、或7-8。仅作为其他实例,此DP或DPw可以为90-120、95-120、100-120、105-120、110-120、115-120、90-115、95-115、100-115、105-115、110-115、90-110、95-110、100-110、105-110、90-105、95-105、100-105、90-100、95-100、90-95、85-95、85-90、200-300、225-275、550-650、或575-625。作为仍更多的实例,右旋糖酐受体的Mw可以为约或至少约、或不大于约0.1、0.125、0.15、0.175、0.2、0.24、0.25、0.5、0.75、0.1、0.1-0.2、0.125-0.175、0.13-0.17、0.135-0.165、0.14-0.16、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、10-80、20-70、30-60、40-50、50-200、60-200、70-200、80-200、90-200、100-200、110-200、120-200、50-180、60-180、70-180、80-180、90-180、100-180、110-180、120-180、50-160、60-160、70-160、80-160、90-160、100-160、110-160、120-160、50-140、60-140、70-140、80-140、90-140、100-140、110-140、120-140、50-120、60-120、70-120、80-120、90-120、90-110、100-120、110-120、50-110、60-110、70-110、80-110、90-110、100-110、50-100、60-100、70-100、80-100、90-100、或95-105百万道尔顿。然而在一些方面,右旋糖苷受体可以是例如美国专利申请公开号2016/0122445、2018/0282385、或2020/0165360,或国际专利申请公开号WO 2017/079595公开的任一种,将所述文献均通过引用并入本文。
本文的用作受体的右旋糖酐可以例如酶促产生。在某些实施例中,可以使用右旋糖酐蔗糖酶和/或美国专利申请公开号2018/0282385或2017/0218093中公开的方法来合成右旋糖酐,将所述文献通过引用并入本文。需要时,可以使用这些参考文献中鉴别为GTF8117、GTF6831、或GTF5604的右旋糖酐蔗糖酶(或包含与这些特定右旋糖酐蔗糖酶中的任一种至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一的氨基酸序列的任何右旋糖酐蔗糖酶)。此种酶促方法产生的右旋糖酐典型地是直链(即,100%α-1,6键)且水性可溶性的。
本文公开的一些实施例涉及包含编码如目前公开的非天然葡糖基转移酶(例如,在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处包含至少一个氨基酸取代的非天然葡糖基转移酶)的核苷酸序列的多核苷酸。任选地,一个或多个调节序列有效地连接到所述核苷酸序列,并且优选包含启动子序列作为调节序列。
包含编码本文的非天然葡糖基转移酶的核苷酸序列的多核苷酸可以是例如用于将核苷酸序列转移到细胞中的载体或构建体。适合的载体/构建体的实例可以选自质粒、酵母人工染色体(YAC)、粘粒、噬菌粒、细菌人工染色体(BAC)、病毒、或线性DNA(例如,线性PCR产物)。在一些方面,多核苷酸序列能够在细胞中瞬时存在(即未整合到基因组中)或稳定存在(即整合到基因组中)。在一些方面,多核苷酸序列可以包含或缺少一个或多个适合的标记序列(例如选择或表型标记)。
在某些实施例中,多核苷酸序列可以包含有效地连接到编码非天然葡糖基转移酶的核苷酸序列的一个或多个调节序列。例如,编码非天然葡糖基转移酶的核苷酸序列可以与启动子序列(例如,异源启动子)可操作地连接。启动子序列可适用于在细胞(例如,细菌细胞,如大肠杆菌或芽孢杆菌属;真核细胞,如真菌、酵母、昆虫或哺乳动物细胞)中或体外蛋白质表达系统中表达。其他适合的调节序列的实例包括转录终止子序列。
本文的一些方面涉及包含如目前公开的多核苷酸序列的细胞;这种细胞可以是任何本文公开的类型(例如,细菌细胞,如大肠杆菌或芽孢杆菌属;真核细胞,如真菌、酵母、昆虫或哺乳动物细胞)。细胞可以任选地表达由多核苷酸序列编码的非天然葡糖基转移酶。在一些方面,所述多核苷酸序列在细胞中瞬时存在(即,未整合到基因组中)或稳定存在(即,整合到基因组中)。
本文公开的一些实施例涉及包含水、蔗糖、适合的受体分子、和一个或多个本文的非天然葡糖基转移酶(例如,在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处包含至少一个氨基酸取代的非天然葡糖基转移酶)的反应组合物。这种反应组合物可以至少产生包含至少一个α-1,3分支的葡聚糖组合物。
如果需要,可以控制本文的反应组合物的温度,并且可以是例如约5℃-50℃、20℃-40℃、30℃-40℃、20℃-30℃、20℃-25℃、20℃、25℃、30℃、35℃或40℃。
本文的反应组合物中蔗糖的初始浓度可以是例如约或至少约1、3、5、25、50、75、100、150、200、25-200、25-150、25-100、或25-75g/L。“蔗糖的初始浓度”是指在反应组合物中刚刚在已经添加/合并所有反应组分(例如,至少水、蔗糖、受体、非天然葡糖基转移酶)之后的蔗糖浓度。
在某些实施例中,反应组合物的pH可以是约4.0-9.0、4.0-8.5、4.0-8.0、5.0-8.0、5.0-7.5、5.0-6.5、或5.0-6.0。在一些方面,pH可以是约4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、或8.0。可以通过添加或掺入适合的缓冲液来调节或控制pH,所述缓冲液包括但不限于:磷酸盐、三羟甲基氨基甲烷、柠檬酸盐、乙酸盐、或其组合。本文的反应组合物中的缓冲液浓度可以是例如约0.1-300mM、01.-150mM、0.1-100mM、10-150mM、10-100mM、10mM、20mM、50mM、75mM、或100mM。
本文的反应中的受体的初始浓度可以是例如约25、50、75、100、150、200、25-200、25-150、25-100、或25-75g/L。在一些方面,受体的初始浓度可以是约或至少约1、2、5、10、15、1-10、或1-5mM。底物如受体的“初始浓度”是指刚刚添加所有反应组分(例如,至少水、蔗糖、受体、非天然葡糖基转移酶)之后在酶促反应中的底物浓度。受体可以是如本文公开的任何受体。
反应组合物可以包含在适合用于应用本文公开的一种或多种反应条件的任何容器(例如,惰性容器/器皿)中。在一些方面,惰性容器可以是不锈钢、塑料、或玻璃的(或包含这些组分中的两种或更多种)并且具有适合于容纳特定反应的尺寸。例如,惰性容器的体积/容量(和/或本文中的反应组合物的体积)可以是约或至少约1、10、50、100、500、1000、2500、5000、10000、12500、15000、或20000升。惰性容器可以任选地配备有搅拌装置。例如,任何前述特征可用于表征本文的分离反应。
本文的反应组合物可以包含一种、两种或更多种不同的葡糖基转移酶,例如,只要至少一种酶是如目前公开的非天然葡糖基转移酶。在一些实施例中,仅一种或两种葡糖基转移酶包含在反应组合物中。本文的葡糖基转移酶反应可以是并且典型地是不含细胞的(例如,无全细胞存在)。在一些方面,反应组合物可以包含约或至少约0.5、1.0、1.5、2.0、2.5、0.5-2.5、0.5-2.0、或0.5-1.5单位/mL。一单位的α-1,3-分支葡糖基转移酶活性可以任选地设置为在30℃,在pH 5.75的50mM乙酸钠缓冲液中从100g/L蔗糖产生1μmol的果糖/分钟的葡糖基转移酶的量。
本文公开的关于反应组合物的任何特征(例如,以上和下面的实例中)可以表征本文的α-1,3-分支葡聚糖生产方法的合适方面,反之亦然。
本公开还涉及产生包含至少一个α-1,3分支的葡聚糖组合物的方法,所述方法包括:(a)使至少水、蔗糖、葡聚糖底物(葡聚糖受体)、和一个或多个本文的非天然葡糖基转移酶(例如,在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处包含至少一个氨基酸取代的非天然葡糖基转移酶)接触,从而产生包含至少一个α-1,3分支的葡聚糖组合物;和(b)任选地,分离在步骤(a)中产生的所述葡聚糖组合物。当利用本文的反应组合物时,典型地还进行这种方法,所述方法可以任选地被表征为α-1,3-分支葡聚糖合成方法。
如目前公开的α-1,3-分支葡聚糖合成方法包括使至少水、蔗糖、葡聚糖底物(葡聚糖受体)、和一个或多个本文的非天然葡糖基转移酶接触。如下文的讨论,可以将这些和任选地其他试剂一起添加或按任何顺序添加。此步骤可以任选地被表征为提供包含至少水、蔗糖、葡聚糖底物(葡聚糖受体)、和一个或多个本文的非天然葡糖基转移酶的反应组合物。本文的接触步骤能以任何数目的方式进行。例如,可以首先将所希望的量的蔗糖溶解在水中(任选地,也可以在这个制备阶段添加其他组分,如缓冲液组分),接着添加葡糖基转移酶。溶液可以保持静止,或经由例如搅拌或轨道振摇而搅动。葡聚糖合成方法可以通过分批、补料分批、连续模式或通过这些模式的任何变化来进行。
所公开方法的反应可以进行例如约1小时至约或至少约2、4、6、8、10、12、14、16、18、20、22、24、36、48、60、72、96、120、144或168小时。
在一些方面,如本文公开的非天然葡糖基转移酶仅在一个或多个取代位置处与第二葡糖基转移酶不同,并且所述非天然葡糖基转移酶的α-1,3分支活性是所述第二葡糖基转移酶的α-1,3分支活性的约,至少约,或不大于约25%、30%、40%、50%、60%、70%、80%、90%、110%、125%、150%、175%、200%、225%、250%、275%、300%、325%、25%-90%、25%-70%、25%-50%、110%-325%、110%-250%、110%-200%、125%-325%、125%-250%、125%-200%、150%-325%、150%-250%、或150%-200%。用于这种比较的α-1,3分支活性确定可以是如Vuillemin等人(2016,J.Biol.Chem.[生物化学杂志]14:7687-7702)或Remaud-Simeon等人(美国专利申请公开号2016/0136199)(将两篇文献均通过引用并入本文)所述的,或关于任何如本文公开的分支反应/过程(例如,考虑到初始蔗糖浓度、受体、温度、pH和/或反应时间),并且使用任何适合的测量技术。典型地,在相同或相似的反应条件下进行本文的非天然葡糖基转移酶和第二葡糖基转移酶之间的比较。
以本文的α-1,3-分支葡聚糖合成方法产生包含至少一个α-1,3分支的葡聚糖组合物。在一些方面,这种产物包含约或至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、1%-50%、1%-40%、1%-30%、1%-20%、1%-10%、1%-5%、5%-50%、5%-40%、5%-30%、5%-20%、或5%-10%α-1,3分支。此百分比水平可以是新添加的α-1,3分支的百分比水平(例如,如当使用不具有预先存在的α-1,3分支的右旋糖酐作为受体时达到的百分比水平),或新添加的α-1,3分支加上任何预先存在的α-1,3分支的总百分比水平。本文的α-1,3-分支葡聚糖产物典型地是可溶性的,但在一些方面可以是不溶性的。
可以任选地分离以本文的方法产生的包含至少一个α-1,3分支的葡聚糖组合物。在某些实施例中,分离这种产物可以包括至少进行离心、过滤、分馏、色谱分离、透析、蒸发、沉淀、和/或稀释的步骤。这些步骤中的一些与分离可溶性产物更相关,而另一些与分离不溶性产物更相关。在一些方面,分离可以任选地进一步包括用水或另一种适合的液体(例如,70wt%-95wt%乙醇)洗涤产物一次、两次、或更多次,这取决于所述产物的溶解度谱图。洗涤体积可以任选地为用于产生分支产物的反应组合物的体积的至少约10%-100%。本文的分离可以任选地进一步包括将分支产物干燥,和/或制备产物的水性分散体(如果所述产物是不溶性的)。
可以将用于合成α-1,3-分支葡聚糖产物的任何公开的条件(如前述或在以下实例中描述的那些)应用于实践如目前公开的反应组合物(并且反之亦然),和/或因此用于表征非天然葡糖基转移酶的特征/活性。
在一些方面,已经分离的(任选地表征为“纯化的”)α-1,3-分支葡聚糖产物可以以至少约50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99%、99.5%、99.8%、或99.9%的wt%(例如,以干重计)存在于组合物中。例如,这种分离的产物可以用作产品/应用中的成分/组分。
本公开还涉及制备编码本文的非天然葡糖基转移酶的多核苷酸序列的方法。此方法包括:
(a)鉴定编码亲本葡糖基转移酶的多核苷酸序列,所述亲本葡糖基转移酶(i)包含与SEQ ID NO:3或SEQ ID NO:2的位置477-1322至少约40%同一的氨基酸序列,并且(ii)能够从受体分子形成至少一个α-1,3分支;和
(b)修饰步骤(a)中鉴定的多核苷酸序列以在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处取代所述亲本葡糖基转移酶的至少一个氨基酸,从而提供编码非天然葡糖基转移酶的多核苷酸序列,所述非天然葡糖基转移酶从受体分子形成至少一个α-1,3分支。
这种方法可任选地进一步包括使用以这种方式制备的多核苷酸用于表达由所述多核苷酸编码的非天然葡糖基转移酶的方法中。这种表达方法可以遵循例如如本领域已知的任何异源蛋白质表达方法。制备多核苷酸的本发明方法可以任选地可替代地被表征为修饰α-1,3-分支酶分支活性的方法。
例如,本文的亲本葡糖基转移酶可以包含与SEQ ID NO:3或SEQ ID NO:2的位置477-1322至少约40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、69%、70%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或99.5%同一的氨基酸序列。应注意仅出于参考目的,SEQ ID NO:3和SEQID NO:2的位置477-1322是SEQ ID NO:4的子序列。
在一些情况下,本文的鉴定步骤(a)可以包括鉴定亲本葡糖基转移酶的氨基酸序列。可以根据遗传密码(密码子)(如鉴定出亲本葡糖基转移酶的物种中使用的遗传密码)从该氨基酸序列确定多核苷酸序列。
例如,可以按以下进行鉴定编码本文的亲本葡糖基转移酶的多核苷酸:(a)经由计算机模拟,(b)用包括核酸杂交步骤的方法,(c)用包括蛋白质测序步骤的方法,和/或(d)用包括蛋白质结合步骤的方法。
关于经由计算机模拟检测,可以将存储在计算机或数据库(例如,公共数据库,如GENBANK、EMBL、REFSEQ、GENEPEPT、SWISS-PROT、PIR、PDB)中的候选亲本葡糖基转移酶的氨基酸序列(和/或编码这种葡糖基转移酶的核苷酸序列)经由计算机模拟进行评估以鉴定葡糖基转移酶,所述葡糖基转移酶包含与如上文所述的亲本葡糖基转移酶具有百分比序列同一性的氨基酸序列。这种评估可以包括使用本领域已知的任何手段,例如通过使用如以上描述的比对算法或软件(例如,BLASTN、BLASTP、ClustalW、ClustalV、Clustal-Omega、EMBOSS)。
可以任选地通过包括核酸杂交步骤的方法进行如以上公开的亲本葡糖基转移酶的鉴定。这种方法可以包括使用例如DNA杂交(例如DNA印迹、斑点印迹)、RNA杂交(例如RNA印迹),或具有核酸杂交步骤的任何其他的方法(例如DNA测序、PCR、RT-PCR,所有这些都可以包括寡核苷酸的杂交)。例如,在这种杂交中,可以将编码SEQ ID NO:3或其子序列(例如,SEQ ID NO:2的位置477-1322)的多核苷酸序列用作探针。用于进行杂交方法的条件和参数通常是熟知的并且公开于以下文献中:例如,在Sambrook J,Fritsch EF和Maniatis T,Molecular Cloning:A Laboratory Manual[分子克隆:实验手册],Cold Spring HarborLaboratory[冷泉港实验室]:冷泉港,纽约州(1989);Silhavy TJ,Bennan ML和EnquistLW,Experiments with Gene Fusions[使用基因融合的实验],Cold Spring HarborLaboratory[冷泉港实验室]:冷泉港,纽约州(1984);Ausubel FM等人,Current Protocols in Molecular Biology[分子生物学当前方案],由以下出版:Greene Publishing Assoc.[格林出版联合公司]和Wiley-Interscience[威利交叉科学出版社],霍博肯格林,新泽西州(1987);以及Innis MA,Gelfand DH,Sninsky JJ和White TJ(编辑),PCR Protocols:A Guide to Methods and Applications,[PCR方案:方法与应用指南]Academic Press,Inc.[学术出版社公司],圣地亚哥,加利福尼亚州(1990)。
可以任选地通过包括蛋白质测序步骤的方法进行如以上公开的亲本葡糖基转移酶的鉴定。这种蛋白质测序步骤可以包括一种或多种程序,例如N-末端氨基酸分析、C-末端氨基酸分析、埃德曼降解、或质谱法。
可以任选地通过包括蛋白质结合步骤的方法进行如以上公开的亲本葡糖基转移酶的鉴定。可以使用例如与SEQ ID NO:3内(例如,SEQ ID NO:2的位置477-1322内)的基序或表位结合的抗体进行这种蛋白质结合步骤。
在一些方面,步骤(a)中鉴定的多核苷酸(即,在步骤[b]中进行其修饰之前)可以编码葡糖基转移酶,所述葡糖基转移酶包含与表1中公开的任何葡糖基转移酶的氨基酸序列相同或与其至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或99.5%同一的氨基酸序列。由这种葡糖基转移酶产生的α-葡聚糖可以例如是如本文所公开的。
制备编码本文的非天然葡糖基转移酶的多核苷酸序列的方法包括修饰步骤(a)中鉴定的多核苷酸序列(编码亲本葡糖基转移酶)的步骤(b)。这种修饰在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处取代亲本葡糖基转移酶的至少一个氨基酸。由这样的一个或多个取代得到的非天然葡糖基转移酶(由经修饰的多核苷酸序列编码)可以任选地被表征为本文的“子代葡糖基转移酶”。
对步骤(b)中多核苷酸的适合的修饰可以遵循本领域已知的任何DNA操作技术进行。修饰步骤(b)可任选地经由计算机模拟进行,然后合成编码非天然葡糖基转移酶的多核苷酸序列。例如,可以使用适合的序列操作程序/软件(例如,VECTOR NTI,生命技术公司(Life Technologies),卡尔斯巴德(Carlsbad),加利福尼亚州;DNAStrider;DNASTAR,麦迪逊,威斯康星州)经由计算机模拟对步骤(a)中鉴定的多核苷酸序列进行操作。在这种虚拟操作之后,可以通过任何适合的技术(例如,基于退火的寡核苷酸连接,或在Hughes等人,Methods Enzymol.[酶学方法]498:277-309中公开的任何技术,将其通过引用并入本文)人工合成经修饰的多核苷酸序列。应当理解,不认为前述方法必然依赖于使预先存在的多核苷酸(编码亲本葡糖基转移酶)受控。
使用在步骤(a)中鉴定的编码亲本葡糖基转移酶的多核苷酸序列的物理拷贝可以任选地进行修饰步骤(b)。作为实例,使用按使得扩增产物编码本文的非天然葡糖基转移酶的方式设计的引物,这种多核苷酸可以用作扩增模板(例如,参考Innis等人,同上)。
此方法中的氨基酸取代可以是如本文公开的一个或多个取代。例如,基本上,如目前公开的任何非天然葡糖基转移酶可以通过如通过此方法制备的多核苷酸编码。
本文公开的组合物和方法的非限制性实例包括:
1.一种非天然葡糖基转移酶,所述非天然葡糖基转移酶在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处包含至少一个氨基酸取代,其中所述非天然葡糖基转移酶能够从受体分子形成至少一个α-1,3分支。
2.如实施例1所述的非天然葡糖基转移酶,其中在与氨基酸残基Ser-734相对应的位置处的氨基酸被Cys、Asp、Gly、His、Lys、Leu、Met、Asn、Thr、或Val残基取代;在与氨基酸残基Ile-735相对应的位置处的氨基酸被Ala、Leu、或Val残基取代;在与氨基酸残基Ile-737相对应的位置处的氨基酸被Ala、Cys、Asp、Gly、His、Leu、Met、Asn、Ser、Val、Trp、或Tyr残基取代;在与氨基酸残基Ile-740相对应的位置处的氨基酸被Ala、Leu、或Val残基取代;在与氨基酸残基Asp-744相对应的位置处的氨基酸被Ala、Cys、Glu、Phe、Gly、His、Lys、Met、Asn、Pro、Gln、Arg、Ser、Thr、Val、Trp、或Tyr残基取代;在与氨基酸残基His-771相对应的位置处的氨基酸被Ala残基取代;在与氨基酸残基Val-772相对应的位置处的氨基酸被Ala或Leu残基取代;在与氨基酸残基Ser-773相对应的位置处的氨基酸被Ala或Asn残基取代;在与氨基酸残基Val-775相对应的位置处的氨基酸被Ala残基取代;在与氨基酸残基Ser-778相对应的位置处的氨基酸被Trp残基取代;在与氨基酸残基Ala-779相对应的位置处的氨基酸被Asp、Gly、或Ser残基取代;在与氨基酸残基Asp-780相对应的位置处的氨基酸被Ala、Gln、或Tyr残基取代;在与氨基酸残基Ile-845相对应的位置处的氨基酸被Ala或Phe残基取代;在与氨基酸残基Val-846相对应的位置处的氨基酸被Ala、Ile、或Thr残基取代;在与氨基酸残基Asp-852相对应的位置处的氨基酸被Ala、Glu、Leu、或Asn残基取代;在与氨基酸残基Ile-853相对应的位置处的氨基酸被Val残基取代;在与氨基酸残基Asp-855相对应的位置处的氨基酸被Ala、Gly、或Ser残基取代;在与氨基酸残基Ser-858相对应的位置处的氨基酸被Ala、Gly、Gln、或Arg残基取代;在与氨基酸残基Asn-859相对应的位置处的氨基酸被Ala、Asp、Glu、Lys、Ser、或Thr残基取代;在与氨基酸残基Ala-1232相对应的位置处的氨基酸被Cys、Asp、Glu、Phe、Gly、His、Leu、Met、Asn、Pro、Gln、Ser、Thr、Val、或Tyr残基取代;在与氨基酸残基Tyr-1234相对应的位置处的氨基酸被Cys、Glu、His、Leu、Met、Thr、Val、或Trp残基取代;和/或在与氨基酸残基Asn-1237相对应的位置处的氨基酸被Asp或Gly残基取代。
3.如实施例1或2所述的非天然葡糖基转移酶,其包含两个或更多个氨基酸取代,其中所述取代中的至少一个在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处。
4.如实施例1、2或3所述的非天然葡糖基转移酶,其中所述取代中的至少一个在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ser-778、Asp-780、Ile-845、Asp-852、Ile-853、Asp-855、Ala-1232、或Tyr-1234相对应的位置处,任选地,其中:在与氨基酸残基Ser-734相对应的位置处的氨基酸被Cys残基取代;在与氨基酸残基Ile-735相对应的位置处的氨基酸被Val残基取代;在与氨基酸残基Ser-778相对应的位置处的氨基酸被Trp残基取代;在与氨基酸残基Asp-780相对应的位置处的氨基酸被Tyr残基取代;在与氨基酸残基Ile-845相对应的位置处的氨基酸被Phe残基取代;在与氨基酸残基Asp-852相对应的位置处的氨基酸被Glu残基取代;在与氨基酸残基Ile-853相对应的位置处的氨基酸被Val残基取代;在与氨基酸残基Asp-855相对应的位置处的氨基酸被Gly残基取代;在与氨基酸残基Ala-1232相对应的位置处的氨基酸被Gly、Met、Ser、或Val残基取代;和/或在与氨基酸残基Tyr-1234相对应的位置处的氨基酸被Trp残基取代。
5.如实施例1、2、3、或4所述的非天然葡糖基转移酶,其中所述受体分子包含葡聚糖。
6.如实施例5所述的非天然葡糖基转移酶,其中所述葡聚糖是可溶性葡聚糖。
7.如实施例5或6所述的非天然葡糖基转移酶,其中所述葡聚糖包含α-葡聚糖。
8.如实施例7所述的非天然葡糖基转移酶,其中所述α-葡聚糖包含右旋糖酐。
9.如实施例1、2、3、4、5、6、7、或8所述的非天然葡糖基转移酶,其中所述非天然葡糖基转移酶仅在一个或多个取代位置处与第二葡糖基转移酶不同,其中所述非天然葡糖基转移酶的α-1,3分支活性是所述第二葡糖基转移酶的α-1,3分支活性的至少约50%。
10.如实施例1、2、3、4、5、6、7、8、或9所述的非天然葡糖基转移酶,其中所述非天然葡糖基转移酶仅在一个或多个取代位置处与第二葡糖基转移酶不同,其中所述第二葡糖基转移酶包含以下基序:(i)与SEQ ID NO:9至少80%同一的氨基酸序列、(ii)与SEQ ID NO:10至少80%同一的氨基酸序列、(iii)与SEQ ID NO:11至少80%同一的氨基酸序列、和(iv)与SEQ ID NO:12至少80%同一的氨基酸序列。
11.如实施例1、2、3、4、5、6、7、8、9、或10所述的非天然葡糖基转移酶,其中所述非天然葡糖基转移酶包含与SEQ ID NO:2的残基477-1322、或SEQ ID NO:13的残基446-1313至少约90%同一的氨基酸序列。
12.如实施例1、2、3、4、5、6、7、8、9、10、或11所述的非天然葡糖基转移酶,其中所述非天然葡糖基转移酶包含与SEQ ID NO:2、3、或15至少约90%同一的氨基酸序列。
13.一种多核苷酸,所述多核苷酸包含编码如实施例1、2、3、4、5、6、7、8、9、10、11、或12所述的非天然葡糖基转移酶的核苷酸序列,任选地其中一个或多个调节序列有效地连接到所述核苷酸序列,并且优选地其中所述一个或多个调节序列包括启动子序列。
14.一种反应组合物,所述反应组合物包含水、蔗糖、受体分子、和如实施例1、2、3、4、5、6、7、8、9、10、11或12所述的非天然葡糖基转移酶。
15.如实施例14所述的反应组合物,其中所述受体分子包含葡聚糖,任选地,其中:(i)所述葡聚糖是可溶性葡聚糖,和/或(ii)所述葡聚糖包含α-葡聚糖,优选地,其中所述α-葡聚糖包含右旋糖酐。
16.一种生产包含至少一个α-1,3分支的葡聚糖组合物的方法,所述方法包括:(a)使至少水、蔗糖、葡聚糖底物、和如实施例1、2、3、4、5、6、7、8、9、10、11、或12所述的非天然葡糖基转移酶接触,从而产生包含至少一个α-1,3分支的葡聚糖组合物;和(b)任选地,分离在步骤(a)中产生的所述葡聚糖组合物。
16b.一种葡聚糖组合物,所述葡聚糖组合物通过(i)如实施例14或15所述的反应组合物、或(ii)如实施例16所述的方法产生。
17.一种制备编码非天然葡糖基转移酶的多核苷酸序列的方法,所述方法包括:(a)鉴定编码亲本葡糖基转移酶的多核苷酸序列,所述亲本葡糖基转移酶(i)包含与SEQ IDNO:3或SEQ ID NO:2的位置477-1322至少约40%同一的氨基酸序列,并且(ii)能够从受体分子形成至少一个α-1,3分支;和(b)修饰步骤(a)中鉴定的多核苷酸序列以在与SEQ IDNO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处取代所述亲本葡糖基转移酶的至少一个氨基酸,从而提供编码非天然葡糖基转移酶的多核苷酸序列,所述非天然葡糖基转移酶从受体分子形成至少一个α-1,3分支。
18.如实施例17所述的方法,其中按以下进行所述鉴定步骤:(a)经由计算机模拟,(b)用包括核酸杂交步骤的方法,(c)用包括蛋白质测序步骤的方法,和/或(d)用包括蛋白质结合步骤的方法;和/或其中按以下进行所述修饰步骤:(e)经由计算机模拟,随后合成编码所述非天然葡糖基转移酶的多核苷酸序列,或(f)使用编码亲本葡糖基转移酶的多核苷酸序列的物理拷贝。
实例
本公开在以下实例中进一步举例说明。应当理解,尽管这些实例指示了本文的某些方面,但其仅以说明的方式给出。从上述论述和这些实例中,本领域的技术人员可以确定所公开的实施例的本质特征,并且在不脱离所公开的实施例的精神和范围的情况下,可以进行各种变化和修改以使所公开的实施例适应多种用途和条件。
实例1
影响α-1,3-分支酶活性的氨基酸位点的分析
此实例描述了筛选α-1,3-分支葡糖基转移酶变体的α-1,3-分支活性。特别地,在右旋糖酐底物上测试了在保守基序中含有单个氨基酸取代的酶变体的α-1,3-分支活性。已鉴定几个α-1,3-分支葡糖基转移酶变体与非氨基酸取代的对照酶相比具有相似的或增强的α-1,3-分支活性。
在此实例中,进行氨基酸取代的α-1,3-分支葡糖基转移酶的氨基酸序列是SEQ IDNO:2(GTF 2592)(由SEQ ID NO:1编码)。此酶可以经由α-1,3-糖苷键添加分支至葡聚糖底物如右旋糖酐;每个分支典型地是侧链葡萄糖。GTF 2592基本上是来自谲诈明串珠菌的全长(未成熟)野生型α-1,3-分支葡糖基转移酶(由SEQ ID NO:4表示)的N-末端截短版本(去除所有信号肽)。除了具有N-末端截短外,GTF 2592(SEQ ID NO:2)具有C-末端聚组氨酸(6xHis)标签。GTF 2592(SEQ ID NO:2)与SEQ ID NO:3在结构上和功能上相对应,所述SEQID NO:3是不具有起始甲硫氨酸和6xHis标签的GTF 2592。GTF 2592(SEQ ID NO:2)中进行的氨基酸取代可以被表征为取代天然氨基酸残基,因为SEQ ID NO:2的每个氨基酸残基/位置(除了SEQ ID NO:2的Met-1残基和C-末端6xHis标签)与SEQ ID NO:4中的氨基酸残基/位置相对应。
GTF 2592含有四个基序(I-IV),在下表2中列出了所述基序。这些基序相对于其他α-1,3-分支葡糖基转移酶是保守的(参考Vuillemin等人,2016,J.Biol.Chem.[生物化学杂志]14:7687-7702;美国专利申请公开号2016/0136199;将二者均通过引用并入本文)。在GTF 2592中这些基序的每个中的不同位置处进行此实例中的氨基酸取代。
表2
GTF 2592的保守基序
应注意,将GTF 2592(SEQ ID NO:2)的氨基酸残基477-1322与柠檬明串珠菌α-1,3-分支酶BRS-B的片段(BRS-B-Δ1)的整个氨基酸序列进行比对(通过进行CLUSTAL OMEGA比对,数据未显示)。Vuillemin等人(同上)公开了代表BRS-B(SEQ ID NO:13)的残基446-1313的BRS-B-Δ1(SEQ ID NO:14)具有与BRS-B相似的分支活性。因此,预期包含GTF 2592(SEQ ID NO:2或3)的氨基酸残基477-1322或相关序列(例如,与GTF 2592的氨基酸残基477-1322至少90%同一)的蛋白质与GTF 2592(SEQ ID NO:2)具有相同或相似的α-1,3-分支活性。SEQ ID NO:15是SEQ ID NO:13的BRS-B的成熟(无信号肽)对应物。
通过基于PCR的诱变来分别制备用于编码每个氨基酸取代的核酸突变。简言之,通过典型的PCR反应,使用编码GTF 2592的DNA(SEQ ID NO:1)作为模板、合适的编码突变的正向引物、和合适的共有的反向引物(序列未显示)来产生含有个体突变的DNA片段。然后使用LightningTM定点诱变试剂盒(安捷伦公司(Agilent),目录号210518)按照制造商的方案来用DNA片段产生编码单个氨基酸取代版本的GTF 2592的DNA。
在大肠杆菌Bw25113(ΔilvC)中制备用于分别表达GTF 2592(pBAD-GTF2592)和其每种单个氨基酸取代的变体的质粒(pBAD载体,赛默飞世尔科技公司(Thermo FisherScientific)),所述大肠杆菌Bw25113是具有一个额外的敲除(ΔilvC)的F-、λ-、大肠杆菌K-12菌株BD792(CGSC6159)的衍生物。对所得的编码单个氨基酸取代的酶的质粒进行测序来验证每个取代。使用具有100mg/L氨苄西林的LB琼脂平板用于选择转化体。
为产生GTF 2592(SEQ ID NO:2)及其单个氨基酸取代的变体,将用pBAD-GTF2592或其突变版本转化的大肠杆菌Bw25113在37℃在具有100mg/L氨苄西林的LB培养基中培养。每个培养物的OD600达到0.8之后,添加L-阿拉伯糖至最终浓度为0.025%,然后使培养物在18℃生长过夜。然后收获细胞并在室温下用5%培养体积的B-PERTM(赛默飞世尔科技公司)裂解细胞约1小时。离心裂解的细胞以去除细胞碎片并将所得上清液用在α-1,3-分支反应(以下)中。
进行单个反应以测试右旋糖酐底物上每种酶(GTF 2592[SEQ ID NO:2]或其单个氨基酸取代的变体)的α-1,3-分支活性。用于此研究的右旋糖酐获得自西格玛-奥德里奇公司(Sigma-Aldrich)(目录号D1662,“来自肠膜状明串珠菌的右旋糖酐”,平均分子量为35000-45000,约95%α-1,6键)。准备包含右旋糖酐、蔗糖、水和如上制备的酶的每个分支反应,并且用与以下相同或相似的参数进行:容器,以300rpm搅拌的96深孔板;初始pH,5.5;反应体积,0.8mL;蔗糖,50g/L;右旋糖酐,50g/L;GTF,异源表达酶的大肠杆菌细胞的0.0875mL裂解物;乙酸钠,50mM,pH 5.5;温度,30℃;时间,约两天。然后将反应在80℃加热灭活30分钟。将所得产物收获并通过NMR分析α-1,3-连接的分支。将每种单个氨基酸取代的变体酶的分支活性针对GTF 2592(SEQ ID NO:2)的分支活性归一化,并在下表3中示出。
表3
GTF 2592(SEQ ID NO:2)的单个氨基酸取代的变体的α-1,3-分支活性
a列出的每种具有取代的GTF是在各自位置处包含取代的GTF 2592的一个版本,其中所述位置编号与SEQ ID NO:4(GTF 2592的全长野生型版本)的残基编号相对应。首先列出的是野生型残基(残基位置编号之前),第二列出的是取代的残基(残基位置编号之后)(贯穿本公开应用该“野生型残基-位置编号-变体残基”标注形式)。
bGTF 2592,SEQ ID NO:2。无氨基酸取代(对照)。
c相对于针对对照(不具有取代的GTF 2592)测量的α-1,3-分支活性的α-1,3-分支活性百分比。
d单个氨基酸取代位于其中的保守基序。表2列出了GTF 2592中保守基序I-IV中每个的位置。
基于表3中的数据,当用各种单个氨基酸取代修饰时,似乎α-1,3-分支葡糖基转移酶(如GTF 2592)保留其大部分或所有活性。几个氨基酸取代增强此活性。
实例2
两个或更多个氨基酸取代对α-1,3-分支酶活性的影响的分析
此实例描述了将多个氨基酸取代引入α-1,3-分支葡糖基转移酶中并确定其对α-1,3-分支活性的影响。鉴定了氨基酸取代的各种组合,所述组合允许变体酶与非氨基酸取代的对照酶相比具有相似的α-1,3-分支活性。
在此实例中,进行氨基酸取代的α-1,3-分支葡糖基转移酶的氨基酸序列是SEQ IDNO:2(GTF 2592)(由SEQ ID NO:1编码),与实例1中相同。简言之,使用上述的定点诱变和酶表达技术,产生在(i)保守基序I-IV中的一个中,或(ii)所有四个保守基序I-IV中具有多个氨基酸取代的酶。将每种变体酶加入分支反应中,所述反应用与实例1中描述的那些相同的参数,并且以相同的方式分析这些反应的产物。将每种多个氨基酸取代的变体酶的分支活性针对GTF 2592(SEQ ID NO:2)的分支活性归一化,并在下表4和5中示出。
表4
在保守基序I-IV中的一个中具有多个氨基酸取代的GTF 2592(SEQ ID
NO:2)变体
的α-1,3-分支活性
a列出的每种具有取代的GTF是在各自位置处包含取代的GTF 2592的一个版本,其中每个位置编号与SEQ ID NO:4(GTF 2592的全长野生型版本)的残基编号相对应。
bGTF 2592,SEQ ID NO:2。无氨基酸取代(对照)。
c相对于针对对照(不具有取代的GTF 2592)测量的α-1,3-分支活性的α-1,3-分支活性百分比。
d氨基酸取代位于其中的保守基序。表2列出了GTF 2592中保守基序I-IV中每个的位置。
表5
在保守基序I-IV中的多于一个中具有多个氨基酸取代的GTF
2592(SEQ
ID NO:2)
变体的α-1,3-分支活性
aGTF 2592,SEQ ID NO:2。无氨基酸取代(对照)。
b以下每行代表在各自位置处包含取代的GTF 2592的一个版本,其中每个位置编号与SEQ ID NO:4(GTF 2592的全长野生型版本)的残基编号相对应。每种酶中的取代是根据其所在的基序(I-IV)而组织的。
c相对于针对对照(不具有取代的GTF 2592)测量的α-1,3-分支活性的α-1,3-分支活性百分比。
基于表4和5中的数据,当经修饰以具有多个氨基酸取代时,似乎α-1,3-分支葡糖基转移酶(如GTF 2592)保留了分支活性。例如,几种取代组合可用于期望更低的分支活性的应用中。
Claims (18)
1.一种非天然葡糖基转移酶,所述非天然葡糖基转移酶在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处包含至少一个氨基酸取代,
其中所述非天然葡糖基转移酶能够从受体分子形成至少一个α-1,3分支。
2.如权利要求1所述的非天然葡糖基转移酶,其中:
在与氨基酸残基Ser-734相对应的位置处的氨基酸被Cys、Asp、Gly、His、Lys、Leu、Met、Asn、Thr、或Val残基取代;
在与氨基酸残基Ile-735相对应的位置处的氨基酸被Ala、Leu、或Val残基取代;
在与氨基酸残基Ile-737相对应的位置处的氨基酸被Ala、Cys、Asp、Gly、His、Leu、Met、Asn、Ser、Val、Trp、或Tyr残基取代;
在与氨基酸残基Ile-740相对应的位置处的氨基酸被Ala、Leu、或Val残基取代;
在与氨基酸残基Asp-744相对应的位置处的氨基酸被Ala、Cys、Glu、Phe、Gly、His、Lys、Met、Asn、Pro、Gln、Arg、Ser、Thr、Val、Trp、或Tyr残基取代;
在与氨基酸残基His-771相对应的位置处的氨基酸被Ala残基取代;
在与氨基酸残基Val-772相对应的位置处的氨基酸被Ala或Leu残基取代;
在与氨基酸残基Ser-773相对应的位置处的氨基酸被Ala或Asn残基取代;
在与氨基酸残基Val-775相对应的位置处的氨基酸被Ala残基取代;
在与氨基酸残基Ser-778相对应的位置处的氨基酸被Trp残基取代;
在与氨基酸残基Ala-779相对应的位置处的氨基酸被Asp、Gly、或Ser残基取代;
在与氨基酸残基Asp-780相对应的位置处的氨基酸被Ala、Gln、或Tyr残基取代;
在与氨基酸残基Ile-845相对应的位置处的氨基酸被Ala或Phe残基取代;
在与氨基酸残基Val-846相对应的位置处的氨基酸被Ala、Ile、或Thr残基取代;
在与氨基酸残基Asp-852相对应的位置处的氨基酸被Ala、Glu、Leu、或Asn残基取代;
在与氨基酸残基Ile-853相对应的位置处的氨基酸被Val残基取代;
在与氨基酸残基Asp-855相对应的位置处的氨基酸被Ala、Gly、或Ser残基取代;
在与氨基酸残基Ser-858相对应的位置处的氨基酸被Ala、Gly、Gln、或Arg残基取代;
在与氨基酸残基Asn-859相对应的位置处的氨基酸被Ala、Asp、Glu、Lys、Ser、或Thr残基取代;
在与氨基酸残基Ala-1232相对应的位置处的氨基酸被Cys、Asp、Glu、Phe、Gly、His、Leu、Met、Asn、Pro、Gln、Ser、Thr、Val、或Tyr残基取代;
在与氨基酸残基Tyr-1234相对应的位置处的氨基酸被Cys、Glu、His、Leu、Met、Thr、Val、或Trp残基取代;和/或
在与氨基酸残基Asn-1237相对应的位置处的氨基酸被Asp或Gly残基取代。
3.如权利要求1所述的非天然葡糖基转移酶,其包含两个或更多个氨基酸取代,其中所述取代中的至少一个在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处。
4.如权利要求3所述的非天然葡糖基转移酶,其中所述取代中的至少一个在与SEQ IDNO:4的氨基酸残基Ser-734、Ile-735、Ser-778、Asp-780、Ile-845、Asp-852、Ile-853、Asp-855、Ala-1232、或Tyr-1234相对应的位置处,
任选地,其中:
在与氨基酸残基Ser-734相对应的位置处的氨基酸被Cys残基取代;
在与氨基酸残基Ile-735相对应的位置处的氨基酸被Val残基取代;
在与氨基酸残基Ser-778相对应的位置处的氨基酸被Trp残基取代;
在与氨基酸残基Asp-780相对应的位置处的氨基酸被Tyr残基取代;
在与氨基酸残基Ile-845相对应的位置处的氨基酸被Phe残基取代;
在与氨基酸残基Asp-852相对应的位置处的氨基酸被Glu残基取代;
在与氨基酸残基Ile-853相对应的位置处的氨基酸被Val残基取代;
在与氨基酸残基Asp-855相对应的位置处的氨基酸被Gly残基取代;
在与氨基酸残基Ala-1232相对应的位置处的氨基酸被Gly、Met、Ser、或Val残基取代;和/或
在与氨基酸残基Tyr-1234相对应的位置处的氨基酸被Trp残基取代。
5.如权利要求1所述的非天然葡糖基转移酶,其中所述受体分子包含葡聚糖。
6.如权利要求5所述的非天然葡糖基转移酶,其中所述葡聚糖是可溶性葡聚糖。
7.如权利要求5所述的非天然葡糖基转移酶,其中所述葡聚糖包含α-葡聚糖。
8.如权利要求7所述的非天然葡糖基转移酶,其中所述α-葡聚糖包含右旋糖酐。
9.如权利要求1所述的非天然葡糖基转移酶,其中所述非天然葡糖基转移酶仅在一个或多个取代位置处与第二葡糖基转移酶不同,其中所述非天然葡糖基转移酶的α-1,3分支活性是所述第二葡糖基转移酶的α-1,3分支活性的至少约50%。
10.如权利要求1所述的非天然葡糖基转移酶,其中所述非天然葡糖基转移酶仅在一个或多个取代位置处与第二葡糖基转移酶不同,其中所述第二葡糖基转移酶包含以下基序:
(i)与SEQ ID NO:9至少80%同一的氨基酸序列,
(ii)与SEQ ID NO:10至少80%同一的氨基酸序列,
(iii)与SEQ ID NO:11至少80%同一的氨基酸序列,和
(iv)与SEQ ID NO:12至少80%同一的氨基酸序列。
11.如权利要求1所述的非天然葡糖基转移酶,其中所述非天然葡糖基转移酶包含与SEQ ID NO:2的残基477-1322、或SEQ ID NO:13的残基446-1313至少约80%同一的氨基酸序列。
12.如权利要求1所述的非天然葡糖基转移酶,其中所述非天然葡糖基转移酶包含与SEQ ID NO:2、3、或15至少约80%同一的氨基酸序列。
13.一种多核苷酸,所述多核苷酸包含编码如权利要求1所述的非天然葡糖基转移酶的核苷酸序列,任选地其中一个或多个调节序列有效地连接到所述核苷酸序列,并且优选地其中所述一个或多个调节序列包括启动子序列。
14.一种反应组合物,所述反应组合物包含水、蔗糖、受体分子、和如权利要求1所述的非天然葡糖基转移酶。
15.如权利要求14所述的反应组合物,其中所述受体分子包含葡聚糖,任选地,其中:
(i)所述葡聚糖是可溶性葡聚糖,和/或
(ii)所述葡聚糖包含α-葡聚糖,优选地,其中所述α-葡聚糖包含右旋糖酐。
16.一种生产包含至少一个α-1,3分支的葡聚糖组合物的方法,所述方法包括:
(a)使至少水、蔗糖、葡聚糖底物、和如权利要求1所述的非天然葡糖基转移酶接触,从而产生包含至少一个α-1,3分支的葡聚糖组合物;和
(b)任选地,分离在步骤(a)中产生的所述葡聚糖组合物。
17.一种制备编码非天然葡糖基转移酶的多核苷酸序列的方法,所述方法包括:
(a)鉴定编码亲本葡糖基转移酶的多核苷酸序列,所述亲本葡糖基转移酶(i)包含与SEQ ID NO:3或SEQ ID NO:2的位置477-1322至少约40%同一的氨基酸序列,并且(ii)能够从受体分子形成至少一个α-1,3分支;
和
(b)修饰步骤(a)中鉴定的所述多核苷酸序列以在与SEQ ID NO:4的氨基酸残基Ser-734、Ile-735、Ile-737、Ile-740、Asp-744、His-771、Val-772、Ser-773、Val-775、Ser-778、Ala-779、Asp-780、Ile-845、Val-846、Asp-852、Ile-853、Asp-855、Ser-858、Asn-859、Ala-1232、Tyr-1234、或Asn-1237相对应的位置处取代所述亲本葡糖基转移酶的至少一个氨基酸,
从而提供编码非天然葡糖基转移酶的多核苷酸序列,所述非天然葡糖基转移酶从受体分子形成至少一个α-1,3分支。
18.如权利要求17所述的方法,其中按以下进行所述鉴定步骤:
(a)经由计算机模拟,
(b)用包括核酸杂交步骤的方法,
(c)用包括蛋白质测序步骤的方法,和/或
(d)用包括蛋白质结合步骤的方法;
和/或其中按以下进行所述修饰步骤:
(e)经由计算机模拟,随后合成编码所述非天然葡糖基转移酶的多核苷酸序列,或
(f)使用编码所述亲本葡糖基转移酶的多核苷酸序列的物理拷贝。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962871796P | 2019-07-09 | 2019-07-09 | |
US62/871,796 | 2019-07-09 | ||
PCT/US2020/041093 WO2021007264A1 (en) | 2019-07-09 | 2020-07-08 | Engineered alpha-1,3 branching enzymes |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115003805A true CN115003805A (zh) | 2022-09-02 |
Family
ID=71944300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080061413.4A Pending CN115003805A (zh) | 2019-07-09 | 2020-07-08 | 工程化的α-1,3分支酶 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220267745A1 (zh) |
EP (1) | EP3997216A1 (zh) |
CN (1) | CN115003805A (zh) |
WO (1) | WO2021007264A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3180753A1 (en) | 2020-06-04 | 2021-12-09 | Douglas J. Adelman | Dextran-alpha-glucan graft copolymers and derivatives thereof |
EP4165091A1 (en) | 2020-06-10 | 2023-04-19 | Nutrition & Biosciences USA 4, Inc. | Poly alpha-1,6-glucan esters and compositions comprising same |
WO2021252569A1 (en) | 2020-06-10 | 2021-12-16 | Nutrition & Biosciences USA 4, Inc. | Poly alpha-1,6-glucan derivatives and compositions comprising same |
EP4168457A1 (en) | 2020-06-18 | 2023-04-26 | Nutrition & Biosciences USA 4, Inc. | Cationic poly alpha-1,6-glucan ethers and compositions comprising same |
WO2022178073A1 (en) | 2021-02-19 | 2022-08-25 | Nutrition & Biosciences USA 4, Inc. | Polysaccharide derivatives for detergent compositions |
CN117616054A (zh) | 2021-07-13 | 2024-02-27 | 营养与生物科学美国4公司 | 阳离子葡聚糖酯衍生物 |
WO2023081346A1 (en) | 2021-11-05 | 2023-05-11 | Nutrition & Biosciences USA 4, Inc. | Glucan derivatives for microbial control |
WO2023114942A1 (en) | 2021-12-16 | 2023-06-22 | Nutrition & Biosciences USA 4, Inc. | Compositions comprising cationic alpha-glucan ethers in aqueous polar organic solvents |
WO2024015769A1 (en) | 2022-07-11 | 2024-01-18 | Nutrition & Biosciences USA 4, Inc. | Amphiphilic glucan ester derivatives |
WO2024081773A1 (en) | 2022-10-14 | 2024-04-18 | Nutrition & Biosciences USA 4, Inc. | Compositions comprising water, cationic alpha-1,6-glucan ether and organic solvent |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150064748A1 (en) * | 2013-09-05 | 2015-03-05 | E I Du Pont De Nemours And Company | Process for producing aplha-1,3-glucan polymer with reduced molecular weight |
US20150218532A1 (en) * | 2014-02-06 | 2015-08-06 | The United States Of America, As Represented By The Secretary Of Agriculture | Modified Glucansucrase and Related Methods |
CN107922958A (zh) * | 2015-06-17 | 2018-04-17 | 纳幕尔杜邦公司 | 用于产生线性聚α‑1,3‑葡聚糖的葡糖基转移酶氨基酸序列基序 |
CN108289494A (zh) * | 2015-11-26 | 2018-07-17 | 纳幕尔杜邦公司 | 能够产生具有α-1,2分支的葡聚糖的多肽及其用途 |
WO2019007999A1 (en) * | 2017-07-03 | 2019-01-10 | Institut Pasteur | PROTECTED TETRAHOLOSIDES, PROCESS FOR THE PREPARATION THEREOF AND THEIR USE AS TRANSGLUCOSYLASE ACCEPTING SUBSTRATES IN THE CHEMO-ENZYMATIC SYNTHESIS OF SPECIFIC SHIGELLA FLEXNERI OLIGOSACCHARIDES |
CN109715818A (zh) * | 2016-09-14 | 2019-05-03 | 纳幕尔杜邦公司 | 工程化的葡糖基转移酶 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100494813B1 (ko) * | 2003-04-25 | 2005-06-13 | 김도만 | 변형된 덱스트란수크라아제 유전자, 그 유전자를 포함하는재조합벡터, 이러한 재조합벡터로 형질전환된 미생물, 및이러한 미생물로부터 생산된 덱스트란수크라아제 |
FR3007038B1 (fr) | 2013-06-17 | 2016-02-26 | Agronomique Inst Nat Rech | Polypeptide ayant la capacite de former des branchements d'unites glucosyle en alpha-1,3 sur un accepteur |
CA2949289A1 (en) | 2014-05-29 | 2015-12-03 | E. I. Du Pont De Nemours And Company | Enzymatic synthesis of soluble glucan fiber |
AU2015342990B2 (en) | 2014-11-05 | 2019-08-29 | Nutrition & Biosciences USA 4, Inc. | Enzymatically polymerized gelling dextrans |
EP4137207A1 (en) | 2015-11-05 | 2023-02-22 | Nutrition & Biosciences USA 4, Inc. | Dextran-poly alpha-1,3-glucan graft copolymers and synthesis methods thereof |
WO2019055373A1 (en) * | 2017-09-13 | 2019-03-21 | E. I. Du Pont De Nemours And Company | GLUCOSYLTRANSFERASES MODIFIED |
-
2020
- 2020-07-08 WO PCT/US2020/041093 patent/WO2021007264A1/en unknown
- 2020-07-08 US US17/625,136 patent/US20220267745A1/en active Pending
- 2020-07-08 EP EP20750901.9A patent/EP3997216A1/en active Pending
- 2020-07-08 CN CN202080061413.4A patent/CN115003805A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150064748A1 (en) * | 2013-09-05 | 2015-03-05 | E I Du Pont De Nemours And Company | Process for producing aplha-1,3-glucan polymer with reduced molecular weight |
US20150218532A1 (en) * | 2014-02-06 | 2015-08-06 | The United States Of America, As Represented By The Secretary Of Agriculture | Modified Glucansucrase and Related Methods |
CN107922958A (zh) * | 2015-06-17 | 2018-04-17 | 纳幕尔杜邦公司 | 用于产生线性聚α‑1,3‑葡聚糖的葡糖基转移酶氨基酸序列基序 |
CN108289494A (zh) * | 2015-11-26 | 2018-07-17 | 纳幕尔杜邦公司 | 能够产生具有α-1,2分支的葡聚糖的多肽及其用途 |
CN109715818A (zh) * | 2016-09-14 | 2019-05-03 | 纳幕尔杜邦公司 | 工程化的葡糖基转移酶 |
WO2019007999A1 (en) * | 2017-07-03 | 2019-01-10 | Institut Pasteur | PROTECTED TETRAHOLOSIDES, PROCESS FOR THE PREPARATION THEREOF AND THEIR USE AS TRANSGLUCOSYLASE ACCEPTING SUBSTRATES IN THE CHEMO-ENZYMATIC SYNTHESIS OF SPECIFIC SHIGELLA FLEXNERI OLIGOSACCHARIDES |
Non-Patent Citations (2)
Title |
---|
VUILLEMIN M等: "Characterization of the First α-(1→3) Branching Sucrases of the GH70 Family", THE JOURNAL OF BIOLOGICAL CHEMISTRY, vol. 291, no. 14, 13 January 2016 (2016-01-13), pages 7687 - 7702, XP055320418, DOI: 10.1074/jbc.M115.688044 * |
黎志德等: "葡聚糖蔗糖酶及其家族在结构与功能上的研究进展", 现代食品科技, vol. 39, no. 12, 31 December 2023 (2023-12-31), pages 336 - 344 * |
Also Published As
Publication number | Publication date |
---|---|
US20220267745A1 (en) | 2022-08-25 |
EP3997216A1 (en) | 2022-05-18 |
WO2021007264A1 (en) | 2021-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115003805A (zh) | 工程化的α-1,3分支酶 | |
AU2017326168B2 (en) | Engineered glucosyltransferases | |
JP7405742B2 (ja) | 遺伝子操作されたグルコシルトランスフェラーゼ | |
JP7384787B2 (ja) | 遺伝子操作されたグルコシルトランスフェラーゼ | |
US10508268B2 (en) | Modified glucosyltransferases for producing branched alpha-glucan polymers | |
US11198853B2 (en) | Engineered glucosyltransferases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |