CN103827298A - 脂肪酶变体及其编码多核苷酸 - Google Patents
脂肪酶变体及其编码多核苷酸 Download PDFInfo
- Publication number
- CN103827298A CN103827298A CN201280045174.9A CN201280045174A CN103827298A CN 103827298 A CN103827298 A CN 103827298A CN 201280045174 A CN201280045174 A CN 201280045174A CN 103827298 A CN103827298 A CN 103827298A
- Authority
- CN
- China
- Prior art keywords
- variant
- seq
- sequence
- polynucleotide
- lipase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 84
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 83
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 83
- 108090001060 Lipase Proteins 0.000 title claims description 90
- 102000004882 Lipase Human genes 0.000 title claims description 90
- 239000004367 Lipase Substances 0.000 title claims description 90
- 235000019421 lipase Nutrition 0.000 title claims description 90
- 238000000034 method Methods 0.000 claims abstract description 77
- 230000000694 effects Effects 0.000 claims abstract description 65
- 238000006243 chemical reaction Methods 0.000 claims abstract description 59
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 28
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 28
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 28
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 146
- 229920001184 polypeptide Polymers 0.000 claims description 139
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 139
- 125000000539 amino acid group Chemical group 0.000 claims description 67
- 239000000758 substrate Substances 0.000 claims description 50
- 239000002253 acid Substances 0.000 claims description 47
- 238000006555 catalytic reaction Methods 0.000 claims description 30
- 102220538356 Chloride intracellular channel protein 3_P38H_mutation Human genes 0.000 claims description 27
- 102220183524 rs768630165 Human genes 0.000 claims description 27
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 22
- 238000009396 hybridization Methods 0.000 claims description 18
- 239000012634 fragment Substances 0.000 claims description 13
- 235000013311 vegetables Nutrition 0.000 claims description 13
- 239000013604 expression vector Substances 0.000 claims description 12
- 102220580976 Induced myeloid leukemia cell differentiation protein Mcl-1_G41Y_mutation Human genes 0.000 claims description 10
- 230000003197 catalytic effect Effects 0.000 claims description 9
- 230000009261 transgenic effect Effects 0.000 claims description 8
- 102200048328 rs1801270 Human genes 0.000 claims description 7
- 238000000926 separation method Methods 0.000 claims description 7
- 230000000295 complement effect Effects 0.000 claims description 5
- 238000005336 cracking Methods 0.000 claims description 5
- 230000007306 turnover Effects 0.000 claims description 5
- 230000005686 electrostatic field Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 102220005453 rs34890875 Human genes 0.000 claims description 2
- 102220059492 rs779005784 Human genes 0.000 claims 76
- 102220353742 c.41G>A Human genes 0.000 claims 1
- 239000013598 vector Substances 0.000 abstract description 3
- 210000004027 cell Anatomy 0.000 description 120
- 235000001014 amino acid Nutrition 0.000 description 74
- 229940024606 amino acid Drugs 0.000 description 73
- 150000001413 amino acids Chemical class 0.000 description 71
- 108090000623 proteins and genes Proteins 0.000 description 70
- 241000196324 Embryophyta Species 0.000 description 59
- 102000004190 Enzymes Human genes 0.000 description 57
- 108090000790 Enzymes Proteins 0.000 description 57
- 229940088598 enzyme Drugs 0.000 description 57
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 48
- 239000002773 nucleotide Substances 0.000 description 45
- 125000003729 nucleotide group Chemical group 0.000 description 45
- 150000001408 amides Chemical class 0.000 description 39
- 108020004414 DNA Proteins 0.000 description 38
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 35
- 230000008859 change Effects 0.000 description 31
- 239000000523 sample Substances 0.000 description 30
- 230000001105 regulatory effect Effects 0.000 description 25
- 239000000463 material Substances 0.000 description 24
- 230000001276 controlling effect Effects 0.000 description 23
- 230000007062 hydrolysis Effects 0.000 description 22
- 238000006460 hydrolysis reaction Methods 0.000 description 22
- 239000000047 product Substances 0.000 description 22
- 241000894006 Bacteria Species 0.000 description 21
- -1 fatty acid ester Chemical class 0.000 description 21
- 230000014509 gene expression Effects 0.000 description 21
- 239000013612 plasmid Substances 0.000 description 19
- 102000004169 proteins and genes Human genes 0.000 description 18
- 241000233866 Fungi Species 0.000 description 17
- 235000018102 proteins Nutrition 0.000 description 17
- 102220096708 rs876660538 Human genes 0.000 description 16
- 230000002538 fungal effect Effects 0.000 description 15
- 239000002609 medium Substances 0.000 description 14
- 125000003412 L-alanyl group Chemical group [H]N([H])[C@@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 13
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 13
- 241000499912 Trichoderma reesei Species 0.000 description 13
- 240000006439 Aspergillus oryzae Species 0.000 description 12
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 12
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 12
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 12
- 108091026890 Coding region Proteins 0.000 description 11
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 241000228212 Aspergillus Species 0.000 description 10
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 10
- 230000001580 bacterial effect Effects 0.000 description 10
- WGQKYBSKWIADBV-UHFFFAOYSA-N benzylamine Chemical compound NCC1=CC=CC=C1 WGQKYBSKWIADBV-UHFFFAOYSA-N 0.000 description 10
- 230000010076 replication Effects 0.000 description 10
- DLFVBJFMPXGRIB-UHFFFAOYSA-N thioacetamide Natural products CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 230000006872 improvement Effects 0.000 description 9
- 239000003550 marker Substances 0.000 description 9
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000002741 site-directed mutagenesis Methods 0.000 description 9
- 241000351920 Aspergillus nidulans Species 0.000 description 8
- 108010031797 Candida antarctica lipase B Proteins 0.000 description 8
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical group OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 8
- 240000007594 Oryza sativa Species 0.000 description 8
- 235000007164 Oryza sativa Nutrition 0.000 description 8
- 230000004927 fusion Effects 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 231100000350 mutagenesis Toxicity 0.000 description 8
- 235000009566 rice Nutrition 0.000 description 8
- 239000007787 solid Substances 0.000 description 8
- 230000001131 transforming effect Effects 0.000 description 8
- 241000228245 Aspergillus niger Species 0.000 description 7
- 241000972773 Aulopiformes Species 0.000 description 7
- 241000193830 Bacillus <bacterium> Species 0.000 description 7
- 244000025254 Cannabis sativa Species 0.000 description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 7
- 241000235395 Mucor Species 0.000 description 7
- 108010076504 Protein Sorting Signals Proteins 0.000 description 7
- 238000002105 Southern blotting Methods 0.000 description 7
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 7
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 7
- 230000000968 intestinal effect Effects 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 238000002703 mutagenesis Methods 0.000 description 7
- 235000019515 salmon Nutrition 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 6
- 108010065511 Amylases Proteins 0.000 description 6
- 108090000371 Esterases Proteins 0.000 description 6
- 241000223218 Fusarium Species 0.000 description 6
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 6
- 108090000637 alpha-Amylases Proteins 0.000 description 6
- 150000001412 amines Chemical class 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- YKPUWZUDDOIDPM-SOFGYWHQSA-N capsaicin Chemical compound COC1=CC(CNC(=O)CCCC\C=C\C(C)C)=CC=C1O YKPUWZUDDOIDPM-SOFGYWHQSA-N 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 150000002148 esters Chemical class 0.000 description 6
- 210000001938 protoplast Anatomy 0.000 description 6
- 102220087235 rs864622622 Human genes 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 239000004382 Amylase Substances 0.000 description 5
- 102000013142 Amylases Human genes 0.000 description 5
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 5
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 5
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 5
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 5
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 5
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical group CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 5
- 235000019418 amylase Nutrition 0.000 description 5
- 239000002585 base Substances 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 230000008034 disappearance Effects 0.000 description 5
- 238000000855 fermentation Methods 0.000 description 5
- 230000004151 fermentation Effects 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 5
- 239000002853 nucleic acid probe Substances 0.000 description 5
- 235000016709 nutrition Nutrition 0.000 description 5
- 230000008488 polyadenylation Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 239000011541 reaction mixture Substances 0.000 description 5
- 238000003259 recombinant expression Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 102000010911 Enzyme Precursors Human genes 0.000 description 4
- 108010062466 Enzyme Precursors Proteins 0.000 description 4
- 241001480714 Humicola insolens Species 0.000 description 4
- 102220468791 Inositol 1,4,5-trisphosphate receptor type 2_Y167A_mutation Human genes 0.000 description 4
- FFQPZWRNXKPNPX-UHFFFAOYSA-N N-benzyl-2-[4-fluoro-3-(trifluoromethyl)phenoxy]butanamide Chemical compound C=1C=CC=CC=1CNC(=O)C(CC)OC1=CC=C(F)C(C(F)(F)F)=C1 FFQPZWRNXKPNPX-UHFFFAOYSA-N 0.000 description 4
- 102000035195 Peptidases Human genes 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- 241000235648 Pichia Species 0.000 description 4
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 4
- 241000222180 Pseudozyma tsukubaensis Species 0.000 description 4
- 102220616233 Sialic acid-binding Ig-like lectin 14_R170K_mutation Human genes 0.000 description 4
- 241000187747 Streptomyces Species 0.000 description 4
- 241001655322 Streptomycetales Species 0.000 description 4
- 241000223259 Trichoderma Species 0.000 description 4
- 240000008042 Zea mays Species 0.000 description 4
- 108010048241 acetamidase Proteins 0.000 description 4
- 102000004139 alpha-Amylases Human genes 0.000 description 4
- 229940024171 alpha-amylase Drugs 0.000 description 4
- 238000009395 breeding Methods 0.000 description 4
- 230000001488 breeding effect Effects 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 241001233957 eudicotyledons Species 0.000 description 4
- 238000005558 fluorometry Methods 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 210000004602 germ cell Anatomy 0.000 description 4
- 229960002989 glutamic acid Drugs 0.000 description 4
- 229910001385 heavy metal Inorganic materials 0.000 description 4
- ZSIAUFGUXNUGDI-UHFFFAOYSA-N hexan-1-ol Chemical compound CCCCCCO ZSIAUFGUXNUGDI-UHFFFAOYSA-N 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 210000001161 mammalian embryo Anatomy 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 4
- YATAVUWVWRFIRI-UHFFFAOYSA-N n-(4-nitrophenyl)butanamide Chemical compound CCCC(=O)NC1=CC=C([N+]([O-])=O)C=C1 YATAVUWVWRFIRI-UHFFFAOYSA-N 0.000 description 4
- 150000003016 phosphoric acids Chemical class 0.000 description 4
- 230000008929 regeneration Effects 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 239000002689 soil Substances 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 3
- DSSYKIVIOFKYAU-XCBNKYQSSA-N (R)-camphor Chemical compound C1C[C@@]2(C)C(=O)C[C@@H]1C2(C)C DSSYKIVIOFKYAU-XCBNKYQSSA-N 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- IGHBXJSNZCFXNK-UHFFFAOYSA-N 4-chloro-7-nitrobenzofurazan Chemical compound [O-][N+](=O)C1=CC=C(Cl)C2=NON=C12 IGHBXJSNZCFXNK-UHFFFAOYSA-N 0.000 description 3
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 3
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 3
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonium chloride Substances [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 3
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical group [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 241000235349 Ascomycota Species 0.000 description 3
- 241001328122 Bacillus clausii Species 0.000 description 3
- 241000194108 Bacillus licheniformis Species 0.000 description 3
- 241000193388 Bacillus thuringiensis Species 0.000 description 3
- 239000005470 Beflubutamid Substances 0.000 description 3
- 241000219193 Brassicaceae Species 0.000 description 3
- 101000898643 Candida albicans Vacuolar aspartic protease Proteins 0.000 description 3
- 101000898783 Candida tropicalis Candidapepsin Proteins 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 108010059892 Cellulase Proteins 0.000 description 3
- 241000146399 Ceriporiopsis Species 0.000 description 3
- 241000123346 Chrysosporium Species 0.000 description 3
- 101000898784 Cryphonectria parasitica Endothiapepsin Proteins 0.000 description 3
- 241000221779 Fusarium sambucinum Species 0.000 description 3
- 206010020649 Hyperkeratosis Diseases 0.000 description 3
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- 125000003338 L-glutaminyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C([H])([H])C(=O)N([H])[H] 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 3
- 241000209510 Liliopsida Species 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 108010020856 N-terminal nucleophile hydrolase Proteins 0.000 description 3
- 241000233654 Oomycetes Species 0.000 description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 3
- 244000046052 Phaseolus vulgaris Species 0.000 description 3
- 101000933133 Rhizopus niveus Rhizopuspepsin-1 Proteins 0.000 description 3
- 101000910082 Rhizopus niveus Rhizopuspepsin-2 Proteins 0.000 description 3
- 101000910079 Rhizopus niveus Rhizopuspepsin-3 Proteins 0.000 description 3
- 101000910086 Rhizopus niveus Rhizopuspepsin-4 Proteins 0.000 description 3
- 101000910088 Rhizopus niveus Rhizopuspepsin-5 Proteins 0.000 description 3
- 101000898773 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Saccharopepsin Proteins 0.000 description 3
- 108010022999 Serine Proteases Proteins 0.000 description 3
- 235000002595 Solanum tuberosum Nutrition 0.000 description 3
- 244000061456 Solanum tuberosum Species 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- 108700005078 Synthetic Genes Proteins 0.000 description 3
- 241000223258 Thermomyces lanuginosus Species 0.000 description 3
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 3
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 3
- 235000015919 Ustilago maydis Nutrition 0.000 description 3
- 244000301083 Ustilago maydis Species 0.000 description 3
- 235000010749 Vicia faba Nutrition 0.000 description 3
- 240000006677 Vicia faba Species 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 3
- 125000002252 acyl group Chemical group 0.000 description 3
- 238000006136 alcoholysis reaction Methods 0.000 description 3
- 235000011114 ammonium hydroxide Nutrition 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 229940097012 bacillus thuringiensis Drugs 0.000 description 3
- WZDDLAZXUYIVMU-UHFFFAOYSA-N bromobutide Chemical compound CC(C)(C)C(Br)C(=O)NC(C)(C)C1=CC=CC=C1 WZDDLAZXUYIVMU-UHFFFAOYSA-N 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 229960000846 camphor Drugs 0.000 description 3
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 210000003205 muscle Anatomy 0.000 description 3
- 230000003505 mutagenic effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003534 oscillatory effect Effects 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 239000002953 phosphate buffered saline Substances 0.000 description 3
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 3
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 101150054232 pyrG gene Proteins 0.000 description 3
- 238000002708 random mutagenesis Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- 230000001810 trypsinlike Effects 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- TYMLOMAKGOJONV-UHFFFAOYSA-N 4-nitroaniline Chemical class NC1=CC=C([N+]([O-])=O)C=C1 TYMLOMAKGOJONV-UHFFFAOYSA-N 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- 240000000073 Achillea millefolium Species 0.000 description 2
- 235000007754 Achillea millefolium Nutrition 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- 241000743339 Agrostis Species 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- 241001513093 Aspergillus awamori Species 0.000 description 2
- 241001225321 Aspergillus fumigatus Species 0.000 description 2
- 241001480052 Aspergillus japonicus Species 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000223651 Aureobasidium Species 0.000 description 2
- 108090000145 Bacillolysin Proteins 0.000 description 2
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 2
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 241000221198 Basidiomycota Species 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- 240000002791 Brassica napus Species 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 240000008574 Capsicum frutescens Species 0.000 description 2
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 2
- 229920002101 Chitin Polymers 0.000 description 2
- 229920001661 Chitosan Polymers 0.000 description 2
- 241000701248 Chlorella virus Species 0.000 description 2
- 241000985909 Chrysosporium keratinophilum Species 0.000 description 2
- 241001674001 Chrysosporium tropicum Species 0.000 description 2
- 241000233652 Chytridiomycota Species 0.000 description 2
- 241000222511 Coprinus Species 0.000 description 2
- 244000251987 Coprinus macrorhizus Species 0.000 description 2
- 235000001673 Coprinus macrorhizus Nutrition 0.000 description 2
- 241000222356 Coriolus Species 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 2
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 2
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 241000234642 Festuca Species 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000223195 Fusarium graminearum Species 0.000 description 2
- 241000146406 Fusarium heterosporum Species 0.000 description 2
- 241000605909 Fusobacterium Species 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 2
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 2
- 108010068370 Glutens Proteins 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 241000223198 Humicola Species 0.000 description 2
- 241001203975 Hyphozyma sp. Species 0.000 description 2
- 235000003332 Ilex aquifolium Nutrition 0.000 description 2
- 241000209027 Ilex aquifolium Species 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 2
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- HXEACLLIILLPRG-YFKPBYRVSA-N L-pipecolic acid Chemical compound [O-]C(=O)[C@@H]1CCCC[NH2+]1 HXEACLLIILLPRG-YFKPBYRVSA-N 0.000 description 2
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 2
- STECJAGHUSJQJN-USLFZFAMSA-N LSM-4015 Chemical compound C1([C@@H](CO)C(=O)OC2C[C@@H]3N([C@H](C2)[C@@H]2[C@H]3O2)C)=CC=CC=C1 STECJAGHUSJQJN-USLFZFAMSA-N 0.000 description 2
- 101710094902 Legumin Proteins 0.000 description 2
- 101710098554 Lipase B Proteins 0.000 description 2
- 241000209082 Lolium Species 0.000 description 2
- 241000219745 Lupinus Species 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- 241000226677 Myceliophthora Species 0.000 description 2
- KEECCEWTUVWFCV-UHFFFAOYSA-N N-acetylprocainamide Chemical compound CCN(CC)CCNC(=O)C1=CC=C(NC(C)=O)C=C1 KEECCEWTUVWFCV-UHFFFAOYSA-N 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- 102000035092 Neutral proteases Human genes 0.000 description 2
- 108091005507 Neutral proteases Proteins 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 244000061176 Nicotiana tabacum Species 0.000 description 2
- 108090000913 Nitrate Reductases Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 2
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 2
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 2
- 241000228143 Penicillium Species 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000222350 Pleurotus Species 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 241000235403 Rhizomucor miehei Species 0.000 description 2
- 241000190932 Rhodopseudomonas Species 0.000 description 2
- 241000235343 Saccharomycetales Species 0.000 description 2
- 241000222480 Schizophyllum Species 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 102000012479 Serine Proteases Human genes 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241001250070 Sporisorium reilianum Species 0.000 description 2
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 2
- 108090000787 Subtilisin Proteins 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 241000228341 Talaromyces Species 0.000 description 2
- 241001540751 Talaromyces ruber Species 0.000 description 2
- 244000152045 Themeda triandra Species 0.000 description 2
- 241001494489 Thielavia Species 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 241001149964 Tolypocladium Species 0.000 description 2
- 241000222354 Trametes Species 0.000 description 2
- 235000002098 Vicia faba var. major Nutrition 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 125000003368 amide group Chemical group 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 210000001367 artery Anatomy 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 229940091771 aspergillus fumigatus Drugs 0.000 description 2
- 238000003705 background correction Methods 0.000 description 2
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000008033 biological extinction Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 229960002504 capsaicin Drugs 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 239000002361 compost Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- NEKNNCABDXGBEN-UHFFFAOYSA-L disodium;4-(4-chloro-2-methylphenoxy)butanoate;4-(2,4-dichlorophenoxy)butanoate Chemical compound [Na+].[Na+].CC1=CC(Cl)=CC=C1OCCCC([O-])=O.[O-]C(=O)CCCOC1=CC=C(Cl)C=C1Cl NEKNNCABDXGBEN-UHFFFAOYSA-L 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000001952 enzyme assay Methods 0.000 description 2
- 210000002615 epidermis Anatomy 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000004459 forage Substances 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- HXEACLLIILLPRG-RXMQYKEDSA-N l-pipecolic acid Natural products OC(=O)[C@H]1CCCCN1 HXEACLLIILLPRG-RXMQYKEDSA-N 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 229960000485 methotrexate Drugs 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 231100000219 mutagenic Toxicity 0.000 description 2
- 239000003471 mutagenic agent Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 235000019629 palatability Nutrition 0.000 description 2
- 235000012736 patent blue V Nutrition 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 239000003375 plant hormone Substances 0.000 description 2
- 229920002704 polyhistidine Polymers 0.000 description 2
- 229920002223 polystyrene Polymers 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000035484 reaction time Effects 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000008521 reorganization Effects 0.000 description 2
- 230000033458 reproduction Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 102220052102 rs35524245 Human genes 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000000779 smoke Substances 0.000 description 2
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000000087 stabilizing effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- RJKCKKDSSSRYCB-UHFFFAOYSA-N tebutam Chemical compound CC(C)(C)C(=O)N(C(C)C)CC1=CC=CC=C1 RJKCKKDSSSRYCB-UHFFFAOYSA-N 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000000108 ultra-filtration Methods 0.000 description 2
- 210000003934 vacuole Anatomy 0.000 description 2
- 230000002792 vascular Effects 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- 239000002023 wood Substances 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- ASZCVNVMQXNJGH-ZYRRHWMLSA-N (1S,2R,9S,12S)-4,12-dimethyl-13-oxotetracyclo[10.2.1.01,9.03,8]pentadeca-3,5,7-triene-2-carboxylic acid Chemical compound Cc1cccc2[C@H]3CC[C@@]4(C)C[C@@]3(CC4=O)[C@@H](C(O)=O)c12 ASZCVNVMQXNJGH-ZYRRHWMLSA-N 0.000 description 1
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- JQFLYFRHDIHZFZ-RXMQYKEDSA-N (2s)-3,3-dimethylpyrrolidine-2-carboxylic acid Chemical compound CC1(C)CCN[C@@H]1C(O)=O JQFLYFRHDIHZFZ-RXMQYKEDSA-N 0.000 description 1
- CNPSFBUUYIVHAP-AKGZTFGVSA-N (2s)-3-methylpyrrolidine-2-carboxylic acid Chemical compound CC1CCN[C@@H]1C(O)=O CNPSFBUUYIVHAP-AKGZTFGVSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- WAOWGAUGDVRDMD-KTKRTIGZSA-N (Z)-N-naphthalen-2-yloctadec-9-enamide Chemical compound C1=CC=CC2=CC(NC(=O)CCCCCCC\C=C/CCCCCCCC)=CC=C21 WAOWGAUGDVRDMD-KTKRTIGZSA-N 0.000 description 1
- 101150084750 1 gene Proteins 0.000 description 1
- VOYXMQFJDIVEQN-UHFFFAOYSA-N 1,3-thiazolidine-2-carboxylic acid Chemical compound S1C(NCC1)C(=O)O.S1C(NCC1)C(=O)O VOYXMQFJDIVEQN-UHFFFAOYSA-N 0.000 description 1
- STGVIVVZSAQRGJ-UHFFFAOYSA-N 1-n,2-n-dibenzylbenzene-1,2-dicarboxamide Chemical compound C=1C=CC=C(C(=O)NCC=2C=CC=CC=2)C=1C(=O)NCC1=CC=CC=C1 STGVIVVZSAQRGJ-UHFFFAOYSA-N 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- OMGHIGVFLOPEHJ-UHFFFAOYSA-N 2,5-dihydro-1h-pyrrol-1-ium-2-carboxylate Chemical compound OC(=O)C1NCC=C1 OMGHIGVFLOPEHJ-UHFFFAOYSA-N 0.000 description 1
- MQNBMOUEKNYZII-UHFFFAOYSA-N 2-(4-nitrophenyl)acetamide Chemical compound NC(=O)CC1=CC=C([N+]([O-])=O)C=C1 MQNBMOUEKNYZII-UHFFFAOYSA-N 0.000 description 1
- JJGYMYLPFPNWII-UHFFFAOYSA-N 2-(4-nitrophenyl)butanamide Chemical compound CCC(C(N)=O)C1=CC=C([N+]([O-])=O)C=C1 JJGYMYLPFPNWII-UHFFFAOYSA-N 0.000 description 1
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- RZTGBAJAVREPOB-UHFFFAOYSA-N 2-bromo-n-decylacetamide Chemical compound CCCCCCCCCCNC(=O)CBr RZTGBAJAVREPOB-UHFFFAOYSA-N 0.000 description 1
- JUBORNFANZZVJL-UHFFFAOYSA-N 2-chloro-n-ethylacetamide Chemical compound CCNC(=O)CCl JUBORNFANZZVJL-UHFFFAOYSA-N 0.000 description 1
- CDUUKBXTEOFITR-BYPYZUCNSA-N 2-methyl-L-serine Chemical compound OC[C@@]([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-BYPYZUCNSA-N 0.000 description 1
- JBIJLHTVPXGSAM-UHFFFAOYSA-N 2-naphthylamine Chemical class C1=CC=CC2=CC(N)=CC=C21 JBIJLHTVPXGSAM-UHFFFAOYSA-N 0.000 description 1
- MDRVSZJDSUDYGP-UHFFFAOYSA-N 4-nitro-n-propylbenzamide Chemical compound CCCNC(=O)C1=CC=C([N+]([O-])=O)C=C1 MDRVSZJDSUDYGP-UHFFFAOYSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- 101150008391 A1 gene Proteins 0.000 description 1
- 101150104118 ANS1 gene Proteins 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 101100510736 Actinidia chinensis var. chinensis LDOX gene Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000220433 Albizia Species 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 241001677738 Aleuron Species 0.000 description 1
- 108090000531 Amidohydrolases Proteins 0.000 description 1
- 102000004092 Amidohydrolases Human genes 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 108010037870 Anthranilate Synthase Proteins 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 101000577181 Aspergillus oryzae (strain ATCC 42149 / RIB 40) Extracellular metalloproteinase NpI Proteins 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 235000007558 Avena sp Nutrition 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241001112741 Bacillaceae Species 0.000 description 1
- 108700003918 Bacillus Thuringiensis insecticidal crystal Proteins 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 101000775727 Bacillus amyloliquefaciens Alpha-amylase Proteins 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 241000193747 Bacillus firmus Species 0.000 description 1
- 241000193422 Bacillus lentus Species 0.000 description 1
- 241000194107 Bacillus megaterium Species 0.000 description 1
- 241000194103 Bacillus pumilus Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 241000222490 Bjerkandera Species 0.000 description 1
- 241000222478 Bjerkandera adusta Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 241000193764 Brevibacillus brevis Species 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 101100520142 Caenorhabditis elegans pin-2 gene Proteins 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 108090000489 Carboxy-Lyases Proteins 0.000 description 1
- 108010084185 Cellulases Proteins 0.000 description 1
- 102000005575 Cellulases Human genes 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 241001466517 Ceriporiopsis aneirina Species 0.000 description 1
- 241001646018 Ceriporiopsis gilvescens Species 0.000 description 1
- 241001277875 Ceriporiopsis rivulosa Species 0.000 description 1
- 241000524302 Ceriporiopsis subrufa Species 0.000 description 1
- 108700031407 Chloroplast Genes Proteins 0.000 description 1
- 208000036086 Chromosome Duplication Diseases 0.000 description 1
- 241001674013 Chrysosporium lucknowense Species 0.000 description 1
- 241001556045 Chrysosporium merdarium Species 0.000 description 1
- 241000080524 Chrysosporium queenslandicum Species 0.000 description 1
- 241000355696 Chrysosporium zonatum Species 0.000 description 1
- 241000235457 Chytridium Species 0.000 description 1
- 241001439061 Cocksfoot streak virus Species 0.000 description 1
- 241000020428 Colea Species 0.000 description 1
- 241001362614 Crassa Species 0.000 description 1
- 241001559589 Cullen Species 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241001063191 Elops affinis Species 0.000 description 1
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 1
- 241000194033 Enterococcus Species 0.000 description 1
- 235000007810 Eryngium campestre Nutrition 0.000 description 1
- 240000005980 Eryngium maritimum Species 0.000 description 1
- 235000003933 Eryngium maritimum Nutrition 0.000 description 1
- 235000002756 Erythrina berteroana Nutrition 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 240000005708 Eugenia stipitata Species 0.000 description 1
- 235000006149 Eugenia stipitata Nutrition 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241000223221 Fusarium oxysporum Species 0.000 description 1
- 241001112697 Fusarium reticulatum Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000223192 Fusarium sporotrichioides Species 0.000 description 1
- 241001465753 Fusarium torulosum Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 241000146398 Gelatoporia subvermispora Species 0.000 description 1
- 241000726221 Gemma Species 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 1
- 239000005980 Gibberellic acid Substances 0.000 description 1
- ASZCVNVMQXNJGH-UHFFFAOYSA-N Gibberic acid Natural products C12CCC(C3)(C)C(=O)CC23C(C(O)=O)C2=C1C=CC=C2C ASZCVNVMQXNJGH-UHFFFAOYSA-N 0.000 description 1
- 102000006395 Globulins Human genes 0.000 description 1
- 108010044091 Globulins Proteins 0.000 description 1
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102220604023 Homeobox protein SIX3_N79Q_mutation Human genes 0.000 description 1
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- 101000882901 Homo sapiens Claudin-2 Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 241000411968 Ilyobacter Species 0.000 description 1
- 241000006384 Jeotgalibacillus marinus Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241000824268 Kuma Species 0.000 description 1
- 125000001176 L-lysyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C([H])([H])C([H])([H])C(N([H])[H])([H])[H] 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 125000000769 L-threonyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](O[H])(C([H])([H])[H])[H] 0.000 description 1
- KKJQZEWNZXRJFG-UHFFFAOYSA-N L-trans-4-Methyl-2-pyrrolidinecarboxylic acid Chemical compound CC1CNC(C(O)=O)C1 KKJQZEWNZXRJFG-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108010029541 Laccase Proteins 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- 241001344131 Magnaporthe grisea Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 241001661345 Moesziomyces antarcticus Species 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- IOVCWXUNBOPUCH-UHFFFAOYSA-N Nitrous acid Chemical compound ON=O IOVCWXUNBOPUCH-UHFFFAOYSA-N 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000194109 Paenibacillus lautus Species 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- 241000222393 Phanerochaete chrysosporium Species 0.000 description 1
- 241000222395 Phlebia Species 0.000 description 1
- 241000222397 Phlebia radiata Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 230000010748 Photoabsorption Effects 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 244000208734 Pisonia aculeata Species 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- 244000252132 Pleurotus eryngii Species 0.000 description 1
- 235000001681 Pleurotus eryngii Nutrition 0.000 description 1
- 241000209048 Poa Species 0.000 description 1
- 241000209049 Poa pratensis Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 235000010829 Prunus spinosa Nutrition 0.000 description 1
- 239000012614 Q-Sepharose Substances 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 101001076706 Saccharomyces cerevisiae Invertase 1 Proteins 0.000 description 1
- 101001053411 Saccharomyces cerevisiae Invertase 3 Proteins 0.000 description 1
- 101001053412 Saccharomyces cerevisiae Invertase 4 Proteins 0.000 description 1
- 101001053409 Saccharomyces cerevisiae Invertase 5 Proteins 0.000 description 1
- 101001053400 Saccharomyces cerevisiae Invertase 7 Proteins 0.000 description 1
- 101900084120 Saccharomyces cerevisiae Triosephosphate isomerase Proteins 0.000 description 1
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 1
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 1
- 241001123227 Saccharomyces pastorianus Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 235000017276 Salvia Nutrition 0.000 description 1
- 240000007164 Salvia officinalis Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 244000082988 Secale cereale Species 0.000 description 1
- 108010016634 Seed Storage Proteins Proteins 0.000 description 1
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- XERQKTRGJIKTRB-CIUDSAMLSA-N Ser-His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CN=CN1 XERQKTRGJIKTRB-CIUDSAMLSA-N 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000046109 Sorghum vulgare var. nervosum Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000264435 Streptococcus dysgalactiae subsp. equisimilis Species 0.000 description 1
- 241000194048 Streptococcus equi Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241000194054 Streptococcus uberis Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000187392 Streptomyces griseus Species 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000005864 Sulphur Substances 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- 241001495429 Thielavia terrestris Species 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 241000222357 Trametes hirsuta Species 0.000 description 1
- 241000222355 Trametes versicolor Species 0.000 description 1
- 241000217816 Trametes villosa Species 0.000 description 1
- 241000223260 Trichoderma harzianum Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 239000006035 Tryptophane Substances 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 241000202898 Ureaplasma Species 0.000 description 1
- 241000221566 Ustilago Species 0.000 description 1
- 229930003756 Vitamin B7 Natural products 0.000 description 1
- GLLRIXZGBQOFLM-UHFFFAOYSA-N Xanthorin Natural products C1=C(C)C=C2C(=O)C3=C(O)C(OC)=CC(O)=C3C(=O)C2=C1O GLLRIXZGBQOFLM-UHFFFAOYSA-N 0.000 description 1
- 241000409279 Xerochrysium dermatitidis Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- MKJRCHCQADCRMN-UHFFFAOYSA-N acetamide;chloromethylbenzene Chemical compound CC(N)=O.ClCC1=CC=CC=C1 MKJRCHCQADCRMN-UHFFFAOYSA-N 0.000 description 1
- JUGOREOARAHOCO-UHFFFAOYSA-M acetylcholine chloride Chemical compound [Cl-].CC(=O)OCC[N+](C)(C)C JUGOREOARAHOCO-UHFFFAOYSA-M 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 108010045649 agarase Proteins 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 239000003905 agrochemical Substances 0.000 description 1
- 108010050181 aleurone Proteins 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- CDUUKBXTEOFITR-UHFFFAOYSA-N alpha-methylserine Natural products OCC([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-UHFFFAOYSA-N 0.000 description 1
- 101150078331 ama-1 gene Proteins 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- KLOHDWPABZXLGI-YWUHCJSESA-M ampicillin sodium Chemical group [Na+].C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C([O-])=O)(C)C)=CC=CC=C1 KLOHDWPABZXLGI-YWUHCJSESA-M 0.000 description 1
- 150000003931 anilides Chemical class 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 230000000433 anti-nutritional effect Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 238000005844 autocatalytic reaction Methods 0.000 description 1
- QLULGSLAHXLKSR-UHFFFAOYSA-N azane;phosphane Chemical compound N.P QLULGSLAHXLKSR-UHFFFAOYSA-N 0.000 description 1
- 229940054340 bacillus coagulans Drugs 0.000 description 1
- 229940005348 bacillus firmus Drugs 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229940073608 benzyl chloride Drugs 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108010047754 beta-Glucosidase Proteins 0.000 description 1
- 102000006995 beta-Glucosidase Human genes 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000004752 cathodic stripping voltammetry Methods 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- FOCAUTSVDIKZOP-UHFFFAOYSA-N chloroacetic acid Chemical compound OC(=O)CCl FOCAUTSVDIKZOP-UHFFFAOYSA-N 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 125000002704 decyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000010612 desalination reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 108010091371 endoglucanase 1 Proteins 0.000 description 1
- 108010091384 endoglucanase 2 Proteins 0.000 description 1
- 108010092413 endoglucanase V Proteins 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 230000001076 estrogenic effect Effects 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000028023 exocytosis Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 239000012847 fine chemical Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- PGBHMTALBVVCIT-VCIWKGPPSA-N framycetin Chemical compound N[C@@H]1[C@@H](O)[C@H](O)[C@H](CN)O[C@@H]1O[C@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](N)C[C@@H](N)[C@@H]2O)O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CN)O2)N)O[C@@H]1CO PGBHMTALBVVCIT-VCIWKGPPSA-N 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 239000010437 gem Substances 0.000 description 1
- IXORZMNAPKEEDV-UHFFFAOYSA-N gibberellic acid GA3 Natural products OC(=O)C1C2(C3)CC(=C)C3(O)CCC2C2(C=CC3O)C1C3(C)C(=O)O2 IXORZMNAPKEEDV-UHFFFAOYSA-N 0.000 description 1
- IXORZMNAPKEEDV-OBDJNFEBSA-N gibberellin A3 Chemical compound C([C@@]1(O)C(=C)C[C@@]2(C1)[C@H]1C(O)=O)C[C@H]2[C@]2(C=C[C@@H]3O)[C@H]1[C@]3(C)C(=O)O2 IXORZMNAPKEEDV-OBDJNFEBSA-N 0.000 description 1
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000021312 gluten Nutrition 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000012203 high throughput assay Methods 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- 239000000413 hydrolysate Substances 0.000 description 1
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000009399 inbreeding Methods 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 229910017053 inorganic salt Inorganic materials 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 239000002608 ionic liquid Substances 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- GCHPUFAZSONQIV-UHFFFAOYSA-N isovaline Chemical compound CCC(C)(N)C(O)=O GCHPUFAZSONQIV-UHFFFAOYSA-N 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 230000004130 lipolysis Effects 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000000442 meristematic effect Effects 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229940045641 monobasic sodium phosphate Drugs 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- TWMFGCHRALXDAR-UHFFFAOYSA-N n-[3-(dimethylamino)propyl]dodecanamide Chemical compound CCCCCCCCCCCC(=O)NCCCN(C)C TWMFGCHRALXDAR-UHFFFAOYSA-N 0.000 description 1
- SRAXAXHQMCQHSH-UHFFFAOYSA-N n-benzyl-2-chloroacetamide Chemical compound ClCC(=O)NCC1=CC=CC=C1 SRAXAXHQMCQHSH-UHFFFAOYSA-N 0.000 description 1
- FVLVBVSILSHUAF-UHFFFAOYSA-N n-benzyl-3,5-dimethyl-n-propan-2-ylbenzamide Chemical compound C=1C(C)=CC(C)=CC=1C(=O)N(C(C)C)CC1=CC=CC=C1 FVLVBVSILSHUAF-UHFFFAOYSA-N 0.000 description 1
- OSPJHCUBEDDXIQ-UHFFFAOYSA-N n-benzyl-3-(4-hydroxyphenyl)propanamide Chemical compound C1=CC(O)=CC=C1CCC(=O)NCC1=CC=CC=C1 OSPJHCUBEDDXIQ-UHFFFAOYSA-N 0.000 description 1
- LKQUCICFTHBFAL-UHFFFAOYSA-N n-benzylbenzamide Chemical compound C=1C=CC=CC=1C(=O)NCC1=CC=CC=C1 LKQUCICFTHBFAL-UHFFFAOYSA-N 0.000 description 1
- OHWQEBAVEDXXDM-UHFFFAOYSA-N n-benzylbutanamide Chemical compound CCCC(=O)NCC1=CC=CC=C1 OHWQEBAVEDXXDM-UHFFFAOYSA-N 0.000 description 1
- IQQYKULLKVYXCS-UHFFFAOYSA-N n-benzyldecan-1-amine Chemical compound CCCCCCCCCCNCC1=CC=CC=C1 IQQYKULLKVYXCS-UHFFFAOYSA-N 0.000 description 1
- TUDFZSGUEDLTJC-UHFFFAOYSA-N n-propylbutanamide Chemical compound CCCNC(=O)CCC TUDFZSGUEDLTJC-UHFFFAOYSA-N 0.000 description 1
- 239000008239 natural water Substances 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 101150105920 npr gene Proteins 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 230000031787 nutrient reservoir activity Effects 0.000 description 1
- 230000000050 nutritive effect Effects 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- FATBGEAMYMYZAF-KTKRTIGZSA-N oleamide Chemical compound CCCCCCCC\C=C/CCCCCCCC(N)=O FATBGEAMYMYZAF-KTKRTIGZSA-N 0.000 description 1
- 229940113162 oleylamide Drugs 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 229940049547 paraxin Drugs 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- 235000020030 perry Nutrition 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000005375 photometry Methods 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 230000010152 pollination Effects 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108060006613 prolamin Proteins 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 101150108007 prs gene Proteins 0.000 description 1
- 101150086435 prs1 gene Proteins 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- 235000019633 pungent taste Nutrition 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 102220273843 rs1060499954 Human genes 0.000 description 1
- 102200049892 rs145873635 Human genes 0.000 description 1
- 102220285717 rs1555461680 Human genes 0.000 description 1
- 102200085102 rs387906955 Human genes 0.000 description 1
- 102220118518 rs759997176 Human genes 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 101150091813 shfl gene Proteins 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- RPLOPBHEZLFENN-HTMVYDOJSA-M sodium;4-[(2r,3r)-2-[(2,2-dichloroacetyl)amino]-3-hydroxy-3-(4-nitrophenyl)propoxy]-4-oxobutanoate Chemical compound [Na+].[O-]C(=O)CCC(=O)OC[C@@H](NC(=O)C(Cl)Cl)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 RPLOPBHEZLFENN-HTMVYDOJSA-M 0.000 description 1
- 238000010563 solid-state fermentation Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 238000011146 sterile filtration Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 229940115922 streptococcus uberis Drugs 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000009871 tenuigenin Substances 0.000 description 1
- OFVLGDICTFRJMM-WESIUVDSSA-N tetracycline Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O OFVLGDICTFRJMM-WESIUVDSSA-N 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- HNBDQABBWNOTRU-UHFFFAOYSA-N thalline Chemical compound C1=CC=[Tl]C=C1 HNBDQABBWNOTRU-UHFFFAOYSA-N 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000005924 transacylation reaction Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000005809 transesterification reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- UFTFJSFQGQCHQW-UHFFFAOYSA-N triformin Chemical compound O=COCC(OC=O)COC=O UFTFJSFQGQCHQW-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229910000406 trisodium phosphate Inorganic materials 0.000 description 1
- 235000019801 trisodium phosphate Nutrition 0.000 description 1
- DCXXMTOCNZCJGO-UHFFFAOYSA-N tristearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(OC(=O)CCCCCCCCCCCCCCCCC)COC(=O)CCCCCCCCCCCCCCCCC DCXXMTOCNZCJGO-UHFFFAOYSA-N 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 229960004799 tryptophan Drugs 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 239000011735 vitamin B7 Substances 0.000 description 1
- 235000011912 vitamin B7 Nutrition 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
- 101150052264 xylA gene Proteins 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 101150103409 yscB gene Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/18—Carboxylic ester hydrolases (3.1.1)
- C12N9/20—Triglyceride splitting, e.g. by means of lipase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/01—Carboxylic ester hydrolases (3.1.1)
- C12Y301/01003—Triacylglycerol lipase (3.1.1.3)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及具有改进的酰胺-键反应中的活性的脂肪酶变体、编码所述变体的多核苷酸、产生所述变体的方法,以及使用所述变体的方法。
Description
涉及序列表
本申请包含计算机可读形式的序列表,其通过提述并入本文。
发明背景
技术领域
本发明涉及具有改进的酰胺-键反应中的活性的脂肪酶变体、编码所述变体的多核苷酸、产生所述变体的方法,以及使用所述变体的方法。更具体地,本发明涉及与南极假丝酵母(Candida antarctica)脂肪酶B(CALB)具有至少60%同源性的修饰酶,其与相应的未修饰酶相比具有改进的酰胺-键反应中的活性。
相关技术的描述
脂肪酶(三酰基甘油水解酶,EC3.1.1.3)是催化脂肪酸酯(甘油三酯)水解的丝氨酸水解酶。它们具有宽的底物特异性,可接受结构差异巨大的多种酯、醇、和羧酸作为底物。脂肪酶不催化或者难以催化酰胺的水解,这部分可以用酰胺的反应性比酯更低来解释(Bruice,P.Y.(1998)Organic Chemistry,678)。然而,已经有少数关于脂肪酶水解酰胺的报道公开:Duarte DE.,Castillo E.,Bárzana E.,&López-Munguía A.(2000)Biotechnol Lett.,22,1811-1814公开了来自南极假丝酵母的脂肪酶B对辣椒素,一种天然水不溶性酰胺的水解。Henke E.&Bornscheuer U.T.(2003)Anal Chem.,75,255-260描述了一种用于高通量测定酰胺水解的荧光测定法,其被用来评估22种未修饰的脂肪酶和酯酶,以及筛选15000种通过易错PCR和其他随机诱变方法生成的突变体。该定向进化实验未揭示阳性结果,即新的酰胺酶活性。
在另一项定向进化实验中,Fujii R.,Nakagawa Y.,Hiratake J.,Sogabe A.,&Sakata K.(2005)Protein Eng Des Sel.,18,93-101针对通过易错PCR随机产生的20000个铜绿假单胞菌脂肪酶突变体筛选改进的酰胺水解,发现了3个突变,即F207S,A213D和F265L,可影响酰胺酶/酯酶活性比。Nakagawa Y.,Hasegawa A.,Hiratake J.&Sakata K.(2007)Protein Eng Des Sel.,20,339-346描述了这项工作的后续进展,其中他们突变了铜绿假单胞菌脂肪酶以寻求更高的酰胺酶活性,并显示三重突变体F207S+A213D+M252F,而非残基M16或H83的取代,产生酰胺酶活性的增加。该项研究还试图进一步揭示为什么不水解酰胺,尽管其与能够水解酰胺的丝氨酸蛋白酶有某些相似性。二者都含有催化一个三联体,其由Ser-His-Asp/Glu以及一个氧阴离子孔构成。但是二者也有相当大的差异,表现在丝氨酸蛋白酶与铜绿假单胞菌脂肪酶之间少于30%的序列同一性。铜绿假单胞菌脂肪酶和南极假丝酵母脂肪酶B享有的序列同一性小于30%。南极假丝酵母脂肪酶B已经是有机化学中一种确立的工具,尤其是用于酯-键反应,即酯的水解和合成以及酯交换反应。
因此,理想的是产生也能够用于催化酰胺的切割(水解)和形成的脂肪酶。本发明提供在酰胺-键反应中与亲本脂肪酶相比具有改进的活性的脂肪酶变体。
发明内容
本发明涉及亲本脂肪酶的变体,所述变体是:(a)与SEQ ID NO:2的成熟多肽具有至少60%序列同一性的多肽;(b).由在低严格条件下与(i)SEQ IDNO:1的成熟多肽编码序列、或(ii)(i)的全长互补物杂交的多核苷酸所编码的多肽;(c)由与SEQ ID NO:1的成熟多肽编码序列、或编码SEQ ID NO:2的成熟多肽的序列具有至少60%同一性的多核苷酸所编码的多肽;或(d)SEQ IDNO:2的成熟多肽的片段,其中所述变体相比于所述亲本脂肪酶具有改进的酰胺-键反应中的活性。
本发明涉及在对应于SEQ ID NO:2的成熟多肽的S31R/K;G39;A225;T103V/S/A;L278G/K/R/H;W104Y/K/R;T42G/S/Q/H/I/L/M;D223G/N/A/V/H;I189;Q191;D134V/T/I/F/A/S/K/R;E188;V221A/R/K/H;7P38H/N/A/G;G41P/S;A132;N79;Q106;和/或L140R/K/H中的一个或多个位置上包含取代的变体。
本发明还涉及编码所述变体的多核苷酸;包含所述多核苷酸的核酸构建体、载体和宿主细胞;以及产生所述变体的方法。
本发明还涉及使用这些脂肪酶变体催化酰胺-键反应的方法。
附图简要说明
图1显示脂肪酶氨基酸序列的比对。
定义
酰胺-键反应中的活性:术语“酰胺-键反应中的活性”意指酰胺键的形成或裂解(永久性的或暂时性的),包括但不限于酰胺合成、酰胺水解、醇解、氨解、酰胺交换、酸解、转酰基(transacylation)、酰基转移(acyl transfer)、以及这些反应的逆反应。为本发明的目的,酰胺-键反应中的活性是根据实施例中描述的程序测定的。在一个方面,本发明的变体与亲本脂肪酶,例如SEQ IDNO:2的成熟多肽相比,具有改进的酰胺-键反应中的活性。
酰胺酶:术语“酰胺酶”意指催化酰胺水解的酶。
酯酶:术语“酯酶”意指在水的存在下催化酯水解成酸和醇的酶。
脂肪酶:术语“脂肪酶”意指催化脂质的水解或形成的酶。为本发明的目的,术语“脂肪酶”还包括任何与SEQ ID NO:2的氨基酸残基1-317有至少60%同源性的酶,无论其酶分类为何。
活性位点残基:术语“活性位点残基”指任何与底物、转化状态或产物直接接触的残基(或骨架部分)。
等位变体(allelic variant):术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
cDNA:术语“cDNA”意指能够通过反转录从得自真核或原核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工包括剪接,然后作为成熟的已剪接的mRNA出现。
编码序列:术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的多核苷酸。编码序列的边界通常由开读框决定,所述开读框通常以起始密码子如ATG、GTG或TTG开始,并且以终止密码子例如TAA、TAG或TGA结束。编码序列可以是DNA、cDNA、合成的DNA,或它们的组合。
调控序列(control sequence):术语“调控序列”意指包括对编码本发明变体的多核苷酸表达是必需的所有成分。每个调控序列对于编码所述变体的核苷酸序列可以是天然的或外源的,或每个调控序列对于彼此可以是天然(即来自相同基因)的或外源的(即来自不同基因)。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,调控序列包括启动子和转录和翻译的终止信号。调控序列可以具备用于引入可促进调控序列与编码变体的核苷酸序列编码区的连接的特异性限制位点的接头。
表达:术语“表达”包括涉及变体产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”意指线性的或环状的DNA分子,其包含编码变体的多核苷酸,并且所述多核苷酸与帮助其表达的控制序列可操作地连接。
片段:术语“片段”意指从成熟多肽的氨基和/或羧基末端缺失一个或多个(例如几个)氨基酸的多肽;其中所述片段具有改进的酰胺-键反应中的活性。
高严格条件:术语“高严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和50%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在65℃将载体材料最终洗涤三次,每次15分钟。
宿主细胞:术语“宿主细胞”意指任何适合于使用包含本发明多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的细胞类型。术语“宿主细胞”涵盖亲本细胞的由于在复制过程中发生的突变而不与亲本细胞完全相同的后代。
改进的性质:术语“改进的性质”意指变体的相比于亲本有所改进的相关性质。这样的改进的性质涉及增加的酰胺-键反应中的活性,且包括但不限于:催化效率、催化速率(catalytic rate)、转换数(turnover number)、比活性、底物结合、底物裂解(substrate cleavage)、底物特异性、和产物释放。
分离的:术语“分离的”意指以不在自然界出现的形式或环境存在的物质。分离的物质的非限定性实例包括(1)任何非天然存在的物质,(2)任何至少部分地与一种或多种或所有与其天然伴随的天然存在的成分分开的物质,包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子;(3)任何这样的物质:相对于在自然界存在的该物质,其经过人工修饰;或(4)任何这样的物质:该物质经过增加该物质相对于与其自然伴随的其他成分的量的修饰(例如,宿主细胞中编码该物质的基因的多重拷贝;和与编码该物质的基因自然结合的启动子更强的启动子的使用)。分离的物质可以存在于发酵液样品中。
低严格条件:术语“低严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和25%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在50℃将载体材料最终洗涤三次,每次15分钟。
成熟多肽:术语“成熟多肽”意指以其在翻译和任何翻译后修饰之后的最终形式存在的多肽,所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一个方面,成熟多肽为SEQ ID NO:2的氨基酸1-317。本领域中已知宿主细胞可产生由相同多核苷酸表达的两种或更多种不同成熟多肽(即具有不同的C端和/或N端氨基酸)的混合物。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有改进的酰胺-键反应中的活性的成熟多肽的多核苷酸。在一个方面,成熟多肽编码序列是SEQ ID NO:1的核苷酸76至1026。
中等严格条件:术语“中等严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和35%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在55℃将载体材料最终洗涤三次,每次15分钟。
中等-高严格条件:术语“中等-高严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和35%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在60℃将载体材料最终洗涤三次,每次15分钟。
突变体:术语“突变体”意指编码变体的多核苷酸。
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子以本来不存在于(not otherwise exist)自然界中的方式修饰以含有核酸的区段,或所述核酸分子是合成的,包含一个或多个调控序列。
可操作地连接:术语“可操作地连接”在本文表示这样的构型,其中调控序列被置于相对于多核苷酸序列的编码序列的适当位置,使得该调控序列指导该编码序列的表达。
亲本或亲本脂肪酶:术语“亲本”或“亲本脂肪酶”意指被施加取代以产生本发明的脂肪酶变体的脂肪酶。亲本可以是天然存在的(野生型)多肽或其变体或片段。
序列同一性:参数“序列同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
就本发明而言,两个氨基酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Riceet al.,2000,Trends Genet.16:276-277)(优选5.0.0版或更新版本)的Needle程序中所执行的Needleman-Wunsch算法(Needleman and Wunsch,1970,J.Mol.Biol.48:443-453)来测定。使用的可选参数为缺口开启罚分(gap open penalty)10,缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用Needle标记为“最长同一性(longest identity)”的输出结果(使用-nobrief选项获得)作为百分比同一性,并计算如下:
(同样的残基×100)/(比对长度-比对中缺口的总数)
就本发明而言,两个脱氧核糖核苷酸序列之间的同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,见上文)(优选5.0.0版或更新版本)的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来测定。使用的可选参数为缺口开启罚分10,缺口延伸罚分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩阵。使用Needle标记为“最长同一性”的输出结果(使用-nobrief选项获得)作为百分比同一性,并计算如下:
(同样的脱氧核糖核苷酸×100)/(比对长度-比对中缺口的总数)
亚序列:术语“亚序列(subsequence)”意指从成熟多肽编码序列的5’和/或3’端缺失一个或多个(例如几个)核苷酸的多核苷酸;其中所述亚序列编码具有改进的酰胺-键反应中的活性的片段。
变体:术语“变体”意指在一个或多个(例如几个)位置包含取代的、具有改进的酰胺-键反应中的活性的多肽。取代意指将占据某位置的氨基酸用不同的氨基酸替代。本发明的变体与亲本脂肪酶相比具有改进的酰胺-键反应中的活性。
非常高严格条件:术语“非常高严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和50%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在70℃将载体材料最终洗涤三次,每次15分钟。
非常低严格条件:术语“非常低严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和25%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在45℃将载体材料最终洗涤三次,每次15分钟。
野生型:术语“野生型”意指由天然存在的生物体,例如自然界中出现的细菌、古细菌、酵母、真菌、植物或动物所表达的多肽。
变体指称规则
为本发明的目的,使用SEQ ID NO:2中公开的成熟多肽来确定另一脂肪酶中的相应氨基酸残基。将另一脂肪酶的氨基酸序列与SEQ ID NO:2中公开的成熟多肽对齐,并基于该比对,使用如EMBOSS程序包(EMBOSS:The EuropeanMolecular Biology Open Software Suite,Rice et al.,2000,Trends Genet.16:276-277),优选5.0.0或更新的版本中的Needle程序所实现的Needleman-Wunsch算法(Needleman and Wunsch,1970,J.Mol.Biol.48:443-453)来确定与SEQ ID NO:2中公开的成熟多肽中的任何氨基酸残基对应的氨基酸位置编号。所用的参数为缺口开启罚分10、缺口延伸罚分0.5、以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。
对另一脂肪酶中的对应氨基酸残基的指认可以通过使用几种计算机程序,以其各自的缺省参数进行多个多肽序列的比对来确定,所述计算机程序包括但不限于MUSCLE(基于log-期望的多重序列比较;3.5或更新版本;Edgar,2004,Nucleic Acids Research 32:1792-1797),MAFFT(6.857或更新版本;Katoh and Kuma,2002,Nucleic Acids Research30:3059-3066;Katoh et al.,2005,Nucleic Acids Research33:511-518;Katoh and Toh,2007,Bioinformatics23:372-374;Katoh et al.,2009,Methods in Molecular Biology537:39-64;Katohand Toh,2010,Bioinformatics26:1899-1900),和使用ClustalW的EMBOSSEMMA(1.83或更新版本;Thompson et al.,1994,Nucleic Acids Research 22:4673-4680)。
当所述另一种酶与SEQ ID NO:2的成熟多肽已经分歧到如此程度,以至于传统的基于序列的比较无法检测出它们的关系时(Lindahl and Elofsson,2000,J.Mol.Biol.295:613-615),可以使用其他逐对的序列比较算法(pairwisesequence comparison)。当其它酶与SEQ IDΝ0:27的成熟多肽差异较大从而传统的基于序列的比较不能检测它们之间的关系时(Lindahl和Elofsson,2000,J.Mol.Biol.295:613-615),可以使用其它逐对序列比较算法。使用利用多肽家族(谱)的概率代表搜索数据库的搜索程序,可在基于序列的搜索中获得更高的灵敏度。例如,PSI-BLAST程序通过迭代的数据库搜索过程产生谱,并且能检测关系较远的同源物(Atschul等,1997,Nucleic Acids Res.25:3389-3402)。如果多肽家族或超家族在蛋白质结构数据库中有一个或多个代表,则可以实现甚至更高的灵敏度。程序如GenTHREADER(Jones,1999,J.Mol.Biol.287:797-815;McGuffin and Jones,2003,Bioinformatics19:874-881)利用来自多种来源的信息(PSI-BLAST,二级结构预测,结构比对谱,和溶解势)作为神经网络的输入,所述网络可预测所查询序列的结构折叠。类似地,可以使用Gough et al.,2000,J.Mol.Biol.313:903-919的方法比对未知结构的序列与SCOP数据库中存在的超家族模型。然后可以使用这些比对结果产生多肽的同源性模型,并且可以使用专门开发的多种工具评价这类模型的精确度。
对于已知结构的蛋白质,有几种工具和资源可用于获取和产生结构比对。例如,已经比对了蛋白质的SCOP超家族的结构,并且这些比对结果是可以访问和下载的。可以使用多种算法,如距离比对矩阵(Holm和Sander,1998,Proteins 33:88-96)或组合延伸(Shindyalov和Bourne,1998,Protein Eng.11:739-747)比对两个或更多个蛋白质的结构,并且执行这些算法还能用于查询具有目的结构的结构数据库以发现可能的结构同源物(例如,Holm和Park,2000,Bioinformatics16:566-567)。
在描述本发明的变体时,为便于提述,采用下述命名法。在所有情况下,应用公认的IUPAC单字母或三字母氨基酸缩写。
取代.对于氨基酸取代,使用下述命名法:原始氨基酸、位置、取代氨基酸。因此,在位置226用丙氨酸取代苏氨酸表示为“Thr226Ala”或“Τ226Α”。
多个取代.多个突变用加号(“+”)分隔,例如,“Arg170Tyr+Gly195Glu”或“R170Y+G195E”,代表在位置170和195的突变,分别用酪氨酸取代精氨酸,和用谷氨酸取代甘氨酸。
不同的取代.当在一个位置可以引入不同的改变时,不同的改变用逗号分隔,例如,“Arg170Tyr,Glu”,或者用斜线分隔,例如“R170Y/E”,代表在位置170用酪氨酸或谷氨酸取代精氨酸。因此,“Tyr167Gly,Ala+Arg170Gly,Ala”或“Y167G/A+R170G/A”分别表示下述变体:
“Tyr167Gly+Arg170Gly”,“Tyr167Gly+Arg170Ala”,“Tyr167Ala+Arg170Gly”,和“Tyr167Ala+Arg170Ala”或“Y167G+R170G”,“Y167G+R170A”,“Y167A+R170G”和“Y167A+R170A”。
发明详述
改进的酰胺-键反应中的活性
与亲本酶相比,本发明涉及变体对至少一种底物中的至少一个选定的酰胺键的活性的改进。因此,具备改进的酰胺-键反应中的活性的酶可以用于许多目的,例如在胺和酰胺是关键中间体和产物的生物催化、有机合成和分析中,例如在药物和杀虫剂合成、分析和降解中,水解(例如保护基团的除去、残余物的降解),醇解,氨解,酸解,酰胺形成,酰胺交换反应,酰胺、胺、羧酸、酯和醇的外消旋拆分,对不希望的酰胺的降解,例如对土壤、表面、食品和饲料的净化;从中间产品去除天然产生的酰胺,对含有酰胺的产品的改性。对于任何使用此类生物催化剂的工业用途,增加酰胺-键反应中的活性都可能是理想的。
底物和产物
底物或产物可以是任何包含酰胺-键的化合物。实例包括但不限于N-异丙基-丁酰胺(N-propyl-butyramide),2-氯-N-乙基-乙酰胺(2-chloro-N-ethyl-acetamide)、2-溴-N-癸基-乙酰胺(2-bromo-N-decyl-acetamide)、N-[3-(二甲基氨基)-丙基]-月桂酰胺(N-[3-(dimethylamino)-propyl]-lauramide))、对-硝基苯基-酰胺(p-nitrophenyl-amides),例如对-硝基苯基-乙酰胺(=对-硝基乙酰苯胺),对-硝基苯基-丁酰胺、N-(2-萘基)-酰胺(N-(2-naphthyl)-amides),例如N-(2-萘基)油酰胺(N-(2-naphthyl)-oleamide)、4-硝基-N-丙基-苯甲酰胺(4-nitro-N-propyl-benzamide)。进一步的例子是结构如下的化合物:
其中任何R基团可为氢(H)或另一已知在有机化合物中出现的残基。
这些底物示例包括,但不限于N-苄基氯乙酰胺(=2-氯-N-苄基-乙酰胺)、N-苄基-丁酰胺、N-苄基癸酰胺、N-苄基苯甲酰胺、2,2,2-三氟-N-[α-甲基-苄基]-乙酰胺、2,2-二氯-N-(1-苯乙基)-乙酰胺、N-(1-苯乙基)辛酰胺、N-(1-苯乙基)-2-甲氧基乙酰胺、N-[1-(4-甲基苯基)-乙基]-辛酰胺、N-[1-(4-氯苯基)-乙基]-2-甲氧基乙酰胺、N-[1-(4-苯氧基苯基)-乙基]-辛酰胺、N-[1-(萘-2-基)-乙基]-乙酰胺、N-[1{二环[2.2.1]庚烷-1-基}-乙基)-辛酰胺、辣椒素(=8-甲基-N-香草基反式-6-壬烯酰胺),氟丁酰草胺(beflubutamid)(=(RS)-N-苄基-2(α,α,α,4-四氟-间-甲苯氧基)-丁酰胺),苄草胺(benzipram)(=N-苄基-N-异丙基-3,5-二甲基苯甲酰胺)、溴丁酰草胺(bromobutide)(=(RS)-2-2-溴-3,3-二甲基-N-(1-甲基-1-苯基乙基)-丁酰胺),牧草胺(tebutam)(=N-苄基-N-异丙基-2,2-二甲基丙酰胺),ε-氨基己酰基-对-氯苯甲酰胺、N-乙酰普鲁卡因胺(N-acetyl-procainamide)、3-(4-羟基苯基)-N-苄基-丙酰胺、N,N′-二苄基-邻苯二甲酰胺。
催化三联体附近的改变
在脂肪酶的活性位点中有三个氨基酸:一个丝氨酸(S)、一个组氨酸(H)和一个天冬氨酸(D)/谷氨酸(E),形成催化三联体。SEQ ID NO:2的催化三联体是(constitute)残基S105、D187和H224。
这样位于距SEQ ID NO:2的至少一个催化三联体残基以内的氨基酸残基为:G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38;G41;A132;N79;Q106;和L140。位于距SEQ ID NO:2的S105以内的氨基酸残基为:G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;P38;G41;A132;N79;和Q106。位于距SEQ ID NO:2的D187以内的氨基酸残基为:A225;L278;W104;D223;I189;Q191;D134;E188;V221;A132;Q106;和L140。位于距SEQ ID NO:2的H224以内的氨基酸残基为:G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38;G41;A132;Q106;和L140。
这样位于距SEQ ID NO:2的至少一个催化三联体残基以内的氨基酸残基为:G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38;G41;A132;Q106;和L140。位于距SEQ ID NO:2的S105以内的氨基酸残基为G39;A225;T103;W104;T42;I189;D134;P38;G41;A132;和Q106。位于距SEQ ID NO:2的D187以内的氨基酸残基为A225;W104;D223;I189;Q191;D134;E188;V221;A132;和L140。位于距SEQ ID NO:2的H224以内的氨基酸残基为G39;A225;L278;W104;D223;I189;Q191;D134;E188;A132;和Q106。
这样位于距SEQ ID NO:2的至少一个催化三联体残基以内的氨基酸残基为:G39;A225;T103;L278;W104;D223;I189;Q191;D134;E188;P38;A132;Q106;和L140。位于距SEQ ID NO:2的S105以内的氨基酸残基为G39;T103;W104;I189;D134;P38;A132;和Q106。位于距SEQ ID NO:2的D187以内的氨基酸残基为D223;I189;Q191;E188;A132;和L140。位于距SEQ ID NO:2的H224以内的氨基酸残基为A225;L278;W104;D223;I189;E188;A132;和Q106。
本发明涉及分离的脂肪酶变体,其在对应于SEQ ID NO:2的成熟多肽的位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中的一个或多个(例如几个)位置上包含取代,其中该变体具有改进的酰胺-键反应中的活性。
本发明在某些实施方案中涉及这样的变体,其中所述变体包含至少一个氨基酸残基的取代,所述氨基酸残基对应于SEQ ID NO:2中位于距离催化三联体中的至少一个氨基酸残基以内的位置,所述位置选自:G39;A225;T103V/S/A;L278G/K/R/H;W104Y/K/R;T42G/S/Q/H/I/L/M;D223G/N/A/V/H;I189;Q191;D134V/T/I/F/A/S/K/R;E188;V221A/R/K/H;P38H/N/A/G;G41P/S;A132;N79;Q106;L140R/K/H。
本发明在某些实施方案中涉及这样的变体,其中所述取代为:G39A;A225I/V/L/M/K/R/S/T/G/H;I189Y/H/Q/N/R/K/A/E/S/T/G;Q191N/A/R/K/H;E188Q/R/D/N/K/H/A;A132S/N/G/H/K/R;N79V/Q/E;或Q106N/Y。
本发明在某些实施方案中涉及这样的变体,其中所述变体还包含至少一个氨基酸残基的取代,所述氨基酸残基对应于SEQ ID NO:2中位于距离催化三联体中的至少一个氨基酸残基以内的位置,所述位置选自:T103G;L278A/V;W104F/Q;T42N/V/A;D134L;G41A。
本发明在某些实施方案中涉及这样的变体,其中所述变体包含至少一个氨基酸残基的取代,所述氨基酸残基对应于SEQ ID NO:2中位于距离催化三联体中的至少一个氨基酸残基以内的位置,所述位置选自:G39;A225;T103V/S/A;L278G/K/R/H;W104Y/K/R;T42G/S/Q/H/I/L/M;D223G/N/A/V/H;I189;Q191;D134V/T/I/F/A/S/K/R;E188;V221A/R/K/H;P38H/N/A/G;G41P/S;A132;Q106;L140R/K/H。
本发明在某些实施方案中涉及这样的变体,其中所述取代为:G39A;A225I/V/L/M/K/R/S/T/G/H;I189Y/H/Q/N/R/K/A/E/S/T/G;Q191N/A/R/K/H;E188Q/R/D/N/K/H/A;A132S/N/G/H/K/R;或Q106N/Y。
本发明在某些实施方案中涉及这样的变体,其中所述变体还包含至少一个氨基酸残基的取代,所述氨基酸残基对应于SEQ ID NO:2中位于距离催化三联体中的至少一个氨基酸残基以内的位置,所述位置选自:T103G;L278A/V;W104F/Q;T42N/V/A;D134L;G41A。
本发明在某些实施方案中涉及这样的变体,其中所述变体包含至少一个氨基酸残基的取代,所述氨基酸残基对应于SEQ ID NO:2中位于距离催化三联体中的至少一个氨基酸残基以内的位置,所述位置选自:G39;A225;T103V/S/A;L278G/K/R/H;W104Y/K/R;D223G/N/A/V/H;I189;Q191;D134V/T/I/F/A/S/K/R;E188;P38H/N/A/G;A132;Q106;L140R/K/H。
本发明在某些实施方案中涉及这样的变体,其中所述取代为:G39A;A225I/V/L/M/K/R/S/T/G/H;I189Y/H/Q/N/R/K/A/E/S/T/G;Q191N/A/R/K/H;E188Q/R/D/N/K/H/A;A132S/N/G/H/K/R;或Q106N/Y。
本发明在某些实施方案中涉及这样的变体,其中所述变体还包含至少一个氨基酸残基的取代,所述氨基酸残基对应于SEQ ID NO:2中位于距离催化三联体中的至少一个氨基酸残基以内的位置,所述位置选自:T103G;L278A/V;W104F/Q;D134L。
本发明在某些实施方案中涉及这样的变体,其相比于亲本脂肪酶包含导致活性位点口袋的几何条件(即体积或形状)的变化的至少一个氨基酸残基的取代。这可以提供底物、过渡态或活性位点口袋残基的改善的结合或更好的朝向。
本发明在某些实施方案中涉及一种变体,其中所述变体包含至少一个对应于SEQ ID NO:2中选自下列的位置的氨基酸残基的取代:G39;A225;T103V/S/A;L278G;W104Y/K/R;T42G/S/Q/H/I/L/M;D223G/N/A/V/H;I189;Q191;D134V/T/I/F/A/S/K/R;E188;V221A/R/K/H;P38H/N/A/G;G41P/S;A132;N79;Q106。
本发明在某些实施方案中涉及这样的变体,其中所述取代为:G39A;A225I/V/L/M/K/R/S/T/G/H;I189Y/H/Q/N/R/K/A/E/S/T/G;Q191N/A/R/K/H;E188Q/R/D/N/K/H/A;A132S/N/G/H/K/R;N79V/Q/E;或Q106N/Y。
本发明在某些实施方案中涉及这样的变体,其中所述变体还包含至少一个对应于SEQ ID NO:2中选自下列的位置的氨基酸残基的取代:T103G;L278A/V;W104F/Q;T42N/V/A;D134L;G41A。
本发明在某些实施方案中涉及一种变体,其与亲本脂肪酶相比,包含至少一个氨基酸残基的导致该残基更带正电的取代,即带负电的残基被取代为中性或带正电的残基,而中性残基被取代为带正电的残基。不意在限定,认为向更带正电的变化可通过静电场影响至少一个催化三联体残基。
本发明在某些实施方案中涉及一种变体,其中所述变体包含至少一个氨基酸残基的取代,所述氨基酸残基对应于SEQ ID NO:2中选自下列的位置:A225;L278K/R/H;W104K/R;T42H;D223G/N/A/V/H;I189;Q191;D134V/T/I/F/A/S/K/R;E188;V221R/K/H;P38;A132;Q106;和L140R/K/H。
本发明在某些实施方案中涉及这样的变体,其中所述取代为:A225K/R/H;I189R/K/H;Q191R/K/H;E188Q/R/N/K/H/A;A132H/K/R;和Q106N/Y。
本发明在某些实施方案中涉及这样的变体,其中所述变体还包含对应于SEQ ID NO:2中的位置的至少一个氨基酸残基的取代,其选自:D134L。
本发明在某些实施方案中涉及这样的变体,其包含两个或更多个(几个)氨基酸残基的取代,所述取代影响活性位点口袋的几何条件,即体积或形状,和/或活性位点残基的电荷。本发明在某些实施方案中涉及这样的变体,其中至少一个影响几何条件的取代与至少一个影响活性位点残基电荷的取代组合。
在一个方面,所述变体具有改进的酰胺-键反应中的活性,并且与亲本脂肪酶有至少60%、例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性。在一个方面,所述变体的氨基酸序列与亲本脂肪酶相差至多20个氨基酸,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。
亲本脂肪酶
亲本多肽,即亲本脂肪酶可以获自任何属的生物体。为本发明的目的,本文中结合给定来源使用的术语“获自”的意思应为:由多核苷酸编码的亲本多肽是由该来源产生的,或者是由已插入了来自该来源的所述多核苷酸的细胞所产生的。在一个方面,亲本多肽是胞外分泌的。
亲本多肽可以是真菌多肽。在一个方面,所述亲本多肽是真菌多肽例如南极假丝酵母脂肪酶B、Hyphozyma sp.脂肪酶、玉米黑粉菌(Ustilago maydis)脂肪酶、丝孢堆黑粉菌(Sporisorium reilianum)脂肪酶或Cryptococcustsukubaensis(Pseudozyma tsukubaensis)脂肪酶多肽。应当理解,对于上述物种,本发明包括完全状态和不完全状态,以及其他分类学上的等同物,例如无性型,而无论这些物种已知的名称如何。本领域技术人员将容易识别合适的等同物的身份。
在一个方面,亲本多肽组成为,或包含与选自下组的脂肪酶具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%,或100%同一性的氨基酸序列:南极假丝酵母脂肪酶B(SEQ ID No:2),Hyphozyma sp.脂肪酶(SEQ ID No:3),玉米黑粉菌脂肪酶(SEQ ID No:4),Sporisorium reilianum脂肪酶,SEQ ID No:5),和Cryptococcus tsukubaensis(Pseudozyma tsukubaensis)脂肪酶(SEQ ID No:6)。
亲本脂肪酶可以是(a)与SEQ ID NO:2的成熟多肽具有至少60%序列同一性的多肽;(b)由在低严格条件下与(i)SEQ ID NO:1的成熟多肽编码序列、或(ii)(i)的全长互补物杂交的多核苷酸所编码的多肽;或(c)由与SEQ ID NO:1的成熟多肽编码序列具有至少60%同一性的多核苷酸所编码的多肽。
表1:脂肪酶氨基酸序列
在一个方面,所述亲本多肽具有与SEQ ID No:2-6中的任何多肽相差少于20个氨基酸,少于19个氨基酸,少于18个氨基酸,少于17个氨基酸,少于16个氨基酸,少于15个氨基酸,少于14个氨基酸,少于13个氨基酸,少于12个氨基酸,少于11个氨基酸,少于10个氨基酸,少于9个氨基酸,少于8个氨基酸,少于7个氨基酸,少于6个氨基酸,少于5个氨基酸,少于4个氨基酸,少于3个氨基酸,少于2个氨基酸,或相差0个氨基酸的氨基酸序列。
除了20种标准氨基酸,非标准氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。可以用有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸来取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于标准氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上可获得的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。
在一个方面,亲本多肽组成为或包含SEQ ID NO:2-6中的任一氨基酸序列,其等位变体或其片段。在一个方面,亲本多肽组成为或包含SEQ ID NO:2-6之任一的成熟多肽。在另一个方面,亲本多肽组成为或包含选自下组的氨基酸:SEQ ID No:2的氨基酸1至317;SEQ ID No:3的氨基酸1至319;SEQID No:4的氨基酸1至336;SEQ ID No:5的氨基酸1至341;SEQ ID No:6的氨基酸1至316;其等位变体及其片段。
SEQ ID NO:2-6中任一者的多肽或成熟多肽的等位变体是由等位变体(即基因的占据同一染色体座位的两种或更多中可选形式)编码的多肽。
SEQ ID NO:2-6中任一者的多肽或成熟多肽的片段是从该氨基酸序列的氨基和/或羧基末端缺失了一个或多个(几个)氨基酸的多肽。优选地,片段含有至少100个氨基酸残基、至少125个氨基酸残基、至少150个氨基酸残基、至少175个氨基酸残基、至少180个氨基酸残基、至少190个氨基酸残基、至少200个氨基酸残基、至少210个氨基酸残基、至少220个氨基酸残基或至少230个氨基酸残基。片段可由100至450个氨基酸组成,例如由150至450、175至400、200至350、225至325、或250至300个氨基酸组成。在一个方面,所述亲本多肽组成为或包含SEQ ID NO:2的氨基酸残基34至277、或氨基酸残基39至54。
SEQ ID NO:1的成熟多肽编码序列或其同源物的亚序列是已有一个或多个(几个)核苷酸从5’和/或3’末端缺失的核苷酸序列。优选的,亚序列含有至少300个核苷酸、至少375个核苷酸、至少450个核苷酸、至少525个核苷酸、至少540个核苷酸、至少570个核苷酸、至少600个核苷酸、至少630个核苷酸、至少660个核苷酸、或至少690个核苷酸。
SEQ ID NO:1的多核苷酸或其亚序列、以及SEQ ID NO:2的氨基酸序列或其片段可以用来设计核酸探针来从不同属或种的株根据本领域公知的方法鉴定和克隆编码亲本多肽的DNA。特别地,此类探针可以用来依照标准Southern印迹程序与感兴趣的属或种的基因组或cDNA杂交,以鉴定并分离其中的相应基因。这样的探针可以显著短于完整序列,但长度应该为至少14个,例如至少25,至少35,或至少70个核苷酸。优选地,核酸探针长度为至少100个核苷酸,例如长度为至少200个核苷酸,至少300个核苷酸,至少400个核苷酸,至少500个核苷酸,至少600个核苷酸,至少700个核苷酸,至少800个核苷酸,或至少900个核苷酸。DNA和RNA探针都可以使用。探针通常进行标记(例如用32P、3H、35S、生物素、或亲和素标记)以检测对应的基因。本发明涵盖此类探针。
可从自此类其他生物中制备的基因组DNA或cDNA文库筛选与上述探针杂交并编码亲本的DNA。可通过琼脂糖或聚丙烯酰胺凝胶电泳或其他分离技术分离来自此类其他生物的基因组或其他DNA。可将来自所述文库的DNA或分离的DNA转移到硝化纤维或其他合适载体材料上并固定在其上。为了鉴定与SEQ ID NO:1或其亚序列同源的克隆或DNA,将载体材料用于Southern印迹法。
就本发明目的而言,杂交指所述多核苷酸在低严格条件至非常高严格条件下杂交到对应于(i)SEQ ID NO:1;(ii)SEQ ID NO:1的成熟多肽编码序列;(iii)其全长互补物;或(iv)其亚序列的标记核苷酸探针上。与所述探针杂交的分子可以使用例如X射线胶片或本领域已知的任何其他检测手段进行检测。
在一个方面,所述核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另一个方面,所述核酸探针是SEQ ID NO:1的核苷酸76至1026。在另一个方面,所述核酸探针是编码SEQ ID NO:2的多肽的多核苷酸序列,或其亚序列。
就长度为至少100个核苷酸的长探针而言,非常低至非常高的严格条件定义为在42℃,在5X SSPE,0.3%SDS,200微克/mL剪切变性鲑精DNA,以及25%甲酰胺(非常低和低严格条件)、35%甲酰胺(中等和中-高严格条件)或50%甲酰胺(高和非常高严格条件)中预杂交和杂交,按照标准Southern印迹程序进行12至24小时(最适)。
就长度为至少100个核苷酸的长探针而言,最后用2X SSC,0.2%SDS优选地在45℃(非常低严格条件),50℃(低严格条件),55℃(中等严格条件),60℃(中-高严格条件),65℃(高严格条件),70℃(非常高严格条件)洗涤载体材料三次,每次15分钟。
就长度为约15个核苷酸至约70个核苷酸的短探针而言,严格条件定义为在比根据Bolton和McCarthy(1962,Proc.Natl.Acad.Sci.USA 48:1390)的算法计算出的Tm低约5℃至约10℃,在0.9M NaCl,0.09M Tris-HCl pH7.6,6mM EDTA,0.5%NP-40,1X Denhardt溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mMATP,以及0.2mg酵母RNA每毫升中预杂交、杂交、以及杂交后洗涤,按照标准Southern印迹程序进行12-24小时(最适)。
就长度为约15个核苷酸至约70个核苷酸的短探针而言,最后将载体材料在6X SCC加0.1%SDS中洗涤一次,时间15分钟,并且用6X SSC洗涤两次,每次15分钟,洗涤温度为低于计算出的Tm5℃至10℃。
在第三个方面,亲本多肽是由这样的多核苷酸编码的,所述多核苷酸包含或组成为与SEQ ID NO:1的成熟多肽编码序列具有至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的同一性程度的核苷酸序列。在一个方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸76-1026。
在另一个方面,所述亲本是由与(i)SEQ ID NO:1的成熟多肽编码序列,或(ii)(i)的全长互补物(Sambrook,Fritsch,and Maniatis,1989,MolecularCloning,A Laboratory Manual,2d edition,Cold Spring Harbor,New York)在非常低严格条件、低严格条件、中等严格条件、中-高严格条件、高严格条件、或非常高严格条件下杂交的多核苷酸所编码的。
所述亲本可以是融合多肽或可切割的融合多肽,其中将另一个多肽融合到本发明多肽的N末端或C末端。通过将编码另一个多肽的多核苷酸融合于编码本发明多肽的多核苷酸序列来产生融合的多肽。产生融合多肽的技术是本领域已知的,包括连接编码多肽的编码序列以使它们符合读框,并且使融合多肽的表达在相同启动子和终止子的控制下。还可以使用蛋白质内含子(Cooper et al.,1993,EMBO J.12:2575-2583;Dawson et al.,1994,Science 266:776-779)技术来构建融合多肽,使得融合在翻译后形成。
融合多肽还可以在两个多肽之间包括切割位点。融合蛋白一旦被分泌,所述位点就被切割,释放这两个多肽。切割位点的实例包括,但不限于,Martin etal.,2003,J.Ind.Microbiol.Biotechnol.3:568-576;Svetina et al.,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson et al.,1997,Appl.Environ.Microbiol.63:3488-3493;Ward et al.,1995,Biotechnology13:498-503;and Contreras et al.,1991,Biotechnology9:378-381;Eaton et al.,1986,Biochemistry25:505-512;Collins-Racie et al.,1995,Biotechnology13:982-987;Carter et al.,1989,Proteins:Structure,Function,and Genetics6:240-248;及Stevens,2003,DrugDiscovery World4:35-48中公开的位点。
可以使用上述的探针从其它来源鉴定和获得所述亲本,所述来源包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从天然材料(例如,土壤、堆肥、水等)获得的DNA样品。用于从天然生境(habitat)分离微生物和DNA的技术是本领域内公知的。随后可通过类似地筛选另一种微生物的基因组或cDNA文库或混合的DNA样品来获得编码所述亲本的多核苷酸。一旦用探针检测到编码亲本的多核苷酸,就能够通过使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook,1989,同上)。
变体
本发明提供脂肪酶变体,其在对应于SEQ ID No:2的位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134E188;V221;P38H;G41;A132;N79;Q106;和L140的一个或多个(例如几个)位置上包含突变,其中所述变体具有改进的酰胺-键反应中的活性。
在一个实施方案中,所述变体与亲本脂肪酶的氨基酸序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。
在另一个实施方案中,所述变体与SEQ ID NO:2的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%,例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。在一个实施方案中,所述变体与SEQ ID NO:2的氨基酸序列34-277具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%,例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。在一个实施方案中,所述变体与SEQ ID NO:2的氨基酸序列38-254具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%,例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。
在另一个实施方案中,所述变体与SEQ ID NO:3的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%,例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。
在另一个实施方案中,所述变体与SEQ ID NO:4的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%,例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。
在另一个实施方案中,所述变体与SEQ ID NO:5的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%,例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。
在另一个实施方案中,所述变体与SEQ ID NO:6的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%,例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。
在一个方面,本发明的变体中的取代的数目为1-20,1-10,1-5,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,或20个改变。
在另一个方面,变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140的一个或多个(例如几个)位置包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的两个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的三个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的四个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的五个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的六个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的七个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的八个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的九个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的十个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的十一个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的十二个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的十三个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的十四个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的十五个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的十六个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的十七个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中任意位置的十八个位置上包含取代。在另一个方面,所述变体在对应于位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38H;G41;A132;N79;Q106;和L140中每一位置的位置上均包含取代。
在另一个方面,所述变体在或者仅在对应于位置S31的位置上包含取代(comprises or consists of a substitution at a position corresponding to positionS31)。在另一个方面,在对应于位置S31的位置上的氨基酸被取代为Arg。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代S31R或S31K。
在另一个方面,所述变体在或者仅在对应于位置G39的位置上包含取代。在另一个方面,在对应于位置G39的位置上的氨基酸被取代为Ala。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代G39A。
在另一个方面,所述变体在或者仅在对应于位置A225的位置上包含取代。在另一个方面,在对应于位置A225的位置上的氨基酸被取代为Ile、Val、Leu、Met、Lys、Arg、Ser、Thr、Gly、或His。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代A225I、A225V、A225L、A225M、A225K、A225R、A225S、A225T、A225G、或A225H。
在另一个方面,所述变体在或者仅在对应于位置T103的位置上包含取代。在另一个方面,在对应于位置T103的位置上的氨基酸被取代为Ala、Ser、或Val。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代T103V、T103S、或T103A。
在另一个方面,所述变体在或者仅在对应于位置L278的位置上包含取代。在另一个方面,在对应于位置L278的位置上的氨基酸被取代为Arg、Gly、His、或Lys。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代L278G、L278K、L278R、或L278H。
在另一个方面,所述变体在或者仅在对应于位置W104的位置上包含取代。在另一个方面,在对应于位置W104的位置上的氨基酸被取代为Arg、Lys、或Tyr。在另一个方面,所述变体包含或仅包含取代W104Y、W104K、或W104R。
在另一个方面,所述变体在或者仅在对应于位置T42的位置上包含取代。在另一个方面,在对应于位置T42的位置上的氨基酸被取代为Gln、Gly、His、Ile、Leu、Met、或Ser。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代T42G、T42S、T42Q、T42H、T42I、T42L、或T42M。
在另一个方面,所述变体在或者仅在对应于位置D223的位置上包含取代。在另一个方面,在对应于位置D223的位置上的氨基酸被取代为Ala、Asn、Gly、His、或Val。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代D223G、D223N、D223A、D223V、或D223H。
在另一个方面,所述变体在或者仅在对应于位置I189的位置上包含取代。在另一个方面,在对应于位置I189的位置上的氨基酸被取代为Ala、Arg、Asn、Gln、Glu、His、Lys、Ser、Thr、或Val。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代I189Y、I189H、I189Q、I189N、I189R、I189K、I189A、I189E、I189S、I189T、或I189G。
在另一个方面,所述变体在或者仅在对应于位置Q191的位置上包含取代。在另一个方面,在对应于位置Q191的位置上的氨基酸被取代为Asn、Ala、Arg、Lys、或His。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代Q191N、Q191A、Q191R、Q191K、或Q191H。
在另一个方面,所述变体在或者仅在对应于位置D134的位置上包含取代。在另一个方面,在对应于位置D134的位置上的氨基酸被取代为Ala、Arg、Ile、Lys、Phe、Ser、Thr、或Val。在另一个方面,所述变体包含或仅包含SEQID NO:2的成熟多肽的取代D134V、D134T、D134I、D134F、D134A、D134S、D134K、或D134R。
在另一个方面,所述变体在或者仅在对应于位置E188的位置上包含取代。在另一个方面,在对应于位置E188的位置上的氨基酸被取代为Gln、Arg、Asp、Asn、Lys、His、或Ala。在另一个方面,所述变体包含或仅包含SEQ IDNO:2的成熟多肽的取代E188Q、E188R、E188D、E188N、E188K、E188H、或E188A。
在另一个方面,所述变体在或者仅在对应于位置V221的位置上包含取代。在另一个方面,在对应于位置V221的位置上的氨基酸被取代为Ala、Arg、His、或Lys。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代V221A、V221R、V221K、或V221H。
在另一个方面,所述变体在或者仅在对应于位置P38的位置上包含取代。在另一个方面,在对应于位置P38的位置上的氨基酸被取代为Ala、Asn、Gly、或His。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代P38H、P38N、P38A、或P38G。
在另一个方面,所述变体在或者仅在对应于位置G41的位置上包含取代。在另一个方面,在对应于位置G41的位置上的氨基酸被取代为Pro、或Ser。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代G41P、或G41S。
在另一个方面,所述变体在或者仅在对应于位置A132的位置上包含取代。在另一个方面,在对应于位置A132的位置上的氨基酸被取代为Ser、Asn、Gly、His、Lys、或Arg。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代A132S、A132N、A132G、A132H、A132K、或A132R。
在另一个方面,所述变体在或者仅在对应于位置N79的位置上包含取代。在另一个方面,在对应于位置N79的位置上的氨基酸被取代为Val、Gln、或Glu。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代N79V、N79Q、或N79E。
在另一个方面,所述变体在或者仅在对应于位置Q106的位置上包含取代。在另一个方面,在对应于Q106的位置上的氨基酸被取代为Asn或Tyr。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代Q106N、或Q106Y。
在另一个方面,所述变体在或者仅在对应于位置L140的位置上包含取代。在另一个方面,在对应于位置L140的位置上的氨基酸被取代为Arg、His、或Lys。在另一个方面,所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代L140R、L140K、或L140H。
在另一个方面,所述变体包含或仅包含下表2所示的对应于SEQ ID NO:2中位置的氨基酸残基序列的如下任何组合:
表2:对应于SEQ ID NO:2中位置的氨基酸残基的取代
所述变体可以在一个或多个(例如几个)其他位置进一步包含一个或多个额外的改变。
氨基酸改变可能是次要性的(of a minor nature),即不显著影响蛋白质的折叠和/或活性的保守的氨基酸取代、缺失或插入;小的缺失,通常为1-30个氨基酸;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(poly histidine tract)、抗原表位(antigenic epitope)或结合域(binding domain)。
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳香氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变特定活性的氨基酸取代是本领域已知的,并且由例如H.Neurath和R.L.Hill,1979,于The Proteins,Academic Press,New York中描述。常见的交换是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly。
在一个实施方案中,所述变体相比于亲本脂肪酶具有改进的催化效率。在一个实施方案中,所述变体相比于亲本脂肪酶具有改进的催化速率。在一个实施方案中,所述变体相比于亲本脂肪酶具有改进的比活性。在一个实施方案中,所述变体相比于亲本脂肪酶具有改进的底物结合。在一个实施方案中,所述变体相比于亲本脂肪酶具有改进的底物裂解。在一个实施方案中,所述变体相比于亲本脂肪酶具有改进的底物特异性。在一个实施方案中,所述变体相比于亲本脂肪酶具有改进的产物释放。在一个实施方案中,所述变体相比于亲本脂肪酶具有改进的转换数。
变体的制备
本发明还涉及用于获得具有改进的酰胺-键反应中活性的变体的方法,包括:(a)向亲本脂肪酶的一个或多个(例如几个)位置导入取代,所述位置对应于SEQ ID NO:2的成熟多肽的位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134;E188;V221;P38;G41;A132;N79;Q106;和L140,其中所述变体具有改进的酰胺-键反应中的活性;和(b)回收该变体。
所述变体可以使用本领域已知的任何诱变程序来制备,例如定点诱变、合成基因构建、半合成基因构建、随机诱变、改组、增变株、物理和化学诱变原(例如UV光、离子化辐照、亚硝酸、羟胺),等等。
定点诱变是其中在编码亲本的多核苷酸中的一个或多个确定位点上制造一个或多个(几个)突变的技术。定点诱变能在体外通过PCR完成,所述PCR涉及使用包含期望诱变的寡核苷酸引物。定点诱变也能在体外通过盒诱变进行,所述盒诱变涉及限制性酶在包含编码亲本的多核苷酸中的某个位点上切割,以及随后包含该多核苷酸中的突变的寡核苷酸。通常消化质粒和寡核苷酸的限制性酶是相同的,使得质粒的粘性末端和插入序列的粘性末端能够彼此连接。参见例如Scherer and Davis,1979,Proc.Natl.Acad.Sci.USA 76:4949-4955;和Barton et al.,1990,Nucleic Acids Res.18:7349-4966。定点诱变也可以通过本领域已知的方法在体内实现。参见例如美国专利申请公布第2004/0171154号;Storici et al.,2001,Nature Biotechnol.19:773-776;Kren et al.,1998,Nat.Med.4:285-290;以及Calissano and Macino,1996,Fungal Genet.Newslett.43:15-16。任何定点诱变程序都能够用于本发明。有多种商业试剂盒可用来制备变体。
合成基因构建涉及在体外合成设计为编码目标多肽分子的多核苷酸分子。基因合成可使用多种技术进行,如由Tian等所述基于多通道微芯片(multiplex microchip-based)的技术(Tian,et.al.,Nature432:1050-1054),以及类似的技术,其中合成寡核苷酸并在可用光编程(photo-programmable)的微流芯片(microfluidic chip)上组装。
可使用已知的诱变、重组、和/或改组方法制造并测试单个或多个氨基酸取代、缺失、和/或插入,随后进行相关的筛选程序,例如那些由以下文献公开的程序:Reidhaar-Olson and Sauer,1988,Science241:53-57;Bowie andSauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;WO95/17413;或WO95/22625。可用的其他方法包括易错PCR、噬菌体展示(Lowman et al.,1991,Biochemistry30:10832-10837;美国专利5,223,409;WO92/06204)和区域定向诱变(Derbyshire et al.,1986,Gene46:145;Ner et al.,1988,DNA 7:127)。
诱变/改组方法可与高通量自动化筛选方法组合使用以检测由宿主细胞表达的经克隆的经诱变多肽的活性(Ness et al.,1999,Nature Biotechnology 17:893-896)。编码活性多肽的经诱变DNA分子可从宿主细胞中回收并使用本领域的标准方法快速测序。通过这些方法可以迅速确定各别氨基酸残基在多肽中的重要性。
半合成基因构建可通过将合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组等方面组合而达成。典型的半合成构建是将合成的多核苷酸片段与PCR技术组合使用的方法。例如,基因中的确定区域可从头合成,另外的区域可使用定点诱变引物扩增,再另外的其他区域可进行易错PCR或非易错PCR扩增。多核苷酸亚序列可随后进行改组。
多核苷酸
本发明还涉及编码本发明变体的分离的多核苷酸。
核酸构建体
本发明还涉及核酸构建体,其包含与一种或多种(几种)调控序列可操作地连接的、编码本发明的变体的多核苷酸,所述调控序列指导所述编码序列在合适的宿主中在与所述调控序列相容的条件下表达。
可以用许多方式操作多核苷酸以便为变体的表达提供条件。依赖于表达载体,在将多核苷酸插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
调控序列可为启动子,其是被用于表达编码多肽的多核苷酸的宿主细胞所识别的多核苷酸。启动子含有介导变体的表达的转录控制序列。启动子可以是在所选的宿主细胞中显示转录活性的任何多核苷酸,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于在细菌宿主细胞中指导本发明的核酸构建体转录的合适启动子的实例是从下述获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌(Bacillus thuringiensis)cryIIIA基因(Agaisse and Lereclus,1994,Molecular Microbiology 13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon et al.,1988,Gene 69:301-315)、天蓝链霉菌琼脂酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedingsof the National Academy of Sciences USA75:3727-3731),以及tac启动子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA 80:21-25)。另外的启动子在"Useful proteinsfrom recombinant bacteria"于Gilbert等,1980,Scientific American,242:74-94中;和Sambrook等,1989,见上文中描述。串联启动子的例子公开于WO99/43835。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO96/00787)、镶片镰孢淀粉葡糖苷酶(WO00/56900)、镶片镰孢Daria(WO00/56900)、镶片镰孢Quinn(WO00/56900)、曼赫根毛霉(Rhizomucor miehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶、以及NA2-tpi启动子(一种来自曲霉属中性α-淀粉酶基因的修饰的启动子,其中的非翻译前导序列已被来自曲霉属丙糖磷酸异构酶的基因的非翻译前导序列所替代;非限制性实例包括:来自黑曲霉中性α-淀粉酶基因的修饰的启动子,其中的非翻译前导序列已被来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的非翻译前导序列所替代);和它们的突变的、截短的和杂合的启动子。
在酵母宿主中,有用的启动子从如下的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast 8:423-488描述。
调控序列也可以是转录终止子,其由宿主细胞识别以终止转录。所述终止子序列与编码所述变体的多核苷酸的3’末端可操作地连接。在本发明中,可使用任何在宿主细胞中有功能的终止子。
对于细菌宿主细胞而言优选的终止子获自克劳氏芽孢杆菌(Bacillusclausii)碱性磷酸酶(aprH),地衣芽孢杆菌α淀粉酶(amyL)和大肠杆菌核糖体RNA(rrnB)的基因。对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、和尖镰孢胰蛋白酶样蛋白酶。对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。
调控序列还可以是位于基因的启动子下游和编码序列上游的mRNA稳定化区域,其增加该基因的表达。
合适的mRNA稳定化区域的例子获自苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue et al.,1995,Journal ofBacteriology 177:3465-3471)。
调控序列还可以是合适的前导序列,其为对于由宿主细胞进行的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码所述变体的多核苷酸的5’-末端。可使用在宿主细胞中有功能的任何前导序列。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列,其是与变体编码序列的3’末端可操作地连接的序列,并且当被转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可使用在宿主细胞中有功能的任何聚腺苷酸化序列。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.Cellular Biol.15:5983-5990描述。
调控序列还可以是信号肽编码区,其编码与变体的N端相连,并指导所述变体进入细胞分泌途径的信号肽。多核苷酸的编码序列5’端可固有地包含信号肽编码序列,其与编码所述变体的编码序列的区段一起天然地连接在翻译阅读框中。或者,编码序列5’端可含有外源于所述编码序列的信号肽编码序列。在编码序列不天然地含有信号肽编码序列时,外源信号肽编码序列可能是必需的。或者,外源信号肽编码序列可直接取代天然信号肽编码区域以增强多肽的分泌。然而,可使用指导表达的变体进入宿主细胞的分泌途径的任何信号肽编码序列。
对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。更多的信号肽由Simonen和Palva,1993,Microbiological Reviews 57:109-137描述。
对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。
对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由Romanos等,1992,见上文描述。
调控序列还可以是前肽编码序列,其编码位于变体N端的前肽。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的,并且能够通过前肽的催化或自催化切割从前多肽转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO95/33836)、曼赫根毛霉天冬氨酸蛋白酶和酿酒酵母α因子的基因获得前肽编码序列。
当信号肽和前肽序列二者均存在时,前肽序列被置于紧接着(next to)变体的N端,并且信号肽序列被置于紧接着前肽区域的N端。
同样理想的是添加相对于宿主细胞的生长调节变体的表达的调节序列。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中,可使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些调节序列包括在氨甲蝶呤(methotrexate)存在下被扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的多核苷酸将与调节序列可操作地连接。
表达载体
本发明还涉及重组表达载体,所述重组表达载体包含本发明变体的多核苷酸、启动子、以及转录和翻译终止信号。可以将各种核苷酸和控制序列连结到一起来产生重组表达载体,其可以包括一个或多个方便的限制位点以允许在这些位点插入或取代编码所述变体的多核苷酸。或者,可以通过在适当的用于表达的载体中插入所述多核苷酸或包含所述多核苷酸的核酸构建体来表达所述多核苷酸。在创建表达载体的过程中,将编码序列置于载体中,使得该编码序列与用于表达适当的调控序列可操作地连接。
重组表达载体可以是任何能够方便地对其进行重组DNA步骤,并且能够带来多核苷酸的表达的载体(例如,质粒或病毒)。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(total DNA),或可以使用转座子(transposon)。
所述载体优选地含有一个或多个选择性标记,使得简单地选择经转化、转染、转导等的细胞成为可能。选择性标记是基因,它的产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因,或赋予抗生素抗性的标记,所述抗生素抗性例如氨苄青霉素、氯霉素、卡那霉素、新霉素、壮观霉素、或四环素抗性。对于酵母宿主细胞合适的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因和吸水链霉菌(Streptomyceshygroscopicus)的bar基因。
所述载体优选含有允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制的元件。
为了整合入宿主细胞基因组,载体可依赖编码变体的多核苷酸的序列或任何其它载体元件用于通过同源或非同源重组整合入基因组。或者,载体可以含有额外的多核苷酸,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应含有足够数量的核酸,如100至10,000碱基对,400至10,000碱基对,和/或800至10,000碱基对,其与相应的目标序列具有高度序列同一性以增强同源重组的概率。整合元件可为任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可为非编码或编码的多核苷酸。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”意指能够使质粒或载体体内复制的多核苷酸。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合,和ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene98:61-67;Cullen等,1987,Nucleic Acids Res.15:9163-9175;WO00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加变体的产生。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,且由此含有多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。
宿主细胞
本发明还涉及重组宿主细胞,其包含编码本发明变体的多核苷酸,所述多核苷酸与一种或多种指导本发明的变体产生的调控序列可操作地连接。将包含多核苷酸的构建体或载体导入宿主细胞,使该构建体或载体如前所述作为染色体整合物或者作为自主复制的染色体外载体维持。术语“宿主细胞”包括亲本细胞的任何由于复制过程中发生的突变而不同于该亲本细胞的后代。宿主细胞的选择将在很大程度上依赖于编码变体的基因及其来源。
宿主细胞可以是变体的重组产生中有用的任何细胞,例如,原核或真核生物。
原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于,芽孢杆菌属、梭菌属、肠球菌属、地芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属和链霉菌属。革兰氏阴性细菌包括但不限于,弯曲杆菌属、大肠杆菌、黄杆菌属、泥杆菌属、螺杆菌属、梭杆菌属(Ilyobacter)、奈瑟氏菌属、假单胞菌属、沙门氏菌属、和脲原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞。包括但不限于,嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌属细胞。包括但不限于,似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌属细胞。包括但不限于,不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。
可通过如下方法实现将DNA引入到芽孢杆菌属细胞:例如原生质体转化(参见,例如,Chang and Cohen,1979,Mol.Gen.Genet.168:111-115),感受态细胞转化(参见,例如,Young and Spizizen,1961,J.Bacteriol.81:823-829,或Dubnau and Davidoff-Abelson,1971,J.Mol.Biol.56:209-221),电穿孔(参见,例如,Shigekawa and Dower,1988,Biotechniques6:742-751)或接合(参见,例如,Koehler and Thorne,1987,J.Bacteriol.169:5271-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞:例如原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见,例如,Dower et al.,1988,Nucleic Acids Res.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞:例如原生质体转化和电穿孔(参见,例如,Gong et al.,2004,FoliaMicrobiol.(Praha)49:399-405),接合(参见,例如,Mazodier et al.,1989,J.Bacteriol.171:3583-3585),或转导(参见,例如,Burke et al.,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞:例如电穿孔(参见,例如,Choi et al.,2006,J.Microbiol.Methods64:391-397)或接合(参见,例如,Pinedo and Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞:例如天然感受态(natural competence)(参见,例如,Perry and Kuramitsu,1981,Infect.Immun.32:1295-1297),原生质体转化(参见,例如,Catt and Jollick,1991,Microbios68:189-207),电穿孔(参见,例如,Buckley et al.,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(参见,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用本领域已知的将DNA引入宿主细胞的任何方法。
宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。
宿主细胞可为真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(mitosporicfungi)(如由Hawksworth等,于Ainsworth and Bisby’s Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中所定义)。
宿主细胞可以是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,酵母应如Biology and Activities of Yeast(Skinner,Passmore,和Davenport,编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述定义。酵母宿主细胞可以是假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞,诸如乳酸克鲁维酵母(Kluyveromyceslactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂西洋蓍霉(Yarrowia lipolytica)细胞。
真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由上文Hawksworth等,1995所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵性的。丝状真菌宿主细胞可为枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属(Trichoderma)细胞。例如,丝状真菌宿主细胞可为泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、Chrysosporiuminops、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporiumlucknowense、Chrysosporium merdarium、毡金孢子菌(Chrysosporium pannicola)、Chrysosporium queenslandicum、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusariumsambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusariumsporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、曼赫毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurosporacrassa)、产紫青霉(Penicillium purpurogenum)、黄孢平革菌(Phanerochaetechrysosporium)、辐射射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢霉(Thielavia terrestris)、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametesversicolor)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本领域已知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023,Yelton等,1984,Proc.Natl.Acad.Sci.USA81:1470-1474以及Christensen等,1988,Bio/Technology6:1419-1422中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,Guide to Yeast Genetics and Molecular Biology,Methods inEnzymology,Volume194,pp182-187,Academic Press,Inc.,New York;Ito等,1983,J.Bacteriol.153:163;和Hinnen等,1978,Proc.Natl.Acad.Sci.USA75:1920。
产生方法
本发明还涉及产生变体的方法,包括(a)在有助于产生变体的条件下培养细胞,其以其野生型形式能够产生多肽;和(b)回收所述变体。
所述宿主细胞使用本领域已知的方法在适合于产生所述变体的营养培养基中培养。例如,可以通过在合适培养基中和允许表达和/或分离所述变体的条件下的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果变体分泌到营养培养基中,可以从所述培养基中直接回收变体。如果变体不分泌,可以将其从细胞裂解物回收。
可以使用本领域已知的对于所述变体特异性的方法来检测变体。这些检测方法包括但不限于特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶测定法(enzyme assay)可用于确定多肽变体的活性。
所述变体可以使用本领域已知的方法回收。例如,变体可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀。
变体可以通过多种本领域已知的方法纯化以获得基本上纯的变体,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或萃取(参见,例如,Protein Purification,Janson和Ryden编,VCH Publishers,New York,1989)。
在另一个方面,不回收变体,而是使用表达所述变体的本发明的宿主细胞作为所述变体的来源。
用途
本发明的方法可以用于酰胺-键反应,例如在酰胺合成、水解、醇解、氨解、酰胺交换、转酰基、或酰基转移。脂肪酶变体的一种应用可以是在生物催化领域中用于有机合成、分析或降解的目的,例如去除保护基团或酰胺、胺、羧酸、酯和醇的外消旋拆分。所述脂肪酶变体可以特别由于其稳定性、接受相对宽范围的底物的能力、化学-、区域-、和/或立体选择性而得到应用。所述脂肪酶变体可以以固定化形式、在水溶液中、在缓冲溶液中、在有机溶剂中、在无溶剂液体底物中、在气相中、在离子液体中或在超临界流体中使用。反应产物可以在原料化学品、精细化学品、农业化学品、药物、食品或饲料工业中使用。
所述脂肪酶变体的用途的其他例子有对不希望的酰胺的降解,例如对土壤、表面、食品或饲料的净化,例如净化去除杀虫剂如氟丁酰草胺、苄草胺、溴丁酰草胺或牧草胺等除草剂。所述脂肪酶变体还可以用于降解天然产生的酰胺,例如辣椒及其他辣椒属物种中含有的辣椒碱(capsaicinoids),以降低刺激性。所述脂肪酶变体可用于对含有酰胺的产品例如尼龙的改性。
植物
本发明还涉及分离的植物,例如,转基因植物、植物部分或植物细胞,其包含本发明的多核苷酸,从而以可回收的量表达和产生所述变体。变体可从植物或植物部分回收。或者,可以按原样(as such)将含有该变体的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheological properties),或用于破坏抗营养因子。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属(Poa));饲用牧草(forage grass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草(temperate grass),如Agrostis(翦股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。
双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugar beet),豌豆,豆(bean)和大豆(soybean),和十字花科的(cruciferous)植物(十字花科(family Brassicaceae)),如花椰菜(cauliflower),油菜籽(rape seed)和近缘的模型生物体拟南芥(Arabidopsis thaliana)。
植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seed coat)。
这些植物、植物部分和植物细胞的后代同样包含于本发明范围内。
表达变体的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞:将编码变体的一个或多个表达构建体并入植物宿主基因组或叶绿体基因组,并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。
表达构建体便利地是包含编码变体的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定植物细胞有用的选择性标记,在所述植物细胞中整合了表达构建体和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。
调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达变体而确定。例如,编码本发明的多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分如种子或叶。调节序列由例如Tague等,1988,Plant Physiology86:506所述。
对于组成性表达,可以使用35S-CaMV、玉米泛素1或稻肌动蛋白1启动子(Franck等,1980,Cell21:285-294,Christensen等,1992,Plant Mo.Biol.18:675-689;Zhang等,1991,Plant Cell3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storage sink tissue)例如种子、马铃薯块茎和果实的启动子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolic sink tissue)例如分生组织的启动子(Ito等,1994,Plant Mol.Biol.24:863-878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,Plant Cell Physiol.39:885-889),来自豆球蛋白(legumin)B4和蚕豆(Vicia faba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,J.Plant Physiol.152:708-711)、来自种子油体蛋白(oil body protein)的启动子(Chen等,1998,Plant Cell Physiol.39:935-941),来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子,或本技术领域公知的任何其他种子特异性的启动子,例如,在WO91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,PlantPhysiol.102:991-1000),小球藻病毒(chlorella virus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,Plant Mol.Biol.26:85-93),来自稻的aldP基因启动子(Kagaya等,1995,Mol.Gen.Genet.248:668-674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,Plant Mol.Biol.22:573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(plant hormones)如乙烯、脱落酸(abscisicacid)和赤霉酸(gibberellic acid),和重金属。
启动子增强子元件也可以用于实现变体在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码变体的多核苷酸之间。例如Xu等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。
选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。
将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science 244:1293;Potrykus,1990,Bio/Technology8:535;Shimamoto等,1989,Nature338:274)。
根癌土壤杆菌(Agrobacterium tumefaciens)介导的基因转移是一种产生转基因双子叶植物(综述可参见Hooykas和Schilperoort,1992,Plant Mol.Biol.19:15-38)、和用于转化单子叶植物的方法,虽然对于这些植物也可以使用其他的转化方法。产生转基因单子叶植物的一种方法是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryonic calli)或发育中的胚(developingembryos)(Christou,1992,Plant J.2:275-281;Shimamoto,1994,Curr.Opin.Biotechnol.5:158-162;Vasil等,1992,Bio/Technology10:667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omirulleh等,1993,Plant Mol.Biol.21:415-428所描述的。其它的转化方法包括描述于美国专利号6,395,966和7,151,204中的那些(两者均通过提述以其整体并入本文)。
转化之后,根据本领域熟知的方法选择具有并入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因:例如,使用带有两个独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。
除了直接用本发明的构建体直接转化具体植物基因型之外,还可通过将具有构建体的植物与缺乏该构建体的第二植物杂交来制备转基因植物。举例而言,可将编码变体的构建体通过杂交而引入特定植物品种,而根本无需直接转化该给定品种的植物。因此,本发明不仅涵盖从依照本发明经转化的细胞直接再生的植物,还包括此类植物的后代(progeny)。如用于本文,后代可指依照本发明制备的亲本植物任何世代的后裔(offspring)。此种后代可包含依据本发明制备的DNA构建体。杂交导致转基因通过将起始种系供体植物种系交叉授粉而引入植物种系。此类步骤的非限制性实例描述于US7,151,204。
植物通过回交转化方法生成。举例而言,该植物包括称作回交转化的基因型、种系、近交体(inbred)或杂交体(hybrid)的植物。
可使用遗传标记以协助本发明的一种或多种转基因从一个遗传背景基因渗入(introgression)至另一个。标记协助的选择提供了相对于常规育种的优势,在于其可用于避免由表型变异导致的错误。进一步,遗传标记可在特定杂交的个体后代中提供有关良种种质相对程度的数据。举例而言,当原本不具有非农艺学所需的遗传背景但具有所需性状的植物与良种亲本杂交时,可使用遗传标记来选择不仅具有目标性状,还具有相对较大比例所需种质的后代。以此方式,使一种或多种性状基因渗入特定遗传背景所需的世代数得到最小化。
本发明亦涉及产生本发明的变体的方法,其包括:(a)在有助于产生所述变体的条件下培养转基因植物或植物细胞,所述植物或植物细胞包含编码具有变体的多核苷酸;和(b)回收所述变体。
实施例
下面的实施例进一步说明本发明,它们不应被解释为限制本发明的范围。
实施例1:变体的产生
(A)为了产生用于在米曲霉菌株中表达的SEQ ID NO:1的变体,利用导入期望的序列改变(取代)的诱变引物进行基于PCR的定点诱变。引物被设计为突变位于寡核苷酸的中央,两侧有足够的核苷酸(15-25个)。PCR模板是一个7467碱基对的质粒,其含有SEQ ID NO:1,并能够在大肠杆菌中增殖且能够转化曲霉属菌株。PCR设置有校对DNA聚合酶(Phusion DNA聚合酶(来自Finnzymes,Themo Scientific);或者KOD DNA聚合酶(来自Novagen,Toyobo))。
根据供应商提供的说明将PCR产物用于转化感受态大肠杆菌DH5α细胞(来自TaKaRa)。从单克隆转化的大肠杆菌菌株分离质粒DNA,并测序以验证期望的取代的存在。用经过确认的质粒变体转化一种米曲霉菌株,该菌株是pyrG(乳清苷-5’-磷酸脱羧酶)阴性,并且还是蛋白酶pepC(一种与yscB同源的丝氨酸蛋白酶)、alp(一种碱性磷酸酶)、NpI(一种中性蛋白酶I)阴性,以避免发酵过程中和发酵后脂肪酶变体的降解。
将经转化的曲霉菌株以深层培养物的形式在摇瓶中发酵,脂肪酶变体被分泌到发酵培养基中。在发酵之后,从经无菌过滤的发酵培养基通过三步程序纯化出脂肪酶变体:(1)在癸胺-琼脂糖上、或者丁基-toyopearl上的疏水相互作用层析,(2)通过凝胶过滤,或者通过超滤的缓冲液交换,以及(3)在SP-sepharose上以pH4.5进行阳离子交换层析,或者在Q-sepharose上以pH7进行阴离子层析。脂肪酶变体溶液冷冻保存。
(B)为了产生用于在巴斯德毕赤酵母菌株中表达的SEQ ID NO:1的变体,利用导入期望的序列改变(取代)的诱变引物进行基于PCR的定点诱变。引物被设计为突变位于寡核苷酸的中央,两侧有足够的核苷酸(15-25个)。PCR模板是一个8604碱基对的质粒,其包含带有His标签的SEQ ID NO:1,并能够在大肠杆菌中增殖且能够转化毕赤酵母属菌株。PCR设置有校对DNA聚合酶(Phusion DNA聚合酶(来自Finnzymes,Themo Scientific))。
根据供应商提供的说明用PCR产物转化感受态大肠杆菌DH5α细胞(来自TaKaRa)。从单克隆转化的大肠杆菌菌株分离质粒DNA,并测序以验证期望的取代的存在。用经过确认的质粒变体转化一种Mut(s)、Suc(+)、His(-)的巴斯德毕赤酵母菌株。
将经转化的毕赤酵母菌株以深层培养物的形式在深孔板中发酵,并通过添加甲醇来诱导脂肪酶变体分泌到发酵培养基中。在发酵之后,从经过澄清的上清液用标准His-标签纯化规程(来自Qiagen)分离出脂肪酶变体,并利用Amicon Ultra离心过滤装置用10kDa截留(来自Merck Millipore)将其缓冲液更换为50mM磷酸盐缓冲液,pH7.0。
带有C末端His标签(下划线)的SEQ ID NO:1:
实施例2:酰胺-键反应中活性的测定
利用与Henke E.&Bornscheuer U.T.(2003)Anal Chem.,75,255-260所描述的荧光测定法相似的荧光测定法测定酰胺-键反应中的活性。
含水反应混合物中的浓度为0.03mg/ml酶、5mM底物、25mM磷酸盐pH7.0,10%(w/v)四氢呋喃。该反应混合物是通过在96孔微量滴定板的微量滴定孔中将75uL酶溶液(其含有0.08mg/ml酶(脂肪酶变体))与125uL测试溶液(其含有8mM底物(苄基氯乙酰胺=2-氯-N-苄基乙酰胺),40mM磷酸盐(钾盐)pH7.0,16%(w/v)四氢呋喃)一起吹打(pipetting)而制备的。
酶溶液是通过稀释浓缩酶储液而制备的,酶储液的浓度通过测量280nm的吸光度并计算浓度来确定。对于南极假丝酵母脂肪酶B使用1.21的消光系数(1.21的光吸收等于1mg/ml)。
微量滴定板用Parafilm(来自Pechiney Plastic Packaging Company,Chicago,Illinois,USA)覆盖,在MTP Thermomixer Comfort(来自Eppendorf AG,Hamburg,Germany)中37℃、300rpm温育18小时。然后将50uL溶于1-己醇的20mM4-氯-7-硝基苯并呋咱(NBD-Cl,4-氯-7-硝基-1,2,3-苯并氧杂二唑)移液到孔中并在37℃、500rpm温育1小时。
然后用荧光计Fluostar Optima(来自BMG Labtech GmbH,Ortenberg,Germany)测量荧光强度,激发为485nm(滤片BMG0038485-P),发射为540nm(滤片BMG 0414A 540-20),每个孔100次闪照(flashes)。每个酶变体在3个孔中三次重复测量。平行地,每个酶变体还设置3个不同的无底物的孔,以测量来自每个变体的微小背景荧光。为了测量底物的微小的自水解,还设置了3个有底物而没有酶的孔。此外还设置了3个没有底物也没有酶、因此只有含水培养基及缓冲剂和溶剂的孔,用来测量来自培养基的微小背景荧光。
来自有酶且有底物的测量的平均值名为“es”,有酶而没有底物的值为“e”,没有酶而有底物的值为“s”;没有酶且没有底物的值为“o”。为了针对来自酶、培养基和自水解的荧光进行校正,计算如下的减法:(es-e)-(s-o)=(es-s)-(e-o)=es-e-s+o=经校正的酶变体活性值。s-o=底物的自水解。由于这些测量值是以自定义荧光单位计,将这些值标准化为反应了的底物的百分比。0%表示底物没有反应,100%意味着底物完全反应成产物。为了该标准化,为每种酶变体平行地设定2个孔。这些孔所含的组成与其他孔相同,只是它们不含有底物,而是含有对应于10%反应的浓度的产物。在这个实施例中,这两个孔中的浓度为0.03mg/ml酶、0.5mM水解产物(即0.5mM苄胺和0.5mM氯乙酸)、25mM磷酸盐pH7.0、10%(w/v)四氢呋喃。来自这些有酶且有产物的测量的平均值名为“ep”。为了针对来自酶变体的背景荧光进行校正,减去来自有酶而没有产物(且没有底物)的测量的平均值(其名为“e”)。简而言之,经标准化和校正的酶变体活性计算如下:10·((es-e)-(s-o))/(ep-e)。
96孔微量滴定板设置方案:
实施例3:不同野生型酯酶的酰胺酶活性
测定了不同酯酶的酰胺酶活性,并将它们的活性作为相对于南极假丝酵母脂肪酶B的酰胺酶活性的百分比显示。还显示了它们相对于南极假丝酵母脂肪酶B的氨基酸序列的相对氨基酸序列同一性。
表3:不同野生型酶在酰胺-键反应中的活性,表示为南极假丝酵母脂肪酶B的活性的百分比并与其比较
实施例4:不同变体的酰胺酶活性
表4:显示了不同脂肪酶在酰胺-键反应中的活性,以改进因子(IF)表示。IF通过用不同脂肪酶的活性除以其亲本脂肪酶的活性来计算。改进因子大于1表明改进的酰胺-键反应中活性。
实施例5:对其他样品的酰胺-键反应中活性的测量
如实施例1中所述制备变体之后,将下列蛋白质样品通过超滤浓缩,并更换缓冲液为25mM磷酸盐pH7.0,再如实施例2所述测量。
表5:显示了不同样品在酰胺-键反应中的活性,以改进因子(IF)表示。IF通过用不同脂肪酶的活性除以其亲本脂肪酶的活性来计算。改进因子大于1表明改进的酰胺-键反应中活性。
在曲霉中表达的脂肪酶 | 改进因子(IF) |
亲本脂肪酶 | 1.0 |
G39A | 1.7 |
G39A+T103G | 0.8 |
G39A+W104F | 2.3 |
G39A+L278A | 3.1–3.3 |
G39A+T103G+L278A | 2.0–3.8 |
G39A+W104F+L278A | 5.2–6.3 |
G39A+T103G+W104F+L278A | 10.0–11.2 |
G39A+T103G+W104Y+L278A | 2.8 |
G39A+T103G+W104Q+L278A | 1.9 |
G39A+W104F+A225K+L278A | 0.8 |
G39A+W104F+D223N+A225I+L278A | 2.8 |
实施例6:对底物N-苄基-2-氯乙酰胺的酶促酰胺水解活性的测定
在一个基于E.Henke and U.T.Bornscheuer,Anal.Chem.2003,75,255-260所描述的测定法的二步荧光测定法中测定了CalB变体的酰胺酶活性。所有测定中均使用经过Ni2+-亲和层析和脱盐后的酶制备物。
首先,在96孔微量滴定板(Nunc,透明平底,聚苯乙烯)中以200uL总体积进行酰胺底物N-苄基-2-氯乙酰胺的酶促水解。所有的反应均在同一微量滴定板上一式三份地进行。反应混合物含有20uL溶于100%DMSO的50mM酰胺底物(终浓度:5mM酰胺底物,10%DMSO),100uL100mM磷酸盐缓冲液pH7.0(终浓度:50mM),20uL3-30uM CalB变体(终浓度:0.3-3uM),20uL120ug/mL BSA(终浓度:12ug/mL),和40uL H2O。为了测定非酶促的背景酰胺水解,在每个微量滴定板上进行了一式三份的相同但没有任何酶的反应。将微量滴定板封盖,将反应在振荡式培养箱中37℃、220rpm温育18-20小时。
在第二步中,将50uL溶于1-己醇的20mM 4-硝基-7-氯-苯并-2-氧杂-1,3-二唑(NBD-Cl)加入所述样品,给平板封盖,NBD-Cl与苄胺(酰胺水解过程中形成的)的反应在37℃、220rpm在同一振荡式培养箱中进行1小时。使用荧光酶标仪(SpectraMax M3)以485nm激发、测量538nm发射来测定最终反应产物的荧光。
为了能够计算酰胺水解反应过程中形成的苄胺,在每个微量滴定板上用与酶水解样品相似但不含有酶、且用苄胺代替酰胺底物N-苄基-2-氯乙酰胺的反应混合物制定校准曲线。校准曲线包含具有涵盖0.04mM到5mM之间范围的最少8个胺浓度的一式三份的样品。校准样品的处理与上述酶样品相同。
为了计算酶活性,求出一式三份测量的荧光的平均值,并将酶样品的所得的值针对背景反应的相应值校正。然后基于经背景校正的荧光值(Fc,单位:au)、校准曲线的线性部分的斜率m(y=mx+n,y轴上的荧光值相对x轴上以mM计的苄胺浓度)、反应时间(t,单位:min)、以及酶浓度(cE:浓度uM),按照下式1计算所测定的CalB变体的比活性(specific activity)(v,单位:min-1):v=(((Fc/m)/t)*1000)/cE。
将CalB变体的比活性v除以CalB野生型(亦通过上述测定法测定)的相应值,得出酰胺酶活性的改进因子(xi)。
表6:CalB变体对底物N-苄基-2-氯乙酰胺的比酰胺酶活性v和所得的相对CalB野生型的改进因子。
实施例7:对底物对-硝基苯基丁酰胺的酶促酰胺水解的测定
在一项基于Syren et al.,ChemBioChem 2012,13,645-648所述的测定法的光度测定中测定CalB变体对底物对-硝基苯基丁酰胺(又称“酰替苯胺”)的酰胺酶活性。在所有测定中均使用纯化的酶制备物。
在96孔微量滴定板(Nunc,透明平底,聚苯乙烯)中以200uL总体积实施对酰胺底物对-硝基苯基丁酰胺的酶促水解。所有反应均在相同微量滴定板上一式三份地进行。反应混合物包含20uL溶于100%DMSO中的10mM酰胺底物(终浓度:1mM酰胺底物,10%DMSO),100uL100mM磷酸盐缓冲液pH7.0(终浓度:50mM)、20uL3-30uM CalB变体(终浓度:0.3-3uM)、和60uLH2O。为了确定非酶促的背景酰胺水解,在每个微量滴定板上进行一式三份相同但没有任何酶的反应。微量滴定板封盖,将反应在振荡式培养箱中37℃、220rpm温育48小时。在温育过程中的确定的时间点,用微量滴定板SpectraMax M3分光光度计测量所有样品的410nm吸光度。
为了计算酶活性,计算一式三份测量的吸光度(A,单位:au)的平均值,并通过对吸光度值相对反应时间的线性回归分析(A=mx+n,y轴上的吸光度值对x轴上的反应时间(t,单位:min))来确定反应斜率(m,单位:au min-1)。将所得的酶样品的反应斜率m相对于背景反应的相应值mb进行校正,得到mc(mc=m-mb)。然后基于经过背景校正的反应斜率mc、对-硝基苯胺的消光系数(ε410nm=9100M-1cm-1)、光径长度(d=0.5cm)、和酶浓度(cE:单位uM)使用式1来计算测定的CalB变体的比活性(v,单位:min-1):v=((mc/(ε*d))*1000000)/cE。
将CalB变体的比活性除以CalB野生型的相应值(也使用上述的测定法测定),得到酰胺酶活性的改进系数(xi)(表1)。
表7:CalB变体对底物对-硝基苯基丁酰胺的比酰胺酶活性v和所得的相对CalB野生型的改进因子
突变 | v(min-1) | xi |
- | 0,0026 | 1 |
I189Y | 0,0241 | 9,4 |
I189H | 0,0139 | 5,4 |
I189A | 0,0128 | 5,0 |
S31K | 0,0041 | 1,6 |
I189G | 0,0161 | 6,3 |
本申请中描述并要求保护的发明的范围不应局限于本申请中公开的具体方面,因为这些方面仅仅是意图用于例示说明本发明的若干方面。本发明的范围内意图涵盖任何等同的方面。实际上,本领域技术人员鉴于前面的描述,容易想到除了本文开示和描述者之外对本发明的各种修改。这样的修改也意图落入随附的权利要求的范围内。在有冲突之时,应以本公开包括定义在内为准。
Claims (20)
1.亲本脂肪酶的变体,所述变体是:
a.与SEQ ID NO:2的成熟多肽具有至少60%序列同一性的多肽;
b.由在低严格条件下与(i)SEQ ID NO:1的成熟多肽编码序列、或(ii)编码SEQ ID NO:2的成熟多肽的序列、或(iii)(i)或(ii)的全长互补物杂交的多核苷酸所编码的多肽;
c.由与SEQ ID NO:1的成熟多肽编码序列、或编码SEQ ID NO:2的成熟多肽的序列具有至少60%同一性的多核苷酸所编码的多肽;或
d.SEQ ID NO:2的成熟多肽的片段,
其中所述变体相比于所述亲本脂肪酶具有改进的酰胺-键反应中的活性。
2.权利要求1的变体,其在对应于SEQ ID NO:2的成熟多肽的位置S31R/K;G39;A225;T103V/S/A;L278G/K/R/H;W104Y/K/R;T42G/S/Q/H/I/L/M;D223G/N/A/V/H;I189;Q191;D134V/T/I/F/A/S/K/R;E188;V221A/R/K/H;7P38H/N/A/G;G41P/S;A132;N79;Q106;和/或L140R/K/H中的一个或多个位置上包含取代。
3.权利要求2的变体,其中所述取代为:G39A;A225I/V/L/M/K/R/S/T/G/H;I189Y/H/Q/N/R/K/A/E/S/T/G;Q191N/A/R/K/H;E188Q/R/D/N/K/H/A;A132S/N/G/H/K/R;N79V/Q/E;和/或Q106N/Y。
4.权利要求2或3的变体,其还包含选自下列的取代:T103G;L278A/V;W104F/Q;T42N/V/A;D134L;和G41A。
5.权利要求1-4中任一项的变体,其与所述亲本脂肪酶的氨基酸序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%同一性,至少96%,至少97%,至少98%,或至少99%,但小于100%序列同一性。
6.权利要求1-5中任一项的变体,其与SEQ ID NO:2的成熟多肽具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,或至少99%,但小于100%序列同一性。
7.权利要求1-6中任一项的变体,其中取代的个数为1-20,1-10,1-5,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,或20。
8.权利要求1-7中任一项的变体,其包含或含有:
a.A225K;
b.A225I;
c.A225V;
d.A225L;
e.A225M;
f.A225S;
g.G39A;
h.D223G;
i.D223N;
j.T42G;
k.T42S;
l.Q191R;
m.I189Y;
n.I189H;
o.T103V;
p.T103S;
q.T103A;
r.G39A+L278A;
s.G39A+W104F;
t.G39A+Q191R;
u.G39A+L278A+A281G;
v.G39A+T103G+L278A;
w.G39A+W104F+L278A;
x.G39A+W104Q+L278A;
y.G39A+T103G+W104F+L278A;
z.G39A+T103G+W104Q+L278A;
aa.G39A+T103G+W104Y+L278A;
bb.G39A+T103G+W104F+D223G+A225K+L278A;
cc.G39A+T103G+W104F+D223N+A225K+L278A;
dd.G39A+W104F+A225K+L278A;
ee.G39A+W104F+D223N+A225K+L278A;
ff.G39A+W104F+D223N+A225I+L278A;
gg.G39A+T103G+D223N+A225K+L278A;
hh.G39A+T103G+W104Y+D223N+A225K+L278A;
ii.G39A+T103G+W104F+M129L+L278A;
jj.G39A+T103G+W104F+M129L+D223N+L278A;
kk.G39A+A225K+L278A;
ll.G39A+D223G+A225K+L278A;
mm.G39A+D223G+A225I+L278A;
nn.G39A+T103G+W104F+A225K+L278A;
oo.G39A+T103G+W104F+A225I+L278A;
pp.G39A+T103G+W104F+D223G+A225I+L278A;
qq.G39A+T103G+W104F+D223N+A225I+L278A;
rr.G39A+W104F+A225I+L278A;
ss.G39A+W104F+V221R+D223N+A225K+L278A;
tt.G39A+T103G+A225K+L278A;
uu.G39A+T103G+A225I+L278A;
vv.G39A+T103G+D223G+A225K+L278A;
ww.G39A+T103G+D223G+A225I+L278A;
xx.G39A+T103G+D223N+A225I+L278A;
yy.G39A+T103G+I189Y+L278A;
zz.G39A+T103G+W104Y+I189Y+D223N+A225K+L278A;
aaa.G39A+W104F+I189Y+D223N+A225K+L278A;
bbb.G39A+T103G+W104F+V221R+D223N+A225K+L278A;
ccc.G39A+T103G+I189Y+D223N+A225K+L278A;
ddd.G39A+T103G+W104Y+I189Y+L278A;
eee.T103G+W104F+D223G+A225K;
fff.T103G+W104F+A225K;
ggg.T103G+W104F+I189Y+D223G;
hhh.T103G+W104F+I189Y;
iii.T103G+W104F+D223G+L278A;
jjj.T103G+W104F+L278A;
kkk.T103G+W104F+Q191R+D223G;
lll.T103G+W104F+Q191R;
mmm.G39A+T42G+T103G+W104F+I189Y+D223G+A225K;
nnn.G39A+T42G+T103G+W104F+D223G+A225K;
ooo.G39A+T42G+T103G+W104F+I189Y+Q191R+D223G+A225K;
ppp.G39A+T42G+T103G+W104F+Q191R+D223G+A225K;
qqq.G39A+W104F+D223G;+A225K
rrr.G39A+W104F+I189Y+D223G;+A225K
sss.G39A+W104F+I189Y;+A225K
ttt.G39A+W104F+A225K;
uuu.G39A+W104F+I189H;
vvv.G39A+W104F+I189Y+D223G;
www.G39A+W104F+I189Y;
xxx.G39A+W104F+D223G;+L278A
yyy.G39A+W104F+I189Y+D223G;+L278A
zzz.G39A+W104F+I189Y;+L278A
aaaa.G39A+W104F+L278A;
bbbb.G39A+T42G+T103G+W104F+M129L+I189Y+D223G+A225K+L278A;
cccc.G39A+T103G+W104F+D223G;
dddd.G39A+T103G+W104F+I189Y+D223G;
eeee.G39A+T103G+W104F+I189Y;
ffff.G39A+T103G+W104F;
gggg.G39A+W104F+I189Y+A281G+A282G+I285A+V286A+L278A;
hhhh.G39A+W104F+A281G+A282G+I285A+V286A+L278A;
iiii.W104F+I189Y+A281G+A282G+I285A+V286A+L278A;
jjjj.W104F+A281G+A282G+I285A+V286A+L278A;
kkkk.G39A+W104F+Q191R;
llll.G39A+W104F+Q191R+D223G;
mmmm.G39A+T42G+T103G+W104F+D223G+A225K+L278A;
nnnn.G39A+T42G+T103G+W104F+D223N+A225K+L278A;
oooo.G39A+T42G+W104F+A225K+L278A;
pppp.G39A+T42G+W104F+D223N+A225K+L278A;
qqqq.G39A+T42G+W104F+D223N+A225I+L278A;
rrrr.G39A+T42G+T103G+D223N+A225K+L278A;
ssss.G39A+T42G+T103G+W104Y+D223N+A225K+L278A;
tttt.T42G+T103G+W104F+D223G+A225K+L278A;
uuuu.T42G+T103G+W104F+D223N+A225K+L278A;
vvvv.T42G+W104F+A225K+L278A;
wwww.T42G+W104F+D223N+A225K+L278A;
xxxx.T42G+W104F+D223N+A225I+L278A;
yyyy.T42G+T103G+D223N+A225K+L278A;
zzzz.T42G+T103G+W104Y+D223N+A225K+L278A;
aaaaa.G39A+T103G+W104F+L278A
bbbbb.G39A+T103G+W104F+D223G+L278A
ccccc.S31R+G39A+T103G+W104F+L278A
ddddd.I189A
eeeee.S31K
fffff.S31R
ggggg.I189G
hhhhh.S31R+G39A+L278A。
9.权利要求1-8中任一项的变体,其相对于所述亲本脂肪酶具有改进的酰胺-键反应中的活性,其中所述反应选自下组:催化效率、催化速率、转换数、比活性、底物结合、底物裂解、底物特异性、底物稳定性、和产物释放。
10.一种分离的多核苷酸,其编码权利要求1-9中任一项的变体。
11.一种核酸构建体,其包含权利要求10的多核苷酸。
12.一种表达载体,其包含权利要求10的多核苷酸。
13.一种宿主细胞,其包含权利要求10的多核苷酸。
14.一种产生脂肪酶变体的方法,其包括:
a)在适于该变体表达的条件下培养权利要求13的宿主细胞;和
b)回收该变体。
15.一种转基因植物、植物部分或植物细胞,其经过权利要求10的多核苷酸的转化。
16.一种产生权利要求1-9中任一项的变体的方法,包括:
a)在有助于产生所述变体的条件下培养包含编码所述变体的多核苷酸的转基因植物或植物细胞;和
b)回收所述变体。
17.用于从亲本脂肪酶获得变体的方法,所述变体与所述亲本脂肪酶相比具有改进的酰胺-键反应中的活性,所述方法包括:
a.选择位于任何催化三联体残基以内的至少一个这样的氨基酸残基,其(i)改变含有该催化三联体的口袋的几何条件;和/或(ii)通过静电场影响该催化三联体;
b.对该至少一个氨基酸残基进行取代;
c.制备由步骤(a)和(b)得到的变体;
d.测试该变体在酰胺-键反应中的活性;和
e.选择相比于所述亲本脂肪酶具有改进的酰胺-键反应中的活性的变体。
18.权利要求17的方法,其中所述至少一个氨基酸残基处的取代选自:对应于SEQ ID NO:2的成熟多肽中的位置的S31R/K;G39;A225;T103V/S/A;L278G/K/R/H;W104Y/K/R;T42G/S/Q/H/I/L/M;D223G/N/A/V/H;I189;Q191;D134V/T/I/F/A/S/K/R;E188;V221A/R/K/H;P38H/N/A/G;G41P/S;A132;N79;Q106;和/或L140R/K/H。
19.权利要求1-9中任一项的变体用于催化酰胺-键反应的用途。
20.权利要求19的用途,其中所述酰胺-键反应选自下组:催化效率、催化速率、转换数、比活性、底物结合、底物裂解、底物特异性、底物稳定性、和产物释放。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP11174169 | 2011-07-15 | ||
EP11174169.0 | 2011-07-15 | ||
EP11184110.2 | 2011-10-06 | ||
EP11184110 | 2011-10-06 | ||
PCT/EP2012/062896 WO2013010783A1 (en) | 2011-07-15 | 2012-07-03 | Lipase variants and polynucleotides encoding same |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103827298A true CN103827298A (zh) | 2014-05-28 |
Family
ID=46466508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280045174.9A Pending CN103827298A (zh) | 2011-07-15 | 2012-07-03 | 脂肪酶变体及其编码多核苷酸 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP2732033A1 (zh) |
CN (1) | CN103827298A (zh) |
WO (1) | WO2013010783A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103881992A (zh) * | 2012-12-21 | 2014-06-25 | 沈阳药科大学 | 一种脂肪酶突变体及其用途 |
CN109182298A (zh) * | 2018-08-14 | 2019-01-11 | 浙江工业大学 | 一种重组脂肪酶突变体、工程菌及应用 |
CN110358751A (zh) * | 2019-07-05 | 2019-10-22 | 浙江工业大学 | 一种重组脂肪酶突变体、编码基因、重组工程菌及应用 |
CN113564144A (zh) * | 2020-04-29 | 2021-10-29 | 上海奥博生物医药技术有限公司 | 脂肪酶突变体及其应用 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10035995B2 (en) * | 2015-12-07 | 2018-07-31 | Eastman Chemical Company | CALB variants |
WO2022168062A1 (en) * | 2021-02-08 | 2022-08-11 | Universidade De Coimbra | Variants of hyperthermophilic carboxylesterase for polymer synthesis |
CN117070496B (zh) * | 2023-10-16 | 2023-12-19 | 深圳昇瑞生物科技有限公司 | 一种南极假丝酵母脂肪酶b突变体及其制备方法和应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101541956A (zh) * | 2006-11-28 | 2009-09-23 | 诺维信公司 | 脂解酶变体 |
WO2011067349A1 (en) * | 2009-12-03 | 2011-06-09 | Novozymes A/S | Variants of a polypeptide with lipolytic activity and improved stability |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
US5223409A (en) | 1988-09-02 | 1993-06-29 | Protein Engineering Corp. | Directed evolution of novel binding proteins |
NZ237549A (en) | 1990-03-23 | 1993-06-25 | Gist Brocades Nv | Production of enhanced levels of enzymes in the seeds of transgenic plants and the use of these seeds |
US6395966B1 (en) | 1990-08-09 | 2002-05-28 | Dekalb Genetics Corp. | Fertile transgenic maize plants containing a gene encoding the pat protein |
IL99552A0 (en) | 1990-09-28 | 1992-08-18 | Ixsys Inc | Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof |
FR2704860B1 (fr) | 1993-05-05 | 1995-07-13 | Pasteur Institut | Sequences de nucleotides du locus cryiiia pour le controle de l'expression de sequences d'adn dans un hote cellulaire. |
DE4343591A1 (de) | 1993-12-21 | 1995-06-22 | Evotec Biosystems Gmbh | Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
BR9507817A (pt) | 1994-06-03 | 1997-09-16 | Novo Nordisk Biotech Inc | Construção de dna enzima vetor recombinante célula hospedeira recombinante lacase de ascomicete ou deuteromicete processos para obter uma enzima de lacase para melhorar o rendimento de enzima recombinante para polimerizar um substrato de lignina ou lignossulfato em soluç o para despolimerizar in situ a pasta kraft para oxidar corantes ou precursores de corantes para pintar cabelo e para polimerizar ou oxidar um composto fenólico ou anilina composição de corante e recipiente contendo a mesma |
WO1996000787A1 (en) | 1994-06-30 | 1996-01-11 | Novo Nordisk Biotech, Inc. | Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein |
US5955310A (en) | 1998-02-26 | 1999-09-21 | Novo Nordisk Biotech, Inc. | Methods for producing a polypeptide in a bacillus cell |
DE69932345T2 (de) | 1998-10-26 | 2007-07-19 | Novozymes A/S | Erstellung und durchmusterung von interessierenden dna-banken in zellen von filamentösen pilzen |
WO2000056900A2 (en) | 1999-03-22 | 2000-09-28 | Novo Nordisk Biotech, Inc. | Promoter sequences derived from fusarium venenatum and uses thereof |
US7151204B2 (en) | 2001-01-09 | 2006-12-19 | Monsanto Technology Llc | Maize chloroplast aldolase promoter compositions and methods for use thereof |
CA2455013A1 (en) | 2001-07-27 | 2003-02-13 | Francesca Storici | Systems for in vivo site-directed mutagenesis using oligonucleotides |
-
2012
- 2012-07-03 EP EP12733085.0A patent/EP2732033A1/en not_active Withdrawn
- 2012-07-03 WO PCT/EP2012/062896 patent/WO2013010783A1/en active Application Filing
- 2012-07-03 CN CN201280045174.9A patent/CN103827298A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101541956A (zh) * | 2006-11-28 | 2009-09-23 | 诺维信公司 | 脂解酶变体 |
WO2011067349A1 (en) * | 2009-12-03 | 2011-06-09 | Novozymes A/S | Variants of a polypeptide with lipolytic activity and improved stability |
Non-Patent Citations (3)
Title |
---|
A. TORRES-GAVIL´AN ET AL: "The amidase activity of Candida antarctica lipase B is dependent on specific structural features of the substrates", 《JOURNAL OF MOLECULAR CATALYSIS B: ENZYMATIC》 * |
KUAN-JU LIU ET AL: "Biocatalytic synthesis of palmitoyl vanillylamide in supercritical carbon dioxide through amidation of vanillylamine hydrochloride and palmitic anhydride by lipase", 《FOOD CHEMISTRY》 * |
UPPENBERG,J ET AL: "RecName: Full=Lipase B; AltName: Full=CALB; Flags: Precursor", 《GENBANK 登录号 P41365.1》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103881992A (zh) * | 2012-12-21 | 2014-06-25 | 沈阳药科大学 | 一种脂肪酶突变体及其用途 |
CN109182298A (zh) * | 2018-08-14 | 2019-01-11 | 浙江工业大学 | 一种重组脂肪酶突变体、工程菌及应用 |
CN109182298B (zh) * | 2018-08-14 | 2021-05-11 | 浙江工业大学 | 一种重组脂肪酶突变体、工程菌及应用 |
CN110358751A (zh) * | 2019-07-05 | 2019-10-22 | 浙江工业大学 | 一种重组脂肪酶突变体、编码基因、重组工程菌及应用 |
CN110358751B (zh) * | 2019-07-05 | 2021-07-02 | 浙江工业大学 | 一种重组脂肪酶突变体、编码基因、重组工程菌及应用 |
CN113564144A (zh) * | 2020-04-29 | 2021-10-29 | 上海奥博生物医药技术有限公司 | 脂肪酶突变体及其应用 |
Also Published As
Publication number | Publication date |
---|---|
WO2013010783A1 (en) | 2013-01-24 |
EP2732033A1 (en) | 2014-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9538771B2 (en) | Polypeptides having phospholipase C activity and polynucleotides encoding same | |
CN102066409A (zh) | 具有阿魏酸酯酶活性的多肽和编码该多肽的多核苷酸 | |
CN103827298A (zh) | 脂肪酶变体及其编码多核苷酸 | |
CN104080908A (zh) | 脂肪酶变体以及编码它们的多核苷酸 | |
US20110269206A1 (en) | Polypeptides Having Catalase Activity And Polynucleotides Encoding Same | |
US20180346892A1 (en) | Polypeptides Having Organophosphorous Hydrolase Activity | |
EP2622071B1 (en) | Polypeptides having endopeptidase activity and polynucleotides encoding same | |
US9493759B2 (en) | Polypeptides having aspartic endopeptidase activity and polynucleotides encoding same | |
US9476072B2 (en) | Cutinase variants and polynucleotides encoding same | |
CN105793418A (zh) | 过氧合酶变体 | |
US20150140588A1 (en) | Lipase Variants and Polynucleotides Encoding Same | |
EP3074511B1 (en) | Organophosphorous hydrolase variants | |
US20110271407A1 (en) | Polypeptides Having Alpha-Mannosidase Activity And Polynucleotides Encoding Same | |
US20140106400A1 (en) | Polypeptides Having Carboxypeptidase Activity And Polynucleotides Encoding Same | |
CN105378050A (zh) | 具有蛋白酶活性的多肽和编码它们的多核苷酸 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140528 |