CN116888142A - 具有提高的生长速率的重组酵母宿主细胞 - Google Patents
具有提高的生长速率的重组酵母宿主细胞 Download PDFInfo
- Publication number
- CN116888142A CN116888142A CN202280011913.6A CN202280011913A CN116888142A CN 116888142 A CN116888142 A CN 116888142A CN 202280011913 A CN202280011913 A CN 202280011913A CN 116888142 A CN116888142 A CN 116888142A
- Authority
- CN
- China
- Prior art keywords
- gene
- host cell
- yeast host
- recombinant yeast
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 240000004808 Saccharomyces cerevisiae Species 0.000 title claims abstract description 468
- 230000012010 growth Effects 0.000 title claims abstract description 191
- 230000001965 increasing effect Effects 0.000 title claims description 12
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 393
- 229920001184 polypeptide Polymers 0.000 claims abstract description 390
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 390
- 230000014509 gene expression Effects 0.000 claims abstract description 284
- 238000012239 gene modification Methods 0.000 claims abstract description 253
- 230000005017 genetic modification Effects 0.000 claims abstract description 253
- 235000013617 genetically modified food Nutrition 0.000 claims abstract description 253
- 230000002018 overexpression Effects 0.000 claims abstract description 38
- 230000028327 secretion Effects 0.000 claims abstract description 18
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 462
- 210000004027 cell Anatomy 0.000 claims description 403
- 108090000623 proteins and genes Proteins 0.000 claims description 275
- 239000012634 fragment Substances 0.000 claims description 215
- 241000235070 Saccharomyces Species 0.000 claims description 99
- 108010064785 Phospholipases Proteins 0.000 claims description 92
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 92
- 102000015439 Phospholipases Human genes 0.000 claims description 90
- ZIIUUSVHCHPIQD-UHFFFAOYSA-N 2,4,6-trimethyl-N-[3-(trifluoromethyl)phenyl]benzenesulfonamide Chemical compound CC1=CC(C)=CC(C)=C1S(=O)(=O)NC1=CC=CC(C(F)(F)F)=C1 ZIIUUSVHCHPIQD-UHFFFAOYSA-N 0.000 claims description 85
- 230000000694 effects Effects 0.000 claims description 85
- 150000007523 nucleic acids Chemical class 0.000 claims description 75
- 102000004169 proteins and genes Human genes 0.000 claims description 72
- 238000000034 method Methods 0.000 claims description 59
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 52
- 102000039446 nucleic acids Human genes 0.000 claims description 48
- 108020004707 nucleic acids Proteins 0.000 claims description 48
- 101150047030 ERO1 gene Proteins 0.000 claims description 44
- 230000037361 pathway Effects 0.000 claims description 44
- 101100243108 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PDI1 gene Proteins 0.000 claims description 42
- 108090000637 alpha-Amylases Proteins 0.000 claims description 42
- 102000004139 alpha-Amylases Human genes 0.000 claims description 36
- 230000032258 transport Effects 0.000 claims description 35
- 229940024171 alpha-amylase Drugs 0.000 claims description 34
- 210000002472 endoplasmic reticulum Anatomy 0.000 claims description 34
- 239000002609 medium Substances 0.000 claims description 33
- 108090000371 Esterases Proteins 0.000 claims description 31
- 210000002421 cell wall Anatomy 0.000 claims description 30
- 239000003008 fumonisin Substances 0.000 claims description 27
- 102000004190 Enzymes Human genes 0.000 claims description 26
- 108090000790 Enzymes Proteins 0.000 claims description 26
- 229940088598 enzyme Drugs 0.000 claims description 26
- 101100428743 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) VPS5 gene Proteins 0.000 claims description 22
- 101150057697 VPS5 gene Proteins 0.000 claims description 22
- 210000000170 cell membrane Anatomy 0.000 claims description 22
- 101150101314 PRB1 gene Proteins 0.000 claims description 21
- 230000004048 modification Effects 0.000 claims description 20
- 238000012986 modification Methods 0.000 claims description 20
- 101100156532 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) VPS17 gene Proteins 0.000 claims description 18
- 108090000854 Oxidoreductases Proteins 0.000 claims description 17
- 102000004316 Oxidoreductases Human genes 0.000 claims description 17
- 101150040428 SEC4 gene Proteins 0.000 claims description 16
- 108010006519 Molecular Chaperones Proteins 0.000 claims description 15
- 230000035755 proliferation Effects 0.000 claims description 15
- 238000013519 translation Methods 0.000 claims description 15
- 101150108662 KAR2 gene Proteins 0.000 claims description 14
- 239000004365 Protease Substances 0.000 claims description 14
- 108091005804 Peptidases Proteins 0.000 claims description 13
- 230000004906 unfolded protein response Effects 0.000 claims description 13
- 210000003934 vacuole Anatomy 0.000 claims description 13
- 101150045458 KEX2 gene Proteins 0.000 claims description 9
- 101150108426 BMH2 gene Proteins 0.000 claims description 8
- 101150102835 BOS1 gene Proteins 0.000 claims description 8
- 101150098196 CCW12 gene Proteins 0.000 claims description 8
- 101150009153 COG6 gene Proteins 0.000 claims description 8
- 101150048931 COY1 gene Proteins 0.000 claims description 8
- 101150055921 CPR5 gene Proteins 0.000 claims description 8
- 101150032680 CWP2 gene Proteins 0.000 claims description 8
- 101100317178 Caenorhabditis elegans vps-26 gene Proteins 0.000 claims description 8
- 101150086287 ERV25 gene Proteins 0.000 claims description 8
- 101150074516 ERV29 gene Proteins 0.000 claims description 8
- 101150049031 HAC1 gene Proteins 0.000 claims description 8
- 101150047219 JEM1 gene Proteins 0.000 claims description 8
- 101150096459 LHS1 gene Proteins 0.000 claims description 8
- 101150024881 MTC6 gene Proteins 0.000 claims description 8
- 101150082238 PAH1 gene Proteins 0.000 claims description 8
- 101150077239 SAR1 gene Proteins 0.000 claims description 8
- 101150005224 SBH1 gene Proteins 0.000 claims description 8
- 101150104940 SEC12 gene Proteins 0.000 claims description 8
- 101150047747 SEC13 gene Proteins 0.000 claims description 8
- 101150003764 SEC16 gene Proteins 0.000 claims description 8
- 101150080918 SEC23 gene Proteins 0.000 claims description 8
- 101150092584 SEC31 gene Proteins 0.000 claims description 8
- 101150087239 SSA4 gene Proteins 0.000 claims description 8
- 101150001283 SSE1 gene Proteins 0.000 claims description 8
- 101150075433 SSO2 gene Proteins 0.000 claims description 8
- 101100219651 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) COY1 gene Proteins 0.000 claims description 8
- 101150108455 Sil1 gene Proteins 0.000 claims description 8
- 101150013427 VPS21 gene Proteins 0.000 claims description 8
- 101150051052 VPS29 gene Proteins 0.000 claims description 8
- 101150035098 VPS35 gene Proteins 0.000 claims description 8
- 101150108883 VPS8 gene Proteins 0.000 claims description 8
- 101150062886 YOS9 gene Proteins 0.000 claims description 8
- 101150078578 cog5 gene Proteins 0.000 claims description 8
- 239000001963 growth medium Substances 0.000 claims description 8
- 101150082283 ire1 gene Proteins 0.000 claims description 8
- 101150083025 kin-2 gene Proteins 0.000 claims description 8
- 230000002062 proliferating effect Effects 0.000 claims description 8
- 101150006457 sed1 gene Proteins 0.000 claims description 8
- 230000035897 transcription Effects 0.000 claims description 8
- 238000013518 transcription Methods 0.000 claims description 8
- 101150084750 1 gene Proteins 0.000 claims description 7
- 101150020502 BFR2 gene Proteins 0.000 claims description 7
- 101150059813 DER1 gene Proteins 0.000 claims description 7
- 101150099089 EXO70 gene Proteins 0.000 claims description 7
- 101150019359 HSF1 gene Proteins 0.000 claims description 7
- 101150086022 LAM1 gene Proteins 0.000 claims description 7
- 101150028033 OPI1 gene Proteins 0.000 claims description 7
- 101150092843 SEC1 gene Proteins 0.000 claims description 7
- 101150037853 SNC2 gene Proteins 0.000 claims description 7
- 101150000499 SRP14 gene Proteins 0.000 claims description 7
- 101150019201 SSO1 gene Proteins 0.000 claims description 7
- 101100015451 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GOS1 gene Proteins 0.000 claims description 7
- 101150095919 UBC7 gene Proteins 0.000 claims description 7
- 101150092093 VMA3 gene Proteins 0.000 claims description 7
- 101150114118 YPT32 gene Proteins 0.000 claims description 7
- 101150099663 rpp0 gene Proteins 0.000 claims description 7
- 230000003248 secreting effect Effects 0.000 claims description 7
- 101150115447 srp54 gene Proteins 0.000 claims description 7
- 210000005253 yeast cell Anatomy 0.000 claims description 7
- 108010092897 Coat Protein Complex I Proteins 0.000 claims description 6
- 102000016726 Coat Protein Complex I Human genes 0.000 claims description 6
- 210000001163 endosome Anatomy 0.000 claims description 6
- 230000004481 post-translational protein modification Effects 0.000 claims description 6
- 230000005945 translocation Effects 0.000 claims description 6
- 230000004900 autophagic degradation Effects 0.000 claims description 5
- 230000006782 ER associated degradation Effects 0.000 claims description 4
- 108010058643 Fungal Proteins Proteins 0.000 claims description 4
- 102000003886 Glycoproteins Human genes 0.000 claims description 4
- 108090000288 Glycoproteins Proteins 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 4
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 claims description 3
- 230000015556 catabolic process Effects 0.000 claims description 3
- 238000006731 degradation reaction Methods 0.000 claims description 3
- 230000013595 glycosylation Effects 0.000 claims description 3
- 238000006206 glycosylation reaction Methods 0.000 claims description 3
- 101150002258 HDR1 gene Proteins 0.000 claims description 2
- 101150029183 PEP4 gene Proteins 0.000 claims description 2
- 101100457453 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MNL1 gene Proteins 0.000 claims description 2
- 241000235088 Saccharomyces sp. Species 0.000 claims description 2
- 238000012258 culturing Methods 0.000 claims description 2
- 108700026220 vif Genes Proteins 0.000 claims description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims 4
- 101150007778 HDR3 gene Proteins 0.000 claims 1
- 230000009467 reduction Effects 0.000 abstract description 20
- 241000235342 Saccharomycetes Species 0.000 description 74
- 235000018102 proteins Nutrition 0.000 description 68
- 230000004151 fermentation Effects 0.000 description 49
- 238000000855 fermentation Methods 0.000 description 48
- 235000001014 amino acid Nutrition 0.000 description 45
- 229940024606 amino acid Drugs 0.000 description 44
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 29
- 238000012217 deletion Methods 0.000 description 27
- 230000037430 deletion Effects 0.000 description 27
- 101710162127 Protein disulfide-isomerase 1 Proteins 0.000 description 25
- 150000001413 amino acids Chemical class 0.000 description 24
- 239000000047 product Substances 0.000 description 23
- 108091026890 Coding region Proteins 0.000 description 20
- 108091028043 Nucleic acid sequence Proteins 0.000 description 18
- 108020004414 DNA Proteins 0.000 description 17
- 125000000539 amino acid group Chemical group 0.000 description 17
- 239000002028 Biomass Substances 0.000 description 16
- 230000002779 inactivation Effects 0.000 description 16
- 241000235648 Pichia Species 0.000 description 15
- 239000000306 component Substances 0.000 description 15
- 230000001105 regulatory effect Effects 0.000 description 15
- 230000004071 biological effect Effects 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 14
- 235000019441 ethanol Nutrition 0.000 description 13
- 238000010438 heat treatment Methods 0.000 description 13
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 13
- 108010011619 6-Phytase Proteins 0.000 description 12
- 229920002472 Starch Polymers 0.000 description 12
- 239000008107 starch Substances 0.000 description 12
- 235000019698 starch Nutrition 0.000 description 12
- 230000014616 translation Effects 0.000 description 12
- 108020004705 Codon Proteins 0.000 description 11
- 210000004899 c-terminal region Anatomy 0.000 description 11
- 230000001976 improved effect Effects 0.000 description 11
- 238000012423 maintenance Methods 0.000 description 11
- 238000004519 manufacturing process Methods 0.000 description 11
- 229940085127 phytase Drugs 0.000 description 11
- 239000002002 slurry Substances 0.000 description 11
- 241000894007 species Species 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 10
- 101001125486 Homo sapiens Basic salivary proline-rich protein 1 Proteins 0.000 description 10
- 241000235058 Komagataella pastoris Species 0.000 description 10
- 102100029516 Basic salivary proline-rich protein 1 Human genes 0.000 description 9
- 102000004157 Hydrolases Human genes 0.000 description 9
- 108090000604 Hydrolases Proteins 0.000 description 9
- 102000035195 Peptidases Human genes 0.000 description 9
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 9
- 241000235013 Yarrowia Species 0.000 description 9
- 210000000349 chromosome Anatomy 0.000 description 9
- 238000006467 substitution reaction Methods 0.000 description 9
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 8
- 241000235646 Cyberlindnera jadinii Species 0.000 description 8
- 244000285963 Kluyveromyces fragilis Species 0.000 description 8
- 108090001060 Lipase Proteins 0.000 description 8
- 241000320412 Ogataea angusta Species 0.000 description 8
- 241000235015 Yarrowia lipolytica Species 0.000 description 8
- 230000002411 adverse Effects 0.000 description 8
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 8
- 101150020143 vps17 gene Proteins 0.000 description 8
- 239000007222 ypd medium Substances 0.000 description 8
- 102000013142 Amylases Human genes 0.000 description 7
- 108010065511 Amylases Proteins 0.000 description 7
- 241000235035 Debaryomyces Species 0.000 description 7
- 241000223221 Fusarium oxysporum Species 0.000 description 7
- 102000004882 Lipase Human genes 0.000 description 7
- 239000004367 Lipase Substances 0.000 description 7
- 235000019418 amylase Nutrition 0.000 description 7
- 238000001035 drying Methods 0.000 description 7
- 230000002255 enzymatic effect Effects 0.000 description 7
- 229930004094 glycosylphosphatidylinositol Natural products 0.000 description 7
- 108010002430 hemicellulase Proteins 0.000 description 7
- 235000019421 lipase Nutrition 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000000644 propagated effect Effects 0.000 description 7
- 101150018813 ssa1 gene Proteins 0.000 description 7
- 239000004382 Amylase Substances 0.000 description 6
- 241000228245 Aspergillus niger Species 0.000 description 6
- 241000222122 Candida albicans Species 0.000 description 6
- 108010059892 Cellulase Proteins 0.000 description 6
- 108090000746 Chymosin Proteins 0.000 description 6
- 241000235036 Debaryomyces hansenii Species 0.000 description 6
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 6
- 229920002488 Hemicellulose Polymers 0.000 description 6
- 101000702653 Homo sapiens Sorting nexin-1 Proteins 0.000 description 6
- 241001138401 Kluyveromyces lactis Species 0.000 description 6
- 101150104042 MNL1 gene Proteins 0.000 description 6
- 108700026244 Open Reading Frames Proteins 0.000 description 6
- 241000081271 Phaffia rhodozyma Species 0.000 description 6
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 6
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 6
- 101150049523 SLY1 gene Proteins 0.000 description 6
- 241000235060 Scheffersomyces stipitis Species 0.000 description 6
- 102100030992 Sorting nexin-1 Human genes 0.000 description 6
- 240000008042 Zea mays Species 0.000 description 6
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 6
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 6
- 108010087924 alanylproline Proteins 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 6
- 229940095731 candida albicans Drugs 0.000 description 6
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 6
- 229940106157 cellulase Drugs 0.000 description 6
- 229940080701 chymosin Drugs 0.000 description 6
- 235000005822 corn Nutrition 0.000 description 6
- -1 for example Proteins 0.000 description 6
- 230000002538 fungal effect Effects 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 235000019419 proteases Nutrition 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 101150015999 sec24 gene Proteins 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 108010024976 Asparaginase Proteins 0.000 description 5
- 240000006439 Aspergillus oryzae Species 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 5
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 5
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 5
- 102100022624 Glucoamylase Human genes 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 5
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 5
- IMQLKJBTEOYOSI-GPIVLXJGSA-N Inositol-hexakisphosphate Chemical compound OP(O)(=O)O[C@H]1[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@@H]1OP(O)(O)=O IMQLKJBTEOYOSI-GPIVLXJGSA-N 0.000 description 5
- 241000235649 Kluyveromyces Species 0.000 description 5
- 102100037611 Lysophospholipase Human genes 0.000 description 5
- 241000235395 Mucor Species 0.000 description 5
- IMQLKJBTEOYOSI-UHFFFAOYSA-N Phytic acid Natural products OP(O)(=O)OC1C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C1OP(O)(O)=O IMQLKJBTEOYOSI-UHFFFAOYSA-N 0.000 description 5
- 102000006010 Protein Disulfide-Isomerase Human genes 0.000 description 5
- 241000223252 Rhodotorula Species 0.000 description 5
- 241000235346 Schizosaccharomyces Species 0.000 description 5
- 108091081024 Start codon Proteins 0.000 description 5
- 230000001276 controlling effect Effects 0.000 description 5
- 239000012228 culture supernatant Substances 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 5
- 239000008103 glucose Substances 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 5
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 5
- 229940059442 hemicellulase Drugs 0.000 description 5
- 230000003301 hydrolyzing effect Effects 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 235000002949 phytic acid Nutrition 0.000 description 5
- 229940068041 phytic acid Drugs 0.000 description 5
- 239000000467 phytic acid Substances 0.000 description 5
- 108020003519 protein disulfide isomerase Proteins 0.000 description 5
- 230000012846 protein folding Effects 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 102100025573 1-alkyl-2-acetylglycerophosphocholine esterase Human genes 0.000 description 4
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 4
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 4
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 241000235548 Blakeslea Species 0.000 description 4
- 241001527609 Cryptococcus Species 0.000 description 4
- 108010015776 Glucose oxidase Proteins 0.000 description 4
- 239000004366 Glucose oxidase Substances 0.000 description 4
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 4
- 101000878213 Homo sapiens Inactive peptidyl-prolyl cis-trans isomerase FKBP6 Proteins 0.000 description 4
- 102100036984 Inactive peptidyl-prolyl cis-trans isomerase FKBP6 Human genes 0.000 description 4
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- 102000005431 Molecular Chaperones Human genes 0.000 description 4
- 241000235575 Mortierella Species 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- 241001542817 Phaffia Species 0.000 description 4
- 241000233671 Schizochytrium Species 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 4
- 108030003984 Thiol oxidases Proteins 0.000 description 4
- 241000233675 Thraustochytrium Species 0.000 description 4
- 241000223230 Trichosporon Species 0.000 description 4
- 230000003625 amylolytic effect Effects 0.000 description 4
- 229960003272 asparaginase Drugs 0.000 description 4
- DCXYFEDJOCDNAF-UHFFFAOYSA-M asparaginate Chemical compound [O-]C(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-M 0.000 description 4
- 108010068265 aspartyltyrosine Proteins 0.000 description 4
- 230000008827 biological function Effects 0.000 description 4
- 235000008429 bread Nutrition 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 229940116332 glucose oxidase Drugs 0.000 description 4
- 235000019420 glucose oxidase Nutrition 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 230000001988 toxicity Effects 0.000 description 4
- 231100000419 toxicity Toxicity 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 3
- 241000680806 Blastobotrys adeninivorans Species 0.000 description 3
- 101100083070 Candida albicans (strain SC5314 / ATCC MYA-2876) PGA6 gene Proteins 0.000 description 3
- 108010084185 Cellulases Proteins 0.000 description 3
- 102000005575 Cellulases Human genes 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 3
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 3
- XVUAQNRNFMVWBR-BLMTYFJBSA-N Ile-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N XVUAQNRNFMVWBR-BLMTYFJBSA-N 0.000 description 3
- 108010028688 Isoamylase Proteins 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- 101710117655 Maltogenic alpha-amylase Proteins 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 3
- 108010058864 Phospholipases A2 Proteins 0.000 description 3
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 3
- 241000235400 Phycomyces Species 0.000 description 3
- 108010000605 Ribosomal Proteins Proteins 0.000 description 3
- 102000002278 Ribosomal Proteins Human genes 0.000 description 3
- 101100001142 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) AGA2 gene Proteins 0.000 description 3
- 101100166584 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CCW12 gene Proteins 0.000 description 3
- 241001123650 Schwanniomyces occidentalis Species 0.000 description 3
- 241001123649 Schwanniomyces polymorphus Species 0.000 description 3
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 3
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 3
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 3
- KQTIIICEAUMSDG-UHFFFAOYSA-N carboxymethylsuccinic acid Natural products OC(=O)CC(C(O)=O)CC(O)=O KQTIIICEAUMSDG-UHFFFAOYSA-N 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 3
- 108010018006 histidylserine Proteins 0.000 description 3
- 230000007062 hydrolysis Effects 0.000 description 3
- 238000006460 hydrolysis reaction Methods 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 239000003112 inhibitor Substances 0.000 description 3
- 239000012978 lignocellulosic material Substances 0.000 description 3
- 235000019626 lipase activity Nutrition 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 235000013379 molasses Nutrition 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 150000003904 phospholipids Chemical class 0.000 description 3
- 229910052698 phosphorus Inorganic materials 0.000 description 3
- 239000011574 phosphorus Substances 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 210000004739 secretory vesicle Anatomy 0.000 description 3
- 108010080629 tryptophan-leucine Proteins 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- 239000002699 waste material Substances 0.000 description 3
- PORPENFLTBBHSG-MGBGTMOVSA-N 1,2-dihexadecanoyl-sn-glycerol-3-phosphate Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(O)=O)OC(=O)CCCCCCCCCCCCCCC PORPENFLTBBHSG-MGBGTMOVSA-N 0.000 description 2
- 108010080981 3-phytase Proteins 0.000 description 2
- 101150021974 Adh1 gene Proteins 0.000 description 2
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 2
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 2
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 2
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 2
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 2
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 241001083548 Anemone Species 0.000 description 2
- 241000219195 Arabidopsis thaliana Species 0.000 description 2
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 2
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 2
- 241001523626 Arxula Species 0.000 description 2
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 2
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 2
- QGABLMITFKUQDF-DCAQKATOSA-N Asn-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGABLMITFKUQDF-DCAQKATOSA-N 0.000 description 2
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 2
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- LBFYTUPYYZENIR-GHCJXIJMSA-N Asp-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N LBFYTUPYYZENIR-GHCJXIJMSA-N 0.000 description 2
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 2
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 2
- PWAIZUBWHRHYKS-MELADBBJSA-N Asp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)O)N)C(=O)O PWAIZUBWHRHYKS-MELADBBJSA-N 0.000 description 2
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 2
- XOASPVGNFAMYBD-WFBYXXMGSA-N Asp-Trp-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O XOASPVGNFAMYBD-WFBYXXMGSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 101100407358 Aspergillus niger pdiA gene Proteins 0.000 description 2
- 208000035404 Autolysis Diseases 0.000 description 2
- 241000193755 Bacillus cereus Species 0.000 description 2
- 241000194107 Bacillus megaterium Species 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 102100032487 Beta-mannosidase Human genes 0.000 description 2
- 101100150553 Caenorhabditis elegans ssu-1 gene Proteins 0.000 description 2
- 244000206911 Candida holmii Species 0.000 description 2
- 206010057248 Cell death Diseases 0.000 description 2
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 2
- 241000235555 Cunninghamella Species 0.000 description 2
- 108010090461 DFG peptide Proteins 0.000 description 2
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 2
- 101000823089 Equus caballus Alpha-1-antiproteinase 1 Proteins 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- XQEAVUJIRZRLQQ-SZMVWBNQSA-N Gln-His-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC3=CN=CN3)NC(=O)[C@H](CCC(=O)N)N XQEAVUJIRZRLQQ-SZMVWBNQSA-N 0.000 description 2
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 2
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 2
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 2
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 2
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 2
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 2
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 2
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- 241001149669 Hanseniaspora Species 0.000 description 2
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 2
- 101000651211 Homo sapiens Transcription factor PU.1 Proteins 0.000 description 2
- 240000005979 Hordeum vulgare Species 0.000 description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 description 2
- IIXDMJNYALIKGP-DJFWLOJKSA-N Ile-Asn-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IIXDMJNYALIKGP-DJFWLOJKSA-N 0.000 description 2
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 2
- GLLAUPMJCGKPFY-BLMTYFJBSA-N Ile-Ile-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 GLLAUPMJCGKPFY-BLMTYFJBSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 241000879186 Kazachstania barnettii Species 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 241000186606 Lactobacillus gasseri Species 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 2
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 2
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 2
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 2
- 241001149698 Lipomyces Species 0.000 description 2
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 2
- GZGWILAQHOVXTD-DCAQKATOSA-N Lys-Met-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O GZGWILAQHOVXTD-DCAQKATOSA-N 0.000 description 2
- PPNCMJARTHYNEC-MEYUZBJRSA-N Lys-Tyr-Thr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)CC1=CC=C(O)C=C1 PPNCMJARTHYNEC-MEYUZBJRSA-N 0.000 description 2
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- OBVHKUFUDCPZDW-JYJNAYRXSA-N Met-Arg-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OBVHKUFUDCPZDW-JYJNAYRXSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 101100491995 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) aro-1 gene Proteins 0.000 description 2
- 241000123069 Ocyurus chrysurus Species 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 241000589779 Pelomonas saccharophila Species 0.000 description 2
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 2
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 2
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 2
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 241000235061 Pichia sp. Species 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 108010059820 Polygalacturonase Proteins 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 2
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 2
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 2
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 2
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 2
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 2
- 241000582914 Saccharomyces uvarum Species 0.000 description 2
- 241000311088 Schwanniomyces Species 0.000 description 2
- 235000007238 Secale cereale Nutrition 0.000 description 2
- 244000082988 Secale cereale Species 0.000 description 2
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 2
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 2
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 2
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 2
- UQGAAZXSCGWMFU-UBHSHLNASA-N Ser-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N UQGAAZXSCGWMFU-UBHSHLNASA-N 0.000 description 2
- 108010051611 Signal Recognition Particle Proteins 0.000 description 2
- 102000013598 Signal recognition particle Human genes 0.000 description 2
- 240000006394 Sorghum bicolor Species 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 241001136494 Talaromyces funiculosus Species 0.000 description 2
- 241000205188 Thermococcus Species 0.000 description 2
- 241000204074 Thermococcus hydrothermalis Species 0.000 description 2
- 241000223257 Thermomyces Species 0.000 description 2
- 241000589499 Thermus thermophilus Species 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 2
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 2
- 241000006364 Torula Species 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 102100027654 Transcription factor PU.1 Human genes 0.000 description 2
- 241000499912 Trichoderma reesei Species 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 241000209140 Triticum Species 0.000 description 2
- BIJDDZBDSJLWJY-PJODQICGSA-N Trp-Ala-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O BIJDDZBDSJLWJY-PJODQICGSA-N 0.000 description 2
- DXDMNBJJEXYMLA-UBHSHLNASA-N Trp-Asn-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 DXDMNBJJEXYMLA-UBHSHLNASA-N 0.000 description 2
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 2
- JVTHMUDOKPQBOT-NSHDSACASA-N Trp-Gly-Gly Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O)=CNC2=C1 JVTHMUDOKPQBOT-NSHDSACASA-N 0.000 description 2
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 2
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 2
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 2
- XYBNMHRFAUKPAW-IHRRRGAJSA-N Tyr-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XYBNMHRFAUKPAW-IHRRRGAJSA-N 0.000 description 2
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 2
- NWDOPHYLSORNEX-QXEWZRGKSA-N Val-Asn-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N NWDOPHYLSORNEX-QXEWZRGKSA-N 0.000 description 2
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 2
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 2
- ZZGPVSZDZQRJQY-ULQDDVLXSA-N Val-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZZGPVSZDZQRJQY-ULQDDVLXSA-N 0.000 description 2
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 235000006085 Vigna mungo var mungo Nutrition 0.000 description 2
- 240000005616 Vigna mungo var. mungo Species 0.000 description 2
- 240000006365 Vitis vinifera Species 0.000 description 2
- 235000014787 Vitis vinifera Nutrition 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 2
- 108010087049 alanyl-alanyl-prolyl-valine Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 150000001298 alcohols Chemical class 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004873 anchoring Methods 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 108010055059 beta-Mannosidase Proteins 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000009924 canning Methods 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 239000003995 emulsifying agent Substances 0.000 description 2
- 230000009483 enzymatic pathway Effects 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 230000029142 excretion Effects 0.000 description 2
- 108010093305 exopolygalacturonase Proteins 0.000 description 2
- 210000001723 extracellular space Anatomy 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 235000002532 grape seed extract Nutrition 0.000 description 2
- 108010018734 hexose oxidase Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 238000000265 homogenisation Methods 0.000 description 2
- 230000000415 inactivating effect Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 229920005610 lignin Polymers 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000002887 multiple sequence alignment Methods 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 230000001323 posttranslational effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- BDERNNFJNOPAEC-UHFFFAOYSA-N propan-1-ol Chemical compound CCCO BDERNNFJNOPAEC-UHFFFAOYSA-N 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 230000028043 self proteolysis Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 2
- 230000035899 viability Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 229920001221 xylan Polymers 0.000 description 2
- 150000004823 xylans Chemical class 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- CNKBMTKICGGSCQ-ACRUOGEOSA-N (2S)-2-[[(2S)-2-[[(2S)-2,6-diamino-1-oxohexyl]amino]-1-oxo-3-phenylpropyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CNKBMTKICGGSCQ-ACRUOGEOSA-N 0.000 description 1
- JARGNLJYKBUKSJ-KGZKBUQUSA-N (2r)-2-amino-5-[[(2r)-1-(carboxymethylamino)-3-hydroxy-1-oxopropan-2-yl]amino]-5-oxopentanoic acid;hydrobromide Chemical compound Br.OC(=O)[C@H](N)CCC(=O)N[C@H](CO)C(=O)NCC(O)=O JARGNLJYKBUKSJ-KGZKBUQUSA-N 0.000 description 1
- PVKZAQYUEVYDGV-CGOOJBRSSA-N (2r,3s,4r,5r)-3,4,5,6-tetrahydroxy-2-[(3r,4s,5r)-3,4,5-trihydroxyoxan-2-yl]oxyhexanal Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](C=O)OC1OC[C@@H](O)[C@H](O)[C@H]1O PVKZAQYUEVYDGV-CGOOJBRSSA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- LUEWUZLMQUOBSB-FSKGGBMCSA-N (2s,3s,4s,5s,6r)-2-[(2r,3s,4r,5r,6s)-6-[(2r,3s,4r,5s,6s)-4,5-dihydroxy-2-(hydroxymethyl)-6-[(2r,4r,5s,6r)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-4,5-dihydroxy-2-(hydroxymethyl)oxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@@H](O[C@@H]2[C@H](O[C@@H](OC3[C@H](O[C@@H](O)[C@@H](O)[C@H]3O)CO)[C@@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O LUEWUZLMQUOBSB-FSKGGBMCSA-N 0.000 description 1
- DNIAPMSPPWPWGF-GSVOUGTGSA-N (R)-(-)-Propylene glycol Chemical compound C[C@@H](O)CO DNIAPMSPPWPWGF-GSVOUGTGSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- UFBJCMHMOXMLKC-UHFFFAOYSA-N 2,4-dinitrophenol Chemical compound OC1=CC=C([N+]([O-])=O)C=C1[N+]([O-])=O UFBJCMHMOXMLKC-UHFFFAOYSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- XJFPXLWGZWAWRQ-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O XJFPXLWGZWAWRQ-UHFFFAOYSA-N 0.000 description 1
- HVCOBJNICQPDBP-UHFFFAOYSA-N 3-[3-[3,5-dihydroxy-6-methyl-4-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyoxan-2-yl]oxydecanoyloxy]decanoic acid;hydrate Chemical group O.OC1C(OC(CC(=O)OC(CCCCCCC)CC(O)=O)CCCCCCC)OC(C)C(O)C1OC1C(O)C(O)C(O)C(C)O1 HVCOBJNICQPDBP-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 108010013043 Acetylesterase Proteins 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- HFBFSOAKPUZCCO-ZLUOBGJFSA-N Ala-Cys-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HFBFSOAKPUZCCO-ZLUOBGJFSA-N 0.000 description 1
- YEELWQSXYBJVSV-UWJYBYFXSA-N Ala-Cys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YEELWQSXYBJVSV-UWJYBYFXSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- GHBSKQGCIYSCNS-NAKRPEOUSA-N Ala-Leu-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GHBSKQGCIYSCNS-NAKRPEOUSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- OMFMCIVBKCEMAK-CYDGBPFRSA-N Ala-Leu-Val-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O OMFMCIVBKCEMAK-CYDGBPFRSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 1
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- AAWLEICNDUHIJM-MBLNEYKQSA-N Ala-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C)N)O AAWLEICNDUHIJM-MBLNEYKQSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- XMIAMUXIMWREBJ-HERUPUMHSA-N Ala-Trp-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XMIAMUXIMWREBJ-HERUPUMHSA-N 0.000 description 1
- XPBVBZPVNFIHOA-UVBJJODRSA-N Ala-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 XPBVBZPVNFIHOA-UVBJJODRSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- 108010025188 Alcohol oxidase Proteins 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 101000734334 Arabidopsis thaliana Protein disulfide isomerase-like 1-1 Proteins 0.000 description 1
- 101100251965 Arabidopsis thaliana RLP51 gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- OLDOLPWZEMHNIA-PJODQICGSA-N Arg-Ala-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OLDOLPWZEMHNIA-PJODQICGSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- QHVRVUNEAIFTEK-SZMVWBNQSA-N Arg-Pro-Trp Chemical compound N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O QHVRVUNEAIFTEK-SZMVWBNQSA-N 0.000 description 1
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 1
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 1
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 1
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 1
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- PLVAAIPKSGUXDV-WHFBIAKZSA-N Asn-Gly-Cys Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)C(=O)N PLVAAIPKSGUXDV-WHFBIAKZSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 1
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 1
- QXNGSPZMGFEZNO-QRTARXTBSA-N Asn-Val-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QXNGSPZMGFEZNO-QRTARXTBSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 1
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 1
- NURJSGZGBVJFAD-ZLUOBGJFSA-N Asp-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O NURJSGZGBVJFAD-ZLUOBGJFSA-N 0.000 description 1
- YRBGRUOSJROZEI-NHCYSSNCSA-N Asp-His-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O YRBGRUOSJROZEI-NHCYSSNCSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 1
- ZXRQJQCXPSMNMR-XIRDDKMYSA-N Asp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N ZXRQJQCXPSMNMR-XIRDDKMYSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- KRQFMDNIUOVRIF-KKUMJFAQSA-N Asp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N KRQFMDNIUOVRIF-KKUMJFAQSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 1
- 241000228257 Aspergillus sp. Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241001134780 Bacillus acidopullulyticus Species 0.000 description 1
- 241001468248 Bacillus thermoalkalophilus Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 101710130006 Beta-glucanase Proteins 0.000 description 1
- 108010004032 Bromelains Proteins 0.000 description 1
- 102100037084 C4b-binding protein alpha chain Human genes 0.000 description 1
- 102100021786 CMP-N-acetylneuraminate-poly-alpha-2,8-sialyltransferase Human genes 0.000 description 1
- 101000609815 Caenorhabditis elegans Protein disulfide-isomerase 1 Proteins 0.000 description 1
- 101000609840 Caenorhabditis elegans Protein disulfide-isomerase 2 Proteins 0.000 description 1
- 101100478237 Caenorhabditis elegans ost-1 gene Proteins 0.000 description 1
- 101100083069 Candida albicans (strain SC5314 / ATCC MYA-2876) PGA62 gene Proteins 0.000 description 1
- 101100106993 Candida albicans (strain SC5314 / ATCC MYA-2876) YWP1 gene Proteins 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241000588923 Citrobacter Species 0.000 description 1
- 241000580513 Citrobacter braakii Species 0.000 description 1
- 241000873310 Citrobacter sp. Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 244000019459 Cynara cardunculus Species 0.000 description 1
- 235000019106 Cynara scolymus Nutrition 0.000 description 1
- HRJLVSQKBLZHSR-ZLUOBGJFSA-N Cys-Asn-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O HRJLVSQKBLZHSR-ZLUOBGJFSA-N 0.000 description 1
- OIMUAKUQOUEPCZ-WHFBIAKZSA-N Cys-Asn-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIMUAKUQOUEPCZ-WHFBIAKZSA-N 0.000 description 1
- UXUSHQYYQCZWET-WDSKDSINSA-N Cys-Glu-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O UXUSHQYYQCZWET-WDSKDSINSA-N 0.000 description 1
- PRHGYQOSEHLDRW-VGDYDELISA-N Cys-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N PRHGYQOSEHLDRW-VGDYDELISA-N 0.000 description 1
- JXVFJOMFOLFPMP-KKUMJFAQSA-N Cys-Leu-Tyr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JXVFJOMFOLFPMP-KKUMJFAQSA-N 0.000 description 1
- HEPLXMBVMCXTBP-QWRGUYRKSA-N Cys-Phe-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O HEPLXMBVMCXTBP-QWRGUYRKSA-N 0.000 description 1
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 1
- LKHMGNHQULEPFY-ACZMJKKPSA-N Cys-Ser-Glu Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O LKHMGNHQULEPFY-ACZMJKKPSA-N 0.000 description 1
- 125000002353 D-glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 101150015836 ENO1 gene Proteins 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102100031375 Endothelial lipase Human genes 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000488157 Escherichia sp. Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000308443 Exophiala spinifera Species 0.000 description 1
- 101710129170 Extensin Proteins 0.000 description 1
- 101150054379 FLO1 gene Proteins 0.000 description 1
- 108090000270 Ficain Proteins 0.000 description 1
- 101150002721 GPD2 gene Proteins 0.000 description 1
- 229920002324 Galactoglucomannan Polymers 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 1
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- BVELAHPZLYLZDJ-HGNGGELXSA-N Gln-His-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O BVELAHPZLYLZDJ-HGNGGELXSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 1
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- GMAGZGCAYLQBKF-NHCYSSNCSA-N Glu-Met-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GMAGZGCAYLQBKF-NHCYSSNCSA-N 0.000 description 1
- YUXIEONARHPUTK-JBACZVJFSA-N Glu-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CCC(=O)O)N YUXIEONARHPUTK-JBACZVJFSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- NTHIHAUEXVTXQG-KKUMJFAQSA-N Glu-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O NTHIHAUEXVTXQG-KKUMJFAQSA-N 0.000 description 1
- BKMOHWJHXQLFEX-IRIUXVKKSA-N Glu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N)O BKMOHWJHXQLFEX-IRIUXVKKSA-N 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- 101710118165 Glucan 1,4-alpha-maltotetraohydrolase Proteins 0.000 description 1
- 229920002581 Glucomannan Polymers 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- YDWZGVCXMVLDQH-WHFBIAKZSA-N Gly-Cys-Asn Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O YDWZGVCXMVLDQH-WHFBIAKZSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- UEGIPZAXNBYCCP-NKWVEPMBSA-N Gly-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)CN)C(=O)O UEGIPZAXNBYCCP-NKWVEPMBSA-N 0.000 description 1
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 1
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- YYXJFBMCOUSYSF-RYUDHWBXSA-N Gly-Phe-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYXJFBMCOUSYSF-RYUDHWBXSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 1
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 1
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- FULZDMOZUZKGQU-ONGXEEELSA-N Gly-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN FULZDMOZUZKGQU-ONGXEEELSA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 241000566341 Hanseniaspora vineae Species 0.000 description 1
- 244000286779 Hansenula anomala Species 0.000 description 1
- 235000014683 Hansenula anomala Nutrition 0.000 description 1
- 240000008892 Helianthus tuberosus Species 0.000 description 1
- 235000003230 Helianthus tuberosus Nutrition 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- YJBMLTVVVRJNOK-SRVKXCTJSA-N His-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N YJBMLTVVVRJNOK-SRVKXCTJSA-N 0.000 description 1
- LMMPTUVWHCFTOT-GARJFASQSA-N His-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O LMMPTUVWHCFTOT-GARJFASQSA-N 0.000 description 1
- YOSQCYUFZGPIPC-PBCZWWQYSA-N His-Asp-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YOSQCYUFZGPIPC-PBCZWWQYSA-N 0.000 description 1
- BPOHQCZZSFBSON-KKUMJFAQSA-N His-Leu-His Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BPOHQCZZSFBSON-KKUMJFAQSA-N 0.000 description 1
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 1
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 1
- 102100024023 Histone PARylation factor 1 Human genes 0.000 description 1
- 101000673456 Homo sapiens 60S acidic ribosomal protein P0 Proteins 0.000 description 1
- 101000616698 Homo sapiens CMP-N-acetylneuraminate-poly-alpha-2,8-sialyltransferase Proteins 0.000 description 1
- 101000583807 Homo sapiens DNA replication licensing factor MCM2 Proteins 0.000 description 1
- 101000842611 Homo sapiens Derlin-1 Proteins 0.000 description 1
- 101000813489 Homo sapiens Exocyst complex component 7 Proteins 0.000 description 1
- 101000867525 Homo sapiens Heat shock factor protein 1 Proteins 0.000 description 1
- 101001018097 Homo sapiens L-selectin Proteins 0.000 description 1
- 101000799554 Homo sapiens Protein AATF Proteins 0.000 description 1
- 101000641419 Homo sapiens V-type proton ATPase 16 kDa proteolipid subunit c Proteins 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 1
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 1
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- IMRKCLXPYOIHIF-ZPFDUUQYSA-N Ile-Met-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IMRKCLXPYOIHIF-ZPFDUUQYSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- RKQAYOWLSFLJEE-SVSWQMSJSA-N Ile-Thr-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N RKQAYOWLSFLJEE-SVSWQMSJSA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 229920001202 Inulin Polymers 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 241000170280 Kluyveromyces sp. Species 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 241000235031 Lachancea fermentati Species 0.000 description 1
- 241000481961 Lachancea thermotolerans Species 0.000 description 1
- 102100039648 Lactadherin Human genes 0.000 description 1
- 101710191666 Lactadherin Proteins 0.000 description 1
- 108010059881 Lactase Proteins 0.000 description 1
- 240000001046 Lactobacillus acidophilus Species 0.000 description 1
- 235000013956 Lactobacillus acidophilus Nutrition 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- XYUBOFCTGPZFSA-WDSOQIARSA-N Leu-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 XYUBOFCTGPZFSA-WDSOQIARSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- QKIBIXAQKAFZGL-GUBZILKMSA-N Leu-Cys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QKIBIXAQKAFZGL-GUBZILKMSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- HMDDEJADNKQTBR-BZSNNMDCSA-N Leu-His-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMDDEJADNKQTBR-BZSNNMDCSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 1
- CNWDWAMPKVYJJB-NUTKFTJISA-N Leu-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CNWDWAMPKVYJJB-NUTKFTJISA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000003820 Lipoxygenases Human genes 0.000 description 1
- 108090000128 Lipoxygenases Proteins 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- JBRWKVANRYPCAF-XIRDDKMYSA-N Lys-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N JBRWKVANRYPCAF-XIRDDKMYSA-N 0.000 description 1
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 1
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- QFSYGUMEANRNJE-DCAQKATOSA-N Lys-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N QFSYGUMEANRNJE-DCAQKATOSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 229920000057 Mannan Polymers 0.000 description 1
- IIPHCNKHEZYSNE-DCAQKATOSA-N Met-Arg-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O IIPHCNKHEZYSNE-DCAQKATOSA-N 0.000 description 1
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 1
- ZRACLHJYVRBJFC-ULQDDVLXSA-N Met-Lys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZRACLHJYVRBJFC-ULQDDVLXSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- KYXDADPHSNFWQX-VEVYYDQMSA-N Met-Thr-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O KYXDADPHSNFWQX-VEVYYDQMSA-N 0.000 description 1
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 1
- 102100036617 Monoacylglycerol lipase ABHD2 Human genes 0.000 description 1
- 241001558145 Mucor sp. Species 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 101100243377 Mus musculus Pepd gene Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 101100028920 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cfp gene Proteins 0.000 description 1
- 101710149086 Nuclease S1 Proteins 0.000 description 1
- 101100070271 Oryza sativa subsp. japonica HDR3 gene Proteins 0.000 description 1
- 241000194105 Paenibacillus polymyxa Species 0.000 description 1
- 102100026367 Pancreatic alpha-amylase Human genes 0.000 description 1
- 108010019160 Pancreatin Proteins 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 241000228168 Penicillium sp. Species 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 1
- VLZGUAUYZGQKPM-DRZSPHRISA-N Phe-Gln-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VLZGUAUYZGQKPM-DRZSPHRISA-N 0.000 description 1
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 1
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 1
- TXKWKTWYTIAZSV-KKUMJFAQSA-N Phe-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N TXKWKTWYTIAZSV-KKUMJFAQSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- JKJSIYKSGIDHPM-WBAXXEDZSA-N Phe-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O JKJSIYKSGIDHPM-WBAXXEDZSA-N 0.000 description 1
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 1
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 1
- MMPBPRXOFJNCCN-ZEWNOJEFSA-N Phe-Tyr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MMPBPRXOFJNCCN-ZEWNOJEFSA-N 0.000 description 1
- IPVPGAADZXRZSH-RNXOBYDBSA-N Phe-Tyr-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IPVPGAADZXRZSH-RNXOBYDBSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- 102100035200 Phospholipase A and acyltransferase 4 Human genes 0.000 description 1
- 108090000553 Phospholipase D Proteins 0.000 description 1
- 102100032967 Phospholipase D1 Human genes 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- CZCCVJUUWBMISW-FXQIFTODSA-N Pro-Ser-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O CZCCVJUUWBMISW-FXQIFTODSA-N 0.000 description 1
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 1
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- HOJUNFDJDAPVBI-BZSNNMDCSA-N Pro-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 HOJUNFDJDAPVBI-BZSNNMDCSA-N 0.000 description 1
- CWZUFLWPEFHWEI-IHRRRGAJSA-N Pro-Tyr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O CWZUFLWPEFHWEI-IHRRRGAJSA-N 0.000 description 1
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- 101710136733 Proline-rich protein Proteins 0.000 description 1
- 102000016611 Proteoglycans Human genes 0.000 description 1
- 108010067787 Proteoglycans Proteins 0.000 description 1
- 101001045444 Proteus vulgaris Endoribonuclease HigB Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 101001100822 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) Pyocin-S2 Proteins 0.000 description 1
- 101001100831 Pseudomonas aeruginosa Pyocin-S1 Proteins 0.000 description 1
- 241001453300 Pseudomonas amyloderamosa Species 0.000 description 1
- 241000511669 Pullulanibacillus naganoensis Species 0.000 description 1
- 241000959173 Rasamsonia emersonii Species 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 101150014136 SUC2 gene Proteins 0.000 description 1
- 101100058541 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) BMH2 gene Proteins 0.000 description 1
- 101100008072 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CWP2 gene Proteins 0.000 description 1
- 101100514836 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MTQ2 gene Proteins 0.000 description 1
- 101100242156 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) OPI1 gene Proteins 0.000 description 1
- 101100203507 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SNC2 gene Proteins 0.000 description 1
- 101100257809 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SSO1 gene Proteins 0.000 description 1
- 101100544820 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YPT32 gene Proteins 0.000 description 1
- 241000235004 Saccharomycopsis fibuligera Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000235348 Schizosaccharomyces japonicus Species 0.000 description 1
- 101100336423 Schizosaccharomyces pombe (strain 972 / ATCC 24843) gdp1 gene Proteins 0.000 description 1
- 101100465990 Schizosaccharomyces pombe (strain 972 / ATCC 24843) psy1 gene Proteins 0.000 description 1
- 101100156531 Schizosaccharomyces pombe (strain 972 / ATCC 24843) vps17 gene Proteins 0.000 description 1
- 101100428742 Schizosaccharomyces pombe (strain 972 / ATCC 24843) vps5 gene Proteins 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- WTPKKLMBNBCCNL-ACZMJKKPSA-N Ser-Cys-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N WTPKKLMBNBCCNL-ACZMJKKPSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- SVWQEIRZHHNBIO-WHFBIAKZSA-N Ser-Gly-Cys Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CS)C(O)=O SVWQEIRZHHNBIO-WHFBIAKZSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- JAWGSPUJAXYXJA-IHRRRGAJSA-N Ser-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=CC=C1 JAWGSPUJAXYXJA-IHRRRGAJSA-N 0.000 description 1
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 1
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 1
- WMZVVNLPHFSUPA-BPUTZDHNSA-N Ser-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 WMZVVNLPHFSUPA-BPUTZDHNSA-N 0.000 description 1
- ATEQEHCGZKBEMU-GQGQLFGLSA-N Ser-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N ATEQEHCGZKBEMU-GQGQLFGLSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 101710089523 Signal recognition particle 14 kDa protein Proteins 0.000 description 1
- 101710187184 Signal recognition particle 54 kDa protein Proteins 0.000 description 1
- 101710150385 Signal recognition particle 54 kDa protein 1 Proteins 0.000 description 1
- 101710150383 Signal recognition particle 54 kDa protein 2 Proteins 0.000 description 1
- 101710150391 Signal recognition particle 54 kDa protein 3 Proteins 0.000 description 1
- 101710128823 Signal recognition particle 54 kDa protein homolog Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 244000138286 Sorghum saccharatum Species 0.000 description 1
- 101000882406 Staphylococcus aureus Enterotoxin type C-1 Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 102000005262 Sulfatase Human genes 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 101150044379 TIR1 gene Proteins 0.000 description 1
- 101150032817 TPI1 gene Proteins 0.000 description 1
- 241000223258 Thermomyces lanuginosus Species 0.000 description 1
- 241000589596 Thermus Species 0.000 description 1
- 235000009430 Thespesia populnea Nutrition 0.000 description 1
- 102000005488 Thioesterase Human genes 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 1
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 1
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- XXNLGZRRSKPSGF-HTUGSXCWSA-N Thr-Gln-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O XXNLGZRRSKPSGF-HTUGSXCWSA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- YZUWGFXVVZQJEI-PMVVWTBXSA-N Thr-Gly-His Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O YZUWGFXVVZQJEI-PMVVWTBXSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- VGNKUXWYFFDWDH-BEMMVCDISA-N Thr-Trp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N)O VGNKUXWYFFDWDH-BEMMVCDISA-N 0.000 description 1
- REJRKTOJTCPDPO-IRIUXVKKSA-N Thr-Tyr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O REJRKTOJTCPDPO-IRIUXVKKSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- RPECVQBNONKZAT-WZLNRYEVSA-N Thr-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H]([C@@H](C)O)N RPECVQBNONKZAT-WZLNRYEVSA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241000235006 Torulaspora Species 0.000 description 1
- 108060008539 Transglutaminase Proteins 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 241001557886 Trichoderma sp. Species 0.000 description 1
- 208000026487 Triploidy Diseases 0.000 description 1
- AVYVKJMBNLPWRX-WFBYXXMGSA-N Trp-Ala-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 AVYVKJMBNLPWRX-WFBYXXMGSA-N 0.000 description 1
- QNMIVTOQXUSGLN-SZMVWBNQSA-N Trp-Arg-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QNMIVTOQXUSGLN-SZMVWBNQSA-N 0.000 description 1
- NKUIXQOJUAEIET-AQZXSJQPSA-N Trp-Asp-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 NKUIXQOJUAEIET-AQZXSJQPSA-N 0.000 description 1
- XKKBFNPJFZLTMY-CWRNSKLLSA-N Trp-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O XKKBFNPJFZLTMY-CWRNSKLLSA-N 0.000 description 1
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 1
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 1
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 1
- QUIXRGCMQOXUSV-SZMVWBNQSA-N Trp-Pro-Pro Chemical compound O=C([C@@H]1CCCN1C(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(O)=O QUIXRGCMQOXUSV-SZMVWBNQSA-N 0.000 description 1
- ARKBYVBCEOWRNR-UBHSHLNASA-N Trp-Ser-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O ARKBYVBCEOWRNR-UBHSHLNASA-N 0.000 description 1
- ABRICLFKFRFDKS-IHPCNDPISA-N Trp-Ser-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 ABRICLFKFRFDKS-IHPCNDPISA-N 0.000 description 1
- DDHFMBDACJYSKW-AQZXSJQPSA-N Trp-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DDHFMBDACJYSKW-AQZXSJQPSA-N 0.000 description 1
- WGBFZZYIWFSYER-BVSLBCMMSA-N Trp-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N WGBFZZYIWFSYER-BVSLBCMMSA-N 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- WDIJBEWLXLQQKD-ULQDDVLXSA-N Tyr-Arg-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O WDIJBEWLXLQQKD-ULQDDVLXSA-N 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- WPVGRKLNHJJCEN-BZSNNMDCSA-N Tyr-Asp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WPVGRKLNHJJCEN-BZSNNMDCSA-N 0.000 description 1
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- FXYOYUMPUJONGW-FHWLQOOXSA-N Tyr-Gln-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 FXYOYUMPUJONGW-FHWLQOOXSA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 1
- RGYCVIZZTUBSSG-JYJNAYRXSA-N Tyr-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O RGYCVIZZTUBSSG-JYJNAYRXSA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- NZBSVMQZQMEUHI-WZLNRYEVSA-N Tyr-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NZBSVMQZQMEUHI-WZLNRYEVSA-N 0.000 description 1
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 1
- GAKBTSMAPGLQFA-JNPHEJMOSA-N Tyr-Thr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 GAKBTSMAPGLQFA-JNPHEJMOSA-N 0.000 description 1
- NAHUCETZGZZSEX-IHPCNDPISA-N Tyr-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N NAHUCETZGZZSEX-IHPCNDPISA-N 0.000 description 1
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 1
- KLOZTPOXVVRVAQ-DZKIICNBSA-N Tyr-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KLOZTPOXVVRVAQ-DZKIICNBSA-N 0.000 description 1
- 101710101614 Ubiquitin-conjugating enzyme E2 G1 Proteins 0.000 description 1
- 108010046334 Urease Proteins 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 1
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 1
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 1
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- TVGWMCTYUFBXAP-QTKMDUPCSA-N Val-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N)O TVGWMCTYUFBXAP-QTKMDUPCSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- HVRRJRMULCPNRO-BZSNNMDCSA-N Val-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 HVRRJRMULCPNRO-BZSNNMDCSA-N 0.000 description 1
- LZRWTJSPTJSWDN-FKBYEOEOSA-N Val-Trp-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N LZRWTJSPTJSWDN-FKBYEOEOSA-N 0.000 description 1
- KJFBXCFOPAKPTM-BZSNNMDCSA-N Val-Trp-Val Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 KJFBXCFOPAKPTM-BZSNNMDCSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- 101100071190 Vibrio parahaemolyticus serotype O3:K6 (strain RIMD 2210633) tdh2 gene Proteins 0.000 description 1
- 101100071192 Vibrio parahaemolyticus tdh3 gene Proteins 0.000 description 1
- 108700040099 Xylose isomerases Proteins 0.000 description 1
- 241000490645 Yarrowia sp. Species 0.000 description 1
- UGXQOOQUZRUVSS-ZZXKWVIFSA-N [5-[3,5-dihydroxy-2-(1,3,4-trihydroxy-5-oxopentan-2-yl)oxyoxan-4-yl]oxy-3,4-dihydroxyoxolan-2-yl]methyl (e)-3-(4-hydroxyphenyl)prop-2-enoate Chemical compound OC1C(OC(CO)C(O)C(O)C=O)OCC(O)C1OC1C(O)C(O)C(COC(=O)\C=C\C=2C=CC(O)=CC=2)O1 UGXQOOQUZRUVSS-ZZXKWVIFSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 108010084631 acetolactate decarboxylase Proteins 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000002154 agricultural waste Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- GZCGUPFRVQAUEE-SLPGGIOYSA-N aldehydo-D-glucose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O GZCGUPFRVQAUEE-SLPGGIOYSA-N 0.000 description 1
- 108010030291 alpha-Galactosidase Proteins 0.000 description 1
- 102000005840 alpha-Galactosidase Human genes 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 102000016679 alpha-Glucosidases Human genes 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 229940025131 amylases Drugs 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 108010054251 arabinogalactan proteins Proteins 0.000 description 1
- 229920000617 arabinoxylan Polymers 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 238000010296 bead milling Methods 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 108010019077 beta-Amylase Proteins 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 235000012813 breadcrumbs Nutrition 0.000 description 1
- 235000019835 bromelain Nutrition 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 150000001733 carboxylic acid esters Chemical class 0.000 description 1
- 230000006652 catabolic pathway Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000001112 coagulating effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000002036 drum drying Methods 0.000 description 1
- 238000009837 dry grinding Methods 0.000 description 1
- 230000000459 effect on growth Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- YERABYSOHUZTPQ-UHFFFAOYSA-P endo-1,4-beta-Xylanase Chemical compound C=1C=CC=CC=1C[N+](CC)(CC)CCCNC(C(C=1)=O)=CC(=O)C=1NCCC[N+](CC)(CC)CC1=CC=CC=C1 YERABYSOHUZTPQ-UHFFFAOYSA-P 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 101150104041 eno2 gene Proteins 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006126 farnesylation Effects 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 235000019836 ficin Nutrition 0.000 description 1
- POTUGHMKJGOKRI-UHFFFAOYSA-N ficin Chemical compound FI=CI=N POTUGHMKJGOKRI-UHFFFAOYSA-N 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- UVBUBMSSQKOIBE-DSLOAKGESA-N fumonisin B1 Chemical compound OC(=O)C[C@@H](C(O)=O)CC(=O)O[C@H]([C@H](C)CCCC)[C@@H](OC(=O)C[C@@H](CC(O)=O)C(O)=O)C[C@@H](C)C[C@H](O)CCCC[C@@H](O)C[C@H](O)[C@H](C)N UVBUBMSSQKOIBE-DSLOAKGESA-N 0.000 description 1
- QZIADBYRQILELJ-UHFFFAOYSA-N fumonisin B1 Natural products CCCCC(C)C(OC(=O)CC(CC(=O)O)C(=O)O)C(C)(CC(C)CC(O)CCCCC(O)CC(O)C(C)N)OC(=O)CC(CC(=O)O)C(=O)O QZIADBYRQILELJ-UHFFFAOYSA-N 0.000 description 1
- 108010044804 gamma-glutamyl-seryl-glycine Proteins 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 101150056490 gdp1 gene Proteins 0.000 description 1
- 229940046240 glucomannan Drugs 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010084760 glycyl-tyrosyl-glycyl-aspartate Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 101150012707 gos1 gene Proteins 0.000 description 1
- 230000009643 growth defect Effects 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- JYJIGFIDKWBXDU-MNNPPOADSA-N inulin Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)OC[C@]1(OC[C@]2(OC[C@]3(OC[C@]4(OC[C@]5(OC[C@]6(OC[C@]7(OC[C@]8(OC[C@]9(OC[C@]%10(OC[C@]%11(OC[C@]%12(OC[C@]%13(OC[C@]%14(OC[C@]%15(OC[C@]%16(OC[C@]%17(OC[C@]%18(OC[C@]%19(OC[C@]%20(OC[C@]%21(OC[C@]%22(OC[C@]%23(OC[C@]%24(OC[C@]%25(OC[C@]%26(OC[C@]%27(OC[C@]%28(OC[C@]%29(OC[C@]%30(OC[C@]%31(OC[C@]%32(OC[C@]%33(OC[C@]%34(OC[C@]%35(OC[C@]%36(O[C@@H]%37[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O%37)O)[C@H]([C@H](O)[C@@H](CO)O%36)O)[C@H]([C@H](O)[C@@H](CO)O%35)O)[C@H]([C@H](O)[C@@H](CO)O%34)O)[C@H]([C@H](O)[C@@H](CO)O%33)O)[C@H]([C@H](O)[C@@H](CO)O%32)O)[C@H]([C@H](O)[C@@H](CO)O%31)O)[C@H]([C@H](O)[C@@H](CO)O%30)O)[C@H]([C@H](O)[C@@H](CO)O%29)O)[C@H]([C@H](O)[C@@H](CO)O%28)O)[C@H]([C@H](O)[C@@H](CO)O%27)O)[C@H]([C@H](O)[C@@H](CO)O%26)O)[C@H]([C@H](O)[C@@H](CO)O%25)O)[C@H]([C@H](O)[C@@H](CO)O%24)O)[C@H]([C@H](O)[C@@H](CO)O%23)O)[C@H]([C@H](O)[C@@H](CO)O%22)O)[C@H]([C@H](O)[C@@H](CO)O%21)O)[C@H]([C@H](O)[C@@H](CO)O%20)O)[C@H]([C@H](O)[C@@H](CO)O%19)O)[C@H]([C@H](O)[C@@H](CO)O%18)O)[C@H]([C@H](O)[C@@H](CO)O%17)O)[C@H]([C@H](O)[C@@H](CO)O%16)O)[C@H]([C@H](O)[C@@H](CO)O%15)O)[C@H]([C@H](O)[C@@H](CO)O%14)O)[C@H]([C@H](O)[C@@H](CO)O%13)O)[C@H]([C@H](O)[C@@H](CO)O%12)O)[C@H]([C@H](O)[C@@H](CO)O%11)O)[C@H]([C@H](O)[C@@H](CO)O%10)O)[C@H]([C@H](O)[C@@H](CO)O9)O)[C@H]([C@H](O)[C@@H](CO)O8)O)[C@H]([C@H](O)[C@@H](CO)O7)O)[C@H]([C@H](O)[C@@H](CO)O6)O)[C@H]([C@H](O)[C@@H](CO)O5)O)[C@H]([C@H](O)[C@@H](CO)O4)O)[C@H]([C@H](O)[C@@H](CO)O3)O)[C@H]([C@H](O)[C@@H](CO)O2)O)[C@@H](O)[C@H](O)[C@@H](CO)O1 JYJIGFIDKWBXDU-MNNPPOADSA-N 0.000 description 1
- 229940029339 inulin Drugs 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 229940116108 lactase Drugs 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 239000002029 lignocellulosic biomass Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010005335 mannoproteins Proteins 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 239000013586 microbial product Substances 0.000 description 1
- 239000011785 micronutrient Substances 0.000 description 1
- 235000013369 micronutrients Nutrition 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- DNIAPMSPPWPWGF-UHFFFAOYSA-N monopropylene glycol Natural products CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 1
- 239000010813 municipal solid waste Substances 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 208000007538 neurilemmoma Diseases 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000008723 osmotic stress Effects 0.000 description 1
- 101150015442 ost-1 gene Proteins 0.000 description 1
- 230000026792 palmitoylation Effects 0.000 description 1
- 229940055695 pancreatin Drugs 0.000 description 1
- 239000010893 paper waste Substances 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 108020004410 pectinesterase Proteins 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 101150079312 pgk1 gene Proteins 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 229940085991 phosphate ion Drugs 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 150000004804 polysaccharides Chemical class 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000035752 proliferative phase Effects 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 229960004063 propylene glycol Drugs 0.000 description 1
- 235000013772 propylene glycol Nutrition 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 102000006844 purple acid phosphatase Human genes 0.000 description 1
- 108010073968 purple acid phosphatase Proteins 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000006479 redox reaction Methods 0.000 description 1
- 229940108461 rennet Drugs 0.000 description 1
- 108010058314 rennet Proteins 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000007441 retrograde transport Effects 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 206010039667 schwannoma Diseases 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000001694 spray drying Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 108060007951 sulfatase Proteins 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 101150063973 tdh1 gene Proteins 0.000 description 1
- 101150003389 tdh2 gene Proteins 0.000 description 1
- 101150088047 tdh3 gene Proteins 0.000 description 1
- 108020002982 thioesterase Proteins 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 210000003412 trans-golgi network Anatomy 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 102000003601 transglutaminase Human genes 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- DCXXMTOCNZCJGO-UHFFFAOYSA-N tristearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(OC(=O)CCCCCCCCCCCCCCCCC)COC(=O)CCCCCCCCCCCCCCCCC DCXXMTOCNZCJGO-UHFFFAOYSA-N 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 238000004927 wastewater treatment sludge Methods 0.000 description 1
- 238000001238 wet grinding Methods 0.000 description 1
- 108010078692 yeast proteinase B Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/16—Yeasts; Culture media therefor
- C12N1/18—Baker's yeast; Brewer's yeast
- C12N1/185—Saccharomyces isolates
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/39—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
- C07K14/395—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/18—Carboxylic ester hydrolases (3.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2408—Glucanases acting on alpha -1,4-glucosidic bonds
- C12N9/2411—Amylases
- C12N9/2414—Alpha-amylase (3.2.1.1.)
- C12N9/2417—Alpha-amylase (3.2.1.1.) from microbiological source
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/58—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi
- C12N9/60—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi from yeast
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/85—Saccharomyces
- C12R2001/865—Saccharomyces cerevisiae
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/01—Carboxylic ester hydrolases (3.1.1)
- C12Y301/01004—Phospholipase A2 (3.1.1.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/01—Carboxylic ester hydrolases (3.1.1)
- C12Y301/01087—Fumonisin B1 esterase (3.1.1.87)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01001—Alpha-amylase (3.2.1.1)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Botany (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本公开涉及重组酵母宿主细胞,其具有第一基因修饰以表达异源多肽或过表达天然多肽。重组酵母宿主细胞还具有第二基因修饰以至少部分地减轻由异源多肽的表达或者天然多肽的过表达造成的生长速率的降低。第二基因修饰可以例如有利于异源或天然多肽的分泌。
Description
相关申请和文献的引证
本申请要求2021年1月26日提交并且在此以其整体并入本文的美国临时申请63/141,807的优先权。本申请还包括也以其整体并入本文的电子格式的序列表。
技术领域
本公开涉及已被修饰为从由异源多肽的表达或天然多肽(native polypeptide)的过表达造成的生长缺陷至少部分地恢复其生长速率(growth rate,生长率)的重组酵母宿主细胞。
背景技术
多肽,特别是酶已在多种行业中具有应用,并且最重要的工业应用可以用于例如食品、去污剂和药物行业。这些蛋白(其可以是酶)的工业用途的限制很大程度是由于它们的高生产成本。在面包制造中,化学乳化剂,如SSL和DATEM广泛用于增强面团,增加面包体积,软化面包屑和延迟面包老化。酶被认为是干净的标签改进剂(label improver),并且取决于具体的酶,它们通常被认为在烘焙期间变性或失活,因此在最终产物中没有保留的活性。因此,脂肪酶和磷脂酶提供了减少或替换面包制造中的化学乳化剂的机会。
然而,从重组表达生产异源多肽具有一些挑战。已报道由于其对膜组分的磷脂的活性,磷脂酶的过表达在几种生产生物体中引起生长损害。当使用酵母宿主细胞表达磷脂酶时,所述酶可以被靶向分泌到细胞外,其中酵母的细胞壁起到扩散屏障的作用以阻断磷脂酶接近其细胞质膜(磷脂酶的靶标之一)。然而,由于在它从酵母宿主细胞中完全转运出之前,旨在被分泌的酶仍可以具有活性,因此仍观察到毒性。这导致了酵母宿主细胞的毒性和降低的生长速率,这进而降低了宿主细胞对脂肪酶和磷脂酶的生产滴度。
因此,需要改善的重组宿主细胞和方法以降低毒性并至少部分地恢复表达异源多肽或过表达天然多肽的宿主细胞的生长速率。
发明内容
本公开提供了已被基因工程化为表达异源多肽或过表达天然多肽的重组酵母宿主细胞以及至少部分地恢复它们的生长速率的基因修饰(genetic modification,遗传修饰)。
根据第一方面,本公开提供了重组酵母宿主细胞,其具有(i)第一基因修饰,所述第一基因修饰用于(a)表达异源多肽或过表达天然多肽和(b)表达与异源多肽或天然多肽操作性地相关联(operatively associated with heterologous polypeptide or nativepolypeptide)的信号序列;和(ii)第二基因修饰,当与对照酵母宿主细胞的生长速率相比时,所述第二基因修饰用于提高重组酵母宿主细胞的生长速率。对照酵母宿主细胞表达异源多肽或过表达天然多肽并且缺少第二基因修饰。当与亲代酵母宿主细胞(缺少第一和第二基因修饰两者)或与重组酵母宿主细胞(具有第一和第二基因修饰两者)相比时,异源多肽的表达或天然多肽的过表达阻碍对照酵母宿主细胞的生长速率。在一个实施方式中,重组酵母宿主细胞包含编码异源多肽的第一异源核酸分子或者编码天然多肽的第一天然核酸分子。在另一个实施方式中,第一异源核酸分子或第一天然核酸分子与增殖或需氧启动子操作性地相关联。在仍另一个实施方式中,分泌异源多肽或天然多肽,并且在进一步的实施方式中,将异源多肽或天然多肽拴系(tether)。在一些实施方式中,异源或天然多肽是具有磷脂酶活性的多肽。在进一步的实施方式中,具有磷脂酶活性的多肽包括SEQ ID NO:1或4的氨基酸序列,是具有磷脂酶活性的SEQ ID NO:1或4的氨基酸序列的变体,或者是具有磷脂酶活性的SEQ ID NO:1或4的氨基酸序列的片段。在其它实施方式中,异源或天然多肽是具有伏马菌素酯酶活性的多肽。在进一步的实施方式中,具有伏马菌素酯酶活性的多肽包括SEQ ID NO:21的氨基酸序列,是具有伏马菌素酯酶活性的SEQ ID NO:21的氨基酸序列的变体,或者是具有伏马菌素酯酶活性的SEQ ID NO:21的氨基酸序列的片段。在其它实施方式中,异源或天然多肽是具有α-淀粉酶活性的多肽。在其它实施方式中,具有α-淀粉酶活性的多肽包括SEQ ID NO:23的氨基酸序列,是具有α-淀粉酶活性的SEQ ID NO:23的氨基酸序列的变体,或者是具有α-淀粉酶活性的SEQ ID NO:23的氨基酸序列的片段。在仍另一个实施方式中,信号序列包括SEQ ID NO:2、3或24的氨基酸序列,是SEQ ID NO:2、3或24的氨基酸序列的变体或者是SEQ ID NO:2、3或24的片段。在一个实施方式中,第二基因修饰是酵母蛋白分泌和运输(trafficking)途径中的修饰。例如,第二基因修饰可以是酵母翻译途径的修饰中的一个或多个、酵母翻译后修饰途径的修饰中的一个或多个、酵母蛋白运输途径的修饰中的一个或多个、酵母液泡途径的修饰中的一个或多个、酵母细胞壁稳定性途径(stability pathway)的修饰中的一个或多个、或其组合。在另一个实施方式中,第二基因修饰包括参与内质网(ER)中多肽折叠、糖基化和降解的基因的表达的调节。在进一步的实施方式中,第二基因修饰包括与分子伴侣(molecular chaperone,分子伴侣蛋白)相关联的基因的表达的调节。例如,与分子伴侣相关联的基因可以包括KAR2基因、LHS1基因、JEM1基因、SSA1基因、SSA4基因和/或SSE1基因。在进一步的实施方式中,第二基因修饰包括与未折叠蛋白反应(unfolded protein response,未折叠蛋白应答)(UPR)相关联的基因的表达的调节。例如,与UPR相关联的基因可以包括HAC1基因、IRE1基因和/或KIN2基因。在进一步的实施方式中,第二基因修饰包括与氧化还原酶相关联的基因的表达的调节。例如,与氧化还原酶相关联的基因可以包括PDI1基因、ERO1基因和/或CPR5基因。在具体的实施方式中,与氧化还原酶相关联的基因是PDI1基因,并且在仍另一个实施方式中,第二基因修饰可以是PD1基因的过表达。在具体的实施方式中,与氧化还原酶相关联的基因是ERO1基因,并且在仍另一个实施方式中,第二基因修饰可以是ERO1基因的过表达。在具体的实施方式中,与氧化还原酶相关联的基因是PDI1基因和ERO1基因,并且在仍另一个实施方式中,第二基因修饰可以是PDI1基因和ERO1基因的过表达。在进一步的实施方式中,第二基因修饰包括参与内质网相关降解途径(endoplasmic reticulum associated degradation pathway,内质网相关降解通路)(ERAD)的基因的表达的调节。例如,参与ERAD的基因可以包括HTM1基因、YOS9基因、HDR1基因、HDR3基因、UBC7基因和/或DER1基因。在进一步的实施方式中,第二基因修饰包括参与内质网(ER)膨胀的基因的表达的调节。例如,参与ER膨胀的基因可以包括OPI1基因和/或PAH1基因。在进一步的实施方式中,第二基因修饰包括参与向内质网(ER)易位(translocation to endoplasmic reticulum(ER),易位至内质网(ER))的基因的表达的调节。例如,参与向ER易位的基因可以包括SIL1基因。在另一个实施方式中,第二基因修饰包括参与多肽从ER向高尔基系统和/或从高尔基系统向质膜运输的基因的表达的调节。在进一步的实施方式中,第二基因修饰包括与COPII囊泡相关联的基因的表达的调节。例如,与COPII囊泡相关联的基因可以包括ERV25基因、ERV29基因、SAR1基因、SEC12基因、SEC13基因、SEC16基因、SEC23基因、SE24基因、SEC31基因、SBH1基因、COG5基因、COG6基因、BOS1基因、COY1基因和/或SLY1基因。在进一步的实施方式中,第二基因修饰包括与COPI囊泡相关联的基因的表达的调节。例如,与COPI囊泡相关联的基因可以包括GOS1基因和/或LAM1基因。在进一步的实施方式中,第二基因修饰包括与核内体(endosome,内涵体)相关联的基因的表达的调节。例如,与核内体相关联的基因可以包括VPS5基因、VPS17基因、VPS26基因、VPS29基因和/或VPS35基因。在具体的实施方式中,与核内体相关联的基因是VPS5基因,并且在仍进一步的具体的实施方式中,第二基因修饰是VPS5基因的失活。在具体的实施方式中,与核内体相关联的基因是VPS17基因,并且在仍进一步的具体的实施方式中,第二基因修饰是VPS17基因的失活。在进一步的实施方式中,第二基因修饰包括参与多肽从高尔基系统向质膜运输的基因的表达的调节。例如,参与多肽从高尔基系统向质膜的运输的基因可以包括SEC1基因、SEC4基因、SSO1基因、SSO2基因、SNC2基因、EXO70基因和/或YPT32基因。在另一个实施方式中,第二基因修饰包括参与液泡分选途径的基因的表达的调节。在进一步的实施方式中,第二基因修饰包括与液泡蛋白酶相关联的基因的表达的调节。例如,与液泡蛋白酶相关联的基因可以包括PRB1基因、VMA3基因和/或PEP4基因。在具体的实施方式中,与液泡蛋白酶相关联的基因是PRB1基因,并且在仍进一步的具体的实施方式中,第二基因修饰可以是PRB1基因的失活。在进一步的实施方式中,第二基因修饰包括与多肽向液泡的运输相关联的基因的表达的调节。例如,与多肽向液泡的运输相关联的基因可以包括VPS8基因和/或VPS21基因。在进一步的实施方式中,第二基因修饰包括参与自噬的基因的表达的调节。例如,参与自噬的基因可以包括MTC6基因和/或SEC4基因。在另一个实施方式中,第二基因修饰包括与细胞壁甘露糖蛋白相关联的基因的表达的调节。例如,与细胞壁甘露糖蛋白相关联的基因可以包括CCW12基因和/或CWP2基因。在另一个实施方式中,第二基因修饰包括与细胞壁糖蛋白相关联的基因的表达的调节。例如,编码细胞壁糖蛋白的基因可以包括SED1基因。在另一个实施方式中,第二基因修饰包括参与转录和/或翻译的基因的表达的调节。例如,参与转录和/或翻译的基因可以包括BMH2基因、HSF1基因、SRP14基因和/或SRP54基因。在另一个实施方式中,第二基因修饰包括与核糖体相关联的基因的表达的调节。例如,与核糖体相关联的基因可以包括BFR2基因和/或RPP0基因。在另一个实施方式中,第二基因修饰包括与参与分泌途径的前蛋白激活的蛋白酶相关联的基因的表达的调节。例如,与参与分泌途径的前蛋白激活的蛋白酶相关联的基因可以包括KEX2基因。在具体的实施方式中,第二基因修饰在KEX2基因中,并且在进一步的实施方式中,第二基因修饰是KEX2基因的过表达。在一个实施方式中,重组酵母宿主细胞来自酵母菌(Saccharomyces sp.)属。在另一个实施方式中,重组酵母宿主细胞来自酿酒酵母(Saccharomyces cerevisiae)种。
根据第二方面,本公开提供了用于增殖本文所描述的重组酵母宿主细胞的方法,所述方法包括在允许重组酵母宿主细胞增殖的条件下在培养基中培养重组酵母宿主细胞。在另一个实施方式中,所述方法是需氧的。在一些进一步的实施方式中,所述方法还包括从培养基分离异源或天然多肽。在另一个实施方式中,所述方法还包括从增殖的重组酵母宿主细胞分离异源或天然多肽。在一个实施方式中,所述方法还包括提供重组酵母宿主细胞。在仍另一个实施方式中,所述方法还包括在亲代酵母宿主细胞中引入本文所定义的第一和第二基因修饰。
附图说明
因此,一般地描述了本发明的性质,现将参考通过说明显示其优选实施方式的附图,并且其中:
图1A显示了野生型酿酒酵母菌株(实线)、表达异源磷脂酶的重组酿酒酵母菌株(虚线)和表达异源磷脂酶并且具有PRB1缺失的重组酿酒酵母菌株(prb1Δ,短划线)的生长曲线。X轴表示时间(单位分钟),Y轴表示如通过在600nm的光密度(OD600)测量的细胞密度。
图1B显示了比较表达异源磷脂酶的重组酿酒酵母菌株(野生型)和表达异源磷脂酶且具有PRB1缺失的重组酿酒酵母菌株(ΔPRB1)的培养上清液中磷脂酶活性的图。X轴表示菌株的类型,Y轴表示磷脂酶活性(488/530nm的激发/发射下的ΔRFU)。
图2A显示了野生型酿酒酵母菌株(实线)、表达异源磷脂酶的重组酿酒酵母菌株(虚线)、表达异源磷脂酶且具有VPS5缺失的重组酿酒酵母菌株(短划线)和表达异源磷脂酶且具有VPS17缺失的重组酿酒酵母菌株(Δ)的生长曲线。X轴表示时间(单位分钟),Y轴表示如通过在600nm的光密度(OD600)测量的密度。
图2B显示了比较表达异源磷脂酶的重组酿酒酵母菌株(野生型)、表达异源磷脂酶且具有VPS5缺失的重组酿酒酵母菌株(ΔVps5)和表达异源磷脂酶且具有VPS17缺失的重组酿酒酵母菌株(ΔVps17)的培养上清液中的磷脂酶活性的图。X轴表示菌株的类型,Y轴表示磷脂酶活性(488/530nm的激发/发射下的ΔRFU)。
图3A显示了野生型酿酒酵母菌株(实线)、表达异源磷脂酶的重组酿酒酵母菌株(虚线)、表达异源磷脂酶且具有PRB1缺失的重组酿酒酵母菌株(短划线)、表达异源磷脂酶且具有同时PDI1和ERO1过表达的重组酿酒酵母菌株(“X”)和除PRB1缺失之外,表达异源磷脂酶且具有同时PDI1和ERO1过表达的重组酿酒酵母菌株(“□”)的生长曲线。X轴表示时间(单位分钟),Y轴表示如通过在600nm的光密度(OD600)测量的细胞密度。
图3B显示了比较表达异源磷脂酶且具有PRB1缺失的重组酿酒酵母菌株(ΔPRB1)和除PRB1缺失之外,表达异源磷脂酶且具有同时PDI1和ERO1过表达的重组酿酒酵母菌株(ΔPRB1 Pdi1+Ero1过表达)的培养上清液中的磷脂酶活性的图。X轴表示菌株的类型,Y轴表示磷脂酶活性(488/530nm的激发/发射下的ΔRFU)。
图4比较了酿酒酵母(S.cerevisiae)菌株M10580和转化体T11203和T11204的最大生长速率(μMax,单位h-1)。
图5比较了酿酒酵母菌株M10580和转化体T11203和T11204的组合的分泌和细胞相关Ceralpha活性(如在400nm的光密度测量的)。
具体实施方式
本公开提供了重组酵母宿主细胞,其具有第一基因修饰以表达异源多肽或过表达天然多肽。旨在在重组酵母宿主细胞中表达或过表达的异源多肽或天然多肽旨在被分泌/排出。然而,异源多肽的表达或天然多肽的过表达导致表达它们的对照酵母宿主细胞的生长速率(并且在一些实施方式中,最大生长速率)降低。当与其亲代酵母宿主细胞相比时,可以在对照酵母宿主细胞(其能够表达异源多肽或者过表达天然多肽)中观察到生长速率的这种降低。如在本申请的上下文中所使用的,“亲代酵母宿主细胞”是不包括如本文所描述的第一和第二基因修饰的细胞。亲代酵母宿主细胞可以用于获得对照酵母宿主细胞和/或重组酵母宿主细胞。在一些实施方式中,亲代酵母宿主细胞对应于对照酵母宿主细胞,除了它缺少对照酵母宿主细胞中存在的第一基因修饰。在一些进一步的实施方式中,亲代酵母宿主细胞对应于重组酵母宿主细胞,除了它缺少存在于重组酵母宿主细胞中的第一和第二基因修饰。在一些实施方式中,当与本公开的重组酵母宿主细胞(其能够表达异源多肽或过表达天然多肽并且包括如本文所描述的另外的(例如,第二)基因修饰)相比时,还可以在对照酵母宿主细胞中观察到生长速率的这种降低。本文所描述的重组酵母宿主细胞包括第二基因修饰(其在对照酵母宿主细胞和亲代酵母宿主细胞中不存在)以克服或至少部分减轻由(对照酵母宿主细胞中的)第一基因修饰所引起的生长速率的降低(例如,最大生长速率的降低)。
本公开的重组酵母宿主细胞包括至少两种不同的基因修饰。可以通过在相应亲代酵母宿主细胞中引入第一和第二基因修饰(以任何顺序)获得这些重组酵母宿主细胞。当基因修饰旨在提高特定靶基因(其可以是天然或异源的)的表达时,可以在一个或多个基因位置进行基因修饰。当基因修饰旨在降低或抑制特定靶基因(其对宿主细胞是内源的)的表达时,可以在靶基因的一个或全部拷贝中进行基因修饰。在本公开的上下文中,当重组酵母宿主细胞被鉴定为“基因工程化的”时,将理解为表示已操纵所述重组酵母宿主细胞以添加至少一个或多个异源或外源核酸残基和/或移除至少一个内源(或天然)核酸残基。在一些实施方式中,所添加的一个或多个核酸残基可以来源于异源细胞或重组细胞本身。在后一种情况下,在不同于天然基因组位置的基因组位置处添加核酸残基。遗传操纵不会天然发生并且是天然酵母或细菌宿主细胞体外操纵的结果。
在一些实施方式中,可以在一个或多个异源或天然核酸分子上编码每个基因修饰。在一些实施方式中,异源或天然核酸分子可以编码一个或多个多肽(其可以是天然基因的另外的拷贝)。在其它实施方式中,异源核酸分子可以编码一个或多个启动子或其它调控序列以用于调节(例如,提高或降低)天然多肽的表达。在一些实施方式中,本公开的异源核酸分子可以包括信号序列以有利于旨在通过重组酵母宿主细胞表达或过表达的异源多肽或天然多肽的分泌。
当用于表示核酸分子(如启动子、终止子或编码序列)或者蛋白/多肽时,术语“异源的”是指不是天然存在于重组宿主细胞中的核酸分子或蛋白/多肽。“异源的”还包括天然编码区/启动子/终止子或其部分,其从来源生物体移除并随后以不同于相应天然基因的形式再引入到来源生物体中。在一些实施方式中,异源核酸序列是不在其天然位置引入生物体基因组的天然核酸序列的拷贝。将异源核酸分子有目的地引入重组酵母宿主细胞。异源元件可以来源于不同宿主细胞菌株,或者来自不同分类群(例如,不同界、门、纲、目、科属或种,或者这些分类之一内的任何亚群)的生物体。当用于表示基因、多肽、酶活性或途径时,如本文所使用的,术语“天然的”是指最初在重组宿主细胞中存在的未修饰的基因、多肽、酶活性或途径。在一些实施方式中,可以在本公开的上下文中使用来源于不同宿主细胞菌株,或者来源于不同分类群(例如,不同界、门、纲、目、科属或种,或者这些分类之一内的任何亚群)的生物体的异源多肽。
本公开的异源核酸分子包括异源多肽的编码区。DNA或RNA“编码区”是当置于适当的调控序列的控制下时,在细胞体外或体内转录和/或翻译成异源多肽的DNA或RNA分子(优选DNA分子)。“适合的调控区”是指位于编码区上游(5'非编码序列)、内或下游(3'非编码序列)并且影响相关编码区的转录、RNA加工或稳定性或者翻译的核酸区域。调控区可以包括启动子、转录终止子、翻译前导序列、RNA加工位点、效应因子结合位点和茎环结构。通过5'(氨基)末端的起始密码子和3'(羧基)末端的翻译终止密码子确定编码区的边界。编码区可以包括但不限于原核区、来自mRNA的cDNA、基因组DNA分子、合成DNA分子或RNA分子。如果编码区旨在在真核细胞(如本公开的重组酵母宿主细胞)中表达,则多腺苷酸化信号和转录终止序列通常将位于编码区的3'。在一个实施方式中,可以将编码区称为开放阅读框。“开放阅读框”缩写为ORF并且表示一段长度的核酸,它是DNA、cDNA或RNA,其包括翻译起始信号或起始密码子,如ATG或AUG,和终止密码子并且可以潜在地翻译为多肽序列。
本文所描述的异源核酸分子可以包括转录和/或翻译控制区。“转录和翻译控制区”是DNA调控区,如启动子、增强子、终止子等,其提供了编码区在重组宿主细胞中的表达。在真核细胞中,认为多腺苷酸化信号是控制区。
在一些实施方式中,本公开的异源核酸分子包括异源多肽的编码序列,任选地结合启动子和/或终止子。在一些实施方式中,本公开的异源核酸分子包括编码用于过表达编码天然多肽的天然基因的启动子的核酸序列。在本公开的异源核酸分子中,启动子和终止子(当存在时)操作性地连接至异源或天然多肽的核酸编码序列,例如,它们控制异源或天然多肽的核酸序列的表达和表达终止。本公开的异源核酸分子还可以包括编码信号序列(例如,用于将异源多肽排出到宿主细胞外部的短肽序列)的核酸序列。当存在时,编码信号序列的核酸序列直接位于编码异源多肽或天然多肽的核酸序列的上游和框中。
在本文所描述的重组酵母宿主细胞中,编码启动子的核酸分子和编码异源或天然多肽的核酸分子操作性地彼此连接。在本公开的上下文中,表述“操作性地连接”或“操作性地关联”是指以下事实:启动子以在一定条件下允许异源多肽从核酸分子表达的方式物理关联(associated,结合)至编码异源或天然多肽的核苷酸分子。在一个实施方式中,启动子可以位于编码异源蛋白质的核酸序列的上游(5')。在仍另一个实施方式中,启动子可以位于编码异源蛋白质的核酸序列的下游(3')。在本公开的上下文中,一种或多于一种启动子可以包括在异源核酸分子中。当在异源核酸分子中包括多于一种启动子时,每种启动子操作性地连接至编码异源或天然多肽的核酸序列。考虑到编码异源或天然多肽的核酸分子,启动子可以位于上游、下游以及上游和下游两者。
术语“启动子”是指能够控制编码序列或功能性RNA的表达的DNA片段。如本文所使用的,术语“表达”是指来自本文所描述的异源核酸分子或天然基因的正义mRNA的转录和稳定积累。表达还可以是指mRNA向多肽的翻译。启动子可以其整体来源于天然基因的启动子,或者由来源于自然界中存在的不同启动子的不同元件组成,或者甚至包括合成DNA片段。本领域技术人员将理解不同启动子可以指导不同发育阶段的表达,或者响应不同环境或生理条件。在大多数时间造成基因在大部分细胞中以基本类似水平表达的启动子通常被称为“组成型启动子”。在本文中,将造成基因在酵母细胞的增殖阶段表达的启动子称为“增殖启动子(propagation promoter)”。增殖启动子包括组成型和诱导型启动子,诸如,例如葡萄糖-调控、糖蜜-调控、胁迫-应答启动子(包括渗透压胁迫应答启动子)和需氧-调控启动子。还认识到由于大多数情况下,尚未完全限定调控序列的准确边界,因此具有不同长度的DNA片段可以具有相同的启动子活性。启动子的边界通常通过转录起始位点限定在其3'端并且上游(5'方向)延伸以包括以高于背景的可检测水平起始转录所必需的最小碱基或元件数。在启动子内将存在转录起始位点(例如,通过核酸酶S1图谱定位(mapping)方便地限定)以及负责聚合酶结合的蛋白结合结构域(共有序列)。
启动子对于编码天然或异源多肽的核酸分子可以是天然或异源的。启动子对于编码过表达的天然多肽的天然基因可以是异源的。启动子可以是异源的或者来源于来自与重组宿主细胞相同的属或种的菌株。在一个实施方式中,启动子来源于酵母宿主细胞的相同属或种,并且异源多肽来源于不同于宿主细胞的属。启动子可以是单一启动子或者不同启动子的组合。在一些实施方式中,启动子是增殖启动子。在一些实施方式中,启动子是需氧启动子(aerobic promoter)。
在本公开的上下文中,控制异源多肽或天然多肽的表达的启动子可以是组成型启动子(诸如,例如tef2p(例如,tef2基因的启动子)、cwp2p(例如,cwp2基因的启动子)、ssa1p(例如,ssa1基因的启动子)、eno1p(例如,eno1基因的启动子)、hxk1(例如,hxk1基因的启动子)和pgk1p(例如,pgk1基因的启动子)。在一些实施方式中,启动子是adh1p(例如,adh1基因的启动子)。然而,在一些实施方式中,优选地限制多肽的表达。因此,控制异源多肽或天然多肽的表达的启动子可以是诱导型或调节启动子,诸如,例如葡萄糖-调节启动子(例如,hxt7基因的启动子(称为hxt7p))或者亚硫酸盐-调节启动子(例如,gpd2基因的启动子(称为gpd2p或fzf1基因的启动子(称为fzf1p))、ssu1基因的启动子(称为ssu1p)、ssu1-r基因的启动子(称为ssur1-rp)。在一个实施方式中,启动子是厌氧-调节启动子,诸如,例如tdh1p(例如,tdh1基因的启动子)、pau5p(例如,pau5基因的启动子)、hor7p(例如,hor7基因的启动子)、adh1p(例如,adh1基因的启动子)、tdh2p(例如,tdh2基因的启动子)、tdh3p(例如,tdh3基因的启动子)、gpd1p(例如,gdp1基因的启动子)、cdc19p(例如,cdc19基因的启动子)、eno2p(例如,eno2基因的启动子)、pdc1p(例如,pdc1基因的启动子)、hxt3p(例如,hxt3基因的启动子)、dan1(例如,dan1基因的启动子)和tpi1p(例如,tpi1基因的启动子)。可以使用一种或多种启动子以允许每种异源多肽在重组酵母宿主细胞中的表达。
可以使用一种或多种启动子以允许每种异源/天然多肽在重组酵母宿主细胞中的表达。在本公开的上下文中,当与启动子组合使用时,表述“启动子的功能性片段”是指比天然启动子短的核酸序列,其保留了控制编码异源多肽的核酸序列表达的能力。通常,功能性片段是来自天然启动子核酸序列的一个或多个核酸残基的5'和/或3'截短。
可以将本公开的异源核酸分子整合到酵母宿主细胞的染色体中。如本文所使用的术语“整合的”是指通过分子生物学技术,置于宿主细胞染色体中的遗传元件。例如,与在载体,如通过宿主细胞携带的质粒中相反,可以将遗传元件置于宿主细胞的染色体中。将遗传元件整合到宿主细胞染色体中的方法在本领域中是熟知的并且包括同源重组。异源核酸分子可以以一个或多个拷贝存在于酵母宿主细胞的染色体中。可替代地,可以独立地从酵母染色体复制异源核酸分子。在这样的实施方式中,核酸分子可以是稳定的和自复制的。异源核酸分子可以以一个或多个拷贝存在于重组酵母宿主细胞中。例如,每个异源核酸分子可以以每个染色体1、2、3、4、5、6、7、8个拷贝或更多个拷贝存在。
本公开还提供了用于修饰酵母宿主细胞以允许一种或多种异源多肽、变体或其片段的表达或者一种或多种天然多肽的过表达的核酸分子。核酸分子可以是DNA(如互补DNA、合成DNA或基因组DNA)或者RNA(其包括合成RNA)并且可以以单链(以正义链或反义链)或双链形式提供。所考虑的核酸分子可以包括编码区、非编码区或两者中的改变。实例是含有改变的核酸分子变体,其产生沉默替换、添加或缺失,但不改变所编码的多肽、变体或片段的性质或活性。
在一些实施方式中,可以引入重组宿主细胞的异源核酸分子是相对于预期受体重组酵母宿主细胞密码子优化的。如本文所使用的,术语“密码子优化的编码区”表示已通过用一个或多个密码子替换至少一个或多于一个密码子以优化表达水平,从而适合于给定生物体的细胞中的表达的核酸编码区。通常,生物体中高度表达的基因偏向该生物体中丰度最高的tRNA物质所识别的密码子。这种偏向的一种量度是“密码子适应指数”或“CAI”,其测量用于编码特定基因中每个氨基酸的密码子是来自生物体的高度表达的基因的参考组中最常出现的那些的程度。
可以使用载体将异源核酸分子引入酵母宿主细胞中。“载体”,例如,“质粒”、“粘粒”或“人工染色体”(诸如,例如酵母人工染色体)是指染色体外元件并且通常处于环状双链DNA分子形式。这些载体可以是单链或双链DNA或RNA的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其是直链、环状或超螺旋,来源于任何来源,其中一些核苷酸序列已连接或重组到能够将启动子片段和所选基因产物的DNA序列与适当的3'未翻译序列一起引入细胞的独特构造中。
第一基因修饰
根据本公开,重组酵母宿主细胞具有第一基因修饰以表达异源多肽。可替代地或组合地,根据本公开,重组酵母宿主细胞具有第一基因修饰以过表达天然多肽。在一些实施方式中,重组酵母宿主细胞具有第一基因修饰以表达异源多肽和过表达天然多肽。旨在分泌/排出异源多肽或天然多肽,并且第一基因修饰还用于表达与异源多肽和/或天然多肽操作性地相关联的信号序列。因此,在本公开的重组酵母宿主细胞中,当胞内存在时,异源或天然多肽包括在从重组酵母宿主细胞分泌/排出时被切割的信号序列。
在本公开的上下文中,当在对照酵母宿主细胞中表达异源多肽或过表达天然多肽时,它阻碍对照酵母宿主细胞的生长速率(当与缺少这种第一基因修饰的亲代酵母宿主细胞的生长速率相比时)。对照酵母宿主细胞表达异源多肽或过表达天然多肽但是不包括第二基因修饰。在一个实施方式中,对照酵母宿主细胞对应于重组酵母宿主细胞,但缺少第二基因修饰。生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少10、15、20、25、30、35、40、45、50、60、65、70%或更多的降低。在一些实施方式中,生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少10%的降低。在一些实施方式中,生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少15%的降低。在一些实施方式中,生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少20%的降低。在一些实施方式中,生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少25%的降低。在一些实施方式中,生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少30%的降低。在一些实施方式中,生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少35%的降低。在一些实施方式中,生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少40%的降低。在一些实施方式中,生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少45%的降低。在一些实施方式中,生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少50%的降低。在一些实施方式中,生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少55%的降低。在一些实施方式中,生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少60%的降低。在一些实施方式中,生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少65%的降低。在一些实施方式中,生长速率的这种阻碍可以是当与亲代酵母宿主细胞和/或重组酵母宿主细胞的生长速率相比时,生长速率至少70%的降低。在具体的实施方式中,当异源多肽或天然多肽不包括信号序列(并因此胞内表达)时,观察到对照酵母宿主细胞的生长速率的这种降低。在另一个具体的实施方式中,当异源多肽或天然多肽包括信号序列(并因此分泌/排出)时,观察到对照酵母宿主细胞的生长速率的这种降低。
在一些实施方式中,异源多肽或天然多肽是酶,其可以不受限制地为水解酶(E.C.3.1)。水解酶不受限制地包括α-乙酰乳酸脱羧酶、氨肽酶、淀粉酶(包括α-淀粉酶)、麦芽糖α-淀粉酶、门冬酰胺酶、菠萝蛋白酶、羧肽酶、催化酶、纤维素酶、凝乳酶(chymosin)(包括凝乳酶A和B)、源自刺菜蓟的天冬氨酸肽酶(cyprosin)、无花果蛋白酶、葡糖淀粉酶(也称为淀粉葡萄糖苷酶或麦芽糖酶)、葡聚糖酶、葡萄糖氧化酶、葡糖异构酶、半纤维素酶、己糖氧化酶、菊粉酶、转化酶、乳糖酶、脂肪酶(包括磷脂酶)、脂肪氧合酶、溶菌酶、甘露聚糖酶、凝乳酵素(milk coagulating enzyme,凝乳酶)、胰酶、木瓜蛋白酶、果胶酶、戊聚糖酶、胃蛋白酶、磷脂酶、过氧化物酶、蛋白酶、支链淀粉酶、粗制凝乳酶(rennet)(包括牛粗制凝乳酶)、转谷氨酰胺酶、胰蛋白酶、尿酶、酯酶(包括伏马菌素酯酶)和/或木聚糖酶。在一个实施方式中,异源多肽或天然肽不受限制地包括分解淀粉酶(包括,例如,麦芽糖α-淀粉酶、葡糖淀粉酶、α-淀粉酶和真菌淀粉酶)、纤维素酶/半纤维素酶、氧化酶(包括,例如,葡萄糖氧化酶)、天冬酰胺酶和脂肪酶。在另一个实施方式中,异源多肽或天然多肽可以不受限制地为肌醇六磷酸酶、β-葡聚糖酶、木聚糖酶、α-半乳糖苷酶、蛋白酶、淀粉酶、脂肪酶(包括磷脂酶)、甘露聚糖酶、纤维素酶和/或半纤维素酶果胶酶。
在本公开的一些实施方式中,异源或天然多肽是具有脂肪酶活性的多肽。脂肪酶(EC 3.1.1.3)是能够水解脂质的酶类。在一个实施方式中,异源或天然多肽是具有磷脂酶活性的多肽。磷脂酶(EC 3.1.1.4、EC 3.1.1.5、EC 3.1.1.32、EC 3.1.4.3和EC 3.1.4.4)是将磷脂水解成脂肪酸及其它亲脂性物质的酶。脂肪酶和磷脂酶是羧酸酯(就EC 3.1.1来说)或磷二酯(就EC 3.1.4来说)水解酶家族的一部分。在一个实施方式中,具有脂肪酶活性的多肽可以是来自疏棉状嗜热丝孢菌(Thermomyces lanuginosis)的三酰基甘油酯酶、来自尖孢镰刀菌(Fusarium oxysporum)的磷脂酶(在一些实施方式中,其可以具有SEQ ID NO:1或4的氨基酸序列,是SEQ ID NO:1或4的氨基酸序列的变体或者是SEQ ID NO:1或4的氨基酸序列的片段)、来自野猪(Sus scrofa)的磷脂酶A2、来自紫红链霉菌(Streptomycesvialaceoruber)的磷脂酶A2和/或来自米曲霉(Aspergillus oryzea)的磷脂酶A2。已在US20200087672和WO2018/167670中描述了具有脂肪酶活性的多肽的实施方式,两者均以其全部内容并入本文。
在本公开的一些实施方式中,具有磷脂酶活性的多肽可以具有SEQ ID NO:1或4的氨基酸序列,或者通过编码SEQ ID NO:1或4的氨基酸序列的核酸序列(如简并序列)编码。在一些实施方式中,具有磷脂酶活性的多肽包括SEQ ID NO:1或4的磷脂酶多肽的变体和片段(在本文中也称为磷脂酶变体和片段)。磷脂酶变体和片段具有磷脂酶活性。可以通过如本领域中已知的多种技术,例如,通过如实施例中所述使用Ped-A1作为底物测量磷脂酶活性。
在本公开的一些实施方式中,异源或天然多肽是具有酯酶活性的多肽。酯酶能够将酯水解成酸和醇。酯酶不受限制地包括乙酰酯酶(E.C.3.1.1.6)、果胶酯酶(E.C.3.1.1.11)、伏马菌素(B1)酯酶(E.C.3.1.1.87)、硫酯水解酶(E.C.3.1.2,其包括硫酯酶)、磷酸单酯水解酶(E.C.3.1.1)、磷酸二酯水解酶(E.C.3.1.4)、三磷酸单酯水解酶(3.1.5)、硫酸酯酶(E.C.3.1.6)、二磷酸单酯水解酶(E.C.3.1.7)、磷酸三酯水解酶(E.C.3.1.8)、核酸外切酶(E.C.3.1.11,3.1.13,3.1.14和3.1.15)以及核酸内切酶。在一个实施方式中,异源或天然多肽是具有伏马菌素酯酶活性的多肽。伏马菌素酯酶催化伏马菌素B1和水以水解为氨基五醇以及丙烷-1,2,3-三羧酸酯。在一个实施方式中,具有伏马菌素酯酶活性的多肽可以来自鞘氨醇盒菌(Sphingopyxis sp.)、外瓶霉(Exophiala sp.)(例如,棘状外瓶霉(Exophiala spinifera))或者来自细菌ATCC 55552。在一些实施方式中,具有伏马菌素酯酶活性的多肽可以具有SEQ ID NO:21的氨基酸序列,是具有伏马菌素酯酶活性的SEQ ID NO:21的氨基酸序列的变体,或者是具有伏马菌素酯酶活性的SEQ ID NO:21的氨基酸序列的片段)。已在美国专利序列号6025188中描述了具有伏马菌素酯酶的多肽的实施方式,其以其全部内容涵盖在本文中。
在本公开的一些实施方式中,具有伏马菌素酯酶活性的多肽可以具有SEQ ID NO:21的氨基酸序列,或者通过编码SEQ ID NO:21的氨基酸序列的核酸序列(包括简并序列)编码。在一些实施方式中,具有伏马菌素酯酶活性的多肽包括SEQ ID NO:21的伏马菌素酯酶多肽的变体和片段(在本文中也称为伏马菌素酯酶变体和片段)。伏马菌素酯酶变体和片段具有伏马菌素酯酶活性。可以通过本领域技术人员,例如,通过测量从伏马菌素释放的丙三羧酸(例如,TCA测定)确定伏马菌素酯酶活性。
在本公开的一些实施方式中,异源或天然多肽是具有α-淀粉酶活性的多肽。α-淀粉酶在含有三个或更多(1→4)-α-连接的D-葡萄糖单元的多糖中显示出(1→4)-α-D-糖苷键的内切水解活性。α-淀粉酶(E.C.3.2.1.1)是糖苷酶(E.C.3.2.1)的亚家族。在一个实施方式中,具有α-淀粉酶活性的多肽可以来自古细菌,诸如,例如来自热球菌(Thermococcussp.),或者在具体的实施方式中,来自热水高温球菌(Thermococcus hydrothermalis)。在一些实施方式中,具有α-淀粉酶活性的多肽可以具有SEQ ID NO:21的氨基酸序列,是具有α-淀粉酶活性的SEQ ID NO:23的氨基酸序列的变体,或者是具有α-淀粉酶活性的SEQ IDNO:23的氨基酸序列的片段)。
在本公开的一些实施方式中,具有α-淀粉酶活性的多肽可以具有SEQ ID NO:23的氨基酸序列,或者通过编码SEQ ID NO:23的氨基酸序列的核酸序列(包括简并序列)编码。在一些实施方式中,具有α-淀粉酶活性的多肽包括SEQ ID NO:23的α-淀粉酶多肽的变体和片段(在本文中也称为α-淀粉酶变体和片段)。α-淀粉酶变体和片段具有α-淀粉酶活性。本领域技术人员可以容易地确定α-淀粉酶活性。在一些实施方式中,可以使用实施例中所描述的CeralphaTM测定确定α-淀粉酶活性。
异源或天然多肽可以是具有氧化酶活性的多肽。如本文所使用的,表述“氧化酶”是指能够催化氧化还原反应的酶类。氧化酶可以是氧化还原酶,如己糖氧化酶(包括葡萄糖氧化酶)。在一个实施方式中,氧化酶是来自黑曲霉(Aspergillus niger)的葡萄糖氧化酶。已在US20200087672和WO2018/167670中描述了具有氧化酶活性的多肽的实施方式,两者均以其全部内容并入本文。
如本文所使用的,表述“淀粉分解酶”是指能够水解淀粉或水解的淀粉的酶类。淀粉分解酶包括但不限于α-淀粉酶(EC 3.2.1.1,有时被称为真菌α-淀粉酶以及细菌α-淀粉酶,参见下文)、麦芽糖淀粉酶(EC 3.2.1.133)、葡糖淀粉酶(EC 3.2.1.3)、葡聚糖1,4-α-麦芽四糖水解酶(EC 3.2.1.60)、普鲁蓝酶(EC 3.2.1.41)、异淀粉酶(EC 3.2.1.68)和麦芽糖转葡糖基酶(EC 2.4.1.25)。在一个实施方式中,一种或多种淀粉分解酶可以是来自米曲霉(Aspergillus oryzae)的α-淀粉酶、来自嗜热脂肪地芽孢杆菌(Geobacillusstearothermophilus)的麦芽糖α-淀粉酶、来自扣囊复膜孢酵母(Saccharomycopsisfibuligera)的葡糖淀粉酶,来自嗜糖假单胞菌(Pseudomonas saccharophila)的葡聚糖1,4-α-麦芽四糖水解酶、来自长野芽孢杆菌(Bacillus naganoensis)的普鲁蓝酶、来自嗜酸普鲁兰芽孢杆菌(Bacillus acidopullulyticus)的普鲁蓝酶、来自淀粉皮假单胞菌(Pseudomonas amyloderamosa)的异淀粉酶和/或来自嗜热栖热菌(Thermusthermophilus)的麦芽糖转葡糖基酶。已在WO 2017/037614、WO 2018/002360、WO 2019/186371、US20200087672和WO2018/167670中描述了具有淀粉分解活性的多肽的实施方式,它们均以其全部内容并入本文。
如本文所使用的,表述“纤维素酶/半纤维素酶”是指能够水解纤维素、半纤维素或戊聚糖的酶类。纤维素酶/半纤维素酶包括但不限于纤维素酶(E.C.3.2.1.4)和内切B(1,4)D-木聚糖酶(E.C.3.2.1.8)。在一个实施方式中,一种或多种纤维素酶/半纤维素酶可以是来自绳状青霉(Penicillium funiculosum)的纤维素酶和/或来自埃默森罗萨氏菌(Rasamsonia emersonii)的内切B(1,4)D-木聚糖酶。已在US20200087672和WO2018/167670中描述了具有纤维素酶/半纤维素酶活性的多肽的实施方式,两者均以其全部内容并入本文。
如本文所使用的,表述“门冬酰胺酶”是指能够催化天门冬酰胺向门冬氨酸和铵转化的酶类。已在US20200087672和WO2018/167670中描述了具有门冬酰胺酶活性的多肽的实施方式,两者均以其全部内容并入本文。
如在本公开中使用的,术语“麦芽糖淀粉酶”是指能够将淀粉或水解的淀粉水解成麦芽糖的多肽。麦芽糖淀粉酶包括但不限于真菌α-淀粉酶(例如,来源于曲霉(Aspergillussp.)(例如,黑曲霉(A.Niger)、河内曲霉(A.kawachi)和米曲霉(A.oryzae));木霉(Trichoderma sp.)(例如,里氏木霉(T.reesie))、根霉(Rhisopus sp.)、毛霉(Mucor sp.)和青霉(Penicillium sp.))、酸稳定的真菌淀粉酶(例如,来源于黑曲霉(Aspergillusniger))、β-淀粉酶(例如,来源于植物(小麦、大麦、黑麦、高粱、大豆、甘薯、大米)和微生物(蜡样芽孢杆菌(Bacillus cereus)、多粘芽胞杆菌(Bacillus polymixa)、巨大芽孢杆菌(Bacillus megaterium)、拟南芥(Arabidopsis thaliana))、麦芽糖淀粉酶(E.C.3.2.1.133)(例如,来源于微生物,如枯草芽孢杆菌(Bacillus subtilis)、嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)、嗜热嗜碱芽孢杆菌(Bacillusthermoalkalophilus)、加氏乳杆菌(Lactobacillus gasseri)、栖热菌(Thermus sp.))。在具体的实施方式中,本公开的重组酵母宿主细胞包括编码来源于嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)的异源麦芽糖淀粉酶的异源核酸分子。已在US20200087672和WO2018/167670中描述了具有麦芽糖淀粉酶活性的多肽的实施方式,两者均以其全部内容并入本文。
如本文所使用的,表述“磷酸酶”是指在存在水的情况下,能够催化磷酸单酯裂解成磷酸根离子和醇的多肽。磷酸酶的一个实施方式是肌醇六磷酸酶,它是具有酶活性并且能够催化植酸(肌醇六磷酸)水解成无机磷的蛋白。存在四种不同种类的肌醇六磷酸酶:组氨酸磷酸酶(HAPS)、β-螺旋桨型植酸酶、紫色酸性磷酸酶和蛋白酪氨酸磷酸酶-样植酸酶(PTP-样植酸酶)。植酸具有六个磷酸酯基,其可以通过植酸酶以不同速率和以不同顺序释放。植酸酶以逐步方式水解来自植酸的磷酸酯,从而获得再次成为用于进一步水解的底物的产物。已基于水解的植酸的第一磷酸酯位置将植酸酶分组为:3-肌醇六磷酸酶(EC3.1.3.8)、4-肌醇六磷酸酶(EC3.1.3.26)和5-肌醇六磷酸酶(EC 3.1.3.72)。在一个实施方式中,肌醇六磷酸酶来源于细菌物种,诸如,例如柠檬酸细菌(Citrobacter sp.)或埃希氏菌(Escherichia sp.)。在具体的实施方式中,异源肌醇六磷酸酶来源于柠檬酸细菌,诸如,例如布氏柠檬酸杆菌(Citrobacter braakii)。在另一个实施方式中,异源肌醇六磷酸酶来源于埃希氏菌,诸如,例如大肠杆菌(Escherichia coli)。已在US20200087672和WO2018/167670中描述了具有磷酸酶活性的多肽的实施方式,两者均以其全部内容并入本文。
当与异源或天然多肽的氨基酸序列相比时,变体包含至少一个氨基酸差异(取代或添加)。变体的确显示出异源或天然多肽的一种或多种生物活性。在一个实施方式中,变体多肽显示出野生型多肽生物活性的至少50%、60%、70%、80%、90%、95%、96%、97%、98%或99%。变体还与野生型多肽的氨基酸序列具有至少70%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。如本领域中已知的,术语“同一性百分比”是如通过比较序列所确定的两条或更多条多肽序列之间的关系。通常,可以使用已知的计算机程序确定同一性水平。可以通过已知方法容易地计算同一性,所述方法包括但不限于以下中描述的那些:Computational Molecular Biology(Lesk A.M.主编)Oxford University Press,NY(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.主编)AcademicPress,NY(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.,和Griffin,H.G.主编)Humana Press,NJ(1994);Sequence Analysis in Molecular Biology(von Heinje,G.主编)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.,主编)Stockton Press,NY(1991)。设计确定同一性的优选方法以提供所测试序列之间的最佳匹配。在公开可用的计算机程序中编码了确定同一性和相似性的方法。使用LASERGENE bioinformatics computing套装的Megalign程序(DNASTAR Inc.,Madison,Wis.)进行序列比对和同一性百分比计算。使用缺省参数(空位罚分=10,空位长度罚分=10),使用Clustal比对法(Higgins and Sharp(1989)CABIOS.5:151-153)实施本文所公开的多序列比对。使用Clustal法的成对比对的缺省参数是KTUPLB 1、空位罚分=3、窗口=5和存储的对角线(DIAGONALS SAVED)=5。
本文所描述的变体可以是(i)其中一个或多个氨基酸残基被保守或非保守氨基酸残基(优选保守氨基酸残基)替换并且这种替换的氨基酸残基可以或可以不是遗传密码所编码的氨基酸残基的变体,或者(ii)其中一个或多个氨基酸残基包括替换基团的变体,或者(iii)其中成熟多肽与另一种化合物,如提高多肽半衰期的化合物(例如,聚乙二醇)融合的变体,或者(iv)其中另外的氨基酸融合至成熟多肽以用于所述多肽的纯化的变体。保守替换通常包括一种氨基酸被具有类似特征的另一种氨基酸替换,例如,以下组内的替换:缬氨酸、甘氨酸;甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;门冬氨酸、谷氨酸;天门冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;赖氨酸、精氨酸;和苯丙氨酸、酪氨酸。其它保守氨基酸替换在本领域中是已知的并且包括在本文中。非保守替换,如疏水性氨基酸对碱性氨基酸的替换也是本领域熟知的。
变体还可以是保守变体或等位变体。如本文所使用的,保守变体是指不会不利地影响多肽的生物学功能的氨基酸序列中的改变。据称当改变的序列防止或破坏与野生型多肽相关联的生物学功能时,替换、插入或缺失不利地影响蛋白。例如,可以改变蛋白的整体电荷、结构或疏水性-亲水性性质但不会不利地影响生物活性。因此,可以改变氨基酸序列例如以使所述肽更疏水或亲水,但不会不利地影响磷脂酶的生物活性。
在本公开的一些实施方式中,多肽可以是异源或天然多肽的片段或者来自本文所描述的变体的片段。与野生型多肽或变体的氨基酸序列相比时,片段包含至少少一个氨基酸残基,并且仍具有全长多肽的生物活性。在一个实施方式中,所述片段显示出全长多肽或其变体的生物活性的至少50%、60%、70%、80%、90%、95%、96%、97%、98%或99%。所述片段还可以在其整个长度上与所述多肽或其变体的氨基酸序列具有至少70%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。所述片段可以是例如在磷脂酶多肽或变体的氨基末端、羧基末端或两端的一个或多个氨基酸残基的截短。可替代地或组合地,可以通过除去一个或多个内部氨基酸残基产生所述片段。在一个实施方式中,所述片段具有至少100、150、200、250、300、350、400、450、500或更多个所述多肽或变体的连续氨基酸。
根据本公开,在重组酵母宿主细胞中表达的异源多肽或者在重组酵母宿主细胞中过表达的天然多肽旨在被分泌/排出。因此,它与信号序列胞内相关联。如本文所使用的,“与信号序列相关联的”多肽是指与信号序列一起转录和翻译的多肽,并且当在分泌途径中加工所述多肽时,随后切割信号序列。在一些实施方式中,异源核酸分子包括信号序列之一或组合的编码序列,从而允许将异源多肽或天然多肽排出到酵母宿主细胞壁外部。可以将信号序列简单地添加至异源核酸分子(通常在具有编码异源或天然多肽的序列的框中)或者替换已存在于异源或天然多肽中的信号序列。信号序列对于编码异源或天然多肽的核酸序列可以是天然或异源的。在一些实施方式中,可以使用一个或多个信号序列。
在一个实施方式中,信号序列是异源信号序列,诸如,例如异源信号序列来自转化酶蛋白、AGA2蛋白或真菌淀粉酶。在一个实施方式中,异源信号肽来自转化酶蛋白。在仍另一个实施方式中,异源信号序列来自AGA2蛋白。在仍另一个实施方式中,异源信号序列来自真菌淀粉酶。在一些实施方式中,信号序列可以来自SUC2基因并且具有例如氨基酸序列MLLQAFLFLLAGFAAKISA(SEQ ID NO:5),是其变体或是其片段。在一些实施方式中,信号序列可以来自PDI1基因并且具有例如氨基酸序列MKFSAGAVLSWSSLLLASSVFAQQEAVA(SEQ ID NO:6),是其变体或是其片段。在一些实施方式中,信号序列可以来自编码M1杀伤蛋白的基因并且具有例如氨基酸序列MTKPTQVLVRSVSILFFITLLHLVVA(SEQ ID NO:7),是其变体或是其片段。在一些实施方式中,信号序列可以来自编码α-接合因子的基因并且具有例如氨基酸序列MRFPSIFTAVLFAASSALA(SEQ ID NO:8),是其变体或是其片段。在一些实施方式中,信号序列可以是来自OST1基因和α-接合因子信号序列的杂交体,并且具有例如氨基酸序列MRQVWFSWIVGLFLCFFNVSSAAPVNTTTEDETAQIPAEAVIGYSDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVSLEKREAEA(SEQ ID NO:2),是其变体或是其片段。在一些实施方式中,信号序列可以来自磷脂酶基因并且具有例如氨基酸序列MLLLPLLSAITLAVA(SEQ ID NO:3),是其变体或是其片段。在一些实施方式中,信号序列可以来自磷脂酶基因并且具有例如氨基酸序列MLLLPLLSAITLAVASPVALDDYVNSLEER(SEQ ID NO:9),是其变体或是其片段。在仍另一个实施方式中,信号序列可以来自α-接合因子基因并且可以具有例如氨基酸序列MRFPSIFTAVLFAASSALA(SEQ ID NO:23),是其变体或是其片段。已在US20200087672和WO2018/167670中描述了信号序列的实施方式,两者均以其全部内容并入本文。
在优选的实施方式中,将异源或天然多肽表达以从细胞中分泌出来至细胞间隙。将异源或天然多肽沿重组酵母宿主细胞的分泌途径输送并以游离形式(未与宿主细胞表面相关联)分泌到细胞外间隙或培养基中。
在其它实施方式中,异源或天然多肽与重组酵母宿主细胞“细胞关联的(cell-associated)”,因为它被设计以表达、排出并与重组酵母宿主细胞保持物理相关联。在一个实施方式中,可以分泌异源或天然多肽,但是如果是这样,它必须保持与重组酵母宿主细胞物理相关联。在一个实施方式中,异源或天然多肽的至少一个部分(通常至少一个末端)共价、非共价和/或静电结合至例如细胞壁(并且在一些实施方式中,结合至细胞质膜)。例如,可以修饰异源或天然多肽以带有一个或多个跨膜结构域,以具有一个或多个脂质修饰(豆蔻酰化、棕榈酰化、法尼基化和/或异戊烯化),以与一个或多个膜相关联蛋白相互作用和/或以与细胞脂筏相互作用。尽管异源或天然多肽可以不直接结合至细胞膜或细胞壁(例如,如当经由拴系部分(tethering moiety,系链部分)发生结合时),但是根据本公开,所述蛋白仍然被认为是“细胞关联的”异源多肽或天然多肽。
在一些实施方式中,可以表达异源或天然多肽以位于并关联至重组酵母宿主细胞的细胞壁或细胞膜。在一些实施方式中,表达、排出和输送异源多肽或天然多肽以定位至或关联至宿主细胞的细胞壁或细胞膜的外表面。重组酵母宿主细胞均具有限定胞内(例如,向内面向核)和胞外(例如,向外)环境的细胞壁(其包括细胞质膜)。异源或天然多肽可以位于(并且在一些实施方式中,物理关联至)重组酵母宿主细胞壁的外表面,并且在进一步的实施方式中,至重组酵母宿主细胞质膜的外表面。在本公开的上下文中,表述“关联至重组酵母宿主细胞的细胞壁/细胞质膜的外表面”是指异源或天然多肽在重组酵母宿主细胞的细胞壁中(并且在一些实施方式中,在细胞质膜中)至少部分物理整合(以共价或非共价方式)的能力。物理整合可以归因于例如异源或天然多肽上跨膜结构域、能够与异源多肽或天然多肽上细胞质膜蛋白相互作用的结构域、对异源酶或天然多肽进行的翻译后修饰(例如,脂化)等的存在。
一些异源或天然多肽具有定位在并关联至重组酵母宿主细胞的细胞壁(例如,细胞关联)的固有能力。
在一些实施方式中,通过将提供或提高与重组酵母宿主细胞的细胞壁的连接的其与拴系氨基酸部分组合,作为嵌合构建体提供异源多肽。在这些实施方式中,嵌合或天然多肽将被认为是“拴系的”。优选地,嵌合蛋白的氨基酸拴系部分相对于异源或天然多肽的生物学(酶促)活性是中性的,例如,不防碍异源或天然多肽的生物学(酶促)活性。在一些实施方式中,氨基酸拴系部分与异源或天然多肽的相关联可以提高异源或天然多肽的生物学(酶促)活性和/或稳定性(当与非拴系、非嵌合形式相比时)。
在一个实施方式中,拴系部分可以用于与异源或天然多肽一起表达以将所述多肽定位至重组酵母宿主细胞的壁。多种拴系氨基酸部分是已知技术并且可以用于本公开的嵌合蛋白。
拴系部分可以是基于另一种蛋白的跨膜结构域并且允许嵌合蛋白具有跨膜结构域。在这种实施方式中,拴系部分可以来源于FLO1蛋白。已在US20200087672和WO2018/167670中描述了拴系部分以及它们的变体和片段的实施方式,两者均以其全部内容并入本文。
在仍另一个实例中,可以翻译后修饰氨基酸拴系部分以包括糖基磷脂酰肌醇(GPI)锚点并允许嵌合蛋白具有GPI锚点。GPI锚点是连接至蛋白末端(并且在一些实施方式中,至蛋白的羧基末端)的糖脂,其允许蛋白锚定至细胞膜的细胞质膜。能够提供GPI锚点的拴系氨基酸部分包括但不限于与以下蛋白相关联/来源于以下蛋白的那些:SED1蛋白、TIR1蛋白、CWP2蛋白、CCW12蛋白、SPI1蛋白、PST1蛋白或者AGA1和AGA2蛋白的组合。在一个实施方式中,拴系部分提供GPI锚点,并且在仍进一步的实施方式中,拴系部分来源于SPI1蛋白或CCW12蛋白。在其中拴系部分来源于CCW12蛋白的实施方式中,它可以具有例如SEQ IDNO:26的氨基酸序列,是其变体或其片段。已在US20200087672和WO2018/167670中描述了能够提供GPI锚点的拴系氨基酸部分的实施方式,两者均以其全部内容并入本文。
拴系氨基酸部分可以是已知/天然拴系氨基酸部分的变体。当与天然拴系氨基酸部分的氨基酸序列相比时,变体包含至少一个氨基酸差异。如本文所使用的,变体是指不会不利地影响拴系氨基酸部分的生物学功能的氨基酸序列中的改变(例如,外表面上的位置和细胞质膜中异源多肽或天然多肽的锚定)。当改变的序列防止或破坏与拴系氨基酸部分相关联的生物学功能(例如,外表面上的位置和细胞质膜中异源多肽或天然多肽的锚定)时,据称替换、插入或缺失不利地影响蛋白。例如,可以改变蛋白的整体电荷、结构或疏水性-亲水性性质但不会不利地影响生物活性。因此,可以改变氨基酸序列例如以使拴系部分更疏水或亲水,但不会不利地影响拴系氨基酸部分的生物活性。拴系氨基酸部分变体与本文所描述的拴系氨基酸部分具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。如本领域中已知的,术语“同一性百分比”是如通过比较序列所确定的两条或更多条多肽序列或者两条或更多条多核苷酸序列之间的关系。通常,可以使用已知的计算机程序确定同一性水平。可以通过已知方法容易地计算同一性,所述方法包括但不限于以下中描述的那些:Computational Molecular Biology(Lesk A.M.,主编)Oxford University Press,NY(1988);Biocomputing:Informatics and GenomeProjects(Smith,D.W.,主编)Academic Press,NY(1993);Computer Analysis ofSequence Data,Part I(Griffin,A.M.,和Griffin,H.G.,主编)Humana Press,NJ(1994);Sequence Analysis in Molecular Biology(von Heinje,G.,主编)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.,主编)StocktonPress,NY(1991)。设计确定同一性的优选方法以提供所测试序列之间的最佳匹配。在公开可用的计算机程序中编码了确定同一性和相似性的方法。可以使用LASERGENEbioinformatics computing套装的Megalign程序(DNASTAR Inc.,Madison,Wis.)进行序列比对和同一性百分比计算。使用缺省参数(空位罚分=10,空位长度罚分=10),使用Clustal比对法(Higgins and Sharp(1989)CABIOS.5:151-153)实施本文所公开的多序列比对。使用Clustal法的成对比对的缺省参数是KTUPLB 1、空位罚分=3、窗口=5和存储的对角线(DIAGONALS SAVED)=5。
本文所描述的变体拴系氨基酸部分可以是(i)其中一个或多个氨基酸残基被保守或非保守氨基酸残基(优选保守氨基酸残基)替换并且这种替换的氨基酸残基可以或可以不是遗传密码所编码的氨基酸残基的变体,或者(ii)其中一个或多个氨基酸残基包括替换基团的变体,或者(iii)其中成熟多肽与另一种化合物,如提高多肽半衰期的化合物(例如,聚乙二醇)融合的变体,或者(iv)其中另外的氨基酸融合至成熟多肽以用于所述多肽的纯化的变体。拴系氨基酸部分的“变体”可以是保守变体或等位变体。
拴系氨基酸部分可以是已知/天然拴系氨基酸部分的片段或者已知/天然拴系氨基酸部分的变体的片段。拴系氨基酸部分“片段”具有至少10、20、30、40、50、60、70、80、90、100或更多个拴系氨基酸部分的连续氨基酸。当与已知/天然拴系氨基酸部分的氨基酸序列相比时,片段包含至少少一个氨基酸残基并且仍具有全长拴系氨基酸部分的生物活性(例如,向细胞壁的定位)。
在其中期望氨基酸拴系部分的实施方式中,可以作为通过重组酵母宿主细胞表达并且具有以下式之一(从氨基(NH2)至羧基(COOH)取向提供)的嵌合蛋白提供异源或天然多肽:
(NH2)SS-TT-L-PP(COOH) (I)
(NH2)SS-PP-L-TT(COOH) (II)
其中:
PP是异源或天然多肽;
L是存在或不存在的并且是氨基酸接头;
TT是存在或不存在的并且是用于将多肽关联至重组酵母宿主细胞的细胞壁或细胞膜的氨基酸拴系部分;
SS是信号序列部分;
(NH2)表示异源多肽的氨基末端;
(COOH)表示异源多肽的羧基末端;且
“-”是酰胺键。
当氨基酸接头(L)不存在时,拴系氨基酸部分直接与异源多肽相关联。在式(I)的嵌合体中,这表示信号序列部分的羧基末端直接关联至拴系氨基酸部分的氨基末端,并且拴系氨基酸部分的羧基末端(在不存在接头的情况下直接,或者在存在接头的情况下间接)关联至异源多肽的氨基末端。在一些实施方式中,这表示信号序列部分的羧基末端直接关联至拴系部分的氨基末端,并且拴系部分的羧基末端直接关联至异源/天然多肽的氨基末端。在式(II)的嵌合体中,这表示信号序列部分的羧基末端直接关联至异源/天然多肽的氨基末端,并且异源/天然多肽的羧基末端(在不存在接头的情况下直接,并且在存在接头的情况下间接)关联至拴系部分的氨基末端。在一些实施方式中,这表示信号序列部分的羧基末端直接关联至异源/天然多肽的氨基末端,并且异源/天然多肽的羧基末端直接关联至拴系氨基酸部分的氨基末端。
在一些实施方式中,氨基酸接头(L)的存在是所期望的,例如:在异源多肽部分和拴系氨基酸部分之间提供一些柔性或所期望的柔性水平;在异源多肽部分和拴系氨基酸部分之间提供刚性;促进构建异源核酸分子;提供异源多肽部分更好的溶解度;提供异源多肽部分更高的表达;促进多肽部分折叠;改善异源多肽部分的生物活性;和/或引入从细胞释放异源多肽部分的切割位点。如在本公开中使用的,“氨基酸接头”或“L”是指将异源多肽PP和氨基酸拴系部分TT分开的一个或多个氨基酸的延伸(例如,将异源多肽或天然多肽间接连接至氨基酸拴系部分TT)。优选地,氨基酸接头是中性的,例如,不防碍异源多肽或天然多肽的生物(酶促)活性,也不防碍氨基酸拴系部分的生物(细胞相关)活性。在一些实施方式中,氨基酸接头L可以提高异源多肽或天然多肽部分和/或氨基酸拴系部分的生物活性。
存在多种氨基酸接头并且它们不受限制地包括(G)n;(GS)n;(GGS)n;(GGGS)n;(GGGGS)n;(GGSG)n;(GSAT)n,其中n=1至8之间(或更大)的整数。在一个实施方式中,氨基酸接头L是(GGGGS)n(也称为G4S),并且在仍进一步的实施方式中,氨基酸接头L包括多于一个G4S基序(SEQ ID NO:10)。例如,氨基酸接头L可以是(G4S)3并且具有SEQ ID NO:11的氨基酸序列。在另一个实例中,氨基酸接头L可以是(G)8并且具有SEQ ID NO:12的氨基酸序列。在仍另一个实例中,氨基酸接头L可以是(G4S)8并且具有SEQ ID NO:13的氨基酸序列。在一些实施方式中,氨基酸接头还可以是GSAGSAAGSGEF(SEQ ID NO:14)。
存在另外的氨基酸接头并且它们不受限制地包括(EAAK)n和(EAAAK)n,其中n=1至8之间(或更大)的整数。在一些实施方式中,可以通过一个或多个另外的氨基酸残基将一个或多个(EAAK)n/(EAAAK)n基序分开。在一个实施方式中,氨基酸接头包括一个或多个EA2K(SEQ ID NO:15)或者EA3K(SEQ ID NO:16)基序。在一个实施方式中,氨基酸接头可以是(EAAK)3并且具有SEQ ID NO:17的氨基酸序列。在另一个实施方式中,氨基酸接头可以是(A(EAAAK)4ALEA(EAAAK)4A)并且具有SEQ ID NO:18的氨基酸序列。在仍另一个实施方式中,氨基酸接头可以具有SEQ ID NO:25的氨基酸序列。
进一步的氨基酸接头包括具有一个或多个(AP)n基序的那些,其中n=1至10之间(或更大)的整数。在一个实施方式中,接头是(AP)10并且具有SEQ ID NO:19的氨基酸。在一些实施方式中,接头还包括一个或多个HA标签(SEQ ID NO:20)。
已在US20200087672和WO2018/167670中描述了氨基酸接头的实施方式,两者均以其全部内容并入本文。
第二基因修饰
本公开的重组酵母宿主细胞还包括第二基因修饰。第二基因修饰的目的在于提高表达异源多肽或过表达天然多肽的重组酵母的生长速率(当例如与对照酵母宿主细胞相比时)。第二基因修饰的存在至少部分恢复了当与亲代酵母宿主细胞相比时重组酵母宿主细胞的生长速率。通过引入第二基因修饰,重组酵母宿主细胞显示出当与对照酵母宿主细胞的生长速率(在类似条件下确定)相比时,生长速率至少100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、200%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少100%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少105%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少110%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少115%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少120%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少125%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少130%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少135%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少140%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少145%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少150%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少155%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少160%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少165%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少170%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少175%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少180%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少185%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少190%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少195%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少200%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少205%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少210%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少215%或更大的升高。在一个实施方式中,当与对照酵母宿主细胞的生长速率相比时,重组酵母宿主细胞显示出生长速率至少220%或更大的升高。在一些实施方式中,重组酵母宿主细胞显示出生长速率恢复至与亲代酵母宿主细胞的生长速率类似的水平。在其它实施方式中,重组酵母宿主细胞显示出相对于亲代酵母宿主细胞生长速率的生长速率的部分恢复。当比较表达异源多肽或天然多肽(在存在或不存在信号序列的情况下)但缺少第二基因修饰的对照酵母宿主细胞的生长速率时,观察到这种生长速率的升高。在一个实施方式中,当比较与信号序列一起表达第一基因修饰(例如,第一基因修饰)的对照酵母宿主细胞的生长速率时,观察到这种生长速率的升高。
在一些实施方式中,第二基因修饰改善或增强异源多肽或天然多肽的分泌和/或运输,借此限制异源多肽或天然多肽的表达对重组酵母宿主细胞的生长速率的影响。本公开的重组酵母宿主细胞可以包括一个或多个第二基因修饰。第二基因修饰调节一种或多种具体基因(其可以是天然或异源的)的表达。第二基因修饰可以引起天然或异源基因的表达(例如,过表达)的升高。第二修饰可以引起天然基因表达(并且在一些实施方式中,失活)的减少。
在一些实施方式中,第二基因修饰有利于异源多肽或过表达的天然多肽的分泌。蛋白的分泌包括从翻译至翻译后修饰至运输等的多个步骤。在一些实施方式中,第二基因修饰可以在以下途径中的一种或多种中包括修饰:翻译途径、翻译后修饰途径、蛋白运输途径、液泡途径或细胞壁稳定性途径。在一些实施方式中,第二基因修饰可以包括蛋白分泌和运输途径。如本公开的上下文中所使用的,“翻译途径”是指参与信使RNA(mRNA)分子向蛋白的翻译的基因和蛋白。将有利于mRNA分子向蛋白的翻译的翻译途径中的基因修饰将被认为是本公开的第二基因修饰。将限制mRNA分子向蛋白的翻译的抑制剂的生物活性的翻译途径中的基因修饰将被认为是本公开的第二基因修饰。“翻译后途径”是指参与蛋白的二级、三级或四级结构的修饰的基因和蛋白。这些修饰不受限制地包括新翻译的蛋白的折叠和/或糖基化。翻译后途径的事件通常发生在内质网(ER)并且因此第二基因修饰可以靶向在ER中表达的蛋白。将有利于新翻译的蛋白的适当修饰的基因修饰将被认为是本公开的第二基因修饰。将限制新翻译的蛋白的翻译后修饰的抑制剂的生物活性的基因修饰将被认为是本公开的第二基因修饰。“蛋白运输途径”是指参与蛋白在ER、高尔基系统和膜之间的运输的基因和蛋白。将有利于蛋白从ER到高尔基系统或者从高尔基系统到膜的运输的基因修饰将被认为是本公开的第二基因修饰。将限制蛋白从膜到高尔基系统或者从高尔基系统到ER的逆行运输的基因修饰将被认为是根据本公开的第二基因修饰。“液泡途径”是指参与液泡形成和液泡降解的基因和蛋白。将限制液泡形成和/或液泡蛋白降解的基因修饰将被认为是本公开的第二基因修饰。将有利于液泡形成和/或液泡蛋白降解的抑制剂的生物活性的基因修饰将被认为是本公开的第二基因修饰。“细胞壁稳定性途径”是指参与细胞壁完整性维持的基因和蛋白。将有利于细胞壁稳定性降低的基因修饰将被认为是根据本公开的第二基因修饰。
第二基因修饰可以包括在重组酵母宿主细胞中引入编码异源多肽的异源基因的一个或多个拷贝。可替代地或组合地,第二基因修饰可以包括引入不同启动子(在一些实施方式中,其可以包括用异源启动子替换天然启动子)用于控制天然基因、基因直系同源物(gene ortholog,直系同源基因)或基因旁系同源物(gene paralog,旁系同源基因)的一个或多个拷贝的表达。可替代地或组合地,第二基因修饰可以包括引入不同终止子(在一些实施方式中,其可以包括用异源终止子替换天然终止子)用于控制天然基因、基因直系同源物或基因旁系同源物的一个或多个拷贝的表达。可替代地或组合地,第二基因修饰可以包括使天然基因、基因直系同源物或基因旁系同源物的至少一个拷贝或所有拷贝失活。可以例如通过除去天然基因中的至少一个核苷酸残基来完成天然基因(包括其基因直系同源物和基因旁系同源物)的(部分或完全)失活。可以在其中存在天然基因的一个或多个基因座中完成第二基因修饰。在一个实施方式中,可以在其中存在天然基因的所有基因座中完成第二基因修饰。还可以例如通过修饰存在于天然基因中的一个或多个调控区来完成第二基因修饰。在一个实施方式中,还可以通过将异源基因的一个或多个拷贝(在一些实施方式中,其可以是重组酵母宿主细胞的天然基因的一个或多个另外的拷贝)与天然和/或异源调控元件(启动子和/或终止子)一起插入到染色体的任何基因座中来完成第二基因修饰。
在一个实施方式中,重组酵母宿主细胞在翻译途径中包含一个或多个第二基因修饰。第二基因修饰可以是位于编码核糖体蛋白的基因中。第二基因修饰可以引起编码核糖体蛋白的天然基因的表达的调节(升高或降低的表达)和/或可以引起编码核糖体蛋白的异源基因的表达。在具体的实施方式中,第二基因修饰可以引起天然BFR2基因(并且在一些实施方式中,带有酵母菌属(Saccharomyces)基因组数据库ID SGD:S000002707、其变体或其片段)、BFR2基因直系同源物或BFR2基因旁系同源物的表达和/或通过BFR2基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000002707、其变体或其片段)、BFR2基因直系同源物或BFR2基因旁系同源物编码的异源多肽的表达的调节。在另一个具体的实施方式中,第二基因修饰可以引起天然RPP0基因(并且在一些实施方式中,带有酵母菌属基因组数据库IDSGD:S000004332、其变体或其片段)、RPP0基因直系同源物或RPP0基因旁系同源物的表达和/或通过RPP0基因(并且在一些实施方式中,带有酵母菌属基因组数据库IDSGD:S000004332、其变体或其片段)、RPP0基因直系同源物或RPP0基因旁系同源物编码的异源多肽的表达的调节。第二基因修饰可以引起编码信号识别颗粒的亚基的天然基因的表达的调节和/或可以引起编码信号识别颗粒的亚基的异源基因的表达。在具体的实施方式中,第二基因修饰可以引起天然SRP14基因(并且在一些实施方式中,带有酵母菌属基因组数据库IDSGD:S000002250、其变体或其片段)、SRP14基因直系同源物或SRP14基因旁系同源物的表达和/或通过SRP14基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000002250、其变体或其片段)、SRP14基因直系同源物或SRP14基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SRP54基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000006292、其变体或其片段)、SRP54基因直系同源物或SRP54基因旁系同源物的表达和/或通过SRP54基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000006292、其变体或其片段)、SRP54基因直系同源物或SRP54基因旁系同源物编码的异源多肽的表达的调节。
第二基因修饰可以位于编码参与蛋白折叠的蛋白的基因中。第二基因修饰可以引起编码参与蛋白折叠的蛋白(诸如,例如伴侣复合物的组分,如ATP酶、分子伴侣或核交换因子)的天然基因的表达调节(升高或降低表达)和/或可以引起编码参与蛋白折叠的蛋白(诸如,例如伴侣复合物的组分,如ATP酶、分子伴侣或核交换因子)的异源基因的表达。在一些实施方式中,第二基因修饰可以引起编码参与蛋白折叠的蛋白(诸如,例如伴侣复合物的组分,如ATP酶、分子伴侣或核交换因子)的天然基因的表达升高和/或可以引起编码参与蛋白折叠的蛋白(诸如,例如伴侣复合物的组分,如ATP酶、分子伴侣或核交换因子)的异源基因的表达的升高。在具体的实施方式中,第二基因修饰可以引起天然KAR2基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000003571、其变体或其片段)、KAR2基因直系同源物或KAR2基因旁系同源物的表达和/或通过KAR2基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000003571、其变体或其片段)、KAR2基因直系同源物或KAR2基因旁系同源物编码的异源多肽的表达的调节(例如,在一些实施方式中,表达的升高)。在具体的实施方式中,第二基因修饰可以引起天然LHS1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000001556、其变体或其片段)、LHS1基因直系同源物或LHS1基因旁系同源物的表达和/或通过LHS1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001556、其变体或其片段)、LHS1基因直系同源物或LHS1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然JEM1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000003609、其变体或其片段)、JEM1基因直系同源物或JEM1基因旁系同源物的表达和/或通过JEM1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000003609、其变体或其片段)、JEM1基因直系同源物或JEM1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SSA1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000000004、其变体或其片段)、SSA1基因直系同源物或SSA1基因旁系同源物的表达和/或通过SSA1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000004、其变体或其片段)、SSA1基因直系同源物或SSA1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SSE1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000006027、其变体或其片段)、SSE1基因直系同源物或SSE1基因旁系同源物的表达和/或通过SSE1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000006027、其变体或其片段)、SSE1基因直系同源物或SSE1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SIL1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000005391、其变体或其片段)、SIL1基因直系同源物或SIL1基因旁系同源物的表达和/或通过SIL1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005391、其变体或其片段)、SIL1基因直系同源物或SIL1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SSA4基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000000905、其变体或其片段)、SSA4基因直系同源物或SSA4基因旁系同源物的表达和/或通过SSA4基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000905、其变体或其片段)、SSA4基因直系同源物或SSA4基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然HSF1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000003041、其变体或其片段)、HSF1基因直系同源物或HSF1基因旁系同源物的表达和/或通过HSF1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000003041、其变体或其片段)、HSF1基因直系同源物或HSF1基因旁系同源物编码的异源多肽的表达的调节。
第二基因修饰可以位于编码参与未折叠蛋白反应(UPR)的蛋白的基因中。第二基因修饰可以引起编码有利于UPR的转录因子或UPR组分的天然基因的表达的调节(提高或降低表达)和/或可以引起编码有利于UPR的蛋白或UPR组分的异源基因的表达。在具体的实施方式中,第二基因修饰可以引起天然HAC1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000001863、其变体或其片段)、HAC1基因直系同源物或HAC1基因旁系同源物的表达和/或通过HAC1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001863、其变体或其片段)、HAC1基因直系同源物或HAC1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然IRE1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000001121、其变体或其片段)、IRE1基因直系同源物或IRE1基因旁系同源物的表达和/或通过IRE1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001121、其变体或其片段)、IRE1基因直系同源物或IRE1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然KIN2基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004086、其变体或其片段)、KIN2基因直系同源物或KIN2基因旁系同源物的表达和/或通过KIN2基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004086、其变体或其片段)、KIN2基因直系同源物或KIN2基因旁系同源物编码的异源多肽的表达的调节。
第二基因修饰可以位于编码在ER中显示出氧化还原酶活性的蛋白的基因中。第二基因修饰可以引起编码蛋白二硫键异构酶、肽酰-脯氨酰基顺反异构酶或硫醇氧化酶的天然基因的表达调节(提高或降低表达)和/或可以引起编码蛋白二硫键异构酶、肽酰-脯氨酰基顺反异构酶或硫醇氧化酶的异源基因的表达。在一些实施方式中,第二基因修饰可以引起编码蛋白二硫键异构酶、肽酰-脯氨酰基顺反异构酶或硫醇氧化酶的天然基因的表达升高和/或编码蛋白二硫键异构酶、肽酰-脯氨酰基顺反异构酶或硫醇氧化酶的异源基因的表达升高。在具体的实施方式中,第二基因修饰可以引起天然PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物的表达和/或通过PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物编码的异源多肽的表达的调节。在另一个具体的实施方式中,第二基因修饰可以引起天然PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物的过表达和/或通过PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物编码的异源多肽的表达。在具体的实施方式中,第二基因修饰可以引起天然CPR5基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000002712、其变体或其片段)、CPR5基因直系同源物或CPR5基因旁系同源物的表达和/或通过CPR5基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000002712、其变体或其片段)、CPR5基因直系同源物或CPR5基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物的表达和/或通过ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物编码的异源多肽的表达的调节。在另一个具体的实施方式中,第二基因修饰可以引起天然ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物的过表达和/或通过ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物编码的异源多肽的表达。
在一些具体的实施方式中,本公开的重组酵母宿主细胞包含至少两个第二基因修饰:一个用于天然PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物的过表达和/或通过PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物编码的异源多肽的表达,并且另一个用于天然ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物的过表达和/或通过ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物编码的异源多肽的表达。
在一些替代的实施方式中,本公开的重组酵母宿主细胞包含至少三个第二基因修饰:一个用于天然PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物的过表达和/或通过PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物编码的异源多肽的表达,另一个用于天然ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物的过表达和/或通过ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物编码的异源多肽的表达,并且另一个用于天然KAR2基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000003571、其变体或其片段)、KAR2基因直系同源物或KAR2基因旁系同源物的过表达和/或通过KAR2基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000003571、其变体或其片段)、KAR2基因直系同源物或KAR2基因旁系同源物编码的异源多肽的表达。
第二基因位置可以位于编码参与ER相关降解途径(ERAD)的蛋白的基因中。在这种实施方式中,第二基因修饰可以是编码参与ERAD的蛋白的基因的表达的调节(提高或降低)。在一个实施方式中,第二基因修饰可以包括天然MNL1基因(并且在一些实施方式中带有酵母菌属基因组数据库ID SGD:S000001247、其变体或其片段)、MNL1基因直系同源物或MNL1基因旁系同源物的表达和/或通过MNL1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001247、其变体或其片段)、MNL1基因直系同源物或MNL1基因旁系同源物编码的异源多肽的表达的调节。在一个实施方式中,第二基因修饰可以包括天然YOS9基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000002464、其变体或其片段)、YOS9基因直系同源物或YOS9基因旁系同源物的表达和/或通过YOS9基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000002464、其变体或其片段)、YOS9基因直系同源物或YOS9基因旁系同源物编码的异源多肽的表达的调节。在一个实施方式中,第二基因修饰可以包括天然UBC7基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004624、其变体或其片段)、UBC7基因直系同源物或UBC7基因旁系同源物的表达和/或通过UBC7基因(并且在一些实施方式中,带有酵母菌属基因组数据库IDSGD:S000004624、其变体或其片段)、UBC7基因直系同源物或UBC7基因旁系同源物编码的异源多肽的表达的调节。在一个实施方式中,第二基因修饰可以包括天然DER1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000405、其变体或其片段)、DER1基因直系同源物或DER1基因旁系同源物的表达和/或通过DER1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000405、其变体或其片段)、DER1基因直系同源物或DER1基因旁系同源物编码的异源多肽的表达的调节。
第二基因修饰可以位于编码参与ER膨胀的蛋白的基因中。第二基因修饰可以是编码参与脂质生物合成的蛋白(如转录因子或Mg2+-依赖性磷脂酸(PA)磷酸酶)的基因的表达的调节。在一个实施方式中,第二基因修饰可以包括天然OPI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001012、其变体或其片段)、OPI1基因直系同源物或OPI1基因旁系同源物的表达和/或通过OPI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001012、其变体或其片段)、OPI1基因直系同源物或OPI1基因旁系同源物编码的异源多肽的表达的调节。在一个实施方式中,第二基因修饰可以包括天然PAH1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004775、其变体或其片段)、PAH1基因直系同源物或PAH1基因旁系同源物的表达和/或通过PAH1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004775、其变体或其片段)、PAH1基因直系同源物或PAH1基因旁系同源物编码的异源多肽的表达的调节。
第二基因修饰可以位于编码参与蛋白运输的蛋白的基因中。第二基因修饰可以位于编码参与COPII囊泡的形成、维持、运输和/或融合的蛋白的基因中。第二基因修饰可以引起编码参与COPII囊泡的形成、维持、运输和/或融合的蛋白的天然基因的表达调节(提高或降低表达)和/或可以引起编码COPII囊泡的形成、维持和运输中的蛋白的异源基因的表达。在具体的实施方式中,第二基因修饰可以引起天然SAR1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000006139、其变体或其片段)、SAR1基因直系同源物或SAR1基因旁系同源物的表达和/或通过SAR1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000006139、其变体或其片段)、SAR1基因直系同源物或SAR1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SEC16基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000006006、其变体或其片段)、SEC16基因直系同源物或SEC16基因旁系同源物的表达和/或通过SEC16基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000006006、其变体或其片段)、SEC16基因直系同源物或SEC16基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SBH1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000002128、其变体或其片段)、SBH1基因直系同源物或SBH1基因旁系同源物的表达和/或通过SBH1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000002128、其变体或其片段)、SBH1基因直系同源物或SBH1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SEC12基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000005309、其变体或其片段)、SEC12基因直系同源物或SEC12基因旁系同源物的表达和/或通过SEC12基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005309、其变体或其片段)、SEC12基因直系同源物或SEC12基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SEC23基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000006385、其变体或其片段)、SEC23基因直系同源物或SEC23基因旁系同源物的表达和/或通过SEC23基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000006385、其变体或其片段)、SEC23基因直系同源物或SEC23基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SEC24基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000001371、其变体或其片段)、SEC24基因直系同源物或SEC24基因旁系同源物的表达和/或通过SEC24基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001371、其变体或其片段)、SEC24基因直系同源物或SEC24基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SEC13基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004198、其变体或其片段)、SEC13基因直系同源物或SEC13基因旁系同源物的表达和/或通过SEC13基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004198、其变体或其片段)、SEC13基因直系同源物或SEC13基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SEC31基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000002354、其变体或其片段)、SEC31基因直系同源物或SEC31基因旁系同源物的表达和/或通过SEC31基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000002354、其变体或其片段)、SEC31基因直系同源物或SEC31基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然COG5基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004996、其变体或其片段)、COG5基因直系同源物或COG5基因旁系同源物的表达和/或通过COG5基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004996、其变体或其片段)、COG5基因直系同源物或COG5基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然BOS1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004068、其变体或其片段)、BOS1基因直系同源物或BOS1基因旁系同源物的表达和/或通过BOS1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004068、其变体或其片段)、BOS1基因直系同源物或BOS1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然COG6基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004986、其变体或其片段)、COG6基因直系同源物或COG6基因旁系同源物的表达和/或通过COG6基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004986、其变体或其片段)、COG6基因直系同源物或COG6基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然COY1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000001662、其变体或其片段)、COY1基因直系同源物或COY1基因旁系同源物的表达和/或通过COY1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001662、其变体或其片段)、COY1基因直系同源物或COY1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SLY1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000002597、其变体或其片段)、SLY1基因直系同源物或SLY1基因旁系同源物的表达和/或通过SLY1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000002597、其变体或其片段)、SLY1基因直系同源物或SLY1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然ERV25基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004473、其变体或其片段)、ERV25基因直系同源物或ERV25基因旁系同源物的表达和/或通过ERV25基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004473、其变体或其片段)、ERV25基因直系同源物或ERV25基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然ERV29基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000003516、其变体或其片段)、ERV29基因直系同源物或ERV29基因旁系同源物的表达和/或通过ERV29基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000003516、其变体或其片段)、ERV29基因直系同源物或ERV29基因旁系同源物编码的异源多肽的表达的调节。
第二基因修饰可以位于编码参与COPI囊泡的形成、维持和运输的蛋白的基因中。第二基因修饰可以引起编码参与COPI囊泡的形成、维持和运输的蛋白的天然基因的表达的调节(提高或降低表达)。在一个实施方式中,第二基因修饰可以包括天然GOS1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001023、其变体或其片段)、GOS1基因直系同源物或GOS1基因旁系同源物的表达和/或通过GOS1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001023、其变体或其片段)、GOS1基因直系同源物或GOS1基因旁系同源物编码的异源多肽的表达的调节。
第二基因修饰可以位于编码参与逆运体复合物(retromer complex,逆转运复合体)的形成、维持、运输和/或融合的蛋白的基因中。第二基因修饰可以引起编码参与逆运体复合物的形成、维持、运输和/或融合的蛋白的天然基因的表达的调节(提高或降低表达)。在一个实施方式中,第二基因修饰可以包括天然LAM1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001198、其变体或其片段)、LAM1基因直系同源物或LAM1基因旁系同源物的表达和/或通过LAM1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001198、其变体或其片段)、LAM1基因直系同源物或LAM1基因旁系同源物编码的异源多肽的表达的调节。在一个实施方式中,第二基因修饰可以包括天然VPS5基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005595、其变体或其片段)、VPS5基因直系同源物或VPS5基因旁系同源物的表达和/或通过VPS5基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005595、其变体或其片段)、VPS5基因直系同源物或VPS5基因旁系同源物编码的异源多肽的表达的调节。在另一个实施方式中,第二基因修饰可以包括天然VPS5基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005595、其变体或其片段)、VPS5基因直系同源物或VPS5基因旁系同源物的失活。在一个实施方式中,第二基因修饰可以包括天然VPS17基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005658、其变体或其片段)、VPS17基因直系同源物或VPS17基因旁系同源物的表达和/或通过VPS17基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005658、其变体或其片段)、VPS17基因直系同源物或VPS17基因旁系同源物编码的异源多肽的表达的调节。在另一个实施方式中,第二基因修饰可以包括天然VPS17基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005658、其变体或其片段)、VPS17基因直系同源物或VPS17基因旁系同源物的失活。在一个实施方式中,第二基因修饰可以包括天然VPS26基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000003589、其变体或其片段)、VPS26基因直系同源物或VPS26基因旁系同源物的表达和/或通过VPS26基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000003589、其变体或其片段)、VPS26基因直系同源物或VPS26基因旁系同源物编码的异源多肽的表达的调节。在一个实施方式中,第二基因修饰可以包括天然VPS29基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000001054、其变体或其片段)、VPS29基因直系同源物或VPS29基因旁系同源物的表达和/或通过VPS29基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001054、其变体或其片段)、VPS29基因直系同源物或VPS29基因旁系同源物编码的异源多肽的表达的调节。在一个实施方式中,第二基因修饰可以包括天然VPS35基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000003690、其变体或其片段)、VPS35基因直系同源物或VPS35基因旁系同源物的表达和/或通过VPS35基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000003690、其变体或其片段)、VPS35基因直系同源物或VPS35基因旁系同源物编码的异源多肽的表达的调节。
在一些实施方式中,重组酵母宿主细胞包含至少两个第二基因修饰:第一个,其导致天然VPS5基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005595、其变体或其片段)、VPS5基因直系同源物或VPS5基因旁系同源物的失活,和另一个,其导致天然VPS17基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005658、其变体或其片段)、VPS17基因直系同源物或VPS17基因旁系同源物的失活。在一些进一步的实施方式中,重组酵母宿主细胞包含至少三个第二基因修饰:第一个,其导致天然VPS5基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005595、其变体或其片段)、VPS5基因直系同源物或VPS5基因旁系同源物的失活,另一个,其用于天然PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物的过表达和/或通过PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物编码的异源多肽的表达,和再一个,其用于天然ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物的过表达和/或通过ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物编码的异源多肽的表达。在一些进一步的实施方式中,重组酵母宿主细胞包含至少三个第二基因修饰:第一个,其导致天然VPS17基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005658、其变体或其片段)、VPS17基因直系同源物或VPS17基因旁系同源物的失活,另一个,其用于天然PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物的过表达和/或通过PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物编码的异源多肽的表达,和再一个,其用于天然ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物的过表达和/或通过ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物编码的异源多肽的表达。
第二基因修饰可以位于编码参与分泌囊泡(高尔基系统和膜之间的运输)的形成、维持、运输和/或融合的蛋白的基因中。第二基因修饰可以引起编码参与分泌囊泡的形成、维持和运输的蛋白的天然基因的表达调节(提高或降低表达)和/或可以引起编码分泌囊泡的形成、维持、运输和/或融合中的蛋白的异源基因的表达。在具体的实施方式中,第二基因修饰可以引起天然SSO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000006153、其变体或其片段)、SSO1基因直系同源物或SSO1基因旁系同源物的表达和/或通过SSO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000006153、其变体或其片段)、SSO1基因直系同源物或SSO1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SSO2基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004795、其变体或其片段)、SSO2基因直系同源物或SSO2基因旁系同源物的表达和/或通过SSO2基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004795、其变体或其片段)、SSO2基因直系同源物或SSO2基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SNC2基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000005854、其变体或其片段)、SNC2基因直系同源物或SNC2基因旁系同源物的表达和/或通过SNC2基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005854、其变体或其片段)、SNC2基因直系同源物或SNC2基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SEC1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000002571、其变体或其片段)、SEC1基因直系同源物或SEC1基因旁系同源物的表达和/或通过SEC1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000002571、其变体或其片段)、SEC1基因直系同源物或SEC1基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然EXO70基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000003621、其变体或其片段)、EXO70基因直系同源物或EXO70基因旁系同源物的表达和/或通过EXO70基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000003621、其变体或其片段)、EXO70基因直系同源物或EXO70基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然YPT32基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000003178、其变体或其片段)、YPT32基因直系同源物或YPT32基因旁系同源物的表达和/或通过YPT32基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000003178、其变体或其片段)、YPT32基因直系同源物或YPT32基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SEC4基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000001889、其变体或其片段)、SEC4基因直系同源物或SEC4基因旁系同源物的表达和/或通过SEC4基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001889、其变体或其片段)、SEC4基因直系同源物或SEC4基因旁系同源物编码的异源多肽的表达的调节。
第二基因位置可以位于编码参与液泡途径的蛋白的基因中。在这种实施方式中,第二基因修饰可以是编码参与液泡途径的蛋白(其可以是例如液泡蛋白酶、液泡蛋白酶激活剂、参与向液泡运输和/或自噬的组分)的基因的表达调节(提高或降低表达)。在一个实施方式中,第二基因修饰可以包括天然PRB1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000786、其变体或其片段)、PRB1基因直系同源物或PRB1基因旁系同源物的表达和/或通过PRB1基因(并且在一些实施方式中,带有酵母菌属基因组数据库IDSGD:S000000786、其变体或其片段)、PRB1基因直系同源物或PRB1基因旁系同源物编码的异源多肽的表达的调节。在另一个实施方式中,第二基因修饰可以包括天然PRB1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000786、其变体或其片段)、PRB1基因直系同源物或PRB1基因旁系同源物的失活。在一个实施方式中,第二基因修饰可以包括天然VMA3基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000753、其变体或其片段)、VMA3基因直系同源物或VMA3基因旁系同源物的表达和/或通过VMA3基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000753、其变体或其片段)、VMA3基因直系同源物或VMA3基因旁系同源物编码的异源多肽的表达的调节。在一个实施方式中,第二基因修饰可以包括天然VPS8基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000002、其变体或其片段)、VPS8基因直系同源物或VPS8基因旁系同源物的表达和/或通过VPS8基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000002、其变体或其片段)、VPS8基因直系同源物或VPS8基因旁系同源物编码的异源多肽的表达的调节。在一个实施方式中,第二基因修饰可以包括天然VPS21基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005615、其变体或其片段)、VPS21基因直系同源物或VPS21基因旁系同源物的表达和/或通过VPS21基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005615、其变体或其片段)、VPS21基因直系同源物或VPS21基因旁系同源物编码的异源多肽的表达的调节。在一个实施方式中,第二基因修饰可以包括天然MTC6基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001194、其变体或其片段)、MTC6基因直系同源物或MTC6基因旁系同源物的表达和/或通过MTC6基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001194、其变体或其片段)、MTC6基因直系同源物或MTC6基因旁系同源物编码的异源多肽的表达的调节。在具体的实施方式中,第二基因修饰可以引起天然SEC4基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000001889、其变体或其片段)、SEC4基因直系同源物或SEC4基因旁系同源物的表达和/或通过SEC4基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001889、其变体或其片段)、SEC4基因直系同源物或SEC4基因旁系同源物编码的异源多肽的表达的调节。
在一些实施方式中,重组酵母宿主细胞包含至少两个第二基因修饰:第一个,其导致天然PRB1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000786、其变体或其片段)、PRB1基因直系同源物或PRB1基因旁系同源物的失活,和另一个,其导致天然VPS5基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005595、其变体或其片段)、VPS5基因直系同源物或VPS5基因旁系同源物的失活。在一些实施方式中,重组酵母宿主细胞包含至少三个第二基因修饰:第一个,其导致天然PRB1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000786、其变体或其片段)、PRB1基因直系同源物或PRB1基因旁系同源物的失活,另一个,其用于天然PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物的过表达和/或通过PDI1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000000548、其变体或其片段)、PDI1基因直系同源物或PDI1基因旁系同源物编码的异源多肽的表达,和再一个,其用于天然ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物的过表达和/或通过ERO1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004599、其变体或其片段)、ERO1基因直系同源物或ERO1基因旁系同源物编码的异源多肽的表达。
第二基因修饰可以位于编码参与细胞壁稳定性途径的蛋白的基因中。第二基因修饰可以是编码参与提供细胞壁稳定性的蛋白的基因的表达调节(提高或降低)。在一个实施方式中,第二基因修饰可以包括天然CCW12基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004100、其变体或其片段)、CCW12基因直系同源物或CCW12基因旁系同源物的表达和/或通过CCW12基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000004100、其变体或其片段)、CCW12基因直系同源物或CCW12基因旁系同源物编码的异源多肽的表达的调节。在一个实施方式中,第二基因修饰可以包括天然CWP2基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001956、其变体或其片段)、CWP2基因直系同源物或CWP2基因旁系同源物的表达和/或通过CWP2基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000001956、其变体或其片段)、CWP2基因直系同源物或CWP2基因旁系同源物编码的异源多肽的表达的调节。在一个实施方式中,第二基因修饰可以包括天然SED1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000002484、其变体或其片段)、SED1基因直系同源物或SED1基因旁系同源物的表达和/或通过SED1基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000002484、其变体或其片段)、SED1基因直系同源物或SED1基因旁系同源物编码的异源多肽的表达的调节。
在一个实施方式中,第二基因修饰可以包括天然BMH2基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000002506、其变体或其片段)、BMH2基因直系同源物或BMH2基因旁系同源物的表达和/或通过BMH2基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000002506、其变体或其片段)、BMH2基因直系同源物或BMH2基因旁系同源物编码的异源多肽的表达的调节。
在一个实施方式中,第二基因修饰可以包括天然KEX2基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005182、其变体或其片段)、BMH2基因直系同源物或KEX2基因旁系同源物的表达和/或通过KEX2基因(并且在一些实施方式中,带有酵母菌属基因组数据库ID SGD:S000005182、其变体或其片段)、KEX2基因直系同源物或KEX2基因旁系同源物编码的异源多肽的表达的调节。
重组酵母宿主细胞
本公开涉及已基因工程化以表达异源多肽或过表达天然多肽的重组酵母宿主细胞。本公开的重组酵母宿主细胞旨在用于异源多肽或天然多肽的生产中。在一个实施方式中,重组酵母宿主细胞旨在用于多肽生产中,所述多肽旨在分泌或排出到重组酵母宿主细胞外部。
在本公开的上下文中,当重组酵母细胞被鉴定为“基因工程化的”时,将理解它表示已操纵以添加和/或除去至少一个或多个异源或外源核酸残基。在一些实施方式中,所添加的一个或多个核酸残基可以来源于异源细胞或重组宿主细胞本身。在后一种情况下,在不同于天然基因组位置的一个或多个基因组位置处添加核酸残基。遗传操纵不会天然发生并且是酵母体外操纵的结果。
本公开涉及已基因工程化并且包括第一和第二基因修饰的重组酵母宿主细胞。基因修饰旨在提高(认为对酵母宿主细胞异源或天然的)具体靶基因的表达并且可以在一个或多个(例如,1、2、3、4、5、6、7、8或更多个)基因位置进行。在一些实施方式中,所添加的一个或多个核酸残基可以来源于异源细胞或重组酵母宿主细胞本身。在后一种情况下,在不同于天然基因组位置的一个或多个基因组位置处添加核酸残基。遗传操纵不会天然发生并且是酵母体外操纵的结果。在一些实施方式中,重组酵母宿主细胞中的基因修饰基本由基因修饰组成或由其组成,所述基因修饰允许编码异源多肽的异源核酸分子表达。可以在天然基因的一个或多个拷贝中制备旨在降低(认为对酵母宿主细胞天然的)具体靶基因的表达的基因修饰。
在本公开的上下文中,重组宿主细胞是酵母。适合的重组酵母宿主细胞可以例如来自酵母菌属(Saccharomyces)、克鲁维酵母属(Kluyveromyces)、阿氏酵母属(Arxula)、德巴利酵母属(Debaryomyces)、假丝酵母属(Candida)、毕赤酵母属(Pichia)、红发夫酵母属(Phaffia)、裂殖酵母属(Schizosaccharomyces)、汉逊酵母属(Hansenula)、克勒克酵母属(Kloeckera)、许旺酵母属(Schwanniomyces)、圆酵母属(Torula)、有孢汉逊酵母属(Hanseniaspora)、拉茜斯酵母属(Lachancea)、威克汉姆酵母属(Wickerhamomyces)或亚罗酵母属(Yarrowia)。适合的酵母种可以包括例如酿酒酵母(S.cerevisiae)、博伊丁酵母(S.bulderi)、巴奈特酵母(S.barnetti)、少孢酵母(S.exiguus)、葡萄汁酵母(S.uvarum)、糖化酵母(S.diastaticus)、产朊假丝酵母(C.utilis)、乳酸克鲁维酵母(K.lactis)、马克斯克鲁维酵母(K.marxianus)、脆壁克鲁维酵母(K.fragilis)、葡萄酒有孢汉生酵母(Hanseniaspora vineae)、发酵性拉茜斯酵母(Lachancea fermentati)、耐热拉茜斯酵母(Lachancea thermotolerans)、日本裂殖酵母(Schizosaccharomyces japonicus)和/或异威克汉姆酵母(Wickerhamomyces anomalus)。在一些实施方式中,酵母选自由下述组成的组:酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizzosaccharomycespombe)、白假丝酵母(Candida albicans)、巴斯德毕赤酵母(Pichia pastoris)、树干毕赤酵母(Pichia stipitis)、解脂耶罗威亚酵母(Yarrowia lipolytica)、多形汉逊酵母(Hansenula polymorpha)、红法夫酵母(Phaffia rhodozyma)、产朊假丝酵母(Candidautilis)、解腺嘌呤阿氏酵母(arxula adeninivorans)、汉氏德巴利氏酵母(Debaryomyceshansenii)、多形德巴利酵母菌(Debaryomyces polymorphus)、粟酒裂殖酵母(Schizosaccharomyces pombe)和西方许旺酵母(Schwanniomyces occidentalis)。在一个具体的实施方式中,酵母是酿酒酵母。在一些实施方式中,宿主细胞可以是产油酵母细胞。例如,产油酵母宿主细胞可以来自布拉氏霉属(Blakeslea)、假丝酵母属(Candida)、隐球菌属(Cryptococcus)、小坎宁安霉属(Cunninghamella)、油脂酵母属(Lipomyces)、被孢霉属(Mortierella)、毛霉属(Mucor)、须霉属(Phycomyces)、腐霉属(Pythium)、红冬孢酵母属(Rhodosporidum)、红酵母属(Rhodotorula)、毛孢子菌属(Trichosporon)或者亚罗酵母属(Yarrowia)。在一些替代实施方式中,宿主细胞可以是产油微藻宿主细胞(例如,来自破囊壶菌属(Thraustochytrium)或裂殖壶菌属(Schizochytrium))。在一个实施方式中,重组酵母宿主细胞来自酵母菌属(Saccharomyces),并且在一些实施方式中,来自酿酒酵母种。在一个实施方式中,重组酵母宿主细胞来自汉逊酵母(Hansenula sp.)属,并且在一些实施方式中,来自多形汉逊酵母(Hansenula polymorpha)种。在一个实施方式中,重组酵母宿主细胞来自毕赤酵母(Pichia sp.)属,并且在一些实施方式中,来自巴斯德毕赤酵母(Pichiapastoris)种。在一个实施方式中,重组酵母宿主细胞来自亚罗酵母(Yarrowia sp.)属,并且在一些实施方式中,来自解脂耶罗威亚酵母(Yarrowia lipolytica)种。在一个实施方式中,重组酵母宿主细胞来自克鲁维酵母(Kluyveromyces sp.)属,并且在一些实施方式中,来自乳酸克鲁维酵母(Kluyveromyces lactis)种。在一个实施方式中,重组酵母宿主细胞来自毕赤酵母(Pichia sp.)属,并且在一些实施方式中,来自巴斯德毕赤酵母(Pichiapastoris)种。
增殖重组酵母宿主细胞并制备酵母产物
本公开使得能够增殖本公开的重组酵母宿主细胞并且最终使得能够分泌过表达的天然多肽或异源多肽(与第一基因修饰相关联)。在增殖过程中,将重组酵母宿主细胞置于适合的生长条件下的培养基中。由于第二基因修饰旨在当与亲代酵母宿主细胞相比时,至少部分恢复重组酵母宿主细胞的生长速率和/或当与对照酵母宿主细胞相比时提高重组酵母宿主细胞的生长速率,因此可以实施增殖过程以恢复和/或提高重组酵母宿主细胞的生长速率。在本公开的增殖方法中,重组酵母宿主细胞可以以当与对照酵母宿主细胞的生长速率(在相似条件下确定)相比时至少100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、200%或更大的生长速率增加。当比较表达异源多肽或天然多肽(在存在或不存在信号序列的情况下)但缺少第二基因修饰的对照酵母宿主细胞的生长速率时,观察到这种生长速率的升高。在一个实施方式中,当比较与信号序列一起表达第一基因修饰(例如,第一基因修饰)的对照酵母宿主细胞的生长速率时,观察到这种生长速率的升高。
增殖期间使用的培养基可以包括碳源(诸如,例如糖蜜、蔗糖、葡萄糖、葡萄糖浆、乙醇、玉米、甘油、玉米浆和/或木质纤维生物质)、氮源(诸如,例如氨或另一种无机氮源)和磷源(诸如,例如磷酸或另一种无机磷源)。培养基还可以包括另外的微量营养素,如维生素和/或矿物质以支持重组酵母宿主细胞的增殖。
可以在特定pH和/或特定温度下实施增殖方法,所述pH和温度对于异源多肽的表达或者对于天然多肽的过表达是最优的。因此,在其中酵母来自酵母菌属(Saccharomyces)的实施方式中,所述方法可以包括将培养基的pH控制在约3.0至约6.0、约3.5至约5.5或者约4.0至约5.5之间。在具体的实施方式中,将pH控制在约4.5。在另一个实例中,在其中酵母来自酵母菌属的实施方式中,所述方法可以包括将培养基的温度控制在约20℃至约40℃、约25℃至约30℃或者约30℃至约35℃之间。在具体的实施方式中,将温度控制在约30℃至约35℃之间(例如,32℃)。
在一些实施方式中,在需氧条件下实施增殖方法。
在一些实施方式中,将异源多肽或天然多肽以游离形式(例如,不与重组酵母宿主细胞物理相关联)表达或分泌至细胞外间隙。在这种实施方式中,在重组酵母宿主细胞增殖后,在培养基中产生和分泌异源或天然多肽。所述方法还可以包括从培养基基本分离和任选地纯化异源或天然多肽。如本公开的上下文中所使用的,表述“从培养基基本分离和任选地纯化异源或天然多肽”是指从异源或天然多肽除去大部分培养基组分(如增殖的重组酵母宿主细胞)并以分离/纯化形式提供它们。可以以液体形式或以固体(干燥)形式提供异源或天然多肽。因此,本公开提供了通过本文所描述的方法可获得的或获得的分离的异源或天然多肽。
在一些实施方式中,以细胞相关联形式表达和分泌异源多肽或天然多肽并关联至重组酵母宿主细胞的细胞壁或细胞膜。在这种实施方式中,异源或天然多肽在增殖的重组酵母宿主细胞表面上积累。所述方法可以包括从培养基基本纯化增殖的重组酵母宿主细胞。所述方法还可以包括裂解和/或干燥增殖的酵母宿主细胞的后续步骤。所述方法还可以包括从增殖的重组酵母宿主细胞至少部分分离异源或天然多肽。所述方法还可以包括干燥分离的异源或天然多肽的后续步骤。
例如,在本公开的方法中,可以使用自溶(其可以任选地在存在另外的外源酶的情况下进行)或者均质(例如,使用珠磨技术)裂解重组酵母宿主细胞。在一个实施方式中,可以使用自溶裂解增殖的重组酵母宿主细胞。在一些实施方式中,可以对增殖的重组细胞进行特定时间量(例如,24h)的组合的热和pH处理,以引起增殖的重组酵母宿主细胞的自溶以提供裂解的重组酵母宿主细胞。例如,可以使增殖的重组细胞经受约40℃至约70℃之间或者约50℃至约60℃之间的温度。可以使增殖的重组细胞经受以下温度:至少约40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃或70℃。可替代地或组合地,可以使增殖的重组细胞经受以下温度:不超过约70℃、69℃、68℃、67℃、66℃、65℃、64℃、63℃、62℃、61℃、60℃、59℃、58℃、57℃、56℃、55℃、54℃、53℃、52℃、51℃、50℃、49℃、48℃、47℃、46℃、45℃、44℃、43℃、42℃、41℃或40℃。在另一个实例中,可以使增殖的重组细胞经受约4.0至8.5之间或者约5.0至7.5之间的pH。可以使增殖的重组细胞经受以下pH:至少约4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5.0、5.1、5.2、5.3、5.4、5.5、5.6、5.7、5.8、5.9、6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9、7.0、7.1、7.2、7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4或8.5。可替代地或组合地,可以使增殖的重组细胞经受以下pH:不超过8.5、8.4、8.3、8.2、8.1、8.0、7.9、7.8、7.7、7.6、7.5、7.4、7.3、7.2、7.1、7.0、6.9、6.8、6.7、6.6、6.5、6.4、6.3、6.2、6.1、6.0、5.9、5.8、5.7、5.6、5.5、5.4、5.3.、5.2、5.1、5.0、4.9、4.8、4.7、4.6或4.5。
在一些实施方式中,本公开的方法可以包括使增殖的酵母宿主细胞部分失活的步骤。如本公开的上下文中所使用的,表述“部分失活”是指以下事实:通过机械方式(高压均质、珠摩擦(bead beating)等)、热方式、化学方式(还原剂、去污剂等)和/或酶促方式降低一定比例的增殖酵母的存活力(在一个实施方式中,大部分增殖酵母的存活力)。因此,本公开提供了部分失活的酵母产物。
所述方法还可以包括干燥步骤。干燥步骤可以包括例如滚筒干燥、电喷雾干燥、喷雾干燥和/或流化床干燥。
所述方法可以包括提供另外的产物,因此可能必需进一步分离裂解的重组酵母宿主细胞的组分。例如,裂解的重组酵母宿主细胞的细胞壁组分(称为“不溶性部分”)可以与裂解的重组酵母宿主细胞的其它组分(称为“可溶性部分”)分离。可以例如通过使用离心和/或过滤进行这种分离步骤。在一些实施方式中,在分离后对不溶性部分进行清洗步骤。在一些实施方式中,在干燥前对不溶性部分进行清洗步骤。
在一些实施方式中,可以作为酵母产物(例如,包含增殖酵母或增殖酵母组分的产物)提供异源或天然多肽。在酵母产物中,可以作为无活性形式提供酵母。可以以液体、半液体、固体或干燥形式提供酵母产物。在一些实施方式中,酵母产物基本不含增殖重组酵母宿主细胞组分。在具体的实施方式中,酵母产物基本不含来自增殖重组酵母宿主细胞的脱氧核糖核酸。
在替代实施方式中,可以作为分离(或基本分离的)多肽提供异源或天然多肽。
使用重组酵母宿主细胞制备发酵产物的方法
本公开的重组酵母宿主细胞可以用于从生物质制备发酵产物的方法。当重组酵母宿主细胞能够表达作为第一基因修饰,能够至少部分水解要发酵的生物质(并且任选地液化)的一种或多种多肽时,这可以是特别有用的。在这些方法中,重组酵母宿主细胞,任选地与发酵酵母一起在获得水解的液化培养基和/或发酵产物的条件下接触生物质。发酵产物,如旨在为使用的生物燃料的醇类,通常可以得自酵母对生物质的发酵。发酵产物可以是醇,诸如,例如乙醇、异丙醇、正丙醇、1-丁醇、甲醇、丙酮和/或1,2丙二醇。在一个实施方式中,发酵产物是乙醇。示例性生物质可以包括但不限于淀粉、糖和木质纤维素材料。淀粉材料可以包括但不限于糊状物(mashes),如玉米、小麦、黑麦、大麦、大米或蜀黍。糖材料可以包括但不限于甜菜、菊芋块茎、甜高粱、糖蜜或甘蔗。术语“木质纤维素材料”、“木质纤维素底物”和“纤维素生物质”表示包含纤维素、半纤维素、木质素或其组合的任何类型的生物质,如但不限于木质生物质、饲草、草本能源作物、非木质植物生物质、农业废物和/或农业废弃物、林业废弃物和/或林业废物、造纸废渣和/或废纸渣、废水处理污泥、城市固体废物、来自湿磨和干磨玉米乙醇厂的玉米纤维和糖处理废弃物。术语“半纤维素”、“半纤维素部分(hemicellulosic portions)”和“半纤维素部分(hemicellulosic fractions)”表示木质纤维素材料的非木质素、非纤维素元素,如但不限于半纤维素(即包含木糖葡萄糖、木聚糖、葡糖醛酸木聚糖、阿糖基木聚糖、甘露聚糖、葡甘露聚糖和半乳葡甘露聚糖)、果胶(例如,同聚半乳糖醛酸、鼠李聚糖半乳糖醛酸I和II和木糖聚半乳糖醛酸)和蛋白聚糖(例如,阿拉伯半乳聚糖-蛋白、伸展蛋白和富含脯氨酸的蛋白)。在一些实施方式中,底物包含淀粉(处于胶凝或原料形式)。在一些另外的实施方式中,生物质包含玉米或来源于玉米。
发酵步骤包括将发酵酵母与糊状物或原料生物质接触,并将这种接触维持在允许生物质向发酵产物转化的条件下。在本公开的方法中,可以将重组酵母宿主细胞认为是发酵酵母。任选地或组合地,可以在发酵步骤期间将重组酵母宿主细胞用于与发酵酵母的共培养。因此,本公开提供了包含本公开的重组酵母宿主细胞或其组分的发酵醪。发酵酵母可以例如来自酵母菌属(Saccharomyces)、克鲁维酵母属(Kluyveromyces)、阿氏酵母属(Arxula)、德巴利酵母属(Debaryomyces)、假丝酵母属(Candida)、毕赤酵母属(Pichia)、红发夫酵母属(Phaffia)、裂殖酵母属(Schizosaccharomyces)、汉逊酵母属(Hansenula)、克勒克酵母属(Kloeckera)、许旺酵母属(Schwanniomyces)、圆酵母属(Torula)或亚罗酵母属(Yarrowia)。适合的酵母种可以包括例如酿酒酵母(S.cerevisiae)、博伊丁酵母(S.bulderi)、巴奈特酵母(S.barnetti)、少孢酵母(S.exiguus)、葡萄汁酵母(S.uvarum)、糖化酵母(S.diastaticus)、布拉迪酵母(S.boulardii)、产朊假丝酵母(C.utilis)、乳酸克鲁维酵母(K.lactis)、马克斯克鲁维酵母(K.marxianus)或者脆壁克鲁维酵母(K.fragilis)。在一些实施方式中,发酵酵母选自由以下组成的组:酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizzosaccharomyces pombe)、白假丝酵母(Candida albicans)、巴斯德毕赤酵母(Pichia pastoris)、树干毕赤酵母(Pichiastipitis)、解脂耶罗威亚酵母(Yarrowia lipolytica)、多形汉逊酵母(Hansenulapolymorpha)、红法夫酵母(Phaffia rhodozyma)、产朊假丝酵母(Candida utilis)、解腺嘌呤阿氏酵母(Arxula adeninivorans)、汉氏德巴利氏酵母(Debaryomyces hansenii)、多形德巴利酵母菌(Debaryomyces polymorphus)、粟酒裂殖酵母(Schizosaccharomycespombe)和西方许旺酵母(Schwanniomyces occidentalis)。在一些进一步的实施方式中,发酵酵母是酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizzosaccharomycespombe)、白假丝酵母(Candida albicans)、巴斯德毕赤酵母(Pichia pastoris)、树干毕赤酵母(Pichia stipitis)、解脂耶罗威亚酵母(Yarrowia lipolytica)、多形汉逊酵母(Hansenula polymorpha)、红法夫酵母(Phaffia rhodozyma)、产朊假丝酵母(Candidautilis)、解腺嘌呤阿氏酵母(Arxula adeninivorans)、汉氏德巴利氏酵母(Debaryomyceshansenii)、多形德巴利酵母菌(Debaryomyces polymorphus)、粟酒裂殖酵母(Schizosaccharomyces pombe)或西方许旺酵母(Schwanniomyces occidentalis)。在一个具体的实施方式中,发酵酵母是酿酒酵母。在一些实施方式中,发酵酵母可以是产油酵母细胞。例如,产油酵母细胞可以来自布拉氏霉属(Blakeslea)、假丝酵母属(Candida)、隐球菌属(Cryptococcus)、小坎宁安霉属(Cunninghamella)、油脂酵母属(Lipomyces)、被孢霉属(Mortierella)、毛霉属(Mucor)、须霉属(Phycomyces)、腐霉属(Pythium)、红冬孢酵母属(Rhodosporidum)、红酵母属(Rhodotorula)、毛孢子菌属(Trichosporon)或者亚罗酵母属(Yarrowia)。在一些替代实施方式中,发酵酵母可以是产油微藻宿主细胞(例如,来自破囊壶菌属(Thraustochytrium)或裂殖壶菌属(Schizochytrium))。在一个实施方式中,发酵酵母来自酵母菌属(Saccharomyces),并且在一些实施方式中,来自酿酒酵母种。
发酵步骤可以是分批进料发酵、连续发酵或者多种发酵循环的组合。
在一个实施方式中,对本公开的重组酵母宿主细胞进行多个发酵循环。其中可以使用重组酵母宿主细胞的多个发酵循环包括至少两个不同的发酵循环:初始发酵循环和一个或多个进一步的发酵循环。在初始发酵循环中,包含重组酵母宿主细胞(任选地结合发酵酵母群体)的发酵群体在获得发酵产物(并且同时发酵培养基)的条件下接触发酵培养基。将在该初始发酵循环结束时所获得的发酵群体再循环用于进一步的发酵循环(例如,基本分离并用于接种另外的发酵培养基)。已认识到用于接种另外的发酵培养基的发酵群体可以包括可以引入初始发酵循环的发酵培养基中的污染野生酵母。然后,将接种的另外的发酵培养基置于获得发酵产物的条件下并随后(从另外的发酵培养基)基本分离(另外的)发酵群体。可以将基本分离的另外的发酵群体再循环并用于实施一个或多个另外的发酵循环。
制备发酵产物的发酵步骤可以在以下温度下进行:至少约20℃、约21℃、约22℃、约23℃、约24℃、约25℃、约26℃、约27℃、约28℃、约29℃、约30℃、约31℃、约32℃、约33°、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃、约43℃、约44℃、约45℃、约46℃、约47℃、约48℃、约49℃或约50℃。
在一些实施方式中,发酵步骤可以用于以特定速率产生乙醇。例如,在一些实施方式中,以下列速率产生乙醇:至少约0.1mg每小时每升、至少约0.25mg每小时每升、至少约0.5mg每小时每升、至少约0.75mg每小时每升、至少约1.0mg每小时每升、至少约2.0mg每小时每升、至少约5.0mg每小时每升、至少约10mg每小时每升、至少约15mg每小时每升、至少约20.0mg每小时每升、至少约25mg每小时每升、至少约30mg每小时每升、至少约50mg每小时每升、至少约100mg每小时每升、至少约200mg每小时每升、至少约300mg每小时每升、至少约400mg每小时每升、至少约500mg每小时每升、至少约600mg每小时每升、至少约700mg每小时每升、至少约800mg每小时每升、至少约900mg每小时每升、至少约1g每小时每升、至少约1.5g每小时每升、至少约2g每小时每升、至少约2.5g每小时每升、至少约3g每小时每升、至少约3.5g每小时每升、至少约4g每小时每升、至少约4.5g每小时每升、至少约5g每小时每升、至少约5.5g每小时每升、至少约6g每小时每升、至少约6.5g每小时每升、至少约7g每小时每升、至少约7.5g每小时每升、至少约8g每小时每升、至少约8.5g每小时每升、至少约9g每小时每升、至少约9.5g每小时每升、至少约10g每小时每升、至少约10.5g每小时每升、至少约11g每小时每升、至少约11.5g每小时每升、至少约12g每小时每升、至少约12.5g每小时每升、至少约13g每小时每升、至少约13.5g每小时每升、至少约14g每小时每升、至少约14.5g每小时每升或至少约15g每小时每升。可以使用本领域中已知的任何方法测量乙醇产生。例如,可以使用HPLC分析评价发酵样品中乙醇的量。多种乙醇测定试剂盒是可商购的,其使用例如醇氧化酶基测定。
在一些实施方式中,在厌氧条件下实施发酵步骤。如以上所描述的,酵母倾向于在厌氧条件下进行发酵过程,而它倾向于在需氧条件下进行增殖过程。如本文所使用的,“厌氧条件”是指生物质处于缺氧环境。缺氧环境可以具有低于空气的氧浓度。例如,氧浓度可以低于按体积计21%、20%、15%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%。
本公开的方法还可以包括从发酵生物质的其它组分分离发酵产物的步骤。本公开的方法还可以包括从发酵生物质获得酒糟的步骤。
任选地,可以实施初步液化步骤以至少部分水解在发酵步骤之前存在的淀粉分子。在本公开的方法中,可以在液化步骤之前、期间和/或之后引入重组酵母宿主细胞。已进行液化步骤的生物质可以被称为水解的液化培养基(其可以是水解的浆液)。因此,本公开提供了水解的液化培养基,其包含本文所描述的重组酵母宿主细胞或其组分。
在液化步骤中,重组酵母宿主细胞可以在产生水解的液化培养基(其可以是水解的浆液)的条件下接触液化培养基(其可以是浆液)。在一些实施方式中,使重组酵母宿主细胞接触未进行热处理步骤(并且在一些实施方式中,不意欲进行热处理步骤)的液化培养基或浆液。在这些情况下,使重组酵母宿主细胞在产生水解的液化培养基的条件下接触未处理的液化培养基或未处理的浆液。在一些实施方式中,使重组酵母宿主细胞接触尚未进行热处理步骤,但是意欲进行这种热处理步骤的液化培养基或浆液。在这些情况下,使重组酵母宿主细胞在热处理步骤之前接触未处理的液化培养基或未处理的浆液。在其它实施方式中,使重组酵母宿主细胞接触已进行上述热处理步骤的液化培养基或浆液。在这些情况下,使重组酵母宿主细胞接触胶凝的液化培养基或胶凝的浆液,因为热处理将有利于存在于原料液化培养基/原料浆液中的淀粉分子的至少部分破环(以提供胶凝的液化培养基/浆液)。在一些实施方式中,胶凝的液化培养基和重组酵母宿主细胞之间的接触可以(至少部分)发生在热处理步骤期间。在一些实施方式中,可以在已应用热处理之前、期间和/或之后将重组酵母宿主细胞添加至液化法中的液化培养基。
如本文所指明的,可以完全对未处理的液化培养基实施液化法。然而,在一些实施方式中,可以有利地将热处理步骤包括至液化法以至少部分液化包含胶凝的淀粉分子的液化培养基。热处理步骤可以改善淀粉分子向糊精的转化和/或可以降低完成液化所需的时间。热处理步骤可以包括使液化培养基(其可以或可以不包括酶组合)经受液化温度并经受液化时间段。在一些实施方式中,在存在本文所描述的重组微生物宿主细胞和/或微生物产物的情况下发生淀粉液化。
在一些实施方式中,可以使用至少约50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、95℃、100℃、105℃或更高的液化温度。在一些进一步的实施方式中,液化温度在约60℃至85℃之间。在一些进一步的实施方式中,液化温度在约70℃至75℃之间。在一些进一步的实施方式中,液化温度在约80℃至85℃之间。当液化温度在约60℃至85℃之间时,可以维持约60分钟或更长的液化时间。
在一些另外的实施方式中,喷射式煮浆锅可以用于提供热处理步骤。在这些实施方式中,液化温度可以是至少约85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃、95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃或更高。仍在这些实施方式中,可以将液化温度维持约1分钟或更长的液化时间。
通过参考提供以说明本发明而不是限制其范围的以下实施例,将更容易理解本发明。
实施例I-异源磷脂酶的表达
将来自尖孢镰刀菌的磷脂酶整合到两个不同的酿酒酵母转化株/菌株。整合到酵母宿主细胞中的核酸分子编码具有SEQ ID NO:1的氨基酸序列的磷脂酶,并且与具有SEQID NO:2(第一转化株/菌株)或3(第二转化株/菌株)的氨基酸序列的信号序列一起表达。
表1.异源磷脂酶序列
确定生长速率以鉴定磷脂酶表达的影响。在30℃,在补充有40g/L葡萄糖的YPD培养基中确定生长速率。
当在转化株中引起磷脂酶表达时,不管所使用的信号序列,生长降低(参见表2)。对于研究具有不同信号序列的磷脂酶表达的影响,在30℃在具有20g/L葡萄糖的成分明确(synthetic defined)的酵母尿嘧啶缺陷型培养基中确定生长速率。
表2.生长24小时后(初始细胞密度~0.1),具有或不具有磷脂酶(PL)表达和具有不同的信号序列,不同培养的细胞密度。
这在图1A中也得到了显示,其中与野生型酿酒酵母菌株相比,表达酿酒酵母菌株(磷脂酶表达菌株)的工程化磷脂酶具有显著较低的生长速率。因此,异源磷脂酶的引入损害了酵母宿主细胞的生长速率。
实施例II-表达异源磷脂酶的酵母宿主细胞中PRB1、VPS5和VPS17的缺失
为了降低表达异源磷脂酶的毒性和生长速率损害,修饰实施例I中所描述的与具有SEQ ID NO:2的氨基酸序列的信号序列一起表达具有SEQ ID NO:1的氨基酸序列的磷脂酶的菌株以使得编码参与分泌途径的蛋白的某些天然基因缺失。在30℃,在补充有40g/L葡萄糖的YPD培养基(YPD40)中确定修饰的菌株的生长速率。
图1A显示通过缺失PRB1基因(通过除去编码液泡蛋白酶B的PRB1基因的起始密码子至终止密码子的开放阅读框),可以显著改善生长同时仍维持磷脂酶在培养上清液中的活性水平(将“磷脂酶表达株”的生长速率与“具有ΔPrb1的磷脂酶表达株”的生长速率相比)。通过PRB1缺失,与工程化但具有未修饰的PRB1基因的磷脂酶表达酿酒酵母菌株相比,表达磷脂酶的工程化酿酒酵母菌株显著改善生长速率(参见图1A)。
另外,如图1B所示,PRB1的缺失不会降低工程化酿酒酵母菌株的磷脂酶生产,并且作为替代,稍微提高磷脂在培养上清液中的活性水平,从而表明与野生型菌株相比,通过工程化酿酒酵母菌株的改善的磷脂酶的生产水平。使用Ped-A1(N-((6-(2,4-DNP)氨基)己酰)-1-(BODIPYTMFL C5)-2-己基-Sn-甘油基-3-磷酸乙醇胺)作为底物测量磷脂酶活性。在25℃,pH 5进行酶促反应10min。确定相对荧光单位(ΔRFU)的升高,其表示表观酶活性,其进而用于确定上清液中活性酶的量。
VPS5和VPS17是酿酒酵母的逆运体复合物中的两种蛋白,所述复合物负责将蛋白从液泡前体或晚期核内体室运输回到反面高尔基网(trans Golgi network)。图2A和图2B显示与无缺失的菌株相比,VPS5或VPS17的缺失(通过除去它们各个从起始密码子至终止密码子的开放阅读框)改善了工程化的表达磷脂酶的酿酒酵母菌株的生长速率(参见图2A-将“磷脂酶表达菌株”的生长速率与“具有ΔVps5的磷脂酶表达菌株”或者“具有ΔVps17的磷脂酶表达菌株”的生长速率相比较)。同样,与野生型菌株相比,VPS5和VPS17缺失还改善了通过工程化酿酒酵母菌株的磷脂酶的分泌或生产水平(参见图2B)。
实施例III-天然酵母伴侣在表达异源磷脂酶的酵母宿主细胞中的过表达
分子间和分子内二硫键的形成是分泌蛋白折叠中的关键步骤。据报道三种ER伴侣ERO1(ER氧化酶1)、PDI1(蛋白二硫键异构酶)和KAR2(核配合2)参与该过程。因此,对工程化酿酒酵母菌株研究了ERO1、PDI1和KAR2的过表达。将ERO1、PDI1和KAR2的表达盒(两者均来源于酿酒酵母(S.cerevisiae))引入作为非ERO1或PDI1的天然基因座的基因座(在中性整合位点)。使用对于ERO1或PDI1非天然,但是为天然酿酒酵母启动子/终止子的启动子和终止子。每个染色体引入每种基因的一个拷贝,总计每个细胞引入每个基因的3个拷贝(酵母宿主细胞是三倍体)。
图3A显示与无过表达的工程化的表达磷脂酶的酿酒酵母菌株相比,在工程化的表达磷脂酶的酿酒酵母菌株中同时过表达PDI1和ERO1改善了生长速率(将“磷脂酶表达菌株”的生长速率与“具有Pdi1和Ero1的过表达的磷脂酶表达菌株”的生长速率相比较)。
通过PDI1和ERO1同时过表达以及PRB1缺失,工程化的表达磷脂酶的酿酒酵母菌株不仅显著改善其生长速率,而且还改善磷脂酶分泌水平(参见图3B)。
实施例IV-对生长速率的影响
在YPD40中生长的细胞的指数生长期期间,确定实施例II和III中的工程化酿酒酵母菌株的最大生长速率。然后,与不表达磷脂酶的野生型菌株相比较。结果如表3和表4所示。
表3.实施例II中所描述的菌株的最大生长速率。WT=野生型,PL=磷脂酶,ΔVPS5=VPS5基因的失活,ΔVPS17=VPS17基因的失活。
菌株 | WT | 对照=WT+PL | WT+ΔVPS5+PL | WT+ΔVPS17+PL |
生长速率(h-1) | 1.47 | 0.5 | 1.1 | 0.77 |
与WT相比的生长 | 100.0% | 34.0% | 74.8% | 52.4% |
与对照相比的生长 | N.D. | 100% | 220% | 154% |
表4.实施例III中所描述的菌株的最大生长速率。WT=野生型,PL=磷脂酶,ΔPRB1=PRB1基因的失活,ERO1=ERO1基因的过表达,PDI1=PDI1基因的过表达,KAR2=KAR2基因的过表达。
实施例V-异源伏马菌素酯酶的表达
将异源伏马菌素酯酶基因的一个或多个拷贝整合到酿酒酵母菌株中并确定其对相应重组酵母宿主细胞的生长速率的影响。还确定另外的基因修饰的引入是否可以调节相应重组酵母宿主细胞的生长速率。表5提供了本实施例中测试的多种菌株的基因型。
表5.本实施例中存在的酿酒酵母菌株的基因型。FE3表示编码具有伏马菌素酯酶活性的SEQ ID NO:21的分泌多肽的异源基因。用于FE3表达的表达盒还包括来自α接合因子1基因的信号序列以允许多肽分泌并且随后在分泌后将其切割。PDI1(蛋白二硫键异构酶1)表示编码PDI1多肽的酿酒酵母(S.cerevisiae)基因的另外的拷贝的存在。ERO1(ER氧化酶1)是指编码ERO1多肽的酿酒酵母基因的另外的拷贝的存在。
/>
起初,将每个菌株在YPD40板上以小片生长,接种到5mL YPD40中并在35℃搅拌生长过夜。将过夜培养物(每个菌株重复三次)归一化至OD=1,稀释至1:1000并在YPD10培养基中在35℃生长72h。使用SpectramaxTM酶标仪,使用600nm下的光密度确定细胞生长。对每个菌株确定最大生长速率和达到OD 0.3的时间,并在表6中显示。达到OD 0.3的时间受生长速率以及延迟时间的影响。
表6.表5中所提供的菌株的最大生长速率
命名 | 最大生长速率(h-1) | 达到OD 0.3的时间(小时:分钟) |
M3836 | 0.40 | 10:40 |
M24868 | 0.38 | 11:00 |
M26599 | 0.23 | 13:30 |
M27750 | 0.17 | 22:10 |
M28728 | 0.19 | 20:00 |
M29002 | 0.21 | 16:50 |
M29004 | 0.18 | 18:10 |
M29005 | 0.22 | 13:50 |
M29019 | 0.17 | 12:40 |
M29020 | 0.20 | 14:20 |
M29021 | 0.17 | 16:30 |
M29022 | 0.15 | 15:50 |
M29023 | 0.24 | 13:20 |
M29028 | 0.23 | 12:50 |
M29029 | 0.18 | 15:20 |
如表6所示,异源FE3多肽的表达降低了酵母的最大生长速率和达到OD 0.3的时间(将不表达异源FE3多肽的M3836对照菌株与菌株M24686(编码FE3的基因的一个拷贝)、M26599(编码FE3的基因的三个拷贝)和M27750(编码FE3的基因的五个拷贝)相比较)。
当与缺少这种基因修饰的FE3表达菌株M27750相比时,FE3表达菌株M28728和M29004中天然基因vps5的缺失的确改善了生长速率(表6)。当与菌株M28728和M29004相比时,FE3表达菌株M29021和M29022中天然基因vps5的缺失以及异源PDI1/ERO1多肽的表达的组合进一步改善了达到OD 0.3的时间(表6)。
当与缺少这种基因修饰的FE3表达菌株M27750相比时,FE3表达菌株M29005中天然基因vps17的缺失的确改善了生长速率并且降低了达到OD 0.3的时间(表6)。当与菌株M29005 e相比时,FE3表达菌株M29023中天然基因vps17的缺失以及异源PDI1/ERO1多肽的表达的组合进一步改善了生长速率(表6)。
当与缺少这种基因修饰的FE3表达菌株M27750相比时,FE3表达菌株M29002中天然基因prb1的缺失的确改善了生长速率并且降低了达到OD 0.3的时间(表6)。当与菌株M29002相比时,FE3表达菌株M29019和M29020中天然基因prb1的缺失以及异源PDI1/ERO1多肽的表达的组合进一步改善了生长速率(表6)。
当与缺少这种基因修饰的FE3表达菌株M27750相比时,FE3表达菌株M29028和M29029中天然基因vps5和prb1的缺失的确改善了生长速率(表6)。
实施例VI-异源α-淀粉酶的表达
将异源α-淀粉酶基因的一个或多个拷贝整合到酿酒酵母菌株中并确定其表达对相应重组酵母宿主细胞的生长速率的影响。还确定PDI1的共表达是否也可以调节相应重组酵母宿主细胞的生长速率。表7提供了本实施例中测试的多种转化株/菌株的基因型。
表7.本实施例中存在的酿酒酵母菌株的基因型。AA表示编码具有α-淀粉酶活性的SEQ ID NO:22的分泌和拴系的多肽的异源基因。PDI1(蛋白二硫键异构酶1)表示编码PDI1多肽(SEQ ID NO:27)的酿酒酵母(S.cerevisiae)基因的另外的拷贝的存在。
酵母培养条件。将总计4个单个酵母转化株T11203和T11204在600μl YP-蔗糖(YPS)20g/L中,在96孔板中,在32℃以900rpm振荡生长48h。重复两次生长亲代对照M10580,并从小片YPD板接种。
生长速率确定。将来自48h培养物的1:1000稀释制备成新鲜YPS,并将100μl转移至Falcon圆底96孔板并在32℃,在Biotek Multitron酶标仪中培育,其中每10min测量光密度,测量48h。最大比生长速率(μmax)是发酵中细胞以最高比生长速率生长时的点,如通过以下方程所计算的:
μ=ln(N(t)-N0)/t
其中μ(h-1)是比生长速率并且N(t)是最终细胞密度,N0是初始细胞密度,并且t是样品之间的时间(单位h)。
异源α-淀粉酶的表达的确降低了表达它的酵母的最大生长速率(图4中,M10580与T11203的比较)。然而,异源α-淀粉酶以及PDI1的共表达的确至少部分恢复了表达两种多肽的酵母的最大生长速率(图4中,T11204与T11203的比较)。
α-淀粉酶活性确定(Ceralpha测定)。将150μl培养物等份转移到新鲜的200μl的96孔板并以3000g离心5min。根据建议规程(产品目录号#K-Cera),并使用以下修改,使用Megazyme Cerlpha测定独立评价分泌的(上清液)与细胞相关活性。将150μl培养物等份转移到新鲜的200μl的96孔板并以3000g离心5min。除去上清液并在测定中使用10μl上清液以及20ul AMY HR试剂,在50℃培育15min。用水清洗细胞颗粒2x,并用150μl Y’Per提取试剂(Thermo Scientific产品目录号#78991)在室温下处理20min,其中将10μl细胞溶液添加至20μl AMY HR试剂并在50℃培育30min。如图5所示,T11204的α-淀粉酶活性高于与T11203相关的活性。
参考文献
Farquhar,R.et al.Protein disulfide isomerase is essential forviability in Sacchavomyces cerevisiae.108,81-89(1991).
Frand,A.R.&Kaiser,C.A.The ERO1 gene of yeast is required foroxidation of protein dithiols in the endoplasmic reticulum.Mol.Cell 1,161-170(1998).
Frauenlob,J.,Scharl,M.,D’Amico,S.&Schoenlechner,R.Effect of differentlipases on bread staling in comparison with Diacetyl tartaric ester ofmonoglycerides(DATEM).Cereal Chem.95,367-372(2018).
Goesaert,H.et al.Wheat flour constituents:How they impact breadquality,and how to impact their functionality.in Trends in Food Science andTechnology 16,12-30(Elsevier,2005).
Houde,A.,Kademi,A.&Leblanc,D.Lipases and their industrialapplications:an overview.Appl.Biochem.Biotechnol.118,155-70(2004).
Huang,Mingtao,et al."Engineering the protein secretory pathway ofSaccharomyces cerevisiae enables improved protein production."Proceedings ofthe National Academy of Sciences 115.47(2018):E11025-E11032.
Kousuke Kuroda,Yoshinori Kitagawa,Kazuo Kobayashi,Haruhiko Tsumura,Toshihiro Komeda,Eiji Mori,Kazuhiro Motoki,Shiro Kataoka,Yasunori Chiba,Yoshifumi Jigami,Antibody expression in protease-deficient strains of themethylotrophic yeast Ogataea minuta,FEMS Yeast Research,Volume 7,Issue 8,December 2007,Pages 1307-1316
Marsalek,L.,Puxbaum,V.,Buchetics,M.et al.Disruption of vacuolarprotein sorting components of the HOPS complex leads to enhanced secretion ofrecombinant proteins in Pichia pastoris.Microb Cell Fact 18,119(2019).
Morozkina EV,Marchenko AN,Keruchenko JS,Keruchenko ID,Khotchenkov VP,Popov VO,Benevolensky SV.Proteinase B disruption is required for high levelproduction of human mechano-growth factor in Saccharomyces cerevisiae.J MolMicrobiol Biotechnol.2010;18(3):188-94.
Robinson,A.,Hines,V.&Wittrup,K.Protein Disulfide IsomeraseOverexpression Increases Secretion of Foreign Proteins in Saccharomycescerevisiae.Nat Biotechnol 12,381-384(1994).
de Ruijter JC,Koskela EV,Frey AD.Enhancing antibody folding andsecretion by tailoring the Saccharomyces cerevisiae endoplasmicreticulum.Microb Cell Fact.2016;15:87.Published 2016 May 23.
Smith JD,Tang BC,Robinson AS.Protein disulfide isomerase,but notbinding protein,overexpression enhances secretion of a non-disulfide-bondedprotein in yeast.Biotechnol Bioeng.2004 Feb 5;85(3)
Wentz AE,Shusta EV.A novel high-throughput screen reveals yeast genesthat increase secretion of heterologous proteins.Appl Environ Microbiol.2007;73(4):1189-1198.doi:10.1128/AEM.02427-06
Wu,M.,Shen,Q.,Yang,Y.et al.Disruption of YPS1 and PEP4 genes reducesproteolytic degradation of secreted HSA/PTH in Pichia pastoris GS115.J IndMicrobiol Biotechnol 40,589-599(2013)。
序列表
<110> 丹斯塔发酵股份公司(DANSTAR FERMENT AG)
<120> 具有提高的生长速率的重组酵母宿主细胞
<130> 55729550-54PCT
<140> 待分配
<141> 2022-01-26
<150> US 63/141,807
<151> 2021-01-26
<160> 27
<170> PatentIn version 3.5
<210> 1
<211> 331
<212> PRT
<213> 尖孢镰刀菌
<400> 1
Ser Pro Val Ala Leu Asp Asp Tyr Val Asn Ser Leu Glu Glu Arg Ala
1 5 10 15
Val Gly Val Thr Thr Thr Asp Phe Ser Asn Phe Lys Phe Tyr Ile Gln
20 25 30
His Gly Ala Ala Ala Tyr Cys Asn Ser Glu Ala Ala Ala Gly Ser Lys
35 40 45
Ile Thr Cys Ser Asn Asn Gly Cys Pro Thr Val Gln Gly Asn Gly Ala
50 55 60
Thr Ile Val Thr Ser Phe Val Gly Ser Lys Thr Gly Ile Gly Gly Tyr
65 70 75 80
Val Ala Thr Asp Ser Ala Arg Lys Glu Ile Val Val Ser Phe Arg Gly
85 90 95
Ser Ile Asn Ile Arg Asn Trp Leu Thr Asn Leu Asp Phe Gly Gln Glu
100 105 110
Asp Cys Ser Leu Val Ser Gly Cys Gly Val His Ser Gly Phe Gln Arg
115 120 125
Ala Trp Asn Glu Ile Ser Ser Gln Ala Thr Ala Ala Val Ala Ser Ala
130 135 140
Arg Lys Ala Asn Pro Ser Phe Asn Val Ile Ser Thr Gly His Ser Leu
145 150 155 160
Gly Gly Ala Val Ala Val Leu Ala Ala Ala Asn Leu Arg Val Gly Gly
165 170 175
Thr Pro Val Asp Ile Tyr Thr Tyr Gly Ser Pro Arg Val Gly Asn Ala
180 185 190
Gln Leu Ser Ala Phe Val Ser Asn Gln Ala Gly Gly Glu Tyr Arg Val
195 200 205
Thr His Ala Asp Asp Pro Val Pro Arg Leu Pro Pro Leu Ile Phe Gly
210 215 220
Tyr Arg His Thr Thr Pro Glu Phe Trp Leu Ser Gly Gly Gly Gly Asp
225 230 235 240
Lys Val Asp Tyr Thr Ile Ser Asp Val Lys Val Cys Glu Gly Ala Ala
245 250 255
Asn Leu Gly Cys Asn Gly Gly Thr Leu Gly Leu Asp Ile Ala Ala His
260 265 270
Leu His Tyr Phe Gln Ala Thr Asp Ala Cys Asn Ala Gly Gly Phe Ser
275 280 285
Trp Arg Arg Tyr Arg Ser Ala Glu Ser Val Asp Lys Arg Ala Thr Met
290 295 300
Thr Asp Ala Glu Leu Glu Lys Lys Leu Asn Ser Tyr Val Gln Met Asp
305 310 315 320
Lys Glu Tyr Val Lys Asn Asn Gln Ala Arg Ser
325 330
<210> 2
<211> 92
<212> PRT
<213> 人工序列
<220>
<223> 杂交信号序列
<400> 2
Met Arg Gln Val Trp Phe Ser Trp Ile Val Gly Leu Phe Leu Cys Phe
1 5 10 15
Phe Asn Val Ser Ser Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu
20 25 30
Thr Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu
35 40 45
Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn
50 55 60
Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu
65 70 75 80
Glu Gly Val Ser Leu Glu Lys Arg Glu Ala Glu Ala
85 90
<210> 3
<211> 15
<212> PRT
<213> 尖孢镰刀菌
<400> 3
Met Leu Leu Leu Pro Leu Leu Ser Ala Ile Thr Leu Ala Val Ala
1 5 10 15
<210> 4
<211> 316
<212> PRT
<213> 尖孢镰刀菌
<400> 4
Ala Val Gly Val Thr Thr Thr Asp Phe Ser Asn Phe Lys Phe Tyr Ile
1 5 10 15
Gln His Gly Ala Ala Ala Tyr Cys Asn Ser Glu Ala Ala Ala Gly Ser
20 25 30
Lys Ile Thr Cys Ser Asn Asn Gly Cys Pro Thr Val Gln Gly Asn Gly
35 40 45
Ala Thr Ile Val Thr Ser Phe Val Gly Ser Lys Thr Gly Ile Gly Gly
50 55 60
Tyr Val Ala Thr Asp Ser Ala Arg Lys Glu Ile Val Val Ser Phe Arg
65 70 75 80
Gly Ser Ile Asn Ile Arg Asn Trp Leu Thr Asn Leu Asp Phe Gly Gln
85 90 95
Glu Asp Cys Ser Leu Val Ser Gly Cys Gly Val His Ser Gly Phe Gln
100 105 110
Arg Ala Trp Asn Glu Ile Ser Ser Gln Ala Thr Ala Ala Val Ala Ser
115 120 125
Ala Arg Lys Ala Asn Pro Ser Phe Asn Val Ile Ser Thr Gly His Ser
130 135 140
Leu Gly Gly Ala Val Ala Val Leu Ala Ala Ala Asn Leu Arg Val Gly
145 150 155 160
Gly Thr Pro Val Asp Ile Tyr Thr Tyr Gly Ser Pro Arg Val Gly Asn
165 170 175
Ala Gln Leu Ser Ala Phe Val Ser Asn Gln Ala Gly Gly Glu Tyr Arg
180 185 190
Val Thr His Ala Asp Asp Pro Val Pro Arg Leu Pro Pro Leu Ile Phe
195 200 205
Gly Tyr Arg His Thr Thr Pro Glu Phe Trp Leu Ser Gly Gly Gly Gly
210 215 220
Asp Lys Val Asp Tyr Thr Ile Ser Asp Val Lys Val Cys Glu Gly Ala
225 230 235 240
Ala Asn Leu Gly Cys Asn Gly Gly Thr Leu Gly Leu Asp Ile Ala Ala
245 250 255
His Leu His Tyr Phe Gln Ala Thr Asp Ala Cys Asn Ala Gly Gly Phe
260 265 270
Ser Trp Arg Arg Tyr Arg Ser Ala Glu Ser Val Asp Lys Arg Ala Thr
275 280 285
Met Thr Asp Ala Glu Leu Glu Lys Lys Leu Asn Ser Tyr Val Gln Met
290 295 300
Asp Lys Glu Tyr Val Lys Asn Asn Gln Ala Arg Ser
305 310 315
<210> 5
<211> 19
<212> PRT
<213> 酿酒酵母
<400> 5
Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys
1 5 10 15
Ile Ser Ala
<210> 6
<211> 28
<212> PRT
<213> 酿酒酵母
<400> 6
Met Lys Phe Ser Ala Gly Ala Val Leu Ser Trp Ser Ser Leu Leu Leu
1 5 10 15
Ala Ser Ser Val Phe Ala Gln Gln Glu Ala Val Ala
20 25
<210> 7
<211> 26
<212> PRT
<213> 酿酒酵母
<400> 7
Met Thr Lys Pro Thr Gln Val Leu Val Arg Ser Val Ser Ile Leu Phe
1 5 10 15
Phe Ile Thr Leu Leu His Leu Val Val Ala
20 25
<210> 8
<211> 19
<212> PRT
<213> 酿酒酵母
<400> 8
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala
<210> 9
<211> 30
<212> PRT
<213> 尖孢镰刀菌
<400> 9
Met Leu Leu Leu Pro Leu Leu Ser Ala Ile Thr Leu Ala Val Ala Ser
1 5 10 15
Pro Val Ala Leu Asp Asp Tyr Val Asn Ser Leu Glu Glu Arg
20 25 30
<210> 10
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 10
Gly Gly Gly Gly Ser
1 5
<210> 11
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 11
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 12
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 12
Gly Gly Gly Gly Gly Gly Gly Gly
1 5
<210> 13
<211> 40
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 13
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser
35 40
<210> 14
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 14
Gly Ser Ala Gly Ser Ala Ala Gly Ser Gly Glu Phe
1 5 10
<210> 15
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 15
Glu Ala Ala Lys
1
<210> 16
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 16
Glu Ala Ala Ala Lys
1 5
<210> 17
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 17
Glu Ala Ala Lys Glu Ala Ala Lys Glu Ala Ala Lys
1 5 10
<210> 18
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 18
Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
1 5 10 15
Glu Ala Ala Ala Lys Ala Leu Glu Ala Glu Ala Ala Ala Lys Glu Ala
20 25 30
Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala
35 40 45
<210> 19
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 19
Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro
1 5 10 15
Ala Pro Ala Pro
20
<210> 20
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 接头序列
<400> 20
Lys Asp Asn Ser Ser Thr Ile Glu Gly Arg Tyr Pro Tyr Asp Val Pro
1 5 10 15
Asp Tyr Ala Leu Gln Ala
20
<210> 21
<211> 490
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 21
Phe Pro Val Arg Arg Thr Asp Leu Gly Gln Val Gln Gly Leu Ala Gly
1 5 10 15
Asp Val Ile Ser Phe Arg Gly Ile Pro Tyr Ala Ala Pro Pro Val Gly
20 25 30
Asp Leu Arg Trp Lys Pro Pro Gln His Ala Arg Pro Trp Ala Gly Val
35 40 45
Arg Pro Ala Thr Gln Phe Gly Ser Asp Cys Phe Gly Ala Ala Tyr Leu
50 55 60
Arg Lys Gly Ser Leu Ala Pro Gly Val Ser Glu Asp Cys Leu Tyr Leu
65 70 75 80
Asn Val Trp Ala Pro Ser Asp Ala Lys Pro Gly Gln Tyr Pro Val Met
85 90 95
Val Trp Val Tyr Gly Gly Gly Phe Ala Gly Gly Thr Ala Ala Met Pro
100 105 110
Tyr Tyr Asp Gly Glu Ala Leu Ala Arg Gln Gly Val Val Val Val Thr
115 120 125
Phe Asn Tyr Arg Thr Asn Ile Phe Gly Phe Phe Ala His Pro Gly Leu
130 135 140
Ser Arg Glu Ser Pro Thr Gly Thr Ser Gly Asn Tyr Gly Leu Leu Asp
145 150 155 160
Ile Leu Ala Ala Leu Arg Trp Val Gln Ser Asn Ala Arg Ala Phe Gly
165 170 175
Gly Asp Pro Gly Arg Val Thr Val Phe Gly Glu Ser Ala Gly Ala Ser
180 185 190
Ala Ile Gly Leu Leu Leu Thr Ser Pro Leu Ser Lys Gly Leu Phe Arg
195 200 205
Gly Ala Ile Leu Glu Ser Pro Gly Leu Thr Arg Pro Leu Ala Thr Leu
210 215 220
Ala Asp Ser Ala Ala Ser Gly Glu Arg Leu Asp Ala Asp Leu Ser Arg
225 230 235 240
Leu Arg Ser Thr Asp Pro Ala Thr Leu Met Ala Arg Ala Asp Ala Ala
245 250 255
Arg Pro Ala Ser Arg Asp Leu Arg Lys Pro Arg Pro Ile Gly Pro Ile
260 265 270
Val Asp Gly His Val Leu Pro Gln Thr Asp Ser Asp Ala Ile Ala Ala
275 280 285
Gly Gln Leu Ala Pro Val Pro Val Leu Ile Gly Thr Asn Ala Asp Glu
290 295 300
Gly Arg Ala Phe Leu Gly Arg Ala Pro Ile Glu Thr Pro Ala Asp Tyr
305 310 315 320
Gln Ala Tyr Leu Glu Ala Leu Phe Gly Asp Gln Ala Ala Ala Val Ala
325 330 335
Ala Cys Tyr Pro Leu Asp Gly Arg Ala Thr Pro Lys Glu Met Val Ala
340 345 350
Arg Ile Phe Gly Asp Asn Gln Phe Asn Arg Gly Val Ser Ala Phe Ser
355 360 365
Glu Ala Leu Val Arg His Gly Val Pro Val Trp Arg Tyr Gln Phe Ile
370 375 380
Gly Asn Thr Glu Asp Gly Arg Ala Pro Ala Thr His Gly Ala Glu Ile
385 390 395 400
Pro Tyr Val Phe Gly Val Phe Lys Leu Asp Glu Leu Gly Leu Phe Asp
405 410 415
Trp Pro Pro Glu Gly Pro Thr Leu Ala Asp Arg Ala Leu Cys Gln Leu
420 425 430
Met Ser Ser Ala Trp Val Arg Phe Ala Lys Asn Gly Asp Pro Ala Gly
435 440 445
Asp Ala Leu Thr Trp Pro Ala Tyr Ser Thr Gly Lys Ser Thr Met Thr
450 455 460
Phe Gly Pro Glu Gly Arg Ala Ala Val Val Ser Pro Gly Pro Ser Ile
465 470 475 480
Pro Ser Cys Ala Asp Gly Val Lys Ala Gly
485 490
<210> 22
<211> 597
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<220>
<221> 信号
<222> (1)...(19)
<400> 22
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
-15 -10 -5
Ala Leu Ala Glu Thr Leu Glu Asn Gly Gly Val Ile Met Gln Ala Phe
1 5 10
Tyr Trp Asp Val Pro Gly Gly Gly Ile Trp Asn Asp Thr Ile Ala Gln
15 20 25
Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro
30 35 40 45
Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro
50 55 60
Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Ser Val Glu
65 70 75
Thr Arg Phe Gly Ser Lys Glu Glu Leu Val Asn Met Ile Asn Thr Ala
80 85 90
His Ala His Asn Met Lys Val Ile Ala Asp Ile Val Ile Asn His Arg
95 100 105
Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Thr Asn Ser Tyr Thr Trp
110 115 120 125
Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu
130 135 140
Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly
145 150 155
Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln His Trp Leu
160 165 170
Trp Ala Ser Asn Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile
175 180 185
Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Ala Pro Trp Val Val
190 195 200 205
Lys Asn Trp Leu Asn Arg Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp
210 215 220
Asp Thr Asn Val Asp Ala Leu Leu Ser Trp Ala Tyr Asp Ser Gly Ala
225 230 235
Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp
240 245 250
Asn Asn Asn Ile Pro Ala Leu Val Asp Ala Leu Lys Asn Gly Gly Thr
255 260 265
Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn His
270 275 280 285
Asp Thr Asn Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu
290 295 300
Thr Tyr Glu Gly Gln Pro Ala Ile Phe Tyr Arg Asp Tyr Glu Glu Trp
305 310 315
Leu Asn Lys Asp Arg Leu Arg Asn Leu Ile Trp Ile His Asp His Leu
320 325 330
Ala Gly Gly Ser Thr Asp Ile Ile Tyr Tyr Asp Ser Asp Glu Leu Ile
335 340 345
Phe Val Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile
350 355 360 365
Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Val Tyr Val Pro Lys Phe
370 375 380
Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Ile
385 390 395
Asp Lys Trp Val Asp Ser Ser Gly Arg Val Tyr Leu Glu Ala Pro Ala
400 405 410
His Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys
415 420 425
Gly Val Gly Ala Glu Ala Ala Ala Lys Ala Leu Glu Ala Glu Ala Ala
430 435 440 445
Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala
450 455 460
Lys Ala Ala Ala Asn Val Thr Thr Ala Thr Val Ser Gln Glu Ser Thr
465 470 475
Thr Leu Val Thr Ile Thr Ser Cys Glu Asp His Val Cys Ser Glu Thr
480 485 490
Val Ser Pro Ala Leu Val Ser Thr Ala Thr Val Thr Val Asp Asp Val
495 500 505
Ile Thr Gln Tyr Thr Thr Trp Cys Pro Leu Thr Thr Glu Ala Pro Lys
510 515 520 525
Asn Gly Thr Ser Thr Ala Ala Pro Val Thr Ser Thr Glu Ala Pro Lys
530 535 540
Asn Thr Thr Ser Ala Ala Pro Thr His Ser Val Thr Ser Tyr Thr Gly
545 550 555
Ala Ala Ala Lys Ala Leu Pro Ala Ala Gly Ala Leu Leu Ala Gly Ala
560 565 570
Ala Ala Leu Leu Leu
575
<210> 23
<211> 432
<212> PRT
<213> 热水高温球菌(Thermococcus hydrothermalis)
<400> 23
Glu Thr Leu Glu Asn Gly Gly Val Ile Met Gln Ala Phe Tyr Trp Asp
1 5 10 15
Val Pro Gly Gly Gly Ile Trp Asn Asp Thr Ile Ala Gln Lys Ile Pro
20 25 30
Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser
35 40 45
Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe
50 55 60
Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Ser Val Glu Thr Arg Phe
65 70 75 80
Gly Ser Lys Glu Glu Leu Val Asn Met Ile Asn Thr Ala His Ala His
85 90 95
Asn Met Lys Val Ile Ala Asp Ile Val Ile Asn His Arg Ala Gly Gly
100 105 110
Asp Leu Glu Trp Asn Pro Phe Thr Asn Ser Tyr Thr Trp Thr Asp Phe
115 120 125
Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His
130 135 140
Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro
145 150 155 160
Asp Ile Cys His Asp Lys Ser Trp Asp Gln His Trp Leu Trp Ala Ser
165 170 175
Asn Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp
180 185 190
Arg Phe Asp Tyr Val Lys Gly Tyr Ala Pro Trp Val Val Lys Asn Trp
195 200 205
Leu Asn Arg Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp Asp Thr Asn
210 215 220
Val Asp Ala Leu Leu Ser Trp Ala Tyr Asp Ser Gly Ala Lys Val Phe
225 230 235 240
Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn
245 250 255
Ile Pro Ala Leu Val Asp Ala Leu Lys Asn Gly Gly Thr Val Val Ser
260 265 270
Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn His Asp Thr Asn
275 280 285
Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu
290 295 300
Gly Gln Pro Ala Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys
305 310 315 320
Asp Arg Leu Arg Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly
325 330 335
Ser Thr Asp Ile Ile Tyr Tyr Asp Ser Asp Glu Leu Ile Phe Val Arg
340 345 350
Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly
355 360 365
Ser Ser Lys Ala Gly Arg Trp Val Tyr Val Pro Lys Phe Ala Gly Ser
370 375 380
Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Ile Asp Lys Trp
385 390 395 400
Val Asp Ser Ser Gly Arg Val Tyr Leu Glu Ala Pro Ala His Asp Pro
405 410 415
Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys Gly Val Gly
420 425 430
<210> 24
<211> 19
<212> PRT
<213> 酿酒酵母
<400> 24
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala
<210> 25
<211> 34
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 25
Ala Glu Ala Ala Ala Lys Ala Leu Glu Ala Glu Ala Ala Ala Lys Glu
1 5 10 15
Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala Ala
20 25 30
Ala Asn
<210> 26
<211> 112
<212> PRT
<213> 酿酒酵母
<400> 26
Val Thr Thr Ala Thr Val Ser Gln Glu Ser Thr Thr Leu Val Thr Ile
1 5 10 15
Thr Ser Cys Glu Asp His Val Cys Ser Glu Thr Val Ser Pro Ala Leu
20 25 30
Val Ser Thr Ala Thr Val Thr Val Asp Asp Val Ile Thr Gln Tyr Thr
35 40 45
Thr Trp Cys Pro Leu Thr Thr Glu Ala Pro Lys Asn Gly Thr Ser Thr
50 55 60
Ala Ala Pro Val Thr Ser Thr Glu Ala Pro Lys Asn Thr Thr Ser Ala
65 70 75 80
Ala Pro Thr His Ser Val Thr Ser Tyr Thr Gly Ala Ala Ala Lys Ala
85 90 95
Leu Pro Ala Ala Gly Ala Leu Leu Ala Gly Ala Ala Ala Leu Leu Leu
100 105 110
<210> 27
<211> 529
<212> PRT
<213> 酿酒酵母
<400> 27
Met Lys Phe Ser Ala Gly Ala Val Leu Ser Trp Ser Ser Leu Leu Leu
1 5 10 15
Ala Ser Ser Val Phe Ala Gln Gln Glu Ala Val Ala Pro Glu Asp Ser
20 25 30
Ala Val Val Lys Leu Ala Thr Asp Ser Phe Asn Glu Tyr Ile Gln Ser
35 40 45
His Asp Leu Val Leu Ala Glu Phe Phe Ala Pro Trp Cys Gly His Cys
50 55 60
Lys Asn Met Ala Pro Glu Tyr Val Lys Ala Ala Glu Thr Leu Val Glu
65 70 75 80
Lys Asn Ile Thr Leu Ala Gln Ile Asp Cys Thr Glu Asn Gln Asp Leu
85 90 95
Cys Met Glu His Asn Ile Pro Gly Phe Pro Ser Leu Lys Ile Phe Lys
100 105 110
Asn Ser Asp Val Asn Asn Ser Ile Asp Tyr Glu Gly Pro Arg Thr Ala
115 120 125
Glu Ala Ile Val Gln Phe Met Ile Lys Gln Ser Gln Pro Ala Val Ala
130 135 140
Val Val Ala Asp Leu Pro Ala Tyr Leu Ala Asn Glu Thr Phe Val Thr
145 150 155 160
Pro Val Ile Val Gln Ser Gly Lys Ile Asp Ala Asp Phe Asn Ala Thr
165 170 175
Phe Tyr Ser Met Ala Asn Lys His Phe Asn Asp Tyr Asp Phe Val Ser
180 185 190
Ala Glu Asn Ala Asp Asp Asp Phe Lys Leu Ser Ile Tyr Leu Pro Ser
195 200 205
Ala Met Asp Glu Pro Val Val Tyr Asn Gly Lys Lys Ala Asp Ile Ala
210 215 220
Asp Ala Asp Val Phe Glu Lys Trp Leu Gln Val Glu Ala Leu Pro Tyr
225 230 235 240
Phe Gly Glu Ile Asp Gly Ser Val Phe Ala Gln Tyr Val Glu Ser Gly
245 250 255
Leu Pro Leu Gly Tyr Leu Phe Tyr Asn Asp Glu Glu Glu Leu Glu Glu
260 265 270
Tyr Lys Pro Leu Phe Thr Glu Leu Ala Lys Lys Asn Arg Gly Leu Met
275 280 285
Asn Phe Val Ser Ile Asp Ala Arg Lys Phe Gly Arg His Ala Gly Asn
290 295 300
Leu Asn Met Lys Glu Gln Phe Pro Leu Phe Ala Ile His Asp Met Thr
305 310 315 320
Glu Asp Leu Lys Tyr Gly Leu Pro Gln Leu Ser Glu Glu Ala Phe Asp
325 330 335
Glu Leu Ser Asp Lys Ile Val Leu Glu Ser Lys Ala Ile Glu Ser Leu
340 345 350
Val Lys Asp Phe Leu Lys Gly Asp Ala Ser Pro Ile Val Lys Ser Gln
355 360 365
Glu Ile Phe Glu Asn Gln Asp Ser Ser Val Phe Gln Leu Val Gly Lys
370 375 380
Asn His Asp Glu Ile Val Asn Asp Pro Lys Lys Asp Val Leu Val Leu
385 390 395 400
Tyr Tyr Ala Pro Trp Cys Gly His Cys Lys Arg Leu Ala Pro Thr Tyr
405 410 415
Gln Glu Leu Ala Asp Thr Tyr Ala Asn Ala Thr Ser Asp Val Leu Ile
420 425 430
Ala Lys Leu Asp His Thr Glu Asn Asp Val Arg Gly Val Val Ile Glu
435 440 445
Gly Tyr Pro Thr Ile Val Leu Tyr Pro Gly Gly Lys Lys Ser Glu Ser
450 455 460
Val Val Tyr Gln Gly Ser Arg Ser Leu Asp Ser Leu Phe Asp Phe Ile
465 470 475 480
Lys Glu Asn Gly His Phe Asp Val Asp Gly Lys Ala Leu Tyr Glu Glu
485 490 495
Ala Gln Glu Lys Ala Ala Glu Glu Ala Glu Ala Asp Ala Glu Ala Glu
500 505 510
Ala Asp Ala Asp Ala Glu Leu Ala Asp Glu Glu Asp Ala Ile His Asp
515 520 525
Glu
Claims (55)
1.一种重组酵母宿主细胞,具有:
(i)第一基因修饰,其用于(a)表达异源多肽或过表达天然多肽和(b)表达与所述异源多肽或所述天然多肽操作性地相关联的信号序列;和
(ii)第二基因修饰,其用于当与对照酵母宿主细胞的生长速率相比时,提高所述重组酵母宿主细胞的生长速率;
其中,所述对照酵母宿主细胞表达所述异源多肽或过表达所述天然多肽并且缺少所述第二基因修饰;并且
其中,当与亲代酵母宿主细胞相比时,所述异源多肽的表达或所述天然多肽的过表达阻碍所述对照酵母宿主细胞的生长速率。
2.根据权利要求1所述的重组酵母宿主细胞,包括编码所述异源多肽的第一异源核酸分子或编码所述天然多肽的第一天然核酸分子。
3.根据权利要求2所述的重组酵母宿主细胞,其中,所述第一异源核酸分子或所述第一天然核酸分子与增殖启动子或需氧启动子操作性地相关联。
4.根据权利要求1至3中任一项所述的重组酵母宿主细胞,其中,所述异源多肽或所述天然多肽被分泌或拴系。
5.根据权利要求1至4中任一项所述的重组酵母宿主细胞,其中,所述异源多肽或所述天然多肽是酶。
6.根据权利要求5所述的重组酵母宿主细胞,其中,所述异源多肽或所述天然多肽具有磷脂酶活性、伏马菌素酯酶活性或α-淀粉酶活性。
7.根据权利要求6所述的重组酵母宿主细胞,其中:
·具有磷脂酶活性的所述多肽包括SEQ ID NO:1或4的氨基酸序列,是具有磷脂酶活性的SEQ ID NO:1或4的氨基酸序列的变体,或是具有磷脂酶活性的SEQ ID NO:1或4的氨基酸序列的片段;
·具有伏马菌素酯酶活性的所述多肽包括SEQ ID NO:21的氨基酸序列,是具有伏马菌素酯酶活性的SEQ ID NO:21的氨基酸序列的变体,或是具有伏马菌素酯酶活性的SEQ IDNO:21的氨基酸序列的片段;或
·具有α-淀粉酶活性的所述多肽包括SEQ ID NO:23的氨基酸序列,是具有α-淀粉酶活性的SEQ ID NO:23的氨基酸序列的变体,或是具有α-淀粉酶活性的SEQ ID NO:23的氨基酸序列的片段。
8.根据权利要求1至7中任一项所述的重组酵母宿主细胞,其中,所述信号序列包括SEQID NO:2、3或24的氨基酸序列,是SEQ ID NO:2、3或24的氨基酸序列的变体或是SEQ ID NO:2、3或24的片段。
9.根据权利要求1至8中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰是酵母蛋白分泌和运输途径中的修饰。
10.根据权利要求9所述的重组酵母宿主细胞,其中,所述第二基因修饰是:
·酵母翻译途径的修饰中的一个或多个;
·酵母翻译后修饰途径的修饰中的一个或多个;
·酵母蛋白运输途径的修饰中的一个或多个;
·酵母液泡途径的修饰中的一个或多个;
·酵母细胞壁稳定性途径的修饰中的一个或多个;或
·它们的组合。
11.根据权利要求9或10所述的重组酵母宿主细胞,其中,所述第二基因修饰包括参与内质网(ER)中多肽折叠、糖基化和降解的基因的表达的调节。
12.根据权利要求11所述的重组酵母宿主细胞,其中,所述第二基因修饰包括与分子伴侣相关联的基因的表达的调节。
13.根据权利要求12所述的重组酵母宿主细胞,其中,所述与分子伴侣相关联的基因包括KAR2基因、LHS1基因、JEM1基因、SSA1基因、SSA4基因和/或SSE1基因。
14.根据权利要求11至13中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括与未折叠蛋白反应(UPR)相关联的基因的表达的调节。
15.根据权利要求14所述的重组酵母宿主细胞,其中,与UPR相关联的基因包括HAC1基因、IRE1基因、和/或KIN2基因。
16.根据权利要求9至15中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括与氧化还原酶相关联的基因的表达的调节。
17.根据权利要求16所述的重组酵母宿主细胞,其中,所述与氧化还原酶相关联的基因包括PDI1基因、ERO1基因、和/或CPR5基因。
18.根据权利要求9至17中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括参与内质网相关降解途径(ERAD)的基因的表达的调节。
19.根据权利要求18所述的重组酵母宿主细胞,其中,参与ERAD的基因包括HTM1基因、YOS9基因、HDR1基因、HDR3基因、UBC7基因、和/或DER1基因。
20.根据权利要求9至19中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括参与内质网(ER)膨胀的基因的表达的调节。
21.根据权利要求20所述的重组酵母宿主细胞,其中,参与ER膨胀的基因包括OPI1基因、和/或PAH1基因。
22.根据权利要求9至21中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括参与向内质网(ER)易位的基因的表达的调节。
23.根据权利要求22所述的重组酵母宿主细胞,其中,参与向ER易位的基因是SIL1基因。
24.根据权利要求9至23中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括参与多肽从ER向高尔基系统和/或从高尔基系统向质膜运输的基因的表达的调节。
25.根据权利要求24所述的重组酵母宿主细胞,其中,所述第二基因修饰包括与COPII囊泡相关联的基因的表达的调节。
26.根据权利要求25所述的重组酵母宿主细胞,其中,所述与COPII囊泡相关联的基因包括ERV25基因、ERV29基因、SAR1基因、SEC12基因、SEC13基因、SEC16基因、SEC23基因、SE24基因、SEC31基因、SBH1基因、COG5基因、COG6基因、BOS1基因、COY1基因、和/或SLY1基因。
27.根据权利要求24至26中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括与COPI囊泡相关联的基因的表达的调节。
28.根据权利要求27所述的重组酵母宿主细胞,其中,所述与COPI囊泡相关联的基因包括GOS1基因、和/或LAM1基因。
29.根据权利要求24至28中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括与核内体相关联的基因的表达的调节。
30.根据权利要求29所述的重组酵母宿主细胞,其中,所述与核内体相关联的基因包括VPS5基因、VPS17基因、VPS26基因、VPS29基因、和/或VPS35基因。
31.根据权利要求9至30中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括参与多肽从高尔基系统向质膜运输的基因的表达的调节。
32.根据权利要求31所述的重组酵母宿主细胞,其中,所述参与多肽从高尔基系统向质膜运输的基因包括SEC1基因、SEC4基因、SSO1基因、SSO2基因、SNC2基因、EXO70基因、和/或YPT32基因。
33.根据权利要求9至32中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括参与液泡分选途径的基因的表达的调节。
34.根据权利要求33所述的重组酵母宿主细胞,其中,所述第二基因修饰包括与液泡蛋白酶相关联的基因的表达的调节。
35.根据权利要求34所述的重组酵母宿主细胞,其中,所述与液泡蛋白酶相关联的基因是PRB1基因、VMA3基因、和/或PEP4基因。
36.根据权利要求33至35中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括与多肽向液泡运输相关联的基因的表达的调节。
37.根据权利要求36所述的重组酵母宿主细胞,其中,所述与多肽向液泡运输相关联的基因包括VPS8基因、和/或VPS21基因。
38.根据权利要求33至37中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括参与自噬的基因的表达的调节。
39.根据权利要求38所述的重组酵母宿主细胞,其中,所述参与自噬的基因包括MTC6基因、和/或SEC4基因。
40.根据权利要求9至39中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括与细胞壁甘露糖蛋白相关联的基因的表达的调节。
41.根据权利要求40所述的重组酵母宿主细胞,其中,所述与细胞壁甘露糖蛋白相关联的基因包括CCW12基因、和/或CWP2基因。
42.根据权利要求9至41中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括与细胞壁糖蛋白相关联的基因的表达的调节。
43.根据权利要求42所述的重组酵母宿主细胞,其中,编码所述细胞壁糖蛋白的基因是天然SED1基因。
44.根据权利要求9至43中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括参与转录和/或翻译的基因的表达的调节。
45.根据权利要求44所述的重组酵母宿主细胞,其中,所述参与转录和/或翻译的基因包括BMH2基因、HSF1基因、SRP14基因、和/或SRP54基因。
46.根据权利要求9至45中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括与核糖体相关联的基因的表达的调节。
47.根据权利要求46所述的重组酵母宿主细胞,其中,所述与核糖体相关联的基因包括BFR2基因、和/或RPP0基因。
48.根据权利要求9至47中任一项所述的重组酵母宿主细胞,其中,所述第二基因修饰包括与参与分泌途径的前蛋白激活的蛋白酶相关联的基因的表达的调节。
49.根据权利要求48所述的重组酵母宿主细胞,其中,所述与参与分泌途径的前蛋白激活的蛋白酶相关联的基因是KEX2基因。
50.根据权利要求1至49中任一项所述的重组酵母宿主细胞,其中,所述重组酵母宿主细胞来自酵母菌(Saccharomyces sp.)属和/或来自酿酒酵母(Saccharomycescerevisiae)种。
51.一种用于使权利要求1至50中任一项所述的重组酵母宿主细胞增殖的方法,所述方法包括在允许所述重组酵母宿主细胞增殖的条件下,在培养基中培养所述重组酵母宿主细胞。
52.根据权利要求51所述的方法,其中,所述方法是需氧的。
53.根据权利要求51或52所述的方法,还包括从所述培养基分离所述异源多肽或所述天然多肽。
54.根据权利要求51至53中任一项所述的方法,还包括提供所述重组酵母宿主细胞。
55.根据权利要求54所述的方法,还包括在亲代酵母宿主细胞中引入权利要求1至49任一项中限定的所述第一基因修饰和所述第二基因修饰。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163141807P | 2021-01-26 | 2021-01-26 | |
US63/141,807 | 2021-01-26 | ||
PCT/IB2022/050686 WO2022162559A2 (en) | 2021-01-26 | 2022-01-26 | Recombinant yeast host cell having enhanced growth rate |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116888142A true CN116888142A (zh) | 2023-10-13 |
Family
ID=80777769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280011913.6A Pending CN116888142A (zh) | 2021-01-26 | 2022-01-26 | 具有提高的生长速率的重组酵母宿主细胞 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20240084244A1 (zh) |
EP (1) | EP4284817A2 (zh) |
CN (1) | CN116888142A (zh) |
IL (1) | IL304399A (zh) |
MX (1) | MX2023008732A (zh) |
WO (1) | WO2022162559A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115558611A (zh) * | 2022-10-24 | 2023-01-03 | 贵州大学 | 一种高絮凝性的日本裂殖酵母菌株及其应用 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024006888A1 (en) * | 2022-06-30 | 2024-01-04 | Ginkgo Bioworks, Inc. | Improved host cells |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1994008012A1 (en) * | 1992-10-02 | 1994-04-14 | Research Corporation Technologies, Inc. | Methods for increasing secretion of overexpressed proteins |
US6025188A (en) | 1994-08-12 | 2000-02-15 | Pioneer Hi-Bred International, Inc. | Fumonisin detoxification compositions and methods |
CA2997380A1 (en) | 2015-09-04 | 2017-03-09 | Lallemand Hungary Liquidity Management Llc | Yeast strains for the expression and secretion of heterologous proteins at high temperatures |
MX2019000209A (es) | 2016-07-01 | 2019-11-12 | Lallemand Hungary Liquidity Man Llc | Alfa-amilasas para combinacion con glucoamilasas para mejorar la sacarificacion. |
AU2018234446B2 (en) | 2017-03-13 | 2024-02-08 | Danstar Ferment Ag | Cell-associated heterologous food and/or feed enzymes |
US20220127564A1 (en) | 2017-03-13 | 2022-04-28 | Lallemand Hungary Liquidity Management Llc | Recombinant yeast host cells expressing cell-associated heterologous proteins |
US20210024909A1 (en) | 2018-03-26 | 2021-01-28 | Lallemand Hungary Liquidity Management Llc | Chimeric amylases comprising an heterologous starch binding domain |
-
2022
- 2022-01-26 MX MX2023008732A patent/MX2023008732A/es unknown
- 2022-01-26 US US18/262,336 patent/US20240084244A1/en active Pending
- 2022-01-26 EP EP22704426.0A patent/EP4284817A2/en active Pending
- 2022-01-26 CN CN202280011913.6A patent/CN116888142A/zh active Pending
- 2022-01-26 WO PCT/IB2022/050686 patent/WO2022162559A2/en active Application Filing
-
2023
- 2023-07-11 IL IL304399A patent/IL304399A/en unknown
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115558611A (zh) * | 2022-10-24 | 2023-01-03 | 贵州大学 | 一种高絮凝性的日本裂殖酵母菌株及其应用 |
CN115558611B (zh) * | 2022-10-24 | 2024-02-23 | 贵州大学 | 一种高絮凝性的日本裂殖酵母菌株及其应用 |
Also Published As
Publication number | Publication date |
---|---|
MX2023008732A (es) | 2023-08-01 |
EP4284817A2 (en) | 2023-12-06 |
WO2022162559A2 (en) | 2022-08-04 |
WO2022162559A3 (en) | 2022-09-09 |
US20240084244A1 (en) | 2024-03-14 |
IL304399A (en) | 2023-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11332728B2 (en) | Yeast strains for the expression and secretion of heterologous proteins at high temperatures | |
US20220127564A1 (en) | Recombinant yeast host cells expressing cell-associated heterologous proteins | |
EP3596200B1 (en) | Cell-associated heterologous food and/or feed enzymes | |
JP6537076B2 (ja) | 分泌シグナルペプチドならびにそれを利用したタンパク質の分泌および細胞表層提示 | |
CA2748135A1 (en) | Heterologous biomass degrading enzyme expression in thermoanaerobacterium saccharolyticum | |
US20240084244A1 (en) | Recombinant yeast host cell having enhanced growth rate | |
MX2015005427A (es) | Beta-glucosidasa de magnaporthe grisea. | |
MX2015005425A (es) | Composiciones y metodos de uso. | |
JP6335161B2 (ja) | 細胞表層発現用ポリヌクレオチド | |
US20230108132A1 (en) | Variant g6p g7p glucoamylase compositions and methods | |
US11891641B2 (en) | Optimization of yeast host cells for the production of heterologous proteins | |
EP2841589B1 (en) | Polypeptide expression method | |
Kim et al. | Efficient secretory expression of recombinant endoxylanase from Bacillus sp. HY-20 in Saccharomyces cerevisiae | |
Ghasemian et al. | Production of recombinant microbial thermostable lipases | |
WO2020190782A1 (en) | Improved lipase for defoaming | |
JP7194112B2 (ja) | 細胞結合型異種タンパク質を発現する組換え酵母宿主細胞 | |
US20240182882A1 (en) | Optimization of yeast host cells for the production of heterologous proteins | |
WO2023187753A1 (en) | N-terminus engineering of intracellular polypeptides expressed in recombinant eukaryotic host cells | |
Ueda et al. | Genetic Immobilization of Enzymes on Yeast Cell Surface | |
Nascimento | Production of recombinant α-amylase from Bacillus subtilis by Kluyveromyces lactis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |