KR20210005054A - 점도 감소 표현형을 포함하는 사상성 진균 균주 - Google Patents
점도 감소 표현형을 포함하는 사상성 진균 균주 Download PDFInfo
- Publication number
- KR20210005054A KR20210005054A KR1020207032226A KR20207032226A KR20210005054A KR 20210005054 A KR20210005054 A KR 20210005054A KR 1020207032226 A KR1020207032226 A KR 1020207032226A KR 20207032226 A KR20207032226 A KR 20207032226A KR 20210005054 A KR20210005054 A KR 20210005054A
- Authority
- KR
- South Korea
- Prior art keywords
- ser
- pro
- ala
- leu
- arg
- Prior art date
Links
- 230000002538 fungal effect Effects 0.000 title claims description 83
- 230000002829 reductive effect Effects 0.000 title claims description 74
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 749
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 393
- 238000000034 method Methods 0.000 claims abstract description 111
- 238000012239 gene modification Methods 0.000 claims abstract description 98
- 230000005017 genetic modification Effects 0.000 claims abstract description 97
- 235000013617 genetically modified food Nutrition 0.000 claims abstract description 97
- 241000233866 Fungi Species 0.000 claims abstract description 88
- 238000007654 immersion Methods 0.000 claims abstract description 33
- 150000007523 nucleic acids Chemical group 0.000 claims description 128
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 108
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 70
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 52
- 239000001301 oxygen Substances 0.000 claims description 52
- 229910052760 oxygen Inorganic materials 0.000 claims description 52
- 238000013019 agitation Methods 0.000 claims description 49
- 238000009396 hybridization Methods 0.000 claims description 45
- 241000223259 Trichoderma Species 0.000 claims description 42
- 230000000295 complement effect Effects 0.000 claims description 29
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 28
- 239000002028 Biomass Substances 0.000 claims description 22
- 230000001965 increasing effect Effects 0.000 claims description 21
- 238000010564 aerobic fermentation Methods 0.000 claims description 20
- 238000012216 screening Methods 0.000 claims description 14
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 claims description 13
- 101100256357 Schizosaccharomyces pombe (strain 972 / ATCC 24843) seb1 gene Proteins 0.000 claims description 13
- 101100275159 Arabidopsis thaliana COBL7 gene Proteins 0.000 claims description 12
- 101100180341 Arabidopsis thaliana IWS1 gene Proteins 0.000 claims description 12
- 101150011071 CRZ1 gene Proteins 0.000 claims description 12
- 102100036683 Growth arrest-specific protein 1 Human genes 0.000 claims description 12
- 101001072723 Homo sapiens Growth arrest-specific protein 1 Proteins 0.000 claims description 12
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 claims description 12
- 101150005224 SBH1 gene Proteins 0.000 claims description 12
- 101100042408 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SFB3 gene Proteins 0.000 claims description 12
- 108091036078 conserved sequence Proteins 0.000 claims description 8
- 241000228257 Aspergillus sp. Species 0.000 claims description 7
- 241000088436 Neurospora sp. Species 0.000 claims description 7
- 241001149959 Fusarium sp. Species 0.000 claims description 5
- 241000228168 Penicillium sp. Species 0.000 claims description 5
- 241000235349 Ascomycota Species 0.000 claims description 3
- 241001203365 Myceliophthora sp. Species 0.000 claims description 3
- 241001207467 Talaromyces sp. Species 0.000 claims description 3
- 241001557886 Trichoderma sp. Species 0.000 claims description 2
- 230000012010 growth Effects 0.000 abstract description 24
- 102000004190 Enzymes Human genes 0.000 abstract description 17
- 108090000790 Enzymes Proteins 0.000 abstract description 17
- 238000011031 large-scale manufacturing process Methods 0.000 abstract description 4
- 239000002207 metabolite Substances 0.000 abstract description 4
- 235000018102 proteins Nutrition 0.000 description 365
- 210000004027 cell Anatomy 0.000 description 221
- 108020004414 DNA Proteins 0.000 description 68
- 235000001014 amino acid Nutrition 0.000 description 64
- 108700028369 Alleles Proteins 0.000 description 62
- 235000010633 broth Nutrition 0.000 description 57
- 108091026890 Coding region Proteins 0.000 description 47
- 230000014509 gene expression Effects 0.000 description 40
- 239000002773 nucleotide Substances 0.000 description 39
- 125000003729 nucleotide group Chemical group 0.000 description 39
- 229940024606 amino acid Drugs 0.000 description 38
- 150000001413 amino acids Chemical class 0.000 description 38
- 102000039446 nucleic acids Human genes 0.000 description 37
- 108020004707 nucleic acids Proteins 0.000 description 37
- 238000012217 deletion Methods 0.000 description 35
- 230000037430 deletion Effects 0.000 description 35
- 238000000855 fermentation Methods 0.000 description 31
- 230000004151 fermentation Effects 0.000 description 31
- 239000003550 marker Substances 0.000 description 28
- 239000013612 plasmid Substances 0.000 description 28
- 241000880493 Leptailurus serval Species 0.000 description 27
- 108010026333 seryl-proline Proteins 0.000 description 27
- 108010057821 leucylproline Proteins 0.000 description 26
- 239000013598 vector Substances 0.000 description 26
- 108091033409 CRISPR Proteins 0.000 description 24
- -1 for example Chemical class 0.000 description 24
- 239000012634 fragment Substances 0.000 description 24
- 230000035772 mutation Effects 0.000 description 22
- 108010050848 glycylleucine Proteins 0.000 description 20
- 230000014616 translation Effects 0.000 description 20
- 108010087924 alanylproline Proteins 0.000 description 19
- 238000002703 mutagenesis Methods 0.000 description 19
- 231100000350 mutagenesis Toxicity 0.000 description 19
- 108090000765 processed proteins & peptides Proteins 0.000 description 19
- 230000000670 limiting effect Effects 0.000 description 18
- 239000002609 medium Substances 0.000 description 18
- 102000004196 processed proteins & peptides Human genes 0.000 description 18
- 108700005088 Fungal Genes Proteins 0.000 description 17
- 108020005004 Guide RNA Proteins 0.000 description 17
- 101100032157 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) pyr2 gene Proteins 0.000 description 17
- 229920001184 polypeptide Polymers 0.000 description 17
- 108700026244 Open Reading Frames Proteins 0.000 description 16
- 229940088598 enzyme Drugs 0.000 description 16
- 230000037433 frameshift Effects 0.000 description 16
- 238000004519 manufacturing process Methods 0.000 description 16
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 15
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 15
- 108010038633 aspartylglutamate Proteins 0.000 description 15
- 239000008103 glucose Substances 0.000 description 15
- 230000000875 corresponding effect Effects 0.000 description 14
- 108010049041 glutamylalanine Proteins 0.000 description 14
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 13
- 108010028295 histidylhistidine Proteins 0.000 description 13
- 230000001105 regulatory effect Effects 0.000 description 13
- 238000006467 substitution reaction Methods 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- 230000035897 transcription Effects 0.000 description 13
- 230000009466 transformation Effects 0.000 description 13
- 108010042407 Endonucleases Proteins 0.000 description 12
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 12
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 12
- 230000004048 modification Effects 0.000 description 12
- 238000012986 modification Methods 0.000 description 12
- 108010031719 prolyl-serine Proteins 0.000 description 12
- 108010004914 prolylarginine Proteins 0.000 description 12
- 108010053725 prolylvaline Proteins 0.000 description 12
- 238000013519 translation Methods 0.000 description 12
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 11
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 11
- 108010044940 alanylglutamine Proteins 0.000 description 11
- 108010047495 alanylglycine Proteins 0.000 description 11
- 108010060035 arginylproline Proteins 0.000 description 11
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 11
- 241000894007 species Species 0.000 description 11
- 108010061238 threonyl-glycine Proteins 0.000 description 11
- 241000228212 Aspergillus Species 0.000 description 10
- 102000004316 Oxidoreductases Human genes 0.000 description 10
- 108090000854 Oxidoreductases Proteins 0.000 description 10
- 108010005233 alanylglutamic acid Proteins 0.000 description 10
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 10
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 10
- 230000007423 decrease Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 231100000221 frame shift mutation induction Toxicity 0.000 description 10
- 238000010362 genome editing Methods 0.000 description 10
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 10
- 108010018006 histidylserine Proteins 0.000 description 10
- 230000008676 import Effects 0.000 description 10
- 238000003780 insertion Methods 0.000 description 10
- 230000037431 insertion Effects 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- 230000008685 targeting Effects 0.000 description 10
- 108020004705 Codon Proteins 0.000 description 9
- 102100031780 Endonuclease Human genes 0.000 description 9
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 9
- 241001112258 Moca Species 0.000 description 9
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 9
- 230000004075 alteration Effects 0.000 description 9
- 108010093581 aspartyl-proline Proteins 0.000 description 9
- 108010092854 aspartyllysine Proteins 0.000 description 9
- 210000000349 chromosome Anatomy 0.000 description 9
- 230000002950 deficient Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000002068 genetic effect Effects 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 108010077112 prolyl-proline Proteins 0.000 description 9
- 108010048818 seryl-histidine Proteins 0.000 description 9
- 238000003756 stirring Methods 0.000 description 9
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 8
- 108700038907 MIT domains Proteins 0.000 description 8
- 102000051516 MIT domains Human genes 0.000 description 8
- 125000000539 amino acid group Chemical group 0.000 description 8
- 108010089804 glycyl-threonine Proteins 0.000 description 8
- 238000002744 homologous recombination Methods 0.000 description 8
- 230000006801 homologous recombination Effects 0.000 description 8
- 230000036961 partial effect Effects 0.000 description 8
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 7
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 7
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 7
- 108700024394 Exon Proteins 0.000 description 7
- 241000223218 Fusarium Species 0.000 description 7
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 7
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 7
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 7
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 7
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 7
- 108010079364 N-glycylalanine Proteins 0.000 description 7
- 101710163270 Nuclease Proteins 0.000 description 7
- 241000228143 Penicillium Species 0.000 description 7
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 7
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 7
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 7
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 7
- 108091023045 Untranslated Region Proteins 0.000 description 7
- 108010013835 arginine glutamate Proteins 0.000 description 7
- 108010062796 arginyllysine Proteins 0.000 description 7
- 108010077245 asparaginyl-proline Proteins 0.000 description 7
- 230000002209 hydrophobic effect Effects 0.000 description 7
- 230000010354 integration Effects 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- 108091033319 polynucleotide Proteins 0.000 description 7
- 102000040430 polynucleotide Human genes 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 108010071207 serylmethionine Proteins 0.000 description 7
- 108010073969 valyllysine Proteins 0.000 description 7
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 6
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 6
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 6
- 108010059892 Cellulase Proteins 0.000 description 6
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 6
- 102000004157 Hydrolases Human genes 0.000 description 6
- 108090000604 Hydrolases Proteins 0.000 description 6
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 6
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 6
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 6
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 6
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 6
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 6
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 6
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 6
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 6
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 6
- 241000499912 Trichoderma reesei Species 0.000 description 6
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 6
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 6
- 108010041407 alanylaspartic acid Proteins 0.000 description 6
- 230000000692 anti-sense effect Effects 0.000 description 6
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 6
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 6
- 229940106157 cellulase Drugs 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 239000003623 enhancer Substances 0.000 description 6
- 108010010147 glycylglutamine Proteins 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 108010051242 phenylalanylserine Proteins 0.000 description 6
- 108010029020 prolylglycine Proteins 0.000 description 6
- 108010090894 prolylleucine Proteins 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 5
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 5
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 5
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 5
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 5
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 5
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 5
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 5
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 5
- 108090000371 Esterases Proteins 0.000 description 5
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 5
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 5
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 5
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 5
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 5
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 5
- 102000004317 Lyases Human genes 0.000 description 5
- 108090000856 Lyases Proteins 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 5
- 102000035195 Peptidases Human genes 0.000 description 5
- 108091005804 Peptidases Proteins 0.000 description 5
- 108010059820 Polygalacturonase Proteins 0.000 description 5
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 5
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 5
- 238000003559 RNA-seq method Methods 0.000 description 5
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 5
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 5
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 5
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 5
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 5
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 5
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 5
- 238000010459 TALEN Methods 0.000 description 5
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 5
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 108010068380 arginylarginine Proteins 0.000 description 5
- 108010068265 aspartyltyrosine Proteins 0.000 description 5
- 230000027455 binding Effects 0.000 description 5
- 230000006378 damage Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 108010093305 exopolygalacturonase Proteins 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 238000012224 gene deletion Methods 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 108010027338 isoleucylcysteine Proteins 0.000 description 5
- 108010003700 lysyl aspartic acid Proteins 0.000 description 5
- 108010064235 lysylglycine Proteins 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 230000001131 transforming effect Effects 0.000 description 5
- 108010080629 tryptophan-leucine Proteins 0.000 description 5
- 108020005345 3' Untranslated Regions Proteins 0.000 description 4
- 108020003589 5' Untranslated Regions Proteins 0.000 description 4
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 4
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 4
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 4
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 4
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 4
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 4
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 4
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 4
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 4
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 4
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 4
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 4
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 4
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 4
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 4
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 4
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 4
- WTFIFQWLQXZLIZ-UMPQAUOISA-N Arg-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O WTFIFQWLQXZLIZ-UMPQAUOISA-N 0.000 description 4
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 4
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 4
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 4
- 238000010354 CRISPR gene editing Methods 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 102000003846 Carbonic anhydrases Human genes 0.000 description 4
- 108090000209 Carbonic anhydrases Proteins 0.000 description 4
- JTNKVWLMDHIUOG-IHRRRGAJSA-N Cys-Arg-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JTNKVWLMDHIUOG-IHRRRGAJSA-N 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 4
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 4
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 4
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 4
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 4
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 4
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 4
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 4
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 4
- 102100022624 Glucoamylase Human genes 0.000 description 4
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 4
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 4
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 4
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 4
- YJBMLTVVVRJNOK-SRVKXCTJSA-N His-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N YJBMLTVVVRJNOK-SRVKXCTJSA-N 0.000 description 4
- LCNNHVQNFNJLGK-AVGNSLFASA-N His-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N LCNNHVQNFNJLGK-AVGNSLFASA-N 0.000 description 4
- FHKZHRMERJUXRJ-DCAQKATOSA-N His-Ser-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 FHKZHRMERJUXRJ-DCAQKATOSA-N 0.000 description 4
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 4
- 108010065920 Insulin Lispro Proteins 0.000 description 4
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 4
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 4
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 4
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 4
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 4
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 4
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 4
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 4
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 4
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 4
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 4
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 4
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 4
- 108090000364 Ligases Proteins 0.000 description 4
- 102000003960 Ligases Human genes 0.000 description 4
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 4
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 4
- 108010066427 N-valyltryptophan Proteins 0.000 description 4
- 241000221960 Neurospora Species 0.000 description 4
- MMPBPRXOFJNCCN-ZEWNOJEFSA-N Phe-Tyr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MMPBPRXOFJNCCN-ZEWNOJEFSA-N 0.000 description 4
- VIIRRNQMMIHYHQ-XHSDSOJGSA-N Phe-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N VIIRRNQMMIHYHQ-XHSDSOJGSA-N 0.000 description 4
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 4
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 4
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 4
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 4
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 4
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 4
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 4
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 4
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 4
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 4
- XERQKTRGJIKTRB-CIUDSAMLSA-N Ser-His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CN=CN1 XERQKTRGJIKTRB-CIUDSAMLSA-N 0.000 description 4
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 4
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 4
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 4
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 4
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 4
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 4
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 4
- WMZVVNLPHFSUPA-BPUTZDHNSA-N Ser-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 WMZVVNLPHFSUPA-BPUTZDHNSA-N 0.000 description 4
- SYCFMSYTIFXWAJ-DCAQKATOSA-N Ser-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N SYCFMSYTIFXWAJ-DCAQKATOSA-N 0.000 description 4
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 4
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 4
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 4
- YLGQHMHKAASRGJ-WDSOQIARSA-N Trp-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YLGQHMHKAASRGJ-WDSOQIARSA-N 0.000 description 4
- MPKPIWFFDWVJGC-IRIUXVKKSA-N Tyr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O MPKPIWFFDWVJGC-IRIUXVKKSA-N 0.000 description 4
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 4
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 4
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 4
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 4
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 4
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 4
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 4
- 238000009630 liquid culture Methods 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 210000003205 muscle Anatomy 0.000 description 4
- 235000015097 nutrients Nutrition 0.000 description 4
- 108010024607 phenylalanylalanine Proteins 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- 210000001938 protoplast Anatomy 0.000 description 4
- 229910001415 sodium ion Inorganic materials 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 4
- 230000032258 transport Effects 0.000 description 4
- 108010013043 Acetylesterase Proteins 0.000 description 3
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 3
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 3
- OQCPATDFWYYDDX-HGNGGELXSA-N Ala-Gln-His Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OQCPATDFWYYDDX-HGNGGELXSA-N 0.000 description 3
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 3
- 108010076441 Ala-His-His Proteins 0.000 description 3
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 3
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 3
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 3
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 3
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 3
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 3
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 3
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 3
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 3
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 3
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 3
- IGULQRCJLQQPSM-DCAQKATOSA-N Arg-Cys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IGULQRCJLQQPSM-DCAQKATOSA-N 0.000 description 3
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 3
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 3
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 3
- SLNCSSWAIDUUGF-LSJOCFKGSA-N Arg-His-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O SLNCSSWAIDUUGF-LSJOCFKGSA-N 0.000 description 3
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 3
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 3
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 3
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 3
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 3
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 3
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 3
- XHTUGJCAEYOZOR-UBHSHLNASA-N Asn-Ser-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XHTUGJCAEYOZOR-UBHSHLNASA-N 0.000 description 3
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 3
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 3
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 3
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 3
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 3
- ICZWAZVKLACMKR-CIUDSAMLSA-N Asp-His-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 ICZWAZVKLACMKR-CIUDSAMLSA-N 0.000 description 3
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 3
- 102100032487 Beta-mannosidase Human genes 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 3
- PONUFVLSGMQFAI-AVGNSLFASA-N Gln-Asn-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PONUFVLSGMQFAI-AVGNSLFASA-N 0.000 description 3
- OFPWCBGRYAOLMU-AVGNSLFASA-N Gln-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OFPWCBGRYAOLMU-AVGNSLFASA-N 0.000 description 3
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 3
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 3
- DUGYCMAIAKAQPB-GLLZPBPUSA-N Gln-Thr-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DUGYCMAIAKAQPB-GLLZPBPUSA-N 0.000 description 3
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 3
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 3
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 3
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 3
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 3
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 3
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 3
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 3
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 3
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 3
- 229920001503 Glucan Polymers 0.000 description 3
- 108010050375 Glucose 1-Dehydrogenase Proteins 0.000 description 3
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 3
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 3
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 3
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 3
- SCJJPCQUJYPHRZ-BQBZGAKWSA-N Gly-Pro-Asn Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O SCJJPCQUJYPHRZ-BQBZGAKWSA-N 0.000 description 3
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 3
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 3
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 3
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 3
- FYVHHKMHFPMBBG-GUBZILKMSA-N His-Gln-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FYVHHKMHFPMBBG-GUBZILKMSA-N 0.000 description 3
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 3
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 3
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 3
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 3
- 108090000769 Isomerases Proteins 0.000 description 3
- 102000004195 Isomerases Human genes 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 3
- 108010029541 Laccase Proteins 0.000 description 3
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 3
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 3
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 3
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 3
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 3
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 3
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 3
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 3
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 3
- 108090001060 Lipase Proteins 0.000 description 3
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 3
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 3
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 3
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 3
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 3
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 3
- 108010090665 Mannosyl-Glycoprotein Endo-beta-N-Acetylglucosaminidase Proteins 0.000 description 3
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 3
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 3
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 3
- 108700011259 MicroRNAs Proteins 0.000 description 3
- 102100036617 Monoacylglycerol lipase ABHD2 Human genes 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 3
- 108010026867 Oligo-1,6-Glucosidase Proteins 0.000 description 3
- 238000010222 PCR analysis Methods 0.000 description 3
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 3
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 3
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 3
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 3
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 3
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 3
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 3
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 3
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 3
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 3
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 3
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 108010079005 RDV peptide Proteins 0.000 description 3
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 3
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 3
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 3
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 3
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 3
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 3
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 3
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 3
- QUGRFWPMPVIAPW-IHRRRGAJSA-N Ser-Pro-Phe Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QUGRFWPMPVIAPW-IHRRRGAJSA-N 0.000 description 3
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 3
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 3
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 3
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 3
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 3
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 3
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 3
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 3
- 108020004459 Small interfering RNA Proteins 0.000 description 3
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 3
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 3
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 3
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 3
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 3
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 3
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 3
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 3
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 3
- 102000004357 Transferases Human genes 0.000 description 3
- 108090000992 Transferases Proteins 0.000 description 3
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 3
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 3
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 3
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 3
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 3
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 108010030291 alpha-Galactosidase Proteins 0.000 description 3
- 230000003698 anagen phase Effects 0.000 description 3
- 108010055059 beta-Mannosidase Proteins 0.000 description 3
- 235000013361 beverage Nutrition 0.000 description 3
- 101150038500 cas9 gene Proteins 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 108010009297 diglycyl-histidine Proteins 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 230000030279 gene silencing Effects 0.000 description 3
- 230000009368 gene silencing by RNA Effects 0.000 description 3
- 238000012226 gene silencing method Methods 0.000 description 3
- 102000054767 gene variant Human genes 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 3
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 3
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 3
- 108010020688 glycylhistidine Proteins 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 238000011081 inoculation Methods 0.000 description 3
- 235000011073 invertase Nutrition 0.000 description 3
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 235000019799 monosodium phosphate Nutrition 0.000 description 3
- 238000002887 multiple sequence alignment Methods 0.000 description 3
- 231100000219 mutagenic Toxicity 0.000 description 3
- 230000003505 mutagenic effect Effects 0.000 description 3
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 239000001965 potato dextrose agar Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 3
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 235000019833 protease Nutrition 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000002708 random mutagenesis Methods 0.000 description 3
- 230000003362 replicative effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 239000004055 small Interfering RNA Substances 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 3
- 229910000162 sodium phosphate Inorganic materials 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 230000009261 transgenic effect Effects 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 3
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 2
- 108090000344 1,4-alpha-Glucan Branching Enzyme Proteins 0.000 description 2
- 102000003925 1,4-alpha-Glucan Branching Enzyme Human genes 0.000 description 2
- 102100025573 1-alkyl-2-acetylglycerophosphocholine esterase Human genes 0.000 description 2
- 102100030492 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase epsilon-1 Human genes 0.000 description 2
- OZRFYUJEXYKQDV-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-carboxypropanoyl)amino]-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]butanedioic acid Chemical compound OC(=O)CC(N)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(O)=O OZRFYUJEXYKQDV-UHFFFAOYSA-N 0.000 description 2
- 108010080981 3-phytase Proteins 0.000 description 2
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 2
- 108010051457 Acid Phosphatase Proteins 0.000 description 2
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 2
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 2
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 2
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 2
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 2
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 2
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 2
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 2
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- GHBSKQGCIYSCNS-NAKRPEOUSA-N Ala-Leu-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GHBSKQGCIYSCNS-NAKRPEOUSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 2
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 2
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 108010025188 Alcohol oxidase Proteins 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 108090000915 Aminopeptidases Proteins 0.000 description 2
- 102000004400 Aminopeptidases Human genes 0.000 description 2
- 239000004382 Amylase Substances 0.000 description 2
- 108010065511 Amylases Proteins 0.000 description 2
- 102000013142 Amylases Human genes 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 2
- DPNHSNLIULPOBH-GUBZILKMSA-N Arg-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DPNHSNLIULPOBH-GUBZILKMSA-N 0.000 description 2
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 2
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 2
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 2
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 2
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 2
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 2
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 2
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 2
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 2
- LCBSSOCDWUTQQV-SDDRHHMPSA-N Arg-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LCBSSOCDWUTQQV-SDDRHHMPSA-N 0.000 description 2
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 2
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 2
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 2
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 2
- SWLOHUMCUDRTCL-ZLUOBGJFSA-N Asn-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N SWLOHUMCUDRTCL-ZLUOBGJFSA-N 0.000 description 2
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 2
- VWJFQGXPYOPXJH-ZLUOBGJFSA-N Asn-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)N VWJFQGXPYOPXJH-ZLUOBGJFSA-N 0.000 description 2
- IHUJUZBUOFTIOB-QEJZJMRPSA-N Asn-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N IHUJUZBUOFTIOB-QEJZJMRPSA-N 0.000 description 2
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 2
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 2
- KEUNWIXNKVWCFL-FXQIFTODSA-N Asn-Met-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O KEUNWIXNKVWCFL-FXQIFTODSA-N 0.000 description 2
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 2
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 2
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 2
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 2
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 2
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 2
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 2
- PMEHKVHZQKJACS-PEFMBERDSA-N Asp-Gln-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PMEHKVHZQKJACS-PEFMBERDSA-N 0.000 description 2
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 2
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 2
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 2
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 2
- OGTCOKZFOJIZFG-CIUDSAMLSA-N Asp-His-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OGTCOKZFOJIZFG-CIUDSAMLSA-N 0.000 description 2
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 2
- SAKCBXNPWDRWPE-BQBZGAKWSA-N Asp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N SAKCBXNPWDRWPE-BQBZGAKWSA-N 0.000 description 2
- LIQNMKIBMPEOOP-IHRRRGAJSA-N Asp-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)O)N LIQNMKIBMPEOOP-IHRRRGAJSA-N 0.000 description 2
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 2
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 2
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 2
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 2
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 2
- 108010024976 Asparaginase Proteins 0.000 description 2
- 241001225321 Aspergillus fumigatus Species 0.000 description 2
- 241001507852 Aspergillus itaconicus Species 0.000 description 2
- 240000006439 Aspergillus oryzae Species 0.000 description 2
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 102100035882 Catalase Human genes 0.000 description 2
- 108010053835 Catalase Proteins 0.000 description 2
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 2
- 241001619326 Cephalosporium Species 0.000 description 2
- 108010022172 Chitinases Proteins 0.000 description 2
- 102000012286 Chitinases Human genes 0.000 description 2
- 108010035722 Chloride peroxidase Proteins 0.000 description 2
- 241000123346 Chrysosporium Species 0.000 description 2
- 108090001069 Chymopapain Proteins 0.000 description 2
- 108090000746 Chymosin Proteins 0.000 description 2
- 108090000317 Chymotrypsin Proteins 0.000 description 2
- 108010025880 Cyclomaltodextrin glucanotransferase Proteins 0.000 description 2
- MBRWOKXNHTUJMB-CIUDSAMLSA-N Cys-Pro-Glu Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O MBRWOKXNHTUJMB-CIUDSAMLSA-N 0.000 description 2
- TXGDWPBLUFQODU-XGEHTFHBSA-N Cys-Pro-Thr Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O TXGDWPBLUFQODU-XGEHTFHBSA-N 0.000 description 2
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 2
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 2
- 108030002106 D-psicose 3-epimerases Proteins 0.000 description 2
- 108010012023 Dextrin dextranase Proteins 0.000 description 2
- 102100025012 Dipeptidyl peptidase 4 Human genes 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 102000055441 Gastricsin Human genes 0.000 description 2
- 108090001072 Gastricsin Proteins 0.000 description 2
- XOKGKOQWADCLFQ-GARJFASQSA-N Gln-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XOKGKOQWADCLFQ-GARJFASQSA-N 0.000 description 2
- SXIJQMBEVYWAQT-GUBZILKMSA-N Gln-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXIJQMBEVYWAQT-GUBZILKMSA-N 0.000 description 2
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 2
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 2
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 2
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 2
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 2
- LVSYIKGMLRHKME-IUCAKERBSA-N Gln-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N LVSYIKGMLRHKME-IUCAKERBSA-N 0.000 description 2
- DQPOBSRQNWOBNA-GUBZILKMSA-N Gln-His-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O DQPOBSRQNWOBNA-GUBZILKMSA-N 0.000 description 2
- OOLCSQQPSLIETN-JYJNAYRXSA-N Gln-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)O OOLCSQQPSLIETN-JYJNAYRXSA-N 0.000 description 2
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 2
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 2
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 2
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 2
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 2
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 2
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 2
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 2
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 2
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 2
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 2
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 2
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 2
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 2
- DRLVXRQFROIYTD-GUBZILKMSA-N Glu-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DRLVXRQFROIYTD-GUBZILKMSA-N 0.000 description 2
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 2
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 2
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 2
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 2
- WXONSNSSBYQGNN-AVGNSLFASA-N Glu-Ser-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WXONSNSSBYQGNN-AVGNSLFASA-N 0.000 description 2
- KXRORHJIRAOQPG-SOUVJXGZSA-N Glu-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KXRORHJIRAOQPG-SOUVJXGZSA-N 0.000 description 2
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 2
- 108010022769 Glucan 1,3-beta-Glucosidase Proteins 0.000 description 2
- 108010032083 Glucan 1,4-beta-Glucosidase Proteins 0.000 description 2
- 108010015776 Glucose oxidase Proteins 0.000 description 2
- 239000004366 Glucose oxidase Substances 0.000 description 2
- 108010073324 Glutaminase Proteins 0.000 description 2
- 102000009127 Glutaminase Human genes 0.000 description 2
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 2
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 2
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 2
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 2
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 2
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 2
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 2
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 2
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 2
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 2
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 2
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 2
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 2
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 2
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 2
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 2
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 2
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 2
- IDNNYVGVSZMQTK-IHRRRGAJSA-N His-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N IDNNYVGVSZMQTK-IHRRRGAJSA-N 0.000 description 2
- PROLDOGUBQJNPG-RWMBFGLXSA-N His-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O PROLDOGUBQJNPG-RWMBFGLXSA-N 0.000 description 2
- WMKXFMUJRCEGRP-SRVKXCTJSA-N His-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N WMKXFMUJRCEGRP-SRVKXCTJSA-N 0.000 description 2
- JWLWNCVBBSBCEM-NKIYYHGXSA-N His-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N)O JWLWNCVBBSBCEM-NKIYYHGXSA-N 0.000 description 2
- BQFGKVYHKCNEMF-DCAQKATOSA-N His-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 BQFGKVYHKCNEMF-DCAQKATOSA-N 0.000 description 2
- KNNSUUOHFVVJOP-GUBZILKMSA-N His-Glu-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N KNNSUUOHFVVJOP-GUBZILKMSA-N 0.000 description 2
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 2
- ZUPVLBAXUUGKKN-VHSXEESVSA-N His-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CN=CN2)N)C(=O)O ZUPVLBAXUUGKKN-VHSXEESVSA-N 0.000 description 2
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 2
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 2
- XKIYNCLILDLGRS-QWRGUYRKSA-N His-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 XKIYNCLILDLGRS-QWRGUYRKSA-N 0.000 description 2
- BSVLMPMIXPQNKC-KBPBESRZSA-N His-Phe-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O BSVLMPMIXPQNKC-KBPBESRZSA-N 0.000 description 2
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 2
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 2
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 description 2
- KDDKJKKQODQQBR-NHCYSSNCSA-N His-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N KDDKJKKQODQQBR-NHCYSSNCSA-N 0.000 description 2
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 2
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 2
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 2
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 2
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 2
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 2
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 2
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 2
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 2
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 2
- 108010028688 Isoamylase Proteins 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- 102000003855 L-lactate dehydrogenase Human genes 0.000 description 2
- 108700023483 L-lactate dehydrogenases Proteins 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 2
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- RRSLQOLASISYTB-CIUDSAMLSA-N Leu-Cys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O RRSLQOLASISYTB-CIUDSAMLSA-N 0.000 description 2
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- QONKWXNJRRNTBV-AVGNSLFASA-N Leu-Pro-Met Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N QONKWXNJRRNTBV-AVGNSLFASA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 2
- 108010004098 Leucyl aminopeptidase Proteins 0.000 description 2
- 102000002704 Leucyl aminopeptidase Human genes 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 2
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 2
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 2
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 2
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 2
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 2
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 2
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 2
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 2
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 2
- 102100033468 Lysozyme C Human genes 0.000 description 2
- 108030004673 Mannuronate-specific alginate lyases Proteins 0.000 description 2
- DLAFCQWUMFMZSN-GUBZILKMSA-N Met-Arg-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N DLAFCQWUMFMZSN-GUBZILKMSA-N 0.000 description 2
- TUSOIZOVPJCMFC-FXQIFTODSA-N Met-Asp-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O TUSOIZOVPJCMFC-FXQIFTODSA-N 0.000 description 2
- TZLYIHDABYBOCJ-FXQIFTODSA-N Met-Asp-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O TZLYIHDABYBOCJ-FXQIFTODSA-N 0.000 description 2
- JYCQGAGDJQYEDB-GUBZILKMSA-N Met-Gln-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JYCQGAGDJQYEDB-GUBZILKMSA-N 0.000 description 2
- MTBVQFFQMXHCPC-CIUDSAMLSA-N Met-Glu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MTBVQFFQMXHCPC-CIUDSAMLSA-N 0.000 description 2
- JACAKCWAOHKQBV-UWVGGRQHSA-N Met-Gly-Lys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN JACAKCWAOHKQBV-UWVGGRQHSA-N 0.000 description 2
- MIAZEQZXAFTCCG-UBHSHLNASA-N Met-Phe-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 MIAZEQZXAFTCCG-UBHSHLNASA-N 0.000 description 2
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 2
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 2
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 2
- 108090000192 Methionyl aminopeptidases Proteins 0.000 description 2
- 102000034452 Methionyl aminopeptidases Human genes 0.000 description 2
- 102000029749 Microtubule Human genes 0.000 description 2
- 108091022875 Microtubule Proteins 0.000 description 2
- 108020002334 Monoacylglycerol lipase Proteins 0.000 description 2
- 102100030397 N-acetylmuramoyl-L-alanine amidase Human genes 0.000 description 2
- 108060004757 N-acyl-D-amino-acid deacylase Proteins 0.000 description 2
- 108030006755 N-acyl-aliphatic-L-amino acid amidohydrolases Proteins 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- 102000007999 Nuclear Proteins Human genes 0.000 description 2
- 108010089610 Nuclear Proteins Proteins 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 108090000526 Papain Proteins 0.000 description 2
- 108010029182 Pectin lyase Proteins 0.000 description 2
- 108010073038 Penicillin Amidase Proteins 0.000 description 2
- 108090000284 Pepsin A Proteins 0.000 description 2
- 102000057297 Pepsin A Human genes 0.000 description 2
- 108090000313 Pepsin B Proteins 0.000 description 2
- 102100038551 Peptide-N(4)-(N-acetyl-beta-glucosaminyl)asparagine amidase Human genes 0.000 description 2
- 108030006253 Peptide-N(4)-(N-acetyl-beta-glucosaminyl)asparagine amidases Proteins 0.000 description 2
- 102000003992 Peroxidases Human genes 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 2
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 2
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 2
- 102100026918 Phospholipase A2 Human genes 0.000 description 2
- 108090000553 Phospholipase D Proteins 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 2
- HPXVFFIIGOAQRV-DCAQKATOSA-N Pro-Arg-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O HPXVFFIIGOAQRV-DCAQKATOSA-N 0.000 description 2
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 2
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 2
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 2
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 2
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 2
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 2
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 2
- LCUOTSLIVGSGAU-AVGNSLFASA-N Pro-His-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LCUOTSLIVGSGAU-AVGNSLFASA-N 0.000 description 2
- AJCRQOHDLCBHFA-SRVKXCTJSA-N Pro-His-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AJCRQOHDLCBHFA-SRVKXCTJSA-N 0.000 description 2
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 2
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 2
- YYARMJSFDLIDFS-FKBYEOEOSA-N Pro-Phe-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YYARMJSFDLIDFS-FKBYEOEOSA-N 0.000 description 2
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 2
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 2
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 2
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 2
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 2
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 2
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 2
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 2
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 2
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 2
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 2
- 102000056251 Prolyl Oligopeptidases Human genes 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 108090000919 Pyroglutamyl-Peptidase I Proteins 0.000 description 2
- 102100031108 Pyroglutamyl-peptidase 1 Human genes 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 108030006203 Rhamnogalacturonan endolyases Proteins 0.000 description 2
- 241000235342 Saccharomycetes Species 0.000 description 2
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 2
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 2
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 2
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 2
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 2
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 2
- QWZIOCFPXMAXET-CIUDSAMLSA-N Ser-Arg-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QWZIOCFPXMAXET-CIUDSAMLSA-N 0.000 description 2
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 2
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 2
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 2
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 2
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 2
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 2
- BRIZMMZEYSAKJX-QEJZJMRPSA-N Ser-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N BRIZMMZEYSAKJX-QEJZJMRPSA-N 0.000 description 2
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 2
- MOQDPPUMFSMYOM-KKUMJFAQSA-N Ser-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N MOQDPPUMFSMYOM-KKUMJFAQSA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 2
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 2
- AMRRYKHCILPAKD-FXQIFTODSA-N Ser-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N AMRRYKHCILPAKD-FXQIFTODSA-N 0.000 description 2
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 2
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 2
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 2
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 2
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 2
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 2
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 2
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 2
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 102100027918 Sucrase-isomaltase, intestinal Human genes 0.000 description 2
- 102000019197 Superoxide Dismutase Human genes 0.000 description 2
- 108010012715 Superoxide dismutase Proteins 0.000 description 2
- 108030003984 Thiol oxidases Proteins 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 2
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 2
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 2
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 2
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 2
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 2
- CJXURNZYNHCYFD-WDCWCFNPSA-N Thr-Lys-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CJXURNZYNHCYFD-WDCWCFNPSA-N 0.000 description 2
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 2
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 2
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 2
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 2
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 2
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 2
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 2
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 108090000190 Thrombin Proteins 0.000 description 2
- 108060008539 Transglutaminase Proteins 0.000 description 2
- 241000894120 Trichoderma atroviride Species 0.000 description 2
- ICNFHVUVCNWUAB-SZMVWBNQSA-N Trp-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ICNFHVUVCNWUAB-SZMVWBNQSA-N 0.000 description 2
- JLTQXEOXIJMCLZ-ZVZYQTTQSA-N Trp-Gln-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 JLTQXEOXIJMCLZ-ZVZYQTTQSA-N 0.000 description 2
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 2
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 2
- NMOIRIIIUVELLY-WDSOQIARSA-N Trp-Val-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)C(C)C)=CNC2=C1 NMOIRIIIUVELLY-WDSOQIARSA-N 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 2
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 2
- OEVJGIHPQOXYFE-SRVKXCTJSA-N Tyr-Asn-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OEVJGIHPQOXYFE-SRVKXCTJSA-N 0.000 description 2
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 2
- FJKXUIJOMUWCDD-FHWLQOOXSA-N Tyr-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N)O FJKXUIJOMUWCDD-FHWLQOOXSA-N 0.000 description 2
- HKYTWJOWZTWBQB-AVGNSLFASA-N Tyr-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HKYTWJOWZTWBQB-AVGNSLFASA-N 0.000 description 2
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 2
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 2
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 2
- 102000003425 Tyrosinase Human genes 0.000 description 2
- 108060008724 Tyrosinase Proteins 0.000 description 2
- 108010046334 Urease Proteins 0.000 description 2
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 2
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 2
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 2
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 2
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 2
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 2
- SDSCOOZQQGUQFC-GVXVVHGQSA-N Val-His-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SDSCOOZQQGUQFC-GVXVVHGQSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- RQOMPQGUGBILAG-AVGNSLFASA-N Val-Met-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQOMPQGUGBILAG-AVGNSLFASA-N 0.000 description 2
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 2
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 2
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 2
- 102100039662 Xaa-Pro dipeptidase Human genes 0.000 description 2
- 102100029089 Xylulose kinase Human genes 0.000 description 2
- 108090000350 actinidain Proteins 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 108010070783 alanyltyrosine Proteins 0.000 description 2
- 108091022872 aldose 1-epimerase Proteins 0.000 description 2
- 102000020006 aldose 1-epimerase Human genes 0.000 description 2
- 102000005840 alpha-Galactosidase Human genes 0.000 description 2
- 108010028144 alpha-Glucosidases Proteins 0.000 description 2
- 108010061314 alpha-L-Fucosidase Proteins 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 102000005922 amidase Human genes 0.000 description 2
- 235000019418 amylase Nutrition 0.000 description 2
- 239000003125 aqueous solvent Substances 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 2
- 229940091771 aspergillus fumigatus Drugs 0.000 description 2
- 108010019077 beta-Amylase Proteins 0.000 description 2
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 108010048610 cellobiose phosphorylase Proteins 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 108010025790 chlorophyllase Proteins 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 229940080701 chymosin Drugs 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 108010005400 cutinase Proteins 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 108010042194 dextransucrase Proteins 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000706 filtrate Substances 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 108090000285 fruit bromelain Proteins 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 229940116332 glucose oxidase Drugs 0.000 description 2
- 235000019420 glucose oxidase Nutrition 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 108010002430 hemicellulase Proteins 0.000 description 2
- 229940059442 hemicellulase Drugs 0.000 description 2
- 108010018734 hexose oxidase Proteins 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 230000000415 inactivating effect Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 108010072591 lysyl-leucyl-alanyl-arginine Proteins 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 210000004688 microtubule Anatomy 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 description 2
- 230000006780 non-homologous end joining Effects 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 108040007629 peroxidase activity proteins Proteins 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- 235000004252 protein component Nutrition 0.000 description 2
- 230000006916 protein interaction Effects 0.000 description 2
- 108010001816 pyranose oxidase Proteins 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 108010035322 rhamnogalacturonan acetylesterase Proteins 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 239000001509 sodium citrate Substances 0.000 description 2
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 2
- 239000000600 sorbitol Substances 0.000 description 2
- 108090000346 stem bromelain Proteins 0.000 description 2
- 238000004659 sterilization and disinfection Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000011573 trace mineral Substances 0.000 description 2
- 235000013619 trace mineral Nutrition 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 102000003601 transglutaminase Human genes 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 108010029384 tryptophyl-histidine Proteins 0.000 description 2
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 108091022915 xylulokinase Proteins 0.000 description 2
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 1
- LJYDIYITSYDTAY-LSBAASHUSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-hydroxypropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 LJYDIYITSYDTAY-LSBAASHUSA-N 0.000 description 1
- YPUDISCJWPUYAX-VRPWFDPXSA-N (3S,4S,5R)-2-amino-2,5-bis(hydroxymethyl)oxolane-3,4-diol Chemical compound OCC1(N)O[C@H](CO)[C@@H](O)[C@@H]1O YPUDISCJWPUYAX-VRPWFDPXSA-N 0.000 description 1
- HGHOBRRUMWJWCU-FXQIFTODSA-N (4s)-4-[[(2s)-2-aminopropanoyl]amino]-5-[[(2s)-3-carboxy-1-(carboxymethylamino)-1-oxopropan-2-yl]amino]-5-oxopentanoic acid Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O HGHOBRRUMWJWCU-FXQIFTODSA-N 0.000 description 1
- 108050004163 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase delta-1 Proteins 0.000 description 1
- 108050004626 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase delta-3 Proteins 0.000 description 1
- 108050004186 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase delta-4 Proteins 0.000 description 1
- 108050004161 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase epsilon-1 Proteins 0.000 description 1
- 108050004167 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase eta-1 Proteins 0.000 description 1
- 108050004168 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase eta-2 Proteins 0.000 description 1
- 108050004159 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase zeta-1 Proteins 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- CHUGKEQJSLOLHL-UHFFFAOYSA-N 2,2-Bis(bromomethyl)propane-1,3-diol Chemical compound OCC(CO)(CBr)CBr CHUGKEQJSLOLHL-UHFFFAOYSA-N 0.000 description 1
- DMSDCBKFWUBTKX-UHFFFAOYSA-N 2-methyl-1-nitrosoguanidine Chemical compound CN=C(N)NN=O DMSDCBKFWUBTKX-UHFFFAOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- 108010029731 6-phosphogluconolactonase Proteins 0.000 description 1
- 102100031126 6-phosphogluconolactonase Human genes 0.000 description 1
- 101150101112 7 gene Proteins 0.000 description 1
- 102100032123 AMP deaminase 1 Human genes 0.000 description 1
- 108700016228 AMP deaminases Proteins 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 102100036426 Acid phosphatase type 7 Human genes 0.000 description 1
- ZHQQRIUYLMXDPP-SSDOTTSWSA-N Actinidine Natural products C1=NC=C(C)C2=C1[C@H](C)CC2 ZHQQRIUYLMXDPP-SSDOTTSWSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- ZFXQNADNEBRERM-BJDJZHNGSA-N Ala-Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZFXQNADNEBRERM-BJDJZHNGSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 1
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- HGRBNYQIMKTUNT-XVYDVKMFSA-N Ala-Asn-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HGRBNYQIMKTUNT-XVYDVKMFSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 1
- FRFDXQWNDZMREB-ACZMJKKPSA-N Ala-Cys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRFDXQWNDZMREB-ACZMJKKPSA-N 0.000 description 1
- WCBVQNZTOKJWJS-ACZMJKKPSA-N Ala-Cys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O WCBVQNZTOKJWJS-ACZMJKKPSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 1
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 1
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- 108010068139 Ala-Leu-Pro-Met Proteins 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 1
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 1
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 1
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- ISCYZXFOCXWUJU-KZVJFYERSA-N Ala-Thr-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O ISCYZXFOCXWUJU-KZVJFYERSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- XMIAMUXIMWREBJ-HERUPUMHSA-N Ala-Trp-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XMIAMUXIMWREBJ-HERUPUMHSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 1
- XKXAZPSREVUCRT-BPNCWPANSA-N Ala-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=C(O)C=C1 XKXAZPSREVUCRT-BPNCWPANSA-N 0.000 description 1
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 1
- OAIGZYFGCNNVIE-ZPFDUUQYSA-N Ala-Val-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O OAIGZYFGCNNVIE-ZPFDUUQYSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 102100025677 Alkaline phosphatase, germ cell type Human genes 0.000 description 1
- 229920000310 Alpha glucan Polymers 0.000 description 1
- 101710199313 Alpha-L-arabinofuranosidase Proteins 0.000 description 1
- 102100026277 Alpha-galactosidase A Human genes 0.000 description 1
- 108700023418 Amidases Proteins 0.000 description 1
- 102000004092 Amidohydrolases Human genes 0.000 description 1
- 108090000531 Amidohydrolases Proteins 0.000 description 1
- 102100025981 Aminoacylase-1 Human genes 0.000 description 1
- 108010033764 Amylosucrase Proteins 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- QEKBCDODJBBWHV-GUBZILKMSA-N Arg-Arg-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O QEKBCDODJBBWHV-GUBZILKMSA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 1
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 1
- NTAZNGWBXRVEDJ-FXQIFTODSA-N Arg-Asp-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NTAZNGWBXRVEDJ-FXQIFTODSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- FBLMOFHNVQBKRR-IHRRRGAJSA-N Arg-Asp-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FBLMOFHNVQBKRR-IHRRRGAJSA-N 0.000 description 1
- XTGGTAWGUFXJSV-NAKRPEOUSA-N Arg-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N XTGGTAWGUFXJSV-NAKRPEOUSA-N 0.000 description 1
- YWENWUYXQUWRHQ-LPEHRKFASA-N Arg-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O YWENWUYXQUWRHQ-LPEHRKFASA-N 0.000 description 1
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 1
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 1
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 1
- MSILNNHVVMMTHZ-UWVGGRQHSA-N Arg-His-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 MSILNNHVVMMTHZ-UWVGGRQHSA-N 0.000 description 1
- UPKMBGAAEZGHOC-RWMBFGLXSA-N Arg-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O UPKMBGAAEZGHOC-RWMBFGLXSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- JOADBFCFJGNIKF-GUBZILKMSA-N Arg-Met-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O JOADBFCFJGNIKF-GUBZILKMSA-N 0.000 description 1
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 1
- JCROZIFVIYMXHM-GUBZILKMSA-N Arg-Met-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N JCROZIFVIYMXHM-GUBZILKMSA-N 0.000 description 1
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 1
- 108010051330 Arg-Pro-Gly-Pro Proteins 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- JQHASVQBAKRJKD-GUBZILKMSA-N Arg-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JQHASVQBAKRJKD-GUBZILKMSA-N 0.000 description 1
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 1
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 1
- LYJXHXGPWDTLKW-HJGDQZAQSA-N Arg-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O LYJXHXGPWDTLKW-HJGDQZAQSA-N 0.000 description 1
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- QUBKBPZGMZWOKQ-SZMVWBNQSA-N Arg-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QUBKBPZGMZWOKQ-SZMVWBNQSA-N 0.000 description 1
- XMGVWQWEWWULNS-BPUTZDHNSA-N Arg-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XMGVWQWEWWULNS-BPUTZDHNSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 1
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 1
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- 102100023943 Arylsulfatase L Human genes 0.000 description 1
- 102000009133 Arylsulfatases Human genes 0.000 description 1
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Natural products OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 1
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 1
- CQMQJWRCRQSBAF-BPUTZDHNSA-N Asn-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N CQMQJWRCRQSBAF-BPUTZDHNSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- JZRLLSOWDYUKOK-SRVKXCTJSA-N Asn-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N JZRLLSOWDYUKOK-SRVKXCTJSA-N 0.000 description 1
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 1
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- PPMTUXJSQDNUDE-CIUDSAMLSA-N Asn-Glu-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PPMTUXJSQDNUDE-CIUDSAMLSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 1
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 1
- ODBSSLHUFPJRED-CIUDSAMLSA-N Asn-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ODBSSLHUFPJRED-CIUDSAMLSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- LZLCLRQMUQWUHJ-GUBZILKMSA-N Asn-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N LZLCLRQMUQWUHJ-GUBZILKMSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- UYRPHDGXHKBZHJ-CIUDSAMLSA-N Asn-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N UYRPHDGXHKBZHJ-CIUDSAMLSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- FLJVGAFLZVBBNG-BPUTZDHNSA-N Asn-Trp-Arg Chemical compound N[C@@H](CC(=O)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O FLJVGAFLZVBBNG-BPUTZDHNSA-N 0.000 description 1
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- NJPLPRFQLBZAMH-IHRRRGAJSA-N Asn-Tyr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O NJPLPRFQLBZAMH-IHRRRGAJSA-N 0.000 description 1
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- SOYOSFXLXYZNRG-CIUDSAMLSA-N Asp-Arg-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O SOYOSFXLXYZNRG-CIUDSAMLSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 1
- VHWNKSJHQFZJTH-FXQIFTODSA-N Asp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N VHWNKSJHQFZJTH-FXQIFTODSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 1
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 1
- RYKWOUUZJFSJOH-FXQIFTODSA-N Asp-Gln-Glu Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N RYKWOUUZJFSJOH-FXQIFTODSA-N 0.000 description 1
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- LDGUZSIPGSPBJP-XVYDVKMFSA-N Asp-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N LDGUZSIPGSPBJP-XVYDVKMFSA-N 0.000 description 1
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 1
- RWHHSFSWKFBTCF-KKUMJFAQSA-N Asp-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N RWHHSFSWKFBTCF-KKUMJFAQSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 1
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 1
- NONWUQAWAANERO-BZSNNMDCSA-N Asp-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 NONWUQAWAANERO-BZSNNMDCSA-N 0.000 description 1
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 1
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 1
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- XOASPVGNFAMYBD-WFBYXXMGSA-N Asp-Trp-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O XOASPVGNFAMYBD-WFBYXXMGSA-N 0.000 description 1
- OTKUAVXGMREHRX-CFMVVWHZSA-N Asp-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 OTKUAVXGMREHRX-CFMVVWHZSA-N 0.000 description 1
- VHUKCUHLFMRHOD-MELADBBJSA-N Asp-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O VHUKCUHLFMRHOD-MELADBBJSA-N 0.000 description 1
- GXIUDSXIUSTSLO-QXEWZRGKSA-N Asp-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N GXIUDSXIUSTSLO-QXEWZRGKSA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- GYNUXDMCDILYIQ-QRTARXTBSA-N Asp-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N GYNUXDMCDILYIQ-QRTARXTBSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 102000030907 Aspartate Carbamoyltransferase Human genes 0.000 description 1
- 108010063021 Aspergillus Endonuclease S1 Proteins 0.000 description 1
- 101000709143 Aspergillus aculeatus Rhamnogalacturonate lyase A Proteins 0.000 description 1
- 101001065065 Aspergillus awamori Feruloyl esterase A Proteins 0.000 description 1
- 101100264263 Aspergillus awamori xlnD gene Proteins 0.000 description 1
- 241001480052 Aspergillus japonicus Species 0.000 description 1
- 241000351920 Aspergillus nidulans Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 241000131386 Aspergillus sojae Species 0.000 description 1
- 241001465318 Aspergillus terreus Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 1
- 101710204694 Beta-xylosidase Proteins 0.000 description 1
- 102100035687 Bile salt-activated lipase Human genes 0.000 description 1
- 101100348341 Caenorhabditis elegans gas-1 gene Proteins 0.000 description 1
- 101100256918 Caenorhabditis elegans sid-2 gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 102000005572 Cathepsin A Human genes 0.000 description 1
- 108010059081 Cathepsin A Proteins 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 241001674013 Chrysosporium lucknowense Species 0.000 description 1
- 102100039501 Chymotrypsinogen B Human genes 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 241000252203 Clupea harengus Species 0.000 description 1
- 102100029057 Coagulation factor XIII A chain Human genes 0.000 description 1
- 102000005870 Coenzyme A Ligases Human genes 0.000 description 1
- UKVGHFORADMBEN-GUBZILKMSA-N Cys-Arg-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UKVGHFORADMBEN-GUBZILKMSA-N 0.000 description 1
- VNLYIYOYUNGURO-ZLUOBGJFSA-N Cys-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N VNLYIYOYUNGURO-ZLUOBGJFSA-N 0.000 description 1
- IIGHQOPGMGKDMT-SRVKXCTJSA-N Cys-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N IIGHQOPGMGKDMT-SRVKXCTJSA-N 0.000 description 1
- ZIKWRNJXFIQECJ-CIUDSAMLSA-N Cys-Cys-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZIKWRNJXFIQECJ-CIUDSAMLSA-N 0.000 description 1
- YZKOXEJTLWZOQL-GUBZILKMSA-N Cys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N YZKOXEJTLWZOQL-GUBZILKMSA-N 0.000 description 1
- RRJOQIBQVZDVCW-SRVKXCTJSA-N Cys-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N RRJOQIBQVZDVCW-SRVKXCTJSA-N 0.000 description 1
- WTNLLMQAFPOCTJ-GARJFASQSA-N Cys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N)C(=O)O WTNLLMQAFPOCTJ-GARJFASQSA-N 0.000 description 1
- JXVFJOMFOLFPMP-KKUMJFAQSA-N Cys-Leu-Tyr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JXVFJOMFOLFPMP-KKUMJFAQSA-N 0.000 description 1
- CAXGCBSRJLADPD-FXQIFTODSA-N Cys-Pro-Asn Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CAXGCBSRJLADPD-FXQIFTODSA-N 0.000 description 1
- SWJYSDXMTPMBHO-FXQIFTODSA-N Cys-Pro-Ser Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SWJYSDXMTPMBHO-FXQIFTODSA-N 0.000 description 1
- YWEHYKGJWHPGPY-XGEHTFHBSA-N Cys-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N)O YWEHYKGJWHPGPY-XGEHTFHBSA-N 0.000 description 1
- 108090000395 Cysteine Endopeptidases Proteins 0.000 description 1
- 102000003950 Cysteine Endopeptidases Human genes 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108030001574 Deuterolysin Proteins 0.000 description 1
- 108010001682 Dextranase Proteins 0.000 description 1
- 101001096557 Dickeya dadantii (strain 3937) Rhamnogalacturonate lyase Proteins 0.000 description 1
- 108091000126 Dihydroorotase Proteins 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 108010067722 Dipeptidyl Peptidase 4 Proteins 0.000 description 1
- 108700036010 EC 3.4.21.65 Proteins 0.000 description 1
- 108700033915 EC 3.4.23.22 Proteins 0.000 description 1
- 108700033917 EC 3.4.23.23 Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 1
- 101710111935 Endo-beta-1,4-glucanase Proteins 0.000 description 1
- 108010092208 Endothia aspartic proteinase Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108090000270 Ficain Proteins 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 108010058643 Fungal Proteins Proteins 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 102100039835 Galactoside alpha-(1,2)-fucosyltransferase 1 Human genes 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241000973882 Geosmithia Species 0.000 description 1
- 101000930822 Giardia intestinalis Dipeptidyl-peptidase 4 Proteins 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 1
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 1
- IKDOHQHEFPPGJG-FXQIFTODSA-N Gln-Asp-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IKDOHQHEFPPGJG-FXQIFTODSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- JKPGHIQCHIIRMS-AVGNSLFASA-N Gln-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N JKPGHIQCHIIRMS-AVGNSLFASA-N 0.000 description 1
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 1
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 1
- NSNUZSPSADIMJQ-WDSKDSINSA-N Gln-Gly-Asp Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NSNUZSPSADIMJQ-WDSKDSINSA-N 0.000 description 1
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 1
- HXOLDXKNWKLDMM-YVNDNENWSA-N Gln-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HXOLDXKNWKLDMM-YVNDNENWSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 1
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 1
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 1
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 1
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 1
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- OUBUHIODTNUUTC-WDCWCFNPSA-N Gln-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OUBUHIODTNUUTC-WDCWCFNPSA-N 0.000 description 1
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 1
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 1
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 1
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- CJWANNXUTOATSJ-DCAQKATOSA-N Glu-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N CJWANNXUTOATSJ-DCAQKATOSA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- XEKAJTCACGEBOK-KKUMJFAQSA-N Glu-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XEKAJTCACGEBOK-KKUMJFAQSA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- RXESHTOTINOODU-JYJNAYRXSA-N Glu-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RXESHTOTINOODU-JYJNAYRXSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- ZKONLKQGTNVAPR-DCAQKATOSA-N Glu-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N ZKONLKQGTNVAPR-DCAQKATOSA-N 0.000 description 1
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 1
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- MIWJDJAMMKHUAR-ZVZYQTTQSA-N Glu-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N MIWJDJAMMKHUAR-ZVZYQTTQSA-N 0.000 description 1
- QGAJQIGFFIQJJK-IHRRRGAJSA-N Glu-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QGAJQIGFFIQJJK-IHRRRGAJSA-N 0.000 description 1
- 108010033128 Glucan Endo-1,3-beta-D-Glucosidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 108010051815 Glutamyl endopeptidase Proteins 0.000 description 1
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 1
- DUYYPIRFTLOAJQ-YUMQZZPRSA-N Gly-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN DUYYPIRFTLOAJQ-YUMQZZPRSA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 1
- GNPVTZJUUBPZKW-WDSKDSINSA-N Gly-Gln-Ser Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GNPVTZJUUBPZKW-WDSKDSINSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- VAXIVIPMCTYSHI-YUMQZZPRSA-N Gly-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN VAXIVIPMCTYSHI-YUMQZZPRSA-N 0.000 description 1
- ZKLYPEGLWFVRGF-IUCAKERBSA-N Gly-His-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZKLYPEGLWFVRGF-IUCAKERBSA-N 0.000 description 1
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 1
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- OJNZVYSGVYLQIN-BQBZGAKWSA-N Gly-Met-Asp Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O OJNZVYSGVYLQIN-BQBZGAKWSA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 1
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 1
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 1
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- IHDKKJVBLGXLEL-STQMWFEESA-N Gly-Tyr-Met Chemical compound CSCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)CN)C(O)=O IHDKKJVBLGXLEL-STQMWFEESA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- FULZDMOZUZKGQU-ONGXEEELSA-N Gly-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN FULZDMOZUZKGQU-ONGXEEELSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- AWHJQEYGWRKPHE-LSJOCFKGSA-N His-Ala-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AWHJQEYGWRKPHE-LSJOCFKGSA-N 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 1
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 1
- TVQGUFGDVODUIF-LSJOCFKGSA-N His-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N TVQGUFGDVODUIF-LSJOCFKGSA-N 0.000 description 1
- JHVCZQFWRLHUQR-DCAQKATOSA-N His-Arg-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N JHVCZQFWRLHUQR-DCAQKATOSA-N 0.000 description 1
- HDXNWVLQSQFJOX-SRVKXCTJSA-N His-Arg-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HDXNWVLQSQFJOX-SRVKXCTJSA-N 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- OMNVOTCFQQLEQU-CIUDSAMLSA-N His-Asn-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMNVOTCFQQLEQU-CIUDSAMLSA-N 0.000 description 1
- IDQKGZWUPVOGPZ-GUBZILKMSA-N His-Cys-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IDQKGZWUPVOGPZ-GUBZILKMSA-N 0.000 description 1
- UPGJWSUYENXOPV-HGNGGELXSA-N His-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N UPGJWSUYENXOPV-HGNGGELXSA-N 0.000 description 1
- LIEIYPBMQJLASB-SRVKXCTJSA-N His-Gln-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LIEIYPBMQJLASB-SRVKXCTJSA-N 0.000 description 1
- ZNNNYCXPCKACHX-DCAQKATOSA-N His-Gln-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZNNNYCXPCKACHX-DCAQKATOSA-N 0.000 description 1
- SWSVTNGMKBDTBM-DCAQKATOSA-N His-Gln-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SWSVTNGMKBDTBM-DCAQKATOSA-N 0.000 description 1
- NELVFWFDOKRTOR-SDDRHHMPSA-N His-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O NELVFWFDOKRTOR-SDDRHHMPSA-N 0.000 description 1
- PYNUBZSXKQKAHL-UWVGGRQHSA-N His-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O PYNUBZSXKQKAHL-UWVGGRQHSA-N 0.000 description 1
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 1
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 1
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 1
- WJGSTIMGSIWHJX-HVTMNAMFSA-N His-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WJGSTIMGSIWHJX-HVTMNAMFSA-N 0.000 description 1
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 1
- SLFSYFJKSIVSON-SRVKXCTJSA-N His-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SLFSYFJKSIVSON-SRVKXCTJSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- SOYCWSKCUVDLMC-AVGNSLFASA-N His-Pro-Arg Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCNC(=N)N)C(=O)O SOYCWSKCUVDLMC-AVGNSLFASA-N 0.000 description 1
- XIGFLVCAVQQGNS-IHRRRGAJSA-N His-Pro-His Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 XIGFLVCAVQQGNS-IHRRRGAJSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 1
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 1
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 1
- 101001095266 Homo sapiens Prolyl endopeptidase Proteins 0.000 description 1
- 101710091977 Hydrophobin Proteins 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- SJIGTGZVQGLMGG-NAKRPEOUSA-N Ile-Cys-Arg Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O SJIGTGZVQGLMGG-NAKRPEOUSA-N 0.000 description 1
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 1
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 1
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 1
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 1
- RWYCOSAAAJBJQL-KCTSRDHCSA-N Ile-Gly-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N RWYCOSAAAJBJQL-KCTSRDHCSA-N 0.000 description 1
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 1
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 1
- RENBRDSDKPSRIH-HJWJTTGWSA-N Ile-Phe-Met Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O RENBRDSDKPSRIH-HJWJTTGWSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- XMYURPUVJSKTMC-KBIXCLLPSA-N Ile-Ser-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XMYURPUVJSKTMC-KBIXCLLPSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- JDCQDJVYUXNCGF-SPOWBLRKSA-N Ile-Ser-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JDCQDJVYUXNCGF-SPOWBLRKSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 1
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 102400000471 Isomaltase Human genes 0.000 description 1
- 101710184220 Kappa-carrageenase Proteins 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- 239000002211 L-ascorbic acid Substances 0.000 description 1
- 235000000069 L-ascorbic acid Nutrition 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- PRZVBIAOPFGAQF-SRVKXCTJSA-N Leu-Glu-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O PRZVBIAOPFGAQF-SRVKXCTJSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 1
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 1
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 1
- FZMNAYBEFGZEIF-AVGNSLFASA-N Leu-Met-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N FZMNAYBEFGZEIF-AVGNSLFASA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- 108010063860 Leu-Ser-Glu-Ala-Leu Proteins 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 1
- QQXJROOJCMIHIV-AVGNSLFASA-N Leu-Val-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O QQXJROOJCMIHIV-AVGNSLFASA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108010013563 Lipoprotein Lipase Proteins 0.000 description 1
- 102100022119 Lipoprotein lipase Human genes 0.000 description 1
- 108010011449 Long-chain-fatty-acid-CoA ligase Proteins 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- MKBIVWXCFINCLE-SRVKXCTJSA-N Lys-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N MKBIVWXCFINCLE-SRVKXCTJSA-N 0.000 description 1
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 1
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- WLXGMVVHTIUPHE-ULQDDVLXSA-N Lys-Phe-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O WLXGMVVHTIUPHE-ULQDDVLXSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 1
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- 108020002496 Lysophospholipase Proteins 0.000 description 1
- 102100028524 Lysosomal protective protein Human genes 0.000 description 1
- 101150002830 MPG1 gene Proteins 0.000 description 1
- 102000001696 Mannosidases Human genes 0.000 description 1
- 108010054377 Mannosidases Proteins 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- MUYQDMBLDFEVRJ-LSJOCFKGSA-N Met-Ala-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 MUYQDMBLDFEVRJ-LSJOCFKGSA-N 0.000 description 1
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 1
- XOMXAVJBLRROMC-IHRRRGAJSA-N Met-Asp-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOMXAVJBLRROMC-IHRRRGAJSA-N 0.000 description 1
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 1
- HHCOOFPGNXKFGR-HJGDQZAQSA-N Met-Gln-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HHCOOFPGNXKFGR-HJGDQZAQSA-N 0.000 description 1
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 1
- HLQWFLJOJRFXHO-CIUDSAMLSA-N Met-Glu-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O HLQWFLJOJRFXHO-CIUDSAMLSA-N 0.000 description 1
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 1
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 1
- OBCRZLRPJFNLAN-DCAQKATOSA-N Met-His-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OBCRZLRPJFNLAN-DCAQKATOSA-N 0.000 description 1
- BKIFWLQFOOKUCA-DCAQKATOSA-N Met-His-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N BKIFWLQFOOKUCA-DCAQKATOSA-N 0.000 description 1
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 1
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 1
- YLBUMXYVQCHBPR-ULQDDVLXSA-N Met-Leu-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YLBUMXYVQCHBPR-ULQDDVLXSA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- CGUYGMFQZCYJSG-DCAQKATOSA-N Met-Lys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CGUYGMFQZCYJSG-DCAQKATOSA-N 0.000 description 1
- UDOYVQQKQHZYMB-DCAQKATOSA-N Met-Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDOYVQQKQHZYMB-DCAQKATOSA-N 0.000 description 1
- OBPCXINRFKHSRY-SDDRHHMPSA-N Met-Met-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N OBPCXINRFKHSRY-SDDRHHMPSA-N 0.000 description 1
- PHKBGZKVOJCIMZ-SRVKXCTJSA-N Met-Pro-Arg Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PHKBGZKVOJCIMZ-SRVKXCTJSA-N 0.000 description 1
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 1
- LUYURUYVNYGKGM-RCWTZXSCSA-N Met-Pro-Thr Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUYURUYVNYGKGM-RCWTZXSCSA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 1
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 1
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 1
- WOGNGBROIHHFAO-JYJNAYRXSA-N Met-Tyr-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCSC)C(=O)O)N WOGNGBROIHHFAO-JYJNAYRXSA-N 0.000 description 1
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 1
- 108090000131 Metalloendopeptidases Proteins 0.000 description 1
- 102000003843 Metalloendopeptidases Human genes 0.000 description 1
- GMPKIPWJBDOURN-UHFFFAOYSA-N Methoxyamine Chemical compound CON GMPKIPWJBDOURN-UHFFFAOYSA-N 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 102100032519 Mitochondrial ribonuclease P catalytic subunit Human genes 0.000 description 1
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 1
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 1
- 102000005398 Monoacylglycerol Lipase Human genes 0.000 description 1
- 101710203791 Mucorpepsin Proteins 0.000 description 1
- 206010048723 Multiple-drug resistance Diseases 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 101100447658 Mus musculus Gas1 gene Proteins 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101000973640 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) Endo-1,6-beta-D-glucanase Proteins 0.000 description 1
- 101000728666 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) Putative rhamnogalacturonase Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- IOVCWXUNBOPUCH-UHFFFAOYSA-N Nitrous acid Chemical compound ON=O IOVCWXUNBOPUCH-UHFFFAOYSA-N 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 102100021969 Nucleotide pyrophosphatase Human genes 0.000 description 1
- 102100033357 Pancreatic lipase-related protein 2 Human genes 0.000 description 1
- 108030006205 Pectate trisaccharide-lyases Proteins 0.000 description 1
- 241000228150 Penicillium chrysogenum Species 0.000 description 1
- 101100541125 Penicillium chrysogenum Xyn gene Proteins 0.000 description 1
- 241001326562 Pezizomycotina Species 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 1
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 1
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 1
- XWBJLKDCHJVKAK-KKUMJFAQSA-N Phe-Arg-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XWBJLKDCHJVKAK-KKUMJFAQSA-N 0.000 description 1
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 1
- KIAWKQJTSGRCSA-AVGNSLFASA-N Phe-Asn-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KIAWKQJTSGRCSA-AVGNSLFASA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- KOUUGTKGEQZRHV-KKUMJFAQSA-N Phe-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KOUUGTKGEQZRHV-KKUMJFAQSA-N 0.000 description 1
- UMKYAYXCMYYNHI-AVGNSLFASA-N Phe-Gln-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N UMKYAYXCMYYNHI-AVGNSLFASA-N 0.000 description 1
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 1
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 1
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- JKJSIYKSGIDHPM-WBAXXEDZSA-N Phe-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O JKJSIYKSGIDHPM-WBAXXEDZSA-N 0.000 description 1
- IWZRODDWOSIXPZ-IRXDYDNUSA-N Phe-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 IWZRODDWOSIXPZ-IRXDYDNUSA-N 0.000 description 1
- FKFCKDROTNIVSO-JYJNAYRXSA-N Phe-Pro-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O FKFCKDROTNIVSO-JYJNAYRXSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- GKRCCTYAGQPMMP-IHRRRGAJSA-N Phe-Ser-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GKRCCTYAGQPMMP-IHRRRGAJSA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- MRWOVVNKSXXLRP-IHPCNDPISA-N Phe-Ser-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MRWOVVNKSXXLRP-IHPCNDPISA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 1
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 1
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 108010044302 Phosphoinositide phospholipase C Proteins 0.000 description 1
- 102100035200 Phospholipase A and acyltransferase 4 Human genes 0.000 description 1
- 102000011420 Phospholipase D Human genes 0.000 description 1
- 102100032967 Phospholipase D1 Human genes 0.000 description 1
- 108010058864 Phospholipases A2 Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 108010073135 Phosphorylases Proteins 0.000 description 1
- 102000009097 Phosphorylases Human genes 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 1
- FCCBQBZXIAZNIG-LSJOCFKGSA-N Pro-Ala-His Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O FCCBQBZXIAZNIG-LSJOCFKGSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 1
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 1
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 1
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 1
- KIGGUSRFHJCIEJ-DCAQKATOSA-N Pro-Asp-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O KIGGUSRFHJCIEJ-DCAQKATOSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 1
- LSIWVWRUTKPXDS-DCAQKATOSA-N Pro-Gln-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LSIWVWRUTKPXDS-DCAQKATOSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- WSRWHZRUOCACLJ-UWVGGRQHSA-N Pro-Gly-His Chemical compound C([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H]1NCCC1)C1=CN=CN1 WSRWHZRUOCACLJ-UWVGGRQHSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- FDINZVJXLPILKV-DCAQKATOSA-N Pro-His-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O FDINZVJXLPILKV-DCAQKATOSA-N 0.000 description 1
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 1
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 1
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 1
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 1
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 1
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 1
- WIPAMEKBSHNFQE-IUCAKERBSA-N Pro-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@@H]1CCCN1 WIPAMEKBSHNFQE-IUCAKERBSA-N 0.000 description 1
- RPLMFKUKFZOTER-AVGNSLFASA-N Pro-Met-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 RPLMFKUKFZOTER-AVGNSLFASA-N 0.000 description 1
- QCMYJBKTMIWZAP-AVGNSLFASA-N Pro-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 QCMYJBKTMIWZAP-AVGNSLFASA-N 0.000 description 1
- QGLFRQCECIWXFA-RCWTZXSCSA-N Pro-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1)O QGLFRQCECIWXFA-RCWTZXSCSA-N 0.000 description 1
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 1
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- SWRNSCMUXRLHCR-ULQDDVLXSA-N Pro-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 SWRNSCMUXRLHCR-ULQDDVLXSA-N 0.000 description 1
- GFHOSBYCLACKEK-GUBZILKMSA-N Pro-Pro-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GFHOSBYCLACKEK-GUBZILKMSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 1
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 1
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 1
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 1
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 1
- BJCXXMGGPHRSHV-GUBZILKMSA-N Pro-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BJCXXMGGPHRSHV-GUBZILKMSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- FYXCBXDAMPEHIQ-FHWLQOOXSA-N Pro-Trp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O FYXCBXDAMPEHIQ-FHWLQOOXSA-N 0.000 description 1
- VPBQDHMASPJHGY-JYJNAYRXSA-N Pro-Trp-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CO)C(=O)O VPBQDHMASPJHGY-JYJNAYRXSA-N 0.000 description 1
- OABLKWMLPUGEQK-JYJNAYRXSA-N Pro-Tyr-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O OABLKWMLPUGEQK-JYJNAYRXSA-N 0.000 description 1
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 1
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108700015930 Prolyl Oligopeptidases Proteins 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 1
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 1
- 108030006244 Protein-glutamine glutaminases Proteins 0.000 description 1
- 102100027378 Prothrombin Human genes 0.000 description 1
- 101710148480 Putative beta-xylosidase Proteins 0.000 description 1
- 102100021702 Putative cytochrome P450 2D7 Human genes 0.000 description 1
- 101710193171 Pyranose dehydrogenase Proteins 0.000 description 1
- 108090001066 Racemases and epimerases Proteins 0.000 description 1
- 102000004879 Racemases and epimerases Human genes 0.000 description 1
- 108090000621 Ribonuclease P Proteins 0.000 description 1
- 102000004167 Ribonuclease P Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 102000000505 Ribonucleotide Reductases Human genes 0.000 description 1
- 108010041388 Ribonucleotide Reductases Proteins 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- RZUOXAKGNHXZTB-GUBZILKMSA-N Ser-Arg-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RZUOXAKGNHXZTB-GUBZILKMSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 1
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 1
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 1
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 1
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 1
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 1
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 1
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 1
- DGHFNYXVIXNNMC-GUBZILKMSA-N Ser-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGHFNYXVIXNNMC-GUBZILKMSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 1
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 1
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 1
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 1
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 1
- HEYZPTCCEIWHRO-IHRRRGAJSA-N Ser-Met-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HEYZPTCCEIWHRO-IHRRRGAJSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- JAWGSPUJAXYXJA-IHRRRGAJSA-N Ser-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=CC=C1 JAWGSPUJAXYXJA-IHRRRGAJSA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 1
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- YXGCIEUDOHILKR-IHRRRGAJSA-N Ser-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CO)N YXGCIEUDOHILKR-IHRRRGAJSA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102000003667 Serine Endopeptidases Human genes 0.000 description 1
- 108090000083 Serine Endopeptidases Proteins 0.000 description 1
- 108030000574 Serine-type carboxypeptidases Proteins 0.000 description 1
- 102000034328 Serine-type carboxypeptidases Human genes 0.000 description 1
- 108090000899 Serralysin Proteins 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 241000228341 Talaromyces Species 0.000 description 1
- 241001136494 Talaromyces funiculosus Species 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- 101710167005 Thiol:disulfide interchange protein DsbD Proteins 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- STGXWWBXWXZOER-MBLNEYKQSA-N Thr-Ala-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 STGXWWBXWXZOER-MBLNEYKQSA-N 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- PKXHGEXFMIZSER-QTKMDUPCSA-N Thr-Arg-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PKXHGEXFMIZSER-QTKMDUPCSA-N 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- APIQKJYZDWVOCE-VEVYYDQMSA-N Thr-Asp-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O APIQKJYZDWVOCE-VEVYYDQMSA-N 0.000 description 1
- KZUJCMPVNXOBAF-LKXGYXEUSA-N Thr-Cys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KZUJCMPVNXOBAF-LKXGYXEUSA-N 0.000 description 1
- UCCNDUPVIFOOQX-CUJWVEQBSA-N Thr-Cys-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 UCCNDUPVIFOOQX-CUJWVEQBSA-N 0.000 description 1
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- YZUWGFXVVZQJEI-PMVVWTBXSA-N Thr-Gly-His Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O YZUWGFXVVZQJEI-PMVVWTBXSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- UDNVOQMPQBEITB-MEYUZBJRSA-N Thr-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UDNVOQMPQBEITB-MEYUZBJRSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- ODXKUIGEPAGKKV-KATARQTJSA-N Thr-Leu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O ODXKUIGEPAGKKV-KATARQTJSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- MCDVZTRGHNXTGK-HJGDQZAQSA-N Thr-Met-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O MCDVZTRGHNXTGK-HJGDQZAQSA-N 0.000 description 1
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 1
- LKJCABTUFGTPPY-HJGDQZAQSA-N Thr-Pro-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O LKJCABTUFGTPPY-HJGDQZAQSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- GQPQJNMVELPZNQ-GBALPHGKSA-N Thr-Ser-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O GQPQJNMVELPZNQ-GBALPHGKSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- VGNLMPBYWWNQFS-ZEILLAHLSA-N Thr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O VGNLMPBYWWNQFS-ZEILLAHLSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 1
- VMSSYINFMOFLJM-KJEVXHAQSA-N Thr-Tyr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O VMSSYINFMOFLJM-KJEVXHAQSA-N 0.000 description 1
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 102000005497 Thymidylate Synthase Human genes 0.000 description 1
- ISWQCIVKKSOKNN-UHFFFAOYSA-L Tiron Chemical compound [Na+].[Na+].OC1=CC(S([O-])(=O)=O)=CC(S([O-])(=O)=O)=C1O ISWQCIVKKSOKNN-UHFFFAOYSA-L 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 1
- HOJPPPKZWFRTHJ-PJODQICGSA-N Trp-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HOJPPPKZWFRTHJ-PJODQICGSA-N 0.000 description 1
- LHHDBONOFZDWMW-AAEUAGOBSA-N Trp-Asp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LHHDBONOFZDWMW-AAEUAGOBSA-N 0.000 description 1
- CZSMNLQMRWPGQF-XEGUGMAKSA-N Trp-Gln-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CZSMNLQMRWPGQF-XEGUGMAKSA-N 0.000 description 1
- VTHNLRXALGUDBS-BPUTZDHNSA-N Trp-Gln-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VTHNLRXALGUDBS-BPUTZDHNSA-N 0.000 description 1
- QEJHHFFFCUDPDV-WDSOQIARSA-N Trp-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N QEJHHFFFCUDPDV-WDSOQIARSA-N 0.000 description 1
- IKUMWSDCGQVGHC-UMPQAUOISA-N Trp-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O IKUMWSDCGQVGHC-UMPQAUOISA-N 0.000 description 1
- 102000014384 Type C Phospholipases Human genes 0.000 description 1
- 108010079194 Type C Phospholipases Proteins 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 1
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 1
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 1
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 1
- IXTQGBGHWQEEDE-AVGNSLFASA-N Tyr-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IXTQGBGHWQEEDE-AVGNSLFASA-N 0.000 description 1
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 1
- UMXSDHPSMROQRB-YJRXYDGGSA-N Tyr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UMXSDHPSMROQRB-YJRXYDGGSA-N 0.000 description 1
- NGALWFGCOMHUSN-AVGNSLFASA-N Tyr-Gln-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NGALWFGCOMHUSN-AVGNSLFASA-N 0.000 description 1
- FMOSEWZYZPMJAL-KKUMJFAQSA-N Tyr-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N FMOSEWZYZPMJAL-KKUMJFAQSA-N 0.000 description 1
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 1
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- BBSPTGPYIPGTKH-JYJNAYRXSA-N Tyr-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N BBSPTGPYIPGTKH-JYJNAYRXSA-N 0.000 description 1
- GYBVHTWOQJMYAM-HRCADAONSA-N Tyr-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N GYBVHTWOQJMYAM-HRCADAONSA-N 0.000 description 1
- AUZADXNWQMBZOO-JYJNAYRXSA-N Tyr-Pro-Arg Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 AUZADXNWQMBZOO-JYJNAYRXSA-N 0.000 description 1
- ARMNWLJYHCOSHE-KKUMJFAQSA-N Tyr-Pro-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O ARMNWLJYHCOSHE-KKUMJFAQSA-N 0.000 description 1
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 1
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 1
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 1
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 1
- KSGKJSFPWSMJHK-JNPHEJMOSA-N Tyr-Tyr-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSGKJSFPWSMJHK-JNPHEJMOSA-N 0.000 description 1
- BQASAMYRHNCKQE-IHRRRGAJSA-N Tyr-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N BQASAMYRHNCKQE-IHRRRGAJSA-N 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 1
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 1
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 1
- JXGWQYWDUOWQHA-DZKIICNBSA-N Val-Gln-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N JXGWQYWDUOWQHA-DZKIICNBSA-N 0.000 description 1
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 1
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- OJOMXGVLFKYDKP-QXEWZRGKSA-N Val-Met-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OJOMXGVLFKYDKP-QXEWZRGKSA-N 0.000 description 1
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 1
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 1
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 1
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- SDHZOOIGIUEPDY-JYJNAYRXSA-N Val-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 SDHZOOIGIUEPDY-JYJNAYRXSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- 101710158370 Xylan 1,4-beta-xylosidase Proteins 0.000 description 1
- 229920002000 Xyloglucan Polymers 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 108010048241 acetamidase Proteins 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 229960003767 alanine Drugs 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010084217 alanyl-glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010081577 aldehyde dehydrogenase (NAD(P)+) Proteins 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- 102000012086 alpha-L-Fucosidase Human genes 0.000 description 1
- 108010044879 alpha-L-rhamnosidase Proteins 0.000 description 1
- 108010084650 alpha-N-arabinofuranosidase Proteins 0.000 description 1
- 108010061261 alpha-glucuronidase Proteins 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 108010076955 arabinogalactan endo-1,4-beta-galactosidase Proteins 0.000 description 1
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 229960003272 asparaginase Drugs 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-M asparaginate Chemical compound [O-]C(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-M 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 108010047754 beta-Glucosidase Proteins 0.000 description 1
- 102000006995 beta-Glucosidase Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 230000012292 cell migration Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 108010052085 cellobiose-quinone oxidoreductase Proteins 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 108010089807 chitosanase Proteins 0.000 description 1
- 229960002976 chymopapain Drugs 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 108010081447 cytochrophin-4 Proteins 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 108010027293 diisopropyl-fluorophosphatase Proteins 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 235000020774 essential nutrients Nutrition 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 108010075712 fatty acid reductase Proteins 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 108010058100 fructan beta-fructosidase Proteins 0.000 description 1
- 108010079306 galactoside 2-alpha-L-fucosyltransferase Proteins 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000010448 genetic screening Methods 0.000 description 1
- 102000034238 globular proteins Human genes 0.000 description 1
- 108091005896 globular proteins Proteins 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 235000019514 herring Nutrition 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 238000002169 hydrotherapy Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 108010031620 mandelonitrile lyase Proteins 0.000 description 1
- 108010022356 mannan 1,2-(1,3)-alpha mannosidase Proteins 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000004660 morphological change Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 108090000021 oryzin Proteins 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 238000012259 partial gene deletion Methods 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 108010087558 pectate lyase Proteins 0.000 description 1
- 108010072638 pectinacetylesterase Proteins 0.000 description 1
- 102000004251 pectinacetylesterase Human genes 0.000 description 1
- 108020004410 pectinesterase Proteins 0.000 description 1
- 229940066716 pepsin a Drugs 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N phenol group Chemical group C1(=CC=CC=C1)O ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 229940085127 phytase Drugs 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 108010066823 proline dipeptidase Proteins 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 230000004845 protein aggregation Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 108010016615 rhamnogalacturonan rhamnohydrolase Proteins 0.000 description 1
- 108010029529 rhamnogalacturonase A Proteins 0.000 description 1
- 238000000518 rheometry Methods 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 238000011218 seed culture Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 108010007375 seryl-seryl-seryl-arginine Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229940079827 sodium hydrogen sulfite Drugs 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 108090000135 streptogrisin A Proteins 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 108060007951 sulfatase Proteins 0.000 description 1
- 108010038851 tannase Proteins 0.000 description 1
- KKEYFWRCBNTPAC-UHFFFAOYSA-L terephthalate(2-) Chemical compound [O-]C(=O)C1=CC=C(C([O-])=O)C=C1 KKEYFWRCBNTPAC-UHFFFAOYSA-L 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- NGSWKAQJJWESNS-ZZXKWVIFSA-N trans-4-coumaric acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C=C1 NGSWKAQJJWESNS-ZZXKWVIFSA-N 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 229960004441 tyrosine Drugs 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 229920001221 xylan Polymers 0.000 description 1
- 150000004823 xylans Chemical class 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/01—Preparation of mutants without inserting foreign genetic material therein; Screening processes therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Mycology (AREA)
- Biophysics (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Botany (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Toxicology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명의 본 균주 및 방법은 변경된 표현형, 변경된 형태, 변경된 성장 특징 등을 갖는 변이체 균주를 생성시키는 사상성 진균에서의 유전자 변형에 관한 것이다. 보다 구체적으로는, 본원에 제시되고 기재된 것처럼, 점도 감소 표현형을 포함하는 사상성 진균의 이러한 변이체 균주는 액침 배양에서의 성장(예를 들어, 상업적 분야에 대한 효소 및 다른 단백질 또는 대사물질의 대규모 제조)에 잘 맞는다.
Description
본 발명은 일반적으로 생물학, 분자 생물학, 레올로지, 사상성 진균, 산업적 단백질 제조 등의 분야에 관한 것이다. 보다 구체적으로는, 본 발명의 본 균주 및 방법은 변경된 표현형, 변경된 형태, 변경된 성장 특징 등을 갖는 변이체 균주를 생성시키는 사상성 진균에서의 유전자 변형에 관한 것이다. 보다 구체적으로는, 본원에 제시되고 기재된 것처럼, 사상성 진균의 이러한 변이체 균주는 액침 배양(submerged culture)에서의 성장(예를 들어, 상업적 분야에 대한 효소 및 다른 단백질 또는 대사물질의 대규모 제조)에 잘 맞는다.
관련 출원의 상호 참조
본 출원은 2018년 4월 24일자로 출원된 미국 특허 가출원 62/661,658호의 우선권을 주장하며, 본 가출원은 본원에 그 전체가 참고로 포함된다.
서열 목록의 언급
"NB40808-WO-PCT_SequenceListing.txt"로 명명된 서열 목록 텍스트 파일의 전자 제출 내용은 2019년 4월 05일자로 생성되었으며, 크기가 184 KB이고, 본원에 그 전체가 참고로 포함된다.
사상성 진균은 자연적 단백질 및 이종성 단백질을 높은 수준으로 발현할 수 있어서, 이것이 산업, 제약, 동물 건강, 식품 및 음료 분야 등에 대해 효소 및 다른 단백질 및/또는 대사물질의 대규모 제조에 매우 적합하다. 사상성 진균은 일반적으로 생물반응기(발효기)에서 균사체 액침 배양에서 성장하고, 생물반응기는 산소 및 영양소를 배양 배지(즉, 배양 브로스)로 도입하고 분포시키도록 적응된다. 균사체의 형태학적 특징은 배양 배지(브로스)의 레올로지 특성에 영향을 미쳐 생물반응기 성능에 영향을 미친다.
예를 들어, 사상성 진균 숙주 트리코데르마 레세이에서, 많은 자연적 단백질 및 이종성 단백질은 효과적으로 분비되어 글루코스의 비생산성(specific productivity)(Qp) 및 수율이 높다. 그러나, 트리코데르마 과정(즉, 일반적으로 사상성 진균)에 대한 용량 요건은 낮은 부피 생산성으로 인해 매우 높다. 예를 들어, 낮은 부피 생산성은 높은 배양 브로스 점도 및 산소 이동 제한으로 인해 바이오매스 수준의 제한의 필요성에 의해 생긴다.
일반적으로, 브로스의 점도가 더 높을수록, 산소 및 영양소의 분포가 덜 균일하고, 배양물을 교반하기 위해 필요한 에너지가 더 많다. 예를 들어, 일부 경우에, 배양 브로스의 점도는 산소 및 영양소의 용해를 상당히 방해하기에 충분히 높아져서, 진균의 성장 및/또는 진균에 의한 생성물 생성에 부정적으로 영향을 미친다. 추가로, 생물반응기에서 점성인 브로스를 혼합하고 에어레이션화하기 위한 파워는 제조 비용을 상당히 증가시키고, 모터 및 전원 공급기구의 면에서 더 높은 자본 비용을 초래할 수 있다. 따라서, 일반적으로 상기 기재된 것처럼, 비제한적인 예로서 부피 효율의 개선, 향상된/균일한 산소 분포, 세포 브로스 점도의 감소, 높은 비생산성, 탄소원에 대한 수율의 개선, 생물반응기 작동 비용의 감소, (세포) 표현형의 변경, (세포) 형태의 변경, (세포) 성장 특징의 변경 등을 포함하는 많은 진행 중이고 충족되지 않은 필요성이 당해 분야에 남아 있다.
변경된 표현형, 변경된 형태, 변경된 성장 특징 등을 갖는 변이체 균주를 생성시키는 유전자 변형을 갖는 사상성 진균과 관련된 균주, 방법, 작제물 등이 본원에 기재되어 있다. 예를 들어, 본 발명의 특정 구현예는 모 균주로부터 유래된 사상성 진균의 변이체 균주에 관한 것이고, 여기서 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함한다.
따라서, 특정 구현예에서, 본 발명은 모 균주로부터 유래된 사상성 진균의 변이체 균주에 관한 것이고, 여기서 변이체 균주는 서열 번호 2, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 31, 서열 번호 33 및 서열 번호 35와 약 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 변이체 균주의 세포는 모 세포에 비해 점도 감소 표현형을 포함한다. 따라서, 특정 다른 구현예에서, 점도 감소 표현형을 포함하는 이러한 변이체 균주는 (a) 액침 배양에서의 호기성 발효 동안 모 균주의 세포에 비해 미리 선택된 용존 산소 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, (b) 모 균주의 세포에 비해 미리 선택된 양의 교반에서 증가한 용존 산소 함량을 유지시키는 세포 브로스를 생성한다.
따라서, 다른 구현예에서, SSB7 단백질을 암호화하는 유전자의 유전자 변형은 SSB7 단백질을 암호화하는 유전자의 적어도 3' 영역을 결실시키거나 파괴시키는 것을 포함한다. 다른 구현예에서, 그 유전자에 의해 암호화된 SSB7 단백질은 SSB7 C 말단의 적어도 마지막 400번 아미노산 위치의 결실, SSB7 C 말단의 적어도 마지막 600번 아미노산 위치의 결실, SSB7 C 말단의 적어도 마지막 800번 아미노산 위치의 결실 또는 SSB7 C 말단의 적어도 마지막 1,000번 아미노산 위치의 결실을 포함한다. 다른 구현예에서, 그 유전자에 의해 암호화된 SSB7 단백질은 완전히 결실된다.
따라서, 특정 다른 구현예에서, ssb7 유전자는 SSB7 C 말단의 마지막 400번 아미노산 위치를 암호화하는 3' 영역에서 파괴되거나, ssb7 유전자는 SSB7 C 말단의 마지막 600번 아미노산 위치를 암호화하는 3' 영역에서 파괴되거나, ssb7 유전자는 SSB7 C 말단의 마지막 800번 아미노산 위치를 암호화하는 3' 영역에서 파괴되거나, ssb7 유전자는 SSB7 C 말단의 마지막 1,000번 아미노산 위치를 암호화하는 3' 영역에서 파괴된다.
관련 구현예에서, 모 균주 및 변이체 균주는 동일한 관심 단백질(POI: protein of interest)을 암호화하는 유전자를 포함한다. 다른 구현예에서, 변이체 균주는 바이오매스의 단위량당 모 균주와 실질적으로 동일한 양의 관심 단백질을 생산한다. 다른 구현예에서, 변이체 균주는 바이오매스의 단위량당 모 균주보다 더 많은 관심 단백질을 생산한다.
다른 구현예에서, 사상성 진균은 자낭균류(Ascomycota) 문이다. 다른 구현예에서, 사상성 진균은 트리코데르마 종(Trichoderma sp.) 진균, 푸사륨 종(Fusarium sp.) 진균, 뉴로스포라 종(Neurospora sp.) 진균, 마이셀리오프토라 종(Myceliophthora sp.) 진균, 탈라로마이세스 종(Talaromyces sp.) 진균, 아스페르길루스 종(Aspergillus sp.) 진균 및 페니실륨 종(Penicillium sp.) 진균으로 이루어진 군으로부터 선택된다.
따라서, 특정 다른 구현예에서, 본 발명은 본 발명의 점도 감소 변이체에 의해 생산된 하나 이상의 관심 단백질에 관한 것이다.
특정 다른 구현예에서, 변이체 균주는 MPG1 단백질, SFB3 단백질, SEB1 단백질, CRZ1 단백질 및/또는 GAS1 단백질을 암호화하는 하나 이상의 유전자의 유전자 변형을 추가로 포함한다.
다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 1의 ssb7 유전자 또는 이의 상보성 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 19의 ssb7 엑손 또는 이의 상보성 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 20의 ssb7 엑손 또는 이의 상보성 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 21의 ssb7 엑손 또는 이의 상보성 서열과 혼성화한다.
또 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 22의 영역 A를 암호화하는 핵산 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 23의 영역 B를 암호화하는 핵산 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 24의 영역 C를 암호화하는 핵산 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 25의 영역 D를 암호화하는 핵산 서열과 혼성화한다.
다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 SSB7 단백질의 보존된 아미노산 서열을 암호화하는 핵산 서열과 혼성화하고, 엄격한 혼성화 조건 하에 보존된 서열은 서열 번호 26 내지 30으로 이루어진 군으로부터 선택된다.
특정 다른 구현예에서, 본 발명은 사상성 진균 세포의 점도 감소 균주를 작제하는 방법에 관한 것이고, 이러한 방법은 (a) 사상성 진균 세포의 모 균주를 수득하고, 서열 번호 2, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 31, 서열 번호 33 또는 서열 번호 35와 적어도 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 유전자를 유전자 변형시키는 단계, 및 (b) 단계 (a)에서 변형된 변이체 균주를 단리시키는 단계(여기서, 변이체 균주의 세포는 모 세포에 비해 점도 감소 표현형을 포함함)를 포함한다. 따라서, 관련 구현예에서, 변이체 균주는 액침 배양에서의 호기성 발효 동안 (a) 모 균주의 세포에 비해 미리 선택된 용존 산소 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, (b) 모 균주의 세포에 비해 미리 선택된 양의 교반에서 증가한 용존 산소 함량을 유지시키는 세포 브로스를 생성한다.
따라서, 상기 방법의 다른 구현예에서, SSB7 단백질을 암호화하는 유전자의 유전자 변형은 SSB7 단백질을 암호화하는 유전자의 적어도 3' 영역을 결실시키거나 파괴시키는 것을 포함한다.
특정 다른 구현예에서, 그 유전자에 의해 암호화된 SSB7 단백질은 SSB7 C 말단의 적어도 마지막 400번 아미노산 위치의 결실, SSB7 C 말단의 적어도 마지막 600번 아미노산 위치의 결실, SSB7 C 말단의 적어도 마지막 800번 아미노산 위치의 결실, SSB7 C 말단의 적어도 마지막 1,000번 아미노산 위치의 결실 등을 포함한다. 상기 방법의 다른 구현예에서, 그 유전자에 의해 암호화된 SSB7 단백질은 완전히 결실된다.
상기 방법의 특정 다른 구현예에서, ssb7 유전자는 SSB7 C 말단의 마지막 400번 아미노산 위치를 암호화하는 3' 영역에서 파괴되거나, ssb7 유전자는 SSB7 C 말단의 마지막 600번 아미노산 위치를 암호화하는 3' 영역에서 파괴되거나, ssb7 유전자는 SSB7 C 말단의 마지막 800번 아미노산 위치를 암호화하는 3' 영역에서 파괴되거나, ssb7 유전자는 SSB7 C 말단의 마지막 1,000번 아미노산 위치를 암호화하는 3' 영역에서 파괴되고, 기타 등등이다.
따라서, 특정 다른 구현예에서, 이러한 진균 세포는 관심 단백질을 암호화하는 유전자를 포함한다. 다른 구현예에서, 변이체 균주는 바이오매스의 단위량당 모 균주와 실질적으로 동일한 양의 관심 단백질을 생산한다. 다른 구현예에서, 변이체 균주는 바이오매스의 단위량당 모 균주보다 더 많은 관심 단백질을 생산한다. 따라서, 특정 다른 구현예에서, 본 발명은 본 발명의 변이체 균주에 의해 생산된 관심 단백질에 관한 것이다.
상기 방법의 특정 다른 구현예에서, 사상성 진균은 자낭균류 문이다. 다른 구현예에서, 사상성 진균은 트리코데르마 종 진균, 푸사륨 종 진균, 뉴로스포라 종 진균, 마이셀리오프토라 종 진균, 탈라로마이세스 종 진균, 아스페르길루스 종 진균 및 페니실륨 종 진균으로 이루어진 군으로부터 선택된다.
상기 방법의 다른 구현예에서, 변이체 균주는 MPG1 단백질, SFB3 단백질, SEB1 단백질, CRZ1 단백질 및/또는 GAS1 단백질을 암호화하는 하나 이상의 유전자의 유전자 변형을 추가로 포함한다.
상기 방법의 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 1의 ssb7 유전자 또는 이의 상보성 서열과 혼성화한다. 특정 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 19의 ssb7 엑손 또는 이의 상보성 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 20의 ssb7 엑손 또는 이의 상보성 서열과 혼성화한다. 또 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 21의 ssb7 엑손 또는 이의 상보성 서열과 혼성화한다.
상기 방법의 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 22의 영역 A를 암호화하는 핵산 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 23의 영역 B를 암호화하는 핵산 서열과 혼성화한다. 또 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 24의 영역 C를 암호화하는 핵산 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 25의 영역 D를 암호화하는 핵산 서열과 혼성화한다. 상기 방법의 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 SSB7 단백질의 보존된 아미노산 서열을 암호화하는 핵산 서열과 혼성화하고, 보존된 서열은 서열 번호 26 내지 30으로 이루어진 군으로부터 선택된다.
특정 다른 구현예에서, 본 발명은 점도 감소 표현형을 포함하는 사상성 진균 세포의 변이체 균주를 스크리닝하고 단리시키는 방법에 관한 것이고, 상기 방법은 (a) 서열 번호 2, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 31, 서열 번호 33 또는 서열 번호 35와 적어도 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 모 진균 균주에서의 유전자를 유전자 변형시키는 단계, (b) 모 균주의 세포 형태에 대하여 점도 감소 표현형을 위해 단계 (a)의 변형된 변이체 균주의 세포 형태를 스크리닝하는 단계, 및 (c) 점도 감소 표현형을 포함하는 단계 (b)의 변형된 변이체 균주를 단리시키는 단계를 포함하고, 여기서 변이체 균주는 액침 배양에서의 호기성 발효 동안 (a) 모 균주의 세포에 비해 미리 선택된 용존 산소 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, (b) 모 균주의 세포에 비해 미리 선택된 양의 교반에서 증가한 용존 산소 함량을 유지시키는 세포 브로스를 생성한다. 다른 구현예에서, 단계 (c)의 변이체 균주는 이것이 유래된 모 균주에 비해 더 짧은 균사 필라멘트와 관련된 점도 감소 표현형을 포함한다(도 2).
생물학적 서열의 간단한 설명
서열 번호 1은 서열 번호 2의 자연적 SSB7 단백질을 암호화하는 야생형 T. 레세이 ssb7 유전자의 핵산 서열이다.
서열 번호 2는 서열 번호 1에 의해 암호화된 자연적 T. 레세이 SSB7 단백질의 아미노산 서열이다.
서열 번호 3은 프레임 쉬프트(fs) 돌연변이 및 ssb7 유전자의 마지막 인트론 전의 조기 종결 코돈을 생성시키는 엑손 2에서의 G의 결실(Δ)을 포함하는 대립유전자 ssb7(fs)의 핵산 서열이다.
서열 번호 4는 서열 번호 3의 대립유전자 ssb7(fs)에 의해 암호화된 변이체 SSB7 단백질의 아미노산 서열이다.
서열 번호 5는 도 6a에 제시된 합성 gBlock 핵산 서열이다.
서열 번호 6은 도 6b에 제시된 ssb7 유전자의 합성 gBlock 단일-가이드 RNA(sgRNA) 발현 카세트 표적화 TS1이다.
서열 번호 7은 도 6c에 제시된 ssb7 유전자의 합성 gBlock 단일-가이드 RNA(sgRNA) 발현 카세트 표적화 TS2이다.
서열 번호 8은 푸사륨 종 SSB7 단백질 오솔로그의 아미노산 서열이다.
서열 번호 9는 뉴로스포라 종 SSB7 단백질 오솔로그의 아미노산 서열이다.
서열 번호 10은 마이셀리오프토라 종 SSB7 단백질 오솔로그의 아미노산 서열이다.
서열 번호 11은 탈라로마이세스 종 SSB7 단백질 오솔로그의 아미노산 서열이다.
서열 번호 12는 아스페르길루스 종 SSB7 단백질 오솔로그의 아미노산 서열이다.
서열 번호 13은 페니실륨 종 SSB7 단백질 오솔로그의 아미노산 서열이다.
서열 번호 14는 T. 레세이 MPG1 단백질의 아미노산 서열이다.
서열 번호 15는 T. 레세이 SFB3 단백질의 아미노산 서열이다.
서열 번호 16은 T. 레세이 SEB1 단백질의 아미노산 서열이다.
서열 번호 17은 T. 레세이 CRZ1 단백질의 아미노산 서열이다.
서열 번호 18은 T. 레세이 GAS1 단백질의 아미노산 서열이다.
서열 번호 19는 야생형 T. 레세이 ssb7 유전자 엑손 1의 핵산 서열이다.
서열 번호 20은 야생형 T. 레세이 ssb7 유전자 엑손 2의 핵산 서열이다.
서열 번호 21은 야생형 T. 레세이 ssb7 유전자 엑손 3의 핵산 서열이다.
서열 번호 22는 SSB7 단백질 영역 A를 암호화하는 T. 레세이 핵산 서열이다.
서열 번호 23은 SSB7 단백질 영역 B를 암호화하는 T. 레세이 핵산 서열이다.
서열 번호 24는 SSB7 단백질 영역 C를 암호화하는 T. 레세이 핵산 서열이다.
서열 번호 25는 SSB7 단백질 영역 D를 암호화하는 T. 레세이 핵산 서열이다.
서열 번호 26은 도 9c에 도시된 바와 같은 보존된 SSB7 아미노산 서열이다.
서열 번호 27은 도 9c에 도시된 바와 같은 보존된 SSB7 아미노산 서열이다.
서열 번호 28은 도 9d에 도시된 바와 같은 보존된 SSB7 아미노산 서열이다.
서열 번호 29는 도 9d에 도시된 바와 같은 보존된 SSB7 아미노산 서열이다.
서열 번호 30은 도 9e에 도시된 바와 같은 보존된 SSB7 아미노산 서열이다.
서열 번호 31은 T. 아트로비리데(atroviride) SSB7 단백질의 아미노산 서열이다.
서열 번호 32는 서열 번호 33의 예측된 SSB7 단백질을 암호화하는 T. 레세이(QM6a 균주) ssb7 유전자의 핵산 서열 예측이다.
서열 번호 33은 서열 번호 32에 의해 암호화된 T. 레세이(QM6a 균주) 예측된 SSB7 단백질의 아미노산 서열이다.
서열 번호 34는 서열 번호 35의 예측된 SSB7 단백질을 암호화하는 T. 레세이(RUT-C30 균주) ssb7 유전자의 핵산 서열 예측이다.
서열 번호 35는 서열 번호 34에 의해 암호화된 T. 레세이(RUT-C30 균주) 예측된 SSB7 단백질의 아미노산 서열이다.
서열 번호 36은 T. 레세이 ssb7 유전자 전사체의 5'-UTR(비번역 영역)이다.
서열 번호 37은 T. 레세이 ssb7 유전자 전사체의 3'-UTR(비번역 영역)이다.
서열 번호 38은 자연적 T. 레세이 Nik1 단백질의 아미노산 서열이다.
도 1은 본원에 개시되고 예시된 ssb7 대립유전자를 예시하는 ssb7 유전좌위의 도시적 다이어그램이다. 보다 구체적으로는, 실시예 부문에 제시되고 기재된 것처럼, 사상성 진균의 이러한 변이체 균주(즉, 돌연변이된 ssb7 대립유전자를 포함)는 야생형 ssb7 대립유전자를 포함하는 모 (대조군) 균주에 비해 점도 감소 표현형/형태(즉, 점도가 감소한 발효 브로스를 생성)를 포함한다. 따라서, 도 1a에 제시된 것처럼, ssb7 유전자에 대한 예측된 SSB7 단백질 암호화 서열에 대응하는 영역(즉, 엑손)은 화살표로 표시되고, 엑손 사이의 선은 인트론의 위치를 나타낸다. 상이한 버전의 ssb7에 대한 유전자 예측, 및 본원에 기재된 예측("SSB7 CDS(푸나노테이트(funannotate))")은 이의 표지(예를 들어, "QM6a JGI ssb7 PID 108712" 및 "RUT-C30 PID 82397")에 의해 표시된다. 이 유전좌위로 맵핑된 RNA-서열분석 판독의 요약은 커버리지 맵(RNA 판독 커버리지)에 도시되어 있다. 푸나노테이트에 의해 예측된 5'-비번역 영역 및 3'-비번역 영역(UTR)은 또한 그렇게 표시되고 표지된다. 서열 밑의 각각의 트랙은 본원에 개시되고 예시된 다섯(5)개의 상이한 대립유전자(예를 들어, 대립유전자 ssb7(fs), 대립유전자 ssb7(311), 대립유전자 ssb7(TS1), 대립유전자 ssb7(TS2) 및 대립유전자 ssb7(339fs))를 예시한다. 박스(예를 들어, "pRATT311 왼쪽 플랭크", "pRATT311 오른쪽 플랭크", "pRATT339 왼쪽 플랭크" 및 "pRATT339 오른쪽 플랭크" 표지됨)는 ssb7 유전좌위에서의 마커(예를 들어, pyr2)의 통합을 목표로 하도록 사용된 상동성 박스를 보여주고; 박스(예를 들어, "TS1" 및 "TS2" 표지됨)는 cas9 매개된 유전자 편집에 사용된 표적 서열(TS: Target Sequence)을 보여준다. 대립유전자에 존재하는 다형성(즉, 돌연변이 및 삽입-결실)은 작은 비표지된 박스로(즉, 이 해상도에서 가능한 최고로) 제시된다. 더욱이, 대립유전자 주석 아래에 박스로 표지된 A-D가 있는데, 하기 실시예 1에 추가로 기재된 것처럼 내부의 아미노산 보존의 네(4)개의 영역(즉, 도 1a, 영역 A-D)의 암호화 서열에서의 위치를 나타낸다. 명확성을 위해, 더 높은 서열 해상도에서, 도 1b는 모두 각각의 대립유전자(ssb7(fs), ssb7(311), ssb7(TS1), ssb7(TS2) 및 ssb7(399fs))에 대해 균주 Morph 77B7에서 확인된 프레임 쉬프트(fs) 부위 주위의 유전자 변형을 제시한다.
도 2는 DNA 단편 1 및 6에 의한 형질전환에 의한 T. 레세이 돌연변이체 균주 Morph 77B7 균사 표현형의 상보성을 보여준다. 도 2에 도시된 것처럼, DNA 단편 1(도 2, 패널 1A 및 패널 1B) 및 DNA 단편 6(도 2, 패널 6A 및 패널 6B)은 각각의 DNA 단편(즉, DNA 단편 1 및 단편 6)에 대한 독립적인 형질전환체를 나타낸다. 대부분의 DNA 단편을 보유하는 형질전환체는 돌연변이체 균주인 Morph 77B7에 대해 관찰된 과분지하고 두꺼운 균사 표현형을 보유하였다. 예를 들어, 도 2, 패널 1A 및 패널 1B에 도시된 것처럼, DNA 단편 1을 포함(균주 Morph 77B7에서의 다른 돌연변이체 유전좌위(즉, PID 112328) 중 하나를 암호화)하는 형질전환체는 이 과분지하고 두꺼운 균사 표현형을 예시한다. 반대로, 도 2, 패널 6A 및 패널 6B에 도시된 것처럼, DNA 단편 6을 포함(즉, PID 108712/SSB7을 암호화)하는 형질전환체만이 적어도 부분적으로 더 얇고 덜 분지된 균사로 이 표현형을 반전시켰다.
도 3은 자연적 SSB7 단백질(도 3b, 서열 번호 2)을 암호화하는 T. 레세이 야생형 ssb7 유전자(도 3a, 서열 번호 1)의 핵산 서열 및 변이체 SSB7 단백질(즉, C 말단 절두된 SSB7 단백질)을 암호화하는 T. 레세이 돌연변이체 ssb7 대립유전자(ssb7(fs), 도 3c, 서열 번호 3)의 핵산 서열을 제시하고, 여기서 암호화 서열 영역은 대문자로 제시하고, 인트론은 이탤릭 소문자로 제시한다. 도 3c에 도시된 것처럼, 돌연변이체 ssb7 대립유전자의 핵산 서열에서의 (ΔG) 프레임 쉬프트 돌연변이의 부위에 인접한 뉴클레오타이드는 볼드체 대문자 및 밑줄 표시된 문자 GA 로 제시된다.
도 4는 엑손 1(도 4a, 서열 번호 19), 엑손 2(도 4b, 서열 번호 20) 및 엑손 3(도 4c, 서열 번호 21)으로서 T. 레세이 ssb7 유전자 (ORF) 암호화 서열을 제시한다.
도 5는 SSB7 단백질의 아미노산 보존을 예시하는 그래프 표시이다. 보다 구체적으로는, 도 5는 N 말단 MIT 도메인에 걸친 아미노산이 결여된 짧은 단백질 예측을 제외하고 삼백오십삼(353)개의 자냥균 동족체의 MUSCLE 정렬의 그래프 표시이다. 도 5의 하부에 T. 레세이 SSB7 단백질의 아미노산 서열을 나타내는 박스가 있고, 여기서 아미노산(잔기)은 85% 초과의 정렬된 서열에서 보존되면 흑색(또는 그렇지 않으면 밝은 회색임) 박스에 제시된다. 도 5에 제시된 것처럼, 서열 정렬에서의 아미노산 서열 갭은 잔기들 간의 회색 음영 선으로 제시된다. 잔기 아래의 단일 회색 박스는 PID 108712/SSB7에 대해 다운로드된 GeneBank EGR47392 서열에 주석이 첨가된 MIT 도메인을 나타낸다. 평균 소수화도 및 등전점(PI)이 또한 작도되어 도 5에 제시된다. 정렬에서의 아미노산 동일성은 잔기 바로 위에 작도된다. 막대 높이는 아미노산 동일성에 비례한다. 회색 막대는 정렬에서 서열의 적어도 30%에서 동일한 잔기를 나타내고, 흑색 막대는 30% 미만에서 동일한 잔기를 나타낸다. 정렬은 SSB7 동족체에서의, 박스 표지된 A 내지 D로 표시된, 네(4)개의 보존 영역인 영역 A 내지 D를 밝혀냈다. 영역 A는 MIT 도메인에 대응한다.
도 6은 ssb7 유전좌위에서의 cas9 매개된 게놈 편집에 대한 pTrex2g MoCas에 첨가된 합성 DNA 서열을 제시한다. 예를 들어, 서열 번호 5(도 6a)는 ssb7 유전좌위를 편집하기 위한 서열 정보를 갖는 IDT gBlock 핵산 서열이고, 서열 번호 6(도 6b)은 77B7 TS1 sgRNA의 발현을 위한 IDT gBlock이고, 서열 번호 7(도 6c)은 77B7 TS2 sgRNA의 발현을 위한 IDT gBlock이다. 도 6a에 제시된 것처럼, 단일 밑줄 표시된 뉴클레오타이드는 시험관내 플라스미드 어셈블리에 사용된 pTrex2gHyg MoCas와의 서열 동일성의 영역을 보여주고, 이중 밑줄 표시된 뉴클레오타이드는 가이드 RNA 서열에 대응하는 20-nt 표적 부위를 나타내고, 대문자 볼드체 잔기는 표적 부위에 인접한 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif) 부위를 변경시키는 G→C 뉴클레오타이드 변화를 나타내고, 회색 음영 뉴클레오타이드는 야생형 유전자에서는 일곱(7)개의 G인 여섯(6)개의 G 잔기를 보여준다. 도 6b 및 도 6c에 제시된 것처럼, 단일 밑줄 표시된 뉴클레오타이드는 시험관내 플라스미드 어셈블리에 사용된 pTrex2gHyg MoCas와의 서열 동일성의 영역을 보여주고, 소문자 뉴클레오타이드는 T. 레세이 게놈에서의 표적 부위를 보여주고, 이중 밑줄 표시된 뉴클레오타이드는 sgRNA의 서열을 나타내고, 회색 음영 뉴클레오타이드는 인트론 서열을 보여준다.
도 7은 대립유전자 ssb7(311) 및 대립유전자 ssb7(TS1)에 의한 발효 브로스 점도 감소를 보여주는 데이터를 제시한다. 보다 구체적으로는, 도 7은 (모) TrGA 29-9 및 (딸) ssb7 돌연변이체 유래 균주의 생물반응기 발효에 대한 "교반" 및 "용존 산소 (DO)" 프로필을 보여준다. 교반(도 7, 'x'로 표시된 왼쪽 y축(RPM); t=0 전에 위로의 경향) 및 용존 산소(도 7, '|'로 표시된 오른쪽 y축(DO%); t=0 전에 아래로의 경향)의 양은 교반-추가 및 DO-제한 측정을 계산하기 위해 사용된 시간 범위(플러스 및 마이너스 10시간)에 대하여 공급 시작 조정된 발효 시간(x축)에 대해 작도되었다. 모 TrGA 29-9("29-9": 흑색) 및 2개의 ssb7 돌연변이체 (딸) 균주 (TrGA 29-9 ssb7(311): 회색) 및 (TrGA 29-9 ssb7(TS1): 흰색)의 프로필이 작도되었다.
도 8은 일반적으로 야생형 T. 레세이 SSB7 단백질(서열 번호 2)의 아미노산 조성 및 관련 특성을 보여준다. 도 8a는 서열 번호 2의 PEPSTATS 분석을 보여주고, 여기서 SSB7 단백질은 1,308개의 잔기, 142,540(Da)의 추정된 (이론적) 분자량, 대략 6.8의 등전점 및 +10의 근사 순 전하를 포함한다. SSB7 단백질은, 도 8a에 제시된 것처럼, 몰 백분율(%)에 기초하여 대략 12.0%(157)의 세린(S) 잔기, 9.6%(126)의 알라닌(A) 잔기, 9.6%(126)의 프롤린(P) 잔기, 6.8%(89)의 류신(L) 잔기, 5.8%(76)의 글루타민(Q) 등을 포함한다. 도 8b는 (문헌[Kyte-Doolittle Hydropathy Index, 9-residue window, Kyte and Doolittle, 1982]에 따라) 서열 번호 2의 1번 내지 1,308번 잔기 위치를 포함하는 자연적 (전장) SSB7 단백질의 소수성 도표이다. 예를 들어, 도 8c-도 8f는 서열 번호 2의 N 말단(1번 잔기)에서 시작하고 C 말단(1,308번 잔기)에서 끝나는 대략 320개의 잔기 범위에서 SSB7 단백질의 서열(서열 번호 2)의 1,308개의 잔기에 걸친 SSB7 단백질의 소수성 도표를 제시하고, 여기서 도 8c는 SSB7 단백질 1번 내지 320번 잔기(서열 번호 2)의 소수성 도표를 보여주고, 도 8d는 SSB7 단백질 321번 내지 640번 잔기(서열 번호 2)의 소수성 도표를 보여주고, 도 8e는 SSB7 단백질 641번 내지 961번 잔기(서열 번호 2)의 소수성 도표를 보여주고, 도 8f는 SSB7 단백질 962번 내지 1,308번 잔기(서열 번호 2)의 소수성 도표를 보여준다. 도 8g는 도 8b-도 8f에 사용된 Kyle-Doolittle 아미노산 소수성 점수를 보여준다. 따라서, 도 8b-도 8g에 제시된 것처럼, SSB7 단백질 서열의 소수성 영역은 0 초과의 점수 값으로 표시되고, SSB7 단백질 서열의 친수성 영역은 0 미만의 점수 값으로 표시된다(예를 들어, 잔기 값 도 8g 참조). 예를 들어, 도 8c는 SSB7 단백질(N 말단 1번 내지 320번 잔기)의 소수성 도표를 제시하고, 여기서 1번 내지 320번 잔기의 단일 문자 아미노산 서열은 소수성 도표 바로 위에 도시된다.
도 9는 여섯(6)개의 상이한 자낭균류 SSB7 단백질 오솔로그와 정렬된 야생형 트리코데르마 레세이 SSB7 단백질("SID_2"로 축약; 볼드체 대문자 아미노산 잔기로 제시됨) 및 야생형 트리코데르마 아트로비리데 SSB7 단백질("SID_31"로 축약)의 CLUSTAL W (1.83) 다중 서열 정렬을 제시한다. 보다 구체적으로는, 도 9a-도 9e에 제시된 것처럼, 푸사륨 종 SSB7 단백질(서열 번호 8; "SID_8"로 축약), 뉴로스포라 종 SSB7 단백질(서열 번호 9; "SID_9"로 축약), 마이셀리오프토라 종 SSB7 단백질(서열 번호 10; "SID_10"으로 축약), 탈라로마이세스 종 SSB7 단백질(서열 번호 11; "SID_11"로 축약), 아스페르길루스 종 SSB7 단백질(서열 번호 12; "SID_12"로 축약), 페니실륨 종 SSB7 단백질(서열 번호 13; "SID_13"으로 축약) 및 야생형 트리코데르마 아트로비리데 SSB7 단백질(서열 번호 31)은 T. 레세이 SSB7 단백질(서열 번호 2)과 정렬되었다. 도 9a-도 9e에(즉, 정렬된 아미노 잔기 아래에) 제시된 것처럼, 별표(*)는 단일의 완전히 보존된 잔기를 갖는 위치를 나타내고, 콜론(:)은 강하게 유사한 특성의 그룹 간의 보존(즉, Gonnet PAM 250 행렬에서 0.5 초과의 점수)을 나타내고, 마침표(.)는 약하게 유사한 특성의 그룹 간의 보존(즉, Gonnet PAM 250 행렬에서 0.5 미만의 점수)을 나타낸다.
도 2는 DNA 단편 1 및 6에 의한 형질전환에 의한 T. 레세이 돌연변이체 균주 Morph 77B7 균사 표현형의 상보성을 보여준다. 도 2에 도시된 것처럼, DNA 단편 1(도 2, 패널 1A 및 패널 1B) 및 DNA 단편 6(도 2, 패널 6A 및 패널 6B)은 각각의 DNA 단편(즉, DNA 단편 1 및 단편 6)에 대한 독립적인 형질전환체를 나타낸다. 대부분의 DNA 단편을 보유하는 형질전환체는 돌연변이체 균주인 Morph 77B7에 대해 관찰된 과분지하고 두꺼운 균사 표현형을 보유하였다. 예를 들어, 도 2, 패널 1A 및 패널 1B에 도시된 것처럼, DNA 단편 1을 포함(균주 Morph 77B7에서의 다른 돌연변이체 유전좌위(즉, PID 112328) 중 하나를 암호화)하는 형질전환체는 이 과분지하고 두꺼운 균사 표현형을 예시한다. 반대로, 도 2, 패널 6A 및 패널 6B에 도시된 것처럼, DNA 단편 6을 포함(즉, PID 108712/SSB7을 암호화)하는 형질전환체만이 적어도 부분적으로 더 얇고 덜 분지된 균사로 이 표현형을 반전시켰다.
도 3은 자연적 SSB7 단백질(도 3b, 서열 번호 2)을 암호화하는 T. 레세이 야생형 ssb7 유전자(도 3a, 서열 번호 1)의 핵산 서열 및 변이체 SSB7 단백질(즉, C 말단 절두된 SSB7 단백질)을 암호화하는 T. 레세이 돌연변이체 ssb7 대립유전자(ssb7(fs), 도 3c, 서열 번호 3)의 핵산 서열을 제시하고, 여기서 암호화 서열 영역은 대문자로 제시하고, 인트론은 이탤릭 소문자로 제시한다. 도 3c에 도시된 것처럼, 돌연변이체 ssb7 대립유전자의 핵산 서열에서의 (ΔG) 프레임 쉬프트 돌연변이의 부위에 인접한 뉴클레오타이드는 볼드체 대문자 및 밑줄 표시된 문자 GA 로 제시된다.
도 4는 엑손 1(도 4a, 서열 번호 19), 엑손 2(도 4b, 서열 번호 20) 및 엑손 3(도 4c, 서열 번호 21)으로서 T. 레세이 ssb7 유전자 (ORF) 암호화 서열을 제시한다.
도 5는 SSB7 단백질의 아미노산 보존을 예시하는 그래프 표시이다. 보다 구체적으로는, 도 5는 N 말단 MIT 도메인에 걸친 아미노산이 결여된 짧은 단백질 예측을 제외하고 삼백오십삼(353)개의 자냥균 동족체의 MUSCLE 정렬의 그래프 표시이다. 도 5의 하부에 T. 레세이 SSB7 단백질의 아미노산 서열을 나타내는 박스가 있고, 여기서 아미노산(잔기)은 85% 초과의 정렬된 서열에서 보존되면 흑색(또는 그렇지 않으면 밝은 회색임) 박스에 제시된다. 도 5에 제시된 것처럼, 서열 정렬에서의 아미노산 서열 갭은 잔기들 간의 회색 음영 선으로 제시된다. 잔기 아래의 단일 회색 박스는 PID 108712/SSB7에 대해 다운로드된 GeneBank EGR47392 서열에 주석이 첨가된 MIT 도메인을 나타낸다. 평균 소수화도 및 등전점(PI)이 또한 작도되어 도 5에 제시된다. 정렬에서의 아미노산 동일성은 잔기 바로 위에 작도된다. 막대 높이는 아미노산 동일성에 비례한다. 회색 막대는 정렬에서 서열의 적어도 30%에서 동일한 잔기를 나타내고, 흑색 막대는 30% 미만에서 동일한 잔기를 나타낸다. 정렬은 SSB7 동족체에서의, 박스 표지된 A 내지 D로 표시된, 네(4)개의 보존 영역인 영역 A 내지 D를 밝혀냈다. 영역 A는 MIT 도메인에 대응한다.
도 6은 ssb7 유전좌위에서의 cas9 매개된 게놈 편집에 대한 pTrex2g MoCas에 첨가된 합성 DNA 서열을 제시한다. 예를 들어, 서열 번호 5(도 6a)는 ssb7 유전좌위를 편집하기 위한 서열 정보를 갖는 IDT gBlock 핵산 서열이고, 서열 번호 6(도 6b)은 77B7 TS1 sgRNA의 발현을 위한 IDT gBlock이고, 서열 번호 7(도 6c)은 77B7 TS2 sgRNA의 발현을 위한 IDT gBlock이다. 도 6a에 제시된 것처럼, 단일 밑줄 표시된 뉴클레오타이드는 시험관내 플라스미드 어셈블리에 사용된 pTrex2gHyg MoCas와의 서열 동일성의 영역을 보여주고, 이중 밑줄 표시된 뉴클레오타이드는 가이드 RNA 서열에 대응하는 20-nt 표적 부위를 나타내고, 대문자 볼드체 잔기는 표적 부위에 인접한 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif) 부위를 변경시키는 G→C 뉴클레오타이드 변화를 나타내고, 회색 음영 뉴클레오타이드는 야생형 유전자에서는 일곱(7)개의 G인 여섯(6)개의 G 잔기를 보여준다. 도 6b 및 도 6c에 제시된 것처럼, 단일 밑줄 표시된 뉴클레오타이드는 시험관내 플라스미드 어셈블리에 사용된 pTrex2gHyg MoCas와의 서열 동일성의 영역을 보여주고, 소문자 뉴클레오타이드는 T. 레세이 게놈에서의 표적 부위를 보여주고, 이중 밑줄 표시된 뉴클레오타이드는 sgRNA의 서열을 나타내고, 회색 음영 뉴클레오타이드는 인트론 서열을 보여준다.
도 7은 대립유전자 ssb7(311) 및 대립유전자 ssb7(TS1)에 의한 발효 브로스 점도 감소를 보여주는 데이터를 제시한다. 보다 구체적으로는, 도 7은 (모) TrGA 29-9 및 (딸) ssb7 돌연변이체 유래 균주의 생물반응기 발효에 대한 "교반" 및 "용존 산소 (DO)" 프로필을 보여준다. 교반(도 7, 'x'로 표시된 왼쪽 y축(RPM); t=0 전에 위로의 경향) 및 용존 산소(도 7, '|'로 표시된 오른쪽 y축(DO%); t=0 전에 아래로의 경향)의 양은 교반-추가 및 DO-제한 측정을 계산하기 위해 사용된 시간 범위(플러스 및 마이너스 10시간)에 대하여 공급 시작 조정된 발효 시간(x축)에 대해 작도되었다. 모 TrGA 29-9("29-9": 흑색) 및 2개의 ssb7 돌연변이체 (딸) 균주 (TrGA 29-9 ssb7(311): 회색) 및 (TrGA 29-9 ssb7(TS1): 흰색)의 프로필이 작도되었다.
도 8은 일반적으로 야생형 T. 레세이 SSB7 단백질(서열 번호 2)의 아미노산 조성 및 관련 특성을 보여준다. 도 8a는 서열 번호 2의 PEPSTATS 분석을 보여주고, 여기서 SSB7 단백질은 1,308개의 잔기, 142,540(Da)의 추정된 (이론적) 분자량, 대략 6.8의 등전점 및 +10의 근사 순 전하를 포함한다. SSB7 단백질은, 도 8a에 제시된 것처럼, 몰 백분율(%)에 기초하여 대략 12.0%(157)의 세린(S) 잔기, 9.6%(126)의 알라닌(A) 잔기, 9.6%(126)의 프롤린(P) 잔기, 6.8%(89)의 류신(L) 잔기, 5.8%(76)의 글루타민(Q) 등을 포함한다. 도 8b는 (문헌[Kyte-Doolittle Hydropathy Index, 9-residue window, Kyte and Doolittle, 1982]에 따라) 서열 번호 2의 1번 내지 1,308번 잔기 위치를 포함하는 자연적 (전장) SSB7 단백질의 소수성 도표이다. 예를 들어, 도 8c-도 8f는 서열 번호 2의 N 말단(1번 잔기)에서 시작하고 C 말단(1,308번 잔기)에서 끝나는 대략 320개의 잔기 범위에서 SSB7 단백질의 서열(서열 번호 2)의 1,308개의 잔기에 걸친 SSB7 단백질의 소수성 도표를 제시하고, 여기서 도 8c는 SSB7 단백질 1번 내지 320번 잔기(서열 번호 2)의 소수성 도표를 보여주고, 도 8d는 SSB7 단백질 321번 내지 640번 잔기(서열 번호 2)의 소수성 도표를 보여주고, 도 8e는 SSB7 단백질 641번 내지 961번 잔기(서열 번호 2)의 소수성 도표를 보여주고, 도 8f는 SSB7 단백질 962번 내지 1,308번 잔기(서열 번호 2)의 소수성 도표를 보여준다. 도 8g는 도 8b-도 8f에 사용된 Kyle-Doolittle 아미노산 소수성 점수를 보여준다. 따라서, 도 8b-도 8g에 제시된 것처럼, SSB7 단백질 서열의 소수성 영역은 0 초과의 점수 값으로 표시되고, SSB7 단백질 서열의 친수성 영역은 0 미만의 점수 값으로 표시된다(예를 들어, 잔기 값 도 8g 참조). 예를 들어, 도 8c는 SSB7 단백질(N 말단 1번 내지 320번 잔기)의 소수성 도표를 제시하고, 여기서 1번 내지 320번 잔기의 단일 문자 아미노산 서열은 소수성 도표 바로 위에 도시된다.
도 9는 여섯(6)개의 상이한 자낭균류 SSB7 단백질 오솔로그와 정렬된 야생형 트리코데르마 레세이 SSB7 단백질("SID_2"로 축약; 볼드체 대문자 아미노산 잔기로 제시됨) 및 야생형 트리코데르마 아트로비리데 SSB7 단백질("SID_31"로 축약)의 CLUSTAL W (1.83) 다중 서열 정렬을 제시한다. 보다 구체적으로는, 도 9a-도 9e에 제시된 것처럼, 푸사륨 종 SSB7 단백질(서열 번호 8; "SID_8"로 축약), 뉴로스포라 종 SSB7 단백질(서열 번호 9; "SID_9"로 축약), 마이셀리오프토라 종 SSB7 단백질(서열 번호 10; "SID_10"으로 축약), 탈라로마이세스 종 SSB7 단백질(서열 번호 11; "SID_11"로 축약), 아스페르길루스 종 SSB7 단백질(서열 번호 12; "SID_12"로 축약), 페니실륨 종 SSB7 단백질(서열 번호 13; "SID_13"으로 축약) 및 야생형 트리코데르마 아트로비리데 SSB7 단백질(서열 번호 31)은 T. 레세이 SSB7 단백질(서열 번호 2)과 정렬되었다. 도 9a-도 9e에(즉, 정렬된 아미노 잔기 아래에) 제시된 것처럼, 별표(*)는 단일의 완전히 보존된 잔기를 갖는 위치를 나타내고, 콜론(:)은 강하게 유사한 특성의 그룹 간의 보존(즉, Gonnet PAM 250 행렬에서 0.5 초과의 점수)을 나타내고, 마침표(.)는 약하게 유사한 특성의 그룹 간의 보존(즉, Gonnet PAM 250 행렬에서 0.5 미만의 점수)을 나타낸다.
본원에 제시되고 기재된 것처럼, 본 발명은 비제한적인 예로서 부피 효율의 개선, 향상된/균일한 산소 분포, 세포 브로스 점도의 감소, 높은 비생산성, 탄소원에 대한 수율의 개선, 생물반응기(발효기) 작동 비용의 감소, (세포) 표현형의 변경, (세포) 형태의 변경, (세포) 성장 특징의 변경 등을 포함하는 사상성 진균 단백질 제조 및 이의 방법의 당해 분야에서의 소정의 계속되는 충족되지 않은 필요성을 해결한다. 따라서, 본 발명의 본 균주 및 방법은 일반적으로 이러한 변경된 표현형, 변경된 형태, 변경된 성장 특징 등을 갖는 변이체 균주를 생성시키는 사상성 진균에서의 유전자 변형에 관한 것이다. 보다 구체적으로는, 본원에 제시되고 기재된 것처럼, 사상성 진균의 이러한 변이체 균주는 효소 및 다른 단백질 또는 대사물질의 대규모 제조에 대해 액침 배양에서의 성장에 잘 맞는다.
따라서, 특정 구현예에서, 본 발명은 본원에 기재된 모 균주로부터 유래된 사상성 진균의 변이체 균주에 관한 것이다. 특정 구현예에서, 이러한 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함한다. 보다 구체적으로는, 특정 다른 구현예에서, 본 발명의 변이체 균주(즉, SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함)는 모 균주의 세포에 비해 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는(즉, 액침 배양에서의 호기성 발효 동안) 세포 브로스를 생성하고/하거나, 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는(즉, 액침 배양에서의 호기성 발효 동안) 세포량을 생성한다.
예를 들어, 특정 구현예에서, 본원에서 작제되고 기재된 사상성 진균의 이러한 변이체 균주는 특히 본원에서 "점도 감소" 표현형이라 칭하는 변경된 세포 형태 표현형(예를 들어, 실시예 1 내지 실시예 3 및 도 2 참조)을 포함한다. 보다 구체적으로는, 실시예 1에 제시된 것처럼, "Morph 77B7"이라 명명된 T. 레세이 돌연변이체는 액침 액체 배양에서 특히 모체보다 더 짧고 더 두꺼운 필라멘트를 갖는 변경된 형태(표현형)를 갖는 것으로 관찰되었고, 여기서 Morph 77B7 돌연변이체는 또한 모체를 함유하는 배양물과 비교하여 성장 동안 더 높은 수준의 용존 산소(DO)을 나타냈다(실시예 1, 표 1 참조).
더욱이, 실시예 1에 기재된 것처럼, 오직 하나의 야생형 유전좌위는 본원에서 "ssb7"이라 명명된 돌연변이체(Morph 77B7) 표현형을 보완하고, 여기서 ssb7 유전자는 동일한 DNA 서열에서의 다른 단백질 예측과 부분적으로 중첩하는 새로 예측된 단백질인 SSB7, 예를 들어 트리코데르마 레세이 QM6a 단백질 ID(PID) 108712를 암호화한다(The Genome Portal of the Department of Energy Joint Genome Institute, Grigoriev et al., Nucleic Acids Res., 2011). 마찬가지로, 확인된 ssb7 돌연변이체 대립유전자는 엑손 2(T. 레세이 QM6a 스캐폴드 13, 167404)에서 단일 구아닌(G) 뉴클레오타이드 결실(ΔG)을 포함하고, 여기서 (ssb7 돌연변이체 대립유전자의) 엑손 2에서의 G의 결실은 프레임 쉬프트(fs) 돌연변이 및 ssb7 유전자의 마지막 인트론(인트론 2) 전의 조기 종결 코돈을 생성시키는데, 돌연변이체 대립유전자는 "ssb7(fs)"라 명명된다.
본 발명의 실시예 2는 ssb7 돌연변이가 발효(배양) 브로스 점도 감소(즉, 변경된 형태/표현형)의 원인인지를 추가로 검증하고, 여기서 ssb7 유전좌위는 모 T. 레세이 균주에서 특이적으로 돌연변이된다. 예를 들어, 두(2) 가지의 상이한 방법이 상동성 재조합에 의해 ssb7 돌연변이유발을 표적화하도록 사용되어서 본원에서 "ssb7(311)" 및 "ssb7(TS1)"이라 명명된 대립유전자를 생성시키고, 여기서 ssb7의 대립유전자 둘 다는 점도 감소 표현형을 나타냈다.
본 발명의 실시예 3은 추가로 시험되고, 이러한 ssb7 돌연변이체의 이용성을 확인하였고, 여기서 "ssb7(311)", "ssb7(339fs)" 및 "ssb7(TS2)"이라 명명된 ssb7의 세(3) 가지의 돌연변이체 대립유전자는 셀룰라아제의 자연적 칵테일을 발현하는 상이한 트리코데르마 레세이 계통("T4abc"라 명명)에서 또한 평가되었다. 이 배경에서 유래된 이 돌연변이체는 또한 본원에 기재된 점도 감소 표현형을 나타냈다.
따라서, 본원에 추가로 예시되고 기재된 것처럼, 본 발명의 점도 감소 표현형을 포함하는 사상성 진균의 이러한 변이체 균주는 모 균주의 세포에 비해 액침 배양에서의 호기성 발효 동안 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, 액침 배양에서의 호기성 발효 동안 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포량을 생성한다. 예를 들어, 사상성 진균 세포의 이러한 변이체 (딸) 균주의 세포량은 (비변형된) 모 균주의 세포량과 비교하여 점도 감소 표현형을 나타내고, 점도 감소는 하기 실시예 부문에 추가로 기재된 것처럼 용존 산소(DO) 함량 및 부가된 교반과 관련한 관찰을 설명한다.
따라서, 본 발명의 특정 다른 구현예는 사상성 진균 세포의 이러한 변이체 균주를 작제하는 방법, 이러한 변이체 균주를 스크리닝하는 방법, 이러한 변이체 균주를 사용하여 관심 단백질을 제조하는 방법 등에 관한 것이고, 여기서 변이체 균주는 모 균주의 세포에 비해 액침 배양에서의 호기성 발효 동안 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포량을 생성한다.
I. 정의
본 발명의 균주 및 방법을 상세하게 기술하기 전에, 하기 용어가 명확함을 위하여 정의된다. 정의되지 않은 용어는 관련 분야에서 사용되는 통상적인 의미를 따라야 한다. 달리 정의되지 않는 한, 본원에 사용되는 모든 기술 용어 및 과학 용어는 본 발명의 조성물 및 방법이 적용되는 기술 분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다.
본원에 기재되는 것과 유사하거나 동등한 임의의 방법 및 물질이 본 발명의 조성물 및 방법의 실시 또는 시험에 또한 사용될 수 있지만, 대표적인 예시적인 방법 및 물질이 이제 기재된다. 본원에 인용된 모든 공보 및 특허는 그 전체가 참고로 포함된다.
본원에 사용된 바와 같이, 단수 관사("a", "an" 및 "the")는, 문맥상 명백하게 달리 기술하지 않는 한, 복수 지시어를 포괄한다.
청구범위는 임의의 선택적 요소를 제외하도록 작성될 수 있다는 것에 또한 유의한다. 따라서, 이러한 서술은 청구항 요소의 설명과 관련하여 "오로지(solely)", "단지(only)", "제외하는(excluding)", "포함하지 않는(not including)" 등과 같은 배타적인 용어를 사용하거나, "부정적" 한정 또는 이의 단서를 사용하는 것에 대한 선행적 근거로서 역할을 하기 위한 것이다.
본 발명을 읽을 때 당업자에게 명백해지는 것과 같이, 본원에 기술되고 예시된 개별적인 구현예의 각각은 본원에 기술된 본 발명의 조성물 및 방법의 범위 또는 사상으로부터 벗어나지 않고도 다른 몇몇 구현예들 중 임의의 구현예의 특징으로부터 쉽게 분리되거나 이 특징과 쉽게 조합될 수 있는 별개의 구성요소 및 특징을 갖는다. 임의의 언급된 방법은 언급된 사건의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행될 수 있다.
본원에 기재된 바와 같은 조작, 작제 및 사용을 위한 사상성 진균 세포는 일반적으로 자낭균류 문(phylum Ascomycota), 주발버섯 아문(subphylum Pezizomycotina), 특히 영양 균사 상태를 갖는 진균에서 유래한다. 이러한 유기체는 비제한적인 예로서 트리코데르마 종, 아스페르길루스 종, 푸사륨 종, 페니실륨 종, 크리소스포륨 종, 세팔로스포륨 종, 탈라로마이세스 종, 게오스미티아 종, 뉴로스포라 종, 마이셀리오프토라 종 등을 포함하는 상업적으로 중요한 산업적 단백질 및 약학적 단백질의 제조에 사용되는 사상성 진균 세포를 포함한다. 예를 들어, 특정 구현예에서, 사상성 진균 세포 및 이의 균주는 트리코데르마 레세이(이전에 트리코데르마 론기브라치아툼(Trichoderma longibrachiatum) 및 하이포크레아 예코리나(Hypocrea jecorina)로 분류됨), 아스페르길루스 니게르(Aspergillus niger), 아스페르길루스 푸미가투스(Aspergillus fumigatus), 아스페르길루스 이타코니쿠스(Aspergillus itaconicus), 아스페르길루스 오리자에(Aspergillus oryzae), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 테레우스(Aspergillus terreus), 아스페르길루스 소에(Aspergillus sojae), 아스페르길루스 쟈포니쿠스(Aspergillus japonicus), 뉴로스포라 크라사(Neurospora crassa), 페니실륨 푸니쿨로숨(Penicillium funiculosum), 페니실륨 크리소게눔(Penicillium chrysogenum), 탈라로마이세스 (게오스미티아) 에메르소니(Talaromyces (Geosmithia) emersonii), 푸사륨 베네나툼(Fusarium venenatum), 마이셀리오프토라 테르모필라(Myceliophthora thermophila), 크리소스포륨 루크노웬스(Chrysosporium lucknowense)(C1) 등을 포함하지만, 이들로 제한되지는 않는다.
본원에 사용된 바와 같이, 게놈 코디네이트(예를 들어, 스캐폴드 13, 167404)는 에너지부 산하 Joint Genome Institute(JGI)에 의해 생성된 트리코데르마 레세이 QM6a 게놈 서열 어셈블리의 버전 2를 참조한다. (The Genome Portal of the Department of Energy Joint Genome Institute, Grigoriev et al., Nucleic Acids Res 2012 Jan;40(Database issue): D26-32. doi: 10.1093/nar/gkr947). JGI 어셈블리된 스캐폴드 서열은 또한 뉴클레오타이드 수탁 번호 GL985056.1 내지 GL985132.1로 GeneBank(The National Center for Biotechnology)에 기탁되었다.
특정 구현예에서, 본원에 기재된 바와 같은 조작, 작제 및 사용을 위한 사상성 진균 세포는 일반적으로 자낭균류 문, 주발버섯 아문, 특히 영양 균사 상태를 갖고 ssb7 유전자(서열 번호 1)의 유전자(또는 유전자 동족체)를 포함하는 진균에서 유래한다.
다른 구현예에서, 본 발명의 변이체 균주(즉, SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함)는 MPG1, SFB3, SEB1, CRZ1 및/또는 GAS1 단백질을 암호화하는 유전자의 유전자 변형을 추가로 포함한다.
본원에 사용된 바와 같이, T. 레세이 MPG1 단백질은 국제 PCT 공보 WO2012/145584호(본원에 그 전체가 참고로 포함됨)에 기재된 바대로 서열 번호 14의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, T. 레세이 SFB3 단백질은 국제 PCT 공보 WO2012/027580호(본원에 그 전체가 참고로 포함됨)에 기재된 바대로 서열 번호 15의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, T. 레세이 SEB1 단백질은 국제 PCT 공보 WO2012/145595호(본원에 그 전체가 참고로 포함됨)에 기재된 바대로 서열 번호 16의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, T. 레세이 CRZ1 단백질은 국제 PCT 공보 WO2012/145596호(본원에 그 전체가 참고로 포함됨)에 기재된 바대로 서열 번호 17의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, T. 레세이 GAS1 단백질은 국제 PCT 공보 WO2012/145596호 및 WO2012/145592호(본원에 그 전체가 참고로 포함됨)에 기재된 바대로 서열 번호 18의 아미노산 서열을 포함한다.
다른 구현예에서, 본 발명의 트리코데르마 종 균주는 국제 PCT 공보 WO2016/130523호에 기재된 Nik1M743 돌연변이를 포함하고, Nik1M743 단백질은 서열 번호 38의 743번 위치에서의 메티오닌 치환을 포함한다.
특정 다른 구현예에서, 본 발명의 아스페르길루스 종 균주는 Nik1M786 돌연변이를 포함하고, Nik1M776 단백질은 국제 PCT 공보 WO2016/130523호(본원에 그 전체가 참고로 포함됨)에 기재된 바와 같은 786번 위치에서의 메티오닌 치환을 포함한다. 본원에 사용된 바와 같이, "모 세포", "모 진균 세포", "모 균주", "모 진균 균주", "사상성 진균 세포의 모 균주", "기준 균주" 등과 같은 어구는 상호 교환적으로 사용될 수 있고, "비변형된" 모 사상성 진균 세포를 지칭한다. 예를 들어, "사상성 진균 세포의 모 균주"는 "모" 세포 및 "딸" 세포가 하나의 유전자 변형만이 다르도록 사상성 진균 세포의 변이체 (딸) 균주를 생성하기 위해 "모" 세포의 게놈이 (예를 들어, 모 세포로 도입된 오직 하나의 유전자 변형을 통해) 변형되거나 변형 가능한 사상성 진균의 임의의 세포 또는 균주를 지칭한다.
본원에 사용된 바와 같이, "변이체 세포", "딸 세포", "변이체 균주", "딸 균주", "변이체 또는 딸 진균 균주", "사상성 진균 세포의 변이체 또는 딸 균주" 등과 같은 어구는 상호 교환적으로 사용될 수 있고, 사상성 진균 세포의 모 균주(또는 기준 균주)로부터 유래된(즉, 수득되거나 수득 가능한) 사상성 진균 세포의 변이체 균주를 지칭하고, 여기서 변이체 균주는 모 균주에 존재하지 않는 하나의 유전자 변형만을 포함하여서, 비교에 의하면 "모" 균주와 "변이체" 균주 간의 표현형 차이는 하나의 유전자 변형에 기인할 수 있다. 다르게 표현하면, 모 균주 및 변이체 균주는 변이체 균주로 "도입된" 단일 유전자 변형을 제외하고는 달리 동질유전자이다. 따라서, 본 발명에서, 모 균주 및 변이체 균주는 소정의 특징, 예컨대 유전자 변형, 발현 표현형, 형태 표현형 등을 갖는 것으로 기재될 수 있지만, 당업자는 이것이 기술적으로 이러한 특징을 갖는 모 균주 또는 변이체 균주의 세포라는 것을 이해할 것이고, "균주"는 편의를 위해 지칭된다.
특정 구현예에서, 비변형된 (모) 세포는 특히 이들로부터 유래된 유전자 변형된 (변이체/딸) 세포와 비교할 때(이에 대하여) "대조군 세포" 또는 "기준 세포"라 칭해질 수 있다.
본원에 사용된 바와 같이, (비변형된) 모 세포(즉, 대조군 세포)의 표현형/형태가 변이체 (딸) 세포의 표현형/형태와 비교될 때, "모" (비변형된) 세포 및 "딸" (변형된) 세포가 동일한 조건(예를 들어, 배지, 온도, pH 등과 같은 동일한 조건) 하에 성장/배양/발효된다고 이해될 것이다.
마찬가지로, 변이체 (변형된) 딸 세포에서의 동일한 POI의 제조에 대하여 (비변형된) 모 세포(즉, 대조군 세포)에서의 관심 단백질(POI)의 제조를 기재할 때, "모" 세포 및 "변이체" 세포가 본질적으로 동일한 조건(예를 들어, 배지, 온도, pH 등과 같은 동일한 조건) 하에 성장/배양/발효된다고 이해될 것이다.
본원에 사용된 바와 같이, "관심 단백질" 또는 "POI"는 사상성 진균 세포의 액침 배양에서 생산될 것이 요망되는 단백질이다. 이러한 단백질(POI)은 효소, 기질 결합 단백질, 표면 활성 단백질, 구조 단백질, 항체 등일 수 있고, 높은 수준으로 발현될 수 있다. 따라서, POI는 변이체 세포 및/또는 모 균주에 대해 내인성 유전자 또는 이종성 유전자에 의해 암호화될 수 있다. (POI를 암호화하는) 이종성 유전자는 (예를 들어, 본 발명의 하나 이상의 유전자 변형을 수행하기 전에, 동안에 또는 후에) 모 진균 균주 및/또는 변이체 진균 균주로 도입(예를 들어, 형질전환)될 수 있다. POI는 세포내로 발현될 수 있거나 분비된 단백질로서 발현될 수 있다. 일반적으로, POI는 산업, 제약, 동물 건강, 식품 및 음료 용도를 위해 상업적으로 중요하므로, 대규모로 생산하는 것이 바람직하다.
본원에 사용된 바와 같이, "호기성 발효"는 산소의 존재 하에서의 성장을 지칭한다.
본원에 사용된 바와 같이, 용어 "브로스", "세포 브로스", "발효 브로스" 및/또는 "배양 브로스"는 상호 교환적으로 사용되고, 총체적으로 액체 (액침) 배양에서 (i) 발효 (배양) 배지 및 (ii) 세포를 지칭한다.
본원에 사용된 바와 같이, 용어 "세포량(cell mass)"은 액체(액침) 배양물에 존재하는 세포 성분(온전한 세포와 용해된 세포를 포함)을 지칭한다. 세포량은 건조 세포 중량 또는 습윤 세포 중량으로 표현될 수 있다.
본원에 사용된 바와 같이, "점도"는 기계적 스트레스(예를 들어, 전단 스트레스 또는 인장 스트레스 등)에 의한 변형에 대한 유체의 저항의 측정치이다.
본 발명의 맥락에서, 점도는 또한 기계적 스트레스에 의한 변형에 대한 "세포 브로스"(상기 정의됨)의 저항을 지칭한다. 따라서, 특정 구현예에서, "점도"는 (예를 들어, 회전자/임펠러에 의해 제공/유도된 것처럼) 이러한 기계적 스트레스에 대한 "세포 브로스의 저항의 측정치"로서 본원에 정의된다. 그러나, 세포 브로스의 점도가 직접 측정하기 어려울 수 있으므로, 미리 선택된 양의 교반에서의 배양 브로스의 용존 산소(DO) 함량, 미리 선택된 DO 함량을 유지시키는 데 필요한 교반의 양, 미리 선택된 DO 함량을 유지시키기 위해 세포 브로스를 교반하는 데 필요한 파워의 양 또는 심지어 균사 형태와 같은 점도의 간접 측정치를 이용할 수 있다.
본원에 사용된 바와 같이, 사상성 진균 세포의 "점도 감소" 변이체 균주는 모 균주에 의해 생산된 동등한 세포 브로스와 비교하여 점도가 감소한(즉, 전단 스트레스 또는 인장 스트레스에 대한 저항이 감소한) 세포 브로스를 생성하는 변이체 균주를 지칭한다. 일반적으로, 동등한 세포 브로스는 필적하는 세포량을 갖는다. 특정 구현예에서, 점도의 임의의 직접 측정치 또는 간접 측정치와 관련하여 변이체 '점도 감소' 균주와 모 균주 사이의 차이는 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 또는 심지어 적어도 50% 이상이다. 사상성 진균 세포 브로스의 점도를 비교하는 방법이 본원에 기재되어 있다.
본원에 사용된 바와 같이, "용존 산소"(DO)는 부피/부피 단위로 측정된 바대로 액체 배지에 존재하는 산소(O2)의 양을 지칭한다. DO 수준은 발효에 걸쳐 높은 수준, 예를 들어 170%~100% 내지 20%, 100%~80% 내지 20%, 70% 내지 20%, 65% 내지 20%, 60% 내지 20%, 55% 내지 20%, 50% 내지 20%, 45% 내지 20%, 44% 내지 20%, 43% 내지 20%, 42% 내지 20%, 41% 내지 20%, 40% 내지 20%, 35% 내지 20%, 30% 내지 20%, 및 25% 내지 20%에서 유지될 수 있다. 특히, DO는 발효의 시작시 높을 수 있고, 발효가 진행하면서 줄어들도록 허용될 것이다. DO 수준은 발효 배지가 교반되는 속도에 의해(예를 들어, 젓는 속도에 의해, 및/또는 공기 또는 산소의 첨가 속도에 의해) 제어될 수 있다. 배양은 교반될 수 있고(예를 들어, 400 내지 700 RPM에서 저어짐), DO 수준은 공기 또는 산소 유속 및 임펠러 속도를 변경함으로써 20% 초과, 25% 초과, 30% 초과, 35% 초과, 40% 초과, 45% 초과, 50% 초과 및 55% 초과 또는 이보다 높게 유지된다.
본원에 사용된 바와 같이, 용어 "야생형" 및 "천연형"은 상호 교환적으로 사용되고, 자연계에서 발견되는 유전자, 단백질 또는 균주를 지칭한다.
본원에 사용된 바와 같이, "1차 유전자 결정부위"는 다른 유전자 또는 이의 유전자 조작의 부재 하에 특정 표현형을 부여하기에 필요하고 충분한 유전자 또는 이의 유전자 조작을 지칭한다. 보다 구체적으로는, 본 발명의 실시예 부문에 기재된 것처럼, 본원에서 "ssb7"이라 칭하는 사상성 진균 유전자는 본원에 기재된 "감소한" 점도 표현형을 부여하기에 필요하고 충분한 "1차 유전자 결정부위"이다.
본원에 사용된 바와 같이, 용어 "유전자"는 단백질 또는 RNA를 암호화하고 이의 발현을 유도하는 핵산을 지칭한다는 점에서 용어 "대립유전자"와 동의어이다. 사상성 진균의 발육 형태는 일반적으로 반수체이며, 따라서 특정 유전자의 단일 카피(즉, 단일 대립유전자)는 특정 표현형을 부여하기에 충분하다.
본원에 사용된 바와 같이, 용어 "폴리펩타이드" 및 "단백질"(및/또는 이의 각각의 복수 형태)은 펩타이드 결합에 의해 연결된 아미노산 잔기를 포함하는 임의의 길이의 중합체를 지칭하기 위해 상호 교환적으로 사용된다. 아미노산 잔기에 대한 통상적인 1문자 또는 3문자 코드가 본원에 사용된다. 중합체는 선형 또는 분지형일 수 있고, 변형된 아미노산을 포함할 수 있고, 비아미노산이 개재될 수 있다. 이 용어는 또한 자연적으로 또는 개입에 의해, 예컨대 이황화 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화 또는 표지 성분과의 접합과 같은 임의의 다른 조작 또는 변형에 의해 변형된 아미노산 중합체를 포함한다. 예를 들어, 아미노산의 하나 이상의 유사체(예를 들어, 비천연 아미노산 등을 포함)뿐만 아니라 당업계에 공지된 다른 변형을 함유하는 폴리펩타이드도 정의에 포함된다.
본원에 사용된 바와 같이, 용어 "유도체 폴리펩타이드/단백질"은 N 말단 및 C 말단 중 어느 하나 또는 둘 모두에 대한 하나 이상의 아미노산의 부가, 아미노산 서열에서의 하나의 또는 다수의 상이한 부위에서의 하나 이상의 아미노산의 치환, 단백질의 어느 하나 또는 양 말단에서의 또는 아미노산 서열에서의 하나 이상의 부위에서의 하나 이상의 아미노산의 결실, 및/또는 아미노산 서열에서의 하나 이상의 부위에서의 하나 이상의 아미노산의 삽입에 의해 단백질로부터 유래되거나 유래될 수 있는 단백질을 지칭한다. 단백질 유도체의 제조는 자연적 단백질을 암호화하는 DNA 서열의 변형, 적합한 숙주로 그 DNA 서열을 형질전환시키는 것 및 변형된 DNA 서열을 발현시켜 유도체 단백질을 형성하는 것에 의해 달성될 수 있다.
관련(및 유도체) 단백질은 "변이체 단백질"을 포함한다. 변이체 단백질은 소수의 아미노산 잔기에서의 치환, 결실, 및/또는 삽입에 의해 기준/모 단백질(예를 들어, 야생형 단백질)과 상이하다. 변이체 단백질과 모 단백질 사이에서 차이가 있는 아미노산 잔기의 수는 1개 이상, 예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 30개, 40개, 50개 이상의 아미노산 잔기일 수 있다. 변이체 단백질은 기준 단백질과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 심지어 적어도 약 99% 이상의 아미노산 서열 동일성을 공유할 수 있다. 변이체 단백질은 또한 선택된 모티프, 도메인, 에피토프, 보존 영역 등에서 기준 단백질과 상이할 수 있다.
본원에 사용된 바와 같이, 용어 "상사 서열"은 관심 단백질(즉, 일반적으로 원래의 관심 단백질)과 유사한 작용, 3차 구조, 및/또는 보존 잔기를 제공하는 단백질 내의 서열을 지칭한다. 예를 들어, α-헬릭스 또는 β-시트 구조를 함유하는 에피토프 영역에서, 상사 서열에서의 대체 아미노산은 바람직하게는 동일한 특정 구조를 유지한다. 이 용어는 또한 뉴클레오타이드 서열, 및 아미노산 서열을 지칭한다. 일부 구현예에서, 아미노산의 대체가 유사한 기능 또는 개선된 기능을 나타내는 변이체 효소를 생성시키도록 상사 서열이 개발된다. 일부 구현예에서, 관심 단백질에서의 아미노산의 3차 구조 및/또는 보존 잔기는 관심 분절 또는 관심 단편에서 또는 그 근처에 위치한다. 따라서, 관심 분절 또는 관심 단편이 예를 들어 α-헬릭스 또는 β-시트 구조를 함유하는 경우, 대체 아미노산은 바람직하게는 그 특정 구조를 유지시킨다.
본원에 사용된 바와 같이, 용어 "상동성 단백질"은 기준 단백질과 비슷한 활성 및/또는 구조를 갖는 단백질을 지칭한다. 상동물은 반드시 진화론상으로 관련되는 것은 아니다. 따라서, 이 용어는 상이한 유기체로부터 얻은 동일한, 유사한 또는 대응하는 단백질(들)(즉, 구조 및 기능 면에서)을 포함하고자 한 것이다. 특정 구현예에서, 상동물은 기준 단백질과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 심지어 적어도 약 99% 이상의 아미노산 서열 동일성을 공유할 수 있다. 일부 구현예에서, 기준 단백질과 유사한 4차, 3차 및/또는 1차 구조를 갖는 상동물을 확인하는 것이 바람직하다. 일부 구현예에서, 상동성 단백질은 기준 단백질과 유사한 면역학적 반응(들)을 유도한다. 일부 구현예에서, 상동성 단백질은 원하는 활성(들)을 갖는 효소를 생산하도록 조작된다.
서열 사이의 아미노산 동일성의 정도는 당해 분야에 알려진 임의의 적합한 방법을 이용하여 결정될 수 있다(예를 들어, Smith and Waterman,1981; Needleman and Wunsch, 1970; Pearson and Lipman, 1988; Wisconsin Genetics Software Package(제네틱스 컴퓨터 그룹(Genetics Computer Group), 미국 위스콘신주 매디슨 소재)의 GAP, BESTFIT, FASTA 및 TFASTA와 같은 프로그램; 및 Devereux et al., 1984 참조).
예를 들어, PILEUP는 서열 상동성 수준을 결정하는 데 유용한 프로그램이다. PILEUP은 진행식 쌍별 정렬(pair-wise alignment)을 이용하여 관련 서열들의 군으로부터 다중 서열 정렬을 생성한다. 이것은 또한 정렬을 생성하는 데 사용된 클러스터링(clustering) 관계를 나타내는 트리(tree)를 작성할 수 있다. PILEUP은 Feng 및 Doolittle의 1987 문헌의 진행식 정렬 방법의 단순화를 이용한다. 상기 방법은 Higgins 및 Sharp의 1989 문헌에 의해 기재된 것과 유사하다. 유용한 PILEUP 매개변수는 3.00의 디폴트 갭 가중치, 0.10의 디폴트 갭 길이 가중치 및 가중 말단 갭을 포함한다. 유용한 알고리즘의 또 다른 예로는 Altschul 등의 1990 문헌 및 Karlin 등의 1993 문헌에 의해 기재된 BLAST 알고리즘이다. 하나의 특히 유용한 BLAST 프로그램은 WU-BLAST-2 프로그램이다(예를 들어, Altschul 등의 1996 문헌 참조). 매개변수 "W", "T" 및 "X"는 정렬의 민감도 및 속도를 결정한다. BLAST 프로그램은 디폴트로서 11의 워드길이(W), 50의 BLOSUM62 점수 행렬(예를 들어, Henikoff 및 Henikoff의 1989 문헌 참조) 정렬(B), 10의 기대치(E), M′5, N′-4, 및 스트랜드 둘 다의 비교를 이용한다.
본원에 사용된 바와 같이, 어구 "실질적으로 유사한" 및 "실질적으로 동일한"은, 적어도 2개의 핵산 또는 폴리펩타이드의 맥락에서, 전형적으로 폴리뉴클레오타이드 또는 폴리펩타이드가 기준(즉, 야생형) 서열과 비교하여 적어도 약 70%의 동일성, 적어도 약 75%의 동일성, 적어도 약 80%의 동일성, 적어도 약 85%의 동일성, 적어도 약 90%의 동일성, 적어도 약 91%의 동일성, 적어도 약 92%의 동일성, 적어도 약 93%의 동일성, 적어도 약 94%의 동일성, 적어도 약 95%의 동일성, 적어도 약 96%의 동일성, 적어도 약 97%의 동일성, 적어도 약 98%의 동일성, 또는 심지어 적어도 약 99%의 동일성 이상을 갖는 서열을 포함함을 의미한다. 서열 동일성은 표준 매개변수를 이용하여 BLAST, ALIGN 및 CLUSTAL과 같은 알려진 프로그램을 이용하여 결정될 수 있다. (예를 들어, Altschul 등의 1990 문헌; Henikoff 등의 1989 문헌; Karlin 등의 1993 문헌; 및 Higgins 등의 1988 문헌 참조). BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립 생물공학 정보 센터(National Center for Biotechnology Information)를 통해 공공에게 이용 가능하다. 또한, 데이터베이스는 FASTA(Pearson 등의 1988 문헌)를 이용하여 조사될 수 있다. 2개의 폴리펩타이드가 실질적으로 동일하다는 하나의 표시는 제1 폴리펩타이드가 제2 폴리펩타이드와 면역학적으로 교차반응성이라는 것이다. 일반적으로, 보존적 아미노산 치환이 다른 폴리펩타이드는 면역학적으로 교차반응성이다. 따라서, 예를 들어, 2개의 펩타이드가 보존적 치환만이 다른 경우에 폴리펩타이드는 제2 폴리펩타이드와 실질적으로 동일하다. 2개의 핵산 서열이 실질적으로 동일하다는 다른 표시는 2개의 분자가 엄격한 조건 하에 (예를 들어, 높은 고엄격도로 배지의 범위 내에서) 서로에 혼성화한다는 것이다.
본원에 사용된 바와 같이, "핵산"은 뉴클레오타이드 서열 또는 폴리뉴클레오타이드 서열, 및 이의 단편 또는 일부를 지칭할 뿐만 아니라, 센스 가닥 또는 안티센스 가닥을 나타내는지와 상관 없이, 이중 가닥 또는 단일 가닥일 수 있는 게놈 또는 합성 기원의 DNA, cDNA 및 RNA를 지칭한다.
본원에 사용된 바와 같이, 용어 "발현"은 본 발명의 핵산 분자로부터 유래된 센스 RNA(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 지칭한다. 발현은 또한 mRNA가 폴리펩타이드로 번역되는 것을 지칭할 수 있다. 따라서, 용어 "발현"은 비제한적인 예로서 전사, 전사 후 변형, 번역, 번역 후 변형, 분비 등을 포함하는 폴리펩타이드의 생산에 관여된 임의의 단계를 포함한다.
본원에 사용된 바와 같이, (i) "사상성 진균 세포의 변이체 균주가 '증가한' 양의 관심 단백질(POI)을 발현한다/생산한다" 및 (ii) "사상성 진균 세포의 변이체 균주가 '감소한' 양의 자연적 SSB7 단백질을 발현한다/생산한다"와 같은 어구에 사용된 바와 같은 조합 용어 "발현한다/생산한다"에서, 용어 "발현한다/생산한다"는 본 발명의 이러한 변이체 사상성 진균 균주에서 단백질의 발현 및 생산에 관여된 임의의 단계를 포함하고자 한다. 예를 들어, '감소한' 양의 자연적 SSB7 단백질을 발현하는/생산하는 사상성 진균 세포의 변이체 균주를 생성하는 수단은 ssb7 유전자의 단백질 암호화 서열, 프로모터 서열, 5'-UTR 서열, 3'-UTR 서열, 이들의 조합 등의 유전자 변형(예를 들어, 돌연변이, 파괴, 절두, 결실 등)을 포함하지만, 이들로 제한되지는 않는다.
본원에 사용된 바와 같이, 어구 "전장 SSB7 단백질" 및 "자연적 SSB7 단백질"은 상호 교환적으로 사용될 수 있고, 특히 본 발명의 모 진균 세포로부터 유래되거나 수득된 SSB7 단백질 서열을 지칭한다. 예를 들어, 특정 구현예에서, 자연적 SSB7 단백질은 서열 번호 2의 1번 내지 1,308번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 31의 1번 내지 1,235번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 33의 1번 내지 1,465번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 35의 1번 내지 1,285번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 8의 1번 내지 1,310번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 9의 1번 내지 1,370번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 10의 1번 내지 805번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 11의 1번 내지 1,004번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 12의 1번 내지 1,215번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 13의 1번 내지 1,098번 아미노산 위치를 포함한다.
따라서, 특정 다른 구현예에서, 사상성 진균 세포의 변이체 균주는 모 균주에 비해 감소한 양의 자연적 SSB7 단백질을 발현한다/생산한다.
특정 다른 구현예에서, 본 발명은 서열 번호 2 또는 서열 번호 31과 적어도 약 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 트리코데르마 종 진균 세포의 변이체 균주에 관한 것이고, 여기서 변이체 균주는 액침 배양에서 호기성 발효 동안 미리 선택된 용존 산소(DO) 함량을 유지시키도록 감소한 양의 교반을 필요로 하는 세포 브로스를 생산하고/하거나, 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포량을 생산한다. 특정 구현예에서, SSB7 단백질을 암호화하는 트리코데르마 종 유전자는 서열 번호 1, 서열 번호 32 또는 서열 번호 34와 적어도 약 55% 내지 99%의 서열 동일성을 포함한다. 다른 구현예에서, 트리코데르마 종 ssb7 유전자는 서열 번호 1, 서열 번호 32 또는 서열 번호 34의 핵산 서열을 포함한다. 특정 다른 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 트리코데르마 종 균주는 ssb7(fs), ssb7(311), ssb7(339fs), ssb7(TS1) 및 ssb7(TS2)로부터 선택된 대립유전자를 포함한다.
따라서, 상기 기재되고 하기 실시예 부문에 추가로 기재된 것처럼, ssb7 유전자는 본원에 기재된 점도 감소 표현형을 부여하기에 필요하고 충분한 1차 유전자 결정부위이다. 따라서, 본 발명의 특정 구현예는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 변이체 트리코데르마 종 균주에 관한 것이고, 변이체 균주는 점도 감소 표현형을 포함한다.
따라서, 특정 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 진균 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 서열 번호 1의 ssb7 유전자의 엑손 1 내지 3 중 어느 하나(1) 내에서 발생한다.
특정 다른 구현예에서, 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 서열 번호 1의 ssb7 유전자의 엑손 1 내지 3 중 어느 둘(2) 내에서 발생한다.
특정 다른 구현예에서, 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 서열 번호 1의 ssb7 유전자의 엑손 1 내지 3 중 모든 셋(3) 내에서 발생한다.
또 다른 구현예에서, 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 서열 번호 1의 ssb7 유전자의 엑손 2 내에서 발생한다.
다른 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 진균 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 도 1a에 도시된 것처럼 SSB7 단백질의 보존된 영역 A, 영역 B, 영역 C 및/또는 영역 D 내에서 발생하거나 이들을 파괴한다. 또 다른 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 도 1a에 도시된 것처럼 SSB7 단백질의 보존된 영역 A 내에서 발생하거나 이것을 파괴한다. 또 다른 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 도 1a에 도시된 것처럼 SSB7 단백질의 보존된 영역 B 내에서 발생하거나 이것을 파괴한다. 또 다른 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 도 1a에 도시된 것처럼 SSB7 단백질의 보존된 영역 C 내에서 발생하거나 이것을 파괴한다. 또 다른 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 도 1a에 도시된 것처럼 SSB7 단백질의 보존된 영역 D 내에서 발생하거나 이것을 파괴한다.
특정 다른 구현예에서, "실질적인 서열 상동성"을 포함하는 SSB7 단백질을 암호화하는 유전자는 (비교가 이루어진) 대응하는 핵산 서열로부터 미미한 서열 변이를 갖고, (비교가 이루어진) 대응하는 핵산 서열과 실질적으로 동일한 생물학적 기능을 보유하는 DNA 또는 RNA (핵산) 서열을 지칭한다. 예를 들어, 특정 구현예에서, SSB7 단백질을 암호화하는 유전자(또는 ORF)와 실질적인 서열 상동성을 포함하는 핵산 서열은 본원에 기재된 것처럼 암호화된 유전자 산물(SSB7 단백질)을 확인함으로써 평가된다.
특정 다른 구현예에서, SSB7 단백질을 암호화하는 유전자(또는 ORF)와 실질적인 서열 상동성을 포함하는 핵산 서열은 핵산 혼성화 방법을 이용하여 결정/확인된다. 예를 들어, 특정 구현예에서, SSB7 단백질을 암호화하는 본 발명의 유전자 또는 폴리뉴클레오타이드와 실질적인 서열 상동성을 포함하는 DNA/RNA 서열(예를 들어, 서열 번호 1)은 엄격한 조건 하에 본 발명의 특정 핵산 서열과 혼성화하는 이러한 DNA/RNA 서열의 능력에 의해 확인된다.
본원에 사용된 바와 같이, "엄격한 조건 하에 혼성화한다"는 혼성화 및 세척에 대한 조건을 기재하고자 하고, 이 조건 하에서 상당히 서로 동일하거나 상동성인 뉴클레오타이드 서열은 서로 혼성화되어 있다. 이러한 엄격한 조건은 당업자에게 잘 알려져 있다(예를 들어, Ausubel 등의 1995 문헌; Sambrook 등의 1989 문헌 참조). 예를 들어, 특정 구현예에서, 엄격한 혼성화 조건의 비제한적인 예는 약 65 내지 70℃에서의 4X 염화나트륨/시트르산나트륨(SSC)에서의 혼성화(또는 약 42 내지 50℃에서의 4xSSC와 50% 포름아미드에서의 혼성화), 이어서 약 65 내지 70℃에서의 1xSSC에서의 1회 이상의 세척을 포함한다. 마찬가지로, 고도로 엄격한 혼성화 조건의 비제한적인 예는 약 65 내지 70℃에서의 1xSSC에서의 혼성화(또는 약 42 내지 50℃에서의 4xSSC와 50% 포름아미드에서의 혼성화), 이어서 약 65 내지 70℃에서의 0.3×SSC에서의 1회 이상의 세척을 포함한다. 따라서, 고도로 엄격한 혼성화 조건은 약 50 내지 60℃에서의 4xSSC에서의 혼성화(또는 대안적으로 약 40 내지 45℃에서의 6xSSC와 50% 포름아미드에서의 혼성화), 이어서 약 50 내지 60℃에서의 2xSSC에서의 1회 이상의 세척을 포함한다. 예를 들어, 65 내지 70℃ 또는 42 내지 50℃에서의 상기 언급된 값에 중간인 범위는 또한 본 발명에 의해 포함되도록 의도된다. 특정 구현예에서, SSPE(1xSSPE는 0.15 M NaCl, 10 mM NaH2PO4 및 1.25 mM EDTA, pH 7.4임)는 혼성화 및 세척 완충액에서 SSC(1xSSPE는 0.15 M NaCl 및 15 mM 시트르산나트륨임)를 대신할 수 있고, 세척은 혼성화가 완료된 후 각각 15분 동안 수행된다. 50개 미만의 염기 쌍 길이에 기대되는 하이브리드에 대한 혼성화 온도는 하이브리드의 융점(Tm)보다 5 내지 10℃ 낮아야 하고, 여기서 Tm은 하기 식에 따라 결정된다. 18개 미만의 염기 쌍 길이의 하이브리드에 대해, Tm(℃) = 2(A+T 염기의 수) + 4(G+C 염기의 수). 18개 내지 49개의 염기 쌍 길이의 하이브리드에 대해, Tm(℃) = 81.5 + 16.6(log10[Na+]) + 0.41(% G+C) - (600/N)이고, 여기서 N은 하이브리드에서의 염기의 수이고, [Na+]는 혼성화 완충액 중의 나트륨 이온의 농도(1xSSC에 대한 [Na+] = 0.165 M)이다. 숙련된 실행자는 비제한적인 예로서 차단제(예를 들어, BSA 또는 연어 또는 청어 정자 운반 DNA), 세제(예를 들어, SDS), 킬레이트화제(예를 들어, EDTA), Ficoll, PVP 등을 포함하는 추가의 시약이 니트로셀룰로스 또는 나일론 막과 같은 막에 대한 핵산 분자의 비특이적 혼성화를 감소시키기 위해 혼성화 및/또는 세척 완충액에 첨가될 수 있다는 것을 또한 인식할 것이다. 특히 나일론 막을 사용할 때, 엄격한 혼성화 조건의 추가의 비제한적인 예는 약 65℃에서의 0.25 내지 0.5 M NaH2PO4, 7% SDS에서의 혼성화, 이어서 약 65℃에서의 0.02 M NaH2PO4, 1% SDS 또는 대안적으로 0.2xSSC, 1% SDS에서의 1회 이상의 세척을 포함한다(예를 들어, Church 및 Gilbert 등의 1984 문헌 참조).
따라서, 본 발명의 특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 1의 ssb7 유전자 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 31의 ssb7 유전자 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 32의 ssb7 유전자 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 34의 ssb7 유전자 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 1, 서열 번호 32, 서열 번호 34의 ssb7 유전자 또는 이의 상보성 서열의 오픈 리딩 프레임(ORF)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다.
특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 19의 엑손 1 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 또 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 20의 엑손 2 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 또 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 21의 엑손 3 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다.
특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 영역 A를 암호화하는 핵산 서열(서열 번호 22)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 영역 B를 암호화하는 핵산 서열(서열 번호 23)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 영역 C를 암호화하는 핵산 서열(서열 번호 24)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 또 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 영역 D를 암호화하는 핵산 서열(서열 번호 25)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다.
특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 서열 1을 암호화하는 핵산 서열(서열 번호 22)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 서열 2를 암호화하는 핵산 서열(서열 번호 27)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 서열 3을 암호화하는 핵산 서열(서열 번호 28)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 서열 4를 암호화하는 핵산 서열(서열 번호 29)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 또 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 서열 5를 암호화하는 핵산 서열(서열 번호 30)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다.
따라서, 상기 일반적으로 기재된 것처럼, 사상성 진균 세포의 변이체 균주는 SSB7을 암호화하는 유전자의 "유전자 변형"을 포함하고, 여기서 유전자 변형은 (비변형된) 모 세포에 대비된다.
본원에 사용된 바와 같이, 용어 "변형" 및 "유전자 변형"은 상호 교환적으로 사용되며, (a) 유전자에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거, 또는 유전자의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거, (b) 유전자 파괴, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자(예를 들어, 안티센스 RNA, siRNA, miRNA 등)의 하향조절, (f) 특이적 돌연변이유발(비제한적인 예로서 CRISPR/Cas9 기반 돌연변이유발 포함) 및/또는 (g) 본원에 개시된 임의의 하나 이상의 유전자의 랜덤 돌연변이유발을 포함하지만, 이들로 제한되지는 않는다. 예를 들어, 본원에 사용된 바와 같이, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 본원에 개시된 ssb7 유전자의 유전자 변형을 포함하지만, 이것으로 제한되지는 않는다. 따라서, 하기 더 자세히 추가로 기재된 것처럼, 다양한 분자 생물학적 방법은 잘 알려져 있고, SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 사상성 진균 세포의 이러한 변이체 균주를 생성/작제하기 위해 당업자에게 이용 가능하다.
본원에 사용된 바와 같이, "SSB7 단백질을 암호화하는 유전자에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거"에서, 이러한 유전자 변형은 유전자의 암호화 서열(즉, 엑손), 비암호화 개재(인트론) 서열, 프로모터 서열, 5'-UTR 서열, 3'-UTR 서열 등을 포함하지만, 이들로 제한되지는 않는다.
따라서, 특정 구현예에서, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 SSB7 단백질을 암호화하는 내인성 유전자를 제거하도록 유전자 결실 기법에 의해 작제된다. 본원에 사용된 바와 같이, "유전자의 결실" 또는 "유전자 결실"은 숙주 세포의 게놈으로부터의 유전자의 암호화 서열의 완전 제거를 지칭한다. 유전자가 유전자의 암호화 서열에 바로 인접하게 위치하지 않은 제어 요소(예를 들어, 인핸서 요소)를 포함하는 경우, 유전자의 결실은 암호화 서열 및 선택적으로 예를 들어 비제한적인 예로서 프로모터 및/또는 종결자 서열을 포함하는 인접한 인핸서 요소의 결실을 지칭한다.
본원에 사용된 바와 같이, "유전자의 부분 결실" 또는 "부분적으로 결실된 유전자"는 숙주 세포의 게놈으로부터의 유전자의 암호화 서열의 부분 제거를 지칭한다. 예를 들어, 서열 번호 2의 트리코데르마 레세이 SSB7 단백질을 암호화하는 서열 번호 1의 ssb7 유전자는 엑손 1 내지 3의 암호화 서열(CDS: coding sequence)(각각 서열 번호 19 내지 23)을 포함한다. 예를 들어, 하기 기재된 특정 구현예에서, ssb7 유전자의 "부분 결실"은 ssb7 유전자의 엑손 1 내지 3 중 어느 하나(또는 하나 초과)의 결실을 포함하지만, 이것으로 제한되지는 않는다.
표적 유전자가 유전자의 암호화 서열에 바로 인접하게 위치하지 않은 제어 요소(예를 들어, 인핸서 요소)를 포함하는 경우, 유전자의 "부분 결실"은 암호화 서열 및 선택적으로 예를 들어 비제한적인 예로서 프로모터 및/또는 종결자 서열을 포함하는 인접한 인핸서 요소의 부분 결실을 지칭한다.
본원에 사용된 바와 같이, "유전자의 파괴", "유전자 파괴", "유전자의 불활성화" 및 "유전자 불활성화"는 상호 교환적으로 사용되며, 표적 유전자를 실질적으로 파괴/불활성화하는 임의의 유전자 변형을 광의적으로 지칭한다. 예시적인 유전자 파괴 방법은 폴리펩타이드 암호화 서열(CDS), 프로모터, 인핸서 또는 다른 조절 요소를 포함하는 유전자의 임의의 부분의 전체 또는 부분 결실, 또는 이의 돌연변이유발을 포함하지만, 이들로 제한되지는 않고, 여기서 돌연변이유발은 표적 유전자(들)를 파괴/불활성화하고 기능적 유전자 산물의 발현/생산을 실질적으로 감소시키거나 방지하는 치환, 삽입, 결실, 역전, 및 임의의 이들의 조합 및 변형을 포괄한다. 본 발명의 특정 구현예에서, 이러한 유전자 파괴는 숙주 세포가 암호화된 ssb7 유전자 산물을 발현/생산하는 것을 방지한다.
다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 확립된 안티센스(유전자 침묵) 기법을 사용하여, 즉 유전자(예를 들어, RNAi, siRNA, miRNA 등)의 핵산 서열에 상보성인 뉴클레오타이드 서열을 사용하여 하향조절된다.
특정 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 확립된 유전자 편집 기법, 예컨대 CRISPR/Cas9 유전자 편집, 징크 핑거 뉴클레아제(ZFN: zinc-finger nuclease) 유전자 편집, 전사 활성자 유사 효과기 뉴클레아제 편집(TALEN: transcription activator-like effector nuclease editing), 호밍(mega) 뉴클레아제 편집 등을 사용하여 유전자 변형된다.
특정 다른 구현예에서, 사상성 진균의 변이체 균주는 유전자 전환의 과정에 의해 작제된다(즉, 유전자 변형된다)(예를 들어, Iglesias 및 Trautner의 1983 문헌 참조).
다른 구현예에서, 사상성 진균의 변이체 균주는 비제한적인 예로서 화학 돌연변이유발(예를 들어, Hopwood의 1970 문헌 참조) 및 전좌(예를 들어, Youngman 등의 1983 문헌 참조)를 포함하는 당해 분야에 잘 알려진 방법을 사용하여 랜덤 돌연변이유발 또는 특이적 돌연변이유발에 의해 작제된다(즉, 유전자 변형된다).
예를 들어, 본원에 개시된 하나 이상의 유전자의 이러한 유전자 변형은 유전자의 프로모터의 효율을 감소시키거나, 인핸서의 효율을 감소시키거나, 유전자의 mRNA의 스플라이싱 또는 편집을 방해하거나, 유전자의 mRNA의 번역을 방해하거나, 전장 단백질의 번역을 방지하도록 유전자의 암호화 서열로 종결 코돈을 도입하거나, 덜 활성이거나 불활성인 단백질을 생산하도록 단백질의 암호화 서열을 변경하거나, 다른 핵 단백질 성분과의 단백질 상호작용을 감소시키거나, 덜 안정한 단백질을 생산하도록 단백질의 암호화 서열을 변경하거나, 파괴를 위해 단백질을 표적화하거나, 단백질이 (예를 들어, 글리코실화에 의해) 미스폴딩되거나 부정확하게 변형되거나, 단백질의 세포 이동을 방해하게 한다.
특정 구현예에서, SSB7 단백질을 암호화하는 유전자의 유전자 변형은 변이체 숙주 세포에 의해 발현/생산된 자연적 SSB7의 양을 감소시키고, 여기서 발현/생산된 자연적 SSB7 단백질의 감소한 양은 당업자에게 알려진 방법을 사용하여 검출되거나 측정되거나 분석되거나 기타 등등이 된다. 따라서, 당업자는 본 발명의 점도 감소 표현형을 포함하는 사상성 진균 세포의 이러한 (돌연변이유도된) 변이체 균주를 확인하기 위해 본원에 의해 실시예 부문에 기재된 스크리닝 방법을 용이하게 적응하고/하거나 변형시킬 수 있다. 예를 들어, 특정 구현예에서, 발현/생산된 자연적 SSB7의 감소한 양은 본원에 개시된 점도 감소 표현형과 용이하게 상관되고, 여기서 당업자는 모 균주와 이로부터 유래된 변이체 균주 간의 형태 차이를 스크리닝함으로써 점도 감소 표현형을 포함하는 이러한 변이체 숙주 균주를 용이하게 확인할 수 있다. 따라서, 당업자는, 비제한적인 예로서 (모 균주에 비해) 액침 배양에서의 호기성 발효 동안 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하는 변이체 균주를 확인하는 것 및/또는 (ii) (모 균주에 비해) 액침 배양에서의 호기성 발효 동안 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포량을 생성하는 변이체 균주를 확인하는 것을 포함하여, 점도 감소 표현형에 대한 모 균주 및 변이체 균주를 스크리닝함으로써 점도 감소 표현형을 포함하는 이러한 변이체 균주를 용이하게 확인할 수 있다.
다른 구현예에서, 발현/생산된 자연적 SSB7의 감소한 양은 비제한적인 예로서 단백질 이동/이동도(SDS-PAGE), 질량 분광법, HPLC, 크기 배제, 초원심분리 침강 속도 분석, 전사체학, 단백질체학, 형광 태그, 에피토프 태그, 형광 단백질 (GFP, RFP 등) 키메라/하이브리드 등을 포함하는 단백질 정량화 방법, 유전자 전사 방법, mRNA 번역 방법 등에 의해 검출되거나 확인되거나 측정되거나 분석되거나 기타 등등이 된다.
본원에 사용된 바와 같이, 기능적으로 및/또는 구조적으로 유사한 단백질은 "관련 단백질"인 것으로 간주된다. 이러한 관련된 단백질은 상이한 속 및/또는 종의 유기체 또는 심지어 상이한 강의 유기체(예를 들어, 박테리아 및 진균)로부터 유래될 수 있다. 관련 단백질은 또한 1차 서열 분석에 의해 결정되거나, 2차 또는 3차 구조 분석에 의해 결정되거나, 면역학적 교차반응성에 의해 결정된 상동물(homologue) 및/또는 오솔로그를 포괄한다.
본원에 사용된 바와 같이, 용어 "프로모터"는 암호화 서열 또는 기능적 RNA의 발현을 제어할 수 있는 핵산 서열을 지칭한다. 일반적으로, 암호화 서열은 프로모터 서열에 대해 3'(하류)에 위치한다. 프로모터는 자연적 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터로부터 유래되는 상이한 요소로 구성될 수 있거나, 심지어 합성 핵산 절편을 포함할 수 있다. 상이한 프로모터가 상이한 세포 유형에서의 유전자 또는 상이한 발달 단계에 있는 유전자의 발현을 지시하거나, 상이한 환경적 또는 생리적 조건에 반응하여 유전자의 발현을 지시할 수 있음을 당업자는 이해할 것이다. 대부분의 세포 유형에서 대부분의 시점에 유전자가 발현되도록 하는 프로모터는 일반적으로 "구성적 프로모터"로 지칭된다. 또한, 대부분의 경우 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있는 것으로 추가로 인식된다.
본원에 사용된 바와 같이, 용어 "작동 가능하게 연결된(operably linked)"은 하나의 기능이 다른 하나에 의해 영향을 받도록 단일 핵산 단편 상에서 핵산 서열들이 회합하는 것을 지칭한다. 예를 들어, 프로모터는 이것이 암호화 서열(예를 들어, ORF)의 발현에 영향을 줄 수 있을 때(즉, 그 암호화 서열은 프로모터의 전사 제어 하에 있음) 그 암호화 서열과 작동 가능하게 연결된다. 암호화 서열은 센스 배향 또는 안티센스 배향으로 조절 서열에 작동 가능하게 연결될 수 있다. 핵산이 또 다른 핵산 서열과 기능적 관계에 있도록 위치할 때 이 핵산은 "작동 가능하게 연결"된다. 예를 들어, 분비 리더(즉, 신호 펩타이드)를 암호화하는 DNA가 폴리펩타이드의 분비에 참여하는 전단백질(pre-protein)로서 발현되는 경우 이것이 폴리펩타이드용 DNA에 작동 가능하게 연결되거나; 프로모터 또는 인핸서가 서열의 전사에 영향을 미칠 경우 이들이 암호화 서열에 작동 가능하게 연결되거나; 리보솜 결합 부위가 번역을 촉진하도록 위치하는 경우 이것이 암호화 서열에 작동 가능하게 연결된다. 일반적으로 "작동 가능하게 연결된"은 연결되는 DNA 서열들이 인접해 있음을 의미하고, 분비 리더의 경우에는 인접해 있고 판독 단계(reading phase)에 있음을 의미한다. 그러나, 인핸서는 인접해 있을 필요는 없다. 연결은 편리한 제한 부위에서의 결찰에 의해 달성된다. 이러한 부위가 존재하지 않는 경우, 합성 올리고뉴클레오타이드 어댑터 또는 링커가 통상적인 관례에 따라 사용된다.
본원에 정의된 바와 같이, "적합한 조절 서열"은 암호화 서열의 상류(5' 비암호화 서열)에, 암호화 서열 내에 또는 하류(3' 비암호화 서열)에 위치하고, 회합된 암호화 서열의 전사, RNA 프로세싱 또는 안정성, 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, RNA 프로세싱 부위, 효과기 결합 부위 및 스템-루프 구조를 포함할 수 있다.
본원에 정의된 바와 같이, 적어도 하나의 폴리뉴클레오타이드 오픈 리딩 프레임(ORF), 또는 이의 유전자 또는 이의 벡터를 "진균 세포 내로 도입하는"과 같은 어구에서 사용될 때 용어 "도입하는"은 비제한적인 예로서 원형질체 융합, 천연 또는 인공 형질전환(예를 들어, 염화칼슘, 전기천공), 형질도입, 형질주입 등을 포함하는 세포로 폴리뉴클레오타이드를 도입하기 위해 당해 분야에 알려진 방법을 포함한다.
본원에 사용된 바와 같이, "형질전환된" 또는 "형질전환"은 세포가 재조합 DNA 기법을 사용하여 형질전환된다는 것을 의미한다. 형질전환은 전형적으로 하나 이상의 뉴클레오타이드 서열(예를 들어, 폴리뉴클레오타이드, ORF 또는 유전자)을 세포로 삽입함으로써 일어난다. 삽입된 뉴클레오타이드 서열은 이종성 뉴클레오타이드 서열(즉, 형질전환되는 세포에 자연 발생하지 않는 서열)일 수 있다.
본원에 사용된 바와 같이, "형질전환"은 DNA가 염색체 통합체 또는 자가 복제성 염색체외 벡터로서 유지되도록 숙주 세포로 외인성 DNA를 도입하는 것을 지칭한다. 본원에 사용된 바와 같이, "형질전환 DNA", "형질전환 서열" 및 "DNA 작제물"은 숙주 세포로 서열을 도입하는 데 사용된 DNA를 지칭한다. DNA는 PCR 또는 임의의 다른 적합한 기법에 의해 시험관내 생성될 수 있다. 일부 구현예에서, 형질전환 DNA는 유입 서열(incoming sequence)을 포함하는 반면, 다른 구현예에서는 상동성 박스(homology box)가 측접된 유입 서열을 추가로 포함한다. 더 추가의 구현예에서, 형질전환 DNA는 말단에 추가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 플랭크)을 포함한다. 말단은 형질전환 DNA가 예를 들어 벡터로의 삽입과 같은 폐쇄된 원을 형성하도록 폐쇄될 수 있다.
본원에 사용된 바와 같이, "유입 서열"은 진균 세포 염색체로 도입된 DNA 서열을 지칭한다. 일부 구현예에서, 유입 서열은 DNA 작제물의 일부이다. 다른 구현예에서, 유입 서열은 하나 이상의 관심 단백질을 암호화한다. 일부 구현예에서, 유입 서열은 형질전환되는 세포의 게놈에 이미 존재하거나 존재하지 않을 수 있는 서열을 포함한다(즉, 상동성 서열이거나 이종성 서열일 수 있음). 일부 구현예에서, 유입 서열은 하나 이상의 관심 단백질, 유전자, 및/또는 돌연변이되었거나 변형된 유전자를 암호화한다. 대안적인 구현예에서, 유입 서열은 기능적 야생형 유전자 또는 오페론, 기능적 돌연변이체 유전자 또는 오페론, 또는 비기능적 유전자 또는 오페론을 암호화한다. 일부 구현예에서, 유입 서열은 유전자로 삽입되어 유전자의 기능을 파괴하는 비기능적 서열이다. 또 다른 구현예에서, 유입 서열은 선택적 마커를 포함한다. 다른 구현예에서, 유입 서열은 2개의 상동성 박스를 포함한다.
본원에 사용된 바와 같이, "상동성 박스"는 진균 세포 염색체에서의 서열에 상동성인 핵산 서열을 지칭한다. 보다 구체적으로는, 상동성 박스는 본 발명에 따라 결실되거나, 파괴되거나, 비활성화되거나, 하향조절 등이 되는 유전자 또는 유전자의 일부의 바로 측접하는 암호화 영역과 약 80% 내지 100%의 서열 동일성, 약 90% 내지 100%의 서열 동일성, 또는 약 95% 내지 100%의 서열 동일성을 갖는 상류 또는 하류 영역이다. 이러한 서열은 진균 세포 염색체에서 DNA 작제물이 어디에서 통합되는지를 지시하고, 진균 세포 염색체의 어느 부분이 유입 서열에 의해 대체되는지를 지시한다. 본 발명을 한정하고자 하는 것은 아니지만, 상동성 박스는 약 1개 염기쌍(bp) 내지 200개 킬로염기(kb)를 포함할 수 있다. 바람직하게는, 상동성 박스는 약 1 bp 내지 10.0 kb; 1 bp 내지 5.0 kb; 1 bp 내지 2.5 kb; 1 bp 내지 1.0 kb, 및 0.25 kb 내지 2.5 kb를 포함한다. 상동성 박스는 또한 약 10.0 kb, 5.0 kb, 2.5 kb, 2.0 kb, 1.5 kb, 1.0 kb, 0.5 kb, 0.25 kb 및 0.1 kb를 포함할 수 있다. 일부 구현예에서, 선택적 마커의 5’ 및 3’ 말단은 상동성 박스에 의해 측접되고, 상동성 박스는 유전자의 암호화 영역을 바로 측접시키는 핵산 서열을 포함한다.
본원에 사용된 바와 같이, 용어 "선별 마커-암호화 뉴클레오타이드 서열"은 숙주 세포에서 발현할 수 있고 선별 마커의 발현이 발현된 유전자를 함유하는 세포에 해당 선택 제제의 존재 또는 필수 영양소의 부재 하에 성장하는 능력을 부여하는 뉴클레오타이드 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "선별 마커" 및 "선택적 마커"는 벡터를 함유하는 숙주의 선택을 용이하게 하는 이 숙주 세포에서 발현할 수 있는 핵산(예를 들어, 유전자)을 지칭한다. 이러한 선별 마커의 예는 항균제를 포함하지만, 이들로 제한되지는 않는다. 따라서, 용어 "선별 마커"는 숙주 세포가 관심 유입 DNA를 흡수했거나 일부 다른 반응이 일어났다는 표시를 제공하는 유전자를 지칭한다. 전형적으로, 선별 마커는 외인성 DNA를 함유하는 세포가 형질전환 동안 어떠한 외인성 서열도 받지 않은 세포와 구별되게 하기 위해 숙주 세포에 항균 내성 또는 대사 이점을 부여하는 유전자이다.
본원에 정의된 바와 같이, 숙주 세포 "게놈", 진균 세포 "게놈" 또는 사상성 진균 세포 "게놈"은 염색체 유전자 및 염색체외 유전자를 포함한다.
본원에 사용된 바와 같이, 용어 "플라스미드", "벡터" 및 "카세트"는 염색체외 요소를 지칭하며, 이는 대개 전형적으로 세포의 중심 대사의 일부가 아니고 보통 원형 이중 가닥 DNA 분자의 형태인 유전자를 운반한다. 이러한 요소는 임의의 공급원으로부터 유래되는 단일 가닥 또는 이중 가닥 DNA 또는 RNA의, 선형 또는 원형인, 자율 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있으며, 여기서 다수의 뉴클레오타이드 서열은 선택된 유전자 산물에 대한 DNA 서열 및 프로모터 단편을 적절한 3' 비번역 서열과 함께 세포로 도입할 수 있는 독특한 작제물로 연결되거나 재조합된다.
본원에 사용된 바와 같이, 용어 "벡터"는 세포에서 복제(증식)될 수 있고, 새로운 유전자 또는 DNA 분절(예를 들어, "유입 서열")을 세포로 운반할 수 있는 임의의 핵산을 지칭한다. 따라서, 이 용어는 상이한 숙주 세포들 간의 전달을 위해 설계된 핵산 작제물을 지칭한다. 벡터는 바이러스, 박테리오파지, 프로-바이러스, 플라스미드, 파지미드, 트랜스포존 및 인공 염색체, 예컨대 YAC(효모 인공 염색체), BAC(박테리아 인공 염색체), PLAC(식물 인공 염색체) 등을 포함하는데, 이들은 "에피좀"(즉, 자율 복제)이거나 숙주 세포의 염색체로 통합될 수 있다.
본원에 사용된 바와 같이, "형질전환 카세트"는 유전자(또는 이의 ORF)를 포함하고 유전자 이외에 특정 숙주 세포의 형질전환을 용이하게 하는 요소를 갖는 특이적 벡터를 지칭한다.
"발현 벡터"는 세포에서 이종성 DNA를 혼입하고 발현시키는 능력을 갖는 벡터를 지칭한다. 많은 원핵 및 진핵 발현 벡터가 상업적으로 이용 가능하고 당업자에게 알려져 있다. 적절한 발현 벡터의 선택은 당업자의 지식 내에 있다.
본원에 사용된 바와 같이, 용어 "발현 카세트" 및 "발현 벡터"는 표적 세포에서 특정 핵산의 전사를 허용하는 일련의 명시된 핵산 요소를 사용하여 재조합으로 또는 합성에 의해 생성된 핵산 작제물을 지칭한다(즉, 이들은 상기에 기술된 바와 같은 벡터 또는 벡터 요소임). 재조합 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 색소체 DNA, 바이러스 또는 핵산 단편으로 혼입될 수 있다. 전형적으로, 발현 벡터의 재조합 발현 카세트 부분은 다른 서열 중에서도 전사될 핵산 서열 및 프로모터를 포함한다. 일부 구현예에서, DNA 작제물은 또한 표적 세포에서 특정 핵산의 전사를 허용하는 일련의 명시된 핵산 요소를 포함한다. 특정 구현예에서, 본 발명의 DNA 작제물은 본원에 정의된 바와 같은 선택적 마커 및 비활성화 염색체 또는 유전자 또는 DNA 절편을 포함한다.
본원에 사용된 바와 같이, "표적화 벡터"는 표적화 벡터가 형질전환되는 숙주 세포의 염색체 내 영역에 대해 상동성이고, 해당 영역에서 상동성 재조합을 유도할 수 있는 폴리뉴클레오타이드 서열을 포함하는 벡터이다. 예를 들어, 표적화 벡터는 상동성 재조합을 통해 숙주 세포의 염색체로 유전자 변형을 도입하는 데 사용된다. 일부 구현예에서, 표적화 벡터는 예를 들어 말단에 부가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 플랭킹 서열)을 포함한다. 그 말단은 표적화 벡터가 예를 들어 벡터 내로의 삽입과 같이 폐쇄된 원을 형성하도록 폐쇄될 수 있다.
본원에 사용된 바와 같이, 변이체 균주에 의해 생산된 단백질의 양이 모 균주에 의해 생산된 단백질의 양과 비교하여 20% 이하 감소, 15% 이하 감소, 10% 이하 감소, 심지어 5% 이하 감소하면 변이체 균주는 바이오매스 단위량당 모 균주와 "실질적으로 동일한 양"의 단백질을 생산하고, 여기서 단백질의 양은 단백질 생산이 측정되는 세포의 총 바이오매스량에 대해 정규화되며, 바이오매스는 습윤 중량(예를 들어, 세포 펠릿의 습윤 중량) 또는 건조 중량의 면으로 표현될 수 있다.
본원에 사용된 바와 같이, 변이체 세포에 의해 생산된 단백질의 양이 모 균주와 비교하여 적어도 5% 증가, 적어도 10% 증가, 적어도 15% 증가, 또는 그보다 많이 증가하면 변이체 균주는 모 균주보다 "바이오매스 단위량당 실질적으로 더 많은 단백질"을 생산하고, 여기서 단백질의 양은 단백질 생산이 측정되는 세포의 총 바이오매스량에 대해 정규화되며, 바이오매스는 습윤 중량(예를 들어, 세포 펠릿의 습윤 중량) 또는 건조 중량의 면으로 표현될 수 있다.
본원에 사용된 바와 같이, "형광색소"는 형광 염료이다. 바람직한 형광색소는 진균의 세포벽에서 셀룰로스 및/또는 키틴에 결합한다.
II. 점도 감소 표현형을 포함하는 트리코데르마 균주
일반적으로 상기 기재되고, 하기 실시예 부문에 추가로 기재된 것처럼, 본 발명의 특정 구현예는 모 균주로부터 유래된 사상성 진균의 변이체 균주에 관한 것이다. 보다 구체적으로는, 특정 구현예는 사상성 진균의 변이체 균주 및 이의 방법에 관한 것이고, 여기서 이러한 변이체 균주는 부피 효율의 개선, 향상된/균일한 산소 분포, 세포 브로스 점도의 감소, 높은 비생산성, 탄소원에 대한 수율의 개선, 생물반응기(발효기) 작동 비용의 감소, (세포) 표현형의 변경, (세포) 형태의 변경, (세포) 성장 특징의 변경 등을 포함한다.
예를 들어, 본원에 기재되고 제시된 것처럼, 본 발명의 이러한 변이체 균주(즉, SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함)는 모 균주의 세포에 비해 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는(즉, 액침 배양에서의 호기성 발효 동안) 세포 브로스를 생성하고/하거나, 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는(즉, 액침 배양에서의 호기성 발효 동안) 세포량을 생성한다. 보다 구체적으로는, 본원에서 작제되고 기재된 사상성 진균의 변이체 균주는 특히 본원에서 "점도 감소" 표현형이라 칭하는 변경된 세포 형태 표현형(예를 들어, 실시예 1 내지 실시예 3 및 도 2 참조)을 포함한다.
따라서, 실시예 1에 기재된 것처럼, "Morph 77B7"이라 명명된 T. 레세이 돌연변이체는 특히 모체보다 더 짧고 더 두꺼운 필라멘트를 갖는 액침 액체 배양에서 변경된 형태(표현형)를 갖는 것으로 관찰되었고, 여기서 Morph 77B7 돌연변이체는 또한 모체를 함유하는 배양물과 비교하여 성장 동안 더 높은 수준의 용존 산소(DO)를 나타냈고(실시예 1, 표 1 참조), 여기서 오직 하나의 유전좌위는 돌연변이체 (Morph 77B7) 표현형("ssb7"이라 명명됨)을 보완하였다. ssb7 유전자는 동일한 DNA 서열에서의 다른 단백질 예측과 부분적으로 중첩하는 새로 예측된 단백질인 SSB7, 예를 들어 트리코데르마 레세이 QM6a 단백질 ID(PID) 108712를 암호화한다(The Genome Portal of the Department of Energy Joint Genome Institute, Grigoriev et al., 2011)(도 1 참조). 균주 Morph 77B7에서 확인된 ssb7 돌연변이체 대립유전자는 엑손 2(T. 레세이 QM6a 스캐폴드 13, 167404; 서열 번호 3)에서 단일 구아닌(G) 뉴클레오타이드 결실(ΔG)을 포함하여 프레임 쉬프트(fs) 돌연변이 및 ssb7 유전자의 마지막 인트론(인트론 2) 전의 조기 종결 코돈을 생성시키는데, 돌연변이체 대립유전자는 "ssb7(fs)"라 명명된다. 실시예 2는 ssb7 돌연변이가 발효(배양) 브로스 점도 감소(변경된 형태/표현형)의 원인인지를 추가로 검증하고, 여기서 ssb7 유전좌위는 모 T. 레세이 균주에서 (2가지 상이한 방법을 통해) 특이적으로 돌연변이되고, ssb7의 대립유전자 둘 다는 점도 감소 표현형을 나타냈다. 마찬가지로, 실시예 3은 추가로 시험되고 이러한 ssb7 돌연변이체의 이용성을 확인하였고, 여기서 ssb7의 세(3) 가지의 돌연변이체 대립유전자는 셀룰라아제의 자연적 칵테일을 발현하는 상이한 트리코데르마 레세이 계통("T4abc"라 명명)에서 또한 평가되었고, 각각의 이들 돌연변이체 대립유전자는 본원에 기재된 점도 감소 표현형을 나타냈다.
따라서, 본 발명의 특정 구현예는 점도 감소 표현형을 포함하는 사상성 진균의 변이체 균주에 관한 것이다. 특정 다른 구현예는 사상성 진균 세포의 이러한 변이체 균주의 작제, 사상성 진균 세포의 이러한 변이체 균주의 스크리닝, 사상성 진균 세포의 이러한 변이체 균주를 사용한 관심 단백질의 생산 등을 위한 조성물 및 방법에 관한 것이다.
III. 점도 감소 표현형을 포함하는 변이체 사상성 진균 균주의 작제
특정 구현예에서, 사상성 진균의 변이체 균주(세포)는 사상성 진균의 모 균주(세포)로부터 유래되고, 여기서 변이체 균주는 SSB7 단백질/SSB7 오솔로그를 암호화하는 유전자의 적어도 하나의 유전자 변형(즉, 모 균주에 대한 것)을 포함하고, 이러한 변이체 균주는 모 균주에 비해 점도 감소 표현형을 포함한다. 보다 구체적으로는, 본 발명의 특정 다른 구현예는 SSB7 단백질/SSB7 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 사상성 진균의 이러한 변이체 균주(세포)에 관한 것이고, 여기서 변이체 균주는 액침 배양에서의 호기성 발효 동안 즉 모 균주에 비해 (i) 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스 및/또는 (ii) 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포 브로스를 생산한다.
III.A
. 점도 감소 표현형을 포함하는 변이체 트리코데르마 균주의 작제
일반적으로 상기 기재된 것처럼, 본 발명의 특정 구현예는 모 트리코데르마 종 균주로부터 유래된 변이체 트리코데르마 종 균주에 관한 것이고, 여기서 변이체 균주는 점도 감소 표현형을 포함한다. 특정 구현예에서, 변이체 트리코데르마 종 균주는 서열 번호 2 또는 서열 번호 31의 SSB7 단백질과 적어도 약 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 변이체 균주는 점도 감소 표현형을 포함한다. 특정 다른 구현예에서, 변이체 트리코데르마 종 균주는 서열 번호 1의 ssb7 유전자와 적어도 약 50%의 서열 동일성을 포함하는 ssb7 유전자의 유전자 변형을 포함하고, 여기서 변이체 균주는 점도 감소 표현형을 포함한다. 특정 다른 구현예에서, 변이체 트리코데르마 종 균주는 서열 번호 32의 ssb7 유전자와 적어도 약 50%의 서열 동일성을 포함하는 ssb7 유전자의 유전자 변형을 포함하고, 여기서 변이체 균주는 점도 감소 표현형을 포함한다. 특정 다른 구현예에서, 변이체 트리코데르마 종 균주는 서열 번호 34의 ssb7 유전자와 적어도 약 50%의 서열 동일성을 포함하는 ssb7 유전자의 유전자 변형을 포함하고, 여기서 변이체 균주는 점도 감소 표현형을 포함한다.
다른 구현예에서, 변이체 트리코데르마 종 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 변형은 SSB7 단백질의 보존 영역 A 내지 D 내에서 생긴다(도 1a 및 서열 번호 22 내지 25 참조). 특정 다른 구현예에서, 변이체 트리코데르마 종 균주는 엑손 1(서열 번호 19), 엑손 2(서열 번호 20) 및 엑손 3(서열 번호 21)으로 이루어진 군으로부터 선택된 적어도 하나(1)의 엑손의 유전자 변형을 포함하고, 여기서 변이체 균주는 점도 감소 표현형을 포함한다. 다른 구현예에서, 변이체 트리코데르마 종 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 변형은 SSB7 단백질을 암호화하는 유전자의 프로모터 서열에서 생기고/생기거나, SSB7 단백질을 암호화하는 유전자의 비번역 영역(UTR)에서 생기고, 변이체 균주는 점도 감소 표현형을 포함한다.
특정 다른 구현예에서, 변이체 트리코데르마 종 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 변형은 도 8b-도 8f에 제시된 바와 같은 하나 이상의 암호화된 SSB7 단백질 소수성 서열 영역을 이의 친수성 서열 영역으로 전환시키거나, 그 반대도 같으며, 변이체 균주는 점도 감소 표현형을 포함한다. 예를 들어, (도 8b-도 8f에 도시된) 서열 번호 2의 SSB7 단백질 서열의 (Kyte-Doolittle(KD) 지표에 따른) 소수성 도표는 SSB7 단백질 서열 내의 특정 아미노산의 소수화도 또는 친수화도의 정량적 분석을 제공한다. 따라서, 도 8b-도 8f에 도시된 소수성 도표는 x축에서 SSB7 단백질의 (1차) 아미노산 서열을 제시하고, y축에서 소수화도(0 초과) 및 친수화도(0 미만)의 정도(점수)를 제시하고, 여기서 KD 지표를 이용한 아미노산 소수성 점수가 도 8g에 도시되어 있다. 예를 들어, 이 도표의 형상을 분석하는 것이 단백질의 부분 구조에 관하여 특히 관련된 정보를 제공하는 것으로 당업자에 의해 일반적으로 이해된다. 예를 들어, 아미노산의 스트레치(즉, 구형 단백질(막에 닿아 있지 않은 단백질)에 대해 대략 10개 잔기 범위)가 소수화도에 대해 양수의 점수(0 초과)를 나타내면, 이 아미노산은 아마도 SSB7 단백질 3차 구조 내에 묻힌다(즉, 표면이 수성 용매에 노출되지 않음). 그에 반해서, 높은 친수화도 점수(0 미만)를 갖는 아미노산 서열 영역은 이 아미노산 잔기가 수성 용매와 접촉하고, 그러므로, 이 잔기가 주로 SSB7 단백질의 외부 표면에 위치한다는 것을 나타낸다.
따라서, 본원에 기재된 것처럼, 이러한 친수성 또는 소수성 SSB7 단백질 서열 영역을 암호화하는 ssb7 유전자(또는 이의 하위서열)가 이의 반대의 서열 영역을 암호화하도록 용이하게 변형될 수 있다(예를 들어, 소수성 서열을 친수성 서열과 바꾸거나 또는 그 반대). 당해 분야에서 알려진 것처럼, 이러한 유전자 변형의 도입(예를 들어, 적어도 하나(1)의 친수성 아미노산 잔기를 소수성 잔기로 전환시키거나 또는 그 반대, 바람직하게는 적어도 2개 내지 3개의 연속 친수성 잔기를 소수성 잔기로 전환시키거나 또는 그 반대)은 감소한 양의 자연적 SSB7 단백질을 발현/생산하는 변이체 트리코데르마 종 균주를 작제하는 데 특히 유용하다. 예를 들어, 상기 기재된 변형된 ssb7 유전자(또는 이의 하위서열)에 의해 암호화된 (비자연적) SSB7 단백질은 미스폴딩 및/또는 비폴딩에 대한 높은 경향을 가져서 단백질 응집, 침전, 단백분해 절단, 분해 등을 야기할 것이다. 따라서, 당업자는 본 발명의 점도 감소 표현형에 대한 모체 및 딸체를 분석하여 감소한 양의 자연적 SSB7 단백질을 발현/생산하는 변형된 (딸) 균주에 대하여 자연적 SSB7 단백질을 암호화하는 야생형 유전자를 포함하는 모 균주를 분석할 수 있다.
따라서, 서열 번호 1의 ssb7 유전자, 서열 번호 2의 SSB7 단백질, 서열 번호 31의 SSB7 단백질, 소수성 도표(도 8b-도 8g), SSB7 단백질의 아미노산 조성(도 8a) 등을 참조하여, 당업자는 자연적 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 이러한 변이체 트리코데르마 종 균주를 용이하게 작제할 수 있고, 여기서 이러한 변이체 균주는 점도 감소 표현형을 포함한다. 예를 들어, 당업자는 당해 분야에 알려진 일상적인 및 전통적인 분자 생물학 방법을 이용하여 ssb7 유전자 서열을 유전자 변형시키고, 본 발명의 점도 감소 표현형을 포함하는 이의 변이체 균주를 용이하게 확인할 수 있다.
III.B
. 점도 감소 표현형을 포함하는 변이체 자낭균류 균주의 작제
상기 기재된 것처럼, 특정 구현예는 사상성 진균의 모 균주(세포)로부터 유래된 사상성 진균의 변이체 균주(세포)에 관한 것이고, 여기서 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 변이체 균주는 점도 감소 표현형을 포함한다. 보다 구체적으로는, 특정 구현예는 비제한적인 예로서 트리코데르마 종, 아스페르길루스 종, 푸사륨 종, 페니실륨 종, 크리소스포륨 종, 세팔로스포륨 종, 탈라로마이세스 종, 게오스미티아 종, 뉴로스포라 종, 마이셀리오프토라 종 등을 포함하는 사상성 진균의 변이체 균주에 관한 것이다. 따라서, 특정 구현예에서, 본 발명은 서열 번호 8의 SSB7 단백질 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 변이체 푸사륨 종 균주에 관한 것이다. 다른 구현예에서, 본 발명은 서열 번호 9의 SSB7 단백질 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 변이체 뉴로스포라 종 균주에 관한 것이다. 다른 구현예에서, 본 발명은 서열 번호 10의 SSB7 단백질 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 변이체 마이셀리오프토라 종 균주에 관한 것이다. 다른 구현예에서, 본 발명은 서열 번호 11의 SSB7 단백질 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 변이체 탈라로마이세스 종 균주에 관한 것이다. 다른 구현예에서, 본 발명은 서열 번호 12의 SSB7 단백질 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 변이체 아스페르길루스 종 균주에 관한 것이다. 다른 구현예에서, 본 발명은 서열 번호 13의 SSB7 단백질 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 변이체 페니실륨 종 균주에 관한 것이다.
보다 구체적으로는, 일반적으로 상기 기재된 것처럼, 서열 번호 1의 야생형 트리코데르마 종 ssb7 유전자는 서열 번호 2의 새로 예측된 단백질인 SSB7(이 단백질은 문헌에서 비규명됨)을 암호화한다. Joint Genome Institute(JGI) 트리코데르마 레세이 v2.0 데이터베이스(균주 QM6a)는 PID 108712로서 이 동일한 DNA 서열에 대해 상이한 유전자 구조를 예측한다. 보다 구체적으로는, 본원에 기재된 ssb7 단백질 서열의 분석은 미세소관 상호작용 및 수송(MIT: microtubule interacting and trafficking) 도메인을 함유한다. 마찬가지로, BLAST 검색은 SSB7 단백질 오솔로그가 사카로미세테스(Saccharomycetes)가 아니라 푸사륨 종(서열 번호 8), 뉴로스포라 종(서열 번호 9), 마이셀리오프토라 종(서열 번호 10), 탈라로마이세스 종(서열 번호 11), 아스페르길루스 종(서열 번호 12) 및 페니실륨 종(서열 번호 13) 진균 균주에 존재한다는 것을 나타낸다. 예를 들어, 도 5에 제시되고 기재된 것처럼, SSB7 단백질은 단백질 서열 보존의 여러 영역을 포함한다. 도 5는 N 말단 MIT 도메인에 걸친 아미노산이 결여된 짧은 단백질 예측을 제외하고 삼백오십삼(353)개의 자낭균 동족체의 MUSCLE 정렬의 그래프 표시이다. 보다 구체적으로는, 정렬은 본원에서 "영역 A"(서열 번호 22), "영역 B"(서열 번호 23), "영역 C"(서열 번호 24) 및 "영역 D"(서열 번호 25)로 정의된 SSB7 동족체/오솔로그에서 네(4)가지의 보존 영역을 밝혀냈다. 도 5에 제시된 것처럼, 영역 A는 상기 언급된 MIT 도메인에 대응한다.
또한, 이러한 SSB7 오솔로그(서열 번호 8 내지 13)와 야생형 트리코데르마 레세이 SSB7 단백질(서열 번호 2) 및 야생형 트리코데르마 아트로비리데 SSB7 단백질(서열 번호 31)과의 CLUSTAL 정렬은 도 9a-도 9e에 제시되어 있는데, 이는 여러 아미노산 서열 보존 영역을 보여준다.
따라서, 특정 다른 구현예에서, 본 발명의 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자는 서열 번호 26의 "보존 1" SSB7 단백질 아미노산을 암호화하는 핵산 서열 영역에서 변형된다. 다른 구현예에서, 본 발명의 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자는 서열 번호 27의 "보존 2" SSB7 단백질 아미노산을 암호화하는 핵산 서열 영역에서 변형된다. 또 다른 구현예에서, 본 발명의 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자는 서열 번호 28의 "보존 3" SSB7 단백질 아미노산을 암호화하는 핵산 서열 영역에서 변형된다. 다른 구현예에서, 본 발명의 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자는 서열 번호 29의 "보존 4" SSB7 단백질 아미노산을 암호화하는 핵산 서열 영역에서 변형된다. 또 다른 구현예에서, 본 발명의 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자는 서열 번호 30의 "보존 5" SSB7 단백질 아미노산을 암호화하는 핵산 서열 영역에서 변형된다.
따라서, 상기 III 부문에 기재된 지침, 하기 제시된 실시예에 대하여, 그리고 본원에 개시된 아미노산 서열(예를 들어, 서열 번호 2, 4, 8 내지 13, 22 내지 31, 33 및 35) 및 핵산 서열(예를 들어, 서열 번호 1, 3, 5 내지 7, 19 내지 21, 32 또는 34)을 참조하여, 당업자는 본 발명의 점도 감소 표현형을 포함하는 사상성 진균의 이러한 변이체 균주를 용이하게 작제할 수 있다.
IV. MPG1, SFB3, SEB1, CRZ1 및/또는 GAS1 단백질을 암호화하는 유전자를 추가로 포함하는 변이체 진균 균주
특정 구현예에서, 본 발명은 SSB7 단백질을 암호화하는 유전자의 유전자 변형, 및 MPG1 단백질(서열 번호 14), SFB3 단백질(서열 번호 15), SEB1 단백질(서열 번호 16), CRZ1 단백질(서열 번호 17) 및/또는 GAS1 단백질(서열 번호 18)을 암호화하는 유전자의 하나 이상의 유전자 변형을 포함하는 사상성 진균의 변이체 균주에 관한 것이다.
예를 들어, MPG1 단백질, SFB3 단백질, SEB1 단백질, CRZ1 단백질 및/또는 GAS1 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 변이체 사상성 진균 균주는 이것이 유래된 모 균주에 비해 점도 감소 표현형을 포함한다(예를 들어, 상기 언급된 점도 감소 표현형을 기재하는 국제 PCT 공보 WO2012/145584호, WO2012/027580호, WO2012/145595호, WO2012/145596호, WO2012/145596호 및 WO2012/145592호 참조).
따라서, 특정 구현예에서, 사상성 진균의 변이체 균주는 SSB7을 암호화하는 유전자의 유전자 변형 및 MPG1, SFB3, SEB1, CRZ1 및/또는 GAS1로부터 선택된 단백질을 암호화하는 유전자의 하나 이상의 유전자 변형을 포함한다.
특정 구현예에서, ssb7 유전자의 유전자 변형 및 mpg1, sfb3, seb1, crz1 및/또는 gas1 유전자의 적어도 하나의 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 ssb7 유전자 단독의 유전자 변형만을 포함하는 사상성 진균의 변이체 균주에 비해 점도 감소 표현형을 추가로 포함한다. 보다 구체적으로는, 사상성 진균의 이러한 변이체 균주는 액침 배양에서의 호기성 발효 동안 (ssb7 단독의 유전자 변형을 포함하는 모 균주 및/또는 이의 변이체 균주의 세포에 비해) (i) 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스, 및/또는 (ii) 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포 브로스를 생산한다.
V. 분자 생물학
일반적으로 상기 기재된 것처럼, 본 발명의 특정 구현예는 사상성 진균의 모 균주로부터 유래된 사상성 진균의 변이체 균주에 관한 것이다. 이 변이체 균주의 세포는 후속하여 액침 배양에서의 호기성 발효 동안 모 균주의 세포와 비교하여 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스, 및/또는 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포 브로스를 생산한다. 따라서, 특정 구현예에서, 점도 감소 표현형을 포함하는 본 발명의 변이체 균주는 SSB7을 암호화하는 유전자의 유전자 변형(즉, 모 균주의 세포에 대한 것)을 포함한다.
따라서, 본원에 기재된 사상성 진균의 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자 변형은 본원에 개시된 SSB7 단백질의 (a) 유전자(또는 ORF)에서 하나 이상의 뉴클레오티드의 도입, 치환 또는 제거, 또는 유전자(또는 이의 ORF)의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오티드의 도입, 치환 또는 제거, (b) 유전자 파괴, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자 하향조절, (f) 특이적 돌연변이유발 및/또는 (g) 랜덤 돌연변이유발을 포함하지만, 이들로 제한되지는 않는다. 다른 구현예에서, SSB7을 암호화하는 유전자의 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 MPG1, SFB3, SEB1, CRZ1 및/또는 GAS1 단백질을 암호화하는 하나 이상의 유전자의 유전자 변형을 추가로 포함한다.
따라서, 특정 구현예에서, SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 자연적 SSB7 단백질의 발현/생산을 제거하도록 유전자 결실에 의해 작제된다. 다른 구현예에서, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 자연적 SSB7 단백질의 발현/생산을 제거하도록 부분 유전자 결실에 의해 작제된다. 예를 들어, 특정 구현예에서, 변형된 사상성 진균 균주는 ssb7 유전자의 부분 결실을 포함하고, 여기서 부분 결실은 ssb7 유전자의 암호화 서열의 임의의 부분의 부분 결실을 포함한다. 따라서, 점도 감소 표현형을 포함하는 이러한 변이체 균주는 자연적 SSB7 단백질을 발현/생산하지 않는다. 예를 들어, 유전자 결실 기법은 유전자의 부분 제거 또는 완전 제거가 가능하게 하여 자연적 단백질의 발현/생산을 제거한다. 이러한 방법에서, 유전자의 결실은 유전자와 측접하는 5' 및 3' 영역을 인접하여 함유하도록 작제된 통합 플라스미드/벡터를 사용하여 상동성 재조합에 의해 달성될 수 있다. 인접한 5' 및 3' 영역은, 플라스미드가 세포에서 통합되게 하도록, 예를 들어 선별 마커와 공동으로 통합 플라스미드/벡터 상의 사상성 진균 세포로 도입될 수 있다.
다른 구현예에서, 사상성 진균의 변이체 균주는 단백질(예를 들어, SSB7)을 암호화하는 유전자를 파괴하거나 불활성화하는 유전자 변형을 포함한다. 예시적인 유전자 파괴/불활성화 방법은 폴리펩타이드 암호화 서열(CDS), 프로모터, 인핸서 또는 다른 조절 요소를 포함하는 유전자의 임의의 부분을 파괴하는 것을 포함하는데, 파괴는 치환, 삽입, 결실, 역위, 및 이들의 조합 및 이들의 변형을 포함한다.
따라서, 특정 구현예에서, 사상성 진균의 변이체 균주는 유전자 파괴 기법에 의해 작제된다. 유전자 파괴 기법의 비제한적인 예는 (예를 들어, ssb7) 유전자에 상동성인 핵산 단편을 함유하는 통합 플라스미드를 본 발명의 하나 이상의 유전자로 삽입(통합)하는 것을 포함하고, 이는 상동성 영역의 중복을 생성하고 중복된 영역들 간에 (인서트) 벡터 DNA를 혼입할 것이다. 예를 들어, 실시예 부문에 기재된 것처럼, 사상성 진균의 이러한 변이체 균주(즉, ssb7 유전자 파괴를 포함)는 본 발명의 점도 감소 표현형을 포함한다.
따라서, 특정 다른 비제한적인 예에서, 유전자 파괴 기법은 (예를 들어, ssb7) 유전자에 상동성인 핵산 단편을 함유하는 통합 플라스미드를 유전자(예를 들어, SSB7 단백질을 암호화하는 유전자)로 삽입하는 것을 포함하고, 이는 상동성 영역의 중복을 생성하고 중복된 영역들 간에 (인서트) 벡터 DNA를 혼입할 것이고, 여기서 삽입된 벡터 DNA는 예를 들어 SSB7 단백질 암호화 영역으로부터 ssb7 유전자의 프로모터를 분리시키거나 ssb7 유전자의 암호화 서열 또는 비암호화 서열을 중단(파괴)시켜서, 이의 점도 감소 표현형 균주를 생성시킨다. 따라서, 파괴 작제물은 ssb7 유전자에 상동성인 5' 및 3' 영역이 동반된 선별 마커 유전자(예를 들어, pyr2)일 수 있다. 선별 마커는 파괴된 유전자를 함유하는 형질전환체의 확인이 가능하게 한다. 따라서, 특정 구현예에서, 유전자 파괴는 유전자의 제어 요소의 변형, 예컨대 프로모터, 비번역 영역(UTR), 코돈 변경 등을 포함한다.
다른 구현예에서, 사상성 진균의 변이체 균주는 유전자 또는 이의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오타이드를 도입하거나 치환하거나 제거함으로써 작제된다(즉, 유전자 변형된다). 예를 들어, 뉴클레오타이드는 종결 코돈이 도입되거나, 시작 코돈이 제거되거나, 오픈 리딩 프레임(ORF)이 프레임 시프트되도록 삽입되거나 제거될 수 있고, 예를 들어 대립유전자 ssb7(fs)을 참조한다. 이러한 변형은 당업계에 알려진 방법에 따라 부위 지정 돌연변이유발 또는 PCR에 의해 생성된 돌연변이유발에 의해 달성될 수 있다(예를 들어, Botstein 및 Shortle의 1985 문헌; Lo 등의 1985 문헌; Higuchi 등의 1988 문헌; Shimada의 1996 문헌; Ho 등의 1989 문헌; Horton 등의 1989 문헌 및 Sarkar 및 Sommer의 1990 문헌 참조).
다른 실시형태에서, 사상성 진균의 변이체 균주는 유전자 변환의 과정에 의해 작제된다(즉, 유전자 변형된다)(예를 들어, Iglesias 및 Trautner의 1983 문헌 참조). 예를 들어, 유전자 변환 방법에서, 표적 유전자에 대응하는 핵산 서열은 결함 핵산 서열을 생산하도록 시험관내 돌연변이되고, 이후 결함 유전자를 포함하는 변이체 세포를 생산하기 위해 모 세포로 형질전환된다. 상동 재조합에 의해, 결함 핵산 서열은 내인성 유전자를 대체한다. 결함 유전자 또는 유전자 단편이 결함 유전자를 함유하는 형질전환체의 선택에 사용될 수 있는 마커도 암호화하는 것이 바람직할 수 있다. 예를 들어, 결함 유전자는 선별 마커와 연관되어 비복제 또는 온도 감수성 플라스미드 상에 도입될 수 있다. 플라스미드의 통합에 대한 선택은 플라스미드 복제를 허용하지 않는 조건 하에 마커에 대한 선택에 의해 실행된다. 유전자 대체로 이어지는 제2 재조합 사건에 대한 선택은 선별 마커의 손실 및 돌연변이된 유전자의 획득에 대한 콜로니 검사에 의해 실행된다(Perego의 1993 문헌).
다른 구현예에서, 사상성 진균의 변이체 균주는 ssb7 유전자의 핵산 서열에 상보성인 뉴클레오티드 서열을 사용하는 확립된 안티센스 (유전자 침묵) 기법에 의해 작제된다(Parish 및 Stoker의 1997 문헌). 보다 구체적으로는, 사상성 진균 균주에 의한 유전자의 발현은 세포에서 전사되고 세포에서 생산된 mRNA에 혼성화할 수 있는 유전자의 핵산 서열에 상보성인 뉴클레오타이드 서열을 도입함으로써 감소(하향조절)되거나 제거될 수 있다. 따라서, 상보성인 안티센스 뉴클레오타이드 서열이 mRNA에 혼성화되게 하는 조건 하에 번역된 단백질의 양은 감소되거나 제거된다. 이러한 안티센스 방법은 RNA 간섭(RNAi), 소간섭 RNA(siRNA), 마이크로RNA(miRNA), 안티센스 올리고뉴클레오타이드 등을 포함하지만, 이들로 제한되지는 않으며, 이들 모두는 당업자에게 잘 알려져 있다.
다른 구현예에서, 사상성 진균의 변이체 균주는 비제한적인 예로서 화학 돌연변이유발(예를 들어, Hopwood의 1970 문헌 참조) 및 전좌(예를 들어, Youngman 등의 1983 문헌 참조)를 포함하는 당해 분야에 잘 알려진 방법을 사용하여 랜덤 또는 특이적 돌연변이유발에 의해 작제된다(즉, 유전자 변형된다). 유전자 변형은, 모 세포에서 돌연변이를 유발시키고 유전자의 발현이 감소되거나 제거된 돌연변이체 세포를 스크리닝함으로써 수행될 수 있다. 예를 들어, 당업자는 점도 감소 표현형을 포함하는 사상성 진균 세포의 이러한 (돌연변이유도된) 변이체 균주를 확인하기 위해 본원과 실시예 부문에 기재된 스크리닝 방법을 용이하게 적응하고/하거나 변형시킬 수 있다.
특이적 또는 무작위적일 수 있는 돌연변이 유발은 예를 들어 적합한 물리적 또는 화학적 돌연변이 유발제를 사용하거나, 적합한 올리고뉴클레오타이드를 사용하거나, DNA 서열이 PCR에 의한 돌연변이를 유발하게 함으로써 수행될 수 있다. 더욱이, 돌연변이 유발은 이들 돌연변이유발 방법의 임의의 조합을 사용함으로써 수행될 수 있다. 본 목적에 적합한 물리적 또는 화학적 돌연변이 유발제의 예는 자외선(UV) 조사, 하이드록실아민, N-메틸-N'-니트로-N-니트로소구아니딘(MNNG), N-메틸-N'-니트로소구아니딘(NTG), O-메틸 히드록실아민, 아질산, 에틸 메탄 설포네이트(EMS), 아황산수소나트륨, 포름산 및 뉴클레오타이드 유사체를 포함한다. 이러한 유발제가 사용될 때, 돌연변이유발은 일반적으로 적절한 조건 하에 선택된 돌연변이 유발제의 존재 하에 돌연변이유발되는 모 세포를 배양하고, 유전자 발현 감소를 나타내거나 유전자를 발현하지 않는 돌연변이체 세포를 선택함으로써 수행된다.
예를 들어, 본원에 개시된 하나 이상의 유전자에서의 이러한 유전자 변형은 유전자의 프로모터의 효율을 감소시키거나, 인핸서의 효율을 감소시키거나, 유전자의 mRNA의 스플라이싱 또는 편집을 방해하거나, 유전자의 mRNA의 번역을 방해하거나, 전장 단백질의 번역을 방지하도록 유전자의 암호화 서열로 종결 코돈을 도입하거나, 덜 활성이거나 불활성인 단백질을 생산하도록 단백질의 암호화 서열을 변경하거나, 다른 핵 단백질 성분과의 단백질 상호작용을 감소시키거나, 덜 안정한 단백질을 생산하도록 단백질의 암호화 서열을 변경하거나, 파괴를 위해 단백질을 표적화하거나, 단백질이 (예를 들어, 글리코실화에 의해) 미스폴딩되거나 부정확하게 변형되게 하거나, 단백질의 세포 이동을 방해할 수 있다.
특정 다른 구현예에서, 사상성 진균의 변이체 균주는 부위 특이적 유전자 편집 기법에 의해 작제된다(즉, 유전자 변형된다). 예를 들어, 특정 구현예에서, 사상성 진균의 변이체 균주는 전사 활성자 유사 엔도뉴클레아제(TALEN), 징크 핑거 엔도뉴클레아제(ZFN), 호밍(mega) 엔도뉴클레아제 등을 사용하여 작제된다(즉, 유전자 변형된다). 보다 구체적으로는, 변형될 유전자의 부분(예를 들어, 암호화 영역, 비암호화 영역, 리더 서열, 프로-펩타이드 서열, 신호 서열, 전사 종결자, 전사 활성자 또는 암호화 영역의 발현에 필요한 다른 조절 요소)은 ZFN 유전자 편집, TALEN 유전자 편집, 호밍(mega) 엔도뉴클레아제 등에 의해 유전자 변형되고, 변형 방법은 당업자에게 잘 알려져 있고 이용 가능하다.
따라서, 특정 구현예에서, 사상성 진균의 변이체 균주는 CRISPR/Cas9 편집에 의해 작제된다(즉, 유전자 변형된다)(예를 들어, 본원의 실시예 참조). 보다 구체적으로는, CRISPR/Cas9 시스템에 의한 진균 게놈 변형에 대한 조성물 및 방법이 기재되어 있고 당해 분야에 잘 알려져 있다(예를 들어, 국제 PCT 공보 WO2016/100571호, WO2016/100568호, WO2016/100272호, WO2016/100562호 등 참조). 따라서, SSB7 단백질을 암호화하는 유전자는 엔도뉴클레아제를 DNA 상의 표적 서열로 동원하는 가이드 RNA(예를 들어, Cas9) 또는 가이드 DNA(예를 들어, NgAgo)에 결합함으로써, 표적 DNA를 찾는, 핵산 가이드된 엔도뉴클레아제에 의해 파괴되거나 결실되거나 돌연변이되거나, 달리 유전자 변형될 수 있고, 여기서 엔도뉴클레아제는 DNA에서 단일쇄 또는 이중쇄 절단을 생성할 수 있다. 이러한 표적화된 DNA 절단은 DNA 복구를 위한 기질이 되고, 유전자를 파괴하거나 결실시키도록 제공된 편집 주형과 재조합된다. 예를 들어, 핵산 가이드된 엔도뉴클레아제를 암호화하는 유전자(예를 들어, S. 피오게네스 유래의 Cas9 또는 Cas9 뉴클레아제를 암호화하는 코돈 최적화된 유전자)는 사상성 진균 세포에서 활성인 프로모터 및 사상성 진균 세포에서 활성인 종결자에 작동 가능하게 연결되어 사상성 진균 Cas9 발현 카세트를 생성한다. 마찬가지로, 관심 유전자에 대해 고유한 하나 이상의 표적 부위가 당업자에 의해 쉽게 확인된다.
예를 들어, 관심 유전자 내의 표적 부위로 지시된 gRNA를 암호화하는 DNA 작제물을 작제하기 위해, 가변 표적화(VT) 도메인은 (PAM) 프로토-스페이서 인접 모티프(TGG)의 5'인 표적 부위의 뉴클레오타이드를 포함할 것이며, 이 뉴클레오타이드는 S. 피오게네스 Cas9에 대한 Cas9 엔도뉴클레아제 인식 도메인(CER)을 암호화하는 DNA에 융합된다. VT 도메인을 암호화하는 DNA와 CER 도메인을 암호화하는 DNA의 조합에 의해 gRNA를 암호화하는 DNA가 생성된다. 따라서, gRNA를 암호화하는 DNA를 사상성 진균 세포에서 활성인 프로모터 및 사상성 진균 세포에서 활성인 종결자에 작동 가능하게 연결함으로써 gRNA에 대한 사상성 진균 발현 카세트가 생성된다.
특정 구현예에서, 엔도뉴클레아제에 의해 유도된 DNA 절단은 유입 서열로 복구/대체된다. 예를 들어, 상기 기재된 Cas9 발현 카세트 및 gRNA 발현 카세트에 의해 생성된 DNA 절단을 정밀하게 복구하기 위해, 뉴클레오타이드 편집 주형이 제공되어서 세포의 DNA 복구 기작은 편집 주형을 이용할 수 있다. 예를 들어, 표적화된 유전자의 5'인 약 500 bp가 표적화된 유전자의 3'인 약 500 bp에 융합되어 편집 주형을 생성할 수 있고, 이 주형은 사상성 진균 숙주의 기작에 의해 사용되어 RGEN(RNA-가이드된 엔도뉴클레아제)에 의해 생성된 DNA 절단을 복구한다.
Cas9 발현 카세트, gRNA 발현 카세트 및 편집 주형은 많은 상이한 방법(예를 들어, 원형질체 융합, 전기천공, 자연 유능성 또는 유도 유능성)을 사용하여 사상 진균 세포에 동시전달될 수 있다. 형질전환된 세포는 PCR에 의해, 정방향 프라이머 및 역방향 프라이머로 표적 유전자위를 증폭시킴으로써 스크리닝된다. 이러한 프라이머는 야생형 유전자위 또는 RGEN에 의해 편집된 변형된 유전자위를 증폭시킬 수 있다. 이후 시퀀싱 프라이머를 사용하여 이들 단편을 시퀀싱하여 편집된 콜로니를 확인한다.
본 발명의 SSB7 단백질을 암호화하는 유전자가 유전자 변형될 수 있는 다른 방식은 관심 유전자의 발현 수준을 변경하는 것에 의한다. 예를 들어, 이러한 뉴클레오타이드-가이드된 엔도뉴클레아제의 뉴클레아제-결함 변이체(예를 들어, Cas9 D10A, N863A 또는 Cas9 D10A, H840A)는 표적 유전자의 전사를 향상시키거나 길항시킴으로써 유전자 발현 수준을 조절하도록 사용될 수 있다. 이 Cas9 변이체는 단백질 서열에 존재하는 모든 뉴클레아제 도메인에 대해 불활성이지만, RNA-가이드된 DNA 결합 활성을 보유한다(즉, 이 Cas9 변이체는 동족 표적 부위에 결합할 때 DNA의 어느 한 가닥을 절단할 수 없음).
따라서, 뉴클레아제-결함 단백질(즉, Cas9 변이체)은 사상성 진균 발현 카세트로서 발현될 수 있어서, Cas9 변이체 단백질은 사상성 진균 gRNA 발현 카세트와 조합될 때 세포 내에 특이적 표적 서열에 지향된다. 특이적 유전자 표적 부위에 대한 Cas9 (변이체) 단백질의 결합은 세포의 DNA 상에서 전사 기작의 결합 또는 이동을 차단하여 유전자 산물의 생산량을 감소시킬 수 있다. 따라서, 본원에 개시된 임의의 유전자는 이 방법을 사용하여 감소한 유전자 발현에 대해 표적화될 수 있다. 유전자 침묵은 뉴클레아제-결함 Cas9 발현 카세트 및 gRNA 발현 카세트(들)를 함유하는 세포에서 RNAseq와 같은 방법을 사용함으로써 모니터링될 수 있다.
VI. 유용성
일반적으로 상기 기재되고, 하기 실시예 부문에 추가로 기재된 것처럼, 본원에 개시된 사상성 진균의 점도 감소 균주의 사용은 액침 배양에서의 산소 및 영양소의 분포를 개선하고, 액침 배양물을 교반하는 데 필요한 에너지의 양을 감소시키고, 증가한 세포량 농도가 배양물에 존재하게 하여서, 단백질 생산을 증가시킨다. 게다가, 본원에 개시된 사상성 진균의 변이체 균주는 완전히 한정된 게놈을 포함하여, 이것이 후속하는 유전자 조작, 보완, 짝짓기(mating) 등에 매우 적합하게 한다. 마찬가지로, 본 발명의 균주는 예를 들어 점도 감소를 수반하는 조작(들)에 의해 단백질 생산에서 불리하게 영향을 받지 않는다. 더욱이, 본원에 개시된 사상성 진균의 이들 변이체 균주(즉, 점도 감소 균주)는 높은 수준 발현에 의도되는 단백질(즉, 내인성 관심 단백질 또는 이종성 관심 단백질)을 이미 생산하거나, 선별 마커를 이미 암호화하거나, 제조 숙주에서 바람직한 다른 특징을 이미 포함하는 모 균주를 포함하여 본질적으로 임의의 모 균주로부터 생산될 수 있다. 따라서, 본 발명의 균주 및 방법은 관심 단백질을 암호화하는 유전자를 이미 존재하는 점도 감소 생성 균주로 운반할 필요성을 제거한다.
따라서, 본 발명의 균주 및 방법은 사상성 진균의 액침 배양에서 상업적으로 중요한 단백질의 생산에서 이용된다. 예를 들어, 상업적으로 중요한 단백질은 셀룰라아제, 자일라나제, 만나아제, 헤미셀룰라아제, 펙티나아제, 리아제, 프로테아제, 키나제, 아밀라아제, 풀룰라나아제, 리파아제, 에스터라제, 퍼하이드롤라제, 트랜스퍼라제, 라카아제, 카탈라아제, 옥시다제, 리덕타제, 클로로필라아제, 하이드로포빈, 키모신, 탄산무수화효소, 티미딜레이트 신타아제, 디하이드로폴레이트 리덕타제, 티로신 키나제, 다중 약물 내성 단백질(예를 들어, ABC P-gp 단백질), CAD(카바밀-P 신타아제, 아스파르테이트 트랜스카바밀라아제, 디하이드로오로타제), 토포아이소머라제, 리보뉴클레오타이드 리덕타제, 항체, 및 사상성 진균에서 발현될 수 있는 다른 효소 및 비효소 단백질을 포함하지만, 이들로 제한되지는 않는다. 이러한 단백질은 산업, 제약, 동물 건강, 식품 및 음료 사용 등에 적합하다.
VII. 관심 단백질
상기 부분에 간단히 기재된 것처럼, 본 발명의 균주 및 방법은 사상성 진균의 액침 배양에서 상업적으로 중요한 단백질의 생산에 이용된다. 본 발명의 관심 단백질(POI)은 임의의 내인성 또는 이종성 단백질일 수 있으며, 이는 이러한 POI의 변이체일 수 있다. 단백질은 하나 이상의 이황화 가교를 함유할 수 있거나, 기능적 형태가 단량체 또는 다량체인 단백질이고, 즉 단백질은 4차 구조를 가지며, 복수의 동일한(상동성) 아단위 또는 비동일한(이종성) 아단위로 이루어지며, 여기서 POI 또는 이의 변이체 POI는 바람직하게는 관심 특성을 갖는 것이다.
특정 구현예에서, POI 또는 변이체 POI는 아세틸 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 탄산무수화효소, 카복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 리아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코스 산화효소, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 가수분해효소, 헤미셀룰라아제, 헥소스 산화효소, 가수분해효소, 인버타아제, 아이소머라아제, 락카아제, 리가아제(ligase), 리파아제, 리아제, 만나나아제, 만노시다아제, 산화효소, 산화환원효소, 펙테이트 리아제, 펙틴 아세틸 에스테라아제, 펙틴 해중합효소, 펙틴 메틸 에스테라아제, 펙틴분해 효소, 퍼하이드롤라아제, 폴리올 산화효소, 과산화효소, 페놀산화효소, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 전환효소, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소스 산화효소, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
특정 구현예에서, POI 또는 변이체 POI는 EC 1, EC 2, EC 3, EC 4, EC 5 또는 EC 6으로 이루어진 군으로부터 선택된 효소 위원회(EC: Enzyme Commission) 번호로부터 선택된다.
예를 들어, 특정 구현예에서, POI는 비제한적인 예로서 EC 1.10.3.2(예를 들어, 락카아제), EC 1.10.3.3(예를 들어, L-아스코르브산 옥시다아제), EC 1.1.1.1(예를 들어, 알코올 탈수소효소), EC 1.11.1.10(예를 들어, 염화물 퍼옥시다아제), EC 1.11.1.17(예를 들어, 퍼옥시다아제), EC 1.1.1.27(예를 들어, L-락테이트 탈수소효소), EC 1.1.1.47(예를 들어, 글루코스 1-탈수소효소), EC 1.1.3.X(예를 들어, 글루코스 옥시다아제), EC 1.1.3.10(예를 들어, 피라노스 옥시다아제), EC 1.13.11.X(예를 들어, 디옥시게나아제), EC 1.13.11.12(예를 들어, 리네올레이트 13S-리폭시게나아제), EC 1.1.3.13(예를 들어, 알코올 옥시다아제), EC 1.14.14.1(예를 들어, 모노옥시게나아제), EC 1.14.18.1(예를 들어, 모노페놀 모노옥시게나아제), EC 1.15.1.1(예를 들어, 수퍼옥사이드 디스무타아제), EC 1.1.5.9(이전 EC 1.1.99.10, 예를 들어, 글루코스 탈수소효소), EC 1.1.99.18(예를 들어, 셀로비오스 탈수소효소), EC 1.1.99.29(예를 들어, 피라노스 탈수소효소), EC 1.2.1.X(예를 들어, 지방산 리덕타아제), EC 1.2.1.10(예를 들어, 아세트알데하이드 탈수소효소), EC 1.5.3.X(예를 들어, 프룩토실 아민 리덕타아제), EC 1.8.1.X(예를 들어, 이황화물 리덕타아제) 및 EC 1.8.3.2(예를 들어, 티올 옥시다아제)로부터 선택된 EC 1(옥시도리덕타아제) 효소를 포함하나 이에 한정되지 않는 옥시도리덕타아제 효소이다.
특정 구현예에서, POI는 비제한적인 예로서 EC 2.3.2.13(예를 들어, 트랜스글루타미나아제), EC 2.4.1.X(예를 들어, 헥소실트랜스퍼라아제), EC 2.4.1.40(예를 들어, 알터나수크라아제), EC 2.4.1.18(예를 들어, 1,4 알파-글루칸 분지화 효소), EC 2.4.1.19(예를 들어, 사이클로말토덱스트린 글루카노트랜스퍼라아제), EC 2.4.1.2(예를 들어, 덱스트린 덱스트라나아제), EC 2.4.1.20(예를 들어, 셀로비오스 포스포릴라아제), EC 2.4.1.25(예를 들어, 4-알파-글루카노트랜스퍼라아제), EC 2.4.1.333(예를 들어, 1,2-베티-올리고글루칸 포스포르 트랜스퍼라아제), EC 2.4.1.4(예를 들어, 아밀로수크라아제), EC 2.4.1.5(예를 들어, 덱스트란수크라아제), EC 2.4.1.69(예를 들어, 갈락토시드 2-알파-L-푸코실 트랜스퍼라아제), EC 2.4.1.9(예를 들어, 이눌로수크라아제), EC 2.7.1.17(예를 들어, 자일룰로키나제), EC 2.7.7.89(이전에 EC 3.1.4.15, 예를 들어, [글루타민 합성효소]-아데닐-L-티로신 포스포릴라아제), EC 2.7.9.4(예를 들어, 알파 글루칸 키나제) 및 EC 2.7.9.5(예를 들어, 포스포글루칸 키나제)로부터 선택된 EC 2(트랜스퍼라아제) 효소를 포함하는 트랜스퍼라아제 효소이다.
다른 구현예에서, POI는 비제한적인 예로서 EC 3.1.X.X(예를 들어, 에스테라아제), EC 3.1.1.1(예를 들어, 펙티나아제), EC 3.1.1.14(예를 들어, 클로로필라제), EC 3.1.1.20(예를 들어, 타나아제), EC 3.1.1.23(예를 들어, 글리세롤-에스테르 아실하이드롤라아제), EC 3.1.1.26(예를 들어, 갈락토리파아제), EC 3.1.1.32(예를 들어, 포스포리파아제 A1), EC 3.1.1.4(예를 들어, 포스포리파아제 A2), EC 3.1.1.6(예를 들어, 아세틸에스테라아제), EC 3.1.1.72(예를 들어, 아세틸자일란 에스테라아제), EC 3.1.1.73(예를 들어, 페룰로일 에스테라아제), EC 3.1.1.74(예를 들어, 큐티나아제), EC 3.1.1.86(예를 들어, 람노갈락투로난 아세틸에스테라아제), EC 3.1.1.87(예를 들어, 푸모신 B1 에스테라아제), EC 3.1.26.5(예를 들어, 리보뉴클레아제 P), EC 3.1.3.X(예를 들어, 포스포릭 모노에스테르 하이드롤라아제), EC 3.1.30.1(예를 들어, 아스페르길루스 뉴클레아제 S1), EC 3.1.30.2(예를 들어, 세라티아 마르세센스 뉴클레아제), EC 3.1.3.1(예를 들어, 알칼라인 포스파타제), EC 3.1.3.2(예를 들어, 산 포스파타제), EC 3.1.3.8(예를 들어, 3-피타아제), EC 3.1.4.1(예를 들어, 포스포디에스테라아제 I), EC 3.1.4.11(예를 들어, 포스포이노시티드 포스포리파아제 C), EC 3.1.4.3(예를 들어, 포스포리파아제 C), EC 3.1.4.4(예를 들어, 포스포리파아제 D), EC 3.1.6.1(예를 들어, 아릴설파타제), EC 3.1.8.2(예를 들어, 디이소프로필-플루오로포스파타제), EC 3.2.1.10(예를 들어, 올리고-1,6-글루코시다아제), EC 3.2.1.101(예를 들어, 만난 엔도-1,6-알파-만노시다아제), EC 3.2.1.11(예를 들어, 알파-1,6-글루칸-6-글루카노하이드롤라아제), EC 3.2.1.131(예를 들어, 자일란 알파-1,2-글루쿠로노시다아제), EC 3.2.1.132(예를 들어, 키토산 N-아세틸글루코스아미노하이드롤라아제), EC 3.2.1.139(예를 들어, 알파-글루쿠로니다아제), EC 3.2.1.14(예를 들어, 키티나아제), EC 3.2.1.151(예를 들어, 자일로글루칸-특이적 엔도-베타-1,4-글루카나아제), EC 3.2.1.155(예를 들어, 자일로글루칸-특이적 엑소-베타-1,4-글루카나아제), EC 3.2.1.164(예를 들어, 갈락탄 엔도-1,6-베타-갈락토시다아제), EC 3.2.1.17(예를 들어, 라이소자임), EC 3.2.1.171(예를 들어, 람노갈락투로난 하이드롤라아제), EC 3.2.1.174(예를 들어, 람노갈락투로난 람노하이드롤라아제), EC 3.2.1.2(예를 들어, 베타-아밀라아제), EC 3.2.1.20(예를 들어, 알파-글루코시다아제), EC 3.2.1.22(예를 들어, 알파-갈락토시다아제), EC 3.2.1.25(예를 들어, 베타-만노시다아제), EC 3.2.1.26(예를 들어, 베타-프럭토푸라노시다아제), EC 3.2.1.37(예를 들어, 자일란 1,4-베타-자일로시다아제), EC 3.2.1.39(예를 들어, 글루칸 엔도-1,3-베타-D-글루코시다아제), EC 3.2.1.40(예를 들어, 알파-L-람노시다아제), EC 3.2.1.51(예를 들어, 알파-L-푸코시다아제), EC 3.2.1.52(예를 들어, 베타-N-아세틸헥소스아미니다아제), EC 3.2.1.55(예를 들어, 알파-N-아라비노푸라노시다아제), EC 3.2.1.58(예를 들어, 글루칸 1,3-베타-글루코시다아제), EC 3.2.1.59(예를 들어, 글루칸 엔도-1,3-알파-글루코시다아제), EC 3.2.1.67(예를 들어, 갈락투란 1,4-알파-갈락투로니다제), EC 3.2.1.68(예를 들어, 이소아밀라아제), EC 3.2.1.7(예를 들어, 1-베타-D-프럭탄 프럭타노하이드롤라아제), EC 3.2.1.74(예를 들어, 글루칸 1,4-β-글루코시다아제), EC 3.2.1.75(예를 들어, 글루칸 엔도-1,6-베타-글루코시다아제), EC 3.2.1.77(예를 들어, 만난 1,2-(1,3)-알파-만노시다아제), EC 3.2.1.80(예를 들어, 프럭탄 베타-프럭토시다아제), EC 3.2.1.82(예를 들어, 엑소-폴리-알파-갈락투로노시다아제), EC 3.2.1.83(예를 들어, 카파-카라기나아제), EC 3.2.1.89(예를 들어, 아라비노갈락탄 엔도-1,4-베타-갈락토시다아제), EC 3.2.1.91(예를 들어, 셀룰로스 1,4-베타-셀로비오시다아제), EC 3.2.1.96(예를 들어, 만노실-당단백질 엔도-베타-N-아세틸글루코스아미니다아제), EC 3.2.1.99(예를 들어, 아라비난 엔도-1,5-알파-L-아라비나아제), EC 3.4.X.X(예를 들어, 펩티다아제), EC 3.4.11.X(예를 들어, 아미노펩티다아제), EC 3.4.11.1(예를 들어, 류실 아미노펩티다아제), EC 3.4.11.18(예를 들어, 메티오닐 아미노펩티다아제), EC 3.4.13.9(예를 들어, Xaa-Pro 디펩티다아제), EC 3.4.14.5(예를 들어, 디펩티딜-펩티다아제 IV), EC 3.4.16.X(예를 들어, 세린-유형 카복시펩티다아제), EC 3.4.16.5(예를 들어, 카복시펩티다아제 C), EC 3.4.19.3(예를 들어, 피로글루타밀-펩티다아제 I), EC 3.4.21.X(예를 들어, 세린 엔도펩티다아제), EC 3.4.21.1(예를 들어, 키모트립신), EC 3.4.21.19(예를 들어, 글루타밀 엔도펩티다아제), EC 3.4.21.26(예를 들어, 프롤릴 올리고펩티다아제), EC 3.4.21.4(예를 들어, 트립신), EC 3.4.21.5(예를 들어, 트롬빈), EC 3.4.21.63(예를 들어, 오리진), EC 3.4.21.65(예를 들어, 써모마이콜린), EC 3.4.21.80(예를 들어, 스트렙토그리신 A), EC 3.4.22.X(예를 들어, 시스테인 엔도펩티다아제), EC 3.4.22.14(예를 들어, 악티니딘), EC 3.4.22.2(예를 들어, 파파인), EC 3.4.22.3(예를 들어, 피카인), EC 3.4.22.32(예를 들어, 줄기 브로멜라인), EC 3.4.22.33(예를 들어, 과일 브로멜라인), EC 3.4.22.6(예를 들어, 키모파파인), EC 3.4.23.1(예를 들어, 펩신 A), EC 3.4.23.2(예를 들어, 펩신 B), EC 3.4.23.22(예를 들어, 엔도티아펩신), EC 3.4.23.23(예를 들어, 무코르펩신), EC 3.4.23.3(예를 들어, 가스트릭신), EC 3.4.24.X(예를 들어, 메탈로엔도펩티다아제), EC 3.4.24.39(예를 들어, 듀테로라이신), EC 3.4.24.40(예를 들어, 세랄라이신), EC 3.5.1.1(예를 들어, 아스파라기나아제), EC 3.5.1.11(예를 들어, 페니실린 아미다아제), EC 3.5.1.14(예를 들어, N-아실-지방족-L-아미노산 아미도하이드롤라아제), EC 3.5.1.2(예를 들어, L-글루타민 아미도하이드롤라아제), EC 3.5.1.28(예를 들어, N-아세틸무라모일-L-알라닌 아미다아제), EC 3.5.1.4(예를 들어, 아미다아제), EC 3.5.1.44(예를 들어, 단백질-L-글루타민 아미도하이드롤라아제), EC 3.5.1.5(예를 들어, 우레아제), EC 3.5.1.52(예를 들어, 펩타이드-N(4)-(N-아세틸-베타-글루코스아미닐)아스파라긴 아미다아제), EC 3.5.1.81(예를 들어, N-아실-D-아미노산 데아실라제), EC 3.5.4.6(예를 들어, AMP 탈아미노효소) 및 EC 3.5.5.1(예를 들어, 니트릴라아제)로부터 선택된 EC 3(가수분해효소) 효소를 포함하는 가수분해효소 효소이다.
다른 구현예에서, POI는 비제한적인 예로서 EC 4.1.2.10(예를 들어, 만델로니트릴 리아제), EC 4.1.3.3(예를 들어, N-아세틸뉴라미네이트 리아제), EC 4.2.1.1(예를 들어, 탄산탈수효소), EC 4.2.2.-(예를 들어, 람노갈락투로난 리아제), EC 4.2.2.10(예를 들어, 펙틴 리아제), EC 4.2.2.22(예를 들어, 펙테이트 트리사카라이드-리아제), EC 4.2.2.23(예를 들어, 람노갈락투로난 엔도리아제) 및 EC 4.2.2.3(예를 들어, 만누로네이트-특이적 알기네이트 리아제)로부터 선택된 EC 4(리아제) 효소를 포함하는 리아제 효소이다.
특정 다른 구현예에서, POI는 비제한적인 예로서 EC 5.1.3.3(예를 들어, 알도오스 1-에피머라아제), EC 5.1.3.30(예를 들어, D-사이코스 3-에피머라아제), EC 5.4.99.11(예를 들어, 이소말툴로스 합상효소) 및 EC 5.4.99.15(예를 들어, (1→4)-α-D-글루칸 1-α-D-글루코실무타아제)로부터 선택된 EC 5(아이소머라아제) 효소를 포함하는 아이소머라아제 효소이다.
또 다른 구현예에서, POI는 비제한적인 예로서 EC 6.2.1.12(예를 들어, 4-쿠마레이트:조효소 A 리가아제) 및 EC 6.3.2.28(예를 들어, L-아미노산 알파-리가아제)로부터 선택된 EC 6(리가아제) 효소를 포함하는 리가아제 효소이다.
본 발명의 균주 및 방법의 이들 및 다른 양태 및 구현예는 본 설명 및 하기 실시예를 고려하여 당업자에게 명확할 것이다.
실시예
본 발명의 특정 양태는 다음의 실시예를 고려하여 추가로 이해될 수 있는데, 이는 제한하는 것으로 해석되어서는 안된다. 재료 및 방법의 변형은 당업자에게 명백할 것이다.
실시예 1
사상성 진균에서 형태 변화의 원인인 것으로서의
ssb7
유전자의 확인
A. 개요
트리코데르마 레세이는 상업적 발효에서 사용될 때 두꺼운 점성의 발효 브로스를 생성하는 호기성 사상성 진균이다. 예를 들어, 이러한 발효 브로스의 높은 점도는 특히 산소 이동을 감소시켜 세포량의 양을 제한하고, 이는 부수적으로 T. 레세이 상업적 발효에서 달성되는 부피 생산성을 감소시킨다. 점도 감소 돌연변이체의 단리는 더 낮은 점도의 발효 브로스를 생성하는 돌연변이체 균주를 생성시킬 수 있다. 이러한 돌연변이체 균주에 의해서, 발효는 더 많은 세포량을 이용하여, 부피 생산성을 증가시킬 수 있다. 보다 구체적으로는, 하나의 이러한 돌연변이체인 Morph 77B7은 유전적 검색으로부터 단리되었고, 여기서 원인성 돌연변이는 이전에 규명되지 않은 MIT 도메인 함유 단백질을 암호화하는 유전자인 ssb7에서 프레임 쉬프트 돌연변이로서 확인되었다. 본 실시예(및 하기 실시예 2 및 실시예 3)에서, ssb7의 상이한 돌연변이체 대립유전자가 개시되어 있는데, 이는 ssb7의 돌연변이가 발효 브로스 점도를 감소시킨다는 것을 예시한다. 본원에 개시된 ssb7 유전좌위 및 돌연변이체 ssb7 대립유전자는 도 1에 제시되어 있다.
B. 형태 돌연변이체에 대한 스크리닝
"TrGA 29-9"라 명명된 트리코데르마 균주를 발현하는 글루코아밀라아제(GA)(미국 특허 제9,725,727호(구체적으로 본원에 그 전체가 참고로 포함됨) 참조)는 10% 사멸이 얻어질 때까지 NTG(N-메틸-N'-니트로-N-니트로소구아니딘)로 돌연변이되었다. 살아 있는 세포를 PDA(감자 덱스트로스 한천)에 평판도말하고 포자를 형성하게 하였다. 포자를 물에 현탁한 후에 플레이트로부터 긁어냈다. 포자를 48시간 내지 72시간 동안 YEG(효모 추출물 글루코스 브로스)에서 성장시키고, 생성된 균사를 200 마이크로미터(㎛) 필터를 통해 체질하고, 이것을 후속하여 엄청난 양의 물로 세척하였다. 여과액을 스핀 다운하고, 균사를 수집하고, YEG로 재접종하였다. 균사를 매회 더 작은 필터를 통해 체질함을 제외하고는 이 정확한 절차를 수회 반복하였다. 최종 단계에서, 균사를 YEG에서 성장시킨 후에 40 ㎛ 필터를 통해 통과시키고, 균사를 여과액으로부터 회수하고, PDA에 평판도말하였다.
포자 라이브러리를 만들고, 콜로니 피커(picker)를 사용하여 구십육(96)웰 라이브러리를 준비하였다. 현미경관찰을 이용하여 라이브러리를 액체 배양에서 스크리닝하고, 형태(즉, 표현형) 변경을 나타낸 돌연변이체를 회수하였다. 이 스크린으로부터의 돌연변이체를 높은 세포 밀도 진탕 플라스크에서 추가로 평가하였다. 낮은 점도 브로스를 갖는 돌연변이체를 표준 세포 밀도 및 높은 세포 밀도 조건 하에 감소한 점도(표현형), 산소 이동 특성 및 단백질 생산에 대해 14 ℓ 발효기에서 추가로 평가하였다.
C. T. 레세이 Morph 77B7의 단리 및 규명
"Morph 77B7"로 명명된 T. 레세이 돌연변이체(즉, 상기 실시예 1B에 기재된 바대로 얻음)는 액침 액체 배양에서 특히 모체보다 더 짧고 더 두꺼운 필라멘트를 갖는 변경된 형태(표현형)를 갖는 것으로 관찰되었다. 예를 들어, 액체 배지에서, Morph 77B7 돌연변이체를 함유하는 배양물은 또한 모체를 함유하는 배양물과 비교하여 성장 동안 더 높은 수준의 용존 산소(DO)를 나타냈다(표 1 참조).
보다 구체적으로는, T. 레세이 균주인 TrGA 29-9 및 Morph 77B7을 액침 (액체) 배양에서 유사한 조건 하에 성장시키고, 이의 성장 표현형을 비교하였다. 간단히 말하면, 각각의 균주의 포자를 측면 배플 및 하부 배플 둘 다를 갖는 3 ℓ 플라스크에서 500 mL의 최소 배지에 별개로 첨가하고, 60% 글루코스를 27.5 g/ℓ의 최종 농도로 첨가하였다. 배양물을 진탕 항온처리기에서 34℃에서 48시간 동안 성장시켰다.
48시간 후, 각각의 플라스크의 내용물을 9.5 ℓ의 배지(4.7 g/ℓ의 KH2PO4, 1.0 g/ℓ의 MgSO4·7·H2O, 4.3 g/ℓ의 (NH4)2SO4 및 175 g/ℓ의 시트르산, 200 g/ℓ의 FeSO4·7·H2O, 16 g/ℓ의 ZnSO4·7·H2O, 3.2 g/ℓ의 CuSO4·5·H2O, 1.4 g/ℓ의 MnSO4·H2O 및 0.8 g/ℓ의 H3BO3을 함유하는 2.5 mL/ℓ의 400X 미량 원소 용액을 함유)를 함유하는 14 ℓ 발효기에 별개로 첨가하였다. 이들 성분들을 121℃에서 30분 동안 함께 열 멸균하였다. 60% 글루코스 및 0.48% CaCl2·2·H2O의 용액을 별개로 오토클레이빙하고, 냉각시키고, 75 g/ℓ의 글루코스 및 0.6 g/ℓ의 CaCl2·2·H2O의 최종 농도로 발효기에 첨가하였다. 배지를 28% NH3으로 pH 3.5로 조정하고, 전체 성장 기간 동안 34℃에서 온도를 유지시켰다.
헤드스페이스에서 압력이 추가되지 않을 때(즉, 0 bar 게이지, 1 bar 절대), 용존 산소(DO) 프로브는 100%로 보정되었다. 이후, 헤드스페이스에서의 압력은 0.7 bar(게이지)로 설정되고, 이후 시드 배양물이 첨가되기 전에 산소 프로브는 170% 판독되었다. 발효기는 초기에 500 RPM에서 설정된 가변 속도를 통해 혼합이 제공되는 2개의 4-블레이드 터빈을 함유하였다.
배양물이 성장하면서, 적어도 부분적으로 사상성 진균 균사의 증식으로 인한 발효 브로스의 점도 증가의 결과로서 DO 함량 수준이 떨어졌다. DO 함량 수준이 40% 아래로 떨어질 때, 교반 속도를 증가시켜 40%에서 용존 산소를 유지시켰다. DO 함량 수준은 750 RPM 교반에 도달할 시에 40% 아래로 떨어지게 될 것이다. DO 함량이 40% 아래로 떨어지지 않으면, 발효 실행 동안 교반 속도를 증가시킬 필요가 없고, 초기 교반 속도는 필요한 것보다 더 높았다. 글루코스가 완전히 소모될 때, 각각의 발효기에서 생성된 바이오매스의 양이 측정되고, 균주 둘 다에 대해 실질적으로 동일한 것으로 발견되었다.
따라서, 주어진 교반 수준에서의 각각의 발효기에서의 DO 함량 수준 및 주어진 DO 함량 수준을 유지시키는 데 필요한 교반의 양은 상이한 브로스의 점도(즉, 상이한 균주 성장 표현형으로 인함)의 간접 측정치이다. 오직 하나의 변수(즉, DO 또는 교반)를 변경하고 다른 변수를 측정하는 것이 이상적일 것이지만, 각각의 발효기에서의 충분한 바이오매스를 보장하여 상이한 균주의 성장 간의 더 의미 있는 비교를 허용하도록 DO가 40% 아래로 떨어지는 것을 방지하는 것이 바람직하다.
표 1에 기재된 것처럼, 균주 Morph 77B7은 (모) TrGA 29-9 균주와 비교하여 발효 브로스 점도가 감소하였다. 예를 들어, 배치 성장 단계의 종료시(즉, 모든 글루코스가 소모될 때), 균주 둘 다는 유사한 바이오매스 농도 및 유사한 피크 탄소 발생 속도(CER: carbon evolution rate)를 달성하였다. 거기까지, 대조군 균주는 750 RPM의 최대 세트포인트까지의 교반 증가를 겪고, DO는 15%까지의 최소 세트포인트 아래로 떨어졌다. 그에 반해서, Morph 7B77 돌연변이체 균주는 동일한 바이오매스 농도를 달성하기 위해 그렇게 많은 교반을 요하지 않고, 교반 속도는 오직 40% 세트포인트에서 DO를 유지시키기 위해 616 RPM까지 증가하였다.
D. T. 레세이 Morph 77B7에서의 원인성
ssb7
(fs) 돌연변이체 대립유전자의 확인
T. 레세이 TrGA 29-9 모체 및 Morph 77B7 돌연변이체 균주의 게놈을 (일반적으로 PCT 공보 WO2012/027580호에 기재된 바와 같이) 서열분석하여, Morph 77B7 게놈에서의 암호화 서열을 변경시키는 것으로 예측된 여덟(8)개의 새로운 돌연변이를 확인하였고, 이들 돌연변이 중 어느 것은 단독으로 또는 조합되어 본원에 기재된 관찰된 변경된 형태 표현형 및 점도 감소에 필요할 것이다. 따라서, 이들 돌연변이 중 어느 것이 중요한지를 결정하기 위해, 보완 분석을 수행하였다.
보다 구체적으로는, 오직 하나의 유전좌위는 본원에서 "ssb7"로 명명된 돌연변이체 표현형을 보완하였다. 따라서, 서열 번호 1의 ssb7 유전자는 동일한 DNA 서열에서의 다른 단백질 예측과 부분적으로 중첩하는 새로 예측된 단백질인 SSB7, 예를 들어 트리코데르마 레세이 QM6a 단백질 ID(PID) 108712를 암호화한다(The Genome Portal of the Department of Energy Joint Genome Institute, Grigoriev et al., 2011, 이하 "JGI 포탈"로 축약). 돌연변이체 균주 Morph 77B7에서, ssb7 돌연변이체 대립유전자는 엑손 2(T. 레세이 QM6a 스캐폴드 13, 167404)에서 단일 구아닌(G) 뉴클레오타이드 결실(ΔG)을 포함한다. 예를 들어, 엑손 2(즉, ssb7 돌연변이체 대립유전자)에서의 G의 결실은 프레임 쉬프트 돌연변이 및 ssb7 유전자의 마지막 인트론 전의 조기 중단을 발생시킨다. 이 대립유전자는 본원에서 "ssb7(fs)"이라 지칭된다.
DNA 단편에 의한 형질전환에 의한 T. 레세이 돌연변이체 균주 Morph 77B7 균사 표현형의 보완이 하기와 같이 수행되었다. 돌연변이체 Morph 77B7에서 관찰된 각각의 여덟(8)개의 돌연변이체 유전좌위에 대해, 형질전환 선택 마커 및 발현을 보장하기에 충분한 플랭킹 서열을 갖는 야생형 유전좌위 서열에 대응하는 DNA 단편을 함유하는 플라스미드가 개발되었다. 돌연변이체 균주 Morph 77B7 원형질체는 각각의 이들 플라스미드로 별개로 형질전환되었다. 각각의 플라스미드로부터의 두(2)개의 형질전환체를 선택적 액체 배지를 갖는 진탕 플라스크로 옮기고, 33℃에서 3일 동안 성장시켰다. 대부분의 DNA 단편을 보유하는 형질전환체는 Morph 77B7 돌연변이체 균주에 대해 관찰된 과분지하고 두꺼운 균사 표현형을 보유하였다. DNA 단편 1에 대한 형질전환체(Morph 77B7에서의 다른 돌연변이체 유전좌위 중 하나를 암호화함, 즉 PID 112328을 암호화하는 유전자)는 이 돌연변이체 표현형을 예시한다. 그에 반해서, DNA 단편 6을 포함하는 형질전환체(즉, PID 108712/SSB7을 암호화함)만이 적어도 부분적으로 더 얇고 덜 분지된 균사로 이 표현형을 반전시켰다. 도 2에 도시된 것처럼, DNA 단편 1(도 2, 패널 1A 및 패널 1B) 및 DNA 단편 6(도 2, 패널 6A 및 패널 6B)은 각각의 DNA 단편 1 및 6에 대한 독립적인 형질전환체를 나타낸다. 서열 번호 4의 변이체 SSB7 단백질을 암호화하는 돌연변이체 ssb7(fs) 대립유전자의 핵산 서열(서열 번호 3)은 도 3에 제시되어 있다.
따라서, 일반적으로 상기 기재된 것처럼, 야생형 T. 레세이 ssb7 유전자의 핵산 서열(서열 번호 1)은 본 문헌에 규명되지 않은 SSB7(서열 번호 2)을 암호화한다. 예를 들어, SSB7에 대한 JGI 포탈 T. 레세이 QM6a v2.0 데이터베이스 PID는 108712(http://genome.jgi-psf.org/cgi-bin/dispGeneModel?db=Trire2&id=108712; 서열 번호 33)이지만, SSB7에 대한 JGI T. 레세이 RUT-C30 데이터베이스 PID는 82397(Jourdier et al., 2017; 서열 번호 35)이다. 따라서, DNA 서열은 두(2)개의 T. 레세이 균주 사이에 이 유전좌위에서 동일하지만, 암호화 서열은 약간 상이한 것으로 예측된다(도 1a 참조; "QM6a JGI ssb7 PID 108712" 및 "RUT-C30 PID 82397"). 구체적으로는, 균주 QM6a 유전자 모델(PID 108712/서열 번호 33을 암호화하는 서열 번호 32)의 N 말단은 균주 RUT-C30 유전자 모델(PID 82397/서열 번호 35를 암호화하는 서열 번호 34)보다 두(2)개의 추가의 엑손을 보유하는 반면, 균주 RUT-C30 유전자 모델은 추가의 인트론을 함유한다. 이 유전좌위에서의 유전자 모델 예측을 분석하기 위해, 본 발명자들은 푸나노테이트 진균 게놈 주석 파이프라인과 커플링된 T. 레세이로부터의 RNA-서열분석 데이터를 이용하였다(JM Palmer. 2019. Funannotate genome annotation pipeline. Zenodo. http://doi.org/10.5281/zenodo.1134477). 푸나노테이트는 RNA-서열분석 판독 맵핑에 의해 지지된 유전자 모델을 예측하였지만, QM6a 및 RUT-C30에서의 JGI로부터의 모델 예측 둘 다는 RNA-서열분석 데이터와 비호환성인 인트론-엑손 경계를 가졌다(도 1a 참조). SSB7 유전자 예측은 3개의 엑손(서열 번호 19, 서열 번호 20 및 서열 번호 21), 462 bp 5' UTR(서열 번호 36) 및 373 bp 3' UTR(서열 번호 37)을 함유하는 4762 bp 전사체로부터 번역된 1308개의 아미노산의 번역된 단백질을 생성시킨다. 본원에서 출원인은 푸나노테이트 소프트웨어로부터 도출된 예측을 이용하여 ssb7 유전자 및 SSB7 단백질의 좌표를 참조할 것이다. 본원에서 출원인은 푸나노테이트 소프트웨어로부터 도출된 예측을 이용하여 ssb7 유전자(서열 번호 1) 및 SSB7 단백질(서열 번호 2)의 좌표를 참조하는 한편, 게놈 좌표는 여전히 JGI QM6a v2 어셈블리를 참조할 것이다.
E. 상동성에 기초한 기능
본원에서 수행된 BLAST 검색은 SSB7 단백질 오솔로그가 사카로미세테스가 아니라 푸사륨 종(서열 번호 8), 뉴로스포라 종(서열 번호 9), 마이셀리오프토라 종(서열 번호 10), 탈라로마이세스 종(서열 번호 11), 아스페르길루스 종(서열 번호 12), 및 페니실륨 종(서열 번호 13)에 존재한다는 것을 나타냈다. 예를 들어, T. 레세이 ssb7 유전자는 예측된 미세소관 상호작용 및 수송(MIT) 도메인(표 2, 영역 A 및 도 5 참조) 및 표 2의 영역 B, 영역 C 및 영역 D로 기재된 미공지 SSB7 단백질 도메인을 포함하는 미확인되었지만 고도로 보존된 SSB7 단백질을 암호화한다. 보다 구체적으로는, 삼백오십삼(353)개의 자낭균 동족체(N 말단 MIT 도메인에 걸친 아미노산이 결여된 짧은 단백질 예측을 배제)는 소프트웨어 패키지 Geneious에서 MUSCLE 방법을 이용하여 정렬되었다(Edgar RC (2004). "MUSCLE: multiple sequence alignment with high accuracy and high throughput". Nucleic Acids Research. 32 (5): 1792-97. doi:10.1093/nar/gkh340). 그래프 출력은 도 5에 제시되어 있고, 여기서 네(4)개의 아미노산 보존 영역(A 내지 D)은 정렬로부터 확인되었다. 영역 A는 MIT 도메인과 중첩하였다. 보존은 현재의 과학 지식에 기초하여 정확한 효소적 기능 또는 구조적 기능이 아미노산 서열에 의해 제시되지 않지만 이 4개의 영역이 SSB7 기능에 중요하다는 것을 암시한다.
실시예 2
모 균주 TrGA 29-9에서의
ssb7
의 파괴에 의한 MORPH 77B7-표현형의 재생성
A. 개요
ssb7 돌연변이가 점도 감소의 원인이라는 것을 추가로 검증하기 위해, ssb7 유전좌위는 모 균주 TrGA 29-9에서 특이적으로 돌연변이되었다. 따라서, 두(2)가지 방법은 상동성 재조합에 의해 ssb7 돌연변이유발을 표적화하기 위해 이용되었다. 플라스미드 pRATT311로부터의 선형 DNA 카세트를 사용한 한가지 방법은 균주 Morph 77B7(대립유전자 "ssb7(311)")에서 확인된 ΔG의 부위에서 파괴적 DNA의 삽입을 표적화하였다.
원형 플라스미드 pTrex2g MoCas 77b7-HR1을 사용한 두번째 방법은 프레임 쉬프트 돌연변이(대립유전자 "ssb7(TS1)"; 대립유전자의 비교에 대해 도 1을 참조)의 하류에서 (원래의 프레임에 비해) 하나의 동의 코돈 변경과 함께 균주 Morph 77B7에서 확인된 ΔG 돌연변이를 도입하였다. 따라서, ssb7의 대립유전자 둘 다는 감소한 점도를 나타냈고, 여기서 프레임 쉬프트 대립유전자인 ssb7(TS1)은 더 양호한 점도 감소를 가졌다.
B. 균주 TrGA 29-9에서의 대립유전자
ssb7
(
311
)
T. 레세이 ssb7 파괴 카세트 플라스미드 pRATT311은 표준 분자 생물학 절차를 이용하여 준비되었다. 따라서, 당업자는 개시된 관련 DNA 부분으로부터 이 플라스미드를 용이하게 재생성할 수 있다. 이 플라스미드는 스캐폴드 13, 164849 내지 167403에 대응하는 DNA 서열에 상동성인 2.6 Kb 상동성 박스를 갖는 DNA 서열(왼쪽 플랭크)을 포함하였다. 스캐폴드 13, 167405 내지 169218에 대응하는 DNA 서열에 상동성인 1.8 Kb 상동성 박스를 갖는 DNA 서열(오른쪽 플랭크)은 이 플라스미드 내에 포함되었다. 이 서열은 ssb7 유전자를 표적화하고, 개재하는 카세트 서열로 왼쪽 플랭크와 오른쪽 플랭크(스캐폴드 13, 167404) 사이의 게놈의 뉴클레오타이드를 대체하도록 설계되었다. 이 개재하는 카세트 서열은 트리코데르마 아트로비리데로부터의 pyr2 선택 마커를 포함하였다. 왼쪽 플랭크(반복서열)의 가장 3'인 영역에 상동성인 스캐폴드 13, 167403 내지 166833에 대응하는 0.6 Kb 영역을 갖는 DNA 서열이 pyr2 선택 마커의 바로 하류에 있다. 이 반복된 서열은 pyr2 마커의 후속하는 손실을 촉진하여 오직 새로 표적화된 게놈 변형으로서 ssb7 유전자에서 단일 뉴클레오타이드 G 결실 돌연변이(스캐폴드 13, 167404)를 남기면서 미래의 균주 개발에서 이의 마커의 사용을 가능하게 한다. 본원과 제시된 데이터가 pyr2 마커를 함유하는 pRATT311 형질전환체 및 ssb7 암호화 서열을 파괴시키는 반복서열로부터 유래함에 유의한다(도 1).
균주 TrGA 29-9의 자발적인 pyr2 돌연변이체 유도체는 5-플루오로-오로트산(FOA) 선택에 의해 단리되었다. 이 TrGA 29-9 pyr2 균주는 PEG 매개 원형질체 형질전환을 이용하여 pRATT311로부터의 ssb7 파괴 카세트로 형질전환되고, pyr2 마커에 의해 획득된 우리딘 프로토트로프(prototrophy)에 기초하여 후보를 선택하기 위해 소르비톨을 함유하는 Vogel 최소 배지에 평판도말되었다. 개별 형질전환체는 단리되고 Vogel 최소 배지로 이동시켜 증식되었다. PCR 분석은 형질전환체를 확인하도록 사용되는데, 여기서 ssb7 파괴 카세트는 하기 지침에 따라 당업자가 수행할 수 있는 것처럼 상동성 재조합에 의해 ssb7 유전좌위에서 통합되었다.
재조합 세포의 하위집단만이 관심 유전자의 파괴를 정확히 표적화하기 위해 상동성 플랭크를 성공적으로 이용할 수 있어서, 많은 형질전환체는 원하는 사건을 갖는 것을 확인하기 위해 스크리닝될 필요가 있을 수 있다. PCR은 어떠한 재조합 세포가 원하는 표적화된 파괴를 갖는지를 시험하기 위해 이용될 수 있다. 각각의 상동성 박스 영역에 걸쳐 증폭하는 프라이머가 설계되어야 하고, 여기서 하나의 프라이머는 가장 가까운 말단으로부터 100 bp 초과인 선별 마커 내의 위치에서 프라이밍하고, 다른 프라이머는 인접한 게놈 서열 내의 상동성 박스 영역의 말단을 넘어 100 bp 초과인 위치에서 프라이밍한다. 정확한 표적화된 파괴를 아마도 함유하는 세포는 파괴 카세트의 왼쪽 플랭크 및 오른쪽 플랭크에 이르는 PCR 산물을 성공적으로 생성하는 반면, 성공적이지 않은 형질전환 사건은 예상된 크기의 산물을 생성하지 않을 것이다. 이 단계에서 배양물은 형질전환된 세포와 비형질전환된 세포의 혼합물일 수 있고, 그래서 정제 단계가 필요할 수 있다. 배양물의 정제는 파괴 부위에 이르는 짧은 PCR 산물의 손실에 대해서 PCR에 의해 시험될 수 있다. ssb7 파괴 카세트의 확인된 상동성 통합을 갖는 생성된 균주는 "TrGA 29-9 ssb7(311)"로 명명된다.
C. 균주 TrGA 29-9에서의 대립유전자
ssb7
(
TS1
)
본원에 기재된 균주 TrGA 29-9에서 ssb7의 cas9 매개 편집에 사용된 벡터 및 균주 개발을 위한 방법은 본질적으로 PCT 공보 PCT/US2015/65693호 및 WO2016/100272호에 기재된 바대로 수행될 수 있고, 여기서 이 공보 내의 실시예 3 및 실시예 4는 pTrex2gHyg MoCas를 구축하는 것을 기술하고; 실시예 5는 이 벡터로 가이드 RNA(gRNA) 발현 카세트를 부가하는 것을 기술하고; 실시예 8은 HR-지시된 게놈 편집, 형질전환 및 스크리닝을 위한 상동성 영역에서의 부가를 추가로 기술한다.
도 6a에 도시된 gBlock DNA 서열(서열 번호 5)을 Integrated DNA Technologies, Inc.(IDT, 아이오와주 코럴빌)로부터 주문하였고, 여기서 EcoRV에 의한 분해 후에 pTrex2gHyg MoCas와의 Gibson 어셈블리를 허용하도록 5'-말단 또는 3'-말단에서 밑줄 표시된 서열이 부가되었다. 이들 밑줄 표시된 서열들 사이는 ssb7 유전자 내의 T. 레세이 게놈으로부터 1,098 bp이다. 회색 하이라이팅은 야생형 ssb7 유전자에서는 일곱(7)개의 G 잔기인 돌연변이체 ssb7(fs) 대립유전자의 여섯(6)개의 G 잔기를 보여준다. 내부 이중 밑줄 표시된 서열은 가이드 RNA(gRNA) 서열에 대응하는 20-뉴클레오타이드(nt) 표적 부위이다. 처음의 20-nt 표적은 "TS1"이라 칭해지고, 두번째의 20-nt 표적은 "TS2"라 칭해지고, 여기서 볼드 서체 c 잔기는 그 표적 부위에 인접한 PAM 부위를 변경시키는 G→C 변경을 나타낸다.
ssb7 유전자에서의 1개의 표적화 TS1(서열 번호 6, 도 6b) 및 ssb7 유전자에서의 1개의 표적화 TS2(서열 번호 7, 도 6c)인 2개의 상이한 단일 가이드 RNA(sgRNA)에 대한 발현 카세트를 암호화하는 2개의 gBlock을 IDT로부터 주문하였다. 따라서, SfiI 및 AflII에 의한 분해 후 pTrex2gHyg MoCas와의 Gibson 어셈블리를 허용하도록 2개의 gBlock의 말단 중 어느 하나에서 밑줄 표시된 서열이 부가되었다.
따라서, 2개의 최종 벡터가 작제되었다. 하나의, pTrex2g MoCas 77b7-HR1은 ssb7 상동성 영역 및 TS1 sgRNA 카세트를 가졌다. 두 번째의, pTrex2g MoCas 77b7-HR2는 ssb7 상동성 영역 및 TS2 sgRNA 카세트를 가졌다. DNA 서열분석은 gBlock의 원하는 삽입을 검증하였다.
따라서, "ssb7(TS1)" 및 "ssb7(TS2)"인 본원에 개시된 ssb7 대립유전자 중 두(2)개는 이들 플라스미드에 의해 생성되었다. 대립유전자 ssb7(TS1)은 표적 서열 1(TS1)로부터 생성되었고, TS1 인식 서열을 불활성화하기 위해 스캐폴드 13, 167404에서의 원래의 프레임 쉬프트 돌연변이 및 스캐폴드 13, 167436에서의 G→C 돌연변이를 함유한다(도 1 참조). ssb7 유전자위의 확인된 상동성 조작을 갖는 생성된 균주는 “TrGA 29-9 ssb7(TS1)"로 명명된다. 예를 들어, PCT 공보 WO2016/100272호(PCT 출원 번호 PCT/US2015/065693호)는 CAS 엔도뉴클레아제를 포함/발현하는 재조합 진균 세포(예를 들어, 재조합 DNA 작제물을 통해 발현됨), 가이드 RNA(gRNA)를 포함/발현하는 재조합 진균 세포, 비기능적 활성 또는 감소한 활성의, 비상동성 말단 연결(NHEJ: non-homologous end joining) 경로를 포함하는 재조합 진균 세포, 사상성 진균 세포를 형질전환시키기 위한 방법 및 조성물, 이러한 형질전환된 진균 세포를 스크리닝하기 위한 방법 및 조성물 등을 기재한다. 따라서, 당업자는 PCT 공보 WO2016/100272호를 참조하여 본 발명의 임의의 사상성 진균 균주에서 대립유전자 ssb7(TS1), 또는 본원에 개시된 임의의 다른 변형된 대립유전자를 유사하게 작제할 수 있다.
D. 생물반응기에서의 점도 감소
트리코데르마 레세이 균주를 액침 (액체) 배양에서 유사한 조건 하에 성장시키고, 이의 성장 표현형을 비교하였다. 간단히 말하면, 각각의 균주의 포자를 측면 배플 및 하부 배플 둘 다를 갖는 250 mL의 플라스크에서 50 mL의 시트레이트 최소 배지에 별개로 첨가하였다. 배양물을 5 cm 쓰로우(throw)로 진탕 항온처리기에서 170 RPM에서 30℃에서 48시간 동안 성장시켰다. 48시간 후에, 각각의 플라스크의 내용물을 접종을 위해 2 ℓ 발효기(생물반응기)에 별개로 첨가하였다. 접종 전에, 4.7 g/ℓ의 KH2PO4, 1.0 g/ℓ의 MgSO4·7·H2O, 9 g/ℓ의 (NH4)2SO4 및 2.5 mL/ℓ의 미량 원소 용액을 함유하는 0.95 kg의 배지를 2 ℓ 생물반응기에 첨가하고, 이후 121℃에서 30분 동안 함께 열 멸균하였다. 탱크에 접종하기 전에 멸균된 4.8 mL의 50% 글루코스 및 0.96 mL의 0.48% CaCl2·2·H2O인 후멸균 첨가물을 첨가하였다. 배지는 14% NH3으로 pH 3.5로 조정되고, 전체 성장 기간 동안 온도는 30℃에서 유지되고, pH는 3.5에서 유지되었다.
헤드스페이스에서 압력이 추가되지 않을 때(즉, 0 bar 게이지, 1 bar 절대), 용존 산소(DO) 프로브를 100%로 보정하였다. 생물반응기는 초기에 800 RPM에서 설정된 가변 속도 모터를 통해 혼합이 제공되는 2개의 침수 임펠러 사이에 4-블레이드 Rushton 임펠러를 함유하였다.
배양물이 성장하면서, 적어도 부분적으로 사상성 진균 균사의 증식으로 인한 발효 브로스의 점도 증가의 결과로서 DO 수준이 떨어졌다. 생물반응기 내의 용존 산소의 제어는 여러 세트포인트를 조정하는 제어 루프에 기초하였다. DO가 30% 아래로 떨어질 때, 교반 속도는 1,200 RPM의 최대 교반 세트포인트로 30%에서 용존 산소를 유지시키도록 증가하였다. DO가 30%에서 유지되지 않으면, 산소 풍부도는 21%에서 40% 이하까지 증가하였다. DO가 여전히 유지되지 않으면, 가스 흐름을 60 sL/h에서 80 sL/h 이하까지 증가시켰다. 글루코스가 완전히 소모될 때, 각각의 생물반응기에서 생성된 바이오매스의 양이 측정되고, 모든 균주에 대해 실질적으로 동일한 것으로 발견되었다(약 50 g/kg 건조 세포 중량). 배치에 있는 글루코스의 소진 후에, 글루코스 제한 상태에서 세포를 유지시키고 단백질 생산을 장려하도록 글루코스 및 혼합 이당류의 느린 공급을 시작하였다. 생물반응기에서 모 TrGA 29-9 균주 및 2개의 ssb7 돌연변이체 (유래) 균주 TrGA 29-9 ssb7(311) 및 TrGA 29-9 ssb7(TS1)에 대한 교반 및 DO 프로필은 명확성을 위해 도 7에 제시된다.
예를 들어, 도 7에 도시된 것처럼, 소정의 교반 수준에서의 각각의 생물반응기에서의 DO 수준 및 소정의 DO 수준을 유지시키는 데 필요한 교반의 양은 발효 브로스 점도의 간접적인 측정치이고, 이 측정은 본원에 기재된 관찰된 진균 균주 성장 표현형과 상관된다(예를 들어, 도 2 참조). 오직 하나의 변수(즉, DO 또는 교반)를 변경하고 다른 변수를 측정하는 것이 이상적일 것이지만, 각각의 생물반응기에서의 충분한 바이오매스의 생산을 보장하고 높은 생산성을 달성하여 상이한 진균 균주의 성장 간의 더 의미 있는 비교를 허용하도록 DO가 30% 아래로 떨어지는 것을 방지하는 것이 바람직하다.
따라서, 상기 기재된 점도 감소의 이(2)회 측정치는 각각의 생물반응기 실행, DO-제한 및 교반-추가로부터 정량화되었다. 균주가 배치에 있는 글루코스를 소진할 때 다르고 그러므로 공급-시작을 촉발하므로, 이들은 또한 발효 동안 DO가 가장 제한될 때에 다르다. 따라서, 이 측정은 공급-시작 전 이십(20)시간에 그리고 이후 사십(40)시간에 이르는 발효 시간의 범위를 이용하여 계산되었다.
도 7은 이 범위의 플러스 및 마이너스 열(10)시간을 보여준다. DO-제한은 DO 수준이 최소 DO 세트포인트(즉, 36% 미만의 DO)보다 20% 미만 높은 샘플링 시점의 비율로서 정의되었다. 교반-추가는 중앙 루프에 의해 촉발되는 것처럼 800 RPM 세트포인트 초과의 추가의 교반의 평균으로 정의되었다. 점도가 세포 밀도에 따라 증가하며 발효 브로스 점도가 세포 밀도의 함수이므로, 돌연변이체와 모 균주 사이의 비교는 유사한 세포량 농도에서 오직 유효하다. 따라서, 이들 간접적인 측정치가 계산되는 범위 동안 피크 건조 세포 중량(DCW)은 실시예에 포함된다.
따라서, 점도 평가는 모 TrGA 29-9 균주 및 ssb7 돌연변이체 (딸) 균주 TrGA 29-9 ssb7(311 ) 및 TrGA 29-9 ssb7(TS1)에 대해 생물반응기에서 수행되었다. 배치 성장 단계의 종료시, 모든 글루코스가 소모될 때, 모든 균주는 유사한 바이오매스 농도를 달성하였다(표 3). 더욱이, ssb7(311) 및 ssb7(TS1)인 ssb7 대립유전자 둘 다는 생물반응기 발효 브로스 점도(즉, TrGA 29-9 모체에 비해)를 감소시켰다. 또한, DO는 더 짧은 발효 기간 동안 낮았다. 따라서, 표 3은 DO를 세트포인트 초과로 유지시키는 데 필요한 감소한 양의 교반 및 DO가 세트포인트 20% 초과 또는 그 이하에 있는 감소한 시간 부분의 정량화된 측정치를 제공한다. 표 3에 기재된 것처럼, 점도 감소는 마커 삽입 ssb7(311)에 비해 프레임 쉬프트 대립유전자 ssb7(TS1)에 대해 더 높았다.
표 3에 제시된 점도 정량화 없이도, 교반이 돌연변이체 ssb7 대립유전자를 함유하는 딸 균주에 대해 감소한다는 것이 도 7에서 시각적으로 명확하다. 당업자는 최소 용존 산소, 초기 교반 및 최대 교반에 대한 최적 세트포인트 값이 사상성 진균 및 발효기 용기마다 다를 수 있음을 인식할 것이다. 모 균주의 용존 산소 제한 및 교반-추가 측정이 돌연변이체 딸 세포의 발효 동안 브로스 점도 변경의 검출을 가능하게 하는 범위에 있다는 것을 보장하도록 발효 매개변수가 설정되어야 함이 인식되어야 한다. 도 7에서의 모체 프로필은 이러한 정보제공 프로필을 예시한다.
실시예 3
전체 셀룰라아제 균주 T4abc에서의
ssb7
의 표적화된 돌연변이.
A. 개요
ssb7 돌연변이체의 유용성을 추가로 시험하기 위해, ssb7의 세(3)개의 돌연변이체 대립유전자는 또한 Nik1(M743T) 돌연변이(서열 번호 36)를 포함하고 셀룰라아제의 자연적 칵테일을 발현하는 "T4abc"라 명명된 상이한 T. 레세이 계통에서 평가되었다. 이 돌연변이체는 또한 점도 감소 표현형을 나타냈다.
B. 균주 T4abc에서의 대립유전자
ssb7
(
311
),
ssb7
(
TS2
) 및
ssb7
(
339fs
)
ssb7(311) 대립유전자는 균주 "T4abc ssb7(311)"을 생성하기 위해 상기 실시예 2에 기재된 것처럼 균주 T4abc pyr2에서 생성되었다. ssb7(TS2) 대립유전자는 표적 서열 2(Ts2)를 함유하는 플라스미드를 사용함을 제외하고는 실시예 2에서 ssb7(TS1)에서처럼 균주 T4abc에서 생성되었다. 따라서, 이것은 각각 TS1 및 TS2 인식 서열을 불활성화하도록 스캐폴드 13, 167404에서의 Morph 77B7 프레임 쉬프트 돌연변이, 및 스캐폴드 13, 167436 및 스캐폴드 13, 167466에서의 2개의 추가의 G → C 돌연변이를 함유하였다(도 1). 이 균주는 "T4abc ssb7(TS2)"로 명명되었다.
ssb7(339fs) 대립유전자가 플라스미드 pRATT339로 생성되는데, 이는 당업자가 개시된 관련 DNA 부분으로부터 이 플라스미드를 용이하게 재생성할 수 있도록 표준 분자 생물학 절차를 이용하여 준비되었다. 이 플라스미드는 스캐폴드 13, 165839 내지 169218에 대응하는 DNA 서열에 상동성인 3.4 Kb 상동성 박스를 갖는 DNA 서열(왼쪽 플랭크)을 포함하였다. 엑손 2에서의 프레임 쉬프트 돌연변이를 야기하는 단일 G 결실이 이 플랭크 내에 있다. 스캐폴드 13, 169273 내지 171458에 대응하는 DNA 서열에 상동성인 2.2 Kb 상동성 박스를 갖는 DNA 서열(오른쪽 플랭크) 또한 이 플라스미드 내에 포함되었다. 이 서열은 ssb7 유전자를 표적화하고, 개재하는 카세트 서열로 왼쪽 플랭크와 오른쪽 플랭크 사이의 게놈의 영역(스캐폴드 13, 169219 내지 169272)을 대체하도록 설계되었다.
이 개재하는 카세트 서열은 형질전환될 균주의 게놈에서 내인성 T. 레세이 pyr2에 대한 상동성을 최소화하도록 의도된 트리코데르마 아트로비리데로부터의 pyr2 선택 마커를 포함하였다. pyr2 선택 마커의 바로 상류에 마커의 3′-말단의 바로 반복된 중복(반복서열)이 있는데, 이는 후속하는 마커 손실 및 형질전환체/파괴체의 유용한 pyr2 돌연변이체 유도체의 단리를 촉진한다. 정확히 표적화된 개재하는 카세트 서열을 갖는 형질전환체의 하위집단에서, 왼쪽 플랭크에서의 프레임 쉬프트 돌연변이는 또한 게놈으로 혼입되어 엑손 2(스캐폴드 13, 167404)에서의 단일 G 뉴클레오타이드를 결실시킬 것이다. 본원에 개시된 ssb7(339fs) 대립유전자는 스캐폴드 13, 167404에서의 뉴클레오타이드 결실 및 스캐폴드 13, 169219 내지 169272 간의 반복-측접된 pyr2 마커의 삽입 둘 다를 함유한다(도 1).
따라서, 균주 T4abc pyr2는 PEG 매개 형질전환을 이용하여 pRATT339로부터의 ssb7 파괴 카세트로 형질전환되고, pyr2 마커에 의해 획득된 우리딘 프로토트로프에 기초하여 후보를 선택하기 위해 소르비톨을 함유하는 Vogel 최소 배지에 평판도말되었다. 개별 형질전환체는 단리되고 Vogel 최소 배지로 이동시켜 증식되었다. PCR 분석은 형질전환체를 확인하도록 사용되는데, ssb7 파괴 카세트는 상기 실시예 2-B에 기재된 것처럼 상동성 재조합에 의해 ssb7 유전좌위에서 통합되었다. 포자 정제 후에, 추가의 PCR 분석이 수행되어 통합이 정확히 발생하고 형질전환체가 동종핵성이라는 것을 보장하였다. 이후, 프레임 쉬프트 돌연변이에 이르는 ssb7 유전자의 부분은 PCR 증폭되고, 왼쪽 플랭크에서의 이 돌연변이가 통합 사건 동안 혼입되는지를 결정하도록 서열분석되었다. 엑손 3에서의 ssb7 파괴 카세트 및 엑손 2에서의 프레임 쉬프트 돌연변이의 확인된 상동성 통합을 갖는 생성된 균주는 "T4abc ssb7(339fs)"로 명명되었다.
C. 생물반응기에서의 점도 감소
점도 평가는 실시예 2에 기재된 바대로 T4abc 및 ssb7 돌연변이체 균주에 대해 생물반응기에서 수행되었다. 표 4에 기재된 것처럼, 배치 성장 단계의 종료시, 모든 글루코스가 소모될 때, 모든 균주는 유사한 바이오매스 농도(건조 세포 중량)을 달성하였다. 모든 세(3)개의 ssb7 대립유전자는 DO를 세트포인트 초과로 유지시키는 데 필요한 감소한 양의 교반(교반-추가) 및 DO가 세트포인트 20% 초과 또는 그 이하에 있는 감소한 시간 부분(DO 제한)에 의해 입증된 것처럼 T4abc 모체에 비해 생물반응기 브로스 점도를 감소시켰다.
참고문헌
국제 PCT 공개 PCT/US2015/65693호
국제 PCT 공개 WO2012/027580호
국제 PCT 공개 WO2012/145584호
국제 PCT 공개 WO2012/145592호
국제 PCT 공개 WO2012/145595호
국제 PCT 공개 WO2012/145596호
국제 PCT 공개 WO2016/100272호
국제 PCT 공개 WO2016/100568호
국제 PCT 공개 WO2016/100571호
국제 PCT 공개 WO2016/130523호
국제 PCT 공개 WO20161/00562호
미국 특허 제9,725,727호
Altschul et al., J. Mol. Biol. 215:403-10, 1990.
Altschul et al., Meth. Enzymol. 266:460-80, 1996.
Ausubel et al., “Current Protocols in Molecular Biology”, Eds., John Wiley & Sons, Inc., 1995, sections 2, 4 and 6.
Botstein and Shortle, Science 229: 4719, 1985.
Devereux et al., Nucleic Acids Res. 12:387-95, 1984.
Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989.
Higgins and Sharp, CABIOS 5:151-53, 1989.
Higgins et al., Gene 73:237-244, 1998.
Higuchi et al., Nucleic Acids Research 16: 7351, 1988.
Ho et al., Gene 77: 61, 1989.
Hopwood, The Isolation of Mutants in Methods in Microbiology (J. R. Norris and D. W. Ribbons, eds.) pp 363-433, Academic Press, New York, 1970.
Horton et al., Gene 77: 61, 1989.
Iglesias and Trautner, Molecular General Genetics 189: 73-76, 1983.
Jourdier et al., “Proximity ligation scaffolding and comparison of two Trichoderma reesei strains genomes”, Biotechnology for Biofuels, 10:151; 2017.
Karlin et al., Proc. Natl. Acad. Sci. USA 90:5873-87, 1993.
Kyte and Doolittle, “A simple method for displaying the hydropathic character of a protein”, J. Mol. Biol. 157, 105-132, 1982.
Lo et al., Proceedings of the National Academy of Sciences USA 81: 2285, 1985.
Majoros et al., “TigrScan and GlimmerHMM: two open-source ab initio eukaryotic gene-finders”, Bioinformatics, 2878-2879, 2004.
Needleman and Wunsch, J. Mol. Biol., 48:443, 1970.
Parish and Stoker, FEMS Microbiology Letters 154: 151-157, 1997.
Perego, 1993, In A. L. Sonneshein, J. A. Hoch, and R. Losick, editors, Bacillus subtilis and Other Gram-Positive Bacteria, Chapter 42, American Society of Microbiology, Washington, D.C.
Sambrook et al., “Molecular Cloning: A Laboratory Manual”, Cold Spring Harbor Press, Cold Spring Harbor, N.Y. (1989), chapters 7, 9 and 11.
Sarkar and Sommer, BioTechniques 8: 404, 1990.
Shimada, Meth. Mol. Biol. 57: 157; 1996.
Smith and Waterman, Adv. Appl. Math. 2:482, 1981.
Stanke et al., “AUGUSTUS: a web server for gene prediction in eukaryotes that allows user-defined constraints” Nucleic acids research, Vol. 33, Web Server issue: W465-7, 2005.
The Genome Portal of the Department of Energy Joint Genome Institute, I. V. Grigoriev, H. Nordberg, I. Shabalov, A. Aerts, M. Cantor, D. Goodstein, A. Kuo, S. Minovitsky, R. Nikitin, R. A. Ohm, R. Otillar, A. Poliakov, I. Ratnere, R. Riley, T. Smirnova, D. Rokhsar, and I. Dubchak, Nucleic Acids Res., 2011, 0: gkr947v1-gkr947; http://genome.jgi-psf.org/
Youngman et al., Proc. Natl. Acad. Sci. USA 80: 2305-2309, 1983.
<110> Danisco
<120> FILAMENTOUS FUNGAL STRAINS COMPRISING REDUCED VISCOSITY
PHENOTYPES
<130> NB40808-WO-PCT
<150> US 62/661,658
<151> 2018-04-24
<160> 38
<170> PatentIn version 3.5
<210> 1
<211> 4067
<212> DNA
<213> Hypocrea jecorina
<400> 1
atgcagcaac cgccctcctt agttggcgac cgcagcatca ccggcctggg agacgcagcc 60
agccgaccaa atctctcttc atcctcgcct accgtcacca gcgcgccctc ggcaccgaca 120
tcgccaccgc cgcggccgcc aatatcgctg aatcccccgt cgcgagagcc tcctggcgtc 180
gagcccgtgc tccgcatcac gccagtcccg cgctccgtct ttgcctctgt ccaccagccg 240
cgcaagtcgt cgctggtcca gacgtcgcac gtcctgccct cgcccaggac cgccgccgca 300
gctcaccatc accatcccgt ctcgcattcc gcctctggca gcagcggcag caacggcagt 360
ggaagcggca gtggcagcgg cagcggcaat ctgctgcgtc aaacgcatcg cgacaccgtg 420
cacccccccg tcaagcggcc atccaccccg tcgtcgcatc ccaccagggg cgccagcacc 480
ggagcatcgc cgcagcaggg cgccagctcc cgaaaccgct cgtcgacgtc gcccgtttcg 540
tccccggcga gtcgcacgcc tccttatgca tctcgtcagg cctcagtttc ccattcccgc 600
cagcagcaca accaccatca tcagcaccaa caccagcatt accactccca caccagctcg 660
actaccagtc gcgccagcat cgaggccgta gtcggtgccg tccccgatcc ctcaggtcac 720
cgagcgccgc cgaaaccccg tcgaccggat cgcaaccact ttggcgcgtc agatcgcagc 780
gcaactccca ccctgtcgca cttcatgagg gcagagtcga gcatgtccat gagacattac 840
gagagcggcc ccttacgctc catgtcgccg aacccctacg gaacccctgc cgccaccacg 900
acgtcgtcca ctgccagaat gccgcacgag cagagccacg atccctacgc ccctcgcggc 960
cactctcgcg atcactcggg gaagagcagc agagacatgg gcaagccccg agctcagaag 1020
aatccctcac agaaggcgat gctctcccgt gccctgcaaa aggccaacac cgcagttcag 1080
ctcgacaatg ctcagaactt cgaaggcgct cgagaagcgt acgccgaggc ttgcgacttg 1140
ttgcagcagg tgcttgaccg aacaccggga gatgaggaca agcggaagct cgaagccatt 1200
gtaagtcacg gcggcaaccg gaatgtcgag cccgttgtct gtcattagta gatcacttgg 1260
aactgacaat ttcaatctgt agcaccaaac ttacaccagc cgcatcgatg agctggatca 1320
gttgggccct tggcaggttg agaccgtcaa ggctctgccg gcgcggccag agagcgagga 1380
gtacagcgcg tccatattca taccccagga ttacgacatg ggcgatgaag ctcccaggat 1440
tgagacggca cgggtggtga gctacatcgc tggagacaac gcgtctccct ttgcagcagc 1500
gcccaaccag tggcagcagt cgggaggtca cacggcatct gaacggctgc agcccaaccg 1560
cggtctggaa ccgggtctgc tacagtcgtc cttctctcgg gccccgaggt cgcccaggcg 1620
gctgcagtcc accgatgatc ttcgcgcaca gcatcaggag ggccagtatg cgcctccccc 1680
actctcgcct cgctcgcagt cgccggtaaa gacgcatgac catgacgacg acatgtttgc 1740
cgaactgcca ccacacgagc cctatcagta ccagcaagag cacgaccatc aagaccacca 1800
tcaagactac catcaacatc accgccatca caaccaccac catcacgaac gacagcccag 1860
cgagactgtc ctatcctcat acgagctcca gggtcatgtg gatggaggaa tccaaaactc 1920
atggctagat ccaattgacg agtcgggagg ctcaacagcg tcgtctgtac actcacgcac 1980
ctcttcgctt ggctaccgtc gacgccatat ccgggccgtg agcgggaaca ccgaggccga 2040
gtttgacacg gcgctggacg ctgctatcga ggctgcctac gacgacggct acgagcccat 2100
ggactctgta gactatggga ccattgatgc tgggggggac aatagcatgg caggcgtatt 2160
gcacaaggtg gagatggcgc gcgaacgagc gagacagacg gagcaggaag cctatgacga 2220
gctggccaac ctccgacagg cgcactcaca gaatccgcag caccagcagg aggaggacag 2280
gtatactgcc gagggattct acgaggacga ctcgtctgaa gaggaggaga gactattgga 2340
cgagattaca cgcgactttg ccattgagga ctttaccatg gaaaacccga atggcacaca 2400
ggtgtcagct aggcagcagg atgcatggaa cgaggacgag acgaggccgg atttcatctc 2460
gggcgtccga tccttttctg ccctgtcgca gaggccaccc attcctcagg cctacgccgc 2520
caacgcctcg cagccagcag ccccccctcc gacatccgca ttgccagacc tgccaccagg 2580
acgccctggt caaaatccaa agcaactcaa gatcgagacg gcaaacattg tacaaaccca 2640
gaagtcggtc tatgacgacg acgaaatctc cccaagcacg caagagccgc cgcccgagac 2700
gctcgtccgg acggcgagcg cgcagcctgt aaggccaccg ataccgacag aaagcttccc 2760
atccgaactc agtgctcccg catcgccaac cgccaagaag aggcttctgg aaggagagaa 2820
tgtgctgaat gcctcgcctt ctatccacag gctacggaag aacttttcgt cttctagctt 2880
gaggagcatg aagaacagga acatgtccgt ctcacatttg gacgacagct cggatgcttc 2940
ccccggcacc cccctgaatg accccttcaa caaggcacct gccgtgcccg tgcccgcgct 3000
gccgaccccc ttgctcgcgt cgttcaaaga tcatatggag gcagcggccg gtgttggctt 3060
ccacctgttt gacgacgagt ttcatgcagc ggcggctgcc ggcccccaaa gcccgcagag 3120
tcccagaagt cccgttgttg tctccatgga cgtccctgtg cctctggaac cctgtccaaa 3180
cgacttcatg ctgcgaccgt tttggctgat gcgatgccta taccagacac ttgtgcatcc 3240
caagggtggc tacatcagta cgaagctatt cgtgccgcga gacgtctggc gggtcaaagg 3300
tgtcaagatc aagaacgtgg aggacaaaat tgccaactgc gactttttga ctgcagccct 3360
gctgaagctg tccaaagtgg acactctgga tgcggatgcc gtgctggagg agatgcaagc 3420
cctcgagggc attctggagc agatacagcc ggtcctggcc cgaaagcttg gaaacgaagt 3480
gggcgttcaa ggttccggtc tgctgttcaa agacgcctcg atgatggaag gagaccccgg 3540
ttcagccgtg ccgcgatcag gaagtgtgtc tggcaaggcg tctgcgtttt cctggcgacg 3600
gcttcggcca aagacgtcgg gcgtcgggct gggagggtcg tacagcagcc gcaacgccag 3660
tgctgagacg aaggaggcct caacgctggc aacggtgccc atgacgccga aaccgacaag 3720
ccgttcggcc aagcgagacg tgagccaggt tcagttcatc gggcccaatg cgagctacat 3780
gggctctctc gcgcgcttgt ttgacgctgc gcaggcagtt ggtaagcata ttgcgatacg 3840
cataccggtt acagtgacgg caagctaacg atgatgcaga tcaaattgca aggcaggtcg 3900
acgaccccgg tttgcggctt gcggacaaga ctcaggtcgg cttggagctc tgcacccggc 3960
acgccgctga gttctttggc ttttacattt gccgattcgt cttggccgac ctcggcctgt 4020
tgctggacaa gttcctcaaa cgaggaagcg aatgggtcat gacatga 4067
<210> 2
<211> 1308
<212> PRT
<213> Hypocrea jecorina
<400> 2
Met Gln Gln Pro Pro Ser Leu Val Gly Asp Arg Ser Ile Thr Gly Leu
1 5 10 15
Gly Asp Ala Ala Ser Arg Pro Asn Leu Ser Ser Ser Ser Pro Thr Val
20 25 30
Thr Ser Ala Pro Ser Ala Pro Thr Ser Pro Pro Pro Arg Pro Pro Ile
35 40 45
Ser Leu Asn Pro Pro Ser Arg Glu Pro Pro Gly Val Glu Pro Val Leu
50 55 60
Arg Ile Thr Pro Val Pro Arg Ser Val Phe Ala Ser Val His Gln Pro
65 70 75 80
Arg Lys Ser Ser Leu Val Gln Thr Ser His Val Leu Pro Ser Pro Arg
85 90 95
Thr Ala Ala Ala Ala His His His His Pro Val Ser His Ser Ala Ser
100 105 110
Gly Ser Ser Gly Ser Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser
115 120 125
Gly Asn Leu Leu Arg Gln Thr His Arg Asp Thr Val His Pro Pro Val
130 135 140
Lys Arg Pro Ser Thr Pro Ser Ser His Pro Thr Arg Gly Ala Ser Thr
145 150 155 160
Gly Ala Ser Pro Gln Gln Gly Ala Ser Ser Arg Asn Arg Ser Ser Thr
165 170 175
Ser Pro Val Ser Ser Pro Ala Ser Arg Thr Pro Pro Tyr Ala Ser Arg
180 185 190
Gln Ala Ser Val Ser His Ser Arg Gln Gln His Asn His His His Gln
195 200 205
His Gln His Gln His Tyr His Ser His Thr Ser Ser Thr Thr Ser Arg
210 215 220
Ala Ser Ile Glu Ala Val Val Gly Ala Val Pro Asp Pro Ser Gly His
225 230 235 240
Arg Ala Pro Pro Lys Pro Arg Arg Pro Asp Arg Asn His Phe Gly Ala
245 250 255
Ser Asp Arg Ser Ala Thr Pro Thr Leu Ser His Phe Met Arg Ala Glu
260 265 270
Ser Ser Met Ser Met Arg His Tyr Glu Ser Gly Pro Leu Arg Ser Met
275 280 285
Ser Pro Asn Pro Tyr Gly Thr Pro Ala Ala Thr Thr Thr Ser Ser Thr
290 295 300
Ala Arg Met Pro His Glu Gln Ser His Asp Pro Tyr Ala Pro Arg Gly
305 310 315 320
His Ser Arg Asp His Ser Gly Lys Ser Ser Arg Asp Met Gly Lys Pro
325 330 335
Arg Ala Gln Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu
340 345 350
Gln Lys Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu
355 360 365
Gly Ala Arg Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val
370 375 380
Leu Asp Arg Thr Pro Gly Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile
385 390 395 400
His Gln Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro
405 410 415
Trp Gln Val Glu Thr Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu
420 425 430
Glu Tyr Ser Ala Ser Ile Phe Ile Pro Gln Asp Tyr Asp Met Gly Asp
435 440 445
Glu Ala Pro Arg Ile Glu Thr Ala Arg Val Val Ser Tyr Ile Ala Gly
450 455 460
Asp Asn Ala Ser Pro Phe Ala Ala Ala Pro Asn Gln Trp Gln Gln Ser
465 470 475 480
Gly Gly His Thr Ala Ser Glu Arg Leu Gln Pro Asn Arg Gly Leu Glu
485 490 495
Pro Gly Leu Leu Gln Ser Ser Phe Ser Arg Ala Pro Arg Ser Pro Arg
500 505 510
Arg Leu Gln Ser Thr Asp Asp Leu Arg Ala Gln His Gln Glu Gly Gln
515 520 525
Tyr Ala Pro Pro Pro Leu Ser Pro Arg Ser Gln Ser Pro Val Lys Thr
530 535 540
His Asp His Asp Asp Asp Met Phe Ala Glu Leu Pro Pro His Glu Pro
545 550 555 560
Tyr Gln Tyr Gln Gln Glu His Asp His Gln Asp His His Gln Asp Tyr
565 570 575
His Gln His His Arg His His Asn His His His His Glu Arg Gln Pro
580 585 590
Ser Glu Thr Val Leu Ser Ser Tyr Glu Leu Gln Gly His Val Asp Gly
595 600 605
Gly Ile Gln Asn Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser
610 615 620
Thr Ala Ser Ser Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg
625 630 635 640
Arg His Ile Arg Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr
645 650 655
Ala Leu Asp Ala Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro
660 665 670
Met Asp Ser Val Asp Tyr Gly Thr Ile Asp Ala Gly Gly Asp Asn Ser
675 680 685
Met Ala Gly Val Leu His Lys Val Glu Met Ala Arg Glu Arg Ala Arg
690 695 700
Gln Thr Glu Gln Glu Ala Tyr Asp Glu Leu Ala Asn Leu Arg Gln Ala
705 710 715 720
His Ser Gln Asn Pro Gln His Gln Gln Glu Glu Asp Arg Tyr Thr Ala
725 730 735
Glu Gly Phe Tyr Glu Asp Asp Ser Ser Glu Glu Glu Glu Arg Leu Leu
740 745 750
Asp Glu Ile Thr Arg Asp Phe Ala Ile Glu Asp Phe Thr Met Glu Asn
755 760 765
Pro Asn Gly Thr Gln Val Ser Ala Arg Gln Gln Asp Ala Trp Asn Glu
770 775 780
Asp Glu Thr Arg Pro Asp Phe Ile Ser Gly Val Arg Ser Phe Ser Ala
785 790 795 800
Leu Ser Gln Arg Pro Pro Ile Pro Gln Ala Tyr Ala Ala Asn Ala Ser
805 810 815
Gln Pro Ala Ala Pro Pro Pro Thr Ser Ala Leu Pro Asp Leu Pro Pro
820 825 830
Gly Arg Pro Gly Gln Asn Pro Lys Gln Leu Lys Ile Glu Thr Ala Asn
835 840 845
Ile Val Gln Thr Gln Lys Ser Val Tyr Asp Asp Asp Glu Ile Ser Pro
850 855 860
Ser Thr Gln Glu Pro Pro Pro Glu Thr Leu Val Arg Thr Ala Ser Ala
865 870 875 880
Gln Pro Val Arg Pro Pro Ile Pro Thr Glu Ser Phe Pro Ser Glu Leu
885 890 895
Ser Ala Pro Ala Ser Pro Thr Ala Lys Lys Arg Leu Leu Glu Gly Glu
900 905 910
Asn Val Leu Asn Ala Ser Pro Ser Ile His Arg Leu Arg Lys Asn Phe
915 920 925
Ser Ser Ser Ser Leu Arg Ser Met Lys Asn Arg Asn Met Ser Val Ser
930 935 940
His Leu Asp Asp Ser Ser Asp Ala Ser Pro Gly Thr Pro Leu Asn Asp
945 950 955 960
Pro Phe Asn Lys Ala Pro Ala Val Pro Val Pro Ala Leu Pro Thr Pro
965 970 975
Leu Leu Ala Ser Phe Lys Asp His Met Glu Ala Ala Ala Gly Val Gly
980 985 990
Phe His Leu Phe Asp Asp Glu Phe His Ala Ala Ala Ala Ala Gly Pro
995 1000 1005
Gln Ser Pro Gln Ser Pro Arg Ser Pro Val Val Val Ser Met Asp Val
1010 1015 1020
Pro Val Pro Leu Glu Pro Cys Pro Asn Asp Phe Met Leu Arg Pro Phe
1025 1030 1035 1040
Trp Leu Met Arg Cys Leu Tyr Gln Thr Leu Val His Pro Lys Gly Gly
1045 1050 1055
Tyr Ile Ser Thr Lys Leu Phe Val Pro Arg Asp Val Trp Arg Val Lys
1060 1065 1070
Gly Val Lys Ile Lys Asn Val Glu Asp Lys Ile Ala Asn Cys Asp Phe
1075 1080 1085
Leu Thr Ala Ala Leu Leu Lys Leu Ser Lys Val Asp Thr Leu Asp Ala
1090 1095 1100
Asp Ala Val Leu Glu Glu Met Gln Ala Leu Glu Gly Ile Leu Glu Gln
1105 1110 1115 1120
Ile Gln Pro Val Leu Ala Arg Lys Leu Gly Asn Glu Val Gly Val Gln
1125 1130 1135
Gly Ser Gly Leu Leu Phe Lys Asp Ala Ser Met Met Glu Gly Asp Pro
1140 1145 1150
Gly Ser Ala Val Pro Arg Ser Gly Ser Val Ser Gly Lys Ala Ser Ala
1155 1160 1165
Phe Ser Trp Arg Arg Leu Arg Pro Lys Thr Ser Gly Val Gly Leu Gly
1170 1175 1180
Gly Ser Tyr Ser Ser Arg Asn Ala Ser Ala Glu Thr Lys Glu Ala Ser
1185 1190 1195 1200
Thr Leu Ala Thr Val Pro Met Thr Pro Lys Pro Thr Ser Arg Ser Ala
1205 1210 1215
Lys Arg Asp Val Ser Gln Val Gln Phe Ile Gly Pro Asn Ala Ser Tyr
1220 1225 1230
Met Gly Ser Leu Ala Arg Leu Phe Asp Ala Ala Gln Ala Val Asp Gln
1235 1240 1245
Ile Ala Arg Gln Val Asp Asp Pro Gly Leu Arg Leu Ala Asp Lys Thr
1250 1255 1260
Gln Val Gly Leu Glu Leu Cys Thr Arg His Ala Ala Glu Phe Phe Gly
1265 1270 1275 1280
Phe Tyr Ile Cys Arg Phe Val Leu Ala Asp Leu Gly Leu Leu Leu Asp
1285 1290 1295
Lys Phe Leu Lys Arg Gly Ser Glu Trp Val Met Thr
1300 1305
<210> 3
<211> 2731
<212> DNA
<213> Hypocrea jecorina
<400> 3
atgcagcaac cgccctcctt agttggcgac cgcagcatca ccggcctggg agacgcagcc 60
agccgaccaa atctctcttc atcctcgcct accgtcacca gcgcgccctc ggcaccgaca 120
tcgccaccgc cgcggccgcc aatatcgctg aatcccccgt cgcgagagcc tcctggcgtc 180
gagcccgtgc tccgcatcac gccagtcccg cgctccgtct ttgcctctgt ccaccagccg 240
cgcaagtcgt cgctggtcca gacgtcgcac gtcctgccct cgcccaggac cgccgccgca 300
gctcaccatc accatcccgt ctcgcattcc gcctctggca gcagcggcag caacggcagt 360
ggaagcggca gtggcagcgg cagcggcaat ctgctgcgtc aaacgcatcg cgacaccgtg 420
cacccccccg tcaagcggcc atccaccccg tcgtcgcatc ccaccagggg cgccagcacc 480
ggagcatcgc cgcagcaggg cgccagctcc cgaaaccgct cgtcgacgtc gcccgtttcg 540
tccccggcga gtcgcacgcc tccttatgca tctcgtcagg cctcagtttc ccattcccgc 600
cagcagcaca accaccatca tcagcaccaa caccagcatt accactccca caccagctcg 660
actaccagtc gcgccagcat cgaggccgta gtcggtgccg tccccgatcc ctcaggtcac 720
cgagcgccgc cgaaaccccg tcgaccggat cgcaaccact ttggcgcgtc agatcgcagc 780
gcaactccca ccctgtcgca cttcatgagg gcagagtcga gcatgtccat gagacattac 840
gagagcggcc ccttacgctc catgtcgccg aacccctacg gaacccctgc cgccaccacg 900
acgtcgtcca ctgccagaat gccgcacgag cagagccacg atccctacgc ccctcgcggc 960
cactctcgcg atcactcggg gaagagcagc agagacatgg gcaagccccg agctcagaag 1020
aatccctcac agaaggcgat gctctcccgt gccctgcaaa aggccaacac cgcagttcag 1080
ctcgacaatg ctcagaactt cgaaggcgct cgagaagcgt acgccgaggc ttgcgacttg 1140
ttgcagcagg tgcttgaccg aacaccggga gatgaggaca agcggaagct cgaagccatt 1200
gtaagtcacg gcggcaaccg gaatgtcgag cccgttgtct gtcattagta gatcacttgg 1260
aactgacaat ttcaatctgt agcaccaaac ttacaccagc cgcatcgatg agctggatca 1320
gttgggccct tggcaggttg agaccgtcaa ggctctgccg gcgcggccag agagcgagga 1380
gtacagcgcg tccatattca taccccagga ttacgacatg ggcgatgaag ctcccaggat 1440
tgagacggca cgggtggtga gctacatcgc tggagacaac gcgtctccct ttgcagcagc 1500
gcccaaccag tggcagcagt cgggaggtca cacggcatct gaacggctgc agcccaaccg 1560
cggtctggaa ccgggtctgc tacagtcgtc cttctctcgg gccccgaggt cgcccaggcg 1620
gctgcagtcc accgatgatc ttcgcgcaca gcatcaggag ggccagtatg cgcctccccc 1680
actctcgcct cgctcgcagt cgccggtaaa gacgcatgac catgacgacg acatgtttgc 1740
cgaactgcca ccacacgagc cctatcagta ccagcaagag cacgaccatc aagaccacca 1800
tcaagactac catcaacatc accgccatca caaccaccac catcacgaac gacagcccag 1860
cgagactgtc ctatcctcat acgagctcca gggtcatgtg gatggaggaa tccaaaactc 1920
atggctagat ccaattgacg agtcgggagg ctcaacagcg tcgtctgtac actcacgcac 1980
ctcttcgctt ggctaccgtc gacgccatat ccgggccgtg agcgggaaca ccgaggccga 2040
gtttgacacg gcgctggacg ctgctatcga ggctgcctac gacgacggct acgagcccat 2100
ggactctgta gactatggga ccattgatgc tggggggaca atagcatggc aggcgtattg 2160
cacaaggtgg agatggcgcg cgaacgagcg agacagacgg agcaggaagc ctatgacgag 2220
ctggccaacc tccgacaggc gcactcacag aatccgcagc accagcagga ggaggacagg 2280
tatactgccg agggattcta cgaggacgac tcgtctgaag aggaggagag actattggac 2340
gagattacac gcgactttgc cattgaggac tttaccatgg aaaacccgaa tggcacacag 2400
gtgtcagcta ggcagcagga tgcatggaac gaggacgaga cgaggccgga tttcatctcg 2460
ggcgtccgat ccttttctgc cctgtcgcag aggccaccca ttcctcaggc ctacgccgcc 2520
aacgcctcgc agccagcagc cccccctccg acatccgcat tgccagacct gccaccagga 2580
cgccctggtc aaaatccaaa gcaactcaag atcgagacgg caaacattgt acaaacccag 2640
aagtcggtct atgacgacga cgaaatctcc ccaagcacgc aagagccgcc gcccgagacg 2700
ctcgtccgga cggcgagcgc gcagcctgta a 2731
<210> 4
<211> 882
<212> PRT
<213> Hypocrea jecorina
<400> 4
Met Gln Gln Pro Pro Ser Leu Val Gly Asp Arg Ser Ile Thr Gly Leu
1 5 10 15
Gly Asp Ala Ala Ser Arg Pro Asn Leu Ser Ser Ser Ser Pro Thr Val
20 25 30
Thr Ser Ala Pro Ser Ala Pro Thr Ser Pro Pro Pro Arg Pro Pro Ile
35 40 45
Ser Leu Asn Pro Pro Ser Arg Glu Pro Pro Gly Val Glu Pro Val Leu
50 55 60
Arg Ile Thr Pro Val Pro Arg Ser Val Phe Ala Ser Val His Gln Pro
65 70 75 80
Arg Lys Ser Ser Leu Val Gln Thr Ser His Val Leu Pro Ser Pro Arg
85 90 95
Thr Ala Ala Ala Ala His His His His Pro Val Ser His Ser Ala Ser
100 105 110
Gly Ser Ser Gly Ser Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser
115 120 125
Gly Asn Leu Leu Arg Gln Thr His Arg Asp Thr Val His Pro Pro Val
130 135 140
Lys Arg Pro Ser Thr Pro Ser Ser His Pro Thr Arg Gly Ala Ser Thr
145 150 155 160
Gly Ala Ser Pro Gln Gln Gly Ala Ser Ser Arg Asn Arg Ser Ser Thr
165 170 175
Ser Pro Val Ser Ser Pro Ala Ser Arg Thr Pro Pro Tyr Ala Ser Arg
180 185 190
Gln Ala Ser Val Ser His Ser Arg Gln Gln His Asn His His His Gln
195 200 205
His Gln His Gln His Tyr His Ser His Thr Ser Ser Thr Thr Ser Arg
210 215 220
Ala Ser Ile Glu Ala Val Val Gly Ala Val Pro Asp Pro Ser Gly His
225 230 235 240
Arg Ala Pro Pro Lys Pro Arg Arg Pro Asp Arg Asn His Phe Gly Ala
245 250 255
Ser Asp Arg Ser Ala Thr Pro Thr Leu Ser His Phe Met Arg Ala Glu
260 265 270
Ser Ser Met Ser Met Arg His Tyr Glu Ser Gly Pro Leu Arg Ser Met
275 280 285
Ser Pro Asn Pro Tyr Gly Thr Pro Ala Ala Thr Thr Thr Ser Ser Thr
290 295 300
Ala Arg Met Pro His Glu Gln Ser His Asp Pro Tyr Ala Pro Arg Gly
305 310 315 320
His Ser Arg Asp His Ser Gly Lys Ser Ser Arg Asp Met Gly Lys Pro
325 330 335
Arg Ala Gln Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu
340 345 350
Gln Lys Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu
355 360 365
Gly Ala Arg Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val
370 375 380
Leu Asp Arg Thr Pro Gly Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile
385 390 395 400
His Gln Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro
405 410 415
Trp Gln Val Glu Thr Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu
420 425 430
Glu Tyr Ser Ala Ser Ile Phe Ile Pro Gln Asp Tyr Asp Met Gly Asp
435 440 445
Glu Ala Pro Arg Ile Glu Thr Ala Arg Val Val Ser Tyr Ile Ala Gly
450 455 460
Asp Asn Ala Ser Pro Phe Ala Ala Ala Pro Asn Gln Trp Gln Gln Ser
465 470 475 480
Gly Gly His Thr Ala Ser Glu Arg Leu Gln Pro Asn Arg Gly Leu Glu
485 490 495
Pro Gly Leu Leu Gln Ser Ser Phe Ser Arg Ala Pro Arg Ser Pro Arg
500 505 510
Arg Leu Gln Ser Thr Asp Asp Leu Arg Ala Gln His Gln Glu Gly Gln
515 520 525
Tyr Ala Pro Pro Pro Leu Ser Pro Arg Ser Gln Ser Pro Val Lys Thr
530 535 540
His Asp His Asp Asp Asp Met Phe Ala Glu Leu Pro Pro His Glu Pro
545 550 555 560
Tyr Gln Tyr Gln Gln Glu His Asp His Gln Asp His His Gln Asp Tyr
565 570 575
His Gln His His Arg His His Asn His His His His Glu Arg Gln Pro
580 585 590
Ser Glu Thr Val Leu Ser Ser Tyr Glu Leu Gln Gly His Val Asp Gly
595 600 605
Gly Ile Gln Asn Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser
610 615 620
Thr Ala Ser Ser Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg
625 630 635 640
Arg His Ile Arg Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr
645 650 655
Ala Leu Asp Ala Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro
660 665 670
Met Asp Ser Val Asp Tyr Gly Thr Ile Asp Ala Gly Gly Thr Ile Ala
675 680 685
Trp Gln Ala Tyr Cys Thr Arg Trp Arg Trp Arg Ala Asn Glu Arg Asp
690 695 700
Arg Arg Ser Arg Lys Pro Met Thr Ser Trp Pro Thr Ser Asp Arg Arg
705 710 715 720
Thr His Arg Ile Arg Ser Thr Ser Arg Arg Arg Thr Gly Ile Leu Pro
725 730 735
Arg Asp Ser Thr Arg Thr Thr Arg Leu Lys Arg Arg Arg Asp Tyr Trp
740 745 750
Thr Arg Leu His Ala Thr Leu Pro Leu Arg Thr Leu Pro Trp Lys Thr
755 760 765
Arg Met Ala His Arg Cys Gln Leu Gly Ser Arg Met His Gly Thr Arg
770 775 780
Thr Arg Arg Gly Arg Ile Ser Ser Arg Ala Ser Asp Pro Phe Leu Pro
785 790 795 800
Cys Arg Arg Gly His Pro Phe Leu Arg Pro Thr Pro Pro Thr Pro Arg
805 810 815
Ser Gln Gln Pro Pro Leu Arg His Pro His Cys Gln Thr Cys His Gln
820 825 830
Asp Ala Leu Val Lys Ile Gln Ser Asn Ser Arg Ser Arg Arg Gln Thr
835 840 845
Leu Tyr Lys Pro Arg Ser Arg Ser Met Thr Thr Thr Lys Ser Pro Gln
850 855 860
Ala Arg Lys Ser Arg Arg Pro Arg Arg Ser Ser Gly Arg Arg Ala Arg
865 870 875 880
Ser Leu
<210> 5
<211> 1158
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 5
ctagtgcatg cgcaaattta aagcgctgat gaggtcgccc aggcggctgc agtccaccga 60
tgatcttcgc gcacagcatc aggagggcca gtatgcgcct cccccactct cgcctcgctc 120
gcagtcgccg gtaaagacgc atgaccatga cgacgacatg tttgccgaac tgccaccaca 180
cgagccctat cagtaccagc aagagcacga ccatcaagac caccatcaag actaccatca 240
acatcaccgc catcacaacc accaccatca cgaacgacag cccagcgaga ctgtcctatc 300
ctcatacgag ctccagggtc atgtggatgg aggaatccaa aactcatggc tagatccaat 360
tgacgagtcg ggaggctcaa cagcgtcgtc tgtacactca cgcacctctt cgcttggcta 420
ccgtcgacgc catatccggg ccgtgagcgg gaacaccgag gccgagtttg acacggcgct 480
ggacgctgct atcgaggctg cctacgacga cggctacgag cccatggact ctgtagacta 540
tgggaccatt gatgctgggg ggacaatagc atggcaggcg tattgcacaa ggtcgagatg 600
gcgcgcgaac gagcgagaca gaccgagcag gaagcctatg acgagctggc caacctccga 660
caggcgcact cacagaatcc gcagcaccag caggaggagg acaggtatac tgccgaggga 720
ttctacgagg acgactcgtc tgaagaggag gagagactat tggacgagat tacacgcgac 780
tttgccattg aggactttac catggaaaac ccgaatggca cacaggtgtc agctaggcag 840
caggatgcat ggaacgagga cgagacgagg ccggatttca tctcgggcgt ccgatccttt 900
tctgccctgt cgcagaggcc acccattcct caggcctacg ccgccaacgc ctcgcagcca 960
gcagcccccc ctccgacatc cgcattgcca gacctgccac caggacgccc tggtcaaaat 1020
ccaaagcaac tcaagatcga gacggcaaac attgtacaaa cccagaagtc ggtctatgac 1080
gacgacgaaa tctccccaag cacgcaagag ccgccgcccg agacgctcat cgatcgcgcg 1140
cagatccata tatagggc 1158
<210> 6
<211> 408
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 6
gaccggccgc tagtctcccg ttatctcact agtggcccac gtggccaatt cctaaagaaa 60
cagcatgaaa tggtattatg taagagctat agtctaaagg cactctgctg gataaaaata 120
gtggctataa gtctgctgca aaactacccc caacctcgta ggtatataag tactgtttga 180
tggtagtcta tcggcaggcg tattgcacaa gggttttaga gctagagttc gtttcggctt 240
ttcctcggaa cccccagagg tcatcagttc gaatcgctaa cagaatagca agttaaaata 300
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt ttttttctct 360
taagcttggc actggccgtc gttttacaac gtcgtgactg ggaaaacc 408
<210> 7
<211> 408
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 7
gaccggccgc tagtctcccg ttatctcact agtggcccac gtggccaatt cctaaagaaa 60
cagcatgaaa tggtattatg taagagctat agtctaaagg cactctgctg gataaaaata 120
gtggctataa gtctgctgca aaactacccc caacctcgta ggtatataag tactgtttga 180
tggtagtcta tcgcgcgaac gagcgagaca gagttttaga gctagagttc gtttcggctt 240
ttcctcggaa cccccagagg tcatcagttc gaatcgctaa cagaatagca agttaaaata 300
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt ttttttctct 360
taagcttggc actggccgtc gttttacaac gtcgtgactg ggaaaacc 408
<210> 8
<211> 1310
<212> PRT
<213> Fusarium sp.
<400> 8
Met His Asp Gly Gln Ile Ser Ser Ser Pro Arg Gln Phe Leu Asn His
1 5 10 15
Asn His Asn His His His Asn Gln Arg Pro Ser Ala Ser Pro Ser Ser
20 25 30
Ala Val Thr Ala Thr Val Pro Pro Pro Trp Ala Leu Pro Ala Tyr Ala
35 40 45
Ser Ser Ala Ser Val Ser Thr Asp Ser Arg Pro Ala Thr Ala Thr Gly
50 55 60
Arg Ser His Tyr Tyr Pro His Arg Asp Pro Ser Arg Ser Ala Leu Ser
65 70 75 80
Pro Ser Ala Ser Pro Ser Leu Asn Thr His Pro His His Lys Gly Pro
85 90 95
Gly Pro Arg Leu Pro Arg Thr Ser Ser Leu Leu Pro Pro Pro His Ile
100 105 110
Glu Pro Ser Pro Arg Ala Val Thr Phe Gln Arg Ser Asp Arg Leu Ser
115 120 125
Pro Thr Pro Thr Pro Thr Pro Gly Ser Ser Ser Asn Gly Asn Gly Asn
130 135 140
Gly Asn Gly Asn Gly Ile Pro His Asn Ala Ala Glu Ser Ser Trp Leu
145 150 155 160
Leu Asn Arg Leu Ser Ser Ser Thr Val Ser Thr Asn Phe Ser Arg Val
165 170 175
Ser Ala Leu Pro Pro Arg Ala Asn His Thr Ser Ser Arg Leu Gly Lys
180 185 190
Ser Pro Ser Ile Asp Ala Thr Thr Phe Ile Asp Asn Ser Pro Pro Pro
195 200 205
Ser Lys Pro Ser Pro Arg Lys Leu Gln Lys Asn His Arg Pro Ser Thr
210 215 220
Ser Val Ser Asn Pro Asp Thr Phe Ile Phe Arg Pro Ser Glu Asp Arg
225 230 235 240
Thr Gln Leu Pro Gln Ser Leu Pro Leu Ile Val Thr Leu Ser Pro Leu
245 250 255
Glu Ala Pro Ala Ala Leu Ser Asp Ile Leu Asn Val Lys Ser Glu Gly
260 265 270
Ala Gly Pro Gly Ser Gly Thr Ser Glu Pro Gly Gln Ser Thr Gly Ala
275 280 285
Arg Gln Gly Gly Gln Ser Leu Lys Gln Phe Asp Asn Ser Asp Ser Pro
290 295 300
Ala Arg Ser Val Thr Ser Thr Pro Gly Ser Ala Arg Ser Met Ala Ala
305 310 315 320
Tyr Arg Pro Asn Met Gln Tyr Asp Gln Asp Gln Glu Ala Tyr Pro Pro
325 330 335
Gln Arg Gly His Ser Arg Ser Arg Ser Gly Lys Gly Ser Asn Asp Lys
340 345 350
Gly Arg Ala Lys Pro Pro Ser Gln Lys Ala Met Leu His Arg Ala Leu
355 360 365
Gln Lys Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Lys
370 375 380
Gly Ala Arg Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val
385 390 395 400
Leu Gln Lys Thr Thr Ala Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile
405 410 415
Arg Arg Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Met Ala Pro
420 425 430
Trp Gln Glu Glu Glu Thr Lys Ala Leu Pro Ala Arg Pro Glu Ser Leu
435 440 445
Ala Gln His Ser Glu Ser Glu Ser Val Leu Arg Leu Asp Asp Asp Asp
450 455 460
Asp Asp Glu Pro Asn Asp Thr Ala Val Phe Asp Thr Ala Thr Ala Ala
465 470 475 480
Arg Ile Asp Gly His Ser Pro Gln Pro Arg Ile Val Asn Ser Pro Pro
485 490 495
Arg Asp Asp Ser Gln Gly Tyr Arg Arg Arg Ser Ala Gln Asn Lys Pro
500 505 510
Lys Pro Ile Val Thr Ser Leu Thr Pro Glu Pro Gly Leu Leu Gln Ser
515 520 525
Ser Phe Ser Arg Ser Pro Val Arg Leu Arg Thr Pro Glu His Phe Leu
530 535 540
Pro Gln Arg Pro Ala Asp Pro Tyr Met Pro Ala Pro Leu Ser Pro Arg
545 550 555 560
Arg Pro Leu Ser Pro Ala Lys Glu Val Asp Asp Met Asp Glu Pro Val
565 570 575
Arg Thr Asp Phe Ser Met Ser His Asp Gln Gln Asn Asp His Ala Gln
580 585 590
Glu His Asn Val Pro Gln Thr His Phe Arg Glu Asp Ser Met Asn Ser
595 600 605
Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser Thr Ala Ser Ser Val
610 615 620
His Ser Arg Thr Ser Ser Leu Gly Phe Arg Arg Lys His Ile Arg Ser
625 630 635 640
Val Ser Gly Glu Thr Glu Ala Glu Phe Asp Thr Ala Leu Asp Ala Ala
645 650 655
Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro Met Ser Pro Ile Asp
660 665 670
Gln Arg Arg Thr Val Ser Val Asp Ala Gly Glu Glu Val Ile Ala Asn
675 680 685
Ala Met Arg Lys Val Glu Leu Ala Arg Gln Lys Val Arg Glu Thr Glu
690 695 700
Gln Glu Leu Tyr Glu Met Glu Arg Asp Asn Arg Ser Gln Pro Gln Tyr
705 710 715 720
Gln Ser Tyr Glu Tyr Gln Gly Thr Pro Asn Asp Phe Tyr Asn Asp Asn
725 730 735
Ser Ser Asp Glu Glu Glu Arg Ile Leu Asp Glu Ile Ala Arg Asp Tyr
740 745 750
Gly Leu Glu Ser Tyr Arg His Arg Pro Pro Pro Pro Arg Glu Ser Asp
755 760 765
Ser Ser Gly Val Thr Ser Arg Thr Trp His Ser Ser Gln Gly Ser Asn
770 775 780
Pro Pro Thr Gly Ala Thr Ser Leu Ser Thr Val Thr Glu Leu Pro Pro
785 790 795 800
Pro Leu Thr His Leu Thr His Gly Pro Ala Ala Pro Pro Pro Thr Gln
805 810 815
Ser Leu Pro Glu Leu Pro Gln Arg Pro Gly Ser Ser Ala Gln Ser Val
820 825 830
Arg Asn Arg Arg Leu Ser Gly Gln Asn Pro Lys Gln Leu Lys Ile Glu
835 840 845
Thr Ser Lys Leu Ala Leu Pro Met Gln Ser Tyr Ala Asp Ala Asn Gln
850 855 860
Ala Lys Ser Ala Pro Leu Ser Ser Gln Asn Val Asp Ala Thr Val Glu
865 870 875 880
Pro Asp Thr Lys Ala Ala Ser Ala Lys His Arg Gln Pro Ser Pro Pro
885 890 895
Leu Phe Glu Ala Ser Pro Thr Asp Met Thr Gly Ser Arg Pro Thr Pro
900 905 910
Ser Pro Phe Gly Gln Leu Gly Ser Glu Lys Gly Asp Asp Asp Ile Thr
915 920 925
Gly Ser Pro Asn Thr Arg Lys Leu Arg Lys Asn Phe Ser Ser Ser Ser
930 935 940
Leu Arg Ser Met Lys Ser Arg Asn Met Ser Leu Thr His Leu Glu Glu
945 950 955 960
Gly Ser Asp Leu Ser Pro Gly Thr Pro Gly Ser Asn Pro Phe Gly Ser
965 970 975
Leu Asn Ala Pro Ser Val Pro Ala Leu Pro Thr Pro Leu Ala Thr Ser
980 985 990
Phe Arg Asp Arg Ser Glu Thr Asn Ala Ala Gly Leu Ser Leu Phe Asp
995 1000 1005
Asp His Phe Tyr Ser Pro Thr Ser Pro Gly Ser Pro Asn Pro Leu Ile
1010 1015 1020
Ser Asp Pro Pro Ala Pro Leu Glu Pro Cys Pro Thr Asp Phe Met Leu
1025 1030 1035 1040
Arg Pro Phe Trp Leu Met Arg Cys Leu Tyr Gln Thr Leu Ala His Pro
1045 1050 1055
Arg Gly Gly Tyr Ile Ser Ser Lys Leu Phe Val Ser Arg Asp Val Trp
1060 1065 1070
Arg Val Lys Gly Val Lys Leu Lys Asn Ile Glu Asp Lys Val Ala Asn
1075 1080 1085
Cys Asp Phe Leu Thr Ala Ala Leu Leu Lys Ile Ala Arg Val Asp Thr
1090 1095 1100
Tyr Asp Ala Asp Ala Val Leu Glu Glu Met Gln Ser Leu Glu Gly Ile
1105 1110 1115 1120
Leu Glu Gln Val Gln Thr Ala Leu Ser Arg Lys Leu Gly Asn Glu Val
1125 1130 1135
Gly Val His Gly Ser Gly Ala Leu Phe Lys Asp Ala Ser Thr Gly Asp
1140 1145 1150
Gly Asp Ala Ala Thr Gly Met Pro Arg Ser Ala Ser Val Ser Gly Lys
1155 1160 1165
Ser Ser Phe Ser Trp Arg Arg Leu Arg Ser Lys Asn Ser Ala Val Gly
1170 1175 1180
Leu Gly Gly Ser Tyr Met Ser Arg Ile Asn Thr Glu Thr Ser Lys Glu
1185 1190 1195 1200
Ile Pro Ser Ile Ala Ser Leu Pro Met Thr Pro Thr Pro Thr Asn Arg
1205 1210 1215
Pro Pro Lys Arg Asp Leu Ala Gln Val Gln Phe Thr Gly Pro Asn Ala
1220 1225 1230
Met Tyr Met Ser Ser Leu Ala Arg Leu Phe Asp Ala Ala Gln Ala Ile
1235 1240 1245
Asp Gln Ile Ala Arg Gln Val Glu Asp Pro Gly Leu Arg His Ala Asp
1250 1255 1260
Lys Thr Gln Val Gly Leu Glu Leu Cys Thr Arg His Ala Ala Glu Phe
1265 1270 1275 1280
Phe Gly Phe Tyr Val Cys Arg Phe Val Leu Ser Asp Leu Gly Leu Leu
1285 1290 1295
Leu Asp Lys Tyr Leu Lys Arg Gly Ser Glu Trp Val Leu Thr
1300 1305 1310
<210> 9
<211> 1370
<212> PRT
<213> Neurospora sp.
<400> 9
Met Pro Leu Pro His Phe Thr Ile Ala Pro Pro Pro Pro Ala Pro Pro
1 5 10 15
Ala Pro Ala Thr Ser Thr Ser Thr Ser Ser Lys Ile Pro Thr Ser Ser
20 25 30
Asn Asn Pro Gly Ser Ser Ala Ser Ala Thr Asp Leu Ser Ser Ala Arg
35 40 45
Thr Pro Pro Ala Thr Val Thr Thr Phe Ala Gly Ser Ala Ser Tyr Ala
50 55 60
Ser Ser Pro Ser Pro Arg Thr Arg Leu Pro Asp Arg Asp Phe Ile Ser
65 70 75 80
Pro Gly Leu Arg Asn Pro Tyr Pro Gln Gly Gln Gln Arg Pro Ser Arg
85 90 95
Pro Pro Pro Pro Pro Pro Arg Gln Arg Gln Gln Gln Gln Gln Gln Pro
100 105 110
Gln Gln His Ser Glu Arg Phe Gly Thr Val Thr Val Pro Thr Ala Ala
115 120 125
Glu His Asn Gln Ser Thr Phe Ser Pro Phe Pro Pro Asp Arg Leu Pro
130 135 140
Pro Lys Val Pro Thr Asp Ser Arg Pro Ser Gln Asp Leu Leu Glu Ser
145 150 155 160
Phe Asn Glu Pro Leu Leu His Gly Pro Ala Thr Pro Asp Ser Thr Lys
165 170 175
Gly Leu Lys Pro Pro Ser His Lys Arg Gly His Ser Arg Ser Gly Ser
180 185 190
Ser Ser Ser Ile Gly Asp Arg Leu Arg Asn Phe Asn Arg Trp Ser Val
195 200 205
Ser Ser Ala Ser Ser Lys Gly Ser Asn Gly Gly Gly Ser Ser Trp Arg
210 215 220
Ile Gly Trp Asp Ser Gly Lys Glu Arg Glu Asp Ser Pro Gly Gln Lys
225 230 235 240
Ser His Lys Arg Arg Pro Ser Thr Ser Glu Ile Ser Pro Arg Ser Val
245 250 255
Ser His Leu Arg Gly Arg Ser Asp Ser Pro Leu Arg His Pro Ile Pro
260 265 270
Pro Leu Pro Ser Leu Pro Arg Ile Ser Thr Gly Pro Ser Leu Val Glu
275 280 285
Ala Phe Arg His Gln Ala Ser Glu Ile Gly Lys Gln Ser Pro Ala Pro
290 295 300
Pro Arg Arg Tyr Tyr Leu Arg Pro Pro Pro Asp Asp Asn Ala Ala Phe
305 310 315 320
Trp Asp Gly Ala Pro Gln Ile Pro Glu Asp Thr Pro Gly Ser Leu Pro
325 330 335
Arg Ser His Gln Ala Ala Gly Leu Leu Leu Pro Pro Ala Glu Leu Ala
340 345 350
Pro Asp His Met Met Pro Gln Tyr Thr Gln Asn Gly Asp Pro Arg Gly
355 360 365
Gln Ser Arg Gly Arg Ser His Gly Ala Lys Ser Ser Thr Asp Ser Thr
370 375 380
Ala Ser Thr Arg Asn Arg Asp Arg Gln Arg His Arg Ser Asp Lys Lys
385 390 395 400
Ala Met Leu Ser Glu Ala Leu Ser Lys Ala Asn Thr Ala Val Gln Leu
405 410 415
Asp Asn Gly Gln Asp Phe Glu Ala Ala Arg Arg Ala Tyr Thr Glu Ala
420 425 430
Cys His Leu Leu Gln Glu Val Leu Gln Arg Thr Ser Val Glu Val Asp
435 440 445
Arg Arg Lys Leu Glu Ala Ile His Gln Thr Tyr Val Gly Arg Ile Asp
450 455 460
Glu Leu Asp Glu Met Leu Gly Asp Ser Leu Asp Glu Lys Ala Leu Pro
465 470 475 480
Glu Glu Pro Glu Ser Tyr Asp Glu Arg Gly Tyr Met Arg Thr Gln Ala
485 490 495
Tyr Asn Gly Glu Val Ser Asp Asp Glu Pro Met Leu Ser Thr Tyr Thr
500 505 510
Arg Glu Arg Ser Arg Thr Arg Glu Pro Ser Leu Ser Val Gln Thr Gln
515 520 525
Phe Arg Arg Gln Pro Pro Ser Gly Arg Pro Pro Ala Pro Pro Thr Leu
530 535 540
Thr Leu Gln Thr Pro Gly Gly Ser Asn Gly Pro Thr Ser Tyr Leu Ser
545 550 555 560
Glu Gln Tyr Ser Leu Gln Ser Ser Phe Ser Lys Ala Arg Phe Glu Lys
565 570 575
Ala Pro Met Asp Asn Ala Tyr Met Pro Pro Pro Leu Leu Pro Arg Arg
580 585 590
Pro Leu Ser Pro Ala Gln Pro Pro Pro Pro Pro Pro Ala Pro Glu Lys
595 600 605
Asp Ala Pro Arg Gln Gln Val Phe Arg Pro Asp Tyr Ser Met Ser Gly
610 615 620
Ala Gln Ala Thr Ser Arg Asn Tyr Lys Thr Asn Gly Gly His Gln Arg
625 630 635 640
Asp Pro Ser His Glu Ser Ile Ser Trp Leu Asp Pro Ile Glu Glu Ser
645 650 655
Gly Gly Ser Ser Ala Ser Ser Val His Ser Arg Ser Ser Ser Thr Gly
660 665 670
Ile Arg Arg Lys His Ile Arg Ala Ala Ser Gly Asp Thr Glu Ala Glu
675 680 685
Phe Asp Ala Ala Leu Asp Asp Ala Ile Glu Ala Ala Tyr Asp Glu Gly
690 695 700
Phe Glu Pro Glu Asp Gln Tyr Tyr Thr Asp Gly His Asp Ala Val Thr
705 710 715 720
Gly Ser Ser Tyr Pro Arg Asp Gln Val Pro Asp Glu Gly Met Asp Ala
725 730 735
Leu Glu Leu Ala Asn Glu Arg Glu Arg Lys Leu Arg Leu Gln Gln His
740 745 750
Leu Glu Asp Glu Glu Tyr Arg Lys Arg Gly Trp Thr Gly His Asp Asp
755 760 765
Phe Tyr Asp Glu Gly His Asp Ser Glu Glu Glu Glu Arg Phe Leu Glu
770 775 780
Glu Met Thr Lys Gly Tyr Gln Ile Glu Asp Phe Ala Phe Gly Pro Asn
785 790 795 800
Asn Lys Gln Ser Ile Pro Arg Glu Ser Asp Ser Ser Gly Val Thr Asn
805 810 815
Arg Thr Trp Asn Ser Ser Thr Gly Ser Asn Gln Asn Thr Ser Thr Thr
820 825 830
Leu Leu Ser Thr Val Ser Glu Ser Pro Thr His Pro Glu Pro Lys Gly
835 840 845
Pro Leu Pro Pro Leu Pro Pro Pro Pro Ala Gly Ala Leu Pro Gln Leu
850 855 860
Pro Asp Arg Pro Pro Gly Thr Ser Gly Ser Gly Ala Ser Asn Arg Ser
865 870 875 880
Val Arg Gln Arg Arg Leu Ser Gly Gln Asn Leu Lys Gln Leu Lys Ile
885 890 895
Glu Thr Thr Lys Leu Ala Gln Pro Gly Pro Thr Thr Ala Gly Pro Ala
900 905 910
Phe Pro Pro Gln Pro Ala Arg Ser His Asn Tyr Ile Ala Gln Gln Arg
915 920 925
Gln Ala Leu Ser Ala Gly Pro His Arg Asn Ala Asn Pro Leu Ala Ala
930 935 940
Arg Arg Val Val Ser Pro Ser Met Gly Glu Gly Gly Ala Pro Pro Leu
945 950 955 960
Pro Ala His Leu Gln Asp Asp Tyr Pro Pro Arg Ala Gly Ser Pro Ser
965 970 975
Val Gly Arg Pro Ser Leu Lys Lys Thr Phe Ser Ser Ser Ser Leu Arg
980 985 990
Ser Ala His Arg Lys Leu Ser Val Ser His Asn Asp Asp Val Phe Asp
995 1000 1005
Met Ser Pro Gly Thr Pro Val Ser Asn Gln Phe Gly Ile Ser Gly Ser
1010 1015 1020
Thr Thr Arg Leu Pro Ser Ile Pro Ser Met Pro Thr Pro Ile Ala Gly
1025 1030 1035 1040
Ser Phe Arg Glu Arg Ala Asp Thr Val Val Gly Thr Ala Gly Met Tyr
1045 1050 1055
Leu Phe Asp Ala Glu Phe His Ser Ala Asn Asp Pro Gly Ser Pro Asn
1060 1065 1070
Gly Thr Leu Thr Asp Ala Pro Ala Pro Leu Glu Pro Cys Pro Ser Asp
1075 1080 1085
Val Leu Leu Arg Pro Phe Trp Leu Met Arg Cys Leu Tyr Gln Thr Leu
1090 1095 1100
Cys His Pro Arg Gly Gly Tyr Ile Ser Asn Lys Leu Phe Val Pro Arg
1105 1110 1115 1120
Asp Val Trp Arg Val Lys Gly Val Lys Leu Lys Tyr Val Glu Glu Lys
1125 1130 1135
Ile Ser Gln Cys Asp Leu Met Thr Ala Ala Leu Gln Lys Leu Ala Arg
1140 1145 1150
Val Asp Thr Cys Asp Ala Asp Ala Val Leu Glu Glu Met Gln Ala Leu
1155 1160 1165
Glu Thr Val Ile Glu Ser Val Glu Lys Phe Leu Val Lys Lys Leu Gly
1170 1175 1180
Ala Ser Glu Val Gly Pro His Ala Thr Ser Phe Lys Asp Pro Val His
1185 1190 1195 1200
Ala Glu Asp Gly Ser Leu Pro Arg Ser Ala Ser Val Ser Ala Lys Thr
1205 1210 1215
Ser Ala Phe Ser Trp Arg Arg Leu Arg Ser Lys Asn Ser Ser Ala Asn
1220 1225 1230
Leu Thr Ser Ala Gly Lys Gly Ser Ser Ser Ala Gly Gly Thr Ser Gly
1235 1240 1245
Asn Val Ala Ser Thr Pro Ile Glu Gly Ala Gly Lys Asp Ile Ile Cys
1250 1255 1260
Pro Ser Leu Pro Met Thr Thr His Pro Thr Asn Arg Pro Met Lys Arg
1265 1270 1275 1280
Asp Val Gly Asn Val Leu Phe Gln Gly Pro Asn Ala Asn Tyr Met Ser
1285 1290 1295
Ser Leu Ala Arg Leu Phe Asp Ala Ala Gln Leu Val Asp Gln Ile Ala
1300 1305 1310
Arg Gln Val Glu Asp Pro Gly Leu Arg His Ala Asp Lys Thr Gln Val
1315 1320 1325
Gly Leu Glu Leu Ser Thr Arg His Ala Ala Glu Phe Phe Ala Leu Tyr
1330 1335 1340
Ile Cys Arg Phe Val Leu Ser Asp Leu Thr Leu Met Leu Asp Lys Phe
1345 1350 1355 1360
Leu Lys Arg Gly Ser Glu Trp Val Leu Val
1365 1370
<210> 10
<211> 805
<212> PRT
<213> Myceliophthora sp.
<400> 10
Met Asp Asn Ala Tyr Met Pro Pro Pro Leu Ser Pro Arg Arg Pro Gly
1 5 10 15
Ser Pro Ala Arg Pro Ser Ser Pro Pro Val Glu Tyr Glu Ser Pro Arg
20 25 30
Arg Pro Pro Pro Asp Arg Pro Asn Ala Gln Thr Glu Ala Pro Ala Ser
35 40 45
Ser Ser Gly His Gln Arg Ala Asn Ser His Glu Ser Val Ser Trp Leu
50 55 60
Asp Pro Ile Asp Glu Ser Asp Arg Ser Ser Val Thr Ser Val His Ser
65 70 75 80
Arg Ser Ser Ser Arg Val Val Arg Lys His Ile Arg Ala Pro Ser Gly
85 90 95
Ala Thr Glu Ala Glu Phe Asp Ala Ala Leu Asp Asp Ala Ile Glu Ala
100 105 110
Ala Tyr Asp Asp Gly Tyr Glu Pro Glu Ser His Tyr Pro Gly His Ser
115 120 125
Tyr His Asp Ala Gln Val Asp Pro Ile Ala Asp Lys Leu Arg Arg Val
130 135 140
Glu Met Ala Arg Glu Leu Val Arg Glu Ser Glu Arg Glu Ala Leu Glu
145 150 155 160
Leu Ala Thr Glu Arg Glu Gln Arg Leu Arg Leu Gln Gln Gln Leu Glu
165 170 175
Asp Glu Glu Tyr Arg Lys Arg Val Thr Ala Gly Glu Asp Phe Tyr Asp
180 185 190
Gly Asn Asp Ser Glu Glu Glu Glu Arg Leu Leu Glu Glu Ala Pro Arg
195 200 205
Thr Asp Gly Met Asp Asp Phe Ala Phe Gly Val Gln Gln Arg Pro Pro
210 215 220
Val Pro Arg Glu Ser Asp Ser Ser Gly Met Thr Gly Arg Thr Trp His
225 230 235 240
Ser Ser Met Gly Ser Asn Pro Ala Thr Gly Ala Thr Leu Thr Pro Val
245 250 255
Ser Glu Asp Gly Thr His Pro His Arg Ser Gly Pro Leu Pro Pro Leu
260 265 270
Pro Pro Gln Ala Ala Ala Gln Val Pro Pro Gln Pro Gly Ser Ala Gly
275 280 285
Ser Gln Ser Ser Gly Gln Ser Val Arg Asn Trp Arg Leu Ser Gly Gln
290 295 300
Asn Pro Lys Gly Leu Lys Ile Glu Thr Asn Lys Leu Ala Ala Thr Ala
305 310 315 320
Ala Pro Ala Thr Ala Gly Pro Thr Phe Pro Ser Gln Pro Lys Thr Gly
325 330 335
Ser Tyr Ile Val Gln Gln Arg Gln Ala Leu Ser Ala Gly Pro Asn Arg
340 345 350
Ala Leu Gly Pro Pro Thr Ser Arg Pro Gly Pro Ser Pro Val Pro Gly
355 360 365
Thr Leu Asp Glu Glu Pro Glu Asp Ala Pro Pro Arg Pro Thr Ala Leu
370 375 380
Ser His Asp Glu Tyr Pro Arg Val Gly Thr Pro Ser Val Val Arg Ala
385 390 395 400
Pro Asn Leu Arg Lys Asn Tyr Ser Ser Ser Ser Leu Lys Ser Leu Lys
405 410 415
Thr Arg Asn Leu Ser Ile Ser His Leu Asp Glu Gly Met Ser Asp His
420 425 430
Ser Pro Gly Thr Pro Leu Ser Ser Gln Phe Gly Ala Arg Leu Pro Ala
435 440 445
Val Pro Ser Leu Pro Ala Gly Ile Leu Ser Asn His Leu Lys Asp Arg
450 455 460
Ala Asn Ser Thr Thr Pro Gly Gly Leu His Leu Phe Glu Asn Asp Phe
465 470 475 480
His Ser Ser Glu Arg Pro Gly Ser Pro Asp Pro Leu Thr Ala Asp Ala
485 490 495
Pro Ala Pro Leu Glu Pro Cys Pro Thr Asp Val Met Leu Arg Pro Phe
500 505 510
Trp Leu Met Arg Ala Leu Tyr Gln Thr Leu Cys His Pro Arg Gly Gly
515 520 525
Tyr Leu Ser Asn Arg Leu Phe Val Pro Arg Asp Val Trp Arg Val Lys
530 535 540
Gly Val Lys Leu Lys Ala Val Glu Asp Lys Ile Ala Asn Cys Asp Leu
545 550 555 560
Leu Thr Ala Ala Leu Gln Lys Leu Ala Arg Val Asp Thr Cys Asp Ala
565 570 575
Asp Ala Val Leu Glu Glu Met Gln Ala Leu Glu Gly Val Leu Glu His
580 585 590
Val Gln Ala Thr Leu Ser Arg Lys Leu Gly Ser Glu Val Gly Val Gln
595 600 605
Gly Ala Ser Ser Met Phe Lys Asp Ala Ala Ala Ala Ala Ala Ala Ala
610 615 620
Ala Ala Gly Asp Ala Ala Ala Ala Gly Gly Asp Ala Ala Ala Met Pro
625 630 635 640
Arg Ser Ala Ser Val Ala Gly Lys Ala Ser Ser Phe Ser Trp Arg Arg
645 650 655
Leu Arg Ser Lys Asn Ser Ser Ala Asn Leu Pro Ala Leu Ala Ala Ser
660 665 670
Gly Tyr Gly Asn Lys Gly Gly Asn Gly Ala Ala Ala Ser Thr Thr Asn
675 680 685
Leu Ser Glu Gly Leu Gly Lys Asp Ala Thr Leu Ala Ser Leu Pro Met
690 695 700
Thr Thr His Pro Thr Ser Arg Pro Thr Lys Arg Asp Ile Asn Ser Val
705 710 715 720
Ser Phe Thr Gly Pro Asn Ala Asn Tyr Met Ser Ser Leu Ala Arg Leu
725 730 735
Phe Asp Ala Ala Gln Thr Val Asp Gln Ile Ala Arg Gln Val Glu Asp
740 745 750
Pro Gly Leu Arg His Ala Asp Lys Thr Gln Val Gly Leu Glu Leu Cys
755 760 765
Ala Arg His Ala Ala Glu Phe Phe Ala Phe Tyr Ile Cys Arg Phe Ala
770 775 780
Leu Ser Asp Leu Thr Leu Leu Met Asp Lys Phe Val Lys Arg Gly Ser
785 790 795 800
Glu Trp Val Leu Ala
805
<210> 11
<211> 1004
<212> PRT
<213> Talaroymyces sp.
<400> 11
Met Glu Asp Pro Val Asn Ile Ser Ser Ser Tyr Ser Gly Glu His Ser
1 5 10 15
Ala Arg His Asp His Glu Arg Thr Glu Ser Gly Ser Thr Ser Pro Gln
20 25 30
Arg Arg Arg Pro Arg Gly Ser Ser Gln Lys Ala Met Leu Ser Lys Ala
35 40 45
Leu Ala Lys Ala Asn Thr Ala Val Leu Leu Asp Asn Ala Glu Asn Phe
50 55 60
Glu Gly Ala Ile Glu Ala Tyr Gln Asp Ala Cys Glu Leu Leu Gln His
65 70 75 80
Val Met Leu Arg Ser Asn Gly Gly Asp Val Glu Lys Tyr Lys Leu Leu
85 90 95
Glu Ile Arg Lys Thr Tyr Leu Asn Arg Ile Gln Glu Leu Leu Arg Ile
100 105 110
Gln Leu Pro Ser Asn Leu Lys Lys Asp Lys Ala Leu Pro Glu Arg Pro
115 120 125
Pro Ser Gly Arg Ser Ala Thr Pro Gln Glu Asp Glu Pro Pro Ile Glu
130 135 140
Gln Asp Tyr Thr Asp Glu Asp Gly Ala Glu Glu Tyr Phe Ala Arg Gln
145 150 155 160
Asn Ala Glu Asp Asp Val Pro Pro Val Pro Ser Leu Asn Thr Val Arg
165 170 175
Leu Pro Ser Ile Ser Gly Gln Asp Leu Asn Phe Ser Phe Glu Ala Ser
180 185 190
Lys Thr Asp Ile Gly Gly Ala Asn Ser Arg Glu Ser Glu Ala Val Ala
195 200 205
Gln Gly His Ser Ser Pro Ser Pro Thr Leu Gln Phe Val Ser Asp Ser
210 215 220
Ala Asp His Gln Gly Asp Thr Glu Thr Arg Ser Ser Thr Ala His Ala
225 230 235 240
Ser His Ser Ser Asp Gly Gln Val Pro Val Asn Asp Asn Gln Ser Thr
245 250 255
Ser Trp Leu Asp Thr Ile Asp Glu Ser Gly Ala Ser Ser Pro Val Ser
260 265 270
Thr Asn Thr Lys Leu Ser Leu Tyr Leu Gly Gly Thr His Ser His His
275 280 285
Ala Ser Asn Gly Thr Glu Ala Glu Phe Asp Ala Ala Leu Asp Ala Ala
290 295 300
Val Glu Ala Ala Tyr Asp Glu Gly Leu Glu Pro Ala Leu Asn Glu Gln
305 310 315 320
Glu Gly Phe Tyr Asp Asp Asp Asp Asp Asp Tyr Glu Asp His Arg Asp
325 330 335
Asp Asp Tyr Asp His Asp Asp Val Val Ser Asn Ala Arg Arg Asn Ile
340 345 350
Glu Ile Ala Lys Gln Arg Val Arg Glu Ala Glu Arg Glu Ala Gln Ala
355 360 365
Val Met Ala Arg Gly Leu Gln Gln Arg Leu Met Met Gln Asp Glu Asn
370 375 380
Val Ala Val Ser Thr Tyr Asn Val Asp Ala Asp Tyr Ile Asp Glu Glu
385 390 395 400
Ala Glu Glu Glu Glu Arg Leu Leu Glu Glu Met Thr Lys Gly Tyr Val
405 410 415
Met Asp Asp Phe Glu Phe Asn Leu His Thr Lys Thr Ala Leu Pro Arg
420 425 430
Gln Ser Asp Ser Ser Thr Val Ser Gly Arg Thr Trp Gly Ser Ser Ile
435 440 445
Thr Ser Thr Ser Ala Asn Ser Ala Thr Ala Gly Thr Ser Leu Ser Thr
450 455 460
Leu Ala Glu Glu Gly Ile Leu Thr Asp Ala Thr Met Pro Ser Lys Arg
465 470 475 480
Leu Pro Pro Val Pro Lys Ile Pro Thr Gly Ser Thr Gln Gln Pro Ile
485 490 495
Pro Pro Asn Met Ser Pro Ser Ala Gly Val Arg Ala Arg Arg Phe Ser
500 505 510
Gly Ser Asn Thr Lys Gln Leu Lys Ile Asp Thr Lys Arg Val Ala Ala
515 520 525
Gly Tyr Glu Pro Thr Lys Lys Glu Pro Phe Ser Ala Gln Pro Ala Gly
530 535 540
Pro Pro Ser Pro Val Leu Leu Pro Glu Pro Lys Thr Ser Leu Pro Ile
545 550 555 560
Leu Thr Ser Ser Met Ser Lys Pro Leu Pro Thr Gly Pro Ser Glu Lys
565 570 575
Lys Gly Ser Phe Asp Val Ser Ala Leu Gly Gln Arg Ser Ser Ser Leu
580 585 590
Thr Arg Ile Pro Thr Leu Glu Gly Asp Ser Val Ala Arg Ser Ala Gln
595 600 605
Ser Ser Pro Pro Arg Thr Ile Ser Lys Ile Thr Ser Ala Pro Gly Met
610 615 620
Leu Arg Lys Asn Thr Ser Ser Ser Ser Leu Ala Gly Met Arg Ala Arg
625 630 635 640
Asn Met Ser Met Ser Thr Pro Asp Ile Asn Glu Ser Pro Asn Thr Pro
645 650 655
Ser Ser Ser Val Phe Pro Ala Phe Asp Phe Gln Arg Gln Leu Ala Asn
660 665 670
Gly Leu Val Pro Ala Met Pro Thr Pro Ser Gly Ala Ser Phe Pro Leu
675 680 685
Met Thr Ser Lys Ser Leu His Leu Phe Asp Asn Asp Ile His Ser Pro
690 695 700
Thr Thr Pro Gly Ser Pro Ser Ser Thr Val Thr Asn Ala Pro Ile Pro
705 710 715 720
Leu Glu Pro Cys Pro Glu Ser Phe Leu Leu Arg Pro Phe Trp Leu Met
725 730 735
Arg Cys Leu Tyr Gln Thr Ile Ala His Pro Arg Gly Gly Tyr Leu Ser
740 745 750
Thr Lys Leu Phe Ile Pro Arg Glu Val Trp His Val Lys Asn Val Arg
755 760 765
Ile Lys Ala Met Glu Asp Lys Ile Ser Leu Cys Asp Leu Leu Thr Ala
770 775 780
Ala Leu Leu Lys Val Ala Gln Val Asp Thr Tyr Asp Ala Asp Ala Val
785 790 795 800
Leu Glu Glu Met Gln Thr Phe Glu Asn Ile Leu Asp Gln Ala Gln Thr
805 810 815
Thr Phe Ala Lys Lys Leu Gly Asn Glu Val Gly Val Gln Gly Ala Leu
820 825 830
Pro Leu Phe Lys Asn Ala Asn Asn Ser Asp Glu Ser Pro Ile Ser Thr
835 840 845
Glu Asn Met Ala Ser Arg Ser Ser Ser Gln Ser Ser Arg Ser Val Leu
850 855 860
Thr Ser Trp Arg Lys Leu Arg Ser Lys Ser Ser Ala Ala Pro Ser Thr
865 870 875 880
Ser Thr Ala Pro Ser Thr Tyr Arg Asp Ser Gly Lys Gly Gly Leu Ser
885 890 895
Met Ser Thr Leu Pro Met Thr Ala Ser Pro Pro Ser Gly Arg Phe Thr
900 905 910
Lys Arg Asp Val Met Gln Leu Gln Leu Ser Gly Pro Asn Ala Asn Tyr
915 920 925
Met Gly Ala Leu Ala Arg Leu Phe Asp Ala Ala Gln Val Leu Asp Gln
930 935 940
Ile Ala Arg Gln Val Glu Asp Pro Gly Leu Lys His Ser Ser Pro Thr
945 950 955 960
His Val Gly Leu Glu Leu Ser Thr Arg His Ala Ala Glu Phe Phe Gly
965 970 975
Phe Tyr Ile Cys Arg Phe Ala Leu Asn Asp Val Gly Leu Leu Leu Asp
980 985 990
Lys Tyr Ile Lys Arg Gly Thr Glu Trp Val Leu Val
995 1000
<210> 12
<211> 1215
<212> PRT
<213> Aspergillus sp.
<400> 12
Met Ala His Asn Leu Thr Ser Glu Gly His Gly Arg Ser Ser Arg Pro
1 5 10 15
Met Ser Pro Glu Tyr Pro Phe Thr Ala Asp Thr Ala Ala Pro Arg Leu
20 25 30
Ser Arg Ala Asn Ser Trp Asn Arg Phe Lys Lys Lys Gly Ser Asp Ser
35 40 45
Thr Glu Leu Ala Ser Arg Phe Gly Ala Val Thr Pro Thr Arg Pro Glu
50 55 60
Leu Val Ser Glu Leu Ile Thr Gly Ser Pro Ser Thr Ser Pro Gly Asp
65 70 75 80
His Ile Gln Glu Gly Leu Gly Ser Leu Asn Arg Trp Ser Gln Ser Thr
85 90 95
Ser Ser Ser Lys Gly Ser Pro Lys Tyr Asp Ser Tyr His Lys Gly Ile
100 105 110
Pro Phe Lys Ala Ser Val Asp His Asp Tyr Thr Ser Pro Lys Ala Arg
115 120 125
Ala Ser Pro Glu Arg Asn Ala Ile Ser Gly Leu Ser Pro Leu Val Ala
130 135 140
Ala Pro Thr Asn Asn Glu Ser Pro Leu Gln Gly His His Ser Ser Asp
145 150 155 160
Ser Ile Ala Thr Gly His Tyr Met Arg Val Leu Glu Leu Gly Asp His
165 170 175
Ser Asn Phe Ser Ala Ser Ser Thr Asn Ala Val Asp Pro Ala Ser Ser
180 185 190
His Gln Asp His Leu Pro Leu Gly Ser Ser Ser Ile Ala Ala Ser Leu
195 200 205
Phe Gln Asn Pro Trp Ser Arg Ser Gly Ala Asp Ala Gln Ala Val Asn
210 215 220
Gln Asn Ser Gln Met Leu Thr Gly Arg Glu Gln His His Gly Lys Arg
225 230 235 240
Arg Arg Gly His Ser Gln Lys Ala Met Leu Ser Lys Ala Leu Gln Lys
245 250 255
Ala Asn Thr Ala Val Leu Leu Asp Asn Ala Ala Asn Phe Glu Gly Ala
260 265 270
Met Glu Ala Tyr Asn Asp Ala Cys Gln Leu Leu Gln Leu Val Met Leu
275 280 285
Arg Ser Ser Gly Gly Glu Asp Glu Lys Ser Lys Leu Gln Glu Ile Arg
290 295 300
Asp Thr Tyr Met Ile Arg Val Thr Glu Leu Gln Arg Met Asp Phe Ser
305 310 315 320
Phe Thr Glu Pro Asn Ser Lys Ala Leu Pro Glu Arg Pro Leu Ser Gln
325 330 335
Glu Ser Tyr Ser Glu Met Phe Gln Ser Ile Glu Glu Asp Glu Asn Glu
340 345 350
Pro Ser Leu Asn Glu Ser Val Asn Ser Leu Arg Arg Ser Ser Asp Asp
355 360 365
His Gln Pro Val Leu Asn Glu Ala Asn Val Leu Ala Ser Asp Arg Val
370 375 380
Pro Val Arg Arg Gln Ser Leu Leu Pro Ser Ala Ile Asp Asp Asp Leu
385 390 395 400
Cys Cys Leu Thr Leu Ser Thr Ser Thr Thr Lys Gln Asn Ser Leu Ser
405 410 415
Gln Thr Glu Ser Phe Thr Ala Ser Arg Asp Gly His Leu Glu Met Ala
420 425 430
Met His Ser Glu Ser Gly Gln Ala Ser Thr Ala Leu Ser Leu Asp Asp
435 440 445
Asp Ser Ala His His Leu Arg Tyr Asn Asp Trp Ala Leu Leu Ser Thr
450 455 460
His Ala Lys Asp Ala Tyr Glu Ser Thr Ser Trp Leu Asp Thr Ile Asp
465 470 475 480
Glu Ser Gly Ala Ser Ser Pro Ala Ser Thr Arg Ser Lys Val Ser Ser
485 490 495
Leu Tyr Leu Arg His Gly Gly Ser His His Leu Ser His Gly Thr Glu
500 505 510
Ala Glu Phe Asp Ala Ala Leu Asp Ala Ala Val Glu Ala Ala Tyr Asp
515 520 525
Glu Gly Phe Glu Pro Val Thr Glu Pro Asn Glu Gln Tyr Asn Gly Gly
530 535 540
Ile Asp Asn Asp Asp Asp Ile Val Ala Asn Ala Arg Arg Asn Ile Glu
545 550 555 560
Leu Ala Lys Gln Lys Val Arg Glu Ala Glu Arg Glu Ala Gln Val Ala
565 570 575
Met Ala Arg Gly Arg Glu Val Arg Asn Leu Gln Gln Pro Ser Ile Ile
580 585 590
Asp His Ser His Gly Val Gly Leu Asp Tyr Leu Asp Glu Glu Ala Glu
595 600 605
Glu Glu Glu Arg Leu Leu Glu Glu Met Thr Arg Gly Tyr Ile Met Asp
610 615 620
Asp Phe Asn Phe Asp Leu Gln Ser Lys Ser Ala Leu Pro Arg Gln Ser
625 630 635 640
Asp Ser Ser Ser Phe Ser Gly Arg Ala Trp Glu Ser Ser Ala Val Ser
645 650 655
Asn Thr Thr Thr Thr Gly Val Met Leu Ser Pro Leu Val Glu Ala Ser
660 665 670
Ala Leu Pro Glu Val Ser Ala Met Thr Lys Gln Val Ala Glu Pro Leu
675 680 685
Pro Thr Gln Ala Asn Gly Pro Ala Val Leu Pro Lys Gln Asn Pro Ala
690 695 700
Pro Thr Pro Gly Pro Ser Val Arg Ala Arg Arg Met Ser Gly Gln Arg
705 710 715 720
Thr Thr Glu Leu Lys Ile Glu Thr Lys Pro Arg Leu Gly Ala Asp Ser
725 730 735
Asp Ile Ser Ser Gln Gly Gln Ser Ser Glu Pro Ala Ala Leu Ser Pro
740 745 750
Pro Pro Pro Leu Pro Lys Asp Glu Pro Ser Met Asn Phe Pro Met Arg
755 760 765
Thr Ser Lys Thr Leu Ala Pro Thr Pro Val Leu Arg Ser Gly Val Arg
770 775 780
Leu Asn Lys Arg Asn Ala Ser Ile Gly Ser Phe Ser Glu Asp Thr Trp
785 790 795 800
Ala Asn Ala Ser Leu Asp Lys Pro Thr Thr Gln Glu Glu Asp Asn Asn
805 810 815
Leu Glu Ile Ser Arg Leu Pro Ser Leu Ala Arg Pro Ile Gly Lys Val
820 825 830
Pro Ser Ala Pro Asp Asn Leu Gly Lys Leu Asn Ser Gly Pro Lys Ser
835 840 845
Phe Arg Ala Arg Asn Val Ser Val Pro Gly Pro Asp Thr Leu Ile Asp
850 855 860
Ser Pro Asp Thr Pro Ser Ser Ala Phe Pro Pro Phe Asp Ile Gln Lys
865 870 875 880
Gly Thr Gly Ser Ala Ala Gly Pro Val Leu Pro Thr Pro Thr Gly Ala
885 890 895
Thr Phe Ala Pro Asn Gly Leu Pro Ser Gly Gly Leu Tyr Leu Phe Asp
900 905 910
Ser His Ile His Ser Pro Thr Asn Leu Gly Ser Pro Asn Ala Thr Ala
915 920 925
Thr Asn Ala Pro Ala Pro Leu Glu His Cys Pro Glu Ser Phe Leu Leu
930 935 940
Arg Pro Phe Trp Leu Met Arg Cys Ile Tyr Gln Thr Ile Ala His Pro
945 950 955 960
Ser Gly Gly Tyr Leu Thr Thr Lys Leu Phe Val Pro Arg Asp Val Trp
965 970 975
Arg Val Lys Asn Val Lys Ile Lys Ala Val Glu Glu Lys Val Ser Asn
980 985 990
Cys Asp Leu Leu Thr Ala Ala Leu Leu Lys Leu Ala Lys Val Asp Thr
995 1000 1005
Tyr Asp Ala Asp Ala Val Leu Glu Glu Met Gln Ser Phe Glu Thr Val
1010 1015 1020
Leu Asp Gln Val Gln Ser Ser Leu Ser Lys Lys Leu Gly Gly Glu Val
1025 1030 1035 1040
Gly Val Gln Gly Ala Met Ala Leu Phe Lys Ala Ser Gln Ser Ser Asp
1045 1050 1055
Asp Ala Ala Ala Val Asp Thr Leu Pro Ser Lys Thr Ser Gly Gly Ala
1060 1065 1070
Ser Lys Ser Tyr Leu Thr Ser Trp Arg Lys Leu Arg Ser Lys Asn Ser
1075 1080 1085
Gly Phe Gly Gly Thr Thr Ser Gln Ser Ser Val Lys Glu Thr Thr Lys
1090 1095 1100
Asp Asn Leu Ile Ile Asn Ser Leu Pro Met Ser Ser Thr Pro Asn Ser
1105 1110 1115 1120
Gln Pro Val Lys Arg Asn Thr Thr Gln Leu Gln Phe Asn Gly Pro Asn
1125 1130 1135
Ala Asn Tyr Met Ser Ala Leu Ala Arg Leu Cys Asp Ala Ala Gln Val
1140 1145 1150
Leu Asp Gln Ile Ala Gln Gln Val Glu Asp Pro Gly Leu Lys His Ser
1155 1160 1165
Ser Pro Thr Leu Val Gly Leu Glu Leu Ser Thr Arg His Ala Ala Glu
1170 1175 1180
Phe Phe Gly Phe Tyr Ile Cys Arg Phe Ala Leu Asn Asp Ile Ala Met
1185 1190 1195 1200
Met Val Asp Lys Phe Ile Lys Arg Gly Ser Glu Trp Val Leu Ile
1205 1210 1215
<210> 13
<211> 1098
<212> PRT
<213> Penicillium sp.
<400> 13
Met Leu Tyr Arg Ala Ala Val Glu Asp Glu Pro Arg Ser Phe His Pro
1 5 10 15
Arg Arg Pro Ser Gly Pro Leu Thr Glu Pro Pro Ser Gly Pro Leu Pro
20 25 30
His Arg Pro Ser Ser Arg Ile Ser Arg Ser Ala Ser Arg Asn Arg Leu
35 40 45
Ala His Pro Ala Gly Gly Gly Ala Arg Ile Ala Ser Thr Ser Pro Asp
50 55 60
Pro Leu Ala Asp Leu Thr Pro Ser Ser Pro Ile Lys Glu Gly Leu Gly
65 70 75 80
Asn Leu Asn Arg Cys Pro Ser Arg Thr Pro Ala Arg Ala Glu Leu Pro
85 90 95
Glu Val Ser Val Pro Glu Leu Arg Ala Ser Glu Met Phe Met Ala Asp
100 105 110
Ala Asn Ile Leu Tyr Ile Asp Pro Pro Phe Ala Ala Gly Asn His Asp
115 120 125
Ser Met Thr Leu Gly His Leu Pro Pro His Gln Glu Ser Ala Ser Thr
130 135 140
Tyr Pro Gly Glu Gly Gly Ile Phe Met Asp Gly Glu Gly Glu Ala Asp
145 150 155 160
Phe Arg Gln His Gly Ala Thr Gln Lys Ala Met Leu Ser Lys Ala Leu
165 170 175
Gln Lys Ala Asn Thr Ala Val Leu Leu Asp Asn Ala Ala Asn Phe Glu
180 185 190
Gly Ala Met Glu Ala Tyr Thr Asp Ala Cys Gln Leu Leu Gln Leu Val
195 200 205
Met Leu Arg Ser Asn Gly Gly Asp Glu Glu Arg Ile Lys Leu Gln Glu
210 215 220
Ile Arg Asp Thr Tyr Met Ala Arg Ile Thr Glu Leu Gln Arg Met Asp
225 230 235 240
Phe Ser Ile Met Glu Ser Asp Gly Lys Ala Leu Pro Glu Arg Pro Leu
245 250 255
Ser Gln Glu Ser Phe Gly Glu Leu Leu His Ala Val Ala Ser Val Gln
260 265 270
Asp Asp Pro Tyr Leu Asp Ser Gln His Ser Ala Ala His Ser Gly Leu
275 280 285
Arg Leu Gln Ala Ala Phe Asp Glu Ser Arg Pro Leu Pro Ser Glu Ala
290 295 300
Ile Pro Pro Arg Arg Gln Ser Leu Arg Pro Ser Ala Gln Ser Asp Arg
305 310 315 320
Thr Thr Pro Ala Gly Leu Gly Asn Asn Leu Ala Ala Tyr His His Gly
325 330 335
Ala Phe Leu Asp Pro Thr Pro Val Leu Asp Ser Asn Glu Thr Thr Ser
340 345 350
Trp Leu Asp Thr Ile Asp Glu Ser Gly Ala Ser Ser Pro Ser Ser Ala
355 360 365
Asn Ser Lys Ala Ser Ser Val Tyr Leu Arg Arg Arg Thr Ser Arg Arg
370 375 380
Leu Ser Thr Asp Thr Glu Ala Glu Phe Asp Ala Ala Leu Asp Ala Ala
385 390 395 400
Val Glu Ala Ala Tyr Asp Asp Gly Leu Glu Pro Val Glu Glu Tyr Gln
405 410 415
Asp Glu Glu Gly Asp Ser Val Val Ala Asn Ala Arg Arg Asn Ile Glu
420 425 430
Leu Ala Lys Gln Arg Val Arg Glu Ala Glu Leu Glu Ala Glu Ala Ala
435 440 445
Met Ser Arg Gly Arg Asp Leu Arg Pro Val Gln Glu Gln Tyr Leu Leu
450 455 460
Asp Asp Ala Gly Gly Gln Thr Leu Glu Tyr Leu Asp Glu Glu Ala Glu
465 470 475 480
Glu Glu Glu Arg Leu Leu Glu Glu Met Thr Lys Gly Tyr Val Met Asp
485 490 495
Glu Phe Glu Phe Gly Leu Gln Thr Lys Ser Ala Leu Pro Arg Glu Ser
500 505 510
Asp Ser Ser Asn Met Ser Gly His Thr Trp Glu Ser Ser Leu Ala Ser
515 520 525
Asn Ala Thr Gly Pro Gly Ser Leu Ala Leu Ser Thr Leu Ala Glu Asp
530 535 540
Asp Asp Ser Val Leu Pro Leu Asp Phe Leu Asp Gln Thr Leu Leu Pro
545 550 555 560
Thr Ala Pro Pro Thr Ala Ala Leu Pro Pro Ile Pro Val Ser Ser Asp
565 570 575
Phe Pro Ser Leu Pro Leu Pro Arg Ala Ser Val Ser Ser Pro Ala Pro
580 585 590
Pro Pro Pro Pro Met Gly Pro Pro Pro Ile Pro Gly Val Arg Ala Arg
595 600 605
Arg Leu Ser Gly Gln Ala Ser Thr Glu Leu Lys Ile Glu Thr Gly Ser
610 615 620
His Ala Arg Ser Ser Ser Thr Val Ser Asn Val Asp Pro Phe Met Ile
625 630 635 640
Pro Pro Thr Gln Pro Ala Pro Ala Ala Ser Lys Asp Glu Ala Ser Gln
645 650 655
Glu Pro Ser Arg Ser Ala Thr Pro Ser Phe Arg Ala Asn Leu His Pro
660 665 670
Thr Ser Arg Arg Asn Pro Ser Thr Gly Ser Phe Val Asp His Ile Asn
675 680 685
Leu Ile Lys Thr Arg Thr Gln Glu Asp Glu Glu Gly Gly Leu Pro Val
690 695 700
Leu Pro Ala Ala Ile Arg Pro Met Gly Lys Val Pro Ser Ala Pro Asp
705 710 715 720
Gly Leu Asp Lys Val Gly Ala Thr Thr Lys Ser Phe Arg Asn Arg Asn
725 730 735
Val Ser Val Pro Ile Pro Asp Thr Val Pro Val Ser Pro Thr Thr Pro
740 745 750
Trp Ser Gly Ser Phe Ser Ser Gln Glu Thr Gln Lys Ala Ser Gly Ile
755 760 765
Pro His Met Pro Val Leu Pro Thr Pro Thr Ala Pro Leu Phe Thr Gln
770 775 780
Asn Gly Leu Pro Thr Gly Gly Leu Asp Leu Phe Asp Cys Glu Ile His
785 790 795 800
Ser Pro Thr Ser Leu Gly Arg Pro Asn Met Leu Val His Asn Ala Pro
805 810 815
Leu Pro Leu Glu Pro Cys Pro Glu Ser Phe Leu Leu Arg Pro Phe Trp
820 825 830
Leu Met Arg Cys Leu Tyr Gln Thr Leu Ser His Pro Gln Gly Gly Tyr
835 840 845
Leu Ser Glu Lys Leu Phe Ile Pro Arg Asp Val Trp Arg Val Lys Asn
850 855 860
Val Lys Ile Lys Ala Leu Glu Asp Lys Ile Ser Asn Cys Asp Leu Leu
865 870 875 880
Thr Ala Ala Leu Leu Lys Leu Ala Gln Val Asp Met Phe Asp Ala Asp
885 890 895
Ala Val Leu Asp Glu Met Gln Ser Phe Glu Ser Ile Leu Asp Gln Ala
900 905 910
Gln Met Val Leu Ser Lys Lys Leu Gly Asn Glu Val Gly Val His Ala
915 920 925
Ala Ile Pro Gln Leu Arg Gln His Ala Ser Phe Asp Asp Ala Ala Gln
930 935 940
Phe Glu Thr Ser Val Val Lys Ser Ser Ser Thr Ser Asn Lys Ser Tyr
945 950 955 960
Arg Pro Thr Trp Lys Arg Leu Arg Ser Lys Thr Ser Gly Ile Thr Thr
965 970 975
Val Ser Ser Phe Ser Ser Val Arg Glu Thr Ser Lys Glu Gln Leu Thr
980 985 990
Met Thr Ser Val Pro Met Thr Thr Ala Pro Ser Asn Gln Ala Arg Arg
995 1000 1005
Ser Val Thr Ser Leu Asp Phe Ser Gly Pro Asn Ser His Tyr Met Gly
1010 1015 1020
Ala Leu Ala Arg Leu Phe Asp Ala Ala Gln Val Leu Asp Gln Val Ala
1025 1030 1035 1040
Gln Gln Val Glu Asp Pro Gly Leu Lys His Ser Ser Pro Thr His Val
1045 1050 1055
Gly Leu Glu Leu Ser Thr Arg His Ala Ala Glu Phe Phe Gly Phe Tyr
1060 1065 1070
Ile Cys Arg Phe Ala Leu Ala Asp Val Gly Leu Met Leu Asp Lys Phe
1075 1080 1085
Ile Lys Arg Gly Ser Glu Trp Val Leu Ile
1090 1095
<210> 14
<211> 364
<212> PRT
<213> Hypocrea jecorina
<400> 14
Met Lys Gly Leu Ile Leu Val Gly Gly Phe Gly Thr Arg Leu Arg Pro
1 5 10 15
Leu Thr Leu Thr Leu Pro Lys Pro Leu Val Glu Phe Cys Asn Lys Pro
20 25 30
Met Ile Val His Gln Ile Glu Ala Leu Val Ala Ala Gly Val Thr Asp
35 40 45
Ile Val Leu Ala Val Asn Tyr Arg Pro Glu Ile Met Glu Lys Phe Leu
50 55 60
Ala Glu Tyr Glu Glu Lys Tyr Asn Ile Asn Ile Glu Phe Ser Val Glu
65 70 75 80
Ser Glu Pro Leu Asp Thr Ala Gly Pro Leu Lys Leu Ala Glu Arg Ile
85 90 95
Leu Gly Lys Asp Asp Ser Pro Phe Phe Val Leu Asn Ser Asp Val Ile
100 105 110
Cys Asp Tyr Pro Phe Lys Glu Leu Leu Glu Phe His Lys Ala His Gly
115 120 125
Asp Glu Gly Thr Ile Val Val Thr Lys Val Glu Glu Pro Ser Lys Tyr
130 135 140
Gly Val Val Val His Lys Pro Asn His Pro Ser Arg Ile Asp Arg Phe
145 150 155 160
Val Glu Lys Pro Val Glu Phe Val Gly Asn Arg Ile Asn Ala Gly Met
165 170 175
Tyr Ile Phe Asn Pro Ser Val Leu Lys Arg Ile Glu Leu Arg Pro Thr
180 185 190
Ser Ile Glu Lys Glu Thr Phe Pro Ala Met Val Ala Asp Asn Gln Leu
195 200 205
His Ser Phe Asp Leu Glu Gly Phe Trp Met Asp Val Gly Gln Pro Lys
210 215 220
Asp Phe Leu Ser Gly Thr Cys Leu Tyr Leu Ser Ser Leu Thr Lys Lys
225 230 235 240
Gly Ser Lys Glu Leu Thr Pro Pro Thr Glu Pro Tyr Val His Gly Gly
245 250 255
Asn Val Met Ile His Pro Ser Ala Lys Ile Gly Lys Asn Cys Arg Ile
260 265 270
Gly Pro Asn Val Thr Ile Gly Pro Asp Val Val Val Gly Asp Gly Val
275 280 285
Arg Leu Gln Arg Cys Val Leu Leu Lys Gly Ser Lys Val Lys Asp His
290 295 300
Ala Trp Val Lys Ser Thr Ile Val Gly Trp Asn Ser Thr Val Gly Arg
305 310 315 320
Trp Ala Arg Leu Glu Asn Val Thr Val Leu Gly Asp Asp Val Thr Ile
325 330 335
Gly Asp Glu Ile Tyr Val Asn Gly Gly Ser Val Leu Pro His Lys Ser
340 345 350
Ile Lys Ala Asn Val Asp Val Pro Ala Ile Ile Met
355 360
<210> 15
<211> 1042
<212> PRT
<213> Hypocrea jecorina
<400> 15
Met Asp Tyr Thr Gln Tyr His Ala Leu Gly His Gly Glu Val Leu Asp
1 5 10 15
Pro Asn Asp Pro Asn Lys Thr Ser Ala Pro Ala Ala Pro Gln Phe Gln
20 25 30
Pro Pro Ser Ser Pro Tyr Val Pro Pro Gly Ser Pro Tyr Gly Ala Pro
35 40 45
Pro Tyr His Gly Gly His Gln Ala Pro Pro Met Ala Met Pro Pro Pro
50 55 60
Ser Thr Pro Gly Tyr Gly Pro Pro Gln Gly Gln Ser Phe Pro Gly Ser
65 70 75 80
Pro Met Pro Ser Gln Asp Ala Gly Leu Ala Ala Gln Phe Gly Gly Met
85 90 95
Ser Leu Gly Ala Asp Ala Gly Gly Ala Ala Ala Arg Lys Lys Lys Lys
100 105 110
Asp Arg His Ala Tyr His Ser Val Glu Pro Thr Gly Ser Ser Gln Ala
115 120 125
Phe Asn Gly Leu Pro Pro Gly Thr Pro Ala Glu Gln Phe Leu Asn Val
130 135 140
Asn Asn Pro Gln Gly Ile Pro Ala Leu Gly Gly Gln Phe Gly Ser Pro
145 150 155 160
Leu Ala Ser Pro Met Gly Thr Pro His Met Ala Asn Pro Gly Gln Phe
165 170 175
Pro Ala Pro Thr Ser Pro Phe Thr Pro Ser Ala Pro Val Ser Pro Ala
180 185 190
Glu Phe Ala Ser Arg Phe Gly Ser Pro Asp Ala Ala Thr Ser Ile Gly
195 200 205
Ser Ala Gly Pro Ser Gln Val Ser Pro Asp Asp Met Pro Ser Ile Pro
210 215 220
Ala Ser Arg Asp Ala Ile Gln Glu His Phe Phe Lys Asn Val Tyr Pro
225 230 235 240
Thr Phe Glu Arg His Val Pro Pro Pro Ala Thr Val Ser Phe Val Ala
245 250 255
Phe Asp Gln Gly Asn Ala Ser Pro Lys Phe Thr Arg Leu Thr Leu Asn
260 265 270
Asn Ile Pro Thr Thr Ala Glu Gly Leu His Ala Thr Gly Leu Pro Leu
275 280 285
Gly Met Leu Ile Gln Pro Leu Ala Pro Leu Gln Ala Gly Glu Ala Glu
290 295 300
Ile Pro Val Leu Asp Phe Gly Asp Ala Gly Pro Pro Arg Cys Arg Arg
305 310 315 320
Cys Arg Ala Tyr Ile Asn Pro Phe Met Met Phe Arg Ser Gly Gly Asn
325 330 335
Lys Phe Val Cys Asn Leu Cys Ser Tyr Pro Asn Glu Thr Pro Pro Glu
340 345 350
Tyr Phe Cys Ala Val Ser Pro Gln Gly Val Arg Leu Asp Arg Asp Gln
355 360 365
Arg Pro Glu Leu His Arg Gly Thr Val Glu Phe Val Val Pro Lys Glu
370 375 380
Tyr Trp Thr Arg Glu Pro Val Gly Leu Arg Trp Leu Phe Val Ile Asp
385 390 395 400
Val Thr Gln Glu Ser Tyr Asn Lys Gly Phe Met Glu Thr Phe Cys Glu
405 410 415
Gly Ile Leu Ala Ala Leu Tyr Gly Gly Asn Asp Glu Glu Asn Asp Glu
420 425 430
Asp Gly Glu Pro Lys Arg Arg Ile Pro Lys Gly Ala Lys Val Gly Phe
435 440 445
Ile Thr Tyr Asp Lys Asp Ile His Phe Tyr Asn Ile Asn Pro His Leu
450 455 460
Asp Gln Ala His Met Met Ile Met Pro Asp Leu Glu Asp Pro Phe Leu
465 470 475 480
Pro Leu Gly Glu Gly Leu Phe Val Asp Pro Tyr Glu Ser Lys Ala Ile
485 490 495
Ile Thr Ser Leu Leu Thr Arg Leu Pro Glu Met Phe Ser Thr Ile Lys
500 505 510
Asn Pro Glu Pro Ala Leu Leu Ala Thr Leu Asn Ala Ala Val Ala Ala
515 520 525
Leu Glu Ala Thr Gly Gly Lys Val Val Cys Ser Cys Ser Thr Leu Pro
530 535 540
Thr Trp Gly Pro Gly Arg Leu Phe Met Arg Asp Asp Gly Asn His Pro
545 550 555 560
Gly Gly Glu Leu Asp Lys Lys Leu Tyr Thr Thr Glu His Pro Ala Trp
565 570 575
Lys Lys Val Ser Glu Lys Met Ala Ser Ser Gly Ile Gly Val Asp Phe
580 585 590
Phe Leu Ala Ala Pro Ser Gly Gly Tyr Leu Asp Ile Ala Thr Ile Gly
595 600 605
His Val Ala Ala Thr Thr Gly Gly Glu Thr Phe Tyr Tyr Pro Asn Phe
610 615 620
Ile Ala Pro Arg Asp Gly Ala Arg Leu Ser Met Glu Ile Thr His Ala
625 630 635 640
Ile Thr Arg Glu Thr Gly Phe Gln Ala Leu Met Lys Val Arg Cys Ser
645 650 655
Thr Gly Leu Gln Val Ala Ala Tyr His Gly Asn Phe Val Gln His Thr
660 665 670
Phe Gly Ala Asp Leu Glu Ile Gly Val Ile Asp Ala Asp Lys Ala Leu
675 680 685
Gly Val Ser Phe Ser His Asp Gly Lys Leu Asp Pro Lys Leu Asp Ala
690 695 700
His Phe Gln Thr Ala Leu Leu Tyr Thr Thr Ala Ser Gly Gln Arg Arg
705 710 715 720
Val Arg Cys Ser Asn Val Ile Ala Ser Val Ser Asp Thr Ser Lys Glu
725 730 735
Ser Asn Thr Lys Glu Leu Ala Ile Arg Gln Cys Leu Lys Phe Val Asp
740 745 750
Gln Asp Ala Val Val Gly Ile Phe Ala Lys Glu Ala Ser Thr Lys Leu
755 760 765
Ala Thr Thr Ser Ala Asn Leu Gln Asp Val Arg Asn Trp Leu Thr Glu
770 775 780
Arg Thr Ile Asp Ile Met Ala Tyr Tyr Lys Lys His Ser Ala Asn Gln
785 790 795 800
Phe Pro Pro Ser Gln Leu Val Met Pro Glu Arg Leu Lys Glu Phe Cys
805 810 815
Met Tyr Met Leu Gly Met Leu Lys Cys Arg Ala Phe Lys Gly Gly Ile
820 825 830
Glu Asn Ser Asp Arg Arg Val His Glu Leu Arg Met Val Arg Ser Met
835 840 845
Gly Pro Leu Glu Leu Ser Leu Tyr Leu Tyr Pro Arg Met Ile Ala Leu
850 855 860
His Asn Leu Gln Pro Glu Glu Gly Phe Ala Asp Pro Glu Thr Gly His
865 870 875 880
Leu Lys Met Pro Pro Ser Val Arg Thr Ser Phe Ser Arg Val Glu Pro
885 890 895
Gly Gly Val Tyr Leu Val Asp Asn Gly Gln Gln Cys Leu Leu Trp Phe
900 905 910
His Ala Gln Thr Ser Pro Asn Leu Ile Thr Asp Leu Phe Gly Glu Gly
915 920 925
His Asp Ser Leu Lys Gly Leu Asp Pro Tyr Thr Ser Thr Leu Pro Val
930 935 940
Leu Glu Thr His Leu Ser Ala Gln Val Arg Asn Ile Ile Glu Phe Leu
945 950 955 960
Lys Ser Met Arg Gly Ser Lys Gly Met Thr Ile Gln Leu Ala Arg Gln
965 970 975
Gly Ile Asp Gly Ala Glu Tyr Glu Phe Ala Arg Met Leu Val Glu Asp
980 985 990
Arg Asn Asn Glu Ala Lys Ser Tyr Val Asp Trp Leu Val His Ile His
995 1000 1005
Arg Gly Val Gln Leu Glu Leu Ser Gly Gln Arg Lys Lys Glu Gly Asp
1010 1015 1020
Gly Glu Ala Thr Ala Val Met Ala Asn Phe Ala Gly Leu Arg Pro Ala
1025 1030 1035 1040
Tyr Trp
<210> 16
<211> 534
<212> PRT
<213> Hypocrea jecorina
<400> 16
Met Asp Gly Met Met Ser Gln Pro Met Gly Gln Gln Ala Phe Tyr Phe
1 5 10 15
Tyr Asn His Glu His Lys Met Ser Pro Arg Gln Val Ile Phe Ala Gln
20 25 30
Gln Met Ala Ala Tyr Gln Met Met Pro Ser Leu Pro Pro Thr Pro Met
35 40 45
Tyr Ser Arg Pro Asn Ser Ser Cys Ser Gln Pro Pro Thr Leu Tyr Ser
50 55 60
Asn Gly Pro Ser Val Met Thr Pro Thr Ser Thr Pro Pro Leu Ser Ser
65 70 75 80
Arg Lys Pro Met Leu Val Asp Thr Glu Phe Gly Asp Asn Pro Tyr Phe
85 90 95
Pro Ser Thr Pro Pro Leu Ser Ala Ser Gly Ser Thr Val Gly Ser Pro
100 105 110
Lys Ala Cys Asp Met Leu Gln Thr Pro Met Asn Pro Met Phe Ser Gly
115 120 125
Leu Glu Gly Ile Ala Ile Lys Asp Ser Ile Asp Ala Thr Glu Ser Leu
130 135 140
Val Leu Asp Trp Ala Ser Ile Ala Ser Pro Pro Leu Ser Pro Val Tyr
145 150 155 160
Leu Gln Ser Gln Thr Ser Ser Gly Lys Val Pro Ser Leu Thr Ser Ser
165 170 175
Pro Ser Asp Met Leu Ser Thr Thr Ala Ser Cys Pro Ser Leu Ser Pro
180 185 190
Ser Pro Thr Pro Tyr Ala Arg Ser Val Thr Ser Glu His Asp Val Asp
195 200 205
Phe Cys Asp Pro Arg Asn Leu Thr Val Ser Val Gly Ser Asn Pro Thr
210 215 220
Leu Ala Pro Glu Phe Thr Leu Leu Ala Asp Asp Ile Lys Gly Glu Pro
225 230 235 240
Leu Pro Thr Ala Ala Gln Pro Ser Phe Asp Phe Asn Pro Ala Leu Pro
245 250 255
Ser Gly Leu Pro Thr Phe Glu Asp Phe Ser Asp Leu Glu Ser Glu Ala
260 265 270
Asp Phe Ser Ser Leu Val Asn Leu Gly Glu Ile Asn Pro Val Asp Ile
275 280 285
Ser Arg Pro Arg Ala Cys Thr Gly Ser Ser Val Val Ser Leu Gly His
290 295 300
Gly Ser Phe Ile Gly Asp Glu Asp Leu Ser Phe Asp Asp Glu Ala Phe
305 310 315 320
His Phe Pro Ser Leu Pro Ser Pro Thr Ser Ser Val Asp Phe Cys Asp
325 330 335
Val His Gln Asp Lys Arg Gln Lys Lys Asp Arg Lys Glu Ala Lys Pro
340 345 350
Val Met Asn Ser Ala Ala Gly Gly Ser Gln Ser Gly Asn Glu Gln Ala
355 360 365
Gly Ala Thr Glu Ala Ala Ser Ala Ala Ser Asp Ser Asn Ala Ser Ser
370 375 380
Ala Ser Asp Glu Pro Ser Ser Ser Met Pro Ala Pro Thr Asn Arg Arg
385 390 395 400
Gly Arg Lys Gln Ser Leu Thr Glu Asp Pro Ser Lys Thr Phe Val Cys
405 410 415
Asp Leu Cys Asn Arg Arg Phe Arg Arg Gln Glu His Leu Lys Arg His
420 425 430
Tyr Arg Ser Leu His Thr Gln Glu Lys Pro Phe Glu Cys Asn Glu Cys
435 440 445
Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ala Gln His Ala Arg Thr
450 455 460
His Ser Gly Gly Ala Ile Val Met Asn Leu Ile Glu Glu Ser Ser Glu
465 470 475 480
Val Pro Ala Tyr Asp Gly Ser Met Met Ala Gly Pro Val Gly Asp Asp
485 490 495
Tyr Ser Thr Tyr Gly Lys Val Leu Phe Gln Ile Ala Ser Glu Ile Pro
500 505 510
Gly Ser Ala Ser Glu Leu Ser Ser Glu Glu Gly Glu Gln Gly Lys Lys
515 520 525
Lys Arg Lys Arg Ser Asp
530
<210> 17
<211> 668
<212> PRT
<213> Hypocrea jecorina
<400> 17
Arg Gly Arg Ser Pro Ser Ala Gly Gly Phe Gln Ser Asp Ile Asn Gln
1 5 10 15
Ser His Ser Pro Ala Arg Ser Pro Leu Ala Pro Thr Asn Glu Gln Pro
20 25 30
Ser Ala Gly Leu Gly Val Gly Leu Gly Gln Gln Gln Gln Arg Ala Phe
35 40 45
Ala Ala Pro Leu His Pro Asn Tyr Asp Ser Phe Gly Ala Asn Gly Phe
50 55 60
Leu Gly Ala Gln Ala Asn Ala Val Asp Pro Thr Asn Gly Phe Asp Pro
65 70 75 80
Ser Ala Ser Phe Gly Gln Gln Pro Ala Thr Gly Pro Asp Ser Thr Leu
85 90 95
Ser Leu Asn Ala Gln Ala Gln His Asn Tyr Leu Ser Pro Asn Leu His
100 105 110
Asp Gly Asp Phe Ser Leu Phe Pro Ser Ala Ala Glu Gln Gly Asp Gln
115 120 125
Tyr Asn Ala Pro Leu Phe Glu Gln Pro Pro Leu Gly Asp Leu Asn Ala
130 135 140
Met Thr Ser Pro His Ser His Gln Ser Pro Thr Pro Pro Gln Leu Phe
145 150 155 160
Gln Pro Asp Ser Leu Gln Ser Pro Pro Phe Asn Arg His Gln Phe Ser
165 170 175
Ser Pro Pro Thr His Ser Arg Asn Ala Ser Leu Gly Pro Glu Ala Ala
180 185 190
Leu Leu Pro Ser Gln Ile Gly Asp Trp Thr Gln Pro Gln Phe Gln Gly
195 200 205
His Arg Arg Thr Pro Ser Glu Tyr Ser Asp Val Ser Ser Val Ala Pro
210 215 220
Ser Pro His Leu Val Ser Ser Asp Thr Phe Asp Ala Asp Gln Ser Gly
225 230 235 240
His Ser Pro Leu Gln Arg Pro Ala Asp Val Ser Leu Tyr Gln Glu Val
245 250 255
Leu Gly Ile Gly Ser Phe Ser Leu Ala Asp His Gly Ser Pro Gly Tyr
260 265 270
His Gly Arg Ser Pro Ser His Ser Pro Ala Ile Ser Pro Arg Ile Met
275 280 285
Pro Gln Gln Met Pro Asp Thr Met Gln Pro Ser Phe Asn Leu Ile Pro
290 295 300
Pro Asn Gly Gly Phe Asp Gly Val Ser Gly Tyr Pro Asp Leu Gln Pro
305 310 315 320
Ser His Glu Ser Phe Pro Ser Leu Ser Gly Gly Met Gly Gly Asp Met
325 330 335
His Gln Met Ala Pro Pro Ala Ile Asn Ile Asp Phe Ala Pro Thr Asn
340 345 350
Ser Arg Gln Gly Ser Phe Glu Pro Pro Lys Ser Gln Met Asp Gln Asp
355 360 365
Ser Leu Thr Pro Pro Glu Arg Gly Arg Pro Lys Ser Arg Pro Arg Ala
370 375 380
Val Thr Asp Pro Phe His Pro Gly Ser Gly Ile Leu Pro Pro Gly Asn
385 390 395 400
Leu Gly Ser Ser Leu Gly Val Asp Leu Ala Ala Arg Ser Asp Thr Ala
405 410 415
Ser Arg Ser Leu Ser Pro Leu Asp Arg Ser Gly Thr Ser Ser Pro Ala
420 425 430
Ser Arg Arg Arg Gln Ser Thr Ser Ser Val Pro Asn Asn Val Ile Ala
435 440 445
Leu Arg Leu Ala Asp Pro Glu Tyr Gln Asn Ser Gln Glu Ala Gly Thr
450 455 460
Ser Lys Arg Met Gln Lys His Pro Ala Thr Phe Gln Cys Thr Leu Cys
465 470 475 480
Pro Lys Arg Phe Thr Arg Ala Tyr Asn Leu Arg Ser His Leu Arg Thr
485 490 495
His Thr Asp Glu Arg Pro Phe Val Cys Thr Val Cys Gly Lys Ala Phe
500 505 510
Ala Arg Gln His Asp Arg Lys Arg His Glu Ser Leu His Ser Gly Glu
515 520 525
Lys Lys Phe Val Cys Lys Gly Asp Leu Lys Thr Gly Gly Gln Trp Gly
530 535 540
Cys Gly Arg Arg Phe Ala Arg Ala Asp Ala Leu Gly Arg His Phe Arg
545 550 555 560
Ser Glu Ala Gly Arg Ile Cys Ile Lys Pro Leu Leu Asp Glu Glu Met
565 570 575
Val Glu Arg Gln Arg Gln Trp Gln Glu Gln Arg Met Gln Gln Asn Met
580 585 590
Ala Gln Asn Met Ala Asn Pro Gln Val Met Gly Met Asp Ala Gly Pro
595 600 605
Ala Tyr Pro Met Asp Ala Ser Gly Asn Tyr Thr Leu Pro Gln Ala Leu
610 615 620
Leu Ala Gln Tyr Pro Ala Leu Ala Gln Met Asn Trp Ser Ala Thr Asp
625 630 635 640
Met Gly Gly Gly Leu Asp Asp Glu Leu Ser Gly Arg Ser Ser Phe Asp
645 650 655
Ala Ser Asp Tyr Asp Asp Gly Asp Asp Gly Gly Tyr
660 665
<210> 18
<211> 540
<212> PRT
<213> Hypocrea jecorina
<400> 18
Met Ser Leu Ser Lys Leu Ser Val Ser Leu Leu Ala Leu Ala Gly Ser
1 5 10 15
Ala Ile Ala Gly Asp Leu Pro Ser Ile Thr Ala Lys Gly Ser Lys Phe
20 25 30
Phe Tyr Pro Asn Gly Thr Gln Phe Phe Ile Lys Gly Val Ala Tyr Gln
35 40 45
Gln Asp Val Gly Gln Ala Gly Ser Thr Asp Ser Ser Thr Ser Thr Phe
50 55 60
Ile Asp Pro Leu Ser Ser Glu Ala Asn Cys Lys Arg Asp Val Pro Leu
65 70 75 80
Leu Lys Gln Leu Gly Thr Asn Val Ile Arg Thr Tyr Ala Ile Asp Pro
85 90 95
Lys Ala Asp His Ser Ala Cys Met Lys Leu Leu Asn Asp Ala Gly Ile
100 105 110
Tyr Val Phe Ser Asp Leu Gly Glu Pro Ser Leu Ser Ile Asn Arg Asp
115 120 125
Thr Pro Ala Trp Asn Thr Glu Leu Phe Asp Arg Tyr Lys Ala Val Val
130 135 140
Asp Glu Met Ser Gln Tyr Pro Asn Val Ile Gly Tyr Phe Ala Gly Asn
145 150 155 160
Glu Val Ser Asn Ala Lys Asn Asn Thr Gly Ala Ser Ala Tyr Val Lys
165 170 175
Ala Ala Val Arg Asp Thr Lys Ala Tyr Ile Lys Ser Lys Lys Tyr Arg
180 185 190
Trp Gln Gly Val Gly Tyr Ala Ala Asn Asp Asp Val Asp Ile Arg Ala
195 200 205
Glu Ile Ala Asp Tyr Phe Asn Cys Gly Asp Gln Asp Glu Ala Ile Asp
210 215 220
Phe Trp Gly Tyr Asn Ile Tyr Ser Trp Cys Gly Gln Ser Ser Met Gln
225 230 235 240
Lys Ser Gly Tyr Asp Glu Gln Thr Thr Phe Phe Ser Asn Tyr Ser Val
245 250 255
Pro Val Phe Phe Ala Glu Tyr Gly Cys Asn Leu Pro Ser Gly Ala Ala
260 265 270
Ala Arg Ile Phe Gln Glu Thr Ala Ala Leu Tyr Ser Asp Glu Met Thr
275 280 285
Lys Val Phe Ser Gly Gly Ile Val Tyr Met Tyr Phe Glu Glu Asp Asn
290 295 300
Asp Tyr Gly Leu Val Lys Val Asn Asn Gly Ala Val Ser Lys Leu Lys
305 310 315 320
Asp Phe Ser Ala Leu Gln Thr Gln Val Thr Lys Ala Asp Pro Lys Gly
325 330 335
Val Asp Ala Asp Asp Tyr Lys Pro Thr Asn Lys Pro Ala Ser Cys Pro
340 345 350
Ala Leu Thr Asp Asp Trp Gln Ala Ile Asn Ser Leu Pro Pro Thr Pro
355 360 365
Asp Ala Ser Leu Cys Thr Cys Met Gln Ser Ser Leu Ser Cys Val His
370 375 380
Ala Asp Asp Leu Asp Thr Lys Asp Phe Gly Asp Ile Phe Gly Phe Ile
385 390 395 400
Cys Gly Lys Ser Pro Glu Val Cys Ala Gly Ile Asn Gly Asp Pro Ser
405 410 415
Thr Gly Val Tyr Gly Ala Tyr Ser Met Cys Glu Asp Ala Ala Lys Leu
420 425 430
Asp Tyr Val Leu Asp Ala Tyr Tyr Gln Ser Gln Lys Lys Ala Ser Thr
435 440 445
Ala Cys Asp Phe Asn Gly Gln Ala Gln Val Val Ser Pro Lys Ala Ala
450 455 460
Ser Thr Cys Ser Ala Ala Leu Ala Ser Ala Ser Ala Ile Asn Lys Gln
465 470 475 480
Ala Ala Thr Ala Thr Ala Pro Val Gly Ala Gly Ser Thr Ser Gly Ser
485 490 495
Lys Gly Ala Ala Thr Ser Thr Asn Ala Ala Val Ala Gly Arg Pro Val
500 505 510
Ser His Leu Leu Ser Met Gly Glu Ile Ser Val Ala Leu Tyr Met Gly
515 520 525
Val Ala Met Leu Ala Gly Gly Ala Met Ile Val Leu
530 535 540
<210> 19
<211> 1200
<212> DNA
<213> Hypocrea jecorina
<400> 19
atgcagcaac cgccctcctt agttggcgac cgcagcatca ccggcctggg agacgcagcc 60
agccgaccaa atctctcttc atcctcgcct accgtcacca gcgcgccctc ggcaccgaca 120
tcgccaccgc cgcggccgcc aatatcgctg aatcccccgt cgcgagagcc tcctggcgtc 180
gagcccgtgc tccgcatcac gccagtcccg cgctccgtct ttgcctctgt ccaccagccg 240
cgcaagtcgt cgctggtcca gacgtcgcac gtcctgccct cgcccaggac cgccgccgca 300
gctcaccatc accatcccgt ctcgcattcc gcctctggca gcagcggcag caacggcagt 360
ggaagcggca gtggcagcgg cagcggcaat ctgctgcgtc aaacgcatcg cgacaccgtg 420
cacccccccg tcaagcggcc atccaccccg tcgtcgcatc ccaccagggg cgccagcacc 480
ggagcatcgc cgcagcaggg cgccagctcc cgaaaccgct cgtcgacgtc gcccgtttcg 540
tccccggcga gtcgcacgcc tccttatgca tctcgtcagg cctcagtttc ccattcccgc 600
cagcagcaca accaccatca tcagcaccaa caccagcatt accactccca caccagctcg 660
actaccagtc gcgccagcat cgaggccgta gtcggtgccg tccccgatcc ctcaggtcac 720
cgagcgccgc cgaaaccccg tcgaccggat cgcaaccact ttggcgcgtc agatcgcagc 780
gcaactccca ccctgtcgca cttcatgagg gcagagtcga gcatgtccat gagacattac 840
gagagcggcc ccttacgctc catgtcgccg aacccctacg gaacccctgc cgccaccacg 900
acgtcgtcca ctgccagaat gccgcacgag cagagccacg atccctacgc ccctcgcggc 960
cactctcgcg atcactcggg gaagagcagc agagacatgg gcaagccccg agctcagaag 1020
aatccctcac agaaggcgat gctctcccgt gccctgcaaa aggccaacac cgcagttcag 1080
ctcgacaatg ctcagaactt cgaaggcgct cgagaagcgt acgccgaggc ttgcgacttg 1140
ttgcagcagg tgcttgaccg aacaccggga gatgaggaca agcggaagct cgaagccatt 1200
1200
<210> 20
<211> 2539
<212> DNA
<213> Hypocrea jecorina
<400> 20
caccaaactt acaccagccg catcgatgag ctggatcagt tgggcccttg gcaggttgag 60
accgtcaagg ctctgccggc gcggccagag agcgaggagt acagcgcgtc catattcata 120
ccccaggatt acgacatggg cgatgaagct cccaggattg agacggcacg ggtggtgagc 180
tacatcgctg gagacaacgc gtctcccttt gcagcagcgc ccaaccagtg gcagcagtcg 240
ggaggtcaca cggcatctga acggctgcag cccaaccgcg gtctggaacc gggtctgcta 300
cagtcgtcct tctctcgggc cccgaggtcg cccaggcggc tgcagtccac cgatgatctt 360
cgcgcacagc atcaggaggg ccagtatgcg cctcccccac tctcgcctcg ctcgcagtcg 420
ccggtaaaga cgcatgacca tgacgacgac atgtttgccg aactgccacc acacgagccc 480
tatcagtacc agcaagagca cgaccatcaa gaccaccatc aagactacca tcaacatcac 540
cgccatcaca accaccacca tcacgaacga cagcccagcg agactgtcct atcctcatac 600
gagctccagg gtcatgtgga tggaggaatc caaaactcat ggctagatcc aattgacgag 660
tcgggaggct caacagcgtc gtctgtacac tcacgcacct cttcgcttgg ctaccgtcga 720
cgccatatcc gggccgtgag cgggaacacc gaggccgagt ttgacacggc gctggacgct 780
gctatcgagg ctgcctacga cgacggctac gagcccatgg actctgtaga ctatgggacc 840
attgatgctg ggggggacaa tagcatggca ggcgtattgc acaaggtgga gatggcgcgc 900
gaacgagcga gacagacgga gcaggaagcc tatgacgagc tggccaacct ccgacaggcg 960
cactcacaga atccgcagca ccagcaggag gaggacaggt atactgccga gggattctac 1020
gaggacgact cgtctgaaga ggaggagaga ctattggacg agattacacg cgactttgcc 1080
attgaggact ttaccatgga aaacccgaat ggcacacagg tgtcagctag gcagcaggat 1140
gcatggaacg aggacgagac gaggccggat ttcatctcgg gcgtccgatc cttttctgcc 1200
ctgtcgcaga ggccacccat tcctcaggcc tacgccgcca acgcctcgca gccagcagcc 1260
ccccctccga catccgcatt gccagacctg ccaccaggac gccctggtca aaatccaaag 1320
caactcaaga tcgagacggc aaacattgta caaacccaga agtcggtcta tgacgacgac 1380
gaaatctccc caagcacgca agagccgccg cccgagacgc tcgtccggac ggcgagcgcg 1440
cagcctgtaa ggccaccgat accgacagaa agcttcccat ccgaactcag tgctcccgca 1500
tcgccaaccg ccaagaagag gcttctggaa ggagagaatg tgctgaatgc ctcgccttct 1560
atccacaggc tacggaagaa cttttcgtct tctagcttga ggagcatgaa gaacaggaac 1620
atgtccgtct cacatttgga cgacagctcg gatgcttccc ccggcacccc cctgaatgac 1680
cccttcaaca aggcacctgc cgtgcccgtg cccgcgctgc cgaccccctt gctcgcgtcg 1740
ttcaaagatc atatggaggc agcggccggt gttggcttcc acctgtttga cgacgagttt 1800
catgcagcgg cggctgccgg cccccaaagc ccgcagagtc ccagaagtcc cgttgttgtc 1860
tccatggacg tccctgtgcc tctggaaccc tgtccaaacg acttcatgct gcgaccgttt 1920
tggctgatgc gatgcctata ccagacactt gtgcatccca agggtggcta catcagtacg 1980
aagctattcg tgccgcgaga cgtctggcgg gtcaaaggtg tcaagatcaa gaacgtggag 2040
gacaaaattg ccaactgcga ctttttgact gcagccctgc tgaagctgtc caaagtggac 2100
actctggatg cggatgccgt gctggaggag atgcaagccc tcgagggcat tctggagcag 2160
atacagccgg tcctggcccg aaagcttgga aacgaagtgg gcgttcaagg ttccggtctg 2220
ctgttcaaag acgcctcgat gatggaagga gaccccggtt cagccgtgcc gcgatcagga 2280
agtgtgtctg gcaaggcgtc tgcgttttcc tggcgacggc ttcggccaaa gacgtcgggc 2340
gtcgggctgg gagggtcgta cagcagccgc aacgccagtg ctgagacgaa ggaggcctca 2400
acgctggcaa cggtgcccat gacgccgaaa ccgacaagcc gttcggccaa gcgagacgtg 2460
agccaggttc agttcatcgg gcccaatgcg agctacatgg gctctctcgc gcgcttgttt 2520
gacgctgcgc aggcagttg 2539
<210> 21
<211> 188
<212> DNA
<213> Hypocrea jecorina
<400> 21
atcaaattgc aaggcaggtc gacgaccccg gtttgcggct tgcggacaag actcaggtcg 60
gcttggagct ctgcacccgg cacgccgctg agttctttgg cttttacatt tgccgattcg 120
tcttggccga cctcggcctg ttgctggaca agttcctcaa acgaggaagc gaatgggtca 180
tgacatga 188
<210> 22
<211> 87
<212> PRT
<213> Hypocrea jecorina
<400> 22
Ser Gln Lys Ala Met Leu Ser Arg Ala Leu Gln Lys Ala Asn Thr Ala
1 5 10 15
Val Gln Leu Asp Asn Ala Gln Asn Phe Glu Gly Ala Arg Glu Ala Tyr
20 25 30
Ala Glu Ala Cys Asp Leu Leu Gln Gln Val Leu Asp Arg Thr Pro Gly
35 40 45
Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile His Gln Thr Tyr Thr Ser
50 55 60
Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro Trp Gln Val Glu Thr Val
65 70 75 80
Lys Ala Leu Pro Ala Arg Pro
85
<210> 23
<211> 60
<212> PRT
<213> Hypocrea jecorina
<400> 23
Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser Thr Ala Ser Ser
1 5 10 15
Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg Arg His Ile Arg
20 25 30
Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr Ala Leu Asp Ala
35 40 45
Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro
50 55 60
<210> 24
<211> 118
<212> PRT
<213> Hypocrea jecorina
<400> 24
Leu Glu Pro Cys Pro Asn Asp Phe Met Leu Arg Pro Phe Trp Leu Met
1 5 10 15
Arg Cys Leu Tyr Gln Thr Leu Val His Pro Lys Gly Gly Tyr Ile Ser
20 25 30
Thr Lys Leu Phe Val Pro Arg Asp Val Trp Arg Val Lys Gly Val Lys
35 40 45
Ile Lys Asn Val Glu Asp Lys Ile Ala Asn Cys Asp Phe Leu Thr Ala
50 55 60
Ala Leu Leu Lys Leu Ser Lys Val Asp Thr Leu Asp Ala Asp Ala Val
65 70 75 80
Leu Glu Glu Met Gln Ala Leu Glu Gly Ile Leu Glu Gln Ile Gln Pro
85 90 95
Val Leu Ala Arg Lys Leu Gly Asn Glu Val Gly Val Gln Gly Ser Gly
100 105 110
Leu Leu Phe Lys Asp Ala
115
<210> 25
<211> 84
<212> PRT
<213> Hypocrea jecorina
<400> 25
Thr Val Pro Met Thr Pro Lys Pro Thr Ser Arg Ser Ala Lys Arg Asp
1 5 10 15
Val Ser Gln Val Gln Phe Ile Gly Pro Asn Ala Ser Tyr Met Gly Ser
20 25 30
Leu Ala Arg Leu Phe Asp Ala Ala Gln Ala Val Asp Gln Ile Ala Arg
35 40 45
Gln Val Asp Asp Pro Gly Leu Arg Leu Ala Asp Lys Thr Gln Val Gly
50 55 60
Leu Glu Leu Cys Thr Arg His Ala Ala Glu Phe Phe Gly Phe Tyr Ile
65 70 75 80
Cys Arg Phe Val
<210> 26
<211> 60
<212> PRT
<213> Hypocrea jecorina
<400> 26
Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser Thr Ala Ser Ser
1 5 10 15
Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg Arg His Ile Arg
20 25 30
Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr Ala Leu Asp Ala
35 40 45
Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro
50 55 60
<210> 27
<211> 22
<212> PRT
<213> Hypocrea jecorina
<400> 27
Asp Ser Ser Glu Glu Glu Glu Arg Leu Leu Asp Glu Ile Thr Arg Asp
1 5 10 15
Phe Ala Ile Glu Asp Phe
20
<210> 28
<211> 119
<212> PRT
<213> Hypocrea jecorina
<400> 28
Pro Val Pro Leu Glu Pro Cys Pro Asn Asp Phe Met Leu Arg Pro Phe
1 5 10 15
Trp Leu Met Arg Cys Leu Tyr Gln Thr Leu Val His Pro Lys Gly Gly
20 25 30
Tyr Ile Ser Thr Lys Leu Phe Val Pro Arg Asp Val Trp Arg Val Lys
35 40 45
Gly Val Lys Ile Lys Asn Val Glu Asp Lys Ile Ala Asn Cys Asp Phe
50 55 60
Leu Thr Ala Ala Leu Leu Lys Leu Ser Lys Val Asp Thr Leu Asp Ala
65 70 75 80
Asp Ala Val Leu Glu Glu Met Gln Ala Leu Glu Gly Ile Leu Glu Gln
85 90 95
Ile Gln Pro Val Leu Ala Arg Lys Leu Gly Asn Glu Val Gly Val Gln
100 105 110
Gly Ser Gly Leu Leu Phe Lys
115
<210> 29
<211> 24
<212> PRT
<213> Hypocrea jecorina
<400> 29
Val Pro Arg Ser Gly Ser Val Ser Gly Lys Ala Ser Ala Phe Ser Trp
1 5 10 15
Arg Arg Leu Arg Pro Lys Thr Ser
20
<210> 30
<211> 96
<212> PRT
<213> Hypocrea jecorina
<400> 30
Thr Ser Arg Ser Ala Lys Arg Asp Val Ser Gln Val Gln Phe Ile Gly
1 5 10 15
Pro Asn Ala Ser Tyr Met Gly Ser Leu Ala Arg Leu Phe Asp Ala Ala
20 25 30
Gln Ala Val Asp Gln Ile Ala Arg Gln Val Asp Asp Pro Gly Leu Arg
35 40 45
Leu Ala Asp Lys Thr Gln Val Gly Leu Glu Leu Cys Thr Arg His Ala
50 55 60
Ala Glu Phe Phe Gly Phe Tyr Ile Cys Arg Phe Val Leu Ala Asp Leu
65 70 75 80
Gly Leu Leu Leu Asp Lys Phe Leu Lys Arg Gly Ser Glu Trp Val Met
85 90 95
<210> 31
<211> 1235
<212> PRT
<213> Trichoderma atraviride
<400> 31
Met Gln Gln Ser His Pro Phe Asp Asp Asn Ile Ile Ser Arg Arg Ala
1 5 10 15
Thr Arg Ala Pro Ile Glu Pro Ser Ser Pro Pro Pro Pro Pro Pro Gln
20 25 30
Ala Ser Ser Arg Glu Ala Pro Gly Ile Glu Ala Val Leu Ser Ser Pro
35 40 45
Lys Thr Pro Val Leu Arg Ser Val Phe Ser Ser Ala Arg Leu Pro Arg
50 55 60
Ser Ser Ser Leu Ile Pro Pro Leu His Gly Ser Pro Pro Ser Ala Ser
65 70 75 80
Thr Ala Ala Ala Ile Asn Thr Asn Ser Pro Pro His His Ala Asn Ala
85 90 95
Ser Gln His Thr His Arg Gly Pro Val His Pro Pro Val Ser Leu Lys
100 105 110
Arg Pro Ser Thr Pro Ser Ser Gln Leu Asn Arg Gly Ala Ser Ser Gly
115 120 125
Ala Ser Pro Gln Glu Ala Ser Arg Thr Arg Asn Arg Trp Ser Thr Ser
130 135 140
Ser Ile Ser Ser Ala Ser Ser Arg Thr Ser Pro Tyr Ala Ser Arg Gln
145 150 155 160
Ala Ser Ile Ser Asn Ser Arg Ile Arg Arg Ala Ser Leu Glu Ala Ala
165 170 175
Leu Ser Pro Pro Ser Val Pro Pro Pro Pro Leu Pro Pro Ala Gln Ala
180 185 190
Pro Pro Arg Lys Pro Ser Tyr Thr Val Arg Ser Arg Phe Asn Ser Ser
195 200 205
Asp Ser Gly Val Thr Pro Thr Ser Val His Pro Met Arg Ser Glu Ser
210 215 220
Ser Met Ser Met Arg His Tyr Glu Asn Gly Gln Leu Arg Ser Val Ser
225 230 235 240
Pro Asn Pro Tyr Ala Asn Pro Thr Thr Thr Thr Ser Ser Thr Ala Arg
245 250 255
Met Pro His Glu His Ser His Asp Pro Tyr Ala Pro Arg Gly His Ser
260 265 270
Arg Asp His Ser Gly Lys Ser Ser Arg Asp Leu Gly Lys Pro Arg Ala
275 280 285
Gln Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu Gln Lys
290 295 300
Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu Gly Ala
305 310 315 320
Arg Glu Ser Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val Leu Asp
325 330 335
Arg Thr Ser Gly Asp Glu Asp Lys Arg Lys Leu Glu Thr Ile Arg Ala
340 345 350
Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Met Gly Pro Trp Gln
355 360 365
Asp Glu Asn Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu Asp Tyr
370 375 380
Gly Ala Ser Ile Tyr Met His Gln Asp Tyr Glu Met Met Glu Glu Ala
385 390 395 400
Pro Arg Ile Glu Thr Ala Arg Val Val Ser Ile Ile Gly Asp Gly Ser
405 410 415
Ser Pro Val Ala His Gln Trp Gln Gln Asp Tyr Thr Thr Thr Asp Arg
420 425 430
Gln Gln Pro Ala Arg Thr Leu Glu Pro Gly Met Leu Gln Ser Ser Phe
435 440 445
Ser Arg Ser Pro Arg Arg Leu Arg Ser Thr Asp Asn Leu Arg Ala Gln
450 455 460
Ser Gln Gln Glu Ala Leu Tyr Ala Pro Ala Pro Leu Ser Pro Arg Ser
465 470 475 480
Pro Ser Pro Met Lys Met His Pro Glu Glu Tyr Thr Glu Met Val Gln
485 490 495
Glu His His Glu Pro His His Gln His Tyr His Gln Arg Gln Pro Ser
500 505 510
Asp Ser Val Leu Pro Tyr Asp Met Gln Asp Phe Thr Glu Gly Thr Gln
515 520 525
Asn Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Ala Ser Thr Val Ser
530 535 540
Ser Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg Arg His Ile
545 550 555 560
Arg Ala Ala Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr Ala Leu Asp
565 570 575
Ala Ala Ile Glu Ala Ala Tyr Asp Asp Gly Phe Glu Pro Met Glu Thr
580 585 590
Glu Asp Tyr Asp Ala Met Asp Pro Arg Glu Asp Val Val Ala Ser Val
595 600 605
Met Gln Arg Val Glu Lys Ala Arg Glu Gln Val Arg Gln Thr Glu Gln
610 615 620
Glu Ala Tyr Asp Asp Leu Ala Met Leu Arg Gln Ala His Gln Gln Asn
625 630 635 640
Gln His Tyr Leu Gln Glu Glu Glu Asp Lys Tyr Thr Pro Asp Gly Phe
645 650 655
Tyr Glu Asp Asp Ser Ser Glu Asp Glu Glu Arg Leu Leu Asp Glu Ile
660 665 670
Thr Arg Asp Phe Ala Ile Glu Asp Phe Thr Met Thr Gln Pro Gln Ser
675 680 685
Asn Thr Ala Thr Val Ser Ala Ser Gln Gln Glu Ala Trp Asn Glu Asp
690 695 700
Glu Thr Arg Pro Asp Phe Ile Ser Gly Val Arg Ser Phe Ser Ala Leu
705 710 715 720
Ser Gln Arg Pro Pro Ile Pro Gln Thr Ser Asn Ile Met Gln Pro Ala
725 730 735
Ala Pro Pro Pro Thr Thr Thr Leu Pro Pro Pro Pro Thr Thr Thr Leu
740 745 750
Pro Glu Val Pro Lys Gly Ser Asp Ser Pro Ser His Gly Val Arg Asn
755 760 765
Arg Arg Met Ser Gly Gln Asn Pro Lys Gln Leu Lys Ile Glu Thr Thr
770 775 780
Asn Leu Gly Gln Ser Asn Thr Arg Thr Val Tyr Asp Asp Asp Glu Ile
785 790 795 800
Ser Pro Ser Thr Val Asp Arg Asp Leu Val Glu Ala Leu Val Arg Gly
805 810 815
Ala Ser Ala His Pro Val Lys Gln Leu Asn Ala Ala Asp Asn Glu Ser
820 825 830
Lys Ile Pro Gly Ser Pro Ser Ala Lys Lys Lys Leu Ile Asp Gly Glu
835 840 845
Asp Ala Thr Ala Ala Asn Ala Ser Pro Ser Ile His Arg Leu Lys Lys
850 855 860
Asn Phe Ser Ser Ser Ser Leu Arg Ser Met Lys Asn Arg Asn Met Ser
865 870 875 880
Val Ser His Leu Asp Asp Asn Ser Asp Val Ser Pro Gly Thr Pro Asn
885 890 895
Gly Asn Pro Phe Gly Lys Thr Pro Ala Val Pro Ala Leu Pro Thr Pro
900 905 910
Leu Ile Thr Ser Phe Arg Asp Asn Gly Glu Ala Gly Gly Gly Ala Gly
915 920 925
Leu His Leu Phe Asp Asp Asn Phe His Ala Ala Ala Thr Pro Gly Pro
930 935 940
Gln Ser Pro Val Val Ser Met Glu Val Pro Ala Pro Leu Glu Pro Cys
945 950 955 960
Pro Asn Asp Phe Met Leu Arg Pro Phe Trp Leu Met Arg Cys Leu Tyr
965 970 975
Gln Thr Leu Val His Pro Lys Gly Gly Tyr Val Ser Thr Lys Leu Phe
980 985 990
Val Pro Arg Asp Val Trp Arg Val Lys Gly Val Lys Ile Lys Asn Val
995 1000 1005
Glu Asp Lys Val Ala Asn Cys Asp Phe Leu Thr Ala Ala Leu Leu Lys
1010 1015 1020
Leu Ala Lys Val Asp Thr Phe Asp Ala Asp Ala Val Leu Glu Glu Met
1025 1030 1035 1040
Gln Ser Leu Glu Gly Val Leu Glu Gln Val Gln Ser Ser Leu Ala Arg
1045 1050 1055
Lys Leu Gly Ser Glu Val Gly Val Gln Gly Gly His Ile Phe Lys Asp
1060 1065 1070
Ala Ser Val Asp Gly Glu Gly Gly Ser Asn Val Pro Arg Ser Gly Ser
1075 1080 1085
Val Ser Gly Lys Ala Ser Ala Phe Ser Trp Arg Arg Leu Arg Pro Lys
1090 1095 1100
Thr Ser Gly Val Gly Leu Gly Gly Ser Tyr Ser Asn Arg Ser Ala Ser
1105 1110 1115 1120
Met Glu Thr Lys Glu Val Thr Thr Leu Ala Thr Leu Pro Met Thr Pro
1125 1130 1135
Lys Pro Thr Ser Arg Pro Pro Lys Arg Asp Val Ser Gln Ala Gln Phe
1140 1145 1150
Ile Gly Pro Asn Ala Met Tyr Met Gly Ser Leu Ala Arg Leu Phe Asp
1155 1160 1165
Ala Ala Gln Ala Ile Asp Gln Ile Ala Arg Gln Val Glu Asp Pro Gly
1170 1175 1180
Leu Arg His Ala Asp Lys Thr Gln Val Gly Leu Glu Leu Cys Thr Arg
1185 1190 1195 1200
His Ala Ala Glu Phe Phe Gly Phe Tyr Ile Cys Arg Phe Val Leu Ala
1205 1210 1215
Asp Leu Ser Leu Leu Leu Asp Lys Phe Leu Lys Arg Gly Ser Glu Trp
1220 1225 1230
Val Leu Thr
1235
<210> 32
<211> 4694
<212> DNA
<213> Hypocrea jecorina
<400> 32
atggatcagc gctgtgggcg gttcgttcag ggccatcgcc aggcacaggc acaggcacag 60
gcacagaggc tcaggcacga ggtaccggta cctgggccgg gccaattgga tgcaccacca 120
cggcctgacc tgcgtttccg caactcccac gcttgcctcc ccacgatcca cagcgccagg 180
gacgtccaaa tccccgatag tattcccagt cgaggaccag cagcgattga gtgagtgagt 240
gactgactga gggacgactg aggtactgac ggatcccaga ggacagcacg acaccgcacc 300
gcaccgctca gcacaggccc gttgctggga gtgctgtcga tccgctgagt ggcctctctc 360
tctctctctg tctctcctcc ttcgcatcag cctcgtgagc accgcaaaga cagaagaacc 420
cgccattgtc tcgaggtcat ggccggctgc cacacgcgcg caatacatcc aatcccacga 480
ctgcgacccc cgacccacgc tgtacgagta agattggccg gaagaggcga ccattggctg 540
agacggcagc ccgcaccagt ccagcaaccg caactgcaag tgctgcacgt cgtacgaacc 600
tgatttggcc atagccagcg ccagagcatg cagcaaccgc cctccttagt tggcgaccgc 660
agcatcaccg gcctgggaga cgcagccagc cgaccaaatc tctcttcatc ctcgcctacc 720
gtcaccagcg cgccctcggc accgacatcg ccaccgccgc ggccgccaat atcgctgaat 780
cccccgtcgc gagagcctcc tggcgtcgag cccgtgctcc gcatcacgcc agtcccgcgc 840
tccgtctttg cctctgtcca ccagccgcgc aagtcgtcgc tggtccagac gtcgcacgtc 900
ctgccctcgc ccaggaccgc cgccgcagct caccatcacc atcccgtctc gcattccgcc 960
tctggcagca gcggcagcaa cggcagtgga agcggcagtg gcagcggcag cggcaatctg 1020
ctgcgtcaaa cgcatcgcga caccgtgcac ccccccgtca agcggccatc caccccgtcg 1080
tcgcatccca ccaggggcgc cagcaccgga gcatcgccgc agcagggcgc cagctcccga 1140
aaccgctcgt cgacgtcgcc cgtttcgtcc ccggcgagtc gcacgcctcc ttatgcatct 1200
cgtcaggcct cagtttccca ttcccgccag cagcacaacc accatcatca gcaccaacac 1260
cagcattacc actcccacac cagctcgact accagtcgcg ccagcatcga ggccgtagtc 1320
ggtgccgtcc ccgatccctc aggtcaccga gcgccgccga aaccccgtcg accggatcgc 1380
aaccactttg gcgcgtcaga tcgcagcgca actcccaccc tgtcgcactt catgagggca 1440
gagtcgagca tgtccatgag acattacgag agcggcccct tacgctccat gtcgccgaac 1500
ccctacggaa cccctgccgc caccacgacg tcgtccactg ccagaatgcc gcacgagcag 1560
agccacgatc cctacgcccc tcgcggccac tctcgcgatc actcggggaa gagcagcaga 1620
gacatgggca agccccgagc tcagaagaat ccctcacaga aggcgatgct ctcccgtgcc 1680
ctgcaaaagg ccaacaccgc agttcagctc gacaatgctc agaacttcga aggcgctcga 1740
gaagcgtacg ccgaggcttg cgacttgttg cagcaggtgc ttgaccgaac accgggagat 1800
gaggacaagc ggaagctcga agccattgta agtcacggcg gcaaccggaa tgtcgagccc 1860
gttgtctgtc attagtagat cacttggaac tgacaatttc aatctgtagc accaaactta 1920
caccagccgc atcgatgagc tggatcagtt gggcccttgg caggttgaga ccgtcaaggc 1980
tctgccggcg cggccagaga gcgaggagta cagcgcgtcc atattcatac cccaggatta 2040
cgacatgggc gatgaagctc ccaggattga gacggcacgg gtggtgagct acatcgctgg 2100
agacaacgcg tctccctttg cagcagcgcc caaccagtgg cagcagtcgg gaggtcacac 2160
ggcatctgaa cggctgcagc ccaaccgcgg tctggaaccg ggtctgctac agtcgtcctt 2220
ctctcgggcc ccgaggtcgc ccaggcggct gcagtccacc gatgatcttc gcgcacagca 2280
tcaggagggc cagtatgcgc ctcccccact ctcgcctcgc tcgcagtcgc cggtaaagac 2340
gcatgaccat gacgacgaca tgtttgccga actgccacca cacgagccct atcagtacca 2400
gcaagagcac gaccatcaag accaccatca agactaccat caacatcacc gccatcacaa 2460
ccaccaccat cacgaacgac agcccagcga gactgtccta tcctcatacg agctccaggg 2520
tcatgtggat ggaggaatcc aaaactcatg gctagatcca attgacgagt cgggaggctc 2580
aacagcgtcg tctgtacact cacgcacctc ttcgcttggc taccgtcgac gccatatccg 2640
ggccgtgagc gggaacaccg aggccgagtt tgacacggcg ctggacgctg ctatcgaggc 2700
tgcctacgac gacggctacg agcccatgga ctctgtagac tatgggacca ttgatgctgg 2760
gggggacaat agcatggcag gcgtattgca caaggtggag atggcgcgcg aacgagcgag 2820
acagacggag caggaagcct atgacgagct ggccaacctc cgacaggcgc actcacagaa 2880
tccgcagcac cagcaggagg aggacaggta tactgccgag ggattctacg aggacgactc 2940
gtctgaagag gaggagagac tattggacga gattacacgc gactttgcca ttgaggactt 3000
taccatggaa aacccgaatg gcacacaggt gtcagctagg cagcaggatg catggaacga 3060
ggacgagacg aggccggatt tcatctcggg cgtccgatcc ttttctgccc tgtcgcagag 3120
gccacccatt cctcaggcct acgccgccaa cgcctcgcag ccagcagccc cccctccgac 3180
atccgcattg ccagacctgc caccaggacg ccctggtcaa aatccaaagc aactcaagat 3240
cgagacggca aacattgtac aaacccagaa gtcggtctat gacgacgacg aaatctcccc 3300
aagcacgcaa gagccgccgc ccgagacgct cgtccggacg gcgagcgcgc agcctgtaag 3360
gccaccgata ccgacagaaa gcttcccatc cgaactcagt gctcccgcat cgccaaccgc 3420
caagaagagg cttctggaag gagagaatgt gctgaatgcc tcgccttcta tccacaggct 3480
acggaagaac ttttcgtctt ctagcttgag gagcatgaag aacaggaaca tgtccgtctc 3540
acatttggac gacagctcgg atgcttcccc cggcaccccc ctgaatgacc ccttcaacaa 3600
ggcacctgcc gtgcccgtgc ccgcgctgcc gacccccttg ctcgcgtcgt tcaaagatca 3660
tatggaggca gcggccggtg ttggcttcca cctgtttgac gacgagtttc atgcagcggc 3720
ggctgccggc ccccaaagcc cgcagagtcc cagaagtccc gttgttgtct ccatggacgt 3780
ccctgtgcct ctggaaccct gtccaaacga cttcatgctg cgaccgtttt ggctgatgcg 3840
atgcctatac cagacacttg tgcatcccaa gggtggctac atcagtacga agctattcgt 3900
gccgcgagac gtctggcggg tcaaaggtgt caagatcaag aacgtggagg acaaaattgc 3960
caactgcgac tttttgactg cagccctgct gaagctgtcc aaagtggaca ctctggatgc 4020
ggatgccgtg ctggaggaga tgcaagccct cgagggcatt ctggagcaga tacagccggt 4080
cctggcccga aagcttggaa acgaagtggg cgttcaaggt tccggtctgc tgttcaaaga 4140
cgcctcgatg atggaaggag accccggttc agccgtgccg cgatcaggaa gtgtgtctgg 4200
caaggcgtct gcgttttcct ggcgacggct tcggccaaag acgtcgggcg tcgggctggg 4260
agggtcgtac agcagccgca acgccagtgc tgagacgaag gaggcctcaa cgctggcaac 4320
ggtgcccatg acgccgaaac cgacaagccg ttcggccaag cgagacgtga gccaggttca 4380
gttcatcggg cccaatgcga gctacatggg ctctctcgcg cgcttgtttg acgctgcgca 4440
ggcagttggt aagcatattg cgatacgcat accggttaca gtgacggcaa gctaacgatg 4500
atgcagatca aattgcaagg caggtcgacg accccggttt gcggcttgcg gacaagactc 4560
aggtcggctt ggagctctgc acccggcacg ccgctgagtt ctttggcttt tacatttgcc 4620
gattcgtctt ggccgacctc ggcctgttgc tggacaagtt cctcaaacga ggaagcgaat 4680
gggtcatgac atga 4694
<210> 33
<211> 1465
<212> PRT
<213> Hypocrea jecorina
<400> 33
Met Asp Gln Arg Cys Gly Arg Phe Val Gln Gly His Arg Gln Ala Gln
1 5 10 15
Ala Gln Ala Gln Ala Gln Arg Leu Arg His Glu Val Pro Val Pro Gly
20 25 30
Pro Gly Gln Leu Asp Ala Pro Pro Arg Pro Asp Leu Arg Phe Arg Asn
35 40 45
Ser His Ala Cys Leu Pro Thr Ile His Ser Ala Arg Asp Val Gln Ile
50 55 60
Pro Asp Ser Ile Pro Ser Arg Gly Pro Ala Ala Ile Glu Gly Gln His
65 70 75 80
Asp Thr Ala Pro His Arg Ser Ala Gln Ala Arg Cys Trp Glu Cys Cys
85 90 95
Arg Ser Ala Glu Trp Pro Leu Ser Leu Ser Leu Ser Leu Leu Leu Arg
100 105 110
Ile Ser Leu Val Ser Thr Ala Lys Thr Glu Glu Pro Ala Ile Val Ser
115 120 125
Arg Ser Trp Pro Ala Ala Thr Arg Ala Gln Tyr Ile Gln Ser His Asp
130 135 140
Cys Asp Pro Arg Pro Thr Leu Tyr Asp Gln Arg Gln Ser Met Gln Gln
145 150 155 160
Pro Pro Ser Leu Val Gly Asp Arg Ser Ile Thr Gly Leu Gly Asp Ala
165 170 175
Ala Ser Arg Pro Asn Leu Ser Ser Ser Ser Pro Thr Val Thr Ser Ala
180 185 190
Pro Ser Ala Pro Thr Ser Pro Pro Pro Arg Pro Pro Ile Ser Leu Asn
195 200 205
Pro Pro Ser Arg Glu Pro Pro Gly Val Glu Pro Val Leu Arg Ile Thr
210 215 220
Pro Val Pro Arg Ser Val Phe Ala Ser Val His Gln Pro Arg Lys Ser
225 230 235 240
Ser Leu Val Gln Thr Ser His Val Leu Pro Ser Pro Arg Thr Ala Ala
245 250 255
Ala Ala His His His His Pro Val Ser His Ser Ala Ser Gly Ser Ser
260 265 270
Gly Ser Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Asn Leu
275 280 285
Leu Arg Gln Thr His Arg Asp Thr Val His Pro Pro Val Lys Arg Pro
290 295 300
Ser Thr Pro Ser Ser His Pro Thr Arg Gly Ala Ser Thr Gly Ala Ser
305 310 315 320
Pro Gln Gln Gly Ala Ser Ser Arg Asn Arg Ser Ser Thr Ser Pro Val
325 330 335
Ser Ser Pro Ala Ser Arg Thr Pro Pro Tyr Ala Ser Arg Gln Ala Ser
340 345 350
Val Ser His Ser Arg Gln Gln His Asn His His His Gln His Gln His
355 360 365
Gln His Tyr His Ser His Thr Ser Ser Thr Thr Ser Arg Ala Ser Ile
370 375 380
Glu Ala Val Val Gly Ala Val Pro Asp Pro Ser Gly His Arg Ala Pro
385 390 395 400
Pro Lys Pro Arg Arg Pro Asp Arg Asn His Phe Gly Ala Ser Asp Arg
405 410 415
Ser Ala Thr Pro Thr Leu Ser His Phe Met Arg Ala Glu Ser Ser Met
420 425 430
Ser Met Arg His Tyr Glu Ser Gly Pro Leu Arg Ser Met Ser Pro Asn
435 440 445
Pro Tyr Gly Thr Pro Ala Ala Thr Thr Thr Ser Ser Thr Ala Arg Met
450 455 460
Pro His Glu Gln Ser His Asp Pro Tyr Ala Pro Arg Gly His Ser Arg
465 470 475 480
Asp His Ser Gly Lys Ser Ser Arg Asp Met Gly Lys Pro Arg Ala Gln
485 490 495
Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu Gln Lys Ala
500 505 510
Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu Gly Ala Arg
515 520 525
Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val Leu Asp Arg
530 535 540
Thr Pro Gly Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile His Gln Thr
545 550 555 560
Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro Trp Gln Val
565 570 575
Glu Thr Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu Glu Tyr Ser
580 585 590
Ala Ser Ile Phe Ile Pro Gln Asp Tyr Asp Met Gly Asp Glu Ala Pro
595 600 605
Arg Ile Glu Thr Ala Arg Val Val Ser Tyr Ile Ala Gly Asp Asn Ala
610 615 620
Ser Pro Phe Ala Ala Ala Pro Asn Gln Trp Gln Gln Ser Gly Gly His
625 630 635 640
Thr Ala Ser Glu Arg Leu Gln Pro Asn Arg Gly Leu Glu Pro Gly Leu
645 650 655
Leu Gln Ser Ser Phe Ser Arg Ala Pro Arg Ser Pro Arg Arg Leu Gln
660 665 670
Ser Thr Asp Asp Leu Arg Ala Gln His Gln Glu Gly Gln Tyr Ala Pro
675 680 685
Pro Pro Leu Ser Pro Arg Ser Gln Ser Pro Val Lys Thr His Asp His
690 695 700
Asp Asp Asp Met Phe Ala Glu Leu Pro Pro His Glu Pro Tyr Gln Tyr
705 710 715 720
Gln Gln Glu His Asp His Gln Asp His His Gln Asp Tyr His Gln His
725 730 735
His Arg His His Asn His His His His Glu Arg Gln Pro Ser Glu Thr
740 745 750
Val Leu Ser Ser Tyr Glu Leu Gln Gly His Val Asp Gly Gly Ile Gln
755 760 765
Asn Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser Thr Ala Ser
770 775 780
Ser Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg Arg His Ile
785 790 795 800
Arg Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr Ala Leu Asp
805 810 815
Ala Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro Met Asp Ser
820 825 830
Val Asp Tyr Gly Thr Ile Asp Ala Gly Gly Asp Asn Ser Met Ala Gly
835 840 845
Val Leu His Lys Val Glu Met Ala Arg Glu Arg Ala Arg Gln Thr Glu
850 855 860
Gln Glu Ala Tyr Asp Glu Leu Ala Asn Leu Arg Gln Ala His Ser Gln
865 870 875 880
Asn Pro Gln His Gln Gln Glu Glu Asp Arg Tyr Thr Ala Glu Gly Phe
885 890 895
Tyr Glu Asp Asp Ser Ser Glu Glu Glu Glu Arg Leu Leu Asp Glu Ile
900 905 910
Thr Arg Asp Phe Ala Ile Glu Asp Phe Thr Met Glu Asn Pro Asn Gly
915 920 925
Thr Gln Val Ser Ala Arg Gln Gln Asp Ala Trp Asn Glu Asp Glu Thr
930 935 940
Arg Pro Asp Phe Ile Ser Gly Val Arg Ser Phe Ser Ala Leu Ser Gln
945 950 955 960
Arg Pro Pro Ile Pro Gln Ala Tyr Ala Ala Asn Ala Ser Gln Pro Ala
965 970 975
Ala Pro Pro Pro Thr Ser Ala Leu Pro Asp Leu Pro Pro Gly Arg Pro
980 985 990
Gly Gln Asn Pro Lys Gln Leu Lys Ile Glu Thr Ala Asn Ile Val Gln
995 1000 1005
Thr Gln Lys Ser Val Tyr Asp Asp Asp Glu Ile Ser Pro Ser Thr Gln
1010 1015 1020
Glu Pro Pro Pro Glu Thr Leu Val Arg Thr Ala Ser Ala Gln Pro Val
1025 1030 1035 1040
Arg Pro Pro Ile Pro Thr Glu Ser Phe Pro Ser Glu Leu Ser Ala Pro
1045 1050 1055
Ala Ser Pro Thr Ala Lys Lys Arg Leu Leu Glu Gly Glu Asn Val Leu
1060 1065 1070
Asn Ala Ser Pro Ser Ile His Arg Leu Arg Lys Asn Phe Ser Ser Ser
1075 1080 1085
Ser Leu Arg Ser Met Lys Asn Arg Asn Met Ser Val Ser His Leu Asp
1090 1095 1100
Asp Ser Ser Asp Ala Ser Pro Gly Thr Pro Leu Asn Asp Pro Phe Asn
1105 1110 1115 1120
Lys Ala Pro Ala Val Pro Val Pro Ala Leu Pro Thr Pro Leu Leu Ala
1125 1130 1135
Ser Phe Lys Asp His Met Glu Ala Ala Ala Gly Val Gly Phe His Leu
1140 1145 1150
Phe Asp Asp Glu Phe His Ala Ala Ala Ala Ala Gly Pro Gln Ser Pro
1155 1160 1165
Gln Ser Pro Arg Ser Pro Val Val Val Ser Met Asp Val Pro Val Pro
1170 1175 1180
Leu Glu Pro Cys Pro Asn Asp Phe Met Leu Arg Pro Phe Trp Leu Met
1185 1190 1195 1200
Arg Cys Leu Tyr Gln Thr Leu Val His Pro Lys Gly Gly Tyr Ile Ser
1205 1210 1215
Thr Lys Leu Phe Val Pro Arg Asp Val Trp Arg Val Lys Gly Val Lys
1220 1225 1230
Ile Lys Asn Val Glu Asp Lys Ile Ala Asn Cys Asp Phe Leu Thr Ala
1235 1240 1245
Ala Leu Leu Lys Leu Ser Lys Val Asp Thr Leu Asp Ala Asp Ala Val
1250 1255 1260
Leu Glu Glu Met Gln Ala Leu Glu Gly Ile Leu Glu Gln Ile Gln Pro
1265 1270 1275 1280
Val Leu Ala Arg Lys Leu Gly Asn Glu Val Gly Val Gln Gly Ser Gly
1285 1290 1295
Leu Leu Phe Lys Asp Ala Ser Met Met Glu Gly Asp Pro Gly Ser Ala
1300 1305 1310
Val Pro Arg Ser Gly Ser Val Ser Gly Lys Ala Ser Ala Phe Ser Trp
1315 1320 1325
Arg Arg Leu Arg Pro Lys Thr Ser Gly Val Gly Leu Gly Gly Ser Tyr
1330 1335 1340
Ser Ser Arg Asn Ala Ser Ala Glu Thr Lys Glu Ala Ser Thr Leu Ala
1345 1350 1355 1360
Thr Val Pro Met Thr Pro Lys Pro Thr Ser Arg Ser Ala Lys Arg Asp
1365 1370 1375
Val Ser Gln Val Gln Phe Ile Gly Pro Asn Ala Ser Tyr Met Gly Ser
1380 1385 1390
Leu Ala Arg Leu Phe Asp Ala Ala Gln Ala Val Asp Gln Ile Ala Arg
1395 1400 1405
Gln Val Asp Asp Pro Gly Leu Arg Leu Ala Asp Lys Thr Gln Val Gly
1410 1415 1420
Leu Glu Leu Cys Thr Arg His Ala Ala Glu Phe Phe Gly Phe Tyr Ile
1425 1430 1435 1440
Cys Arg Phe Val Leu Ala Asp Leu Gly Leu Leu Leu Asp Lys Phe Leu
1445 1450 1455
Lys Arg Gly Ser Glu Trp Val Met Thr
1460 1465
<210> 34
<211> 4067
<212> DNA
<213> Hypocrea jecorina
<400> 34
atgcagcaac cgccctcctt agttggcgac cgcagcatca ccggcctggg agacgcagcc 60
agccgaccaa atctctcttc atcctcgcct accgtcacca gcgcgccctc ggcaccgaca 120
tcgccaccgc cgcggccgcc aatatcgctg aatcccccgt cgcgagagcc tcctggcgtc 180
gagcccgtgc tccgcatcac gccagtcccg cgctccgtct ttgcctctgt ccaccagccg 240
cgcaagtcgt cgctggtcca gacgtcgcac gtcctgccct cgcccaggac cgccgccgca 300
gctcaccatc accatcccgt ctcgcattcc gcctctggca gcagcggcag caacggcagt 360
ggaagcggca gtggcagcgg cagcggcaat ctgctgcgtc aaacgcatcg cgacaccgtg 420
cacccccccg tcaagcggcc atccaccccg tcgtcgcatc ccaccagggg cgccagcacc 480
ggagcatcgc cgcagcaggg cgccagctcc cgaaaccgct cgtcgacgtc gcccgtttcg 540
tccccggcga gtcgcacgcc tccttatgca tctcgtcagg cctcagtttc ccattcccgc 600
cagcagcaca accaccatca tcagcaccaa caccagcatt accactccca caccagctcg 660
actaccagtc gcgccagcat cgaggccgta gtcggtgccg tccccgatcc ctcaggtcac 720
cgagcgccgc cgaaaccccg tcgaccggat cgcaaccact ttggcgcgtc agatcgcagc 780
gcaactccca ccctgtcgca cttcatgagg gcagagtcga gcatgtccat gagacattac 840
gagagcggcc ccttacgctc catgtcgccg aacccctacg gaacccctgc cgccaccacg 900
acgtcgtcca ctgccagaat gccgcacgag cagagccacg atccctacgc ccctcgcggc 960
cactctcgcg atcactcggg gaagagcagc agagacatgg gcaagccccg agctcagaag 1020
aatccctcac agaaggcgat gctctcccgt gccctgcaaa aggccaacac cgcagttcag 1080
ctcgacaatg ctcagaactt cgaaggcgct cgagaagcgt acgccgaggc ttgcgacttg 1140
ttgcagcagg tgcttgaccg aacaccggga gatgaggaca agcggaagct cgaagccatt 1200
gtaagtcacg gcggcaaccg gaatgtcgag cccgttgtct gtcattagta gatcacttgg 1260
aactgacaat ttcaatctgt agcaccaaac ttacaccagc cgcatcgatg agctggatca 1320
gttgggccct tggcaggttg agaccgtcaa ggctctgccg gcgcggccag agagcgagga 1380
gtacagcgcg tccatattca taccccagga ttacgacatg ggcgatgaag ctcccaggat 1440
tgagacggca cgggtggtga gctacatcgc tggagacaac gcgtctccct ttgcagcagc 1500
gcccaaccag tggcagcagt cgggaggtca cacggcatct gaacggctgc agcccaaccg 1560
cggtctggaa ccgggtctgc tacagtcgtc cttctctcgg gccccgaggt cgcccaggcg 1620
gctgcagtcc accgatgatc ttcgcgcaca gcatcaggag ggccagtatg cgcctccccc 1680
actctcgcct cgctcgcagt cgccggtaaa gacgcatgac catgacgacg acatgtttgc 1740
cgaactgcca ccacacgagc cctatcagta ccagcaagag cacgaccatc aagaccacca 1800
tcaagactac catcaacatc accgccatca caaccaccac catcacgaac gacagcccag 1860
cgagactgtc ctatcctcat acgagctcca gggtcatgtg gatggaggaa tccaaaactc 1920
atggctagat ccaattgacg agtcgggagg ctcaacagcg tcgtctgtac actcacgcac 1980
ctcttcgctt ggctaccgtc gacgccatat ccgggccgtg agcgggaaca ccgaggccga 2040
gtttgacacg gcgctggacg ctgctatcga ggctgcctac gacgacggct acgagcccat 2100
ggactctgta gactatggga ccattgatgc tgggggggac aatagcatgg caggcgtatt 2160
gcacaaggtg gagatggcgc gcgaacgagc gagacagacg gagcaggaag cctatgacga 2220
gctggccaac ctccgacagg cgcactcaca gaatccgcag caccagcagg aggaggacag 2280
gtatactgcc gagggattct acgaggacga ctcgtctgaa gaggaggaga gactattgga 2340
cgagattaca cgcgactttg ccattgagga ctttaccatg gaaaacccga atggcacaca 2400
ggtgtcagct aggcagcagg atgcatggaa cgaggacgag acgaggccgg atttcatctc 2460
gggcgtccga tccttttctg ccctgtcgca gaggccaccc attcctcagg cctacgccgc 2520
caacgcctcg cagccagcag ccccccctcc gacatccgca ttgccagacc tgccaccagg 2580
acgccctggt caaaatccaa agcaactcaa gatcgagacg gcaaacattg tacaaaccca 2640
gaagtcggtc tatgacgacg acgaaatctc cccaagcacg caagagccgc cgcccgagac 2700
gctcgtccgg acggcgagcg cgcagcctgt aaggccaccg ataccgacag aaagcttccc 2760
atccgaactc agtgctcccg catcgccaac cgccaagaag aggcttctgg aaggagagaa 2820
tgtgctgaat gcctcgcctt ctatccacag gctacggaag aacttttcgt cttctagctt 2880
gaggagcatg aagaacagga acatgtccgt ctcacatttg gacgacagct cggatgcttc 2940
ccccggcacc cccctgaatg accccttcaa caaggcacct gccgtgcccg tgcccgcgct 3000
gccgaccccc ttgctcgcgt cgttcaaaga tcatatggag gcagcggccg gtgttggctt 3060
ccacctgttt gacgacgagt ttcatgcagc ggcggctgcc ggcccccaaa gcccgcagag 3120
tcccagaagt cccgttgttg tctccatgga cgtccctgtg cctctggaac cctgtccaaa 3180
cgacttcatg ctgcgaccgt tttggctgat gcgatgccta taccagacac ttgtgcatcc 3240
caagggtggc tacatcagta cgaagctatt cgtgccgcga gacgtctggc gggtcaaagg 3300
tgtcaagatc aagaacgtgg aggacaaaat tgccaactgc gactttttga ctgcagccct 3360
gctgaagctg tccaaagtgg acactctgga tgcggatgcc gtgctggagg agatgcaagc 3420
cctcgagggc attctggagc agatacagcc ggtcctggcc cgaaagcttg gaaacgaagt 3480
gggcgttcaa ggttccggtc tgctgttcaa agacgcctcg atgatggaag gagaccccgg 3540
ttcagccgtg ccgcgatcag gaagtgtgtc tggcaaggcg tctgcgtttt cctggcgacg 3600
gcttcggcca aagacgtcgg gcgtcgggct gggagggtcg tacagcagcc gcaacgccag 3660
tgctgagacg aaggaggcct caacgctggc aacggtgccc atgacgccga aaccgacaag 3720
ccgttcggcc aagcgagacg tgagccaggt tcagttcatc gggcccaatg cgagctacat 3780
gggctctctc gcgcgcttgt ttgacgctgc gcaggcagtt ggtaagcata ttgcgatacg 3840
cataccggtt acagtgacgg caagctaacg atgatgcaga tcaaattgca aggcaggtcg 3900
acgaccccgg tttgcggctt gcggacaaga ctcaggtcgg cttggagctc tgcacccggc 3960
acgccgctga gttctttggc ttttacattt gccgattcgt cttggccgac ctcggcctgt 4020
tgctggacaa gttcctcaaa cgaggaagcg aatgggtcat gacatga 4067
<210> 35
<211> 1285
<212> PRT
<213> Hypocrea jecorina
<400> 35
Met Gln Gln Pro Pro Ser Leu Val Gly Asp Arg Ser Ile Thr Gly Leu
1 5 10 15
Gly Asp Ala Ala Ser Arg Pro Asn Leu Ser Ser Ser Ser Pro Thr Val
20 25 30
Thr Ser Ala Pro Ser Ala Pro Thr Ser Pro Pro Pro Arg Pro Pro Ile
35 40 45
Ser Leu Asn Pro Pro Ser Arg Glu Pro Pro Gly Val Glu Pro Val Leu
50 55 60
Arg Ile Thr Pro Val Pro Arg Ser Val Phe Ala Ser Val His Gln Pro
65 70 75 80
Arg Lys Ser Ser Leu Val Gln Thr Ser His Val Leu Pro Ser Pro Arg
85 90 95
Thr Ala Ala Ala Ala His His His His Pro Val Ser His Ser Ala Ser
100 105 110
Gly Ser Ser Gly Ser Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser
115 120 125
Gly Asn Leu Leu Arg Gln Thr His Arg Asp Thr Val His Pro Pro Val
130 135 140
Lys Arg Pro Ser Thr Pro Ser Ser His Pro Thr Arg Gly Ala Ser Thr
145 150 155 160
Gly Ala Ser Pro Gln Gln Gly Ala Ser Ser Arg Asn Arg Ser Ser Thr
165 170 175
Ser Pro Val Ser Ser Pro Ala Ser Arg Thr Pro Pro Tyr Ala Ser Arg
180 185 190
Gln Ala Ser Val Ser His Ser Arg Gln Gln His Asn His His His Gln
195 200 205
His Gln His Gln His Tyr His Ser His Thr Ser Ser Thr Thr Ser Arg
210 215 220
Ala Ser Ile Glu Ala Val Val Gly Ala Val Pro Asp Pro Ser Gly His
225 230 235 240
Arg Ala Pro Pro Lys Pro Arg Arg Pro Asp Arg Asn His Phe Gly Ala
245 250 255
Ser Asp Arg Ser Ala Thr Pro Thr Leu Ser His Phe Met Arg Ala Glu
260 265 270
Ser Ser Met Ser Met Arg His Tyr Glu Ser Gly Pro Leu Arg Ser Met
275 280 285
Ser Pro Asn Pro Tyr Gly Thr Pro Ala Ala Thr Thr Thr Ser Ser Thr
290 295 300
Ala Arg Met Pro His Glu Gln Ser His Asp Pro Tyr Ala Pro Arg Gly
305 310 315 320
His Ser Arg Asp His Ser Gly Lys Ser Ser Arg Asp Met Gly Lys Pro
325 330 335
Arg Ala Gln Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu
340 345 350
Gln Lys Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu
355 360 365
Gly Ala Arg Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val
370 375 380
Leu Asp Arg Thr Pro Gly Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile
385 390 395 400
His Gln Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro
405 410 415
Trp Gln Val Glu Thr Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu
420 425 430
Glu Tyr Ser Ala Ser Ile Phe Ile Pro Gln Asp Tyr Asp Met Gly Asp
435 440 445
Glu Ala Pro Arg Ile Glu Thr Ala Arg Val Val Ser Tyr Ile Ala Gly
450 455 460
Asp Asn Ala Ser Pro Phe Ala Ala Ala Pro Asn Gln Trp Gln Gln Ser
465 470 475 480
Gly Gly His Thr Ala Ser Glu Arg Leu Gln Pro Asn Arg Gly Leu Glu
485 490 495
Pro Gly Leu Leu Gln Ser Ser Phe Ser Arg Ala Pro Arg Ser Pro Arg
500 505 510
Arg Leu Gln Ser Thr Asp Asp Leu Arg Ala Gln His Gln Glu Gly Gln
515 520 525
Tyr Ala Pro Pro Pro Leu Ser Pro Arg Ser Gln Ser Pro Gln Glu His
530 535 540
Asp His Gln Asp His His Gln Asp Tyr His Gln His His Arg His His
545 550 555 560
Asn His His His His Glu Arg Gln Pro Ser Glu Thr Val Leu Ser Ser
565 570 575
Tyr Glu Leu Gln Gly His Val Asp Gly Gly Ile Gln Asn Ser Trp Leu
580 585 590
Asp Pro Ile Asp Glu Ser Gly Gly Ser Thr Ala Ser Ser Val His Ser
595 600 605
Arg Thr Ser Ser Leu Gly Tyr Arg Arg Arg His Ile Arg Ala Val Ser
610 615 620
Gly Asn Thr Glu Ala Glu Phe Asp Thr Ala Leu Asp Ala Ala Ile Glu
625 630 635 640
Ala Ala Tyr Asp Asp Gly Tyr Glu Pro Met Asp Ser Val Asp Tyr Gly
645 650 655
Thr Ile Asp Ala Gly Gly Asp Asn Ser Met Ala Gly Val Leu His Lys
660 665 670
Val Glu Met Ala Arg Glu Arg Ala Arg Gln Thr Glu Gln Glu Ala Tyr
675 680 685
Asp Glu Leu Ala Asn Leu Arg Gln Ala His Ser Gln Asn Pro Gln His
690 695 700
Gln Gln Glu Glu Asp Arg Tyr Thr Ala Glu Gly Phe Tyr Glu Asp Asp
705 710 715 720
Ser Ser Glu Glu Glu Glu Arg Leu Leu Asp Glu Ile Thr Arg Asp Phe
725 730 735
Ala Ile Glu Asp Phe Thr Met Glu Asn Pro Asn Gly Thr Gln Val Ser
740 745 750
Ala Arg Gln Gln Asp Ala Trp Asn Glu Asp Glu Thr Arg Pro Asp Phe
755 760 765
Ile Ser Gly Val Arg Ser Phe Ser Ala Leu Ser Gln Arg Pro Pro Ile
770 775 780
Pro Gln Ala Tyr Ala Ala Asn Ala Ser Gln Pro Ala Ala Pro Pro Pro
785 790 795 800
Thr Ser Ala Leu Pro Asp Leu Pro Pro Gly Arg Pro Gly Gln Asn Pro
805 810 815
Lys Gln Leu Lys Ile Glu Thr Ala Asn Ile Val Gln Thr Gln Lys Ser
820 825 830
Val Tyr Asp Asp Asp Glu Ile Ser Pro Ser Thr Gln Glu Pro Pro Pro
835 840 845
Glu Thr Leu Val Arg Thr Ala Ser Ala Gln Pro Val Arg Pro Pro Ile
850 855 860
Pro Thr Glu Ser Phe Pro Ser Glu Leu Ser Ala Pro Ala Ser Pro Thr
865 870 875 880
Ala Lys Lys Arg Leu Leu Glu Gly Glu Asn Val Leu Asn Ala Ser Pro
885 890 895
Ser Ile His Arg Leu Arg Lys Asn Phe Ser Ser Ser Ser Leu Arg Ser
900 905 910
Met Lys Asn Arg Asn Met Ser Val Ser His Leu Asp Asp Ser Ser Asp
915 920 925
Ala Ser Pro Gly Thr Pro Leu Asn Asp Pro Phe Asn Lys Ala Pro Ala
930 935 940
Val Pro Val Pro Ala Leu Pro Thr Pro Leu Leu Ala Ser Phe Lys Asp
945 950 955 960
His Met Glu Ala Ala Ala Gly Val Gly Phe His Leu Phe Asp Asp Glu
965 970 975
Phe His Ala Ala Ala Ala Ala Gly Pro Gln Ser Pro Gln Ser Pro Arg
980 985 990
Ser Pro Val Val Val Ser Met Asp Val Pro Val Pro Leu Glu Pro Cys
995 1000 1005
Pro Asn Asp Phe Met Leu Arg Pro Phe Trp Leu Met Arg Cys Leu Tyr
1010 1015 1020
Gln Thr Leu Val His Pro Lys Gly Gly Tyr Ile Ser Thr Lys Leu Phe
1025 1030 1035 1040
Val Pro Arg Asp Val Trp Arg Val Lys Gly Val Lys Ile Lys Asn Val
1045 1050 1055
Glu Asp Lys Ile Ala Asn Cys Asp Phe Leu Thr Ala Ala Leu Leu Lys
1060 1065 1070
Leu Ser Lys Val Asp Thr Leu Asp Ala Asp Ala Val Leu Glu Glu Met
1075 1080 1085
Gln Ala Leu Glu Gly Ile Leu Glu Gln Ile Gln Pro Val Leu Ala Arg
1090 1095 1100
Lys Leu Gly Asn Glu Val Gly Val Gln Gly Ser Gly Leu Leu Phe Lys
1105 1110 1115 1120
Asp Ala Ser Met Met Glu Gly Asp Pro Gly Ser Ala Val Pro Arg Ser
1125 1130 1135
Gly Ser Val Ser Gly Lys Ala Ser Ala Phe Ser Trp Arg Arg Leu Arg
1140 1145 1150
Pro Lys Thr Ser Gly Val Gly Leu Gly Gly Ser Tyr Ser Ser Arg Asn
1155 1160 1165
Ala Ser Ala Glu Thr Lys Glu Ala Ser Thr Leu Ala Thr Val Pro Met
1170 1175 1180
Thr Pro Lys Pro Thr Ser Arg Ser Ala Lys Arg Asp Val Ser Gln Val
1185 1190 1195 1200
Gln Phe Ile Gly Pro Asn Ala Ser Tyr Met Gly Ser Leu Ala Arg Leu
1205 1210 1215
Phe Asp Ala Ala Gln Ala Val Asp Gln Ile Ala Arg Gln Val Asp Asp
1220 1225 1230
Pro Gly Leu Arg Leu Ala Asp Lys Thr Gln Val Gly Leu Glu Leu Cys
1235 1240 1245
Thr Arg His Ala Ala Glu Phe Phe Gly Phe Tyr Ile Cys Arg Phe Val
1250 1255 1260
Leu Ala Asp Leu Gly Leu Leu Leu Asp Lys Phe Leu Lys Arg Gly Ser
1265 1270 1275 1280
Glu Trp Val Met Thr
1285
<210> 36
<211> 462
<212> DNA
<213> Hypocrea jecorina
<400> 36
atccacagcg ccagggacgt ccaaatcccc gatagtattc ccagtcgagg accagcagcg 60
attgagtgag tgagtgactg actgagggac gactgaggta ctgacggatc ccagaggaca 120
gcacgacacc gcaccgcacc gctcagcaca ggcccgttgc tgggagtgct gtcgatccgc 180
tgagtggcct ctctctctct ctctgtctct cctccttcgc atcagcctcg tgagcaccgc 240
aaagacagaa gaacccgcca ttgtctcgag gtcatggccg gctgccacac gcgcgcaata 300
catccaatcc cacgactgcg acccccgacc cacgctgtac gagtaagatt ggccggaaga 360
ggcgaccatt ggctgagacg gcagcccgca ccagtccagc aaccgcaact gcaagtgctg 420
cacgtcgtac gaacctgatt tggccatagc cagcgccaga gc 462
<210> 37
<211> 373
<212> DNA
<213> Hypocrea jecorina
<400> 37
agaaagagaa ggagaccgtt tttttgtcat tgaaagcaag cttgtgtgtt ttatcctatg 60
cgatacctaa tgagcaagag gcgggataat tgatctgaga ttttggtata acgttcatga 120
cgacggaacg atgagaagca gcaaaaggcg cgtttgttcg gaattcagtt gcggacatgc 180
ggcagcctgc tatatatcaa gaggaggttg gctgctttgg tgatccagac atcgaaaggc 240
atacatgtgt gtattttata gtatatatat ctctctcttt cctgaagcgt cttttctctg 300
gaagagacgg gatacatgat cgaacagcaa gcgagaagac atctgaaaga tttaatctga 360
agaaatggtc atg 373
<210> 38
<211> 1343
<212> PRT
<213> Hypocrea jecorina
<400> 38
Met Ile Glu Asp Thr Ala Ala Leu Ala Ala Ala Ala Glu Leu Ile Ala
1 5 10 15
Ser Leu Ala Cys Asp Pro Ala Ser Ala Ser Ala Ser Ser Ser Leu Val
20 25 30
Ser Val Gly Pro Gly Ser Ser Ile Lys Leu Pro Gly Arg Glu Asn Pro
35 40 45
Ala Lys Arg Thr Leu Glu Ile Glu Leu Glu Lys Leu Val Leu Arg Ile
50 55 60
Ser Gln Leu Glu Ser Arg Ala Ser Ala Ser Ala Asn Ala Ser Val Phe
65 70 75 80
Pro Glu Thr Pro Asn Glu Val Asn Asp Thr Leu Phe Asn Asp Asp Val
85 90 95
Asp Pro Ser Val Asn Gly Arg Pro Pro Val Ala Pro Gln Pro Arg Leu
100 105 110
Ser Gln Ala Gln Gln Gly Ser Leu Asp Ser Pro Ile Phe Val Ser Arg
115 120 125
Gln Leu Thr Lys Glu Ala Leu Gln Gly Leu Arg Asp His Val Asp Asp
130 135 140
Gln Ser Lys Leu Leu Asp Ser Gln Arg Gln Glu Leu Ala Gly Val Asn
145 150 155 160
Ala Gln Leu Leu Glu Gln Lys Gln Leu Gln Glu Arg Ala Leu Ala Met
165 170 175
Leu Glu Gln Glu Arg Val Ala Thr Leu Glu Arg Glu Leu Trp Lys His
180 185 190
Gln Lys Ala Asn Glu Ala Phe Gln Lys Ala Leu Arg Glu Ile Gly Glu
195 200 205
Ile Val Thr Ala Val Ala Arg Gly Asp Leu Thr Met Lys Val Arg Met
210 215 220
Asn Ser Val Glu Met Asp Pro Glu Ile Thr Thr Phe Lys Arg Thr Ile
225 230 235 240
Asn Ala Met Met Asp Gln Leu Gln Thr Phe Ala Ser Glu Val Ser Arg
245 250 255
Val Ala Arg Glu Val Gly Thr Glu Gly Leu Leu Gly Gly Gln Ala Arg
260 265 270
Ile Gly Gly Val Asp Gly Val Trp Lys Glu Leu Thr Asp Asn Val Asn
275 280 285
Ile Met Ala Gln Asn Leu Thr Asp Gln Val Arg Glu Ile Ala Ser Val
290 295 300
Thr Thr Ala Val Ala His Gly Asp Leu Thr Lys Lys Ile Glu Arg Pro
305 310 315 320
Ala Lys Gly Glu Ile Leu Gln Leu Gln Gln Thr Ile Asn Thr Met Val
325 330 335
Asp Gln Leu Arg Thr Phe Ala Ser Glu Val Thr Arg Val Ala Arg Asp
340 345 350
Val Gly Thr Glu Gly Ile Leu Gly Gly Gln Ala Asp Val Gly Gly Val
355 360 365
Lys Gly Met Trp Asn Asp Leu Thr Val Asn Val Asn Ala Met Ala Asn
370 375 380
Asn Leu Thr Thr Gln Val Arg Asp Ile Ile Lys Val Thr Thr Ala Val
385 390 395 400
Ala Lys Gly Asp Leu Thr Gln Lys Val Gln Ala Glu Cys Arg Gly Glu
405 410 415
Met Phe Lys Leu Lys Ser Thr Ile Asn Ser Met Val Asp Gln Leu Gln
420 425 430
Gln Phe Ala Arg Glu Val Thr Lys Ile Ala Arg Glu Val Gly Thr Glu
435 440 445
Gly Arg Leu Gly Gly Gln Ala Thr Val His Asp Val Glu Gly Thr Trp
450 455 460
Arg Asp Leu Thr Glu Asn Val Asn Gly Met Ala Met Asn Leu Thr Thr
465 470 475 480
Gln Val Arg Glu Ile Ala Lys Val Thr Thr Ala Val Ala Arg Gly Asp
485 490 495
Leu Thr Lys Lys Ile Gly Val Glu Val Lys Gly Glu Ile Leu Glu Leu
500 505 510
Lys Asn Thr Ile Asn Gln Met Val Asp Arg Leu Gly Thr Phe Ala Val
515 520 525
Glu Val Ser Lys Val Ala Arg Glu Val Gly Thr Asp Gly Thr Leu Gly
530 535 540
Gly Gln Ala Gln Val Ala Asn Val Glu Gly Lys Trp Lys Asp Leu Thr
545 550 555 560
Glu Asn Val Asn Thr Met Ala Ser Asn Leu Thr Val Gln Val Arg Ser
565 570 575
Ile Ser Ala Val Thr Gln Ala Ile Ala Asn Gly Asp Met Ser Gln Thr
580 585 590
Ile Asp Val Glu Ala Asn Gly Glu Ile Gln Val Leu Lys Glu Thr Ile
595 600 605
Asn Asn Met Val Ser Arg Leu Ser Ser Phe Cys Tyr Glu Val Gln Arg
610 615 620
Val Ala Lys Asp Val Gly Val Asp Gly Lys Met Gly Ala Gln Ala Asp
625 630 635 640
Val Ala Gly Leu Asn Gly Arg Trp Lys Glu Ile Thr Thr Asp Val Asn
645 650 655
Thr Met Ala Ser Asn Leu Thr Thr Gln Val Arg Ala Phe Ser Asp Ile
660 665 670
Thr Asn Leu Ala Thr Asp Gly Asp Phe Thr Lys Leu Val Asp Val Glu
675 680 685
Ala Ser Gly Glu Met Asp Glu Leu Lys Lys Lys Ile Asn Gln Met Ile
690 695 700
Ser Asn Leu Arg Asp Ser Ile Gln Arg Asn Thr Gln Ala Arg Glu Ala
705 710 715 720
Ala Glu Leu Ala Asn Lys Thr Lys Ser Glu Phe Leu Ala Asn Met Ser
725 730 735
His Glu Ile Arg Thr Pro Met Asn Gly Ile Ile Gly Met Thr Gln Leu
740 745 750
Thr Leu Asp Thr Asp Leu Thr Gln Tyr Gln Arg Glu Met Leu Asn Ile
755 760 765
Val Asn Asp Leu Ala Asn Ser Leu Leu Thr Ile Ile Asp Asp Ile Leu
770 775 780
Asp Leu Ser Lys Ile Glu Ala Arg Arg Met Val Ile Glu Glu Ile Pro
785 790 795 800
Tyr Thr Leu Arg Gly Thr Val Phe Asn Ala Leu Lys Thr Leu Ala Val
805 810 815
Lys Ala Asn Glu Lys Phe Leu Asp Leu Thr Tyr Lys Val Asp Ser Ser
820 825 830
Val Pro Asp Tyr Val Ile Gly Asp Ser Phe Arg Leu Arg Gln Ile Ile
835 840 845
Leu Asn Leu Val Gly Asn Ala Ile Lys Phe Thr Glu His Gly Glu Val
850 855 860
Ser Leu Thr Ile Gln Glu Gln Glu Asp Lys Arg His Val Gly Pro Gly
865 870 875 880
Glu Tyr Ala Ile Glu Phe Ile Val Glu Asp Thr Gly Ile Gly Ile Ala
885 890 895
Lys Asp Lys Leu Asn Leu Ile Phe Asp Thr Phe Gln Gln Ala Asp Gly
900 905 910
Ser Met Thr Arg Lys Phe Gly Gly Thr Gly Leu Gly Leu Ser Ile Ser
915 920 925
Lys Arg Phe Val Asn Leu Met Gly Gly Asp Leu Trp Val Asn Ser Glu
930 935 940
Val Gly Lys Gly Ser Glu Phe His Phe Thr Cys Arg Val Lys Leu Ala
945 950 955 960
Asp Val His Ala Glu Ser Val Gln Gln Gln Leu Lys Pro Tyr Arg Gly
965 970 975
His Gln Val Leu Phe Val Asp Lys Ser Gln Ser Asn Ala Ala Thr His
980 985 990
Ile Gly Glu Met Leu Glu Glu Ile Gly Leu His Pro Val Val Val Asn
995 1000 1005
Ser Glu Lys Ser Ser Ala Leu Thr Arg Leu Lys Glu Gly Gly Ala Leu
1010 1015 1020
Pro Tyr Asp Ala Ile Ile Val Asp Ser Ile Asp Thr Ala Arg Arg Leu
1025 1030 1035 1040
Arg Ala Val Asp Asp Phe Lys Tyr Leu Pro Ile Val Leu Leu Ala Pro
1045 1050 1055
Val Val His Val Ser Leu Lys Ser Cys Leu Asp Leu Gly Ile Thr Ser
1060 1065 1070
Tyr Met Thr Met Pro Cys Lys Leu Ile Asp Leu Ser Asn Gly Met Ile
1075 1080 1085
Pro Ala Leu Glu Asn Arg Ala Thr Pro Ser Leu Ala Asp Val Thr Lys
1090 1095 1100
Ser Phe Glu Ile Leu Leu Ala Glu Asp Asn Thr Val Asn Gln Lys Leu
1105 1110 1115 1120
Ala Val Lys Ile Leu Glu Lys Tyr His His Val Val Thr Val Val Gly
1125 1130 1135
Asn Gly Trp Glu Ala Val Glu Ala Val Lys Gln Lys Lys Phe Asp Val
1140 1145 1150
Ile Leu Met Asp Val Gln Met Pro Ile Met Gly Gly Phe Glu Ala Thr
1155 1160 1165
Gly Lys Ile Arg Glu Tyr Glu Arg Gly Met Gly Thr His Arg Thr Pro
1170 1175 1180
Ile Ile Ala Leu Thr Ala His Ala Met Met Gly Asp Arg Glu Lys Cys
1185 1190 1195 1200
Ile Gln Ala Gln Met Asp Glu Tyr Leu Ser Lys Pro Leu Gln Gln Asn
1205 1210 1215
Gln Leu Ile Gln Thr Ile Leu Lys Cys Ala Thr Leu Gly Gly Ala Leu
1220 1225 1230
Leu Glu Lys Asn Arg Glu Arg Glu Leu Ala Leu Gln Ala Glu Ala Lys
1235 1240 1245
Ala Ser Gly Arg Leu Asp Gly Glu Arg Gly Met Leu Arg Pro Gly Leu
1250 1255 1260
Glu Gly Arg Ser Phe Thr Thr Arg Glu Pro Met Thr Lys Ser Arg Pro
1265 1270 1275 1280
Ser Leu Thr Lys Ala Thr Ser Lys Ala Leu Glu Glu Ala Arg Asn Ala
1285 1290 1295
Ala Ala Ala Asn Ala Gly Leu Arg Phe Ser Glu Leu Thr Gly Phe Ser
1300 1305 1310
Ala Asp Leu Met Glu Glu Leu Asp Asn Met Glu Asp Glu Asp Ser Phe
1315 1320 1325
Thr Lys Ala Arg Glu Asp Leu Ala Asp Arg Arg Ser Leu Ser Ser
1330 1335 1340
Claims (31)
- 모 균주로부터 유래된 사상성 진균(filamentous fungus)의 변이체 균주로서, 변이체 균주는 서열 번호 2, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 31, 서열 번호 33 또는 서열 번호 35와 약 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 변이체 균주의 세포는 모 세포에 비해 점도 감소 표현형을 포함하는, 변이체 균주.
- 제1항에 있어서, 변이체 균주는 액침 배양(submerged culture)에서의 호기성 발효 동안 (i) 모 균주의 세포에 비해 미리 선택된 용존 산소 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, (ii) 모 균주의 세포에 비해 미리 선택된 양의 교반에서 증가한 용존 산소 함량을 유지시키는 세포 브로스를 생성하는, 변이체 균주.
- 제1항에 있어서, SSB7 단백질을 암호화하는 유전자의 유전자 변형은 SSB7 단백질을 암호화하는 유전자의 적어도 3' 영역을 결실시키거나 파괴시키는 것을 포함하는, 변이체 균주.
- 제1항에 있어서, 관심 단백질을 암호화하는 유전자를 추가로 포함하는, 변이체 균주.
- 제4항에 있어서, 변이체 균주는 바이오매스의 단위량당 모 균주와 실질적으로 동일한 양의 관심 단백질을 생산하는, 변이체 균주.
- 제4항에 있어서, 변이체 균주는 바이오매스의 단위량당 모 균주보다 더 많은 관심 단백질을 생산하는, 변이체 균주.
- 제1항에 있어서, 사상성 진균은 자낭균류(Ascomycota) 문인, 변이체 균주.
- 제1항에 있어서, 사상성 진균은 트리코데르마 종(Trichoderma sp.) 진균, 푸사륨 종(Fusarium sp.) 진균, 뉴로스포라 종(Neurospora sp.) 진균, 마이셀리오프토라 종(Myceliophthora sp.) 진균, 탈라로마이세스 종(Talaromyces sp.) 진균, 아스페르길루스 종(Aspergillus sp.) 진균 및 페니실륨 종(Penicillium sp.) 진균으로 이루어진 군으로부터 선택되는, 변이체 균주.
- 제4항의 변이체 균주에 의해 생산된 관심 단백질.
- 제1항에 있어서, MPG1 단백질, SFB3 단백질, SEB1 단백질, CRZ1 단백질 및/또는 GAS1 단백질을 암호화하는 하나 이상의 유전자의 유전자 변형을 추가로 포함하는, 변이체 균주.
- 제1항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 1의 ssb7 유전자 또는 이의 상보성 서열과 혼성화하는, 변이체 균주.
- 제1항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 19, 서열 번호 20 또는 서열 번호 21의 ssb7 엑손 또는 이의 상보성 서열과 혼성화하는, 변이체 균주.
- 제1항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 22의 영역 A, 서열 번호 23의 영역 B, 서열 번호 24의 영역 C 또는 서열 번호 25의 영역 D를 암호화하는 핵산 서열 또는 이의 상보성 서열과 혼성화하는, 변이체 균주.
- 제1항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 SSB7 단백질의 보존된 아미노산 서열을 암호화하는 핵산 서열 또는 이의 상보성 서열과 혼성화하고, 보존된 서열은 서열 번호 26 내지 30으로 이루어진 군으로부터 선택되는, 변이체 균주.
- 사상성 진균 세포의 점도 감소 균주를 작제하는 방법으로서,
(a) 사상성 진균 세포의 모 균주를 수득하고, 서열 번호 2, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 31, 서열 번호 33 또는 서열 번호 35와 적어도 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 유전자를 유전자 변형시키는 단계, 및
(b) 단계 (a)에서 생산된 변이체 균주를 단리시키는 단계이되, 변이체 균주의 세포는 모 세포에 비해 점도 감소 표현형을 포함하는 단계를 포함하는, 방법. - 제15항에 있어서, 변이체 균주는 액침 배양에서의 호기성 발효 동안 (a) 모 균주의 세포에 비해 미리 선택된 용존 산소 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, (b) 모 균주의 세포에 비해 미리 선택된 양의 교반에서 증가한 용존 산소 함량을 유지시키는 세포 브로스를 생성하는, 방법.
- 제15항에 있어서, SSB7 단백질을 암호화하는 유전자의 유전자 변형은 SSB7 단백질을 암호화하는 유전자의 적어도 3' 영역을 결실시키거나 파괴시키는 것을 포함하는, 방법.
- 제15항에 있어서, 진균 세포는 관심 단백질을 암호화하는 유전자를 추가로 포함하는, 방법.
- 제18항에 있어서, 변이체 균주는 바이오매스의 단위량당 모 균주와 실질적으로 동일한 양의 관심 단백질을 생산하는, 방법.
- 제18항에 있어서, 변이체 균주는 바이오매스의 단위량당 모 균주보다 더 많은 관심 단백질을 생산하는, 방법.
- 제18항에 있어서, 사상성 진균은 자낭균류 문인, 방법.
- 제18항에 있어서, 사상성 진균은 트리코데르마 종 진균, 푸사륨 종 진균, 뉴로스포라 종 진균, 마이셀리오프토라 종 진균, 탈라로마이세스 종 진균, 아스페르길루스 종 진균 및 페니실륨 종 진균으로 이루어진 군으로부터 선택되는, 방법.
- 제18항의 방법에 따라 생산된 관심 단백질.
- 제15항에 있어서, MPG1 단백질, SFB3 단백질, SEB1 단백질, CRZ1 단백질 및/또는 GAS1 단백질을 암호화하는 하나 이상의 유전자의 유전자 변형을 추가로 포함하는, 방법.
- 제15항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 1의 ssb7 유전자 또는 이의 상보성 서열과 혼성화하는, 방법.
- 제15항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 19, 서열 번호 20 또는 서열 번호 21의 ssb7 엑손 또는 이의 상보성 서열과 혼성화하는, 방법.
- 제15항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 22의 영역 A, 서열 번호 23의 영역 B, 서열 번호 24의 영역 C 또는 서열 번호 25의 영역 D를 암호화하는 핵산 서열 또는 이의 상보성 서열과 혼성화하는, 방법.
- 제15항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 SSB7 단백질의 보존된 아미노산 서열을 암호화하는 핵산 서열 또는 이의 상보성 서열과 혼성화하고, 보존된 서열은 서열 번호 26 내지 30으로 이루어진 군으로부터 선택되는, 방법.
- 점도 감소 표현형을 포함하는 사상성 진균 세포의 변이체 균주를 스크리닝하고 단리시키는 방법으로서,
(a) 서열 번호 2, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 31, 서열 번호 33 또는 서열 번호 35와 적어도 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 모 진균 균주에서의 유전자를 유전자 변형시키는 단계,
(b) 모 균주의 세포 형태에 대하여 점도 감소 표현형을 위해 단계 (a)의 변형된 변이체 균주의 세포 형태를 스크리닝하는 단계, 및
(c) 점도 감소 표현형을 포함하는 단계 (b)의 변형된 변이체 균주를 단리시키는 단계를 포함하는, 방법. - 제29항에 있어서, 변이체 균주는 액침 배양에서의 호기성 발효 동안 (a) 모 균주의 세포에 비해 미리 선택된 용존 산소 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, (b) 모 균주의 세포에 비해 미리 선택된 양의 교반에서 증가한 용존 산소 함량을 유지시키는 세포 브로스를 생성하는, 방법.
- 제29항에 있어서, 점도 감소 표현형을 포함하는 단계 (c)의 변이체 균주는 모 균주에 비해 더 짧은 균사 필라멘트를 포함하는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862661658P | 2018-04-24 | 2018-04-24 | |
US62/661,658 | 2018-04-24 | ||
PCT/US2019/027590 WO2019209576A1 (en) | 2018-04-24 | 2019-04-16 | Filamentous fungal strains comprising reduced viscosity phenotypes |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210005054A true KR20210005054A (ko) | 2021-01-13 |
Family
ID=66647442
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207032226A KR20210005054A (ko) | 2018-04-24 | 2019-04-16 | 점도 감소 표현형을 포함하는 사상성 진균 균주 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11976266B2 (ko) |
EP (1) | EP3755710A1 (ko) |
JP (1) | JP7376505B2 (ko) |
KR (1) | KR20210005054A (ko) |
CN (1) | CN112074530A (ko) |
WO (1) | WO2019209576A1 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220057464A (ko) * | 2020-10-29 | 2022-05-09 | 씨제이제일제당 (주) | 점액질 생성능이 저감된 미생물 및 이를 이용한 대두 발효물 |
EP4015642A1 (en) * | 2020-12-16 | 2022-06-22 | Clariant Produkte (Deutschland) GmbH | Process for the production of a filamentous fungus whole broth enzyme composition with low biomass formation and high protein yield |
EP4015641A1 (en) * | 2020-12-16 | 2022-06-22 | Clariant Produkte (Deutschland) GmbH | Process for the production of a filamentous fungus whole broth enzyme composition with low biomass formation and high protein yield |
EP4015640A1 (en) * | 2020-12-16 | 2022-06-22 | Clariant Produkte (Deutschland) GmbH | Process for the production of a filamentous fungus whole broth enzyme composition with low viscosity |
CN112592941B (zh) * | 2020-12-31 | 2023-06-27 | 河南巨龙生物工程股份有限公司 | 一种降低l-组氨酸发酵液粘度的方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1380905A (zh) | 2000-04-13 | 2002-11-20 | 马克·阿龙·埃马尔法尔布 | 丝状真菌中dna表达文库的高通量筛选 |
KR102004003B1 (ko) | 2010-08-25 | 2019-07-25 | 다니스코 유에스 인크. | 변경된 점성 표현형을 갖는 사상균 |
US9587242B2 (en) | 2011-04-22 | 2017-03-07 | Danisco Us Inc. | Filamentous fungi having an altered viscosity phenotype |
BR112013025430A2 (pt) | 2011-04-22 | 2016-11-29 | Danisco Us Inc | "cepas variantes de fundos filamentosos tendo modificação genética para maior produção de proteína mpg1 e crescimento alterado e seu método de produção". |
CN107223157B (zh) | 2014-12-16 | 2021-01-08 | 丹尼斯科美国公司 | 用于辅助菌株介导的真菌基因组修饰的组合物和方法 |
AU2015362784B2 (en) | 2014-12-16 | 2021-05-13 | Danisco Us Inc | Fungal genome modification systems and methods of use |
CN108064267A (zh) | 2015-02-09 | 2018-05-22 | 丹尼斯科美国公司 | 真菌菌株及使用方法 |
-
2019
- 2019-04-16 WO PCT/US2019/027590 patent/WO2019209576A1/en unknown
- 2019-04-16 US US17/042,308 patent/US11976266B2/en active Active
- 2019-04-16 JP JP2020559404A patent/JP7376505B2/ja active Active
- 2019-04-16 CN CN201980027119.9A patent/CN112074530A/zh active Pending
- 2019-04-16 EP EP19726524.2A patent/EP3755710A1/en active Pending
- 2019-04-16 KR KR1020207032226A patent/KR20210005054A/ko not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
JP2021521821A (ja) | 2021-08-30 |
EP3755710A1 (en) | 2020-12-30 |
US20210017487A1 (en) | 2021-01-21 |
JP7376505B2 (ja) | 2023-11-08 |
US11976266B2 (en) | 2024-05-07 |
WO2019209576A1 (en) | 2019-10-31 |
CN112074530A (zh) | 2020-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20210005054A (ko) | 점도 감소 표현형을 포함하는 사상성 진균 균주 | |
JP6725513B2 (ja) | ヘルパー株媒介型真菌ゲノム改変用の組成物および方法 | |
KR20170087521A (ko) | 진균 게놈 변형 시스템 및 사용 방법 | |
KR101952469B1 (ko) | 변경된 점성 표현형을 갖는 사상균 | |
JP2018525983A (ja) | ゲノム編集システムおよび使用方法 | |
CN113366108A (zh) | 新颖启动子序列及其增强芽孢杆菌属细胞蛋白生产的方法 | |
KR20140033053A (ko) | 변경된 점성 표현형을 갖는 사상균 | |
RU2608639C2 (ru) | Мицелиальные грибы, имеющие фенотип измененной вязкости | |
KR20220097451A (ko) | 향상된 단백질 생산성 표현형을 포함하는 진균 균주 및 이의 방법 | |
JP2021510070A (ja) | タンパク質の産生増加のための変異及び遺伝子改変バチルス属(bacillus)細胞、並びにその方法 | |
US20230174998A1 (en) | Compositions and methods for enhanced protein production in filamentous fungal cells | |
US12116605B2 (en) | Mutant and genetically modified filamentous fungal strains comprising enhanced protein productivity phenotypes and methods thereof | |
WO2024102556A1 (en) | Filamentous fungal strains comprising enhanced protein productivity phenotypes and methods thereof | |
KR20240110854A (ko) | 진균 세포에서의 향상된 단백질 생산을 위한 조성물 및 방법 | |
US9765322B2 (en) | Pectin degrading enzymes from macrophomina phaseolina and uses thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal |