KR101530765B1 - 글리세롤-3-인산 아실기 전이 효소 호몰로그와 그 이용 - Google Patents
글리세롤-3-인산 아실기 전이 효소 호몰로그와 그 이용 Download PDFInfo
- Publication number
- KR101530765B1 KR101530765B1 KR1020127022357A KR20127022357A KR101530765B1 KR 101530765 B1 KR101530765 B1 KR 101530765B1 KR 1020127022357 A KR1020127022357 A KR 1020127022357A KR 20127022357 A KR20127022357 A KR 20127022357A KR 101530765 B1 KR101530765 B1 KR 101530765B1
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ser
- ala
- val
- gly
- Prior art date
Links
- 101710091951 Glycerol-3-phosphate acyltransferase Proteins 0.000 title abstract description 139
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 329
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 303
- 239000002773 nucleotide Substances 0.000 claims abstract description 231
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 231
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 165
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 164
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 164
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 148
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims abstract description 66
- 235000014113 dietary fatty acids Nutrition 0.000 claims description 150
- 239000000194 fatty acid Substances 0.000 claims description 150
- 229930195729 fatty acid Natural products 0.000 claims description 150
- 150000004665 fatty acids Chemical class 0.000 claims description 150
- 239000000203 mixture Substances 0.000 claims description 105
- 239000013598 vector Substances 0.000 claims description 63
- 150000002632 lipids Chemical class 0.000 claims description 45
- 238000004519 manufacturing process Methods 0.000 claims description 35
- 238000012258 culturing Methods 0.000 claims description 13
- 235000018102 proteins Nutrition 0.000 description 299
- 230000000694 effects Effects 0.000 description 177
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 135
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 135
- 238000000034 method Methods 0.000 description 78
- 108020004414 DNA Proteins 0.000 description 66
- 241000907999 Mortierella alpina Species 0.000 description 58
- YZXBAPSDXZZRGB-DOFZRALJSA-N arachidonic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O YZXBAPSDXZZRGB-DOFZRALJSA-N 0.000 description 56
- 235000001014 amino acid Nutrition 0.000 description 52
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 52
- DCXXMTOCNZCJGO-UHFFFAOYSA-N tristearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(OC(=O)CCCCCCCCCCCCCCCCC)COC(=O)CCCCCCCCCCCCCCCCC DCXXMTOCNZCJGO-UHFFFAOYSA-N 0.000 description 51
- 239000013612 plasmid Substances 0.000 description 50
- 229940024606 amino acid Drugs 0.000 description 48
- 150000001413 amino acids Chemical class 0.000 description 48
- 210000004027 cell Anatomy 0.000 description 47
- SECPZKHBENQXJG-FPLPWBNLSA-N palmitoleic acid Chemical compound CCCCCC\C=C/CCCCCCCC(O)=O SECPZKHBENQXJG-FPLPWBNLSA-N 0.000 description 40
- 239000002609 medium Substances 0.000 description 37
- 239000002299 complementary DNA Substances 0.000 description 35
- 230000000295 complement effect Effects 0.000 description 34
- 239000012634 fragment Substances 0.000 description 33
- 235000013305 food Nutrition 0.000 description 29
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 28
- 229940114079 arachidonic acid Drugs 0.000 description 28
- 235000021342 arachidonic acid Nutrition 0.000 description 28
- 241000282326 Felis catus Species 0.000 description 27
- 235000021314 Palmitic acid Nutrition 0.000 description 26
- 238000009396 hybridization Methods 0.000 description 26
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 25
- 230000014509 gene expression Effects 0.000 description 24
- 125000000539 amino acid group Chemical group 0.000 description 23
- 230000007812 deficiency Effects 0.000 description 23
- 238000006467 substitution reaction Methods 0.000 description 22
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 21
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 21
- 108010050848 glycylleucine Proteins 0.000 description 21
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 21
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 20
- 235000021319 Palmitoleic acid Nutrition 0.000 description 20
- SECPZKHBENQXJG-UHFFFAOYSA-N cis-palmitoleic acid Natural products CCCCCCC=CCCCCCCCC(O)=O SECPZKHBENQXJG-UHFFFAOYSA-N 0.000 description 20
- 239000000523 sample Substances 0.000 description 20
- 238000010367 cloning Methods 0.000 description 18
- 238000012360 testing method Methods 0.000 description 18
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 17
- 108091028043 Nucleic acid sequence Proteins 0.000 description 17
- 108700016155 Acyl transferases Proteins 0.000 description 16
- 229920001817 Agar Polymers 0.000 description 16
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 16
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 16
- 239000008272 agar Substances 0.000 description 16
- 239000013604 expression vector Substances 0.000 description 16
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 15
- 108010034529 leucyl-lysine Proteins 0.000 description 15
- 241000894006 Bacteria Species 0.000 description 14
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 14
- 108091008146 restriction endonucleases Proteins 0.000 description 14
- 102000057234 Acyl transferases Human genes 0.000 description 13
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 12
- 230000004071 biological effect Effects 0.000 description 12
- 239000008103 glucose Substances 0.000 description 12
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 12
- 235000020777 polyunsaturated fatty acids Nutrition 0.000 description 12
- 102100040679 Dihydroxyacetone phosphate acyltransferase Human genes 0.000 description 11
- 101001039272 Homo sapiens Dihydroxyacetone phosphate acyltransferase Proteins 0.000 description 11
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 11
- 108700026244 Open Reading Frames Proteins 0.000 description 11
- 239000002253 acid Substances 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 108010018837 Glycerol-3-Phosphate O-Acyltransferase Proteins 0.000 description 10
- 102000002754 Glycerol-3-Phosphate O-Acyltransferase Human genes 0.000 description 10
- 101100229953 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SCT1 gene Proteins 0.000 description 10
- 101100194362 Schizosaccharomyces pombe (strain 972 / ATCC 24843) res1 gene Proteins 0.000 description 10
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 10
- 108010078144 glutaminyl-glycine Proteins 0.000 description 10
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 10
- 108010061238 threonyl-glycine Proteins 0.000 description 10
- 241000588724 Escherichia coli Species 0.000 description 9
- 101150017311 GPAT gene Proteins 0.000 description 9
- XYZZKVRWGOWVGO-UHFFFAOYSA-N Glycerol-phosphate Chemical compound OP(O)(O)=O.OCC(O)CO XYZZKVRWGOWVGO-UHFFFAOYSA-N 0.000 description 9
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 9
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 9
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 9
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 9
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 9
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 9
- 239000004472 Lysine Substances 0.000 description 9
- 108010013835 arginine glutamate Proteins 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 229930182830 galactose Natural products 0.000 description 9
- 108010089804 glycyl-threonine Proteins 0.000 description 9
- 229930182817 methionine Natural products 0.000 description 9
- 244000005700 microbiome Species 0.000 description 9
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 9
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 9
- 239000004475 Arginine Substances 0.000 description 8
- 241000196324 Embryophyta Species 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 8
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 8
- 241000235575 Mortierella Species 0.000 description 8
- 101150059317 SCT1 gene Proteins 0.000 description 8
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 8
- 239000004473 Threonine Substances 0.000 description 8
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 8
- 125000002252 acyl group Chemical group 0.000 description 8
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 8
- 108010087924 alanylproline Proteins 0.000 description 8
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 8
- 230000003321 amplification Effects 0.000 description 8
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 8
- 108010068380 arginylarginine Proteins 0.000 description 8
- 235000003704 aspartic acid Nutrition 0.000 description 8
- 108010068265 aspartyltyrosine Proteins 0.000 description 8
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 108010081551 glycylphenylalanine Proteins 0.000 description 8
- 108010064235 lysylglycine Proteins 0.000 description 8
- 229910052757 nitrogen Inorganic materials 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 8
- 150000003904 phospholipids Chemical class 0.000 description 8
- 108091033319 polynucleotide Proteins 0.000 description 8
- 102000040430 polynucleotide Human genes 0.000 description 8
- 239000002157 polynucleotide Substances 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 229940035893 uracil Drugs 0.000 description 8
- 102100033814 Alanine aminotransferase 2 Human genes 0.000 description 7
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 7
- 108700024394 Exon Proteins 0.000 description 7
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 7
- 101000779415 Homo sapiens Alanine aminotransferase 2 Proteins 0.000 description 7
- 108091092195 Intron Proteins 0.000 description 7
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 7
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 7
- 108091081024 Start codon Proteins 0.000 description 7
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 7
- 108010005233 alanylglutamic acid Proteins 0.000 description 7
- 108010044940 alanylglutamine Proteins 0.000 description 7
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 7
- 229940041514 candida albicans extract Drugs 0.000 description 7
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 7
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 7
- 235000013922 glutamic acid Nutrition 0.000 description 7
- 239000004220 glutamic acid Substances 0.000 description 7
- 108010015792 glycyllysine Proteins 0.000 description 7
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 7
- 108010085325 histidylproline Proteins 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 108010031719 prolyl-serine Proteins 0.000 description 7
- 108010048818 seryl-histidine Proteins 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 239000004474 valine Substances 0.000 description 7
- 239000012138 yeast extract Substances 0.000 description 7
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 6
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 6
- 102100025376 Glycerol-3-phosphate acyltransferase 4 Human genes 0.000 description 6
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 6
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 6
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 6
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 6
- 108010079364 N-glycylalanine Proteins 0.000 description 6
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 6
- 108010077245 asparaginyl-proline Proteins 0.000 description 6
- 108010047857 aspartylglycine Proteins 0.000 description 6
- 235000021588 free fatty acids Nutrition 0.000 description 6
- 108010087823 glycyltyrosine Proteins 0.000 description 6
- FUKUFMFMCZIRNT-UHFFFAOYSA-N hydron;methanol;chloride Chemical compound Cl.OC FUKUFMFMCZIRNT-UHFFFAOYSA-N 0.000 description 6
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 6
- 229960004488 linolenic acid Drugs 0.000 description 6
- 108010054155 lysyllysine Proteins 0.000 description 6
- 239000012528 membrane Substances 0.000 description 6
- 108010056582 methionylglutamic acid Proteins 0.000 description 6
- 150000004702 methyl esters Chemical class 0.000 description 6
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 6
- 239000002904 solvent Substances 0.000 description 6
- 230000001131 transforming effect Effects 0.000 description 6
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 5
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 5
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 5
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 5
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 5
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 5
- -1 D-amino acids Chemical class 0.000 description 5
- 241000233866 Fungi Species 0.000 description 5
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 5
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 5
- 101710199766 Glycerol-3-phosphate acyltransferase 4 Proteins 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 5
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 5
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 5
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 5
- 239000005642 Oleic acid Substances 0.000 description 5
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 5
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 5
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 5
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 5
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 5
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 5
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 5
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 5
- JAZBEHYOTPTENJ-JLNKQSITSA-N all-cis-5,8,11,14,17-icosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O JAZBEHYOTPTENJ-JLNKQSITSA-N 0.000 description 5
- 108010038633 aspartylglutamate Proteins 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 150000001982 diacylglycerols Chemical class 0.000 description 5
- 238000004817 gas chromatography Methods 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 5
- 108010057821 leucylproline Proteins 0.000 description 5
- 108010003700 lysyl aspartic acid Proteins 0.000 description 5
- 108010009298 lysylglutamic acid Proteins 0.000 description 5
- 108010017391 lysylvaline Proteins 0.000 description 5
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 5
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 108010015796 prolylisoleucine Proteins 0.000 description 5
- 108010053725 prolylvaline Proteins 0.000 description 5
- 108010026333 seryl-proline Proteins 0.000 description 5
- WRGQSWVCFNIUNZ-GDCKJWNLSA-N 1-oleoyl-sn-glycerol 3-phosphate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@@H](O)COP(O)(O)=O WRGQSWVCFNIUNZ-GDCKJWNLSA-N 0.000 description 4
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 4
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 4
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 4
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 4
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 4
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 4
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 4
- 108700028369 Alleles Proteins 0.000 description 4
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 4
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 4
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 4
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 4
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 4
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 4
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 4
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 4
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 4
- 101150079757 GPT2 gene Proteins 0.000 description 4
- WOACHWLUOFZLGJ-GUBZILKMSA-N Gln-Arg-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O WOACHWLUOFZLGJ-GUBZILKMSA-N 0.000 description 4
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 4
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 4
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 4
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 4
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 4
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 4
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 4
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 4
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 4
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 4
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 4
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 4
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 4
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 4
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 4
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 4
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 4
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 4
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 4
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 4
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 4
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 4
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 4
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 4
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 4
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 4
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 4
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 4
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 4
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 4
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 4
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 4
- 108010079005 RDV peptide Proteins 0.000 description 4
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 4
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 4
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 4
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 4
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 4
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 4
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 4
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 4
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 4
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 4
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 4
- 108700019146 Transgenes Proteins 0.000 description 4
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 4
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 4
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 4
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 4
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 4
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 4
- 229960005305 adenosine Drugs 0.000 description 4
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 4
- AWUCVROLDVIAJX-UHFFFAOYSA-N alpha-glycerophosphate Natural products OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- JAZBEHYOTPTENJ-UHFFFAOYSA-N eicosapentaenoic acid Natural products CCC=CCC=CCC=CCC=CCC=CCCCC(O)=O JAZBEHYOTPTENJ-UHFFFAOYSA-N 0.000 description 4
- 229960005135 eicosapentaenoic acid Drugs 0.000 description 4
- 235000020673 eicosapentaenoic acid Nutrition 0.000 description 4
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 4
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 108010018006 histidylserine Proteins 0.000 description 4
- 108010012058 leucyltyrosine Proteins 0.000 description 4
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 4
- 108010038320 lysylphenylalanine Proteins 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 235000015097 nutrients Nutrition 0.000 description 4
- 239000003921 oil Substances 0.000 description 4
- 235000019198 oils Nutrition 0.000 description 4
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 101150112552 plsB gene Proteins 0.000 description 4
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 4
- 239000000843 powder Substances 0.000 description 4
- 108010065320 prolyl-lysyl-glutamyl-lysine Proteins 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 238000003757 reverse transcription PCR Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 238000010187 selection method Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000004809 thin layer chromatography Methods 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- MKPCNMXYTMQZBE-UHFFFAOYSA-N 7h-purin-6-amine;sulfuric acid;dihydrate Chemical compound O.O.OS(O)(=O)=O.NC1=NC=NC2=C1NC=N2.NC1=NC=NC2=C1NC=N2 MKPCNMXYTMQZBE-UHFFFAOYSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 3
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 3
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 3
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 3
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 3
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 3
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 3
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 3
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 3
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 3
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 3
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 3
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 3
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 3
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 3
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 3
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 3
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 3
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 3
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 3
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 3
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 3
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 3
- JNCRAQVYJZGIOW-QSFUFRPTSA-N Asn-Val-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNCRAQVYJZGIOW-QSFUFRPTSA-N 0.000 description 3
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 3
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 3
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 3
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 3
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 3
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 3
- 241000950446 Chaetomium globosum CBS 148.51 Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 3
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 3
- QFXNFFZTMFHPST-DZKIICNBSA-N Gln-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)N)N QFXNFFZTMFHPST-DZKIICNBSA-N 0.000 description 3
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 3
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 3
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 3
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 3
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 3
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 3
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 3
- DENRBIYENOKSEX-PEXQALLHSA-N Gly-Ile-His Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DENRBIYENOKSEX-PEXQALLHSA-N 0.000 description 3
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 3
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 3
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 3
- 235000010469 Glycine max Nutrition 0.000 description 3
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 3
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 3
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 3
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 3
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 3
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 3
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 3
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 3
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 3
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- XVSJMWYYLHPDKY-DCAQKATOSA-N Leu-Asp-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O XVSJMWYYLHPDKY-DCAQKATOSA-N 0.000 description 3
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 3
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 3
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 3
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 3
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 3
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 3
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 3
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 3
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 3
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 3
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 3
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 3
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 3
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 3
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 3
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 3
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 3
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 3
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 3
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 3
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 3
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 3
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 3
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 3
- OXKJSGGTHFMGDT-UFYCRDLUSA-N Phe-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 OXKJSGGTHFMGDT-UFYCRDLUSA-N 0.000 description 3
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 3
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 3
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 3
- BFXZQMWKTYWGCF-PYJNHQTQSA-N Pro-His-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BFXZQMWKTYWGCF-PYJNHQTQSA-N 0.000 description 3
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 3
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 3
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 3
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 3
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 3
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 3
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 3
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 3
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 3
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 3
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 3
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 3
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 3
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 3
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 3
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 3
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 3
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 3
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 3
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 3
- RPECVQBNONKZAT-WZLNRYEVSA-N Thr-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H]([C@@H](C)O)N RPECVQBNONKZAT-WZLNRYEVSA-N 0.000 description 3
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 3
- JFDGVHXRCKEBAU-KKUMJFAQSA-N Tyr-Asp-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JFDGVHXRCKEBAU-KKUMJFAQSA-N 0.000 description 3
- YYZPVPJCOGGQPC-JYJNAYRXSA-N Tyr-His-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYZPVPJCOGGQPC-JYJNAYRXSA-N 0.000 description 3
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 3
- DJSYPCWZPNHQQE-FHWLQOOXSA-N Tyr-Tyr-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=C(O)C=C1 DJSYPCWZPNHQQE-FHWLQOOXSA-N 0.000 description 3
- 240000003482 Ustilago maydis 521 Species 0.000 description 3
- 235000016110 Ustilago maydis 521 Nutrition 0.000 description 3
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 3
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 3
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 3
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 3
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 3
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 3
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 3
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 3
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 3
- WSUWDIVCPOJFCX-TUAOUCFPSA-N Val-Met-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N WSUWDIVCPOJFCX-TUAOUCFPSA-N 0.000 description 3
- FMQGYTMERWBMSI-HJWJTTGWSA-N Val-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N FMQGYTMERWBMSI-HJWJTTGWSA-N 0.000 description 3
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 3
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 3
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 3
- 239000011543 agarose gel Substances 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- MBMBGCFOFBJSGT-KUBAVDMBSA-N all-cis-docosa-4,7,10,13,16,19-hexaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCC(O)=O MBMBGCFOFBJSGT-KUBAVDMBSA-N 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 3
- 235000009508 confectionery Nutrition 0.000 description 3
- 239000002537 cosmetic Substances 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 235000015872 dietary supplement Nutrition 0.000 description 3
- HOBAELRKJCKHQD-QNEBEIHSSA-N dihomo-γ-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCCCC(O)=O HOBAELRKJCKHQD-QNEBEIHSSA-N 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 235000013350 formula milk Nutrition 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 108010084389 glycyltryptophan Proteins 0.000 description 3
- 239000006455 gy-medium Substances 0.000 description 3
- 235000013402 health food Nutrition 0.000 description 3
- 108010036413 histidylglycine Proteins 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 3
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 3
- 108010091871 leucylmethionine Proteins 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 230000003228 microsomal effect Effects 0.000 description 3
- 108010012581 phenylalanylglutamate Proteins 0.000 description 3
- 230000002028 premature Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 108010029020 prolylglycine Proteins 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 108010071207 serylmethionine Proteins 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 150000003626 triacylglycerols Chemical class 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 2
- HOBAELRKJCKHQD-UHFFFAOYSA-N (8Z,11Z,14Z)-8,11,14-eicosatrienoic acid Natural products CCCCCC=CCC=CCC=CCCCCCCC(O)=O HOBAELRKJCKHQD-UHFFFAOYSA-N 0.000 description 2
- PORPENFLTBBHSG-MGBGTMOVSA-N 1,2-dihexadecanoyl-sn-glycerol-3-phosphate Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(O)=O)OC(=O)CCCCCCCCCCCCCCC PORPENFLTBBHSG-MGBGTMOVSA-N 0.000 description 2
- OGNSCSPNOLGXSM-UHFFFAOYSA-N 2,4-diaminobutyric acid Chemical compound NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- OYIFNHCXNCRBQI-UHFFFAOYSA-N 2-aminoadipic acid Chemical compound OC(=O)C(N)CCCC(O)=O OYIFNHCXNCRBQI-UHFFFAOYSA-N 0.000 description 2
- PECYZEOJVXMISF-UHFFFAOYSA-N 3-aminoalanine Chemical compound [NH3+]CC(N)C([O-])=O PECYZEOJVXMISF-UHFFFAOYSA-N 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- WYPUMLRSQMKIJU-BPNCWPANSA-N Ala-Arg-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WYPUMLRSQMKIJU-BPNCWPANSA-N 0.000 description 2
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 2
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 2
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 2
- FOWHQTWRLFTELJ-FXQIFTODSA-N Ala-Asp-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N FOWHQTWRLFTELJ-FXQIFTODSA-N 0.000 description 2
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 2
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 2
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 2
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 2
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 2
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 2
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- 108010076441 Ala-His-His Proteins 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 2
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 2
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 2
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 2
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 2
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 2
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 2
- SGFBVLBKDSXGAP-GKCIPKSASA-N Ala-Phe-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N SGFBVLBKDSXGAP-GKCIPKSASA-N 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 2
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 2
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 2
- 102100039239 Amidophosphoribosyltransferase Human genes 0.000 description 2
- 108010039224 Amidophosphoribosyltransferase Proteins 0.000 description 2
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 2
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 2
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 2
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 2
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 2
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 2
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 2
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 2
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 2
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 2
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 2
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 2
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 2
- VVJTWSRNMJNDPN-IUCAKERBSA-N Arg-Met-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O VVJTWSRNMJNDPN-IUCAKERBSA-N 0.000 description 2
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 2
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 2
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 2
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 2
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 2
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 2
- FBXMCPLCVYUWBO-BPUTZDHNSA-N Arg-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N FBXMCPLCVYUWBO-BPUTZDHNSA-N 0.000 description 2
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 2
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 2
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 2
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 2
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 2
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 2
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 2
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 2
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 2
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 2
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 2
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 2
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 2
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 2
- VXLBDJWTONZHJN-YUMQZZPRSA-N Asn-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N VXLBDJWTONZHJN-YUMQZZPRSA-N 0.000 description 2
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 2
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 2
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 2
- ALHMNHZJBYBYHS-DCAQKATOSA-N Asn-Lys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ALHMNHZJBYBYHS-DCAQKATOSA-N 0.000 description 2
- LZLCLRQMUQWUHJ-GUBZILKMSA-N Asn-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N LZLCLRQMUQWUHJ-GUBZILKMSA-N 0.000 description 2
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 2
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 2
- BKZFBJYIVSBXCO-KKUMJFAQSA-N Asn-Phe-His Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O BKZFBJYIVSBXCO-KKUMJFAQSA-N 0.000 description 2
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 2
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 2
- XCBKBPRFACFFOO-AQZXSJQPSA-N Asn-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O XCBKBPRFACFFOO-AQZXSJQPSA-N 0.000 description 2
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 2
- DPSUVAPLRQDWAO-YDHLFZDLSA-N Asn-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)N)N DPSUVAPLRQDWAO-YDHLFZDLSA-N 0.000 description 2
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 2
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 2
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 2
- CXBOKJPLEYUPGB-FXQIFTODSA-N Asp-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N CXBOKJPLEYUPGB-FXQIFTODSA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 2
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 2
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 2
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 2
- LXKLDWVHXNZQGB-SRVKXCTJSA-N Asp-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O LXKLDWVHXNZQGB-SRVKXCTJSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 2
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 2
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 2
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 2
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 2
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 2
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 2
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 2
- SARSTIZOZFBDOM-FXQIFTODSA-N Asp-Met-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SARSTIZOZFBDOM-FXQIFTODSA-N 0.000 description 2
- VMVUDJUXJKDGNR-FXQIFTODSA-N Asp-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N VMVUDJUXJKDGNR-FXQIFTODSA-N 0.000 description 2
- RRUWMFBLFLUZSI-LPEHRKFASA-N Asp-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N RRUWMFBLFLUZSI-LPEHRKFASA-N 0.000 description 2
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 2
- LIQNMKIBMPEOOP-IHRRRGAJSA-N Asp-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)O)N LIQNMKIBMPEOOP-IHRRRGAJSA-N 0.000 description 2
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 2
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 2
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 2
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 2
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 2
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 2
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 2
- 108010083946 Asp-Tyr-Leu-Lys Proteins 0.000 description 2
- XQFLFQWOBXPMHW-NHCYSSNCSA-N Asp-Val-His Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O XQFLFQWOBXPMHW-NHCYSSNCSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- GRNOCLDFUNCIDW-ACZMJKKPSA-N Cys-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N GRNOCLDFUNCIDW-ACZMJKKPSA-N 0.000 description 2
- XRTISHJEPHMBJG-SRVKXCTJSA-N Cys-Asp-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XRTISHJEPHMBJG-SRVKXCTJSA-N 0.000 description 2
- HAYVLBZZBDCKRA-SRVKXCTJSA-N Cys-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N HAYVLBZZBDCKRA-SRVKXCTJSA-N 0.000 description 2
- RESAHOSBQHMOKH-KKUMJFAQSA-N Cys-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N RESAHOSBQHMOKH-KKUMJFAQSA-N 0.000 description 2
- CNAMJJOZGXPDHW-IHRRRGAJSA-N Cys-Pro-Phe Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O CNAMJJOZGXPDHW-IHRRRGAJSA-N 0.000 description 2
- JLZCAZJGWNRXCI-XKBZYTNZSA-N Cys-Thr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O JLZCAZJGWNRXCI-XKBZYTNZSA-N 0.000 description 2
- JAHCWGSVNZXHRR-SVSWQMSJSA-N Cys-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)N JAHCWGSVNZXHRR-SVSWQMSJSA-N 0.000 description 2
- BOMGEMDZTNZESV-QWRGUYRKSA-N Cys-Tyr-Gly Chemical compound SC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 BOMGEMDZTNZESV-QWRGUYRKSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 206010059866 Drug resistance Diseases 0.000 description 2
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 2
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 2
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 2
- KYFSMWLWHYZRNW-ACZMJKKPSA-N Gln-Asp-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KYFSMWLWHYZRNW-ACZMJKKPSA-N 0.000 description 2
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 2
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 2
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 2
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 2
- DWDBJWAXPXXYLP-SRVKXCTJSA-N Gln-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DWDBJWAXPXXYLP-SRVKXCTJSA-N 0.000 description 2
- KQOPMGBHNQBCEL-HVTMNAMFSA-N Gln-His-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KQOPMGBHNQBCEL-HVTMNAMFSA-N 0.000 description 2
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 2
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 2
- JKGHMESJHRTHIC-SIUGBPQLSA-N Gln-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JKGHMESJHRTHIC-SIUGBPQLSA-N 0.000 description 2
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 2
- HSHCEAUPUPJPTE-JYJNAYRXSA-N Gln-Leu-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HSHCEAUPUPJPTE-JYJNAYRXSA-N 0.000 description 2
- DFRYZTUPVZNRLG-KKUMJFAQSA-N Gln-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DFRYZTUPVZNRLG-KKUMJFAQSA-N 0.000 description 2
- QZQYITIKPAUDGN-GVXVVHGQSA-N Gln-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QZQYITIKPAUDGN-GVXVVHGQSA-N 0.000 description 2
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 2
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 2
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 2
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 2
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 2
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 2
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 2
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 2
- ZZIFPJZQHRJERU-WDSKDSINSA-N Glu-Cys-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZZIFPJZQHRJERU-WDSKDSINSA-N 0.000 description 2
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 2
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 2
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 2
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 2
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 2
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 2
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 2
- NJPQBTJSYCKCNS-HVTMNAMFSA-N Glu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N NJPQBTJSYCKCNS-HVTMNAMFSA-N 0.000 description 2
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 2
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 2
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 2
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 2
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 2
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 2
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 2
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 2
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 2
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 2
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 2
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 2
- QOOFKCCZZWTCEP-AVGNSLFASA-N Glu-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QOOFKCCZZWTCEP-AVGNSLFASA-N 0.000 description 2
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 2
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 2
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 2
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 2
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 2
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 2
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 2
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 2
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 2
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 2
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 2
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 2
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 2
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 2
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 2
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 2
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 2
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 2
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 2
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 2
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 2
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 2
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 2
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 2
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 2
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 2
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 2
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 2
- CJGDTAHEMXLRMB-ULQDDVLXSA-N His-Arg-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CJGDTAHEMXLRMB-ULQDDVLXSA-N 0.000 description 2
- OBTMRGFRLJBSFI-GARJFASQSA-N His-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OBTMRGFRLJBSFI-GARJFASQSA-N 0.000 description 2
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 2
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 2
- HQKADFMLECZIQJ-HVTMNAMFSA-N His-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N HQKADFMLECZIQJ-HVTMNAMFSA-N 0.000 description 2
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 2
- FSOXZQBMPBQKGJ-QSFUFRPTSA-N His-Ile-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 FSOXZQBMPBQKGJ-QSFUFRPTSA-N 0.000 description 2
- VTZYMXGGXOFBMX-DJFWLOJKSA-N His-Ile-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O VTZYMXGGXOFBMX-DJFWLOJKSA-N 0.000 description 2
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 2
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 2
- ULRFSEJGSHYLQI-YESZJQIVSA-N His-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ULRFSEJGSHYLQI-YESZJQIVSA-N 0.000 description 2
- JGFWUKYIQAEYAH-DCAQKATOSA-N His-Ser-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JGFWUKYIQAEYAH-DCAQKATOSA-N 0.000 description 2
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 2
- YSMZBYPVVYSGOT-SZMVWBNQSA-N His-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N YSMZBYPVVYSGOT-SZMVWBNQSA-N 0.000 description 2
- ZNTSGDNUITWTRA-WDSOQIARSA-N His-Trp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O ZNTSGDNUITWTRA-WDSOQIARSA-N 0.000 description 2
- DRKZDEFADVYTLU-AVGNSLFASA-N His-Val-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DRKZDEFADVYTLU-AVGNSLFASA-N 0.000 description 2
- 101000639970 Homo sapiens Sodium- and chloride-dependent GABA transporter 1 Proteins 0.000 description 2
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 2
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 2
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 2
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 2
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 2
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 2
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 2
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 2
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 2
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 2
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 2
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 2
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 2
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 2
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 2
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 2
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 2
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 2
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 2
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 2
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 2
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 2
- RMJWFINHACYKJI-SIUGBPQLSA-N Ile-Tyr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RMJWFINHACYKJI-SIUGBPQLSA-N 0.000 description 2
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 2
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 2
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 2
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 2
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- 101150007280 LEU2 gene Proteins 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 2
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 2
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 2
- CUXRXAIAVYLVFD-ULQDDVLXSA-N Leu-Arg-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUXRXAIAVYLVFD-ULQDDVLXSA-N 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 2
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 2
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- WRLPVDVHNWSSCL-MELADBBJSA-N Leu-His-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N WRLPVDVHNWSSCL-MELADBBJSA-N 0.000 description 2
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 2
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 2
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 2
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 2
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 2
- VVQJGYPTIYOFBR-IHRRRGAJSA-N Leu-Lys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N VVQJGYPTIYOFBR-IHRRRGAJSA-N 0.000 description 2
- FIICHHJDINDXKG-IHPCNDPISA-N Leu-Lys-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FIICHHJDINDXKG-IHPCNDPISA-N 0.000 description 2
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 2
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 2
- FZMNAYBEFGZEIF-AVGNSLFASA-N Leu-Met-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N FZMNAYBEFGZEIF-AVGNSLFASA-N 0.000 description 2
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 2
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 2
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- HGUUMQWGYCVPKG-DCAQKATOSA-N Leu-Pro-Cys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HGUUMQWGYCVPKG-DCAQKATOSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- LSLUTXRANSUGFY-XIRDDKMYSA-N Leu-Trp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O LSLUTXRANSUGFY-XIRDDKMYSA-N 0.000 description 2
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 2
- ONHCDMBHPQIPAI-YTQUADARSA-N Leu-Trp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N ONHCDMBHPQIPAI-YTQUADARSA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 2
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 2
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 2
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 2
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 description 2
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 2
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 2
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 2
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- SSJBMGCZZXCGJJ-DCAQKATOSA-N Lys-Asp-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O SSJBMGCZZXCGJJ-DCAQKATOSA-N 0.000 description 2
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 2
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 2
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 2
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 2
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 2
- KZJQUYFDSCFSCO-DLOVCJGASA-N Lys-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N KZJQUYFDSCFSCO-DLOVCJGASA-N 0.000 description 2
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 2
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 2
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 2
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 2
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 2
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 2
- DAHQKYYIXPBESV-UWVGGRQHSA-N Lys-Met-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O DAHQKYYIXPBESV-UWVGGRQHSA-N 0.000 description 2
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 2
- MIROMRNASYKZNL-ULQDDVLXSA-N Lys-Pro-Tyr Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MIROMRNASYKZNL-ULQDDVLXSA-N 0.000 description 2
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 2
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 2
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 2
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 2
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 2
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 2
- BQVJARUIXRXDKN-DCAQKATOSA-N Met-Asn-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BQVJARUIXRXDKN-DCAQKATOSA-N 0.000 description 2
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 2
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 2
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 2
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 2
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 2
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 2
- CRVSHEPROQHVQT-AVGNSLFASA-N Met-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N CRVSHEPROQHVQT-AVGNSLFASA-N 0.000 description 2
- QLESZRANMSYLCZ-CYDGBPFRSA-N Met-Pro-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QLESZRANMSYLCZ-CYDGBPFRSA-N 0.000 description 2
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 2
- LUYURUYVNYGKGM-RCWTZXSCSA-N Met-Pro-Thr Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUYURUYVNYGKGM-RCWTZXSCSA-N 0.000 description 2
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 2
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 2
- VOAKKHOIAFKOQZ-JYJNAYRXSA-N Met-Tyr-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=C(O)C=C1 VOAKKHOIAFKOQZ-JYJNAYRXSA-N 0.000 description 2
- TWEWRDAAIYBJTO-ULQDDVLXSA-N Met-Tyr-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N TWEWRDAAIYBJTO-ULQDDVLXSA-N 0.000 description 2
- JHVNNUIQXOGAHI-KJEVXHAQSA-N Met-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N)O JHVNNUIQXOGAHI-KJEVXHAQSA-N 0.000 description 2
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 2
- IQJMEDDVOGMTKT-SRVKXCTJSA-N Met-Val-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IQJMEDDVOGMTKT-SRVKXCTJSA-N 0.000 description 2
- 241001219224 Mortierella elongata Species 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 2
- PLNHHOXNVSYKOB-JYJNAYRXSA-N Phe-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N PLNHHOXNVSYKOB-JYJNAYRXSA-N 0.000 description 2
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 2
- SXJGROGVINAYSH-AVGNSLFASA-N Phe-Gln-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SXJGROGVINAYSH-AVGNSLFASA-N 0.000 description 2
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 2
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 2
- ZKSLXIGKRJMALF-MGHWNKPDSA-N Phe-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N ZKSLXIGKRJMALF-MGHWNKPDSA-N 0.000 description 2
- BVHFFNYBKRTSIU-MEYUZBJRSA-N Phe-His-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BVHFFNYBKRTSIU-MEYUZBJRSA-N 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- KPEIBEPEUAZWNS-ULQDDVLXSA-N Phe-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KPEIBEPEUAZWNS-ULQDDVLXSA-N 0.000 description 2
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 2
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 2
- YOFKMVUAZGPFCF-IHRRRGAJSA-N Phe-Met-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O YOFKMVUAZGPFCF-IHRRRGAJSA-N 0.000 description 2
- JKJSIYKSGIDHPM-WBAXXEDZSA-N Phe-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O JKJSIYKSGIDHPM-WBAXXEDZSA-N 0.000 description 2
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 2
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 2
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 2
- ILGCZYGFYQLSDZ-KKUMJFAQSA-N Phe-Ser-His Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ILGCZYGFYQLSDZ-KKUMJFAQSA-N 0.000 description 2
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 2
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 2
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 2
- QUUCAHIYARMNBL-FHWLQOOXSA-N Phe-Tyr-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N QUUCAHIYARMNBL-FHWLQOOXSA-N 0.000 description 2
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 2
- FXEKNHAJIMHRFJ-ULQDDVLXSA-N Phe-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N FXEKNHAJIMHRFJ-ULQDDVLXSA-N 0.000 description 2
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 2
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 2
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 2
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 2
- SZZBUDVXWZZPDH-BQBZGAKWSA-N Pro-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 SZZBUDVXWZZPDH-BQBZGAKWSA-N 0.000 description 2
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 2
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 2
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 2
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 2
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 2
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 2
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 2
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 2
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 2
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 2
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 2
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 2
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 2
- GXWRTSIVLSQACD-RCWTZXSCSA-N Pro-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1)O GXWRTSIVLSQACD-RCWTZXSCSA-N 0.000 description 2
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 2
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 2
- 108010029485 Protein Isoforms Proteins 0.000 description 2
- 102000001708 Protein Isoforms Human genes 0.000 description 2
- 108091034057 RNA (poly(A)) Proteins 0.000 description 2
- 108010025216 RVF peptide Proteins 0.000 description 2
- 101100505556 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GPT2 gene Proteins 0.000 description 2
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 2
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 2
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 2
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 2
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 2
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 2
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 2
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 2
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 2
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 2
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 2
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 2
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 2
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 2
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 2
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 2
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 2
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 2
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 2
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 2
- ASGYVPAVFNDZMA-GUBZILKMSA-N Ser-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N ASGYVPAVFNDZMA-GUBZILKMSA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 2
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 2
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 2
- LSHUNRICNSEEAN-BPUTZDHNSA-N Ser-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N LSHUNRICNSEEAN-BPUTZDHNSA-N 0.000 description 2
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 2
- 102100033927 Sodium- and chloride-dependent GABA transporter 1 Human genes 0.000 description 2
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 2
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 2
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 2
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 2
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 2
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 2
- XIULAFZYEKSGAJ-IXOXFDKPSA-N Thr-Leu-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XIULAFZYEKSGAJ-IXOXFDKPSA-N 0.000 description 2
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 2
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 2
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 2
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 2
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 2
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 2
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 2
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 2
- SJPDTIQHLBQPFO-VLCNGCBASA-N Thr-Tyr-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SJPDTIQHLBQPFO-VLCNGCBASA-N 0.000 description 2
- YOPQYBJJNSIQGZ-JNPHEJMOSA-N Thr-Tyr-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 YOPQYBJJNSIQGZ-JNPHEJMOSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 2
- BTAJAOWZCWOHBU-HSHDSVGOSA-N Thr-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)C(C)C)C(O)=O)=CNC2=C1 BTAJAOWZCWOHBU-HSHDSVGOSA-N 0.000 description 2
- BRBCKMMXKONBAA-KWBADKCTSA-N Trp-Ala-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 BRBCKMMXKONBAA-KWBADKCTSA-N 0.000 description 2
- OETOOJXFNSEYHQ-WFBYXXMGSA-N Trp-Ala-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 OETOOJXFNSEYHQ-WFBYXXMGSA-N 0.000 description 2
- TWJDQTTXXZDJKV-BPUTZDHNSA-N Trp-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O TWJDQTTXXZDJKV-BPUTZDHNSA-N 0.000 description 2
- WSGPBCAGEGHKQJ-BBRMVZONSA-N Trp-Gly-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WSGPBCAGEGHKQJ-BBRMVZONSA-N 0.000 description 2
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 2
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 2
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 2
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 2
- GFUOTIPYXKAPAH-BVSLBCMMSA-N Trp-Pro-Phe Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GFUOTIPYXKAPAH-BVSLBCMMSA-N 0.000 description 2
- LNGFWVPNKLWATF-ZVZYQTTQSA-N Trp-Val-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LNGFWVPNKLWATF-ZVZYQTTQSA-N 0.000 description 2
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 2
- MTEQZJFSEMXXRK-CFMVVWHZSA-N Tyr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N MTEQZJFSEMXXRK-CFMVVWHZSA-N 0.000 description 2
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 2
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 2
- WPVGRKLNHJJCEN-BZSNNMDCSA-N Tyr-Asp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WPVGRKLNHJJCEN-BZSNNMDCSA-N 0.000 description 2
- RYSNTWVRSLCAJZ-RYUDHWBXSA-N Tyr-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RYSNTWVRSLCAJZ-RYUDHWBXSA-N 0.000 description 2
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 2
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 2
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 2
- AZZLDIDWPZLCCW-ZEWNOJEFSA-N Tyr-Ile-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O AZZLDIDWPZLCCW-ZEWNOJEFSA-N 0.000 description 2
- FJBCEFPCVPHPPM-STECZYCISA-N Tyr-Ile-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O FJBCEFPCVPHPPM-STECZYCISA-N 0.000 description 2
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 2
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 2
- BCOBSVIZMQXKFY-KKUMJFAQSA-N Tyr-Ser-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O BCOBSVIZMQXKFY-KKUMJFAQSA-N 0.000 description 2
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 2
- XYBNMHRFAUKPAW-IHRRRGAJSA-N Tyr-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XYBNMHRFAUKPAW-IHRRRGAJSA-N 0.000 description 2
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- MQUYPYFPHIPVHJ-MNSWYVGCSA-N Tyr-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)O MQUYPYFPHIPVHJ-MNSWYVGCSA-N 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 2
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 2
- XPYNXORPPVTVQK-SRVKXCTJSA-N Val-Arg-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N XPYNXORPPVTVQK-SRVKXCTJSA-N 0.000 description 2
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 2
- NWDOPHYLSORNEX-QXEWZRGKSA-N Val-Asn-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N NWDOPHYLSORNEX-QXEWZRGKSA-N 0.000 description 2
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 2
- BWVHQINTNLVWGZ-ZKWXMUAHSA-N Val-Cys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BWVHQINTNLVWGZ-ZKWXMUAHSA-N 0.000 description 2
- SRWWRLKBEJZFPW-IHRRRGAJSA-N Val-Cys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N SRWWRLKBEJZFPW-IHRRRGAJSA-N 0.000 description 2
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 2
- CHWRZUGUMAMTFC-IHRRRGAJSA-N Val-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CNC=N1 CHWRZUGUMAMTFC-IHRRRGAJSA-N 0.000 description 2
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 2
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 2
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 2
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 2
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 2
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 2
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 2
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 2
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 2
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 2
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 2
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 2
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 2
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 2
- USXYVSTVPHELAF-RCWTZXSCSA-N Val-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N)O USXYVSTVPHELAF-RCWTZXSCSA-N 0.000 description 2
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 2
- HOZAIQIEJTWWDG-HJOGWXRNSA-N Val-Trp-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N HOZAIQIEJTWWDG-HJOGWXRNSA-N 0.000 description 2
- GTACFKZDQFTVAI-STECZYCISA-N Val-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 GTACFKZDQFTVAI-STECZYCISA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- QWCKQJZIFLGMSD-UHFFFAOYSA-N alpha-aminobutyric acid Chemical compound CCC(N)C(O)=O QWCKQJZIFLGMSD-UHFFFAOYSA-N 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 2
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 2
- 235000011130 ammonium sulphate Nutrition 0.000 description 2
- 210000001557 animal structure Anatomy 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 2
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 235000008452 baby food Nutrition 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 2
- 235000015895 biscuits Nutrition 0.000 description 2
- 235000008429 bread Nutrition 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 125000004432 carbon atom Chemical group C* 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000010411 cooking Methods 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 235000019197 fats Nutrition 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 235000013376 functional food Nutrition 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 231100000518 lethal Toxicity 0.000 description 2
- 230000001665 lethal effect Effects 0.000 description 2
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 2
- 235000020778 linoleic acid Nutrition 0.000 description 2
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000013028 medium composition Substances 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 230000003505 mutagenic effect Effects 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 235000011056 potassium acetate Nutrition 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 239000006152 selective media Substances 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010045269 tryptophyltryptophan Proteins 0.000 description 2
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 2
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 108010082737 zymolyase Proteins 0.000 description 2
- BJBUEDPLEOHJGE-UHFFFAOYSA-N (2R,3S)-3-Hydroxy-2-pyrolidinecarboxylic acid Natural products OC1CCNC1C(O)=O BJBUEDPLEOHJGE-UHFFFAOYSA-N 0.000 description 1
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 1
- YOFPFYYTUIARDI-ZCFIWIBFSA-N (2r)-2-aminooctanedioic acid Chemical compound OC(=O)[C@H](N)CCCCCC(O)=O YOFPFYYTUIARDI-ZCFIWIBFSA-N 0.000 description 1
- BVAUMRCGVHUWOZ-ZETCQYMHSA-N (2s)-2-(cyclohexylazaniumyl)propanoate Chemical compound OC(=O)[C@H](C)NC1CCCCC1 BVAUMRCGVHUWOZ-ZETCQYMHSA-N 0.000 description 1
- MRTPISKDZDHEQI-YFKPBYRVSA-N (2s)-2-(tert-butylamino)propanoic acid Chemical compound OC(=O)[C@H](C)NC(C)(C)C MRTPISKDZDHEQI-YFKPBYRVSA-N 0.000 description 1
- NPDBDJFLKKQMCM-SCSAIBSYSA-N (2s)-2-amino-3,3-dimethylbutanoic acid Chemical compound CC(C)(C)[C@H](N)C(O)=O NPDBDJFLKKQMCM-SCSAIBSYSA-N 0.000 description 1
- UNSRRHDPHVZAHH-WYTUUNCASA-N (5e,8e,11e)-icosa-5,8,11-trienoic acid Chemical compound CCCCCCCC\C=C\C\C=C\C\C=C\CCCC(O)=O UNSRRHDPHVZAHH-WYTUUNCASA-N 0.000 description 1
- YUFFSWGQGVEMMI-UHFFFAOYSA-N (7Z,10Z,13Z,16Z,19Z)-7,10,13,16,19-docosapentaenoic acid Natural products CCC=CCC=CCC=CCC=CCC=CCCCCCC(O)=O YUFFSWGQGVEMMI-UHFFFAOYSA-N 0.000 description 1
- YUFFSWGQGVEMMI-RCHUDCCISA-N (7e,10e,13e,16e,19e)-docosa-7,10,13,16,19-pentaenoic acid Chemical compound CC\C=C\C\C=C\C\C=C\C\C=C\C\C=C\CCCCCC(O)=O YUFFSWGQGVEMMI-RCHUDCCISA-N 0.000 description 1
- HQPCSDADVLFHHO-GFRMADBLSA-N (8e,11e,14e,17e)-icosa-8,11,14,17-tetraenoic acid Chemical compound CC\C=C\C\C=C\C\C=C\C\C=C\CCCCCCC(O)=O HQPCSDADVLFHHO-GFRMADBLSA-N 0.000 description 1
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- 102100031251 1-acylglycerol-3-phosphate O-acyltransferase PNPLA3 Human genes 0.000 description 1
- NUKQEEMKQGMUQH-UHFFFAOYSA-N 1-methyl-1-nitrosoguanidine Chemical compound O=NN(C)C(N)=N NUKQEEMKQGMUQH-UHFFFAOYSA-N 0.000 description 1
- 108010054662 2-acylglycerophosphate acyltransferase Proteins 0.000 description 1
- MIDXCONKKJTLDX-UHFFFAOYSA-N 3,5-dimethylcyclopentane-1,2-dione Chemical compound CC1CC(C)C(=O)C1=O MIDXCONKKJTLDX-UHFFFAOYSA-N 0.000 description 1
- AVKOENOBFIYBSA-GUTOPQIJSA-N 4,7,10,13,16-Docosapentaenoic acid Chemical compound CCCCC\C=C\C\C=C\C\C=C\C\C=C\C\C=C\CCC(O)=O AVKOENOBFIYBSA-GUTOPQIJSA-N 0.000 description 1
- AVKOENOBFIYBSA-UHFFFAOYSA-N 4,7,10,13,16-Docosapentaenoic acid Natural products CCCCCC=CCC=CCC=CCC=CCC=CCCC(O)=O AVKOENOBFIYBSA-UHFFFAOYSA-N 0.000 description 1
- XUJWOMMOEOHPFP-OKLKQMLOSA-N 8,11-Eicosadienoic acid Chemical compound CCCCCCCC\C=C\C\C=C\CCCCCCC(O)=O XUJWOMMOEOHPFP-OKLKQMLOSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 1
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- KRHRBKYBJXMYBB-WHFBIAKZSA-N Ala-Cys-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O KRHRBKYBJXMYBB-WHFBIAKZSA-N 0.000 description 1
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 1
- CVHJIWVKTFNGHT-ACZMJKKPSA-N Ala-Gln-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N CVHJIWVKTFNGHT-ACZMJKKPSA-N 0.000 description 1
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- SIGTYDNEPYEXGK-ZANVPECISA-N Ala-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 SIGTYDNEPYEXGK-ZANVPECISA-N 0.000 description 1
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 1
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 1
- XCZXVTHYGSMQGH-NAKRPEOUSA-N Ala-Ile-Met Chemical compound C[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C([O-])=O XCZXVTHYGSMQGH-NAKRPEOUSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- QPBSRMDNJOTFAL-AICCOOGYSA-N Ala-Leu-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QPBSRMDNJOTFAL-AICCOOGYSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 1
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- LTTLSZVJTDSACD-OWLDWWDNSA-N Ala-Thr-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LTTLSZVJTDSACD-OWLDWWDNSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- OOBVTWHLKYJFJH-FXQIFTODSA-N Arg-Ala-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O OOBVTWHLKYJFJH-FXQIFTODSA-N 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- DPNHSNLIULPOBH-GUBZILKMSA-N Arg-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DPNHSNLIULPOBH-GUBZILKMSA-N 0.000 description 1
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- OBFTYSPXDRROQO-SRVKXCTJSA-N Arg-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCN=C(N)N OBFTYSPXDRROQO-SRVKXCTJSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 1
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 1
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 1
- PZBSKYJGKNNYNK-ULQDDVLXSA-N Arg-Leu-Tyr Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O PZBSKYJGKNNYNK-ULQDDVLXSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- OISWSORSLQOGFV-AVGNSLFASA-N Arg-Met-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N OISWSORSLQOGFV-AVGNSLFASA-N 0.000 description 1
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 1
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 1
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 1
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- KSHJMDSNSKDJPU-QTKMDUPCSA-N Arg-Thr-His Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KSHJMDSNSKDJPU-QTKMDUPCSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- XMZZGVGKGXRIGJ-JYJNAYRXSA-N Arg-Tyr-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O XMZZGVGKGXRIGJ-JYJNAYRXSA-N 0.000 description 1
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 1
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 1
- YNSCBOUZTAGIGO-ZLUOBGJFSA-N Asn-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)N YNSCBOUZTAGIGO-ZLUOBGJFSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- QUAWOKPCAKCHQL-SRVKXCTJSA-N Asn-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QUAWOKPCAKCHQL-SRVKXCTJSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- UHGUKCOQUNPSKK-CIUDSAMLSA-N Asn-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N UHGUKCOQUNPSKK-CIUDSAMLSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 1
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 1
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 1
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 1
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 1
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 1
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 1
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- LDGUZSIPGSPBJP-XVYDVKMFSA-N Asp-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N LDGUZSIPGSPBJP-XVYDVKMFSA-N 0.000 description 1
- QHHVSXGWLYEAGX-GUBZILKMSA-N Asp-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QHHVSXGWLYEAGX-GUBZILKMSA-N 0.000 description 1
- LDLZOAJRXXBVGF-GMOBBJLQSA-N Asp-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N LDLZOAJRXXBVGF-GMOBBJLQSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- KFAFUJMGHVVYRC-DCAQKATOSA-N Asp-Leu-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O KFAFUJMGHVVYRC-DCAQKATOSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 1
- XAPPCWUWHNWCPQ-PBCZWWQYSA-N Asp-Thr-His Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O XAPPCWUWHNWCPQ-PBCZWWQYSA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- GFYOIYJJMSHLSN-QXEWZRGKSA-N Asp-Val-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GFYOIYJJMSHLSN-QXEWZRGKSA-N 0.000 description 1
- MFDPBZAFCRKYEY-LAEOZQHASA-N Asp-Val-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFDPBZAFCRKYEY-LAEOZQHASA-N 0.000 description 1
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 1
- GXIUDSXIUSTSLO-QXEWZRGKSA-N Asp-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N GXIUDSXIUSTSLO-QXEWZRGKSA-N 0.000 description 1
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- KYBMMBXOFALKTI-UHFFFAOYSA-N C(CCCCCCCCCCCCCCCCC)(=O)O.C(C=CCCCCCCCCCCC)(=O)O Chemical compound C(CCCCCCCCCCCCCCCCC)(=O)O.C(C=CCCCCCCCCCCC)(=O)O KYBMMBXOFALKTI-UHFFFAOYSA-N 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 241001515917 Chaetomium globosum Species 0.000 description 1
- 241000270281 Coluber constrictor Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- XXDLUZLKHOVPNW-IHRRRGAJSA-N Cys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)O XXDLUZLKHOVPNW-IHRRRGAJSA-N 0.000 description 1
- ZQHQTSONVIANQR-BQBZGAKWSA-N Cys-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N ZQHQTSONVIANQR-BQBZGAKWSA-N 0.000 description 1
- ANPADMNVVOOYKW-DCAQKATOSA-N Cys-His-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ANPADMNVVOOYKW-DCAQKATOSA-N 0.000 description 1
- XBELMDARIGXDKY-GUBZILKMSA-N Cys-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CS)N XBELMDARIGXDKY-GUBZILKMSA-N 0.000 description 1
- RJPKQCFHEPPTGL-ZLUOBGJFSA-N Cys-Ser-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RJPKQCFHEPPTGL-ZLUOBGJFSA-N 0.000 description 1
- NRVQLLDIJJEIIZ-VZFHVOOUSA-N Cys-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N)O NRVQLLDIJJEIIZ-VZFHVOOUSA-N 0.000 description 1
- UGPCUUWZXRMCIJ-KKUMJFAQSA-N Cys-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CS)N UGPCUUWZXRMCIJ-KKUMJFAQSA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- GUBGYTABKSRVRQ-WFVLMXAXSA-N DEAE-cellulose Chemical compound OC1C(O)C(O)C(CO)O[C@H]1O[C@@H]1C(CO)OC(O)C(O)C1O GUBGYTABKSRVRQ-WFVLMXAXSA-N 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101100322920 Danio rerio gpt2l gene Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 108010001348 Diacylglycerol O-acyltransferase Proteins 0.000 description 1
- 102000002148 Diacylglycerol O-acyltransferase Human genes 0.000 description 1
- 235000009245 Elaeagnus multiflora Nutrition 0.000 description 1
- 240000000298 Elaeagnus multiflora Species 0.000 description 1
- 101000618322 Enterobacteria phage T4 Uncharacterized 10.3 kDa protein in Gp46-Gp47 intergenic region Proteins 0.000 description 1
- OPGOLNDOMSBSCW-CLNHMMGSSA-N Fursultiamine hydrochloride Chemical compound Cl.C1CCOC1CSSC(\CCO)=C(/C)N(C=O)CC1=CN=C(C)N=C1N OPGOLNDOMSBSCW-CLNHMMGSSA-N 0.000 description 1
- 101150094690 GAL1 gene Proteins 0.000 description 1
- 102100021736 Galectin-1 Human genes 0.000 description 1
- 102100024637 Galectin-10 Human genes 0.000 description 1
- 101001011019 Gallus gallus Gallinacin-10 Proteins 0.000 description 1
- 101001011021 Gallus gallus Gallinacin-12 Proteins 0.000 description 1
- IGNGBUVODQLMRJ-CIUDSAMLSA-N Gln-Ala-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IGNGBUVODQLMRJ-CIUDSAMLSA-N 0.000 description 1
- KZKBJEUWNMQTLV-XDTLVQLUSA-N Gln-Ala-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZKBJEUWNMQTLV-XDTLVQLUSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- MQANCSUBSBJNLU-KKUMJFAQSA-N Gln-Arg-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQANCSUBSBJNLU-KKUMJFAQSA-N 0.000 description 1
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 1
- ULXXDWZMMSQBDC-ACZMJKKPSA-N Gln-Asp-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ULXXDWZMMSQBDC-ACZMJKKPSA-N 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 1
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 1
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- BVELAHPZLYLZDJ-HGNGGELXSA-N Gln-His-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O BVELAHPZLYLZDJ-HGNGGELXSA-N 0.000 description 1
- SBHVGKBYOQKAEA-SDDRHHMPSA-N Gln-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SBHVGKBYOQKAEA-SDDRHHMPSA-N 0.000 description 1
- XWIBVSAEUCAAKF-GVXVVHGQSA-N Gln-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N XWIBVSAEUCAAKF-GVXVVHGQSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- ILKYYKRAULNYMS-JYJNAYRXSA-N Gln-Lys-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ILKYYKRAULNYMS-JYJNAYRXSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 1
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 1
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- SAHTWBLTLJWAQA-XIRDDKMYSA-N Gln-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N SAHTWBLTLJWAQA-XIRDDKMYSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- MPZWMIIOPAPAKE-BQBZGAKWSA-N Glu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MPZWMIIOPAPAKE-BQBZGAKWSA-N 0.000 description 1
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- ZKONLKQGTNVAPR-DCAQKATOSA-N Glu-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N ZKONLKQGTNVAPR-DCAQKATOSA-N 0.000 description 1
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 1
- JPUNZXVHHRZMNL-XIRDDKMYSA-N Glu-Pro-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JPUNZXVHHRZMNL-XIRDDKMYSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 1
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 1
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- ZOTGXWMKUFSKEU-QXEWZRGKSA-N Gly-Ile-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O ZOTGXWMKUFSKEU-QXEWZRGKSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- YIFUFYZELCMPJP-YUMQZZPRSA-N Gly-Leu-Cys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O YIFUFYZELCMPJP-YUMQZZPRSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 1
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 1
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 1
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 244000299507 Gossypium hirsutum Species 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- MJNWEIMBXKKCSF-XVYDVKMFSA-N His-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MJNWEIMBXKKCSF-XVYDVKMFSA-N 0.000 description 1
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 1
- MAABHGXCIBEYQR-XVYDVKMFSA-N His-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MAABHGXCIBEYQR-XVYDVKMFSA-N 0.000 description 1
- LYSMQLXUCAKELQ-DCAQKATOSA-N His-Asp-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N LYSMQLXUCAKELQ-DCAQKATOSA-N 0.000 description 1
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 1
- ZZLWLWSUIBSMNP-CIUDSAMLSA-N His-Asp-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZZLWLWSUIBSMNP-CIUDSAMLSA-N 0.000 description 1
- YOSQCYUFZGPIPC-PBCZWWQYSA-N His-Asp-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YOSQCYUFZGPIPC-PBCZWWQYSA-N 0.000 description 1
- LBHOVGUGOBINDL-KKUMJFAQSA-N His-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O LBHOVGUGOBINDL-KKUMJFAQSA-N 0.000 description 1
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- PGTISAJTWZPFGN-PEXQALLHSA-N His-Gly-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O PGTISAJTWZPFGN-PEXQALLHSA-N 0.000 description 1
- CTJHHEQNUNIYNN-SRVKXCTJSA-N His-His-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O CTJHHEQNUNIYNN-SRVKXCTJSA-N 0.000 description 1
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- IGBBXBFSLKRHJB-BZSNNMDCSA-N His-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 IGBBXBFSLKRHJB-BZSNNMDCSA-N 0.000 description 1
- RNAYRCNHRYEBTH-IHRRRGAJSA-N His-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RNAYRCNHRYEBTH-IHRRRGAJSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- XIGFLVCAVQQGNS-IHRRRGAJSA-N His-Pro-His Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 XIGFLVCAVQQGNS-IHRRRGAJSA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- FHKZHRMERJUXRJ-DCAQKATOSA-N His-Ser-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 FHKZHRMERJUXRJ-DCAQKATOSA-N 0.000 description 1
- SWBUZLFWGJETAO-KKUMJFAQSA-N His-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O SWBUZLFWGJETAO-KKUMJFAQSA-N 0.000 description 1
- GYXDQXPCPASCNR-NHCYSSNCSA-N His-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N GYXDQXPCPASCNR-NHCYSSNCSA-N 0.000 description 1
- 101710194321 Histone H4.1 Proteins 0.000 description 1
- 101001094079 Homo sapiens Sodium- and chloride-dependent GABA transporter 2 Proteins 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 241000108463 Hygrophila <snail> Species 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 1
- QHGBCRCMBCWMBJ-UHFFFAOYSA-N Ile-Glu-Ala-Lys Natural products CCC(C)C(N)C(=O)NC(CCC(O)=O)C(=O)NC(C)C(=O)NC(C(O)=O)CCCCN QHGBCRCMBCWMBJ-UHFFFAOYSA-N 0.000 description 1
- QRTVJGKXFSYJGW-KBIXCLLPSA-N Ile-Glu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N QRTVJGKXFSYJGW-KBIXCLLPSA-N 0.000 description 1
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- DMSVBUWGDLYNLC-IAVJCBSLSA-N Ile-Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DMSVBUWGDLYNLC-IAVJCBSLSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- TUYOFUHICRWDGA-CIUDSAMLSA-N Ile-Met Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCSC TUYOFUHICRWDGA-CIUDSAMLSA-N 0.000 description 1
- MASWXTFJVNRZPT-NAKRPEOUSA-N Ile-Met-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)O)N MASWXTFJVNRZPT-NAKRPEOUSA-N 0.000 description 1
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 1
- USXAYNCLFSUSBA-MGHWNKPDSA-N Ile-Phe-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N USXAYNCLFSUSBA-MGHWNKPDSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- KLJKJVXDHVUMMZ-KKPKCPPISA-N Ile-Phe-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N KLJKJVXDHVUMMZ-KKPKCPPISA-N 0.000 description 1
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- FBGXMKUWQFPHFB-JBDRJPRFSA-N Ile-Ser-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N FBGXMKUWQFPHFB-JBDRJPRFSA-N 0.000 description 1
- SHVFUCSSACPBTF-VGDYDELISA-N Ile-Ser-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SHVFUCSSACPBTF-VGDYDELISA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 1
- NXRNRBOKDBIVKQ-CXTHYWKRSA-N Ile-Tyr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N NXRNRBOKDBIVKQ-CXTHYWKRSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 238000012218 Kunkel's method Methods 0.000 description 1
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- QJUWBDPGGYVRHY-YUMQZZPRSA-N Leu-Gly-Cys Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N QJUWBDPGGYVRHY-YUMQZZPRSA-N 0.000 description 1
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- TVEOVCYCYGKVPP-HSCHXYMDSA-N Leu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N TVEOVCYCYGKVPP-HSCHXYMDSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- UCNNZELZXFXXJQ-BZSNNMDCSA-N Leu-Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCNNZELZXFXXJQ-BZSNNMDCSA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 1
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- MQMIRLVJXQNTRJ-SDDRHHMPSA-N Lys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O MQMIRLVJXQNTRJ-SDDRHHMPSA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 1
- KKFVKBWCXXLKIK-AVGNSLFASA-N Lys-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCCN)N KKFVKBWCXXLKIK-AVGNSLFASA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 1
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- XFANQCRHTMOEAP-WDSOQIARSA-N Lys-Pro-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XFANQCRHTMOEAP-WDSOQIARSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- MVQGZYIOMXAFQG-GUBZILKMSA-N Met-Ala-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MVQGZYIOMXAFQG-GUBZILKMSA-N 0.000 description 1
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 1
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- OXHSZBRPUGNMKW-DCAQKATOSA-N Met-Gln-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OXHSZBRPUGNMKW-DCAQKATOSA-N 0.000 description 1
- GXYYFDKJHLRNSI-SRVKXCTJSA-N Met-Gln-His Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GXYYFDKJHLRNSI-SRVKXCTJSA-N 0.000 description 1
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 1
- BCRQJDMZQUHQSV-STQMWFEESA-N Met-Gly-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BCRQJDMZQUHQSV-STQMWFEESA-N 0.000 description 1
- XPCLRYNQMZOOFB-ULQDDVLXSA-N Met-His-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N XPCLRYNQMZOOFB-ULQDDVLXSA-N 0.000 description 1
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 1
- ZEVPMOHYCQFWSE-NAKRPEOUSA-N Met-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCSC)N ZEVPMOHYCQFWSE-NAKRPEOUSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 1
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 1
- WTHGNAAQXISJHP-AVGNSLFASA-N Met-Lys-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WTHGNAAQXISJHP-AVGNSLFASA-N 0.000 description 1
- JKXVPNCSAMWUEJ-GUBZILKMSA-N Met-Met-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O JKXVPNCSAMWUEJ-GUBZILKMSA-N 0.000 description 1
- KRLKICLNEICJGV-STQMWFEESA-N Met-Phe-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 KRLKICLNEICJGV-STQMWFEESA-N 0.000 description 1
- VQILILSLEFDECU-GUBZILKMSA-N Met-Pro-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O VQILILSLEFDECU-GUBZILKMSA-N 0.000 description 1
- WXXNVZMWHOLNRJ-AVGNSLFASA-N Met-Pro-Lys Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O WXXNVZMWHOLNRJ-AVGNSLFASA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 1
- SOAYQFDWEIWPPR-IHRRRGAJSA-N Met-Ser-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SOAYQFDWEIWPPR-IHRRRGAJSA-N 0.000 description 1
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 1
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 1
- WXJLBSXNUHIGSS-OSUNSFLBSA-N Met-Thr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WXJLBSXNUHIGSS-OSUNSFLBSA-N 0.000 description 1
- HOTNHEUETJELDL-BPNCWPANSA-N Met-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N HOTNHEUETJELDL-BPNCWPANSA-N 0.000 description 1
- MUDYEFAKNSTFAI-JYJNAYRXSA-N Met-Tyr-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O MUDYEFAKNSTFAI-JYJNAYRXSA-N 0.000 description 1
- ALTHVGNGGZZSAC-SRVKXCTJSA-N Met-Val-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCNC(N)=N ALTHVGNGGZZSAC-SRVKXCTJSA-N 0.000 description 1
- LPNWWHBFXPNHJG-AVGNSLFASA-N Met-Val-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN LPNWWHBFXPNHJG-AVGNSLFASA-N 0.000 description 1
- 244000294411 Mirabilis expansa Species 0.000 description 1
- 235000015429 Mirabilis expansa Nutrition 0.000 description 1
- YBHQCJILTOVLHD-YVMONPNESA-N Mirin Chemical compound S1C(N)=NC(=O)\C1=C\C1=CC=C(O)C=C1 YBHQCJILTOVLHD-YVMONPNESA-N 0.000 description 1
- 241000048020 Mortierella exigua Species 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- KNTFCRCCPLEUQZ-VKHMYHEASA-N O-methylserine Chemical compound COC[C@H](N)C(O)=O KNTFCRCCPLEUQZ-VKHMYHEASA-N 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 1
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- KOUUGTKGEQZRHV-KKUMJFAQSA-N Phe-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KOUUGTKGEQZRHV-KKUMJFAQSA-N 0.000 description 1
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 1
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 1
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 1
- GYEPCBNTTRORKW-PCBIJLKTSA-N Phe-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O GYEPCBNTTRORKW-PCBIJLKTSA-N 0.000 description 1
- RGZYXNFHYRFNNS-MXAVVETBSA-N Phe-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGZYXNFHYRFNNS-MXAVVETBSA-N 0.000 description 1
- HTXVATDVCRFORF-MGHWNKPDSA-N Phe-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N HTXVATDVCRFORF-MGHWNKPDSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 1
- PHJUFDQVVKVOPU-ULQDDVLXSA-N Phe-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=CC=C1)N PHJUFDQVVKVOPU-ULQDDVLXSA-N 0.000 description 1
- SZYBZVANEAOIPE-UBHSHLNASA-N Phe-Met-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SZYBZVANEAOIPE-UBHSHLNASA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- ABEFOXGAIIJDCL-SFJXLCSZSA-N Phe-Thr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 ABEFOXGAIIJDCL-SFJXLCSZSA-N 0.000 description 1
- KCIKTPHTEYBXMG-BVSLBCMMSA-N Phe-Trp-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCIKTPHTEYBXMG-BVSLBCMMSA-N 0.000 description 1
- AOKZOUGUMLBPSS-PMVMPFDFSA-N Phe-Trp-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O AOKZOUGUMLBPSS-PMVMPFDFSA-N 0.000 description 1
- APXXVISUHOLGEE-ILWGZMRPSA-N Phe-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CC=CC=C4)N)C(=O)O APXXVISUHOLGEE-ILWGZMRPSA-N 0.000 description 1
- GLUYKHMBGKQBHE-JYJNAYRXSA-N Phe-Val-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 GLUYKHMBGKQBHE-JYJNAYRXSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- 102000001107 Phosphatidate Phosphatase Human genes 0.000 description 1
- 108010069394 Phosphatidate Phosphatase Proteins 0.000 description 1
- 206010036590 Premature baby Diseases 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- ZYBUKTMPPFQSHL-JYJNAYRXSA-N Pro-Asp-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZYBUKTMPPFQSHL-JYJNAYRXSA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- OGRYXQOUFHAMPI-DCAQKATOSA-N Pro-Cys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O OGRYXQOUFHAMPI-DCAQKATOSA-N 0.000 description 1
- ODPIUQVTULPQEP-CIUDSAMLSA-N Pro-Gln-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ODPIUQVTULPQEP-CIUDSAMLSA-N 0.000 description 1
- LANQLYHLMYDWJP-SRVKXCTJSA-N Pro-Gln-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O LANQLYHLMYDWJP-SRVKXCTJSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 1
- MHBSUKYVBZVQRW-HJWJTTGWSA-N Pro-Phe-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MHBSUKYVBZVQRW-HJWJTTGWSA-N 0.000 description 1
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 1
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 1
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 244000253724 Saccharomyces cerevisiae S288c Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- DSSOYPJWSWFOLK-CIUDSAMLSA-N Ser-Cys-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O DSSOYPJWSWFOLK-CIUDSAMLSA-N 0.000 description 1
- SWIQQMYVHIXPEK-FXQIFTODSA-N Ser-Cys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O SWIQQMYVHIXPEK-FXQIFTODSA-N 0.000 description 1
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 1
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- HZNFKPJCGZXKIC-DCAQKATOSA-N Ser-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N HZNFKPJCGZXKIC-DCAQKATOSA-N 0.000 description 1
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 1
- OCWWJBZQXGYQCA-DCAQKATOSA-N Ser-Lys-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O OCWWJBZQXGYQCA-DCAQKATOSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102100035242 Sodium- and chloride-dependent GABA transporter 2 Human genes 0.000 description 1
- 241000592344 Spermatophyta Species 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- JVTHIXKSVYEWNI-JRQIVUDYSA-N Thr-Asn-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JVTHIXKSVYEWNI-JRQIVUDYSA-N 0.000 description 1
- NLJKZUGAIIRWJN-LKXGYXEUSA-N Thr-Asp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O NLJKZUGAIIRWJN-LKXGYXEUSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 1
- GUZGCDIZVGODML-NKIYYHGXSA-N Thr-Gln-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O GUZGCDIZVGODML-NKIYYHGXSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- MQUZMZBFKCHVOB-HJGDQZAQSA-N Thr-Gln-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O MQUZMZBFKCHVOB-HJGDQZAQSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- BIENEHRYNODTLP-HJGDQZAQSA-N Thr-Glu-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O BIENEHRYNODTLP-HJGDQZAQSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 1
- JRAUIKJSEAKTGD-TUBUOCAGSA-N Thr-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N JRAUIKJSEAKTGD-TUBUOCAGSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 1
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 1
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- HOJPPPKZWFRTHJ-PJODQICGSA-N Trp-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HOJPPPKZWFRTHJ-PJODQICGSA-N 0.000 description 1
- TZNNEYFZZAHLBL-BPUTZDHNSA-N Trp-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O TZNNEYFZZAHLBL-BPUTZDHNSA-N 0.000 description 1
- VIWQOOBRKCGSDK-RYQLBKOJSA-N Trp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O VIWQOOBRKCGSDK-RYQLBKOJSA-N 0.000 description 1
- GKUROEIXVURAAO-BPUTZDHNSA-N Trp-Asp-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GKUROEIXVURAAO-BPUTZDHNSA-N 0.000 description 1
- HQJOVVWAPQPYDS-ZFWWWQNUSA-N Trp-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQJOVVWAPQPYDS-ZFWWWQNUSA-N 0.000 description 1
- JVTHMUDOKPQBOT-NSHDSACASA-N Trp-Gly-Gly Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O)=CNC2=C1 JVTHMUDOKPQBOT-NSHDSACASA-N 0.000 description 1
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 1
- NLWCSMOXNKBRLC-WDSOQIARSA-N Trp-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLWCSMOXNKBRLC-WDSOQIARSA-N 0.000 description 1
- UHXOYRWHIQZAKV-SZMVWBNQSA-N Trp-Pro-Arg Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UHXOYRWHIQZAKV-SZMVWBNQSA-N 0.000 description 1
- UUZYQOUJTORBQO-ZVZYQTTQSA-N Trp-Val-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 UUZYQOUJTORBQO-ZVZYQTTQSA-N 0.000 description 1
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 1
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 1
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 1
- BVDHHLMIZFCAAU-BZSNNMDCSA-N Tyr-Cys-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BVDHHLMIZFCAAU-BZSNNMDCSA-N 0.000 description 1
- ARPONUQDNWLXOZ-KKUMJFAQSA-N Tyr-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ARPONUQDNWLXOZ-KKUMJFAQSA-N 0.000 description 1
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 1
- LMLBOGIOLHZXOT-JYJNAYRXSA-N Tyr-Glu-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O LMLBOGIOLHZXOT-JYJNAYRXSA-N 0.000 description 1
- ADECJAKCRKPSOR-ULQDDVLXSA-N Tyr-His-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ADECJAKCRKPSOR-ULQDDVLXSA-N 0.000 description 1
- YIKDYZDNRCNFQB-KKUMJFAQSA-N Tyr-His-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O YIKDYZDNRCNFQB-KKUMJFAQSA-N 0.000 description 1
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 1
- LRHBBGDMBLFYGL-FHWLQOOXSA-N Tyr-Phe-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LRHBBGDMBLFYGL-FHWLQOOXSA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- KSGKJSFPWSMJHK-JNPHEJMOSA-N Tyr-Tyr-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSGKJSFPWSMJHK-JNPHEJMOSA-N 0.000 description 1
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 1
- NVJCMGGZHOJNBU-UFYCRDLUSA-N Tyr-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N NVJCMGGZHOJNBU-UFYCRDLUSA-N 0.000 description 1
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- 101150044776 URA5 gene Proteins 0.000 description 1
- 241000306282 Umbelopsis isabellina Species 0.000 description 1
- 241000907980 Umbelopsis nana Species 0.000 description 1
- 241000134363 Umbelopsis ramanniana Species 0.000 description 1
- 244000301083 Ustilago maydis Species 0.000 description 1
- 235000015919 Ustilago maydis Nutrition 0.000 description 1
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 1
- JFAWZADYPRMRCO-UBHSHLNASA-N Val-Ala-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JFAWZADYPRMRCO-UBHSHLNASA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 1
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 1
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 1
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- PYXQBKJPHNCTNW-CYDGBPFRSA-N Val-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N PYXQBKJPHNCTNW-CYDGBPFRSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- BCBFMJYTNKDALA-UFYCRDLUSA-N Val-Phe-Phe Chemical compound N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O BCBFMJYTNKDALA-UFYCRDLUSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- UFCHCOKFAGOQSF-BQFCYCMXSA-N Val-Trp-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N UFCHCOKFAGOQSF-BQFCYCMXSA-N 0.000 description 1
- QTXGUIMEHKCPBH-FHWLQOOXSA-N Val-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 QTXGUIMEHKCPBH-FHWLQOOXSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 1
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- TWSWSIQAPQLDBP-UHFFFAOYSA-N adrenic acid Natural products CCCCCC=CCC=CCC=CCC=CCCCCCC(O)=O TWSWSIQAPQLDBP-UHFFFAOYSA-N 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 235000013334 alcoholic beverage Nutrition 0.000 description 1
- TWSWSIQAPQLDBP-DOFZRALJSA-N all-cis-docosa-7,10,13,16-tetraenoic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCCCC(O)=O TWSWSIQAPQLDBP-DOFZRALJSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 108010066988 asparaginyl-alanyl-glycyl-alanine Proteins 0.000 description 1
- 235000015241 bacon Nutrition 0.000 description 1
- 235000013527 bean curd Nutrition 0.000 description 1
- HOFVKMPPWKKHNQ-UHFFFAOYSA-N benzoic acid octadec-11-enoic acid Chemical compound C(CCCCCCCCCC=CCCCCCC)(=O)O.C(C1=CC=CC=C1)(=O)O HOFVKMPPWKKHNQ-UHFFFAOYSA-N 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 235000014121 butter Nutrition 0.000 description 1
- 235000012970 cakes Nutrition 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 235000013736 caramel Nutrition 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 235000015218 chewing gum Nutrition 0.000 description 1
- 229940112822 chewing gum Drugs 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 235000019219 chocolate Nutrition 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 229910052956 cinnabar Inorganic materials 0.000 description 1
- BJBUEDPLEOHJGE-IUYQGCFVSA-N cis-3-hydroxy-D-proline zwitterion Chemical compound O[C@H]1CCN[C@H]1C(O)=O BJBUEDPLEOHJGE-IUYQGCFVSA-N 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- IJKVHSBPTUYDLN-UHFFFAOYSA-N dihydroxy(oxo)silane Chemical compound O[Si](O)=O IJKVHSBPTUYDLN-UHFFFAOYSA-N 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- MBMBGCFOFBJSGT-SFGLVEFQSA-N docosa-4,7,10,13,16,19-hexaenoic acid Chemical compound CC\C=C\C\C=C\C\C=C\C\C=C\C\C=C\C\C=C\CCC(O)=O MBMBGCFOFBJSGT-SFGLVEFQSA-N 0.000 description 1
- 235000020669 docosahexaenoic acid Nutrition 0.000 description 1
- 229940090949 docosahexaenoic acid Drugs 0.000 description 1
- AGDANEVFLMAYGL-UHFFFAOYSA-N docosanoic acid Chemical compound CCCCCCCCCCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCCCCCCCCCC(O)=O AGDANEVFLMAYGL-UHFFFAOYSA-N 0.000 description 1
- 235000012489 doughnuts Nutrition 0.000 description 1
- 235000015071 dressings Nutrition 0.000 description 1
- IQLUYYHUNSSHIY-HZUMYPAESA-N eicosatetraenoic acid Chemical compound CCCCCCCCCCC\C=C\C=C\C=C\C=C\C(O)=O IQLUYYHUNSSHIY-HZUMYPAESA-N 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000004626 essential fatty acids Nutrition 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 235000021107 fermented food Nutrition 0.000 description 1
- 125000005519 fluorenylmethyloxycarbonyl group Chemical group 0.000 description 1
- OQZCSNDVOWYALR-UHFFFAOYSA-N flurochloridone Chemical compound FC(F)(F)C1=CC=CC(N2C(C(Cl)C(CCl)C2)=O)=C1 OQZCSNDVOWYALR-UHFFFAOYSA-N 0.000 description 1
- 235000012041 food component Nutrition 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010083327 glycyl-prolyl-arginyl-valine Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229960000789 guanidine hydrochloride Drugs 0.000 description 1
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- JYDNQSLNPKOEII-CFYXSCKTSA-N hexadec-9-enoic acid;(z)-hexadec-9-enoic acid Chemical compound CCCCCCC=CCCCCCCCC(O)=O.CCCCCC\C=C/CCCCCCCC(O)=O JYDNQSLNPKOEII-CFYXSCKTSA-N 0.000 description 1
- KYYWBEYKBLQSFW-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCCCC(O)=O KYYWBEYKBLQSFW-UHFFFAOYSA-N 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 238000002169 hydrotherapy Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 235000015243 ice cream Nutrition 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 235000008446 instant noodles Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- BBJIPMIXTXKYLZ-UHFFFAOYSA-N isoglutamic acid Chemical compound OC(=O)CC(N)CC(O)=O BBJIPMIXTXKYLZ-UHFFFAOYSA-N 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 235000014058 juice drink Nutrition 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 230000004132 lipogenesis Effects 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010072591 lysyl-leucyl-alanyl-arginine Proteins 0.000 description 1
- 235000013310 margarine Nutrition 0.000 description 1
- 239000003264 margarine Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 235000010746 mayonnaise Nutrition 0.000 description 1
- 239000008268 mayonnaise Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 210000001589 microsome Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013536 miso Nutrition 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 150000002762 monocarboxylic acid derivatives Chemical class 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 235000012149 noodles Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- PIRWNASAJNPKHT-SHZATDIYSA-N pamp Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C)N)C(C)C)C1=CC=CC=C1 PIRWNASAJNPKHT-SHZATDIYSA-N 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 235000014594 pastries Nutrition 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 210000004896 polypeptide structure Anatomy 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 239000008057 potassium phosphate buffer Substances 0.000 description 1
- 238000011533 pre-incubation Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 235000013324 preserved food Nutrition 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 239000012857 radioactive material Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 235000021067 refined food Nutrition 0.000 description 1
- 235000019685 rice crackers Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 150000004671 saturated fatty acids Chemical class 0.000 description 1
- 235000013580 sausages Nutrition 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 235000014214 soft drink Nutrition 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 235000014347 soups Nutrition 0.000 description 1
- 235000013555 soy sauce Nutrition 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 235000011496 sports drink Nutrition 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- JIWBIWFOSCKQMA-UHFFFAOYSA-N stearidonic acid Natural products CCC=CCC=CCC=CCC=CCCCCC(O)=O JIWBIWFOSCKQMA-UHFFFAOYSA-N 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 239000002887 superconductor Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 235000013616 tea Nutrition 0.000 description 1
- OVCRJDHPHMEGTN-UHFFFAOYSA-N tetracosanoic acid tetradecanoic acid Chemical compound C(CCCCCCCCCCCCCCCCCCCCCCC)(=O)O.C(CCCCCCCCCCCCC)(=O)O OVCRJDHPHMEGTN-UHFFFAOYSA-N 0.000 description 1
- ZTUXEFFFLOVXQE-UHFFFAOYSA-N tetradecanoic acid Chemical compound CCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCC(O)=O ZTUXEFFFLOVXQE-UHFFFAOYSA-N 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- LKOVPWSSZFDYPG-WUKNDPDISA-N trans-octadec-2-enoic acid Chemical compound CCCCCCCCCCCCCCC\C=C\C(O)=O LKOVPWSSZFDYPG-WUKNDPDISA-N 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- UFTFJSFQGQCHQW-UHFFFAOYSA-N triformin Chemical compound O=COCC(OC=O)COC=O UFTFJSFQGQCHQW-UHFFFAOYSA-N 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 239000000052 vinegar Substances 0.000 description 1
- 235000021419 vinegar Nutrition 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 235000013618 yogurt Nutrition 0.000 description 1
- 239000007222 ypd medium Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/01015—Glycerol-3-phosphate O-acyltransferase (2.3.1.15)
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23D—EDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
- A23D9/00—Other edible oils or fats, e.g. shortenings, cooking oils
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L33/00—Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
- A23L33/10—Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L33/00—Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
- A23L33/10—Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives
- A23L33/115—Fatty acids or derivatives thereof; Fats or oils
- A23L33/12—Fatty acids or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C11—ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
- C11B—PRODUCING, e.g. BY PRESSING RAW MATERIALS OR BY EXTRACTION FROM WASTE MATERIALS, REFINING OR PRESERVING FATS, FATTY SUBSTANCES, e.g. LANOLIN, FATTY OILS OR WAXES; ESSENTIAL OILS; PERFUMES
- C11B1/00—Production of fats or fatty oils from raw materials
- C11B1/10—Production of fats or fatty oils from raw materials by extracting
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
- C12P7/6463—Glycerides obtained from glyceride producing microorganisms, e.g. single cell oil
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
- C12P7/6472—Glycerides containing polyunsaturated fatty acid [PUFA] residues, i.e. having two or more double bonds in their backbone
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Food Science & Technology (AREA)
- Polymers & Plastics (AREA)
- Molecular Biology (AREA)
- Mycology (AREA)
- General Chemical & Material Sciences (AREA)
- Nutrition Science (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Coloring Foods And Improving Nutritive Qualities (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은, 신규의 글리세롤-3-인산 아실기 전이 효소 유전자 및 그 이용을 제공한다. 본 발명의 상기 과제는, 본 발명의 서열 번호 1, 4 혹은 8, 서열 번호 3, 6 혹은 11, 또는 서열 번호 7 혹은 12의 염기 서열을 갖는 핵산 및 그 변이체의 제공에 의해 해결한다. 본 발명은 또한 서열 번호 2, 5 혹은 9의 아미노산 서열을 갖는 단백질 및 그 변이체를 제공한다.
Description
본 발명은 신규의 아실기 전이 효소 유전자와 그 이용에 관한 것이다. 본 발명의 아실기 전이 효소 유전자는, 글리세롤-3-인산 아실기 전이 효소(GPAT) 유전자 및/또는 글리세론 포스페이트 O-아실기 전이 효소(GNPAT) 유전자라도 좋다.
지방산은 인지질이나 트리아실글리세롤 등 지질을 구성하는 중요한 성분이다. 불포화 결합을 2곳 이상 함유하는 지방산은 고도 불포화 지방산(PUFA)이라고 총칭된다. 구체예로서는, 아라키돈산이나 디호모γ-리놀렌산, 에이코사펜타엔산, 도코사헥사엔산 등이 알려져 있으며, 여러 가지 생리 활성이 보고되어 있다(비특허문헌 1). 이 고도 불포화 지방산 중, 몇 개의 종류는 동물이 체내에서 합성할 수 없다. 따라서, 이러한 고도 불포화 지방산은 필수지방산으로서 음식물로부터 섭취할 필요가 있다.
동물 체내에 있어서, 고도 불포화 지방산은 다종 다양한 장기 및 조직에 포함되어 있다. 예컨대, 아라키돈산은 동물의 부신선이나 간으로부터 추출한 지질로부터 분리된다. 그러나, 동물 장기에는 고도 불포화 지방산은 소량밖에 포함되어 있지 않기 때문에, 동물 장기로부터 추출·분리되는 고도 불포화 지방산만으로는 충분한 공급량을 얻을 수 없다. 그 때문에, 여러 가지 미생물을 배양하여 고도 불포화 지방산을 획득하는 방법이 개발되어 왔다. 그 중에서도 모르티에렐라(Mortierella)속 미생물은 아라키돈산 등의 고도 불포화 지방산 함유 지질을 효율적으로 생산하는 미생물로서 알려져 있다. 또한, 식물에서 고도 불포화 지방산을 생산하게 하는 시도도 이루어지고 있다. 고도 불포화 지방산은 트리아실글리세롤 등의 저장 지질을 구성하며, 미생물의 균체 내 혹은 식물 종자 속에 축적되는 것이 알려져 있다.
저장 지질인 트리아실글리세롤은 생체 내에서 다음과 같이 생성된다. 글리세롤-3-인산 아실기 전이 효소에 의해 글리세롤-3-인산에 아실기가 전이되어 리소포스파티딘산이 생긴다. 이어서, 리소포스파티딘산 아실기 전이 효소에 의해 리소포스파티딘산에 아실기가 전이되어 포스파티딘산이 생긴다. 그리고, 포스파티딘산이 포스파티딘산 포스파타아제에 의해 탈인산화됨으로써 디아실글리세롤이 생긴다. 마지막으로, 디아실글리세롤 아실기 전이 효소에 의해 디아실글리세롤에 아실기가 전이되어 트리아실글리세롤이 생긴다.
상기한 트리아실글리세롤 생합성 경로나 인지질 생합성 경로에 있어서, 글리세롤-3-인산의 아실화에 의해 리소포스파티딘산(lysophosphatidic acid)이 생성되는 반응에는, 글리세롤-3-인산 아실기 전이 효소(이하, 「GPAT」라고 기재하는 경우도 있음 : EC 2.3.1.15)가 개재하는 것이 알려져 있다.
GPAT 유전자의 존재는 지금까지 몇 개의 생물에서 보고되어 있다. 포유동물 유래의 GPAT 유전자로서, 소포체형(막결합형)과 미토콘드리아형(막결합형)의 2 종류가 클론화되어 있다(비특허문헌 2). 또한, 식물 유래의 GPAT 유전자로서 소포체형(막결합형), 미토콘드리아형(막결합형) 및 엽록체형(유리형)의 3 종류가 클론화되어 있다(비특허문헌 3).
진균인 사카로미세스 세레비시에(Saccharomyces cerevisiae) 유래의 GPAT 유전자로서, 소포체형(막결합형)의 GPT2/GAT1(YKR067w)과 SCT1/GAT2(YBL011w)의 2 종류가 클론화되어 있으며, 이들을 동시에 결실시키면 치사에 이른다는 것이 알려져 있다(비특허문헌 4). 여기서, GPT2는 팔미틴산(16:0)에서부터 올레인산(18:1)에 이르기까지 폭넓은 범위의 지방산을 기질로 하는 활성을 갖는 데 대하여, SCT1은 팔미틴산(16:0), 팔미톨레산(16:1)과 같은 탄소수 16의 지방산을 기질로 하는 데에 강한 선택성을 갖는 것이 기재되어 있다(비특허문헌 4).
상기한 것 외에도 많은 생물종으로부터 GPAT 유전자가 클론화되어 있다. 특히, 지질 생산균인 모르티에렐라(Mortierella)속 미생물 유래의 GPAT에 대해서도 다음과 같은 보고가 있다.
모르티에렐라 라마니아나(Mortierella ramanniana) 유래의 GPAT에 대해서는, 소포체형 GPAT가 단리되고, 이것이 팔미틴산(16:0)보다도 올레인산(18:1)을 5.4배 높은 선택성을 가지고서 아실 도너로서 이용하는 것이 기재되어 있다(비특허문헌 5). 모르티에렐라 알피나(Mortierella alpina)(이하, 「M. alpina」 또는 「모르티에렐라 알피나」라고 기재하는 경우도 있음) 유래의 GPAT에 대해서는, 마이크로솜 분획에 글리세롤-3-인산 아실기 전이 효소 활성이 있음이 보고되어 있다(비특허문헌 6).
M. alpina의 마이크로솜에 존재하는 GPAT(막에 결합하고 있는 상태)와 여러 가지 아실 CoA를 인비트로로 반응시키면, GPAT는 높은 활성을 유지한 채로, 올레인산(18:1), 리놀레산(18:2), 디호모γ-리놀렌산(DGLA)(20:3), 아라키돈산(20:4)과 같은 고도 불포화 지방산을 널리 기질로서 이용하는 것이 나타내어져 있다(특허문헌 1).
M. alpina(ATCC #16266)로부터 클로닝된 GPAT(이하, 본 명세서에서는 MaGPAT1(ATCC #16266)이라 기재함)를, 에이코사펜타엔산(EPA)까지 생합성할 수 있도록 형질전환된 야로이야 리포라이티카(Yarrowia lipolytica) 내에서 발현시킨 바, 총 지방산 중, 디호모γ-리놀렌산(DGLA)(20:3)의 조성이 증가하고, 올레인산(18:1)의 조성이 감소하는 것이 드러났다. 이 결과는, 보다 장쇄이며 불포화도가 높은 고도 불포화 지방산이 선택적으로 받아들여지고 있음을 보이는 것이다(특허문헌 2).
최근, M. alpina(1S-4주)로부터 GPAT 호몰로그인 MaGPAT2가 단리되어, MaGPAT1과는 다른 기질 특이성을 보이는 것이 보고되어 있다(특허문헌 3). 즉, 효모로 발현시킨 경우에, MaGPAT1은 효모가 생산하는 지질 중의 팔미틴산의 함유 비율을 증가시키는 데 대하여, MaGPAT2는 효모가 생산하는 지질 중의 올레인산의 함유 비율을 증가시킨다.
비특허문헌 1 : Lipids, 39, 1147-1161, 2004
비특허문헌 2 : Biochimica et Biophysica Acta, 1348, 17-26, 1997
비특허문헌 3 : Biochimica et Biophysica Acta, 1348, 10-16, 1997
비특허문헌 4 : The Journal of Biological Chemistry, 276(45), 41710-41716, 2001
비특허문헌 5 : The Biochemical Journal, 355, 315-322, 2001
비특허문헌 6 : Biochemical Society Transactions, 28, 707-709, 2000
지금까지 보고되어 있는 GPAT 유전자는, 숙주 세포에 도입하여 발현시키더라도, 그 기질 특이성에 의해, 숙주가 생성하는 지질 조성물은 한정되어 있었다. 숙주 세포에 도입하거나 또는 발현시킴으로써 원하는 조성의 지방산 조성물을 생성할 있는 신규의 유전자를 동정할 것이 요구되고 있다.
본 발명의 목적은, 숙주 세포로 발현 또는 도입함으로써, 목적으로 하는 지방산 조성의 유지를 제조시키거나, 목적으로 하는 지방산의 함유량을 증가시키거나, 저장 지질인 트리아실글리세롤(TG)량을 증가시키거나 할 수 있는 단백질 및 핵산을 제공하는 것이다.
본 발명자는 상기 과제를 해결하기 위해서 예의 연구를 했다. 우선, 지질 생산균 Mortierella alpina의 게놈을 해석하여, 그 중에서 이미 알려진 글리세롤-3-인산 아실기 전이 효소(GPAT) 유전자와 동일성이 높은 서열을 추출했다. 또한, GPAT를 코드하는 오픈 리딩 프레임(ORF) 전체 길이를 취득하기 위해서, cDNA 라이브러리의 스크리닝 혹은 PCR에 의해 전장 cDNA를 클로닝했다. 그것을 효모 등의 높은 증식능을 갖는 숙주 세포에 도입하여 지방산 조성물의 생성을 시도한 발명자는, 종래의 GPAT가 발현한 숙주가 생성하는 지방산 조성물과 비교하여, 다른 지방산 조성물을 생성시킬 수 있는, 기질 특이성이 다른 신규의 GPAT에 관한 유전자의 클로닝에 성공하여 발명을 완성하기에 이르렀다. 즉, 본 발명은 다음과 같다.
(1) 이하의 (a)∼(g) 중 어느 것에 기재한 핵산.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열에 있어서 하나 혹은 복수 개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
(b) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
(c) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열과 동일성이 70% 이상인 염기 서열로 이루어지고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
(d) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 70% 이상인 아미노산 서열로 이루어지고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
(e) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
(f) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
(g) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열과 동일성이 70% 이상인 염기 서열로 이루어지고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
(2) 이하의 (a)∼(g) 중 어느 것인 (1)에 기재한 핵산.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열에 있어서 1∼80개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
(b) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 2×SSC, 50℃의 조건 하에서 하이브리다이즈하고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
(c) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열과 동일성이 90% 이상인 염기 서열로 이루어지고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
(d) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 90% 이상인 아미노산 서열로 이루어지고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
(e) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 2×SSC, 50℃의 조건 하에서 하이브리다이즈하고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
(f) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 2×SSC, 50℃의 조건 하에서 하이브리다이즈하고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
(g) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열과 동일성이 90% 이상인 염기 서열로 이루어지고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
(3) 이하의 (a)∼(d) 중 어느 것에 기재한 핵산.
(a) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 나타내어지는 염기 서열 혹은 그 부분 서열을 포함하는 핵산
(b) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열 혹은 그 부분 서열을 포함하는 핵산
(c) 서열 번호 3, 서열 번호 6 또는 서열 번호 11로 나타내어지는 염기 서열 혹은 그 부분 서열을 포함하는 핵산
(d) 서열 번호 7 또는 서열 번호 12로 나타내어지는 염기 서열 혹은 그 부분 서열을 포함하는 핵산
(4) 이하의 (a)∼(g) 중 어느 것에 기재한 핵산.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열에 있어서 하나 혹은 복수 개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 글리세롤-3-인산 아실기 전이 효소 결손(이하, 「GPAT 결손」이라고 기재하는 경우도 있음)을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(b) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(c) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열과 동일성이 70% 이상인 염기 서열로 이루어지고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(d) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 70% 이상인 아미노산 서열로 이루어지고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(e) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(f) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(g) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열과 동일성이 70% 이상인 염기 서열로 이루어지고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(5) 이하의 (a)∼(g) 중 어느 것인 (4)에 기재한 핵산.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열에 있어서 1∼80개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(b) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 2×SSC, 50℃의 조건 하에서 하이브리다이즈하고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(c) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열과 동일성이 90% 이상인 염기 서열로 이루어지고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(d) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 90% 이상인 아미노산 서열로 이루어지고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(e) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 2×SSC, 50℃의 조건 하에서 하이브리다이즈하고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(f) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 2×SSC, 50℃의 조건 하에서 하이브리다이즈하고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(g) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열과 동일성이 90% 이상인 염기 서열로 이루어지고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(6) 이하의 (a) 또는 (b) 중 어느 것에 기재한 단백질.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9에 있어서 하나 혹은 복수 개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질
(b) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 70% 이상인 아미노산 서열로 이루어지는 단백질이며, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질
(7) 이하의 (a) 또는 (b) 중 어느 것에 기재한 단백질.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9에 있어서 1∼80개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지고, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질
(b) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 90% 이상인 아미노산 서열로 이루어지는 단백질이며, 또한, 글리세롤-3-인산 아실기 전이 효소 활성 및/또는 글리세론 포스페이트 아실기 전이 효소 활성을 갖는 단백질
(8) 이하의 (a) 또는 (b) 중 어느 것에 기재한 단백질.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9에 있어서 하나 혹은 복수 개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(b) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 70% 이상인 아미노산 서열로 이루어지는 단백질이며, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(9) 이하의 (a) 또는 (b) 중 어느 것에 기재한 단백질.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9에 있어서 1∼80개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지고, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(b) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 90% 이상인 아미노산 서열로 이루어지는 단백질이며, 또한, 이하의 ⅰ) 내지 ⅴ) 중 어느 활성을 갖는 단백질
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성
ⅳ) 효모(S. cerevisiae)의 GPAT 결손을 상보하는 활성
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성
(10) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질.
(11) (1)∼(5) 중 어느 한 항에 기재한 핵산을 함유하는 재조합 벡터.
(12) (11)에 기재한 재조합 벡터에 의해서 형질전환된 형질전환체.
(13) (12)에 기재한 형질전환체를 배양하여 얻어지는 지방산 또는 지질을 포함하는 지방산 조성물.
(14) (12)에 기재한 형질전환체를 배양하여 얻어지는 배양물로부터 지방산 또는 지질을 채취하는 것을 특징으로 하는 지방산 조성물의 제조 방법.
(15) (13)에 기재한 지방산 조성물을 포함하는 식품.
본 발명의 GPAT는 종래의 GPAT와는 기질 특이성이 다르고, 종래의 GPAT가 발현한 숙주가 생성하는 지방산 조성물과는 조성이 다른 지방산 조성물을 숙주 중에 생성시킬 수 있다. 이에 따라, 원하는 특성이나 효과를 갖는 지질을 제공할 수 있기 때문에, 식품, 화장료, 의약품, 비누 등에 적용할 수 있는 것으로서 유용하다.
또한, 본 발명의 GPAT는 지방산이나 저장 지질의 생산능 향상을 도모할 수 있기 때문에, 미생물이나 식물 속에서의 고도 불포화 지방산의 생산성을 향상시키는 것으로서 바람직하다.
도 1a는 M. alpina 1S-4주 유래의 MaGPAT4의 게놈 서열(서열 번호 7)과 CDS 서열(서열 번호 3)을 비교한 도면이다.
도 1b는 도 1a에 계속되는 것이다.
도 1c는 도 1b에 계속되는 것이다.
도 2a는 M. alpina 1S-4주 유래의 MaGPAT4의 CDS 서열(서열 번호 3) 및 그로부터 유도되는 추정 아미노산 서열(서열 번호 2)을 도시한 도면이다. 2줄 밑줄부는 pfam의 아실기 전이 효소(수탁번호(accession No.) PF01553)의 모티브와 높은 상동성을 갖는 것으로서 히트된 영역이다.
도 2b는 도 2a에 계속되는 것이다.
도 3a는 M. alpina 1S-4주 유래의 MaGPAT5의 게놈 서열(서열 번호 12)과 CDS 서열(서열 번호 10)을 비교한 도면이다.
도 3b는 도 3a에 계속되는 것이다.
도 4a는 M. alpina 1S-4주 유래의 MaGPAT5의 cDNA 서열(서열 번호 11) 및 그로부터 유도되는 추정 아미노산 서열(서열 번호 9)을 도시한 도면이다.
도 4b는 도 4a에 계속되는 것이다.
도 5는 M. alpina 1S-4주 유래의 MaGPAT4의 추정 아미노산 서열(서열 번호 2)과, 자낭균 Chaetomium globosum CBS 148.51 유래의 추정 단백질의 아미노산 서열(서열 번호 21; GenBank 수탁번호 XP_001224211) 및 E. coli 유래의 GPAT인 plsB 단백질의 아미노산 서열(서열 번호 22; GenBank 수탁번호 BAE78043)을 비교한 도면이다. 1줄 밑줄부는 pfam의 아실기 전이 효소(수탁번호 PF01553)의 모티브와 상동성이 높은 영역. 그 중에서도 2줄 밑줄부는 GPAT 호몰로그로 잘 보존되어 있는 영역이며, *는 아실기 전이 효소 활성에 중요한 아미노산 잔기, +는 G3P와의 결합에 필요한 아미노산 잔기를 나타낸다.
도 6a는 M. alpina 1S-4주 유래의 MaGPAT5의 추정 아미노산 서열(서열 번호 9)과, 담자균 Ustilago maydis 521 유래의 추정 단백질 UM03369의 아미노산 서열(서열 번호 23; GenBank 수탁번호 XP_759516), 및 S. cerevisiae 유래의 GPAT인 SCT1(YBL011W)(서열 번호 24) 및 GPT2(YKR067W)(서열 번호 25W)의 아미노산 서열을 비교한 도면이다. 2줄 밑줄부는 GPAT 호몰로그로 잘 보존되어 있는 영역이며, *는 아실기 전이 효소 활성에 중요한 아미노산 잔기, +는 G3P와의 결합에 필요한 아미노산 잔기를 나타낸다.
도 6b는 도 6a에 계속되는 것이다.
도 7은 갈락토오스 유도형의 프로모터에 연결된 MaGPAT4-long 또는 MaGPAT4를 갖는 플라스미드로 형질전환한 효모에 대해서, SG-Trp 배지로 배양함으로써, 갈락토오스로 발현 유도시킨 경우의 지질 분획의 지방산 조성을 나타내는 그래프이다.
도 8은 갈락토오스 유도형의 프로모터에 연결된 MaGPAT4-long 또는 MaGPAT4를 갖는 플라스미드로 형질전환한 효모에 대해서, 갈락토오스를 포함하지 않는 SC-Trp 배지로 배양한 경우의 총 지방산의 조성을 나타내는 그래프이다.
도 9는 GPAT4를 M. alpina로 과잉 발현시킨 경우의 건조 균체당 아라키돈산 생산량의 시간 경과에 따른 변화를 나타내는 그래프이다.
도 1b는 도 1a에 계속되는 것이다.
도 1c는 도 1b에 계속되는 것이다.
도 2a는 M. alpina 1S-4주 유래의 MaGPAT4의 CDS 서열(서열 번호 3) 및 그로부터 유도되는 추정 아미노산 서열(서열 번호 2)을 도시한 도면이다. 2줄 밑줄부는 pfam의 아실기 전이 효소(수탁번호(accession No.) PF01553)의 모티브와 높은 상동성을 갖는 것으로서 히트된 영역이다.
도 2b는 도 2a에 계속되는 것이다.
도 3a는 M. alpina 1S-4주 유래의 MaGPAT5의 게놈 서열(서열 번호 12)과 CDS 서열(서열 번호 10)을 비교한 도면이다.
도 3b는 도 3a에 계속되는 것이다.
도 4a는 M. alpina 1S-4주 유래의 MaGPAT5의 cDNA 서열(서열 번호 11) 및 그로부터 유도되는 추정 아미노산 서열(서열 번호 9)을 도시한 도면이다.
도 4b는 도 4a에 계속되는 것이다.
도 5는 M. alpina 1S-4주 유래의 MaGPAT4의 추정 아미노산 서열(서열 번호 2)과, 자낭균 Chaetomium globosum CBS 148.51 유래의 추정 단백질의 아미노산 서열(서열 번호 21; GenBank 수탁번호 XP_001224211) 및 E. coli 유래의 GPAT인 plsB 단백질의 아미노산 서열(서열 번호 22; GenBank 수탁번호 BAE78043)을 비교한 도면이다. 1줄 밑줄부는 pfam의 아실기 전이 효소(수탁번호 PF01553)의 모티브와 상동성이 높은 영역. 그 중에서도 2줄 밑줄부는 GPAT 호몰로그로 잘 보존되어 있는 영역이며, *는 아실기 전이 효소 활성에 중요한 아미노산 잔기, +는 G3P와의 결합에 필요한 아미노산 잔기를 나타낸다.
도 6a는 M. alpina 1S-4주 유래의 MaGPAT5의 추정 아미노산 서열(서열 번호 9)과, 담자균 Ustilago maydis 521 유래의 추정 단백질 UM03369의 아미노산 서열(서열 번호 23; GenBank 수탁번호 XP_759516), 및 S. cerevisiae 유래의 GPAT인 SCT1(YBL011W)(서열 번호 24) 및 GPT2(YKR067W)(서열 번호 25W)의 아미노산 서열을 비교한 도면이다. 2줄 밑줄부는 GPAT 호몰로그로 잘 보존되어 있는 영역이며, *는 아실기 전이 효소 활성에 중요한 아미노산 잔기, +는 G3P와의 결합에 필요한 아미노산 잔기를 나타낸다.
도 6b는 도 6a에 계속되는 것이다.
도 7은 갈락토오스 유도형의 프로모터에 연결된 MaGPAT4-long 또는 MaGPAT4를 갖는 플라스미드로 형질전환한 효모에 대해서, SG-Trp 배지로 배양함으로써, 갈락토오스로 발현 유도시킨 경우의 지질 분획의 지방산 조성을 나타내는 그래프이다.
도 8은 갈락토오스 유도형의 프로모터에 연결된 MaGPAT4-long 또는 MaGPAT4를 갖는 플라스미드로 형질전환한 효모에 대해서, 갈락토오스를 포함하지 않는 SC-Trp 배지로 배양한 경우의 총 지방산의 조성을 나타내는 그래프이다.
도 9는 GPAT4를 M. alpina로 과잉 발현시킨 경우의 건조 균체당 아라키돈산 생산량의 시간 경과에 따른 변화를 나타내는 그래프이다.
본 발명은 Mortierella 유래의 신규의 아실기 전이 효소 유전자와 그 이용에 관한 것이다. 본 발명의 아실기 전이 효소는, 글리세롤-3-인산을 아실화하여 리소포스파티딘산을 생성시키거나 및/또는 글리세론 포스페이트의 수산기에 아실기를 전이시키는 것을 특징으로 하는 아실기 전이 효소라도 좋다.
본 발명의 아실기 전이 효소는, 글리세롤-3-인산 및/또는 글리세론 포스페이트에 아실기를 전이시키는 반응을 촉매하는 효소이다. 본 발명의 효소의 아실기 수용체는 통상 글리세롤-3-인산 및/또는 글리세론 포스페이트이지만, 이들에 한정되지 않는다.
따라서 본 발명의 아실기 전이 효소는 글리세롤-3-인산 아실기 전이 효소(GPAT) 및/또는 글리세론 포스페이트 O-아실기 전이 효소(GNPAT)로서의 활성을 지닐 수 있다. 그러나, 본 명세서에 있어서는 본 발명의 효소에 대해서, 실제로 갖는 활성의 여하는 상관하지 않고, 편의적으로 「글리세롤-3-인산 아실기 전이 효소」 또는 「GPAT」라고 기재하는 경우도 있다.
본 발명의 글리세롤-3-인산 아실기 전이 효소를
코드하는
핵산
본 발명의 글리세롤-3-인산 아실기 전이 효소(GPAT)에는 MaGPAT4, MaGPAT4-long 및 MaGPAT5가 포함된다. MaGPAT4, MaGPAT4-long 및 MaGPAT5를 코드하는 cDNA, CDS, ORF 및 추정 아미노산 서열의 대응 관계를 이하의 표 1에 정리하여 기재했다.
본 발명의 MaGPAT4에 관련되는 서열로서, MaGPAT4의 아미노산 서열인 서열 번호 2, 및 MaGPAT4의 ORF의 영역을 나타내는 서열인 서열 번호 1 및 그 CDS 또는 cDNA의 영역을 나타내는 서열인 서열 번호 3을 들 수 있다. 이 중, 서열 번호 1은 서열 번호 3의 제1-2475번째의 염기 서열에 해당한다. 본 발명의 MaGPAT4-long에 관련되는 서열로서, MaGPAT4-long의 아미노산 서열인 서열 번호 5, 및 MaGPAT4-long의 ORF의 영역을 나타내는 서열인 서열 번호 4 및 그 CDS 또는 cDNA의 영역을 나타내는 서열인 서열 번호 6을 들 수 있다. 이 중, 서열 번호 4는 서열 번호 6의 제1-2643번째의 염기 서열에 해당한다. 여기서, 상술한 표에서 나타낸 것과 같이, MaGPAT4의 아미노산 서열 및 염기 서열은 각각 MaGPAT4-long의 아미노산 서열 및 염기 서열의 일부를 구성하고 있다. 또한, 본 발명의 MaGPAT4 및 MAGPAT4-long을 코드하는 게놈 서열로서 서열 번호 7을 들 수 있다. MaGPAT4를 코드하는 경우, 서열 번호 7의 게놈 서열은 엑손 10개와 인트론 9개로 이루어져 있고, 엑손 영역은 서열 번호 7의 제596∼744번째, 제850∼924번째, 제1302∼1396번째, 제1480∼1726번째, 제1854∼2279번째, 제2370∼2632번째, 제2724∼3299번째, 제3390∼3471번째, 제3575∼4024번째, 제4133∼4248번째이다. 혹은, MaGPAT4-long을 코드하는 경우, 서열 번호 7의 게놈 서열은 엑손 10개와 인트론 9개로 이루어져 있고, 엑손 영역은 서열 번호 7의 제428∼744번째, 제850∼924번째, 제1302∼1396번째, 제1480∼1726번째, 제1854∼2279번째, 제2370∼2632번째, 제2724∼3299번째, 제3390∼3471번째, 제3575∼4024번째, 제4133∼4248번째이다.
본 발명의 MaGPAT5에 관련되는 서열로서, MaGPAT5의 아미노산 서열인 서열 번호 9, 및 MaGPAT5의 ORF의 영역을 나타내는 서열인 서열 번호 8, 그 CDS의 영역을 나타내는 서열인 서열 번호 10 및 그 cDNA의 염기 서열인 서열 번호 11을 들 수 있다. 이 중, 서열 번호 10은 서열 번호 11의 제225-2591번째의 염기 서열에 해당하고, 서열 번호 8은 서열 번호 11의 제225-2588번째의 염기 서열 및 서열 번호 10의 1-2364번째의 염기 서열에 해당한다. 또한, 본 발명의 MaGPAT5를 코드하는 게놈 서열로서 서열 번호 12를 들 수 있다. 서열 번호 12의 게놈 서열은 엑손 3개와 인트론 2개로 이루어져 있고, 엑손 영역은 서열 번호 12의 제1∼302번째, 제457∼1676번째, 제1754∼2598번째이다.
본 발명의 핵산이란, 단일쇄 및 이중쇄의 DNA 외에, 그 RNA 상보체도 포함하며, 천연에서 유래하는 것이라도 인공적으로 제작한 것이라도 좋다. DNA에는, 예컨대 게놈 DNA나, 상기 게놈 DNA에 대응하는 cDNA, 화학적으로 합성된 DNA, PCR에 의해 증폭된 DNA 및 이들의 조합이나, DNA와 RNA의 하이브리드를 들 수 있지만 이들에 한정되지 않는다.
본 발명의 핵산의 바람직한 양태로서는, (a) 서열 번호 1, 서열 번호 4 혹은 서열 번호 8로 나타내어지는 염기 서열을 포함하는 핵산, (b) 서열 번호 2, 서열 번호 5 혹은 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열을 포함하는 핵산, (c) 서열 번호 3, 서열 번호 6 혹은 서열 번호 11로 나타내어지는 염기 서열을 포함하는 핵산, 또는 (d) 서열 번호 7 혹은 서열 번호 12로 나타내어지는 염기 서열을 포함하는 핵산 등을 들 수 있다.
상기 염기 서열을 얻기 위해서는, GPAT 활성을 갖는 생물의 EST나 게놈 DNA의 염기 서열 데이터로부터, 이미 알려진 GPAT 활성을 갖는 단백질과 상동성이 있는 단백질을 코드하는 염기 서열을 탐색할 수도 있다. GPAT 활성을 갖는 생물로서는 지질 생산균이 바람직하며, 지질 생산균으로서는 M. alpina를 들 수 있지만, 이것에 한정되지 않는다.
EST 해석을 하는 경우에는 우선 cDNA 라이브러리를 제작한다. cDNA 라이브러리의 제작 방법에 관해서는 『Molecular Cloning, A Laboratory Manual 3rd ed.』(Cold Spring Harbor Press(2001))를 참조할 수 있다. 또한, 시판되는 cDNA 라이브러리 제작 키트를 이용하더라도 좋다. 본 발명에 알맞은 cDNA 라이브러리의 제작 방법으로서는 예컨대 다음과 같은 방법을 들 수 있다. 즉, 지질 생산균인 M. alpina의 적당한 주를 적당한 배지에 식균하여, 적당 기간 전배양한다. 이 전배양에 알맞은 배양 조건으로서는, 예컨대 배지 조성은 1.8% 글루코오스, 1% 효모 엑기스, pH 6.0을 들 수 있고, 배양 기간은 3∼4일간, 배양 온도는 28℃인 조건을 들 수 있다. 그 후, 전배양물을 적당한 조건으로 본배양에 제공한다. 본배양에 알맞은 배지 조성은, 예컨대 1.8% 글루코오스, 1% 대두분, 0.1% 올리브유, 0.01% 아데카놀, 0.3% KH2PO4, 0.1% Na2SO4, 0.05% CaCl2·2H2O, 0.05% MgCl2·6H2O, pH 6.0을 들 수 있다. 본배양에 알맞은 배양 조건은, 예컨대 300 rpm, 1 vvm, 26℃에서 8일간 통기 교반 배양하는 조건을 들 수 있다. 배양 기간 중에 적당량의 글루코오스를 첨가하더라도 좋다. 본배양 중에 적시에 배양물을 채취하고, 그로부터 균체를 회수하여, 전체 RNA를 조제한다. 전체 RNA의 조제에는 염산구아니딘/CsCl법 등의 공지된 방법을 이용할 수 있다. 얻어진 전체 RNA로부터 시판되는 키트를 이용하여 poly(A)+RNA를 정제할 수 있다. 또한, 시판되는 키트를 이용하여 cDNA 라이브러리를 제작할 수 있다. 그 후, 제작한 cDNA 라이브러리의 임의 클론의 염기 서열을, 벡터 상에 인서트 부분의 염기 서열을 결정할 수 있도록 설계된 프라이머를 이용하여 결정하여, EST를 얻을 수 있다. 예컨대, ZAP-cDNA GigapackIII Gold Cloning Kit(STRATAGENE)로 cDNA 라이브러리를 제작한 경우는, 디렉셔널 클로닝을 행할 수 있다.
게놈 DNA를 해석하는 경우는, GPAT 활성을 갖는 생물의 세포를 배양하여, 그 세포로부터 게놈 DNA를 조제한다. 얻어진 게놈 DNA의 염기 서열을 결정하여, 결정한 염기 서열을 어셈블리했다. 최종적으로 얻어진 수퍼콘티그의 서열로부터, 이미 알려진 GPAT 활성을 갖는 단백질의 아미노산 서열과 상동성이 있는 아미노산 서열을 코드하는 서열을 탐색한다. 이러한 아미노산 서열을 코드하는 것으로서 히트된 수퍼콘티그의 서열로부터 프라이머를 제작하고, 상술한 cDNA 라이브러리를 주형으로 하여 PCR을 행하고, 얻어진 DNA 단편을 플라스미드에 집어넣어, 클론화한다. 클론화된 플라스미드를 주형으로 하고, 상술한 프라이머를 이용하여 PCR을 행함으로써 프로브를 제작한다. 제작한 프로브를 이용하여 cDNA 라이브러리를 스크리닝한다.
본 발명의 MaGPAT4 및 MaGPAT5의 추정 아미노산 서열을, GenBank에 등록되어 있는 아미노산 서열에 대하여 BLASTp 프로그램으로 상동성 검색을 했다. MaGPAT4에 대하여 동일성이 높았던 아미노산 서열은, 자낭균 Chaetomium globosum CBS 148.51 유래의 추정 단백질의 아미노산 서열(GenBank 수탁번호 XP_001224221)이며, 동일성은 39.3%이다. 또한, MaGPAT4는 인간 유래의 글리세론 포스페이트 O-아실기 전이 효소(GNPAT; GenBank 수탁번호 AAH00450)와도 상동성이 있고, 아미노산 동일성은 22.6%이다. 더욱이, MaGPAT4는 대장균(E. coli) 유래의 GPAT인 plsB 단백질(GenBank 수탁번호 BAE78043)과의 아미노산 동일성은 17.6%이다. 한편, MaGPAT5에 대하여 동일성이 높았던 아미노산 서열은 담자균 Ustilago maydis 521 유래의 추정 단백질의 아미노산 서열(GenBank 수탁번호 XP_759516)이며, 동일성은 15.4%이다.
본 발명은 또한, 상기 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 나타내어지는 염기 서열(「본 발명의 염기 서열」이라고 기재하는 경우도 있음) 및 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열(「본 발명의 아미노산 서열」이라고 기재하는 경우도 있음)로 이루어지는 단백질을 코드하는 염기 서열을 포함하는 핵산과 동등한 기능을 갖는 핵산을 포함한다. 「동등한 기능을 갖는다」란, 본 발명의 염기 서열이 코드하는 단백질 및 본 발명의 아미노산 서열로 이루어지는 단백질이, 글리세롤-3-인산 아실기 전이 효소(GPAT) 활성 및/또는 글리세론 포스페이트 O-아실기 전이 효소(GNPAT) 활성을 가짐을 의미한다. 또, 「동등한 기능을 갖는다」란, 본 발명의 염기 서열이 코드하는 단백질 또는 본 발명의 아미노산 서열로 이루어지는 단백질이 발현하고 있는 숙주의 지방산 조성에 있어서, 이하 :
ⅰ) 상기 단백질을 발현시킨 효모의 지방산 조성에 있어서, 상기 단백질을 발현하지 않은 숙주의 지방산 조성과 비교하여, 팔미틴산의 비율이 높고, 팔미톨레산의 비율이 낮은 지방산 조성을 형성할 수 있는 활성;
ⅱ) 상기 단백질을 발현시킨 효모의 지방산 함유율이, 상기 단백질을 발현하지 않은 숙주의 지방산 함유율과 비교하여 높은 함유율을 달성하는 활성;
ⅲ) 상기 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량이, 상기 단백질을 발현하지 않은 숙주의 TG량과 비교하여 높은 TG량을 달성하는 활성;
ⅳ) 효모(S. cerevisiae)의 글리세롤-3-인산 아실기 전이 효소 결손(GPAT 결손)을 상보하는 활성, 바람직하게는 상기 GPAT 결손은 효모의 SCT1 유전자 및 GPT2 유전자 양쪽의 결손에 의한 것임; 및/또는
ⅴ) 상기 단백질을 코드하는 핵산을 함유하는 재조합 벡터에 의해서 형질전환된 숙주에 있어서의 아라키돈산의 생산량을, 상기 벡터로 형질전환되지 않은 숙주에 있어서의 생산량보다도 높일 수 있는 활성,
중 어느 활성을 가짐을 의미하더라도 좋다.
이러한 본 발명의 핵산과 동등한 기능을 갖는 핵산으로서는 이하의 (a)∼(g) 중 어느 것에 기재한 염기 서열을 포함하는 핵산을 들 수 있다. 한편, 이하에 예로 드는 염기 서열의 기재에 있어서, 「본 발명의 상기 활성」이란, 상기한 「GPAT 활성, GNPAT 활성, 상기 ⅰ) 내지 ⅴ)의 활성에서 선택되는 어느 하나 이상의 활성」을 의미한다.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열에 있어서 하나 혹은 복수 개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
본 발명의 핵산에 포함되는 염기 서열은, 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열에 있어서 하나 혹은 복수 개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 포함한다.
구체적으로는,
(ⅰ) 서열 번호 2, 서열 번호 5 또는 서열 번호 9에 나타내는 아미노산 서열 중 1개 또는 복수 개(바람직하게는 1개 또는 수개(예컨대, 1∼250개, 1∼200개, 1∼150개, 1∼100개, 1∼80개, 1∼75개, 1∼50개, 1∼30개, 1∼25개, 1∼20개, 1∼15개, 더욱 바람직하게는 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개))의 아미노산이 결실된 아미노산 서열,
(ⅱ) 서열 번호 2, 서열 번호 5 또는 서열 번호 9에 나타내는 아미노산 서열 중 1개 또는 복수 개(바람직하게는 1개 또는 수개(예컨대, 1∼250개, 1∼200개, 1∼150개, 1∼100개, 1∼80개, 1∼75개, 1∼50개, 1∼30개, 1∼25개, 1∼20개, 1∼15개, 더욱 바람직하게는 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개))의 아미노산이 다른 아미노산으로 치환한 아미노산 서열,
(ⅲ) 서열 번호 2, 서열 번호 5 또는 서열 번호 9에 나타내는 아미노산 서열에 있어서 1개 또는 복수 개(바람직하게는 1개 또는 수개(예컨대, 1∼250개, 1∼200개, 1∼150개, 1∼100개, 1∼80개, 1∼75개, 1∼50개, 1∼30개, 1∼25개, 1∼20개, 1∼15개, 더욱 바람직하게는 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개))의 다른 아미노산이 부가된 아미노산 서열, 또는
(ⅳ) 상기 (ⅰ)∼(ⅲ)을 조합시킨 아미노산 서열로 이루어지는 단백질이며, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열이다.
상기에서, 치환은 바람직하게는 보존적 치환이다. 보존적 치환이란, 특정한 아미노산 잔기를 유사한 물리 화학적 특징을 갖는 잔기로 치환하는 것인데, 원래 서열의 구조에 관한 특징을 실질적으로 변화시키지 않으면 어떠한 치환이라도 좋으며, 예컨대, 치환 아미노산이 원래의 서열에 존재하는 나선을 파괴하거나, 원래의 서열을 특징짓는 다른 종류의 이차 구조를 파괴하거나 하지 않으면 어떠한 치환이라도 좋다.
보존적 치환은, 일반적으로는 생물학적 합성계나 화학적 펩티드 합성으로 도입되지만, 바람직하게는 화학적 펩티드 합성에 의한다. 이 경우, 치환기에는 비천연 아미노산 잔기가 포함되어 있더라도 좋고, 펩티드 모방체나, 아미노산 서열 중, 치환되지 않은 영역이 역전되어 있는 역전형 또는 동 영역이 반전되어 있는 반전형도 포함된다.
이하에, 아미노산 잔기를 치환 가능한 잔기별로 분류하여 예시하지만, 치환 가능한 아미노산 잔기는 이하에 기재되어 있는 것에 한정되는 것은 아니다.
A군 : 류신, 이소류신, 노르류신, 발린, 노르발린, 알라닌, 2-아미노부탄산, 메티오닌, O-메틸세린, t-부틸글리신, t-부틸알라닌 및 시클로헥실알라닌
B군 : 아스파라긴산, 글루타민산, 이소아스파라긴산, 이소글루타민산, 2-아미노아디프산 및 2-아미노수베린산
C군 : 아스파라긴 및 글루타민
D군 : 리신, 아르기닌, 오르니틴, 2,4-디아미노부탄산 및 2,3-디아미노프로피온산
E군 : 프롤린, 3-히드록시프롤린 및 4-히드록시프롤린
F군 : 세린, 트레오닌 및 호모세린
G군 : 페닐알라닌 및 티로신
비보존적 치환의 경우는, 상기 종류 중, 어떤 하나의 멤버와 다른 종류의 멤버를 교환할 수 있는데, 이 경우는 본 발명의 단백질의 생물학적 기능을 유지하기 위해서, 아미노산의 히드로파시(hydropathy) 지수(히드로파시 아미노산 지수)를 고려하는 것이 바람직하다(Kyte 등, J. Mol. Biol., 157:105-131(1982)).
또한, 비보존적 치환의 경우는, 친수성에 기초하여 아미노산 치환을 할 수 있다.
보존적 치환 및 비보존적 치환 어느 것에 있어서도, 서열 번호 2에 있어서의 316번째, 319번째 및 351번째의 아미노산에 상당하는 아미노산 잔기는 각각 글리신, 세린 및 프롤린인 것이 바람직하다. 서열 번호 9에 대해서는, 430번째, 432번째 및 465번째의 아미노산에 상당하는 아미노산 잔기는 각각 글리신, 세린 및 프롤린인 것이 바람직하다.
본 명세서 및 도면에 있어서, 염기나 아미노산 및 그 약어는, IUPAC-IUB Commission on Biochemical Nomenclature에 따르거나, 또는 예컨대, Immunology--A Synthesis(제2판, E.S. Golub 및 D.R. Gren 감수, Sinauer Associates, 매사츄세츠 주 선더랜드(1991)) 등에 기재되어 있는 것과 같은 당업계에서 관용되고 있는 약어에 기초한다. 또한 아미노산에 대하여 광학 이성체가 있을 수 있는 경우는, 특별히 명시하지 않으면 L체를 나타낸다.
D-아미노산 등의 상기한 아미노산의 입체 이성체, α,α-2 치환 아미노산 등의 비천연 아미노산, N-알킬아미노산, 젖산 및 그 밖의 비관용적인 아미노산도 또한 본 발명의 단백질을 구성하는 요소가 될 수 있다.
한편, 본 명세서에서 이용하는 단백질의 표기법은 표준 적용법 및 당업계에서 관용되고 있는 표기법에 기초하며, 좌측 방향은 아미노 말단 방향이고, 그리고 우측 방향은 카르복시 말단 방향이다.
마찬가지로, 일반적으로는, 특별히 언급하지 않는 한, 단일쇄 폴리뉴클레오티드 서열의 좌단은 5'단이고, 이중쇄 폴리뉴클레오티드 서열의 좌측 방향을 5' 방향으로 한다.
당업자라면, 당업계에서 공지된 기술을 이용하여, 본 명세서에 기재한 단백질의 적당한 변이체를 설계하여, 제작할 수 있다. 예컨대, 본 발명의 단백질의 생물학적 활성에 그다지 중요하지 않다고 생각되는 영역을 타케팅함으로써, 본 발명의 단백질의 생물학적 활성을 손상하는 일없이 그 구조를 변화시킬 수 있는 단백질 분자 중의 적절한 영역을 동정할 수 있다. 또한, 유사 단백질 사이에서 보존되어 있는 분자의 잔기 및 영역을 동정할 수도 있다. 더욱이, 본 발명의 단백질의 생물학적 활성 또는 구조에 중요하다고 생각되는 영역 중에, 생물학적 활성을 손상하지 않고, 또, 단백질의 폴리펩티드 구조에 악영향을 주지 않고서, 보존적 아미노산 치환을 도입할 수도 있다.
당업자라면, 본 발명의 단백질의 생물학적 활성 또는 구조에 중요하고, 동 단백질의 펩티드와 유사한 펩티드의 잔기를 동정하여, 이 2개의 펩티드의 아미노산 잔기를 비교하여, 본 발명의 단백질과 유사한 단백질의 어느 잔기가 생물학적 활성 또는 구조에 중요한 아미노산 잔기에 대응하는 아미노산 잔기인지를 예측하는, 소위 구조-기능 연구를 할 수 있다. 더욱이, 이와 같이 예측한 아미노산 잔기의 화학적으로 유사한 아미노산 치환을 선택함으로써, 본 발명의 단백질의 생물학적 활성이 유지되어 있는 변이체를 선택할 수도 있다. 또한, 당업자라면, 본 단백질의 변이체의 삼차원 구조 및 아미노산 서열을 해석할 수도 있다. 더욱이, 얻어진 해석 결과로부터, 단백질의 삼차원 구조에 관한, 아미노산 잔기의 얼라인먼트를 예측할 수도 있다. 단백질 표면 상에 있다고 예측되는 아미노산 잔기는 다른 분자와의 중요한 상호 작용에 관여할 가능성이 있는데, 당업자라면, 상기한 것과 같은 해석 결과에 기초하여, 이러한 단백질 표면 상에 있다고 예측되는 아미노산 잔기를 변화시키지 않는 변이체를 제작할 수 있다. 또한, 당업자라면, 본 발명의 단백질을 구성하는 각각의 아미노산 잔기 중, 하나의 아미노산 잔기만을 치환하는 변이체를 제작할 수도 있다. 이러한 변이체를 공지된 분석 방법에 의해 스크리닝하여, 개개의 변이체의 정보를 수집할 수 있다. 이에 따라, 어떤 특정한 아미노산 잔기가 치환된 변이체의 생물학적 활성이 본 발명의 단백질의 생물학적 활성에 비하여 저하하는 경우, 그와 같은 생물학적 활성을 보이지 않는 경우, 또는 본 단백질의 생물학적 활성을 저해하는 부적절한 활성을 일으키는 경우를 비교함으로써, 본 발명의 단백질을 구성하는 개개의 아미노산 잔기의 유용성을 평가할 수 있다. 또한, 당업자라면, 이러한 일상적인 실험에서 수집한 정보에 기초하여, 단독으로 또는 다른 돌연변이와 조합하여, 본 발명의 단백질의 변이체로서는 바람직하지 않은 아미노산 치환을 용이하게 해석할 수 있다.
상기한 것과 같이, 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열에 있어서 하나 혹은 복수 개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지는 단백질은 『Molecular Cloning, A Laboratory Manual 3rd ed.』(Cold Spring Harbor Press(2001)), 『Current Protocols in Molecular Biology』(John Wiley & Sons(1987-1997), Kunkel(1985) Proc. Natl. Acad. Sci. USA 82: 488-92, Kunkel(1988) Method. Enzymol. 85: 2763-6 등에 기재된 부위 특이적 변이 유발법 등의 방법에 따라서 조제할 수 있다. 이러한 아미노산의 결실, 치환 혹은 부가 등의 변이가 이루어진 변이체의 제작은, 예컨대, Kunkel법이나 Gapped duplex법 등의 공지된 수법에 의해, 부위 특이적 돌연변이 유발법을 이용한 변이 도입용 키트, 예컨대 QuikChangeTM Site-Directed Mutagenesis Kit(스트라타진사 제조), GeneTailorTM Site-Directed Mutagenesis System(인비트로젠사 제조), TaKaRa Site-Directed Mutagenesis System(Mutan-K, Mutan-Super Express Km 등: 타카라바이오사 제조) 등을 이용하여 행할 수 있다.
한편, 단백질의 아미노산 서열에, 그 활성을 유지하면서 하나 혹은 복수 개의 아미노산의 결실, 치환, 혹은 부가를 도입하는 방법으로서는, 상기한 부위 특이적 변이 유발 외에도, 유전자를 변이원으로 처리하는 방법 및 유전자를 선택적으로 개열(開裂)하여 선택된 뉴클레오티드를 제거, 치환 혹은 부가한 후에 연결하는 방법을 들 수 있다.
본 발명의 핵산에 포함되는 염기 서열은, 바람직하게는 서열 번호 2, 서열 번호 5 또는 서열 번호 9에 나타내어지는 아미노산 서열에 있어서 1∼80개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지고, 또한, GPAT 활성 및/또는 GNPAT 활성을 갖는 단백질을 코드하는 염기 서열이다.
또한, 본 발명의 핵산에 포함되는 염기 서열에는, 바람직하게는, 서열 번호 2, 서열 번호 5 또는 서열 번호 9에 있어서 1∼80개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열도 포함된다.
본 발명의 단백질에 있어서의 아미노산의 변이 또는 수식의 수, 혹은 변이 또는 수식의 부위는 본 발명의 상기 활성이 유지되는 한 제한은 없다.
본 발명의 단백질의 GPAT 활성을 비롯하여, 본 발명의 상기 활성은 공지된 방법을 이용하여 측정하는 것이 가능하다. 예컨대, 이하의 문헌 : Biochem. J., 355, 315-322, 2001을 참조할 수 있다.
예컨대, 본 발명의 「GPAT 활성」은 다음과 같이 측정하더라도 좋다. 본 발명의 GPAT를 발현시킨 효모로부터, J. Bacteriology, 173, 2026-2034(1991)에 기재된 방법 등에 의해 마이크로솜 분획을 조제한다. 그리고, 반응액인, 0.44 mM 글리세롤-3-인산, 0.36 mM 아실-CoA, 0.5 mM DTT, 1 mg/ml BSA, 2 mM MgCl2, 50 mM Tris-HCl(pH 7.5)에 상기 마이크로솜 분획을 첨가하여, 28℃에서 적당 시간 반응시키고, 클로로포름:메탄올을 첨가하여 반응을 정지시킨 후, 지질을 추출하고, 얻어진 지질을 박층 크로마토그래피 등에 의해 분획하여, 생성된 리소포스파티딘산의 양을 정량할 수 있다.
또한, 본 발명의 상기 ⅰ), ⅱ) 또는 ⅴ)에 나타낸 활성은 예컨대 다음과 같이 하여, 본 발명의 단백질을 발현시킨 숙주 세포(예컨대, 효모, M. alpina)의 지방산 조성 또는 지방산 함유율을 측정함으로써 측정하더라도 좋다. 본 발명의 지방산 조성물의 제조 방법에 의해 얻어진 동결 건조한 균체에, 적당한 비율로 조정한 클로로포름:메탄올을 첨가하여 교반한 후, 적당 시간 가열 처리를 한다. 또한 원심 분리에 의해 균체를 분리하고, 용매를 회수하는 것을 수회 반복한다. 그 후, 적당한 방법을 이용하여 지질을 건고(乾固)시키고 나서, 클로로포름 등의 용매를 첨가하여 지질을 용해한다. 이 시료를 적당량 분취하여, 염산 메탄올법에 의해 균체의 지방산을 메틸에스테르로 유도한 후에, 헥산으로 추출하고, 헥산을 유거하고 나서, 가스 크로마토그래피로 분석을 한다.
본 발명의 상기 ⅲ)에 나타낸 활성은 예컨대 다음과 같이 하여, 본 발명의 단백질을 발현시킨 효모의 트리아실글리세롤(TG)량을 측정함으로써 측정하더라도 좋다. 상기한 것과 같이 지질을 균체로부터 추출·회수한 후, 예컨대 박층 크로마토그래피(TLC)를 실시하여 분획하고, TG 분획을 회수한다. 그리고, 염산 메탄올법에 의해, 회수한 TG 분획에 대해서 TG를 구성하는 지방산을 메틸에스테르로 유도한 후에, 헥산으로 추출하고, 헥산을 유거하고 나서, 가스 크로마토그래피로 정량한다.
본 발명의 상기 ⅳ)에 나타낸 활성은 예컨대 다음과 같이 하여, 도입한 본 발명의 단백질이 효모(S. cerevisiae)의 GPAT 결손을 상보할 수 있는지 여부를 확인함으로써 측정하더라도 좋다. 효모에서는, GPAT 활성을 담당하는 유전자로서 SCT1과 GPT2가 알려지고 있으며, 이들을 동시에 결실시키면 치사에 이르는 것이 알려져 있다. 즉, SCT1 유전자 및 GPT2 유전자가 결실된 효모는 통상은 생육할 수 없지만, 이들 유전자와 동등한 기능을 하는 유전자, 즉 GPAT 활성을 갖는 단백질을 발현시킨 경우, 상보되어, 생육하는 것이 가능하게 된다. 여기서, 본 발명의 GPAT에 관해서, 효모의 GPAT 결손이 상보되었음을 확인하는 방법으로서는, 효모의 SCT1 유전자 및 GPT2 유전자가 결손된 주에 있어서, 본 발명의 GPAT 유전자를 발현시킨 경우, 그 효모의 GPAT 활성이 회복되었음을 확인하는 방법이라면, 어떠한 방법이라도 좋다. 예컨대, 이하의 실시예 8에서도 구체적으로 설명하고 있는 것과 같이, Δgpt2 호모접합 2배체 효모에 있어서, SCT1 유전자의 대립 유전자의 하나만을 결손시킨 이형 접합주를 제작하고, 이어서 이 이형 접합주에 본 발명의 GPAT 유전자의 발현 카세트를 SCT1이 실려 있는 염색체와는 별도의 염색체 상에 하나 삽입한 주, 혹은 상기 이형 접합주에 본 발명의 GPAT 유전자의 발현 카세트를 갖는 플라스미드형 벡터를 삽입한 주를 제작한다. 상기 균주를 포자 형성 배지 상에 도포하여, 자낭 포자를 형성시킨다. 얻어진 균체를, 랜덤 포자 분석 혹은 사분자 분석에 의해, 포자 유래의 1배체 주를 얻을 수 있다. 이와 같이 하여 얻어진 1배체 효모의 유전자형을 조사하여, 원래 생육할 수 없는 Δgpt2Δsct1주에 있어서, 본 발명의 GPAT 유전자의 발현 카세트가 존재하는 경우에만 생육할 수 있음을 확인할 수 있으면, 본 발명의 GPAT가 효모 속에서 GPAT 활성을 상보할 수 있었다고 판단할 수 있다.
(b) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
본 발명의 핵산에 포함되는 염기 서열은, 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 포함한다.
상기 염기 서열은, 당업자에게 공지된 방법으로 적당한 단편을 이용하여 프로브를 제작하고, 이 프로브를 이용하여 콜로니 하이브리다이제이션, 플라크 하이브리다이제이션, 서전 블롯 등의 공지된 하이브리다이제이션법에 의해 cDNA 라이브러리 및 게놈 라이브러리 등으로부터 얻을 수 있다.
하이브리다이제이션법의 상세한 순서에 관해서는 『Molecular Cloning, A Laboratory Manual 3rd ed.』(Cold Spring Harbor Press(2001); 특히 Section 6-7), 『Current Protocols in Molecular Biology』(John Wiley & Sons(1987-1997); 특히 Section 6.3-6.4), 『DNA Cloning 1 : Core Techniques, A Practical Approach 2nd ed.』(Oxford Unⅳersity(1995); 하이브리다이제이션 조건에 관해서는 특히 Section 2.10) 등을 참조할 수 있다.
하이브리다이제이션 조건의 세기는, 주로 하이브리다이제이션 조건, 보다 바람직하게는 하이브리다이제이션 조건 및 세정 조건에 의해서 결정된다. 본 명세서에 있어서의 「스트린젠트한 조건」에는 중간 정도 또는 고도의 스트린젠트한 조건이 포함된다.
구체적으로는, 중간 정도의 스트린젠트한 조건으로서는, 예컨대 하이브리다이제이션 조건으로서, 1×SSC∼6×SSC, 42℃∼55℃의 조건, 보다 바람직하게는 1×SSC∼3×SSC, 45℃∼50℃의 조건, 가장 바람직하게는 2×SSC, 50℃의 조건을 들 수 있다. 하이브리다이제이션 용액 중에, 예컨대 약 50%의 포름아미드를 포함하는 경우에는, 상기 온도보다도 5 내지 15℃ 낮은 온도를 채용한다. 세정 조건은 0.5×SSC∼6×SSC, 40℃∼60℃를 들 수 있다. 하이브리다이제이션 및 세정시에는 일반적으로 0.05%∼0.2%, 바람직하게는 약 0.1% SDS를 가하더라도 좋다.
고도의 스트린젠트(하이스트린젠트) 조건은, 중간 정도의 스트린젠트한 조건보다도 높은 온도 및/또는 낮은 염 농도에서의 하이브리다이제이션 및/또는 세정을 포함한다. 예컨대, 하이브리다이제이션 조건으로서, 0.1×SSC∼2×SSC, 55℃∼65℃의 조건, 보다 바람직하게는 0.1×SSC∼1×SSC, 60℃∼65℃의 조건, 가장 바람직하게는 0.2×SSC, 63℃의 조건을 들 수 있다. 세정 조건으로서, 0.2×SSC∼2×SSC, 50℃∼68℃, 보다 바람직하게는 0.2×SSC, 60∼65℃를 들 수 있다.
특히 본 발명에 이용되는 하이브리다이제이션 조건으로서는, 예컨대 5×SSC, 1% SDS, 50 mM Tris-HCl(pH 7.5) 및 50% 포름아미드 중 42℃의 조건에서 프리하이브리다이제이션을 행한 후, 프로브를 첨가하여 하룻밤 42℃로 유지하여 하이브리드 형성시키고, 그 후, 0.2×SSC, 0.1% SDS 중, 65℃에서 20분간의 세정을 3회 실시한다고 하는 조건을 들 수 있지만, 이들에 한정되지 않는다.
또한, 프로브에 방사성 물질을 사용하지 않는 시판되는 하이브리다이제이션 키트를 사용할 수도 있다. 구체적으로는, DIG 핵산 검출 키트(로슈·다이아그노스틱사), ECL direct labeling & detection system(Amersham사 제조)를 사용한 하이브리다이제이션 등을 들 수 있다.
본 발명에 포함되는 염기 서열로서는, 바람직하게는, 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 2×SSC, 50℃의 조건 하에서 하이브리다이즈하고, 또한, GPAT 활성 및/또는 GNPAT 활성을 갖는 단백질을 코드하는 염기 서열을 들 수 있다.
(c) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열과 동일성이 70% 이상인 염기 서열로 이루어지고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
본 발명의 핵산에 포함되는 염기 서열은, 서열 번호 1, 서열 번호 4 또는 서열 번호 8에 나타내어지는 염기 서열에 대하여 적어도 70% 이상의 동일성을 갖는 염기 서열로 이루어지고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 포함한다.
바람직하게는, 서열 번호 1, 서열 번호 4 또는 서열 번호 8에 나타내어지는 염기 서열에 대하여 적어도 75% 이상, 더욱 바람직하게는 80% 이상(예컨대, 85% 이상, 더한층 바람직하게는 90% 이상, 나아가서는 95%, 98% 또는 99% 이상)의 동일성을 갖는 염기 서열을 포함하는 핵산이며, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 들 수 있다.
2개의 염기 서열의 동일성%는 시각적 검사나 수학적 계산에 의해 결정할 수 있는데, 컴퓨터 프로그램을 사용하여 2개의 핵산의 서열 정보를 비교함으로써 결정하는 것이 바람직하다. 서열 비교 컴퓨터 프로그램으로서는, 예컨대, 미국국립의학 라이브러리의 웹사이트 : http://www.ncbi.nlm.nih.gov/blast/bl2seq/bls.html로부터 이용할 수 있는 BLASTN 프로그램(Altschul et al.(1990) J. Mol. Biol. 215: 403-10) : 버젼 2.2.7 또는 WU-BLAST 2.0 알고리즘 등을 들 수 있다. WU-BLAST2.0에 관한 표준적인 디폴트 파라미터의 설정은 이하의 인터넷 사이트 : http://blast.wustl.edu에 기재되어 있는 것을 이용할 수 있다.
(d) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 70% 이상인 아미노산 서열을 코드하고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
본 발명의 핵산에 포함되는 염기 서열은, 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 70% 이상인 아미노산 서열을 코드하고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 포함한다. 본 발명의 핵산이 코드하는 단백질은, 본 발명의 상기 활성을 갖는 단백질과 동등한 기능을 갖는 한, MaGPAT4, MaGPAT4-long 또는 MaGPAT5의 아미노산 서열과 동일성이 있는 단백질이라도 좋다.
구체적으로는, 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열과 75% 이상, 바람직하게는 80% 이상, 보다 바람직하게는 85%, 더욱 바람직하게는 90%(예컨대, 95%, 나아가서는 98%) 이상의 동일성을 갖는 아미노산 서열 등을 들 수 있다.
본 발명의 핵산에 포함되는 염기 서열은, 바람직하게는 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 90% 이상인 아미노산 서열을 코드하고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열이다. 더욱 바람직하게는, 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 95% 이상인 아미노산 서열을 코드하고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열이다.
2개의 아미노산 서열의 동일성 퍼센트는 시각적 검사 및 수학적 계산에 의해서 결정할 수 있다. 또한, 컴퓨터 프로그램을 이용하여 동일성 퍼센트를 결정할 수도 있다. 그와 같은 컴퓨터 프로그램으로서는, 예컨대, BLAST, FASTA(Altschul 등, J. Mol. Biol., 215: 403-410(1990)) 및 ClustalW 등을 들 수 있다. 특히, BLAST 프로그램에 의한 동일성 검색의 각종 조건(파라미터)은 Altschul 등(Nucl. Acids. Res., 25, p.3389-3402, 1997)에 기재된 것으로, 미국 바이오테크놀로지정보센터(NCBI)나 DNA Data Bank of Japan(DDBJ)의 웹사이트로부터 공적으로 입수할 수 있다(BLAST 매뉴얼, Altschul 등 NCB/NLM/NIH Bethesda, MD 20894; Altschul 등). 또한, 유전 정보 처리 소프트웨어 GENETYX Ver.7(제네틱스), DINASIS Pro(히타치소프트), Vector NTI(Infomax) 등의 프로그램을 이용하여 결정할 수도 있다.
복수의 아미노산 서열을 병렬시키는 특정한 얼라인먼트 스킴은, 서열 중, 특정한 짧은 영역의 매칭도 나타낼 수 있기 때문에, 이용한 서열의 전장 서열 사이에 의미 있는 관계가 없는 경우라도, 그와 같은 영역에 있어서, 특정한 서열 동일성이 매우 높은 영역을 검출할 수도 있다. 또한, BLAST 알고리즘은, BLOSUM62 아미노산 스코어가 붙은 매트릭스를 이용할 수 있는데, 선택 파라미터로서는 이하의 것을 이용할 수 있다 : (A) 낮은 조성 복잡성을 갖는 쿼리 서열의 세그먼트(Wootton 및 Federhen의 SEG 프로그램(Computers and Chemistry, 1993)에 의해 결정된다; Wootton 및 Federhen, 1996 「서열 데이터베이스에 있어서의 조성 편중 영역의 해석(Analysis of compositionally biased regions in sequence databases)」 Methods Enzymol., 266: 544-71도 참조하길 바람), 또는 단주기성의 내부 리피트로 이루어지는 세그먼트(Claverie 및 States(Computers and Chemistry, 1993)의 XNU 프로그램에 의해 결정됨)를 마스크하기 위한 필터를 포함하는 것, 및 (B) 데이터베이스 서열에 대한 적합을 보고하기 위한 통계학적 유의성의 임계치, 또는 E-스코어(Karlin 및 Altschul, 1990)의 통계학적 모델에 따라서, 단순히 우연에 의해 발견되는 적합의 기대 확률; 어느 적합에 기인한 통계학적 유의차가 E-스코어 임계치보다 큰 경우, 이 적합은 보고되지 않는다.
(e) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산
본 발명의 핵산에 포함되는 염기 서열은, 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 포함한다.
서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질 및 하이브리다이즈 조건은 상기한 것과 같다. 본 발명의 핵산에 포함되는 염기 서열로서는, 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 들 수 있다.
(f) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열은 각각 본 발명의 MaGPAT4(및 MaGPAT4-long) 또는 MaGPAT5를 코드하는 게놈 DNA 서열이다.
본 발명의 핵산에 포함되는 염기 서열은, 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함한다.
상기 염기 서열은, 당업자에게 공지된 방법으로 적당한 단편을 이용하여 프로브를 제작하고, 이 프로브를 이용하여, 콜로니 하이브리다이제이션, 플라크 하이브리다이제이션, 서전 블롯 등의 공지의 하이브리다이제이션법에 의해 게놈 라이브러리 등으로부터 얻을 수 있다. 하이브리다이즈의 조건은 상기한 것과 같다.
(g) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열과 동일성이 70% 이상인 염기 서열로 이루어지고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 포함하는 핵산
본 발명의 핵산에 포함되는 염기 서열은, 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열에 대하여 적어도 70% 이상의 동일성을 갖는 염기 서열로 이루어지고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 포함한다. 바람직하게는, 서열 번호 7 또는 서열 번호 12에 나타내어지는 염기 서열에 대하여 적어도 75% 이상, 더욱 바람직하게는 80% 이상(예컨대, 85% 이상, 더한층 바람직하게는 90% 이상, 나아가서는 95%, 98% 또는 99% 이상)의 동일성을 갖는 염기 서열을 포함하고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 들 수 있다. 2개의 염기 서열의 동일성%는 상술한 것과 같이 결정할 수 있다.
또한, 서열 번호 7의 게놈 DNA 서열은 엑손 10개와 인트론 9개로 이루어져 있고, 엑손 영역은 서열 번호 7의 제428∼744번째 또는 제596∼744번째, 제850∼924번째, 제1302∼1396번째, 제1480∼1726번째, 제1854∼2279번째, 제2370∼2632번째, 제2724∼3299번째, 제3390∼3471번째, 제3575∼4024번째 및 제4133∼4248번째이다. 그리고, 서열 번호 12의 게놈 DNA 서열은 엑손 3개와 인트론 2개로 이루어져 있고, 엑손 영역은 서열 번호 12의 제1∼302번째, 제457∼1676번째 및 제1754∼2598번째이다.
다른 양태에 있어서, 본 발명의 핵산에 포함되는 염기 서열은, 서열 번호 7 또는 서열 번호 12에 나타내어지는 게놈 DNA 서열에 있어서, 인트론 영역의 염기 서열이 서열 번호 7 또는 서열 번호 12에 나타내어지는 서열에 대하여 100% 동일하고, 그리고, 엑손 영역의 염기 서열이 서열 번호 7 또는 서열 번호 12에 나타내어지는 서열에 대하여 적어도 70% 이상, 바람직하게는 75% 이상, 더욱 바람직하게는 80% 이상(예컨대, 85% 이상, 더한층 바람직하게는 90% 이상, 나아가서는 95% 이상, 98% 이상, 99% 이상)의 동일성을 갖는 염기 서열을 포함하고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 엑손을 갖는 염기 서열을 들 수 있다.
또 다른 양태에 있어서, 본 발명의 핵산에 포함되는 염기 서열은, 서열 번호 7 또는 서열 번호 12에 나타내어지는 게놈 DNA 서열에 있어서, 엑손 영역의 염기 서열이 서열 번호 7 또는 서열 번호 12에 나타내어지는 서열에 대하여 100% 동일하고, 그리고, 인트론 영역의 염기 서열이 서열 번호 7 또는 서열 번호 12에 나타내어지는 서열에 대하여 적어도 70% 이상, 바람직하게는 75% 이상, 더욱 바람직하게는 80% 이상(예컨대, 85% 이상, 더한층 바람직하게는 90% 이상, 나아가서는 95% 이상, 98% 이상, 99% 이상)의 동일성을 갖는 염기 서열을 포함하고, 또한, 스플라이싱에 의해 인트론 영역이 탈리 가능하며, 이에 따라 엑손 영역이 연결하여 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 들 수 있다.
추가로 또 다른 양태에 있어서, 본 발명의 핵산에 포함되는 염기 서열은, 서열 번호 7 또는 서열 번호 12에 나타내어지는 게놈 DNA 서열에 있어서, 인트론 영역의 염기 서열이 서열 번호 7 또는 서열 번호 12에 나타내어지는 서열에 대하여 적어도 70% 이상, 바람직하게는 75% 이상, 더욱 바람직하게는 80% 이상(예컨대, 85% 이상, 더한층 바람직하게는 90% 이상, 나아가서는 95% 이상, 98% 이상, 99% 이상)의 동일성을 갖는 염기 서열을 포함하고, 그리고, 엑손 영역의 염기 서열이 서열 번호 7 또는 서열 번호 12에 나타내어지는 서열에 대하여 적어도 70% 이상, 바람직하게는 75% 이상, 더욱 바람직하게는 80% 이상(예컨대, 85% 이상, 더한층 바람직하게는 90% 이상, 나아가서는 95% 이상, 98% 이상, 99% 이상)의 동일성을 갖는 염기 서열을 포함하고, 또한, 스플라이싱에 의해 인트론 영역이 탈리 가능하며, 이에 따라 연결한 엑손 영역이 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 들 수 있다.
2개의 염기 서열의 동일성%는 상술한 방법에 의해 결정할 수 있다.
또한, 본 발명의 핵산에는, 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열에 있어서 하나 혹은 복수 개의 염기가 결실, 치환 혹은 부가된 염기 서열로 이루어지고, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하는 염기 서열을 포함하는 핵산도 포함된다. 구체적으로는,
(ⅰ) 서열 번호 1, 서열 번호 4 또는 서열 번호 8에 나타내는 염기 서열 중 1개 또는 복수 개(바람직하게는 1개 또는 수개(예컨대, 1∼720개, 1∼600개, 1∼500개, 1∼400개, 1∼300개, 1∼250개, 1∼200개, 1∼150개, 1∼100개, 1∼50개, 1∼30개, 1∼25개, 1∼20개, 1∼15개, 더욱 바람직하게는 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개))의 염기가 결실된 염기 서열,
(ⅱ) 서열 번호 1, 서열 번호 4 또는 서열 번호 8에 나타내는 염기 서열 중 1개 또는 복수 개(바람직하게는 1개 또는 수개(예컨대, 1∼720개, 1∼600개, 1∼500개, 1∼400개, 1∼300개, 1∼250개, 1∼200개, 1∼150개, 1∼100개, 1∼50개, 1∼30개, 1∼25개, 1∼20개, 1∼15개, 더욱 바람직하게는 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개))의 염기가 다른 염기로 치환된 염기 서열,
(ⅲ) 서열 번호 1, 서열 번호 4 또는 서열 번호 8에 나타내는 염기 서열에 있어서 1개 또는 복수 개(바람직하게는 1개 또는 수개(예컨대, 1∼720개, 1∼600개, 1∼500개, 1∼400개, 1∼300개, 1∼250개, 1∼200개, 1∼150개, 1∼100개, 1∼50개, 1∼30개, 1∼25개, 1∼20개, 1∼15개, 더욱 바람직하게는 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개))의 다른 염기가 부가된 염기 서열, 또는
(ⅳ) 상기 (ⅰ)∼(ⅲ)을 조합시킨 염기 서열이며, 또한, 본 발명의 상기 활성을 갖는 단백질을 코드하고 있는 염기 서열을 포함하는 핵산을 이용할 수도 있다.
본 발명의 핵산의 바람직한 양태로서는, 이하의 (a)∼(d) 중 어느 것에 기재한 염기 서열의 프래그먼트를 포함하는 핵산도 포함된다.
(a) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 나타내어지는 염기 서열
(b) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열
(c) 서열 번호 3, 서열 번호 6 또는 서열 번호 11로 나타내어지는 염기 서열
(d) 서열 번호 7 또는 서열 번호 12로 나타내어지는 염기 서열
(a) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 나타내어지는 염기 서열, (b) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열, (c) 서열 번호 3, 서열 번호 6 또는 서열 번호 11로 나타내어지는 염기 서열에 대해서는 표 1에 기재한 바와 같다. 또한, 서열 번호 7 또는 서열 번호 12로 나타내어지는 염기 서열에 대해서도 상술한 바와 같다. 상기 서열의 프래그먼트란, 상기 염기 서열에 포함되는 ORF, CDS, 생물학적 활성을 갖는 영역, 이하에 기재하는 것과 같은 프라이머로서 이용한 영역, 프로브가 될 수 있는 영역이 포함되며, 천연에서 유래하는 것이라도 인공적으로 제작한 것이라도 좋다.
또한, 본 발명의 핵산에는 이하의 핵산도 포함된다.
(1) 이하의 (a)∼(g) 중 어느 것에 기재한 핵산.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열에 있어서 하나 혹은 복수 개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열을 포함하는 핵산
(b) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하는 핵산
(c) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열과 동일성이 70% 이상인 염기 서열을 포함하는 핵산
(d) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 70% 이상인 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열을 포함하는 핵산
(e) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하는 핵산
(f) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 스트린젠트한 조건 하에서 하이브리다이즈하는 핵산
(g) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열과 동일성이 70% 이상인 염기 서열을 포함하는 핵산
(2) 이하의 (a)∼(g) 중 어느 것인 (1)에 기재한 핵산.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열에 있어서 1∼80개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열을 포함하는 핵산
(b) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 2×SSC, 50℃의 조건 하에서 하이브리다이즈하는 핵산
(c) 서열 번호 1, 서열 번호 4 또는 서열 번호 8로 이루어지는 염기 서열과 동일성이 90% 이상인 염기 서열을 포함하는 핵산
(d) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 90% 이상인 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열을 포함하는 핵산
(e) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 2×SSC, 50℃의 조건 하에서 하이브리다이즈하는 핵산
(f) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열에 대하여 상보적인 염기 서열로 이루어지는 핵산과 2×SSC, 50℃의 조건 하에서 하이브리다이즈하는 핵산
(g) 서열 번호 7 또는 서열 번호 12로 이루어지는 염기 서열과 동일성이 90% 이상인 염기 서열을 포함하는 핵산
본 발명의 글리세롤-3-인산 아실기 전이 효소
본 발명의 단백질은, 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질 및 상기 단백질과 동등한 기능을 갖는 단백질을 포함하며, 천연 유래의 것이라도 인공적으로 제작한 것이라도 좋다. 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내어지는 아미노산 서열로 이루어지는 단백질에 대해서는 상기한 것과 같다. 「동등한 기능을 갖는 단백질」이란, 상기 『본 발명의 글리세롤-3-인산 아실기 전이 효소를 코드하는 핵산』의 항에서 설명한 대로 「본 발명의 상기 활성」을 갖는 단백질을 의미한다.
본 발명에 있어서, 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 나타내아지는 아미노산 서열로 이루어지는 단백질과 동등한 기능을 갖는 단백질로서는, 이하의 (a) 또는 (b) 중 어느 것에 기재한 단백질을 들 수 있다.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9에 있어서 하나 혹은 복수 개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지고, 또한, 본 발명의 상기 활성을 갖는 단백질
(b) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 70% 이상인 아미노산 서열로 이루어지는 단백질이며, 또한, 본 발명의 상기 활성을 갖는 단백질
상기에서, 서열 번호 2, 서열 번호 5 혹은 서열 번호 9에 있어서 하나 혹은 복수 개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열, 또는 서열 번호 2, 서열 번호 5 혹은 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 70% 이상인 아미노산 서열에 대해서는, 상기 『본 발명의 글리세롤-3-인산 아실기 전이 효소를 코드하는 핵산』의 항에서 설명한 것과 같다. 또한, 상기 「본 발명의 상기 활성을 갖는 단백질」에는, 서열 번호 1, 서열 번호 4 혹은 서열 번호 8의 염기 서열을 포함하는 핵산에 의해서 코드되는 단백질의 변이체, 또는 서열 번호 2, 서열 번호 5 혹은 서열 번호 9에 나타내어지는 아미노산 서열에 있어서 1개 또는 복수 개의 아미노산이 치환, 결실 혹은 부가 등의 많은 종류의 수식에 의해 변이된 단백질, 혹은 아미노산 측쇄 등이 수식되어 있는 수식 단백질, 다른 단백질과의 융합 단백질이며, 또한, GPAT 활성, GNPAT 활성 및/혹은 상기 『본 발명의 글리세롤-3-인산 아실기 전이 효소를 코드하는 핵산』의 항에 기재한 ⅰ)의 활성 또는 상기 ⅱ)의 활성을 갖는 단백질도 포함된다.
또한, 본 발명의 단백질은 인공적으로 제작한 것이라도 좋으며, 그 경우는, Fmoc법(플루오레닐메틸옥시카르보닐법), tBoc법(t-부틸옥시카르보닐법) 등의 화학 합성법에 의해서도 제조할 수 있다. 또한, 어드밴스드 켐테크사 제조, 퍼킨엘머사 제조, 파마시아사 제조, 프로테인 테크놀로지 인스트루먼츠사 제조, 신세셀-베가사 제조, 퍼셉티브사 제조, 시마즈 세이사쿠쇼사 제조 등의 펩티드 합성기를 이용하여 화학 합성할 수도 있다.
또한, 본 발명의 단백질에는 이하의 단백질도 포함된다.
(1) 이하의 (a) 또는 (b) 중 어느 것에 기재한 단백질.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9에 있어서 하나 혹은 복수 개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지는 단백질
(b) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 70% 이상인 아미노산 서열로 이루어지는 단백질
(2) 이하의 (a) 또는 (b) 중 어느 것인 (1)에 기재한 단백질.
(a) 서열 번호 2, 서열 번호 5 또는 서열 번호 9에 있어서 1∼80개의 아미노산이 결실, 치환 혹은 부가된 아미노산 서열로 이루어지는 단백질
(b) 서열 번호 2, 서열 번호 5 또는 서열 번호 9로 이루어지는 아미노산 서열과 동일성이 90% 이상인 아미노산 서열로 이루어지는 단백질
본 발명의 핵산의
클로닝
본 발명의 GPAT의 핵산은 예컨대 적절한 프로브를 이용하여 cDNA 라이브러리로부터 스크리닝함으로써 클로닝할 수 있다. 또한, 적절한 프라이머를 이용하여 PCR 반응에 의해 증폭하고, 적절한 벡터에 연결함으로써 클로닝할 수 있다. 더욱이, 다른 벡터에 서브클로닝할 수도 있다.
예컨대, pBlue-ScriptTMSK(+)(Stratagene), pGEM-T(Promega), pAmp(TM : Gibco-BRL), p-Direct(Clontech), pCR2.1-TOPO(Invitrogene) 등의 시판되는 플라스미드 벡터를 이용할 수 있다. 또한, PCR 반응으로 증폭하는 경우, 프라이머는 상기한 서열 번호 3, 6 또는 11 등에 나타내어지는 염기 서열의 어느 부분이나 이용할 수 있다. 예컨대, 후술하는 실시예에 기재한 프라이머를 이용할 수 있다. 그리고, M. alpina 균체로부터 조제한 cDNA에, 상기 프라이머 및 DNA 폴리머라제 등을 작용시켜 PCR 반응을 행한다. 상기 방법은 『Molecular Cloning, A Laboratory Manual 3rd ed.』(Cold Spring Harbor Press(2001)) 등에 따라서 당업자라면 용이하게 행할 수 있는데, 본 발명의 PCR 반응의 조건은 예컨대 이하의 조건을 들 수 있다.
변성 온도 : 90∼95℃
어닐링 온도 : 40∼60℃
신장 온도 : 60∼75℃
사이클수 : 10회 이상
얻어진 PCR 산물의 정제에는 공지된 방법을 이용할 수 있다. 예컨대, GENECLEAN(후나코시), QIAquick PCR purification Kits(QIAGEN), ExoSAP-IT(GE 헬스케어바이오사이언스) 등의 키트를 이용하는 방법, DEAE-셀룰로오스 여과지를 이용하는 방법, 투석 튜브를 이용하는 방법 등이 있다. 아가로스 겔을 이용하는 경우에는, 아가로스 겔 전기 영동을 실시하여, 염기 서열 단편을 아가로스 겔로부터 잘라내어, GENECLEAN(후나코시), QIAquick Gel extraction Kits(QIAGEN), 프리즈 & 스퀴즈법 등에 의해 정제할 수 있다.
클로닝한 핵산의 염기 서열은 염기 서열 시퀀서를 이용하여 결정할 수 있다.
GPAT
발현용 벡터 구축 및 형질전환
체의
작성
본 발명은 또한 본 발명의 GPAT를 코드하는 핵산을 함유하는 재조합 벡터를 제공한다. 본 발명은 더욱이 상기 재조합 벡터에 의해서 형질전환된 형질전환체도 제공한다.
이러한 재조합 벡터 및 형질전환체는 다음과 같이 하여 얻을 수 있다. 즉, 본 발명의 GPAT를 코드하는 핵산을 갖는 플라스미드를 제한 효소를 이용하여 소화한다. 이용하는 제한 효소로서는, 예컨대, EcoRI, KpnI, BamHI 및 SalI 등을 들 수 있지만, 이들에 한정되지 않는다. 또, 말단을 T4 폴리머라제 처리함으로써 평활화하더라도 좋다. 소화 후의 DNA 단편을 아가로스 겔 전기 영동에 의해 정제한다. 이 DNA 단편을 발현용 벡터에 공지된 방법을 이용하여 집어넣음으로써, GPAT 발현용 벡터를 얻을 수 있다. 이 발현 벡터를 숙주에 도입하여 형질전환체를 제작하여, 목적으로 하는 단백질의 발현에 제공한다.
이 때, 발현 벡터 및 숙주는 목적으로 하는 단백질을 발현할 수 있는 것이라면 특별히 한정되지 않고, 예컨대, 숙주로서, 진균이나 세균, 식물, 동물 혹은 이들의 세포 등을 들 수 있다. 진균으로서, 지질 생산균인 M. alpina 등의 사상균, 사카로미세스·세레비시에(Saccharomyces cerevisiae) 등의 효모 등을 들 수 있다. 또한 세균으로서, 대장균(Escherichia coli)이나 바틸루스·서브틸리스(Bacillus subtilis) 등을 들 수 있다. 또한 식물로서는, 유채씨, 콩, 목화, 홍화, 아마 등의 유량(油糧) 식물을 들 수 있다.
지질 생산균으로서는, 예컨대 MYCOTAXON, Vol.XLIV, NO.2, pp.257-265(1992)에 기재되어 있는 균주를 사용할 수 있으며, 구체적으로는, 모르티에렐라(Mortierella)속에 속하는 미생물, 예컨대, 모르티에렐라·엘론가타(Mortierella elongata) IFO8570, 모르티에렐라·엑시구아(Mortierella exigua) IFO8571, 모르티에렐라·히그로필라(Mortierella hygrophila) IFO5941, 모르티에렐라·알피나(Mortierella alpina) IFO8568, ATCC16266, ATCC32221, ATCC42430, CBS 219.35, CBS224.37, CBS250.53, CBS343.66, CBS527.72, CBS528.72, CBS529.72, CBS608.70, CBS754.68 등의 모르티에렐라 아속(subgenus Mortierella)에 속하는 미생물, 또는 모르티에렐라·이자벨리나(Mortierella isabellina) CBS194.28, IFO6336, IFO7824, IFO7873, IFO7874, IFO8286, IFO8308, IFO7884, 모르티에렐라·나나(Mortierella nana) IFO8190, 모르티에렐라·라마니아나(Mortierella ramanniana) IFO5426, IFO8186, CBS112.08, CBS212.72, IFO7825, IFO8184, IFO8185, IFO8287, 모르티에렐라·뷔나세아(Mortierella vinacea) CBS236.82 등의 마이크로뮤코 아속(subgenus Micromucor)에 속하는 미생물 등을 들 수 있다. 특히, 모르티에렐라·알피나(Mortierella alpina)가 바람직하다.
진균류를 숙주로서 이용하는 경우는, 본 발명의 핵산이 숙주 속에서 자립 복제 가능하거나, 혹은 그 균의 염색체 상에 삽입될 수 있는 구조인 것이 바람직하다. 그와 동시에, 프로모터, 터미네이터를 포함하는 구성인 것이 바람직하다. 숙주로서 M. alpina를 사용하는 경우, 발현 벡터로서, 예컨대 pD4, pDuraSC, pDura5 등을 들 수 있다. 프로모터로서는, 숙주 속에서 발현할 수 있는 것이라면 어떠한 프로모터를 이용하더라도 좋으며, 예컨대, histonH4.1 유전자 프로모터, GAPDH(글리세르알데히드3-인산데히드로게나아제) 유전자 프로모터, TEF(Translation elongation factor) 유전자 프로모터와 같은 M. alpina에 유래하는 프로모터가 이용된다.
M. alpina 등의 사상균에 재조합 벡터를 도입하는 방법으로서는, 예컨대, 일렉트로포레이션법, 스페로플라스트법, 파티클 딜리버리법 및 핵 내로의 DNA 직접 마이크로인젝션 등을 들 수 있다. 영양 요구성의 호스트주를 이용하는 경우는, 그 영양소가 결핍된 선택 배지 상에서 생육하는 주를 선택함으로써, 형질전환주를 취득할 수 있다. 또한, 형질전환에 약제 내성 마커 유전자를 이용하는 경우에는, 그 약제를 포함하는 선택 배지로 배양을 하여, 약제 내성을 보이는 세포 콜로니를 얻을 수 있다.
효모를 숙주로서 이용하는 경우는, 발현 벡터로서, 예컨대 pYE22m 등을 들 수 있다. 또한, pYES(Invitrogen), pESC(STRATAGENE) 등의 시판되는 효모 발현용 벡터를 이용하더라도 좋다. 또한 본 발명에 알맞은 숙주로서는, Saccharomyces cerevisiae EH13-15주(trp1, MATα) 등을 들 수 있지만 이들에 한정되지 않는다. 프로모터로서는, 예컨대, GAPDH 프로모터, gal1 프로모터, gal10 프로모터 등의 효모 등에 유래하는 프로모터가 이용된다.
효모에 재조합 벡터를 도입하는 방법으로서는, 예컨대, 초산리튬법, 일렉트로포레이션법, 스페로플라스트법, 덱스트란 중개 트랜스펙션, 인산칼슘 침전, 폴리브렌 중개 트랜스펙션, 프로토플라스트 융합, 리포좀 중의 폴리뉴클레오티드(단수 또는 복수)의 피포(被包) 및 핵 내로의 DNA 직접 마이크로인젝션 등을 들 수 있다.
대장균 등의 세균을 숙주로서 이용하는 경우는, 발현 벡터로서는, 예컨대 파마시아사의 pGEX, pUC18 등을 들 수 있다. 프로모터로서는, 예컨대, trp 프로모터, lac 프로모터, PL 프로모터, PR 프로모터 등의 대장균이나 파지 등에 유래하는 프로모터가 이용된다. 세균에 재조합 벡터를 도입하는 방법으로서는, 예컨대 일렉트로포레이션법이나 염화칼슘법을 이용할 수 있다.
본 발명의 지방산 조성물의 제조 방법
본 발명은 상기 형질전환체로부터 지방산 조성물을 제조하는 방법을 제공한다. 즉, 상기 형질전환체를 배양하여 얻어지는 배양물로부터 지방산 조성물을 제조하는 방법이다. 지방산 조성물은 하나 또는 그 이상의 지방산의 집합체를 포함하는 조성물이다. 여기서, 지방산은 유리 지방산이라도 좋고, 트리글리세리드나 인지질 등의 지방산을 포함하는 지질로서 존재하고 있더라도 좋다. 본 발명의 지방산 조성물은 구체적으로는 이하의 방법으로 제조할 수 있다. 그러나, 본 제조 방법에 관해서는 이 방법에 한정되지 않고, 일반적인 공지된 다른 방법을 이용하여 행할 수도 있다.
GPAT를 발현시킨 생물의 배양에 이용하는 배지는, 적당한 pH 및 침투압을 지니고, 각 숙주의 증식에 필요한 영양소, 미량 성분, 혈청이나 항생 물질 등의 생물 재료를 포함하고 있는 배양액(배지)이라면, 어떠한 배양액이나 이용할 수 있다. 예컨대, 효모를 형질전환하여 GPAT를 발현시킨 경우는, SC-Trp 배지, YPD 배지, YPD5 배지 등을 이용할 수 있지만, 이들에 한정되지 않는다. 구체적인 배지의 조성으로서 SC-Trp 배지를 예시한다: 1 ℓ당, Yeast nitrogen base w/o amino acids(DIFCO) 6.7 g, 글루코오스 20 g, 아미노산 파우더(아데닌황산염 1.25 g, 아르기닌 0.6 g, 아스파라긴산 3 g, 글루타민산 3 g, 히스티딘 0.6 g, 류신 1.8 g, 리신 0.9 g, 메티오닌 0.6 g, 페닐알라닌 1.5 g, 세린 11.25 g, 티로신 0.9 g, 발린 4.5 g, 트레오닌 6 g, 우라실 0.6 g을 혼합한 것) 1.3 g.
배양 조건은, 숙주의 증식에 알맞고, 또한 생성된 효소가 안정적으로 유지되는 데에 적당한 조건이라면 어떠한 조건이라도 좋지만, 구체적으로는, 혐기도, 배양 시간, 온도, 습도, 정치 배양 또는 진탕 배양 등의 개개의 조건을 조절할 수 있다. 배양 방법은, 동일 조건에서의 배양(1단계 배양)이라도 좋고, 2 이상의 다른 배양 조건을 이용하는, 소위 2단계 배양 혹은 3단계 배양이라도 좋지만, 대량 배양을 하는 경우에는 배양 효율이 좋은 2단계 배양 등이 바람직하다.
숙주로서 효모를 이용하여 2단계 배양을 하는 경우, 본 발명의 지방산 조성물의 제조 방법은 다음과 같이 행할 수 있다. 전배양으로서, 형질전환체의 콜로니를 상기한 SC-Trp 배지 등에 식균하여, 30℃에서 2일간 진탕 배양을 행한다. 그 후, 본배양으로서, YPD5(2% 효모 엑기스, 1% 폴리펩톤, 5% 글루코오스) 배지 10 ml에 전배양액을 500 μl 첨가하여, 30℃에서 2일간 진탕 배양을 한다.
본 발명의 지방산 조성물
본 발명은 또한 본 발명의 GPAT가 발현하고 있는 세포에 있어서의 1 또는 그 이상의 지방산의 집합체인 지방산 조성물을 제공한다. 바람직하게는, 본 발명의 GPAT가 발현하고 있는 형질전환체를 배양하여 얻어지는 지방산 조성물이다. 지방산은 유리 지방산이라도 좋고, 트리글리세리드, 인지질 등의 지방산을 포함하는 지질의 형태로 존재하고 있더라도 좋다.
본 발명의 지방산 조성물에 포함되는 지방산으로서는, 장쇄 탄수화물의 쇄형 혹은 분기형의 모노카르복실산을 말하며, 예컨대, 미리스틴산(테트라데칸산)(14:0), 미리스트올레산(테트라데센산)(14:1), 팔미틴산(헥사데칸산)(16:0), 팔미톨레산(9-헥사데센산)(16:1), 스테아린산(옥타데칸산)(18:0), 올레인산(cis-9-옥타데센산)(18:1(9)), 박센산(11-옥타데센산)(18:1(11)), 리놀레산(cis,cis-9,12 옥타데카디엔산)(18:2(9,12)), α-리놀렌산(9,12,15-옥타데칸트리엔산)(18:3(9,12,15)), γ-리놀렌산(6,9,12-옥타데칸트리엔산)(18:3(6,9,12)), 스테아리돈산(6,9,12,15-옥타데칸테트라엔산)(18:4(6,9,12,15)), 아라키드산(아이코산산)(20:0), (8,11-아이코사디엔산)(20:2(8,11)), 미드산(5,8,11-아이코사트리엔산)(20:3(5,8,11)), 디호모γ-리놀렌산(8,11,14-아이코사트리엔산)(20:3(8,11,14)), 아라키돈산(5,8,11,14-아이코사테트라엔산)(20:4(5,8,11,14)), 에이코사테트라엔산(8,11,14,17-아이코사테트라엔산)(20:4(8,11,14,17), 에이코사펜타엔산(5,8,11,14,17-아이코사펜타엔산)(20:5(5,8,11,14,17)), 베헨산(도코산산)(22:0), (7,10,13,16-도코사테트라엔산)(22:4(7,10,13,16)), (7,10,13,16,19-도코사펜타엔산)(22:5(7,10,13,16,19)), (4,7,10,13,16-도코사펜타엔산)(22:5(4,7,10,13,16)), (4,7,10,13,16,19-도코사헥사엔산)(22:6(4,7,10,13,16,19)), 리그노세린산(테트라도코산산)(24:0), 네르본산(cis-15-테트라도코산산)(24:1), 세로틴산(헥사도코산산)(26:0) 등을 들 수 있지만, 이들에 한정되지 않는다. 한편, 상기 물질명은 IUPAC 생화학 명명법으로 정의된 관용명이며, 조직명 및 탄소수와 이중 결합의 위치를 나타내는 수치를 괄호 내에 기재했다.
본 발명의 지방산 조성물은, 상기한 지방산 중, 하나 또는 그 이상의 지방산의 조합이라면, 어떠한 수의 어떠한 종류의 지방산으로 이루어지는 조성물이라도 좋다.
본 발명의 지방산 조성물의 조성을 측정하기 위해서는, 본 명세서 중의 「본 발명의 글리세롤-3-인산 아실기 전이 효소를 코드하는 핵산」의 항목에서 기재한, 지방산 조성 또는 지방산 함유율의 측정 방법을 이용할 수 있다.
본 발명의 지방산 조성물을 포함하는 식품 등
또한, 본 발명은 상기 지방산 조성물을 포함하는 식품을 제공한다. 본 발명의 지방산 조성물은 통상의 방법에 따라서, 예컨대 유지를 포함하는 식품, 공업 원료(화장료, 의약(예컨대, 피부외용약), 비누 등의 원료)의 제조 등의 용도에 사용할 수 있다. 화장료(조성물) 또는 의약(조성물)의 제형으로서는, 용액형, 페이스트형, 겔형, 고체형, 분말형 등 임의의 제형을 들 수 있지만, 이들에 한정되지 않는다. 또한, 식품의 형태로서는, 캡슐 등의 의약 제제의 형태 또는 단백질, 당류, 지방, 미량 원소, 비타민류, 유화제, 향료 등에 본 발명의 지방산 조성물이 배합된 자연 유동식, 반소화 상태 영양식 및 성분 영양식, 드링크제, 경장 영양제 등의 가공 형태를 들 수 있다.
더욱이, 본 발명의 식품의 예로서는, 영양 보조 식품, 건강 식품, 기능성 식품, 유아용 식품, 유아용 조제유, 미숙아용 조제유, 노인용 식품 등을 들 수 있지만, 이들에 한정되지 않는다. 본 명세서에 있어서, 식품이란, 고체, 유동체 및 액체, 및 이들의 혼합물로서, 섭식 가능한 것의 총칭을 말한다.
영양 보조 식품이란, 특정한 영양 성분이 강화되어 있는 식품을 말한다. 건강 식품이란, 건강적인 또는 건강에 좋다고 하는 식품을 말하며, 영양 보조 식품, 자연 식품, 다이어트 식품 등이 포함된다. 기능성 식품이란, 몸의 조절 기능을 하는 영양 성분을 보급하기 위한 식품을 말하며, 특정 보건용 식품과 동의이다. 유아용 식품이란, 약 6세까지의 아이에게 주기 위한 식품을 말한다. 노인용 식품이란, 무처리 식품과 비교하여 소화 및 흡수가 용이하도록 처리된 식품을 말한다. 유아용 조제유란, 약 1세까지의 아이에게 주기 위한 조제유를 말한다. 미숙아용 조제유란, 미숙아가 생후 약 6개월이 될 때까지 주기 위한 조제유를 말한다.
이들 식품으로서는, 육류, 어류, 견과류 등의 천연 식품(유지로 처리한 것); 중화요리, 라면, 스프 등의 조리시에 유지를 가하는 식품; 튀김, 후라이, 유부, 볶음밥, 도넛, 막과자 등의 열 매체로서 유지를 이용한 식품; 버터, 마가린, 마요네즈, 드레싱, 초콜릿, 즉석라면, 캬라멜, 비스킷, 쿠키, 케이크, 아이스크림 등의 유지 식품 또는 가공시에 유지를 가한 가공 식품; 센베과자, 하드 비스킷, 팥빵 등의 가공 마무리시에 유지를 분무 또는 도포한 식품 등을 들 수 있다. 그러나, 본 발명의 식품은 유지를 포함하는 식품에 한정되는 것은 아니며, 예컨대, 빵, 국수류, 밥, 과자류(캔디, 츄잉검, 구미, 정과, 화과자), 두부 및 그 가공품 등의 농산 식품; 청주, 약용주, 미림, 식초, 간장, 된장 등의 발효 식품; 요구르트, 햄, 베이컨, 소시지 등의 축산 식품; 어묵(Kammaboko), 튀긴 어묵, 한펜 등의 수산 식품; 과즙 음료, 청량 음료, 스포츠 음료, 알코올 음료, 차 등을 들 수 있다.
본 발명의
GPAT
를
코드하는
핵산 또는
GPAT
단백질을 이용한 균주의 평가·선택 방법
본 발명은 또한 본 발명의 GPAT를 코드하는 핵산 또는 GPAT 단백질을 이용하여, 지질 생산균을 평가나 선택하는 방법을 제공한다. 구체적으로는 다음과 같다.
(1) 평가 방법
본 발명의 한 양태로서, 본 발명의 GPAT를 코드하는 핵산 또는 GPAT 단백질을 이용하여, 지질 생산균 평가를 하는 방법을 들 수 있다. 본 발명의 상기 평가 방법으로서는, 우선, 본 발명의 염기 서열에 기초하여 설계한 프라이머 또는 프로브를 이용하여, 피검 균주인 지질 생성 균주의 본 발명의 상기 활성에 관해서 평가하는 방법을 들 수 있다. 이러한 평가 방법의 일반적 수법은 공지이며, 예컨대, 국제특허출원 팜플렛 WO01/040514호, 일본 특허공개 평8-205900호 공보 등에 기재되어 있다. 이하, 이 평가 방법에 관해서 간단히 설명한다.
우선, 피검 균주의 게놈을 조제한다. 조제 방법은 Hereford법이나 초산칼륨법 등, 어떠한 공지된 방법도 이용할 수 있다(예컨대, Methods in Yeast Genetics, Cold Spring Harbor Laboratory Press, p130(1990) 참조).
본 발명의 염기 서열, 바람직하게는, 서열 번호 1, 서열 번호 4 또는 서열 번호 8에 기초하여 프라이머 또는 프로브를 설계한다. 상기 프라이머 또는 프로브는 본 발명의 염기 서열의 어느 부분이나 이용할 수 있으며, 또한 그 설계는 공지된 수법을 이용하여 행할 수 있다. 프라이머로서 이용하는 폴리뉴클레오티드의 염기수는 통상 10 염기 이상이며, 15∼25 염기인 것이 바람직하다. 또한, 끼워 넣는 부분의 염기수는 통상 300∼2000 염기가 적당하다.
상기에서 제작한 프라이머 또는 프로브를 이용하여, 상기 피검 균주의 게놈 중에 본 발명의 염기 서열과 특이적인 서열이 존재하는지 여부를 조사한다. 본 발명의 염기 서열과 특이적인 서열의 검출은 공지된 수법을 이용하여 행할 수 있다. 예컨대, 본 발명의 염기 서열에 특이적 서열의 일부 또는 전부를 포함하는 폴리뉴클레오티드 또는 상기 염기 서열에 대하여 상보적인 염기 서열을 포함하는 폴리뉴클레오티드를 하나의 프라이머로서 이용하고, 또 한쪽의 프라이머로서 이 서열보다도 상류 혹은 하류의 서열의 일부 또는 전부를 포함하는 폴리뉴클레오티드 또는 상기 염기 서열에 대하여 상보적인 염기 서열을 포함하는 폴리뉴클레오티드를 이용하여, 예컨대, PCR법 등에 의해서 피검 균주의 핵산을 증폭하여, 증폭물의 유무, 증폭물의 분자량 크기 등을 측정할 수 있다.
본 발명의 방법에 알맞은 PCR법의 반응 조건은, 특별히 한정되지 않지만, 예컨대, 이하의 조건을 들 수 있다.
변성 온도 : 90∼95℃
어닐링 온도 : 40∼60℃
신장 온도 : 60∼75℃
사이클수 : 10회 이상
등의 조건이다.
얻어진 반응 생성물은 아가로스 겔 등을 이용한 전기영동법 등에 의해 분리하여, 증폭 산물의 분자량을 측정할 수 있다. 이에 따라, 증폭 산물의 분자량이 본 발명의 염기 서열과 특이적인 영역에 상당하는 핵산 분자를 포함하는 크기인지 여부를 확인함으로써, 피검 균주의 본 발명의 상기 활성을 예측 또는 평가할 수 있다. 또한, 상기 증폭 산물의 염기 서열을 상기 방법 등으로 해석함으로써, 더욱 본 발명의 상기 활성을 보다 정확하게 예측 또는 평가할 수 있다. 한편, 본 발명의 상기 활성의 평가 방법은 상기한 바와 같다.
또한, 본 발명의 상기 평가 방법으로서는, 피검 균주를 배양하여, 서열 번호 1 또는 서열 번호 6 등의 본 발명의 염기 서열이 코드하는 GPAT의 발현량을 측정함으로써, 피검 균주의 본 발명의 상기 활성을 평가할 수도 있다. 한편, GPAT의 발현량은, 피검 균주를 적당한 조건으로 배양하여, GPAT의 mRNA 또는 단백질을 정량함으로써 측정할 수 있다. mRNA 또는 단백질의 정량은 공지된 수법을 이용하여 행할 수 있다. mRNA의 정량은 예컨대 노던 하이브리다이제이션이나 정량적 RT-PCR에 의해서, 단백질의 정량은 예컨대 웨스턴 블로팅에 의해서 행할 수 있다(Current Protocols in Molecular Biology, John Wiley & Sons 1994-2003).
(2) 선택 방법
본 발명의 다른 양태로서, 본 발명의 GPAT를 코드하는 핵산 또는 GPAT 단백질을 이용하여 지질 생산균을 선택하는 방법을 들 수 있다. 본 발명의 상기 선택 방법으로서는, 피검 균주를 배양하여, 서열 번호 1, 서열 번호 4 또는 서열 번호 8 등의 본 발명의 염기 서열이 코드하는 GPAT의 발현량을 측정하여, 목적으로 하는 발현량의 균주를 선택함으로써, 원하는 활성을 갖는 균주를 선택할 수 있다. 또한, 기준이 되는 균주를 설정하여, 이 기준 균주와 피검 균주를 각각 배양하고, 각 균주의 상기 발현량을 측정하여, 기준 균주와 피검 균주의 발현량을 비교하여, 원하는 균주를 선택할 수도 있다. 구체적으로는, 예컨대, 기준 균주 및 피검 균주를 적당한 조건으로 배양하고, 각 균주의 발현량을 측정하여, 기준 균주보다도 피검 균주 쪽이 고발현 또는 저발현인 피검 균주를 선택함으로써, 원하는 활성을 갖는 균주를 선택할 수 있다. 원하는 활성에는, 상기한 것과 같이, GPAT의 발현량 및 GPAT가 생성하는 지방산 조성물의 조성을 측정하는 방법을 들 수 있다.
또한, 본 발명의 상기 선택 방법으로서는, 피검 균주를 배양하여, 본 발명의 상기 활성이 높거나 혹은 낮은 균주를 선택함으로써, 원하는 활성을 갖는 피검 균주를 선택할 수도 있다. 원하는 활성에는, 상기한 것과 같이, GPAT의 발현량 및 GPAT가 생성하는 지방산 조성물의 조성을 측정하는 방법을 들 수 있다.
피검 균주 또는 기준 균주로서는, 예컨대, 상기한 본 발명의 벡터를 도입한 균주, 상기 본 발명의 핵산의 발현이 억제된 균주, 돌연변이 처리가 실시된 균주, 자연 변이된 균주 등을 이용할 수 있지만 이들에 한정되지 않는다. 또, 본 발명의 상기 활성은, 예컨대 본 명세서 중의 「본 발명의 글리세롤-3-인산 아실기 전이 효소를 코드하는 핵산」의 항목에서 기재한 방법에 의해서 측정하는 것이 가능하다. 돌연변이 처리로서는, 예컨대, 자외선 조사나 방사선 조사 등의 물리적 방법, EMS(에틸메탄술포네이트), N-메틸-N-니트로소구아니딘 등의 약제 처리에 의한 화학적 방법 등을 들 수 있지만(예컨대, 오시마 야스지 편저, 생물화학실험법 39 효모분자유전학 실험법, p.67-75, 학회출판센터 등 참조), 이들에 한정되지 않는다.
한편, 본 발명의 기준 균주, 피검 균주로서 이용하는 균주로서는, 상기한 지질 생산균 또는 효모 등을 들 수 있지만, 이들에 한정되지 않는다. 구체적으로는, 기준 균주, 피검 균주는 다른 속이나 종에 속하는 어떠한 균주를 조합시켜 이용하더라도 좋고, 피검 균주는 하나 또는 그 이상의 균주를 동시에 이용하더라도 좋다.
이하, 실시예에 의해 본 발명을 더욱 구체적으로 설명한다. 단, 본 발명은 실시예에 한정되는 것은 아니다.
실시예
실시예
1 :
모르티엘라
알피나의
게놈 해석
M. alpina 1S-4주를 100 ml의 GY2:1 배지(2% 글루코오스, 1% 효모 엑기스, pH 6.0)에 식균하여, 28℃에서 2일간 진탕 배양했다. 여과에 의해 균체를 집균하고, DNeasy(QIAGEN)를 이용하여 게놈 DNA를 조제했다.
상기 게놈 DNA의 염기 서열을 Roche 454 GS FLX Standard를 이용하여 결정했다. 그 때, 프래그먼트 라이브러리의 염기 서열 결정을 2 런분, 메이트 페어 라이브러리의 염기 서열 결정을 3 런분 행했다. 얻어진 염기 서열을 어셈블리함으로써, 300개의 수퍼콘티그를 얻었다.
실시예
2 :
cDNA
의 합성과
cDNA
라이브러리의 제작
M. alpina 1S-4주를 4 ml의 배지(2% 글루코오스, 1% 효모 엑기스, pH 6.0)에 식균하여, 4일간 28℃에서 배양했다. 균체를 여과에 의해 회수하고, RNeasy plant kit(QIAGEN)를 이용하여 RNA를 추출했다. 수퍼스크립트 퍼스트 스트랜드 시스템 for RT-PCR(인비트로젠)에 의해 cDNA를 합성했다. 또한, Oligotex-dT30<Super> mRNA Purification Kit(타카라바이오)를 이용하여, 토탈 RNA로부터 poly(A)+RNA의 정제를 실시했다. cDNA 라이브러리를 ZAP-cDNA GigapackIII Gold Cloning Kit(STRATAGENE)를 이용하여 제작했다.
실시예
3 :
GPAT
호몰로그의
탐색
우선, 대장균(Escherichia coli) 유래의 GPAT인 plsB의 아미노산 서열(GenBank 수탁번호 BAE78043)을, M. alpina 1S-4주의 게놈 염기 서열에 대하여 tblastn에 의해 검색한 결과, 서열 번호 7을 포함하는 수퍼콘티그가 히트되었다. 한편, 효모(S.cerevisiae) 유래의 GPAT인 SCT1(YBL011W) 또는 GPT2(YKR067W)의 아미노산 서열을 M. alpina 1S-4주의 게놈 염기 서열에 대하여 tblastn에 의해 검색한 결과, 서열 번호 12, 서열 번호 13, 서열 번호 14 또는 서열 번호 15를 포함하는 수퍼콘티그가 히트되었다.
서열 번호 13은 MaGPAT1의 게놈 서열, 서열 번호 15는 MaGPAT2의 게놈 서열(WO2008/156026)이었다. 서열 번호 14는 본 발명자들이 앞서 별도 동정하였던 MaGPAT3의 게놈 서열이었다(본원 출원시 미공개).
서열 번호 7과 서열 번호 12에 관련한 유전자는 신규의 것이라고 생각되었다. 서열 번호 7에 관련한 유전자를 MaGPAT4, 서열 번호 12에 관련한 유전자를 MaGPAT5라 명명하였다.
실시예
4 :
MaGPAT4
및
MaGPAT5
의
클로닝
(1) MaGPAT4 의 cDNA 의 클론화
MaGPAT4의 cDNA를 클론화하기 위해서 이하의 프라이머를 제작했다.
서열 번호 4를 포함하는 수퍼콘티그의 염기 서열을 BLAST 해석하여, 이미 알려진 GPAT 호몰로그와 비교한 바, 서열 번호 4의 4246-4248번째의 TAA가 종지 코돈이라고 생각되었다. 한편, 개시 코돈은 이미 알려진 호몰로그와의 비교로부터는 추정하기가 어려웠다. 그래서, 5'-RACE법에 의해, cDNA의 5' 말단의 클론화를 시도했다. 즉, Gene Racer Kit(인비트로젠)를 이용하여,
를 5' 유전자 특이적 프라이머로 하여, 상기 프라이머보다 5' 상류의 cDNA의 클론화를 시도했다. 그 결과, 얻어진 서열은, 서열 번호 3의 93번째-595번째의 염기 서열을 포함하고 있었다. 그러나, 개시 코돈이라고 생각되는 서열이 없는 것과, 다른 GPAT 호몰로그와의 비교로부터, 얻어진 서열도 MaGPAT4의 개시 코돈을 포함하지 않을 가능성이 생각되었다. 그래서, 게놈 서열인 서열 번호 7과 서열 번호 3의 93번째-595번째의 서열을 비교하여, 일치하는 영역의 5' 상류를 상세히 조사한 바, 게놈 서열 상의 MaGPAT4를 코드한다고 생각되는 프레임 상에 맨 처음에 출현하는 종지 코돈보다 하류에, 개시 코돈으로 될 수 있는 ATG가 596-598번째와 428-430번째의 2개소에서 발견되었다. 우선, 596-598번째의 ATG를 개시 코돈으로 하여, MaGPAT4의 CDS를 클론화하기 위해서, 이하의 프라이머를 제작했다.
cDNA를 주형, 프라이머 SacI-GPAT4-1과 프라이머 Sal-GPAT4-2의 조합으로, ExTaq(타카라바이오)를 이용하여, 94℃ 2분, (94℃ 1분, 55℃ 1분, 72℃ 1분) 30 사이클의 PCR 반응을 실시했다. 증폭된 약 2.5 kbp의 DNA 단편을 TOPO-TA 클론닝 키트(Invitrogen)를 사용하여 클론화하고, 인서트 부분의 염기 서열을 결정하여, 서열 번호 3의 염기 서열을 갖는 플라스미드를 pCR-MaGPAT4로 했다. MaGPAT4를 코드하고 있는 CDS의 염기 서열을 서열 번호 3, ORF의 염기 서열을 서열 번호 1, 이들 염기 서열로부터 유도되는 MaGPAT4의 아미노산 서열을 서열 번호 2에 나타냈다.
한편, 428-430번째의 ATG를 개시 코돈으로 한 경우를 MaGPAT4-long이라 표기한다. MaGPAT4-long을 코드하고 있는 CDS의 염기 서열을 서열 번호 6, ORF의 염기 서열을 서열 번호 4, 이들 염기 서열로부터 유도되는 MaGPAT4-long의 아미노산 서열을 서열 번호 5로서 나타냈다.
(2) MaGPAT5 의 cDNA 의 클론화
MaGPAT5의 cDNA를 클론화하기 위해서 이하의 프라이머를 제작했다.
상기한 것과 같이 제작한 라이브러리를 주형, 프라이머 GPAT5-1F와 프라이머 GPAT5-3R의 조합으로 ExTaq(타카라바이오)를 이용하여, 94℃ 2분, (94℃ 1분, 55℃ 1분, 72℃ 1분) 30 사이클의 PCR 반응을 실시했다. 얻어진 약 0.9 kbp의 DNA 단편을 TOPO-TA 클로닝 키트(Invitrogen)를 사용하여 클론화하여, 인서트 부분의 염기 서열을 결정했다. 서열 번호 8의 1503-2385번째의 염기 서열을 갖는 플라스미드를 pCR-MaGPAT5-P로 했다.
이어서, 이 플라스미드를 주형으로 하고, 상기 프라이머를 이용하여 PCR에 의해 프로브를 제작했다. 반응에는 ExTaq(타카라바이오)를 이용했지만, 첨부한 dNTP 믹스 대신에 PCR 라벨링 믹스(로슈·다이아그노스틱사)를 이용하여, 증폭되는 DNA를 디곡시게닌(DIG) 라벨한 프로브를 제작하여 MaGPAT5 프로브로 했다. 이들 프로브를 이용하여 cDNA 라이브러리를 스크리닝했다.
하이브리다이제이션의 조건은 다음과 같다.
버퍼 : 5xSSC, 1% SDS, 50 mM Tris-HCl(pH 7.5), 50% 포름아미드;
온도 : 42℃(하룻밤);
세정 조건 : 0.2xSSC, 0.1% SDS 용액 속(65℃)에서, 20분간×3회;
검출은 DIG 핵산 검출 키트(로슈·다이아그노스틱사)를 이용하여 행했다. 스크리닝에 의해서 얻어진 파지 클론으로부터 인비보 엑시젼에 의해 플라스미드를 잘라내어, 각 플라스미드 DNA를 얻었다. MaGPAT5 프로브로 스크리닝하여 얻어진 플라스미드 중, 가장 인서트 길이가 긴 것은 서열 번호 11의 염기 서열을 포함하고 있으며, 플라스미드 pB-MaGPAT5라 이름붙였다. 서열 번호 11의 염기 서열 중의 ORF 검색을 했다. 그 결과, 서열 번호 11의 225-227번째를 개시 코돈, 2589-2591번째를 종지 코돈으로 하는 CDS가 존재했다. 이 서열로부터 유도되는 아미노산 서열의 blastp 검색 결과 등으로부터, 이 CDS가 MaGPAT5를 코드하고 있다고 생각되었다. MaGPAT5를 코드하는 유전자의 CDS를 서열 번호 10, ORF를 서열 번호 8, 이들 염기 서열로부터 유도되는 MaGPAT5의 아미노산 서열을 서열 번호 9에 나타냈다.
(3) 서열 해석
MaGPAT4 유전자의 게놈 서열(서열 번호 7)과 CDS 서열(서열 번호 3)을 비교한 바, 본 유전자의 게놈 서열은 엑손 10개, 인트론 9개로 이루어지고, 825개의 아미노산 잔기로 이루어지는 단백질을 코드하고 있다고 생각되었다(도 1 및 도 2). 한편, MaGPAT5 유전자의 게놈 서열(서열 번호 12)과 CDS 서열(서열 번호 10)을 비교한 바, 본 유전자의 게놈 서열은 엑손 3개, 인트론 2개로 이루어지고, 788개의 아미노산 잔기로 이루어지는 단백질을 코드하고 있다고 생각되었다(도 3, 도 4).
MaGPAT4, MaGPAT5와 이미 알려진 모르티에렐라 알피나 유래의 GPAT 호몰로그를 비교했다. CDS 서열과 CDS 서열로부터 유도되는 아미노산 서열의 동일성을 표 2 및 표 3에 각각 나타냈다.
MaGPAT4의 추정 아미노산 서열(서열 번호 2)을 GenBank nr에 등록되어 있는 아미노산 서열에 대하여 BLASTp로 상동성 해석을 한 바, 이 서열에 대하여 가장 E-value가 낮았던, 즉 동일성이 높았던 아미노산 서열은 자낭균 Chaetomium globosum CBS 148.51 유래의 추정 단백질의 아미노산 서열(GenBank 수탁번호 XP_001224211)이며, 동일성은 39.3%였다. 또한, 동물 유래의 Glyceronephosphate O-acyltransferase(GNPAT)와도 상동성이 있으며, 인간 유래의 GNPAT(GenBank 수탁번호 AAH00450)와는 동일성이 22.6%였다. 더욱이, 대장균 E.coli 유래의 GPAT인 plsB 단백질과의 아미노산 서열(GenBank 수탁번호 BAE78043)의 동일성은 17.6%였다. MaGPAT4와 이들 아미노산 서열과의 얼라이먼트를 도 5에 도시했다.
한편, MaGPAT5의 추정 아미노산 서열(서열 번호 9)을 GenBank nr에 등록되어 있는 아미노산 서열에 대하여 BLASTp로 상동성 해석을 한 바, 이 서열에 대하여 가장 E-value가 낮았던, 즉 동일성이 높았던 아미노산 서열은 담자균 Ustilago maydis 521 유래의 추정 단백질 UM03369의 아미노산 서열(GenBank 수탁번호 XP_759516)이며, 동일성은 15.4%였다. MaGPAT5와 이들의 아미노산 서열과의 얼라이먼트를 도 6에 도시했다.
MaGPAT4, MaGPAT5 모두 아실기 전이 효소로 보존되어 있는 영역이 보존되어 있고, 특히 아실기 전이 효소 활성에 중요하다고 생각되고 있는 * 표시로 나타내는 글리신 잔기(G)와 프롤린 잔기(P)가 보존되어 있었다. 또한, G3P와의 결합에 중요하다고 생각되고 있는 + 표시로 나타낸 세린 잔기(S)도 보존되어 있었다(도 5 및 도 6).
실시예
5 :
MaGPAT4
의 기능 해석
(1) MaGPAT4 의 효모용 발현 벡터의 구축
효모 발현용 벡터 pYE22m(Biosci. Biotech. Biochem., 59, 1221-1228, 1995)을 제한 효소 EcoRI와 SalI로 소화한 DNA 단편과, 플라스미드 pCR-MaGPAT4를 제한효소 EcoRI와 제한 효소 SalI로 소화하여, 얻어진 약 2.1 kbp의 DNA 단편을 ligation high(TOYOBO)로 연결하여, 플라스미드 pYE-MaGPAT4를 구축했다.
또한, 비교를 위해, MaGPAT1, MaGPAT2 및 MaGPAT3에 대해서도 효모용 발현 벡터를 구축했다. MaGPAT1 및 MaGPAT2의 효모용 발현 벡터에 대해서는, WO2008/156026에 기재되어 있는 것과 같이 구축하여, 각각 pYE-MaGPAT1 및 pYE-MaGPAT2로 했다. MaGPAT3의 효모용 발현 벡터에 대해서는 다음과 같이 조제했다. MaGPAT1(ATCC #16266)의 아미노산 서열을 쿼리로 하여, 상기한 실시예 1과 같이 하여 얻어진 M. alpina 1S-4주의 게놈 염기 서열에 대하여, tblastn에 의해 검색한 결과, MaGPAT1과 상동성을 갖는 유전자가 얻어져, 이것을 MaGPAT3이라 명명했다(본원 출원시 미공개). 이하의 프라이머:
를 작성하고, 상기한 실시예 2에 기재한 cDNA를 주형으로 하여, 이들 프라이머로 KOD-Plus-(토요보)를 이용하여 PCR를 행한 바, 약 2.2 kbp의 DNA 단편이 증폭되었다. 이것을 Zero Blunt TOPO PCR 클로닝 키트(인비트로젠)를 이용하여 클론화하여, 얻어진 플라스미드를 pCR-MaGPAT3으로 했다. 플라스미드 pCR-MaGPAT3을 제한 효소 EcoRI와 SalI로 소화하여 얻어진 약 2.3 kbp의 DNA 단편을 효모 발현용 벡터 pYE22m의 EcoRI, SalI 사이트에 삽입하여, 플라스미드 pYE-MaGPAT3을 얻었다.
(2) 형질전환주의 취득
플라스미드 pYE22m, pYE-MaGPAT4, pYE-MaGPAT1, pYE-MaGPAT2, pYE-MaGPAT3을 각각 이용하여 초산리튬법에 의해 효모 S. cerevisiae EH13-15주(trp1, MATα)(Appl. Microbiol. Biotechnol., 30, 515-520, 1989)를 형질전환했다. 형질전환주는, SC-Trp(1 ℓ당, Yeast nitrogen base w/o amino acids(DIFCO) 6.7 g, 글루코오스 20 g, 아미노산 파우더(아데닌황산염 1.25 g, 아르기닌 0.6 g, 아스파라긴산 3 g, 글루타민산 3 g, 히스티딘 0.6 g, 류신 1.8 g, 리신 0.9 g, 메티오닌 0.6 g, 페닐알라닌 1.5 g, 세린 11.25 g, 티로신 0.9 g, 발린 4.5 g, 트레오닌 6 g, 우라실 0.6 g을 혼합한 것) 1.3 g) 한천 배지(2% 아가) 상에서 생육하는 것으로서 선발했다.
(3) 효모의 배양
플라스미드 pYE22m을 이용하여 형질전환하여 얻어진 임의의 2주를 C-1주, C-2주로 하고, 또한 플라스미드 pYE-MaGPAT4를 이용하여 형질전환하여 얻어진 임의의 2주를 MaGPAT4-1주, MaGPAT4-2주로 하여, 이하의 배양 실험에 제공했다. 또한, 비교를 위해, 플라스미드 pYE-MaGPAT1을 이용하여 형질전환하여 얻어진 임의의 2주를 MaGPAT1-1주, MaGPAT1-2주로 하고, 플라스미드 pYE-MaGPAT2를 이용하여 형질전환하여 얻어진 임의의 2주를 MaGPAT2-1주, MaGPAT2-2주로 하고, 또 플라스미드 pYE-MaGPAT3을 이용하여 형질전환하여 얻어진 임의의 2주를 MaGPAT3-1주, MaGPAT3-2주로 하여, MaGPAT4-1주 및 MaGPAT4-2주와 마찬가지로 이하의 배양 실험에 제공했다.
전배양으로서, SC-Trp 배지 10 ml에 효모를 플레이트로부터 1 백금이 식균하여, 30℃에서 1일간 진탕 배양을 했다. 본배양은, SC-Trp 배지 또는 YPD(효모 엑기스 2%, 폴리펩톤 1%, 글루코오스 2%) 배지 10 ml에 전배양액을 500 μl 첨가하여, 30℃에서 2일간 진탕 배양을 했다.
(4) 균체의 지방산 분석
효모의 배양액을 원심 분리함으로써 균체를 회수했다. 10 ml의 멸균수로 세정하고, 원심 분리에 의해 다시 균체를 회수하여, 동결 건조했다. 동결 건조 균체에 클로로포름:메탄올(2:1)을 4 ml 첨가하여, 격하게 교반한 후, 70℃에서 1시간 처리했다. 원심 분리에 의해 균체를 분리하여, 용매를 회수했다. 남은 균체에 재차 클로로포름:메탄올(2:1)을 4 ml 첨가하여, 마찬가지로 용매를 회수했다. 스피드백으로 지질을 건고한 후, 2 ml의 클로로포름을 첨가하여 지질을 용해했다. 이 시료 중, 200 μl를 분취하여, 염산 메탄올법에 의해 균체의 지방산을 메틸에스테르로 유도한 후, 헥산으로 추출하고, 헥산을 유거하여, 가스 크로마토그래피에 의해 분석을 했다.
결과를 표 4, 표 5, 표 6 및 표 7에 나타낸다.
표 4 및 표 5에 나타낸 대로, MaGPAT4를 고발현시킨 주의 균체 내의 지질을 구성하는 지방산 조성은, 벡터만을 도입한 컨트롤주와 비교하여, 팔미틴산(16:0)의 비율이 상승하고, 팔미톨레산(16:1)의 비율이 저하하고 있었다. 이 경향은 모르티에렐라 알피나 유래의 다른 GPAT인 MaGPAT1, MaGPAT2 및 MaGPAT3을 이용한 경우의 경향과는 다르다. 따라서, 본 발명의 MaGPAT4는 다른 모르티에렐라 알피나 유래의 GPAT와는 다른 기질 특이성을 갖고 있다.
또한, 표 6 및 표 7에 나타낸 대로, 균체 내의 지방산 함유율은, MaGPAT4를 고발현시킨 주에서는, 컨트롤주에 비해서 대략 2배로 상승하고 있었다.
실시예
6 :
MaGPAT4
-
long
및
MaGPAT4
의 기능 해석
(1) 갈락토오스 유도형 발현 벡터의 구축
MaGPAT4-long 또는 MaGPAT4를 갈락토오스로 발현 유도시키기 위해서, 다음과 같이, 갈락토오스 유도형의 프로모터를 갖는 플라스미드를 구축했다.
실시예 2에서 조제한 cDNA를 주형으로 하여, 프라이머 Not-MaGPAT4-F1과 프라이머 Bam-MaGPAT4-R 또는 프라이머 Not-MaGPAT4-F2와 프라이머 Bam-MaGPAT4-R의 조합으로, ExTaq(타카라바이오)를 이용하여, 94℃ 2분, (94℃ 1분, 55℃ 1분, 72℃ 1분) 30 사이클의 PCR 반응을 실시했다. 증폭된 약 2.7 kbp 또는 약 2.5 kbp의 DNA 단편을 TOPO-TA 클로닝 키트(Invitrogen)를 사용하여 클론화하여, 각각 서열 번호 6의 GPAT4-long의 CDS 서열 또는 서열 번호 3의 GPAT4의 CDS 서열을 갖는 것을 확인하여, 각각 플라스미드 pCR-MaGPAT4-long-1 또는 플라스미드 pCR-MaGPAT4-1로 했다. 벡터 pESC-TRP(스트라타진)를 제한 효소 NotI와 BglII로 소화하여 얻어진 약 6.5 kbp의 DNA 단편과, 플라스미드 pCR-MaGPAT4-long-1 또는 플라스미드 pCR-MaGPAT4-1을 제한 효소 NotI와 BamHI로 소화하여 얻어진 약 2.7 kbp 또는 2.5 kbp의 DNA 단편을 ligation high(TOYOBO)를 이용하여 연결하여, 플라스미드 pESC-T-MaGPAT4-long 또는 플라스미드 pESC-T-MaGPAT4를 얻었다.
(2) 형질전환주의 취득
pESC-TRP, pESC-T-MaGPAT4-long, pESC-T-MaGPAT4를 각각 이용하여 초산리튬법에 의해, 효모 S. cerevisiae EH13-15주를 형질전환했다. 형질전환주는 SC-Trp 한천 배지 상에서 생육하는 것으로서 선발했다.
(3) 효모의 배양
각 플라스미드로 형질전환하여 얻어진 임의의 4주씩을, 전배양으로서, SD-Trp 액체 배지 10 ml에 각각 식균하여, 30℃에서 1일간 진탕 배양했다. 본배양으로서, 얻어진 전배양액 중 1 ml를 각각 SG-Trp(1 ℓ당, Yeast nitrogen base w/o amino acids(DIFCO) 6.7 g, 갈락토오스 20 g, 아미노산 파우더(아데닌황산염 1.25 g, 아르기닌 0.6 g, 아스파라긴산 3 g, 글루타민산 3 g, 히스티딘 0.6 g, 류신 1.8 g, 리신 0.9 g, 메티오닌 0.6 g, 페닐알라닌 1.5 g, 세린 11.25 g, 티로신 0.9 g, 발린 4.5 g, 트레오닌 6 g, 우라실 0.6 g을 혼합한 것) 1.3 g) 액체 배지 10 ml에, 각 주 2개씩 식균하고, 30℃에서 2일간 진탕 배양하여, MaGPAT4-long 또는 MaGPAT4의 발현을 유도했다.
(4) 지질 분석
효모의 배양액을 원심 분리함으로써, 균체를 회수했다. 10 ml의 멸균수로 세정하고, 원심 분리에 의해 다시 균체를 회수하여, 동결 건조했다. 각 주의 1개의 균체의 지방산을 염산 메탄올법에 의해 메틸에스테르로 유도하여, 가스 크로마토그래피에 의해 균체 내에 포함되는 총 지방산을 분석했다(표 8).
한편, 각 주의 나머지 1개의 균체로부터 다음과 같이 지질을 추출했다. 즉, 1 ml의 클로로포름:메탄올(2:1)과 글라스 비드를 가하여, 비드 비터로 균체를 파쇄한 후, 원심 분리하여 상청을 회수했다. 남은 균체에 추가로 1 ml의 클로로포름:메탄올(2:1)을 가하고, 같은 식으로 상청을 회수하는 것을 반복하여, 총량 4 ml의 클로로포름:메탄올(2:1)로 지질을 회수했다. 스피드백을 사용하여, 용매를 유거하여, 잔사를 소량의 클로로포름에 녹였다. 실리카겔 60 플레이트(머크), 전개 용매 헥산:디에틸에테르:초산 70:30:1의 조건으로 박층 크로마토그래피를 행하여, 지질을 분획했다. 프리물린 용액을 분무하고, 자외선을 조사함으로써 지질을 검출했다. 트리아실글리세롤(TG) 분획, 유리 지방산(FFA) 분획, 디아실글리세롤(DG) 분획과 인지질(PL) 분획을 각각 긁어내어 시험관에 모아서, 염산 메탄올법에 의해 지방산을 메틸에스테르로 유도하여, 가스 크로마토그래피에 의해 지방산 분석을 했다(표 9, 도 7).
이하에 각 유전자 도입주의 분석 결과를 나타낸다. 벡터인 pESC-TRP 도입주를 컨트롤로 했다.
총 지방산량은, 컨트롤과 비교하여, MaGPAT4-long 또는 MaGPAT4를 발현시킨 주에서는, 각각 1.7배, 2.0배로 증가했다(표 8).
PL의 양은 MaGPAT4-long, MaGPAT4를 발현시킨 주에서도, 컨트롤에 대하여, 각각 1.1배, 1.2배로 차가 거의 없었다. 한편, TG량은 MaGPAT4-long 또는 MaGPAT4를 발현시킨 주에서는, 컨트롤에 비해서 MaGPAT4-long, MaGPAT4를 발현시킨 주에서, 2.8배, 3.5배로 크게 증가하고 있었다. 즉, MaGPAT4-long 또는 MaGPAT4를 발현시킴으로써 지방산의 생합성을 활성화하여, 저장 지질인 TG의 생산성을 높일 수 있었다. 또한, DG나 FFA도, MaGPAT4-long, MaGPAT4를 발현시킨 주에서는 컨트롤에 비해서 증가하고 있었다(표 9).
각 지질 분획의 지방산 조성을 도 7에 도시했다. FFA 분획의 조성은 컨트롤과 MaGPAT4-long 또는 MaGPAT4를 발현시킨 주에서 거의 차가 없었다. 이에 대하여, 그 밖의 분획에서는, MaGPAT4-long 또는 MaGPAT4를 발현시킨 주에서는 포화지방산이 증가하고, 불포화지방산이 감소하는 경향이 있으며, 특히 16:0(팔미틴산)이 증가하고, 16:1(팔미톨레산)이 감소하고 있었다.
한편, 본배양으로서, SG-Trp 액체 배지 대신에, SC-Trp 액체 배지를 사용한 경우에 관해서도 검토했다. SC-Trp 액체 배지는 갈락토오스를 포함하지 않기 때문에, 이 배지를 사용하여 본배양을 하는 경우는, 형질전환에 의해 도입한 MaGPAT4-long 또는 MaGPAT4의 발현은 유도되지 않는다. SC-Trp 액체 배지를 사용한 실험에서는, 균체의 총 지방산의 양, 조성 모두, 컨트롤과 MaGPAT4-long, MaGPAT4 도입주 사이에서 차는 인정되지 않았다(표 10, 도 8). 이로부터도, MaGPAT4-long 또는 MaGPAT4의 발현이 갈락토오스에 의해 유도된 결과, SG-Trp 배지에 있어서는 균체 내의 지방산이 증가했다고 말할 수 있다.
실시예
7 : 효모 S.
cerevisiae
Δ
sct1
, Δ
gpt2
상보 실험
효모 S.cerevisiae에서는, GPAT 활성을 담당하는 유전자로서 SCT1과 GPT2가 알려져 있으며, 이들을 동시에 결실시키면 치사에 이르는 것이 알려져 있다. 모르티에렐라 알피나 유래의 MaGPAT4, MaGPAT4-long의 산물이 GPAT 활성을 갖는지 여부를 확인하기 위해서, Δsct1, Δgpt2의 상보 실험을 했다. 표 11에 다음과 같이 제작한 주의 유전자형을 정리했다.
(1)
GP
-1주의 제작
Yeast knock out strain collection(오픈바이오시스템즈)의 Δgpt2 호모접합 2배체 효모(카탈로그 No.YSC1021-663938)의 SCT1 유전자를 다음과 같이 파괴했다. 우선, S.cerevisiae S288C주의 균체로부터, Gen토루쿤(효모용)(타카라바이오)를 이용하여 DNA를 추출했다. 이것을 주형으로 하여, 프라이머 Xba1-Des-SCT1-F : 5'-TCTAGAATGCCTGCACCAAAACTCAC-3'(서열 번호 31)과 프라이머 Xba1-Des-SCT1-R : 5'-TCTAGACCACAAGGTGATCAGGAAGA-3'(서열 번호 32)로, KOD-Plus-(토요보)를 이용하여 PCT를 하여, SCT1 유전자의 부분 서열을 증폭했다. 증폭된 약 1.3 kbp의 DNA 단편을 Zero Blunt TOPO PCR 클로닝 키트(인비트로젠)를 이용하여 클론화하여, 얻어진 플라스미드를 pCR-SCT1P로 했다. 이어서, 플라스미드 YEp13을 제한 효소 SalI와 XhoI로 소화하여 얻어진 LEU2 유전자의 CDS를 포함하는 약 2.2 kbp의 DNA 단편과, 플라스미드 pCR-SCT1P를 SalI로 소화하여 얻어진 약 4.4 kbp의 DNA 단편을, ligation high(토요보)에 의해 연결하고, SCT1 유전자에 대하여 LEU2 유전자가 역방향으로 삽입된 플라스미드를 pCR-Δsct1:LEU2로 했다. 이것을 제한 효소 XbaI로 소화하여, 상기 Δgpt2 호모접합 2배체 효모를 초산리튬법에 의해 형질전환하고, SD-Leu(1 ℓ당, Yeast nitrogen base w/o amino acids (DIFCO) 6.7 g, 글루코오스 20 g, 아미노산 파우더(아데닌황산염 1.25 g, 아르기닌 0.6 g, 아스파라긴산 3 g, 글루타민산 3 g, 히스티딘 0.6 g, 리신 0.9 g, 메티오닌 0.6 g, 페닐알라닌 1.5 g, 세린 11.25 g, 티로신 0.9 g, 발린 4.5 g, 트레오닌 6 g, 트립토판 1.2 g, 우라실 0.6 g을 혼합한 것) 1.3 g) 한천 배지(2% 아가)로 생육할 수 있는 것을 선발했다. 얻어진 형질전환주의 균체로부터 상슬한 방법으로 DNA를 추출했다. (a) 프라이머 SCT1outORF-F : 5'-AGTGTAGGAAGCCCGGAATT-3'(서열 번호 33)와 프라이머 SCT1inORF-R : 5'-GCGTAGATCCAACAGACTAC-3'(서열 번호 34)(0.5 kbp), (b) 프라이머 SCT1outORF-F와 프라이머 LEU2inORF-F : 5'-TTGCCTCTTCCAAGAGCACA-3'(서열 번호 35)(1.2 kbp)의 조합으로 PCR을 실시함으로써 유전자형을 확인, 즉, SCT1/Δsct1:LEU2임을 확인하여, GP-1주로 했다.
(2)
URA3
을
마커로
하는 갈락토오스 유도형 발현 벡터의 구축
벡터 pESC-URA(스트라타진)를, 제한 효소 NotI와 BglII로 소화하여 얻어진 약 6.6 kbp의 DNA 단편과, 플라스미드 pCR-MaGPAT4-long-1 또는 플라스미드 pCR-MaGPAT4-1을 제한 효소 NotI와 BamHI로 소화하여 얻어진 약 2.7 kbp 또는 2.5 kbp의 DNA 단편을 ligation high(TOYOBO)를 이용하여 연결하여, 플라스미드 pESC-U-MaGPAT4-long 또는 플라스미드 pESC-U-MaGPAT4를 얻었다.
(3) 형질전환주의 취득
pESC-URA, pESC-U-MaGPAT4-long 또는 pESC-U-MaGPAT4를 각각 이용하여 초산리튬법에 의해 효모 GP-1주를 형질전환했다. 형질전환주는 SC-Ura(1 ℓ당, Yeast nitrogen base w/o amino acids(DIFCO) 6.7 g, 글루코오스 20 g, 아미노산 파우더(아데닌황산염 1.25 g, 아르기닌 0.6 g, 아스파라긴산 3 g, 글루타민산 3 g, 히스티딘 0.6 g, 리신 0.9 g, 메티오닌 0.6 g, 페닐알라닌 1.5 g, 세린 11.25 g, 티로신 0.9 g, 발린 4.5 g, 트레오닌 6 g, 트립토판 1.2 g, 류신 1.8 g을 혼합한 것) 1.3 g) 한천 배지(2% 아가)로 생육할 수 있는 것을 선발했다. pESC-URA로 형질전환하여 얻어진 주를 C-D주, pESC-U-MaGPAT4-long, pESC-U-MaGPAT4로 형질전환하여 얻어진 주를 각각 MaGPAT4-long-D주, MaGPAT4-D주로 했다.
(4) 포자 형성과
사분자
분석
C-D주와 MaGPAT4-long-D주, MaGPAT4-D주를 각각 YPD 한천 배지에 도포하여, 30℃에서 1일간 배양했다. 생육한 균체를 포자 형성용 한천 배지(0.5% 초산칼륨, 2% 아가)에 도포하여, 20℃에서 7일간 배양했다. 얻어진 균체를 적당량 긁어내어, 100 μl의 자이몰리아제 용액(0.125 mg/ml 자이몰리아제 100T, 1 M 솔비톨, 40 mM 인산칼륨 버퍼(pH 6.8))에 현탁하여, 실온에서 30분간 인큐이베트한 후 튜브를 얼음 속으로 옮겼다. 현미경 하에서, 자낭 포자가 형성되어 있음을 확인한 후, YPGal(효모 엑기스 2%, 펩톤 1%, 갈락토오스 2%) 한천 배지 상에서 마이크로매니퓰레이션에 의해 4개의 자낭 포자를 분리하여, 30℃에서 2일간 인큐베이트하여, 각각의 포자에 유래하는 콜로니를 얻었다.
얻어진 포자 클론을, SG-Ura(1 ℓ당, Yeast nitrogen base w/o amino acids(DIFCO) 6.7 g, 갈락토오스 20 g, 아미노산 파우더(아데닌황산염 1.25 g, 아르기닌 0.6 g, 아스파라긴산 3 g, 글루타민산 3 g, 히스티딘 0.6 g, 리신 0.9 g, 메티오닌 0.6 g, 페닐알라닌 1.5 g, 세린 11.25 g, 티로신 0.9 g, 발린 4.5 g, 트레오닌 6 g, 트립토판 1.2 g, 류신 1.8 g을 혼합한 것) 1.3 g) 한천 배지(2% 아가) 및 SG-Leu(1 ℓ당, Yeast nitrogen base w/o amino acids(DIFCO) 6.7 g, 갈락토오스 20 g, 아미노산 파우더(아데닌황산염 1.25 g, 아르기닌 0.6 g, 아스파라긴산 3 g, 글루타민산 3 g, 히스티딘 0.6 g, 리신 0.9 g, 메티오닌 0.6 g, 페닐알라닌 1.5 g, 세린 11.25 g, 티로신 0.9 g, 발린 4.5 g, 트레오닌 6 g, 트립토판 1.2 g, 우라실 0.6 g을 혼합한 것) 1.3 g) 한천 배지(2% 아가)에 복제하고, 30℃에서 3일간 인큐베이트하여, 우라실 요구성과 류신 요구성을 조사했다. 우라실 요구성을 보이는 경우, 도입한 플라스미드가 탈락한 것으로 생각되었기 때문에, 이하의 해석에서는 제외했다.
C-D주로부터 분리한 4개의 자낭 포자 중, YPGal 한천 배지 상에서 생육할 수 있었던 것은 모두 2개로, 모든 주가 류신 요구성이었다. 한편, MaGPAT4-long-D주와 MaGPAT4-D주로부터 분리한 4개의 자낭 포자는 어느 것이나 4개 모두 YPGal 한천 배지 상에서 생육할 수 있었다. 류신 요구성을 조사한 바, 류신 요구성의 주와 류신 비요구성의 주가 각각 2개씩이었다.
얻어진 주의 유전자형을 조사하기 위해서, 균체로부터 전술한 대로 DNA를 추출하여, (a) 프라이머 SCT1outORF-F와 프라이머 SCT1inORF-R, (b) 프라이머 SCT1outORF-F와 프라이머 LEU2in ORF-F의 조합으로 PCR을 실시했다. 그 결과, 류신 비요구성의 주에서는 (a)에서는 PCR에 의한 증폭이 보이지 않고 (b)에서는 증폭이 보였으므로, 이들 주는 Δsct1:LEU2 대립인자를 갖는 주임을 확인할 수 있었다. 또한, 류신 요구성의 주에서는 (a)에서는 PCR에 의한 증폭이 보이고 (b)에서는 증폭이 보이지 않았기 때문에, 이들 주는 SCT1 대립인자를 갖는 주임을 확인할 수 있었다.
또한, MaGPAT4-long-D주와 MaGPAT4-D주로부터 분리한 4개의 자낭 포자에서 유래하는 주를 YPD 한천 배지 상에 도포하면, 생육이 좋은 주와 현저히 생육이 나쁜 주가 각각 2개씩이며, 생육이 나쁜 주는 Δsct1:LEU2 대립인자를 갖는 류신 비요구성의 주와 일치하고 있었다.
이로부터, 효모의 GPAT 활성을 담당하는 2개의 유전자를 파괴한 Δsct1, Δgpt2주는 치사에 이르지만, MaGPAT4-long 혹은 MaGPAT4를 발현시킴으로써 생육이 가능하게 되는 것을 확인할 수 있었다. 즉, MaGPAT4-long 단백질 및 MaGPAT4 단백질은 GPAT 활성을 갖는 것이 강하게 시사되었다.
실시예
8 :
모르티에렐라
알피나에
있어서의
GPAT4
의 과잉 발현
(1) M.
alpina
용 발현 벡터의 구축
GPAT4를 M. alpina로 발현시키기 위해서 다음과 같이 벡터를 구축했다.
우선, 벡터 pUC18을 제한 효소 EcoRI와 HindIII로 소화하고, 올리고DNA MCS-for-pUC18-F2와 MCS-for-pUC18-R2를 어닐링시킨 어댑터를 삽입하여, 플라스미드 pUC18-RF2를 구축했다.
M. alpina의 게놈을 주형으로 하고, 프라이머 Not1-GAPDHt-F와 프라이머 EcoR1-Asc1-GAPDHt-R을 사용하여, KOD-plus-(TOYOBO)를 이용한 PCR로 증폭한 약 0.5 kbp의 DNA 단편을 Zero Blunt TOPO PCR Cloning Kit(인비트로젠)로 클론화했다. 인서트 부분의 염기 서열을 확인한 후, 제한 효소 NotI와 EcoRI로 소화하여 얻어진 약 0.9 kbp의 DNA 단편을 플라스미드 pUC18-RF2의 NotI, EcoRI 사이트에 삽입하여, 플라스미드 pDG-1을 구축했다.
M. alpina의 게놈을 주형으로 하고, 프라이머 URA5g-F1과 프라이머 URA5g-R1을 사용하여, KOD-plus-(TOYOBO)를 이용한 PCR로 증폭한 DNA 단편을 Zero Blunt TOPO PCR Cloning Kit(인비트로젠)로 클론화했다. 인서트 부분의 염기 서열을 확인한 후, 제한 효소 SalI로 소화하여 얻어진 약 2 kbp의 DNA 단편을 플라스미드 pDG-1의 SalI 사이트에 삽입하여, URA5 유전자의 5' 측이 벡터의 EcoRI 측으로 되는 방향으로 삽입된 것을 플라스미드 pDuraG로 했다.
이어서, M. alpina의 게놈을 주형 프라이머 hisHp+URA5-F와 프라이머 hisHp+MGt-F를 사용하여, KOD-plus-(TOYOBO)를 이용한 PCR로 증폭한 약 1.0 kbp의 DNA 단편과, pDuraG를 주형으로 하고, 프라이머 pDuraSC-GAPt-F와 프라이머 URA5gDNA-F를 사용하여, KOD-plus-(TOYOBO)를 이용한 PCR로 증폭한 약 5.3 kbp의 DNA 단편을 In-Fusion(등록상표) Advantage PCR Cloning Kit(타카라바이오)를 사용하여 연결하여, 플라스미드 pDUra-RhG를 얻었다.
플라스미드 pDUra-RhG를 주형으로 하고, 프라이머 pDuraSC-GAPt-F와 프라이머 pDurahG-hisp-R를 사용하여, KOD-plus-(TOYOBO)를 이용한 PCR로 약 6.3 kbp의 DNA 단편을 증폭했다.
플라스미드 pCR-MaGPAT4-1을 주형으로 하고, 프라이머 MaGPAT4+hisp-F와 프라이머 MaGPAT4+MGt-R을 사용하여, KOD-plus-(TOYOBO)를 이용한 PCR로 약 2.5 kbp의 DNA 단편을 증폭했다.
얻어진 2.5 kbp 단편을 상기 6.3 kbp의 DNA 단편과, In-Fusion(등록상표) Advantage PCR Cloning Kit(타카라바이오)를 사용하여 연결하여, 플라스미드 pDUraRhG-GPAT4를 얻었다.
(2) M.
alpina
형질전환주의 취득
특허문헌(WO2005/019437, 발명의 명칭 : 「지질 생산균의 육종 방법」)에 기재된 방법에 따라서 M. alpina 1S-4주로부터 유도한 우라실 요구성의 주 Δura-3을 숙주로 하여 파티클 딜리버리법으로, 플라스미드 pDUraRhG-GPAT4를 이용하여, 각각 형질전환을 했다. 형질전환주의 선택에는, SC 한천 배지(Yeast Nitrogen Base w/o Amino Acids and Ammonium Sulfate(Difco) 0.5%, 황산암모늄 0.17%, 글루코오스 2%, 아데닌 0.002%, 티로신 0.003%, 메티오닌 0.0001%, 아르기닌 0.0002%, 히스티딘 0.0002%, 리신 0.0004%, 트립토판 0.0004%, 트레오닌 0.0005%, 이소류신 0.0006%, 류신 0.0006%, 페닐알라닌 0.0006%, 한천 2%)를 이용했다.
(3) 형질전환 M. alpina의 평가
얻어진 형질전환주를, GY 배지 4 ml에 식균하여, 28℃에서 2일간 진탕 배양을 했다. 균체를 여과에 의해 회수하고, RNeasy plant kit(QIAGEN)를 이용하여 RNA를 추출했다. 수퍼스크립트 퍼스트 스트랜드 시스템 for RT-PCR(인비트로젠)에 의해 cDNA를 합성했다. 도입한 컨스트럭트로부터의 각 유전자의 발현을 확인하기 위해서, 이하의 프라이머 조합으로 RT-PCR을 실시했다.
과잉 발현을 확인할 수 있었던 주 중, 1주에 대해서, GY 배지(글루코오스 2%, 효모 엑기스 1%) 10 ml에 식균하여, 28℃, 300 rpm으로 3일간 진탕 배양했다. 이것을 GY 배지 500 ml(2 L 사카구치 플라스크)에 전량 옮겨, 28℃, 120 rpm으로 진탕 배양했다. 이로부터 3일 후, 7일 후, 10일 후, 12일 후에 각각 5 ml, 10 ml 씩 분취하여, 여과했다. 균체를 120℃에서 건조시켜, 염산 메탄올법에 의해 지방산을 메틸에스테르로 유도하고, 가스 크로마토그래피에 의해 지방산 분석을 했다. 건조 균체당 아라키돈산 생산량의 시간 경과에 따른 변화를 조사했다. 한편, 형질전환의 숙주인 Δura-3주를 컨트롤로 했다. 결과를 도 9에 도시한다.
GPAT4를 M. alpina로 과잉 발현시킨 경우, 균체당 아라키돈산(AA)량이 컨트롤에 비해서 증가하고 있었다.
서열목록 프리텍스트
서열 번호 16 : 프라이머 GPAT4-S
서열 번호 17 : 프라이머 SacI-GPAT4-1
서열 번호 18 : 프라이머 Sal-GPAT4-2
서열 번호 19 : 프라이머 GPAT5-1F
서열 번호 20 : 프라이머 GPAT5-3R
서열 번호 26 : 프라이머 Eco-MaGPAT3-F
서열 번호 27 : 프라이머 Sal-MaGPAT3-R
서열 번호 28 : 프라이머 Not-MaGPAT4-F1
서열 번호 29 : 프라이머 Not-MaGPAT4-F2
서열 번호 30 : 프라이머 Bam-MaGPAT4-R
서열 번호 31 : 프라이머 Xba1-Des-SCT1-F
서열 번호 32 : 프라이머 Xba1-Des-SCT1-R
서열 번호 33 : 프라이머 SCT1outORF-F
서열 번호 34 : 프라이머 SCT1inORF-R
서열 번호 35 : 프라이머 LEU2inORF-F
서열 번호 36 : 올리고DNA MCS-for-pUC18-F2
서열 번호 37 : 올리고DNA MCS-for-pUC18-R2
서열 번호 38 : 프라이머 Not1-GAPDHt-F
서열 번호 39 : 프라이머 EcoR1-Asc1-GAPDHt-R
서열 번호 40 : 프라이머 URA5g-F1
서열 번호 41 : 프라이머 URA5g-R1
서열 번호 42 : 프라이머 hisHp+URA5-F
서열 번호 43 : 프라이머 hisHp+MGt-F
서열 번호 44 : 프라이머 pDuraSC-GAPt-F
서열 번호 45 : 프라이머 URA5gDNA-F
서열 번호 46 : 프라이머 pDurahG-hisp-R
서열 번호 47 : 프라이머 MaGPAT4+hisp-F
서열 번호 48 : 프라이머 MaGPAT4+MGt-R
서열 번호 49 : 프라이머 GPAT4-RT1
서열 번호 50 : 프라이머 GPAT4-RT2
SEQUENCE LISTING
<110> Suntory Holdings, Ltd.
<120> Glycerol-3-phosphate acyltransferase homologue and use thereof
<130> FA0008-11002
<140> PCT/JP2011/052258
<141> 2011-02-03
<150> JP 2010-22125
<151> 2010-02-03
<160> 50
<170> PatentIn version 3.1
<210> 1
<211> 2475
<212> DNA
<213> Mortierella alpina
<220>
<221> CDS
<222> (1)..(2475)
<223>
<400> 1
atg ccc atc gtt cca gct cag caa gtc gac tcc tcc tcg tgc cct ccc 48
Met Pro Ile Val Pro Ala Gln Gln Val Asp Ser Ser Ser Cys Pro Pro
1 5 10 15
tct ggt gaa tct agc ccg ttg att ccc agt ttg ggc gaa gga gtg cat 96
Ser Gly Glu Ser Ser Pro Leu Ile Pro Ser Leu Gly Glu Gly Val His
20 25 30
tcg ggt cat gga cac gtt gtc gac aat gac gag tcc ggc gtg gag aac 144
Ser Gly His Gly His Val Val Asp Asn Asp Glu Ser Gly Val Glu Asn
35 40 45
att acc aaa aag cac gca gga cga att aga gaa gat ccg gtc ggc ttc 192
Ile Thr Lys Lys His Ala Gly Arg Ile Arg Glu Asp Pro Val Gly Phe
50 55 60
gtg gtg cag act gca gct ttc tat cag ggc acg ggt tgg aga agc tac 240
Val Val Gln Thr Ala Ala Phe Tyr Gln Gly Thr Gly Trp Arg Ser Tyr
65 70 75 80
agc aac tat gtt gga acg cgc att ctt tac gaa ggc ttc tct gca acc 288
Ser Asn Tyr Val Gly Thr Arg Ile Leu Tyr Glu Gly Phe Ser Ala Thr
85 90 95
ttc aag gag cga att ctc gcc agt tca aaa gtg aat gat ctc atc aag 336
Phe Lys Glu Arg Ile Leu Ala Ser Ser Lys Val Asn Asp Leu Ile Lys
100 105 110
gac atg gcc aac aag cag ttg gat gtc ctg atc aag caa aga caa gat 384
Asp Met Ala Asn Lys Gln Leu Asp Val Leu Ile Lys Gln Arg Gln Asp
115 120 125
gcg tat gac gca gag agg act gca aat gca gga aaa aag aac ttc aag 432
Ala Tyr Asp Ala Glu Arg Thr Ala Asn Ala Gly Lys Lys Asn Phe Lys
130 135 140
ccc aaa gtt cga ctc ctt cgc cca gaa gat atc gag gct cgt cgc aaa 480
Pro Lys Val Arg Leu Leu Arg Pro Glu Asp Ile Glu Ala Arg Arg Lys
145 150 155 160
aca tta gaa gcc gag ctt gtt gcg gtg gca aag tca aat atc gac aaa 528
Thr Leu Glu Ala Glu Leu Val Ala Val Ala Lys Ser Asn Ile Asp Lys
165 170 175
ctt gtt tgt gat atg aac agt atg aaa ttc atc agg ttc ttc gcc ttc 576
Leu Val Cys Asp Met Asn Ser Met Lys Phe Ile Arg Phe Phe Ala Phe
180 185 190
ctc atc aac aac atc ctt gtg aga atg tac cat caa gga att cac atc 624
Leu Ile Asn Asn Ile Leu Val Arg Met Tyr His Gln Gly Ile His Ile
195 200 205
aag gag tcc gag ttc ttg gag ctg cgg agg ata gct gag tac tgc gca 672
Lys Glu Ser Glu Phe Leu Glu Leu Arg Arg Ile Ala Glu Tyr Cys Ala
210 215 220
gag aaa aag tat tcg atg gtg gtg ttg cca tgc cac aag tca cac atc 720
Glu Lys Lys Tyr Ser Met Val Val Leu Pro Cys His Lys Ser His Ile
225 230 235 240
gac tac ctc gtc gtc tcg tac att ttc ttc cgc atg gga tta gct tta 768
Asp Tyr Leu Val Val Ser Tyr Ile Phe Phe Arg Met Gly Leu Ala Leu
245 250 255
cct cac att gct gct ggc gat aac ctg gac atg ccc att gtc gga aag 816
Pro His Ile Ala Ala Gly Asp Asn Leu Asp Met Pro Ile Val Gly Lys
260 265 270
gca ctc aaa gga gca ggc gcg ttc ttc att cgc cgt tct tgg gct gac 864
Ala Leu Lys Gly Ala Gly Ala Phe Phe Ile Arg Arg Ser Trp Ala Asp
275 280 285
gat caa ctt tac acc agc att gtt cag gaa tat gtt cag gag ctt ttg 912
Asp Gln Leu Tyr Thr Ser Ile Val Gln Glu Tyr Val Gln Glu Leu Leu
290 295 300
gag gga gga tac aat atc gag tgc ttc atc gag ggc acc cga agc aga 960
Glu Gly Gly Tyr Asn Ile Glu Cys Phe Ile Glu Gly Thr Arg Ser Arg
305 310 315 320
aca gga aaa ctt ttg cca cca aag ctg gga gtc cta aag att atc atg 1008
Thr Gly Lys Leu Leu Pro Pro Lys Leu Gly Val Leu Lys Ile Ile Met
325 330 335
gat gct atg ctt tcg aac cgc atc caa gac tgc tac atc gtg ccc atc 1056
Asp Ala Met Leu Ser Asn Arg Ile Gln Asp Cys Tyr Ile Val Pro Ile
340 345 350
tct atc ggt tat gac aag gtc atc gaa acc gag act tat atc aat gag 1104
Ser Ile Gly Tyr Asp Lys Val Ile Glu Thr Glu Thr Tyr Ile Asn Glu
355 360 365
ctt ctc gga atc ccc aag gaa aag gag agt ttg tgg ggt gtt att acg 1152
Leu Leu Gly Ile Pro Lys Glu Lys Glu Ser Leu Trp Gly Val Ile Thr
370 375 380
aat tcg agg ctg ctc cag ctc aag atg ggc cgc att gat gtc cga ttt 1200
Asn Ser Arg Leu Leu Gln Leu Lys Met Gly Arg Ile Asp Val Arg Phe
385 390 395 400
gca aag ccg tac agt ttg cga aac ttt atg aat cat gag atc gag cgc 1248
Ala Lys Pro Tyr Ser Leu Arg Asn Phe Met Asn His Glu Ile Glu Arg
405 410 415
aga gag atc atc aat aag cgg gaa gac acc gat agt gtg gcg aaa tct 1296
Arg Glu Ile Ile Asn Lys Arg Glu Asp Thr Asp Ser Val Ala Lys Ser
420 425 430
cag ctg cta aag gca ttg ggc tac aag gtc ttg gca gac atc aac tcg 1344
Gln Leu Leu Lys Ala Leu Gly Tyr Lys Val Leu Ala Asp Ile Asn Ser
435 440 445
gtc tct gta gta atg ccc acg gcc ctc gtg ggt act gtc atc ctt aca 1392
Val Ser Val Val Met Pro Thr Ala Leu Val Gly Thr Val Ile Leu Thr
450 455 460
ctc cga gga cga ggt gtt ggc cgt aat gag ctg atc cgt cgt gtt gag 1440
Leu Arg Gly Arg Gly Val Gly Arg Asn Glu Leu Ile Arg Arg Val Glu
465 470 475 480
tgg ctg aag cgc gag att ctt tcc aag ggt ggt cgc gtt gcc aac ttt 1488
Trp Leu Lys Arg Glu Ile Leu Ser Lys Gly Gly Arg Val Ala Asn Phe
485 490 495
agc ggg atg gaa act ggc gag gtt gta gat cga gca ttg ggc gtt ctt 1536
Ser Gly Met Glu Thr Gly Glu Val Val Asp Arg Ala Leu Gly Val Leu
500 505 510
aag gac ctt gtg gcg ctg cag aag aat ttg ctc gag ccc gtc ttc tat 1584
Lys Asp Leu Val Ala Leu Gln Lys Asn Leu Leu Glu Pro Val Phe Tyr
515 520 525
gcg gtc aag cgc ttc gag ctt tcg ttc tac agg aat cag ctc atc cac 1632
Ala Val Lys Arg Phe Glu Leu Ser Phe Tyr Arg Asn Gln Leu Ile His
530 535 540
ctc ttt gtc cat gag gcc atc atc gcc gtg acg atg tac acc cgc atc 1680
Leu Phe Val His Glu Ala Ile Ile Ala Val Thr Met Tyr Thr Arg Ile
545 550 555 560
aag att ggt ggc gcc aag tct aca caa cac att agt cag aat gag ctg 1728
Lys Ile Gly Gly Ala Lys Ser Thr Gln His Ile Ser Gln Asn Glu Leu
565 570 575
ctg aac gag gtc acc ttc ctg agc cgc ctg ctc aag acc gac ttt atc 1776
Leu Asn Glu Val Thr Phe Leu Ser Arg Leu Leu Lys Thr Asp Phe Ile
580 585 590
tac aac cct ggc gat att gag agt aac ttg gag cat aca ttg gat tac 1824
Tyr Asn Pro Gly Asp Ile Glu Ser Asn Leu Glu His Thr Leu Asp Tyr
595 600 605
ctc aag aaa tcc aat gtg atc gag gtt gac agt gaa gga tat gtc gga 1872
Leu Lys Lys Ser Asn Val Ile Glu Val Asp Ser Glu Gly Tyr Val Gly
610 615 620
ctc tct gat gct gaa cgc agc aag ggc cga gag aac tat gac ttt tat 1920
Leu Ser Asp Ala Glu Arg Ser Lys Gly Arg Glu Asn Tyr Asp Phe Tyr
625 630 635 640
tgt ttc ctg ctc tgg ccc ttc gtg gag aca tac tgg ctc gca gcc gtg 1968
Cys Phe Leu Leu Trp Pro Phe Val Glu Thr Tyr Trp Leu Ala Ala Val
645 650 655
tcc ctg tat acc ctg att ccc acc gcc aaa gag ttg act cag cag ttg 2016
Ser Leu Tyr Thr Leu Ile Pro Thr Ala Lys Glu Leu Thr Gln Gln Leu
660 665 670
gac agc aac gga gag cct cag gtt cac tgg gtt gag gag cgc gtg ttc 2064
Asp Ser Asn Gly Glu Pro Gln Val His Trp Val Glu Glu Arg Val Phe
675 680 685
atg gag aag acg caa atg ttc gga aag acg ctt tac tac cag gga gac 2112
Met Glu Lys Thr Gln Met Phe Gly Lys Thr Leu Tyr Tyr Gln Gly Asp
690 695 700
ctc tcc tac ttt gag tct gtc aac atg gag acg ctc aag aat ggt ttt 2160
Leu Ser Tyr Phe Glu Ser Val Asn Met Glu Thr Leu Lys Asn Gly Phe
705 710 715 720
aat cgt ctg tgc gat tat ggc atc ctt atg atg aag cga ccc acc aat 2208
Asn Arg Leu Cys Asp Tyr Gly Ile Leu Met Met Lys Arg Pro Thr Asn
725 730 735
gcc aag gag aag aca aag gtt gct ctc cac cct gat ttt atg cca agc 2256
Ala Lys Glu Lys Thr Lys Val Ala Leu His Pro Asp Phe Met Pro Ser
740 745 750
cga ggt gct gac ggt cat gtc att gcc agc ggc gca ctt tgg gat atg 2304
Arg Gly Ala Asp Gly His Val Ile Ala Ser Gly Ala Leu Trp Asp Met
755 760 765
gtc gaa cat atc ggc acg ttc aga cgt gaa ggc aag aat cgt cgt gat 2352
Val Glu His Ile Gly Thr Phe Arg Arg Glu Gly Lys Asn Arg Arg Asp
770 775 780
aac gcc aca gtt tcc tcc cgt gtc ctg cgg ttt gca gag gtc gtc gcg 2400
Asn Ala Thr Val Ser Ser Arg Val Leu Arg Phe Ala Glu Val Val Ala
785 790 795 800
aac gct cca gct ccg gtt aag gta ccc ttg ccc aat ccg gca ccc aaa 2448
Asn Ala Pro Ala Pro Val Lys Val Pro Leu Pro Asn Pro Ala Pro Lys
805 810 815
agg aca ggc gat ggc gcc ccg aaa tta 2475
Arg Thr Gly Asp Gly Ala Pro Lys Leu
820 825
<210> 2
<211> 825
<212> PRT
<213> Mortierella alpina
<400> 2
Met Pro Ile Val Pro Ala Gln Gln Val Asp Ser Ser Ser Cys Pro Pro
1 5 10 15
Ser Gly Glu Ser Ser Pro Leu Ile Pro Ser Leu Gly Glu Gly Val His
20 25 30
Ser Gly His Gly His Val Val Asp Asn Asp Glu Ser Gly Val Glu Asn
35 40 45
Ile Thr Lys Lys His Ala Gly Arg Ile Arg Glu Asp Pro Val Gly Phe
50 55 60
Val Val Gln Thr Ala Ala Phe Tyr Gln Gly Thr Gly Trp Arg Ser Tyr
65 70 75 80
Ser Asn Tyr Val Gly Thr Arg Ile Leu Tyr Glu Gly Phe Ser Ala Thr
85 90 95
Phe Lys Glu Arg Ile Leu Ala Ser Ser Lys Val Asn Asp Leu Ile Lys
100 105 110
Asp Met Ala Asn Lys Gln Leu Asp Val Leu Ile Lys Gln Arg Gln Asp
115 120 125
Ala Tyr Asp Ala Glu Arg Thr Ala Asn Ala Gly Lys Lys Asn Phe Lys
130 135 140
Pro Lys Val Arg Leu Leu Arg Pro Glu Asp Ile Glu Ala Arg Arg Lys
145 150 155 160
Thr Leu Glu Ala Glu Leu Val Ala Val Ala Lys Ser Asn Ile Asp Lys
165 170 175
Leu Val Cys Asp Met Asn Ser Met Lys Phe Ile Arg Phe Phe Ala Phe
180 185 190
Leu Ile Asn Asn Ile Leu Val Arg Met Tyr His Gln Gly Ile His Ile
195 200 205
Lys Glu Ser Glu Phe Leu Glu Leu Arg Arg Ile Ala Glu Tyr Cys Ala
210 215 220
Glu Lys Lys Tyr Ser Met Val Val Leu Pro Cys His Lys Ser His Ile
225 230 235 240
Asp Tyr Leu Val Val Ser Tyr Ile Phe Phe Arg Met Gly Leu Ala Leu
245 250 255
Pro His Ile Ala Ala Gly Asp Asn Leu Asp Met Pro Ile Val Gly Lys
260 265 270
Ala Leu Lys Gly Ala Gly Ala Phe Phe Ile Arg Arg Ser Trp Ala Asp
275 280 285
Asp Gln Leu Tyr Thr Ser Ile Val Gln Glu Tyr Val Gln Glu Leu Leu
290 295 300
Glu Gly Gly Tyr Asn Ile Glu Cys Phe Ile Glu Gly Thr Arg Ser Arg
305 310 315 320
Thr Gly Lys Leu Leu Pro Pro Lys Leu Gly Val Leu Lys Ile Ile Met
325 330 335
Asp Ala Met Leu Ser Asn Arg Ile Gln Asp Cys Tyr Ile Val Pro Ile
340 345 350
Ser Ile Gly Tyr Asp Lys Val Ile Glu Thr Glu Thr Tyr Ile Asn Glu
355 360 365
Leu Leu Gly Ile Pro Lys Glu Lys Glu Ser Leu Trp Gly Val Ile Thr
370 375 380
Asn Ser Arg Leu Leu Gln Leu Lys Met Gly Arg Ile Asp Val Arg Phe
385 390 395 400
Ala Lys Pro Tyr Ser Leu Arg Asn Phe Met Asn His Glu Ile Glu Arg
405 410 415
Arg Glu Ile Ile Asn Lys Arg Glu Asp Thr Asp Ser Val Ala Lys Ser
420 425 430
Gln Leu Leu Lys Ala Leu Gly Tyr Lys Val Leu Ala Asp Ile Asn Ser
435 440 445
Val Ser Val Val Met Pro Thr Ala Leu Val Gly Thr Val Ile Leu Thr
450 455 460
Leu Arg Gly Arg Gly Val Gly Arg Asn Glu Leu Ile Arg Arg Val Glu
465 470 475 480
Trp Leu Lys Arg Glu Ile Leu Ser Lys Gly Gly Arg Val Ala Asn Phe
485 490 495
Ser Gly Met Glu Thr Gly Glu Val Val Asp Arg Ala Leu Gly Val Leu
500 505 510
Lys Asp Leu Val Ala Leu Gln Lys Asn Leu Leu Glu Pro Val Phe Tyr
515 520 525
Ala Val Lys Arg Phe Glu Leu Ser Phe Tyr Arg Asn Gln Leu Ile His
530 535 540
Leu Phe Val His Glu Ala Ile Ile Ala Val Thr Met Tyr Thr Arg Ile
545 550 555 560
Lys Ile Gly Gly Ala Lys Ser Thr Gln His Ile Ser Gln Asn Glu Leu
565 570 575
Leu Asn Glu Val Thr Phe Leu Ser Arg Leu Leu Lys Thr Asp Phe Ile
580 585 590
Tyr Asn Pro Gly Asp Ile Glu Ser Asn Leu Glu His Thr Leu Asp Tyr
595 600 605
Leu Lys Lys Ser Asn Val Ile Glu Val Asp Ser Glu Gly Tyr Val Gly
610 615 620
Leu Ser Asp Ala Glu Arg Ser Lys Gly Arg Glu Asn Tyr Asp Phe Tyr
625 630 635 640
Cys Phe Leu Leu Trp Pro Phe Val Glu Thr Tyr Trp Leu Ala Ala Val
645 650 655
Ser Leu Tyr Thr Leu Ile Pro Thr Ala Lys Glu Leu Thr Gln Gln Leu
660 665 670
Asp Ser Asn Gly Glu Pro Gln Val His Trp Val Glu Glu Arg Val Phe
675 680 685
Met Glu Lys Thr Gln Met Phe Gly Lys Thr Leu Tyr Tyr Gln Gly Asp
690 695 700
Leu Ser Tyr Phe Glu Ser Val Asn Met Glu Thr Leu Lys Asn Gly Phe
705 710 715 720
Asn Arg Leu Cys Asp Tyr Gly Ile Leu Met Met Lys Arg Pro Thr Asn
725 730 735
Ala Lys Glu Lys Thr Lys Val Ala Leu His Pro Asp Phe Met Pro Ser
740 745 750
Arg Gly Ala Asp Gly His Val Ile Ala Ser Gly Ala Leu Trp Asp Met
755 760 765
Val Glu His Ile Gly Thr Phe Arg Arg Glu Gly Lys Asn Arg Arg Asp
770 775 780
Asn Ala Thr Val Ser Ser Arg Val Leu Arg Phe Ala Glu Val Val Ala
785 790 795 800
Asn Ala Pro Ala Pro Val Lys Val Pro Leu Pro Asn Pro Ala Pro Lys
805 810 815
Arg Thr Gly Asp Gly Ala Pro Lys Leu
820 825
<210> 3
<211> 2478
<212> DNA
<213> Mortierella alpina
<400> 3
atgcccatcg ttccagctca gcaagtcgac tcctcctcgt gccctccctc tggtgaatct 60
agcccgttga ttcccagttt gggcgaagga gtgcattcgg gtcatggaca cgttgtcgac 120
aatgacgagt ccggcgtgga gaacattacc aaaaagcacg caggacgaat tagagaagat 180
ccggtcggct tcgtggtgca gactgcagct ttctatcagg gcacgggttg gagaagctac 240
agcaactatg ttggaacgcg cattctttac gaaggcttct ctgcaacctt caaggagcga 300
attctcgcca gttcaaaagt gaatgatctc atcaaggaca tggccaacaa gcagttggat 360
gtcctgatca agcaaagaca agatgcgtat gacgcagaga ggactgcaaa tgcaggaaaa 420
aagaacttca agcccaaagt tcgactcctt cgcccagaag atatcgaggc tcgtcgcaaa 480
acattagaag ccgagcttgt tgcggtggca aagtcaaata tcgacaaact tgtttgtgat 540
atgaacagta tgaaattcat caggttcttc gccttcctca tcaacaacat ccttgtgaga 600
atgtaccatc aaggaattca catcaaggag tccgagttct tggagctgcg gaggatagct 660
gagtactgcg cagagaaaaa gtattcgatg gtggtgttgc catgccacaa gtcacacatc 720
gactacctcg tcgtctcgta cattttcttc cgcatgggat tagctttacc tcacattgct 780
gctggcgata acctggacat gcccattgtc ggaaaggcac tcaaaggagc aggcgcgttc 840
ttcattcgcc gttcttgggc tgacgatcaa ctttacacca gcattgttca ggaatatgtt 900
caggagcttt tggagggagg atacaatatc gagtgcttca tcgagggcac ccgaagcaga 960
acaggaaaac ttttgccacc aaagctggga gtcctaaaga ttatcatgga tgctatgctt 1020
tcgaaccgca tccaagactg ctacatcgtg cccatctcta tcggttatga caaggtcatc 1080
gaaaccgaga cttatatcaa tgagcttctc ggaatcccca aggaaaagga gagtttgtgg 1140
ggtgttatta cgaattcgag gctgctccag ctcaagatgg gccgcattga tgtccgattt 1200
gcaaagccgt acagtttgcg aaactttatg aatcatgaga tcgagcgcag agagatcatc 1260
aataagcggg aagacaccga tagtgtggcg aaatctcagc tgctaaaggc attgggctac 1320
aaggtcttgg cagacatcaa ctcggtctct gtagtaatgc ccacggccct cgtgggtact 1380
gtcatcctta cactccgagg acgaggtgtt ggccgtaatg agctgatccg tcgtgttgag 1440
tggctgaagc gcgagattct ttccaagggt ggtcgcgttg ccaactttag cgggatggaa 1500
actggcgagg ttgtagatcg agcattgggc gttcttaagg accttgtggc gctgcagaag 1560
aatttgctcg agcccgtctt ctatgcggtc aagcgcttcg agctttcgtt ctacaggaat 1620
cagctcatcc acctctttgt ccatgaggcc atcatcgccg tgacgatgta cacccgcatc 1680
aagattggtg gcgccaagtc tacacaacac attagtcaga atgagctgct gaacgaggtc 1740
accttcctga gccgcctgct caagaccgac tttatctaca accctggcga tattgagagt 1800
aacttggagc atacattgga ttacctcaag aaatccaatg tgatcgaggt tgacagtgaa 1860
ggatatgtcg gactctctga tgctgaacgc agcaagggcc gagagaacta tgacttttat 1920
tgtttcctgc tctggccctt cgtggagaca tactggctcg cagccgtgtc cctgtatacc 1980
ctgattccca ccgccaaaga gttgactcag cagttggaca gcaacggaga gcctcaggtt 2040
cactgggttg aggagcgcgt gttcatggag aagacgcaaa tgttcggaaa gacgctttac 2100
taccagggag acctctccta ctttgagtct gtcaacatgg agacgctcaa gaatggtttt 2160
aatcgtctgt gcgattatgg catccttatg atgaagcgac ccaccaatgc caaggagaag 2220
acaaaggttg ctctccaccc tgattttatg ccaagccgag gtgctgacgg tcatgtcatt 2280
gccagcggcg cactttggga tatggtcgaa catatcggca cgttcagacg tgaaggcaag 2340
aatcgtcgtg ataacgccac agtttcctcc cgtgtcctgc ggtttgcaga ggtcgtcgcg 2400
aacgctccag ctccggttaa ggtacccttg cccaatccgg cacccaaaag gacaggcgat 2460
ggcgccccga aattataa 2478
<210> 4
<211> 2643
<212> DNA
<213> Mortierella alpina
<220>
<221> CDS
<222> (1)..(2643)
<223>
<400> 4
atg aca acc ggc gac agt acc gct gct gac ggt agc agc agc agt agc 48
Met Thr Thr Gly Asp Ser Thr Ala Ala Asp Gly Ser Ser Ser Ser Ser
1 5 10 15
agc aac aac agc acc aac att gcc agt act agt aac ggc aag gct gct 96
Ser Asn Asn Ser Thr Asn Ile Ala Ser Thr Ser Asn Gly Lys Ala Ala
20 25 30
ccc cac cca ctc caa ggg gga tca ccc gct cct gta gct cca gtt ttg 144
Pro His Pro Leu Gln Gly Gly Ser Pro Ala Pro Val Ala Pro Val Leu
35 40 45
gaa ttg aag cct ctc aag aat gtt atg ccc atc gtt cca gct cag caa 192
Glu Leu Lys Pro Leu Lys Asn Val Met Pro Ile Val Pro Ala Gln Gln
50 55 60
gtc gac tcc tcc tcg tgc cct ccc tct ggt gaa tct agc ccg ttg att 240
Val Asp Ser Ser Ser Cys Pro Pro Ser Gly Glu Ser Ser Pro Leu Ile
65 70 75 80
ccc agt ttg ggc gaa gga gtg cat tcg ggt cat gga cac gtt gtc gac 288
Pro Ser Leu Gly Glu Gly Val His Ser Gly His Gly His Val Val Asp
85 90 95
aat gac gag tcc ggc gtg gag aac att acc aaa aag cac gca gga cga 336
Asn Asp Glu Ser Gly Val Glu Asn Ile Thr Lys Lys His Ala Gly Arg
100 105 110
att aga gaa gat ccg gtc ggc ttc gtg gtg cag act gca gct ttc tat 384
Ile Arg Glu Asp Pro Val Gly Phe Val Val Gln Thr Ala Ala Phe Tyr
115 120 125
cag ggc acg ggt tgg aga agc tac agc aac tat gtt gga acg cgc att 432
Gln Gly Thr Gly Trp Arg Ser Tyr Ser Asn Tyr Val Gly Thr Arg Ile
130 135 140
ctt tac gaa ggc ttc tct gca acc ttc aag gag cga att ctc gcc agt 480
Leu Tyr Glu Gly Phe Ser Ala Thr Phe Lys Glu Arg Ile Leu Ala Ser
145 150 155 160
tca aaa gtg aat gat ctc atc aag gac atg gcc aac aag cag ttg gat 528
Ser Lys Val Asn Asp Leu Ile Lys Asp Met Ala Asn Lys Gln Leu Asp
165 170 175
gtc ctg atc aag caa aga caa gat gcg tat gac gca gag agg act gca 576
Val Leu Ile Lys Gln Arg Gln Asp Ala Tyr Asp Ala Glu Arg Thr Ala
180 185 190
aat gca gga aaa aag aac ttc aag ccc aaa gtt cga ctc ctt cgc cca 624
Asn Ala Gly Lys Lys Asn Phe Lys Pro Lys Val Arg Leu Leu Arg Pro
195 200 205
gaa gat atc gag gct cgt cgc aaa aca tta gaa gcc gag ctt gtt gcg 672
Glu Asp Ile Glu Ala Arg Arg Lys Thr Leu Glu Ala Glu Leu Val Ala
210 215 220
gtg gca aag tca aat atc gac aaa ctt gtt tgt gat atg aac agt atg 720
Val Ala Lys Ser Asn Ile Asp Lys Leu Val Cys Asp Met Asn Ser Met
225 230 235 240
aaa ttc atc agg ttc ttc gcc ttc ctc atc aac aac atc ctt gtg aga 768
Lys Phe Ile Arg Phe Phe Ala Phe Leu Ile Asn Asn Ile Leu Val Arg
245 250 255
atg tac cat caa gga att cac atc aag gag tcc gag ttc ttg gag ctg 816
Met Tyr His Gln Gly Ile His Ile Lys Glu Ser Glu Phe Leu Glu Leu
260 265 270
cgg agg ata gct gag tac tgc gca gag aaa aag tat tcg atg gtg gtg 864
Arg Arg Ile Ala Glu Tyr Cys Ala Glu Lys Lys Tyr Ser Met Val Val
275 280 285
ttg cca tgc cac aag tca cac atc gac tac ctc gtc gtc tcg tac att 912
Leu Pro Cys His Lys Ser His Ile Asp Tyr Leu Val Val Ser Tyr Ile
290 295 300
ttc ttc cgc atg gga tta gct tta cct cac att gct gct ggc gat aac 960
Phe Phe Arg Met Gly Leu Ala Leu Pro His Ile Ala Ala Gly Asp Asn
305 310 315 320
ctg gac atg ccc att gtc gga aag gca ctc aaa gga gca ggc gcg ttc 1008
Leu Asp Met Pro Ile Val Gly Lys Ala Leu Lys Gly Ala Gly Ala Phe
325 330 335
ttc att cgc cgt tct tgg gct gac gat caa ctt tac acc agc att gtt 1056
Phe Ile Arg Arg Ser Trp Ala Asp Asp Gln Leu Tyr Thr Ser Ile Val
340 345 350
cag gaa tat gtt cag gag ctt ttg gag gga gga tac aat atc gag tgc 1104
Gln Glu Tyr Val Gln Glu Leu Leu Glu Gly Gly Tyr Asn Ile Glu Cys
355 360 365
ttc atc gag ggc acc cga agc aga aca gga aaa ctt ttg cca cca aag 1152
Phe Ile Glu Gly Thr Arg Ser Arg Thr Gly Lys Leu Leu Pro Pro Lys
370 375 380
ctg gga gtc cta aag att atc atg gat gct atg ctt tcg aac cgc atc 1200
Leu Gly Val Leu Lys Ile Ile Met Asp Ala Met Leu Ser Asn Arg Ile
385 390 395 400
caa gac tgc tac atc gtg ccc atc tct atc ggt tat gac aag gtc atc 1248
Gln Asp Cys Tyr Ile Val Pro Ile Ser Ile Gly Tyr Asp Lys Val Ile
405 410 415
gaa acc gag act tat atc aat gag ctt ctc gga atc ccc aag gaa aag 1296
Glu Thr Glu Thr Tyr Ile Asn Glu Leu Leu Gly Ile Pro Lys Glu Lys
420 425 430
gag agt ttg tgg ggt gtt att acg aat tcg agg ctg ctc cag ctc aag 1344
Glu Ser Leu Trp Gly Val Ile Thr Asn Ser Arg Leu Leu Gln Leu Lys
435 440 445
atg ggc cgc att gat gtc cga ttt gca aag ccg tac agt ttg cga aac 1392
Met Gly Arg Ile Asp Val Arg Phe Ala Lys Pro Tyr Ser Leu Arg Asn
450 455 460
ttt atg aat cat gag atc gag cgc aga gag atc atc aat aag cgg gaa 1440
Phe Met Asn His Glu Ile Glu Arg Arg Glu Ile Ile Asn Lys Arg Glu
465 470 475 480
gac acc gat agt gtg gcg aaa tct cag ctg cta aag gca ttg ggc tac 1488
Asp Thr Asp Ser Val Ala Lys Ser Gln Leu Leu Lys Ala Leu Gly Tyr
485 490 495
aag gtc ttg gca gac atc aac tcg gtc tct gta gta atg ccc acg gcc 1536
Lys Val Leu Ala Asp Ile Asn Ser Val Ser Val Val Met Pro Thr Ala
500 505 510
ctc gtg ggt act gtc atc ctt aca ctc cga gga cga ggt gtt ggc cgt 1584
Leu Val Gly Thr Val Ile Leu Thr Leu Arg Gly Arg Gly Val Gly Arg
515 520 525
aat gag ctg atc cgt cgt gtt gag tgg ctg aag cgc gag att ctt tcc 1632
Asn Glu Leu Ile Arg Arg Val Glu Trp Leu Lys Arg Glu Ile Leu Ser
530 535 540
aag ggt ggt cgc gtt gcc aac ttt agc ggg atg gaa act ggc gag gtt 1680
Lys Gly Gly Arg Val Ala Asn Phe Ser Gly Met Glu Thr Gly Glu Val
545 550 555 560
gta gat cga gca ttg ggc gtt ctt aag gac ctt gtg gcg ctg cag aag 1728
Val Asp Arg Ala Leu Gly Val Leu Lys Asp Leu Val Ala Leu Gln Lys
565 570 575
aat ttg ctc gag ccc gtc ttc tat gcg gtc aag cgc ttc gag ctt tcg 1776
Asn Leu Leu Glu Pro Val Phe Tyr Ala Val Lys Arg Phe Glu Leu Ser
580 585 590
ttc tac agg aat cag ctc atc cac ctc ttt gtc cat gag gcc atc atc 1824
Phe Tyr Arg Asn Gln Leu Ile His Leu Phe Val His Glu Ala Ile Ile
595 600 605
gcc gtg acg atg tac acc cgc atc aag att ggt ggc gcc aag tct aca 1872
Ala Val Thr Met Tyr Thr Arg Ile Lys Ile Gly Gly Ala Lys Ser Thr
610 615 620
caa cac att agt cag aat gag ctg ctg aac gag gtc acc ttc ctg agc 1920
Gln His Ile Ser Gln Asn Glu Leu Leu Asn Glu Val Thr Phe Leu Ser
625 630 635 640
cgc ctg ctc aag acc gac ttt atc tac aac cct ggc gat att gag agt 1968
Arg Leu Leu Lys Thr Asp Phe Ile Tyr Asn Pro Gly Asp Ile Glu Ser
645 650 655
aac ttg gag cat aca ttg gat tac ctc aag aaa tcc aat gtg atc gag 2016
Asn Leu Glu His Thr Leu Asp Tyr Leu Lys Lys Ser Asn Val Ile Glu
660 665 670
gtt gac agt gaa gga tat gtc gga ctc tct gat gct gaa cgc agc aag 2064
Val Asp Ser Glu Gly Tyr Val Gly Leu Ser Asp Ala Glu Arg Ser Lys
675 680 685
ggc cga gag aac tat gac ttt tat tgt ttc ctg ctc tgg ccc ttc gtg 2112
Gly Arg Glu Asn Tyr Asp Phe Tyr Cys Phe Leu Leu Trp Pro Phe Val
690 695 700
gag aca tac tgg ctc gca gcc gtg tcc ctg tat acc ctg att ccc acc 2160
Glu Thr Tyr Trp Leu Ala Ala Val Ser Leu Tyr Thr Leu Ile Pro Thr
705 710 715 720
gcc aaa gag ttg act cag cag ttg gac agc aac gga gag cct cag gtt 2208
Ala Lys Glu Leu Thr Gln Gln Leu Asp Ser Asn Gly Glu Pro Gln Val
725 730 735
cac tgg gtt gag gag cgc gtg ttc atg gag aag acg caa atg ttc gga 2256
His Trp Val Glu Glu Arg Val Phe Met Glu Lys Thr Gln Met Phe Gly
740 745 750
aag acg ctt tac tac cag gga gac ctc tcc tac ttt gag tct gtc aac 2304
Lys Thr Leu Tyr Tyr Gln Gly Asp Leu Ser Tyr Phe Glu Ser Val Asn
755 760 765
atg gag acg ctc aag aat ggt ttt aat cgt ctg tgc gat tat ggc atc 2352
Met Glu Thr Leu Lys Asn Gly Phe Asn Arg Leu Cys Asp Tyr Gly Ile
770 775 780
ctt atg atg aag cga ccc acc aat gcc aag gag aag aca aag gtt gct 2400
Leu Met Met Lys Arg Pro Thr Asn Ala Lys Glu Lys Thr Lys Val Ala
785 790 795 800
ctc cac cct gat ttt atg cca agc cga ggt gct gac ggt cat gtc att 2448
Leu His Pro Asp Phe Met Pro Ser Arg Gly Ala Asp Gly His Val Ile
805 810 815
gcc agc ggc gca ctt tgg gat atg gtc gaa cat atc ggc acg ttc aga 2496
Ala Ser Gly Ala Leu Trp Asp Met Val Glu His Ile Gly Thr Phe Arg
820 825 830
cgt gaa ggc aag aat cgt cgt gat aac gcc aca gtt tcc tcc cgt gtc 2544
Arg Glu Gly Lys Asn Arg Arg Asp Asn Ala Thr Val Ser Ser Arg Val
835 840 845
ctg cgg ttt gca gag gtc gtc gcg aac gct cca gct ccg gtt aag gta 2592
Leu Arg Phe Ala Glu Val Val Ala Asn Ala Pro Ala Pro Val Lys Val
850 855 860
ccc ttg ccc aat ccg gca ccc aaa agg aca ggc gat ggc gcc ccg aaa 2640
Pro Leu Pro Asn Pro Ala Pro Lys Arg Thr Gly Asp Gly Ala Pro Lys
865 870 875 880
tta 2643
Leu
<210> 5
<211> 881
<212> PRT
<213> Mortierella alpina
<400> 5
Met Thr Thr Gly Asp Ser Thr Ala Ala Asp Gly Ser Ser Ser Ser Ser
1 5 10 15
Ser Asn Asn Ser Thr Asn Ile Ala Ser Thr Ser Asn Gly Lys Ala Ala
20 25 30
Pro His Pro Leu Gln Gly Gly Ser Pro Ala Pro Val Ala Pro Val Leu
35 40 45
Glu Leu Lys Pro Leu Lys Asn Val Met Pro Ile Val Pro Ala Gln Gln
50 55 60
Val Asp Ser Ser Ser Cys Pro Pro Ser Gly Glu Ser Ser Pro Leu Ile
65 70 75 80
Pro Ser Leu Gly Glu Gly Val His Ser Gly His Gly His Val Val Asp
85 90 95
Asn Asp Glu Ser Gly Val Glu Asn Ile Thr Lys Lys His Ala Gly Arg
100 105 110
Ile Arg Glu Asp Pro Val Gly Phe Val Val Gln Thr Ala Ala Phe Tyr
115 120 125
Gln Gly Thr Gly Trp Arg Ser Tyr Ser Asn Tyr Val Gly Thr Arg Ile
130 135 140
Leu Tyr Glu Gly Phe Ser Ala Thr Phe Lys Glu Arg Ile Leu Ala Ser
145 150 155 160
Ser Lys Val Asn Asp Leu Ile Lys Asp Met Ala Asn Lys Gln Leu Asp
165 170 175
Val Leu Ile Lys Gln Arg Gln Asp Ala Tyr Asp Ala Glu Arg Thr Ala
180 185 190
Asn Ala Gly Lys Lys Asn Phe Lys Pro Lys Val Arg Leu Leu Arg Pro
195 200 205
Glu Asp Ile Glu Ala Arg Arg Lys Thr Leu Glu Ala Glu Leu Val Ala
210 215 220
Val Ala Lys Ser Asn Ile Asp Lys Leu Val Cys Asp Met Asn Ser Met
225 230 235 240
Lys Phe Ile Arg Phe Phe Ala Phe Leu Ile Asn Asn Ile Leu Val Arg
245 250 255
Met Tyr His Gln Gly Ile His Ile Lys Glu Ser Glu Phe Leu Glu Leu
260 265 270
Arg Arg Ile Ala Glu Tyr Cys Ala Glu Lys Lys Tyr Ser Met Val Val
275 280 285
Leu Pro Cys His Lys Ser His Ile Asp Tyr Leu Val Val Ser Tyr Ile
290 295 300
Phe Phe Arg Met Gly Leu Ala Leu Pro His Ile Ala Ala Gly Asp Asn
305 310 315 320
Leu Asp Met Pro Ile Val Gly Lys Ala Leu Lys Gly Ala Gly Ala Phe
325 330 335
Phe Ile Arg Arg Ser Trp Ala Asp Asp Gln Leu Tyr Thr Ser Ile Val
340 345 350
Gln Glu Tyr Val Gln Glu Leu Leu Glu Gly Gly Tyr Asn Ile Glu Cys
355 360 365
Phe Ile Glu Gly Thr Arg Ser Arg Thr Gly Lys Leu Leu Pro Pro Lys
370 375 380
Leu Gly Val Leu Lys Ile Ile Met Asp Ala Met Leu Ser Asn Arg Ile
385 390 395 400
Gln Asp Cys Tyr Ile Val Pro Ile Ser Ile Gly Tyr Asp Lys Val Ile
405 410 415
Glu Thr Glu Thr Tyr Ile Asn Glu Leu Leu Gly Ile Pro Lys Glu Lys
420 425 430
Glu Ser Leu Trp Gly Val Ile Thr Asn Ser Arg Leu Leu Gln Leu Lys
435 440 445
Met Gly Arg Ile Asp Val Arg Phe Ala Lys Pro Tyr Ser Leu Arg Asn
450 455 460
Phe Met Asn His Glu Ile Glu Arg Arg Glu Ile Ile Asn Lys Arg Glu
465 470 475 480
Asp Thr Asp Ser Val Ala Lys Ser Gln Leu Leu Lys Ala Leu Gly Tyr
485 490 495
Lys Val Leu Ala Asp Ile Asn Ser Val Ser Val Val Met Pro Thr Ala
500 505 510
Leu Val Gly Thr Val Ile Leu Thr Leu Arg Gly Arg Gly Val Gly Arg
515 520 525
Asn Glu Leu Ile Arg Arg Val Glu Trp Leu Lys Arg Glu Ile Leu Ser
530 535 540
Lys Gly Gly Arg Val Ala Asn Phe Ser Gly Met Glu Thr Gly Glu Val
545 550 555 560
Val Asp Arg Ala Leu Gly Val Leu Lys Asp Leu Val Ala Leu Gln Lys
565 570 575
Asn Leu Leu Glu Pro Val Phe Tyr Ala Val Lys Arg Phe Glu Leu Ser
580 585 590
Phe Tyr Arg Asn Gln Leu Ile His Leu Phe Val His Glu Ala Ile Ile
595 600 605
Ala Val Thr Met Tyr Thr Arg Ile Lys Ile Gly Gly Ala Lys Ser Thr
610 615 620
Gln His Ile Ser Gln Asn Glu Leu Leu Asn Glu Val Thr Phe Leu Ser
625 630 635 640
Arg Leu Leu Lys Thr Asp Phe Ile Tyr Asn Pro Gly Asp Ile Glu Ser
645 650 655
Asn Leu Glu His Thr Leu Asp Tyr Leu Lys Lys Ser Asn Val Ile Glu
660 665 670
Val Asp Ser Glu Gly Tyr Val Gly Leu Ser Asp Ala Glu Arg Ser Lys
675 680 685
Gly Arg Glu Asn Tyr Asp Phe Tyr Cys Phe Leu Leu Trp Pro Phe Val
690 695 700
Glu Thr Tyr Trp Leu Ala Ala Val Ser Leu Tyr Thr Leu Ile Pro Thr
705 710 715 720
Ala Lys Glu Leu Thr Gln Gln Leu Asp Ser Asn Gly Glu Pro Gln Val
725 730 735
His Trp Val Glu Glu Arg Val Phe Met Glu Lys Thr Gln Met Phe Gly
740 745 750
Lys Thr Leu Tyr Tyr Gln Gly Asp Leu Ser Tyr Phe Glu Ser Val Asn
755 760 765
Met Glu Thr Leu Lys Asn Gly Phe Asn Arg Leu Cys Asp Tyr Gly Ile
770 775 780
Leu Met Met Lys Arg Pro Thr Asn Ala Lys Glu Lys Thr Lys Val Ala
785 790 795 800
Leu His Pro Asp Phe Met Pro Ser Arg Gly Ala Asp Gly His Val Ile
805 810 815
Ala Ser Gly Ala Leu Trp Asp Met Val Glu His Ile Gly Thr Phe Arg
820 825 830
Arg Glu Gly Lys Asn Arg Arg Asp Asn Ala Thr Val Ser Ser Arg Val
835 840 845
Leu Arg Phe Ala Glu Val Val Ala Asn Ala Pro Ala Pro Val Lys Val
850 855 860
Pro Leu Pro Asn Pro Ala Pro Lys Arg Thr Gly Asp Gly Ala Pro Lys
865 870 875 880
Leu
<210> 6
<211> 2646
<212> DNA
<213> Mortierella alpina
<400> 6
atgacaaccg gcgacagtac cgctgctgac ggtagcagca gcagtagcag caacaacagc 60
accaacattg ccagtactag taacggcaag gctgctcccc acccactcca agggggatca 120
cccgctcctg tagctccagt tttggaattg aagcctctca agaatgttat gcccatcgtt 180
ccagctcagc aagtcgactc ctcctcgtgc cctccctctg gtgaatctag cccgttgatt 240
cccagtttgg gcgaaggagt gcattcgggt catggacacg ttgtcgacaa tgacgagtcc 300
ggcgtggaga acattaccaa aaagcacgca ggacgaatta gagaagatcc ggtcggcttc 360
gtggtgcaga ctgcagcttt ctatcagggc acgggttgga gaagctacag caactatgtt 420
ggaacgcgca ttctttacga aggcttctct gcaaccttca aggagcgaat tctcgccagt 480
tcaaaagtga atgatctcat caaggacatg gccaacaagc agttggatgt cctgatcaag 540
caaagacaag atgcgtatga cgcagagagg actgcaaatg caggaaaaaa gaacttcaag 600
cccaaagttc gactccttcg cccagaagat atcgaggctc gtcgcaaaac attagaagcc 660
gagcttgttg cggtggcaaa gtcaaatatc gacaaacttg tttgtgatat gaacagtatg 720
aaattcatca ggttcttcgc cttcctcatc aacaacatcc ttgtgagaat gtaccatcaa 780
ggaattcaca tcaaggagtc cgagttcttg gagctgcgga ggatagctga gtactgcgca 840
gagaaaaagt attcgatggt ggtgttgcca tgccacaagt cacacatcga ctacctcgtc 900
gtctcgtaca ttttcttccg catgggatta gctttacctc acattgctgc tggcgataac 960
ctggacatgc ccattgtcgg aaaggcactc aaaggagcag gcgcgttctt cattcgccgt 1020
tcttgggctg acgatcaact ttacaccagc attgttcagg aatatgttca ggagcttttg 1080
gagggaggat acaatatcga gtgcttcatc gagggcaccc gaagcagaac aggaaaactt 1140
ttgccaccaa agctgggagt cctaaagatt atcatggatg ctatgctttc gaaccgcatc 1200
caagactgct acatcgtgcc catctctatc ggttatgaca aggtcatcga aaccgagact 1260
tatatcaatg agcttctcgg aatccccaag gaaaaggaga gtttgtgggg tgttattacg 1320
aattcgaggc tgctccagct caagatgggc cgcattgatg tccgatttgc aaagccgtac 1380
agtttgcgaa actttatgaa tcatgagatc gagcgcagag agatcatcaa taagcgggaa 1440
gacaccgata gtgtggcgaa atctcagctg ctaaaggcat tgggctacaa ggtcttggca 1500
gacatcaact cggtctctgt agtaatgccc acggccctcg tgggtactgt catccttaca 1560
ctccgaggac gaggtgttgg ccgtaatgag ctgatccgtc gtgttgagtg gctgaagcgc 1620
gagattcttt ccaagggtgg tcgcgttgcc aactttagcg ggatggaaac tggcgaggtt 1680
gtagatcgag cattgggcgt tcttaaggac cttgtggcgc tgcagaagaa tttgctcgag 1740
cccgtcttct atgcggtcaa gcgcttcgag ctttcgttct acaggaatca gctcatccac 1800
ctctttgtcc atgaggccat catcgccgtg acgatgtaca cccgcatcaa gattggtggc 1860
gccaagtcta cacaacacat tagtcagaat gagctgctga acgaggtcac cttcctgagc 1920
cgcctgctca agaccgactt tatctacaac cctggcgata ttgagagtaa cttggagcat 1980
acattggatt acctcaagaa atccaatgtg atcgaggttg acagtgaagg atatgtcgga 2040
ctctctgatg ctgaacgcag caagggccga gagaactatg acttttattg tttcctgctc 2100
tggcccttcg tggagacata ctggctcgca gccgtgtccc tgtataccct gattcccacc 2160
gccaaagagt tgactcagca gttggacagc aacggagagc ctcaggttca ctgggttgag 2220
gagcgcgtgt tcatggagaa gacgcaaatg ttcggaaaga cgctttacta ccagggagac 2280
ctctcctact ttgagtctgt caacatggag acgctcaaga atggttttaa tcgtctgtgc 2340
gattatggca tccttatgat gaagcgaccc accaatgcca aggagaagac aaaggttgct 2400
ctccaccctg attttatgcc aagccgaggt gctgacggtc atgtcattgc cagcggcgca 2460
ctttgggata tggtcgaaca tatcggcacg ttcagacgtg aaggcaagaa tcgtcgtgat 2520
aacgccacag tttcctcccg tgtcctgcgg tttgcagagg tcgtcgcgaa cgctccagct 2580
ccggttaagg tacccttgcc caatccggca cccaaaagga caggcgatgg cgccccgaaa 2640
ttataa 2646
<210> 7
<211> 4248
<212> DNA
<213> Mortierella alpina
<400> 7
gttgacatag tctttttggt agcagtagca ttgttgtagt ttctcttact caacggacag 60
cagcagcacg accgccgagg taaagcggtg gatcccatag agactctttt gccctcgtct 120
ccactgtcgc tctccccaca gaaaaacatt tttatttcct ttcccgcatt tttttcttct 180
ttttttcctg cctctcttgt ctctcctccc ctaagcacca cctaacccgc tctatcgccc 240
aaccacttca actcagcacc ctcacggagc ctgccaacca acgttgcaag aaggaaaaaa 300
agtacagcgc atcttgtagt ccagcgcgga gcagtggaaa aacctctcca ttccgaccta 360
acagatcacg cagtctgatc agctagtttg ccccacagtt attgcatcac cctttcaacc 420
agtccacatg acaaccggcg acagtaccgc tgctgacggt agcagcagca gtagcagcaa 480
caacagcacc aacattgcca gtactagtaa cggcaaggct gctccccacc cactccaagg 540
gggatcaccc gctcctgtag ctccagtttt ggaattgaag cctctcaaga atgttatgcc 600
catcgttcca gctcagcaag tcgactcctc ctcgtgccct ccctctggtg aatctagccc 660
gttgattccc agtttgggcg aaggagtgca ttcgggtcat ggacacgttg tcgacaatga 720
cgagtccggc gtggagaaca ttacgcaagt tcaaattgaa tattccagcg gctatgaacg 780
agtttggatg cttgtttagt tttgtattaa cacgaacttt cgctcttgtt attgttgtta 840
tcaatgcagc aaaaagcacg caggacgaat tagagaagat ccggtcggct tcgtggtgca 900
gactgcagct ttctatcagg gcacggtacg ttcaatatct gacatcactg ctttagtgga 960
gccgcagagg aaagcacttc ttaacgacaa ctgcagctgg atcggtcggt acctcctgct 1020
caacgagcta tcagcccttc tccgccgcca ttgtgagggt gatttgtctc ataccaggaa 1080
cagcagaaga aaaagaggaa tcgtgttcac aaagcatcgc ttcggggttg cgctcacgct 1140
cggtcctctt gattgctccc tggaagtctc ccttctgcaa actgtcactc tcccacgttc 1200
cctttttttt ttttttttta ctatcctccc atcccctgcc tctcgtcatg cttgagctga 1260
ataatgctaa attcttatcc gcatatcgtc tttgcttttt agggttggag aagctacagc 1320
aactatgttg gaacgcgcat tctttacgaa ggcttctctg caaccttcaa ggagcgaatt 1380
ctcgccagtt caaaaggtaa cacaagatag ggtgctgtct gtacttcaac acgattcgtc 1440
aaaatggcat gatctaacga accctacctt gacctcctag tgaatgatct catcaaggac 1500
atggccaaca agcagttgga tgtcctgatc aagcaaagac aagatgcgta tgacgcagag 1560
aggactgcaa atgcaggaaa aaagaacttc aagcccaaag ttcgactcct tcgcccagaa 1620
gatatcgagg ctcgtcgcaa aacattagaa gccgagcttg ttgcggtggc aaagtcaaat 1680
atcgacaaac ttgtttgtga tatgaacagt atgaaattca tcaggtatgg accaacacga 1740
gaataacgca gcgtggaact gaacagtgtg gcagaagagg gatggcgaga tatatttgtt 1800
gtttgctaga caccagatgt taacaacttt cctccttggc tgatgtgtta ggttcttcgc 1860
cttcctcatc aacaacatcc ttgtgagaat gtaccatcaa ggaattcaca tcaaggagtc 1920
cgagttcttg gagctgcgga ggatagctga gtactgcgca gagaaaaagt attcgatggt 1980
ggtgttgcca tgccacaagt cacacatcga ctacctcgtc gtctcgtaca ttttcttccg 2040
catgggatta gctttacctc acattgctgc tggcgataac ctggacatgc ccattgtcgg 2100
aaaggcactc aaaggagcag gcgcgttctt cattcgccgt tcttgggctg acgatcaact 2160
ttacaccagc attgttcagg aatatgttca ggagcttttg gagggaggat acaatatcga 2220
gtgcttcatc gagggcaccc gaagcagaac aggaaaactt ttgccaccaa agctgggagg 2280
ttcgttcaca gctttggtct tgtttttgct actgggcacg ctggcgatct ctttgggtat 2340
taaccttcac accaatccac ctttactagt cctaaagatt atcatggatg ctatgctttc 2400
gaaccgcatc caagactgct acatcgtgcc catctctatc ggttatgaca aggtcatcga 2460
aaccgagact tatatcaatg agcttctcgg aatccccaag gaaaaggaga gtttgtgggg 2520
tgttattacg aattcgaggc tgctccagct caagatgggc cgcattgatg tccgatttgc 2580
aaagccgtac agtttgcgaa actttatgaa tcatgagatc gagcgcagag agtaagcaga 2640
acctgtgttt tgttgtgcaa gacgttttca aaactggaga ggaattatgt tgacccaggg 2700
ctatttgttt ttctgcattt aggatcatca ataagcggga agacaccgat agtgtggcga 2760
aatctcagct gctaaaggca ttgggctaca aggtcttggc agacatcaac tcggtctctg 2820
tagtaatgcc cacggccctc gtgggtactg tcatccttac actccgagga cgaggtgttg 2880
gccgtaatga gctgatccgt cgtgttgagt ggctgaagcg cgagattctt tccaagggtg 2940
gtcgcgttgc caactttagc gggatggaaa ctggcgaggt tgtagatcga gcattgggcg 3000
ttcttaagga ccttgtggcg ctgcagaaga atttgctcga gcccgtcttc tatgcggtca 3060
agcgcttcga gctttcgttc tacaggaatc agctcatcca cctctttgtc catgaggcca 3120
tcatcgccgt gacgatgtac acccgcatca agattggtgg cgccaagtct acacaacaca 3180
ttagtcagaa tgagctgctg aacgaggtca ccttcctgag ccgcctgctc aagaccgact 3240
ttatctacaa ccctggcgat attgagagta acttggagca tacattggat tacctcaagg 3300
tgagttatct cgcacaggaa taagggacag ctgcaattcg ctgaaagtag acctgagcgc 3360
aacggtctaa cattatcgtt cttttctaga aatccaatgt gatcgaggtt gacagtgaag 3420
gatatgtcgg actctctgat gctgaacgca gcaagggccg agagaactat ggtaatgggc 3480
tattctattt gtactcacta cagacgtgat gtgcatgttg tatcggccga gaaagtcgtt 3540
tctgactgaa cctctcattt tatcattact ctagactttt attgtttcct gctctggccc 3600
ttcgtggaga catactggct cgcagccgtg tccctgtata ccctgattcc caccgccaaa 3660
gagttgactc agcagttgga cagcaacgga gagcctcagg ttcactgggt tgaggagcgc 3720
gtgttcatgg agaagacgca aatgttcgga aagacgcttt actaccaggg agacctctcc 3780
tactttgagt ctgtcaacat ggagacgctc aagaatggtt ttaatcgtct gtgcgattat 3840
ggcatcctta tgatgaagcg acccaccaat gccaaggaga agacaaaggt tgctctccac 3900
cctgatttta tgccaagccg aggtgctgac ggtcatgtca ttgccagcgg cgcactttgg 3960
gatatggtcg aacatatcgg cacgttcaga cgtgaaggca agaatcgtcg tgataacgcc 4020
acaggtaagg aacatgtgtc ttgacattgc tcgaaacgaa atttgttgct ctgtatgctt 4080
tgtcaccagg ggtactaatg gcttgtgctc ttgcttacac tttccaacct agtttcctcc 4140
cgtgtcctgc ggtttgcaga ggtcgtcgcg aacgctccag ctccggttaa ggtacccttg 4200
cccaatccgg cacccaaaag gacaggcgat ggcgccccga aattataa 4248
<210> 8
<211> 2364
<212> DNA
<213> Mortierella alpina
<220>
<221> CDS
<222> (1)..(2364)
<223>
<400> 8
atg gaa gga gac gca gta cgg cct gct ttg gcc aga aag atc cct ggt 48
Met Glu Gly Asp Ala Val Arg Pro Ala Leu Ala Arg Lys Ile Pro Gly
1 5 10 15
ctc tac agc ttc atc aaa ctc ctt tgc agg acg ctt ttt cac atc ttc 96
Leu Tyr Ser Phe Ile Lys Leu Leu Cys Arg Thr Leu Phe His Ile Phe
20 25 30
ttc agg gat tac gac gcc ttt cat acc cag ttt gtt cca cag gac gaa 144
Phe Arg Asp Tyr Asp Ala Phe His Thr Gln Phe Val Pro Gln Asp Glu
35 40 45
cca ttg cta gtt atc tcc aac cat ggc aac tac ctt ctg gat ggc ctc 192
Pro Leu Leu Val Ile Ser Asn His Gly Asn Tyr Leu Leu Asp Gly Leu
50 55 60
gcc ttg ttg gcc acc ttt cca ggc cag atc tcc ttt ttg atg gca cag 240
Ala Leu Leu Ala Thr Phe Pro Gly Gln Ile Ser Phe Leu Met Ala Gln
65 70 75 80
ccc aat ttc aag act gca att ggt ggc atc gcc agg aag att ggt gcc 288
Pro Asn Phe Lys Thr Ala Ile Gly Gly Ile Ala Arg Lys Ile Gly Ala
85 90 95
att cca gta ctg aga cca cag gac gcg gcc aga tat gac ggt gcg agt 336
Ile Pro Val Leu Arg Pro Gln Asp Ala Ala Arg Tyr Asp Gly Ala Ser
100 105 110
atg gtc aca atc gct cag gat ggc aac tca gtc ctc ggt cag ggg att 384
Met Val Thr Ile Ala Gln Asp Gly Asn Ser Val Leu Gly Gln Gly Ile
115 120 125
ggc aag cag ctg act ttg ggc gat act gtc tat atc gag tgt ggg acg 432
Gly Lys Gln Leu Thr Leu Gly Asp Thr Val Tyr Ile Glu Cys Gly Thr
130 135 140
ttc cag gac gct ggc agg gac aat cgc gtc acg caa tgt tat ggc gtg 480
Phe Gln Asp Ala Gly Arg Asp Asn Arg Val Thr Gln Cys Tyr Gly Val
145 150 155 160
gtc agt gcg atc gtc agt gac aac gag gtg ttg ttc aag gct ccc ggt 528
Val Ser Ala Ile Val Ser Asp Asn Glu Val Leu Phe Lys Ala Pro Gly
165 170 175
ttg aaa tgg att ccc gca tcc ttg aca tcg gaa cgc gac att gcc tat 576
Leu Lys Trp Ile Pro Ala Ser Leu Thr Ser Glu Arg Asp Ile Ala Tyr
180 185 190
atc aaa tcg cga aag att gtt cgg cat ggg tca ctc aag atc aga gtg 624
Ile Lys Ser Arg Lys Ile Val Arg His Gly Ser Leu Lys Ile Arg Val
195 200 205
gaa cgt ggc aac acc tgg gtc gga atc aat gag gcg ctt aaa gca cag 672
Glu Arg Gly Asn Thr Trp Val Gly Ile Asn Glu Ala Leu Lys Ala Gln
210 215 220
gag cag cag aac aat ggc tcg ttg gca agc agc gca acg ggg acg atc 720
Glu Gln Gln Asn Asn Gly Ser Leu Ala Ser Ser Ala Thr Gly Thr Ile
225 230 235 240
ggc aag ttt gtt cac aag ata ttt tca aag tcg ccg gat gca gac gca 768
Gly Lys Phe Val His Lys Ile Phe Ser Lys Ser Pro Asp Ala Asp Ala
245 250 255
aga tca gat gat gtg cat ttg gcc gag aat ggg tat tcc gga gca gat 816
Arg Ser Asp Asp Val His Leu Ala Glu Asn Gly Tyr Ser Gly Ala Asp
260 265 270
atc ccc ggg tcc ttg acc gct cca gcc aac ttt cac aca act gag act 864
Ile Pro Gly Ser Leu Thr Ala Pro Ala Asn Phe His Thr Thr Glu Thr
275 280 285
aca cca cta ctc aaa aag gcg cgc tcg tca aac agc tcc agt cat cct 912
Thr Pro Leu Leu Lys Lys Ala Arg Ser Ser Asn Ser Ser Ser His Pro
290 295 300
ata tac aca gta cca aag cgc gca gac tcg aac gcg agg ctt tca tca 960
Ile Tyr Thr Val Pro Lys Arg Ala Asp Ser Asn Ala Arg Leu Ser Ser
305 310 315 320
tac tct acc act cac agc aca aat gca gtg gcc gat gcc gac aac gac 1008
Tyr Ser Thr Thr His Ser Thr Asn Ala Val Ala Asp Ala Asp Asn Asp
325 330 335
gac gag acc acg cgc cct gca aat gga ctt agg aac gcg caa ggc gga 1056
Asp Glu Thr Thr Arg Pro Ala Asn Gly Leu Arg Asn Ala Gln Gly Gly
340 345 350
cac aac ccc gct gga acc aat ggc gtt gtc aat gga ggc gca tcc aca 1104
His Asn Pro Ala Gly Thr Asn Gly Val Val Asn Gly Gly Ala Ser Thr
355 360 365
tcc atg agc cca cga agc act cca ttg acc tcc cct aca ctt cac agc 1152
Ser Met Ser Pro Arg Ser Thr Pro Leu Thr Ser Pro Thr Leu His Ser
370 375 380
tcc aca tcg gcc gtg tca cac ttc ccc tcg cga ccc tgc ccc ttc cag 1200
Ser Thr Ser Ala Val Ser His Phe Pro Ser Arg Pro Cys Pro Phe Gln
385 390 395 400
ttc tca cac cca atc gac cat tct gtg atc tac gag agc gtc tgg aag 1248
Phe Ser His Pro Ile Asp His Ser Val Ile Tyr Glu Ser Val Trp Lys
405 410 415
aac ttt gag gat ggt cgc acc gtt gct gta ttc cct gaa ggc gta tcg 1296
Asn Phe Glu Asp Gly Arg Thr Val Ala Val Phe Pro Glu Gly Val Ser
420 425 430
agc gac gat tat cac ttg ctc gac ttc aaa tat ggc tgc acc atc atg 1344
Ser Asp Asp Tyr His Leu Leu Asp Phe Lys Tyr Gly Cys Thr Ile Met
435 440 445
gtt ctt gga tac ctg gct cag cat cgc tct aag act cta agg att ata 1392
Val Leu Gly Tyr Leu Ala Gln His Arg Ser Lys Thr Leu Arg Ile Ile
450 455 460
cca tgc gga ctg aac ttc ttt aat cgc cat cga ttt cga tcc cgg ttc 1440
Pro Cys Gly Leu Asn Phe Phe Asn Arg His Arg Phe Arg Ser Arg Phe
465 470 475 480
tac gcc gac tac tcc cat ccg ctc acc gtc ccc gac cac ctt gta gag 1488
Tyr Ala Asp Tyr Ser His Pro Leu Thr Val Pro Asp His Leu Val Glu
485 490 495
atg tat cgc gaa gga gga gaa gcc aag aag caa gcc tgt act gag ctt 1536
Met Tyr Arg Glu Gly Gly Glu Ala Lys Lys Gln Ala Cys Thr Glu Leu
500 505 510
ctg cag atg att cac tcg gct gtg gag ggg ctg act ctt aac gca cca 1584
Leu Gln Met Ile His Ser Ala Val Glu Gly Leu Thr Leu Asn Ala Pro
515 520 525
aac tac gac gag ctg cga ctt tac aag gca acg cga cga ctc tac agc 1632
Asn Tyr Asp Glu Leu Arg Leu Tyr Lys Ala Thr Arg Arg Leu Tyr Ser
530 535 540
act ggg aag aag ctt acc gtg cca cag aaa ttg gag cta act cgc cgt 1680
Thr Gly Lys Lys Leu Thr Val Pro Gln Lys Leu Glu Leu Thr Arg Arg
545 550 555 560
ttt gcg aaa ggt tat caa aat ctg gtc atg acg ccg agc atg gct gca 1728
Phe Ala Lys Gly Tyr Gln Asn Leu Val Met Thr Pro Ser Met Ala Ala
565 570 575
ttg aaa cgc gac att gat gct tat gac aag cat ctc tcc agc agc ggc 1776
Leu Lys Arg Asp Ile Asp Ala Tyr Asp Lys His Leu Ser Ser Ser Gly
580 585 590
gtc cga gac gca caa ctg acc gca aac cca agc att ctg gct gcc ctt 1824
Val Arg Asp Ala Gln Leu Thr Ala Asn Pro Ser Ile Leu Ala Ala Leu
595 600 605
gta ttc ata ttg ccc gcg tta ttc ctc ttg cca gtg ctg ttc ctg ctt 1872
Val Phe Ile Leu Pro Ala Leu Phe Leu Leu Pro Val Leu Phe Leu Leu
610 615 620
tcg tta ccc ggg acg ttg ctc ttc gga cct gtt gga ctt ttg gcg tcg 1920
Ser Leu Pro Gly Thr Leu Leu Phe Gly Pro Val Gly Leu Leu Ala Ser
625 630 635 640
tgg gcg gca aag cag aaa gga cag cag gcc atg ctt gcc ttt cag tct 1968
Trp Ala Ala Lys Gln Lys Gly Gln Gln Ala Met Leu Ala Phe Gln Ser
645 650 655
tat ctc cca gtt tca cgt tgg cct ggc cga gat gtg atc gcc acc tgg 2016
Tyr Leu Pro Val Ser Arg Trp Pro Gly Arg Asp Val Ile Ala Thr Trp
660 665 670
aag atc gtg gtg tcc ttg gcg ttg atg ccc gtc tgc ttt att ctg gac 2064
Lys Ile Val Val Ser Leu Ala Leu Met Pro Val Cys Phe Ile Leu Asp
675 680 685
gca aca ctg ctc acg atc cta gca cac cat tgg gaa gca ctg cag gag 2112
Ala Thr Leu Leu Thr Ile Leu Ala His His Trp Glu Ala Leu Gln Glu
690 695 700
tac tgg act atg ggt cgt cta gtt gcg ttc tgg ctg ctg tca aca ttt 2160
Tyr Trp Thr Met Gly Arg Leu Val Ala Phe Trp Leu Leu Ser Thr Phe
705 710 715 720
gtg att ttt cca acg atg gcg tat ggt acg gtc tgg ctt tgg gag tgg 2208
Val Ile Phe Pro Thr Met Ala Tyr Gly Thr Val Trp Leu Trp Glu Trp
725 730 735
cag att gat ttg aag atg cag atc tat gta tgg tgg tgg aag ctc tgc 2256
Gln Ile Asp Leu Lys Met Gln Ile Tyr Val Trp Trp Trp Lys Leu Cys
740 745 750
gga ggc aat gca gag atg aag cgc tgg aga cag gat ctt gtc gag aga 2304
Gly Gly Asn Ala Glu Met Lys Arg Trp Arg Gln Asp Leu Val Glu Arg
755 760 765
atg gat gca ctt gtc gaa agg atg ggc ggt aga agg gtg ttt gat gta 2352
Met Asp Ala Leu Val Glu Arg Met Gly Gly Arg Arg Val Phe Asp Val
770 775 780
tcg ggc tat tat 2364
Ser Gly Tyr Tyr
785
<210> 9
<211> 788
<212> PRT
<213> Mortierella alpina
<400> 9
Met Glu Gly Asp Ala Val Arg Pro Ala Leu Ala Arg Lys Ile Pro Gly
1 5 10 15
Leu Tyr Ser Phe Ile Lys Leu Leu Cys Arg Thr Leu Phe His Ile Phe
20 25 30
Phe Arg Asp Tyr Asp Ala Phe His Thr Gln Phe Val Pro Gln Asp Glu
35 40 45
Pro Leu Leu Val Ile Ser Asn His Gly Asn Tyr Leu Leu Asp Gly Leu
50 55 60
Ala Leu Leu Ala Thr Phe Pro Gly Gln Ile Ser Phe Leu Met Ala Gln
65 70 75 80
Pro Asn Phe Lys Thr Ala Ile Gly Gly Ile Ala Arg Lys Ile Gly Ala
85 90 95
Ile Pro Val Leu Arg Pro Gln Asp Ala Ala Arg Tyr Asp Gly Ala Ser
100 105 110
Met Val Thr Ile Ala Gln Asp Gly Asn Ser Val Leu Gly Gln Gly Ile
115 120 125
Gly Lys Gln Leu Thr Leu Gly Asp Thr Val Tyr Ile Glu Cys Gly Thr
130 135 140
Phe Gln Asp Ala Gly Arg Asp Asn Arg Val Thr Gln Cys Tyr Gly Val
145 150 155 160
Val Ser Ala Ile Val Ser Asp Asn Glu Val Leu Phe Lys Ala Pro Gly
165 170 175
Leu Lys Trp Ile Pro Ala Ser Leu Thr Ser Glu Arg Asp Ile Ala Tyr
180 185 190
Ile Lys Ser Arg Lys Ile Val Arg His Gly Ser Leu Lys Ile Arg Val
195 200 205
Glu Arg Gly Asn Thr Trp Val Gly Ile Asn Glu Ala Leu Lys Ala Gln
210 215 220
Glu Gln Gln Asn Asn Gly Ser Leu Ala Ser Ser Ala Thr Gly Thr Ile
225 230 235 240
Gly Lys Phe Val His Lys Ile Phe Ser Lys Ser Pro Asp Ala Asp Ala
245 250 255
Arg Ser Asp Asp Val His Leu Ala Glu Asn Gly Tyr Ser Gly Ala Asp
260 265 270
Ile Pro Gly Ser Leu Thr Ala Pro Ala Asn Phe His Thr Thr Glu Thr
275 280 285
Thr Pro Leu Leu Lys Lys Ala Arg Ser Ser Asn Ser Ser Ser His Pro
290 295 300
Ile Tyr Thr Val Pro Lys Arg Ala Asp Ser Asn Ala Arg Leu Ser Ser
305 310 315 320
Tyr Ser Thr Thr His Ser Thr Asn Ala Val Ala Asp Ala Asp Asn Asp
325 330 335
Asp Glu Thr Thr Arg Pro Ala Asn Gly Leu Arg Asn Ala Gln Gly Gly
340 345 350
His Asn Pro Ala Gly Thr Asn Gly Val Val Asn Gly Gly Ala Ser Thr
355 360 365
Ser Met Ser Pro Arg Ser Thr Pro Leu Thr Ser Pro Thr Leu His Ser
370 375 380
Ser Thr Ser Ala Val Ser His Phe Pro Ser Arg Pro Cys Pro Phe Gln
385 390 395 400
Phe Ser His Pro Ile Asp His Ser Val Ile Tyr Glu Ser Val Trp Lys
405 410 415
Asn Phe Glu Asp Gly Arg Thr Val Ala Val Phe Pro Glu Gly Val Ser
420 425 430
Ser Asp Asp Tyr His Leu Leu Asp Phe Lys Tyr Gly Cys Thr Ile Met
435 440 445
Val Leu Gly Tyr Leu Ala Gln His Arg Ser Lys Thr Leu Arg Ile Ile
450 455 460
Pro Cys Gly Leu Asn Phe Phe Asn Arg His Arg Phe Arg Ser Arg Phe
465 470 475 480
Tyr Ala Asp Tyr Ser His Pro Leu Thr Val Pro Asp His Leu Val Glu
485 490 495
Met Tyr Arg Glu Gly Gly Glu Ala Lys Lys Gln Ala Cys Thr Glu Leu
500 505 510
Leu Gln Met Ile His Ser Ala Val Glu Gly Leu Thr Leu Asn Ala Pro
515 520 525
Asn Tyr Asp Glu Leu Arg Leu Tyr Lys Ala Thr Arg Arg Leu Tyr Ser
530 535 540
Thr Gly Lys Lys Leu Thr Val Pro Gln Lys Leu Glu Leu Thr Arg Arg
545 550 555 560
Phe Ala Lys Gly Tyr Gln Asn Leu Val Met Thr Pro Ser Met Ala Ala
565 570 575
Leu Lys Arg Asp Ile Asp Ala Tyr Asp Lys His Leu Ser Ser Ser Gly
580 585 590
Val Arg Asp Ala Gln Leu Thr Ala Asn Pro Ser Ile Leu Ala Ala Leu
595 600 605
Val Phe Ile Leu Pro Ala Leu Phe Leu Leu Pro Val Leu Phe Leu Leu
610 615 620
Ser Leu Pro Gly Thr Leu Leu Phe Gly Pro Val Gly Leu Leu Ala Ser
625 630 635 640
Trp Ala Ala Lys Gln Lys Gly Gln Gln Ala Met Leu Ala Phe Gln Ser
645 650 655
Tyr Leu Pro Val Ser Arg Trp Pro Gly Arg Asp Val Ile Ala Thr Trp
660 665 670
Lys Ile Val Val Ser Leu Ala Leu Met Pro Val Cys Phe Ile Leu Asp
675 680 685
Ala Thr Leu Leu Thr Ile Leu Ala His His Trp Glu Ala Leu Gln Glu
690 695 700
Tyr Trp Thr Met Gly Arg Leu Val Ala Phe Trp Leu Leu Ser Thr Phe
705 710 715 720
Val Ile Phe Pro Thr Met Ala Tyr Gly Thr Val Trp Leu Trp Glu Trp
725 730 735
Gln Ile Asp Leu Lys Met Gln Ile Tyr Val Trp Trp Trp Lys Leu Cys
740 745 750
Gly Gly Asn Ala Glu Met Lys Arg Trp Arg Gln Asp Leu Val Glu Arg
755 760 765
Met Asp Ala Leu Val Glu Arg Met Gly Gly Arg Arg Val Phe Asp Val
770 775 780
Ser Gly Tyr Tyr
785
<210> 10
<211> 2367
<212> DNA
<213> Mortierella alpina
<400> 10
atggaaggag acgcagtacg gcctgctttg gccagaaaga tccctggtct ctacagcttc 60
atcaaactcc tttgcaggac gctttttcac atcttcttca gggattacga cgcctttcat 120
acccagtttg ttccacagga cgaaccattg ctagttatct ccaaccatgg caactacctt 180
ctggatggcc tcgccttgtt ggccaccttt ccaggccaga tctccttttt gatggcacag 240
cccaatttca agactgcaat tggtggcatc gccaggaaga ttggtgccat tccagtactg 300
agaccacagg acgcggccag atatgacggt gcgagtatgg tcacaatcgc tcaggatggc 360
aactcagtcc tcggtcaggg gattggcaag cagctgactt tgggcgatac tgtctatatc 420
gagtgtggga cgttccagga cgctggcagg gacaatcgcg tcacgcaatg ttatggcgtg 480
gtcagtgcga tcgtcagtga caacgaggtg ttgttcaagg ctcccggttt gaaatggatt 540
cccgcatcct tgacatcgga acgcgacatt gcctatatca aatcgcgaaa gattgttcgg 600
catgggtcac tcaagatcag agtggaacgt ggcaacacct gggtcggaat caatgaggcg 660
cttaaagcac aggagcagca gaacaatggc tcgttggcaa gcagcgcaac ggggacgatc 720
ggcaagtttg ttcacaagat attttcaaag tcgccggatg cagacgcaag atcagatgat 780
gtgcatttgg ccgagaatgg gtattccgga gcagatatcc ccgggtcctt gaccgctcca 840
gccaactttc acacaactga gactacacca ctactcaaaa aggcgcgctc gtcaaacagc 900
tccagtcatc ctatatacac agtaccaaag cgcgcagact cgaacgcgag gctttcatca 960
tactctacca ctcacagcac aaatgcagtg gccgatgccg acaacgacga cgagaccacg 1020
cgccctgcaa atggacttag gaacgcgcaa ggcggacaca accccgctgg aaccaatggc 1080
gttgtcaatg gaggcgcatc cacatccatg agcccacgaa gcactccatt gacctcccct 1140
acacttcaca gctccacatc ggccgtgtca cacttcccct cgcgaccctg ccccttccag 1200
ttctcacacc caatcgacca ttctgtgatc tacgagagcg tctggaagaa ctttgaggat 1260
ggtcgcaccg ttgctgtatt ccctgaaggc gtatcgagcg acgattatca cttgctcgac 1320
ttcaaatatg gctgcaccat catggttctt ggatacctgg ctcagcatcg ctctaagact 1380
ctaaggatta taccatgcgg actgaacttc tttaatcgcc atcgatttcg atcccggttc 1440
tacgccgact actcccatcc gctcaccgtc cccgaccacc ttgtagagat gtatcgcgaa 1500
ggaggagaag ccaagaagca agcctgtact gagcttctgc agatgattca ctcggctgtg 1560
gaggggctga ctcttaacgc accaaactac gacgagctgc gactttacaa ggcaacgcga 1620
cgactctaca gcactgggaa gaagcttacc gtgccacaga aattggagct aactcgccgt 1680
tttgcgaaag gttatcaaaa tctggtcatg acgccgagca tggctgcatt gaaacgcgac 1740
attgatgctt atgacaagca tctctccagc agcggcgtcc gagacgcaca actgaccgca 1800
aacccaagca ttctggctgc ccttgtattc atattgcccg cgttattcct cttgccagtg 1860
ctgttcctgc tttcgttacc cgggacgttg ctcttcggac ctgttggact tttggcgtcg 1920
tgggcggcaa agcagaaagg acagcaggcc atgcttgcct ttcagtctta tctcccagtt 1980
tcacgttggc ctggccgaga tgtgatcgcc acctggaaga tcgtggtgtc cttggcgttg 2040
atgcccgtct gctttattct ggacgcaaca ctgctcacga tcctagcaca ccattgggaa 2100
gcactgcagg agtactggac tatgggtcgt ctagttgcgt tctggctgct gtcaacattt 2160
gtgatttttc caacgatggc gtatggtacg gtctggcttt gggagtggca gattgatttg 2220
aagatgcaga tctatgtatg gtggtggaag ctctgcggag gcaatgcaga gatgaagcgc 2280
tggagacagg atcttgtcga gagaatggat gcacttgtcg aaaggatggg cggtagaagg 2340
gtgtttgatg tatcgggcta ttattga 2367
<210> 11
<211> 2632
<212> DNA
<213> Mortierella alpina
<400> 11
gtttgtctct cgacctttcg tcatcactct ctcgtcgtca tcccagccag ccttttgctt 60
ctttttcatt tctttgccgc atggactaac ggctgacact ctcacgccct ctcctccatc 120
gcaaagtatt tcttgcactg cttgccctgt ttttaatcga ctcctcgtca agcaatcacc 180
tccagcggat cccaggtggc cgcagcccta taccccaact gccaatggaa ggagacgcag 240
tacggcctgc tttggccaga aagatccctg gtctctacag cttcatcaaa ctcctttgca 300
ggacgctttt tcacatcttc ttcagggatt acgacgcctt tcatacccag tttgttccac 360
aggacgaacc attgctagtt atctccaacc atggcaacta ccttctggat ggcctcgcct 420
tgttggccac ctttccaggc cagatctcct ttttgatggc acagcccaat ttcaagactg 480
caattggtgg catcgccagg aagattggtg ccattccagt actgagacca caggacgcgg 540
ccagatatga cggtgcgagt atggtcacaa tcgctcagga tggcaactca gtcctcggtc 600
aggggattgg caagcagctg actttgggcg atactgtcta tatcgagtgt gggacgttcc 660
aggacgctgg cagggacaat cgcgtcacgc aatgttatgg cgtggtcagt gcgatcgtca 720
gtgacaacga ggtgttgttc aaggctcccg gtttgaaatg gattcccgca tccttgacat 780
cggaacgcga cattgcctat atcaaatcgc gaaagattgt tcggcatggg tcactcaaga 840
tcagagtgga acgtggcaac acctgggtcg gaatcaatga ggcgcttaaa gcacaggagc 900
agcagaacaa tggctcgttg gcaagcagcg caacggggac gatcggcaag tttgttcaca 960
agatattttc aaagtcgccg gatgcagacg caagatcaga tgatgtgcat ttggccgaga 1020
atgggtattc cggagcagat atccccgggt ccttgaccgc tccagccaac tttcacacaa 1080
ctgagactac accactactc aaaaaggcgc gctcgtcaaa cagctccagt catcctatat 1140
acacagtacc aaagcgcgca gactcgaacg cgaggctttc atcatactct accactcaca 1200
gcacaaatgc agtggccgat gccgacaacg acgacgagac cacgcgccct gcaaatggac 1260
ttaggaacgc gcaaggcgga cacaaccccg ctggaaccaa tggcgttgtc aatggaggcg 1320
catccacatc catgagccca cgaagcactc cattgacctc ccctacactt cacagctcca 1380
catcggccgt gtcacacttc ccctcgcgac cctgcccctt ccagttctca cacccaatcg 1440
accattctgt gatctacgag agcgtctgga agaactttga ggatggtcgc accgttgctg 1500
tattccctga aggcgtatcg agcgacgatt atcacttgct cgacttcaaa tatggctgca 1560
ccatcatggt tcttggatac ctggctcagc atcgctctaa gactctaagg attataccat 1620
gcggactgaa cttctttaat cgccatcgat ttcgatcccg gttctacgcc gactactccc 1680
atccgctcac cgtccccgac caccttgtag agatgtatcg cgaaggagga gaagccaaga 1740
agcaagcctg tactgagctt ctgcagatga ttcactcggc tgtggagggg ctgactctta 1800
acgcaccaaa ctacgacgag ctgcgacttt acaaggcaac gcgacgactc tacagcactg 1860
ggaagaagct taccgtgcca cagaaattgg agctaactcg ccgttttgcg aaaggttatc 1920
aaaatctggt catgacgccg agcatggctg cattgaaacg cgacattgat gcttatgaca 1980
agcatctctc cagcagcggc gtccgagacg cacaactgac cgcaaaccca agcattctgg 2040
ctgcccttgt attcatattg cccgcgttat tcctcttgcc agtgctgttc ctgctttcgt 2100
tacccgggac gttgctcttc ggacctgttg gacttttggc gtcgtgggcg gcaaagcaga 2160
aaggacagca ggccatgctt gcctttcagt cttatctccc agtttcacgt tggcctggcc 2220
gagatgtgat cgccacctgg aagatcgtgg tgtccttggc gttgatgccc gtctgcttta 2280
ttctggacgc aacactgctc acgatcctag cacaccattg ggaagcactg caggagtact 2340
ggactatggg tcgtctagtt gcgttctggc tgctgtcaac atttgtgatt tttccaacga 2400
tggcgtatgg tacggtctgg ctttgggagt ggcagattga tttgaagatg cagatctatg 2460
tatggtggtg gaagctctgc ggaggcaatg cagagatgaa gcgctggaga caggatcttg 2520
tcgagagaat ggatgcactt gtcgaaagga tgggcggtag aagggtgttt gatgtatcgg 2580
gctattattg agcaacgttc atgtataaag tcatttggcc caattcttct cc 2632
<210> 12
<211> 2598
<212> DNA
<213> Mortierella alpina
<400> 12
atggaaggag acgcagtacg gcctgctttg gccagaaaga tccctggtct ctacagcttc 60
atcaaactcc tttgcaggac gctttttcac atcttcttca gggattacga cgcctttcat 120
acccagtttg ttccacagga cgaaccattg ctagttatct ccaaccatgg caactacctt 180
ctggatggcc tcgccttgtt ggccaccttt ccaggccaga tctccttttt gatggcacag 240
cccaatttca agactgcaat tggtggcatc gccaggaaga ttggtgccat tccagtactg 300
aggcaagtct ttgaaaaacc acaaaataca gagcgaaata gtgaccatag gctcgacata 360
tggggtggcg tgatctgcgc atcctgtctt ttcgtcaacc ctttttgctt tgcccacttg 420
ctgaccctgt gattatgctc tttgtccaat ctatagacca caggacgcgg ccagatatga 480
cggtgcgagt atggtcacaa tcgctcagga tggcaactca gtcctcggtc aggggattgg 540
caagcagctg actttgggcg atactgtcta tatcgagtgt gggacgttcc aggacgctgg 600
cagggacaat cgcgtcacgc aatgttatgg cgtggtcagt gcgatcgtca gtgacaacga 660
ggtgttgttc aaggctcccg gtttgaaatg gattcccgca tccttgacat cggaacgcga 720
cattgcctat atcaaatcgc gaaagattgt tcggcatggg tcactcaaga tcagagtgga 780
acgtggcaac acctgggtcg gaatcaatga ggcgcttaaa gcacaggagc agcagaacaa 840
tggctcgttg gcaagcagcg caacggggac gatcggcaag tttgttcaca agatattttc 900
aaagtcgccg gatgcagacg caagatcaga tgatgtgcat ttggccgaga atgggtattc 960
cggagcagat atccccgggt ccttgaccgc tccagccaac tttcacacaa ctgagactac 1020
accactactc aaaaaggcgc gctcgtcaaa cagctccagt catcctatat acacagtacc 1080
aaagcgcgca gactcgaacg cgaggctttc atcatactct accactcaca gcacaaatgc 1140
agtggccgat gccgacaacg acgacgagac cacgcgccct gcaaatggac ttaggaacgc 1200
gcaaggcgga cacaaccccg ctggaaccaa tggcgttgtc aatggaggcg catccacatc 1260
catgagccca cgaagcactc cattgacctc ccctacactt cacagctcca catcggccgt 1320
gtcacacttc ccctcgcgac cctgcccctt ccagttctca cacccaatcg accattctgt 1380
gatctacgag agcgtctgga agaactttga ggatggtcgc accgttgctg tattccctga 1440
aggcgtatcg agcgacgatt atcacttgct cgacttcaaa tatggctgca ccatcatggt 1500
tcttggatac ctggctcagc atcgctctaa gactctaagg attataccat gcggactgaa 1560
cttctttaat cgccatcgat ttcgatcccg gttctacgcc gactactccc atccgctcac 1620
cgtccccgac caccttgtag agatgtatcg cgaaggagga gaagccaaga agcaaggtaa 1680
ggaagaccaa aactgcctcc ctcacatatc gcagtctgtc gaagtttttc tcacatatct 1740
ctttttctct tagcctgtac tgagcttctg cagatgattc actcggctgt ggaggggctg 1800
actcttaacg caccaaacta cgacgagctg cgactttaca aggcaacgcg acgactctac 1860
agcactggga agaagcttac cgtgccacag aaattggagc taactcgccg ttttgcgaaa 1920
ggttatcaaa atctggtcat gacgccgagc atggctgcat tgaaacgcga cattgatgct 1980
tatgacaagc atctctccag cagcggcgtc cgagacgcac aactgaccgc aaacccaagc 2040
attctggctg cccttgtatt catattgccc gcgttattcc tcttgccagt gctgttcctg 2100
ctttcgttac ccgggacgtt gctcttcgga cctgttggac ttttggcgtc gtgggcggca 2160
aagcagaaag gacagcaggc catgcttgcc tttcagtctt atctcccagt ttcacgttgg 2220
cctggccgag atgtgatcgc cacctggaag atcgtggtgt ccttggcgtt gatgcccgtc 2280
tgctttattc tggacgcaac actgctcacg atcctagcac accattggga agcactgcag 2340
gagtactgga ctatgggtcg tctagttgcg ttctggctgc tgtcaacatt tgtgattttt 2400
ccaacgatgg cgtatggtac ggtctggctt tgggagtggc agattgattt gaagatgcag 2460
atctatgtat ggtggtggaa gctctgcgga ggcaatgcag agatgaagcg ctggagacag 2520
gatcttgtcg agagaatgga tgcacttgtc gaaaggatgg gcggtagaag ggtgtttgat 2580
gtatcgggct attattga 2598
<210> 13
<211> 3087
<212> DNA
<213> Mortierella alpina
<400> 13
atggcccttc agatctacga cttcgtgtcg ttcttcttca ctatcctgct cgacatcttc 60
ttcagggaga ttcgtcccag aggcgcacac aaaattccac aaaaaggacc cgtgatcttt 120
gttgccgctc ctcatgccaa tcaggtacgt gcacatgagg gctcgctttt ctcggagcgg 180
gcttcgtcca aaaagctgca caggctgaaa tgagagcgca tattcacctg gacacgggca 240
cagagttcat gcatgataag ccggatagca ggagccgaca ctgcagaaga gaccctctgg 300
accaacaaag aaaaacatca tgacggaact agccttctcc ggaagagcca atggacgtca 360
ttggtagacg caaccgttcc aactaaccgg cgctcttgtc ctcatagttt gtcgatcctc 420
tcgtcttgat gcgtgagtgt ggccgtagag tctcattcct tgcggccaaa aagtctatgg 480
accgccggtg gattggtgct atggcacgct cgatgaatgc gagtaagttg cttggacttt 540
gacacgaaac tgttgccacg tcaagaatat tcccaccctc ccgactcgac cacctccagc 600
tctcacctac acacacaaaa caggaaattt cagtgttctt caaggctttg gtggtgcttc 660
gaatggcgct acaaaaggcc tgctctaggg tgatagagtg ttggctttga tccttccgac 720
attctcggct cccttaccaa gacatttgtc ctgaatgctg attgatccga cactgctgaa 780
ccattcctac tcatagttcc tgttgaacgc ccgcaggatc ttgctaaagc gggttcggga 840
gtcatcaaac ttttggatcg ctatggtgat cctcttcgag tgacaggtgt cggcactaaa 900
ttcacaaagg agctacttgt gggagatcag atatctctcc caaaggacgt tggctcctca 960
gccgtggtcg agatcatatc tgataccgag ctgattgtca agaaggaatt caaggagctc 1020
aaggccctcg aattattgac cagccctgat ggaaccaagt ataaatgcct acctcacatg 1080
gaccagacga atgtatacaa aactgtcttt gagcgcctca acgctggaca ttgcgttggc 1140
attttccccg aaggtggatc ccacgatcgc gctgagatgc tgccattgaa aggtacgtgt 1200
gctcgtgctt ctgcacagag cagagtagtt gatatggaac agaagaaaaa agacacgcga 1260
ccagctttga ttaacagcca cgtgtttcct ttacctttgc gaaacattat agctggagtc 1320
accatcatgg ctctgggcgc gttggccgcc aacccttcgt tggacctcaa gattgtcacc 1380
tgcggcctca actactttca tcctcatcgc ttccgctcgc gtgcagtggt cgagtttggc 1440
gagccactga cggtccctcc tgagctggtc gaaatgtaca agcgaggcgg ggctgagaag 1500
cgtgaagcgt gcggaaagtt gctggataca atctatgagg ctcttcgcgg tgtcactctc 1560
aatgcacctg attacgaaac gttgatggta tggagcaaag gaccatagcg tggatgaagg 1620
aggacgtgga aaggacaagc accgctcaca gatttctcac tcttgtattt gtgattatct 1680
ctaggtcatt caagcggccc gtcgccttta caagcccact catcgcaagc tgcagatctc 1740
acaagtcgtg gagttgaacc gcaggttcgt cgcaggatac atgcacttca aggacaaccc 1800
taaagtcatt gaagccaagg acaaggtcat gcattacaac actcaacttc gataccatgg 1860
actgcgcgat catcaggtga acattcgcac aaccaggaaa cacgctatcg gcatgctcat 1920
ctcacggctc attcagatga tctttttgag ttgtctggct ctacctgggt aagcacagct 1980
tgaatctcga ccaggtcccg caatgatccc attgcggaga agtcactgac gcttgctctt 2040
cccgtgcttt tttgaataga accctgatga atcttccggt cgctattgtc gctcgtgtca 2100
tcagcaacaa gaaggccaaa ggtacgcctt gcggtttgtt atcttttcgt gtttgctttt 2160
gtgctcgcca ctggaaacta atatttctac atcactctgc aactggtaga ggcgctggct 2220
gcctcgacag tcaagattgc tggaagggat gtcctggcta catggaagct gctggtcgct 2280
ctaggattga tgcctgtcct ctacttcaca tattccgtca tggtctttat ctattgtggc 2340
cgcttcgaca tatcgttcaa gtcgcgtctc ttgatcgctt gggcagcatg ggcgctaatt 2400
cctttcgtaa cgtatgcaag catacgcttc ggtgaagttg gtatcgatat tttcaaatct 2460
atccgcccat tgttcttgtc catcatccca ggtgaagaga gcacgatcaa cgacttgcgc 2520
aaagcccgag cggaactcca gaagactatc accaatctta tcaatgagct ggcgccgcag 2580
atttatcccg actttgattc gaagcgcatc ctcgatccgt ctcctgcaga tcgccccagc 2640
cgctcggcat caggtaccaa ccttgcacag acaatcttca acacggccgc tcagcctttg 2700
aaccaatggc taggcaagga cggccgcttt gaatgggagc gcaccgagga ttcggatgca 2760
gatgatgtgt tcttcttttt ggacccagca agaggaattc ttggacggtc gagggcgtcg 2820
tcctggggag gaggggcatt tacacctgcc gccgatgggt cgcgatcccg gaatcggagc 2880
aggacaagca gcttcacgtc gggacagatc cagcttggcg agggcttcaa actcgaggca 2940
ttgacggaac tgccgaggga caagcctttt gcagaggtga cgaggcggct gagtgtgagc 3000
cgcatgcaga gatacgggtt ggagggtatg acgcgctcgg acacggacga aaacgaaggc 3060
tctacagcca agtcaaaaga tatctag 3087
<210> 14
<211> 3280
<212> DNA
<213> Mortierella alpina
<400> 14
atgggtctcc agatctatga cttcgtctca ttcttcttca ccctcctgct cgacatcttc 60
ttcagggaaa tccgtcctcg gggggcccac aagatccccc gacaaggacc cgtcattttt 120
gtcgccgccc ctcatgccaa tcaggtaggc cattgtcttt aatttggaag cttaaagtca 180
ccactttatg cgcaagagcc tcatggtccg taaggtacta atcgctgctt gcatgaaact 240
agtttgttga tccactcgtg ttgatgcgcg aatgtggccg acgagtctcg ttcctggctg 300
ccaaaaagtc aatggaccgt cgctggatag gcgccatggc gcgttccatg aatgccagta 360
agtacaaaaa aaaaaaaaaa aaaaaaaaaa aacgacctat tcggcgtgag agtggcaacg 420
aaggggagag agatacacaa acgggccttt tgagtgcgtg tgtgcgtggg aaaagaatac 480
gagaacattc tcttgccagc aaaacgcgct tcctttctct tttctccgac gttgttgatg 540
gcgccttttg tatacacttc ctatccatcg tccctatccg agagatcaag gttttctgcg 600
tcgtgttatt ttaggccact ccgccgagat aacagacacg agctactgac cgattcaacg 660
agggttcaca caccgtccac aaccacctga gaaatgtgca ggccatgacg agtgtcgtgt 720
gccgtttctt ctttgatacc ataccgctcc tgcagtcatg ggccatccgt tatgccctga 780
cctcagcatt ggaatctgac gtttttttct gctcgctctc ttgtcatctg cgttagttcc 840
tgtggagcgt cctcaggact tggctaaggc tggttcggga acgatcaaac tggtggatcg 900
ctatggcgac cctctccgca tcactgggct cggtaccaaa ttcacaaagg aactctttgt 960
cggcgaccag atttcgctcc caaaggacgt tggaacctcg gctgtggtcg agatcatctc 1020
ggacactgaa ctgattgtca agaaagagtt caaggagctc aaggcactgg agcttttaac 1080
cagtgctgag ggatccaagt acaagtgcat gcctcacatg gaccagagca aggtctacaa 1140
gactgttttt gaacgcttaa atgctggcca ttgtgttggc atctttcctg aaggaggttc 1200
acacgatcgt gcagagatgc tgcccctgaa aggtaagcgc ccctcgtgag catcccaaca 1260
taacgggaat taccccacac ttgccttgtc cttgcgcatc tctgtatgaa cgtacactga 1320
ttgcattgca tatctccgtt tggattggat agctggtgtc accatcatgg cgcttggcgc 1380
actggccgct aaccctgacc tggaccttaa aattgtgacc tgcggcctga actatttcca 1440
cccccatcga ttccgttctc gcgccgttgt tgagtttggt gagcctttga ccgtgcctcc 1500
agaacttgtc gagatgtaca agaggggtgg agctgagaag cgcgaggcct gcggaaagct 1560
cctcgacacc atctacgatg cactcaagaa tgtcacactg aacgcccccg attacgaaac 1620
actcatggtg aggattggcg gtgtttttgc atgcggctta tgtcatttgg agcaattgag 1680
accaacgtta acttaaaggg ctttaatatg gctggactgg atgtaggtta ttcaagctgc 1740
ccgccgtctc tacaagccaa cacatcgcaa gctgcagatc tctcaagttg tggagttgaa 1800
ccgtcgcttc gtcgctggtt atctgcactt tcaggacaac ccaaaggtga ttgatacaaa 1860
ggacaaagtt atgcactaca acactcagct acgctatcat ggacttcgcg accaccaggt 1920
caacatccgc acaactcggc gacatgccat tgaactattg atttggcgag ttgtgcagat 1980
ggtctttttg agtctactag cgcttccagg gtaagaacga atgcagcagt ggtgtcatgt 2040
cacagacttt tgtgtgggcg gttagattga ggctagcact acttcacgcg attggatatt 2100
agactaacgc tttctctact tttagtacca tgatgaatct tccagttgcc atcgttgctc 2160
gcatcatcag caacaagaag gccaagggta tgtaatcgtc gcaatgacag cgacaaatct 2220
tttgattatc gggagaatgg cgtcagagga aaaaggccaa ggctaacgct ataatcattt 2280
tcacaattta acagaggctt tggctgcatc gaccgtgaaa attgcaggaa gggacgttct 2340
agccacatgg aagttgcttg tggccctggg attgatgccc gtcctttact tttcgtactc 2400
gtttgttatc tttttgctgt gtggacggtt cgacattacg ctcaagaccc gcctcctgat 2460
cgcttgggcg gcttgggcct gcattccgtt tgtgacctac gccagtatcc gtttcggtga 2520
ggtgggtatc gatatcttca agtcgatccg tcctctcttc ttgtcaatca ttcccggcga 2580
ggaaaacacg atcaatgagc tccgcaagtc gcgtgcagag cttcaaaaga ccatcaacga 2640
gctcatcaat gagctggcgc cggaaatata ccccgacttt gattccaaac gaatcttgga 2700
cccttcgcca aacgatcgac ccagccgcgg cgcgtcgcgc tccgcctcgg gcaccaacct 2760
tgcgcagacc attttcaaca ccatgaacac ggccacacag ccgctaaacc aatggctcgg 2820
tatggatggg cgcttcgagt gggagcgtgt ggacgactcg gatgcggacg acgtgttctt 2880
tttcctcaac cctgcaggag ccatccaagg gcgatcgagg acgtcttctt ggggtgctgg 2940
agcatggacg ccttcgtctg ctggcgatgg ttctcggtct cggtcaagga gtcgcagtcg 3000
gacgagctcg tttgcgtcag ggcagattca gctgggcgaa gggttcaagc tggaggcatt 3060
gacagagctg ccaaaggata agccttttgg cgaggtgaca cgacgactca gcttgagtcg 3120
caagcagaag catggactgg tgggcgacat gaccaaggat cccgaggaga ttgagaagca 3180
gggcggattt atgcatgagg gacactttgt cagcacaccg cccatcacgg ttcagaacat 3240
ggatgatcct atggatgcag tcaagtctaa ggaggcataa 3280
<210> 15
<211> 2896
<212> DNA
<213> Mortierella alpina
<400> 15
atggccaaac ttcggaagcg gacctcccag tcaaaggagg gcgccgctga caccaacggc 60
acaaggcgag acagcgtcga tgacacgaac agcgtcggca gctacgatcc acgcgccctc 120
tccaacgatc caccaaagat gtacagggcg atccggttct tcttcaagat gtgcctgcac 180
tccttctatg gccatgtgga ggtcgagggc accgagaata ttgcaccaaa caactaccct 240
gctatccttg gtaacgttct taggacaaat attcctttgc aggatgatca cacattatgt 300
catggccttt ggtcttgaaa tgttagtcta accgttcgga tgcacactcg tcgatagttg 360
cgaaccacag caacagtttg acggatgcga ttgccattat gtcgactgtt cctcccaaga 420
gcaggagcat gattaggatg accgcaaagg acacgttttg gcataagcca ggcgtcttca 480
agtatgcact gccagcctag cctgaacaca cctcgtccga tgcctccttt cactgaccgg 540
atatcttttt tgtctttgaa tggcgcgccc tcctcgtgca ctcttcgtct ccttctccgt 600
tattgatagt tatgtcatca aaaacgctgg cactgtcccg atcaaaagac gcaaggatta 660
tgagaaccaa aaggtcgaca acactgacgc gatgggtgca ttgatcgata cccttggagc 720
aggaagttgt gtatggtaag tggagggtcc ttgtctgcat accgcgctgc acttgaaggc 780
tttctacact tccaatgaca gggatagctg cactgcatgt ttgattgtaa agcgtaacat 840
agagagaaga gggggaagag ggggtgggga aaactgaatc aatatcaagg accatatgaa 900
tatgattcaa agcactggtt gcaatgctgt gttgttttgc atgaaaaacg cagctccttg 960
cctcgactca cccctgcatc ttcatatacc accttccaac cgcaaaaaaa aatcaaagca 1020
tgttcccgga gggcatctcg cgctatcacc cacaacttgc tccgttcaag gccggtgtcg 1080
ccatgattgc cagcgatgta agtgttcgct tgatgaactt ttattatttt tgacgttccg 1140
accgtgctgg ctcctcgcga ctgcaactgt gatttgtcat ggcaaatacc acagcgctct 1200
cactgacatg aattttcatg ctctctttca cgctcctctg tctctcatgc ttgccctaat 1260
attcttttgt acacgaccga tgatacacga ccgatgatac acgacggggg ggtttctcgg 1320
tttgcgacat tgtgccatgg atgtgtttgt ctcaattaga cgctctcccg gtttcaagac 1380
acgcccgatt tttctctcac gctcatgaca gcgtcgatca actatcttca ccgtgaaaag 1440
ttccgatctg atgttctcgt cacgttccat gcacccattg tgctaacccc gcaacaagac 1500
tcgaagctgt tttcgactga cctggaagtc aagaaggaag cgatccgaaa actgacagag 1560
ttgctcgagg gcaccgtccg atcaactcta ctggatgccg aggactggca aacagtccga 1620
gtgggtcatg ttgccaggaa gctctatgct ggcgatctgg gaactcggat ttcgctggga 1680
cagtacgtgc gtttgaccag gaagtttgtc acggcgttca gtcagcacaa gcaggaggag 1740
gaggcagcgg tcgatgacga gcgttatggt caggagaagc acgggggcgg tgccgagagg 1800
aatggtgatt ctttggagat gaggcatcct gagcgcatgg ataaggcgac tagaaagaaa 1860
atcgacgagc tcgccaggga tttggctgta agcatgagta attcattcag tcgtctcaca 1920
cacggcatgc tctttcaaaa gtggacgcta acggatacat tattcttatt tttattttct 1980
tgacggtgat cataacagga ctaccaaaac cagctggact tctatcacct caaggactat 2040
cgtatcaagc aaggcaagcc aagtgcaaag attcttatcg gacgtctttt ccaaagattc 2100
ttgcttgctt gccttttgtc gaccatttgc attcctggac tgttcctttg ggcacctgtg 2160
tttatcgccg tgaagtacgc aagacattgg gttgacactg ataccttgcc aacaattaag 2220
cacgaactct ccttctcgat acctgctatt tttaacactg atgtaatcgt ctcttttttt 2280
ttctctctag gtacaaagag agtcagctta ggcgcaaggg acccttggag gacaacttgg 2340
atgaaattgc ccagtacaag ttgatgatct cgactttctt cttgccgatc atctgggggt 2400
tctggatcgt aatgaccttg ccaattgcgc tctttagcgc gccgggcatc gttgttctga 2460
tgtggctgta agtcaagaga ggaagaagat gcatatcaag accttttcaa gttatcaaga 2520
cactatgact attgctgcga cgaagactaa cttatatttc cattgtgcgt gtgatagtac 2580
gatccgctgg cttgaggact tgatccacaa cgcgaaatcg atgttgtccc ttttgcgatt 2640
gctgtttatg acggaggata ccatgtactc gttgagagac taccgtcagg ggctggcgca 2700
tcgtgtgcac gattttgcgg tcgatcatct gaagttgcct gaggaccctg aggttctggt 2760
caaggagaac aagaccaaga aggtcgacag tggctggatg ggcaagttgt cgggcagcta 2820
cttctcgatc aagaggagaa gaagaaagga ctggaacgag gttatgcgat tgcacgatgt 2880
ttctcactat gactga 2896
<210> 16
<211> 29
<212> DNA
<213> Artificial sequence
<220>
<223> primer GPAT4-S
<400> 16
caaggatgtt gttgatgagg aaggcgaag 29
<210> 17
<211> 28
<212> DNA
<213> Artificial sequence
<220>
<223> primer SacI-GPAT41
<400> 17
gagctcatgc ccatcgttcc agctcagc 28
<210> 18
<211> 29
<212> DNA
<213> Artificial sequence
<220>
<223> primer Sal-GPAT4-2
<400> 18
gtcgacttat aatttcgggg cgccatcgc 29
<210> 19
<211> 28
<212> DNA
<213> Artificial sequence
<220>
<223> primer GPAT5-1F
<400> 19
ttccctgaag gcgtatcgag cgacgatt 28
<210> 20
<211> 24
<212> DNA
<213> Artificial sequence
<220>
<223> primer GPAT5-3R
<400> 20
caaatgttga cagcagccag aacg 24
<210> 21
<211> 835
<212> PRT
<213> Chaetomium globosum
<400> 21
Met Ala Pro Asp Asp Arg His Asp Ser Ala Pro Asp Leu Arg Ile Leu
1 5 10 15
Gly Asp Arg Ile Thr Leu Gln Pro Ser Gly Phe Val Glu Pro Glu His
20 25 30
Thr Gly Glu Gly Lys Glu Glu Ala Leu Met Lys Asn Met Ala Arg Phe
35 40 45
Arg Ser Glu Pro Leu Arg Phe Leu Arg Glu Val Ser Leu Tyr Val Ser
50 55 60
Gly Thr Gly Trp Arg Ala Tyr Asp Asn Val Ile Gly Gln Pro Ile Phe
65 70 75 80
Tyr Ser Gly Phe Ser Glu His Ile Lys Thr Glu Met Met Ser Ala Thr
85 90 95
Leu Leu Gln Thr Lys Ile Ala Gln Leu Ala Asp Met Arg Val Ala Val
100 105 110
Glu Glu Lys Glu Gly Leu Leu Asn Gly Ser Asp Ser Asp Leu Ala Ala
115 120 125
Lys Lys Ala Arg Arg Arg Ala Ala Leu Val Gln Asn Leu Gln Glu Val
130 135 140
Ala Glu Lys Leu Ala Asp Asn Met Ile Cys Lys Phe Asp Ser Lys Pro
145 150 155 160
Phe Ile Arg Gly Ala Tyr Tyr Leu Val Thr Gln Leu Leu Leu Arg Ala
165 170 175
Tyr His Gln Gly Ile His Val Ser Ser Glu Glu Val Leu Arg Leu Arg
180 185 190
Ser Val Ala Glu Glu Ala Ala Arg Lys Lys Gln Ser Ile Ile Phe Leu
195 200 205
Pro Cys His Arg Ser His Val Asp Tyr Val Ser Leu Gln Leu Leu Cys
210 215 220
Tyr Arg Leu Gly Leu Ala Leu Pro Val Val Val Ala Gly Asp Asn Leu
225 230 235 240
Asn Phe Pro Val Val Gly Ser Phe Leu Gln His Ala Gly Ala Met Tyr
245 250 255
Ile Arg Arg Ser Phe Gly Asp Asp Gln Leu Tyr Ser Thr Leu Val Gln
260 265 270
Thr Tyr Ile Asp Val Met Leu Gln Gly Gly Tyr Asn Leu Glu Cys Phe
275 280 285
Ile Glu Gly Gly Arg Ser Arg Thr Gly Lys Leu Leu Pro Pro Lys Phe
290 295 300
Gly Ile Leu Asn Phe Val Leu Asp Ser Leu Leu Ser Gly Arg Val Glu
305 310 315 320
Asp Ala Ile Ile Cys Pro Val Ser Thr Gln Tyr Asp Lys Val Ile Glu
325 330 335
Thr Glu Gly Tyr Val Thr Glu Leu Leu Gly Val Pro Lys Lys Lys Glu
340 345 350
Asn Leu Ala Asp Phe Leu Thr Gly Gly Ser Ser Ile Leu Ser Leu Arg
355 360 365
Leu Gly Arg Val Asp Val Arg Phe His Glu Pro Trp Ser Leu Arg Gly
370 375 380
Phe Ile Asp Glu Gln Leu Ser Arg Leu Ser Lys Met Pro Ser Ala Ile
385 390 395 400
Asn Val Asp Trp Arg Asp Met Lys Asn Gln Met Leu Arg Gln Lys Leu
405 410 415
Leu Arg Thr Leu Gly Tyr Lys Val Leu Ala Asp Ile Asn Ala Val Ser
420 425 430
Val Val Met Pro Thr Ala Leu Ile Gly Thr Val Leu Leu Thr Leu Arg
435 440 445
Gly Arg Gly Val Gly Arg Arg Glu Leu Ile Leu Arg Val Glu Trp Leu
450 455 460
Thr Asn Arg Val Arg Ala Lys Gly Gly Arg Val Ala His Phe Gly Asn
465 470 475 480
Ala Pro Leu Ser Asp Val Val Gln Arg Gly Leu Asp Val Leu Gly Lys
485 490 495
Asp Leu Val Gly Val Val Glu Gly Leu Pro Glu Pro Thr Tyr Tyr Ala
500 505 510
Val Asp Arg Phe Gln Leu Ser Phe Tyr Arg Asn Met Thr Ile His Leu
515 520 525
Phe Ile Ser Glu Thr Leu Val Ala Thr Ala Leu Tyr Thr Lys Val Lys
530 535 540
Gln Gly Gly Gly Pro Ser Ile Gln Asp Ile Pro Tyr Arg Asp Leu Ser
545 550 555 560
Asp Gln Val Leu Phe Leu Ser Ser Leu Phe Arg Gly Glu Phe Ile Tyr
565 570 575
Ser Gly Glu Gly Leu Ala Thr Asn Leu Glu Arg Thr Leu Leu Gly Leu
580 585 590
Glu Ala Asp Asn Val Ile Leu Leu Glu Arg Asp Glu Glu Gly Asn Ile
595 600 605
Thr Lys Val Gly Leu Ser Gly Ala Glu Arg Ala Ala Gly Arg Glu Asn
610 615 620
Phe Asp Phe Tyr Cys Phe Leu Ile Trp Pro Phe Ile Glu Ala Ser Trp
625 630 635 640
Leu Ala Ala Val Ser Leu Met Gly Leu Val Pro Pro Ala Gly Gln Lys
645 650 655
Asp Asp Ile Trp Val Gln Val Ser Lys Ala Gln Asp Ser Ala Gln Leu
660 665 670
Leu Gly Lys Thr Leu Tyr His Gln Gly Asp Leu Ser Tyr Phe Glu Ala
675 680 685
Val Asn Lys Glu Thr Leu Lys Asn Ser Tyr Gln Arg Phe Ala Glu Glu
690 695 700
Gly Ile Ile Gln Val Val Lys Ser Lys Asp Thr Arg Ile Pro Pro Arg
705 710 715 720
Leu Arg Ile Ala Pro Glu Trp Arg Pro Gly Arg Asp Lys Glu Thr Gly
725 730 735
Glu Leu Leu Pro Ala Gly Arg Leu Trp Asp Phe Thr Glu Lys Ile Ala
740 745 750
Ser Ser Arg Arg Glu Gly Lys Asn Arg Arg Asp Gly Ala Thr Val Ser
755 760 765
Ser Arg Val Leu Arg Leu Thr Asn Glu Leu Gly Arg Lys Leu Phe Glu
770 775 780
Glu Ala Val Glu Gly Glu Thr Gly Lys Gly Lys Gly Lys Gly Lys Gly
785 790 795 800
Lys Ala Ala Val Pro Ala Arg Leu Ser Ser Glu Asp Glu Arg Ser Leu
805 810 815
Ser Arg Thr Val Arg Glu Gln Glu Arg Lys Arg Lys Leu Glu Arg Arg
820 825 830
Ala His Leu
835
<210> 22
<211> 807
<212> PRT
<213> Escherichia coli
<400> 22
Met Ser Gly Trp Pro Arg Ile Tyr Tyr Lys Leu Leu Asn Leu Pro Leu
1 5 10 15
Ser Ile Leu Val Lys Ser Lys Ser Ile Pro Ala Asp Pro Ala Pro Glu
20 25 30
Leu Gly Leu Asp Thr Ser Arg Pro Ile Met Tyr Val Leu Pro Tyr Asn
35 40 45
Ser Lys Ala Asp Leu Leu Thr Leu Arg Ala Gln Cys Leu Ala His Asp
50 55 60
Leu Pro Asp Pro Leu Glu Pro Leu Glu Ile Asp Gly Thr Leu Leu Pro
65 70 75 80
Arg Tyr Val Phe Ile His Gly Gly Pro Arg Val Phe Thr Tyr Tyr Thr
85 90 95
Pro Lys Glu Glu Ser Ile Lys Leu Phe His Asp Tyr Leu Asp Leu His
100 105 110
Arg Ser Asn Pro Asn Leu Asp Val Gln Met Val Pro Val Ser Val Met
115 120 125
Phe Gly Arg Ala Pro Gly Arg Glu Lys Gly Glu Val Asn Pro Pro Leu
130 135 140
Arg Met Leu Asn Gly Val Gln Lys Phe Phe Ala Val Leu Trp Leu Gly
145 150 155 160
Arg Asp Ser Phe Val Arg Phe Ser Pro Ser Val Ser Leu Arg Arg Met
165 170 175
Ala Asp Glu His Gly Thr Asp Lys Thr Ile Ala Gln Lys Leu Ala Arg
180 185 190
Val Ala Arg Met His Phe Ala Arg Gln Arg Leu Ala Ala Val Gly Pro
195 200 205
Arg Leu Pro Ala Arg Gln Asp Leu Phe Asn Lys Leu Leu Ala Ser Arg
210 215 220
Ala Ile Ala Lys Ala Val Glu Asp Glu Ala Arg Ser Lys Lys Ile Ser
225 230 235 240
His Glu Lys Ala Gln Gln Asn Ala Ile Ala Leu Met Glu Glu Ile Ala
245 250 255
Ala Asn Phe Ser Tyr Glu Met Ile Arg Leu Thr Asp Arg Ile Leu Gly
260 265 270
Phe Thr Trp Asn Arg Leu Tyr Gln Gly Ile Asn Val His Asn Ala Glu
275 280 285
Arg Val Arg Gln Leu Ala His Asp Gly His Glu Leu Val Tyr Val Pro
290 295 300
Cys His Arg Ser His Met Asp Tyr Leu Leu Leu Ser Tyr Val Leu Tyr
305 310 315 320
His Gln Gly Leu Val Pro Pro His Ile Ala Ala Gly Ile Asn Leu Asn
325 330 335
Phe Trp Pro Ala Gly Pro Ile Phe Arg Arg Leu Gly Ala Phe Phe Ile
340 345 350
Arg Arg Thr Phe Lys Gly Asn Lys Leu Tyr Ser Thr Val Phe Arg Glu
355 360 365
Tyr Leu Gly Glu Leu Phe Ser Arg Gly Tyr Ser Val Glu Tyr Phe Val
370 375 380
Glu Gly Gly Arg Ser Arg Thr Gly Arg Leu Leu Asp Pro Lys Thr Gly
385 390 395 400
Thr Leu Ser Met Thr Ile Gln Ala Met Leu Arg Gly Gly Thr Arg Pro
405 410 415
Ile Thr Leu Ile Pro Ile Tyr Ile Gly Tyr Glu His Val Met Glu Val
420 425 430
Gly Thr Tyr Ala Lys Glu Leu Arg Gly Ala Thr Lys Glu Lys Glu Ser
435 440 445
Leu Pro Gln Met Leu Arg Gly Leu Ser Lys Leu Arg Asn Leu Gly Gln
450 455 460
Gly Tyr Val Asn Phe Gly Glu Pro Met Pro Leu Met Thr Tyr Leu Asn
465 470 475 480
Gln His Val Pro Asp Trp Arg Glu Ser Ile Asp Pro Ile Glu Ala Val
485 490 495
Arg Pro Ala Trp Leu Thr Pro Thr Val Asn Asn Ile Ala Ala Asp Leu
500 505 510
Met Val Arg Ile Asn Asn Ala Gly Ala Ala Asn Ala Met Asn Leu Cys
515 520 525
Cys Thr Ala Leu Leu Ala Ser Arg Gln Arg Ser Leu Thr Arg Glu Gln
530 535 540
Leu Thr Glu Gln Leu Asn Cys Tyr Leu Asp Leu Met Arg Asn Val Pro
545 550 555 560
Tyr Ser Thr Asp Ser Thr Val Pro Ser Ala Ser Ala Ser Glu Leu Ile
565 570 575
Asp His Ala Leu Gln Met Asn Lys Phe Glu Val Glu Lys Asp Thr Ile
580 585 590
Gly Asp Ile Ile Ile Leu Pro Arg Glu Gln Ala Val Leu Met Thr Tyr
595 600 605
Tyr Arg Asn Asn Ile Ala His Met Leu Val Leu Pro Ser Leu Met Ala
610 615 620
Ala Ile Val Thr Gln His Arg His Ile Ser Arg Asp Val Leu Met Glu
625 630 635 640
His Val Asn Val Leu Tyr Pro Met Leu Lys Ala Glu Leu Phe Leu Arg
645 650 655
Trp Asp Arg Asp Glu Leu Pro Asp Val Ile Asp Ala Leu Ala Asn Glu
660 665 670
Met Gln Arg Gln Gly Leu Ile Thr Leu Gln Asp Asp Glu Leu His Ile
675 680 685
Asn Pro Ala His Ser Arg Thr Leu Gln Leu Leu Ala Ala Gly Ala Arg
690 695 700
Glu Thr Leu Gln Arg Tyr Ala Ile Thr Phe Trp Leu Leu Ser Ala Asn
705 710 715 720
Pro Ser Ile Asn Arg Gly Thr Leu Glu Lys Glu Ser Arg Thr Val Ala
725 730 735
Gln Arg Leu Ser Val Leu His Gly Ile Asn Ala Pro Glu Phe Phe Asp
740 745 750
Lys Ala Val Phe Ser Ser Leu Val Leu Thr Leu Arg Asp Glu Gly Tyr
755 760 765
Ile Ser Asp Ser Gly Asp Ala Glu Pro Ala Glu Thr Met Lys Val Tyr
770 775 780
Gln Leu Leu Ala Glu Leu Ile Thr Ser Asp Val Arg Leu Thr Ile Glu
785 790 795 800
Ser Ala Thr Gln Gly Glu Gly
805
<210> 23
<211> 1092
<212> PRT
<213> Ustilago maydis
<400> 23
Met Thr Gly Thr Ser Asn Leu Pro Ala Ala Ser Ser Gln Asp Ser Ala
1 5 10 15
Val Ile Thr Thr Leu Ser Ser Pro Ser Glu Ala His Leu Ser Thr Ala
20 25 30
Ser His Pro Ser Ala Ala Ala Ser Ser Thr Ala Ser Ala Gln His Pro
35 40 45
Pro Thr Ile Asp Thr His Pro Thr Arg Leu Ser Ser Asn Asp Pro Leu
50 55 60
Lys Lys His Pro Asn Thr Ala Ile Ala Lys Gly Thr Ala Ala Glu Val
65 70 75 80
Gly Ser Lys Gln Lys Glu Phe Gln Arg Arg Ala Gln His Leu Ser Leu
85 90 95
Thr Ser Lys Pro Ile Pro Tyr Ala Arg Gln Gly Asp Ser Pro Arg Leu
100 105 110
Leu Val Val Leu Lys Asp Phe Asp Arg Leu Leu Arg Ser Leu Pro Ile
115 120 125
Pro Leu His His Ile Val Pro Thr Ile Val Ala Arg Phe Ile Cys Arg
130 135 140
Val Phe Arg Ser Gln Asn Ile Met Ala Ser Asn Ile Ala Phe Asp Ile
145 150 155 160
Ala Leu Phe Phe Trp Arg Ile Ile Ile Asn Leu Phe Phe Arg Glu Ile
165 170 175
Arg Pro Arg Ser Ser Trp Arg Ile Pro Arg Glu Gly Pro Val Ile Phe
180 185 190
Val Ala Ala Pro His His Asn Gln Phe Leu Asp Pro Leu Leu Leu Ala
195 200 205
Ser Glu Val Arg Arg Ala Ser Gly Arg Arg Val Ala Phe Leu Ile Ala
210 215 220
Glu Lys Ser Ile Lys Arg Arg Phe Val Gly Ala Ala Ala Arg Ile Met
225 230 235 240
Gln Ser Ile Pro Val Ala Arg Ala Ala Asp Ser Ala Lys Ala Gly Lys
245 250 255
Gly Tyr Ile Ser Leu His Pro Ser Gly Asp Pro Leu Leu Ile Gln Gly
260 265 270
His Gly Thr Ala Phe Lys Ser Gln Leu Gln Leu Lys Gly Gln Ile Met
275 280 285
Leu Pro Lys Ala Cys Gly His Ala Thr Val Glu Val Val Glu Val Ile
290 295 300
Ser Asp Thr Glu Leu Lys Ile Lys Lys Glu Phe Lys Asp Pro Arg Ala
305 310 315 320
Leu Asp Met Leu Arg Gly Lys Val Pro Gln Pro Glu Pro Thr Lys Ser
325 330 335
Asp Lys Lys Pro Ser Lys Ser Ser Ser Ser Lys Ala Leu Glu Lys Val
340 345 350
Ala Ala Asp Leu Phe Glu Asn Gln Gly Cys Arg Tyr Ser Cys Leu Pro
355 360 365
Phe Val Asp Gln Thr Gln Met Tyr Ala Lys Val Tyr Asp Lys Leu Ala
370 375 380
Glu Gly Gly Cys Leu Gly Ile Phe Pro Glu Gly Gly Ser His Asp Arg
385 390 395 400
Thr Asp Leu Leu Pro Leu Lys Ala Gly Val Val Ile Met Ala Leu Gly
405 410 415
Ala Met Ser Ala Asn Arg Asp Leu Asn Val Arg Ile Val Pro Val Gly
420 425 430
Leu Ser Tyr Phe His Pro His Lys Phe Arg Ser Arg Ala Val Val Glu
435 440 445
Phe Gly Ala Pro Ile Asp Val Pro Arg Gln Leu Val Gly Gln Phe Asp
450 455 460
Glu Gly Gly Glu Gly Lys Arg Lys Ala Val Gly Gln Met Met Asp Ile
465 470 475 480
Val Tyr Asp Gly Leu Lys Gly Val Thr Leu Arg Ala Pro Asp Tyr Glu
485 490 495
Thr Leu Met Val Val Gln Ala Gly Arg Arg Leu Tyr Arg Ala Pro Gly
500 505 510
Gln Ser Leu Ser Leu Gly Gln Thr Val Ala Leu Asn Arg Lys Phe Ile
515 520 525
Met Gly Tyr Leu Gln Phe Lys Asp Glu Pro Arg Val Val Lys Leu Arg
530 535 540
Asp Glu Val Leu Arg Tyr Asn Lys Lys Leu Arg Tyr Ala Gly Leu Arg
545 550 555 560
Asp His Gln Val Glu Arg Ala Thr Arg Ala Gly Trp Arg Ser Leu Gly
565 570 575
Leu Leu Ala Tyr Arg Leu Gly Leu Leu Gly Leu Trp Gly Gly Leu Ala
580 585 590
Leu Pro Gly Ala Val Leu Asn Ser Pro Ile Ile Ile Leu Ala Lys Ile
595 600 605
Ile Ser His Lys Lys Ala Lys Glu Ala Leu Ala Ala Ser Gln Val Lys
610 615 620
Val Ala Gly Arg Asp Val Leu Ala Thr Trp Lys Val Leu Val Ser Leu
625 630 635 640
Gly Val Ala Pro Ile Leu Tyr Ser Phe Tyr Ala Ala Leu Ala Thr Tyr
645 650 655
Leu Ala His Arg Leu Glu Leu Ser Pro Arg Thr Arg Ala Leu Met Pro
660 665 670
Leu Tyr Thr Leu Ile Val Leu Pro Thr Met Ser Tyr Ser Ala Leu Lys
675 680 685
Phe Ala Glu Val Gly Ile Asp Ile Tyr Lys Ser Leu Pro Pro Leu Phe
690 695 700
Ile Ser Leu Ile Pro Gly Asn His Lys Val Ile Leu Asp Leu Gln Gln
705 710 715 720
Thr Arg Thr Lys Ile Ser Ala Asp Met His Ala Leu Ile Asp Glu Leu
725 730 735
Ala Pro Gln Val Trp Glu Asp Phe Ala Glu Asn Arg Met Leu Pro Ser
740 745 750
Ala Ser Ala Pro Pro Thr Pro Ser Arg Glu Ala Leu Val Trp Lys Asp
755 760 765
Lys Lys Gln Ser Ser Ser Ala Ala Ser Asp Ala Leu Ser His Pro Leu
770 775 780
Gln Trp Met Asp Glu Arg Leu Phe Gly Trp Gly Arg Arg Arg His Ser
785 790 795 800
Ser Thr Arg Arg Ser Leu Thr Ala Glu Glu Ile Lys His Leu Arg Ser
805 810 815
Pro Ser Leu Thr Arg Gly Ser Ala Lys Asp Glu Asn Ser Val Leu Asp
820 825 830
Asp Glu Asp Gly Ala Arg Phe Glu Gly Glu Gly Asp Gly Ser Leu Asp
835 840 845
Asp Val Ser Glu Gly Ser Ser Ser Phe Ile Glu Ser Gly Glu Glu Asp
850 855 860
Glu Gly Asp Tyr Glu Ala Val Phe Ser Met Leu Asn Pro Gln Asn Leu
865 870 875 880
Leu Asn Gly Leu Arg Asn Gly Gly Leu Ser Pro Gly Thr Pro Gly Ser
885 890 895
Gly Gly Arg Arg Ser Arg Thr His Ser Arg Ser Arg Ser Gly Ser Arg
900 905 910
Gly Ser Ile Gly Gly Val Ala Ser Gly Glu Thr Phe Ala Glu Lys Arg
915 920 925
Asn Arg Ser Ser Gln Asp Leu Arg Ala Leu Met Arg Glu Gly Gly Ala
930 935 940
Met Ser Pro Thr Thr Thr Arg Ser Ser Gly Ile Leu Glu Gly Ala Gly
945 950 955 960
Ser Lys Gln Ser Ser Arg Thr Ser Ala Leu Pro Ala Ser Leu Ile Thr
965 970 975
Thr Asn Ile Ser Gly Asn Asp Gly Glu Asn Gly Ala Ser Lys Ala Ser
980 985 990
Asn Thr Ser Arg Arg Asn Arg Thr His Ser Leu Ser Glu Asp Val His
995 1000 1005
Val Ser Glu Leu Lys Asn Ala Gly Pro Ala Ala Lys Lys Leu Pro
1010 1015 1020
Phe Ser Ala Ala Ser Gln Ala Phe Glu Met Gln His Glu Ala Ser
1025 1030 1035
Gly Gly Gln Ala Gly Tyr Arg Pro Lys Leu Glu Asn Met Gln Ser
1040 1045 1050
Ala Glu Asn Thr Pro Pro Ala Thr Pro Lys His Glu Asp Lys Lys
1055 1060 1065
Val Leu Thr Ser Ala Ser Ser Val Pro Thr Asp Ser Asn Asp Leu
1070 1075 1080
Asp Gly Lys Asp Asp Gly Lys Ala Gln
1085 1090
<210> 24
<211> 759
<212> PRT
<213> Saccharomyces cerevisiae
<400> 24
Met Pro Ala Pro Lys Leu Thr Glu Lys Phe Ala Ser Ser Lys Ser Thr
1 5 10 15
Gln Lys Thr Thr Asn Tyr Ser Ser Ile Glu Ala Lys Ser Val Lys Thr
20 25 30
Ser Ala Asp Gln Ala Tyr Ile Tyr Gln Glu Pro Ser Ala Thr Lys Lys
35 40 45
Ile Leu Tyr Ser Ile Ala Thr Trp Leu Leu Tyr Asn Ile Phe His Cys
50 55 60
Phe Phe Arg Glu Ile Arg Gly Arg Gly Ser Phe Lys Val Pro Gln Gln
65 70 75 80
Gly Pro Val Ile Phe Val Ala Ala Pro His Ala Asn Gln Phe Val Asp
85 90 95
Pro Val Ile Leu Met Gly Glu Val Lys Lys Ser Val Asn Arg Arg Val
100 105 110
Ser Phe Leu Ile Ala Glu Ser Ser Leu Lys Gln Pro Pro Ile Gly Phe
115 120 125
Leu Ala Ser Phe Phe Met Ala Ile Gly Val Val Arg Pro Gln Asp Asn
130 135 140
Leu Lys Pro Ala Glu Gly Thr Ile Arg Val Asp Pro Thr Asp Tyr Lys
145 150 155 160
Arg Val Ile Gly His Asp Thr His Phe Leu Thr Asp Cys Met Pro Lys
165 170 175
Gly Leu Ile Gly Leu Pro Lys Ser Met Gly Phe Gly Glu Ile Gln Ser
180 185 190
Ile Glu Ser Asp Thr Ser Leu Thr Leu Arg Lys Glu Phe Lys Met Ala
195 200 205
Lys Pro Glu Ile Lys Thr Ala Leu Leu Thr Gly Thr Thr Tyr Lys Tyr
210 215 220
Ala Ala Lys Val Asp Gln Ser Cys Val Tyr His Arg Val Phe Glu His
225 230 235 240
Leu Ala His Asn Asn Cys Ile Gly Ile Phe Pro Glu Gly Gly Ser His
245 250 255
Asp Arg Thr Asn Leu Leu Pro Leu Lys Ala Gly Val Ala Ile Met Ala
260 265 270
Leu Gly Cys Met Asp Lys His Pro Asp Val Asn Val Lys Ile Val Pro
275 280 285
Cys Gly Met Asn Tyr Phe His Pro His Lys Phe Arg Ser Arg Ala Val
290 295 300
Val Glu Phe Gly Asp Pro Ile Glu Ile Pro Lys Glu Leu Val Ala Lys
305 310 315 320
Tyr His Asn Pro Glu Thr Asn Arg Asp Ala Val Lys Glu Leu Leu Asp
325 330 335
Thr Ile Ser Lys Gly Leu Gln Ser Val Thr Val Thr Cys Ser Asp Tyr
340 345 350
Glu Thr Leu Met Val Val Gln Thr Ile Arg Arg Leu Tyr Met Thr Gln
355 360 365
Phe Ser Thr Lys Leu Pro Leu Pro Leu Ile Val Glu Met Asn Arg Arg
370 375 380
Met Val Lys Gly Tyr Glu Phe Tyr Arg Asn Asp Pro Lys Ile Ala Asp
385 390 395 400
Leu Thr Lys Asp Ile Met Ala Tyr Asn Ala Ala Leu Arg His Tyr Asn
405 410 415
Leu Pro Asp His Leu Val Glu Glu Ala Lys Val Asn Phe Ala Lys Asn
420 425 430
Leu Gly Leu Val Phe Phe Arg Ser Ile Gly Leu Cys Ile Leu Phe Ser
435 440 445
Leu Ala Met Pro Gly Ile Ile Met Phe Ser Pro Val Phe Ile Leu Ala
450 455 460
Lys Arg Ile Ser Gln Glu Lys Ala Arg Thr Ala Leu Ser Lys Ser Thr
465 470 475 480
Val Lys Ile Lys Ala Asn Asp Val Ile Ala Thr Trp Lys Ile Leu Ile
485 490 495
Gly Met Gly Phe Ala Pro Leu Leu Tyr Ile Phe Trp Ser Val Leu Ile
500 505 510
Thr Tyr Tyr Leu Arg His Lys Pro Trp Asn Lys Ile Tyr Val Phe Ser
515 520 525
Gly Ser Tyr Ile Ser Cys Val Ile Val Thr Tyr Ser Ala Leu Ile Val
530 535 540
Gly Asp Ile Gly Met Asp Gly Phe Lys Ser Leu Arg Pro Leu Val Leu
545 550 555 560
Ser Leu Thr Ser Pro Lys Gly Leu Gln Lys Leu Gln Lys Asp Arg Arg
565 570 575
Asn Leu Ala Glu Arg Ile Ile Glu Val Val Asn Asn Phe Gly Ser Glu
580 585 590
Leu Phe Pro Asp Phe Asp Ser Ala Ala Leu Arg Glu Glu Phe Asp Val
595 600 605
Ile Asp Glu Glu Glu Glu Asp Arg Lys Thr Ser Glu Leu Asn Arg Arg
610 615 620
Lys Met Leu Arg Lys Gln Lys Ile Lys Arg Gln Glu Lys Asp Ser Ser
625 630 635 640
Ser Pro Ile Ile Ser Gln Arg Asp Asn His Asp Ala Tyr Glu His His
645 650 655
Asn Gln Asp Ser Asp Gly Val Ser Leu Val Asn Ser Asp Asn Ser Leu
660 665 670
Ser Asn Ile Pro Leu Phe Ser Ser Thr Phe His Arg Lys Ser Glu Ser
675 680 685
Ser Leu Ala Ser Thr Ser Val Ala Pro Ser Ser Ser Ser Glu Phe Glu
690 695 700
Val Glu Asn Glu Ile Leu Glu Glu Lys Asn Gly Leu Ala Ser Lys Ile
705 710 715 720
Ala Gln Ala Val Leu Asn Lys Arg Ile Gly Glu Asn Thr Ala Arg Glu
725 730 735
Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu
740 745 750
Glu Gly Lys Glu Gly Asp Ala
755
<210> 25
<211> 743
<212> PRT
<213> Saccharomyces cerevisiae
<400> 25
Met Ser Ala Pro Ala Ala Asp His Asn Ala Ala Lys Pro Ile Pro His
1 5 10 15
Val Pro Gln Ala Ser Arg Arg Tyr Lys Asn Ser Tyr Asn Gly Phe Val
20 25 30
Tyr Asn Ile His Thr Trp Leu Tyr Asp Val Ser Val Phe Leu Phe Asn
35 40 45
Ile Leu Phe Thr Ile Phe Phe Arg Glu Ile Lys Val Arg Gly Ala Tyr
50 55 60
Asn Val Pro Glu Val Gly Val Pro Thr Ile Leu Val Cys Ala Pro His
65 70 75 80
Ala Asn Gln Phe Ile Asp Pro Ala Leu Val Met Ser Gln Thr Arg Leu
85 90 95
Leu Lys Thr Ser Ala Gly Lys Ser Arg Ser Arg Met Pro Cys Phe Val
100 105 110
Thr Ala Glu Ser Ser Phe Lys Lys Arg Phe Ile Ser Phe Phe Gly His
115 120 125
Ala Met Gly Gly Ile Pro Val Pro Arg Ile Gln Asp Asn Leu Lys Pro
130 135 140
Val Asp Glu Asn Leu Glu Ile Tyr Ala Pro Asp Leu Lys Asn His Pro
145 150 155 160
Glu Ile Ile Lys Gly Arg Ser Lys Asn Pro Gln Thr Thr Pro Val Asn
165 170 175
Phe Thr Lys Arg Phe Ser Ala Lys Ser Leu Leu Gly Leu Pro Asp Tyr
180 185 190
Leu Ser Asn Ala Gln Ile Lys Glu Ile Pro Asp Asp Glu Thr Ile Ile
195 200 205
Leu Ser Ser Pro Phe Arg Thr Ser Lys Ser Lys Val Val Glu Leu Leu
210 215 220
Thr Asn Gly Thr Asn Phe Lys Tyr Ala Glu Lys Ile Asp Asn Thr Glu
225 230 235 240
Thr Phe Gln Ser Val Phe Asp His Leu His Thr Lys Gly Cys Val Gly
245 250 255
Ile Phe Pro Glu Gly Gly Ser His Asp Arg Pro Ser Leu Leu Pro Ile
260 265 270
Lys Ala Gly Val Ala Ile Met Ala Leu Gly Ala Val Ala Ala Asp Pro
275 280 285
Thr Met Lys Val Ala Val Val Pro Cys Gly Leu His Tyr Phe His Arg
290 295 300
Asn Lys Phe Arg Ser Arg Ala Val Leu Glu Tyr Gly Glu Pro Ile Val
305 310 315 320
Val Asp Gly Lys Tyr Gly Glu Met Tyr Lys Asp Ser Pro Arg Glu Thr
325 330 335
Val Ser Lys Leu Leu Lys Lys Ile Thr Asn Ser Leu Phe Ser Val Thr
340 345 350
Glu Asn Ala Pro Asp Tyr Asp Thr Leu Met Val Ile Gln Ala Ala Arg
355 360 365
Arg Leu Tyr Gln Pro Val Lys Val Arg Leu Pro Leu Pro Ala Ile Val
370 375 380
Glu Ile Asn Arg Arg Leu Leu Phe Gly Tyr Ser Lys Phe Lys Asp Asp
385 390 395 400
Pro Arg Ile Ile His Leu Lys Lys Leu Val Tyr Asp Tyr Asn Arg Lys
405 410 415
Leu Asp Ser Val Gly Leu Lys Asp His Gln Val Met Gln Leu Lys Thr
420 425 430
Thr Lys Leu Glu Ala Leu Arg Cys Phe Val Thr Leu Ile Val Arg Leu
435 440 445
Ile Lys Phe Ser Val Phe Ala Ile Leu Ser Leu Pro Gly Ser Ile Leu
450 455 460
Phe Thr Pro Ile Phe Ile Ile Cys Arg Val Tyr Ser Glu Lys Lys Ala
465 470 475 480
Lys Glu Gly Leu Lys Lys Ser Leu Val Lys Ile Lys Gly Thr Asp Leu
485 490 495
Leu Ala Thr Trp Lys Leu Ile Val Ala Leu Ile Leu Ala Pro Ile Leu
500 505 510
Tyr Val Thr Tyr Ser Ile Leu Leu Ile Ile Leu Ala Arg Lys Gln His
515 520 525
Tyr Cys Arg Ile Trp Val Pro Ser Asn Asn Ala Phe Ile Gln Phe Val
530 535 540
Tyr Phe Tyr Ala Leu Leu Val Phe Thr Thr Tyr Ser Ser Leu Lys Thr
545 550 555 560
Gly Glu Ile Gly Val Asp Leu Phe Lys Ser Leu Arg Pro Leu Phe Val
565 570 575
Ser Ile Val Tyr Pro Gly Lys Lys Ile Glu Glu Ile Gln Thr Thr Arg
580 585 590
Lys Asn Leu Ser Leu Glu Leu Thr Ala Val Cys Asn Asp Leu Gly Pro
595 600 605
Leu Val Phe Pro Asp Tyr Asp Lys Leu Ala Thr Glu Ile Phe Ser Lys
610 615 620
Arg Asp Gly Tyr Asp Val Ser Ser Asp Ala Glu Ser Ser Ile Ser Arg
625 630 635 640
Met Ser Val Gln Ser Arg Ser Arg Ser Ser Ser Ile His Ser Ile Gly
645 650 655
Ser Leu Ala Ser Asn Ala Leu Ser Arg Val Asn Ser Arg Gly Ser Leu
660 665 670
Thr Asp Ile Pro Ile Phe Ser Asp Ala Lys Gln Gly Gln Trp Lys Ser
675 680 685
Glu Gly Glu Thr Ser Glu Asp Glu Asp Glu Phe Asp Glu Lys Asn Pro
690 695 700
Ala Ile Val Gln Thr Ala Arg Ser Ser Asp Leu Asn Lys Glu Asn Ser
705 710 715 720
Arg Asn Thr Asn Ile Ser Ser Lys Ile Ala Ser Leu Val Arg Gln Lys
725 730 735
Arg Glu His Glu Lys Lys Glu
740
<210> 26
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> primer Eco-MaGPAT3-F
<400> 26
gaattcatgg gtctccagat ctatgacttc gtctc 35
<210> 27
<211> 34
<212> DNA
<213> Artificial sequence
<220>
<223> primer Sal-MaGPAT3-R
<400> 27
gtcgacttat gcctccttag acttgactgc atcc 34
<210> 28
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> primer Not-MaGPAT4-F1
<400> 28
gcggccgcat gacaaccggc gacagtaccg 30
<210> 29
<211> 29
<212> DNA
<213> Artificial sequence
<220>
<223> primer Not-MaGPAT4-F2
<400> 29
gcggccgcat gcccatcgtt ccagctcag 29
<210> 30
<211> 28
<212> DNA
<213> Artificial sequence
<220>
<223> primer Bam-MaGPAT4-R
<400> 30
ggatccttat aatttcgggg cgccatcg 28
<210> 31
<211> 26
<212> DNA
<213> Artificial sequence
<220>
<223> primer Xba1-Des-SCT1-F
<400> 31
tctagaatgc ctgcaccaaa actcac 26
<210> 32
<211> 26
<212> DNA
<213> Artificial sequence
<220>
<223> primer Xba1-Des-SCT1-R
<400> 32
tctagaccac aaggtgatca ggaaga 26
<210> 33
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer SCT1outORF-F
<400> 33
agtgtaggaa gcccggaatt 20
<210> 34
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer SCT1inORF-R
<400> 34
gcgtagatcc aacagactac 20
<210> 35
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer LEU2inORF-F
<400> 35
ttgcctcttc caagagcaca 20
<210> 36
<211> 54
<212> DNA
<213> Artificial sequence
<220>
<223> oligo DNA MCS-for-pUC18-F2
<400> 36
aattcataag aatgcggccg ctaaactatt ctagactagg tcgacggcgc gcca 54
<210> 37
<211> 54
<212> DNA
<213> Artificial sequence
<220>
<223> oligo DNA MCS-for-pUC18-R2
<400> 37
agcttggcgc gccgtcgacc tagtctagaa tagtttagcg gccgcattct tatg 54
<210> 38
<211> 26
<212> DNA
<213> Artificial sequence
<220>
<223> primer Not1-GAPDHt-F
<400> 38
agcggccgca taggggagat cgaacc 26
<210> 39
<211> 33
<212> DNA
<213> Artificial sequence
<220>
<223> primer EcoR1-Asc1-GAPDHt-R
<400> 39
agaattcggc gcgccatgca cgggtccttc tca 33
<210> 40
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer URA5g-F1
<400> 40
gtcgaccatg acaagtttgc 20
<210> 41
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> primer URA5g-R1
<400> 41
gtcgactgga agacgagcac g 21
<210> 42
<211> 43
<212> DNA
<213> Artificial sequence
<220>
<223> primer hisHp+URA5-F
<400> 42
ggcaaacttg tcatgaagcg aaagagagat tatgaaaaca agc 43
<210> 43
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<223> primer hisHp+MGt-F
<400> 43
cactcccttt tcttaattgt tgagagagtg ttgggtgaga gt 42
<210> 44
<211> 27
<212> DNA
<213> Artificial sequence
<220>
<223> primer pDuraSC-GAPt-F
<400> 44
taagaaaagg gagtgaatcg cataggg 27
<210> 45
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> primer URA5gDNA-F
<400> 45
catgacaagt ttgccaagat gcg 23
<210> 46
<211> 28
<212> DNA
<213> Artificial sequence
<220>
<223> primer pDurahG-hisp-R
<400> 46
attgttgaga gagtgttggg tgagagtg 28
<210> 47
<211> 38
<212> DNA
<213> Artificial sequence
<220>
<223> primer MaGPAT4+hisp-F
<400> 47
cactctctca acaatatgac aaccggcgac agtaccgc 38
<210> 48
<211> 38
<212> DNA
<213> Artificial sequence
<220>
<223> primer MaGPAT4+MGt-R
<400> 48
cactcccttt tcttattata atttcggggc gccatcgc 38
<210> 49
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> primer GPAT4-RT1
<400> 49
gagtgcttca tcgagggcac c 21
<210> 50
<211> 24
<212> DNA
<213> Artificial sequence
<220>
<223> perimer GPAT4-RT2
<400> 50
tccttcactg tcaacctcga tcac 24
Claims (15)
- 삭제
- 이하의 (a)∼(d) 중 어느 하나에 기재한 핵산:
(a) 서열 번호 1 또는 서열 번호 4로 나타내어지는 염기 서열을 포함하는 핵산,
(b) 서열 번호 2 또는 서열 번호 5로 나타내어지는 아미노산 서열로 이루어지는 단백질을 코드하는 염기 서열을 포함하는 핵산,
(c) 서열 번호 3 또는 서열 번호 6으로 나타내어지는 염기 서열을 포함하는 핵산,
(d) 서열 번호 7로 나타내어지는 염기 서열을 포함하는 핵산. - 삭제
- 삭제
- 삭제
- 서열 번호 2 또는 서열 번호 5로 나타내어지는 아미노산 서열로 이루어지는 단백질.
- 제2항에 기재한 핵산을 함유하는 재조합 벡터.
- 제7항에 기재한 재조합 벡터에 의해서 형질전환된 형질전환체.
- 삭제
- 제8항에 기재한 형질전환체를 배양하여 얻어지는 배양물로부터 지방산 또는 지질을 채취하는 것을 특징으로 하는 지방산 조성물의 제조 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010022125 | 2010-02-03 | ||
JPJP-P-2010-022125 | 2010-02-03 | ||
PCT/JP2011/052258 WO2011096481A1 (ja) | 2010-02-03 | 2011-02-03 | グリセロール-3-リン酸アシル基転移酵素ホモログとその利用 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120109652A KR20120109652A (ko) | 2012-10-08 |
KR101530765B1 true KR101530765B1 (ko) | 2015-06-29 |
Family
ID=44355474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127022357A KR101530765B1 (ko) | 2010-02-03 | 2011-02-03 | 글리세롤-3-인산 아실기 전이 효소 호몰로그와 그 이용 |
Country Status (11)
Country | Link |
---|---|
US (1) | US9163291B2 (ko) |
EP (1) | EP2532744B1 (ko) |
JP (1) | JP5890687B2 (ko) |
KR (1) | KR101530765B1 (ko) |
CN (1) | CN102947447B (ko) |
AU (1) | AU2011211741B2 (ko) |
BR (1) | BR112012019566A2 (ko) |
CA (1) | CA2787603C (ko) |
DK (1) | DK2532744T3 (ko) |
RU (1) | RU2545375C2 (ko) |
WO (1) | WO2011096481A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9719115B2 (en) | 2012-05-10 | 2017-08-01 | Kyoto University | Method for producing oxo fatty acid and rare fatty acid |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060094092A1 (en) * | 2004-11-04 | 2006-05-04 | Damude Howard G | High arachidonic acid producing strains of Yarrowia lipolytica |
WO2008156026A1 (ja) * | 2007-06-18 | 2008-12-24 | Suntory Holdings Limited | グリセロール-3-リン酸アシル基転移酵素(gpat)ホモログとその利用 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4149007B2 (ja) | 1995-02-01 | 2008-09-10 | 麒麟麦酒株式会社 | 酵母の凝集性判定用dna分子および凝集性判定方法 |
CA2227864C (en) * | 1995-07-27 | 2003-05-13 | Kirin Beer Kabushiki Kaisha | Dna strands coding for glycerol-3-phosphate acyltransferase |
CN1230541C (zh) * | 1999-04-01 | 2005-12-07 | 巴斯夫植物科学股份有限公司 | 产生三酰甘油的生物合成途径中的新型酶类及编码该酶类的重组dna分子 |
WO2000078974A2 (en) * | 1999-06-21 | 2000-12-28 | National Research Council Of Canada | Overexpression in yeast and plants of a gene encoding glycerol 3-phosphate acyltransferase |
CA2392508A1 (en) | 1999-11-30 | 2001-06-07 | Asahi Breweries, Ltd. | Method of judging flocculating properties of bottom brewer's yeast |
AU2002218091A1 (en) * | 2000-11-17 | 2002-05-27 | Xenon Genetics Inc | Fat regulated genes, uses thereof, and compounds for modulating same |
CA2520795C (en) | 2003-03-31 | 2015-06-23 | University Of Bristol | Novel plant acyltransferases specific for long-chained, multiply unsaturated fatty acids |
EP1666584B1 (en) | 2003-08-22 | 2010-12-29 | Suntory Holdings Limited | Method of breeding lipid-producing fungus |
US7264949B2 (en) * | 2004-09-15 | 2007-09-04 | E.I. Du Pont De Nemours And Company | Glycerol-3-phosphate o-acyltransferase promoter for gene expression in oleaginous yeast |
US7192762B2 (en) * | 2004-11-04 | 2007-03-20 | E. I. Du Pont De Nemours And Company | Mortierella alpina glycerol-3-phosphate o-acyltransferase for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms |
RU2507263C2 (ru) | 2007-05-25 | 2014-02-20 | Сантори Холдингз Лимитед | Новые гены ацилтрансферазы лизофосфатидной кислоты |
EP2182071B1 (en) | 2007-07-23 | 2016-12-14 | Suntory Holdings Limited | A method for preparing a fatty acid composition |
EP2676554B1 (en) | 2009-03-26 | 2014-12-31 | Suntory Holdings Limited | Novel lysophospholipid acyltransferase |
RU2499835C1 (ru) | 2009-09-18 | 2013-11-27 | Сантори Холдингз Лимитед | Глицерол-3-фосфатацилтрансфераза |
BR112012015410A2 (pt) | 2009-12-21 | 2016-11-29 | Suntory Holdings Ltd | genes diacilglicerol aciltransferase e uso dos mesmos. |
-
2011
- 2011-02-03 KR KR1020127022357A patent/KR101530765B1/ko active IP Right Grant
- 2011-02-03 CN CN201180018133.6A patent/CN102947447B/zh not_active Expired - Fee Related
- 2011-02-03 DK DK11739829.7T patent/DK2532744T3/da active
- 2011-02-03 BR BR112012019566A patent/BR112012019566A2/pt not_active Application Discontinuation
- 2011-02-03 JP JP2011552820A patent/JP5890687B2/ja not_active Expired - Fee Related
- 2011-02-03 WO PCT/JP2011/052258 patent/WO2011096481A1/ja active Application Filing
- 2011-02-03 CA CA2787603A patent/CA2787603C/en active Active
- 2011-02-03 AU AU2011211741A patent/AU2011211741B2/en not_active Ceased
- 2011-02-03 RU RU2012137247/10A patent/RU2545375C2/ru active
- 2011-02-03 US US13/575,700 patent/US9163291B2/en not_active Expired - Fee Related
- 2011-02-03 EP EP11739829.7A patent/EP2532744B1/en not_active Not-in-force
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060094092A1 (en) * | 2004-11-04 | 2006-05-04 | Damude Howard G | High arachidonic acid producing strains of Yarrowia lipolytica |
WO2008156026A1 (ja) * | 2007-06-18 | 2008-12-24 | Suntory Holdings Limited | グリセロール-3-リン酸アシル基転移酵素(gpat)ホモログとその利用 |
Also Published As
Publication number | Publication date |
---|---|
BR112012019566A2 (pt) | 2015-09-15 |
JP5890687B2 (ja) | 2016-03-22 |
CN102947447B (zh) | 2015-05-13 |
KR20120109652A (ko) | 2012-10-08 |
EP2532744B1 (en) | 2017-09-06 |
EP2532744A1 (en) | 2012-12-12 |
US20120302777A1 (en) | 2012-11-29 |
DK2532744T3 (da) | 2017-11-13 |
EP2532744A4 (en) | 2013-07-31 |
AU2011211741A1 (en) | 2012-08-23 |
WO2011096481A1 (ja) | 2011-08-11 |
AU2011211741B2 (en) | 2013-10-17 |
CA2787603C (en) | 2017-05-30 |
CA2787603A1 (en) | 2011-08-11 |
JPWO2011096481A1 (ja) | 2013-06-10 |
US9163291B2 (en) | 2015-10-20 |
CN102947447A (zh) | 2013-02-27 |
RU2012137247A (ru) | 2014-03-10 |
RU2545375C2 (ru) | 2015-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101496803B1 (ko) | 신규 리소포스파티드산 아실기 전이 효소 유전자 | |
KR101519680B1 (ko) | 신규 지방산 조성을 갖는 지방산 조성물 | |
KR101692016B1 (ko) | 신규한 리소인지질 아실기 전이효소 | |
KR101496805B1 (ko) | 글리세롤-3-인산 아실기 전이 효소(gpat) 호몰로그와 그 이용 | |
KR101517643B1 (ko) | 신규한 atp:시트르산 리아제 유전자 | |
KR101519704B1 (ko) | 포스파티딘산 포스파타아제 유전자와 그 이용 | |
KR101496771B1 (ko) | 포스파티드산 포스파타아제 유전자 | |
KR101530765B1 (ko) | 글리세롤-3-인산 아실기 전이 효소 호몰로그와 그 이용 | |
KR101519678B1 (ko) | 포스파티딘산포스파타아제 동족체 및 그 이용 | |
KR101646302B1 (ko) | 신규한 아세틸 CoA 카복실라제 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20180516 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20190515 Year of fee payment: 5 |