PL194095B1 - Wyizolowana cząsteczka kwasu nukleinowego, konstrukt genetyczny, sposób dokonywania zmian poziomu epoksykwasów tłuszczowych, sposób wytwarzania rekombinantowego polipeptydu monooksygenazy w komórce, sposób wytwarzania rekombinantowego polipeptydu monooksygenazy w roślinie transgenicznej, polipeptydrekombinantowy, sposób wytwarzania epoksydowanegokwasu tłuszczowego, roślina transformowana i roślina lub pochodząca z niej komórka - Google Patents
Wyizolowana cząsteczka kwasu nukleinowego, konstrukt genetyczny, sposób dokonywania zmian poziomu epoksykwasów tłuszczowych, sposób wytwarzania rekombinantowego polipeptydu monooksygenazy w komórce, sposób wytwarzania rekombinantowego polipeptydu monooksygenazy w roślinie transgenicznej, polipeptydrekombinantowy, sposób wytwarzania epoksydowanegokwasu tłuszczowego, roślina transformowana i roślina lub pochodząca z niej komórkaInfo
- Publication number
- PL194095B1 PL194095B1 PL98336292A PL33629298A PL194095B1 PL 194095 B1 PL194095 B1 PL 194095B1 PL 98336292 A PL98336292 A PL 98336292A PL 33629298 A PL33629298 A PL 33629298A PL 194095 B1 PL194095 B1 PL 194095B1
- Authority
- PL
- Poland
- Prior art keywords
- plant
- epoxygenase
- nucleic acid
- acid molecule
- carbon
- Prior art date
Links
- 239000000194 fatty acid Substances 0.000 title claims abstract description 68
- 235000014113 dietary fatty acids Nutrition 0.000 title claims abstract description 67
- 229930195729 fatty acid Natural products 0.000 title claims abstract description 67
- 150000004665 fatty acids Chemical class 0.000 title claims abstract description 67
- 108090000623 proteins and genes Proteins 0.000 title claims description 44
- 241000196324 Embryophyta Species 0.000 claims abstract description 70
- 102000004190 Enzymes Human genes 0.000 claims abstract description 36
- 108090000790 Enzymes Proteins 0.000 claims abstract description 36
- 102000008109 Mixed Function Oxygenases Human genes 0.000 claims abstract description 34
- 108010074633 Mixed Function Oxygenases Proteins 0.000 claims abstract description 34
- 230000002068 genetic effect Effects 0.000 claims abstract description 24
- 241001250700 Crepis palaestina Species 0.000 claims abstract description 15
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims abstract description 10
- 239000003921 oil Substances 0.000 claims abstract description 10
- 235000021122 unsaturated fatty acids Nutrition 0.000 claims abstract description 10
- 150000004670 unsaturated fatty acids Chemical class 0.000 claims abstract description 9
- 241000894006 Bacteria Species 0.000 claims abstract description 7
- 241000238631 Hexapoda Species 0.000 claims abstract description 6
- 108020004707 nucleic acids Proteins 0.000 claims description 67
- 102000039446 nucleic acids Human genes 0.000 claims description 67
- 150000007523 nucleic acids Chemical class 0.000 claims description 67
- 238000000034 method Methods 0.000 claims description 52
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 42
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 42
- 125000003729 nucleotide group Chemical group 0.000 claims description 40
- 239000002773 nucleotide Substances 0.000 claims description 38
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 35
- 229920001184 polypeptide Polymers 0.000 claims description 34
- 239000002253 acid Substances 0.000 claims description 30
- 239000011203 carbon fibre reinforced carbon Substances 0.000 claims description 29
- CCPPLLJZDQAOHD-UHFFFAOYSA-N vernolic acid Natural products CCCCCC1OC1CC=CCCCCCCCC(O)=O CCPPLLJZDQAOHD-UHFFFAOYSA-N 0.000 claims description 26
- 239000000758 substrate Substances 0.000 claims description 25
- 230000014509 gene expression Effects 0.000 claims description 23
- 210000000056 organ Anatomy 0.000 claims description 22
- CCPPLLJZDQAOHD-BEBBCNLGSA-N (-)-vernolic acid Chemical compound CCCCC[C@@H]1O[C@@H]1C\C=C/CCCCCCCC(O)=O CCPPLLJZDQAOHD-BEBBCNLGSA-N 0.000 claims description 21
- 239000004593 Epoxy Substances 0.000 claims description 19
- 240000006240 Linum usitatissimum Species 0.000 claims description 19
- 210000004027 cell Anatomy 0.000 claims description 19
- 235000004431 Linum usitatissimum Nutrition 0.000 claims description 18
- 241001649137 Vernonia galamensis Species 0.000 claims description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 13
- 241000723221 Crepis Species 0.000 claims description 12
- YZXBAPSDXZZRGB-DOFZRALJSA-N arachidonic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O YZXBAPSDXZZRGB-DOFZRALJSA-N 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 12
- 210000001519 tissue Anatomy 0.000 claims description 12
- 244000068988 Glycine max Species 0.000 claims description 11
- 235000010469 Glycine max Nutrition 0.000 claims description 11
- 230000000295 complement effect Effects 0.000 claims description 11
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 claims description 11
- 230000000692 anti-sense effect Effects 0.000 claims description 10
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 claims description 9
- 235000004426 flaxseed Nutrition 0.000 claims description 9
- 235000020778 linoleic acid Nutrition 0.000 claims description 9
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 claims description 9
- 239000005642 Oleic acid Substances 0.000 claims description 8
- 238000006735 epoxidation reaction Methods 0.000 claims description 8
- 235000019198 oils Nutrition 0.000 claims description 8
- 230000001131 transforming effect Effects 0.000 claims description 8
- 240000002791 Brassica napus Species 0.000 claims description 7
- 241000221079 Euphorbia <genus> Species 0.000 claims description 7
- 241000233866 Fungi Species 0.000 claims description 7
- 244000105624 Arachis hypogaea Species 0.000 claims description 6
- 235000004977 Brassica sinapistrum Nutrition 0.000 claims description 6
- 244000020518 Carthamus tinctorius Species 0.000 claims description 6
- 235000003255 Carthamus tinctorius Nutrition 0.000 claims description 6
- 235000001950 Elaeis guineensis Nutrition 0.000 claims description 6
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 6
- 244000020551 Helianthus annuus Species 0.000 claims description 6
- 235000003434 Sesamum indicum Nutrition 0.000 claims description 6
- 244000000231 Sesamum indicum Species 0.000 claims description 6
- 229940114079 arachidonic acid Drugs 0.000 claims description 6
- 235000021342 arachidonic acid Nutrition 0.000 claims description 6
- 125000003700 epoxy group Chemical group 0.000 claims description 6
- SECPZKHBENQXJG-FPLPWBNLSA-N palmitoleic acid Chemical compound CCCCCC\C=C/CCCCCCCC(O)=O SECPZKHBENQXJG-FPLPWBNLSA-N 0.000 claims description 6
- 238000011144 upstream manufacturing Methods 0.000 claims description 6
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 claims description 5
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 claims description 5
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 claims description 5
- 235000010777 Arachis hypogaea Nutrition 0.000 claims description 5
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 claims description 5
- DTOSIQBPPRVQHS-PDBXOOCHSA-N alpha-linolenic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCC(O)=O DTOSIQBPPRVQHS-PDBXOOCHSA-N 0.000 claims description 5
- 235000020661 alpha-linolenic acid Nutrition 0.000 claims description 5
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 claims description 5
- 229960004488 linolenic acid Drugs 0.000 claims description 5
- KQQKGWQCNNTQJW-UHFFFAOYSA-N linolenic acid Natural products CC=CCCC=CCC=CCCCCCCCC(O)=O KQQKGWQCNNTQJW-UHFFFAOYSA-N 0.000 claims description 5
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 claims description 5
- 235000021313 oleic acid Nutrition 0.000 claims description 5
- 230000009261 transgenic effect Effects 0.000 claims description 5
- 108090000994 Catalytic RNA Proteins 0.000 claims description 4
- 102000053642 Catalytic RNA Human genes 0.000 claims description 4
- 235000007516 Chrysanthemum Nutrition 0.000 claims description 4
- 240000005250 Chrysanthemum indicum Species 0.000 claims description 4
- CREMABGTGYGIQB-UHFFFAOYSA-N carbon carbon Chemical compound C.C CREMABGTGYGIQB-UHFFFAOYSA-N 0.000 claims description 4
- 244000005700 microbiome Species 0.000 claims description 4
- 235000020232 peanut Nutrition 0.000 claims description 4
- 108091092562 ribozyme Proteins 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 235000017060 Arachis glabrata Nutrition 0.000 claims description 3
- 235000018262 Arachis monticola Nutrition 0.000 claims description 3
- 108020004635 Complementary DNA Proteins 0.000 claims description 3
- 229920000742 Cotton Polymers 0.000 claims description 3
- 241001552432 Crepis aurea Species 0.000 claims description 3
- 241000529715 Crepis biennis Species 0.000 claims description 3
- 241001589537 Crepis intermedia Species 0.000 claims description 3
- 241001589714 Crepis occidentalis Species 0.000 claims description 3
- 241000125487 Crepis vesicaria Species 0.000 claims description 3
- 240000007817 Olea europaea Species 0.000 claims description 3
- 235000021319 Palmitoleic acid Nutrition 0.000 claims description 3
- SECPZKHBENQXJG-UHFFFAOYSA-N cis-palmitoleic acid Natural products CCCCCCC=CCCCCCCCC(O)=O SECPZKHBENQXJG-UHFFFAOYSA-N 0.000 claims description 3
- 235000012343 cottonseed oil Nutrition 0.000 claims description 3
- 230000002103 transcriptional effect Effects 0.000 claims description 3
- MJYQFWSXKFLTAY-OVEQLNGDSA-N (2r,3r)-2,3-bis[(4-hydroxy-3-methoxyphenyl)methyl]butane-1,4-diol;(2r,3r,4s,5s,6r)-6-(hydroxymethyl)oxane-2,3,4,5-tetrol Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O.C1=C(O)C(OC)=CC(C[C@@H](CO)[C@H](CO)CC=2C=C(OC)C(O)=CC=2)=C1 MJYQFWSXKFLTAY-OVEQLNGDSA-N 0.000 claims description 2
- OYHQOLUKZRVURQ-NTGFUMLPSA-N (9Z,12Z)-9,10,12,13-tetratritiooctadeca-9,12-dienoic acid Chemical compound C(CCCCCCC\C(=C(/C\C(=C(/CCCCC)\[3H])\[3H])\[3H])\[3H])(=O)O OYHQOLUKZRVURQ-NTGFUMLPSA-N 0.000 claims description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 claims description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 claims description 2
- 239000003623 enhancer Substances 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims description 2
- 238000013518 transcription Methods 0.000 claims description 2
- 230000035897 transcription Effects 0.000 claims description 2
- 240000003133 Elaeis guineensis Species 0.000 claims 3
- 235000003276 Apios tuberosa Nutrition 0.000 claims 2
- 235000010744 Arachis villosulicarpa Nutrition 0.000 claims 2
- 240000001689 Cyanthillium cinereum Species 0.000 claims 1
- 241000219146 Gossypium Species 0.000 claims 1
- AWGFYZFANDHELM-SCPMJEMWSA-N Mangiferic acid Chemical compound CC\C=C\CCCC\C=C\CCCCCCCC(O)=O AWGFYZFANDHELM-SCPMJEMWSA-N 0.000 claims 1
- 235000019482 Palm oil Nutrition 0.000 claims 1
- 238000001727 in vivo Methods 0.000 claims 1
- 239000002540 palm oil Substances 0.000 claims 1
- 210000003705 ribosome Anatomy 0.000 claims 1
- 239000002299 complementary DNA Substances 0.000 abstract description 10
- 238000004519 manufacturing process Methods 0.000 abstract description 9
- 241000124008 Mammalia Species 0.000 abstract description 6
- 241000271566 Aves Species 0.000 abstract description 4
- 238000000576 coating method Methods 0.000 abstract description 3
- 230000004129 fatty acid metabolism Effects 0.000 abstract description 3
- 239000000314 lubricant Substances 0.000 abstract description 3
- 239000004033 plastic Substances 0.000 abstract description 3
- 229920003023 plastic Polymers 0.000 abstract description 3
- 239000011347 resin Substances 0.000 abstract description 3
- 229920005989 resin Polymers 0.000 abstract description 3
- 239000004094 surface-active agent Substances 0.000 abstract description 3
- 239000002994 raw material Substances 0.000 abstract description 2
- 239000003292 glue Substances 0.000 abstract 1
- 235000013351 cheese Nutrition 0.000 description 192
- 235000001014 amino acid Nutrition 0.000 description 54
- 229940024606 amino acid Drugs 0.000 description 52
- 150000001413 amino acids Chemical class 0.000 description 52
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 49
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 43
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 40
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 28
- PAJPWUMXBYXFCZ-UHFFFAOYSA-N 1-aminocyclopropanecarboxylic acid Chemical compound OC(=O)C1(N)CC1 PAJPWUMXBYXFCZ-UHFFFAOYSA-N 0.000 description 25
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 24
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 24
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 24
- 238000006243 chemical reaction Methods 0.000 description 17
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 15
- 241000532497 Euphorbia lagascae Species 0.000 description 14
- 239000004471 Glycine Substances 0.000 description 14
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 14
- 102000004169 proteins and genes Human genes 0.000 description 14
- 235000018102 proteins Nutrition 0.000 description 13
- 108010050848 glycylleucine Proteins 0.000 description 12
- 108010058731 nopaline synthase Proteins 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 11
- 108010068265 aspartyltyrosine Proteins 0.000 description 11
- 108010028295 histidylhistidine Proteins 0.000 description 11
- 238000006467 substitution reaction Methods 0.000 description 11
- KWBISLAEQZUYIC-UWJYBYFXSA-N His-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N KWBISLAEQZUYIC-UWJYBYFXSA-N 0.000 description 10
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 10
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 10
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 10
- 108010065920 Insulin Lispro Proteins 0.000 description 9
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 8
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 8
- XFFIGWGYMUFCCQ-ULQDDVLXSA-N Pro-His-Tyr Chemical compound C1=CC(O)=CC=C1C[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)[C@H]1[NH2+]CCC1)CC1=CN=CN1 XFFIGWGYMUFCCQ-ULQDDVLXSA-N 0.000 description 8
- 108010093581 aspartyl-proline Proteins 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- 125000004432 carbon atom Chemical group C* 0.000 description 8
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 8
- 108010092114 histidylphenylalanine Proteins 0.000 description 8
- 241000894007 species Species 0.000 description 8
- 241000978062 Crepis sp. Species 0.000 description 7
- IXQGOKWTQPCIQM-YJRXYDGGSA-N His-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O IXQGOKWTQPCIQM-YJRXYDGGSA-N 0.000 description 7
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 7
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 7
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 7
- HYNAKPYFEYJMAS-XIRDDKMYSA-N Trp-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HYNAKPYFEYJMAS-XIRDDKMYSA-N 0.000 description 7
- KWTRGSQOQHZKIA-PMVMPFDFSA-N Trp-Lys-Tyr Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CCCCN)C(O)=O)C1=CC=C(O)C=C1 KWTRGSQOQHZKIA-PMVMPFDFSA-N 0.000 description 7
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 7
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 7
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 7
- 108010085325 histidylproline Proteins 0.000 description 7
- 108010090894 prolylleucine Proteins 0.000 description 7
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical group CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 7
- -1 2-carbamylethyl Chemical group 0.000 description 6
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 6
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 6
- 102000002004 Cytochrome P-450 Enzyme System Human genes 0.000 description 6
- ZZIFPJZQHRJERU-WDSKDSINSA-N Glu-Cys-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZZIFPJZQHRJERU-WDSKDSINSA-N 0.000 description 6
- VJVAQZYGLMJPTK-QEJZJMRPSA-N Glu-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VJVAQZYGLMJPTK-QEJZJMRPSA-N 0.000 description 6
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 6
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 6
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 6
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 6
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 6
- 108010064997 VPY tripeptide Proteins 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 6
- 108010077245 asparaginyl-proline Proteins 0.000 description 6
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 6
- 108010081551 glycylphenylalanine Proteins 0.000 description 6
- CCPPLLJZDQAOHD-DHZHZOJOSA-N 12,13-EpOME(9) Chemical compound CCCCCC1OC1C\C=C\CCCCCCCC(O)=O CCPPLLJZDQAOHD-DHZHZOJOSA-N 0.000 description 5
- BKKGUKSHPCTUGE-UHFFFAOYSA-N 12,13-Epoxy-9,15-octadecadienoic acid Natural products CCC=CCC1OC1CC=CCCCCCCCC(O)=O BKKGUKSHPCTUGE-UHFFFAOYSA-N 0.000 description 5
- BKKGUKSHPCTUGE-OOHFSOINSA-N A-12(13)-EpODE Chemical compound CC\C=C/CC1OC1C\C=C/CCCCCCCC(O)=O BKKGUKSHPCTUGE-OOHFSOINSA-N 0.000 description 5
- 108010076441 Ala-His-His Proteins 0.000 description 5
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 5
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 5
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 5
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 5
- 108010090461 DFG peptide Proteins 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 5
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 5
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 5
- CIWILNZNBPIHEU-DCAQKATOSA-N His-Arg-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O CIWILNZNBPIHEU-DCAQKATOSA-N 0.000 description 5
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 5
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 5
- 101710202365 Napin Proteins 0.000 description 5
- 108090000417 Oxygenases Proteins 0.000 description 5
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 5
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 5
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 5
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 5
- RKISDJMICOREEL-QRTARXTBSA-N Trp-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RKISDJMICOREEL-QRTARXTBSA-N 0.000 description 5
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 5
- UXODSMTVPWXHBT-ULQDDVLXSA-N Val-Phe-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N UXODSMTVPWXHBT-ULQDDVLXSA-N 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 108010015792 glycyllysine Proteins 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 108010057821 leucylproline Proteins 0.000 description 5
- 108010053725 prolylvaline Proteins 0.000 description 5
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 5
- 108010078580 tyrosylleucine Proteins 0.000 description 5
- IMYZYCNQZDBZBQ-UHFFFAOYSA-N 9,10-epoxyoctadecanoic acid Chemical compound CCCCCCCCC1OC1CCCCCCCC(O)=O IMYZYCNQZDBZBQ-UHFFFAOYSA-N 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 241000219195 Arabidopsis thaliana Species 0.000 description 4
- VBKIFHUVGLOJKT-FKZODXBYSA-N Asn-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)N)O VBKIFHUVGLOJKT-FKZODXBYSA-N 0.000 description 4
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 4
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 4
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 4
- 241001250698 Crepis alpina Species 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 4
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 4
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 4
- PASHZZBXZYEXFE-LSDHHAIUSA-N Gly-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)CN)C(=O)O PASHZZBXZYEXFE-LSDHHAIUSA-N 0.000 description 4
- FLUVGKKRRMLNPU-CQDKDKBSSA-N His-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLUVGKKRRMLNPU-CQDKDKBSSA-N 0.000 description 4
- LPBWRHRHEIYAIP-KKUMJFAQSA-N His-Tyr-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LPBWRHRHEIYAIP-KKUMJFAQSA-N 0.000 description 4
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 4
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 4
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 4
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 4
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 4
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 4
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 4
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 4
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 4
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 108010020688 glycylhistidine Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 108010040030 histidinoalanine Proteins 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 108010054155 lysyllysine Proteins 0.000 description 4
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 4
- 150000002924 oxiranes Chemical group 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- ATAKEVCGTRZKLI-UWJYBYFXSA-N Ala-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 ATAKEVCGTRZKLI-UWJYBYFXSA-N 0.000 description 3
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 3
- XPBVBZPVNFIHOA-UVBJJODRSA-N Ala-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 XPBVBZPVNFIHOA-UVBJJODRSA-N 0.000 description 3
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 3
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 3
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 3
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 3
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 3
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 3
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 3
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 3
- 244000178993 Brassica juncea Species 0.000 description 3
- 235000011332 Brassica juncea Nutrition 0.000 description 3
- 235000014700 Brassica juncea var napiformis Nutrition 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- RWAZRMXTVSIVJR-YUMQZZPRSA-N Cys-Gly-His Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CNC=N1)C(O)=O RWAZRMXTVSIVJR-YUMQZZPRSA-N 0.000 description 3
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 3
- 244000127993 Elaeis melanococca Species 0.000 description 3
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 3
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 3
- NIKBMHGRNAPJFW-IUCAKERBSA-N His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 NIKBMHGRNAPJFW-IUCAKERBSA-N 0.000 description 3
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 3
- RLAOTFTXBFQJDV-KKUMJFAQSA-N His-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CN=CN1 RLAOTFTXBFQJDV-KKUMJFAQSA-N 0.000 description 3
- QTMKFZAYZKBFRC-BZSNNMDCSA-N His-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N)O QTMKFZAYZKBFRC-BZSNNMDCSA-N 0.000 description 3
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 3
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 3
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 3
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 3
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 3
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 3
- AOFYPTOHESIBFZ-KKUMJFAQSA-N Leu-His-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O AOFYPTOHESIBFZ-KKUMJFAQSA-N 0.000 description 3
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 3
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 3
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 3
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 3
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 3
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 3
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 3
- 101710198130 NADPH-cytochrome P450 reductase Proteins 0.000 description 3
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 3
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 3
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 3
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 3
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 3
- VIIRRNQMMIHYHQ-XHSDSOJGSA-N Phe-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N VIIRRNQMMIHYHQ-XHSDSOJGSA-N 0.000 description 3
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 3
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 3
- HYLNRGXEQACDKG-NYVOZVTQSA-N Trp-Asn-Trp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HYLNRGXEQACDKG-NYVOZVTQSA-N 0.000 description 3
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 3
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 3
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 3
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 3
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 3
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 3
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 3
- KJFBXCFOPAKPTM-BZSNNMDCSA-N Val-Trp-Val Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 KJFBXCFOPAKPTM-BZSNNMDCSA-N 0.000 description 3
- LMVWCLDJNSBOEA-FKBYEOEOSA-N Val-Tyr-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N LMVWCLDJNSBOEA-FKBYEOEOSA-N 0.000 description 3
- YKZVPMUGEJXEOR-JYJNAYRXSA-N Val-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N YKZVPMUGEJXEOR-JYJNAYRXSA-N 0.000 description 3
- 241000736800 Vernonia Species 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 3
- 108010011559 alanylphenylalanine Proteins 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 229910003460 diamond Inorganic materials 0.000 description 3
- 239000010432 diamond Substances 0.000 description 3
- 108010054813 diprotin B Proteins 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 235000019387 fatty acid methyl ester Nutrition 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 108010018006 histidylserine Proteins 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 108010005942 methionylglycine Proteins 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 3
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 3
- 239000001509 sodium citrate Substances 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 108010084932 tryptophyl-proline Proteins 0.000 description 3
- 108010044292 tryptophyltyrosine Proteins 0.000 description 3
- 108010051110 tyrosyl-lysine Proteins 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 125000000579 2,2-diphenylethyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])(C1=C([H])C([H])=C([H])C([H])=C1[H])C([H])([H])* 0.000 description 2
- FOUZISDNESEYLX-UHFFFAOYSA-N 2-(2-hydroxyethylazaniumyl)acetate Chemical compound OCCNCC(O)=O FOUZISDNESEYLX-UHFFFAOYSA-N 0.000 description 2
- ONEGZXHXCLCVRF-UHFFFAOYSA-N 2-[[2-[[1-(2-amino-3-methylbutanoyl)pyrrolidine-2-carbonyl]amino]-3-methylbutanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(C(O)=O)NC(=O)C(C(C)C)NC(=O)C1CCCN1C(=O)C(N)C(C)C ONEGZXHXCLCVRF-UHFFFAOYSA-N 0.000 description 2
- GAUBNQMYYJLWNF-UHFFFAOYSA-N 3-(Carboxymethylamino)propanoic acid Chemical compound OC(=O)CCNCC(O)=O GAUBNQMYYJLWNF-UHFFFAOYSA-N 0.000 description 2
- FBUKMFOXMZRGRB-JXMROGBWSA-N 9,10-epoxy-12-octadecenoic acid Chemical compound CCCCC\C=C\CC1OC1CCCCCCCC(O)=O FBUKMFOXMZRGRB-JXMROGBWSA-N 0.000 description 2
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 2
- JQDFGZKKXBEANU-IMJSIDKUSA-N Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(O)=O JQDFGZKKXBEANU-IMJSIDKUSA-N 0.000 description 2
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 2
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 2
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 2
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 2
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 2
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 2
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 2
- JSLGXODUIAFWCF-WDSKDSINSA-N Arg-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O JSLGXODUIAFWCF-WDSKDSINSA-N 0.000 description 2
- NUBPTCMEOCKWDO-DCAQKATOSA-N Arg-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N NUBPTCMEOCKWDO-DCAQKATOSA-N 0.000 description 2
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 2
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 2
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 2
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 2
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 2
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 2
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 2
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 2
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 2
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 2
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- FBUKMFOXMZRGRB-UHFFFAOYSA-N Coronaric acid Natural products CCCCCC=CCC1OC1CCCCCCCC(O)=O FBUKMFOXMZRGRB-UHFFFAOYSA-N 0.000 description 2
- 108010070913 Crepis palaestina epoxygenase Proteins 0.000 description 2
- JXVFJOMFOLFPMP-KKUMJFAQSA-N Cys-Leu-Tyr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JXVFJOMFOLFPMP-KKUMJFAQSA-N 0.000 description 2
- XZFYRXDAULDNFX-UWVGGRQHSA-N Cys-Phe Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UWVGGRQHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-RFZPGFLSSA-N D-Isoleucine Chemical compound CC[C@@H](C)[C@@H](N)C(O)=O AGPKZVBTJJNPAG-RFZPGFLSSA-N 0.000 description 2
- CKLJMWTZIZZHCS-UWTATZPHSA-N D-aspartic acid Chemical compound OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-GSVOUGTGSA-N D-glutamic acid Chemical compound OC(=O)[C@H](N)CCC(O)=O WHUUTDBJXJRKMK-GSVOUGTGSA-N 0.000 description 2
- 229930182845 D-isoleucine Natural products 0.000 description 2
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 2
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 2
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 2
- ZPASCJBSSCRWMC-GVXVVHGQSA-N Glu-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N ZPASCJBSSCRWMC-GVXVVHGQSA-N 0.000 description 2
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 2
- UDEPRBFQTWGLCW-CIUDSAMLSA-N Glu-Pro-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O UDEPRBFQTWGLCW-CIUDSAMLSA-N 0.000 description 2
- BDISFWMLMNBTGP-NUMRIWBASA-N Glu-Thr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O BDISFWMLMNBTGP-NUMRIWBASA-N 0.000 description 2
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 2
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 2
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 2
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 2
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 2
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 2
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 2
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 2
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 2
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 2
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 2
- 244000299507 Gossypium hirsutum Species 0.000 description 2
- TVTIDSMADMIHEU-KKUMJFAQSA-N His-Cys-Phe Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CS)C(=O)N[C@@H](Cc1ccccc1)C(O)=O TVTIDSMADMIHEU-KKUMJFAQSA-N 0.000 description 2
- YTKOTXRIWQHSAZ-GUBZILKMSA-N His-Glu-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N YTKOTXRIWQHSAZ-GUBZILKMSA-N 0.000 description 2
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 2
- CNHSMSFYVARZLI-YJRXYDGGSA-N His-His-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CNHSMSFYVARZLI-YJRXYDGGSA-N 0.000 description 2
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 2
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 2
- CWSZWFILCNSNEX-CIUDSAMLSA-N His-Ser-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CWSZWFILCNSNEX-CIUDSAMLSA-N 0.000 description 2
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 2
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 2
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 2
- XBCWOTOCBXXJDG-BZSNNMDCSA-N Leu-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XBCWOTOCBXXJDG-BZSNNMDCSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 2
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 2
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 2
- YLMIDMSLKLRNHX-HSCHXYMDSA-N Leu-Trp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YLMIDMSLKLRNHX-HSCHXYMDSA-N 0.000 description 2
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 2
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 2
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 2
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 2
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 2
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 2
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 2
- NROQVSYLPRLJIP-PMVMPFDFSA-N Lys-Trp-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NROQVSYLPRLJIP-PMVMPFDFSA-N 0.000 description 2
- MYTOTTSMVMWVJN-STQMWFEESA-N Lys-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MYTOTTSMVMWVJN-STQMWFEESA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- CWLQUGTUXBXTLF-YFKPBYRVSA-N N-methylproline Chemical compound CN1CCC[C@H]1C(O)=O CWLQUGTUXBXTLF-YFKPBYRVSA-N 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 102000004020 Oxygenases Human genes 0.000 description 2
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 2
- MDHZEOMXGNBSIL-DLOVCJGASA-N Phe-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MDHZEOMXGNBSIL-DLOVCJGASA-N 0.000 description 2
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 2
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 2
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 2
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 2
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 2
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 2
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 2
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 2
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 2
- FSXRLASFHBWESK-HOTGVXAUSA-N Phe-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 FSXRLASFHBWESK-HOTGVXAUSA-N 0.000 description 2
- GCFNFKNPCMBHNT-IRXDYDNUSA-N Phe-Tyr-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)NCC(=O)O)N GCFNFKNPCMBHNT-IRXDYDNUSA-N 0.000 description 2
- FRMKIPSIZSFTTE-HJOGWXRNSA-N Phe-Tyr-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FRMKIPSIZSFTTE-HJOGWXRNSA-N 0.000 description 2
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 2
- BEPSGCXDIVACBU-IUCAKERBSA-N Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BEPSGCXDIVACBU-IUCAKERBSA-N 0.000 description 2
- DTQIXTOJHKVEOH-DCAQKATOSA-N Pro-His-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O DTQIXTOJHKVEOH-DCAQKATOSA-N 0.000 description 2
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 2
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 2
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 2
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 2
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 2
- 240000000528 Ricinus communis Species 0.000 description 2
- 235000004443 Ricinus communis Nutrition 0.000 description 2
- BRIZMMZEYSAKJX-QEJZJMRPSA-N Ser-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N BRIZMMZEYSAKJX-QEJZJMRPSA-N 0.000 description 2
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 2
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 235000002634 Solanum Nutrition 0.000 description 2
- 241000207763 Solanum Species 0.000 description 2
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 2
- XIULAFZYEKSGAJ-IXOXFDKPSA-N Thr-Leu-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XIULAFZYEKSGAJ-IXOXFDKPSA-N 0.000 description 2
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 2
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 2
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 2
- PJCYRZVSACOYSN-ZJDVBMNYSA-N Thr-Thr-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O PJCYRZVSACOYSN-ZJDVBMNYSA-N 0.000 description 2
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 2
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 2
- DZHDVYLBNKMLMB-ZFWWWQNUSA-N Trp-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 DZHDVYLBNKMLMB-ZFWWWQNUSA-N 0.000 description 2
- GRSCONMARGNYHA-PMVMPFDFSA-N Trp-Lys-Phe Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GRSCONMARGNYHA-PMVMPFDFSA-N 0.000 description 2
- BUWIKRJTARQGNZ-IHPCNDPISA-N Trp-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N BUWIKRJTARQGNZ-IHPCNDPISA-N 0.000 description 2
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 2
- OEVJGIHPQOXYFE-SRVKXCTJSA-N Tyr-Asn-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OEVJGIHPQOXYFE-SRVKXCTJSA-N 0.000 description 2
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 2
- KEANSLVUGJADPN-LKTVYLICSA-N Tyr-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N KEANSLVUGJADPN-LKTVYLICSA-N 0.000 description 2
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 2
- AUEJLPRZGVVDNU-STQMWFEESA-N Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-STQMWFEESA-N 0.000 description 2
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 2
- NVZVJIUDICCMHZ-BZSNNMDCSA-N Tyr-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O NVZVJIUDICCMHZ-BZSNNMDCSA-N 0.000 description 2
- RZAGEHHVNYESNR-RNXOBYDBSA-N Tyr-Trp-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RZAGEHHVNYESNR-RNXOBYDBSA-N 0.000 description 2
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 2
- VJOWWOGRNXRQMF-UVBJJODRSA-N Val-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 VJOWWOGRNXRQMF-UVBJJODRSA-N 0.000 description 2
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 2
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 2
- JMCOXFSCTGKLLB-FKBYEOEOSA-N Val-Phe-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JMCOXFSCTGKLLB-FKBYEOEOSA-N 0.000 description 2
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 2
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 2
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 2
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 2
- 239000000853 adhesive Substances 0.000 description 2
- 230000001070 adhesive effect Effects 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- DLAMVQGYEVKIRE-UHFFFAOYSA-N alpha-(methylamino)isobutyric acid Chemical compound CNC(C)(C)C(O)=O DLAMVQGYEVKIRE-UHFFFAOYSA-N 0.000 description 2
- 229940067621 aminobutyrate Drugs 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 229940009098 aspartate Drugs 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 235000021281 monounsaturated fatty acids Nutrition 0.000 description 2
- 108010023506 peroxygenase Proteins 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- 108010073101 phenylalanylleucine Proteins 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- FSYKKLYZXJSNPZ-UHFFFAOYSA-N sarcosine Chemical compound C[NH2+]CC([O-])=O FSYKKLYZXJSNPZ-UHFFFAOYSA-N 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- RSPOGBIHKNKRFJ-MSZQBOFLSA-N (2S)-2-amino-2,3-dimethylpentanoic acid Chemical compound C[C@@](C(=O)O)(C(CC)C)N RSPOGBIHKNKRFJ-MSZQBOFLSA-N 0.000 description 1
- ADHNUPOJJCKWRT-JLXBFWJWSA-N (2e,4e)-octadeca-2,4-dienoic acid Chemical compound CCCCCCCCCCCCC\C=C\C=C\C(O)=O ADHNUPOJJCKWRT-JLXBFWJWSA-N 0.000 description 1
- CWLQUGTUXBXTLF-RXMQYKEDSA-N (2r)-1-methylpyrrolidine-2-carboxylic acid Chemical compound CN1CCC[C@@H]1C(O)=O CWLQUGTUXBXTLF-RXMQYKEDSA-N 0.000 description 1
- YAXAFCHJCYILRU-RXMQYKEDSA-N (2r)-2-(methylamino)-4-methylsulfanylbutanoic acid Chemical compound CN[C@@H](C(O)=O)CCSC YAXAFCHJCYILRU-RXMQYKEDSA-N 0.000 description 1
- XLBVNMSMFQMKEY-SCSAIBSYSA-N (2r)-2-(methylamino)pentanedioic acid Chemical compound CN[C@@H](C(O)=O)CCC(O)=O XLBVNMSMFQMKEY-SCSAIBSYSA-N 0.000 description 1
- GDFAOVXKHJXLEI-GSVOUGTGSA-N (2r)-2-(methylamino)propanoic acid Chemical compound CN[C@H](C)C(O)=O GDFAOVXKHJXLEI-GSVOUGTGSA-N 0.000 description 1
- SCIFESDRCALIIM-SECBINFHSA-N (2r)-2-(methylazaniumyl)-3-phenylpropanoate Chemical compound CN[C@@H](C(O)=O)CC1=CC=CC=C1 SCIFESDRCALIIM-SECBINFHSA-N 0.000 description 1
- NHTGHBARYWONDQ-SNVBAGLBSA-N (2r)-2-amino-3-(4-hydroxyphenyl)-2-methylpropanoic acid Chemical compound OC(=O)[C@@](N)(C)CC1=CC=C(O)C=C1 NHTGHBARYWONDQ-SNVBAGLBSA-N 0.000 description 1
- HYOWVAAEQCNGLE-SNVBAGLBSA-N (2r)-2-azaniumyl-2-methyl-3-phenylpropanoate Chemical compound [O-]C(=O)[C@@]([NH3+])(C)CC1=CC=CC=C1 HYOWVAAEQCNGLE-SNVBAGLBSA-N 0.000 description 1
- ZYVMPHJZWXIFDQ-ZCFIWIBFSA-N (2r)-2-azaniumyl-2-methyl-4-methylsulfanylbutanoate Chemical compound CSCC[C@@](C)(N)C(O)=O ZYVMPHJZWXIFDQ-ZCFIWIBFSA-N 0.000 description 1
- LWHHAVWYGIBIEU-ZCFIWIBFSA-N (2r)-2-methylpyrrolidin-1-ium-2-carboxylate Chemical compound OC(=O)[C@@]1(C)CCCN1 LWHHAVWYGIBIEU-ZCFIWIBFSA-N 0.000 description 1
- CYZKJBZEIFWZSR-ZCFIWIBFSA-N (2r)-3-(1h-imidazol-5-yl)-2-(methylamino)propanoic acid Chemical compound CN[C@@H](C(O)=O)CC1=CN=CN1 CYZKJBZEIFWZSR-ZCFIWIBFSA-N 0.000 description 1
- CZCIKBSVHDNIDH-LLVKDONJSA-N (2r)-3-(1h-indol-3-yl)-2-(methylamino)propanoic acid Chemical compound C1=CC=C2C(C[C@@H](NC)C(O)=O)=CNC2=C1 CZCIKBSVHDNIDH-LLVKDONJSA-N 0.000 description 1
- LNSMPSPTFDIWRQ-GSVOUGTGSA-N (2r)-4-amino-2-(methylamino)-4-oxobutanoic acid Chemical compound CN[C@@H](C(O)=O)CC(N)=O LNSMPSPTFDIWRQ-GSVOUGTGSA-N 0.000 description 1
- NTWVQPHTOUKMDI-RXMQYKEDSA-N (2r)-5-(diaminomethylideneamino)-2-(methylamino)pentanoic acid Chemical compound CN[C@@H](C(O)=O)CCCNC(N)=N NTWVQPHTOUKMDI-RXMQYKEDSA-N 0.000 description 1
- KSZFSNZOGAXEGH-SCSAIBSYSA-N (2r)-5-amino-2-(methylamino)-5-oxopentanoic acid Chemical compound CN[C@@H](C(O)=O)CCC(N)=O KSZFSNZOGAXEGH-SCSAIBSYSA-N 0.000 description 1
- OZRWQPFBXDVLAH-RXMQYKEDSA-N (2r)-5-amino-2-(methylamino)pentanoic acid Chemical compound CN[C@@H](C(O)=O)CCCN OZRWQPFBXDVLAH-RXMQYKEDSA-N 0.000 description 1
- OLYPWXRMOFUVGH-ZCFIWIBFSA-N (2r)-6-amino-2-(methylamino)hexanoic acid Chemical compound CN[C@@H](C(O)=O)CCCCN OLYPWXRMOFUVGH-ZCFIWIBFSA-N 0.000 description 1
- KSPIYJQBLVDRRI-NTSWFWBYSA-N (2r,3s)-3-methyl-2-(methylazaniumyl)pentanoate Chemical compound CC[C@H](C)[C@@H](NC)C(O)=O KSPIYJQBLVDRRI-NTSWFWBYSA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- BVAUMRCGVHUWOZ-ZETCQYMHSA-N (2s)-2-(cyclohexylazaniumyl)propanoate Chemical compound OC(=O)[C@H](C)NC1CCCCC1 BVAUMRCGVHUWOZ-ZETCQYMHSA-N 0.000 description 1
- LDUWTIUXPVCEQF-LURJTMIESA-N (2s)-2-(cyclopentylamino)propanoic acid Chemical compound OC(=O)[C@H](C)NC1CCCC1 LDUWTIUXPVCEQF-LURJTMIESA-N 0.000 description 1
- FPDYKABXINADKS-LURJTMIESA-N (2s)-2-(methylazaniumyl)hexanoate Chemical compound CCCC[C@H](NC)C(O)=O FPDYKABXINADKS-LURJTMIESA-N 0.000 description 1
- HCPKYUNZBPVCHC-YFKPBYRVSA-N (2s)-2-(methylazaniumyl)pentanoate Chemical compound CCC[C@H](NC)C(O)=O HCPKYUNZBPVCHC-YFKPBYRVSA-N 0.000 description 1
- IZLOSIXADNUSCM-ACRUOGEOSA-N (2s)-2-[[[(4s)-4-carboxy-4-[[(4s)-4-carboxy-4-[6-[(4-fluorobenzoyl)amino]hexanoylamino]butanoyl]amino]butoxy]-hydroxyphosphoryl]amino]pentanedioic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NP(O)(=O)OCCC[C@@H](C(O)=O)NC(=O)CC[C@@H](C(O)=O)NC(=O)CCCCCNC(=O)C1=CC=C(F)C=C1 IZLOSIXADNUSCM-ACRUOGEOSA-N 0.000 description 1
- WTDHSXGBDZBWAW-QMMMGPOBSA-N (2s)-2-[cyclohexyl(methyl)azaniumyl]propanoate Chemical compound OC(=O)[C@H](C)N(C)C1CCCCC1 WTDHSXGBDZBWAW-QMMMGPOBSA-N 0.000 description 1
- IUYZJPXOXGRNNE-ZETCQYMHSA-N (2s)-2-[cyclopentyl(methyl)amino]propanoic acid Chemical compound OC(=O)[C@H](C)N(C)C1CCCC1 IUYZJPXOXGRNNE-ZETCQYMHSA-N 0.000 description 1
- NPDBDJFLKKQMCM-SCSAIBSYSA-N (2s)-2-amino-3,3-dimethylbutanoic acid Chemical compound CC(C)(C)[C@H](N)C(O)=O NPDBDJFLKKQMCM-SCSAIBSYSA-N 0.000 description 1
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 1
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 1
- GPYTYOMSQHBYTK-LURJTMIESA-N (2s)-2-azaniumyl-2,3-dimethylbutanoate Chemical compound CC(C)[C@](C)([NH3+])C([O-])=O GPYTYOMSQHBYTK-LURJTMIESA-N 0.000 description 1
- LWHHAVWYGIBIEU-LURJTMIESA-N (2s)-2-methylpyrrolidin-1-ium-2-carboxylate Chemical compound [O-]C(=O)[C@]1(C)CCC[NH2+]1 LWHHAVWYGIBIEU-LURJTMIESA-N 0.000 description 1
- KWWFNGCKGYUCLC-RXMQYKEDSA-N (2s)-3,3-dimethyl-2-(methylamino)butanoic acid Chemical compound CN[C@H](C(O)=O)C(C)(C)C KWWFNGCKGYUCLC-RXMQYKEDSA-N 0.000 description 1
- AXDLCFOOGCNDST-VIFPVBQESA-N (2s)-3-(4-hydroxyphenyl)-2-(methylamino)propanoic acid Chemical compound CN[C@H](C(O)=O)CC1=CC=C(O)C=C1 AXDLCFOOGCNDST-VIFPVBQESA-N 0.000 description 1
- XKZCXMNMUMGDJG-AWEZNQCLSA-N (2s)-3-[(6-acetylnaphthalen-2-yl)amino]-2-aminopropanoic acid Chemical compound C1=C(NC[C@H](N)C(O)=O)C=CC2=CC(C(=O)C)=CC=C21 XKZCXMNMUMGDJG-AWEZNQCLSA-N 0.000 description 1
- LNSMPSPTFDIWRQ-VKHMYHEASA-N (2s)-4-amino-2-(methylamino)-4-oxobutanoic acid Chemical compound CN[C@H](C(O)=O)CC(N)=O LNSMPSPTFDIWRQ-VKHMYHEASA-N 0.000 description 1
- XJODGRWDFZVTKW-LURJTMIESA-N (2s)-4-methyl-2-(methylamino)pentanoic acid Chemical compound CN[C@H](C(O)=O)CC(C)C XJODGRWDFZVTKW-LURJTMIESA-N 0.000 description 1
- ZFCTVQXXABERPH-RZVRUWJTSA-N (2s)-5-amino-2-(methylamino)-5-oxopentanoic acid;(2s)-2-(methylamino)pentanedioic acid Chemical compound CN[C@H](C(O)=O)CCC(N)=O.CN[C@H](C(O)=O)CCC(O)=O ZFCTVQXXABERPH-RZVRUWJTSA-N 0.000 description 1
- OZRWQPFBXDVLAH-YFKPBYRVSA-N (2s)-5-amino-2-(methylamino)pentanoic acid Chemical compound CN[C@H](C(O)=O)CCCN OZRWQPFBXDVLAH-YFKPBYRVSA-N 0.000 description 1
- RHMALYOXPBRJBG-WXHCCQJTSA-N (2s)-6-amino-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-6-amino-2-[[(2s)-2-[[(2s)-2-[[2-[[(2s,3r)-2-[[(2s)-2-[[2-[[2-[[(2r)-2-amino-3-phenylpropanoyl]amino]acetyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-3-hydroxybutanoyl]amino]acetyl]amino]propanoyl]amino]- Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(N)=O)NC(=O)CNC(=O)CNC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RHMALYOXPBRJBG-WXHCCQJTSA-N 0.000 description 1
- PAHHYDSPOXDASW-VGWMRTNUSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-1-[(2s)-2-amino-3-hydroxypropanoyl]pyrrolidine-2-carbonyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO PAHHYDSPOXDASW-VGWMRTNUSA-N 0.000 description 1
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- LJRDOKAZOAKLDU-UDXJMMFXSA-N (2s,3s,4r,5r,6r)-5-amino-2-(aminomethyl)-6-[(2r,3s,4r,5s)-5-[(1r,2r,3s,5r,6s)-3,5-diamino-2-[(2s,3r,4r,5s,6r)-3-amino-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-6-hydroxycyclohexyl]oxy-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl]oxyoxane-3,4-diol;sulfuric ac Chemical compound OS(O)(=O)=O.N[C@@H]1[C@@H](O)[C@H](O)[C@H](CN)O[C@@H]1O[C@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](N)C[C@@H](N)[C@@H]2O)O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)N)O[C@@H]1CO LJRDOKAZOAKLDU-UDXJMMFXSA-N 0.000 description 1
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 125000004066 1-hydroxyethyl group Chemical group [H]OC([H])([*])C([H])([H])[H] 0.000 description 1
- YFABJDFPWQGZEM-UHFFFAOYSA-N 10-(3-dodec-2-enyloxiran-2-yl)deca-5,8-dienoic acid Chemical compound CCCCCCCCCC=CCC1OC1CC=CCC=CCCCC(O)=O YFABJDFPWQGZEM-UHFFFAOYSA-N 0.000 description 1
- YIGOUQPEZPVCTI-UHFFFAOYSA-N 14-(3-ethyloxiran-2-yl)tetradeca-2,4-dienoic acid Chemical compound CCC1OC1CCCCCCCCCC=CC=CC(O)=O YIGOUQPEZPVCTI-UHFFFAOYSA-N 0.000 description 1
- HKSDVVJONLXYKL-ZFILXNNPSA-N 15,16-epoxy-9,12-octadecadienoic acid Chemical compound CCC1OC1C\C=C/C\C=C\CCCCCCCC(O)=O HKSDVVJONLXYKL-ZFILXNNPSA-N 0.000 description 1
- HKSDVVJONLXYKL-UHFFFAOYSA-N 15,16-epoxy-9,12-octadecadienoic acid Natural products CCC1OC1CC=CCC=CCCCCCCCC(O)=O HKSDVVJONLXYKL-UHFFFAOYSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical compound NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- DHGYLUFLENKZHH-UHFFFAOYSA-N 2-(3-aminopropylamino)acetic acid Chemical compound NCCCNCC(O)=O DHGYLUFLENKZHH-UHFFFAOYSA-N 0.000 description 1
- OGAULEBSQQMUKP-UHFFFAOYSA-N 2-(4-aminobutylamino)acetic acid Chemical compound NCCCCNCC(O)=O OGAULEBSQQMUKP-UHFFFAOYSA-N 0.000 description 1
- KGSVNOLLROCJQM-UHFFFAOYSA-N 2-(benzylamino)acetic acid Chemical compound OC(=O)CNCC1=CC=CC=C1 KGSVNOLLROCJQM-UHFFFAOYSA-N 0.000 description 1
- IVCQRTJVLJXKKJ-UHFFFAOYSA-N 2-(butan-2-ylazaniumyl)acetate Chemical compound CCC(C)NCC(O)=O IVCQRTJVLJXKKJ-UHFFFAOYSA-N 0.000 description 1
- KQLGGQARRCMYGD-UHFFFAOYSA-N 2-(cyclobutylamino)acetic acid Chemical compound OC(=O)CNC1CCC1 KQLGGQARRCMYGD-UHFFFAOYSA-N 0.000 description 1
- DICMQVOBSKLBBN-UHFFFAOYSA-N 2-(cyclodecylamino)acetic acid Chemical compound OC(=O)CNC1CCCCCCCCC1 DICMQVOBSKLBBN-UHFFFAOYSA-N 0.000 description 1
- RDLWRTMITWVDLV-UHFFFAOYSA-N 2-(cyclododecylamino)acetic acid Chemical compound OC(=O)CNC1CCCCCCCCCCC1 RDLWRTMITWVDLV-UHFFFAOYSA-N 0.000 description 1
- NPLBBQAAYSJEMO-UHFFFAOYSA-N 2-(cycloheptylazaniumyl)acetate Chemical compound OC(=O)CNC1CCCCCC1 NPLBBQAAYSJEMO-UHFFFAOYSA-N 0.000 description 1
- OQMYZVWIXPPDDE-UHFFFAOYSA-N 2-(cyclohexylazaniumyl)acetate Chemical compound OC(=O)CNC1CCCCC1 OQMYZVWIXPPDDE-UHFFFAOYSA-N 0.000 description 1
- PNKNDNFLQNMQJL-UHFFFAOYSA-N 2-(cyclooctylazaniumyl)acetate Chemical compound OC(=O)CNC1CCCCCCC1 PNKNDNFLQNMQJL-UHFFFAOYSA-N 0.000 description 1
- DXQCCQKRNWMECV-UHFFFAOYSA-N 2-(cyclopropylazaniumyl)acetate Chemical compound OC(=O)CNC1CC1 DXQCCQKRNWMECV-UHFFFAOYSA-N 0.000 description 1
- PRVOMNLNSHAUEI-UHFFFAOYSA-N 2-(cycloundecylamino)acetic acid Chemical compound OC(=O)CNC1CCCCCCCCCC1 PRVOMNLNSHAUEI-UHFFFAOYSA-N 0.000 description 1
- HEPOIJKOXBKKNJ-UHFFFAOYSA-N 2-(propan-2-ylazaniumyl)acetate Chemical compound CC(C)NCC(O)=O HEPOIJKOXBKKNJ-UHFFFAOYSA-N 0.000 description 1
- YDBPFLZECVWPSH-UHFFFAOYSA-N 2-[3-(diaminomethylideneamino)propylamino]acetic acid Chemical compound NC(=N)NCCCNCC(O)=O YDBPFLZECVWPSH-UHFFFAOYSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- WBXOONOXOHMGQW-UHFFFAOYSA-N 3-aminobicyclo[2.2.1]heptane-4-carboxylic acid Chemical compound C1CC2(C(O)=O)C(N)CC1C2 WBXOONOXOHMGQW-UHFFFAOYSA-N 0.000 description 1
- 101800000535 3C-like proteinase Proteins 0.000 description 1
- 101800002396 3C-like proteinase nsp5 Proteins 0.000 description 1
- OILYOLYCRVWTFK-UHFFFAOYSA-N 4-(3-octadeca-2,5,8-trienyloxiran-2-yl)butanoic acid Chemical compound CCCCCCCCCC=CCC=CCC=CCC1OC1CCCC(O)=O OILYOLYCRVWTFK-UHFFFAOYSA-N 0.000 description 1
- RMZKYTQLBKGARQ-UHFFFAOYSA-N 7-(3-pentadeca-2,5-dienyloxiran-2-yl)hept-5-enoic acid Chemical compound CCCCCCCCCC=CCC=CCC1OC1CC=CCCCC(O)=O RMZKYTQLBKGARQ-UHFFFAOYSA-N 0.000 description 1
- LJHZTUXMTXHFAK-UHFFFAOYSA-N 8-(3-hexyloxiran-2-yl)octanoic acid Chemical compound CCCCCCC1OC1CCCCCCCC(O)=O LJHZTUXMTXHFAK-UHFFFAOYSA-N 0.000 description 1
- HSUFTYAWQXVISU-UHFFFAOYSA-N 8-[3-[[3-[(3-ethyloxiran-2-yl)methyl]oxiran-2-yl]methyl]oxiran-2-yl]octanoic acid Chemical compound CCC1OC1CC1C(CC2C(O2)CCCCCCCC(O)=O)O1 HSUFTYAWQXVISU-UHFFFAOYSA-N 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 1
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 1
- HGRBNYQIMKTUNT-XVYDVKMFSA-N Ala-Asn-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HGRBNYQIMKTUNT-XVYDVKMFSA-N 0.000 description 1
- WQVYAWIMAWTGMW-ZLUOBGJFSA-N Ala-Asp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WQVYAWIMAWTGMW-ZLUOBGJFSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- OMNVYXHOSHNURL-WPRPVWTQSA-N Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMNVYXHOSHNURL-WPRPVWTQSA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 1
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UFBFGSQYSA-N Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UFBFGSQYSA-N 0.000 description 1
- FSXDWQGEWZQBPJ-HERUPUMHSA-N Ala-Trp-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FSXDWQGEWZQBPJ-HERUPUMHSA-N 0.000 description 1
- VQBULXOHAZSTQY-GKCIPKSASA-N Ala-Trp-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VQBULXOHAZSTQY-GKCIPKSASA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- DEFJQIDDEAULHB-UHFFFAOYSA-N Alanyl-alanine Chemical compound CC(N)C(=O)NC(C)C(O)=O DEFJQIDDEAULHB-UHFFFAOYSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- NYZGVTGOMPHSJW-CIUDSAMLSA-N Arg-Glu-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N NYZGVTGOMPHSJW-CIUDSAMLSA-N 0.000 description 1
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 1
- LQJAALCCPOTJGB-YUMQZZPRSA-N Arg-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 1
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- QADCERNTBWTXFV-JSGCOSHPSA-N Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(O)=O)=CNC2=C1 QADCERNTBWTXFV-JSGCOSHPSA-N 0.000 description 1
- XOZYYXMHMIEJET-XIRDDKMYSA-N Arg-Trp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O XOZYYXMHMIEJET-XIRDDKMYSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- SJUXYGVRSGTPMC-IMJSIDKUSA-N Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O SJUXYGVRSGTPMC-IMJSIDKUSA-N 0.000 description 1
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 1
- ZTRJUKDEALVRMW-SRVKXCTJSA-N Asn-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZTRJUKDEALVRMW-SRVKXCTJSA-N 0.000 description 1
- JGIAYNNXZKKKOW-KKUMJFAQSA-N Asn-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N JGIAYNNXZKKKOW-KKUMJFAQSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 1
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 1
- RGGVDKVXLBOLNS-JQWIXIFHSA-N Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)N)C(O)=O)=CNC2=C1 RGGVDKVXLBOLNS-JQWIXIFHSA-N 0.000 description 1
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 1
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 1
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 1
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 1
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- XAPPCWUWHNWCPQ-PBCZWWQYSA-N Asp-Thr-His Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O XAPPCWUWHNWCPQ-PBCZWWQYSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- NVMMUAUTQCWYHD-ABHRYQDASA-N Asp-Val-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 NVMMUAUTQCWYHD-ABHRYQDASA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 241000726103 Atta Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- MTIJQNAGSPRELL-UHFFFAOYSA-N C(CCCC=CCC=CCCCCCCCCCCCCCCC)(=O)O Chemical compound C(CCCC=CCC=CCCCCCCCCCCCCCCC)(=O)O MTIJQNAGSPRELL-UHFFFAOYSA-N 0.000 description 1
- 101100228200 Caenorhabditis elegans gly-5 gene Proteins 0.000 description 1
- 101100285688 Caenorhabditis elegans hrg-7 gene Proteins 0.000 description 1
- 102100033029 Carbonic anhydrase-related protein 11 Human genes 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 244000289527 Cordyline terminalis Species 0.000 description 1
- 235000009091 Cordyline terminalis Nutrition 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- LVZWSLJZHVFIQJ-UHFFFAOYSA-N Cyclopropane Chemical compound C1CC1 LVZWSLJZHVFIQJ-UHFFFAOYSA-N 0.000 description 1
- HAYVTMHUNMMXCV-IMJSIDKUSA-N Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CS HAYVTMHUNMMXCV-IMJSIDKUSA-N 0.000 description 1
- ZOLXQKZHYOHHMD-DLOVCJGASA-N Cys-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N ZOLXQKZHYOHHMD-DLOVCJGASA-N 0.000 description 1
- UUERSUCTHOZPMG-SRVKXCTJSA-N Cys-Asn-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UUERSUCTHOZPMG-SRVKXCTJSA-N 0.000 description 1
- BUXAPSQPMALTOY-WHFBIAKZSA-N Cys-Glu Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BUXAPSQPMALTOY-WHFBIAKZSA-N 0.000 description 1
- BDWIZLQVVWQMTB-XKBZYTNZSA-N Cys-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N)O BDWIZLQVVWQMTB-XKBZYTNZSA-N 0.000 description 1
- DIUBVGXMXONJCF-KKUMJFAQSA-N Cys-His-Tyr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DIUBVGXMXONJCF-KKUMJFAQSA-N 0.000 description 1
- YFAFBAPQHGULQT-HJPIBITLSA-N Cys-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N YFAFBAPQHGULQT-HJPIBITLSA-N 0.000 description 1
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 1
- VXLXATVURDNDCG-CIUDSAMLSA-N Cys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N VXLXATVURDNDCG-CIUDSAMLSA-N 0.000 description 1
- OZSBRCONEMXYOJ-AVGNSLFASA-N Cys-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N OZSBRCONEMXYOJ-AVGNSLFASA-N 0.000 description 1
- RESAHOSBQHMOKH-KKUMJFAQSA-N Cys-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N RESAHOSBQHMOKH-KKUMJFAQSA-N 0.000 description 1
- IDZDFWJNPOOOHE-KKUMJFAQSA-N Cys-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N IDZDFWJNPOOOHE-KKUMJFAQSA-N 0.000 description 1
- ALNKNYKSZPSLBD-ZDLURKLDSA-N Cys-Thr-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ALNKNYKSZPSLBD-ZDLURKLDSA-N 0.000 description 1
- UGPCUUWZXRMCIJ-KKUMJFAQSA-N Cys-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CS)N UGPCUUWZXRMCIJ-KKUMJFAQSA-N 0.000 description 1
- WVWRADGCZPIJJR-IHRRRGAJSA-N Cys-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N WVWRADGCZPIJJR-IHRRRGAJSA-N 0.000 description 1
- XUJNEKJLAYXESH-UWTATZPHSA-N D-Cysteine Chemical compound SC[C@@H](N)C(O)=O XUJNEKJLAYXESH-UWTATZPHSA-N 0.000 description 1
- AHLPHDHHMVZTML-SCSAIBSYSA-N D-Ornithine Chemical compound NCCC[C@@H](N)C(O)=O AHLPHDHHMVZTML-SCSAIBSYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-SCSAIBSYSA-N D-Proline Chemical compound OC(=O)[C@H]1CCCN1 ONIBWKKTOPOVIA-SCSAIBSYSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UWTATZPHSA-N D-Serine Chemical compound OC[C@@H](N)C(O)=O MTCFGRXMJLQNBG-UWTATZPHSA-N 0.000 description 1
- 229930195711 D-Serine Natural products 0.000 description 1
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-SCSAIBSYSA-N D-arginine Chemical compound OC(=O)[C@H](N)CCCNC(N)=N ODKSFYDXXFIFQN-SCSAIBSYSA-N 0.000 description 1
- 229930028154 D-arginine Natural products 0.000 description 1
- 229930182847 D-glutamic acid Natural products 0.000 description 1
- ZDXPYRJPNDTMRX-GSVOUGTGSA-N D-glutamine Chemical compound OC(=O)[C@H](N)CCC(N)=O ZDXPYRJPNDTMRX-GSVOUGTGSA-N 0.000 description 1
- 229930195715 D-glutamine Natural products 0.000 description 1
- HNDVDQJCIGZPNO-RXMQYKEDSA-N D-histidine Chemical compound OC(=O)[C@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-RXMQYKEDSA-N 0.000 description 1
- 229930195721 D-histidine Natural products 0.000 description 1
- ROHFNLRQFUQHCH-RXMQYKEDSA-N D-leucine Chemical compound CC(C)C[C@@H](N)C(O)=O ROHFNLRQFUQHCH-RXMQYKEDSA-N 0.000 description 1
- 229930182819 D-leucine Natural products 0.000 description 1
- KDXKERNSBIXSRK-RXMQYKEDSA-N D-lysine Chemical compound NCCCC[C@@H](N)C(O)=O KDXKERNSBIXSRK-RXMQYKEDSA-N 0.000 description 1
- FFEARJCKVFRZRR-SCSAIBSYSA-N D-methionine Chemical compound CSCC[C@@H](N)C(O)=O FFEARJCKVFRZRR-SCSAIBSYSA-N 0.000 description 1
- 229930182818 D-methionine Natural products 0.000 description 1
- COLNVLDHVKWLRT-MRVPVSSYSA-N D-phenylalanine Chemical compound OC(=O)[C@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-MRVPVSSYSA-N 0.000 description 1
- 229930182832 D-phenylalanine Natural products 0.000 description 1
- 229930182820 D-proline Natural products 0.000 description 1
- AYFVYJQAPQTCCC-STHAYSLISA-N D-threonine Chemical compound C[C@H](O)[C@@H](N)C(O)=O AYFVYJQAPQTCCC-STHAYSLISA-N 0.000 description 1
- 229930182822 D-threonine Natural products 0.000 description 1
- 229930182827 D-tryptophan Natural products 0.000 description 1
- QIVBCDIJIAJPQS-SECBINFHSA-N D-tryptophane Chemical compound C1=CC=C2C(C[C@@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-SECBINFHSA-N 0.000 description 1
- OUYCCCASQSFEME-MRVPVSSYSA-N D-tyrosine Chemical compound OC(=O)[C@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-MRVPVSSYSA-N 0.000 description 1
- 229930195709 D-tyrosine Natural products 0.000 description 1
- KZSNJWFQEVHDMF-SCSAIBSYSA-N D-valine Chemical compound CC(C)[C@@H](N)C(O)=O KZSNJWFQEVHDMF-SCSAIBSYSA-N 0.000 description 1
- 229930182831 D-valine Natural products 0.000 description 1
- 229930195710 D‐cysteine Natural products 0.000 description 1
- 241001337814 Erysiphe glycines Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- MPZWMIIOPAPAKE-BQBZGAKWSA-N Glu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MPZWMIIOPAPAKE-BQBZGAKWSA-N 0.000 description 1
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 1
- PABVKUJVLNMOJP-WHFBIAKZSA-N Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(O)=O PABVKUJVLNMOJP-WHFBIAKZSA-N 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 1
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- MXXXVOYFNVJHMA-IUCAKERBSA-N Gly-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN MXXXVOYFNVJHMA-IUCAKERBSA-N 0.000 description 1
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- LLXVQPKEQQCISF-YUMQZZPRSA-N Gly-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN LLXVQPKEQQCISF-YUMQZZPRSA-N 0.000 description 1
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 1
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 1
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 1
- CQIIXEHDSZUSAG-QWRGUYRKSA-N Gly-His-His Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CQIIXEHDSZUSAG-QWRGUYRKSA-N 0.000 description 1
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 1
- IROABALAWGJQGM-OALUTQOASA-N Gly-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)CN IROABALAWGJQGM-OALUTQOASA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- OOFLZRMKTMLSMH-UHFFFAOYSA-N H4atta Chemical compound OC(=O)CN(CC(O)=O)CC1=CC=CC(C=2N=C(C=C(C=2)C=2C3=CC=CC=C3C=C3C=CC=CC3=2)C=2N=C(CN(CC(O)=O)CC(O)=O)C=CC=2)=N1 OOFLZRMKTMLSMH-UHFFFAOYSA-N 0.000 description 1
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 1
- WSDOHRLQDGAOGU-BQBZGAKWSA-N His-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 WSDOHRLQDGAOGU-BQBZGAKWSA-N 0.000 description 1
- SYIPVNMWBZXKMU-HJPIBITLSA-N His-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N SYIPVNMWBZXKMU-HJPIBITLSA-N 0.000 description 1
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 1
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- PGRPSOUCWRBWKZ-DLOVCJGASA-N His-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 PGRPSOUCWRBWKZ-DLOVCJGASA-N 0.000 description 1
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 1
- SGLXGEDPYJPGIQ-ACRUOGEOSA-N His-Phe-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N SGLXGEDPYJPGIQ-ACRUOGEOSA-N 0.000 description 1
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 1
- WRPDZHJNLYNFFT-GEVIPFJHSA-N His-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O WRPDZHJNLYNFFT-GEVIPFJHSA-N 0.000 description 1
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 1
- MCGOGXFMKHPMSQ-AVGNSLFASA-N His-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MCGOGXFMKHPMSQ-AVGNSLFASA-N 0.000 description 1
- 101000867841 Homo sapiens Carbonic anhydrase-related protein 11 Proteins 0.000 description 1
- 101001075218 Homo sapiens Gastrokine-1 Proteins 0.000 description 1
- 101000946053 Homo sapiens Lysosomal-associated transmembrane protein 4A Proteins 0.000 description 1
- 101000619708 Homo sapiens Peroxiredoxin-6 Proteins 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 1
- VZSDQFZFTCVEGF-ZEWNOJEFSA-N Ile-Phe-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O VZSDQFZFTCVEGF-ZEWNOJEFSA-N 0.000 description 1
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 1
- GDFAOVXKHJXLEI-UHFFFAOYSA-N L-N-Boc-N-methylalanine Natural products CNC(C)C(O)=O GDFAOVXKHJXLEI-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QWCKQJZIFLGMSD-VKHMYHEASA-N L-alpha-aminobutyric acid Chemical compound CC[C@H](N)C(O)=O QWCKQJZIFLGMSD-VKHMYHEASA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- JTTHKOPSMAVJFE-VIFPVBQESA-N L-homophenylalanine Chemical compound OC(=O)[C@@H](N)CCC1=CC=CC=C1 JTTHKOPSMAVJFE-VIFPVBQESA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- CNNQBZRGQATKNY-DCAQKATOSA-N Leu-Arg-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N CNNQBZRGQATKNY-DCAQKATOSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 1
- FEHQLKKBVJHSEC-SZMVWBNQSA-N Leu-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FEHQLKKBVJHSEC-SZMVWBNQSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 1
- AZLASBBHHSLQDB-GUBZILKMSA-N Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C AZLASBBHHSLQDB-GUBZILKMSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 1
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 1
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 1
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- IDGRADDMTTWOQC-WDSOQIARSA-N Leu-Trp-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IDGRADDMTTWOQC-WDSOQIARSA-N 0.000 description 1
- ZGGVHTQAPHVMKM-IHPCNDPISA-N Leu-Trp-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N ZGGVHTQAPHVMKM-IHPCNDPISA-N 0.000 description 1
- SEOXPEFQEOYURL-PMVMPFDFSA-N Leu-Tyr-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SEOXPEFQEOYURL-PMVMPFDFSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000721701 Lynx Species 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 1
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- CRNNMTHBMRFQNG-GUBZILKMSA-N Lys-Glu-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N CRNNMTHBMRFQNG-GUBZILKMSA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- RVKIPWVMZANZLI-ZFWWWQNUSA-N Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-ZFWWWQNUSA-N 0.000 description 1
- YUTZYVTZDVZBJJ-IHPCNDPISA-N Lys-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 YUTZYVTZDVZBJJ-IHPCNDPISA-N 0.000 description 1
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102100034728 Lysosomal-associated transmembrane protein 4A Human genes 0.000 description 1
- HDNOQCZWJGGHSS-VEVYYDQMSA-N Met-Asn-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HDNOQCZWJGGHSS-VEVYYDQMSA-N 0.000 description 1
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 1
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 1
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 1
- CAEZLMGDJMEBKP-AVGNSLFASA-N Met-Pro-His Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CNC=N1 CAEZLMGDJMEBKP-AVGNSLFASA-N 0.000 description 1
- CULGJGUDIJATIP-STQMWFEESA-N Met-Tyr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 CULGJGUDIJATIP-STQMWFEESA-N 0.000 description 1
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 1
- OLYPWXRMOFUVGH-LURJTMIESA-N N(2)-methyl-L-lysine Chemical compound CN[C@H](C(O)=O)CCCCN OLYPWXRMOFUVGH-LURJTMIESA-N 0.000 description 1
- CYZKJBZEIFWZSR-LURJTMIESA-N N(alpha)-methyl-L-histidine Chemical compound CN[C@H](C(O)=O)CC1=CNC=N1 CYZKJBZEIFWZSR-LURJTMIESA-N 0.000 description 1
- CZCIKBSVHDNIDH-NSHDSACASA-N N(alpha)-methyl-L-tryptophan Chemical compound C1=CC=C2C(C[C@H]([NH2+]C)C([O-])=O)=CNC2=C1 CZCIKBSVHDNIDH-NSHDSACASA-N 0.000 description 1
- WRUZLCLJULHLEY-UHFFFAOYSA-N N-(p-hydroxyphenyl)glycine Chemical compound OC(=O)CNC1=CC=C(O)C=C1 WRUZLCLJULHLEY-UHFFFAOYSA-N 0.000 description 1
- SCIFESDRCALIIM-UHFFFAOYSA-N N-Me-Phenylalanine Natural products CNC(C(O)=O)CC1=CC=CC=C1 SCIFESDRCALIIM-UHFFFAOYSA-N 0.000 description 1
- NTWVQPHTOUKMDI-YFKPBYRVSA-N N-Methyl-arginine Chemical compound CN[C@H](C(O)=O)CCCN=C(N)N NTWVQPHTOUKMDI-YFKPBYRVSA-N 0.000 description 1
- GDFAOVXKHJXLEI-VKHMYHEASA-N N-methyl-L-alanine Chemical compound C[NH2+][C@@H](C)C([O-])=O GDFAOVXKHJXLEI-VKHMYHEASA-N 0.000 description 1
- KSPIYJQBLVDRRI-WDSKDSINSA-N N-methyl-L-isoleucine Chemical compound CC[C@H](C)[C@H](NC)C(O)=O KSPIYJQBLVDRRI-WDSKDSINSA-N 0.000 description 1
- YAXAFCHJCYILRU-YFKPBYRVSA-N N-methyl-L-methionine Chemical compound C[NH2+][C@H](C([O-])=O)CCSC YAXAFCHJCYILRU-YFKPBYRVSA-N 0.000 description 1
- SCIFESDRCALIIM-VIFPVBQESA-N N-methyl-L-phenylalanine Chemical compound C[NH2+][C@H](C([O-])=O)CC1=CC=CC=C1 SCIFESDRCALIIM-VIFPVBQESA-N 0.000 description 1
- AKCRVYNORCOYQT-YFKPBYRVSA-N N-methyl-L-valine Chemical compound CN[C@@H](C(C)C)C(O)=O AKCRVYNORCOYQT-YFKPBYRVSA-N 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 101150054880 NASP gene Proteins 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- 101100150705 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) tca-9 gene Proteins 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 102100022239 Peroxiredoxin-6 Human genes 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 1
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 1
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 1
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 1
- RVRRHFPCEOVRKQ-KKUMJFAQSA-N Phe-His-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVRRHFPCEOVRKQ-KKUMJFAQSA-N 0.000 description 1
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 1
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- TXKWKTWYTIAZSV-KKUMJFAQSA-N Phe-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N TXKWKTWYTIAZSV-KKUMJFAQSA-N 0.000 description 1
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- YMTMNYNEZDAGMW-RNXOBYDBSA-N Phe-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N YMTMNYNEZDAGMW-RNXOBYDBSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- APECKGGXAXNFLL-RNXOBYDBSA-N Phe-Trp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 APECKGGXAXNFLL-RNXOBYDBSA-N 0.000 description 1
- MMPBPRXOFJNCCN-ZEWNOJEFSA-N Phe-Tyr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MMPBPRXOFJNCCN-ZEWNOJEFSA-N 0.000 description 1
- KIQUCMUULDXTAZ-HJOGWXRNSA-N Phe-Tyr-Tyr Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O KIQUCMUULDXTAZ-HJOGWXRNSA-N 0.000 description 1
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 1
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 1
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 1
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- OYEUSRAZOGIDBY-JYJNAYRXSA-N Pro-Arg-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OYEUSRAZOGIDBY-JYJNAYRXSA-N 0.000 description 1
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 1
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 1
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 1
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 1
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 1
- BAKAHWWRCCUDAF-IHRRRGAJSA-N Pro-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BAKAHWWRCCUDAF-IHRRRGAJSA-N 0.000 description 1
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 1
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 1
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 1
- IWIANZLCJVYEFX-RYUDHWBXSA-N Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 IWIANZLCJVYEFX-RYUDHWBXSA-N 0.000 description 1
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 1
- SPLBRAKYXGOFSO-UNQGMJICSA-N Pro-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@@H]2CCCN2)O SPLBRAKYXGOFSO-UNQGMJICSA-N 0.000 description 1
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- HOJUNFDJDAPVBI-BZSNNMDCSA-N Pro-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 HOJUNFDJDAPVBI-BZSNNMDCSA-N 0.000 description 1
- CWZUFLWPEFHWEI-IHRRRGAJSA-N Pro-Tyr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O CWZUFLWPEFHWEI-IHRRRGAJSA-N 0.000 description 1
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 1
- DYJTXTCEXMCPBF-UFYCRDLUSA-N Pro-Tyr-Phe Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O DYJTXTCEXMCPBF-UFYCRDLUSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 125000000066 S-methyl group Chemical group [H]C([H])([H])S* 0.000 description 1
- 108010077895 Sarcosine Proteins 0.000 description 1
- 108010016634 Seed Storage Proteins Proteins 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 1
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 1
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 1
- KZUJCMPVNXOBAF-LKXGYXEUSA-N Thr-Cys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KZUJCMPVNXOBAF-LKXGYXEUSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 1
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- YZUWGFXVVZQJEI-PMVVWTBXSA-N Thr-Gly-His Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O YZUWGFXVVZQJEI-PMVVWTBXSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 1
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 1
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 1
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- ISLDRLHVPXABBC-IEGACIPQSA-N Thr-Leu-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISLDRLHVPXABBC-IEGACIPQSA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- YJVJPJPHHFOVMG-VEVYYDQMSA-N Thr-Met-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YJVJPJPHHFOVMG-VEVYYDQMSA-N 0.000 description 1
- SIEZEMFJLYRUMK-YTWAJWBKSA-N Thr-Met-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N)O SIEZEMFJLYRUMK-YTWAJWBKSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- UMFLBPIPAJMNIM-LYARXQMPSA-N Thr-Trp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N)O UMFLBPIPAJMNIM-LYARXQMPSA-N 0.000 description 1
- CKHWEVXPLJBEOZ-VQVTYTSYSA-N Thr-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O CKHWEVXPLJBEOZ-VQVTYTSYSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- OHGNSVACHBZKSS-KWQFWETISA-N Trp-Ala Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](C)C([O-])=O)=CNC2=C1 OHGNSVACHBZKSS-KWQFWETISA-N 0.000 description 1
- GHXXDFDIDHIEIL-WFBYXXMGSA-N Trp-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GHXXDFDIDHIEIL-WFBYXXMGSA-N 0.000 description 1
- DVAAUUVLDFKTAQ-VHWLVUOQSA-N Trp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DVAAUUVLDFKTAQ-VHWLVUOQSA-N 0.000 description 1
- OSYOKZZRVGUDMO-HSCHXYMDSA-N Trp-Lys-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OSYOKZZRVGUDMO-HSCHXYMDSA-N 0.000 description 1
- GQEXFCQNAJHJTI-IHPCNDPISA-N Trp-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GQEXFCQNAJHJTI-IHPCNDPISA-N 0.000 description 1
- VCGOTJGGBXEBFO-FDARSICLSA-N Trp-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VCGOTJGGBXEBFO-FDARSICLSA-N 0.000 description 1
- XOLLWQIBBLBAHQ-WDSOQIARSA-N Trp-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O XOLLWQIBBLBAHQ-WDSOQIARSA-N 0.000 description 1
- HTGJDTPQYFMKNC-VFAJRCTISA-N Trp-Thr-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 HTGJDTPQYFMKNC-VFAJRCTISA-N 0.000 description 1
- UIDJDMVRDUANDL-BVSLBCMMSA-N Trp-Tyr-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UIDJDMVRDUANDL-BVSLBCMMSA-N 0.000 description 1
- SJWLQICJOBMOGG-PMVMPFDFSA-N Trp-Tyr-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CC4=CN=CN4)C(=O)O)N SJWLQICJOBMOGG-PMVMPFDFSA-N 0.000 description 1
- ZJPSMXCFEKMZFE-IHPCNDPISA-N Trp-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O ZJPSMXCFEKMZFE-IHPCNDPISA-N 0.000 description 1
- UGFOSENEZHEQKX-PJODQICGSA-N Trp-Val-Ala Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](C)C(O)=O UGFOSENEZHEQKX-PJODQICGSA-N 0.000 description 1
- XKTWZYNTLXITCY-QRTARXTBSA-N Trp-Val-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 XKTWZYNTLXITCY-QRTARXTBSA-N 0.000 description 1
- SWSUXOKZKQRADK-FDARSICLSA-N Trp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SWSUXOKZKQRADK-FDARSICLSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 1
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 1
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 1
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 1
- ONWMQORSVZYVNH-UWVGGRQHSA-N Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ONWMQORSVZYVNH-UWVGGRQHSA-N 0.000 description 1
- DKKHULUSOSWGHS-UWJYBYFXSA-N Tyr-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DKKHULUSOSWGHS-UWJYBYFXSA-N 0.000 description 1
- QZOSVNLXLSNHQK-UWVGGRQHSA-N Tyr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UWVGGRQHSA-N 0.000 description 1
- WPVGRKLNHJJCEN-BZSNNMDCSA-N Tyr-Asp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WPVGRKLNHJJCEN-BZSNNMDCSA-N 0.000 description 1
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 1
- BODHJXJNRVRKFA-BZSNNMDCSA-N Tyr-Cys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BODHJXJNRVRKFA-BZSNNMDCSA-N 0.000 description 1
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 1
- STTVVMWQKDOKAM-YESZJQIVSA-N Tyr-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O STTVVMWQKDOKAM-YESZJQIVSA-N 0.000 description 1
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 1
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 1
- ZMKDQRJLMRZHRI-ACRUOGEOSA-N Tyr-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N ZMKDQRJLMRZHRI-ACRUOGEOSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 1
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 1
- AKKYBQGHUAWPJR-MNSWYVGCSA-N Tyr-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)O AKKYBQGHUAWPJR-MNSWYVGCSA-N 0.000 description 1
- BMPPMAOOKQJYIP-WMZOPIPTSA-N Tyr-Trp Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C([O-])=O)C1=CC=C(O)C=C1 BMPPMAOOKQJYIP-WMZOPIPTSA-N 0.000 description 1
- ZYVAAYAOTVJBSS-GMVOTWDCSA-N Tyr-Trp-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZYVAAYAOTVJBSS-GMVOTWDCSA-N 0.000 description 1
- ABZWHLRQBSBPTO-RNXOBYDBSA-N Tyr-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CC=C(C=C4)O)N ABZWHLRQBSBPTO-RNXOBYDBSA-N 0.000 description 1
- JRMCISZDVLOTLR-BVSLBCMMSA-N Tyr-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CC=C(C=C3)O)N JRMCISZDVLOTLR-BVSLBCMMSA-N 0.000 description 1
- AFWXOGHZEKARFH-ACRUOGEOSA-N Tyr-Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 AFWXOGHZEKARFH-ACRUOGEOSA-N 0.000 description 1
- RGJZPXFZIUUQDN-BPNCWPANSA-N Tyr-Val-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O RGJZPXFZIUUQDN-BPNCWPANSA-N 0.000 description 1
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 1
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 1
- SMKXLHVZIFKQRB-GUBZILKMSA-N Val-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N SMKXLHVZIFKQRB-GUBZILKMSA-N 0.000 description 1
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 1
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- SRWWRLKBEJZFPW-IHRRRGAJSA-N Val-Cys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N SRWWRLKBEJZFPW-IHRRRGAJSA-N 0.000 description 1
- CJDZKZFMAXGUOJ-IHRRRGAJSA-N Val-Cys-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CJDZKZFMAXGUOJ-IHRRRGAJSA-N 0.000 description 1
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 1
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- ZTKGDWOUYRRAOQ-ULQDDVLXSA-N Val-His-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N ZTKGDWOUYRRAOQ-ULQDDVLXSA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 1
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 1
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 1
- GJNDXQBALKCYSZ-RYUDHWBXSA-N Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 GJNDXQBALKCYSZ-RYUDHWBXSA-N 0.000 description 1
- HPOSMQWRPMRMFO-GUBZILKMSA-N Val-Pro-Cys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HPOSMQWRPMRMFO-GUBZILKMSA-N 0.000 description 1
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- TVGWMCTYUFBXAP-QTKMDUPCSA-N Val-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N)O TVGWMCTYUFBXAP-QTKMDUPCSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- JPBGMZDTPVGGMQ-ULQDDVLXSA-N Val-Tyr-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JPBGMZDTPVGGMQ-ULQDDVLXSA-N 0.000 description 1
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 1
- 108010056748 acetylenase Proteins 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- ZVDPYSVOZFINEE-BQBZGAKWSA-N alpha-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O ZVDPYSVOZFINEE-BQBZGAKWSA-N 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 108010045514 alpha-lactorphin Proteins 0.000 description 1
- HYOWVAAEQCNGLE-JTQLQIEISA-N alpha-methyl-L-phenylalanine Chemical compound OC(=O)[C@](N)(C)CC1=CC=CC=C1 HYOWVAAEQCNGLE-JTQLQIEISA-N 0.000 description 1
- ZYVMPHJZWXIFDQ-LURJTMIESA-N alpha-methylmethionine Chemical compound CSCC[C@](C)(N)C(O)=O ZYVMPHJZWXIFDQ-LURJTMIESA-N 0.000 description 1
- UGJQDKYTAYNNBH-UHFFFAOYSA-N amino cyclopropanecarboxylate Chemical compound NOC(=O)C1CC1 UGJQDKYTAYNNBH-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000012364 cultivation method Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 125000000031 ethylamino group Chemical group [H]C([H])([H])C([H])([H])N([H])[*] 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000004817 gas chromatography Methods 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 229920000140 heteropolymer Polymers 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- NBZBKCUXIYYUSX-UHFFFAOYSA-N iminodiacetic acid Chemical compound OC(=O)CNCC(O)=O NBZBKCUXIYYUSX-UHFFFAOYSA-N 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 108010088381 isoleucyl-lysyl-valyl-alanyl-valine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- GCHPUFAZSONQIV-UHFFFAOYSA-N isovaline Chemical compound CCC(C)(N)C(O)=O GCHPUFAZSONQIV-UHFFFAOYSA-N 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- DVCSNHXRZUVYAM-BQBZGAKWSA-N leu-asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010087810 leucyl-seryl-glutamyl-leucine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 235000021388 linseed oil Nutrition 0.000 description 1
- 239000000944 linseed oil Substances 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 108010072591 lysyl-leucyl-alanyl-arginine Proteins 0.000 description 1
- 108010043322 lysyl-tryptophyl-alpha-lysine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- XJODGRWDFZVTKW-ZCFIWIBFSA-N n-methylleucine Chemical compound CN[C@@H](C(O)=O)CC(C)C XJODGRWDFZVTKW-ZCFIWIBFSA-N 0.000 description 1
- UORPHRRDLIGMDN-SVMKZPJVSA-N octadec-2-enoic acid;(z)-octadec-9-enoic acid Chemical compound CCCCCCCCCCCCCCCC=CC(O)=O.CCCCCCCC\C=C/CCCCCCCC(O)=O UORPHRRDLIGMDN-SVMKZPJVSA-N 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 229960001639 penicillamine Drugs 0.000 description 1
- 150000002978 peroxides Chemical class 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 235000020777 polyunsaturated fatty acids Nutrition 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 102200142793 rs35418374 Human genes 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 108010015840 seryl-prolyl-lysyl-lysine Proteins 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 101150065190 term gene Proteins 0.000 description 1
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- LKOVPWSSZFDYPG-WUKNDPDISA-N trans-octadec-2-enoic acid Chemical compound CCCCCCCCCCCCCCC\C=C\C(O)=O LKOVPWSSZFDYPG-WUKNDPDISA-N 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8247—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
- C12P7/6463—Glycerides obtained from glyceride producing microorganisms, e.g. single cell oil
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Nutrition Science (AREA)
- Environmental Sciences (AREA)
- Botany (AREA)
- Developmental Biology & Embryology (AREA)
- Physiology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Peptides Or Proteins (AREA)
- Lubricants (AREA)
- Food Preservation Except Freezing, Refrigeration, And Drying (AREA)
- Medicines Containing Plant Substances (AREA)
- Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
Abstract
1. Wyizolowana czasteczka kwasu nukleinowego lub czasteczka do niej komplementarna, ko- dujaca epoksygenaze, bedaca polipeptydem monooksygenazy o funkcji mieszanej zdolnej do katali- zowania epoksydacji wiazania wegiel-wegiel w czasteczce kwasu tluszczowego, znamienna tym, ze obejmuje sekwencje aminokwasów zawierajaca trzy motywy o wysokiej zawartosci histydyny, a mianowicie: (i) His-(Xaa) 3-4 -His; (ii) His-(Xaa) 2-3 -His-His, oraz (iii) His-(Xaa) 2-3 -His-His, PL PL PL
Description
Opis wynalazku
Przedmiotem wynalazku jest wyizolowana cząsteczka kwasu nukleinowego, konstrukt genetyczny, sposób dokonywania zmiany poziomu epoksykwasów tłuszczowych, sposób wytwarzania rekombinantowego polipeptydu monooksygenazy w komórce, sposób wytwarzania rekombinantowego polipeptydu monooksygenazy w roślinie transgenicznej, polipeptyd rekombinantowy, sposób wytwarzania epoksydowanego kwasu tłuszczowego, roślina transformowana oraz roślina lub pochodząca od niej komórka.
Wynalazek niniejszy dotyczy, ogólnie, nowych sekwencji genetycznych kodujących epoksygenazy kwasów tłuszczowych a zwłaszcza sekwencji genetycznych kodujących D12-epoksygenzy kwasów tłuszczowych. Bardziej szczegółowo, wynalazek niniejszy dotyczy cDNA i genomowych sekwencji genowych kodujących epoksygenazy roślinnych kwasów tłuszczowych, korzystnie D12-epoksygenazy Crepis palaestina lub Euphorpbia lagascae.
Sekwencje genetyczne według niniejszego wynalazku stanowią skuteczne narzędzie umożliwiające dokonywanie zmian metabolizmu kwasów tłuszczowych, lub manipulowanie tym metabolizmem, w takich organizmach, jak drożdże, pleśnie, bakterie, owady, ptaki, ssaki i rośliny wyższe, a zwłaszcza dokonywania przekształcania nienasyconych kwasów tłuszczowych w epoksydowane kwasy tłuszczowe. Wynalazek obejmuje swym zakresem genetycznie zmodyfikowane organizmy oleiste, transformowane przedmiotowymi sekwencjami genetycznymi, a także oleje pochodzące z tego źródła. Oleje wytworzone sposobem według wynalazku służą uzyskiwaniu tanich surowców przydatnych do wydajnej produkcji, między innymi, powłok, żywic, klejów, tworzyw sztucznych, środków powierzchniowo czynnych i smarów.
Obecnie istnieje szerokie, zainteresowanie wytwarzaniem produktów zasilających, takich jak kwasy tłuszczowe, przeznaczonych do zastosowaniach przemysłowego raczej z odnawialnych źródeł roślinnych niżeli z nieodnawialnych produktów przemysłu petrochemicznego. Pomysł ten jest bardzo atrakcyjny dla wytwórców i użytkowników z uwagi na ochronę zasobów, a dla rolnictwa stwarza znaczącą okazję rozwinięcia się nowych upraw przemysłowych.
W przyrodzie występuje różnorodność nietypowych kwasów tłuszczowych i zostały one dobrze scharakteryzowane [Radam i Paril (1981); Smith (1970)]. Wiele spośród tych nietypowych kwasów tłuszczowych ma znaczenie przemysłowe, co prowadzi do zainteresowania się możliwością zaaklimatyzowania wytwarzających je gatunków w celu produkowania wspomnianych kwasów w skali agrotechnicznej.
Jedną grupę kwasów tłuszczowych budzącą szczególne zainteresowanie stanowią epoksykwasy tłuszczowe, złożone z łańcucha acylowego, w którym dwa sąsiednie atomy węgla połączone są ze sobą mostkiem epoksydowym. Dzięki swej wysokiej reaktywności, znajdują one szerokie zastosowanie w produkcji powłok, żywic, klejów, tworzyw sztucznych, środków powierzchniowo czynnych i smarów. Kwasy tłuszczowe tego rodzaju wytwarza się obecnie na drodze chemicznej epoksydacji olejów roślinnych, zazwyczaj oleju sojowego i oleju lnianego, jednakże w procesie tym otrzymuje się mieszaniny różnorodnych postaci i form izomerycznych, przy czym jest to proces bardzo kosztowny.
Toteż, czynione są wysiłki zmierzające do odpowiedniego wykorzystania dzikich roślin, które produkują i gromadzą epoksykwasy tłuszczowe (na przykład, Euphorbia lagascae, Vernonia galamensis), dla uzyskania przemysłowych źródeł tych olejów. Jednakże, problemy wynikające z przydatności tych roślin pod względem stosowalności agronomicznej i niskiego potencjału plonowania w poważnym stopniu ograniczają przemysłową użyteczność podejścia opartego na tradycyjnych metod hodowli i uprawy.
Szybko rozwijające się, ciągłe unowocześnianie technologii rekombinantowego DNA bardzo ułatwia osiąganie efektywności procesów przemysłowych ważnych z handlowego punktu widzenia, a to przez dzięki wykorzystaniu ekspresji genów, wyizolowanych z pierwszego organizmu lub gatunku, w drugim organizmie lub gatunku, z nadaniem mu nowego fenotypu. Bardziej szczegółowo, typowe metody przemysłowe można uczynić wydajniejszymi i oszczędniejszymi (w wyniku wyższych wydajności w przeliczeniu na koszt jednostkowy) przez zastosowanie technologii rekombinantowego DNA.
PL 194 095B1
Ponadto, właściwy dobór organizmu-gospodarza dla ekspresji sekwencji genetycznej będącej przedmiotem zainteresowania zapewnia wytworzenie takich związków, które normalnie nie są wytwarzane lub syntetyzowane przez organizm gospodarza, do tego z wysoką wydajnością i o wysokiej czystości.
Jednakże, pomimo ogólnej efektywności technologii rekombinantowego DNA, izolacja sekwencji genetycznych kodujących enzymy ważne w sensie metabolizmu kwasu tłuszczowego, a zwłaszcza genów kodujących D12-epoksygenazy kwasów tłuszczowych odpowiedzialne za wytwarzanie, między innymi, kwasu 12,13-epoksy-9-oktadecenowego (kwasu wernolowego) i kwasu 12,13-epoksy-9,15-oktadekadienowego, ciągle jeszcze pozostaje przeszkodą na drodze opracowania organizmu otrzymanego metodami inżynierii genetycznej wytwarzającego wspomniane kwasy tłuszczowe.
Aż do czasu opracowania niniejszego wynalazku, istniała tylko bardzo ograniczona ilość danych biochemicznych wyjaśniających naturę wspomnianych enzymów typu epoksygenazy, a zwłaszcza D 12-epoksygenaz. Tym niemniej jednak wydaje się, że w Euphorbia lagascae tworzenie się kwasu 12,13-epoksy-9-oktadecenowego (kwasu wernolowego) z kwasu linolowego jest katalizowane przez D12-epoksygenazę zależną od cytochromu P 450 [Bafor i in. (1993); Blee i in. (1994)].
Oprócz tego, rozwijające się nasiona lnu wykazują zdolność przekształcania kwasu wernolowego w kwas 12,13-epoksy-9,15-oktadekadienowy zachodzącego z udziałem endogennej D15-desaturazy [Engeseth i Stymne (1996)]. Epoksykwasy tłuszczowe można wytwarzać także w tkankach roślin z udziałem nadtlenkozależnej peroksygenazy [Blee i Schuber (1990)].
W pracach prowadzących do powstania niniejszego wynalazku twórcy starali się wyodrębnić sekwencje genetyczne kodujące geny ważne z punktu widzenia produkcji epoksykwasów tłuszczowych, takich jak kwas 12,13-epoksy-9-oktadecenowy (kwas wernolowy) i kwas 12,13-epoksy-9,15-oktadekadienowy, i przenieść te sekwencje genetyczne do wysokoprodukcyjnych przemysłowych roślin lnu i/lub innych organizmów gromadzących wytworzony przez siebie olej.
Przedmiotem wynalazku jest wyizolowana cząsteczka kwasu nukleinowego lub cząsteczka do niej komplementarna, kodująca epoksygenazę, będącą polipeptydem monooksygenazy o funkcji mieszanej zdolnej do katalizowania epoksydacji wiązania węgiel-węgiel w cząsteczce kwasu tłuszczowego, charakteryzująca się tym, że obejmuje sekwencję aminokwasów zawierającą trzy motywy o wysokiej zawartości histydyny, a mianowicie:
(i) His-(Xaa)3-4-His;
(ii) His-(Xaa)2-3-His-His, oraz (iii) His-(Xaa)2-3-His-His,
Korzystnie w cząsteczce według wynalazku wiązanie węgiel-węgiel jest wiązaniem podwójnym znajdującym się w cząsteczce nienasyconego kwasu tłuszczowego.
Bardziej korzystnie, wspomnianą epoksygenazą jest enzym D6-epoksygenaza, enzym D9-epoksygenaza, enzym D12-epoksygenaza lub enzym 15D-epoksygenaza. Korzystnie cząsteczka kwasu nukleinowego według wynalazku pochodzi z rośliny, a bardziej korzystnie, roślina jest wybrana z grupy obejmującej Crepis spp., Euphorbia spp., Chrysanthemum spp. i Vernonia spp. Także korzystnie, wspomnianą rośliną jest roślina wytwarzająca wysoki poziom kwasu wernolowego, ewentualnie wybrana z grupy obejmującej Crepis biennis, Crepis aurea, Crepis conyzaefolia, Crepis intermedia, Crepis occidentalis, Crepis palaestina, Crepis vesicaria i Crepis xancitha i Vernonia galamensis.
Wyizolowana cząsteczka kwasu nukleinowego według wynalazku korzystnie obejmuje sekwencję nukleotydów identyczną w co najmniej 65% z którąkolwiek z sekwencji SEQ ID NO NO: 1, 3 lub 5, albo z sekwencję komplementarną do niej; i jest zdolna do hybrydyzacji w co najmniej średnich warunkach z sekwencją SEQ ID NO NO: 1, 3 lub 5 albo sekwencją komplementarną do niej.
Także korzystnie wyizolowana cząsteczka kwasu nukleinowego według wynalazku obejmuje sekwencję nukleotydów przedstawioną w SEQ ID NO: 1, 3 lub 5, lub sekwencja nukleotydowa komplementarna do niej albo co najmniej około 20 przylegających nukleotydów tej sekwencji.
Przedmiotem wynalazku jest także konstrukt genetyczny, charakteryzujący się tym, że obejmuje wyizolowaną cząsteczkę kwasu nukleinowego według wynalazku, operatywnie połączoną z sekwencją promotorową, przy czym wspomniana cząsteczka kwasu nukleinowego jest zdolna do ulegania transkrypcji w orientacji sensownej lub antysensownej względem naturalnie występującego w przyrodzie kierunku transkrypcji in vivo genu epoksygenazy monooksygenazy o funkcji mieszanej.
PL 194 095B1
Przedmiotem wynalazku jest również sposób dokonywania zmiany poziomu epoksykwasów tłuszczowych w komórce, tkance, narządzie, organizmie nie-człoweka lub drobnoustroju, polegający na tym, że wprowadza się cząsteczkę sensowną, antysensowną, rybozymową lub ko-supresorową, obejmującą wyizolowaną cząsteczkę kwasu według wynalazku do komórki, tkanki, narządu lub organizmu nie-człowieka i inkubuje się wspomnianą komórkę w czasie i w warunkach wystarczających do zajścia ekspresji wspomnianej cząsteczki sensownej, antysensownej, robozomowej lub kosupresorowej.
Korzystnie w sposobie według wynalazku etap wprowadzania sensownej, antysensownej, rybozymowej lub ko-supresorowej cząsteczki obejmuje stabilną transformację komórki, tkanki, narządu lub organizmu nie-człowieka sensowną, antysensowną, rybozomową lub kosupresorową cząsteczką.
Przedmiotem wynalazku jest też sposób wytwarzania w komórce rekombinantowego, enzymatycznie aktywnego polipetydu monooksygenazy o funkcji mieszanej epoksygenazy, polegający na tym, że przeprowadza się hodowlę komórki zawierającej wyizolowaną cząsteczkę kwasu nukleinowego według wynalazku w czasie i w warunkach wystarczających do zajścia ekspresji.
Korzystnie przeprowadza się dodatkowy pierwszy etap transformacji komórki, z udziałem wyizolowanej cząsteczki kwasu nukleinowego.
Przedmiotem wynalazku jest też sposób wytwarzania w komórce rekombinantowego, enzymatycznie aktywnego polipeptydu monooksygenazy o funkcji mieszanej epoksygenazy, polegający na tym, że:
(i) wytwarza się konstrukt genetyczny obejmujący wyizolowaną cząsteczkę kwasu nukleinowego według wynalazku zlokalizowaną operatywnie pod kontrolą promotora zdolnego do napędzania ekspresji wspomnianej sekwencji genetycznej we wspomnianej komórce, oraz, ewentualnie, wzmacniacza ekspresji:
(ii) transformuje się wspomniany konstrukt genetyczny do wspomnianej komórki; oraz (iii) selekcjonuje się transformanty z wysokim poziomem ekspresji funkcjonalnej epoksygenazy, kodowanej przez tą sekwencję genetyczną.
Następnym przedmiotem wynalazku jest sposób wytwarzania w roślinie transgenicznej rekombinantowego, enzymatycznie aktywnego polipeptydu monooksygenazy o funkcji mieszanej epoksygenazy znamienny tym, że:
(i) wytwarza się konstrukt genetyczny obejmujący wyizolowaną cząsteczkę kwasu nukleinowego według wynalazku, zlokalizowaną operatywnie pod kontrolą specyficznego względem nasion promotora oraz, ewentualnie, elementu wzmacniacza ekspresji, przy czym wspomniana sekwencja genetyczna zlokalizowana jest wgórę od sekwencji terminatora transkrypcji;
(ii) transformuje się wspomniany konstrukt genetyczny do komórki lub tkanki wspomnianej rośliny; oraz (iii) selekcjonuje się transformanty, u których, w nasionach, dochodzi do wysokiego poziomu ekspresji funkcjonalnej epoksygenazy, kodowanej przez sekwencję tą genetyczną.
W sposobie według tym jako roślinę stosuje się gatunki roślin nasionach oleistych, normalnie produkujące wysoki poziom kwasu linolowego, a jako roślinę stosuje się roślinę wybraną z grupy obejmującej: len Linola®, rzepak, słonecznik, krokosz barwierski, soję, siemię lniane, sezam, nasiona bawełny, orzechy ziemne, palmę oliwną lub palmę olejową.
Przedmiotem wynalazku jest również polipeptyd rekombinantowy monooksygenazy o funkcji mieszanej epoksygenazy, który obejmuje sekwencję aminokwasów przedstawioną w sekwencji SEQ ID NO NO: 2, 4 lub 6, lub który jest identyczny z tą sekwencją w co najmniej w 50%.
Kolejnym przedmiotem wynalazku jest sposób wytwarzania epoksydowanego kwasu tłuszczowego w komórce, tkance, narządzie, organizmie nie-człowieka lub drobnoustroju, polegający na tym, że inkubuje się komórkę, tkankę, narząd lub organizm, u których dochodzi do ekspresji rekombinantowego polipeptydu monooksygenazy o funkcji mieszanej epoksygenazy obejmującego sekwencje aminokwasów zidentyfikowaną jako SEQ IDNo 2, 4 lub 6, lub który jest identyczny z ta sekwencją, z kwasem tłuszczowym stanowiącym substrat, w czasie i w warunkach wystarczających do przekształcenia co najmniej jednego wiązania węgiel-węgiel wspomnianego substratu w grupę epoksydową.
PL 194 095B1
Korzystnie w sposobie tym, jako kwas tłuszczowy stanowiący substrat stosuje się nienasycony kwas tłuszczowy, a wiązanie węgiel-węgiel poddawane epoksydowaniu jest podwójnym wiązaniem węgiel-węgiel. Ewentualnie jako kwas tłuszczowy stanowiący substrat stosuje się kwas wybrany z grupy obejmującej kwas palmitolejowy, kwas oleinowy, kwas linolowy, kwas linolenowy, kwas 9,15-oktadekadlenowy i kwas arachidonowy.
Korzystnie epoksydowaniu poddaje się wiązanie węgiel-węgiel D6 lub wiązanie węgiel-węgiel D9, lub wiązanie węgiel-węgiel D12 lub wiązanie węgiel-węgiel D15.
Ogólnie korzystnie, w sposobie tym jako epoksydowany kwas tłuszczowy wytwarza się kwas wernolowy.
W sposobie tym można przeprowadzać dodatkowy pierwszy etap transformacji lub transfekcji komórki, tkanki, narządu lub organizmu nie-człowieka z udziałem cząsteczki kwasu nukleinowego kodującej rekombinantową monooksygenazę o funkcji mieszanej epoksygenazę.
Komórka, narząd, tkanka organ lub organizm nie-człowieka, w którym zachodzi ekspresja rekombinantowej epoksygenazy, korzystnie może pochodzić z bakterii, drożdży, grzyba, pleśni, owada, rośliny wyższej, ptaka lub ssaka nie-człowieka. Zaś drożdżami, rośliną, grzybem lub pleśnią są korzystnie oleiste drożdże, oleista roślina, oleisty grzyb lub oleista pleśń.
Jako roślinę korzystnie stosuje się roślinę oleistą, w której normalnie nie zachodzi na wysokim poziomie ekspresja rekombinantowej monooksygenazy o funkcji mieszanej epoksygenazy.
Jeszcze bardziej korzystnie jako roślinę oleistą stosuje się roślinę wybraną z grupy obejmującej, między innymi, len Linola®, rzepak, słonecznik, krokosz barwierski, soję, siemię lniane, sezam, nasiona bawełny, orzechy ziemne, palmę oliną lub palmę olejową.
Przedmiotem wynalazku jest także roślina transformowana wyizolowaną cząsteczką kwasu nukleinowego według wynalazku, albo pochodząca od niej komórka, tkanka lub organ, lub potomstwo wspomnianej rośliny, także zawierające wspomnianą cząsteczkę kwasu nukleinowego.
Następnie przedmiotem wynalazku jest roślina transformowana, która charakteryzuje się tym, że jest zdolna do ekspresji rekombinantowego polipeptydu monooksygenazy o funkcji mieszanej epoksygenazy obejmującego sekwencje aminokwasów zidentyfikowaną jako SEQ IDNo 2, 4 lub 6, lub który jest identyczny z ta sekwencją, albo pochodząca od niej komórka, tkanka lub organ, lub potomstwo wspomnianej rośliny, także zdolne do ekspresji wspomnianego polipeptydu rekombinantowego.
Przedmiotem wynalazku jest też roślina lub pochodząca od niej komórka, tkanka lub organ, lub jej potomstwo jak jak zdefiniowano powyżej stanowiąca lub pochodząca od lnu Linola®, rzepaku, słonecznika, krokosza barwierskiego, soji, siemienia lnianego, sezamu, nasion bawełny, orzecha ziemnego, palmy oliwnej lub palmy olejowej.
Wynalazek został zilustrowany na rysunku na którym: fig. 1 stanowi liniowe przedstawienie plazmidu ekspresyjnego obejmującego gen strukturalny epoksygenazy, zlokalizowany operatywnie pod kontrolą skróconego promotora napin (FP1; po prawej stronie, prostokąt zakreskowany) i zlokalizowanej w górę sekwencji terminacyjnej NOS (po prawej stronie, prostokąt zakropkowany). Genetyczna sekwencja epoksygenazy ukazana jest przez znajdujący się po prawej stronie biały prostokąt. Konstrukt ten zawiera także promotora NOS (po lewej stronie, zakreskowany) napędzającego ekspresję genu NPTII (biały prostokąt po lewej stronie) i zlokalizowanego w górę terminatora NOS (po lewej stronie, prostokąt zakropkowany). Wskazano także sekwencje graniczne, lewą i prawą, plazmidu Ti Agrobacterium tumefaciens.
Figura 2 (2A -2H) przedstawia w sposób schematyczny porównawczą analizę podstawowej struktury sekwencji aminokwasów polipetydu epoksygenazy z Crepis palaestina (Cpa12; SEQ ID NO: 2), dalszej epoksygenazy pochodzącej z Crepis sp. innej niż C. palaestina, produkującej duże ilości kwasu wernolowego (CrepX; SEQ ID NO: 4, częściowej sekwencji aminokwasów polipeptydu epoksygenazy pochodzącej z Vernonia galamensis (Vgal1; SEQ IDNO: 6), sekwencji aminokwasów D12-acetylenazy z Crepis alpina (Crep1; SEQ ID NO:8), D12-desaturaz z A. thaliana (L26296; SEQ ID NO: 9), Brassica juncea (K91139; SEQ ID NO:10), Glycine max (L43921; SEQ ID NO: 11), Solanum commersoni (X92847; SEQ ID NO: 12) i Glycine max (LA43920; SEQ ID NO: 13) oraz D12-hydroksylazę z Ricinus communis (U22378; SEQ ID NO:14). Podkreślone są trzy motywy o wysokiej zawartości histydyny zakonserwowane w nie zawierających hemu monooksygenazach o funkcji mieszanej.
PL 194 095B1
Figura 3 jest kopią fotograficznego przedstawienia hybrydyzacji metodą northern blot, pokazującą specyficzną względem nasion ekspresję genu epoksygenazy Crepis palaestina zilustrowanego przykładowo przez sekwencję SEQ ID NO:1.
Analiza metodą Northern blot całkowitego RNA z liści (ścieżka 1) i rozwijających się nasion (ścieżka 2) Crepis palaestina.
Na żelu Northern rozwijano 15 mg całkowitego RNA i blotowano na błonę Hybond N+ z firmy Amersham zgodnie z instrukcją wytwórcy. Otrzymany tak blot hybrydyzowano w temperaturze 60°C z sondą wykonaną z 3' nie uległego translacji rejonu SEQ ID NO:1. Następnie blot przemywano dwukrotnie 2x SSC (bufor NaCl-cytrynian sodu) w temperaturze pokojowej, w ciągu 10 minut, a następnie w 0,1x SSC w temperaturze 60°Cw ciągu 20 minut.
Figura 4 przedstawia w sposób schematyczny sekwencję nukleotydów zdegenerowanego startera PCR (kierunek 5' do 3') stosowanego do izolacji opisanych w niniejszym opisie genów epoksygenazy Euphorbia lagascae.
Figura 5 jest kopią fotograficznego przedstawienia hybrydyzacji dot blot RNA, pokazującą ekspresję genu epoksygenazy, zilustrowanego w sekwencji SEQ ID NO: 3, w roślinach produkujących kwas wernolowy w porównaniu z roślinami nie wytwarzającymi kwasu wernolowego.
Z określonej tkanki wyizolowano 1 m g całkowitego RNA i blotowano dot na błonę Hybond N+ z firmy Amersham zgodnie z instrukcją wytwórcy. Otrzymany tak blot poddano hybrydyzacji w temperaturze 42°C w 50% formamidzie z odpowiednią sondą znakowaną 32P, wykonaną z SEQ ID NO:3, w ciągu 16 godzin. Następnie bloty przemywano dwukrotnie w 2x SSC (bufor NaCl-cytrynian sodu) w temperaturze pokojowej, a następnie w 0,5x SSC w temperaturze 55°Cw ciągu 20 minut. Autoradiogramy otrzymano po całonocnej ekspozycji. Tabela A pokazuje całkowity RNA z rozwijających się nasion Euphorbia lagascae (1), Euphorbia cyparissus (2), Vernonia galamensis (3) i lnu (Linum usitatissimum) (4). Tabela B pokazuje całkowity RNA z różnych tkanek Euphorbia lagascae, w tym z rozwijających się nasion (1), korzenia (2) i liścia (3).
Figura 6 przedstawia w sposób schematyczny metodę hybrydyzacji subtraktywnej stosowaną do izolowania opisywanych w niniejszym opisie genów oksygenazy Euphorbia lagascae. Pula +6cDNA składała się przeważnie z sekwencji podobnych do białka zapasowego nasion. Pulę 15 takich sekwencji poddano obróbce biotyną i w dalszym ciągu subtrakcji z +6cDNA. LH = długa hybrydyzacja, ~ 20 godzin; SH = krótka hybrydyzacja, ~ 3 godziny.
Figura 7 jest kopią fotograficznego przedstawienia hybrydyzacji dot blot RNA, pokazującą ekspresję genu epoksygenazy, zilustrowanego w SEQ ID NO: 20, w roślinach produkujących kwas wernolowy w porównaniu z roślinami nie wytwarzającymi kwasu wernolowego.
Z określonej tkanki wyizolowano 1 m g całkowitego RNA i blotowano dot na błonę Hybond N+ z firmy Amersham zgodnie z instrukcją wytwórcy. Otrzymany tak blot poddano hybrydyzacji w temperaturze 42°C w 50% formamidzie z odpowiednią sondą znakowaną 32P wykonaną z SEQ ID NO:20 w ciągu 16 godzin. Następnie bloty przemywano dwukrotnie w 2x SSC (bufor NaCl-cytrynian sodu) w temperaturze pokojowej, a następnie w 0,5 SSC w temperaturze 55°C w ciągu 20 minut. Autoradiogramy otrzymano po całonocnej ekspozycji. Tabela A pokazuje całkowity RNA z rozwijających się nasion Euphorbia lagascae (1), Euphorbia cyparissus (2), Vernonia galamensis (3) i lnu (Linum usitatissimum) (4). Tabela B pokazuje całkowity RNAS z różnych tkanek Euphorbia lagascae, w tym z rozwijających się nasion (1), korzenia (2) i liścia (3).
Figura 8 przedstawia w sposób schematyczny podwójny wektor plazmidowy obejmujący kasetę ekspresyjną zawierającą skrócony specyficzny względem nasion promotor napin (Napin) i terminator syntazy nopalinowej (NT), ze znajdującym się między nimi miejscem klonowania BamHI, oprócz genu oporności na kanamycynę NPTII operatywnie połączonego z sekwencjami promotora syntazy nopalinowej (NP) i terminatora syntazy nopalinowej (NT). Kaseta ekspresyjna oflankowana jest sekwencjami T-DNA lewej granicy (LB) i prawej granicy (RB).
Figura 9 przedstawia w sposób schematyczny podwójny wektor plazmidowy obejmujący kasetę ekspresyjną zawierającą SEQ IDNO: 1 operatywnie zlokalizowaną pod kontrolą skróconego, specyficznego względem nasion promotora napin (Napin) i w górę od terminatora syntazy nopalinowej (NT) oprócz genu oporności na kanamycynę NPTII operatywnie połączonego z sekwencjami promotora syntazy nopalinowej (NP) i terminatora syntazy nopalinowej (NT). Kaseta ekspresyjna oflankowana jest sekwencjami T-DNA lewej granicy (LB) i prawej granicy (RB). Do wytworzenia tego konstruktu, SEQ ID NO: 1 zostaje wstawiona w miejsce BamHI podwójnego wektora przedstawionego na fig. 8.
PL 194 095B1
Figura 10 jest graficznym przedstawieniem wykazanych metodą chromatografii gazowej śladów estrów metylowych kwasów tłuszczowych sporządzonych z udziałem oleistych nasion nietransformowanych roślin Arabidopsis thaliana [tabela (a)] lub roślin A. thaliana (linia transgeniczna Cpal-17), transformowanych przy użyciu SEQ ID NO:1 z zastosowaniem konstruktu genetycznego przedstawionego na fig. 9 [tabele (b) i (c) ]. Na tabelach (a) i (b) estry metylowe kwasu tłuszczowego są rozdzielone z zastosowaniem metody rozdziału na kolumnie upakowanej. Na tablicy (c) estry metylowe kwasu tłuszczowego są rozdzielone z zastosowaniem metody rozdziału na kolumnie kapilarnej. Wskazano pozycje elucji kwasu wernolowego.
Figura 11 jest graficznym przedstawieniem pokazującym rozmieszczenie epoksykwasów tłuszczowych w nasionach linii wsobnej na roślinach Ti z roślin Arabidopsis thaliana transformowanych Cpal2 według oznaczenia metodą chromatografii gazowej. Oznaczono zawartość tak kwasu wernolowego (oś x) jak i kwasu 12,13-epoksy-9,15-oktadekadienowego (oś y) i odpowiednie wartości naniesiono na wykres jedne względem drugich. Dane wskazują na pozytywną korelację między poziomami tych kwasów tłuszczowych w roślinach transgenicznych.
Figura 12 jest graficznym przedstawieniem pokazującym włączanie miana 14C do fazy chloroformowej otrzymywanej w wyniku ekstrakcji lipidów liścieni lnu w trakcie zasilania znakowanym sub14 stratem. Zastosowano symbole: zaczerniony romb: zasilanie kwasem 14C-olejowym; zaczerniony kwa14 drat: zasilanie kwasem 14C-wernolowym.
Figura 13 jest graficznym przedstawieniem pokazującym włączanie miana 14C do fosfatydylocholiny liścieni lnu w trakcie zasilania znakowanym substratem. Zastosowane symbole: zaczerniony 14 14 romb: zasilanie kwasem 14C-olejowym; zaczerniony kwadrat: zasilanie kwasem 14C-wernolowym.
Figura 14 jest graficznym przedstawieniem pokazującym włączanie miana 14C do triacelogliceroli liścieni lnu w trakcie zasilania znakowanym substratem. Zastosowane symbole: zaczerniony romb: 14 14 zasilanie kwasem 14C-olejowym; zaczerniony kwadrat: zasilanie kwasem 14C-wernolowym.
Szczegółowy opis korzystnych sposobów wykonania wynalazku
Jedną z cech znamiennych niniejszego wynalazku stanowi wyizolowana cząsteczka, która koduje epoksygenazę kwasu tłuszczowego lub jest komplementarna do wyizolowanej cząsteczki kwasu nukleinowego kodującej epoksygenazę kwasu tłuszczowego.
Aczkolwiek wyizolowana cząsteczka kwasu nukleinowego według wynalazku koduje enzym zaangażowany w bezpośredniej epoksydacji kwasu arachidonowego, szczególnie korzystnie przedmiotowa cząsteczka kwasu nukleinowego pochodzi ze źródła innego niż organizm ssaka.
Stosowany w niniejszym opisie termin pochodząca z należy rozumieć w ten sposób, że wskazuje on na to, że konkretna jednostka strukturalna lub grupa jednostek strukturalnych wywodzi się z wyszczególnionego gatunku, ale niekoniecznie jest otrzymana wprost z wyszczególnionego źródła.
Stosowany w niniejszym opisie termin źródło inne niż organizm ssaka odnosi się do jakiegokolwiek organizmu innego niż organizm ssaka albo jego tkanka lub jego komórka. W tym kontekście, termin źródło inne niż organizm ssaka należy rozumieć w ten sposób, że wskazuje on na to, że konkretna jednostka strukturalna lub grupa jednostek strukturalnych wywodzi się z bakterii, drożdży, ptaków, płazów, gadów, owadów, roślin wyższych, grzybów, pleśni i glonów, albo innych organizmów nie będących ssakami.
W korzystnym wykonaniu niniejszego wynalazku, organizmem stanowiącym źródło jest jakikolwiek organizm obdarzony genetyczną zdolnością syntetyzowania epoksykwasów tłuszczowych.
Korzystniej, takim będącym źródłem organizmem są rośliny takie jak, między innymi, (ale bez ograniczania się tylko do nich) Chrysanthemum spp., Crepis spp., Euphorbia spp. i Vermonia spp.
Jeszcze korzystniej, organizm stanowiący źródło wybiera się z grupy obejmującej Crepis biennis, Crepis aurea, Crepis conyzaefolia, Crepis intermedia, Crepis occidentalis, Crepis palaestina, Crepis vesicaria, Crepis xacintha, Euphorbia lagascae i Vernonia galamensis. Nie wyłączone są inne także gatunki.
Zgodnie ze szczególnie korzystnym sposobem wykonania niniejszego wynalazku, jako organizm stanowiący źródło stosuje się Crepis sp., odznaczające się wysoką zawartością kwasu wernolowego, takie jak, między innymi, Crepis palaestina lub, alternatywnie, Vernonia galamensis lub Euphorbia lagascae.
Aczkolwiek wyizolowana cząsteczka kwasu nukleinowego według wynalazku koduje D6-epoksygenazę lub D9-epoksygenazę, lub D12-epoksygenazę lub D15-epoksygenazę, albo co najmniej koduje enzym nie zaangażowany w bezpośredniej epoksydacji kwasu arachidonowego, przedmiotowa cząsteczka kwasu nukleinowego może wywodzić się z jakiegokolwiek źródła wytwarzającego wspo8
PL 194 095B1 mniany enzym, włączając w to, ale bez ograniczania się tylko do nich, drożdże, pleśnie, bakterie, owady, ptaki, ssaki i rośliny.
Cząsteczka kwasu nukleinowego według wynalazku, zgodnie z którymkolwiek z poprzednio wspomnianych wykonań, może stanowić DNA, taki jak gen, cząsteczkę cDNA, cząsteczkę RNA lub cząsteczkę syntetycznego oligonukleotydu, czy to jednoniciową czy dwuniciową i niezależną od jakichkolwiek właściwości struktury drugorzędowej, jeżeli tego inaczej nie sprecyzowano.
Występujące w niniejszym opisie odniesienia się do genu należy rozumieć w ich najszerszym kontekście i obejmują one: (i) klasyczny gen genomowy złożony z transkrypcyjnych i/lub translacyjnych sekwencji regulatorowych i/lub regionu kodującego i/lub sekwencji nie ulegających translacji (to znaczy intronów, sekwencji nie ulegających translacji na końcu 5 ' i 3 '); albo (ii) mRNA lub cDNA odpowiadające regionom kodującym (to znaczy eksony) i sekwencje genu nie ulegające translacji na końcu 5'i 3'.
Stosowany w niniejszym opisie termin gen używany jest także do opisania cząsteczek syntetycznych lub fuzyjnych kodujących całość lub część funkcjonalnego produktu. Korzystne geny oksygenazy według niniejszego wynalazku mogą pochodzić od występującego w naturze genu oksygenazy oraz mogą być otrzymywane typowymi metodami rekombinantowymi. Ogólnie, gen epoksygenazy można poddać mutagenezie z uzyskaniem pojedynczego lub wielokrotnego podstawienia, delecji i/lub addycji nukleotydów.
Do nukleotydowych pochodnych insercyjnych, należą produkty fuzji na końcach 5' i 3', jak również wewnątrz sekwencyjnej insercji jednego lub więcej niż jednego nukleotydu. Insercyjne warianty sekwencji nukleotydów są to takie warianty, w przypadku których jeden, lub większa ilość nukleotydów została wprowadzona w przewidziane miejsce w sekwencji nukleotydów, aczkolwiek możliwa jest także insercja przypadkowa, z odpowiednim skriningiem wytworzonego produktu.
Warianty delecyjne charakteryzują się usunięciem z sekwencji jednego, lub więcej niż jednego nukleotydu.
Substytucyjne warianty nukleotydów są to takie warianty, w przypadku których co najmniej jeden nukleotyd w sekwencji został usunięty, a w jego miejsce wstawiony został inny, odmienny nukleotyd. Podstawienie takie może być milczące w tym sensie, że nie zmienia ono aminokwasu zdefiniowanego przez kodon. Alternatywnie, podstawniki przeznaczone są do doprowadzenia do wymiany jednego aminokwasu na inny, podobnie działający aminokwas, lub aminokwas o podobnym ładunku, polarności i hydrofobowości.
W kontekście niniejszego wynalazku, termin oksygenaza kwasów tłuszczowych należy rozumieć w ten sposób, że odnosi się on do jakiegokolwiek enzymu, lub jego funkcjonalnego równoważnika lub jego enzymatycznie aktywnej pochodnej, która katalizuje biosyntezę epoksydowanego kwasu tłuszczowego przez przekształcenie wiązania węgiel-węgiel kwasu tłuszczowego w grupę epoksydową, a korzystnie, przez przekształcenie podwójnego wiązania węgiel-węgiel w nienasyconym kwasie tłuszczowym w grupę epoksydową. Bez ograniczania zakresu wynalazku, epoksygenaza kwasów tłuszczowych może katalizować biosyntezę epoksykwasu tłuszczowego wybranego z wykazu obejmującego, między innymi, kwas 12,13-epoksy-9-oktadecenowy (kwas wernolowy), kwas 12,13-epoksy-9,15-oktadekadienowy, kwas 15,16-epoksy-9,12-oktadekadienowy, kwas 9,10-epoksy-12-oktadecenowy i kwas 9,10-epoksyoktadekanowy.
Terminy epoksy, grupa epoksydowa i reszta epoksydowa, jak wiedzą o tym fachowcy w tej dziedzinie techniki, odnoszą się do trój członowego pierścienia złożonego z dwóch atomów węgla i jednego atomu tlenu, połączonych ze sobą wiązaniami pojedynczymi w sposób następujący:
Zgodnie z tym, termin epoksyd odnosi się do związków zawierających co najmniej jedną grupę epoksydową powyżej zdefiniowaną.
PL 194 095B1
Fachowcy w tej dziedzinie techniki wiedzą, że nomenklatura kwasów tłuszczowych oparta jest na długości łańcucha węglowego i pozycji nienasyconych atomów węgla w obrębie tego łańcucha węglowego. l tak, kwasy tłuszczowe oznacza się w notacji stenograficznej:
Węgielcałość: wiązanie podwójnecałość pozycja wiązania podwójnego (D),
Itak, na przykład, kwas palmitynowy (kwas n-heksanodekanowy) jest nasyconym kwasem o 16 atomach węgla (to znaczy jest to 16:0), kwas oleinowy (kwas oktadecenowy) jest nienasyconym kwasem o 18 atomach węgla i jednym podwójnym wiązaniem między C-9 a C-10 (to znaczy jest to 18:1D 9) a kwas linolenowy (kwas oktadekadienowy) jest nienasyconym kwasem o 18 atomach węgla i dwoma podwójnymi wiązaniami między C-9 a C-10 i między C-12 a C-13 (to znaczy jest to 18:2D9,12).
Jednakże, w kontekście niniejszego wynalazku, epoksygenaza może katalizować przekształcenie jakiegokolwiek wiązania węgiel-węgiel w grupę epoksydową, albo, alternatywnie, przekształcenie jakiegokolwiek wiązania podwójnego w nienasyconym kwasie tłuszczowym będącym substratem w grupę epoksydową. Z tego punktu widzenia, jak wiedzą o tym fachowcy w tej dziedzinie techniki, większość jednonienasyconych kwasów tłuszczowych organizmów wyższych są to nienasycone kwasy tłuszczowe o 18 atomach węgla (są to więc 18:1D9), podczas gdy większość wielonienasyconych kwasów tłuszczowych wywodzących się z organizmów wyższych są to kwasy o 18 atomach węgla z co najmniej jednym wiązaniem podwójnym, mieszczącym się między C-9 a C-10. Poza tym, bakterie także zawierają kwasy tłuszczowe jednonienasycone w pozycji C16.
Ponadto, epoksygenaza według niniejszego wynalazku może przejawiać aktywność w stosunku do więcej niż jednej cząsteczki kwasu tłuszczowego jako substratu, a w konsekwencji, zakres niniejszego wynalazku nie jest ograniczony przez naturę cząsteczki substratu, na którą działa przedmiotowa epoksygenaza.
Korzystnie, cząsteczka będąca substratem dla epoksygenazy według niniejszego wynalazku stanowi cząsteczkę kwasu tłuszczowego zawierającego co najmniej jedno wiązanie podwójne.
Następnie, epoksygenazy mogą wywierać działanie na dowolną liczbę atomów węgla w cząsteczce jakiegokolwiek substratu. Itak, na przykład, można je scharakteryzować jako, między innymi, D6-epoksygenazy, D9-epoksygenazy, D12-epoksygenazy lub D15-epoksygenazy. Zgodnie z tym, zakres niniejszego wynalazku nie jest ograniczony pozycją atomu węgla w substracie na który epoksygenaza może działać.
Stosowany w niniejszym opisie termin D6-epoksygenaza należy rozumieć w taki sposób, że odnosi się on do enzymu, który katalizuje przekształcenie wiązania D6 kwasu tłuszczowego stanowiącego substrat w grupę D6-epoksydową, a, korzystnie, katalizuje przekształcenie wiązania podwójnego D6 co najmniej jednego kwasu nienasyconego w grupę D6-epoksydową.
Stosowany w niniejszym opisie termin D9-epoksygenaza należy rozumieć w taki sposób, że odnosi się on do enzymu, który katalizuje przekształcenie wiązania D9 kwasu tłuszczowego stanowiącego substrat w grupę D9-epoksydową, a, korzystnie, katalizuje przekształcenie wiązania podwójnego D9 co najmniej jednego kwasu nienasyconego w grupę D9-epoksydową.
Stosowany w niniejszym opisie termin D12-epoksygenaza należy rozumieć w taki sposób, że odnosi się on do enzymu, który katalizuje przekształcenie wiązania D12 kwasu tłuszczowego stanowiącego substrat w grupę D12-epoksydową, a korzystnie, katalizuje przekształcenie wiązania podwójnego D12co najmniej jednego kwasu nienasyconego w grupę D12-epoksydową.
Stosowany w niniejszym opisie termin D15-epoksygenaza należy rozumieć w taki sposób, że odnosi się on do enzymu, który katalizuje przekształcenie wiązania D15 kwasu tłuszczowego stanowiącego substrat w grupę D15-epoksydową, a, korzystnie, katalizuje przekształcenie wiązania podwójnego A15 co najmniej jednego kwasu nienasyconego w grupę D15-epoksydową.
Wynalazek niniejszy, oczywiście, obejmuje swym zakresem substancje genetyczne kodujące, między innymi, wszystkie enzymy typu oksygenazy wyszczególnione powyżej.
Zgodnie z jednym z korzystnych sposobów wykonania niniejszego wynalazku, wyizolowana cząsteczka kwasu nukleinowego koduje epoksygenazę kwasów tłuszczowych, która przekształca co najmniej jedno wiązanie węgiel-węgiel w kwasie palmitolejowym (16:1D9), kwasie oleinowym (18:1D9), kwasie linolowym (18:2D9,12), kwasie linolenowym (18: 3D9,12,15) lub kwasie arachidonowym (20: 4D5,8,11,14), do wiązania epoksydowego. Korzystnie, wiązanie węgiel-węgiel stanowi podwójne wiązanie węgiel-węgiel.
PL 194 095B1
Korzystniej, wyizolowana cząsteczka kwasu nukleinowego według wynalazku koduje epoksygenazę kwasów tłuszczowych, która co najmniej przekształca jedno lub oba podwójne wiązania w kwasie linolowym w grupę epoksydową.
Zgodnie z tym wykonaniem, epoksygenaza przekształcająca zarówno wiązanie podwójne D9 jak i D12 kwasu linolowego w grupę epoksydową, może katalizować takie przekształcenie niezależnie jedno od drugiego tak, że wspomniana epoksygenaza jest D9-epoksygenazą i/lub D12-epoksygenazą, jak zdefiniowano w powyższej części niniejszego opisu.
Zgodnie z innym korzystnym sposobem wykonania niniejszego wynalazku, epoksygenaza kwasów tłuszczowych według niniejszego wynalazku jest D12-epoksygenaza, D15-epoksygenaza lub D9-epoksygenaza, jak zdefiniowano w powyższej części niniejszego opisu.
Korzystniej, epoksygenazą kwasów tłuszczowych według wynalazku jest blot D12-epoksygnaza, jak zdefiniowano w powyższej części niniejszego opisu.
Zgodnie ze szczególnie korzystnym sposobem wykonania, wynalazek niniejszy dotyczy wyizolowanej cząsteczki kwasu nukleinowego kodującej D12-epoksygenazę będącą enzymem, który co najmniej przekształca wiązanie podwójne D12 kwasu linolowego w grupę D12-epoksydową, w wyniku czego otrzymuje się kwas 12,13-epoksy-9-oktadecenowy (kwas wernolowy).
Korzystnym źródłem D12-epoksygenazy jest, ale bez ograniczania zakresu niniejszego wynalazku, roślina, w szczególności Crepis palaestina, lub inna Crepis sp. różniąca się od C. palaestina i zawierająca dużą ilość kwasu wernolowego, a dalej Vernonia galamnesis lub Euphorbia lagascae.
Zgodnie z tym wykonaniem, D12-epoksygenaza może, katalizować, między innymi, przekształcenie kwasu olejopalmitynowego w kwas 9,10-epoksy-palmitynowy i/lub przekształcenie kwasu olejowego w kwas 9,10-epoksystearynowy i/lub przekształcenie kwasu linolowego w jeden, lub więcej niż jeden kwas 9,10-epoksy-12-oktadecenowy lub kwas 12,13-epoksy-9-oktadecenowy lub kwas 9,10,12,13-diepoksystearynowy i/lub przekształcenie kwasu linolenowego w jeden, lub więcej niż jeden kwas 9,10-epoksy-12,15-oktadekadienowy lub kwas 12,13-epoksy-9,15-oktadekadienowy lub kwas 15,16-epoksy-oktadekadienowy lub kwas 9,10,12,13-diepoksy-15-oktadecenowy lub kwas 9,10,15,16-diepoksy-12-oktadecenowy lub kwas 12,13,15,16-diepoksy-9-oktadecenowy lub kwas 9,10,12,13,15,16-triepoksystearynowy i/lub przekształcenie kwasu arachidonowego w jeden, lub więcej niż jeden kwas 5,6-epoksy-8,11,14 tetrakozatrienowy lub kwas 8,9-epoksy-5,11,14-tetrakozatrienowy lub kwas 11,12-epoksy-5,8,14-tetrakozatrienowy lub kwas 14,15-epoksy-5,8,11-tetrakozatrienowy lub kwas 5,6,8,9-diepoksy-11,14-tetrakozadienowy lub kwas 5,6,11,12-diepoksy-8,14-tetrakozadienowy lub kwas 5,6,14,15-diepoksy-8,11-tetrakozadienowy lub kwas 8,9,11,12-diepoksy-5,14-tetrakozadienowy lub kwas 8,9,14,15-diepoksy-5,11-tetrakozadienowy lub kwas 11,12,14,15-diepoksy-5,8-tetrakozadienowy lub kwas 5,6,8,9,11,12-triepoksy-14-tatrakozenowy lub kwas 5,6,8,9,14,15-triepoksy-11-tetrakozenowy lub kwas 5,6,11,12,14,15-triepoksy-8-tetrakozenowy lub kwas 8,9,11,12,14,15-triepoksy-5-tetrakozenowy
Fachowcy w tej dziedzinie techniki wiedzą, że nie wszystkie substraty wyszczególnione powyżej są osiągalne ze źródeł naturalnych, tym niemniej jednak można je wytworzyć na drodze syntezy chemicznej. Wynalazek niniejszy obejmuje swym zakresem przekształcenie zarówno występujących w przyrodzie jak i zsyntetyzowanych chemicznie nienasyconych kwasów tłuszczowych w epoksykwasy tłuszczowe, przy czym jedynym wymaganiem w tym przypadku jest to, aby cząsteczka kwasu nukleinowego według niniejszego wynalazku, jakto opisano w niniejszym opisie, kodowała enzym, lub jego funkcjonalną część zdolną do katalizowania wspomnianej przemiany.
W zgodności z powyższym omówieniem, fachowcy w tej dziedzinie techniki zdadzą sobie sprawę z tego, że epoksygenaza kwasów tłuszczowych może stanowić, między innymi, enzym monooksygenazę zależną od cytochromu P 450 lub monooksygenazę o funkcji mieszanej, albo, alternatywnie, enzym peroksygenazę zależną od nadtlenku, albo enzym podobny.
Jednakże, wynalazek niniejszy jest w szczególny sposób ukierunkowany na te enzymy typu epoksygenazy, które są monooksygenazami o funkcji mieszanej i na kodujące je cząsteczki kwasu nukleinowego, oraz na ich zastosowanie. Zgodnie z tym, szczególnie korzystnie cząsteczka kwasu nukleinowego według wynalazku koduje epoksygenazę kwasów tłuszczowych będącą monooksygenazą o funkcji mieszanej.
PL 194 095B1
W kontekście niniejszego wynalazku, termin monooksydaza o funkcji mieszanej należy rozumieć w ten sposób, że odnosi się on do jakiegokolwiek enzymu katalizującego epoksydację wiązania węgiel-węgiel lub podwójnego wiązania węgiel-węgiel w cząsteczce kwasu tłuszczowego, przy czym wspomniany enzym obejmuje sekwencję aminokwasów zawierającą trzy regiony o wysokiej zawartości histydyny, jak następuje:
(i) His-(Xaa)3-4-His;
(ii) His-(Xaa)2-3-His-His; oraz (iii) His-(Xaa)2-3-His-His, przy czym His oznacza histydynę, Xaa oznacza resztę jakiegokolwiek aminokwasu występującego w przyrodzie jak to przedstawiono w poniższej tabeli 1, składnik (Xaa)3-4 oznacza sekwencję aminokwasów obejmującą trzy lub cztery jednostki powtarzalne Xaa, a składnik (Xaa)2-3 oznacza sekwencję aminokwasów obejmującą dwie lub trzy jednostki powtarzalne Xaa.
Termin enzym podobny do monooksydazy o funkcji mieszanej należy rozumieć w ten sposób, że odnosi się on do jakiegokolwiek enzymu obejmującego dwa lub trzy regiony o wysokiej zawartości histydyny wyszczególnione powyżej.
Dla zilustrowania wynalazku tu opisywanego, jego twórcy zademonstrowali, między innymi, fakt, że sekwencja aminokwasów Crepis palaestina obejmuje D12-epoksygenazę zawierającą charakterystyczne motywy sekwencji aminokwasów monooksygenazy o funkcji mieszanej, jak to opisano w powyższej części niniejszego opisu. Daleko posunięta identyczność sekwencji aminokwasów występująca między D12-epoksygenazą C. palaestina (SEQ ID NO: 2) i sekwencjami polipeptydów pochodzących z niezidentyfikowanych Crepis sp. i Vernonia galamensis (SEQ ISD NO NO: 4 i 6), w porównaniu z sekwencjami aminokwasów innych monooksygenaz o funkcji mieszanej, takich jak desaturazy i hydroksylazy, sugeruje, że wspomniane sekwencje aminokwasów Crepis sp. i V. galamensis także są enzymami typu epoksygenazy kwasów tłuszczowych i że mogą stanowić D12-epoksygenazy.
Pod tym względem, przytoczona to przykładowo sekwencja aminokwasów Vernonia galamensis jest sekwencją częściową, obejmującą jedynie jeden motyw o wysokiej zawartości histydyny (to jest: His-Arg-Asn-His-His) i częściową sekwencję pierwszego motywu o wysokiej zawartości histydyny (to jest, zawiera ona dwie ostatnie reszty histydyny motywu His-Glu-Cys-Gly-His-His), ponieważ kodująca ją odpowiednia sekwencja nukleotydów była amplifikowana metodą PCR jako częściowa sekwencji cDNA, z udziałem pierwszego startera dla wspomnianego motywu o wysokiej zawartości histydyny i drugiego startera amplifikacji przeznaczonego dla regionu w górę od trzeciego motywu o wysokiej zawartości histydyny (to jest: His-Val-Met-His-His). Oprócz tego, fakt amplifikacji sekwencji V. galamensis przy użyciu startera swoistego dla pierwszego motywu o wysokiej zawartości histydyny, wskazuje na to, że odpowiednia sekwencja o pełnej długości będzie także obejmować ten motyw.
Zgodnie z tym, w szczególnie korzystnym wykonaniu wynalazku, cząsteczka kwasu nukleinowego według wynalazku koduje monooksygenazę o funkcji mieszanej lub enzym podobny pochodzący z Crepis spp., włącznie z Crepis palaestina, albo, alternatywnie, pochodzący z Vernonia galamensis. Zgodnie z tym wykonaniem, nawet jeszcze bardziej korzystnie przedmiotowa epoksygenaza co najmniej obejmuje sekwencję aminokwasów, zawierającą trzy lub więcej niż trzy regiony o wysokiej zawartości histydyny, jak następuje:
(i) His-Glu-Cys-Gly-His-His (SEQ IDNO: 15);
(ii) His-Arg-Asn-His-His (SEQ IDNO: 16); oraz (iii) His-Val-Met-His-His (SEQ IDNO: 17), albo jej homolog, analog lub pochodną, przy czym His oznacza histydynę, Glu oznacza kwas glutaminowy, Cys oznacza cysteinę, Gly oznacza glicynę, Arg oznacza argininę, Asn oznacza asparaginę, Val oznacza walinę i Met oznacza metioninę.
Wynalazek niniejszy, oczywiście, obejmuje swym zakresem geny epoksygenazy pochodzące z innych gatunków, włącznie z genami epoksygenazy pochodzącymi, między innymi, z Chrysanthemum spp. i Euphorbia lagascae.
W korzystnym wykonaniu, ale bez ograniczania zakresu niniejszego wynalazku, geny epoksygenazy z innych gatunków, objęte zakresem niniejszego wynalazku, kodują monooksygenazy o funkcji mieszanej. Wynalazek niniejszy obejmuje swym zakresem wyizolowane lub rekombinantowe polipeptydy kodowane przez geny tego rodzaju oraz zastosowanie wspomnianych genów i polipeptydów.
PL 194 095B1
Opisywany tu wynalazek, zgodnie z tym jego wykonaniem, nie obejmuje swym zakresem cząsteczek kwasu nukleinowego kodujących aktywności enzymatyczne inne niż aktywności epoksygenaz, jak zdefiniowano w niniejszym opisie, a zwłaszcza nie dotyczy D12-desaturaz pochodzących, między innymi, z Arabidopsis thaliana, Brassica juncea, Brassica napus lub Glycine max, które są znane z tego, że zawierają podobne motywy o wysokiej zawartości histydyny.
W kontekście niniejszego wynalazku, termin homologi sekwencji aminokwasów odnosi się do tych sekwencji aminokwasów lub sekwencji peptydów, które wywodzą się z polipeptydów, enzymów lub białek według niniejszego wynalazku, albo, alternatywnie, odpowiadają zasadniczo sekwencjom aminokwasów wyszczególnionych w poniższej części niniejszego opisu, z uwzględnieniem możliwości występowania jakichkolwiek substytucji, addycji lub delecji aminokwasów występujących w przyrodzie.
I tak, na przykład, aminokwasy można zastąpić innymi aminokwasami odznaczającymi się podobnymi właściwościami, na przykład hydrofobowością, hydrofilowością, momentem hydrofobowości, antygenowością, skłonnością do tworzenia lub rozrywania struktury a-heliksu lub struktury b (pofałdowanej kartki) itd. Alternatywnie, względnie dodatkowo, aminokwasy homologicznej sekwencji aminokwasów można zastąpić innymi aminokwasami o podobnych właściwościach, takich jak, na przykład hydrofobowość, hydrofilowość, moment hydrofobowości, ładunek lub antygenowość itd.
Omawiane tu reszty aminokwasów występujących w przyrodzie opisano w poniższej tabeli 1.
Homologiem sekwencji aminokwasów może być peptyd syntetyczny wytworzony jakimkolwiek sposobem znanym fachowcom w tej dziedzinie techniki, takim jak chemia Fmoc.
Alternatywnie, homolog sekwencji aminokwasów może wywodzić się ze źródła naturalnego, takiego jak ten czy inny gatunek polipetydów, enzymów lub białek według niniejszego wynalazku. Do korzystnych źródeł homologów sekwencji aminokwasów wyszczególnionych powyżej należą jakiekolwiek źródła brane pod uwagę w niniejszym opisie.
Termin analogi sekwencji aminokwasów obejmuje te sekwencje aminokwasów, które są zasadniczo identyczne z sekwencjami aminokwasów wyszczególnionymi powyżej, z uwzględnieniem możliwości obecności w nich jakichkolwiek analogów aminokwasów nie występujących w przyrodzie.
Korzystne aminokwasy nie występujące w przyrodzie i brane pod uwagę w niniejszym opisie są wyszczególnione w poniższej tabeli 2.
Termin pochodna w nawiązaniu do sekwencji aminokwasów należy rozumieć w ten sposób, że odnosi się on do mutantów, części, fragmentów lub fuzji polipeptydów sekwencji aminokwasów wyszczególnionych powyżej. Do pochodnych należą zmodyfikowane sekwencje aminokwasów lub peptydów, w których ligandy są przyłączone do jednej, lub większej ilości zawartych w nich reszt aminokwasowych, takich jak węglowodany, enzymy, białka, polipeptydy lub cząsteczki reporterowe, takie jak radionuklidy lub związki fluorescencyjne. Wynalazek obejmuje swym zakresem także glikozylowane, fluorescencyjne, acylowane lub alkilowane postacie przedmiotowych peptydów. Oprócz tego, do pochodnych należeć mogą także fragmenty lub części sekwencji aminokwasów ujawnionej w niniejszym opisie i są one objęte zakresem niniejszego wynalazku, jak również homopolimery i heteropolimery zawierające dwie lub większą ilość kopii przedmiotowych sekwencji.
Sposoby postępowania dotyczące derywatyzacji peptydów są dobrze znane w tej dziedzinie techniki.
Do substytucji należą zamiany aminokwasów, w przypadku których aminokwas zostaje zastąpiony resztą odmiennego występującego w naturze lub nietypowego aminokwasu. Substytucje takie można sklasyfikować jako konserwatywne i w tym przypadku reszta aminokwasu zostaje zastąpiona innym występującym w przyrodzie aminokwasem o podobnym charakterze, na przykład:
Gly « Ala, Val « Ile « Leu, Asp « Glu, Lys « Arg, Asn « Gin lub Phe « Trp « Tyr.
Substytucje objęte zakresem niniejszego wynalazku mogą być także niekonserwatywne. W tym przypadku reszta aminokwasu obecna w polipeptydzie represorowym zostaje zastąpiona aminokwasem o odmiennych właściwościach, takim jak występujący w przyrodzie aminokwas pochodzący z innej grupy (na przykład podstawiony naładowany lub hydrofobowy aminokwas zastąpiony alaniną), albo, alternatywnie, występujący w przyrodzie aminokwas zastąpiony jest aminokwasem nietypowym).
PL 194 095B1
Substytucje aminokwasów są to typowo zamiany pojedynczych reszt, jednakże mogą to być również zamiany wielu reszt, albo skupionych, albo rozproszonych.
Delecje aminokwasów są, na ogół, rzędu 1-10 reszt aminokwasowych, natomiast insercje mogą mieć dowolną długość. Delecje i insercje mogą być wykonane na N-końcu, na C-końcu lub też mogą to być delecje lub insercje wewnętrzne. Ogólnie, insercje w obrębie sekwencji aminokwasów będą mniejsze od fuzji na N-końcu lub na C-końcu i są rzędu 1-4 reszt aminokwasowych.
Wynalazek niniejszy, oczywiście, obejmuje swym zakresem przedmiotową wyizolowaną cząsteczkę kwasu nukleinowego zintegrowaną z genomem komórki jako addycja do endogennego kompleksu genów epoksygenazy. Alternatywnie, chociaż komórka-gospodarz normalnie nie koduje enzymów potrzebnych do biosyntezy epoksykwasów tłuszczowych, wynalazek niniejszy obejmuje swym zakresem przedmiotową wyizolowaną cząsteczkę kwasu nukleinowego zintegrowaną z genomem wspomnianej komórki jako addycja do endogennego genomu komórkowego.
T a b e l a 1
Aminokwas | Skrót trzyliterowy | Symbol jednoliterowy |
Alanina | Ala | A |
Arginina | Arg | R |
Asparagina | Asn | N |
Kwas asparaginowy | Asp | D |
Cysteina | Cys | C |
Glutamina | Gln | Q |
Kwas glutaminowy | Glu | E |
Glicyna | Gly | G |
Histydyna | His | H |
Izoleucyna | Ile | I |
Leucyna | Leu | L |
Lizyna | Lys | K |
Metionina | Met | M |
Fenyloalanina | Phe | F |
Prolina | Pro | P |
Seryna | Ser | S |
Treonina | Thr | T |
Tryptofan | Trp | W |
Tyrozyna | Tyr | Y |
Walina | Val | V |
Jakikolwiek aminokwas przytoczony powyżej | Xaa | X |
PL 194 095B1
Aminokwas nietypowy | Kod | Aminokwas nietypowy | Kod |
kwas a-aminomasłowy | Abu | L-N-metyloalanina | Nmala |
a-amino-a-metylomaślan | Mgabu | L-N-metyloarginina | Nmarg |
aminocyklopropanokarboksylan | Cpro | metyloasparagina kwas L-N-metyloasparaginowy | Nmasn Nmas |
kwas aminoizomasłowy | Aib | L-N-metylocysteina | Nmcys |
aminonorbornylokarboksylan | Norb | L-N-metyloglutamina kwas L-N-metyloglutaminowy | NMglu Nmglu |
cykloheksyloalanina | Chexa | L-N-metylohistydyna | Nmhis |
cyklopentyloalanina | Cpen | L-N-metyloizoleucyna | Nmile |
D-alanina | Dal | L-N-metyloleucyna | Nmleu |
D-arginina | Darg | L-N-metylolizyna | Nmlys |
kwas D-asparaginowy | Dasp | L-N-metylometionina | Nmmet |
D-cysteina | Dcys | L-N-metylonorleucyna | Nmnle |
D-glutamina | Dgln | L-N-metylonorwalina | Nmnva |
kwas D-glutaminowy | Dglu | L-N-metyloornityna | Nmorn |
D-histydyna | Dhis | L-N-metylofenyloalanina | Nmphe |
D-izoleucyna | Dile | L-N-metyloprolina | Nmpro |
D-izoleucyna | Dile | L-N-metyloprolina | Nmpro |
D-leucyna | Dleu | L-N-metyloseryna | Nmser |
D-lizyna | Dlys | L-N-metylotreonina | Nmthr |
D-metionina | Dmet | L-N-metylotryptofan | Nmtrp |
D-ornityna | Dorn | L-N-metylotyrozyna | Nmtyr |
D-fenyloalanina | Dphe | L-N-metylowalina | Nmval |
D-prolina | Dpro | L-N-metyloetyloglicyna | Nmctg |
D-seryna | Dser | L-N-metylo-tert-butyloglicyna | Nmtbug |
D-treonina | Dthr | L-norleucyna | NIe |
D-tryptofan | Dtrp | L-norwalina | Nva |
D-tyrozyna | Dtyr | a-metyloaminoizomaślan | Mlb |
D-walina | Dval | a-metylo-g-aminomaślan | Mgabu |
D-a-metyloalanina | Dmala | a-metylocykloheksyloalanina | Mchexa |
D-a-metyloarginina | Dmarg | a-metylocyklopentyloalanina | Mcpen |
D-a-metyloasparagina | Dmasn | a-metylo-a-naftyloalanina | Manap |
D-a-metyloasparaginian | Dmasp | a-metylopenicylamina | Mpen |
D-a-metylocysteina | Dmcys | N-(4-aminobutylo)glicyna | Nglu |
D-a-metyloglutamina | Dmgln | N-(2-aminoetylo)glicyna | Naeg |
D-a-metylohistydyna | Dmhis | N-(3-aminopropylo)glicyna | Norn |
D-a-metyloizoleucyna | Dmile | N-amino-a-metylomaślan | Nmabu |
D-a-metyloleucyna | Dmleu | a-naftyloalanina | Anap |
D-a-metylolizyna | Dmlys | N-benzyloglicyna | Nphe |
PL 194 095B1
D-a-metylometionina | Dmmet | N-(2-karbamyloetylo)glicyna | Ngln |
D-a-metyloornityna | Dmorn | N-(karbamylometylo)glicyna | Nasn |
D-a-metylofenyloalanina | Dmphe | N-(2-karboksyetylo)glicyna | Nglu |
D-a-metyloprolina | Dmpro | N-(karboksymetylo)glicyna | Nasp |
D-a-metyloseryna | Dmser | N-cyklobutyloglicyna | Ncbut |
D-a-metylotreonina | Dmthr | N-cykloheptyloglicyna | Nchep |
D-a-metylotryptofan | Dmtrp | N-cykloheksyloglicyna | Nchex |
D-a-metylotyrozyna | Dmty | N-cyklodecyloglicyna | Ncdec |
D-a-metylowalina | Dmval | N-cyklododecyloglicyna | Ncdod |
D-N-metyloalanina | Dnmala | N-cyklooktyloglicyna | Ncoct |
D-N-metyloarginina | Dnmarg | N-cyklopropyloglicyna | Ncpro |
D-N-metyloasparagina | Dnmasn | N-cykloundecyloglicyna | Ncund |
D-N-metyloasparaginian | Dnmasp | N-(2,2-difenyloetylo)glicyna | Nbhm |
D-N-metylocysteina | Dnmcys | N-(3,3-difenylopropylo)glicyna | Nbhe |
D-N-metyloglutamina | Dnmgln | N-(3-guanidynopropylo)glicyna | Narg |
D-N-metyloglutaminian | Dnmglu | N-(1 -hydroksyetylo)glicyna | Nthr |
D-N-metylohistydyna | Dnmhis | N-(hydroksyetylo)glicyna | Nser |
D-N-metyloizoleucyna | Dnmile | N-(imidazoliloetylo)glicyna | Nhis |
D-N-metyloleucyna | Dnmleu | N-(3-indoliloetylo)glicyna | Nhtrp |
D-N-metylolizyna | Dnmlys | N-metylo-g-amino-maślan | Nmgabu |
N-metylocykloheksyloalanina | Nmchexa | D-N-metylometionina | Dnmmet |
D-N-metyloornityna | Dnmorn | N-metylocyklopentyloalanina | Nmcpen |
N-metyloglicyna | Nala | D-N-metylofenyloalanina | Dnmphe |
N-metyloaminoizomaślan | Nmaib | D-N-metyloprolina | Dnmpro |
N-(1 -metylopropylo)glicyna | Nile | D-N-metyloseryna | Dnmser |
N(2-metylopropylo)glicyna | Nleu | D-N-metylotreonina | Dnmthr |
D-N-metylotryptofan | Dnmtrp | N-(1 -metyloetylo)glicyna | Nval |
D-N-metylotyrozyna | Dnmtyr | N-metylopenicylamina | Nmpen |
kwas g-izomasłowy | Gabu | N-(p-hydroksyfenylo)glicyna | Nthyr |
L-tert-butyloglicyna | Tbug | N-(tiometylo)glicyna | Ncys |
L-etyloglicyna | Etg | penicylamina | Pen |
L-homofenyloalanina | Hphe | L-a-metyloalanina | Mala |
L-a-metyloarginina | Marg | L-a-metyloasparagina | Masn |
L-a-metyloasparaginian | Masp | L-a-metylo-tert-butylogicyna | Mtbug |
L-a-metylocysteina | Mcys | L-metyloetyloglicyna | Metg |
L-a-metyloglutamina | Mgln | L-a-metyloglutaminian | Mglu |
L-a-metylohistydyna | Mhis | L-a-metylohomofenyloalanina | Mhphe |
L-a-metyloizoleucyna | Mile | N-(2-metylotioetylo)glicyna | Nmet |
L-a-metyloleucyna | Mleu | L-a-metylolizyna | Mlys |
L-a-metylometionina | Mmet | L-a-metylonorleucyna | Mnle |
L-a-metylonorwalina | Mnva | L-a-metyloornityna | Morn |
L-a-metylofenyloalanina | Mphe | L-a-metyloprolina | Mpro |
PL 194 095B1
L-a-metyloseryna | Mser | L-a-metylotreonina | Mthr |
L-a-metylotryptofan | Mtrp | L-a-metylotyryzyna | Mtyr |
L-a-metylowalina | M-val | L-a-metylohomofenyloalanina | Mmhphe |
N-(N-(2,2-difenyloetylo)karbamylo- | Nnbhm | N-(N-(3,3-difenylopropylo)karba- | Nnbhe |
metylo)glicyna | mylometylo)glicyna | ||
1 -karboksy-1-(2,2-dipropanfenylo- | Nmbc |
etyloamino)cyklopropan
Zgodnie ze swą drugą cechą znamienną, wynalazek niniejszy dotyczy wyizolowanej cząsteczki kwasu nukleinowego obejmującej sekwencję nukleotydów przedstawioną w którejkolwiek z sekwencji SEQ ID NO NO: 1lub 3 lub 5 lub 19 lub 20, albo sekwencję komplementarną do niej, albo jej homolog, analog lub pochodną.
Dla celów nomenklaturowych, sekwencja nukleotydów przedstawiona w SEQ IDNO: 1 pochodzi z Crepis palaestina i koduje sekwencję monooksygenazy o funkcji mieszanej lub sekwencję podobną do sekwencji monooksygenazy o funkcji mieszanej przedstawioną w SEQ IDNO: 2.
Jak to zilustrowano przykładowo w niniejszym opisie, sekwencja aminokwasów przedstawiona w SEQ IDNO: 2 wykazuje aktywność epoksygenazy, a bardziej szczegółowo, aktywność D12-epoksygenazy.
Sekwencja nukleotydów przedstawiona w SEQ ID NO: 3 odpowiada cDNA pochodzącemu z Crepis sp. innego niż C. palaestina, zawierającego w dużej ilości kwas wernolowy. Sekwencja aminokwasów przedstawiona w SEQ ID NO: 4 odpowiada pochodnej sekwencji aminokwasów genu epoksygenazy z Crepis sp. przedstawionej w SEQ ID NO: 3.
Sekwencja nukleotydów przedstawiona w SEQ ID NO: 5 odpowiada amplifikowanemu DNA pochodzącemu z Vernania galamensis, otrzymanej z udziałem starterów amplifikacji wywodzących się ze zgodnej sekwencji monooksygenaz o funkcji mieszanej, włącznie z sekwencjami genu epoksygenazy z Crepis spp. według wynalazku.
Amplifikowany DNA obejmuje częściową sekwencję genu epoksygenazy, zawierającą sekwencję nukleotydów zdolną do kodowania motywu His-Arg-Asn-His-His o wysokiej zawartości histydyny, charakterystycznego dla enzymów typu monooksygenazy o funkcji mieszanej. Sekwencja aminokwasów przedstawiona w SEQ ID NO: 6 odpowiada pochodnej sekwencji aminokwasów genu epoksygenazy z Vermonia galamensis przedstawionej w SEQ ID NO:5.
Sekwencja nukleotydów przedstawiona w SEQ ID NO: 7 odnosi się do częściowej sekwencji genu acetylenazy z Crepis alpina, użytego jako sonda w celu wyizolowania cząsteczki kwasu nukleinowego zawierającej sekwencję nukleotydów przedstawioną w SEQ ID NO: 1. Sekwencja aminokwasów przedstawiona w SEQ ID NO 8 odpowiada pochodnej sekwencji aminokwasów wspomnianej sekwencji częściowej genu acetylenazy z C. alpina.
Stosowany w niniejszym opisie termin acetylenaza należy rozumieć w taki sposób, że odnosi się on do enzymu, który jest zdolny do katalizowania przekształcenia podwójnego wiązania węgielwęgiel w cząsteczce kwasu tłuszczowego jako substratu, w potrójne wiązanie węgiel-węgiel, albo, alternatywnie, który jest zdolny do katalizowania tworzenia się potrójnego wiązania w cząsteczce kwasu tłuszczowego.
Sekwencja nukleotydów przedstawiona w SEQ IDNO: 18 odpowiada zdegenerowanemu starterowi amplifikacji używanemu do amplifikacji sekwencji domniemanego genu epoksygenazy z Euphorbia lagascae. Z tego punktu widzenia, reszty nukleotydowe pokazane w SEQ ID NO: 18 są to reszty zalecane przez IUPAC-IUB Biochemical Nomenclature Commission, przy czym A oznacza adeninę, C oznacza cytozynę, G oznacza guaninę, T oznacza tyminę, Y oznacza resztę pirymidyny, R oznacza resztę puryny, M oznacza adeninę lub cytozynę, K oznacza guaninę lub tyminę, S oznacza guaninę lub cytozynę, W oznacza adeninę lub tyminę, H oznacza nukleotyd inny niż guanina, B oznacza nukleotyd inny niż adenina, V oznacza nukleotyd inny niż tymina, D oznacza nukleotyd inny niż cytozyna i N oznacza resztę jakiegokolwiek nukleotydu.
PL 194 095B1
Sekwencja nukleotydów przedstawiona w SEQ IDNO: 19 pochodzi z Euphorbia lagscae i koduje sekwencję monooksygenazy zależnej od cytochromu P 450 lub sekwencję podobną do sekwencji monooksygenazy zależnej od cytochromu P 450.
Sekwencja nukleotydów przedstawiona w SEQ IDNO: 20 pochodzi z Euphorbia lagscae i koduje domniemaną sekwencję monooksygenazy zależnej od cytochromu P 450 lub sekwencję podobną do sekwencji monooksygenazy zależnej od cytochromu P450.
Wynalazek niniejszy, oczywiście, obejmuje swym zakresem genowe genomowe równoważniki cząsteczek cDNA przedstawionych w którejkolwiek s SEQ IDNO NO: 1, 3, 5, 19 lub 20.
W najkorzystniejszym wykonaniu, wynalazek niniejszy dotyczy wyizolowanej cząsteczki kwasu nukleinowego obejmującej sekwencję nukleotydową przedstawioną w którejkolwiek z SEQ IDNO NO: 1, 3, 5, 19 lub 20, albo genowy genomowy równoważnik wspomnianej sekwencji nukleotydów, albo jej homolog, analog lub pochodną.
Dla celów niniejszego wynalazku, termin homologi sekwencji nukleotydów należy rozumieć w taki sposób, że odnosi się on do wyizolowanej cząsteczki kwasu nukleinowego, zasadniczo takiej samej jak cząsteczka kwasu nukleinowego według niniejszego wynalazku lub komplementarnej do niej sekwencji nukleotydów, z uwzględnieniem możliwości występowania w obrębie wspomnianej sekwencji jednej, lub więcej niż jednej substytucji, insercji, delecji lub przegrupowań.
Stosowany w niniejszym opisie termin analogi sekwencji nukleotydów należy rozumieć w ten sposób, że odnosi się on do wyizolowanej cząsteczki kwasu nukleinowego zasadniczo takiej samej, jak cząsteczka kwasu nukleinowego według niniejszego wynalazku lub komplementarnej do niej sekwencji nukleotydów, z uwzględnieniem możliwości występowania w niej składników nienukleotydowych, normalnie nieobecnych we wspomnianej wyizolowanej cząsteczce kwasu nukleinowego, takich jak, na przykład, między innymi, węglowodany, promieniotwórcze związki chemiczne, w tym radionukleotydy, cząsteczki reporterowe, takie jak (ale bez ograniczania się tylko do niej) DIG, fosfataza alkaliczna lub peroksydaza chrzanowa.
Stosowany w niniejszym opisie termin pochodne sekwencji nukleotydów należy rozumieć w taki sposób, że odnosi się on do jakiejkolwiek wyizolowanej cząsteczki kwasu nukleinowego odznaczającej się wyraźnym podobieństwem do wspomnianej sekwencji lub jej części.
Ogólnie, homologi, analogi lub pochodne cząsteczki kwasu nukleinowego według wynalazku wytwarza się na drodze syntezy albo, alternatywnie, pochodzą one ze źródeł naturalnych. I tak, na przykład, sekwencję nukleotydów według niniejszego wynalazku można poddać mutagenezie w celu utworzenia licznych substytucji, delecji i/lub insercji, jak na to wskazano w powyższej części niniejszego opisu.
Zgodnie z jednym z wykonań wynalazku, korzystne homologi, analogi lub pochodne sekwencji nukleotydów przedstawionych w którejkolwiek z sekwencji SEQ ID NO NO: 1, 3, 5, 19 lub 20, albo sekwencje komplementarne do nich, kodują polipeptydy immunologicznie aktywne lub enzymatycznie aktywne.
Stosowany w niniejszym opisie termin immunologicznie aktywna należy rozumieć w taki sposób, że odnosi się on do zdolności danej cząsteczki polipetydu do wywoływania odpowiedzi immunologicznej u ssaka, a w szczególności odpowiedzi immunologicznej wystarczającej do wytworzenia cząsteczki przeciwciała, takiej jak (ale bez ograniczania się tylko do nich) cząsteczka IgM lub IgG, albo pełnej surowicy zawierającej wspomnianą cząsteczkę przeciwciała. Termin immunologicznie aktywna obejmuje swym zakresem także zdolność polipeptydu do wywoływania odpowiedzi immunologicznej wystarczającej do wytworzenia przeciwciał monoklonalnych, syntetycznych fragmentów Fab cząsteczki przeciwciała, jednołańcuchowej cząsteczki przeciwciała lub innej cząsteczki immunologicznie interaktywnej.
Stosowany w niniejszym opisie termin enzymatycznie aktywna należy rozumieć w taki sposób, że odnosi się on do zdolności danej cząsteczki polipeptydu do katalizowania reakcji enzymatycznej, a w szczególności reakcji enzymatycznej obejmującej epoksydację wiązania węgiel-węgiel w cząsteczce kwasu tłuszczowego jako substratu. Bardziej szczegółowo, ale bez ograniczania zakresu wynalazku, termin enzymatycznie aktywna może odnosić się również do zdolności cząsteczki polipeptydu do katalizowania epoksydacji D-9 lub D-12 w cząsteczce kwasu tłuszczowego stanowiącego substrat, takiego jak kwas linolowy lub kwas wernolowy.
PL 194 095B1
Odnośniki literaturowe
1. An i in., EMBO J. 4, 277 - 284 (1985).
2. F.M. Ausubel, R. Brent, R.E. Kingston, D.D. Moore, J.G. Seidman, J.A. Smith i K. Struhl w: Current Protocols in Molecular Biology, Wiley Interscience (ISBN 047150338) (1987).
3. R.C. Badami i K.B. Patil, Progress in Lipid Research, 19, 119 - 153 (1981).
4. M. Bafor, M.A. Smith, L. Jonsson, K. Stobart i S. Stymne, Arch. Biochem. Bipphys., 303, 145 - 151 (1993).
5. M. Bafor, A. Banas, E. Wiberg. M. Lenman. U. Stahl i S. Stymne w: Physiology, biochemistry and molecular biology of plant lipids (red. J.P. Williams, K.U. Mobasher i N.W. Lem), Kluwer Academic Publisher, Dordrecht. w druku, (1997).
6. Blee i Schuber, J. Biol. Chem., 265, 12887 - 12894 (1990).
7. E. Blee, A.L. Wilcox, J.M. Marnett i F. Schuber, J. Biol. Chem., 268, 1798 -1715 (1993).
8. F. Blee, S. Stahl. F. Schuber i S. Stymne, Biochem. Biophus. Res. Comm., 197, 778 -784 (1994).
9. E.G. Bligh i W. J. Dyer, Can. J. Biochem. Physiol., 230, 379 - 288 (1959).
10. K.R. Bozak, H. Yu, R. Sirevag i R.E. Christoffersen, Proc. Natl. Acad. Sci., 87, 3904 -3908 (1990).
11. P. Christou, D.E. McCabe i W.F. Swain, Plant Physiol., 87, 671 - 674 (1988).
12. Crossway i in., Mol. Gen. Genet., 202, 179 - 185 (1986).
13. J. Devereux, P. Haeberli i O. Smithies, Nucl. Acids Res., 12, 387 - 395 (1984).
14. Dolferus i in., Plant Physiol., 105, 1075 - 1087 (1994).
15. N. Engeseth I S. Stymne, Planta, 198, 238 - 245 (1996).
16. Fromm i in., Proc. Natl. Acad. Sci. (USA), 82, 5824 - 5828 (1085).
17. J. Haseloff i W.L. Gerlach, Nature, 334, 586 - 594 (1988).
18. Herrera-Estella i in., Nature, 303, 209 - 213 (1983a).
19. Herrera-Estella i in., EMBO J. 2, 987 -995 (1983b).
20. Herrera-Estella i in. w: Plant Genetic Engineering, Cambridge University Press,
NY, str. 63 - 93 (1985).
21. G. Kohn, E. Hartmann, S. Stymne i P. Beutelmann. J. Plant Physiol., 144, 265 - 271 (1994).
22. F.A. Krens, L. Molendijk, G. J. Wullems i R.A. Schilperoort, Nature, 296, 77 - 74 (1982).
23. G.J. Lawrence, J.G. Ellis, E.J. Finnegan, E.S. Dennis i W.J. Peacock w :Breeding Rese arch: The Key to Survival of the Earth (red. S. Iyama i G. Takeda). 6th International Congress of SABRAO, str. 535 - 538 (1989).
24. G.R. Lazo, P.A. Stein i R.A. Ludwig, Bio/technology, 9, 963 - 967 (1991).
25. Needleman i Wunsch, J. Mol. Biol., 48, 443 - 453 (1970).
26. Pazkowski i in., Embo J., 3, 2717 - 2722 (1984).
27. M. Pietrzak, R.D. Shilito, T. Hohn i I. Potrykus, Nucl. Acids Res., 14, 5857 - 5868 (1986).
28. F. Sanger, S. Nicklin i A.R. Coulson, Proc. Natl. Acad. Sci. (USA), 72, 5463 - 5467 (1977).
29. J. Shanklin, E. White i B.G. Fox, Biochemistry, 33, 12787 - 12794 (1994).
30. Valvekens i in., Proc. Natl. Acad. Sci. (USA), 85, 5536- 5540 (1988).
PL 194 095B1
Wykaz sekwencji (1) Informacja ogólna:
(i) Zgłaszający: Commonwealth Scientific and Industrial Research Organisation
AND Sten Stynme (ii) Tytuł wynalazku: Geny epoksygenazy roślinnych kwasów tłuszczowych i ich zastosowanie (iii) Liczba sekwencji: 20 (iv) Adres dla korespondencji:
(A) Adres: DAVIES COLLISON CAVE (B) Ulica: 1 LITTLE COLLINS STREET (C) Miasto: Melbourne (D) Stan: Wiktoria (E) Kraj: Australia (F) ZIP: 3000 (v) Postać czytelna dla komputera:
(A) Typ nośnika: dyskietka (B) Komputer: zgodny z IBM PC (C) System operacyjny: PC-DOS/M5-DOs (D) Oprogramowanie: Patentln Release #1.0, Version #1.25 (vi) Dane dotyczące niniejszego zgłoszenia:
(A) Numer zgłoszenia (B) Data złożenia:
(vii) Dane dotyczące zgłoszenia poprzedzającego:
(A) Numer zgłoszenia: AU P06223 (B) Data złożenia: 15 kwietnia 1997 (vii) Dane dotyczące zgłoszenia poprzedzającego:
(A) Numer zgłoszenia: AU P06223 (B) Data złożenia: 15 kwietnia 1997 (vii) Dane dotyczące zgłoszenia poprzedzającego:
(A) Numer zgłoszenia: US 60/043706 (B) Data złożenia: 16 kwietnia 1997
PL 194 095B1 (vii) Dane dotyczące zgłoszenia poprzedzającego:
(A) Numer zgłoszenia: US 60/050403 (B) Data złożenia: 20 czerwca 1997 (viii) Dane dotyczące rzecznika patentowego:
(A) Nazwisko : Dr E.John L. Hughes (C) Numer sprawy/akt: MRO/EJH/JMC (ix) Informacje dotyczące telekomunikacji:
(A) Telefon: +61 3 9Z54 2777 (B) Telefax; +6z 3 9254 2770 CC) TELEX: AA 31787 (2) Informacja dotycząca sekwencji SEQ ID N0:l (i) Charakterystyka sekwencji::
(A) Długość: 1358 par zasad (B) TYP: kwas nukleinowy (C) Struktura niciowa: nić pojedyncza (D) Topologia; liniowa (ii) Typ cząsteczki: DNA (ix) Cecha znamienna:
(A) Nazwa/Klucz: CDS (B) Pozycja: 30..1151 <xi) Opis sekwencji : SEQ ID N0:l:
GAGAAGGTTGA CCATAAATCA TTTATCAAC ATG GGT GCC GGC GGT CGT GGT CGG 53
Met Gly Ala Gly Gly Arg Gly Arg 1 5
ACA Thr | TCG Ser 10 | GAA Glu | AAA Lys | TCG GTC | ATG Met 15 | GAA CGT | GTC TCA GTT | GAT Aap | CCA Pro | GTA Val | ACC Thr | 101 | ||||
Ser | Val | Glu | Arg | Val | Ser | Val 20 | ||||||||||
TTC | TCA | CTG | AGT | GAA | TTG | AAG | CAA | GCA | ATC | CCT | CCC | CAT | TGC | TTC | CAG | 149 |
Phe | Ser | Leu | Ser | Glu | Leu | Lys | Gin | Ala | Ile | Pro | Pro | His | Cys | Phe | Gin | |
25 | 30 | 35 | 40 | |||||||||||||
AGA | TCT | GTA | ATC | CGC | TCA | TCT | TAC | TAT | GTT | GTT | CAA | GAT | CTC | ATT | ATT | 197 |
Arg | Ser | Val | Ile | Arg | Ser | Ser | Tyr | Tyr | Val | Val | Gin | Asp | Leu | Ile | Ile | |
45 | 50 | 55 | ||||||||||||||
GCC | TAC | ATC | TTC | TAC | TTC | CTT | GCC | AAC | ACA | TAT | ATC | CCT | ACT | CTT | CCT | 245 |
Ala | Tyr | Ile | Phe | Tyr | Phe | Leu | Ala | Asn | Thr | Tyr | Ile | Pro | Thr | Leu | Pro | |
60 | 65 | 70 | ||||||||||||||
ACT | AGT | CTA | GCC | TAC | TTA | GCT | TGG | CCC | GTT | TAC | TGG | TTC | TGT | CAA | GCT | 293 |
Thx | Ser | Leu | Ala | Tyr | Leu | Ala | Trp | Pro | Val | Tyr | Trp | Phe | Cys | Gin | Ala | |
75 | 80 | 85 | ||||||||||||||
AGC | GTC | CTC | ACT | GGC | TTA | TGG | ATC | CTC | GGC | CAC | GAA | TGT | GGT | CAC | CAT | 341 |
Ser | Val | Leu | Thr | Gly | Leu | Trp | Ile | Leu | Gly | His | Glu | Cys | Gly | His | His | |
90 | 95 | 100 | ||||||||||||||
GCC | TTT | AGC | AGC | TAC | ACA | TGG | TTT | GAC | GAC | ACT | GTG | GGC | TTC | ATC | CTC | 389 |
Ala | Phe | Ser | Asn | Tyr | Thr | Trp | Phe | Asp | Asp | Thr | Val | Gly | Phe | Ile | Leu | |
105 | 110 | 115 | 120 | |||||||||||||
CAC | TCA | TTT | CrC | CTC | ACC | CCG | TAT | TTC | TCT | TGG | JOp | TTC | AGT | CAC | CGG | 437 |
His | Ser | Phe | Leu | Leu | Thr | Pro | Tyr | Phe | Ser | Trp | Lys | Phe | Ser | His | Arg |
□ 125 130 135
PL 194 095B1
AAT | CAC | CAT | TCC | AAC ACA AGT TCG ATT | GAT | AAC | GAT | GAA | GTT | TAC | ATT | 485 | ||||
Asn | His | His | Ser | Asn | Thr | Ser | Ser | Ile | Asp | Asn | Asp | Glu | Val | Tyr | Ile | |
140 | 145 | 150 | ||||||||||||||
CCG | AAA | AGC | AAG | TCC | AAA | CTC | GCG | CGT | ATC | TAT | AAA | CTT | CTT | AAC | AAC | 533 |
Pro | Lys | Ser | Lys | Ser | Lys | Leu | Ala | Arg | Ile | Tyr | Lys | Leu | Leu | Asn | Asn | |
155 | 160 | 165 | ||||||||||||||
CCA | CCT | GGT | CGG | CTG | TTG | GTT | TTG | ATT | ATC | ATG | TTC | ACC | CTA | GGA | TTT | 581 |
Pro | Pro | siy | Arg | Leu | Leu | Val | Leu | Ile | Ile | Met | Phe | Thr | Leu | Gly | Phe | |
170 | 175 | 180 | ||||||||||||||
CCT | TTA | TAC | CTC | TTG | ACA | AAT | ATT | TCC | GGC | AAG | AAA | TAC | GAC | AGG | TTT | 629 |
Pro | Leu | Tyr | Leu | Leu | Thr | Asn | Ile | Ser | Gly | Lys | Lys | Tyr | Asp | Arg | Phe | |
185 | 190 | 195 | 200 | |||||||||||||
GCC | AAC | CAC | TTC | GAC | CCC | ATG | AGT | CCA | ATT | TTC | AAA | GAA | CGT | GAG | CGG | 677 |
Ala | Asn | His | Phe | Asp | Pro | Met | Ser | Pro | Ile | Phe | Lys | Glu | Arg | Glu | Arg | |
205 | 210 | 215 | ||||||||||||||
TTT | CAG | GTC | TTC | CTT | TCG | GAT | CTT | GGT | CTT | CTT | GCC | GTG | TTT | TAT | GGA | 725 |
Phe | Gin | Val | Phe | Leu | Ser | Asp | Leu | Gly | Leu | Leu | Ala | Val | Phe | Tyr | Gly | |
220 | 225 | 230 | ||||||||||||||
ATT | AAA | GTT | GCT | GTA | GGA | AAT | AAA | GGA | GCT | GCT | TGG | GTA | GCG | TGC | ATG | 773 |
Ile | Lys | Val | Ala | Val | Ala | Asn | Lys | Gly | Ala | Ala | Trp | Val | Ala | Cys | Met | |
235 | 240 | 245 | ||||||||||||||
TAT | GGA | GTT | CCG | GTA | TTA | GGC | GTA | TTT | ACC | TTT | TTC | GAT | GTG | ATC | ACC | 821 |
Tyr | Gly | Val | Pro | Val | Leu | Gly | Val | Phe | Thr | Phe | Phe | Asp | Val | Ile | Thr | |
250 | 255 | 260 | ||||||||||||||
TTC | TTG | CAC | CAC | ACC | CAT | CAG | TCG | TCG | CCT | CAT | TAT | GAT | TCA | ACT | GAA | 869 |
Phe | Leu | His | His | Thr | His | Gin | Ser | Ser | Pro | His | Tyr | Asp | Ser | Thr | Glu | |
265 | 270 | 275 | 280 | |||||||||||||
TGG | AAC | TGG | ATC | AGA | GGG | GCC | TTG | TCA | GCA | ATC | GAT | AGG | GAC | TTT | GGA | 917 |
Trp | Asn | Trp | Ile | Arg | Gly | Ala | Leu | Ser | Ala | Ile | Asp | Arg | Asp | Phe | Gly | |
285 | 290 | 295 | TCC | |||||||||||||
CTG | AAT | AGT | GTT | TTC | GAT | GAT | GTT | ACA | CAC | ACT | CAT | GTC | ATG | CAT | 965 | |
Phe | Leu | Asn | Ser | Val | Phe | His | Asp | Val | Thr | His | Thr | His | Val | Met | His | |
300 | 305 | 310 | ||||||||||||||
CAT | TTG | TTT | TCA | TAC | ATT | CCA | CAC | TAT | CAT | GCA | AAG | GAG | GCA | AGG | GAT | 1013 |
His | Leu | Phe | Ser | Tyr | Ile | Pro | His | Tyr | His | Ala | Lys | Glu | Ala | Arg | Asp | |
315 | 320 | 325 | ||||||||||||||
GCA | ATC | AAG | CCA | ATC | TTG | GGC | GAC | TTT | TAT | ATG | ATC | GAC | AGG | ACi | CCA | 1061 |
Ala | Ile | Lys | Pro | Ile | Leu | Gly | Asp | Phe | Tyr | Met | Ile | Asp | Arg | Thr | Pro | |
330 | 335 | 34o | ||||||||||||||
ATT | TTA | AAA | GCA | ATG | TGG | AGA | GAG | GGC | AGG | GAG | TGC | ATG | TAC | ATC | GAG | 1109 |
Ile | Leu | Lys | Ala | Met | Trp | Arg | Glu | dy | Arg | Glu | Cys | Met | Tyr | Ile | Glu | |
345 | 350 | 355 | 360 | |||||||||||||
CCT | GAT | AGC | AAG | CTC | AAA | GGT | GTT | TAT | TGG | TAT | CAT | AAA | TTG | 1151 | ||
Pro | Asp | Ser | Lys | Leu | Lys | Gly | Val | Tyr | Trp | Tyr | His | Lys | Leu |
365 370
TGATCATATG CAAATGCAC ATGCATTTTC AAACCCTCTA GTTACGTTTG TTCTATGTAT 1211
AATAAACCGC | CGCTCCTTTG | GTTGACTATG | CCTAAGCCAG | GCGAAACAGT | TAAATAATAT | 1271 |
CCGTATGATG | TGTAATCAAA | GTATGTGGTT | GTCTGGTTTT | GTTGCTATGA | AAGAAAGTAT | 1331 |
GTGGTTGTCG | GTCAAAAAAA | AAAAAAA | 1358 |
(2) I]Informacja dotytcząca sekwencji SEQ ID N0:2; (i) Charakterystyka sekwencji:
(A) Długość: 374 aminokwasów (B) Tp: aminokwasowa (D) Topologia: liniowa (ii) Typ cząsteczki: białko
PL 194 095B1 (xi) Opis sekwencji: SEQ ID N0:2:
5 | Met 1 Arg | Gly Ala Gly | Gly Arg Gly | ||||
5 | Val | ||||||
Val | Ser | Val 20 | Asp | Pro | |||
10 | Ala | Ile | Pro 35 | Pro | His | Cys | Phe |
Tyr | Val 50 | Val | Gin | Asp | Leu | Ile 55 | |
15 | |||||||
Asn Thr 65 | Tyr | Ile | Pro | Thr 70 | Leu | ||
20 | |||||||
Pro | Val | Tyr | Trp | Phe 85 | Cys | Gin | |
25 | Leu | Gly | His | Glu 100 | Cys | Gly | His |
30 | Asp | Asp | Thr 115 | Val | Gly | Phe | Ile |
Phe | Ser 130 | Trp | Lys | Phe | Ser | His 135 | |
35 | |||||||
Ile 145 | Asp | Asn | Asp | Glu | Val 150 | Tyr | |
40 | Arg | Ile | Tyr | Lys | Leu 165 | Leu | Asn |
45 | Ile | Ile | Met | Phe 180 | Thr | Leu | Gly |
Ser | Gly | Lys 195 | Lys | Tyr | Asp | Arg | |
50 | |||||||
Pro | Ile 210 | Phe | Lys | Glu | Arg | Glu 215 | |
55 | Gly 225 | Leu | Leu | Ala | Val | Phe 230 | Tyr |
60 | Gly | Ala | Ala | Trp | Val 245 | Ala | Cys |
Arg Thr Ser Glu Lys Ser Val Met Glu 10 15
Thr Phe Ser Leu Ser Glu Leu lys Gin 25 30
Gin Arg Ser Val Ile Arg Ser Ser Tyr 40 45
Ile Ala Tyr Ile Phe Tyr Phe Leu Ala 60
Pro Thr Ser Leu Ala Tyr Leu Ala Trp 75 80
Ala Ser Val Leu Thr Gly Leu Trp Ile 90 95
His Ala Phe Ser Asn Tyr Thr Trp Phe 105 110
Leu His Ser Phe Leu Leu Thr Pro Tyr 120 125
Arg Asn His His Ser Asn Thr Ser Ser 140
Ile Pro Lys Ser Lys Ser Lys Leu Ala 155 160
Asn Pro Pro Gly Arg Leu Leu Val Leu 170 175
Phe Pro Leu Tyr Leu Leu Thr Asn Ile 185 190
Phe Ala Asn His Phe Asp Pro Met Ser 200 205
Arg Phe Gin Val Phe Leu Ser Asp Leu 220
Gly Ile Lys Val Ala Val Ala Asn Lys 235 240
Met Tyr Gly Val Pro Val Leu Gly Val 250 255
PL 194 095B1
Phe | Thr | Phe | Phe 260 | Asp | Val | Ile | Thr | Phe 265 | Leu | His | His | Thr | His 270 | Gin | Ser |
Ser | Pro | His 275 | Tyr | Asp | Ser | Thr | Glu 280 | Trp | Asn | Trp | Ile | Arg 285 | Gly | Ala | Leu |
Ser | Ala 290 | Ile | Asp | Arg | Asp | Phe 295 | Gly | Phe | Leu | Asn | Ser 300 | Val | Phe | His | Asp |
Val 305 | Thr | His | THr | His | Val 310 | Met | His | His | Leu | Phe 315 | Ser | Tyr | Ile | Pro | His 320 |
Tyr | His | Ala | Lys 325 | Glu | Ala | Arg | Asp | Ala | Ile 330 | Lys | Pro | Ile | Leu | Gly Asp 335 | |
Phe | Tyr | Met | Ile 340 | Asp | Arg | Thr | Pro | Ile 345 | Leu | Lys | Ala | Met | Trp 350 | Arg | Glu |
Gly | Arg | Glu 355 | Cys | Met | Tyr | Ile | Glu 360 | Pro | Asp | Ser | Lys | Leu 365 | Lys | Gly | Val |
Tyr | Trp 370 | Tyr | His | Lys | Leu |
(2) | Informacja dotycząca SEQ ID | NO: | 3: | ||||||||
(i) | Charakterystyka sekwencji | ||||||||||
(A) | Długość: 1312 par zasad | ||||||||||
(B) | Typ: kwas nukleinowy | ||||||||||
(D) | Topologia: liniowa | ||||||||||
(ii) | Typ cząsteczki: cDNA | ||||||||||
(iii) | Źródło pierwotne: Crepis sp, | ||||||||||
(ix) | Cexcha znamienna: | ||||||||||
(A) | Nazwa/Klucz: CDS | ||||||||||
(B) | Pozycja: 26 1147 | ||||||||||
(xi) | Opis sekwencji: SEQ | ID NO:3: | |||||||||
TGTTGACCAT AAATCATCTA TCAAC ATG | GGT | GCC | GGC | GGC | CGT | GGT | CGG | ACA | 52 | ||
Met | Gly | Ala | Gly | Gly | Arg | Gly | Arg | Thr | |||
TCG | GAA AAG | TCG GTC ATG GAA CGT | GTC | TCA | GTT | GAT | CCA | GTA | ACC | TTC | 100 |
Ser | Glu Lys | Ser Val Met Glu Arg | Val | Ser | Val | Asp | Pro | Val | Thr | Phe | |
10 | 15 | 20 | 25 | ||||||||
TCA | CTG AGT | GAT TTG AAG CAA GCA | ATC | CCT | CCA | CAT | TGC | TTC | CAG | CGA | 148 |
Ser | Leu Ser | Asp Leu Lys Gin Ala | Ile | Pro | Pro | His | Cys | Phe | Gin | Arg | |
30 | 35 | 40 | |||||||||
TCT | GTC ATC | CGT TCA TCT TAT TAC | GTP | GTT | CAG | GAT | CTC | ATA | ATT | GCC | 196 |
Ser | Val Ile | Arg Ser Ser Tyr Tyr | Val | Val | Gin | Asp | Leu | Ile | Ile | Ala | |
45 | 50 | 55 | |||||||||
TAC | ATC TTC | TAC TTC CTi GCC AAC | ACA | TAT | ATC | CCT | AAT | CTC | Ccd’ | CAT | 244 |
Tyr | Ile Phe | Tyr Phe Leu Ala Asn | Thr | Tyr | Ile | Pro | Asn | Leu | Pro | His | |
60 | 65 | 70 | |||||||||
CCT | CTA GCC | TAC TTA GCT TGG CCG | CTT | TAC | TGG | TTC | TGT | CAA | GCT | AGC | 292 |
Pro | Leu Ala | Tyr Leu Ala Trp Pro | Leu | Tyr | Trp | Phe | Cys | Gin | Ala | Ser |
PL 194 095B1
80 85
GTC Val 90 | CTC Leu | ACT Thr | GGG Gly | TTA Leu | TGG ATC CTC | GGC Gly | CAT His | GAA Glu 100 | TGT Cys | GGT Gly | CAC Hi5 | CAT His | GCC Ala | 340 | ||
Trp 95 | Ile | Leu | ||||||||||||||
TAT | AGC | AAC | TAC | ACA | TGG | GTT | GAC | GAC | ACT | GTG | GGC | TTC | ATC | ATC | CAT | 388 |
Tyr | Ser | Asn | Tyr | Thr 110 | Trp | Val | Asp | Asp | Thr Val 115 | Gly | Phe | Ile | Ile 120 | His | ||
TCA | TTT | CTC | CTC | ACC | CCG | TAT | TTC | TCT | TGG | AAA | TAC | AGT | CAC | CGG | AAT | 436 |
Ser | Phe | Leu | Leu 125 | Thr | Pro | Tyr | Phe | Ser 130 | Trp | Lys | Tyr | Ser | His 135 | Arg | Asn | |
CAC | CAT | TCC | AAC | ACA | AGT | TCG | ATT | GAT | AAC | GAT | GAA | GTT | TAC | ATT | CCG | 484 |
His | His | Ser 140 | Asn | Thr | Ser | Ser | Ile 145 | Asp | Asn | Asp | Glu | Val 150 | Tyr | Ile | Pro |
AAA | AGC | AAG | TCC | AAA | CTC | AAG | CGT | ATC | TAT | AAA | CTT | CTT | AAC | AAC | CCA | 532 |
Lys | Ser | Lys | Ser | Lys | Leu | Lys | Arg | Ile | Tyr | Lys | Leu | Leu | Asn | Asn | Pro | |
155 | 160 | 165 |
CCT Pro 170 | GGT Gly | CGA Arg | CTG Leu | TTG Leu | GTT Val 175 | TTG GTT | ATC ATG | TTC ACC Phe Thr 180 | CTA Leu | GGA Gly | TTT Phe | CCT Pro 185 | 5B0 | |||
Leu | Val | Ile | Met | |||||||||||||
TTA | TAC | CTC | TTG | ACA | AAT | AAT | TCC | GGC | AAG | AAA | TAC | GAT | AGG | TTT | GCC | 628 |
Leu | Tyr | Leu | Leu | Thr | Asn | Ile | Ser | Gly | Lys | Lys | Tyr | Asp | Arg | Phe | Ala | |
190 | 1 | 195 | 200 | |||||||||||||
AAC | CAC | TTC | GAC | CCC | ATG | AGT | CCA | ATT | TTC | AAA | GAA | CGT | GAG | CGG | TTT | 676 |
Asn | His | Phe | Asp | Pro | Met | Ser | Pro | Ile | Phe | Lys | Glu | Arg | Glu | Arg | Phe | |
205 | 210 | 215 | ||||||||||||||
CAG | GTC | TTC | CTT | TCG | GAT | CTT | GGT | CTT | CTT | GCT | GTG | TTT | TAT | GGA | ATT | 724 |
Gin | Val | Phe | Leu | Ser | Asp | Leu | Gly | Leu | Leu | Ala | Val | Phe | Tyr | Gly | Ile | |
220 | 225 | 230 | ||||||||||||||
AAA | GTT | GCT | GTA | GCA | AAT | AAA | GGA | GCT | GCT | TGG | GTG | GCG | TGC | ATG | TAT | 772 |
Lys | Val | Ala | Val | Ala | Asn | Lys | Gly | Ala | Ala | Trp | Val | Ala | Cys | Met | Tyr | |
235 | 240 | 245 | ||||||||||||||
GGA | GTT | CCG | GTG | CTA | GGC | GTA | TTT | ACC | TTT | TTC | GAT | GTG | ATC | ACG | TTC | 820 |
Gly | Val | Pro | Val | Leu | Gly | Val | Phe | Thr | Phe | Phe | Aep | Val | Ile | Thr | Phe | |
250 | 255 | 260 | 265 | |||||||||||||
TTA | CAC | CAC | ACC | CAT | CAG | TCG | TCG | CCT | CAT | TAT | GAT | TCA | ACT | GAA | TGG | 868 |
Leu | His | His | Thr | His | Gin | Ser | Ser | Pro | His | Tyr | Asp | Ser | Thr | Glu | Trp | |
Z70 | 275 | 280 | ||||||||||||||
AAC | TGC | ATC | AGA | GCG | GCT | TTG | TCA | GCT | ATC | GAT | AGN | GAC | TTT | GGG | TTC | 916 |
Asn | Trp | Ile | Arg | Gly | Ala | Leu | Ser | Ala | Ile | Asp | Arg | Asp | Phe | Gly | Phe | |
285 | 290 | 295 |
CTG | AAT | AGT | GTT | TTC | CAT | GAT | GTN | ACA | CAC | ACT | CAC | GTC | ATG | CAT | CAT | 969 |
Leu | Asn | Ser | Val | Phe | His | Asp | Val | Thr | His | Thr | His | Val | Met | His | His |
300 305 310
PL 194 095B1
TTG Leu | TTT TCA TAC | ATT Ile | CCA Pro | CAC His 320 | TAT CAT | GCA AAG Ala Lys | GAA GCA AGG | GAT Asp | GCA Ala | 1012 | ||||||
Phe 315 | Ser | Tyr | Tyr | His | Glu 325 | Aln | Arg | |||||||||
ATC | AAA | CCG | ATC | TTG | GGC | GAC | TTT | TAT | ATG | ATC | GAT | AGG | ACT | CCA | ATT | 1060 |
Ile | Lys | Pro | Ile | Leu | Gly | Asp | Phe | Tyr | Met | Ile | Asp | Arg | Thr | Pro | Ile | |
330 | 338 | 340 | 345 | |||||||||||||
TTA | AAA | GCA | ATG | TGG | AGA | GAG | GGC | AGG | GAA | TGC | ATC | TAC | ATC | GAG | CCT | 1108 |
Leu | Lys | Ala | Met | Trp | Arg | Glu | Gly | Arg | Glu | Cys | Met | Tyr | Ile | Glu | Pro | |
350 | 355 | 360 | ||||||||||||||
GAT | AGC | AAG | CTC | AAA | GGT | GTT | TAT | TGG | TAT | CAT | AAA | TTG | TGATCATATG | 1157 | ||
Asp | Ser | Lys | Leu | Lys | Gly | Val | Tyr | Trp | Tyr | His | Lys | Leu |
365 370
CAAAATGCAC | ATGCATTTTC | AAACCCTCTA | GTTACCTTTG | TTCTATGTAT | AATAAGACCG | 1217 |
CCGGTCCTAT | GGTTTTCTAT | GCCTAAGCCA | GGCGAAATAG | TTAAATAATA | TCDGTATGAT | 1277 |
GTAATGAAAG | TATGTGGTTG | TCTAAAAAAA | AAAAA | 1312 |
(2) Informacja dotycząca SEQ ID NO:4:
(i) Charakterystyka sekwencji:
(A) Długość: 374 aminokwasów (B) Typ: aminokwasowa (D) Topologia: liniowa (ii) Typ cząsteczki: białko (xi) Opis sekwencji: SEQ ID NO: 4
Met Gly Ala Gly Gly Arg Gly Arg Thr Ser Glu Lys Ser Val Met Glu I 5 10 15
Arg Val Ser Val Asp Pro Val Thr Phe Ser Leu Ser Asp Leu Lys Gin 20 25 30
Ma Ile Pro Pro His Cys Phe Gin Arg Ser Val Ile Arg Ser Ser Tyr 35 40 45
Tyr Val Val Gin Asp Leu Ile Ile Ala Tyr Ile Phe Tyr Phe Leu Ala 50 55 60
Asn Thr Tyr Ile Pro Asn Leu Pro His Pro Leu Ala Tyr Leu Ala Trp
70 75 60
Pro Leu Tyr Trp Phe Cys Gin Ala Ser Val Leu Thr Gly Leu Trp Ile
90 95
Leu Gly His Glu Cys Gly His His Ala Tyr Ser Asn Tyr Thr Trp Val 100 105 110
Asp Asp Thr Val Gly Phe Ile Ile His Ser Phe Leu Leu Thr Pro Tyr 115 120 125
PL 194 095B1
Phe | Ser 130 | Trp Lys | Tyr | Ser | His 135 | Arg Asn | His | His | Ser 140 | Asn | Thr | Ser | Ser | ||
Ile | Asp | Asn | Asp | Glu | Val | Tyr | Ile | Pro | Lys | Ser | Lys | Ser | Lys | Leu | Lys |
145 | 150 | 155 | 160 | ||||||||||||
Arg | Ile | Tyr | Lys | Leu | Leu | Asn | Asn | Pro | Pro | Gly | Arg | Leu | Leu | Val | Leu |
165 | 170 | 175 | |||||||||||||
Val | Ile | Met | Phe | Thr | Leu | Gly | Phe | Pro | Leu | Tyr | Leu | Leu | Thr | Asn | Ile |
180 | 185 | 190 | |||||||||||||
Ser | Gly | Lys | Lys | Tyr | Asp | Arg | Phe | Ala | Asn | His | Phe | Asp | Pro | Met | Ser |
195 | 200 | 205 | |||||||||||||
Pro | Ile | Phe | Lys | Glu | Arg | Glu | Arg | Phe | Gin | Val | Phe | Leu | Ser | Asp | Leu |
210 | 215 | 2Z0 | |||||||||||||
Gly | Leu | Leu | Ala | Val | Phe | Tyr | Gly | Ile | Lys | Val | Ala | Val | Ala | Asn | Lys |
225 | 230 | 235 | 240 | ||||||||||||
Gly | Ala | Ala | Trp | Val | Ala | Cys | Met | Tyr | Gly | Val | Pro | Val | Leu | Gly | Val |
245 | 250 | 25S | |||||||||||||
Phe | Thr | Phe | Phe | Asp | Val | Ile | Thr | Phe | Leu | His | His | Thr | His | Gin | Ser |
260 | 265 | 270 | |||||||||||||
Ser | Pro | His | Tyr | Asp | Ser | Thr | Giy | Trp | Asn | Trp | Ile | Arg | Gly | Ala | Leu |
275 | 280 | 285 | |||||||||||||
Ser | Aia | Ile | Asp | Arg | Asp | Phe | Gly | Phe | Leu | Asn | Ser | Val | Phe | His | Asp |
290 | 295 | 300 | |||||||||||||
Val | Thr | His | Thr | His | Val | Met | His | His | Leu | Phe | Ser | Tyr | Ile | Pro | His |
305 | 310 | 315 | 320 | ||||||||||||
Tyr | His | Ala | Lys | Glu | Ala | Arg | Asp | Ala | Ile | Lys | Pro | Ile | Leu | Gly | Asp |
325 | 330 | 335 | |||||||||||||
Phe | Tyr | Met | Ile | Asp | Arg | Thr | Pro | Ile | Leu | Lys | Ala | Met | Trp | Arg | Glu |
340 | 345 | 350 | |||||||||||||
Gly | Arg | Glu | Cys | Met | Tyr | Ile | Glu | Pro | Asp | Ser | Lys | Leu | Lys | Gly | Val |
355 | 360 | 365 | |||||||||||||
Tyr | Trp | Tyr | His | Lys | Leu |
370 (2) Informacja dotycząca SEQ ID NO:5:
(i) Charakterystyka sekwencji:
(A) Długość : 55o par zasad (B) Typ: kwas nukleinowy (C) Struktura niciowa: nić pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: cDNA (vi) Źródło pierwotne: Vernonia galamenzis
PL 194 095B1 (A) Organizm: Vernonia galamensis (ix) Cecha znamienna:
(A) Nazwa/Klucz: CDS (B) Pozycja: 1..549 (xi) Opis sekwencji: SEQ ID N0:5:
CAT His 1 | CAC His | GCC Ala | TTC Phe | AGT Ser 5 | GAC Asp | TAT Tyr | CAA Gin | TGG ATA | GAC Asp | GAC Asp | ACT Thr | GTG Val | GGC Gly 15 | TTC Phe | 48 | |
Trp | Ile 10 | |||||||||||||||
ATC | CTT | CAC | TTT | GCA | CTC | TTC | ACC | CCT | TAT | TTC | TCT | TGG | AAA | TAC | ACT | 96 |
Ile | Leu | His | Phe 20 | Ala | Leu | Phe | Tyr | Pro 25 | Tyr | Phe | Ser | Trp | Lys 30 | Tyr | Ser | |
CAC | CGT | AAT | CAC | CAT | GCC | AAC | ACA | AAC | TCT | CTT | GTA | ACC | GAT | GAA | GTA | 144 |
His | Arg | Asn 35 | His | His | Ala | Asn | Thr 40 | Asn | Ser | Leu | Val | Thr 45 | Asp | Glu | Val | |
TAC | ATC | CCT | AAA | GTT | AAA | TCC | AAG | GTC | AAG | ATT | TAT | TCC | AAA | ATC | CTT | 192 |
Tyr | Ile 50 | Pro | Lys | Val | Lys | Ser 55 | Lys | Val | Lys | Ile | Tyr 60 | Ser | Lys | Ile | Leu | |
AAC | AAC | CCT | CCT | GGT | CGC | GTT | TTC | ACC | TTG | GCT | TTC | AGA | TTG | ATC | GTG | 240 |
Asn 65 | Asn | Pro | Pro | Gly | Arg 70 | Val | Phe | Thr | Leu | Ala 75 | Phe | Arg | Leu | Ile | Val 80 | |
GGT | TTT | CCT | TTA | TAC | CTT | TTC | ACC | AAT | GTT | TCA | GGC | AAG | AAA | TAC | GAA | 288 |
Gly | Phe | Pro | Leu | Tyr 85 | Leu | Phe | Thr | Asn | Val 90 | Ser | Gly | Lys | Lys | Tyr 95 | Glu | |
CGT | TTT | GCC | AAC | CAT | TTT | GAT | CCC | ATG | AGT | CCC | ATT | TTC | ACC | GAG | CGT | 335 |
Arg | Phe | Ala | Asn 100 | His | Phe | Asp | Pro | Met 105 | Ser | Pro | Ile | Phe | Thr 110 | Glu | Arg | |
GAG | CAT | GTA | CAA | GTC | TTG | CTT | TCT | GAT | TTT | GGT | CTC | ATA | GCA | GTT | GCT | 384 |
Glu | His | Val 115 | Gin | Val | Leu | Leu | Ser 120 | Asp | Phe | Gly | Leu | Ile 125 | Ala | Val | Ala | |
TAC | GTG | GTT | CGT | CAA | GCT | GTA | CTG | GCT | AAA | GGA | GGA | GCT | TGG | GTG | ATG | 432 |
Tyr | Val 130 | Val | Arg | Gin | Ala | Val 135 | Leu | Ala | Lys | Gly | Gly 140 | Ala | Trp | Val | Met | |
TGC | ATT | TAC | GGA | GTT | CCT | GTG | CTG | GCC | GTA | AAC | GCA | TTC | TTT | GTT | TTA | 480 |
Cys | Ile | Tyr | Gly | Val | Pro | Val | Leu | Ala | Val | Asn | Ala | Phe | Phe | Val | Leu |
145 150 155 160
ATC ACT TAT CTT CAC CAC ACG CAT CTC TCA CTG CCC CAC TAT GAT AGC 528 Ile Thr Tyr Leu His His Thr His Leu Ser Leu Pro His Tyr Asp Ser
165 170 175
TCA GAA TGG GAC TCG CTA CGA G 550
Ser Glu Trp Asp Trp Leu Arg
180 (2) Informacja dotycząca SEQ ID NO:6 (i) Charakterystyka sekwencji
PL 194 095B1 (A) Długość: 183 aminokwasów (B) Typ: aminokwasowa □ (D) Topologia: liniowa (ii) Typ cząsteczki: białko (xi) Opis sekwencji: SEQ ID NO:D6
His 1 | His | Ala | Phe | Ser 5 | Asp | Tyr | Gin | Trp | Ile Asp 10 | Asp | Thr | Val | Gly 15 | Phe |
Ile | Leu | His | Phe | Ala | Leu | Phr | Thr | Pro | Tyr Phe | Ser | Trp | Lys | Yyr | Ser |
20 | 25 | 30 | ||||||||||||
His | Arg | Asn | His | His | Ala | Asn | Thr | Asn | Ser Leu | Val | Thr | Asp | Glu | Val |
35 | 40 | 45 | ||||||||||||
Tyr | Ile | Pro | Lys | Val | Lys | Ser | Lys | Val | Lys Ile | Tyr | Ser | Lys | Ile | Leu |
50 | 55 | 60 | ||||||||||||
Asn | Asn | Pro | Pro | Gly | Arg | Val | The | Thr | Leu Ala | Phe | Arg | Leu | Ile | Val |
65 | 70 | 75 | 80 | |||||||||||
Gly | Phe | Pro | Leu | Tyr | Leu | Phe | Thr | Asn | Val Ser | Gly | Lys | Lys | Tyr | Glu |
85 | 90 | 95 | ||||||||||||
Arg | Phe | Ala | Asn | His | Phe | Asp | Pro | Met | Ser Pro | Ile | Phe | Thr | Glu | Arg |
100 | 105 | 110 | ||||||||||||
Glu | His | Val | Gin | Val | Leu | Leu | Ser | Asp | Phe Gly | Leu | Ile | Ala | Val | Ala |
115 | 120 | 125 | ||||||||||||
Tyr | Val | Val | Arg | Gin | Ala | Val | Leu | Ala | Lys Gly | Gly | Ala | Trp | Val | Met |
130 | 135 | 140 | ||||||||||||
Cys | Ile | Tyr | Gly | Val | Pro | Val | Leu | Ala | Val Asn | Ala | Phe | Phe | Val | Leu |
145 | 150 | 155 | 160 | |||||||||||
Ile | Thr | Tyr | Leu | His | His | Thr | His | Leu | Ser Leu | Tro | His | Tyr | Asp | Ser |
165 | 170 | 175 | ||||||||||||
Ser | Glu | Trp | Asp | Trp | Leu | Arg |
180 (2) Informacja dotycząca SEQ ID NO:7:
(i) Charakterystyka sekwencji:
(A) Długość: 177 par zasad (B) Typ: kwas nukleinowy (C) Struktura niciowa: nić pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: cDNA (vi) Źródło pierwotne::
(A) Organizm; Crepis alpina
PL 194 095B1 (ix) Cecha znamienna:
(A) Nazwa/Klucz: CDS (B) Pozycja: 1..177 (xi) Opis sekwencji: SEQ ID NO:7
GAA TGC | GGT Gly | CAC His | CAT His 5 | GCC TTC | AGC Ser | GAC Asp | TAC Tyr 10 | CAG TGG GTT | GAC GAC AAT | 48 | ||||||
Glu 1 | Cys | Ala | Phe | Gin | Trp | Val | Asp | Asp 15 | Asn | |||||||
GTG | GGC | TTC | ATC | CTC | CAC | TCG | TTT | CTC | ATG | ACC | CCG | TAT | TTC | TCC | TGG | 96 |
Val | Gly | Phe | Ile | Leu | His | Ser | Phe | Leu | Met | Thr | Pro | Tyr | Phe | Ser | Trp | |
20 | 25 | 30 | ||||||||||||||
AAA | TAC | ACC | CAC | CGG | AAC | CAC | CAT | GCC | AAC | ACA | AAT | TCG | CTT | GAC | AAC | |
Lys | Tyr | Ser | His | Arg | Asn | His | His | Ala | Asn | Thr | Asn | Ser | Leu | Asp | Asn | |
35 | 40 | 45 | ||||||||||||||
GAT | GAA | GTT | TAC | ATC | CCC | AAA | AGC | AAG | GCC | AAA | 177 | |||||
Asp | Glu | Val | Tyr | Ile | Pro | Lys | Ser | Lys | Ala | Lys | ||||||
50 | 55 |
(2) Informacja dotycząca SEQ ID NO:8 (i) charakterystyka sekwencji:
(A) Długość: 59 aminokwasów (B) Typ: aminokwasowa (D) Topologia: liniowa (ii) Typ cząsteczki: białko (xi) Opis sekwencji: SEQ ID NO:8:
Glu | Cys | Gly | His | His | Ala | Phe | Ser | Asp | Tyr | Gin | Trp Val Asp Asp Asn | |
1 | 5 | 10 | 15 | |||||||||
Val | Gly | Phe | Ile | Leu | His | Sr : | Phe : | Leu Met Thr ' | Pro Tyr Phe | Ser Trp | ||
20 | 25 | 30 | ||||||||||
Lys | Tyr | Ser | His | Arg | Asn | His | His | Ala | Asn | Thr | Asn Ser Leu | Asp Asn |
35 | 40 | 45 | ||||||||||
Asp | Glu | Val | Tyr | Ile | Pro | Lys | Ser | Lys | Ala | Lys | ||
50 | 55 |
(2) Informacja dotycząca SEQ ID NO:9:
(i) Charakterystyka sekwencji:
(A) Długość: 383 aminokwasów (B) Typ: aminokwasowa (C) Struktura niciowa: nić pojedyncza (D) Topologia: liniowa
PL 194 095B1 (ii) Typ cząsteczki: białko (vi) Źródło pierwotne:
(A) Organicm: Arabidopsis thaliana
(xi) | Opis | sekwencji: | SEQ | ID N0:9: | |
Met 1 | Gly Ala | Gly | Gly Arg Met 5 | Pro 10 | Val Pro Thr Ser Ser Lys Lys Ser 15 |
Glu | Thr Asp | Thr 20 | Thr Lys Arg | Val | Pro Cys Glu Lys Pro Pro Phe 5er 25 30 |
Val | Gly Asp 35 | Leu | Lys Lys Ala | Ile 40 | Pro Pro His Cys Phe Lys Arg Ser 45 |
Ile | Pro Arg 50 | Ser | Phe Ser Tyr 55 | Leu | Ile Ser Asp Ile Ile Ile Ala Ser 60 |
Cys 65 | Phe Tyr | Tyr | Val Ala Thr 70 | Asn | Tyr Phe Ser Leu Leu Pro Gin Pro 75 80 |
Leu | Ser Tyr | Leu | Ala Trp Pro 85 | Leu | Tyr Trp Ala Cys Gin Gly Cys Val 90 95 |
Leu | Thr Gly | Ile 100 | Trp Val Ile | Ala | His Glu Cys Gly His His Ala Phe 105 110 |
Ser | Asp Tyr 115 | Gin | Trp Leu Asp | Asp 120 | Thr Val Gly Leu Ile Phe His Ser 125 |
Phe | Leu Leu 130 | Val | Pro Tyr Phe 135 | Ser | Trp Lys Tyr Ser His Arg Arg His 140 |
His | Ser Asn | Thr | Gly Ser Leu 150 | Glu | Arg Asp Glu Val Phe Val Pro Lys 155 160 |
Gin | Lys Ser | Ala | Ile Lys Trp 165 | Tyr | Gly Lys Tyr Leu Asn Asn Pro Leu 170 275 |
Gly | Arg Ile | Met | Met Leu Thr 180 | Val | Gin Phe Val Leu Gly Trp Pro Leu 185 190 |
Tyr | Leu Ala 195 | Phe | Asn Val Ser | Gly Arg Pro Tyr Asp GlyDPhe Ala Cys 200 205 | |
His | Phe Phe 210 | Pro | Asn Ala Pro 215 | Ile | Tyr Asn Asp Arg Glu Arg Leu Gin 220 |
Ile 225 | Tyr Leu | Ser | Asp Ala Gly 230 | Ile | Leu Aln Val Cys Phe Gly Leu Tyr 235 240 |
Arg | Tyr Ala | Ala | Ala Gin Gly 245 | Met | Ala Ser Met Ile Cys Leu Tyr Gly 250 255 |
Val | Pro Leu | Leu 260 | Ile Val Asn | Ala | Phe Leu Val Leu Ile Thr Tyr Leu 265 270 |
Gin | His Thr | His | Pro Ser Leu | Pro | His Tyr Asp Ser Ser Glu Trp Asp |
PL 194 095B1
275 | 280 | 285 | |
Trp Leu | Arg Gly Ala Leu Ala | Thr Val Asp Arg Asp | Tyr Gly Ile Leu |
290 | 295 | 300 | |
Asn Lys | Val Phe HiS Asn Ile | Thr Asp Thr His Val | Ala His His Leu |
305 | 310 | 315 | 320 |
Phe Ser | Thr Met Pro His Tyr | Asn Ala Met Glu Ala | Thr Lys Ala Ile |
325 | 330 | 335 | |
Lys Pro | Ile Leu Gly Asp Tyr | Tyr Gin Phe Asp Gly | Thr Pro Trp Tyr |
340 | 345 | 350 | |
Val Ala | Met Tyr Arg Glu Ala | Lys Glu Cys Ile Tyr | Val Glu Pro Asp |
355 | 360 | 365 | |
Arg Glu | Gly Acp Lys Lys Gly | Val Tyr Trp Tyr Asn | Asn Lys Leu |
370 | 375 | 380 | |
(2) Informacja dotycząca ; | SEQ ID NO:10: |
(i) Charakterystyka sekwencji
□ | (A) (B) (C) (D) | Długość: 384 aminokwasów Typ: aminokwasowa Sruktura niciowa: nić pojedyncza Topologia: liniowa |
(ii) ‘ (vi) : (A) (xi) < | Typ cząsteczki: białko Źrodło pierwotne: Organizm: Brassica juncea Opis sekwencji: SEQ ID NO:10: | |
Met Gly 1 | Ala | Gly Gly Arg Met Gin Val Ser Pro Ser Pro Lys Lys Ser 5 10 5 |
Glu Thr | Asp | Thr Leu Lys Arg Val Pro Cys Glu Thr Pro Pro Phe Thr 20 25 30 |
Val Gly | Glu 35 | Leu Lys Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser 40 45 |
Ile Pro 50 | Arg | Sar Phe Ser Tyr Leu Ile Trp Asp Ile Ile Val Ala Ser 55 60 |
Cys Phe 65 | Tyr | Tyr Val Ala Thr Thr Tyr Phe Pro Leu Leu Pro His Pro 70 75 80 |
Leu Ser | Tyr | Val Ala Trp Pro Leu Tyr Trp Ala Cys Gin Gly Val Val 85 90 95 |
Leu Thr | Gly | Val Trp Val Ile Ala His Glu Cys Gly His His Ala Phe 100 105 110 |
Ser Asp | Tyr 115 | Gin Trp Leu Asp Asp Thr Val Gly Leu Ile Phe His Ser 120 125 |
PL 194 095B1
Phe | Leu 130 | Leu | Val | Pro | Tyr | Phe 135 | Ser | Trp | Lys | Tyr | Ser 140 | His | Arg | Arg | His |
His 145 □ Lys | Ser | Asn | Thr | Gly | Ser 150 | Leu | Glu | Arg | Asp | Glu 155 | Val | Phe | Val | Pro | Lys 160 |
Lys | Ser | Asp | Ile 165 | Lys | Trp | Tyr | Gly | Lys 170 | Tyr | Leu | Asn | Asn | Pro 175 | Leu | |
Gly □ | Arg | Thr | Val 180 | Met | Leu | Thr | Val | Gin 185 | Phe | Thr | Leu | Gly | Trp 190 | Pro | Leu |
Tyr | Trp | Ala 195 | Phe | Asn | Val | Ser | Gly 200 | Arg | Pro | Tyr | Pro | Glu 205 | Gly | Phe | Ala |
Cys | His 210 | Phe | His | Pro | Asn | Ala | Pro 215 | Ile | Tyr | Asn | Asp 220 | Arg | Glu | Arg | Leu |
Gin 225 | Ile | Tyr | Val | Ser | Asp 230 | Ala | Gly | Ile | Leu | Ala 235 | Val | Cys | Tyr | Gly | Leu 240 |
Tyr | Arg | Tyr | Ala | Ala 245 | Ala | Gin | Gly | Val | Ala 250 | Ser | Met | Val | Cys | Leu 255 | Tyr |
Gly | Val | Pro | Leu 260 | Leu | Ile | Val | Asn | Ala 2 65 | Phe | Leu | Val | Leu | Ile 270 | Thr | Tyr |
Leu | Gin | His 275 | Thr | His | Pro | Ser | Leu 280 | Pro | His | Tyr | Asp | Ser 285 | Ser | Glu | Trp |
Asp | Trp 290 | Leu | Arg | Gly | Ala | Leu 295 | Ala | Thr | Val | Asp | Arg 300 | Asp | Tyr | Gly | Ile |
Leu 305 | Asn | Lys | Val | Phe | His 310 | Asn | Ile | Thr | Asp | Thr 315 | His | Val | Ala | His | His 320 |
Leu | Phe | Ser | Thr | Met 325 | Pro | His | Tyr | His | Ala 330 | Met | Glu | Val | Thr | Lys 335 | Ala |
Ile | Lys | Pro | Ile 340 | Leu | Gly | Asp | Tyr 345 | Tyr | Gin | Phe | Asp | Gly | Thr 350 | Pro | Trp |
Val | Lys | Ala 355 | Met | Trp | Arg | Glu | Ala 360 | Lys | Glu | Cys | Ile | Tyr 365 | Val | Glu | Pro |
Asp | Arg | Gin | Gly | Glu | Lys | Lys | Gly | Val | Phe | Trp | Tyr | Asn | Asn | Lys | Leu |
370 375 380 (a) Informacja dotycząca SEQ ID NO:11:
(i) Charakterystyka sekwencji:
(A) Długość: 383 aminokwasy (B) Typ: aminokwasowa (C) Struktura niciowa: nić pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: białko (vi) Źródło pierwotne:
PL 194 095B1 (A) Organizm: Glycine max
(xi) Opis sekwencji: SEQ ID NO:11: | |||||||||||||||
Met | Gly | Ala | Gly | Gly | Arg | Thr | Asp | Val | Pro | Pro | Ala | Asn | Arg | Lys | Ser |
1 | 5 | 10 | 15 | ||||||||||||
Glu | Val | Asp | Pro | Leu | Lys | Arg | Val | Pro | Phe | Glu | Lys | Pro | Gin | The | Ser |
20 | 25 | 30 | |||||||||||||
Leu | Ser | Gin | Ile | Lys | Lys | Ala | Ile | Pro | Pro | His | Cys | Phe | Gin | Arg | Ser |
35 | 40 | 45 | |||||||||||||
Val | Leu | Arg | Ser | Phe | Ser | Tyr | Val | Val | Tyr | Asp | Leu | Thr | Ile | Ala | Phe |
50 | 55 | 60 | |||||||||||||
Cys | Leu | Tyr | Tyr | Val | Ala | Thr | His | Tyr | Phe | His | Leu | Leu | Pro | Gly | Pro |
65 | 70 | 75 | 80 | ||||||||||||
Leu | Ser | Phe | Arg | Gly | Met | Ala | Ile | Tyr | Trp | Ala | Val | Gin | Gly | Cys | Ile |
85 | 90 | 95 | |||||||||||||
Leu | Thr | Gly | Val | Trp | Val | Ile | Ala | His | Glu | Cys | Gly | His | His | Ala | Phe |
100 | 105 | 110 | |||||||||||||
Ser | Asp | Tyr | Gin | Leu | Leu | Asp | Asp | Ile | Val | Gly | Leu | Ile | Leu | His | Ser |
115 | 120 | 125 | |||||||||||||
Ala | Leu | Leu | Val | Pro | Tyr | Phe | Ser | Trp | Lys | Tyr | Ser | His | Arg | Arg | His |
130 | 135 | 140 | |||||||||||||
His | Ser | Asn | Thr | Gly | Ser | Leu | Glu | Arg | Asp | Glu | Val | Phe | Val | Pro | Lys |
145 | 150 | 155 | 160 | ||||||||||||
Gin | Lys | Ser | Cys | Ile | Lys | Trp | Tyr | Ser | Lys | Tyr | Leu | Asn | Asn | Pro | Pro |
165 | 170 | 175 | |||||||||||||
Gly | Arg | Val | Leu | Thr | Leu | Ala | Val | Thr | Leu | Thr | Leu | Gly | Trp | Pro | Leu |
180 | 185 | 190 | |||||||||||||
Tyr | Leu | Ala | Leu | Asn | Val | Ser | Gly | Arg | Pro | Tyr | Asp | Arg | Phe | Ala | Cys |
195 | 200 | 205 | |||||||||||||
His | Tyr | Asp | Pro | Tyr | Gly | Pro | Ile | Tyr | Ser | Asp | Arg | Glu | Arg | Leu | Gin |
210 | 215 | 220 | |||||||||||||
Ile | Tyr | Ile | Ser | Asp | Ala | Gly | Val | Leu | Ala | Val | Val | Tyr | Gly | Leu | Phe |
225 | 230 | 235 | 240 | ||||||||||||
Arg | Leu | Ala | Met | Ala | Lys | Gly | Leu | Ala | Trp | Val | Val | Cys | Val | Tyr | Gly |
245 | 250 | 255 | |||||||||||||
Val | Pro | Leu | Leu | Val | Val | Asn | Gly | Phe | Leu | Val | Leu | Ile | Thr | Phe | Leu |
260 | 265 | 270 | |||||||||||||
Gin | His | Thr | His | Pro | Ala | Leu | Pro | His | Tyr | Thr | Ser | Ser | Glu | Trp | Asp |
275 | 280 | 285 | |||||||||||||
Trp | Leu | Arg | Gly | Ala | Leu | Ala | Thr | Val | Asp | Arg | Asp | Tyr | Gly | Ile | Leu |
290 | 295 | 300 |
PL 194 095B1
Asn 305 | Lys | Val | Phe | His | Asn 310 | Ile | Thr | Asp | Thr | His 315 | Val | Ala | His | His | Leu 320 |
Phe | Ser | Thr | Met | Pro 325 | His | Tyr | His | Ala | Met 330 | Glu | Ala | Thr | Lys | Ala 335 | Ile |
Lys □ | Pro | Ile | Leu 340 | Gly | Glu | Tyr | Tyr | Arg 345 | fhe | Asp | Glu | Thr | Pro 350 | Phe | Val |
Lys | Ala | Met 355 | Trp | Arg | Glu | Ala | Arg 360 | Glu | Cys | Ile | Tyr | Val 365 | Glu | Pro | Asp |
Gin | Ser 370 | Thr | Glu | Ser | Lys | Gly 375 | Val | Phe | Trp | Tyr | Asn 380 | Asn | Lys | Leu | |
(2) | Informacja dotycząca | SEQ | id : | NO:12: | |||||||||||
(i) | Charakterystyka | sekwencji: |
(A) Długość: 383 aminokwasy (B) Typ: aminokwasowa (C) Struktura niciowa: nić pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: białko (vi) Źródło pierwotne:
□ (A) Organizm: Solanum commersoni (xi) Opis sekwencji: SEQ ID NO:12
Met 1 | Gly | Ala | Gly | Gly Arg 5 | Met | Ser Ala | Pro Asn Gly Glu Thr Glu Val | |
10 | 15 | |||||||
Lys | Arg | Asn | Pro 20 | Leu Cln | Lys | Val Pro 25 | Thr | Ser Lys Pro Pro Phe Thr 30 |
Val | Gly | Asp 35 | Ile | Lys Lys | Ala | Ile Pro 40 | Pro | His Cys Phe Gin Arg Ser 45 |
Leu | Ile 50 | Asp | Ser | Phe Ser | Tyr 55 | Val Val | Tyr | Asp Leu Ile Leu Val Ser 60 |
Ile 65 | Met | Tyr | Tyr | Val Ala 70 | Asn | Thr Tyr | Phe | His Leu Leu Pro Ser Pro 75 80 |
Tyr | Cys | Tyr | Ile | Ala Trp 85 | Pro | Ile Tyr | Trp 90 | Ile Cys Gin Gly Cys Val 95 |
Cys | Thr | Gly | Ile 100 | Trp Val | Asn | Ala His 105 | Glu | Cys Gly His His Ala Phe 110 |
Ser | Asp | Tyr 115 | Gin | Trp Val | Asp Asp Thr 120 | Val | Gly Leu Ile Leu His Ser 125 | |
Ala | Leu 130 | Leu | Val | Pro Tyr | Phe 135 | Ser Trp | Lys | Tyr Ser His Arg Arg His 140 |
His | Ser | Asn | Thr | Gly Ser | Leu | Glu Arg | Asp | Glu Val Phe Val Pro Lys |
PL 194 095B1
145 150 155 160
Pro | Lys | Ser | Gin | Leu 165 | Gly | Trp | Tyr | Ser | Lys lyO | Tyr | Leu | Asn | Asn | Pro 175 | Pra |
Gly | Arg | Val | Leu 180 | Ser | Leu | Thr | Ile | Thr 185 | Leu | Thr | Leu | Gly | Trp 190 | Pro | Leu |
Tyr | Leu | Ala 195 | Phe | Asn | Val | Ser | Gly 200 | Arg | Pro | Tyr | Asp | Arg 205 | Phe | Ala | Cys |
His | Tyr 210 | Asp | Pro | Tyr | Gly | Pro 215 | Ile | Tyr | Asn | Asn | Arg 220 | Glu | Arg | Leu | Gin |
Ile 225 | Phe | Ile | Ser | Asp | Ala 230 | Gly | Val | Leu | Gly | Val 235 | Cys | Tyr | Leu | Leu | Tyr 240 |
Arg | Ile | Ala | Leu | Val 245 | Lys | Gly | Leu | Ala | Trp 250 | Leu | Val | Cys | Val | Tyr 255 | Gly |
Val | Pro | Leu | Leu 260 | Val | Val | Asn | Gly | Phe 265 | Leu | Val | Leu | Ile | Thr Z70 | Tyr | Leu |
Gin | His | Thr 275 | His | Pro | Ser | Leu | Pro 280 | His | Tyr | Asp | Ser | Thr 285 | Glu | Trp | Asp |
Trp | Leu 290 | Arg | Gly | Ala | Leu | Ala 295 | Thr | Cys | Asp | Arg | Asp 300 | Tyr | Gly | Val | Leu |
Agn 305 | Lys | Val | Phe | His | Asn 310 | Ile | Thr | Asp | Thr | His 315 | Val | Val | His | His | Leu 320 |
Phe | Ser | Thr | Met | Pro 325 | His | Tyx | Asn | Ala | Met 330 | Glu | Ala | Thr | Lys | Ala 335 | Val |
Lys | Pro | Leu | Leu 340 | Gly | Asp | Tyr | Tyr | Gin 345 | Phe | Asp | Gly | Thr | Pro 350 | Ile | Tyr |
Lys | Glu | Met 355 | Trp | Arg | Glu | Aia | Lys 360 | Glu | Cys | Leu | Tyr | Val 365 | Glu | Lys | Aap |
Glu | 5er 370 | Ser | Gin | Gly | Lys | Gly 375 | Val | Phe | Trp | Tyr | Lys 380 | Asn | Lys | Leu |
(2) Informacja dotycząca SEQ ID NO:13:
(i) Charakterystyka sekwencji:
(A) Długość: 387 aminokwasów (B) Typ: aminokwasowa (C) Struktura niciowa: nić pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: białko.
(vi) ORIGINAL SOURCE:
(A) Organizm: Glycine max (xi) Opis sekwencji: SEQ ID NO:13:
PL 194 095B1
Met Gly Leu Ala Lys Glu Thr Thr Met Gly Gly Arg Gly Arg Val Ala 15 10 15
Lys Val Glu Val Gin Gly Lys Lys Pro Leu Ser Arg Val Pro Asn Thr 20 25 30
Lys Pro Pro Phe Thr Val Gly Gin Leu Lys Lys Ala Ile Pro Pro His 35 40 45
Cys Phe Gin Arg 5er Leu Leu Thr 5er Phe Ser Tyr Val Val Tyr Asp 50 55 60
Leu Ser Phe Ala Phe Ile Phe Tyr Ile Ala Thr Thr Tyr Phe His Leu 65 70 75 80
Leu Pro Gin Pro Phe Ser Leu Ile Ala Trp Pro Ile Tyr Trp Val Leu 85 90 95
Gin Gly Cys Leu Leu Thr Gly Val Trp Val Ile Ala His Glu Cys Gly 100 105 110
His His Ala Phe Ser Lys Tyr Gin Trp Val Asp Asp Val Val Gly Leu 115 120 125
Thr Leu His Ser Thr Leu Leu Val Pro Tyr Phe Ser Trp Lys Ile Ser 130 135 140
His Arg Arq Hia His Ser Asn Thr Gly Ser Leu Asp Arg Asp Glu Val
145 150 155 160
Phe Val Pro Lys Pro Lys Ser Lys Val Ala Trp Phe Ser Lys Tyr Leu
165 170 175
Asn Asn Pro Leu Gly Arg Ala Val Ser Leu Leu Val Thr Leu Thr Ile 180 185 190
Gly Trp Pro Met Tyr 195
Ser Phe Ala Ser His 210
Glu Arg Leu Leu Ile 225
Tyr Ser Leu Tyr Arg 245
Cys Val Tyr Gly Val 260
Ile Thr Tyr Leu Gin 275
Ser Glu Trp Asp Trp 290
Tyr Gly Ile Leu Asn
Leu Ala Phe Asn Val Ser 200
Tyr His Pro Tyr Ala Pro 215
Tyr Val Ser Asp Val Ala 230 235
Val Ala Thr Leu Lys Gly 250
Pro Leu Leu Ile Val Asn 265
His Thr His Phe Ala Leu 280
Leu Lys Gly Ala Leu Ala 295
Lys Val Phe His His Ile
Gly Arg Pro Tyr Asp 205
Ile Tyr Ser Asn Arg 220
Leu Phe Ser Val Thr 240
Leu Val Trp Leu Leu 255
Gly Phe Leu Val Thr 270
Pro His Tyr Asp Ser 285
Thr Met Asp Arg Asp 300
Thr Asp Thr His Val
PL 194 095B1
305 310 315 320
Ala His His Leu Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala 325 330 335
Thr | Asn | Ala | Ile 340 | Lys | Pro | Ile | Leu | Gly 345 | Glu | Tyr | Tyr | Gin | Phe 350 | Asp | Asp |
Thr | Pro | Phe | Tyr | Lys | Ala | Leu | Trp | Arg | Glu | Ala | Arg | Glu | Cys | Leu | Tyr |
355 360 365
Val Glu Pro Asp Glu Gly Thr Ser Glu Lys Gly Val Tyr Trp Tyr Arg 370 375 380
Asn Lys Tyr
385 (2) Informacja dotycząca SEQ ID NO;14;
(i) Charakterystyka sekwencji:
(A) Długość: 387 aminokwasów (B) Typ: aminokwasowa (C) Sruktura niciowa: nić pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: białko (vi) Źródło pierwotne;
(A) Organizm: Ricinus communis
(xi) | Opis | sekwencji: | SEQ | ID 1 | NO:14: | |
Met ' 5 | Gly Gly | Gly Gly Arg Met ! 10 | 5er Thr ' | Val Ile Thr Ser Asn Asn Ser 1 15 | ||
Giu : | Lys Lys | Gly Gly Ser 5er His Leu : 20 25 | Lys Arg Ala Pro His Thr Lys 30 | |||
Pro | Pro Phe 35 | Thr | Leu Gly Asp | Leu 40 | Lys | Arg Ala Ile Pro Pro His Cys 45 |
Phe | Glu Arg 50 | Ser | Phe Val Arg 55 | Ser | Phe | Ser Tyr Val Ala Tyr Asp Val 60 |
Cys 65 | Leu Ser | Phe | Leu Phe Tyr 70 | Ser | Ile | Ala Thr Asn Phe Phe Pro Tyr 75 80 |
Ile | Ser Ser | Pro | Leu Ser Tyr 85 | Val | Ala | Trp Leu Val Tyr Trp Leu Phe 90 95 |
Gin | Gly Cys | Ile 100 | Leu Thr Gly | Leu | Trp 105 | Val Ile Gly His Glu Cys Gly 110 |
His | His Ala 115 | Phe | Ser Glu Tyr | Gin 120 | Leu | Ala Asp Asp Ile Val GlyD Leu 125 |
PL 194 095B1
Ile Vał His Ser Ala Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser □ 130 135 140
His Arg Arg His His Ser Asn Ile Gly Ser Leu Glu Arg Asp Glu Val
145 150 155 160
Phe Val Pro Lys Ser Lys 5er Lys Ile Ser Trp Tyr Ser Lys Tyr Ser
165 170 175
Asn Asn Pro Pro Gly Arg Val Leu Thr Leu Ala Ala Thr Leu Leu Leu 180 185 190
Gly Trp Pro Leu Tyr Leu Ala Phe Asn Val Ser Gly Arg Pro Tyr Asp 195 200 205
Arg Phe Ala Cys His Tyr Asp Pro Tyr Gly Pro Ile Phe Ser Glu Arg 210 215 220
Glu Arg Leu Gin Ile Tyr Ile Ala Asp Leu Gly Ile Phe Ala Thr Thr
225 230 235 240
Phe Val Leu Tyr Gin Ala Thr Met Ala Lys Gly Leu Ala Trp Val Met
245 250 255
Arg Tle Tyr Gly Val Pro Leu Leu Ile Val Asn Cys Phe Leu Val Mee 260 265 270
Ile Thr Tyr Leu Gin His Thr His Pro Ala Ile Pro Arg Tyr Gly Ser 275 280 285
Ser Glu Trp Asp Trp Leu Arg Gly Ala Met Val Thr Val Asp Arg Asp 290 295 300
Tyr Gly Val Leu Asn Lys Val Phe His Asn Ile Ala Asp Thr His Val
305 310 315 320
Ala His His Leu Phe Ala Thr Val Pro His Tyr His Ala Met Glu Ala
325 330 335
Thr Lys Ala Ile Lys Pro Ile Met Gly Glu Tyr Tyr Arg Tyr Asp Gly 340 345 350
Thr Pro Phe Tyr Lys Ala Leu Trp Arg Glu Ala Lys Glu Cys Leu Phe 355 360 365
Val Glu Pro Asp Glu Gly Ala Pro Thr Gin Gly Val Phe Trp Tyr Arg 370 375 380
Asn Lys Tyr
385 (2) Informacja dotycząca SEQ ID NO:15D (ii Charakterystyka sekwencji:
(A) Długość: 6 aminokwasów (B) Typ: aminokwasowa (C) Struktura niciowa: nić pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: peptyd
PL 194 095B1 (ν) Typ fragmentu: wewnętrzny (xi) Opis sekwencji: SEQ ID NO:15:
His Glu Cys Gly His His
5 (2) Informacja dotycząca SEQ ID NO:160 (i) Charakterystyka sekwencji:
(A) Długość: 5 aminokwasów (B) Typ: aminokwasowa (C) Struktura niciowa: nić pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: peptyd (v) Typ fragmentu: wewnętrzny (xi) Opis sekwencji: SEQ ID NO:16:
His Arg Asn His His
5 (2) Informacja dotycząca SEQ ID N0:17D (i) Charakterystyka sekwencji:
(A) Długość: 5 aminokwasów (B) Typ: aminokwasowa (C) Struktura niciowa: nić pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: peptyd (v) Typ fragmentu: wewnętrzny (xi) Opis sekwencji: SEQ ID NO:17:
His Val Met His His
5 (2) Informacja dotycząca SEQ ID NO:18:
(i) Charakterystyka sekwencji:
(A) Długość: 29 par zasad (B) Typ: kwas nukleinowy (C) Struktura niciowa: nić pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: oligonukleotyd (xi) Opis sekwencji; SEQ ID NO:18:
TGGAATTCCY TBMGNNNNYT SGGNHTBGG
PL 194 095B1 (2) Informacja dotycząca SEQ ID N0:19:
(i) Charakterystyka sekwencji:
(A) Długość: 1610 par zasad (B) Typ: kwas nukleinowy (C) Struktura niciowa: nić pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: cDNA (vi) Źródło pierwotne:
(A) Organizm Euphorbia lagascae (ix) Cecha znamienna:
(A) Nazwa/Klucz: CDS (B) Pozycja: 8..1545 (xi) Opis sekwencji: SEQ ID NO:19:
AGTAACA ATG AAC ACT Met Asn Thr | AAG Lys | GAG AAG AAG | AAG AAG | AAC Asn 10 | AGG GTT TCT AAC | 49 | |||||
Glu 5 | Lys | Lys | Lys | Lys | Arg Val | Ser Asn | |||||
1 | |||||||||||
ATC | TCT ATT CTT CTT | TGC | TTC | CTT | TGC | CTT | CTT | CCA | GTT TTC | CTT GTT | 97 |
Met Ser Ile Leu Leu 15 | Cys 20 | Phe | Leu | Cys | Leu | Leu 25 | Pro | Val Phe | Leu Val 30 | ||
TCT | CTT TCT ATT CTT | TCT | AAC | AGG | CTT | AAG | CCA | TCT | AAG TGG | AAC CTT | 145 |
Ser | Leu Ser Ile Leu 35 | Ser | Lys | Arg | Leu | Lys 40 | Pro | Ser | Lys Trp | Lys Leu 45 | |
CCA | CCA GGA CCA AAG | ACT | CTT | CCA | ATT | ATT | GGA | AAC | CTT CAA | GAT GAG | 193 |
Pro | Pro Gly Pro Lys 50 | Thr | Leu | pro | Ile 55 | Ile | Gly | Asn | Leu Gin 60 | Asp Glu | |
AGG | CAA GAT CCA GAG | GCT | TCT | CTT | TCT | CAA | GGA | GAT | ATT GCT | AGG GGA | 241 |
Arg | Gin Asp Pro Glu 65 | Ala | Ser | Leu 70 | Ser | Gin | Gly | His | Ile Ala 75 | Arg Gly | |
CCA | GTT GTT CAT TGC | GAG | AAG | CTT | GAG | TCT | TTC | GGA | ACT CAA | CCA ACT | 289 |
Pro | Val Val His Cys 80 | Glu | Lys 85 | Leu | Glu | Ser | Phe | Gly 90 | Thr Gin | Pro Thr | |
ATT | AAG GTT GGA CAT | TAT | GAT | AAG | AAC | TGC | GCT | CTT | CTT CAT | GGA GCT | 337 |
Ile 95 | Lys Val Gly His | Tyr 100 | Asp | Lys | Asn | Cys | Ala 105 | Leu | Leu His | Gly Ala 110 | |
GGA | GAT GAG CTT CTT | GGA | AAG | CCA | TCT | CCA | CCA | AAC | GAT GCT | TGG GAT | 385 |
Gly | Asp Glu Leu Leu 115 | Gly | Lys | Pro | Ser | Pro 120 | Pro | Asn | Asp Ala | Trp Asp 125 | |
ACT | GGA GGA TAT GGA | CTT | GAG | AGG | TCT | AAG | AAC | GAG | AGG TGG | SAG GAG | 433 |
Thr | Gly Gly Tyr Gly 130 | Leu | Glu | Arg | Ser 135 | Lys | Asn | Glu | Arg Trp 140 | Lys Glu | |
AAG | GAG ACT TCG TCT | GCT | TTC | AGG | CA11 TAT AGG ACT CTT AGC GCT TTC | 481 | |||||
Lys | Glu Thr Trp Ser 145 | Ala | Phe | Arg 150 | Gin | Tyr Arg | Thr | Leu Arg Ala Phe 155 |
PL 194 095B1
GGA ATG | GGA GGA AGG TCT TTC GAG | CTT Leu | ATG AGG TGG CAA | GAG Glu | GCT Ala | CAT His | 525 | |||||||||
Gly | Met 160 | Gly Gly | Arg | Ser | Phe 165 | Glu | Met | Arg | Trp 170 | Gin | ||||||
TGC | CTT | GTT | GAT | GGA | TAT | GTT | TCT | AGG | AAG | GCT | TCT | CGA | ACT | GAT | CCA | 577 |
Cys | Leu | Val | Asp | Gly | Tyr | Val | Ser | Arg | Lys | Ala | Ser | Gly | Thr | Asp | Pro | |
175 | ISO | 185 | 190 | |||||||||||||
ACT | AAG | GAT | CTT | GAG | GAT | TCT | AGG | TTC | AAC | ATT | ATT | ATG | GGA | GCT | ACT | 625 |
Thr | Lys | Asp | Leu | Glu | Asp | Ser | Arg | Phe | Asn | Ile | Ile | Met | Gly | Ala | Thr | |
195 | 200 | 205 | ||||||||||||||
TTC | AAC | CAA | GGA | CTT | GAT | TAT | AAG | ATT | AAG | ACT | TTC | CTT | GAT | AGG | CAT | 673 |
Phe | Asn | Gin | Gly | Leu | Asp | Tyr | Lys | Ile | Lys | Thr | Phe | Leu | Asp | Arg | His | |
210 | 215 | 220 | ||||||||||||||
GAG | AGG | AGG | AAC | TTC | CAA | TTC | AAC | AAC | GTT | GAT | GCT | GTT | TAT | CAT | CAA | 721 |
Glu | Arg | Arg | Asn | Phe | Gin | Phe | Asn | Asn | Val | Asp | Ala | Val | Tyr | His | Gin | |
225 | 230 | 235 | ||||||||||||||
ATG | AAG | GAT | GCT | GAG | AGG | GGA | TTC | GTT | GAT | TCT | AGG | GGA | TGG | CAA | GAT | 769 |
Met | Lys | Asp | Ala | Glu | Arg | Gly | Phe | Val | Asp | Ser | Arg | Gly | Trp | Gin | Asp | |
240 | 245 | 250 | ||||||||||||||
GAG | TTC | GGA | ATT | GCT | CTT | CAA | CAA | GTT | GTT | GCT | CAA | ATT | CTT | GAT | AAG | 817 |
Glu | Phe | Gly | Ile | Ala | Leu | Gin | Gin | Val | Val | Ala | Gin | Ile | Leu | Asp | Lys | |
255 | 260 | 265 | 270 | |||||||||||||
CCA | CTT | GAT | CAT | CAA | AAG | GCT | CTT | GAG | AGG | TGG | CAA | CAA | AGG | GAT | TCT | 865 |
Pro | Leu | Asp | His | Gin | Lys | Ala | Leu | Glu | Arg | Trp | Gin | Pro | Arg | Asp | Ser | |
275 | 280 | 285 | ||||||||||||||
CTT | AAC | CAT | TTC | ATT | GGA | GCT | AGG | GAT | GAT | GAG | ATG | GTT | CAA | ATT | AAG | 913 |
Leu | Asn | His | Phe | Ile | Gly | Ala | Arg | Asp | Asp | Glu | Met | Val | Gin | Ile | Lys | |
290 | 295 | 300 | ||||||||||||||
TAT | GAT | TTC | TGC | AAG | GAT | GCT | CTT | AGG | ATG | TTC | GAT | ACT | GGA | ATT | CTT | 961 |
Tyr | Asp | Phe | Cys | Lys | Asp | Ala | Leu | Arg | Met | Phe | Asp | Thr | θίγ | Ile | Leu | |
305 | 310 | 315 | ||||||||||||||
GCT | GCT | GAT | CTT | CAA | TCT | TCT | ACT | TCT | TCT | ATT | ACG | TGG | GAG | CCA | ATT | 1009 |
Ala | Ala | Asp | Leu | Gin | Ser | Ser | Thr | Ser | Ser | Ile | Arg | Trp | Glu | Pro | Ile | |
320 | 325 | 330 | ||||||||||||||
GTT | GTT | ATG | CTT | CAA | GCT | GAG | GTT | AAG | GGA | GAG | ATT | TGC | GAG | GAG | CTT | 1057 |
Val | Val | Met | Leu | Gin | Ala | Glu | Val | Lys | Gly | Glu | Ile | Cys | Glu | Glu | Leu | |
335 | 340 | 345 | 350 | |||||||||||||
GAT | AGG | GTT | ATT | GCT | AGG | CAT | CAA | AGG | CCA | TCT | ATG | AAG | GAT | AAG | ATG | 1105 |
Asp | Arg | Val | Ile | Ala | Arg | His | Gin | Arg | Pro | Ser | Met | Lys | Asp | Lys | Met | |
355 | 360 | 365 | ||||||||||||||
GTT | AAG | AGG | TAT | ACT | GCT | GCT | GTT | GTT | TGC | GAG | CTT | GAT | AGG | TAT | GCT | 1153 |
Val | Lys | Arg | Tyr | Thr | Ala | Ala | Val | Val | Cys | Glu | Leu | Asp | Arg | TyrDAla | ||
370 | 375 | 380 |
AAG | CTT | CTT | CCA | TCT | TCT | CTT | AGG | TGC | GTT | GCT | GCT | GAT | GAG | TGG AAG 1201 |
Lys | Leu | Leu | Pro | Ser | Ser | Leu | Arg | Cys | Val | Ala | Ala | Asp | Glu | TrpDLys |
PL 194 095B1
385 390 395
TTC AGG GAG TAT | CTT ATT | CCA Pro 405 | GTT Val | GGA ATG ACT | GTT Val 410 | GGA AAC Gly Asn | CTT JAG | 1249 | |||||
Phe Arg 400 | Glu | Tyr | Leu | Ile | Gly Met | Thr | Leu | Lys | |||||
ACT ACT | GTT | ATG | CTT | GAT | CAA | AAG | GAT CCA | GTT | GAT | CCA GAG | CTT | TTC | 1297 ' |
Thr Val | Met | Leu | Asp | Gin | Lys | Asp | Pro Val | Asp | Pro | Glu Leu | Phe | ||
415 | 420 | 425 | 430 | ||||||||||
GAT GGA | ATG | TAT | GGA | CTT | GAT | GCT | GAG GTT | CAT | TTC | GAT AAG | ACT | GAT | 1345 |
Asp Gly | Met | Tyr | Gly | Leu | Asp | Ala | Glu Val | His | Phe | Asp Lys | Thr | Asp | |
435 | 440 | 445 | |||||||||||
AGG TTC | ATG | CCA | CCA | TTC | TCT | GCTOGGG AGG | ATT | GCC | TGC GCT | GGA | CAA | 1393 | |
Arg Phe | Met | Pro | Pro | Phe | Ser | Ala | Gly Arg | Ile | Aia | Cys Ala | Giy | Gin | |
450 | 455 □ | 460 | |||||||||||
CTT CTT | GCT | GCT | TAT | GAG | CTY | TTC | CTT TTC | TTC | TGG | ACT ACT | GCT | GAT | 1441 |
Leu Leu | Ala | Ala | Tyr | Glu | Leu | Phe | Leu Phe | Phe | Trp | Thr Ile | Ala | Asp | |
465 | 470 | 475 | |||||||||||
GTT TTC | CAA | ATT | TTC | TCT | CTT | GCT | CAA TTC | AAG | GAG | GGA CAT | TGC | ACT | 1489 |
Val Phe | Gin | Ile | Phe | Ser | Leu | Ala | Gin Phe | Lys | Glu | Gly His | rys | Thr | |
480 | 485 | 490 | |||||||||||
GCT GTT | ACT | CTT | ATT | ATT | GAT | TGC | CTT GCT | GTT | AGG | TAT GAT | CTT | TGC | 1537 |
Ala Val | The | Leu | Ile | Ile | Asp | Cys | Leu Ala | Val | Arg | Tyr Asp | Leu | Cys | |
495 | 500 | 505 | 510 | ||||||||||
CTT CCT | AGG | TAGGGACCTT TACCGTTTGT GTGACCGTGT CAATGCTTGC | 1586 |
Leu Ala Arg
AATGGGCTTT TAATAATATT ATTA 1610 (2) Informacja dotycząca SEQ ID NO:20:
(i) Charakterystyka sekwencji:
(A) Długość: 1698 par zasad (B) Typ: kwas nukleinowy (C) Struktura niciowa: nić pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: DNA (ix) Cecha znamienna:
(A) Nazwa/Klucz: CDS (B) Pozycja: 8..1504 (xi) Opis sekwencji: SEQ ID NO:20:
GAGAACA ATG GCA CAA TTC GGC ACG AGG GAA ATT CTA GTC TCA CTC TTT 49
Met Ala Gin Phe Gly Thr Arg Glu Ile Leu Val Ser Leu Phe
PL 194 095B1
10
CTC Leu 15 | TCT Phe | CTA Leu | ATA Ile | CTA ATA | AAG TTC | ACA Thr | TTT TTA AAA CTC | AAA ACC | CCC Pro 30 | 97 | ||||||
Leu | Ile 20 | Lys | Phe | Phe | Leu 25 | Lys | Leu | Lys | Thr | |||||||
CAA | AAC | CCC | CCC | CCA | TCA | CCA | CCA | TCT | TTT | CCA | ATC | ACC | GGC | CAT | CTC | 145 |
Gin | Asn | Leu | Pro | Pro 35 | Ser | Pro | Pro | 5er | Phe 40 | Pro | Ile | Thr | Gly | His 45 | Leu | |
CAT | CTC | CTA | AAA | CAA | CCA | ATC | CAC | AGA | ACT | CTC | CAC | CAA | ATC | GCC | ACC | 193 |
His | Leu | Leu | Lys 50 | Gin | Pro | Ile | His | Arg 55 | Thr | Leu | His | Gin | Ile 60 | Ala | Thr | |
AAG | TAC | GGG | GAC | ATC | TTA | TTC | CTC | CGA | TTC | GGA | ACA | CGA | AAA | GTC | CTA | 741 |
Lys | Tyr | Gly 65 | Asp | Ile | Leu | Phe | Leu 70 | Arg | Phe | Gly | Thr | Arg 75 | Lys | Val | Leu |
GTC ATC | TCC Ser | TCT Ser | CTC Leu | CCC fi CC Pro Ala 85 | GTA Val | CAA Gin | GAA Glu | TGT Cys | TTC ACT ATA AAC | GAC Asp | 289 | ||||
Val | Ile Θ0 | Phe 90 | Thr | Ile | Asn | ||||||||||
ATC | ATT | TTC | GCT | AAC | CGC CCA | ACA | ATT | CTC | GCC | GGG | AAG | CAC | CTC | AAT | 337 |
Ile 95 | Ile | ^he | Ala | Asn | Arg Pro 100 | Thr | Ile | Leu | Ala 105 | Gly | Lys | His | Leu | Asn 110 | |
TAC | AAT | TCC | ACC | ACC | ATG GGA | TTC | GCC | TCC | TAT | GGC | GAT | CAC | TGG | CGT | 385 |
Tyr | Asn | Ser 20 | Thr | Thr | Met Gly 115 | Phe | Ala | Ser Tyr 120 | Gly | Asp | His Trp 125 | Arg | |||
CAT | CTC | CGA | CGA | CTC | ACA ACA | ATT | GAG | CTC | TTC | TCT | GCA | AAT | CGT | GTT | 433 |
His | Leu | Arg | Arg 130 | Leu | Thr Thr | Ile | Glu 135 | Leu | Phe | Ser | Ala | Asn 140 | Arg | Val |
GCC Ala | ATG Met | TTT Phe 145 | TCC Ser | GGG TTC | CGG Arg | GCC Ala 150 | GAT Asp | GAA Glu | AGT ACA GCT | TTT Phe | TAT Tyr | CAA Gin | 4B1 | |||
Gly | Phe | Ser | Thr | Ala 155 | ||||||||||||
ACA | GTT | GTT | CCA | GGA | AAT | CGG | GAT | TCG | GGA | AAG | ATA | GTA | ACT | TTG | ACA | 529 |
Thr | Val | Val | Pro | Gly | Asn | Arg | Asp | Ser | Gly | Lys | Ile | Val | Thr | Leu | Thr | |
160 | 165 | 170 | ||||||||||||||
TCG | AAA | CTG | ATG | GAG | CTT | ACA | CTG | AAT | AAC | ATA | ATG | AGA | ATC | GCT | GCC | 577 |
Ser | Lys | Leu | Met | Glu | Leu | Thr | Leu | Asn | Asn | Ile | Met | Arg | Met | Ala | Ala | |
175 | 180 | 185 | 190 | |||||||||||||
GGA | AAA | CGG | TTT | TAC | GGG | AAA | GAA | GTG | AAG | GAT | GAA | GAA | GGT | GAG | TTG | 625 |
Gly | Lys | Arg | Phe | Tyr | Gly | Lys | Glu | Val | Lys | Asp | Glu | Glu | Gly | Glu | Leu | |
195 | 200 | 205 | ||||||||||||||
TTG | CAG | GAT | CTT | ATG | AAG | ΛΛΆ. | ATG | GAG | GCG | CTC | CGG | GGG | AAT | TCA | ACG | 673 |
Leu | Gin | Asp | Leu | Met | Lys | Lys | Met | Glu | Ala | Leu | Arg | Gly | Asn | Ser | Thr | |
210 | 215 | 220 |
GTG | AAA | CGA | GAT | TAT | TTT | CCA | GTA | TTG | CAG | TGG | ATT | GAT | TAT | CAG | GGA | 721 |
Val | Lys | Arg | Asp | Tyr | Phe | Pro | Val | Leu | Gin | Trp | Ile | Asp | Tyr | Gin | Gly | |
225 | 230 | 235 |
PL 194 095B1
GTA AAG | AAG Lys | AAG ATG AGG | AAC CTG ATG AAG AAA ATG GAC | GGG TTC Gly Phe | TTG Leu | 763 | ||||||||
Val | Lys 240 | Lys | Met | Arg | Asn 245 | Leu Met | Lys | Lys | Met 250 | Asp | ||||
CAA | AAT | CTC | ATT | GAT | GAA | CAC | GGA AAC | ACG | ACG | TTG | TGG | ATC AAT | CAA | 817 |
Gin | Asn | Leu | Ile | Asp | Glu | His | Arg Asn | Thr | Thr | Leu | Trp | Ile Asn | Gin | |
255 | 260 | 265 | 270 | |||||||||||
GTT | CGA | GCA | ACT | CGG | ACA | AAA | AGApGGA | ACT | TGG | ACA | CTG | GTA GAT | GTT | 865 |
Val | Arg | Ala | Thr | Arg | Thr | Lys | Arg Gly | Thr | Trp | Thr | Leu | Val Asp | Val | |
275 | 280 | 285 | ||||||||||||
ATG | TTG | AAT | CTT | AAA | AAG | ACA | CAA CCT | GAC | TTC | TAC | ACT | GAT CTA | ACT | 913 |
Met | Leu | Asn | Leu | Lye | Lys | Thr | Gin Pro | Asp | Phe | Tyr | Thr | Asp Leu | Thr | |
290 | 295 | 300 | ||||||||||||
ATC | AAA | GGT | GTC | ATT | CAG | ACA | ACA CTG | ACT | GCA | GGA | TCT | CAA ACG | TCA | 9 |
Ile | Lys | Gly | Val | Ile | Gin | Thr | Thr Leu | Thr | Ala | Gly | Ser | Gin Thr | Ser | |
305 | 310 | 315 | ||||||||||||
GCA | GTT | ACA | CTA | GAA | TGG | GCG | CTG TCA | CTT | CTT | CTC | AAC | CAT CCT | CAA | 1009 |
Ala | Val | Thr | Leu | Glu | Trp | Ala | Leu Ser | Leu | Leu | Leu | Agn | His Pro | Gin | |
320 | 325 | 330 | ||||||||||||
GTA | ATG | CAC | AAA | GCT | TAT | GCC | GAA ATA | GAG | GCG | ATT | GTC | GGG ACC | AAC | 1057 |
Val | Met | His | Lys | Ala | Tyr | Ala | Glu Ile | Glu | Ala | Ile | Val | Gly Thr | Asn | |
335 | 340 | 345 | 350 | |||||||||||
CGC | TTA | TTA | PAC | GAA | GCC | GAC | TTA CCA | CAT | CTA | AGC | TAT | TTA CAA | AAC | 1105 |
Arg | Leu | Leu | Asn | Glu | Ala | Asp | Leu Pro | His | Leu | Ser | Tyr | Leu Gin | Asn | |
355 | 360 | 365 | ||||||||||||
ATA | ATC | ACC | GAG | ACA | TTT | CGA | CTC TTC | CCA | CCA | GTA | CCA | CTT TTA | CTA | 1153 |
Ile | Ile | Thr | Glu | Thr | Phe | Arg | Leu Phe | Pro | Pro | Val | Pro | Leu Leu | Leu | |
370 | 375 | 380 | ||||||||||||
CCC | CAT | AAA | TCA | TCA | GCA | GAT | TGC ATA | GTT | TCC | GGG | TTT | CAC ATA | CCA | 1201 |
Pro | His | Lys | Ser | Ser | Ala | Asp | Cys Ile | Val | Ser | Gly | Phe | His Ile | Pro | |
38S | 390 | 395 | ||||||||||||
CGG | GGC | ACA | ATG | TTG | CTA | GTG | AAC ACA | TGC | AGC | ATG | AAT | AGA AAT | CCA | 1249 |
Arg | Gly | Thr | Met | Leu | Leu | Val | Asn Thr | Trp | Ser | Met | Asn | Arg Asn | Pro | |
400 | 405 | 410 | ||||||||||||
AGA | TTA | TGG | AAC | GAA | CCA | GAG | AAA TTC | ATA | CCA | GAA | AGA | TTT G11A GGA | ||
Leu | Trp | Lys | Glu | Pro | Glu | Lys | Phe Ile | Pro | Glu | Arg | Phe | Glu Gly | ||
415 | 420 | 425 | 430 | |||||||||||
GGA | GAA | AAT | ACT | GAA | GGG | TGT | AAC TAT | AAA | TTG | CCT | CCT | TTC GGT | GCA | 1345 |
Gly | Glu | Asn | Thr | Glu | Gly | Cys | Asn Tyr | Lys | Leu | Leu | Pro | Phe Gly | Ala | |
435 | 440 | 445 | ||||||||||||
GGA | AGG | CGG | GCT | TGT | CCG | GGG | GCC GGT | GTG | GCG | ARA | CGA | ATG GTA | GGA | 1393 |
Gly | Arg | Arg | Ala | Gys | Pro | Gly | Ala Gly | Val | Ala | Lys | Arg | Met Val | Gly |
450 455 460
PL 194 095B1
CTC | ACT | TTA | GGT | GCA | TTG | ATT | CAG | TGT | TTT | GAG | TGG | GAA | AGA | ATT | GGC | 1441 |
Leu | Thr | Leu 465 | Gly | Ala | Leu | Ile | Gin 470 | Cys | Phe | Glu | Trp | Glu 475 | Arg | Ile | Gly | |
GAA | GAA | GAA | ATA | GAT | TTG | AGT | GAA | GGA | ACA | GGT | CTT | ACT | ATG | CCA | AAA | 1489 |
Glu | Glu 480 | Glu | Ile | Asp | Leu | Ser 485 | Glu | Gly | Thr | Gly | Leu 490 | Thr | Met | Pro | Lys |
GAT TTC CTT TGG AAG TAATATGCAA ACCTCGGCAA AACATGATTAA ACTTTCTTTC 1544
Asp Phe Leu Trp Lys
495
TACATTGTTA TAAAAGGTTG GTTTCTTTGC AGGTGCCAAC CCTAATTCAA ATATCGCATT 1604 TTTTCCCTGC AACCCAGCTG CTAACCAAAT ATCACTGTTT CTCATTATTC CTTATATAAA 1664 ACCTTAAAGC ACTATTTGCC TCCTAAAAAA AAAA 1698
Claims (33)
1. Wyizolowana cząsteczka kwasu nukleinowego lub cząsteczka do niej komplementarna, kodująca epoksygenazę, będącą polipeptydem monooksygenazy o funkcji mieszanej zdolnej do katalizowania epoksydacji wiązania węgiel-węgiel w cząsteczce kwasu tłuszczowego, znamienna tym, że obejmuje sekwencję aminokwasów zawierającą trzy motywy o wysokiej zawartości histydyny, a mianowicie:
(i) His-(Xaa)3-4-His;
(ii) His-(Xaa)2-3-His-His, oraz (iii) His-(Xaa)2-3-His-His,
2. Wyizolowana cząsteczka kwasu nukleinowego według zastrz. 1, znamienna tym, że wiązanie węgiel-węgiel jest wiązaniem podwójnym znajdującym się w cząsteczce nienasyconego kwasu tłuszczowego.
3. Wyizolowana cząsteczka kwasu nukleinowego według zastrz. 1 albo 2, znamienna tym, że wspomnianą epoksygenazą jest enzym D6-epoksygenaza, enzym D9-epoksygenaza, enzym D12-epoksygenaza lub enzym 15D-epoksygenaza.
4. Wyizolowana cząsteczka kwasu nukleinowego według zastrz. 1, znamienna tym, że pochodzi z rośliny.
5. Wyizolowana cząsteczka kwasu nukleinowego według zastrz. 1, znamienna tym, że roślina jest wybrana z grupy obejmującej Crepis spp., Euphorbia spp., Chrysanthemum spp. i Vernonia spp.
6. Wyizolowana cząsteczka kwasu nukleinowego według zastrz. 4, znamienna tym, że wspomnianą rośliną jest roślina wytwarzająca wysoki poziom kwasu wernolowego.
7. Wyizolowana cząsteczka kwasu nukleinowego według zastrz. 5, znamienna tym, że roślina jest wybrana z grupy obejmującej Crepis biennis, Crepis aurea, Crepis conyzaefolia, Crepis intermedia, Crepis occidentalis, Crepis palaestina, Crepis vesicaria i Crepis xancitha i Vernonia galamensis.
8. Wyizolowana cząsteczka kwasu nukleinowego według zastrz. 1, znamienna tym, że obejmuje sekwencję nukleotydów identyczną w co najmniej 65% z którąkolwiek z sekwencji SEQ ID NO NO: 1, 3 lub 5, albo z sekwencję komplementarną do niej.
9. Wyizolowana cząsteczka kwasu nukleinowego według zastrz. 1, znamienna tym, że jest zdolna do hybrydyzacji w co najmniej średnich warunkach z sekwencją SEQ ID NO NO: 1, 3 lub 5 albo sekwencją komplementarną do niej.
10. Wyizolowana cząsteczka kwasu nukleinowego według zastrz. 1, znamienna tym, że obejmuje sekwencję nukleotydów przedstawioną w SEQ ID NO: 1, 3 lub 5, lub sekwencja nukleotydowa komplementarna do niej albo co najmniej około 20 przylegających nukleotydów tej sekwencji.
PL 194 095B1
11. Konstrukt genetyczny, znamienny tym, że obejmuje wyizolowaną cząsteczkę kwasu nukleinowego zdefiniowaną w zastrz. 1, operatywnie połączoną z sekwencją promotorową, przy czym wspomniana cząsteczka kwasu nukleinowego jest zdolna do ulegania transkrypcji w orientacji sensownej lub antysensownej względem naturalnie występującego w przyrodzie kierunku transkrypcji in vivo genu epoksygenazy monooksygenazy o funkcji mieszanej.
12. Sposób dokonywania zmiany poziomu epoksykwasów tłuszczowych w komórce, tkance, narządzie, organizmie nie-człoweka lub drobnoustroju, znamienny tym, że wprowadza się cząsteczkę sensowną, antysensowną, rybozymową lub ko-supresorową, obejmującą wyizolowaną cząsteczkę kwasu jak zdefiniowano w zastrz. 1, do komórki, tkanki, narządu lub organizmu nie-człowieka i inkubuje się wspomnianą komórkę w czasie i w warunkach wystarczających do zajścia ekspresji wspomnianej cząsteczki sensownej, antysensownej, robozomowej lub ko-supresorowej.
13. Sposób według zastrz. 12, znamienny tym, że etap wprowadzania sensownej, antysensownej, rybozymowej lub ko-supresorowej cząsteczki obejmuje stabilną transformację komórki, tkanki, narządu lub organizmu nie-człowieka sensowną, antysensowną, rybozomową lub kosupresorową cząsteczką.
14. Sposób wytwarzania w komórce rekombinantowego, enzymatycznie aktywnego polipetydu monooksygenazy o funkcji mieszanej epoksygenazy, znamienny tym, że przeprowadza się hodowlę komórki zawierającej wyizolowaną cząsteczkę kwasu nukleinowego zdefiniowaną w zastrz. 1, w czasiei w warunkach wystarczających do zajścia ekspresji.
15. Sposób według zastrz. 14, znamienny tym, że przeprowadza się dodatkowy pierwszy etap transformacji komórki, z udziałem wyizolowanej cząsteczki kwasu nukleinowego.
16. Sposób wytwarzania w komórce rekombinantowego, enzymatycznie aktywnego polipeptydu monooksygenazy o funkcji mieszanej epoksygenazy, znamienny tym, że:
(i) wytwarza się konstrukt genetyczny obejmujący wyizolowaną cząsteczkę kwasu nukleinowego jak zdefiniowano w zastrz. 1, zlokalizowaną operatywnie pod kontrolą promotora zdolnego do napędzania ekspresji wspomnianej sekwencji genetycznej we wspomnianej komórce, oraz, ewentualnie, wzmacniacza ekspresji:
(ii) transformuje się wspomniany konstrukt genetyczny do wspomnianej komórki; oraz (iii) selekcjonuje się transformanty z wysokim poziomem ekspresji funkcjonalnej epoksygenazy, kodowanej przez tą sekwencję genetyczną.
17. Sposób wytwarzania w roślinie transgenicznej rekombinantowego, enzymatycznie aktywnego polipeptydu monooksygenazy o funkcji mieszanej epoksygenazy, znamienny tym, że:
(i) wytwarza się konstrukt genetyczny obejmujący wyizolowaną cząsteczkę kwasu nukleinowego jak zdefiniowano w zastrz. 1, zlokalizowaną operatywnie pod kontrolą specyficznego względem nasion promotora oraz, ewentualnie, elementu wzmacniacza ekspresji, przy czym wspomniana sekwencja genetyczna zlokalizowana jest w górę od sekwencji terminatora transkrypcji;
(ii) transformuje się wspomniany konstrukt genetyczny do komórki lub tkanki wspomnianej rośliny; oraz (iii) selekcjonuje się transformanty, u których, w nasionach, dochodzi do wysokiego poziomu ekspresji funkcjonalnej epoksygenazy, kodowanej przez sekwencję tą genetyczną.
18. Sposób według zastrz. 17, znamienny tym, że jako roślinę stosuje się gatunki roślin nasionach oleistych, normalnie produkujące wysoki poziom kwasu linolowego.
19. Sposób według zastrz. 17 lub 18, znamienny tym, że jako roślinę stosuje się roślinę wybraną z grupy obejmującej: len Linola®, rzepak, słonecznik, krokosz barwierski, soję, siemię lniane, sezam, nasiona bawełny, orzechyziemne,palmęoliwnąlubpalmę olejową.
20. Polipeptyd rekombinantowy monooksygenazy o funkcji mieszanej epoksygenazy, znamienny tym, że obejmuje sekwencję aminokwasówprzedstawioną w sekwencji SEQ IDNO NO: 2, 4 lub6,lubktóryjestidentycznyztąsekwencjąwco najmniejw50%.
21. Sposób wytwarzania epoksydowanego kwasu tłuszczowego w komórce, tkance, narządzie, organizmienie-człowiekalubdrobnoustroju, znamienny tym, że inkubuje się komórkę, tkankę, narząd lub organizm, u których dochodzi do ekspresji rekombinantowego polipeptydu jak zdefiniowano w zastrz. 20, z kwasem tłuszczowym stanowiącym substrat, w czasie i w warunkach wystarczających do przekształcenia co najmniej jednego wiązania węgiel-węgiel wspomnianego substratu w grupę epoksydową.
PL 194 095B1
22. Sposób według zastrz. 21, znamienny tym, że jako kwas tłuszczowy stanowiący substrat stosuje się nienasycony kwas tłuszczowy, a wiązanie węgiel-węgiel poddawane epoksydowaniu jest podwójnymwiązaniem węgiel-węgiel.
23. Sposób według zastrz. 21 albo 22, znamienny tym, że jako kwas tłuszczowy stanowiący substrat stosuje się kwas wybrany z grupy obejmującej kwas palmitolejowy, kwas oleinowy, kwas linolowy, kwaslinolenowy, kwas9,15- oktadekadienowy i kwas arachidonowy.
24. Sposób według zastrz. 21, znamienny tym, że epoksydowaniu poddaje się wiązanie węgiel-węgiel D6 lub wiązanie węgiel-węgiel D9, lub wiązanie węgiel-węgiel D12 lub wiązanie węgielwęgiel D15.
25. Sposób według któregokolwiek z zastrz. 21, znamienny tym, że jako epoksydowany kwas tłuszczowy wytwarza się kwas wernolowy.
26. Sposób według zastrz. 21, znamienny tym, że przeprowadza się dodatkowy pierwszy etap transformacji lub transfekcji komórki, tkanki, narządu lub organizmu nie człowieka z udziałem cząsteczki kwasu nukleinowego kodującej rekombinantową monooksygenazę o funkcji mieszanej epoksygenazę.
27. Sposób według zastrz. 21, znamienny tym, że komórka, narząd, tkanka organ lub organizm nie-człowieka, wktórymzachodzi ekspresjarekombinantowej epoksygenazy, pochodzi z bakterii, drożdży, grzyba, pleśni, owada, rośliny wyższej, ptaka lub ssaka nie-człowieka.
28. Sposób według zastrz. 27, znamienny tym, że drożdżami, rośliną, grzybem lub pleśnią są oleiste drożdże, oleista roślina, oleisty grzyb lub oleistapleśń.
29. Sposób według zastrz. 28, znamienny tym, że jako roślinę stosuje się roślinę oleistą, w której normalnie nie zachodzi na wysokim poziomie ekspresja rekombinantowej monooksygenazy o funkcji mieszanej epoksygenazy.
30. Sposób według zastrz. 29, znamienny tym, że jako roślinę oleistą, stosuje się roślinę wybraną z grupy obejmującej, między innymi, len Linola®, rzepak, słonecznik, krokosz barwierski, soję, siemięlniane,sezam,nasionabawełny, orzechyziemne, palmęolinąlubpalmęolejową.
31. Roślina transformowana wyizolowaną cząsteczką kwasu nukleinowego jak zdefiniowano w zastrz. 1, albo pochodząca od niej komórka, tkanka lub organ, lub potomstwo wspomnianej rośliny, które także zawierające wspomnianą cząsteczkę kwasu nukleinowego.
32. Roślina transformowana, znamienna tym, że jest zdolna do ekspresji rekombinantowego polipeptydu jak zdefiniowano w zastrz. 20 albo pochodząca od niej komórka, tkanka lub organ, lub potomstwo wspomnianej rośliny, także zdolne do ekspresji wspomnianego polipeptydu rekombinantowego.
33. Roślina lub pochodząca od niej komórka, tkanka lub organ, lub jej potomstwo jak zdefiniowano w zastrz. 32 stanowiąca lub pochodząca od lnu Linola®, rzepaku, słonecznika, krokosza barwierskiego, soi, siemienia lnianego, sezamu, nasion bawełny, orzecha ziemnego, palmy oliwnej lub palmy olejowej.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AUPO6226A AUPO622697A0 (en) | 1997-04-15 | 1997-04-15 | Plant fatty acid epoxygenase genes and uses therefor IIa |
AUPO6223A AUPO622397A0 (en) | 1997-04-15 | 1997-04-15 | Plant fatty acid epoxygenase genes and uses therefor Ia |
US4370697P | 1997-04-16 | 1997-04-16 | |
US5040397P | 1997-06-20 | 1997-06-20 | |
PCT/AU1998/000246 WO1998046762A1 (en) | 1997-04-15 | 1998-04-09 | Plant fatty acid epoxygenase genes and uses therefor |
Publications (2)
Publication Number | Publication Date |
---|---|
PL336292A1 PL336292A1 (en) | 2000-06-19 |
PL194095B1 true PL194095B1 (pl) | 2007-04-30 |
Family
ID=27424435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PL98336292A PL194095B1 (pl) | 1997-04-15 | 1998-04-09 | Wyizolowana cząsteczka kwasu nukleinowego, konstrukt genetyczny, sposób dokonywania zmian poziomu epoksykwasów tłuszczowych, sposób wytwarzania rekombinantowego polipeptydu monooksygenazy w komórce, sposób wytwarzania rekombinantowego polipeptydu monooksygenazy w roślinie transgenicznej, polipeptydrekombinantowy, sposób wytwarzania epoksydowanegokwasu tłuszczowego, roślina transformowana i roślina lub pochodząca z niej komórka |
Country Status (18)
Country | Link |
---|---|
US (1) | US6329518B1 (pl) |
EP (1) | EP0975765B1 (pl) |
JP (1) | JP4108765B2 (pl) |
KR (1) | KR100711074B1 (pl) |
CN (1) | CN100482797C (pl) |
AT (1) | ATE342361T1 (pl) |
BR (1) | BR9808676B1 (pl) |
CA (1) | CA2286895C (pl) |
DE (1) | DE69836133T2 (pl) |
DK (1) | DK0975765T3 (pl) |
EA (1) | EA004568B1 (pl) |
ES (1) | ES2275301T3 (pl) |
IL (2) | IL132393A0 (pl) |
MX (1) | MX224646B (pl) |
NZ (1) | NZ500542A (pl) |
PL (1) | PL194095B1 (pl) |
TR (1) | TR199902583T2 (pl) |
WO (1) | WO1998046762A1 (pl) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06240940A (ja) * | 1993-02-22 | 1994-08-30 | Takigen Seizo Kk | 掛金装置 |
US6310194B1 (en) | 1994-09-26 | 2001-10-30 | Carnegie Institution Of Washington | Plant fatty acid hydroxylases |
US7589253B2 (en) * | 1997-04-15 | 2009-09-15 | Commonwealth Scientific And Industrial Research Organisation | Fatty acid epoxygenase genes from plants and uses therefor in modifying fatty acid metabolism |
BR9910125A (pt) * | 1998-04-16 | 2003-02-25 | Pierre Broun | Interconversão de dessaturases e hidroxilases de ácido graxo de plantas |
DE19941609A1 (de) * | 1999-09-01 | 2001-03-08 | Inst Pflanzenbiochemie Ipb | Fettsäure-Desaturase-Gen aus Pflanzen |
CA2408357A1 (en) * | 2000-05-09 | 2001-11-15 | Bioriginal Food & Science Corp. | Production of conjugated linoleic and linolenic acids in plants |
US7214520B2 (en) | 2000-07-18 | 2007-05-08 | National Research Council Of Canada | Cloning, sequencing and expression of a comamonas cyclopentanone 1,2-monooxygenase-encoding gene in Escherichia coli |
MXPA03000507A (es) * | 2000-07-21 | 2003-10-06 | Du Pont | Enzima de citocromo p450 asociada con la sintesis de grupos delta12-epoxi en acidos grasos de plantas.. |
US6485949B1 (en) * | 2001-01-29 | 2002-11-26 | The United States Of America As Represented By The Secretary Of Agriculture | Epoxidation of carbon-carbon double bond with membrane bound peroxygenase |
EP1578987A2 (en) * | 2001-08-03 | 2005-09-28 | Diversa Corporation | Epoxide hydrolases, nucleic acids encoding them and methods for making and using them |
US20040157803A1 (en) * | 2002-03-04 | 2004-08-12 | Williams Deryck J. | Nematicidal fatty acid and fatty acid ester related compounds |
US6887900B2 (en) | 2002-03-04 | 2005-05-03 | Divergence, Inc. | Nematicidal compositions and methods |
US7364901B2 (en) | 2002-07-15 | 2008-04-29 | University Of Kentucky Research Foundation | Recombinant Stokesia epoxygenase gene |
US7365240B2 (en) | 2003-02-05 | 2008-04-29 | Divergence, Inc. | Nucleic acids encoding anthelmintic agents and plants made therefrom |
CN1310674C (zh) * | 2003-04-30 | 2007-04-18 | 比奥滕普特公司 | 治疗重症急性呼吸综合征的药物组合物 |
WO2005014834A1 (en) * | 2003-07-31 | 2005-02-17 | The University Of York | Fatty acid biosynthesis 3 |
WO2005014832A1 (en) * | 2003-07-31 | 2005-02-17 | The University Of York | Fatty acid biosynthesis 4 |
AU2003255742A1 (en) * | 2003-07-31 | 2005-02-25 | The Universtiy Of York | Fatty acid biosynthesis 1 |
US7368629B2 (en) * | 2004-02-04 | 2008-05-06 | Divergence, Inc. | Nucleic acids encoding anthelmintic agents and plants made therefrom |
AU2005323136A1 (en) * | 2004-12-20 | 2006-07-13 | Basf Plant Science Gmbh | Nucleic acid molecules encoding fatty acid desaturase genes from plants and methods of use |
ES2550623T3 (es) * | 2005-05-23 | 2015-11-11 | Blue Horse Labs, Inc. | Cártamo con ácido gamma linolénico elevado |
AU2009240794A1 (en) * | 2008-04-25 | 2009-10-29 | Commonwealth Scientific Industrial Research Organisation | Polypeptides and methods for producing triacylglycerols comprising modified fatty acids |
US8431772B1 (en) * | 2008-11-19 | 2013-04-30 | University Of Kentucky Research Foundation | Diacylglycerol acyltransferase sequences and related methods |
US9249082B2 (en) | 2010-02-09 | 2016-02-02 | King Abdulaziz City for Science and Technology (KACST) | Synthesis of dimethyl carbonate from carbon dioxide and methanol |
AU2012324024B2 (en) | 2011-12-27 | 2016-06-16 | Nuseed Global Innovation Ltd | Processes for producing lipids |
SG11201604871VA (en) | 2013-12-18 | 2016-07-28 | Commw Scient Ind Res Org | Lipid comprising long chain polyunsaturated fatty acids |
KR102527795B1 (ko) | 2014-06-27 | 2023-05-02 | 커먼웰쓰 사이언티픽 앤 인더스트리알 리서치 오거니제이션 | 도코사펜타에노산을 포함하는 지질 |
MX2017000109A (es) | 2014-07-07 | 2017-05-23 | Commw Scient Ind Res Org | Procesos para producir productos industriales de lipidos vegetales. |
US11913006B2 (en) | 2018-03-16 | 2024-02-27 | Nuseed Global Innovation Ltd. | Plants producing modified levels of medium chain fatty acids |
EP3543323A1 (de) * | 2018-03-21 | 2019-09-25 | Bergolin GmbH & Co. KG | Verwendung eines insektenöls in harzen für beschichtungs- und klebstoffzusammensetzungen |
CN116212948B (zh) * | 2023-02-14 | 2024-07-09 | 四川九天五洋新材料有限责任公司 | 一种丙烯气相环氧化成型催化剂及其制备方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE115999T1 (de) | 1987-12-15 | 1995-01-15 | Gene Shears Pty Ltd | Ribozyme. |
PH31293A (en) * | 1991-10-10 | 1998-07-06 | Rhone Poulenc Agrochimie | Production of y-linolenic acid by a delta6-desaturage. |
US5668292A (en) * | 1994-09-26 | 1997-09-16 | Carnegie Institution Of Washington | Use of plant fatty acyl hydroxylases to produce hydroxylated fatty acids and derivatives in plants |
US5834293A (en) * | 1994-09-28 | 1998-11-10 | Vanderbilt University | Cytochrome P450 arachidonic acid epoxygenase genetic mutation associated with hypertension |
SE9601236D0 (sv) | 1996-03-29 | 1996-03-29 | Sten Stymne | Novel plant enzyme and use thereof |
-
1998
- 1998-04-09 BR BRPI9808676-6A patent/BR9808676B1/pt not_active IP Right Cessation
- 1998-04-09 KR KR1019997009558A patent/KR100711074B1/ko not_active IP Right Cessation
- 1998-04-09 EP EP98913438A patent/EP0975765B1/en not_active Expired - Lifetime
- 1998-04-09 CA CA2286895A patent/CA2286895C/en not_active Expired - Fee Related
- 1998-04-09 DE DE69836133T patent/DE69836133T2/de not_active Expired - Lifetime
- 1998-04-09 WO PCT/AU1998/000246 patent/WO1998046762A1/en active IP Right Grant
- 1998-04-09 ES ES98913438T patent/ES2275301T3/es not_active Expired - Lifetime
- 1998-04-09 MX MX9909476A patent/MX224646B/es not_active IP Right Cessation
- 1998-04-09 DK DK98913438T patent/DK0975765T3/da active
- 1998-04-09 CN CNB988054701A patent/CN100482797C/zh not_active Expired - Fee Related
- 1998-04-09 TR TR1999/02583T patent/TR199902583T2/xx unknown
- 1998-04-09 PL PL98336292A patent/PL194095B1/pl not_active IP Right Cessation
- 1998-04-09 EA EA199900933A patent/EA004568B1/ru not_active IP Right Cessation
- 1998-04-09 IL IL13239398A patent/IL132393A0/xx unknown
- 1998-04-09 NZ NZ500542A patent/NZ500542A/xx unknown
- 1998-04-09 JP JP54330298A patent/JP4108765B2/ja not_active Expired - Fee Related
- 1998-04-09 AT AT98913438T patent/ATE342361T1/de not_active IP Right Cessation
- 1998-04-14 US US09/059,769 patent/US6329518B1/en not_active Expired - Lifetime
-
1999
- 1999-10-14 IL IL132393A patent/IL132393A/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
JP2001518797A (ja) | 2001-10-16 |
EP0975765A1 (en) | 2000-02-02 |
IL132393A (en) | 2010-11-30 |
EA004568B1 (ru) | 2004-06-24 |
WO1998046762A1 (en) | 1998-10-22 |
BR9808676A (pt) | 2000-07-11 |
CA2286895C (en) | 2010-07-13 |
DE69836133T2 (de) | 2007-08-16 |
EP0975765B1 (en) | 2006-10-11 |
DK0975765T3 (da) | 2007-02-19 |
CA2286895A1 (en) | 1998-10-22 |
CN100482797C (zh) | 2009-04-29 |
BR9808676B1 (pt) | 2010-10-05 |
PL336292A1 (en) | 2000-06-19 |
US6329518B1 (en) | 2001-12-11 |
EP0975765A4 (en) | 2002-09-25 |
EA199900933A1 (ru) | 2000-04-24 |
DE69836133D1 (de) | 2006-11-23 |
MX9909476A (es) | 2000-04-30 |
TR199902583T2 (xx) | 2000-05-22 |
IL132393A0 (en) | 2001-03-19 |
KR100711074B1 (ko) | 2007-04-26 |
ES2275301T3 (es) | 2007-06-01 |
KR20010006468A (ko) | 2001-01-26 |
NZ500542A (en) | 2000-11-24 |
JP4108765B2 (ja) | 2008-06-25 |
CN1257541A (zh) | 2000-06-21 |
MX224646B (es) | 2004-12-03 |
ATE342361T1 (de) | 2006-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
PL194095B1 (pl) | Wyizolowana cząsteczka kwasu nukleinowego, konstrukt genetyczny, sposób dokonywania zmian poziomu epoksykwasów tłuszczowych, sposób wytwarzania rekombinantowego polipeptydu monooksygenazy w komórce, sposób wytwarzania rekombinantowego polipeptydu monooksygenazy w roślinie transgenicznej, polipeptydrekombinantowy, sposób wytwarzania epoksydowanegokwasu tłuszczowego, roślina transformowana i roślina lub pochodząca z niej komórka | |
US7834248B2 (en) | Plant seed comprising vernolic acid | |
MXPA99009476A (en) | Plant fatty acid epoxygenase genes and uses therefor | |
US7154026B2 (en) | Manipulation of cellulose and/or β-1,4,-glucan | |
EP1390381B1 (en) | Lipid metabolism regulators in plants | |
Wang et al. | The soybean Dof‐type transcription factor genes, GmDof4 and GmDof11, enhance lipid content in the seeds of transgenic Arabidopsis plants | |
AU2003245878B2 (en) | Methods for increasing oil content in plants | |
CA2522618A1 (en) | Use of genes for increasing the oil content in plants | |
EP0977866B1 (en) | Fatty acid modifying enzymes from developing seeds of vernonia galamenensis | |
KR100854607B1 (ko) | 식물 스테롤 아실전달효소 | |
AU2003219899A1 (en) | Process for the production of unsaturated fatty acids | |
US20060078973A1 (en) | Process for the production of unsaturated fatty acids | |
AU734232B2 (en) | Plant fatty acid epoxygenase genes and uses therefor | |
US20050170478A1 (en) | Expression of phospholipid:diacylglycerine acyltranssferase (pdat) for the production of plant storage lipids with polyunsaturated fatty acids | |
PT975765E (pt) | Genes de apoxigenase de ácido gordo vegetal e suas utilizações | |
WO2000003006A1 (en) | Sucrose biosynthesis genes and uses therefor | |
AU4762499A (en) | Sucrose biosynthesis genes and uses therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Decisions on the lapse of the protection rights |
Effective date: 20100409 |