KR20190059961A - 신규한 곤충 저해 단백질 - Google Patents
신규한 곤충 저해 단백질 Download PDFInfo
- Publication number
- KR20190059961A KR20190059961A KR1020197013077A KR20197013077A KR20190059961A KR 20190059961 A KR20190059961 A KR 20190059961A KR 1020197013077 A KR1020197013077 A KR 1020197013077A KR 20197013077 A KR20197013077 A KR 20197013077A KR 20190059961 A KR20190059961 A KR 20190059961A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- leu
- glu
- asn
- thr
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 298
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 291
- 241000238631 Hexapoda Species 0.000 title claims abstract description 128
- 230000002401 inhibitory effect Effects 0.000 title claims description 49
- 230000000749 insecticidal effect Effects 0.000 claims abstract description 104
- 238000000034 method Methods 0.000 claims abstract description 61
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 58
- 108020004414 DNA Proteins 0.000 claims abstract description 41
- 241000255777 Lepidoptera Species 0.000 claims abstract description 36
- 241000196324 Embryophyta Species 0.000 claims description 195
- 210000004027 cell Anatomy 0.000 claims description 92
- 244000068988 Glycine max Species 0.000 claims description 71
- 150000001413 amino acids Chemical class 0.000 claims description 69
- 235000010469 Glycine max Nutrition 0.000 claims description 59
- 241000607479 Yersinia pestis Species 0.000 claims description 56
- 102000039446 nucleic acids Human genes 0.000 claims description 44
- 108020004707 nucleic acids Proteins 0.000 claims description 44
- 241000449794 Alabama argillacea Species 0.000 claims description 37
- 230000000694 effects Effects 0.000 claims description 36
- 239000012634 fragment Substances 0.000 claims description 36
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 34
- 239000000203 mixture Substances 0.000 claims description 34
- 239000013598 vector Substances 0.000 claims description 34
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 31
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 28
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 27
- 235000005822 corn Nutrition 0.000 claims description 27
- 102000040430 polynucleotide Human genes 0.000 claims description 26
- 108091033319 polynucleotide Proteins 0.000 claims description 26
- 239000002157 polynucleotide Substances 0.000 claims description 26
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 24
- 239000000523 sample Substances 0.000 claims description 24
- 239000002773 nucleotide Substances 0.000 claims description 23
- 125000003729 nucleotide group Chemical group 0.000 claims description 23
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 20
- 238000009396 hybridization Methods 0.000 claims description 19
- 239000002917 insecticide Substances 0.000 claims description 19
- 241000894006 Bacteria Species 0.000 claims description 17
- 229920001184 polypeptide Polymers 0.000 claims description 17
- 102000053602 DNA Human genes 0.000 claims description 15
- 240000000111 Saccharum officinarum Species 0.000 claims description 15
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 15
- 241000193388 Bacillus thuringiensis Species 0.000 claims description 14
- 230000001580 bacterial effect Effects 0.000 claims description 14
- 235000013312 flour Nutrition 0.000 claims description 14
- 240000007124 Brassica oleracea Species 0.000 claims description 13
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 claims description 13
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 claims description 13
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 claims description 13
- 241000254173 Coleoptera Species 0.000 claims description 13
- 241000255967 Helicoverpa zea Species 0.000 claims description 13
- 244000105624 Arachis hypogaea Species 0.000 claims description 12
- 241000256244 Heliothis virescens Species 0.000 claims description 12
- 235000020232 peanut Nutrition 0.000 claims description 12
- 240000007594 Oryza sativa Species 0.000 claims description 11
- 235000007164 Oryza sativa Nutrition 0.000 claims description 11
- 229940097012 bacillus thuringiensis Drugs 0.000 claims description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 10
- 235000000832 Ayote Nutrition 0.000 claims description 10
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 claims description 10
- 240000003259 Brassica oleracea var. botrytis Species 0.000 claims description 10
- 235000009854 Cucurbita moschata Nutrition 0.000 claims description 10
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 claims description 10
- 241000256251 Spodoptera frugiperda Species 0.000 claims description 10
- 235000015136 pumpkin Nutrition 0.000 claims description 10
- 235000009566 rice Nutrition 0.000 claims description 10
- 241000555281 Brevibacillus Species 0.000 claims description 9
- 240000004244 Cucurbita moschata Species 0.000 claims description 9
- 241001555556 Ephestia elutella Species 0.000 claims description 9
- 241001012098 Omiodes indicata Species 0.000 claims description 9
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 9
- 244000046052 Phaseolus vulgaris Species 0.000 claims description 9
- 235000010582 Pisum sativum Nutrition 0.000 claims description 9
- 240000004713 Pisum sativum Species 0.000 claims description 9
- 240000003829 Sorghum propinquum Species 0.000 claims description 9
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 9
- 241000256247 Spodoptera exigua Species 0.000 claims description 9
- 241000209140 Triticum Species 0.000 claims description 9
- 239000002023 wood Substances 0.000 claims description 9
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 8
- 241000589158 Agrobacterium Species 0.000 claims description 8
- 235000008331 Pinus X rigitaeda Nutrition 0.000 claims description 8
- 241000018646 Pinus brutia Species 0.000 claims description 8
- 235000011613 Pinus brutia Nutrition 0.000 claims description 8
- 241000985245 Spodoptera litura Species 0.000 claims description 8
- 235000009508 confectionery Nutrition 0.000 claims description 8
- 235000021307 Triticum Nutrition 0.000 claims description 7
- 239000000575 pesticide Substances 0.000 claims description 7
- 244000025254 Cannabis sativa Species 0.000 claims description 6
- 241000207199 Citrus Species 0.000 claims description 6
- 235000009852 Cucurbita pepo Nutrition 0.000 claims description 6
- 241000219104 Cucurbitaceae Species 0.000 claims description 6
- 244000020551 Helianthus annuus Species 0.000 claims description 6
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 6
- 235000004431 Linum usitatissimum Nutrition 0.000 claims description 6
- 240000006240 Linum usitatissimum Species 0.000 claims description 6
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 6
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 6
- 241000589516 Pseudomonas Species 0.000 claims description 6
- 240000003768 Solanum lycopersicum Species 0.000 claims description 6
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 6
- 244000061456 Solanum tuberosum Species 0.000 claims description 6
- 235000020971 citrus fruits Nutrition 0.000 claims description 6
- 235000001674 Agaricus brunnescens Nutrition 0.000 claims description 5
- 235000005254 Allium ampeloprasum Nutrition 0.000 claims description 5
- 240000006108 Allium ampeloprasum Species 0.000 claims description 5
- 240000002234 Allium sativum Species 0.000 claims description 5
- 240000007087 Apium graveolens Species 0.000 claims description 5
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 claims description 5
- 235000010591 Appio Nutrition 0.000 claims description 5
- 239000002028 Biomass Substances 0.000 claims description 5
- 235000017647 Brassica oleracea var italica Nutrition 0.000 claims description 5
- 241000283707 Capra Species 0.000 claims description 5
- 235000002566 Capsicum Nutrition 0.000 claims description 5
- 235000003255 Carthamus tinctorius Nutrition 0.000 claims description 5
- 244000020518 Carthamus tinctorius Species 0.000 claims description 5
- 241001367803 Chrysodeixis includens Species 0.000 claims description 5
- 235000010523 Cicer arietinum Nutrition 0.000 claims description 5
- 244000045195 Cicer arietinum Species 0.000 claims description 5
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 claims description 5
- 235000013162 Cocos nucifera Nutrition 0.000 claims description 5
- 244000060011 Cocos nucifera Species 0.000 claims description 5
- 241000219112 Cucumis Species 0.000 claims description 5
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 claims description 5
- 235000009849 Cucumis sativus Nutrition 0.000 claims description 5
- 240000008067 Cucumis sativus Species 0.000 claims description 5
- 235000002767 Daucus carota Nutrition 0.000 claims description 5
- 244000000626 Daucus carota Species 0.000 claims description 5
- 244000004281 Eucalyptus maculata Species 0.000 claims description 5
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 5
- 240000005979 Hordeum vulgare Species 0.000 claims description 5
- 235000008694 Humulus lupulus Nutrition 0.000 claims description 5
- 244000025221 Humulus lupulus Species 0.000 claims description 5
- 244000017020 Ipomoea batatas Species 0.000 claims description 5
- 235000002678 Ipomoea batatas Nutrition 0.000 claims description 5
- 235000003228 Lactuca sativa Nutrition 0.000 claims description 5
- 240000008415 Lactuca sativa Species 0.000 claims description 5
- 240000003183 Manihot esculenta Species 0.000 claims description 5
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 claims description 5
- 240000004658 Medicago sativa Species 0.000 claims description 5
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 claims description 5
- 240000005561 Musa balbisiana Species 0.000 claims description 5
- 235000018290 Musa x paradisiaca Nutrition 0.000 claims description 5
- 241001520808 Panicum virgatum Species 0.000 claims description 5
- 239000006002 Pepper Substances 0.000 claims description 5
- 241001236219 Pinus echinata Species 0.000 claims description 5
- 235000005018 Pinus echinata Nutrition 0.000 claims description 5
- 235000017339 Pinus palustris Nutrition 0.000 claims description 5
- 235000016761 Piper aduncum Nutrition 0.000 claims description 5
- 240000003889 Piper guineense Species 0.000 claims description 5
- 235000017804 Piper guineense Nutrition 0.000 claims description 5
- 235000008184 Piper nigrum Nutrition 0.000 claims description 5
- 241000219000 Populus Species 0.000 claims description 5
- 235000004443 Ricinus communis Nutrition 0.000 claims description 5
- 235000009337 Spinacia oleracea Nutrition 0.000 claims description 5
- 244000300264 Spinacia oleracea Species 0.000 claims description 5
- 244000269722 Thea sinensis Species 0.000 claims description 5
- 241000219094 Vitaceae Species 0.000 claims description 5
- 235000012343 cottonseed oil Nutrition 0.000 claims description 5
- 235000013399 edible fruits Nutrition 0.000 claims description 5
- 239000000446 fuel Substances 0.000 claims description 5
- 235000004611 garlic Nutrition 0.000 claims description 5
- 235000021021 grapes Nutrition 0.000 claims description 5
- 239000013612 plasmid Substances 0.000 claims description 5
- 235000013616 tea Nutrition 0.000 claims description 5
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 claims description 4
- 235000008733 Citrus aurantifolia Nutrition 0.000 claims description 4
- 240000007154 Coffea arabica Species 0.000 claims description 4
- 241000949463 Correa reflexa Species 0.000 claims description 4
- 241000588722 Escherichia Species 0.000 claims description 4
- 240000009088 Fragaria x ananassa Species 0.000 claims description 4
- 206010061217 Infestation Diseases 0.000 claims description 4
- 244000088415 Raphanus sativus Species 0.000 claims description 4
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 claims description 4
- 235000021536 Sugar beet Nutrition 0.000 claims description 4
- 240000006909 Tilia x europaea Species 0.000 claims description 4
- 235000011941 Tilia x europaea Nutrition 0.000 claims description 4
- 235000016213 coffee Nutrition 0.000 claims description 4
- 235000013353 coffee beverage Nutrition 0.000 claims description 4
- 230000000295 complement effect Effects 0.000 claims description 4
- 239000002385 cottonseed oil Substances 0.000 claims description 4
- 239000004571 lime Substances 0.000 claims description 4
- 235000014571 nuts Nutrition 0.000 claims description 4
- 239000000123 paper Substances 0.000 claims description 4
- 239000008188 pellet Substances 0.000 claims description 4
- 241000234282 Allium Species 0.000 claims description 3
- 235000002732 Allium cepa var. cepa Nutrition 0.000 claims description 3
- 235000017060 Arachis glabrata Nutrition 0.000 claims description 3
- 235000010777 Arachis hypogaea Nutrition 0.000 claims description 3
- 235000018262 Arachis monticola Nutrition 0.000 claims description 3
- 235000007319 Avena orientalis Nutrition 0.000 claims description 3
- 244000075850 Avena orientalis Species 0.000 claims description 3
- 229920002261 Corn starch Polymers 0.000 claims description 3
- 241000588698 Erwinia Species 0.000 claims description 3
- 241000588724 Escherichia coli Species 0.000 claims description 3
- 235000016623 Fragaria vesca Nutrition 0.000 claims description 3
- 235000011363 Fragaria x ananassa Nutrition 0.000 claims description 3
- 241001147381 Helicoverpa armigera Species 0.000 claims description 3
- 241000258937 Hemiptera Species 0.000 claims description 3
- 241000588748 Klebsiella Species 0.000 claims description 3
- 241001465754 Metazoa Species 0.000 claims description 3
- 108020004711 Nucleic Acid Probes Proteins 0.000 claims description 3
- 241000207836 Olea <angiosperm> Species 0.000 claims description 3
- 241001521235 Spodoptera eridania Species 0.000 claims description 3
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 claims description 3
- 239000008120 corn starch Substances 0.000 claims description 3
- 238000003306 harvesting Methods 0.000 claims description 3
- 239000002853 nucleic acid probe Substances 0.000 claims description 3
- 235000013311 vegetables Nutrition 0.000 claims description 3
- ZHVOBYWXERUHMN-KVJKMEBSSA-N 3-[(3s,5r,8r,9s,10s,13s,14s,17s)-10,13-dimethyl-3-[(2r,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-2,3,4,5,6,7,8,9,11,12,14,15,16,17-tetradecahydro-1h-cyclopenta[a]phenanthren-17-yl]-2h-furan-5-one Chemical compound O([C@@H]1C[C@H]2CC[C@@H]3[C@@H]([C@]2(CC1)C)CC[C@]1([C@H]3CC[C@@H]1C=1COC(=O)C=1)C)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O ZHVOBYWXERUHMN-KVJKMEBSSA-N 0.000 claims description 2
- 241000252084 Anguilla Species 0.000 claims description 2
- 241000625753 Anticarsia Species 0.000 claims description 2
- 241000233788 Arecaceae Species 0.000 claims description 2
- 241000193755 Bacillus cereus Species 0.000 claims description 2
- 241000879145 Diatraea grandiosella Species 0.000 claims description 2
- 241000122106 Diatraea saccharalis Species 0.000 claims description 2
- 238000002965 ELISA Methods 0.000 claims description 2
- 241001572697 Earias vittella Species 0.000 claims description 2
- 241000209510 Liliopsida Species 0.000 claims description 2
- 241000520272 Pantoea Species 0.000 claims description 2
- 241000721451 Pectinophora gossypiella Species 0.000 claims description 2
- 235000008577 Pinus radiata Nutrition 0.000 claims description 2
- 241000218621 Pinus radiata Species 0.000 claims description 2
- 241000218679 Pinus taeda Species 0.000 claims description 2
- 235000008566 Pinus taeda Nutrition 0.000 claims description 2
- 241000589180 Rhizobium Species 0.000 claims description 2
- 241000235070 Saccharomyces Species 0.000 claims description 2
- 108010073771 Soybean Proteins Proteins 0.000 claims description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 claims description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 claims description 2
- 235000013339 cereals Nutrition 0.000 claims description 2
- 235000013351 cheese Nutrition 0.000 claims description 2
- 239000012141 concentrate Substances 0.000 claims description 2
- 235000008504 concentrate Nutrition 0.000 claims description 2
- 235000005687 corn oil Nutrition 0.000 claims description 2
- 239000002285 corn oil Substances 0.000 claims description 2
- 239000006071 cream Substances 0.000 claims description 2
- 239000000835 fiber Substances 0.000 claims description 2
- 235000011389 fruit/vegetable juice Nutrition 0.000 claims description 2
- 230000009545 invasion Effects 0.000 claims description 2
- 235000015110 jellies Nutrition 0.000 claims description 2
- 235000012771 pancakes Nutrition 0.000 claims description 2
- 239000004460 silage Substances 0.000 claims description 2
- 235000013322 soy milk Nutrition 0.000 claims description 2
- 229940001941 soy protein Drugs 0.000 claims description 2
- 235000012424 soybean oil Nutrition 0.000 claims description 2
- 239000003549 soybean oil Substances 0.000 claims description 2
- 239000006188 syrup Substances 0.000 claims description 2
- 235000020357 syrup Nutrition 0.000 claims description 2
- 238000001262 western blot Methods 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 14
- 241000209149 Zea Species 0.000 claims 12
- 244000241235 Citrullus lanatus Species 0.000 claims 2
- 244000061176 Nicotiana tabacum Species 0.000 claims 2
- 241000219122 Cucurbita Species 0.000 claims 1
- 241000208682 Liquidambar Species 0.000 claims 1
- 235000006552 Liquidambar styraciflua Nutrition 0.000 claims 1
- 241000209082 Lolium Species 0.000 claims 1
- 241001147397 Ostrinia Species 0.000 claims 1
- 241000235527 Rhizopus Species 0.000 claims 1
- 239000004464 cereal grain Substances 0.000 claims 1
- 235000004426 flaxseed Nutrition 0.000 claims 1
- 235000021067 refined food Nutrition 0.000 claims 1
- 235000021012 strawberries Nutrition 0.000 claims 1
- 210000001215 vagina Anatomy 0.000 claims 1
- 230000009261 transgenic effect Effects 0.000 abstract description 43
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 25
- 241000894007 species Species 0.000 abstract description 12
- 230000002588 toxic effect Effects 0.000 abstract description 7
- 239000012472 biological sample Substances 0.000 abstract description 3
- 108091005461 Nucleic proteins Proteins 0.000 abstract 1
- 235000018102 proteins Nutrition 0.000 description 256
- 108700012359 toxins Proteins 0.000 description 60
- 230000014509 gene expression Effects 0.000 description 45
- 108091026890 Coding region Proteins 0.000 description 39
- 108700019146 Transgenes Proteins 0.000 description 25
- 235000001014 amino acid Nutrition 0.000 description 22
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 21
- 239000000047 product Substances 0.000 description 20
- 239000003053 toxin Substances 0.000 description 20
- 231100000765 toxin Toxicity 0.000 description 20
- 108010038633 aspartylglutamate Proteins 0.000 description 19
- 241000880493 Leptailurus serval Species 0.000 description 18
- 240000008042 Zea mays Species 0.000 description 17
- 241000256248 Spodoptera Species 0.000 description 16
- 238000004166 bioassay Methods 0.000 description 16
- 239000000126 substance Substances 0.000 description 16
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 14
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 14
- 108010013835 arginine glutamate Proteins 0.000 description 13
- 231100000654 protein toxin Toxicity 0.000 description 13
- 230000009466 transformation Effects 0.000 description 13
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 12
- 230000006378 damage Effects 0.000 description 12
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 12
- 210000001519 tissue Anatomy 0.000 description 12
- 108020004705 Codon Proteins 0.000 description 11
- 235000004341 Gossypium herbaceum Nutrition 0.000 description 11
- 240000002024 Gossypium herbaceum Species 0.000 description 11
- 108010061238 threonyl-glycine Proteins 0.000 description 11
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 10
- 108020004511 Recombinant DNA Proteins 0.000 description 10
- 210000003763 chloroplast Anatomy 0.000 description 10
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 10
- 229930182817 methionine Natural products 0.000 description 10
- 241000726221 Gemma Species 0.000 description 9
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 9
- 108700026244 Open Reading Frames Proteins 0.000 description 9
- 230000035515 penetration Effects 0.000 description 9
- 230000000361 pesticidal effect Effects 0.000 description 9
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 8
- 239000003795 chemical substances by application Substances 0.000 description 8
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 8
- 108010050848 glycylleucine Proteins 0.000 description 8
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 8
- 108010012581 phenylalanylglutamate Proteins 0.000 description 8
- 108010029020 prolylglycine Proteins 0.000 description 8
- 244000111261 Mucuna pruriens Species 0.000 description 7
- 235000008540 Mucuna pruriens var utilis Nutrition 0.000 description 7
- 108010066427 N-valyltryptophan Proteins 0.000 description 7
- 101710163270 Nuclease Proteins 0.000 description 7
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 7
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 7
- 108010077245 asparaginyl-proline Proteins 0.000 description 7
- 238000003556 assay Methods 0.000 description 7
- 108010054813 diprotin B Proteins 0.000 description 7
- 238000009472 formulation Methods 0.000 description 7
- 108010049041 glutamylalanine Proteins 0.000 description 7
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 7
- 230000000977 initiatory effect Effects 0.000 description 7
- 108010057821 leucylproline Proteins 0.000 description 7
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 6
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 6
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 6
- 108091036066 Three prime untranslated region Proteins 0.000 description 6
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 6
- 108010031100 chloroplast transit peptides Proteins 0.000 description 6
- 230000001747 exhibiting effect Effects 0.000 description 6
- 108010089804 glycyl-threonine Proteins 0.000 description 6
- 108010087823 glycyltyrosine Proteins 0.000 description 6
- 239000002919 insect venom Substances 0.000 description 6
- 108010018625 phenylalanylarginine Proteins 0.000 description 6
- 108010051242 phenylalanylserine Proteins 0.000 description 6
- 108010026333 seryl-proline Proteins 0.000 description 6
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 6
- 229960000268 spectinomycin Drugs 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 231100000331 toxic Toxicity 0.000 description 6
- 231100000167 toxic agent Toxicity 0.000 description 6
- 239000003440 toxic substance Substances 0.000 description 6
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 5
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 5
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 5
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 5
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 5
- 241000255990 Helicoverpa Species 0.000 description 5
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 5
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 5
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 5
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 5
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 5
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 5
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 5
- 241001414989 Thysanoptera Species 0.000 description 5
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 5
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 5
- 235000004279 alanine Nutrition 0.000 description 5
- -1 alanine amino acids Chemical class 0.000 description 5
- 108010047857 aspartylglycine Proteins 0.000 description 5
- 235000013305 food Nutrition 0.000 description 5
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 5
- 108010010147 glycylglutamine Proteins 0.000 description 5
- 108010040030 histidinoalanine Proteins 0.000 description 5
- 108010025306 histidylleucine Proteins 0.000 description 5
- 230000005764 inhibitory process Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 5
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 5
- 230000000813 microbial effect Effects 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 5
- 238000011426 transformation method Methods 0.000 description 5
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 5
- 108010084932 tryptophyl-proline Proteins 0.000 description 5
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 5
- 241000256118 Aedes aegypti Species 0.000 description 4
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 4
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 4
- 108010076441 Ala-His-His Proteins 0.000 description 4
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 4
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 4
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 4
- XVAPVJNJGLWGCS-ACZMJKKPSA-N Asn-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVAPVJNJGLWGCS-ACZMJKKPSA-N 0.000 description 4
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 4
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 4
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 4
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 4
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 4
- 108091033409 CRISPR Proteins 0.000 description 4
- 229920000742 Cotton Polymers 0.000 description 4
- 241000489975 Diabrotica Species 0.000 description 4
- 241001057636 Dracaena deremensis Species 0.000 description 4
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 4
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 4
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 4
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 4
- 241000219146 Gossypium Species 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- 241000590002 Helicobacter pylori Species 0.000 description 4
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 4
- 108010060231 Insect Proteins Proteins 0.000 description 4
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 4
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 4
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 4
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 4
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 4
- 208000002720 Malnutrition Diseases 0.000 description 4
- 241000208125 Nicotiana Species 0.000 description 4
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 4
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 4
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 4
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 4
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 4
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 4
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 4
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 4
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 4
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 4
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 4
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 108010036533 arginylvaline Proteins 0.000 description 4
- 235000019504 cigarettes Nutrition 0.000 description 4
- 230000001276 controlling effect Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 229940037467 helicobacter pylori Drugs 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 230000001071 malnutrition Effects 0.000 description 4
- 235000000824 malnutrition Nutrition 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 208000015380 nutritional deficiency disease Diseases 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 210000004215 spore Anatomy 0.000 description 4
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 3
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 3
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 3
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 3
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 3
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 3
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 3
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 3
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 3
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 3
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 3
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 3
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 3
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 3
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 3
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 3
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 3
- QGNXYDHVERJIAY-ACZMJKKPSA-N Asn-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGNXYDHVERJIAY-ACZMJKKPSA-N 0.000 description 3
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 3
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 3
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 3
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 3
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 3
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 3
- KPNUCOPMVSGRCR-DCAQKATOSA-N Asp-His-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KPNUCOPMVSGRCR-DCAQKATOSA-N 0.000 description 3
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 3
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 3
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 3
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 3
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 3
- 241000283153 Cetacea Species 0.000 description 3
- 241000219109 Citrullus Species 0.000 description 3
- 241000252210 Cyprinidae Species 0.000 description 3
- XEEIQMGZRFFSRD-XVYDVKMFSA-N Cys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N XEEIQMGZRFFSRD-XVYDVKMFSA-N 0.000 description 3
- FGWRYRAVBVOHIB-XIRDDKMYSA-N Gln-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O FGWRYRAVBVOHIB-XIRDDKMYSA-N 0.000 description 3
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 3
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 3
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 3
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 3
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 3
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 3
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 3
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 3
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 3
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 3
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 3
- 241000589989 Helicobacter Species 0.000 description 3
- VTZYMXGGXOFBMX-DJFWLOJKSA-N His-Ile-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O VTZYMXGGXOFBMX-DJFWLOJKSA-N 0.000 description 3
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 3
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 3
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 3
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 3
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 3
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 3
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 3
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 3
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 3
- LJKJVTCIRDCITR-SRVKXCTJSA-N Leu-Cys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LJKJVTCIRDCITR-SRVKXCTJSA-N 0.000 description 3
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 3
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 3
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 3
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 3
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 3
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 3
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 3
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 3
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 3
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 3
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 3
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 3
- RYOLKFYZBHMYFW-WDSOQIARSA-N Lys-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 RYOLKFYZBHMYFW-WDSOQIARSA-N 0.000 description 3
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 3
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 3
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 3
- VIIRRNQMMIHYHQ-XHSDSOJGSA-N Phe-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N VIIRRNQMMIHYHQ-XHSDSOJGSA-N 0.000 description 3
- 241000500437 Plutella xylostella Species 0.000 description 3
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 3
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 3
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 3
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 3
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 3
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 3
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 3
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 3
- ZGFRMNZZTOVBOU-CIUDSAMLSA-N Ser-Met-Gln Chemical compound N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)O ZGFRMNZZTOVBOU-CIUDSAMLSA-N 0.000 description 3
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 3
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 3
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 3
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 3
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 3
- VUKVQVNKIIZBPO-HOUAVDHOSA-N Thr-Asp-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VUKVQVNKIIZBPO-HOUAVDHOSA-N 0.000 description 3
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 3
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 3
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 3
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 3
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 3
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 3
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 3
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 3
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 3
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 3
- YTCNLMSUXPCFBW-SXNHZJKMSA-N Trp-Ile-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O YTCNLMSUXPCFBW-SXNHZJKMSA-N 0.000 description 3
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 3
- CKKFTIQYURNSEI-IHRRRGAJSA-N Tyr-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CKKFTIQYURNSEI-IHRRRGAJSA-N 0.000 description 3
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 3
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 3
- NUQZCPSZHGIYTA-HKUYNNGSSA-N Tyr-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N NUQZCPSZHGIYTA-HKUYNNGSSA-N 0.000 description 3
- 108010064997 VPY tripeptide Proteins 0.000 description 3
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 3
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 3
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 3
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 3
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 3
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 3
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 3
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 3
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 3
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 3
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 3
- 108010011559 alanylphenylalanine Proteins 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- 108010070783 alanyltyrosine Proteins 0.000 description 3
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 3
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 3
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 108010060199 cysteinylproline Proteins 0.000 description 3
- 235000005911 diet Nutrition 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010362 genome editing Methods 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 3
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 3
- 108010084760 glycyl-tyrosyl-glycyl-aspartate Proteins 0.000 description 3
- 108010081551 glycylphenylalanine Proteins 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 108010028295 histidylhistidine Proteins 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 3
- 108010078274 isoleucylvaline Proteins 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 210000003739 neck Anatomy 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 230000001850 reproductive effect Effects 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 2
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 2
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 2
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 2
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 2
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 2
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- OQWQTGBOFPJOIF-DLOVCJGASA-N Ala-Lys-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N OQWQTGBOFPJOIF-DLOVCJGASA-N 0.000 description 2
- IHRGVZXPTIQNIP-NAKRPEOUSA-N Ala-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)N IHRGVZXPTIQNIP-NAKRPEOUSA-N 0.000 description 2
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 2
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 2
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 2
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 2
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 241001259789 Amyelois transitella Species 0.000 description 2
- 241000272814 Anser sp. Species 0.000 description 2
- 241000856922 Arctia caja Species 0.000 description 2
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 2
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 2
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 2
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 2
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 2
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 2
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 2
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 2
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 2
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 2
- UGJLILSJKSBVIR-ZFWWWQNUSA-N Arg-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)NCC(O)=O)=CNC2=C1 UGJLILSJKSBVIR-ZFWWWQNUSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 2
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 2
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 2
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 2
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 2
- UTSMXMABBPFVJP-SZMVWBNQSA-N Arg-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UTSMXMABBPFVJP-SZMVWBNQSA-N 0.000 description 2
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 2
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 2
- YJRORCOAFUZVKA-FXQIFTODSA-N Asn-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N YJRORCOAFUZVKA-FXQIFTODSA-N 0.000 description 2
- CIBWFJFMOBIFTE-CIUDSAMLSA-N Asn-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N CIBWFJFMOBIFTE-CIUDSAMLSA-N 0.000 description 2
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 2
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 2
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 2
- SNAKIVFVLVUCKB-UHFFFAOYSA-N Asn-Glu-Ala-Lys Natural products NCCCCC(C(O)=O)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(N)CC(N)=O SNAKIVFVLVUCKB-UHFFFAOYSA-N 0.000 description 2
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 2
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 2
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 2
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 2
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 2
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 2
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 2
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 2
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 2
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 2
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 2
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 2
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 2
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 2
- NURJSGZGBVJFAD-ZLUOBGJFSA-N Asp-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O NURJSGZGBVJFAD-ZLUOBGJFSA-N 0.000 description 2
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 2
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 2
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 2
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 2
- SARSTIZOZFBDOM-FXQIFTODSA-N Asp-Met-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SARSTIZOZFBDOM-FXQIFTODSA-N 0.000 description 2
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 2
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 2
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 2
- ZQFZEBRNAMXXJV-KKUMJFAQSA-N Asp-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O ZQFZEBRNAMXXJV-KKUMJFAQSA-N 0.000 description 2
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 2
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 2
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 2
- 238000010354 CRISPR gene editing Methods 0.000 description 2
- 108010049994 Chloroplast Proteins Proteins 0.000 description 2
- GMXSSZUVDNPRMA-FXQIFTODSA-N Cys-Arg-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GMXSSZUVDNPRMA-FXQIFTODSA-N 0.000 description 2
- DEVDFMRWZASYOF-ZLUOBGJFSA-N Cys-Asn-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DEVDFMRWZASYOF-ZLUOBGJFSA-N 0.000 description 2
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 2
- BLGNLNRBABWDST-CIUDSAMLSA-N Cys-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BLGNLNRBABWDST-CIUDSAMLSA-N 0.000 description 2
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 2
- ZLFRUAFDAIFNHN-LKXGYXEUSA-N Cys-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)O ZLFRUAFDAIFNHN-LKXGYXEUSA-N 0.000 description 2
- CLEFUAZULXANBU-MELADBBJSA-N Cys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CS)N)C(=O)O CLEFUAZULXANBU-MELADBBJSA-N 0.000 description 2
- FNXOZWPPOJRBRE-XGEHTFHBSA-N Cys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CS)N)O FNXOZWPPOJRBRE-XGEHTFHBSA-N 0.000 description 2
- 241000489947 Diabrotica virgifera virgifera Species 0.000 description 2
- 241000255925 Diptera Species 0.000 description 2
- 241000353522 Earias insulana Species 0.000 description 2
- 241000611421 Elia Species 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108010074122 Ferredoxins Proteins 0.000 description 2
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 2
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 2
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 2
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 2
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 2
- OACQOWPRWGNKTP-AVGNSLFASA-N Gln-Tyr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O OACQOWPRWGNKTP-AVGNSLFASA-N 0.000 description 2
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 2
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 2
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 2
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 2
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 2
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 2
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 2
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 2
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 2
- KIMXNQXJJWWVIN-AVGNSLFASA-N Glu-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)O KIMXNQXJJWWVIN-AVGNSLFASA-N 0.000 description 2
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 2
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 2
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 2
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 2
- WVWZIPOJECFDAG-AVGNSLFASA-N Glu-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N WVWZIPOJECFDAG-AVGNSLFASA-N 0.000 description 2
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 2
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 2
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 2
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 2
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 2
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 2
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 2
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 2
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 2
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 2
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 2
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 2
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 2
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 2
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 2
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 2
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 2
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 2
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 2
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 2
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 2
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 2
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 2
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 2
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 2
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 2
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 2
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 2
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 2
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 2
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 2
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 2
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 2
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 2
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 2
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 2
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 2
- COZMNNJEGNPDED-HOCLYGCPSA-N Gly-Val-Trp Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O COZMNNJEGNPDED-HOCLYGCPSA-N 0.000 description 2
- 108020005004 Guide RNA Proteins 0.000 description 2
- 241000256257 Heliothis Species 0.000 description 2
- 241000380914 Hesperus Species 0.000 description 2
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 2
- AWHJQEYGWRKPHE-LSJOCFKGSA-N His-Ala-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AWHJQEYGWRKPHE-LSJOCFKGSA-N 0.000 description 2
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 2
- QNILDNVBIARMRK-XVYDVKMFSA-N His-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CN=CN1)N QNILDNVBIARMRK-XVYDVKMFSA-N 0.000 description 2
- PQKCQZHAGILVIM-NKIYYHGXSA-N His-Glu-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O PQKCQZHAGILVIM-NKIYYHGXSA-N 0.000 description 2
- PGTISAJTWZPFGN-PEXQALLHSA-N His-Gly-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O PGTISAJTWZPFGN-PEXQALLHSA-N 0.000 description 2
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 2
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 2
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 2
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 2
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 2
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 2
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 2
- PJLLMGWWINYQPB-PEFMBERDSA-N Ile-Asn-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PJLLMGWWINYQPB-PEFMBERDSA-N 0.000 description 2
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 2
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 2
- CYHJCEKUMCNDFG-LAEOZQHASA-N Ile-Gln-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N CYHJCEKUMCNDFG-LAEOZQHASA-N 0.000 description 2
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 2
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 2
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- JLWLMGADIQFKRD-QSFUFRPTSA-N Ile-His-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CN=CN1 JLWLMGADIQFKRD-QSFUFRPTSA-N 0.000 description 2
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 2
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 2
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 2
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 2
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 2
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 2
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 2
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 2
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- 241000258915 Leptinotarsa Species 0.000 description 2
- 241000258916 Leptinotarsa decemlineata Species 0.000 description 2
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 2
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 2
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 2
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 2
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 2
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 2
- FEHQLKKBVJHSEC-SZMVWBNQSA-N Leu-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FEHQLKKBVJHSEC-SZMVWBNQSA-N 0.000 description 2
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 2
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 2
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 2
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 2
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 2
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 2
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 2
- ONHCDMBHPQIPAI-YTQUADARSA-N Leu-Trp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N ONHCDMBHPQIPAI-YTQUADARSA-N 0.000 description 2
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 2
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- 241001261104 Lobesia botrana Species 0.000 description 2
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 2
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 2
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 2
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 2
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 2
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 2
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 2
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 2
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 2
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 2
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 2
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 2
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 2
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 2
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 2
- NKLDZIPTGKBDBB-HTUGSXCWSA-N Phe-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O NKLDZIPTGKBDBB-HTUGSXCWSA-N 0.000 description 2
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 2
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 2
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 2
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 2
- ZUQACJLOHYRVPJ-DKIMLUQUSA-N Phe-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZUQACJLOHYRVPJ-DKIMLUQUSA-N 0.000 description 2
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 2
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 2
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 2
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 2
- MRWOVVNKSXXLRP-IHPCNDPISA-N Phe-Ser-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MRWOVVNKSXXLRP-IHPCNDPISA-N 0.000 description 2
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 2
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 2
- 241000255969 Pieris brassicae Species 0.000 description 2
- 241000209504 Poaceae Species 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- VPVHXWGPALPDGP-GUBZILKMSA-N Pro-Asn-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPVHXWGPALPDGP-GUBZILKMSA-N 0.000 description 2
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 2
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 2
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 2
- LCWXSALTPTZKNM-CIUDSAMLSA-N Pro-Cys-Glu Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O LCWXSALTPTZKNM-CIUDSAMLSA-N 0.000 description 2
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 2
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 2
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 2
- RYJRPPUATSKNAY-STECZYCISA-N Pro-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@@H]2CCCN2 RYJRPPUATSKNAY-STECZYCISA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 2
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 2
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 2
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 2
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 2
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 2
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 2
- BNUKRHFCHHLIGR-JYJNAYRXSA-N Pro-Trp-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC(=O)O)C(=O)O BNUKRHFCHHLIGR-JYJNAYRXSA-N 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 2
- UCXDHBORXLVBNC-ZLUOBGJFSA-N Ser-Asn-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O UCXDHBORXLVBNC-ZLUOBGJFSA-N 0.000 description 2
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 2
- GRRAECZXRONTEE-UBHSHLNASA-N Ser-Cys-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GRRAECZXRONTEE-UBHSHLNASA-N 0.000 description 2
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 2
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- IOVBCLGAJJXOHK-SRVKXCTJSA-N Ser-His-His Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IOVBCLGAJJXOHK-SRVKXCTJSA-N 0.000 description 2
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 2
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 2
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 2
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 2
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 2
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 2
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 2
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 2
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 2
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 2
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 2
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 2
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 2
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 2
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 2
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 2
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 2
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- MCDVZTRGHNXTGK-HJGDQZAQSA-N Thr-Met-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O MCDVZTRGHNXTGK-HJGDQZAQSA-N 0.000 description 2
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 2
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 2
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 2
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 2
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 2
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 2
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 2
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 2
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 2
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 2
- SCQBNMKLZVCXNX-ZFWWWQNUSA-N Trp-Arg-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N SCQBNMKLZVCXNX-ZFWWWQNUSA-N 0.000 description 2
- XZSJDSBPEJBEFZ-QRTARXTBSA-N Trp-Asn-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O XZSJDSBPEJBEFZ-QRTARXTBSA-N 0.000 description 2
- CZWIHKFGHICAJX-BPUTZDHNSA-N Trp-Glu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 CZWIHKFGHICAJX-BPUTZDHNSA-N 0.000 description 2
- YDTKYBHPRULROG-LTHWPDAASA-N Trp-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YDTKYBHPRULROG-LTHWPDAASA-N 0.000 description 2
- MPYZGXUYLNPSNF-NAZCDGGXSA-N Trp-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O MPYZGXUYLNPSNF-NAZCDGGXSA-N 0.000 description 2
- SWSUXOKZKQRADK-FDARSICLSA-N Trp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SWSUXOKZKQRADK-FDARSICLSA-N 0.000 description 2
- NIHNMOSRSAYZIT-BPNCWPANSA-N Tyr-Ala-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NIHNMOSRSAYZIT-BPNCWPANSA-N 0.000 description 2
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 2
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 2
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 2
- DWJQKEZKLQCHKO-SRVKXCTJSA-N Tyr-Asn-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O DWJQKEZKLQCHKO-SRVKXCTJSA-N 0.000 description 2
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 2
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 2
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 2
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 2
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 2
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 2
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 2
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 2
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 2
- CDBXVDXSLPLFMD-BPNCWPANSA-N Tyr-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDBXVDXSLPLFMD-BPNCWPANSA-N 0.000 description 2
- SOEGLGLDSUHWTI-STECZYCISA-N Tyr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 SOEGLGLDSUHWTI-STECZYCISA-N 0.000 description 2
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 2
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 2
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 2
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 2
- JOQSQZFKFYJKKJ-GUBZILKMSA-N Val-Arg-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N JOQSQZFKFYJKKJ-GUBZILKMSA-N 0.000 description 2
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 2
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 2
- AHHJARQXFFGOKF-NRPADANISA-N Val-Glu-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N AHHJARQXFFGOKF-NRPADANISA-N 0.000 description 2
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 2
- OXGVAUFVTOPFFA-XPUUQOCRSA-N Val-Gly-Cys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N OXGVAUFVTOPFFA-XPUUQOCRSA-N 0.000 description 2
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 2
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 2
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 2
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 2
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 2
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 2
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 2
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 2
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 2
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 2
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 2
- WFTKOJGOOUJLJV-VKOGCVSHSA-N Val-Trp-Ile Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C)=CNC2=C1 WFTKOJGOOUJLJV-VKOGCVSHSA-N 0.000 description 2
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 2
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 229940099112 cornstarch Drugs 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 230000000378 dietary effect Effects 0.000 description 2
- 229940096118 ella Drugs 0.000 description 2
- 239000002158 endotoxin Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- WABYCCJHARSRBH-UHFFFAOYSA-N metaclazepam Chemical compound C12=CC(Br)=CC=C2N(C)C(COC)CN=C1C1=CC=CC=C1Cl WABYCCJHARSRBH-UHFFFAOYSA-N 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 2
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 2
- 235000021317 phosphate Nutrition 0.000 description 2
- 210000002706 plastid Anatomy 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 239000007921 spray Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000006032 tissue transformation Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- OOLLAFOLCSJHRE-ZHAKMVSLSA-N ulipristal acetate Chemical compound C1=CC(N(C)C)=CC=C1[C@@H]1C2=C3CCC(=O)C=C3CC[C@H]2[C@H](CC[C@]2(OC(C)=O)C(C)=O)[C@]2(C)C1 OOLLAFOLCSJHRE-ZHAKMVSLSA-N 0.000 description 2
- 230000035899 viability Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- WHRZCXAVMTUTDD-UHFFFAOYSA-N 1h-furo[2,3-d]pyrimidin-2-one Chemical compound N1C(=O)N=C2OC=CC2=C1 WHRZCXAVMTUTDD-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- 241000722946 Acanthocybium solandri Species 0.000 description 1
- 241001133760 Acoelorraphe Species 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241000218473 Agrotis Species 0.000 description 1
- 241000001996 Agrotis orthogonia Species 0.000 description 1
- 241001652650 Agrotis subterranea Species 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 1
- PJNSIUPOXFBHDM-GUBZILKMSA-N Ala-Arg-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O PJNSIUPOXFBHDM-GUBZILKMSA-N 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 1
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- ISCYZXFOCXWUJU-KZVJFYERSA-N Ala-Thr-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O ISCYZXFOCXWUJU-KZVJFYERSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 1
- 241000531891 Alburnus alburnus Species 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 108090000668 Annexin A2 Proteins 0.000 description 1
- 102100034613 Annexin A2 Human genes 0.000 description 1
- 108090000669 Annexin A4 Proteins 0.000 description 1
- 102100034612 Annexin A4 Human genes 0.000 description 1
- 101000768857 Arabidopsis thaliana 3-phosphoshikimate 1-carboxyvinyltransferase, chloroplastic Proteins 0.000 description 1
- 241001002470 Archips argyrospila Species 0.000 description 1
- 241001423656 Archips rosana Species 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- DQNLFLGFZAUIOW-FXQIFTODSA-N Arg-Cys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DQNLFLGFZAUIOW-FXQIFTODSA-N 0.000 description 1
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 1
- YHQGEARSFILVHL-HJGDQZAQSA-N Arg-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O YHQGEARSFILVHL-HJGDQZAQSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 1
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- VJIQPOJMISSUPO-BVSLBCMMSA-N Arg-Trp-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VJIQPOJMISSUPO-BVSLBCMMSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- 240000001851 Artemisia dracunculus Species 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 1
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 1
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 1
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 1
- HUAOKVVEVHACHR-CIUDSAMLSA-N Asn-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N HUAOKVVEVHACHR-CIUDSAMLSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- BGINHSZTXRJIPP-FXQIFTODSA-N Asn-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BGINHSZTXRJIPP-FXQIFTODSA-N 0.000 description 1
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 1
- FJIRXKVEDFLLOQ-SRVKXCTJSA-N Asn-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N FJIRXKVEDFLLOQ-SRVKXCTJSA-N 0.000 description 1
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 1
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- ASCGFDYEKSRNPL-CIUDSAMLSA-N Asn-Glu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O ASCGFDYEKSRNPL-CIUDSAMLSA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 1
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 1
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 1
- GFGUPLIETCNQGF-DCAQKATOSA-N Asn-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O GFGUPLIETCNQGF-DCAQKATOSA-N 0.000 description 1
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- KYQJHBWHRASMKG-ZLUOBGJFSA-N Asn-Ser-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O KYQJHBWHRASMKG-ZLUOBGJFSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 1
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 1
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 1
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 1
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- DPSUVAPLRQDWAO-YDHLFZDLSA-N Asn-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)N)N DPSUVAPLRQDWAO-YDHLFZDLSA-N 0.000 description 1
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 1
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 1
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 1
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 1
- WLKVEEODTPQPLI-ACZMJKKPSA-N Asp-Gln-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O WLKVEEODTPQPLI-ACZMJKKPSA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- RATOMFTUDRYMKX-ACZMJKKPSA-N Asp-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N RATOMFTUDRYMKX-ACZMJKKPSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- CMCIMCAQIULNDJ-CIUDSAMLSA-N Asp-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N CMCIMCAQIULNDJ-CIUDSAMLSA-N 0.000 description 1
- VMVUDJUXJKDGNR-FXQIFTODSA-N Asp-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N VMVUDJUXJKDGNR-FXQIFTODSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- KACWACLNYLSVCA-VHWLVUOQSA-N Asp-Trp-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KACWACLNYLSVCA-VHWLVUOQSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- BOXNGMVEVOGXOJ-UBHSHLNASA-N Asp-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N BOXNGMVEVOGXOJ-UBHSHLNASA-N 0.000 description 1
- VHUKCUHLFMRHOD-MELADBBJSA-N Asp-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O VHUKCUHLFMRHOD-MELADBBJSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 1
- 235000021537 Beetroot Nutrition 0.000 description 1
- 241000238662 Blatta orientalis Species 0.000 description 1
- 241000255789 Bombyx mori Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 244000188595 Brassica sinapistrum Species 0.000 description 1
- 241000426497 Chilo suppressalis Species 0.000 description 1
- 241000098289 Cnaphalocrocis medinalis Species 0.000 description 1
- 241000252185 Cobitidae Species 0.000 description 1
- 241000720864 Coleophoridae Species 0.000 description 1
- 241001275954 Cortinarius caperatus Species 0.000 description 1
- 241001340508 Crambus Species 0.000 description 1
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 1
- 244000007835 Cyamopsis tetragonoloba Species 0.000 description 1
- 241001635274 Cydia pomonella Species 0.000 description 1
- PKNIZMPLMSKROD-BIIVOSGPSA-N Cys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N PKNIZMPLMSKROD-BIIVOSGPSA-N 0.000 description 1
- UYYZZJXUVIZTMH-AVGNSLFASA-N Cys-Glu-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UYYZZJXUVIZTMH-AVGNSLFASA-N 0.000 description 1
- ZEXHDOQQYZKOIB-ACZMJKKPSA-N Cys-Glu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZEXHDOQQYZKOIB-ACZMJKKPSA-N 0.000 description 1
- ODDOYXKAHLKKQY-MMWGEVLESA-N Cys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N ODDOYXKAHLKKQY-MMWGEVLESA-N 0.000 description 1
- OZSBRCONEMXYOJ-AVGNSLFASA-N Cys-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N OZSBRCONEMXYOJ-AVGNSLFASA-N 0.000 description 1
- NITLUESFANGEIW-BQBZGAKWSA-N Cys-Pro-Gly Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O NITLUESFANGEIW-BQBZGAKWSA-N 0.000 description 1
- BCWIFCLVCRAIQK-ZLUOBGJFSA-N Cys-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O BCWIFCLVCRAIQK-ZLUOBGJFSA-N 0.000 description 1
- IQXSTXKVEMRMMB-XAVMHZPKSA-N Cys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N)O IQXSTXKVEMRMMB-XAVMHZPKSA-N 0.000 description 1
- DXSBGVKEPHDOTD-UBHSHLNASA-N Cys-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N DXSBGVKEPHDOTD-UBHSHLNASA-N 0.000 description 1
- VIOQRFNAZDMVLO-NRPADANISA-N Cys-Val-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIOQRFNAZDMVLO-NRPADANISA-N 0.000 description 1
- QQAYIVHVRFJICE-AEJSXWLSSA-N Cys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N QQAYIVHVRFJICE-AEJSXWLSSA-N 0.000 description 1
- YAHZABJORDUQGO-NQXXGFSBSA-N D-ribulose 1,5-bisphosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)C(=O)COP(O)(O)=O YAHZABJORDUQGO-NQXXGFSBSA-N 0.000 description 1
- 241000289763 Dasygaster padockina Species 0.000 description 1
- 241000489976 Diabrotica undecimpunctata howardi Species 0.000 description 1
- 241000122105 Diatraea Species 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 241001095202 Ecdytolopha fabivora Species 0.000 description 1
- 241000400699 Elasmopalpus Species 0.000 description 1
- 241000400698 Elasmopalpus lignosellus Species 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241001248531 Euchloe <genus> Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 1
- MQANCSUBSBJNLU-KKUMJFAQSA-N Gln-Arg-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQANCSUBSBJNLU-KKUMJFAQSA-N 0.000 description 1
- RRYLMJWPWBJFPZ-ACZMJKKPSA-N Gln-Asn-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RRYLMJWPWBJFPZ-ACZMJKKPSA-N 0.000 description 1
- PONUFVLSGMQFAI-AVGNSLFASA-N Gln-Asn-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PONUFVLSGMQFAI-AVGNSLFASA-N 0.000 description 1
- DXMPMSWUZVNBSG-QEJZJMRPSA-N Gln-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N DXMPMSWUZVNBSG-QEJZJMRPSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 1
- MSHXWFKYXJTLEZ-CIUDSAMLSA-N Gln-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MSHXWFKYXJTLEZ-CIUDSAMLSA-N 0.000 description 1
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 1
- LVRKAFPPFJRIOF-GARJFASQSA-N Gln-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N LVRKAFPPFJRIOF-GARJFASQSA-N 0.000 description 1
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 1
- KFHASAPTUOASQN-JYJNAYRXSA-N Gln-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KFHASAPTUOASQN-JYJNAYRXSA-N 0.000 description 1
- NPMFDZGLKBNFOO-SRVKXCTJSA-N Gln-Pro-His Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NPMFDZGLKBNFOO-SRVKXCTJSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- VFZIDQZAEBORGY-GLLZPBPUSA-N Glu-Gln-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VFZIDQZAEBORGY-GLLZPBPUSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- AOCARQDSFTWWFT-DCAQKATOSA-N Glu-Met-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AOCARQDSFTWWFT-DCAQKATOSA-N 0.000 description 1
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 1
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 1
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 1
- CBOVGULVQSVMPT-CIUDSAMLSA-N Glu-Pro-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CBOVGULVQSVMPT-CIUDSAMLSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- WXONSNSSBYQGNN-AVGNSLFASA-N Glu-Ser-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WXONSNSSBYQGNN-AVGNSLFASA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- BKMOHWJHXQLFEX-IRIUXVKKSA-N Glu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N)O BKMOHWJHXQLFEX-IRIUXVKKSA-N 0.000 description 1
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- ZALGPUWUVHOGAE-GVXVVHGQSA-N Glu-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZALGPUWUVHOGAE-GVXVVHGQSA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 1
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 1
- ZKLYPEGLWFVRGF-IUCAKERBSA-N Gly-His-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZKLYPEGLWFVRGF-IUCAKERBSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 1
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 241001441330 Grapholita molesta Species 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 1
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 1
- HRGGKHFHRSFSDE-CIUDSAMLSA-N His-Asn-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N HRGGKHFHRSFSDE-CIUDSAMLSA-N 0.000 description 1
- OZBDSFBWIDPVDA-BZSNNMDCSA-N His-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N OZBDSFBWIDPVDA-BZSNNMDCSA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- FBCURAVMSXNOLP-JYJNAYRXSA-N His-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBCURAVMSXNOLP-JYJNAYRXSA-N 0.000 description 1
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 1
- WSAILOWUJZEAGC-DCAQKATOSA-N His-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WSAILOWUJZEAGC-DCAQKATOSA-N 0.000 description 1
- 101000583175 Homo sapiens Prolactin-inducible protein Proteins 0.000 description 1
- 241000370519 Hypena Species 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 1
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 1
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 1
- WNQKUUQIVDDAFA-ZPFDUUQYSA-N Ile-Gln-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N WNQKUUQIVDDAFA-ZPFDUUQYSA-N 0.000 description 1
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 1
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 1
- YKLOMBNBQUTJDT-HVTMNAMFSA-N Ile-His-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YKLOMBNBQUTJDT-HVTMNAMFSA-N 0.000 description 1
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- XOZOSAUOGRPCES-STECZYCISA-N Ile-Pro-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XOZOSAUOGRPCES-STECZYCISA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 1
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 1
- MGUTVMBNOMJLKC-VKOGCVSHSA-N Ile-Trp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C(C)C)C(=O)O)N MGUTVMBNOMJLKC-VKOGCVSHSA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 1
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 1
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 1
- WRDTXMBPHMBGIB-STECZYCISA-N Ile-Tyr-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 WRDTXMBPHMBGIB-STECZYCISA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- 235000006173 Larrea tridentata Nutrition 0.000 description 1
- 244000073231 Larrea tridentata Species 0.000 description 1
- 206010024229 Leprosy Diseases 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- 241000721703 Lymantria dispar Species 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- ZAWOJFFMBANLGE-CIUDSAMLSA-N Lys-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N ZAWOJFFMBANLGE-CIUDSAMLSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- UETQMSASAVBGJY-QWRGUYRKSA-N Lys-Gly-His Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 UETQMSASAVBGJY-QWRGUYRKSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- BEGQVWUZFXLNHZ-IHPCNDPISA-N Lys-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 BEGQVWUZFXLNHZ-IHPCNDPISA-N 0.000 description 1
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- WAAZECNCPVGPIV-RHYQMDGZSA-N Lys-Thr-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O WAAZECNCPVGPIV-RHYQMDGZSA-N 0.000 description 1
- YUTZYVTZDVZBJJ-IHPCNDPISA-N Lys-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 YUTZYVTZDVZBJJ-IHPCNDPISA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- 241000555300 Mamestra Species 0.000 description 1
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- NKDSBBBPGIVWEI-RCWTZXSCSA-N Met-Arg-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NKDSBBBPGIVWEI-RCWTZXSCSA-N 0.000 description 1
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 1
- CRGKLOXHKICQOL-GARJFASQSA-N Met-Gln-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N CRGKLOXHKICQOL-GARJFASQSA-N 0.000 description 1
- YAWKHFKCNSXYDS-XIRDDKMYSA-N Met-Glu-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N YAWKHFKCNSXYDS-XIRDDKMYSA-N 0.000 description 1
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 1
- VYXIKLFLGRTANT-HRCADAONSA-N Met-Tyr-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N VYXIKLFLGRTANT-HRCADAONSA-N 0.000 description 1
- 241000819714 Monema flavescens Species 0.000 description 1
- 241001477931 Mythimna unipuncta Species 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 241000256259 Noctuidae Species 0.000 description 1
- 102000002512 Orexin Human genes 0.000 description 1
- 241001147398 Ostrinia nubilalis Species 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 241000179039 Paenibacillus Species 0.000 description 1
- 241000497111 Paralobesia viteana Species 0.000 description 1
- 241000459456 Parapediasia teterrellus Species 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 241000286209 Phasianidae Species 0.000 description 1
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 1
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 1
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 1
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 1
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- KNPVDQMEHSCAGX-UWVGGRQHSA-N Phe-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KNPVDQMEHSCAGX-UWVGGRQHSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 1
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 1
- BVHFFNYBKRTSIU-MEYUZBJRSA-N Phe-His-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BVHFFNYBKRTSIU-MEYUZBJRSA-N 0.000 description 1
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 1
- GZGPMBKUJDRICD-ULQDDVLXSA-N Phe-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O GZGPMBKUJDRICD-ULQDDVLXSA-N 0.000 description 1
- FZBGMXYQPACKNC-HJWJTTGWSA-N Phe-Pro-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FZBGMXYQPACKNC-HJWJTTGWSA-N 0.000 description 1
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 1
- IPVPGAADZXRZSH-RNXOBYDBSA-N Phe-Tyr-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IPVPGAADZXRZSH-RNXOBYDBSA-N 0.000 description 1
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 1
- 241000255972 Pieris <butterfly> Species 0.000 description 1
- 241000907661 Pieris rapae Species 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 1
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- XFFIGWGYMUFCCQ-ULQDDVLXSA-N Pro-His-Tyr Chemical compound C1=CC(O)=CC=C1C[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)[C@H]1[NH2+]CCC1)CC1=CN=CN1 XFFIGWGYMUFCCQ-ULQDDVLXSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- XZBYTHCRAVAXQQ-DCAQKATOSA-N Pro-Met-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XZBYTHCRAVAXQQ-DCAQKATOSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- SNSYSBUTTJBPDG-OKZBNKHCSA-N Pro-Trp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N4CCC[C@@H]4C(=O)O SNSYSBUTTJBPDG-OKZBNKHCSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- 102100030350 Prolactin-inducible protein Human genes 0.000 description 1
- VQXSOUPNOZTNAI-UHFFFAOYSA-N Pyrethrin I Natural products CC(=CC1CC1C(=O)OC2CC(=O)C(=C2C)CC=C/C=C)C VQXSOUPNOZTNAI-UHFFFAOYSA-N 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- QWZIOCFPXMAXET-CIUDSAMLSA-N Ser-Arg-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QWZIOCFPXMAXET-CIUDSAMLSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- NJSPTZXVPZDRCU-UBHSHLNASA-N Ser-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N NJSPTZXVPZDRCU-UBHSHLNASA-N 0.000 description 1
- BLPYXIXXCFVIIF-FXQIFTODSA-N Ser-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N)CN=C(N)N BLPYXIXXCFVIIF-FXQIFTODSA-N 0.000 description 1
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- JAWGSPUJAXYXJA-IHRRRGAJSA-N Ser-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=CC=C1 JAWGSPUJAXYXJA-IHRRRGAJSA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 1
- BVLGVLWFIZFEAH-BPUTZDHNSA-N Ser-Pro-Trp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O BVLGVLWFIZFEAH-BPUTZDHNSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- NERYDXBVARJIQS-JYBASQMISA-N Ser-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N)O NERYDXBVARJIQS-JYBASQMISA-N 0.000 description 1
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 241001575047 Suleima Species 0.000 description 1
- 244000204900 Talipariti tiliaceum Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- JHBHMCMKSPXRHV-NUMRIWBASA-N Thr-Asn-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JHBHMCMKSPXRHV-NUMRIWBASA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- QWMPARMKIDVBLV-VZFHVOOUSA-N Thr-Cys-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O QWMPARMKIDVBLV-VZFHVOOUSA-N 0.000 description 1
- ODSAPYVQSLDRSR-LKXGYXEUSA-N Thr-Cys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O ODSAPYVQSLDRSR-LKXGYXEUSA-N 0.000 description 1
- KZUJCMPVNXOBAF-LKXGYXEUSA-N Thr-Cys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KZUJCMPVNXOBAF-LKXGYXEUSA-N 0.000 description 1
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 1
- XXNLGZRRSKPSGF-HTUGSXCWSA-N Thr-Gln-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O XXNLGZRRSKPSGF-HTUGSXCWSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 1
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 1
- JRAUIKJSEAKTGD-TUBUOCAGSA-N Thr-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N JRAUIKJSEAKTGD-TUBUOCAGSA-N 0.000 description 1
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 1
- PCMDGXKXVMBIFP-VEVYYDQMSA-N Thr-Met-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMDGXKXVMBIFP-VEVYYDQMSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 1
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 1
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 1
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 1
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 1
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 1
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- 241000255901 Tortricidae Species 0.000 description 1
- 241000219793 Trifolium Species 0.000 description 1
- WACMTVIJWRNVSO-CWRNSKLLSA-N Trp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O WACMTVIJWRNVSO-CWRNSKLLSA-N 0.000 description 1
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 1
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 1
- DNUJCLUFRGGSDJ-YLVFBTJISA-N Trp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DNUJCLUFRGGSDJ-YLVFBTJISA-N 0.000 description 1
- YRXXUYPYPHRJPB-RXVVDRJESA-N Trp-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N YRXXUYPYPHRJPB-RXVVDRJESA-N 0.000 description 1
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 1
- GIAMKIPJSRZVJB-IHPCNDPISA-N Trp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GIAMKIPJSRZVJB-IHPCNDPISA-N 0.000 description 1
- XGFOXYJQBRTJPO-PJODQICGSA-N Trp-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XGFOXYJQBRTJPO-PJODQICGSA-N 0.000 description 1
- XOLLWQIBBLBAHQ-WDSOQIARSA-N Trp-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O XOLLWQIBBLBAHQ-WDSOQIARSA-N 0.000 description 1
- GBEAUNVBIMLWIB-IHPCNDPISA-N Trp-Ser-Phe Chemical compound C([C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 GBEAUNVBIMLWIB-IHPCNDPISA-N 0.000 description 1
- SGQSAIFDESQBRA-IHPCNDPISA-N Trp-Tyr-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SGQSAIFDESQBRA-IHPCNDPISA-N 0.000 description 1
- ZJPSMXCFEKMZFE-IHPCNDPISA-N Trp-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O ZJPSMXCFEKMZFE-IHPCNDPISA-N 0.000 description 1
- 241001389010 Tuta Species 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- OEVJGIHPQOXYFE-SRVKXCTJSA-N Tyr-Asn-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OEVJGIHPQOXYFE-SRVKXCTJSA-N 0.000 description 1
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 1
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 1
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 1
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 1
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 1
- ADECJAKCRKPSOR-ULQDDVLXSA-N Tyr-His-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ADECJAKCRKPSOR-ULQDDVLXSA-N 0.000 description 1
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 1
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 1
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 1
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- BCOBSVIZMQXKFY-KKUMJFAQSA-N Tyr-Ser-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O BCOBSVIZMQXKFY-KKUMJFAQSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 1
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- FZADUTOCSFDBRV-RNXOBYDBSA-N Tyr-Tyr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 FZADUTOCSFDBRV-RNXOBYDBSA-N 0.000 description 1
- RGJZPXFZIUUQDN-BPNCWPANSA-N Tyr-Val-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O RGJZPXFZIUUQDN-BPNCWPANSA-N 0.000 description 1
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- ZSZFTYVFQLUWBF-QXEWZRGKSA-N Val-Asp-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N ZSZFTYVFQLUWBF-QXEWZRGKSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- DLYOEFGPYTZVSP-AEJSXWLSSA-N Val-Cys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N DLYOEFGPYTZVSP-AEJSXWLSSA-N 0.000 description 1
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- OPGWZDIYEYJVRX-AVGNSLFASA-N Val-His-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OPGWZDIYEYJVRX-AVGNSLFASA-N 0.000 description 1
- CHWRZUGUMAMTFC-IHRRRGAJSA-N Val-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CNC=N1 CHWRZUGUMAMTFC-IHRRRGAJSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- SVLAAUGFIHSJPK-JYJNAYRXSA-N Val-Trp-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CO)C(=O)O)N SVLAAUGFIHSJPK-JYJNAYRXSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- UELITFHSCLAHKR-UHFFFAOYSA-N acibenzolar-S-methyl Chemical compound CSC(=O)C1=CC=CC2=C1SN=N2 UELITFHSCLAHKR-UHFFFAOYSA-N 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 230000011681 asexual reproduction Effects 0.000 description 1
- 238000013465 asexual reproduction Methods 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 210000004666 bacterial spore Anatomy 0.000 description 1
- HNYOPLTXPVRDBG-UHFFFAOYSA-M barbiturate Chemical compound O=C1CC(=O)[N-]C(=O)N1 HNYOPLTXPVRDBG-UHFFFAOYSA-M 0.000 description 1
- 229940125717 barbiturate Drugs 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000013065 commercial product Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229960002126 creosote Drugs 0.000 description 1
- 238000012272 crop production Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009313 farming Methods 0.000 description 1
- 230000035611 feeding Effects 0.000 description 1
- 230000004634 feeding behavior Effects 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 231100000502 fertility decrease Toxicity 0.000 description 1
- 244000037666 field crops Species 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000021393 food security Nutrition 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 231100000086 high toxicity Toxicity 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 238000011905 homologation Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 210000003000 inclusion body Anatomy 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 235000015094 jam Nutrition 0.000 description 1
- 239000008274 jelly Substances 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010043322 lysyl-tryptophyl-alpha-lysine Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007758 mating behavior Effects 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 244000000010 microbial pathogen Species 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 230000017066 negative regulation of growth Effects 0.000 description 1
- 230000006780 non-homologous end joining Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 108060005714 orexin Proteins 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 150000004045 organic chlorine compounds Chemical class 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- HYJYGLGUBUDSLJ-UHFFFAOYSA-N pyrethrin Natural products CCC(=O)OC1CC(=C)C2CC3OC3(C)C2C2OC(=O)C(=C)C12 HYJYGLGUBUDSLJ-UHFFFAOYSA-N 0.000 description 1
- VJFUPGQZSXIULQ-XIGJTORUSA-N pyrethrin II Chemical compound CC1(C)[C@H](/C=C(\C)C(=O)OC)[C@H]1C(=O)O[C@@H]1C(C)=C(C\C=C/C=C)C(=O)C1 VJFUPGQZSXIULQ-XIGJTORUSA-N 0.000 description 1
- 229910052705 radium Inorganic materials 0.000 description 1
- HCWPIIXVSYCSAN-UHFFFAOYSA-N radium atom Chemical compound [Ra] HCWPIIXVSYCSAN-UHFFFAOYSA-N 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
- C07K14/325—Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N37/00—Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids
- A01N37/18—Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids containing the group —CO—N<, e.g. carboxylic acid amides or imides; Thio analogues thereof
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N37/00—Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids
- A01N37/44—Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids containing at least one carboxylic group or a thio analogue, or a derivative thereof, and a nitrogen atom attached to the same carbon skeleton by a single or double bond, this nitrogen atom not being a member of a derivative or of a thio analogue of a carboxylic group, e.g. amino-carboxylic acids
- A01N37/46—N-acyl derivatives
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
- C12N15/8286—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/6895—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/5308—Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/13—Plant traits
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/195—Assays involving biological materials from specific organisms or of a specific nature from bacteria
- G01N2333/32—Assays involving biological materials from specific organisms or of a specific nature from bacteria from Bacillus (G)
- G01N2333/325—Bacillus thuringiensis crystal protein (delta-endotoxin)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/435—Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
- G01N2333/43504—Assays involving biological materials from specific organisms or of a specific nature from animals; from humans from invertebrates
- G01N2333/43552—Assays involving biological materials from specific organisms or of a specific nature from animals; from humans from invertebrates from insects
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Pest Control & Pesticides (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Botany (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Insects & Arthropods (AREA)
- Food Science & Technology (AREA)
- Pathology (AREA)
- General Physics & Mathematics (AREA)
- Agronomy & Crop Science (AREA)
- Dentistry (AREA)
- Environmental Sciences (AREA)
- Tropical Medicine & Parasitology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
나비목 해충 종에 대해 독성 활성을 나타내는 살충 단백질이 개시되어 있되, 상기 살충 단백질은 TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL을 포함하지만, 이들로 제한되지는 않는다. 개시된 살충 단백질 중 하나 이상을 코딩하는 재조합 핵산 서열을 함유하는 DNA 작제물이 제공된다. 본 발명의 살충 단백질을 코딩하는 재조합 핵산 서열을 함유하는, 나비목 침입에 내성인 형질전환 식물, 식물 세포, 종자 및 식물 부분이 제공된다. 생물학적 샘플에서 본 발명의 재조합 핵산 서열 또는 단백질의 존재를 검출하는 방법 및 TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 살충 단백질 중 어느 하나를 사용하여 나비목 종 해충을 방제하는 방법이 또한 제공된다.
Description
관련 출원에 대한 참조
본 출원은 2016년 10월 10일자로 출원된 미국 가출원 제62/406,082호(본 명세서에서 참고로 그 전문이 포함됨)의 이익을 주장한다.
서열 목록의 포함
서열 목록의 컴퓨터 판독 가능한 형태를 함유하는 파일명 "MONS426WO_ST25.txt"는 2017년 10월 8일자에 생성되었다. 이 파일은 (MS-Windows(등록상표)에서 측정된) 77,030바이트이다(전자 제출(미국 특허청 EFS-Web 제출 시스템 사용)에 의해 동시에 제출되고, 본 명세서에서 참고로 그 전문이 포함됨).
기술 분야
본 발명은 일반적으로 곤충 저해 단백질의 분야에 관한 것이다. 농작물 및 종자의 농업적으로 관련된 해충에 대해 곤충 저해 활성을 나타내는 단백질의 신규한 종류가 개시되어 있다. 특히, 단백질의 개시된 종류는 농작물 및 종자의 농업적으로 관련된 해충, 특히 곤충 해충의 나비목 종에 대해 살충 활성이다. 하나 이상의 개시된 독소 단백질을 코딩하는 재조합 폴리뉴클레오타이드 작제물을 함유하는 식물, 식물 부분 및 종자가 제공된다.
무엇보다도 옥수수, 대두, 사탕수수, 쌀, 밀, 야채 및 면을 포함하는 농업적으로 유의미한 식물로부터 작물 수율의 개선은 점점 더 중요해진다. 먹히고 입히고 성장하는 인간 집단에 대한 에너지를 공급하기 위한 농업 제품에 대한 증가하는 수요 이외에, 기후 관련된 효과 및 영농에 대한 것 이외에 토지를 사용하려는 성장하는 집단으로부터의 압박은 농사에 이용 가능한 경작 가능한 토지의 양을 감소시키는 것으로 예측된다. 이 인자는 특히 식물 바이오기술 및 농경 실행에서 주요 개선의 부재 하에 식량 안보의 암울한 예측을 발생시켰다. 이 압박의 견지에서, 기술, 농업 기법 및 해충 관리에서의 환경적으로 지속 가능한 개선은 농사에 이용 가능한 경작 가능한 토지의 제한된 양에서 작물 생산을 확장시키는 필수적인 도구이다.
곤충, 특히 나비목 및 딱정벌레목의 목 내의 곤충은 밭 작물에 대한 손상의 주요 원인으로 생각되어서, 침입된 면적에 걸쳐 작물 수율을 감소시킨다. 농업에 부정적으로 영향을 미치는 나비목 해충 종은 근대 거염벌레(스포돕테라 엑시구아(Spodoptera exigua)), 옥수수 귀벌레(헬리코베르파 제아(Helicoverpa zea)), 면 잎 벌레(알라바마 아르길라세아(Alabama argillacea)), 유럽 옥수수 나무좀(오스트리니아 누빌랄리스(Ostrinia nubilalis)), 밤나방유충(스포돕테라 푸리기페르다)(Spodoptera frugiperda), 올드 월드 솜벌레(헬리코베르파 아르미게라(Helicoverpa armigera)), 오리엔탈 잎 벌레(스포돕테라 리투라(Spodoptera litura)), 분홍 솜벌레(펙티노포라 고시피엘라(Pectinophora gossypiella)), Cry1Ac 내성 분홍 솜벌레(펙티노포라 고시피엘라), 대두 자벌레(크리소데익시스 인클루덴스(Chrysodeixis includens)), 써던 거염벌레(스포돕테라 에리다니아(Spodoptera eridania)), 사우쓰웨스턴 옥수수 나무좀(디아트라에아 그라디오셀라(Diatraea grandiosella)), 점무늬 솜벌레(에아리아스 비텔라(Earias vittella)), 사탕수수 나무좀(디아트라에아 사카랄리스(Diatraea saccharalis)), 회색담배나방(헬리오티스 비레센스(Heliothis virescens)) 및 벨벳콩 애벌레(안티카르시아 겜마탈리스(Anticarsia gemmatalis))를 포함하지만, 이들로 제한되지는 않는다.
역사적으로, 합성 화학 살충제의 강력한 적용은 농업에서 해충 방제 물질로서 의존되다. 출현하는 내성 문제 이외에 환경 및 인간 건강에 대한 우려는 생물학적 농약의 조사 및 개발을 자극하였다. 이 조사 노력은 박테리아를 포함하는 다양한 곤충 병원성 미생물 종의 진보적인 발견 및 사용을 발생시켰다.
곤충 병원성 박테리아, 특히 바실러스 속에 속하는 박테리아의 가능성이 생물학적 해충 방제 물질로서 발견되고 개발되었을 때 생물학적 방제 패러다임이 바꿨다. Bt 균주가 특정한 곤충에 대해 높은 독성을 나타낸다는 것이 발견된 이후로, 박테리아 바실러스 튜링겐시스(Bt)의 균주는 살충 단백질에 대한 소스로서 사용되었다. Bt 균주는 포자형성의 시작 시 및 정지상 증식기(예를 들어, Cry 단백질) 동안 부아포 결정질 봉입체 내에 국재화된 델타-내독소를 생성시키는 것으로 공지되어 있고, 분비된 살충 단백질을 생산하는 것으로 또한 공지되어 있다. 감수성인 곤충에 의한 침입 시, 델타-내독소, 및 분비된 독소는 중장 상피의 표면에서 이의 효과를 발휘하여서, 세포막을 파괴하여서, 세포 파괴 및 사멸을 발생시킨다.
살충 단백질을 코딩하는 유전자는 Bt 이외의 박테리아 종, 예를 들어 다른 바실러스 및 다양한 추가적인 박테리아 종, 예컨대 브레비바실러스 라테로스포루스, 라이시니바실러스 스파에리쿠스(이전에 바실러스 스파에리쿠스로 공지된 "Ls") 및 파에니바실러스 포필리아에에서 또한 확인되었다.
결정질 및 분비된 가용성 살충 독소는 이의 숙주에 고도로 특이적이고, 화학 살충제에 대한 세계적인 동의를 얻었다. 예를 들어, 살충 독소 단백질은 곤충 침입으로부터 농업적으로 중요한 식물을 보호하고, 화학 농약 분야에 대한 수요를 감소시키고, 수율을 증가시키기 위해 다양한 농업 분야에서 사용된다. 살충 독소 단백질은 기계적 방법, 예컨대 식물 표면에 대한 다양한 박테리아 균주를 함유하는 미생물 제제를 산재시키기 위한 살포에 의해, 그리고 살충 독소 단백질을 발현하는 형질전환 식물 및 종자를 생성하기 위한 유전자 형질전환 기법을 이용함으로써 농작물의 농업적으로 관련된 해충을 방제하기 위해 사용된다.
살충 독소 단백질을 발현하는 형질전환 식물의 사용은 세계적으로 채택되었다. 예를 들어, 2012년에, 2610만개 헥타르가 Bt 독소를 발현하는 형질전환 작물에 의해 식목되었다(James, C., Global Status of Commercialized Biotech/GM Crops: 2012. ISAAA Brief No. 44). 형질전환 곤충 보호된 작물의 세계적인 사용 및 이 작물에서 사용된 살충 독소 단백질의 제한된 수는 현재 사용되는 살충 단백질에 내성을 부여하는 기존의 곤충 대립유전자에 대한 선택 압박을 생성하였다.
표적 해충에서의 살충 독소 단백질에 대한 내성의 발생은 살충 독소 단백질을 발현하는 형질전환 작물에 대한 곤충 내성의 증가를 관리하는 데 유용한 살충 독소 단백질의 새로운 형태의 발견 및 개발에 대한 계속적인 수요를 생성한다. 개선된 효율을 갖고 감수성인 더 광범위한 스펙트럼의 곤충 종에 대한 방제를 나타내는 새로운 단백질 독소는 내성 대립유전자를 발생시킬 수 있는 생존한 곤충의 수를 감소시킬 것이다. 또한, 동일한 곤충 해충에 대해 독성이고 상이한 작용 방식을 나타내는 2개 이상의 형질전환 살충 독소 단백질의 하나의 식물에서의 사용은 임의의 단일 표적 곤충 종에서의 내성의 확률을 감소시킨다.
따라서, 본 발명자들은 유사한 독소 단백질, 변이체 단백질, 및 표적 나비목 종, 특히 근대 거염벌레(스포돕테라 엑시구아), 옥수수 귀벌레(헬리코베르파 제아), 면 잎 벌레(알라바마 아르길라세아), 유럽 옥수수 나무좀(오스트리니아 누빌랄리스), 밤나방유충(스포돕테라 푸리기페르다), 올드 월드 솜벌레(헬리코베르파 아르미게라), 오리엔탈 잎 벌레(스포돕테라 리투라), 분홍 솜벌레(펙티노포라 고시피엘라), Cry1Ac 내성 분홍 솜벌레(펙티노포라 고시피엘라), 대두 자벌레(크리소데익시스 인클루덴스), 써던 거염벌레(스포돕테라 에리다니아), 사우쓰웨스턴 옥수수 나무좀(디아트라에아 그라디오셀라), 점무늬 솜벌레(에아리아스 비텔라), 사탕수수 나무좀(디아트라에아 사카랄리스), 회색담배나방(헬리오티스 비레센스) 및 벨벳콩 애벌레(안티카르시아 겜마탈리스)에 대한 살충 활성을 나타내는 예시적인 재조합 단백질과 함께 바실러스 튜링겐시스로부터의 신규한 단백질 독소 과를 본 명세서에 개시한다.
농작물의 하나 이상의 해충에 대해 저해 활성을 나타내는 것으로 밝혀진 TIC4472 단백질 독소 종류에 속하는 TIC4472, TIC1425 및 TIC2613으로서 본 명세서에서 언급된, 곤충 저해 활성을 갖는 살충 단백질(독소 단백질)의 신규한 그룹이 본 명세서에 개시되어 있다. TIC4472 단백질 및 TIC4472 단백질 독소 종류에서의 단백질은 단독으로 제제 및 식물계에서 다른 살충 단백질 및 독성 물질과 조합되어 사용될 수 있어서, 현재 농업 시스템에서의 사용에 대해 살충 단백질 및 살충제 화학물질에 대한 대안을 제공한다.
일 실시형태에서, 살충 단백질 또는 이의 단편을 코딩하는 폴리뉴클레오타이드 분절에 작동 가능하게 연결된 이종성 촉진자 단편을 포함하는 재조합 핵산 분자가 본 출원에 개시되어 있고, 여기서 (a) 상기 살충 단백질은 서열 번호 4, 서열 번호 2 또는 서열 번호 6의 아미노산 서열을 포함하거나; (b) 상기 살충 단백질은 (i) 서열 번호 4, 서열 번호 2 또는 서열 번호 6과 적어도 93% 또는 95% 또는 98% 또는 99% 또는 약 100%의 아미노산 서열 동일성; 또는 (ii) 서열 번호 8 또는 서열 번호 10과 적어도 73% 또는 75% 또는 80% 또는 85% 또는 90% 또는 95% 또는 약 100%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하거나; (c) 상기 폴리뉴클레오타이드 분절은 서열 번호 3, 서열 번호 1, 서열 번호 5, 서열 번호 7 또는 서열 번호 9의 뉴클레오타이드 서열을 갖는 폴리뉴클레오타이드에 혼성화되거나; (d) 살충 단백질 또는 이의 단편을 코딩하는 상기 폴리뉴클레오타이드 분절은 서열 번호 3, 서열 번호 1, 서열 번호 5, 서열 번호 7 또는 서열 번호 9의 뉴클레오타이드 서열과 적어도 65% 또는 70% 또는 75% 또는 80% 또는 85% 또는 90% 또는 95% 또는 98% 또는 99% 또는 약 100%의 서열 동일성을 갖는 폴리뉴클레오타이드 서열을 포함하거나; (e) 상기 재조합 핵산 분자는 벡터와 작동 가능하게 연결되고, 상기 벡터는 플라스미드, 파지미드, 박미드(bacmid), 코스미드 및 박테리아 또는 효모 인공 염색체로 이루어진 군으로부터 선택된다. 재조합 핵산 분자는 식물에서 살충 단백질을 발현하도록 작용하는 서열을 포함하거나; 식물 세포에서 살충 단백질의 살충 유효량을 생성하도록 발현된다.
본 출원의 또 다른 실시형태에서, 본 출원의 재조합 핵산 분자를 포함하는 숙주 세포가 제공되고, 여기서 숙주 세포는 박테리아 및 식물 세포로 이루어진 군으로부터 선택된다. 고안된 박테리아 숙주 세포는 아그로박테륨(Agrobacterium), 리조븀(Rhizobium), 바실러스(Bacillus), 브레비바실러스(Brevibacillus), 에스체리치아(Escherichia), 슈도모나스(Pseudomonas), 클레브시엘라(Klebsiella), 판토에아(Pantoea) 및 에르위니아(Erwinia)를 포함한다. 소정의 실시형태에서, 상기 바실러스 종은 바실러스 세레우스(Bacillus cereus) 또는 바실러스 튜링겐시스(Bacillus thuringiensis)이고, 상기 브레비바실러스는 브레비바실러스 라테로스페로우스(Brevibacillus laterosperous)이고, 또는 에스체리치아는 에스체리치아 콜라이(Escherichia coli)이다. 고안된 식물 숙주 세포는 쌍떡잎식물 식물 세포 및 외떡잎식물 식물 세포를 포함한다. 고안된 식물 세포는 알팔파, 바나나, 보리, 콩, 브로콜리, 양배추, 배추속, 당근, 카사바, 피마자, 꽃양배추, 셀러리, 병아리콩, 배추, 감귤류, 코코넛, 커피, 옥수수, 클로버, 면(고시퓸 종), 조롱박, 오이, 미송, 가지, 유칼립투스, 아마, 마늘, 포도, 홉, 리크, 상추, 테에다 소나무(Loblolly pine), 수수, 멜론, 견과, 귀리, 올리브, 양파, 관상품, 팜, 목초, 완두콩, 땅콩, 후추, 나무콩, 소나무, 감자, 포플러, 호박, 라디아타 소나무(Radiata pine), 무, 유채, 쌀, 근경, 호밀, 잇꽃, 관목, 수수, 남부 소나무, 대두, 시금치, 호박, 딸기, 사탕무, 사탕수수, 해바라기, 사탕 옥수수, 스위트 검, 고구마, 스위치그래스, 차, 담배, 토마토, 라이밀, 잔디, 수박 및 밀 식물 세포를 추가로 포함한다.
또 다른 실시형태에서, 살충 단백질은 근대 거염벌레(스포돕테라 엑시구아), 옥수수 귀벌레(헬리코베르파 제아), 면 잎 벌레(알라바마 아르길라세아), 유럽 옥수수 나무좀(오스트리니아 누빌랄리스), 밤나방유충(스포돕테라 푸리기페르다), 올드 월드 솜벌레(헬리코베르파 아르미게라), 오리엔탈 잎 벌레(스포돕테라 리투라), 분홍 솜벌레(펙티노포라 고시피엘라), Cry1Ac 내성 분홍 솜벌레(펙티노포라 고시피엘라), 대두 자벌레(크리소데익시스 인클루덴스), 써던 거염벌레(스포돕테라 에리다니아), 사우쓰웨스턴 옥수수 나무좀(디아트라에아 그라디오셀라), 점무늬 솜벌레(에아리아스 비텔라), 사탕수수 나무좀(디아트라에아 사카랄리스), 회색담배나방(헬리오티스 비레센스) 및 벨벳콩 애벌레(안티카르시아 겜마탈리스)를 포함하는 나비목 곤충에 대해 활성을 나타낸다.
살충 단백질 또는 이의 단편을 코딩하는 폴리뉴클레오타이드 분절에 작동 가능하게 연결된 이종성 촉진자 단편을 포함하는 재조합 핵산 분자를 포함하는 식물이 본 출원에 또한 고안되고, 여기서 (a) 상기 살충 단백질은 서열 번호 4, 서열 번호 2 또는 서열 번호 6의 아미노산 서열을 포함하거나; (b) 상기 살충 단백질은 (i) 서열 번호 4, 서열 번호 2 또는 서열 번호 6과 적어도 93% 또는 95% 또는 98% 또는 99% 또는 약 100%의 아미노산 서열 동일성; 또는 (ii) 서열 번호 8 또는 서열 번호 10과 적어도 73% 또는 75% 또는 80% 또는 85% 또는 90% 또는 95% 또는 약 100%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하거나; (c) 상기 폴리뉴클레오타이드 분절은 엄격한 혼성화 조건 하에 서열 번호 3 또는 서열 번호 9의 뉴클레오타이드 서열의 보체에 혼성화되거나; (d) 상기 식물은 상기 살충 단백질의 검출 가능한 양을 나타낸다. 소정의 실시형태에서, 살충 단백질은 서열 번호 4, 서열 번호 2, 서열 번호 6, 서열 번호 8 또는 서열 번호 10을 포함한다. 일 실시형태에서, 식물은 쌍떡잎식물 식물 또는 외떡잎식물 식물 중 어느 하나이다. 또 다른 실시형태에서, 식물은 알팔파, 바나나, 보리, 콩, 브로콜리, 양배추, 배추속, 당근, 카사바, 피마자, 꽃양배추, 셀러리, 병아리콩, 배추, 감귤류, 코코넛, 커피, 옥수수, 클로버, 면, 조롱박, 오이, 미송, 가지, 유칼립투스, 아마, 마늘, 포도, 홉, 리크, 상추, 테에다 소나무, 수수, 멜론, 견과, 귀리, 올리브, 양파, 관상품, 팜, 목초, 완두콩, 땅콩, 후추, 나무콩, 소나무, 감자, 포플러, 호박, 라디아타 소나무, 무, 유채, 쌀, 근경, 호밀, 잇꽃, 관목, 수수, 남부 소나무, 대두, 시금치, 호박, 딸기, 사탕무, 사탕수수, 해바라기, 사탕 옥수수, 스위트 검, 고구마, 스위치그래스, 차, 담배, 토마토, 라이밀, 잔디, 수박 및 밀로 이루어진 군으로부터 추가로 선택된다.
추가의 실시형태에서, 재조합 핵산 분자를 포함하는 종자가 개시된다.
또 다른 실시형태에서, 본 출원에 개시된 재조합 핵산 분자를 포함하는 곤충 저해 조성물이 고안된다. 곤충 저해 조성물은 상기 살충 단백질과 다른 적어도 하나의 다른 살충제를 코딩하는 뉴클레오타이드 서열을 추가로 포함할 수 있다. 소정의 실시형태에서, 적어도 하나의 다른 살충제는 곤충 저해 단백질, 곤충 저해 dsRNA 분자 및 보조 단백질로 이루어진 군으로부터 선택된다. 곤충 저해 조성물 내의 적어도 하나의 다른 살충제가 나비목, 딱정벌레목 또는 반시목의 목의 하나 이상의 해충 종에 대해 활성을 나타낸다는 것이 또한 고안된다. 곤충 저해 조성물 내의 적어도 하나의 다른 살충제는 일 실시형태에서 Cry1A, Cry1Ab, Cry1Ac, Cry1A.105, Cry1Ae, Cry1B, Cry1C, Cry1C 변이체, Cry1D, Cry1E, Cry1F, Cry1A/F 키메라, Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry2A, Cry2Ab, Cry2Ae, Cry3, Cry3A 변이체, Cry3B, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry34, Cry35, Cry43A, Cry43B, Cry51Aa1, ET29, ET33, ET34, ET35, ET66, ET70, TIC400, TIC407, TIC417, TIC431, TIC800, TIC807, TIC834, TIC853, TIC900, TIC901, TIC1201, TIC1415, TIC2160, TIC3131, TIC836, TIC860, TIC867, TIC869, TIC1100, VIP3A, VIP3B, VIP3Ab, AXMI-AXMI-, AXMI-88, AXMI-97, AXMI-102, AXMI-112, AXMI-117, AXMI-100, AXMI-115, AXMI-113, 및 AXMI-005, AXMI134, AXMI-150, AXMI-171, AXMI-184, AXMI-196, AXMI-204, AXMI-207, AXMI-209, AXMI-205, AXMI-218, AXMI-220, AXMI-221z, AXMI-222z, AXMI-223z, AXMI-224z 및 AXMI-225z, AXMI-238, AXMI-270, AXMI-279, AXMI-345, AXMI-335, AXMI-R1 및 이의 변이체, IP3 및 이의 변이체, DIG-3, DIG-5, DIG-10, DIG-657 및 DIG-11 단백질로 이루어진 군으로부터 선택된다.
본 출원에 개시된 재조합 핵산 분자의 검출 가능한 양을 포함하는 소비재(commodity product)가 또한 고안된다. 이러한 소비재는 곡물 취급자가 담은 소비재 옥수수, 옥수수 플레이크, 옥수수 케이크, 옥수수 밀가루, 옥수수 가루, 옥수수 시럽, 옥수수 오일, 옥수수 사일리지, 옥수수 전분, 옥수수 시리얼 등, 및 상응하는 대두, 쌀, 밀, 수수, 나무콩, 땅콩, 과일, 멜론, 및 식물성 소비재, 예를 들어, 적용 가능한 경우, 주스, 농축물, 잼, 젤리, 마멀레이드 및 검출 가능한 양의 본 출원의 이러한 폴리뉴클레오타이드 및 또는 폴리펩타이드를 함유하는 이러한 소비재의 다른 식용 가능한 형태, 전체 또는 처리된 면 종자, 면 오일, 린트, 먹이 또는 사료에 대해 처리된 종자 및 식물 일부, 섬유, 제지, 바이오매스, 및 연료 생성물, 예컨대 면 오일로부터 유래된 연료 또는 조면기 폐기물로부터 유래된 펠릿, 전체 또는 처리된 대두 종자, 대두유, 대두 단백질, 대두 가루, 대두 밀가루, 대두 플레이크, 대두 겨, 대두 밀크, 대두 치즈, 대두 와인, 대두를 포함하는 동물 사료, 대두를 포함하는 제지, 대두를 포함하는 크림, 대두 바이오매스, 및 대두 식물 및 대두 식물 일부를 사용하여 제조된 연료 생성물을 포함한다.
본 출원에 개시된 재조합 핵산 분자를 포함하는 종자를 제조하는 방법이 본 출원에서 또한 고안된다. 상기 방법은 본 출원에 개시된 재조합 핵산 분자를 포함하는 종자 중 적어도 하나를 식목하는 단계; 종자로부터 식물을 성장시키는 단계; 및 식물로부터 종자를 수확하는 단계를 포함하고, 여기서 수확된 종자는 본 출원에서 재조합 핵산 분자를 포함한다.
또 다른 예시적인 실시형태에서, 곤충 침입에 대한 식물 내성이 제공되고, 여기서 상기 식물의 세포는 (a) 서열 번호 4, 서열 번호 2 또는 서열 번호 6에 기재된 바와 같은 살충 단백질의 살충 유효량을 코딩하는 재조합 핵산 분자; 또는 (b) (i) 서열 번호 4, 서열 번호 2 또는 서열 번호 6과 적어도 93% 또는 95% 또는 약 100%의 아미노산 서열 동일성; 또는 (ii) 서열 번호 8 또는 서열 번호 10과 적어도 73% 또는 75% 또는 80% 또는 85% 또는 90% 또는 95% 또는 약 100%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질의 살충 유효량을 포함한다.
나비목 종 해충을 방제하고, 식물, 특히 농작물의 나비목 종 해충 침입을 방제하는 방법이 본 출원에 또한 개시되어 있다. 상기 방법은, 일 실시형태에서, (a) 해충을 서열 번호 4, 서열 번호 2 또는 서열 번호 6에 기재된 바와 같은 살충 단백질의 살충 유효량과 접촉시키는 단계; 또는 (b) 해충을 (i) 서열 번호 4, 서열 번호 2 또는 서열 번호 6과 적어도 93% 또는 95% 또는 약 100%의 아미노산 서열 동일성; 또는 (ii) 서열 번호 8 또는 서열 번호 10과 적어도 73% 또는 75% 또는 80% 또는 85% 또는 90% 또는 95% 또는 약 100%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하는 하나 이상의 살충 단백질의 살충 유효량과 접촉시키는 단계를 포함한다.
살충 단백질 또는 이의 단편을 코딩하는 폴리뉴클레오타이드 분절을 포함하는 재조합 핵산 분자의 존재를 검출하는 방법이 본 명세서에 추가로 제공되고, 여기서 (a) 상기 살충 단백질은 서열 번호 4, 서열 번호 2 또는 서열 번호 6의 아미노산 서열을 포함하거나; (b) 상기 살충 단백질은 (i) 서열 번호 4, 서열 번호 2 또는 서열 번호 6과 적어도 93% 또는 95% 또는 98% 또는 99% 또는 약 100%의 아미노산 서열 동일성; 또는 (ii) 서열 번호 8 또는 서열 번호 10과 적어도 73% 또는 75% 또는 80% 또는 85% 또는 90% 또는 95% 또는 약 100%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하거나; (c) 상기 폴리뉴클레오타이드 분절은 서열 번호 4, 서열 번호 2, 서열 번호 6, 서열 번호 8 또는 서열 번호 10의 뉴클레오타이드 서열을 갖는 폴리뉴클레오타이드에 혼성화된다. 본 발명의 일 실시형태에서, 상기 방법은 엄격한 혼성화 조건 하에 본 명세서에 제공된 살충 단백질 또는 이의 단편을 코딩하는 폴리뉴클레오타이드 분절을 포함하는 식물로부터의 게놈 DNA과 혼성화되고, 이러한 혼성화 조건 하에 그 분절을 포함하지 않는 달리 동질유전자 식물로부터의 게놈 DNA와 혼성화되지 않는 핵산 프로브(여기서, 프로브는 서열 번호 3 또는 서열 번호 9와 상동성 또는 상보성임), 또는 (a) 서열 번호 4, 서열 번호 2 또는 서열 번호 6과 적어도 93% 또는 95% 또는 98% 또는 99% 또는 약 100%의 아미노산 서열 동일성; 또는 (b) 서열 번호 8 또는 서열 번호 10과 적어도 73% 또는 75% 또는 80% 또는 85% 또는 90% 또는 95% 또는 약 100%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하는 살충 단백질을 코딩하는 서열과 핵산의 샘플을 접촉시키는 단계를 포함한다. 상기 방법은 (a) 샘플 및 프로브를 엄격한 혼성화 조건으로 처리하는 단계; 및 (b) 프로브의 샘플의 DNA와의 혼성화를 검출하는 단계를 추가로 포함할 수 있다.
단백질을 포함하는 샘플에서 살충 단백질 또는 이의 단편의 존재를 검출하는 방법이 본 발명에 의해 또한 제공되고, 여기서 상기 살충 단백질은 서열 번호 4, 서열 번호 2, 서열 번호 6, 서열 번호 8 또는 서열 번호 10의 아미노산 서열을 포함하거나; 상기 살충 단백질은 (a) 서열 번호 4, 서열 번호 2 또는 서열 번호 6과 적어도 93% 또는 95% 또는 98% 또는 99% 또는 약 100%의 아미노산 서열 동일성; 또는 (b) 서열 번호 8 또는 서열 번호 10과 적어도 73% 또는 75% 또는 80% 또는 85% 또는 90% 또는 95% 또는 약 100%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다. 일 실시형태에서, 상기 방법은 (a) 샘플을 면역반응성 항체와 접촉시키는 단계; 및 (b) 단백질의 존재를 검출하는 단계를 포함한다. 몇몇 실시형태에서, 검출하는 단계는 ELISA 또는 웨스턴 블롯을 포함한다.
[서열의 간단한 설명]
서열 번호 1은 바실러스 튜링겐시스 종 EG10742로부터 얻은 TIC4472 살충 단백질을 코딩하는 핵산 서열이다.
서열 번호 2는 TIC4472 살충 단백질의 아미노산 서열이다.
서열 번호 3은 추가적인 알라닌 코돈이 시작 메티오닌 코돈 직후에 삽입된 식물 세포에서의 발현을 위해 설계된 TIC4472PL 살충 단백질을 코딩하는 합성 코딩 서열이다.
서열 번호 4는 식물 세포에서의 발현을 위해 설계되고, 추가적인 알라닌 아미노산이 시작 메티오닌 직후에 삽입된, 합성 코딩 서열에 의해 코딩된 TIC4472PL의 아미노산 서열(서열 번호 3)이다.
서열 번호 5는 바실러스 튜링겐시스 종 EG10731로부터 얻은 TIC1425 살충 단백질을 코딩하는 핵산 서열이다.
서열 번호 6은 TIC1425 살충 단백질의 아미노산 서열이다.
서열 번호 7은 바실러스 튜링겐시스 종 EG5408로부터 얻은 TIC2613 살충 단백질을 코딩하는 핵산 서열이다.
서열 번호 8은 TIC2613 살충 단백질의 아미노산 서열이다.
서열 번호 9는 추가적인 알라닌 코돈이 시작 메티오닌 코돈 직후에 삽입된 식물 세포에서의 발현을 위해 설계된 TIC2613PL 살충 단백질을 코딩하는 합성 코딩 서열이다.
서열 번호 10은 식물 세포에서의 발현을 위해 설계되고, 추가적인 알라닌 아미노산이 시작 메티오닌 직후에 삽입된, 합성 코딩 서열에 의해 코딩된 TIC2613PL의 아미노산 서열(서열 번호 9)이다.
농업적 해충 방제의 당해 분야에서의 문제는 표적 해충에 대해 효율적이고, 표적 해충 종에 대해 광범위한 스펙트럼 독성을 나타내고, 바람직하지 않은 농경 문제를 야기하지 않으면서 식물에서 발현될 수 있고, 식물에서 상업적으로 사용되는 현재의 독소와 비교하여 대안적인 작용 방식을 제공하는 새로운 독소 단백질의 수요를 특징으로 할 수 있다.
TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL에 의해 예시되는 신규한 살충 단백질은 본 명세서에 개시되어 있고, 특히 나비목 곤충 해충의 광범위한 스펙트럼, 더 특히 근대 거염벌레(스포돕테라 엑시구아), 옥수수 귀벌레(헬리코베르파 제아), 면 잎 벌레(알라바마 아르길라세아), 유럽 옥수수 나무좀(오스트리니아 누빌랄리스), 밤나방유충(스포돕테라 푸리기페르다), 올드 월드 솜벌레(헬리코베르파 아르미게라), 오리엔탈 잎 벌레(스포돕테라 리투라), 분홍 솜벌레(펙티노포라 고시피엘라), Cry1Ac 내성 분홍 솜벌레(펙티노포라 고시피엘라), 대두 자벌레(크리소데익시스 인클루덴스), 써던 거염벌레(스포돕테라 에리다니아), 사우쓰웨스턴 옥수수 나무좀(디아트라에아 그라디오셀라), 점무늬 솜벌레(에아리아스 비텔라), 사탕수수 나무좀(디아트라에아 사카랄리스), 회색담배나방(헬리오티스 비레센스) 및 벨벳콩 애벌레(안티카르시아 겜마탈리스)에 대한 이들 수요 각각을 해소한다.
본 출원에서 TIC4472, "TIC4472 단백질", "TIC4472 단백질 독소", "TIC4472 독소 단백질", "TIC4472 살충 단백질", "TIC4472 관련된 독소", "TIC4472 관련된 독소 단백질", TIC4472PL, "TIC4472PL 단백질", "TIC4472PL 단백질 독소", "TIC4472PL 독소 단백질", "TIC4472PL 살충 단백질", "TIC4472PL 관련된 독소", "TIC4472PL 관련된 독소 단백질", TIC1425, "TIC1425 단백질", "TIC1425 단백질 독소", "TIC1425 독소 단백질" "TIC1425 살충 단백질", "TIC1425 관련된 독소", "TIC1425 관련된 독소 단백질", TIC2613, "TIC2613단백질, "TIC2613단백질 독소", "TIC2613독소 단백질", "TIC2613살충 단백질", "TIC2613 관련된 독소", "TIC2613 관련된 독소 단백질", TIC2613PL, "TIC2613PL 단백질", "TIC2613PL 단백질 독소", "TIC2613PL 독소 단백질", "TIC2613PL 살충 단백질", "TIC2613PL 관련된 독소", "TIC2613PL 관련된 독소 단백질" 등의 언급은, 이러한 단백질의 TIC4472, TIC4472PL 또는 TIC1425와의 정렬이 약 93% 내지 약 100%의 임의의 분수 백분율의 아미노산 서열 동일성을 발생시키는 경우; 또는 이러한 단백질의 TIC2613 또는 TIC2613PL과의 정렬이 약 73% 내지 약 100%의 임의의 분수 백분율의 아미노산 서열 동일성을 발생시키는 경우, 살충 또는 곤충 저해 활성을 나타내는 임의의 단백질을 포함하는 나비목 해충에 대해 활성을 부여하는, TIC4472(서열 번호 2), TIC4472PL(서열 번호 4), TIC1425(서열 번호 6), TIC2613(서열 번호 8) 또는 TIC2613PL(서열 번호 10)의 임의의 살충 단백질 또는 곤충 저해 단백질 서열 및 이의 살충 또는 곤충 저해 분절, 또는 이의 조합을 포함하거나, 이들로 이루어지거나, 이들과 실질적으로 상동성이거나, 이들과 유사하거나 이들로부터 유래된 임의의 신규한 살충 단백질 또는 곤충 저해 단백질을 의미한다. TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질은 단백질로부터 색소체 표적된 및 색소체 비표적화된 형태 둘 다를 포함한다.
용어 "분절" 또는 "단편"은 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질을 기재하는 완전한 아미노산 또는 핵산 서열보다 짧은 구성적 아미노산 또는 핵산 서열을 기재하도록 본 출원에서 사용된다. 곤충 저해 활성을 나타내는 분절 또는 단편은 이러한 분절 또는 단편과 서열 번호 2에 기재된 TIC4472 단백질, 서열 번호 4에 기재된 TIC4472PL 단백질, 서열 번호 6에 기재된 TIC1425 단백질의 상응하는 섹션과의 정렬이 분절 또는 단편과 TIC4472, TIC4472PL 또는 TIC1425 단백질의 상응하는 섹션 사이의 약 93% 내지 약 100%의 임의의 분수 백분율의 아미노산 서열 동일성을 발생시키는 경우; 또는 이러한 분절 또는 단편과 서열 번호 8에 기재된 TIC2613 또는 서열 번호 10에 기재된 TIC2613PL 단백질의 상응하는 섹션과의 정렬이 분절 또는 단편과 TIC2613 또는 TIC2613PL 단백질의 상응하는 섹션 사이의 약 73% 내지 약 100%의 임의의 분수 백분율의 아미노산 서열 동일성을 발생시키는 경우 본 출원에 또한 개시되어 있다.
훨씬 추가의 구체적인 실시형태에서, TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질의 단편은 이것이 유래된 시작 단백질 분자가 보유하는 살충 활성을 나타내는 것으로서 정의될 수 있다. TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질을 코딩하는 핵산 서열의 단편은 이것이 유래된 시작 핵산 서열에 의해 코딩된 단백질 분자가 보유하는 살충 활성을 나타내는 단백질을 코딩하는 것으로서 정의될 수 있다. 본 명세서에 기재된 단편 또는 변이체는 단백질의 살충 활성을 담당하는 본 명세서에서 확인된 도메인을 추가로 포함할 수 있다.
구체적인 실시형태에서, 본 명세서에 개시된 바와 같은 살충 활성을 갖는 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질의 적어도 약 50개, 적어도 약 75개, 적어도 약 95개, 적어도 약 100개, 적어도 약 125개, 적어도 약 150개, 적어도 약 175개, 적어도 약 200개, 적어도 약 225개, 적어도 약 250개, 적어도 약 275개, 적어도 약 300개, 적어도 약 500개, 적어도 약 600개, 적어도 약 700개, 적어도 약 750개, 적어도 약 800개, 적어도 약 900개, 적어도 약 1000개, 적어도 약 1100개, 적어도 약 1150개 또는 적어도 약 1175개, 또는 이것 초과의 인접한 아미노산을 포함하는, TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질의 단편이 제공된다. 소정의 실시형태에서, 본 발명은 전장 서열의 활성을 갖는 서열 번호 2, 4, 6, 8 또는 10 중 어느 하나의 단편을 제공한다. 출발 분자로부터 이러한 단편을 제조하는 방법은 당해 분야에 널리 공지되어 있다.
본 출원에서 용어 "활성인" 또는 "활성, "살충 활성" 또는 "살충성" 또는 "곤충사멸 활성", "곤충 저해" 또는 "곤충사멸성"의 언급은 해충을 저해(성장, 먹이공급, 생식력, 또는 생존능력의 저해), 억제(성장, 먹이공급, 생식력 또는 생존능력의 억제), 방제(해충 침입의 방제, 유효량의 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질을 함유하는 특정한 작물에 대한 해충 먹이공급 활성의 방제) 또는 사멸(이환율, 사망률 또는 생식력의 감소를 발생시킴)하게 하는 데 있어서 독성 물질, 예컨대 단백질 독소의 효율을 의미한다. 이들 용어는 독성 단백질에 대한 해충의 노출이 이환율, 사망률, 생식력의 감소 또는 영양실조를 발생시키는 해충에 대한 독성 단백질의 살충 유효량을 제공하는 것의 결과를 포함하도록 의도된다. 이들 용어는 또한 식물에서의 또는 식물 상의 독성 단백질의 살충 유효량을 제공하는 것의 결과로서 식물, 식물의 조직, 식물 부분, 종자, 식물 세포 또는 식물이 성장할 수 있는 특정한 지정학적 위치로부터의 해충의 혐오감을 포함한다. 일반적으로, 살충 활성은 나비목 목의 곤충(이들로 제한되지는 않음)을 포함하는 특정한 표적 해충의 성장, 발육, 생존능력, 먹이공급 행동, 짝짓기 행동, 생식력을 저해하는 데 있어서 효과적인 독성 단백질의 능력 또는 이 단백질, 단백질 단편, 단백질 분절 또는 폴리뉴클레오타이드에 대한 곤충 먹이공급에 의해 생긴 부작용의 임의의 측정 가능한 감소를 의미한다. 독성 단백질은 식물에 의해 생산될 수 있거나, 식물 또는 식물이 배치된 위치 내의 환경에 시비될 수 있다. 용어 "생물활성", "효과적", "효율적" 또는 이의 변형어는 또한 표적 곤충 해충에 대한 본 발명의 단백질의 효과를 기재하기 위해 본 출원에서 상호 교환되어 사용되는 용어이다.
독성 물질의 살충 유효량은, 표적 해충의 식이에 제공될 때, 독성 물질이 해충과 접촉할 때 살충 활성을 나타낸다. 독성 물질은 당해 분야에 공지된 살충 단백질 또는 하나 이상의 화학 물질일 수 있다. 살충 또는 살충 화학 물질 및 살충 또는 살충 단백질 물질은 단독으로 또는 서로와 조합되어 사용될 수 있다. 화학 물질은 표적 해충, 유기 클로라이드, 유기 포스페이트, 카바메이트, 피레스린, 네오니코티노이드 및 리아노이드에서의 억제를 위한 특정한 유전자를 표적화하는 dsRNA 분자를 포함하지만, 이들로 제한되지는 않는다. 살충 또는 살충 단백질 물질은 본 출원에 기재된 단백질 독소, 및 나비목을 표적화하는 것을 포함하는 다른 단백질성 독성 물질, 및 다른 식물 해충을 방제하기 위해 사용된 단백질 독소, 예컨대 나비목, 딱정벌레목 또는 반시목 종을 방제하는 데 사용하기 위해 당해 분야에서 이용 가능한 Cry 및 Cyt 단백질을 포함한다.
해충, 특히 농작물의 해충의 언급은 농작물의 곤충 해충, 특히 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질 독소 종류에 의해 방제되는 나비목 곤충 해충을 의미하는 것으로 의도된다. 그러나, 해충의 언급은 또한 식물의 나비목, 딱정벌레목 또는 반시목 곤충 해충, 및 이들 해충을 표적화하는 독성 물질이 TIC4472, TIC4472PL 또는 TIC1425 단백질 또는 TIC4472, TIC4472PL 또는 TIC1425와 93% 내지 약 100% 동일한 단백질; 또는 TIC2613 또는 TIC2613PL 단백질 또는 TIC2613 또는 TIC2613PL과 73% 내지 약 100% 동일한 단백질과 함께 동시국재화 또는 존재할 때 선충 및 진균을 포함할 수 있다.
TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질은 일반 기능에 의해 관련되고, 성체, 번데기, 애벌레 및 유충(neonate)을 포함하는 나비목 곤충 종으로부터의 곤충 해충에 대해 살충 활성을 나타낸다.
나비목 목의 곤충은 밤나방과 과(Family Noctuidae)에서의 거염벌레(armyworm), 야도충(cutworm), 자벌레(looper) 및 헬리오티네스(heliothine), 예를 들어 밤나방유충(스포돕테라 푸리기페르다), 근대 거염벌레(스포돕테라 엑시구아), 블랙 거염벌레(스포돕테라 엑셈프타), 써던 거염벌레(스포돕테라 에리다니아), 베르타 거염벌레(마메스트라 컨피구라타), 블랙 야도충(아그로티스 입실론), 양배추 자벌레(트라이쵸플루시아 니), 대두 자벌레(푸슈도풀시아 인클루덴스), 벨벳빈 애벌레(안티카르시아 겜마탈리스), 그린 클로버웜(하이페나 스카브라), 회색담배나방(헬리오티스 비레센스), 그라눌라테 야도충(아그로티스 수브테라네아), 거염벌레(슈달레티아 유니펀크타), 웨스턴 야도충(아그로티스 오르토고니아); 명나방과 과로부터의 나무좀, 고치 애벌레(casebearer), 흰불나방(webworm), 뿔벌레(coneworm), 양배추벌레 및 알락나방(skeletonizer), 예를 들어 유럽 옥수수 나무좀(오스트리니아 누빌랄리스), 네이블 오렌지 벌레(아멜로이스 트란시텔라(Amyelois transitella)), 옥수수 뿌리 흰불나방(크람부스 칼리지노셀루스(Crambus caliginosellus)), 잔디 흰불나방(헤르페토그람마 리카르시살리스(암엘로이스)), 해바라기 나방(호모에오소마 엘렉텔룸), 명충나방 유충(lesser cornstalk borer)(엘라스모팔푸스 리그노셀루스(Elasmopalpus lignosellus)); 잎말이나방과 과에서의 리프롤러(leafroller), 버드웜(budworm), 종자 벌레 및 과일 벌레, 예를 들어 코드링 나방(Cydia pomonella), 포도 열매 나방(엔도피자 비테아나(Endopiza viteana)), 오리엔탈 과일 나방(그라폴리타 몰레스타(Grapholita molesta)), 해바라기 순나방(술레이마 헬리안타나(Suleima helianthana)); 및 많은 다른 경제적으로 중요한 나비목, 예를 들어 배추좀나방(플루텔라 자일로스텔라(Plutella xylostella)), 분홍 솜벌레(펙티노포라 고시피엘라) 및 매미 나방(라이만트리아 디스파(Lymantria dispar))를 포함하지만, 이들로 제한되지는 않는다. 나비목 목의 다른 곤충 해충은 예를 들어 면 잎 벌레(알라바마 아르길라세아), 과일 나무 잎말이 나방(아르칩스 아르기노스필라(Archips argyrospila)), 유럽 잎말이 나방(아르칩스 로사나(Archips rosana)) 및 다른 아르칩스 종(칠로 수프레살리스(Chilo suppressalis), 아시아 쌀 나무좀 또는 쌀 줄기 나무좀), 쌀 잎말이 나방(크나팔로크로시스 메디날리스(Cnaphalocrocis medinalis)), 옥수수 뿌리 흰불나방(크람부스 칼리지노셀루스), 잔디포충나방(bluegrass webworm)(크람부스 테테렐루스), 사우쓰웨스턴 옥수수 나무좀(디아트라에아 그라디오셀라), 사탕수수 나무좀(디아트라에아 사카랄리스), 가시 솜벌레(spiny bollworm)(에아리아스 인술라나), 점무늬 솜벌레(에아리아스 비텔라), 아메리칸 솜벌레(헬리코베르파 아르미게라), 옥수수 귀벌레(헬리코베르파 제아, 대두 꼬투리벌레 및 면 솜벌레로도 공지됨), 회색담배나방(헬리오티스 비레센스), 잔디 흰불나방(헤르페토그람마 리카르시살리스), 웨스턴 콩 야도충(스티리아코스타 알비코스타), 유럽 포도 나무 나방(로베시아 보트라나), 감귤류 잎나방벌레(필로크니스티스 시트렐라), 큰 하얀 나방(피에리스 브라시카에), 작은 하얀 나방(피에리스 라파에, 수입된 양배추벌레로도 공지됨), 근대 거염벌레(스포돕테라 엑시구아), 담배 야도충(클러스터 애벌레로도 공지된 스포돕테라 리투라) 및 토마토 잎나방벌레(투타 압솔루타)를 포함한다.
본 출원에서 "단리된 DNA 분자" 또는 동등한 용어 또는 구절의 언급은 DNA 분자가 이의 천연 환경 내가 아니라 단독으로 또는 다른 조성물과 조합되어 존재하는 것을 의미하도록 의도된다. 예를 들어, 유기체의 게놈의 DNA 내에 자연에서 발견되는, 핵산 요소, 예컨대 코딩 서열, 인트론 서열, 비번역된 리더 서열, 촉진자 서열, 전사 종결 서열 등은, 이 요소가 유기체의 게놈 내에 및 이것이 자연에서 발견된 게놈 내의 위치에서 있는 한, "단리"된 것으로 고려되지 않는다. 그러나, 이들 요소의 각각, 및 이들 요소의 하위부분은, 이 요소가 유기체의 게놈 내에 및 이것이 자연에서 발견된 게놈 내의 위치에서 있지 않은 한, 본 개시내용의 범위 내에 "단리"될 것이다. 유사하게, 살충 단백질 또는 그 단백질의 임의의 천연 발생 살충 변이체를 코딩하는 뉴클레오타이드 서열은, 뉴클레오타이드 서열이 단백질을 코딩하는 서열이 자연에서 발견되는 박테리아의 DNA 내에 있지 않은 한, 단리된 뉴클레오타이드 서열일 것이다. 천연 발생 살충 단백질의 아미노산 서열을 코딩하는 합성 뉴클레오타이드 서열은 본 개시내용의 목적을 위해 단리된 것으로 고려될 것이다. 본 개시내용의 목적을 위해, 임의의 형질전환 뉴클레오타이드 서열, 즉 식물 또는 박테리아의 세포의 게놈으로 삽입되거나 염색체외 벡터에 존재하는 DNA의 뉴클레오타이드 서열은, 이것이 세포를 형질전환시키기 위해 사용된 플라스미드 또는 유사한 구조 내에, 식물 또는 박테리아의 게놈 내에 존재하든, 또는 조직, 자손, 생물학적 샘플 또는 식물 또는 박테리아로부터 유래된 소비재에서 검출 가능한 양으로 존재하든 단리된 뉴클레오타이드 서열인 것으로 생각될 것이다.
본 출원에 추가로 기재된 바대로, TIC4747(서열 번호 1)을 코딩하는 오픈 리딩 프레임(ORF)은 바실러스 튜링겐시스 균주 EG10742로부터 얻은 DNA에서 발견되었다. 코딩 서열은 생물검정에서 사용된 재조합 단백질을 생성하기 위해 미생물 숙주 세포에서 클로닝되고 발현된다. TIC1425(서열 번호 5)를 코딩하는 오픈 리딩 프레임(ORF)은 바실러스 튜링겐시스 균주 EG10731로부터 얻은 DNA에서 발견되었다. TIC2613(서열 번호 7)을 코딩하는 오픈 리딩 프레임(ORF)은 바실러스 튜링겐시스 균주 EG5408로부터 얻은 DNA에서 발견되었다. TIC4472의 미생물 숙주 세포 유래된 단백질을 이용한 생물검정은 나비목 종 근대 거염벌레(스포돕테라 엑시구아), 옥수수 귀벌레(헬리코베르파 제아), 면 잎 벌레(알라바마 아르길라세아), 유럽 옥수수 나무좀(오스트리니아 누빌랄리스), 밤나방유충(스포돕테라 푸리기페르다), 올드 월드 솜벌레(헬리코베르파 아르미게라), 오리엔탈 잎 벌레(스포돕테라 리투라), 분홍 솜벌레(펙티노포라 고시피엘라), Cry1Ac 내성 분홍 솜벌레(펙티노포라 고시피엘라), 대두 자벌레(크리소데익시스 인클루덴스), 써던 거염벌레(스포돕테라 에리다니아), 사우쓰웨스턴 옥수수 나무좀(디아트라에아 그라디오셀라), 점무늬 솜벌레(에아리아스 비텔라), 사탕수수 나무좀(디아트라에아 사카랄리스), 회색담배나방(헬리오티스 비레센스) 및 벨벳콩 애벌레(안티카르시아 겜마탈리스)에 대한 활성을 입증하였다. 또한, 활성은 황열 모기(아에데스 아에깁티)에 대해 또한 관찰되었다. TIC1425의 미생물 숙주 세포 유래된 단백질을 이용한 생물검정은 나비목 종 면 잎 벌레(알라바마 아르길라세아), 유럽 옥수수 나무좀(오스트리니아 누빌랄리스), 밤나방유충(스포돕테라 푸리기페르다), 사탕수수 나무좀(디아트라에아 사카랄리스) 및 사우쓰웨스턴 옥수수 나무좀(디아트라에아 그라디오셀라에 대해 활성을 입증하였다. TIC2613의 미생물 숙주 세포 유래된 단백질을 사용한 생물검정은 나비목 종 옥수수 귀벌레(헬리코베르파 제아), 면 잎 벌레(알라바마 아르길라세아), 유럽 옥수수 나무좀(오스트리니아 누빌랄리스), 밤나방유충(스포돕테라 푸리기페르다), 대두 자벌레(크리소데익시스 인클루덴스), 사우쓰웨스턴 옥수수 나무좀(디아트라에아 그라디오셀라) 및 회색담배나방(헬리오티스 비레센스)에 대해 활성을 입증하였다.
식물 세포에서의 발현을 위해, TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질은 식물 세포의 사이토졸에 있도록 발현되거나 다양한 세포소기관에 표적화될 수 있다. 예를 들어, 엽록체에 대한 단백질의 표적화는 오프-표현형이 생기는 것을 방지하면서 형질전환 식물에서 발현된 단백질의 증가된 수준을 발생시킬 수 있다. 표적화는 형질전환 사건에서 해충 내성 효율의 증가를 또한 발생시킬 수 있다. 표적 펩타이드 또는 통과 펩타이드는 핵, 미토콘드리아, 소포체(ER), 엽록체, 아포플라스트, 퍼옥시좀 및 혈장 막을 포함하는 세포에서 특정한 영역으로 단백질의 운송을 지시하는 짧은(3개 내지 70개의 아미노산 길이) 펩타이드 사슬이다. 몇몇 표적 펩타이드는 단백질이 운송된 후 신호 펩티다제에 의해 단백질로부터 절단된다. 엽록체에 대한 표적화를 위해, 단백질은 대략 40개 내지 50개의 아미노산인 통과 펩타이드를 함유한다. 엽록체 통과 펩타이드의 사용의 설명을 위해, 미국 특허 제5,188,642호 및 제5,728,925호를 참조한다. 많은 엽록체 국소화된 단백질은 전구체로서 핵 유전자로부터 발현되고, 엽록체 통과 펩타이드(CTP)에 의해 엽록체로 표적화된다. 이러한 단리된 엽록체 단백질의 예는 리불로스-1,5-비스포스페이트 카복실라제의 작은 아단위(SSU)와 연관된 것, 페레독신, 페레독신 옥시도리덕타제, 광 수확 복합 단백질 I 및 단백질 II, 티오레독신 F, 엔올피루빌 쉬키메이트 포스페이트 신타아제(EPSPS) 및 미국 특허 제7,193,133호에 기재된 통과 펩타이드를 포함하지만, 이들로 제한되지는 않는다. 비엽록체 단백질이 이종성 CTP와의 단백질 융합의 사용에 의해 엽록체로 표적화될 수 있고, CTP가 엽록체로 단백질을 표적화하기에 충분하다는 것이 생체내 및 시험관내 입증되었다. 적합한 엽록체 통과 펩타이드, 예컨대 아라비돕시스 탈리아나 EPSPS CTP(CTP2)(문헌[Klee et al., Mol . Gen. Genet. 210:437-442, 1987] 참조) 또는 페투니아 하이브리다 EPSPS CTP(CTP4)(문헌[della-Cioppa et al., Proc . Natl . Acad . Sci . USA 83:6873-6877, 1986] 참조)의 혼입은 형질전환 식물에서 엽록체로 이종성 EPSPS 단백질 서열을 표적화하는 것으로 나타났다(미국 특허 제5,627,061호; 제5,633,435호호; 및 제5,312,910호; 및 EP 제0218571호; EP 제189707호; EP 제508909호; 및 EP 제924299호를 참조한다). 엽록체에 대한 TIC6757 또는 TIC6757PL 독소 단백질의 표적화를 위해, 엽록체 통과 펩타이드를 코딩하는 서열은 식물 세포에서 최적 발현을 위해 설계된 TIC6757 또는 TIC6757PL 독소 단백질을 코딩하는 합성 코딩 서열에 작동 가능한 연결로 및 인 프레임으로 5'에 배치된다.
TIC4472, TIC1425 또는 TIC2613과 관련된 추가적인 독소 단백질 서열이 신규한 특성을 갖는 신규한 단백질을 생성하도록 TIC4472, TIC1425 또는 TIC2613의 아미노산 서열을 사용함으로써 이것은 고안된다. TIC4472, TIC1425 또는 TIC2613 독소 단백질은 아미노산 서열 수준에서 신규한 아미노산 서열 변이체로 차이를 조합하고 변이체를 코딩하는 재조합 핵산 서열에 적절한 변화를 만들도록 정렬될 수 있다.
본 개시내용은 추가로 TIC4472 단백질 독소 종류의 개선된 변이체가 당해 분야에 공지된 다양한 유전자 편집 방법을 이용함으로써 식물계에서 조작될 수 있다는 것을 고려한다. 게놈 편집에 사용된 이러한 기술은 ZFN(아연-핑거 뉴클레아제), 메가뉴클레아제, TALEN(전사 활성자 유사 효과기 뉴클레아제) 및 CRISPR(일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복서열)/Cas(CRISPR 연관된) 시스템을 포함하지만, 이들로 제한되지는 않는다. 이 게놈 편집 방법은 상이한 독소 코딩 서열에 대한 식물 세포 내에 형질전환된 독소 단백질 코딩 서열을 변경하도록 사용될 수 있다. 구체적으로, 이들 방법을 통해, 독소 코딩 서열 내의 하나 이상의 코돈은 새로운 단백질 아미노산 서열을 조작하도록 변경된다. 대안적으로, 코딩 서열 내의 단편은 대체되거나 결실되거나, 추가적인 DNA 단편은 새로운 독소 코딩 서열을 조작하도록 코딩 서열로 삽입된다. 새로운 코딩 서열은 곤충 해충에 대해 새로운 특성, 예컨대 증가된 활성 또는 스펙트럼을 갖는 독소 단백질을 코딩하면서, 원래의 곤충 독소 단백질에 대해 내성을 발생시킨 곤충 해충 종에 대해 활성을 제공할 수 있다. 유전자 편집된 독소 코딩 서열을 포함하는 식물 세포는 새로운 독소 단백질을 발현하는 전체 식물을 생산하도록 당해 분야에 공지된 방법에 의해 사용될 수 있다.
TIC4472, TIC1425 또는 TIC2613의 단편 또는 이의 단백질 변이체가 절두된 형태일 수 있는 것으로 또한 고안되고, 여기서 하나 이상의 아미노산은 N 말단 끝, C 말단 끝, 단백질의 중간, 또는 이의 조합으로부터 결실되고, 여기서 단편 및 변이체는 곤충 저해 활성을 보유한다. 이 단편은 TIC4472, TIC1425 또는 TIC2613의 천연 발생 또는 합성 변이체 또는 유래된 단백질 변이체일 수 있지만, 적어도 TIC4472, TIC1425 또는 TIC2613의 곤충 저해 활성을 보유해야 한다. 본 명세서에 기재된 단편 또는 변이체는 단백질의 살충 활성을 담당하는 본 명세서에서 확인된 도메인을 추가로 포함할 수 있다.
TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 단백질을 닮은 단백질은 당해 분야에 공지된 다양한 컴퓨터 기반 알고리즘을 이용하여 확인되고 서로에 비교될 수 있다(표 1 및 표 2 참조). 본 출원에 보고된 아미노산 서열 동일성은 이 디폴트 매개변수를 이용한 Clustal W 정렬의 결과이다: 가중 매트릭스: blosum, 갭 오프닝 패널티: 10.0, 갭 연장 패널티: 0.05, 친수성 갭: On, 친수성 잔기: GPSNDQERK, 잔기 특정 갭 패널티: On(Thompson, et al (1994) Nucleic Acids Research, 22:4673-4680). 퍼센트 아미노산 동일성은 100% x (아미노산 동일성/해당 단백질의 길이)의 곱에 의해 추가로 계산된다. 다른 정렬 알고리즘은 또한 당해 분야에서 이용 가능하고, Clustal W 정렬을 이용하여 얻은 것과 유사한 결과를 제공하고, 본 명세서에서 고안된다.
나비목 곤충 종에 대해 곤충 저해 활성을 나타내는 단백질은 단백질이 예를 들어 Clustal W 정렬에서 쿼리에서 사용되는 경우 TIC4472, TIC4472PL 또는 TIC1425와 관련되고, 서열 번호 2, 서열 번호 4 또는 서열 번호 6에 기재된 바와 같은 본 발명의 단백질은 쿼리 단백질이 이 범위에서 약 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100% 또는 임의의 분수 백분율인 쿼리 단백질의 길이를 따라 적어도 93% 내지 약 100%의 아미노산 동일성을 나타내는 이러한 정렬에서 히트로서 확인되는 것으로 의도된다. 나비목 곤충 종에 대해 곤충 저해 활성을 나타내는 단백질은 단백질이 예를 들어 Clustal W 정렬에서 쿼리에서 사용되는 경우 TIC2613 또는 TIC2613PL과 관련되고, 서열 번호 8 또는 서열 번호 10에 기재된 바와 같은 본 발명의 단백질은 쿼리 단백질이 이 범위에서 약 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100% 또는 임의의 분수 백분율인 쿼리 단백질의 길이를 따라 적어도 73% 내지 약 100%의 아미노산 동일성을 나타내는 이러한 정렬에서 히트로서 확인되는 것으로 또한 의도된다.
예시적인 단백질 TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL을 Clustal W 알고리즘을 이용하여 서로에 정렬하였다. 각각의 전장 단백질에 대한 퍼센트 아미노산 서열 동일성의 쌍별 매트릭스는 표 1에 보고된 바대로 생성되었다.
퍼센트 동일성 이외에, TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 및 관련된 단백질은 1차 구조(보존된 아미노산 모티프), 길이(약 1187개의 아미노산) 및 다른 특징에 의해 또한 관련될 수 있다. TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 단백질 독소의 특징은 표 2에 기록되어 있다.
본 출원의 예에 추가로 예시된 바대로, TIC4472, TIC4472PL의 변이체 및 TIC2613, TIC2613PL의 변이체를 코딩하는 합성 핵산 분자 서열을 식물에서 사용하도록 설계하였다. TIC4472PL 단백질을 코딩하는 식물에서 사용하도록 설계된 예시적인 재조합 핵산 분자 서열은 서열 번호 3으로서 제시된다. TIC2613PL 단백질을 코딩하는 식물에서 사용하도록 설계된 예시적인 재조합 핵산 분자 서열은 서열 번호 9로서 제시된다. TIC4472PL 및 TIC2613PL 단백질은 각각 TIC4472 및 TIC2613 단백질에 대해 출발 메티오닌 바로 뒤에 추가적인 알라닌 아미노산을 갖는다. TIC4472 및 TIC2613 아미노산 서열로 삽입된 추가적인 알라닌 잔기는 식물계에서 단백질의 발현을 개선하는 것으로 생각된다. 마찬가지로, TIC1425의 변이체를 코딩하는 합성 핵산 분자 서열은 식물에서 사용하도록 설계될 수 있다.
TIC4472PL 단백질을 발현하는 R0 면 잎 조직을 사용한 잎 디스크 검정은 대두 자벌레(크리소데익시스 인클루덴스) 및 회색담배나방(헬리오티스 비레센스)에 대해 높은 활성 및 면 솜벌레(헬리코베르파 제아) 및 밤나방유충(스포돕테라 푸리기페르다)에 대해 낮은 활성을 입증하였다. TIC4472PL 단백질을 발현하는 R0 대두 잎 조직을 사용한 잎 디스크 검정은 써던 거염벌레(스포돕테라 에리다니아) 및 대두 자벌레(크리소데익시스 인클루덴스)에 대해 활성을 입증하였다.
TIC4472PL 및 TIC2613PL 단백질을 발현하는 R0 대두 식물로부터의 잎 샘플은 써던 거염벌레(스포돕테라 에리다니아) 및 대두 자벌레(크리소데익시스 인클루덴스)에 대해 활성을 입증하였다.
재조합 핵산 분자 서열을 함유하는 발현 카세트 및 벡터는 당해 분야에 공지된 형질전환 방법 및 기법에 따라 작제되고 옥수수, 대두, 면 또는 다른 식물 세포로 도입될 수 있다. 예를 들어, 아그로박테륨 매개된 형질전환은 미국 특허 출원 공보 제2009/0138985A1호(대두), 2008/0280361A1호(대두), 2009/0142837A1호(옥수수), 2008/0282432호(면), 2008/0256667호(면), 2003/0110531호(밀), 2001/0042257 A1호(사탕무), 미국 특허 제5,750,871호(카놀라), 7,026,528호(밀) 및 6,365,807호(쌀) 및 문헌[Arencibia et al. (1998) Transgenic Res. 7:213-222 (sugarcane)](이들 모두 본 명세서에서 그 전문이 참고로 포함됨)에 기재되어 있다. 형질전환된 세포는 TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 단백질을 발현하고 형질전환된 식물로부터 얻은 식물 잎 디스크를 사용하여 나비목 해충 애벌레의 존재 하에 수행된 생물검정을 이용하여 살충 활성을 나타낸 형질전환된 식물로 재생될 수 있다. 식물은 재생, 종자, 화분 또는 분열조직 형질전환 기법에 의해 식물 세포로부터 유래될 수 있다. 식물을 형질전환시키는 방법은 당해 분야에 공지되어 있다.
전통적인 형질전환 방법에 대한 대안으로서, DNA 서열, 예컨대 전이유전자, 발현 카세트(들) 등은 부위 지시된 통합을 통해 식물 또는 식물 세포의 게놈 내의 특정한 부위 또는 유전좌위로 삽입되거나 통합될 수 있다. 본 개시내용의 재조합 DNA 작제물(들) 및 분자(들)는 이에 따라 적어도 하나의 전이유전자를 포함하는 도너 주형 서열, 발현 카세트, 또는 식물 또는 식물 세포의 게놈으로의 삽입을 위해 다른 DNA 서열을 포함할 수 있다. 부위 지시된 통합을 위한 이러한 도너 주형은 삽입 서열을 플랭킹하는 1개 또는 2개의 상동성 아암(즉, 식물 게놈으로 삽입되는 서열, 전이유전자, 카세트 등)을 추가로 포함할 수 있다. 본 개시내용의 재조합 DNA 작제물(들)은 부위 지시된 통합을 수행하도록 부위 특이적 뉴클레아제를 코딩하는 발현 카세트(들) 및/또는 임의의 연관된 단백질(들)을 추가로 포함할 수 있다. 카세트(들)를 발현하는 이 뉴클레아제는 도너 주형(시스로)으로서 동일한 분자 또는 벡터에서 또는 별개의 분자 또는 벡터(트랜스로)에 존재할 수 있다. 부위 지시된 통합을 위한 몇몇 방법은 원하는 게놈 부위 또는 유전좌위에서 이중 가닥 파괴(double strand break: DSB) 또는 닉(nick)을 생성하도록 게놈 DNA를 절단시키는 상이한 단백질(또는 단백질 및/또는 가이드 RNA의 복합체)을 수반하는 것이 당해 분야에 공지되어 있다. 간단히 당해 분야에서 이해되는 것처럼, 뉴클레아제 효소에 의해 도입된 DSB 또는 닉을 보수하는 과정 동안에, 도너 주형 DNA는 DSB 또는 닉의 부위에서 게놈으로 통합될 수 있다. 도너 주형에서의 상동성 아암(들)의 존재는 상동성 재조합을 통해 보수 과정 동안 식물 게놈으로의 삽입 서열의 입양 및 표적화를 촉진할 수 있지만, 삽입 사건은 비상동성 말단 연결(non-homologous end joining: NHEJ)을 통해 생길 수 있다. 사용될 수 있는 부위 특이적 뉴클레아제의 예는 아연-핑거 뉴클레아제, 조작된 또는 네이티브 메가뉴클레아제, TALE-엔도뉴클레아제 및 RNA 가이드된 엔도뉴클레아제(예를 들어, Cas9 또는 Cpf1)를 포함한다. RNA 가이드된 부위 특이적 뉴클레아제(예를 들어, Cas9 또는 Cpf1)를 사용한 방법을 위해, 재조합 DNA 작제물(들)은 식물 게놈 내에 원하는 부위로 뉴클레아제를 지시하도록 하나 이상의 가이드 RNA를 코딩하는 서열을 또한 포함할 것이다.
본 명세서에 사용된 바대로, "재조합 DNA 분자"는 인간 중재 없이 함께 천연에서 생기지 않는 DNA 분자의 조합을 포함하는 DNA 분자이다. 예를 들어, 재조합 DNA 분자는 서로에 대해 적어도 2개의 DNA 분자 이종성으로 이루어진 DNA 분자, 자연에 존재하는 DNA 서열로부터 벗어난 DNA 서열을 포함하는 DNA 분자 또는 유전자 형질전환 또는 유전자 편집에 의해 숙주 세포의 DNA로 도입된 DNA 분자일 수 있다. 유사하게, "재조합 단백질 분자"는 인간 중재 없이 함께 천연에서 생기지 않는 아미노산의 조합을 포함하는 단백질 분자이다. 예를 들어, 재조합 단백질 분자는 서로에 대해 적어도 2개의 아미노산 분자 이종성으로 이루어진 단백질 분자, 천연에 존재하는 아미노산 서열로부터 벗어난 아미노산 서열을 포함하는 단백질 분자 또는 숙주 세포의 유전자 형질전환의 결과로서 또는 숙주 세포 게놈의 유전자 편집에 의해 숙주 세포에서 발현된 단백질 분자일 수 있다.
TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL을 코딩하는 재조합 핵산 분자 조성물이 고안된다. 예를 들어, TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 단백질은 단백질을 코딩하는 ORF를 갖는 폴리뉴클레오타이드 분자가 유전자 발현 요소, 예컨대 촉진자 및 작제물이 의도되는 시스템에서 발현에 필요한 임의의 다른 조절 요소에 작동 가능하게 연결된 재조합 DNA 작제물과 발현될 수 있다. 비제한적인 예는 식물에서 단백질의 발현을 위한 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질 코딩 서열에 작동 가능하게 연결된 식물 작용성 촉진자 또는 Bt 박테리아 또는 다른 바실러스 종에서의 단백질의 발현을 위한 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질 코딩 서열에 작동 가능하게 연결된 Bt-작용성 촉진자를 포함한다. 다른 요소는 인핸서, 인트론, 비번역된 리더, 코딩된 단백질 부동화 태그(HIS-태그), 전위 펩타이드(즉, 색소체 통과 펩타이드, 신호 펩타이드), 번역 후 변형 효소에 대한 폴리펩타이드 서열, 리보솜 결합 부위 및 RNAi 표적 부위(이들로 제한되지는 않음)를 포함하는 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질 코딩 서열에 작동 가능하게 연결될 수 있다. 본 명세서와 제공된 예시적인 재조합 폴리뉴클레오타이드 분자는 서열 번호 4, 서열 번호 2, 서열 번호 6, 서열 번호 8 및 서열 번호 10에 기재된 바와 같은 아미노산 서열을 갖는 각각의 폴리펩타이드 또는 단백질을 코딩하는 폴리뉴클레오타이드, 예컨대 서열 번호 3, 서열 번호 1, 서열 번호 5, 서열 번호 7 및 서열 번호 9에 작동 가능하게 연결된 이종성 촉진자를 포함하지만, 이들로 제한되지는 않는다. 이종성 촉진자는 또한 색소체 표적화된 TIC4472PL 또는 TIC2613PL; 또는 비표적화된 TIC4472PL 또는 TIC2613PL을 코딩하는 합성 DNA 코딩 서열에 작동 가능하게 연결될 수 있다. 본 명세서에 개시된 단백질을 코딩하는 재조합 핵산 분자의 코돈은 동의 코돈에 의해 치환될 수 있다(당해 분야에서 침묵 치환으로 공지됨).
TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질 코딩 서열을 포함하는 재조합 DNA 작제물은 또한 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질, TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질과 다른 단백질, 곤충 저해 dsRNA 분자 또는 보조 단백질을 코딩하는 DNA 서열과 동반 발현하거나 동시 발현하도록 구성될 수 있는 하나 이상의 곤충 저해 물질을 코딩하는 DNA의 영역을 포함한다. 보조 단백질은 보인자, 효소, 결합-파트너 또는 예를 들어 이의 발현을 보조하고, 식물에서 이의 안정성에 영향을 미치고, 올리고머화에 대해 자유 에너지를 최적화하고, 이의 독성을 증대시키고, 활성에 대한 이의 스펙트럼을 증가시킴으로써 곤충 저해 물질의 유효성을 보조하도록 기능하는 다른 물질을 포함하지만, 이들로 제한되지는 않는다. 보조 단백질은 예를 들어 하나 이상의 곤충 저해 물질의 흡수를 촉진하거나 독성 물질의 독성 효과를 강화시킬 수 있다.
재조합 DNA 작제물은 조립될 수 있어서, 모든 단백질 또는 dsRNA 분자는 하나의 촉진자로부터 발현되거나, 각각의 단백질 또는 dsRNA 분자는 별개의 촉진자 제어 또는 이의 몇몇 조합 하에 있다. 본 발명의 단백질은 선택된 발현 시스템의 유형에 따라 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL의 하나 이상의 단백질이 다른 오픈 리딩 프레임 및 촉진자를 또한 함유하는 일반 뉴클레오타이드 분절로부터 발현된 멀티-유전자 발현 시스템으로부터 발현될 수 있다. 예를 들어, 박테리아 멀티-유전자 발현 시스템은 단일 오페론 내로부터 다중 연결된/탠덤 오픈 리딩 프레임의 발현(즉, 폴리시스트론성 발현)을 추진시키도록 단일 촉진자를 이용할 수 있다. 또 다른 예에서, 식물 멀티-유전자 발현 시스템은 다중 비연결된 또는 연결된 발현 카세트를 이용할 수 있고, 각각의 카세트는 상이한 단백질 또는 다른 물질, 예컨대 하나 이상의 dsRNA 분자를 발현한다.
TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질 코딩 서열을 포함하는 재조합 폴리뉴클레오타이드 또는 재조합 DNA 작제물은 벡터, 예를 들어 플라스미드, 바큘로바이러스, 합성 염색체, 비리온, 코스미드, 파지미드, 파지 또는 바이러스 벡터에 의해 숙주 세포로 전달될 수 있다. 이러한 벡터는 숙주 세포에서 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질 코딩 서열의 안정한 또는 일시적인 발현, 또는 코딩된 폴리펩타이드의 후속하는 발현을 달성하도록 사용될 수 있다. 숙주 세포로 도입된 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질 코딩 서열을 포함하는 외인성 재조합 폴리뉴클레오타이드 또는 재조합 DNA 작제물은 본 출원에서 "전이유전자"라 칭해진다.
TIC4472의 임의의 하나 이상을 발현하는 재조합 폴리뉴클레오타이드 또는 관련된 과 독소 단백질 코딩 서열을 함유하는 형질전환 박테리아, 형질전환 식물 세포, 형질전환 식물 및 형질전환 식물 부분은 본 명세서에 제공된다. 용어 "박테리아 세포" 또는 "박테리아"는 아그로박테륨, 바실러스, 에스체리치아, 살모넬라, 슈도모나스, 브레비바실러스, 클레브시엘라, 에르위니아 또는 리조븀 세포를 포함할 수 있지만, 이들로 제한되지는 않는다. 용어 "식물 세포" 또는 "식물"은 쌍떡잎식물 또는 외떡잎식물 식물을 포함할 수 있지만, 이들로 제한되지는 않는다. 용어 "식물 세포" 또는 "식물"은 또한 알팔파, 바나나, 보리, 콩, 브로콜리, 양배추, 배추속, 당근, 카사바, 피마자, 꽃양배추, 셀러리, 병아리콩, 배추, 감귤류, 코코넛, 커피, 옥수수, 클로버, 면, 조롱박, 오이, 미송, 가지, 유칼립투스, 아마, 마늘, 포도, 홉, 리크, 상추, 테에다 소나무, 수수, 멜론, 견과, 귀리, 올리브, 양파, 관상품, 팜, 목초, 완두콩, 땅콩, 후추, 나무콩, 소나무, 감자, 포플러, 호박, 라디아타 소나무, 무, 유채, 쌀, 근경, 호밀, 잇꽃, 관목, 수수, 남부 소나무, 대두, 시금치, 호박, 딸기, 사탕무, 사탕수수, 해바라기, 사탕 옥수수, 스위트 검, 고구마, 스위치그래스, 차, 담배, 토마토, 라이밀, 잔디, 수박 및 밀 식물 세포 또는 식물을 포함할 수 있지만, 이들로 제한되지는 않는다. 소정의 실시형태에서, 형질전환 식물 및 형질전환 식물 세포로부터 재생된 형질전환 식물 부분이 제공된다. 소정의 실시형태에서, 형질전환 식물은 식물로부터의 부분을 절단, 스내핑, 분쇄 또는 달리 분리함으로써 형질전환 종자로부터 얻을 수 있다. 소정의 실시형태에서, 식물 부분은 종자, 꼬투리, 잎, 꽃, 줄기, 뿌리 또는 임의의 이의 일부, 또는 형질전환 식물 부분의 생식 불가 부분일 수 있다. 이 문맥에서 사용된 바대로, 형질전환 식물 부분의 "생식 불가" 부분은 전체 식물을 형성하도록 유도될 수 없거나, 유성 및/또는 무성 생식을 할 수 있는 전체 식물을 형성하도록 유도될 수 없는 부분이다. 소정의 실시형태에서, 식물 부분의 생식 불가 부분은 형질전환 종자, 꼬투리, 잎, 꽃, 줄기 또는 뿌리의 부분이다.
TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질의 곤충, 나비목 저해 양을 포함하는 형질전환 식물을 제조하는 방법이 제공된다. 이러한 식물은 본 출원에서 제공된 임의의 단백질을 코딩하는 재조합 폴리뉴클레오타이드를 도입하고, 단백질의 곤충, 나비목 저해 양을 발현하는 상기 식물 세포로부터 유래된 식물을 선택함으로써 제조될 수 있다. 식물은 재생, 종자, 화분 또는 분열조직 형질전환 기법에 의해 식물 세포로부터 유래될 수 있다. 식물을 형질전환시키는 방법은 당해 분야에 공지되어 있다.
처리된 식물 생성물(여기서, 처리된 생성물은 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질의 검출 가능한 양을 포함하고, 곤충 저해 분절 또는 이의 단편, 또는 이의 임의의 구별 부분은 또한 본 명세서에 개시된다. 소정의 실시형태에서, 처리된 생성물은 식물 부분, 식물 바이오매스, 오일, 가루, 당, 동물 공급물, 밀가루, 플레이크, 겨, 린트, 껍질, 처리된 종자 및 종자로 이루어진 군으로부터 선택된다. 소정의 실시형태에서, 처리된 생성물은 생식 불가이다. 식물 생성물은 형질전환 식물 또는 형질전환 식물 부분으로부터 유래된 상업의 원자재 또는 다른 생성물을 포함할 수 있고, 원자재 또는 다른 생성물은 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질의 구별 부분을 코딩하거나 포함하는 뉴클레오타이드 분절 또는 발현된 RNA 또는 단백질을 검출함으로써 상업품을 통해 추적될 수 있다.
TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질을 발현하는 식물은 다른 독소 단백질을 발현하고/하거나 다른 형질전환 특징, 예컨대 제초제 관용성 유전자, 수율 또는 스트레스 관용성 특질 등을 부여하는 유전자를 발현하는 형질전환과 육종에 의해 교배될 수 있거나, 이러한 특질은 단일 벡터에서 조합될 수 있어서 특질은 모두 연결된다.
본 출원에서 "단리된" DNA 분자 또는 아미노산 분자, 또는 동등한 용어 또는 구절의 언급은 DNA 분자 또는 아미노산 분자가 이의 천연 환경 내에서가 아니라 단독으로 또는 다른 조성물과 조합되어 존재한다는 것을 의미하도록 의도된다. 예를 들어, DNA 분자 또는 아미노산 분자는, 그 요소가 유기체의 게놈 내에 및 이것이 자연에서 발견된 게놈 내의 위치에서 있지 않은 한, 본 개시내용의 범위 내에 "단리"될 것이다. 본 개시내용의 목적을 위해, 임의의 형질전환 뉴클레오타이드 서열, 즉 식물 또는 박테리아의 세포의 게놈으로 삽입된, 또는 염색체외 벡터 내에 존재하는, DNA의 뉴클레오타이드 서열은, 세포를 형질전환시키기 위해 사용된 플라스미드 또는 유사한 구조 내에, 식물 또는 박테리아의 게놈 내에 존재하거나, 조직, 자손, 생물학적 샘플 또는 식물 또는 박테리아로부터 유래된 소비재에서 검출 가능한 양으로 존재하든지, 단리된 뉴클레오타이드 서열인 것으로 간주될 것이다.
실시예에 추가로 기재된 바대로, TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL 단백질 코딩 서열 및 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL과 실질적인 백분율 동일성을 갖는 서열은 당업자에게 공지된 방법, 예컨대 중합효소 연쇄 반응(polymerase chain reaction: PCR), 열 증폭 및 혼성화를 이용하여 확인될 수 있다. 예를 들어, 단백질 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL은 관련된 단백질에 특이적으로 결합하는 항체를 생성하도록 사용될 수 있고, 밀접하게 관련된 다른 단백질 구성원을 스크리닝하고 발견하기 위해 사용될 수 있다.
게다가, TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 독소 단백질을 코딩하는 뉴클레오타이드 서열은 스크리닝이 열 사이클 또는 등온 증폭 및 혼성화 방법을 이용하여 종류의 다른 구성원을 확인하기 위한 프로브 및 프라이머로서 사용될 수 있다. 예를 들어, 서열 번호 3에 기재된 바와 같은 서열로부터 유래된 올리고뉴클레오타이드는 소비재로부터 유래된 데옥시리보핵산 샘플에서 TIC4472PL 전이유전자의 존재 또는 부재를 결정하도록 사용될 수 있다. 서열 번호 7에 기재된 바와 같은 서열로부터 유래된 올리고뉴클레오타이드는 소비재로부터 유래된 데옥시리보핵산 샘플에서 TIC2613PL 전이유전자의 존재 또는 부재를 결정하도록 사용될 수 있다. 올리고뉴클레오타이드를 사용하는 소정의 핵산 검출 방법의 감수성을 고려하면, 서열 번호 3 또는 서열 번호 9에 기재된 바와 같은 서열로부터 유래된 올리고뉴클레오타이드가 오직 소비재의 분획이 임의의 전이유전자를 함유하는 형질전환 식물로부터 유래된 혼주된 소스로부터 유래된 소비재에서 TIC4472PL 또는 TIC2613PL 전이유전자를 검출하도록 사용될 수 있다. 이러한 올리고뉴클레오타이드가 서열 번호 3 및 서열 번호 9의 각각에서 뉴클레오타이드 서열 변이를 도입하도록 사용될 수 있다는 것이 추가로 인식된다. 이러한 "돌연변이유발" 올리고뉴클레오타이드는 형질전환 식물 숙주 세포에서 곤충 저해 활성 또는 변하는 발현의 범위를 나타내는 TIC4472PL 및 TIC2613PL 아미노산 서열 변이체의 확인에 유용하다.
뉴클레오타이드 서열 동족체, 예를 들어 엄격한 혼성화 조건 하게 본 출원에 개시된 각각의 또는 임의의 서열에 혼성화되는 뉴클레오타이드 서열에 의해 코딩된 살충 단백질은 또한 본 발명의 실시형태이다. 본 발명은 또한 제2 뉴클레오타이드 서열에 혼성화되는 제1 뉴클레오타이드 서열을 검출하는 방법을 제공하고, 여기서 제1 뉴클레오타이드 서열(또는 이의 역 보체 서열)은 살충 단백질 또는 이의 살충 단편을 코딩하고, 제2 뉴클레오타이드 서열에 혼성화된다. 이러한 경우에, 제2 뉴클레오타이드 서열은 엄격한 혼성화 조건 하에 서열 번호 3, 서열 번호 1, 서열 번호 5, 서열 번호 7 또는 서열 번호 9로서 제시된 임의의 뉴클레오타이드 서열일 수 있다. 뉴클레오타이드 코딩 서열은 적절한 혼성화 조건, 예컨대 엄격한 혼성화 조건 하에 서로에 혼성화되고, 이들 뉴클레오타이드 서열에 의해 코딩된 단백질은 다른 단백질 중 어느 하나에 대해 키워진 항혈청과 상호작용한다. 본 명세서에 정의된 바와 같은, 엄격한 혼성화 조건은 적어도 42℃에서의 혼성화, 이어서 2X SSC, 0.1% SDS에 의해 실온에서의 각각 5분 동안 2회의 세척, 이어서 0.5X SSC, 0.1% SDS 중의 65℃에서의 각각 30분 동안 2회의 세척을 포함한다. 훨씬 더 높은 온도에서의 세척은 훨씬 더 엄격한 조건, 예를 들어 68℃의 혼성화 조건, 이어서 0.1% SDS를 함유하는 2xSSC 중의 68℃에서의 세척을 구성한다.
당업자는, 유전자 코드의 중복으로 인해, 많은 다른 서열이 이러한 관련된 단백질을 코딩할 수 있고, 이들 서열이 바실러스 균주 또는 식물 세포에서 살충 단백질을 발현하도록 작용하는 정도로 본 발명의 실시형태라는 것을 인식할 것이어서, 물론 많은 이러한 중복 코딩 서열이 이들 조건 하에 TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL을 코딩하는 네이티브 바실러스 서열에 혼성화되지 않는다는 것을 인식한다. 본 출원은 TIC4472, TIC1425 및 TIC2613 단백질 코딩 서열 및 TIC4472, TIC1425 및 TIC2613 단백질 코딩 서열에 실질적인 백분율 동일성을 갖는 서열을 확인하기 위해 당업자에게 공지된 이들 및 다른 확인 방법의 사용을 고려한다.
본 개시내용은 또한 살충 단백질로부터의 단백질의 키메라를 포함하는 상업적으로 유용한 단백질을 조작하고 클로닝하기 위한 당해 분야에 공지된 분자 방법의 용도를 고려하고; 예를 들어, 키메라는 TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 단백질의 분절과 TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 및 관련된 단백질과 다른 다양한 단백질의 분절과의 어셈블리를 포함하는 추가적인 유용한 실시형태를 유도화하기 위한 단백질인 TIC4472, TIC4472PL, TIC1425, TIC2613 또는 TIC2613PL의 분절로부터 어셈블링될 수 있다. TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 단백질은 서로에 및 다른 바실러스 튜링겐시스 또는 다른 살충 단백질(이들이 밀접하게 또는 멀리 계통발생적으로 관련되든 또는 아니든)에 정렬하도록 처리될 수 있고, 정렬된 단백질 사이에서 치환에 유용한 각각의 이러한 단백질의 분절이 확인될 수 있어서, 키메라 단백질의 작제를 발생시킨다. 이러한 키메라 단백질은 해충 생물검정 분석으로 처리되고, 키메라에서의 각각의 이러한 분절이 유래된 모 단백질과 비교하여, 증가한 생물활성 또는 확대된 표적 해충 스펙트럼의 존재 또는 부재에 대해 규명될 수 있다. 폴리펩타이드의 살충 활성은 도메인 또는 분절을 다른 단백질과 스와핑함으로써 또는 당해 분야에 공지된 지향된 진화 방법을 이용함으로써 특정한 해충 또는 더 넓은 스펙트럼의 해충에 대한 활성에 대해 추가로 조작될 수 있다.
TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 단백질에 의해 곤충, 특히 농작물의 나비목 침입을 방제하는 방법이 본 출원에 또한 개시되어 있다. 이러한 방법은 TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 독소 단백질의 곤충 또는 나비목 저해 양을 포함하는 식물을 성장시키는 것을 포함할 수 있다. 소정의 실시형태에서, 이러한 방법은 (i) 식물을 생성시키는 식물 또는 종자에 TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 독소 단백질을 포함하거나 이들을 코딩하는 임의의 조성물을 시비하는 단계; 및 (ii) TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 독소 단백질을 코딩하는 폴리뉴클레오타이드에 의해 식물 또는 식물을 생산하는 식물 세포를 형질전환시키는 단계 중 임의의 하나 이상을 추가로 포함할 수 있다. 일반적으로, TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 독소 단백질이 조성물에서 제공되거나, 미생물에서 제공되거나, 형진전환 식물에서 제공될 수 있어서, 나비목 곤충에 대해 곤충 저해 활성을 부여한다는 것이 고안된다.
소정의 실시형태에서, TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 독소 단백질의 재조합 핵산 분자는 TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 독소 단백질을 발현시키기에 적합한 조건 하에 TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 독소 단백질을 발현시키도록 형질전환된 재조합 바실러스 또는 임의의 다른 재조합 박테리아 세포를 배양함으로써 제조된 곤충 저해 조성물의 살충 활성 성분이다. 이러한 조성물은 상기 재조합 폴리펩타이드를 발현/생산하는 이러한 재조합 세포의 배양물의 건조, 동결건조, 균질화, 추출, 여과, 원심분리, 침강 또는 농축에 의해 제조될 수 있다. 이러한 공정은 바실러스 또는 다른 곤충 병원성 박테리아 세포 추출물, 세포 현탁액, 세포 균질액, 세포 용해물, 세포 상청액, 세포 여과액 또는 세포 펠릿을 생성시킬 수 있다. 이렇게 생산된 재조합 폴리펩타이드를 얻음으로써, 재조합 폴리펩타이드를 포함하는 조성물은 박테리아 세포, 박테리아 포자 및 부아포 봉입체를 포함할 수 있고, 농업적 곤충 저해 스프레이 생성물로서 또는 식이 생물검정에서의 곤충 저해 제제로서를 포함하여 다양한 용도에 대해 제제화될 수 있다.
일 실시형태에서, 내성 발생의 가능성을 감소시키기 위해, TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL을 포함하는 곤충 저해 조성물은 동일한 나비목 곤충 종에 대해 곤충 저해 활성을 나타내지만 TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 독소 단백질과 다른 적어도 하나의 추가적인 폴리펩타이드를 추가로 포함할 수 있다. 이러한 조성물에 가능한 추가적인 폴리펩타이드는 곤충 저해 단백질 및 곤충 저해 dsRNA 분자를 포함한다. 곤충 해충을 방제하기 위한 이러한 리보뉴클레오타이드 서열의 사용을 위한 하나의 예는 Baum 등에 기재되어 있다(미국 특허 공보 제2006/0021087호 A1). 나비목 해충의 방제를 위한 이러한 추가적인 폴리펩타이드는 곤충 저해 단백질, 예컨대 Cry1A(미국 특허 제5,880,275호), Cry1Ab, Cry1Ac, Cry1A.105, Cry1Ae, Cry1B(미국 특허 공보 제10/525,318호), Cry1C(미국 특허 제6,033,874), Cry1D, Cry1Da 및 이들의 변이체(이들로 제한되지는 않음), Cry1E, Cry1F 및 Cry1A/F 키메라(미국 특허 제7,070,982호; 제6,962,705호; 및 제6,713,063호), Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry1-type 키메라, 예컨대 TIC836, TIC860, TIC867, TIC869 및 TIC1100(국제 출원 공보 WO 제2016/061391호(A2)), TIC2160(국제 출원 공보 WO 제2016/061392호(A2)), Cry2A, Cry2Ab(미국 특허 제7,064,249호), Cry2Ae, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry43A, Cry43B, Cry51Aa1, ET66, TIC400,, TIC800, TIC834, TIC1415, Vip3A, VIP3Ab, VIP3B, AXMI-001, AXMI-002, AXMI-030, AXMI-035 및 AXMI-045(미국 특허 공보 제2013-0117884호 A1), AXMI-52, AXMI-58, AXMI-88, AXMI-97, AXMI-102, AXMI-112, AXMI-117, AXMI-100(미국 특허 공보 제2013-0310543호 A1), AXMI-115, AXMI-113, AXMI-005(미국 특허 공보 제2013-0104259호 A1), AXMI-134(미국 특허 공보 제2013-0167264호 A1), AXMI-150(미국 특허 공보 제2010-0160231호 A1), AXMI-184(미국 특허 공보 제2010-0004176호 A1), AXMI-196, AXMI-204, AXMI-207, axmi209(미국 특허 공보 제2011-0030096호 A1), AXMI-218, AXMI-220(미국 특허 공보 제2014-0245491호 A1), AXMI-221z, AXMI-222z, AXMI-223z, AXMI-224z, AXMI-225z(미국 특허 공보 제2014-0196175호 A1), AXMI-238(미국 특허 공보 제2014-0033363호 A1), AXMI-270(미국 특허 공보 제2014-0223598호 A1), AXMI-345(미국 특허 공보 제2014-0373195호 A1), AXMI-335(국제 출원 공보 WO 제2013/134523호(A2)), DIG-3(미국 특허 공보 제2013-0219570호 A1), DIG-5(미국 특허 공보 제2010-0317569호 A1), DIG-11(미국 특허 공보 제2010-0319093호 A1), AfIP-1A 및 이의 유도체(미국 특허 공보 제2014-0033361호 A1), AfIP-1B 및 이의 유도체(미국 특허 공보 제2014-0033361호 A1), PIP-1APIP-1B(미국 특허 공보 제2014-0007292호 A1), PSEEN3174(미국 특허 공보 제2014-0007292호 A1), AECFG-592740(미국 특허 공보 제2014-0007292호 A1), Pput_1063(미국 특허 공보 제2014-0007292호 A1), DIG-657(국제 출원 공보 WO 제2015/195594호(A2)), Pput_1064(미국 특허 공보 제2014-0007292호 A1), GS-135 및 이의 유도체(미국 특허 공보 제2012-0233726호 A1), GS153 및 이의 유도체(미국 특허 공보 제2012-0192310호 A1), GS154 및 이의 유도체(미국 특허 공보 제2012-0192310호 A1), GS155 및 이의 유도체(미국 특허 공보 제2012-0192310호 A1), 미국 특허 공보 제2012-0167259호 A1에 기재된 바와 같은 서열 번호 2 및 이의 유도체, 미국 특허 공보 제2012-0047606호 A1에 기재된 바와 같은 서열 번호 2 및 이의 유도체, 미국 특허 공보 제2011-0154536호 A1에 기재된 바와 같은 서열 번호 2 및 이의 유도체, 미국 특허 공보 제2011-0112013호 A1에 기재된 바와 같은 서열 번호 2 및 이의 유도체, 미국 특허 공보 제2010-0192256호 A1에 기재된 바와 같은 서열 번호 2 및 4 및 이의 유도체, 미국 특허 공보 제2010-0077507호 A1에 기재된 바와 같은 서열 번호 2 및 이의 유도체, 미국 특허 공보 제2010-0077508호 A1에 기재된 바와 같은 서열 번호 2 및 이의 유도체, 미국 특허 공보 제2009-0313721호 A1에 기재된 바와 같은 서열 번호 2 및 이의 유도체, 미국 특허 공보 제2010-0269221호 A1에 기재된 바와 같은 서열 번호 2 또는 4 및 이의 유도체, 미국 특허 제7,772,465호(B2)에 기재된 바와 같은 서열 번호 2 및 이의 유도체, WO 제2014/008054호 A2에 기재된 바와 같은 CF161_0085 및 이의 유도체, US 특허 공보 US 제2008-0172762호 A1, US 제2011-0055968호 A1 및 US 제2012-0117690호 A1에 기재된 바와 같은 나비목 독성 단백질 및 이의 유도체; US 제7510878호(B2)에 기재된 바와 같은 서열 번호 2 및 이의 유도체, 미국 특허 제7812129호(B1)에 기재된 바와 같은 서열 번호 2 및 이의 유도체; 등(이들로 제한되지는 않음)으로 이루어진 군으로부터 선택될 수 있다.
다른 실시형태에서, 이러한 조성물/제제는 얻은 곤충 저해의 스펙트럼을 확장시키도록 달리 본 발명의 곤충 저해 단백질에 의해 저해되지 않는 곤충에 대한 곤충 저해 활성을 나타내는 적어도 하나의 추가적인 폴리펩타이드를 추가로 포함할 수 있다. 예를 들어, 반시목 해충의 방제를 위해, 본 발명의 곤충 저해 단백질의 조합은 반시목 활성 단백질, 예컨대 TIC1415(US 특허 공보 제2013-0097735호 A1), TIC807(미국 특허 제8609936호), TIC834(미국 특허 공보 제2013-0269060호 A1), AXMI-036(미국 특허 공보 제2010-0137216호 A1) 및 AXMI-171(미국 특허 공보 제2013-0055469호 A1)와 사용될 수 있다. 딱정벌레목 해충의 방제를 위한 추가의 폴리펩타이드는 곤충 저해 단백질, 예컨대 Cry3Bb(미국 특허 제6,501,009호), Cry1C 변이체, Cry3A 변이체, Cry3, Cry3B, Cry34/35, 5307, AXMI134(미국 특허 공보 제2013-0167264호 A1) AXMI-184(미국 특허 공보 제2010-0004176호 A1), AXMI-205(미국 특허 공보 제2014-0298538호 A1), axmi207(미국 특허 공보 제2013-0303440호 A1), AXMI-218, AXMI-220(미국 특허 공보 제20140245491호 A1), AXMI-221z, AXMI-223z(미국 특허 공보 제2014-0196175호 A1), AXMI-279(미국 특허 공보 제2014-0223599호 A1), AXMI-R1 및 이의 변이체(미국 특허 공보 제2010-0197592호 A1, TIC407, TIC417, TIC431, TIC807, TIC853, TIC901, TIC1201, TIC3131, DIG-10(미국 특허 공보 제2010-0319092호 A1), eHIP(미국 특허 출원 공보 제2010/0017914호), IP3 및 이의 변이체(미국 특허 공보 제2012-0210462호 A1) 및 ω-헥사톡신-Hv1a(미국 특허 출원 공보 제2014-0366227호 A1)(이들로 제한되지는 않음)로 이루어진 군으로부터 선택될 수 있다.
딱정벌레목, 나비목 및 반시목 곤충 해충의 방제를 위한 추가적인 폴리펩타이드는 Neil Crickmore에 의해 유지되는 바실러스 튜링겐시스 독소 명명법 웹사이트(btnomenclature.info에서의 world wide web에서)에서 발견될 수 있다.
곤충이 소정의 살충제에 대해 내성을 발생시킬 가능성은 당해 분야에 문서기록되어 있다. 하나의 곤충 내성 관리 전략은 상이한 작용 방식을 통해 작동하는 2개의 구별되는 곤충 저해 물질을 발현하는 형진전환 작물을 사용하는 것이다. 따라서, 곤충 저해 물질 중 어느 하나에 내성을 갖는 임의의 곤충은 다른 곤충 저해 물질에 의해 방제될 수 있다. 또 다른 곤충 내성 관리 전략은 이러한 비보호된 식물에 대한 은신처를 제공하도록 표적화된 나비목 해충 종에 보호되지 않는 식물의 사용을 이용한다. 하나의 특정한 예는 미국 특허 제6,551,962호(참고로 그 전문이 포함됨)에 기재되어 있다.
종자 처리에서 단백질과 사용되는 본 명세서에 개시된 단백질, 스프레이 온, 드립 온 또는 와이프 온 제제에 의해 또한 방제되는 해충을 방제하도록 설계된 다른 실시형태, 예컨대 국소로 시비된 살충 화학물질은 토양에 직접 시비되거나(토양 관주), 본 명세서에 개시된 단백질을 발현하는 성장하는 식물에 시비되거나, 개시된 단백질 중 하나 이상을 코딩하는 하나 이상의 전이유전자를 함유하는 종자에 시비되도록 제제화될 수 있다. 종자 처리에서 사용하기 위한 이러한 제제는 당해 분야에 공지된 다양한 스티커(sticker) 및 점착제와 시비될 수 있다. 이러한 제제는 개시된 단백질과 작용 방식에서 상승적인 농약을 함유할 수 있어서, 제제 농약은 개시된 단백질에 의해 방제될 수 있는 동일한 또는 유사한 해충을 방제하도록 상이한 작용 방식을 통해 작용하고, 이러한 농약은 더 광범위한 숙주 범위 내의 해충 또는 TIC4472, TIC4472PL, TIC1425, TIC2613 및 TIC2613PL 살충 단백질에 의해 효과적으로 제어되지 않는 식물 해충 종을 방제하도록 작용한다.
상기 언급된 조성물/제제는 농업적으로 허용 가능한 캐리어, 예컨대 미끼, 분말, 먼지, 펠릿, 과립, 스프레이, 에멀션, 콜로이드성 현탁액, 수성 용액, 바실러스 포자/결정 제제, 종자 처리, 단백질 중 하나 이상을 발현하도록 형질전환된 재조합 식물 세포/식물 조직/종자/식물, 또는 단백질 중 하나 이상을 발현하도록 형질전환된 박테리아를 추가로 포함할 수 있다. 재조합 폴리펩타이드에서 고유한 곤충 저해 또는 살충 저해의 수준 및 식물 또는 식이 검정에 시비되는 제제의 수준에 따라, 조성물/제제는 재조합 폴리펩타이드의 다양한 중량 기준 양, 예를 들어 재조합 폴리펩타이드의 0.0001% 내지 0.001% 내지 0.01% 내지 1% 내지 99중량%를 포함할 수 있다.
상기의 검토에서, 당업자는 개시된 구체적인 양태에서 변화는 이루어질 수 있고 본 발명의 사상 및 범위로부터 벗어나지 않으면서 동일하거나 유사한 결과를 여전히 얻을 수 있다는 것을 이해해야 한다. 따라서, 본 명세서에 개시된 구체적인 구조 및 기능적 상세내용은 제한으로서 해석되지 않아야 한다. 본 명세서에 인용된 각각의 참고문헌의 전체 개시내용은 본 출원의 개시내용 내에 포함되는 것으로 이해되어야 한다.
실시예
실시예
1
TIC4472, TIC1425 및 TIC2613의 발견, 클로닝 및 발현
3개의 신규한 바실러스 튜링겐시스 살충 단백질을 코딩하는 서열을 곤충 생물검정에서 동정하고, 클로닝하고, 서열 확인하고, 시험하였다. 각각 바실러스 튜링겐시스 균주 EG10742, EG10731 및 EG5408로부터 단리된 TIC4472, TIC1425 및 TIC2613인 살충 단백질은 신규한 Cry1Ca-유사 단백질을 나타낸다.
중합효소 연쇄 반응(PCR) 프라이머는 각각 EG10742, EG10731 및 EG5408인 바실러스 튜링겐시스 균주로부터 단리된 전체 게놈 DNA로부터 TIC4472, TIC1425 및 TIC2613에 대한 코딩 영역의 전장 카피를 증폭시키도록 설계되었다. PCR 앰플리콘은 각각의 코딩 서열의 번역 개시 및 종결 코돈을 또한 포함하였다.
각각의 앰플리콘을 Bt 발현 가능한 촉진자와 작동 가능한 연결에 있는 Bt(바실러스 튜링겐시스) 발현 벡터로 당해 분야에 공지된 방법을 이용하여 클로닝하였다.
실시예
2
TIC4472, TIC1425 및 TIC2613은 곤충 생물검정에서 나비목 활성을 입증한다
Bt 발현 숙주에서 단백질을 제조함으로써 살충 단백질 TIC4472, TIC1425 및 TIC2613의 생물활성을 평가하였다. TIC4472, TIC1425 및 TIC2613을 발현하는 Bt 균주를 이십사(24) 시간 동안 성장시키고, 이후 포자 결정 제제 또는 가용화된 단백질 제제 중 어느 하나를 곤충 먹이에 첨가하였다. TIC4472, TIC1425 및 TIC2613을 발현하는 Bt 균주로부터의 배양물을 갖는 먹이에서의 곤충의 성장 및 발생을 비처리된 대조군 배양물을 갖는 먹이에서의 곤충과 비교함으로써 사망률 및 영양실조를 평가하였다.
TIC4472의 제제는 나비목 종 옥수수 귀벌레(2개의 콜로니(CEW 및 CEWUC), 헬리코베르파 제아, 본 명세서에서 면 솜벌레 및 대두 꼬투리 벌레라고도 함), 면 잎 벌레(CLW, 알라바마 아르길라세아), 유럽 옥수수 나무좀(ECB, 오스트리니아 누빌랄리스), 밤나방유충(FAW, 스포돕테라 푸리기페르다), 대두 자벌레(SBL, 크리소데익시스 인클루덴스), 써던 거염벌레(SAW, 스포돕테라 에리다니아), 사우쓰웨스턴 옥수수 나무좀(SWCB, 디아트라에아 그라디오셀라), 사탕수수 나무좀(SCB, 디아트라에아 사카랄리스), 사탕수수 나무좀의 Cry2Ab 내성 콜로니(SCB2R), 회색담배나방(TBW, 헬리오티스 비레센스) 및 벨벳콩 애벌레(VBW, 안티카르시아 겜마탈리스); 딱정벌레목 종 콜로라도 감자 딱정벌레(CPB, 렙티노타르사 데셈리네아타) 및 웨스턴 옥수수 뿌리벌레(WCB, 디아브로티카 비르기페라 비르기페라); 반시목 종 타니시드 식물 벌레(TPB, 리구스 리네올라리스), 웨스턴 타니시드 식물 벌레(WTP, 리구스 헤스페루스); 및 쌍시류 종 황열 모기(아에데스 아에깁티)에 대해 평가되었다. TIC1425의 제제는 나비목 종 블랙 야도충(BCW, 아그로티스 입실론), 면 잎 벌레(CLW, 알라바마 아르길라세아), 유럽 옥수수 나무좀(ECB, 오스트리니아 누빌랄리스), 밤나방유충(FAW, 스포돕테라 푸리기페르다), 블랙 야도충(BCW, 아그로티스 입실론), 사우쓰웨스턴 옥수수 나무좀(SWCB, 디아트라에아 그라디오셀라) 및 사탕수수 나무좀(SCB, 디아트라에아 사카랄리스); 및 딱정벌레목 종 웨스턴 옥수수 뿌리벌레(WCB, 디아브로티카 비르기페라 비르기페라) 및 써던 옥수수 뿌리벌레(디아브로티카 운데심푼크타타 호와디)에 대해 평가되었다. TIC2613의 제제는 나비목 종 옥수수 귀벌레(2개의 콜로니(CEW 및 CEWUC), 헬리코베르파 제아, 본 명세서에서 면 솜벌레 및 대두 꼬투리 벌레라고도 함), 면 잎 벌레(CLW, 알라바마 아르길라세아), 유럽 옥수수 나무좀(ECB, 오스트리니아 누빌랄리스), 밤나방유충(FAW, 스포돕테라 푸리기페르다), 대두 자벌레(SBL, 크리소데익시스 인클루덴스), 써던 거염벌레(SAW, 스포돕테라 에리다니아), 블랙 야도충(BCW, 아그로티스 입실론), 사우쓰웨스턴 옥수수 나무좀(SWCB, 디아트라에아 그라디오셀라), 회색담배나방(TBW, 헬리오티스 비레센스) 및 벨벳콩 애벌레(VBW, 안티카르시아 겜마탈리스); 딱정벌레목 종 콜로라도 감자 딱정벌레(CPB, 렙티노타르사 데셈리네아타); 웨스턴 옥수수 뿌리벌레(WCB, 디아브로티카 비르기페라 비르기페라) 및 써던 옥수수 뿌리벌레(디아브로티카 운데심푼크타타 호와디); 및 반시목 종 타니시드 식물 벌레(TPB, 리구스 리네올라리스), 웨스턴 타니시드 식물 벌레(WTP, 리구스 헤스페루스)에 대해 평가되었다.
Bt 숙주에서 성장한 각각의 단백질에 대해 관찰된 생물검정 활성은 하기 표 3 및 표 4에 제시되고, 여기서 "+"는 활성을 나타내고, "NT"는 독소가 그 특이적 곤충 해충에 대해 평가되지 않았다는 것을 나타내고, "S"는 영양실조를 나타내고, "M"은 사망률을 나타낸다. TIC4472, TIC1425 및 TIC2613의 제제는 각각의 단백질에 대해 평가된 딱정벌레목 또는 반시목 곤충 해충에 대한 활성을 입증하지 않는다. TIC4472는 또한 황열 모기(아에데스 아에깁티)에 대한 활성을 입증하였다. 모든 3개의 독소는 표 3 및 표 4에 기재된 바대로 다수의 나비목 곤충 해충에 대한 내성을 입증하였다.
상기 표 3 및 표 4에서 볼 수 있는 것처럼, 곤충 독소 TIC4472는 평가되는 모든 나비목 곤충 해충(CEW, CEWUC, CLW, ECB, FAW, SBL, SAW, SCB, SCB2R, SWCB, TBW 및 VBC); 및 YFM에 대한 활성을 입증하였다. 곤충 독소 TIC1425는 CLW, ECB, FAW, SCB 및 SWCB에 대한 활성을 입증하였다. 곤충 독소 TIC2613은 CEW, CLW, ECB, FAW, SBL, SAW, SCB, SWCB, TBW 및 VBC에 대한 활성을 입증하였다. BCW에 대해 평가될 때 TIC1425 및 TIC2613에 대해 활성이 관찰되지 않았다.
실험의 별개의 시리즈에서, TIC4472의 단백질 제제는 나비목 곤충 해충 근대 거염벌레(BAW, 스포돕테라 엑시구아), 분홍 솜벌레(PBW, 펙티노포라 고시피엘라), Cry1Ac 내성 분홍 솜벌레(PBW_Cry1Acr, 펙티노포라 고시피엘라), 올드 월드 솜벌레(OWB, 헬리코베르파 아르미게라), 오리엔탈 잎 벌레(OLW, 스포돕테라 리투라) 및 점무늬 솜벌레(SBW, 에아리아스 비텔라)에 대해 먹이 오버레이 검정을 이용하여 평가되었다. 표 5는 먹이 오버레이 생물검정에서 평가된 이들 나비목 곤충 해충의 각각에 대해 관찰된 활성으르 보여주고, 여기서 "+"는 활성을 나타낸다.
상기 표 5에서 볼 수 있는 것처럼, TIC4472는 분홍 솜벌레의 Cry1Ac 내성 콜로니를 포함하여 먹이 오버레이 생물검정에서 모든 나비목 곤충 해충에 대한 활성을 입증하였다.
표 3 내지 표 5에서 입증된 바대로, TIC4472, TIC1425 및 TIC2613은 광범위한 나비목 곤충 해충 종에 걸쳐 활성을 입증하였다.
실시예
3
식물 세포에서의 발현을 위한 TIC4472PL 및 TIC2613PL을 코딩하는 합성 코딩 서열의 설계
합성 코딩 서열을 식물에서 코딩된 단백질의 발현에서 사용하도록 작제하고, 2원 식물 형질전환 벡터로 클로닝하고, 사용하여 식물 세포를 형질전환시켰다. 합성 서열을 일반적으로 미국 특허 5,500,365호에 기재된 방법에 따라 합성하여, 소정의 해로운 문제 서열, 예컨대 ATTTA 및 A/T 농후 식물 폴리아덴일화 서열을 피했다. 합성 코딩 서열은 각각 TIC4472 및 TIC2613 단백질에 대해 개시 메티오닌 바로 뒤에 추가적인 알라닌 잔기를 포함하는 TIC4472PL 및 TIC2613PL 단백질을 코딩한다. 추가적인 알라닌 잔기는 곤충 독소 단백질의 발현을 개선하도록 합성 코딩 서열로 도입되었다.
TIC4472PL을 코딩하는 합성 코딩 서열(서열 번호 4)은 서열 번호 3으로서 본 명세서에서 제시된다. TIC2613PL을 코딩하는 합성 코딩 서열(서열 번호 10)은 서열 번호 9로서 제시된다. 2원 식물 형질전환 벡터에서 합성 코딩 서열을 사용하여 TIC4472PL 및 TIC2613PL 단백질을 발현하는 형질전환 식물을 생성하고, 나비목 곤충 해충에 대해 활성에 대해 평가하였다.
실시예
4
안정하게 형질전환된 면 식물에서의 나비목 해충에 대한 TIC4472PL 활성의 검정
당해 분야에 공지된 방법을 이용하여 비표적화된 TIC4472PL 살충 단백질을 발현하도록 설계된 전이유전자 카세트를 포함하는 2원 식물 형질전환 벡터를 클로닝하였다. 생성된 벡터를 사용하여 면 식물을 안정하게 형질전환시켰다. 조직을 형질전환체로부터 수확하고, 다양한 나비목 곤충 해충에 대해 곤충 생물검정에서 사용하였다.
합성 코딩 서열을 식물에서 코딩된 단백질의 발현에서 사용하기 위해 작제하고, 2원 식물 형질전환 벡터로 클로닝하고, 사용하여 면 식물 세포를 형질전환시켰다. 생성된 식물 형질전환 벡터는 리더에 작동 가능하게 5' 연결되고, 비표적화된 TIC4472PL 단백질을 코딩하는 합성 코딩 서열에 5' 작동 가능하게 연결되어, 결국 3' UTR에 5' 작동 가능하게 연결된, 구성적 촉진자로 구성된 TIC4472PL 살충 단백질의 발현을 위한 제1 전이유전자 카세트; 및 스펙티노마이신 선택을 이용하여 형질전환된 식물 세포의 선택을 위한 제2 전이유전자 카세트로 구성된다.
3개의 2원 식물 형질전환 벡터 작제물을 상기 기재된 바대로 작제하고, 상이한 구성적 촉진자를 구성하였다. 2개의 작제물, 작제물 1 및 작제물 3은 또한 리더에 3' 및 비표적화된 TIC4472PL 단백질을 발현하는 합성 코딩 서열에 5' 작동 가능하게 연결된 인트론 서열로 구성되었다. 작제물 2는 인트론 무였다. 면 식물을 아그로박테륨 매개된 형질전환 방법을 이용하여 3개의 상이한 2원 형질전환 벡터에 의해 형질전환시켰다. 형질전환된 세포를 당해 분야에 공지된 방법에 의해 식물을 형성하도록 유도하였다. 식물 잎 디스크를 사용한 생물검정은 미국 특허 제8,344,207호에 기재된 것과 유사하게 수행되었다. 1일 미만의 단일의 새로 부화된 신생아 애벌레는 각각의 잎 디스크 샘플에 위치하고, 대략 4일 동안 먹이공급에 허용되었다. 비형질전환된 면 식물을 이용하여 음성 대조군으로서 사용되는 조직을 얻었다. 각각의 2원 벡터로부터의 다수의 형질전환 R0 단일-카피 삽입 사건은 면 솜벌레(CBW, 헬리코베르파 제아), 밤나방유충(FAW, 스포돕테라 푸리기페르다), 대두 자벌레(SBL, 크리소데익시스 인클루덴스) 및 회색담배나방(TBW, 헬리오티스 비레센스)에 대해 평가되었다. 일(1) 내지 사(4)의 범위의 잎 손상 순위(Leaf Damage Rating: LDR) 점수는 사건에 적용되었다. LDR 점수는 각각의 잎 디스크에 관찰된 손상의 백분율에 기초한다. 하기 표 6은 LDR 점수 및 각각의 점수와 연관된 퍼센트 손상의 상응하는 범위를 보여준다. 일(1)의 LDR 점수에 대해, 특성의 침투를 또한 평가하였다. ("H"로 표시된 바와 같은) 높은 침투는 십(10) 퍼센트 이하의 입 손상을 갖는 각각의 작제물에 대한 평가된 사건의 오십(50) 퍼센트 초과로서 정의된다. ("L"로 표시된 바와 같은) 높은 침투는 십(10) 퍼센트 이하의 입 손상을 갖는 각각의 작제물에 대한 평가된 사건의 오십(50) 퍼센트 이하로서 정의된다. 침투는 일(1) 초과의 LDR 점수에 적용되지 않는다.
TIC4472PL을 발현하는 형질전환된 R0 면 식물에 대한 잎 손상 순위 점수는 하기 표 7에 제시되어 있다. 평가된 전체 수 사건 중에서 LDR 점수를 입증하는 사건의 수는 괄호 내에, 이어서 하나(1)의 LDR 점수에 대한 침투로 표시된다.
TIC4472PL을 발현하는 형질전환된 R0 면 식물은 표 7에 기재된 바대로 SBL 및 TBW에 대해 고도로 효율적이다(퍼센트 잎 손상보다 적거나 이와 동일한 것으로 정의됨). CBW 및 FAW에 대한 활성은 또한 몇몇 사건에서 관찰되었다.
R1 면 사건은 상기 평가된 형질전환된 R0 면 식물로부터 선택되고, FAW, SBL 및 TBW에 대해 디스크 검정에서 사용되었다. 표 8은 TIC4472PL을 발현하는 형질전환된 R1 면 식물에 대한 잎 손상 순위 점수를 보여준다.
상기 표 8에서 볼 수 있는 것처럼, 선택된 사건은 FAW, SBL 및 TBW에 대해 높은 효율을 보여주었다. 침투는 모든 3개의 곤충 해충 종에 대해 작제물 1 형질전환된 사건에 대해 높았다. 작제물 2 형질전환된 사건과 관련하여, 침투는 SBL에 대해 높았다.
상기는 TIC4472PL 단백질을 발현하는 형질전환된 면 식물이 밤나방유충(FAW, 스포돕테라 푸리기페르다), 대두 자벌레(SBL, 크리소데익시스 인클루덴스) 및 회색담배나방(TBW, 헬리오티스 비레센스)에 내성을 제공한다는 것을 입증한다.
실시예
5
안정하게 형질전환된 대두 식물에서 나비목 해충에 대한
TIC4472PL
및 TIC2613PL 활성의 검정
당해 분야에 공지된 방법을 이용하여 색소체 표적화된 TIC4472PL 또는 TIC2613PL 비표적화된 살충 단백질을 발현하도록 설계된 전이유전자 카세트를 포함하는 2원 식물 형질전환 벡터를 클로닝하였다. 생성된 벡터를 사용하여 대두 식물을 안정하게 형질전환시켰다. 조직을 형질전환체로부터 수확하고, 다양한 나비목 곤충 해충에 대해 곤충 생물검정에서 사용하였다.
실시예 3에 기재된 식물 발현에 대해 설계된 합성 코딩 서열을 2원 식물 형질전환 벡터 작제물로 클로닝하고, 대두 식물 세포를 형질전환시키도록 사용하였다. 색소체 표적화된 및 비표적화된 TIC4472PL을 발현하는 것으로 당해 분야에 공지된 방법을 이용하여 3개의 2원 벡터 작제물을 작제하였다. 작제물 4는 리더에 5' 작동 가능하게 연결되고, 비표적화된 TIC4472PL 단백질을 코딩하는 합성 코딩 서열에 5' 작동 가능하게 연결되어, 결국 3' UTR에 5' 작동 가능하게 연결된 구성적 촉진자로 구성된 비표적화된 TIC4472PL의 발현을 위한 제1 전이유전자 카세트 및; 스펙티노마이신 선택을 이용하여 형질전환된 식물 세포의 선택에 대한 제2 전이유전자 카세트로 구성된다. 작제물 5는 리더에 5' 작동 가능하게 연결되고, 인트론에 5' 작동 가능하게 연결되고, 색소체 표적화된 TIC4472PL 단백질을 코딩하는 합성 코딩 서열에 5' 작동 가능하게 연결되어, 결국 3' UTR에 5' 작동 가능하게 연결된 구성적 촉진자로 구성된 비표적화된 TIC4472PL의 발현을 위한 제1 전이유전자 카세트 및; 스펙티노마이신 선택을 이용하여 형질전환된 식물 세포의 선택에 대한 제2 전이유전자 카세트로 구성된다. 작제물 6은 리더에 5' 작동 가능하게 연결되고, 인트론에 5' 작동 가능하게 연결되고, 비표적화된 TIC4472PL 단백질을 코딩하는 합성 코딩 서열에 5' 작동 가능하게 연결되어, 결국 3' UTR에 5' 작동 가능하게 연결된 구성적 촉진자로 구성된 비표적화된 TIC4472PL의 발현을 위한 제1 전이유전자 카세트 및; 스펙티노마이신 선택을 이용하여 형질전환된 식물 세포의 선택에 대한 제2 전이유전자 카세트로 구성된다.
비표적화된 TIC2613PL을 발현하는 것으로 당해 분야에 공지된 방법을 이용하여 2개의 2원 벡터 작제물을 작제하였다. 작제물 7은 리더에 5' 작동 가능하게 연결되고, 비표적화된 TIC2613PL 단백질을 코딩하는 합성 코딩 서열에 5' 작동 가능하게 연결되어, 결국 3' UTR에 5' 작동 가능하게 연결된 구성적 촉진자로 구성된 비표적화된 TIC2613PL의 발현을 위한 제1 전이유전자 카세트 및; 스펙티노마이신 선택을 이용하여 형질전환된 식물 세포의 선택에 대한 제2 전이유전자 카세트로 구성된다. 작제물 8은 리더에 5' 작동 가능하게 연결되고, 인트론에 5' 작동 가능하게 연결되고, 비표적화된 TIC2613PL 단백질을 코딩하는 합성 코딩 서열에 5' 작동 가능하게 연결되어, 결국 3' UTR에 5' 작동 가능하게 연결된 구성적 촉진자로 구성된 비표적화된 TIC2613PL의 발현을 위한 제1 전이유전자 카세트 및; 스펙티노마이신 선택을 이용하여 형질전환된 식물 세포의 선택에 대한 제2 전이유전자 카세트로 구성된다.
생성된 2원 형질전환 벡터 작제물을 이용하여 아그로박테륨 매개된 형질전환 방법을 사용하여 대두 세포를 형질전환시켰다. 형질전환된 대두 세포를 유도하여 당해 분야에 공지된 방법에 의해 식물을 형성하였다. 식물 잎 디스크를 사용한 생물검정은 미국 특허 제8,344,207호에 기재된 것과 유사하게 수행되었다. 비형질전환된 대두 식물을 사용하여 음성 대조군으로서 사용되는 조직을 얻었다. 2원 벡터로부터 유래된 다수의 R0 대두 형질전환 사건은 써던 거염벌레(SAW, 스포돕테라 에리다니아), 대두 자벌레(SBL, 크리소데익시스 인클루덴스) 및 대두 꼬투리벌레(SPW, 헬리코베르파 제아)에 대해 평가되었다. 잎 손상 순위(LDR) 점수는 면에 대해서 그것과 유사하지만, 점수를 결정하기 위해 사용된 백분율 손상의 범위에서 다르다. 잎 손상 순위 점수 및 이의 상응하는 퍼센트 잎 손상 순위 범위는 하기 표 9에 제시된다.
TIC4472PL 및 TIC2613PL을 발현하는 형질전환된 R0 면 식물에 대한 잎 손상 순위 점수는 하기 표 10에 제시되어 있다. 평가된 전체 수 사건 중에서 LDR 점수를 입증하는 다수의 사건은 괄호 내에 표시된다.
상기 표 10에서 볼 수 있는 것처럼, TIC4472PL 및 TIC2613PL 둘 다의 발현 둘 다는 SAW 및 SBL에 대해 높은 효율을 입증하였다. 활성은 SPW에 대해 단백질 둘 다에 대해 더 낮았다.
R1 대두 사건은 상기 평가된 TIC4472PL 및 TIC2613PL을 발현하는 형질전환된 R0 대두 식물로부터 선택되고, SAW, SBL 및 SPW에 대해 잎 디스크 검정에서 사용되었다. TIC4472PL을 발현하는 R1 대두 사건은 벨벳콩 애벌레(VBW, 안티카르시아 겜마탈리스)에 대해 또한 평가되었다. 표 11은 TIC4472PL 및 TIC2613PL을 발현하는 형질전환된 R1 대두 식물에 대한 잎 손상 순위 점수를 보여준다.
표 11에서 볼 수 있는 것처럼, TIC4472PL에 의해 형질전환된 다수의 R1 대두 사건은 SAW 및 SBL에 대한 높은 효율을 입증하였다. 또한, 작제물 6을 사용하여 형질전환된 몇몇 R1 대두 사건은 VBC에 대한 높은 효율을 입증하였다. TIC2613PL에 의해 형질전환된 R1 대두 사건은 SBL에 대해 높은 효율을 입증하였다.
상기는 TIC4472PL 또는 TIC2613PL을 발현하는 형질전환된 대두 식물이 나비목 곤충, 특히 써던 거염벌레(스포돕테라 에리다니아) 및 대두 자벌레(크리소데익시스 인클루덴스) 및 벨벳콩 애벌레(안티카르시아 겜마탈리스)에 내성을 제공한다는 것을 입증한다.
실시예
6
안정하게 형질전환된 옥수수 식물에서 나비목 해충에 대한
TIC4472PL
및 TIC2613PL 활성의 검정
색소체 표적화된 및 비표적화된 TIC4472PL 또는 TIC2613PL 살충 단백질 둘 다를 발현하도록 설계된 전이유전자 카세트를 포함하는 2원 식물 형질전환 벡터를 당해 분야에 공지된 방법을 이용하여 클로닝하였다. 생성된 벡터를 사용하여 옥수수 식물을 안정하게 형질전환시켰다. 조직은 형질전환체로부터 수확되고, 다양한 나비목 곤충 해충에 대해 곤충 생물검정에서 사용되었다.
TIC4472PL(서열 번호 3) 또는 TIC2613(서열 번호 9) 단백질을 코딩하는 합성 코딩 서열을 2원 형질전환 벡터로 클로닝하였다. 색소체 표적화된 단백질에 대해, 합성 TIC4472PL 또는 TIC2613PL 살충 단백질 코딩 서열을 엽록체 표적화 신호 펩타이드 코딩 서열과 인프레임으로 작동 가능하게 연결하였다. 생성된 식물 형질전환 벡터는 리더에 5' 작동 가능하게 연결되고, 인트론에 5' 작동 가능하게 연결되고, 색소체 표적화된 또는 비표적화된 TIC4472PL 또는 TIC2613PL 단백질을 코딩하는 합성 코딩 서열에 5' 작동 가능하게 연결되어, 결국 3' UTR에 5' 작동 가능하게 연결된 구성적 촉진자를 포함하는 TIC4472PL 또는 TIC2613PL 살충 단백질의 발현을 위한 제1 전이유전자 카세트; 및 글라이포세이트 선택을 이용하여 형질전환된 식물 세포의 선택을 위한 제2 전이유전자 카세트를 포함한다.
옥수수 식물은 아그로박테륨 매개된 형질전환 방법을 이용하여 상기 기재된 2원 형질전환 벡터에 의해 형질전환된다. 형질전환된 세포는 당해 분야에 공지된 방법에 의해 식물을 형성하도록 유도된다. 식물 잎 디스크를 이용한 생물검정은 미국 특허 제8,344,207호에 기재된 것과 유사하게 수행된다. 비형질전환된 옥수수 식물은 음성 대조군으로서 사용되는 조직을 얻도록 사용되었다. 각각의 2원 벡터로부터의 다수의 형질전환 사건은 근대 거염벌레(BAW, 스포돕테라 엑시구아), 블랙 야도충(BCW, 아그로티스 입실론), 옥수수 귀벌레(CEW, 헬리코베르파 제아), 면 잎 벌레(CLW, 알라바마 아르길라세아), 유럽 옥수수 나무좀(ECB, 오스트리니아 누빌랄리스), 밤나방유충(FAW, 스포돕테라 푸리기페르다), 올드 월드 솜벌레(OWB, 헬리코베르파 아르미게라), 오리엔탈 잎 벌레(OLW, 스포돕테라 리투라), 분홍 솜벌레(PBW, 펙티노포라 고시피엘라), 대두 자벌레(SBL, 크리소데익시스 인클루덴스), 점무늬 솜벌레(SBW, 에아리아스 비텔라), 사우쓰웨스턴 옥수수 나무좀(SWCB, 디아트라에아 그라디오셀라), 사탕수수 나무좀(SCB, 디아트라에아 사카랄리스), 회색담배나방(TBW, 헬리오티스 비레센스) 및 벨벳콩 애벌레(VBW, 안티카르시아 겜마탈리스), 및 다른 나비목 곤충 해충에 대해 평가되었다.
곤충 해충은 TIC4472PL 또는 TIC2613PL을 발현하는 제시된 잎 디스크의 침입에 의해 생긴 사망률 및 영양실조에 대해 관찰되고, 비형질전환된 옥수수 식물로부터 유래된 잎 디스크와 비교되었다.
본 명세서에 개시되고 청구된 모든 조성물은 본 개시내용의 견지에서 부당한 실험 없이 이루어지고 실행될 수 있다. 본 발명의 조성물이 상기 예시적인 실시형태의 면에서 기재되어 있지만, 본 발명의 진정한 개념, 정신 및 범위로부터 벗어나지 않으면서 본 명세서에 기재된 조성물에 변동, 변화, 변형 및 변경이 적용될 수 있다는 것이 당업자에게 명확할 것이다. 더 구체적으로, 화학적으로 및 생리학적으로 둘 다와 관련된 소정의 물질이 본 명세서에 기재된 물질에 대해 치환될 수 있지만, 동일한 또는 유사한 결과가 성취될 것이라는 것이 이해될 것이다. 당업자에게 명확한 모든 이러한 유사한 치환물 및 변형은 첨부된 청구항에 의해 정의된 바대로 본 발명의 정신, 범위 및 개념 내에 있는 것을 간주된다는 것이 명확하다.
본 명세서에 인용된 모든 공보 및 공개 특허 문헌은, 각각의 개별 공보 또는 특허 출원이 구체적으로 및 개별적으로 참고로 포함된 것으로 표시된 것과 동일한 정도로 본 명세서에 참고로 포함된다.
SEQUENCE LISTING
<110> Monsanto Technology LLC
<120> NOVEL INSECT INHIBITORY PROTEINS
<130> WO2018/071324
<140> PCT/US2017/055731
<141> 2017-09-19
<150> US 62/406082
<151> 2016-10-10
<160> 10
<170> PatentIn version 3.5
<210> 1
<211> 3564
<212> DNA
<213> Bacillus thuringienses
<220>
<221> misc_feature
<222> (1)..(3564)
<223> Nucleic acid sequence encoding a TIC4472 pesticidal protein
obtained from Bacillus thuringiensis species EG10742.
<400> 1
atgaataata atattgaaaa ccaatgcgta ccttacaatt gtttaagtaa tcctgaagaa 60
gtaattttgg atggagaacg gatatcaact ggtaattcat caattgatat ttctctgtca 120
cttgttcaac ttctggtatc taactttgta ccaggcggag gatttttagt agggttaata 180
gattttgtat ggggaatagt aggcccttct ccatgggatg catttctagt gcaaattgaa 240
caattaattc agcaaagaat agaagcatat gctagggctg cagcaatttc taatttagaa 300
ggaataggaa acaatttcaa tatatatgtg gaagcatttc aagaatggga agaagatcct 360
aataatccag caaccaggaa tagagtagtt gatcgctttc gtatacttga tgggctactt 420
gaaagggaca ttccttcgtt tcgaatttct ggatttgaag tccccctttt atccgtttat 480
gctcaagcgg ccaatctgca tctagctata ttaagagatt ctgtaatttt tggagaaaga 540
tggggattga caacaacaaa tgtcaatgaa aactataata gacaaatcag gcatattgat 600
gaatatgctg atcactgtgc aaatacgtat aatcggggat taaataattt accgaaatct 660
acgtatcaag attggataac atataatcga ttacggagag aattaacatt gactgtatta 720
gatatcgctg ctttctttcc aaactatgac aataggcggt atccaattca gccagttggt 780
caactaacaa gggaagttta tacggaccca ttaattactt ttaatcccca gttacagtct 840
gtagctcaat tacctacttt taacgttatg gaaagcaacg caattagaaa tcctcatttg 900
tttgatatat tgaataatct tacaattttt acggattggt ttagtgttgg acgcaacttt 960
tattggggag gacatcgagt aacttctaac tatataggag gaggcaacat aacatctcct 1020
atatatggaa gagaggcgaa ccaggagcct ccaagatctt ttacttttaa tggacctgtt 1080
tttaggactt tatcaaatcc tactttacga ttattacagc aaccttggcc agcaccacca 1140
tttaatttac gtggtgttga aggagtagaa ttttctacac ctacaaatag ctttacgtat 1200
cgaggaagag gtacagttga ttctttaacc gaattaccgc ctgaggataa tagtgtgcta 1260
cctcgcgagg gatatagtca tcgtttatgt catgcaactt ttgttcaaag atctggaaca 1320
ccatttttaa caacgggtgt agtattttct tggacgcatc gcagtgcaac tcttacaaat 1380
acaattgatc cagacaaaat tactcagata cctttagtga aaggatttag agtttggagt 1440
ggcgcctctg tcgttacagg accaggtttt acaggagggg atatccttcg aagaactaac 1500
tttggggatt ttgtatctat gcaagttaat attaattcac caataacaca aagataccgt 1560
ttaagatttc gttatgcttc cagtagagat gcacgactta cagtagcgac aggagcagca 1620
aacacaggag ttggagggca aattagtgtg gacatggctc ttcagaaaac tatggaaatt 1680
ggagagagct taacatctag aacatttaga tataccgatt ttagtaatcc tttttcattt 1740
agagctaatc cagatataat tcgtataaat gaacaaccac tattcggtgc aggctctatt 1800
agtagtggtg aactttatat agataaaatt gaaattattc tagcagatgc aacatttgaa 1860
gcagaatatg atttggaaag agcacagaag gcggtgaatg cgctgtttac ttctacaaac 1920
caaagaggat taaaaacaga tgtgacggat tatcatattg atcaagtatc caatttagtt 1980
gagtgtttat cggatgaatt ttgtctggat gaaaaacgag aattgtccga gaaagtcaaa 2040
catgcgaagc gactcagtga tgagcgaaat ttactccagg atcgaaattt cacatccatt 2100
aatgggcaac tagaccgtgg ctggagagga agtacggata ttaccatcca aggaggagat 2160
gacgtattca aagagaatta cgtcacacta ctgggtacct ttgatgagtg ctatccaacg 2220
tatttatatc aaaaaataga tgagtcgaaa ttaaaagcct atacccgcta tgaattaaga 2280
gggtatatcg aggatagtca agacttagaa atctatttaa ttcgctacaa tgcaaaacac 2340
gaaacagtaa atgtgccagg tacaggttcc ttatggccgc tttcagtcga aagtccaatc 2400
ggaaagtgtg gagaaccgaa tcgatgcaca ccacaccttg aatggaatcc taatctagat 2460
tgttcctgca gagacgggaa aacatgtgca catcattctc atcatttctc cttggacatt 2520
gatgttggat gtacagactt aaatgaagat ctaggtgtat gggtgatatt caagattaag 2580
acgcaagatg gtcatgcaag actaggaaat ctagagtttc tcgaagagaa accattagta 2640
ggagaagcgt tagctcgtgt gaaaagagcg gagaaaaaat ggagagacaa acgcgaaaaa 2700
ttgcaattag aaacaaatat cgtttacaaa gaggcaaaag aagctgtgga tgctttattt 2760
gtaaactctc aatatgatag attacaagtg gatacgaaca ttgccatgat tcatgcggca 2820
gataaacgcg ttcatagaat ccgagaagcg tatcttccag agttatctgt gattccgggt 2880
gtcaatgcgg ctattttcga agaattagaa gggtgtgttt tcactgcatt ctccctatat 2940
gatgcgagaa atgtcattaa aaatggcgat tttaataatg gcttatcatg ctggaacgtg 3000
aaagggcatg tagaagaaca aaacgaccat cgttcggtcc ttgttgtccc ggaatgggaa 3060
gcagaagtgt cacaagaggt tcgtgtctgt ccaggtcgtg gctatatcct tcgtgttaca 3120
gcatacaaag agggatatgg agaaggctgt gtaaccattc atgggatcga gaacaataca 3180
gacgaactga agtttagcaa ctgcgtagaa gaggaagtct atccaaacaa cacggtaacg 3240
tgtaatgatt atcctgcaaa tcaagaagaa tacgggggtg cgtacacttc tcgtaatcgt 3300
ggatatgacg aaacttatgg aagcaattct tccgtatcag ctgattatgc gtcagtttat 3360
gaagaaaaag cgtatacaga tggacgaaga gacaatccat gtgaatttaa cagagggtat 3420
ggggattata cgccactacc agctggctat gtaacaaaag aattagaata cttcccagaa 3480
accgataagg tatggattga gattggagaa acggaaggaa cattcatcgt ggacagtgtg 3540
gaattactcc ttatggagga atag 3564
<210> 2
<211> 1187
<212> PRT
<213> Bacillus thuringienses
<220>
<221> MISC_FEATURE
<222> (1)..(1187)
<223> The amino acid sequence of the TIC4472 pesticidal protein.
<400> 2
Met Asn Asn Asn Ile Glu Asn Gln Cys Val Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Ile Leu Asp Gly Glu Arg Ile Ser Thr Gly Asn
20 25 30
Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Leu Leu Val Ser Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val Trp
50 55 60
Gly Ile Val Gly Pro Ser Pro Trp Asp Ala Phe Leu Val Gln Ile Glu
65 70 75 80
Gln Leu Ile Gln Gln Arg Ile Glu Ala Tyr Ala Arg Ala Ala Ala Ile
85 90 95
Ser Asn Leu Glu Gly Ile Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala
100 105 110
Phe Gln Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Asn Arg
115 120 125
Val Val Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile
130 135 140
Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr
145 150 155 160
Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Glu Asn Tyr
180 185 190
Asn Arg Gln Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn
195 200 205
Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp
210 215 220
Trp Ile Thr Tyr Asn Arg Leu Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile
245 250 255
Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile
260 265 270
Thr Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn
275 280 285
Val Met Glu Ser Asn Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu
290 295 300
Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe
305 310 315 320
Tyr Trp Gly Gly His Arg Val Thr Ser Asn Tyr Ile Gly Gly Gly Asn
325 330 335
Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg
340 345 350
Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr
355 360 365
Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg
370 375 380
Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr
385 390 395 400
Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp
405 410 415
Asn Ser Val Leu Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala
420 425 430
Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val
435 440 445
Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro
450 455 460
Asp Lys Ile Thr Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Ser
465 470 475 480
Gly Ala Ser Val Val Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu
485 490 495
Arg Arg Thr Asn Phe Gly Asp Phe Val Ser Met Gln Val Asn Ile Asn
500 505 510
Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser
515 520 525
Arg Asp Ala Arg Leu Thr Val Ala Thr Gly Ala Ala Asn Thr Gly Val
530 535 540
Gly Gly Gln Ile Ser Val Asp Met Ala Leu Gln Lys Thr Met Glu Ile
545 550 555 560
Gly Glu Ser Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn
565 570 575
Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Arg Ile Asn Glu Gln
580 585 590
Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp
595 600 605
Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Tyr Asp
610 615 620
Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn
625 630 635 640
Gln Arg Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Gln Val
645 650 655
Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys
660 665 670
Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu
675 680 685
Arg Asn Leu Leu Gln Asp Arg Asn Phe Thr Ser Ile Asn Gly Gln Leu
690 695 700
Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asp
705 710 715 720
Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp Glu
725 730 735
Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys
740 745 750
Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp
755 760 765
Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn
770 775 780
Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile
785 790 795 800
Gly Lys Cys Gly Glu Pro Asn Arg Cys Thr Pro His Leu Glu Trp Asn
805 810 815
Pro Asn Leu Asp Cys Ser Cys Arg Asp Gly Lys Thr Cys Ala His His
820 825 830
Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn
835 840 845
Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly
850 855 860
His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Val
865 870 875 880
Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp
885 890 895
Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val Tyr Lys Glu Ala
900 905 910
Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu
915 920 925
Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val
930 935 940
His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly
945 950 955 960
Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Cys Val Phe Thr Ala
965 970 975
Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn
980 985 990
Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Glu Glu Gln Asn
995 1000 1005
Asp His Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val
1010 1015 1020
Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg
1025 1030 1035
Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile
1040 1045 1050
His Gly Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys
1055 1060 1065
Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp
1070 1075 1080
Tyr Pro Ala Asn Gln Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg
1085 1090 1095
Asn Arg Gly Tyr Asp Glu Thr Tyr Gly Ser Asn Ser Ser Val Ser
1100 1105 1110
Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Tyr Thr Asp Gly
1115 1120 1125
Arg Arg Asp Asn Pro Cys Glu Phe Asn Arg Gly Tyr Gly Asp Tyr
1130 1135 1140
Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe
1145 1150 1155
Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly
1160 1165 1170
Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1175 1180 1185
<210> 3
<211> 3567
<212> DNA
<213> Artificial
<220>
<223> A synthetic coding sequence encoding a TIC4472PL pesticidal
protein designed for expression in a plant cell wherein an
additional alanine codon is inserted immediately following the
initiating methionine codon.
<400> 3
atggctaata acaacatcga gaaccagtgc gtgccctaca actgcctttc gaacccggag 60
gaagtgatcc tggacggcga aaggatctcg accgggaata gcagcatcga catctcgctt 120
tcgctcgtgc agcttctagt cagtaacttc gttccgggcg gagggtttct cgtgggcctt 180
attgacttcg tttggggcat cgtgggccca tctccttggg acgcattcct cgtgcagatc 240
gagcaactga tccagcagcg tatcgaggcg tacgctaggg ctgccgctat ctccaacctg 300
gagggcatcg gcaacaactt caacatctac gttgaagcct tccaagaatg ggaggaagat 360
cctaataacc cagctacgcg gaacagagtg gtggatcgct ttagaatcct cgacggcctc 420
ctggaaaggg acatcccgag cttccgtatt tccggcttcg aggtgccgct gctgagcgtg 480
tacgcgcaag cggccaatct gcacctggcg attctccggg actctgtgat cttcggcgag 540
cggtggggcc tcaccaccac taacgtgaac gagaactaca accgccagat ccgccacatc 600
gacgagtacg cggaccactg cgccaacaca tacaatcgcg ggctgaacaa cctccctaag 660
agcacttacc aagattggat cacctacaac aggctccgcc gggaactcac tctcacagtc 720
ctcgacatcg ctgccttctt cccgaactac gacaaccgcc gctacccgat tcagccagtc 780
ggccagctca cccgtgaggt gtacaccgat ccactgataa ctttcaatcc gcagctccag 840
tctgtcgcac agttgcccac cttcaacgtc atggaaagca acgccatcag gaacccacac 900
ttgttcgaca tccttaacaa cctgactatc ttcaccgact ggttcagcgt cggacggaac 960
ttctactggg gcggacaccg cgtcacctca aactacatcg gcggcggcaa cattacttcg 1020
cccatctacg gccgggaggc gaatcaggag ccgccacgca gctttacatt caacggtcct 1080
gtgtttcgca cgttatcgaa cccgacactc aggctgctcc agcagccctg gcctgcgccg 1140
ccgtttaatt tgcgcggcgt cgaaggcgtc gagttcagta cgccgaccaa cagcttcacc 1200
tatcgcggac gcgggactgt tgactccctg acagagctgc cgccggagga caactcggtt 1260
ctgccgcgtg agggctacag ccataggctt tgtcacgcga cctttgtgca gcgatccggg 1320
acaccgttcc ttacaaccgg cgtggtgttc tcctggacac accgcagtgc aactctgacg 1380
aacacgattg acccagacaa gatcacgcag atcccgttag tgaagggctt ccgggtttgg 1440
tctggtgcct ctgtagtcac tgggcctggc tttacgggtg gcgacatcct ccgtcgcacg 1500
aactttggcg acttcgtgtc catgcaagtg aacattaaca gccctattac gcaacgctac 1560
cggctgaggt tcagatacgc ttcctcgcgg gacgcccgtc ttacggtggc gacgggcgca 1620
gcgaacactg gagttggcgg ccaaatctcc gtggacatgg ctttgcagaa gactatggag 1680
atcggtgagt ctctcacatc tcgcacgttc cgctacacgg atttctccaa ccctttctcc 1740
ttccgcgcca atccggacat cattcggatc aacgaacagc cgctcttcgg cgcgggctcc 1800
atctcatccg gtgagcttta cattgataag attgagataa ttctggccga cgcgaccttt 1860
gaggcagagt atgatctgga gcgcgcacag aaggccgtga acgcgctgtt tacgtccacg 1920
aaccagcgcg ggctcaagac agacgtcaca gactaccaca tcgaccaagt ctccaacctt 1980
gtcgagtgtc tctccgacga gttctgcctg gacgagaagc gggagcttag tgagaaggtg 2040
aagcacgcaa agcgcctgtc tgacgagcgg aaccttctac aagaccgtaa cttcacctcc 2100
attaacgggc agctagaccg tggctggcgc gggtccaccg acatcactat ccaaggtggc 2160
gacgacgtct tcaaggagaa ctacgtgacg ctgctcggca cctttgacga gtgctacccg 2220
acatacctct atcagaagat tgacgagtct aagctcaagg cttacacccg ttacgagctg 2280
cgtggctaca tcgaggactc ccaggatctg gaaatctatc tcatcagata caacgcgaag 2340
cacgagacag tcaacgtacc tgggacaggc tctctctggc ctctgtctgt ggagagtccc 2400
atcggcaaat gtggcgagcc gaacagatgt actccgcacc tggagtggaa tcccaacttg 2460
gactgtagtt gccgcgacgg caagacctgc gcgcaccact cccaccactt ctccctggac 2520
attgacgtcg gctgcacgga tctcaacgag gatctgggcg tttgggtcat cttcaagata 2580
aagacccagg acggacacgc cagactggga aacctagagt tccttgagga gaagccgctg 2640
gtcggcgaag cactggcgcg ggtcaagagg gccgagaaga agtggcggga caaacgggag 2700
aaacttcaac tcgaaacgaa catcgtttac aaggaggcaa aggaggccgt ggacgcactg 2760
ttcgtgaact cgcagtacga ccgcctccaa gtggacacca acatcgccat gatccatgca 2820
gcggacaagc gcgtgcaccg aatcagggaa gcgtacttgc ccgagttgtc cgttatccct 2880
ggcgtgaacg ctgccatctt cgaggaactg gagggctgcg tgttcaccgc attctccctg 2940
tacgacgcac gaaacgtcat caagaatggc gacttcaaca acggcctgag ctgctggaac 3000
gtgaagggcc acgtggagga gcagaacgac caccgctccg tgttagtggt cccggaatgg 3060
gaagccgaag tgagccagga ggtcagggtg tgtcccggtc gcggttacat cctccgcgtg 3120
accgcctaca aggagggcta tggcgagggc tgcgtgacga tacacggtat cgagaacaac 3180
accgatgagc ttaagttctc gaactgcgtg gaggaggagg tgtacccgaa taacacagtg 3240
acgtgcaatg actacccggc caaccaggag gagtacggcg gtgcctacac gagccgaaac 3300
cgtggctatg acgaaactta cggctcgaac agcagcgtgt ctgcggatta tgccagtgtg 3360
tacgaggaga aggcgtacac ggacgggcgg cgcgacaacc cttgcgagtt caatagaggc 3420
tatggcgact acacgccgct gcccgccggt tatgtgacga aggagttgga atacttccca 3480
gagacggaca aggtgtggat cgagattggc gagaccgagg gcacgttcat tgtggacagc 3540
gttgagctgc tactgatgga ggagtga 3567
<210> 4
<211> 1188
<212> PRT
<213> Artificial
<220>
<223> The amino acid sequence of TIC4472PL encoded by a synthetic
coding sequence designed for expression in a plant cell (SEQ ID
NO:3), and wherein an additional alanine amino acid is inserted
immediately following the initiating methionine.
<400> 4
Met Ala Asn Asn Asn Ile Glu Asn Gln Cys Val Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Ile Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Leu Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Pro Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Gln Gln Arg Ile Glu Ala Tyr Ala Arg Ala Ala Ala
85 90 95
Ile Ser Asn Leu Glu Gly Ile Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Gln Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Asn
115 120 125
Arg Val Val Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Gln Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Thr Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Ser Asn Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Thr Ser Asn Tyr Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Leu Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Asp Lys Ile Thr Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Ser Gly Ala Ser Val Val Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Thr Asn Phe Gly Asp Phe Val Ser Met Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Leu Thr Val Ala Thr Gly Ala Ala Asn Thr Gly
530 535 540
Val Gly Gly Gln Ile Ser Val Asp Met Ala Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Ser Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Arg Ile Asn Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Tyr
610 615 620
Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Thr
625 630 635 640
Asn Gln Arg Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Gln
645 650 655
Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu
660 665 670
Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp
675 680 685
Glu Arg Asn Leu Leu Gln Asp Arg Asn Phe Thr Ser Ile Asn Gly Gln
690 695 700
Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly
705 710 715 720
Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp
725 730 735
Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu
740 745 750
Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln
755 760 765
Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val
770 775 780
Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Val Glu Ser Pro
785 790 795 800
Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Thr Pro His Leu Glu Trp
805 810 815
Asn Pro Asn Leu Asp Cys Ser Cys Arg Asp Gly Lys Thr Cys Ala His
820 825 830
His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu
835 840 845
Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp
850 855 860
Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu
865 870 875 880
Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg
885 890 895
Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val Tyr Lys Glu
900 905 910
Ala Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg
915 920 925
Leu Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg
930 935 940
Val His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro
945 950 955 960
Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Cys Val Phe Thr
965 970 975
Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe
980 985 990
Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Glu Glu Gln
995 1000 1005
Asn Asp His Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu
1010 1015 1020
Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu
1025 1030 1035
Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr
1040 1045 1050
Ile His Gly Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn
1055 1060 1065
Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn
1070 1075 1080
Asp Tyr Pro Ala Asn Gln Glu Glu Tyr Gly Gly Ala Tyr Thr Ser
1085 1090 1095
Arg Asn Arg Gly Tyr Asp Glu Thr Tyr Gly Ser Asn Ser Ser Val
1100 1105 1110
Ser Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Tyr Thr Asp
1115 1120 1125
Gly Arg Arg Asp Asn Pro Cys Glu Phe Asn Arg Gly Tyr Gly Asp
1130 1135 1140
Tyr Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr
1145 1150 1155
Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu
1160 1165 1170
Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1175 1180 1185
<210> 5
<211> 3564
<212> DNA
<213> Bacillus thuringienses
<220>
<221> misc_feature
<222> (1)..(3564)
<223> Nucleic acid sequence encoding a TIC1425 pesticidal protein
obtained from Bacillus thuringiensis species EG10731.
<400> 5
atgaataata atattgaaaa ccaatgcgta ccttacaatt gtttaagtaa tcctgaagaa 60
gtaattttgg atggagaacg gatatcaact ggtaattcat caattgatat ttctctgtca 120
cttgttcaac ttctggtatc taactttgta ccaggcggag gatttttagt agggttaata 180
gattttgtat ggggaatagt aggcccttct ccatgggatg catttctagt gcaaattgaa 240
caattaattc agcaaagaat agaagcatat gctagggctg cagcaatttc taatttagaa 300
ggaataggaa acaatttcaa tatatatgtg gaagcatttc aagaatggga agaagatcct 360
aataatccag caaccaggaa tagagtagtt gatcgctttc gtatacttga tgggctactt 420
gaaagggaca ttccttcgtt tcgaatttct ggatttgaag tccccctttt atccgtttat 480
gctcaagcgg ccaatctgca tctagctata ttaagagatt ctgtaatttt tggagaaaga 540
tggggattga caacaacaaa tgtcaatgaa aactataata gacaaatcag gcatattgat 600
gaatatgctg atcactgtgc aaatacgtat aatcggggat taaataattt accgaaatct 660
acgtatcaag attggataac atataatcga ttacggagag aattaacatt gactgtatta 720
gatatcgctg ctttctttcc aaactatgac aataggcggt atccaattca gccagttggt 780
caactaacaa gggaagttta tacggaccca ttaattactt ttaatcccca gttacagtct 840
gtagctcaat tacctacttt taacgttatg gaaagcaacg caattagaaa tcctcatttg 900
tttgatatat tgaataatct tacaattttt acggattggt ttagtgttgg acgcaacttt 960
tattggggag gacatcgagt aacttctaac tatataggag gaggcaacat aacatctcct 1020
atatatggaa gagaggcgaa ccaggagcct ccaagatctt ttacttttaa tggacctgtt 1080
tttaggactt tatcaaatcc tactttacga ttattacagc aaccttggcc agcaccacca 1140
tttaatttac gtggtgttga aggagtagaa ttttctacac ctacaaatag ctttacgtat 1200
cgaggaagag gtacagttga ttctttaacc gaattaccgc ctgaggataa tagtgtgcta 1260
cctcgcgagg gatatagtca tcgtttatgt catgcaactt ttgttcaaag atctggaaca 1320
ccatttttaa caacgggtgt agtattttct tggacgcatc gcagtgcaac tcttacaaat 1380
acaattgatc cagacaaaat tactcagata cctttagtga aaggatttag agtttggagt 1440
ggcgcctctg tcgttacagg accaggtttt acaggagggg atatccttcg aagaactaac 1500
tttggggatt ttgtatctat gcaagttaat attaattcac caataacaca aagataccgt 1560
ttaagatttc gttatgcttc cagtagagat gcacgactta cagtagcgac aggagcagca 1620
aacacaggag ttggagggca aattagtgtg gacatggctc ttcagaaaac tatggaaatt 1680
ggagagagct taacatctag aacatttaga tataccgatt ttagtaatcc tttttcattt 1740
agagctaatc cagatataat tcgtataaat gaacaaccac tattcggtgc aggctctatt 1800
agtagtggtg aactttatat agataaaatt gaaattattc tagcagatgc aacatttgaa 1860
gcagaatatg atttggaaag agcacagaag gcggtgaatg cgctgtttac ttctacaaac 1920
caaagaggat taaaaacaga tgtgacggat tatcatattg atcaagtatc caatttagtt 1980
gagtgtttat cggatgaatt ttgtctggat gaaaaacgag aattgtccga gaaagtcaaa 2040
catgcgaagc gactcagtga tgagcgaaat ttactccagg atcgaaattt cacatccatt 2100
aatgggcaac tagaccgtgg ctggagagga agtacggata ttaccatcca aggaggagat 2160
gacgtattca aagagaatta cgtcacacta ctgggtacct ttgatgagtg ctatccaacg 2220
tatttatatc aaaaaataga tgagtcgaaa ttaaaagcct atacccgcta tgaattaaga 2280
gggtatatcg aggatagtca agacttagaa atctatttaa ttcgctacaa tgcaaaacac 2340
gaaacagtaa atgtgccagg tacaggttcc ttatggccgc tttcagtcga aagtccaatc 2400
ggaaagtgtg gagaaccgaa tcgatgcaca ccacaccttg aatggaatcc taatctagat 2460
tgttcctgca gagacgggaa aacatgtgca catcattctc atcatttctc cttggacatt 2520
gatgttggat gtacagactt aaatgaagat ctaggtgtat gggtgatatt caagattaag 2580
acgcaagatg gtcatgcaag actaggaaat ctagagtttc tcgaagagaa accattagta 2640
ggagaagcgt tagctcgtgt gaaaagagcg gagaaaaaat ggagagacaa acgcgaaaaa 2700
ttgcaattag aaacaaatat cgtttacaaa gaggcaaaag aagctgtgga tgctttattt 2760
gtaaactctc aatatgatag attacaagtg gatacgaaca ttgccatgat tcatgcggca 2820
gataaacgcg ttcatagaat ccgagaagcg tatcttccag agttatctgt gattccgggt 2880
gtcaatgcgg ctattttcga agaattagaa gggtgtattt tcactgcatt ctccctatat 2940
gatgcgagaa atgtcattaa aaatggcgat tttaataatg gcttatcatg ctggaacgtg 3000
aaagggcatg tagaagaaca aaacgaccat cgttcggtcc ttgttgtccc ggaatgggaa 3060
gcagaagtgt cacaagaggt tcgtgtctgt ccaggtcgtg gctatatcct tcgtgttaca 3120
gcatacaaag agggatatgg agaaggctgt gtaaccattc atgggatcga gaacaataca 3180
gacgaactga agtttagcaa ctgcgtagaa gaggaagtct atccaaacaa cacggtaacg 3240
tgtaatgatt atcctgcaaa tcaagaagaa tacgggggtg cgtacacttc tcgtaatcgt 3300
ggatatgacg aaacttatgg aagcaattct tccgtatcag ctgattatgc gtcagtttat 3360
gaagaaaaag cgtatacaga tggacgaaga gacaatccat gtgaatttaa cagagggtat 3420
ggggattata cgccactacc agctggctat gtaacaaaag aattagaata cttcccagaa 3480
accgataagg tatggattga gattggagaa acggaaggaa cattcatcgt ggacagtgtg 3540
gaattactcc ttatggagga ataa 3564
<210> 6
<211> 1187
<212> PRT
<213> Bacillus thuringienses
<220>
<221> MISC_FEATURE
<222> (1)..(1187)
<223> The amino acid sequence of the TIC1425 pesticidal protein.
<400> 6
Met Asn Asn Asn Ile Glu Asn Gln Cys Val Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Ile Leu Asp Gly Glu Arg Ile Ser Thr Gly Asn
20 25 30
Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Leu Leu Val Ser Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val Trp
50 55 60
Gly Ile Val Gly Pro Ser Pro Trp Asp Ala Phe Leu Val Gln Ile Glu
65 70 75 80
Gln Leu Ile Gln Gln Arg Ile Glu Ala Tyr Ala Arg Ala Ala Ala Ile
85 90 95
Ser Asn Leu Glu Gly Ile Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala
100 105 110
Phe Gln Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Asn Arg
115 120 125
Val Val Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile
130 135 140
Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr
145 150 155 160
Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Glu Asn Tyr
180 185 190
Asn Arg Gln Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn
195 200 205
Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp
210 215 220
Trp Ile Thr Tyr Asn Arg Leu Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile
245 250 255
Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile
260 265 270
Thr Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn
275 280 285
Val Met Glu Ser Asn Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu
290 295 300
Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe
305 310 315 320
Tyr Trp Gly Gly His Arg Val Thr Ser Asn Tyr Ile Gly Gly Gly Asn
325 330 335
Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg
340 345 350
Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr
355 360 365
Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg
370 375 380
Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr
385 390 395 400
Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp
405 410 415
Asn Ser Val Leu Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala
420 425 430
Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val
435 440 445
Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro
450 455 460
Asp Lys Ile Thr Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Ser
465 470 475 480
Gly Ala Ser Val Val Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu
485 490 495
Arg Arg Thr Asn Phe Gly Asp Phe Val Ser Met Gln Val Asn Ile Asn
500 505 510
Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser
515 520 525
Arg Asp Ala Arg Leu Thr Val Ala Thr Gly Ala Ala Asn Thr Gly Val
530 535 540
Gly Gly Gln Ile Ser Val Asp Met Ala Leu Gln Lys Thr Met Glu Ile
545 550 555 560
Gly Glu Ser Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn
565 570 575
Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Arg Ile Asn Glu Gln
580 585 590
Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp
595 600 605
Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Tyr Asp
610 615 620
Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn
625 630 635 640
Gln Arg Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Gln Val
645 650 655
Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys
660 665 670
Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu
675 680 685
Arg Asn Leu Leu Gln Asp Arg Asn Phe Thr Ser Ile Asn Gly Gln Leu
690 695 700
Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asp
705 710 715 720
Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp Glu
725 730 735
Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys
740 745 750
Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp
755 760 765
Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn
770 775 780
Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile
785 790 795 800
Gly Lys Cys Gly Glu Pro Asn Arg Cys Thr Pro His Leu Glu Trp Asn
805 810 815
Pro Asn Leu Asp Cys Ser Cys Arg Asp Gly Lys Thr Cys Ala His His
820 825 830
Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn
835 840 845
Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly
850 855 860
His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Val
865 870 875 880
Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp
885 890 895
Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val Tyr Lys Glu Ala
900 905 910
Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu
915 920 925
Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val
930 935 940
His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly
945 950 955 960
Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Cys Ile Phe Thr Ala
965 970 975
Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn
980 985 990
Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Glu Glu Gln Asn
995 1000 1005
Asp His Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val
1010 1015 1020
Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg
1025 1030 1035
Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile
1040 1045 1050
His Gly Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys
1055 1060 1065
Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp
1070 1075 1080
Tyr Pro Ala Asn Gln Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg
1085 1090 1095
Asn Arg Gly Tyr Asp Glu Thr Tyr Gly Ser Asn Ser Ser Val Ser
1100 1105 1110
Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Tyr Thr Asp Gly
1115 1120 1125
Arg Arg Asp Asn Pro Cys Glu Phe Asn Arg Gly Tyr Gly Asp Tyr
1130 1135 1140
Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe
1145 1150 1155
Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly
1160 1165 1170
Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1175 1180 1185
<210> 7
<211> 3537
<212> DNA
<213> Bacillus thuringienses
<220>
<221> misc_feature
<222> (1)..(3537)
<223> Nucleic acid sequence encoding a TIC2613 pesticidal protein
obtained from Bacillus thuringiensis species EG5408.
<400> 7
atggataaca atatcaagaa ccaatgcatt ccttacaatt gtttaaatga tcctgaggta 60
gaaatattag gtgaagaggg gataactact agtaatgaaa atctcgaatt tttcttatcg 120
ctaacgaaat ttgtcttgaa taggtttgtc cctggtggag catatgtagc tggcctattt 180
gatgtattct ggggatggtt aaaaccttct gattggtctg caatccttga acaaattgaa 240
gaattaatta accaaaaaat tgagacgttt gctagaaatc aagcaattag tagattggaa 300
gggttaagca acctttatga aatttacgca gatactttta aagaatggga aaaagatccg 360
actaatccag cattaagaga agaaatgcgt acacaattta atgacatgaa cagctctttt 420
gtaacagcta tgcctctttt ttcagttcaa aattttgaag ttcctctttt agcagtatac 480
gctcaagctg caaatttaca tctatcagtt ttaagggatg tctcagtttt tggtcaaaat 540
tggggatttg attcagccac tgtcaatagt cgttataatg atttagtaag aaatattcgt 600
acctatacaa attatgtcgt acgttggtat aacacaggat tagcaaggtt acgaggtact 660
acgtaccaag attggttaaa ttatcatcgc tttagaagag aattaacaat aactgcattg 720
gatatcatta ccatattccc acactacgat aataaaatgt atccaattca accccatttt 780
caattaacaa gagagattta tacggatcca ctaattaatt tcaatccggc gttacagtct 840
gtagcacaat tacctctatt taatgagatg gaaaatagta caattagaag ccctcattta 900
gttgattttt taaataggct tacaatttat acagattggt atagtctcgg aagacactat 960
tattggggag gacatcaaat agtctctaga caaacaggat caacttccac tattacattc 1020
cctatatatg gaagagaggc gaatcaagag gcccctagaa catataattt tagtcaacct 1080
gtctttagaa cactgtcaaa tcctacttta acacgtttaa tgcaaccttg gccagcccca 1140
gcatttcagt tgcgtcgtct tgagggagtt gaatttcaaa caactacagg taattttacg 1200
tatcgaggaa gaggtacggt agattccttt gatgaattac caccagatga tacaagcgta 1260
ccagcgcgtg aaggatatag tcatcgttta tgtcatgcaa catttatcag aaaatctggg 1320
acgccgtatt taacaacggg tgtaacacta tcttggacac acaatagcaa tacacctacg 1380
aatataattt atcctgataa aatcactcaa gtaccattgg tgaaagcatc taaccttcat 1440
tctagtgctt tcgttttaaa aggaccagga tttacaggag gggacatact tggaagaact 1500
agtgtgggca acatagcaga tatccaaatg aatattactg caccgttatc acaaagatat 1560
cgcgtacgaa ttcggtatgc ctctactaca aacttacaat ttcatacgac aattaacggc 1620
agggccgtaa atcaggctaa tttcccagca actatgaata gagtagaaga cttagaatat 1680
aattccttta gaacgataag tttcggtact ccttttaact ttttagatgc tcaaagtacc 1740
ttcaggttag gtgtatggag cttttcttca ggtaccgttt taatagatag aattgaagtt 1800
gtaccaatgg aagtaacatt tgaagcagaa tctgatttag aaagagcaca aaaggcggtg 1860
aacgctctgt ttacttctat aaatcaaaaa ggactaaaaa cagatgtaac agattatcac 1920
attgatcaag tatccaattt ggtcgaatgt ctatccgatg aattttgtct agatgaaaag 1980
agagaactat ttgagaaagt caaatatgcg aaacgactca gtgacgaacg gaatttactt 2040
gcagatccaa atttcacatc tattaatggg caactagatc gtggatggag aggaagtacg 2100
gatattacca ttcaaggggg cgatgacgta ttcaaagaaa actacgtcac actatcaggt 2160
acccttgatg agtgttatcc aacctattta tatcaaaaaa tagacgaatc gaaattaaaa 2220
gcgtataccc gttacgagtt acgaggatat atcgaagata gtcaagattt agaagtatac 2280
ttgattcgtt acaataccaa acatgaaaca ttgaatgtac caggtacagg gggcctatgg 2340
ccgcttgcag tagaaagttc aatcggaggg tgtggcgaac caaaccgatg cgcaccacaa 2400
atggaatggg atccaaatct agaatgttct tgtagcgacg aggagaaatg tgcgcatcat 2460
tcccatcatt tctctctcga tattgatgtt ggatgtactg atttaaatga aaatctaggt 2520
atatgggtta tatttaaaat taaaacgcag aacggttatg caaaattagg aaatttagag 2580
tttctcgaag agaaaccatt aataggggaa gcgttagctc gtgttaagcg agtggagaaa 2640
aaatggaaag acaaacgtga aaaattagaa tttgaaacga atatagtcta caacgaggca 2700
aaagaagctg tggatgcact attcgtaaat tcacaatatg atagattgca agctgataca 2760
aatatcgcaa tgattcatgc ggcggataac aaagttcata aaattcgcga ggcgtacctc 2820
ccagagttat ctgtgatacc aggtgtaaat gcgaccgttt ttgaagaatt agaagagcgt 2880
atttttacag cattctccct ttacgatgca agaaatgtga taaaaaatgg ggatttcaat 2940
aatggattat cttgttggaa tgtgaagggc caagtagatg tagaccaaaa tgaccatcgt 3000
tctgtccttg ttattccagg atgggaatcg gaagtatcac aagaagttca tgtatgtcca 3060
gatcgtggat acattcttcg tgttacggcg tacaaagaag gatatggaga aggctgcgta 3120
acaatccatg agattgataa tcatacagac gaactgaaat ttaaaaactg ctttgaagag 3180
gaagtatctc taaataatgc ggtgacatgt gatgagtata ctacaaatca agaagtagga 3240
gggtatgcgg atgtacgtca atccaataat cgtggatcta atgaggccta tgtaaatcct 3300
acttccacat caactgatta tgcatcgctc tacgaggaag agtcgtatac gaatgaacag 3360
acatataatt cttgtgaatc taacagaggg tatggtaatc aaatgccatt accgtctggc 3420
tatgtgacaa aagaattaga atattttcca gagacagata aagtatggat tgagattgga 3480
gaaacagaag gaacattcat cgtagacagt gtggaattac tccttatgga ggaataa 3537
<210> 8
<211> 1178
<212> PRT
<213> Bacillus thuringienses
<220>
<221> MISC_FEATURE
<222> (1)..(1178)
<223> The amino acid sequence of the TIC2613 pesticidal protein.
<400> 8
Met Asp Asn Asn Ile Lys Asn Gln Cys Ile Pro Tyr Asn Cys Leu Asn
1 5 10 15
Asp Pro Glu Val Glu Ile Leu Gly Glu Glu Gly Ile Thr Thr Ser Asn
20 25 30
Glu Asn Leu Glu Phe Phe Leu Ser Leu Thr Lys Phe Val Leu Asn Arg
35 40 45
Phe Val Pro Gly Gly Ala Tyr Val Ala Gly Leu Phe Asp Val Phe Trp
50 55 60
Gly Trp Leu Lys Pro Ser Asp Trp Ser Ala Ile Leu Glu Gln Ile Glu
65 70 75 80
Glu Leu Ile Asn Gln Lys Ile Glu Thr Phe Ala Arg Asn Gln Ala Ile
85 90 95
Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Glu Ile Tyr Ala Asp Thr
100 105 110
Phe Lys Glu Trp Glu Lys Asp Pro Thr Asn Pro Ala Leu Arg Glu Glu
115 120 125
Met Arg Thr Gln Phe Asn Asp Met Asn Ser Ser Phe Val Thr Ala Met
130 135 140
Pro Leu Phe Ser Val Gln Asn Phe Glu Val Pro Leu Leu Ala Val Tyr
145 150 155 160
Ala Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser Val
165 170 175
Phe Gly Gln Asn Trp Gly Phe Asp Ser Ala Thr Val Asn Ser Arg Tyr
180 185 190
Asn Asp Leu Val Arg Asn Ile Arg Thr Tyr Thr Asn Tyr Val Val Arg
195 200 205
Trp Tyr Asn Thr Gly Leu Ala Arg Leu Arg Gly Thr Thr Tyr Gln Asp
210 215 220
Trp Leu Asn Tyr His Arg Phe Arg Arg Glu Leu Thr Ile Thr Ala Leu
225 230 235 240
Asp Ile Ile Thr Ile Phe Pro His Tyr Asp Asn Lys Met Tyr Pro Ile
245 250 255
Gln Pro His Phe Gln Leu Thr Arg Glu Ile Tyr Thr Asp Pro Leu Ile
260 265 270
Asn Phe Asn Pro Ala Leu Gln Ser Val Ala Gln Leu Pro Leu Phe Asn
275 280 285
Glu Met Glu Asn Ser Thr Ile Arg Ser Pro His Leu Val Asp Phe Leu
290 295 300
Asn Arg Leu Thr Ile Tyr Thr Asp Trp Tyr Ser Leu Gly Arg His Tyr
305 310 315 320
Tyr Trp Gly Gly His Gln Ile Val Ser Arg Gln Thr Gly Ser Thr Ser
325 330 335
Thr Ile Thr Phe Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Ala Pro
340 345 350
Arg Thr Tyr Asn Phe Ser Gln Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Thr Arg Leu Met Gln Pro Trp Pro Ala Pro Ala Phe Gln Leu
370 375 380
Arg Arg Leu Glu Gly Val Glu Phe Gln Thr Thr Thr Gly Asn Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Phe Asp Glu Leu Pro Pro Asp
405 410 415
Asp Thr Ser Val Pro Ala Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Ile Arg Lys Ser Gly Thr Pro Tyr Leu Thr Thr Gly Val
435 440 445
Thr Leu Ser Trp Thr His Asn Ser Asn Thr Pro Thr Asn Ile Ile Tyr
450 455 460
Pro Asp Lys Ile Thr Gln Val Pro Leu Val Lys Ala Ser Asn Leu His
465 470 475 480
Ser Ser Ala Phe Val Leu Lys Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Gly Arg Thr Ser Val Gly Asn Ile Ala Asp Ile Gln Met Asn Ile
500 505 510
Thr Ala Pro Leu Ser Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser
515 520 525
Thr Thr Asn Leu Gln Phe His Thr Thr Ile Asn Gly Arg Ala Val Asn
530 535 540
Gln Ala Asn Phe Pro Ala Thr Met Asn Arg Val Glu Asp Leu Glu Tyr
545 550 555 560
Asn Ser Phe Arg Thr Ile Ser Phe Gly Thr Pro Phe Asn Phe Leu Asp
565 570 575
Ala Gln Ser Thr Phe Arg Leu Gly Val Trp Ser Phe Ser Ser Gly Thr
580 585 590
Val Leu Ile Asp Arg Ile Glu Val Val Pro Met Glu Val Thr Phe Glu
595 600 605
Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe
610 615 620
Thr Ser Ile Asn Gln Lys Gly Leu Lys Thr Asp Val Thr Asp Tyr His
625 630 635 640
Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys
645 650 655
Leu Asp Glu Lys Arg Glu Leu Phe Glu Lys Val Lys Tyr Ala Lys Arg
660 665 670
Leu Ser Asp Glu Arg Asn Leu Leu Ala Asp Pro Asn Phe Thr Ser Ile
675 680 685
Asn Gly Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile
690 695 700
Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Ser Gly
705 710 715 720
Thr Leu Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu
725 730 735
Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu
740 745 750
Asp Ser Gln Asp Leu Glu Val Tyr Leu Ile Arg Tyr Asn Thr Lys His
755 760 765
Glu Thr Leu Asn Val Pro Gly Thr Gly Gly Leu Trp Pro Leu Ala Val
770 775 780
Glu Ser Ser Ile Gly Gly Cys Gly Glu Pro Asn Arg Cys Ala Pro Gln
785 790 795 800
Met Glu Trp Asp Pro Asn Leu Glu Cys Ser Cys Ser Asp Glu Glu Lys
805 810 815
Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys
820 825 830
Thr Asp Leu Asn Glu Asn Leu Gly Ile Trp Val Ile Phe Lys Ile Lys
835 840 845
Thr Gln Asn Gly Tyr Ala Lys Leu Gly Asn Leu Glu Phe Leu Glu Glu
850 855 860
Lys Pro Leu Ile Gly Glu Ala Leu Ala Arg Val Lys Arg Val Glu Lys
865 870 875 880
Lys Trp Lys Asp Lys Arg Glu Lys Leu Glu Phe Glu Thr Asn Ile Val
885 890 895
Tyr Asn Glu Ala Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser Gln
900 905 910
Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala
915 920 925
Asp Asn Lys Val His Lys Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser
930 935 940
Val Ile Pro Gly Val Asn Ala Thr Val Phe Glu Glu Leu Glu Glu Arg
945 950 955 960
Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn
965 970 975
Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly Gln Val
980 985 990
Asp Val Asp Gln Asn Asp His Arg Ser Val Leu Val Ile Pro Gly Trp
995 1000 1005
Glu Ser Glu Val Ser Gln Glu Val His Val Cys Pro Asp Arg Gly
1010 1015 1020
Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly
1025 1030 1035
Cys Val Thr Ile His Glu Ile Asp Asn His Thr Asp Glu Leu Lys
1040 1045 1050
Phe Lys Asn Cys Phe Glu Glu Glu Val Ser Leu Asn Asn Ala Val
1055 1060 1065
Thr Cys Asp Glu Tyr Thr Thr Asn Gln Glu Val Gly Gly Tyr Ala
1070 1075 1080
Asp Val Arg Gln Ser Asn Asn Arg Gly Ser Asn Glu Ala Tyr Val
1085 1090 1095
Asn Pro Thr Ser Thr Ser Thr Asp Tyr Ala Ser Leu Tyr Glu Glu
1100 1105 1110
Glu Ser Tyr Thr Asn Glu Gln Thr Tyr Asn Ser Cys Glu Ser Asn
1115 1120 1125
Arg Gly Tyr Gly Asn Gln Met Pro Leu Pro Ser Gly Tyr Val Thr
1130 1135 1140
Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu
1145 1150 1155
Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu
1160 1165 1170
Leu Leu Met Glu Glu
1175
<210> 9
<211> 3540
<212> DNA
<213> Artificial
<220>
<223> A synthetic coding sequence encoding a TIC2613PL pesticidal
protein designed for expression in a plant cell wherein an
additional alanine codon is inserted immediately following the
initiating methionine codon.
<400> 9
atggctgaca acaacatcaa gaaccagtgc atcccgtaca actgcctcaa cgacccggag 60
gtcgagatcc tcggcgagga gggcataacg acgagcaacg agaaccttga gttcttcctc 120
agcctcacga agttcgtcct gaaccgcttc gtgccgggcg gagcctacgt ggctggcctg 180
ttcgatgtgt tctggggatg gctcaagcca agcgactggt ccgcgattct ggagcagatc 240
gaggaactca tcaaccagaa gatcgagaca ttcgcccgca accaggccat cagccgcctg 300
gagggcctct cgaacctcta cgaaatctac gccgatacgt tcaaggagtg ggagaaggat 360
ccgacgaacc cggccttgcg cgaggagatg aggacgcaat tcaacgacat gaactccagc 420
ttcgtcaccg ccatgccgct gttctccgtc cagaacttcg aggtgccctt gctcgccgtg 480
tacgcgcaag ctgcgaactt acatcttagc gtcctccgcg acgtcagcgt cttcggccag 540
aactggggat tcgattccgc gacggtgaac tcacggtaca atgatctcgt gcggaacatc 600
cggacctaca ccaattacgt cgtgcgctgg tacaacacgg gattggcgcg tctgcgcggc 660
actacctacc aggactggct caactaccac cggttccgcc gcgaactcac aatcacagcg 720
ctggacatca ttaccatctt cccgcactac gacaacaaga tgtacccaat ccagcctcac 780
ttccagctta cccgtgagat ctacacggac ccgctcatca acttcaatcc cgcactgcaa 840
tcagtagccc aattgccact cttcaacgag atggagaact cgacaatccg aagccctcac 900
ctcgtggact tcctcaaccg cctgaccatc tacacggatt ggtactctct tggtcggcac 960
tactattggg gcgggcacca aatcgtgtcc aggcagaccg gctctacctc taccataacc 1020
ttcccgatct atggccggga ggccaaccag gaggctccga ggacttacaa cttcagtcag 1080
ccagtgttcc gcacactctc caacccgact ctcactcgtt tgatgcagcc ctggcccgct 1140
cccgcgtttc agctcagaag attggagggc gtggagttcc aaacaacgac gggcaacttc 1200
acctaccgtg gccgtgggac ggtggacagt ttcgacgagt tgcctccgga cgacaccagc 1260
gtgcctgcaa gggaaggcta ctcgcacagg ctgtgccacg cgacgttcat ccgcaagtct 1320
gggacaccct acctgacaac cggcgtcact ctctcctgga cccacaacag caacacaccc 1380
accaacataa tctaccctga caagataaca caagtgccgc tggtgaaggc ttcgaacctc 1440
cattcctccg ccttcgtcct caagggtccg ggcttcaccg gcggcgacat cctgggtcgc 1500
acgtcggtcg gcaacatcgc ggacattcag atgaacatta ccgcacctct gtcccagcgc 1560
tacagagtgc gtatccgcta cgcgagtacg accaacctcc aattccacac tacgatcaat 1620
gggagggcgg ttaatcaggc caacttcccg gccacgatga accgggtcga agacctggag 1680
tacaactcgt ttcggaccat ctctttcggc acgccgttca acttcctaga cgcccagtca 1740
acctttcggc tgggagtttg gagcttcagc agcggcacag tcctcatcga ccgaatagag 1800
gtggttccga tggaggtcac gttcgaggcg gagtcggacc tggagcgagc gcagaaggct 1860
gtaaatgcgt tgttcacgag cattaaccag aagggcctca agaccgatgt cacagactac 1920
cacatcgacc aagtgtcgaa cctggtggag tgtctgtcgg atgagttctg tcttgacgag 1980
aagcgggagc tgttcgagaa ggtgaagtat gctaagcggc tgagcgacga gcggaacttg 2040
ttggctgacc cgaacttcac cagcatcaac ggacagctcg accgtgggtg gcgaggttcc 2100
accgacatca cgatacaggg cggagacgat gtgttcaagg agaactatgt gaccctctca 2160
ggaacactgg atgagtgcta cccgacctat ctctaccaga agatcgacga gagcaagctc 2220
aaggcttaca cgcgctacga actccgtggc tacatcgaag actcccagga tcttgaggtg 2280
tacctcatac gctacaacac aaagcacgag acgctcaacg ttcctggcac cggtggtctt 2340
tggcccttgg ccgtggagag tagcatcggc gggtgcggtg agccaaaccg atgcgcgcca 2400
cagatggaat gggatccgaa cctagagtgc tcctgctcag acgaggagaa gtgcgcccac 2460
cactcccacc acttctcgct cgacattgac gttggctgca cggatctcaa cgagaaccta 2520
ggaatctggg tgatcttcaa gattaagacc cagaacggct acgccaagct cgggaatctg 2580
gagtttcttg aggagaagcc gctgatcggc gaggccctcg cgcgcgtgaa gcgagtcgag 2640
aagaagtgga aagacaagcg ggagaagcta gagtttgaaa cgaacattgt ttacaacgag 2700
gcaaaggaag ccgtggacgc tctgttcgta aacagtcagt acgaccgtct ccaggccgac 2760
acgaacatcg caatgataca cgcggcggat aacaaggtgc acaagattcg ggaggcttac 2820
ctgcccgagc tgtcggtcat cccaggcgta aacgctaccg tgttcgagga gctggaggaa 2880
cggatcttca ccgcgttctc cctctatgac gcaaggaacg tcatcaagaa cggcgacttc 2940
aacaacggcc tgagctgctg gaacgtgaag ggccaagtgg acgtcgatca gaacgatcac 3000
cgctccgttc tggtcattcc agggtgggag tccgaggtga gccaagaggt ccatgtgtgc 3060
ccggaccgtg gctacatcct tcgggtgacc gcgtacaagg agggctacgg cgaaggctgc 3120
gtgaccatac acgagatcga caaccacacc gacgagctta agttcaagaa ctgcttcgag 3180
gaggaggtgt cactgaacaa cgccgtgacc tgcgacgagt acacgaccaa tcaggaggtc 3240
ggcggctacg ccgacgtccg ccagtcgaac aatcgaggca gcaacgaggc gtacgtgaac 3300
ccaacctcca cctcgacgga ctacgccagc ctctacgagg aggagtccta cacaaacgag 3360
cagacctaca actcgtgcga gagcaaccga ggttacggga accagatgcc gctaccgtcc 3420
gggtacgtga cgaaggagct ggagtatttc ccagagaccg acaaggtgtg gatcgagatc 3480
ggcgagacag agggcacgtt catcgtggac agcgtcgagc tgctgttgat ggaggagtga 3540
<210> 10
<211> 1179
<212> PRT
<213> Artificial
<220>
<223> The amino acid sequence of TIC2613PL encoded by a synthetic
coding sequence designed for expression in a plant cell (SEQ ID
NO:9), and wherein an additional alanine amino acid is inserted
immediately following the initiating methionine.
<400> 10
Met Ala Asp Asn Asn Ile Lys Asn Gln Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Asn Asp Pro Glu Val Glu Ile Leu Gly Glu Glu Gly Ile Thr Thr Ser
20 25 30
Asn Glu Asn Leu Glu Phe Phe Leu Ser Leu Thr Lys Phe Val Leu Asn
35 40 45
Arg Phe Val Pro Gly Gly Ala Tyr Val Ala Gly Leu Phe Asp Val Phe
50 55 60
Trp Gly Trp Leu Lys Pro Ser Asp Trp Ser Ala Ile Leu Glu Gln Ile
65 70 75 80
Glu Glu Leu Ile Asn Gln Lys Ile Glu Thr Phe Ala Arg Asn Gln Ala
85 90 95
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Glu Ile Tyr Ala Asp
100 105 110
Thr Phe Lys Glu Trp Glu Lys Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125
Glu Met Arg Thr Gln Phe Asn Asp Met Asn Ser Ser Phe Val Thr Ala
130 135 140
Met Pro Leu Phe Ser Val Gln Asn Phe Glu Val Pro Leu Leu Ala Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175
Val Phe Gly Gln Asn Trp Gly Phe Asp Ser Ala Thr Val Asn Ser Arg
180 185 190
Tyr Asn Asp Leu Val Arg Asn Ile Arg Thr Tyr Thr Asn Tyr Val Val
195 200 205
Arg Trp Tyr Asn Thr Gly Leu Ala Arg Leu Arg Gly Thr Thr Tyr Gln
210 215 220
Asp Trp Leu Asn Tyr His Arg Phe Arg Arg Glu Leu Thr Ile Thr Ala
225 230 235 240
Leu Asp Ile Ile Thr Ile Phe Pro His Tyr Asp Asn Lys Met Tyr Pro
245 250 255
Ile Gln Pro His Phe Gln Leu Thr Arg Glu Ile Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Ala Leu Gln Ser Val Ala Gln Leu Pro Leu Phe
275 280 285
Asn Glu Met Glu Asn Ser Thr Ile Arg Ser Pro His Leu Val Asp Phe
290 295 300
Leu Asn Arg Leu Thr Ile Tyr Thr Asp Trp Tyr Ser Leu Gly Arg His
305 310 315 320
Tyr Tyr Trp Gly Gly His Gln Ile Val Ser Arg Gln Thr Gly Ser Thr
325 330 335
Ser Thr Ile Thr Phe Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Ala
340 345 350
Pro Arg Thr Tyr Asn Phe Ser Gln Pro Val Phe Arg Thr Leu Ser Asn
355 360 365
Pro Thr Leu Thr Arg Leu Met Gln Pro Trp Pro Ala Pro Ala Phe Gln
370 375 380
Leu Arg Arg Leu Glu Gly Val Glu Phe Gln Thr Thr Thr Gly Asn Phe
385 390 395 400
Thr Tyr Arg Gly Arg Gly Thr Val Asp Ser Phe Asp Glu Leu Pro Pro
405 410 415
Asp Asp Thr Ser Val Pro Ala Arg Glu Gly Tyr Ser His Arg Leu Cys
420 425 430
His Ala Thr Phe Ile Arg Lys Ser Gly Thr Pro Tyr Leu Thr Thr Gly
435 440 445
Val Thr Leu Ser Trp Thr His Asn Ser Asn Thr Pro Thr Asn Ile Ile
450 455 460
Tyr Pro Asp Lys Ile Thr Gln Val Pro Leu Val Lys Ala Ser Asn Leu
465 470 475 480
His Ser Ser Ala Phe Val Leu Lys Gly Pro Gly Phe Thr Gly Gly Asp
485 490 495
Ile Leu Gly Arg Thr Ser Val Gly Asn Ile Ala Asp Ile Gln Met Asn
500 505 510
Ile Thr Ala Pro Leu Ser Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala
515 520 525
Ser Thr Thr Asn Leu Gln Phe His Thr Thr Ile Asn Gly Arg Ala Val
530 535 540
Asn Gln Ala Asn Phe Pro Ala Thr Met Asn Arg Val Glu Asp Leu Glu
545 550 555 560
Tyr Asn Ser Phe Arg Thr Ile Ser Phe Gly Thr Pro Phe Asn Phe Leu
565 570 575
Asp Ala Gln Ser Thr Phe Arg Leu Gly Val Trp Ser Phe Ser Ser Gly
580 585 590
Thr Val Leu Ile Asp Arg Ile Glu Val Val Pro Met Glu Val Thr Phe
595 600 605
Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu
610 615 620
Phe Thr Ser Ile Asn Gln Lys Gly Leu Lys Thr Asp Val Thr Asp Tyr
625 630 635 640
His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe
645 650 655
Cys Leu Asp Glu Lys Arg Glu Leu Phe Glu Lys Val Lys Tyr Ala Lys
660 665 670
Arg Leu Ser Asp Glu Arg Asn Leu Leu Ala Asp Pro Asn Phe Thr Ser
675 680 685
Ile Asn Gly Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr
690 695 700
Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Ser
705 710 715 720
Gly Thr Leu Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp
725 730 735
Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile
740 745 750
Glu Asp Ser Gln Asp Leu Glu Val Tyr Leu Ile Arg Tyr Asn Thr Lys
755 760 765
His Glu Thr Leu Asn Val Pro Gly Thr Gly Gly Leu Trp Pro Leu Ala
770 775 780
Val Glu Ser Ser Ile Gly Gly Cys Gly Glu Pro Asn Arg Cys Ala Pro
785 790 795 800
Gln Met Glu Trp Asp Pro Asn Leu Glu Cys Ser Cys Ser Asp Glu Glu
805 810 815
Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly
820 825 830
Cys Thr Asp Leu Asn Glu Asn Leu Gly Ile Trp Val Ile Phe Lys Ile
835 840 845
Lys Thr Gln Asn Gly Tyr Ala Lys Leu Gly Asn Leu Glu Phe Leu Glu
850 855 860
Glu Lys Pro Leu Ile Gly Glu Ala Leu Ala Arg Val Lys Arg Val Glu
865 870 875 880
Lys Lys Trp Lys Asp Lys Arg Glu Lys Leu Glu Phe Glu Thr Asn Ile
885 890 895
Val Tyr Asn Glu Ala Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser
900 905 910
Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala
915 920 925
Ala Asp Asn Lys Val His Lys Ile Arg Glu Ala Tyr Leu Pro Glu Leu
930 935 940
Ser Val Ile Pro Gly Val Asn Ala Thr Val Phe Glu Glu Leu Glu Glu
945 950 955 960
Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys
965 970 975
Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly Gln
980 985 990
Val Asp Val Asp Gln Asn Asp His Arg Ser Val Leu Val Ile Pro Gly
995 1000 1005
Trp Glu Ser Glu Val Ser Gln Glu Val His Val Cys Pro Asp Arg
1010 1015 1020
Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu
1025 1030 1035
Gly Cys Val Thr Ile His Glu Ile Asp Asn His Thr Asp Glu Leu
1040 1045 1050
Lys Phe Lys Asn Cys Phe Glu Glu Glu Val Ser Leu Asn Asn Ala
1055 1060 1065
Val Thr Cys Asp Glu Tyr Thr Thr Asn Gln Glu Val Gly Gly Tyr
1070 1075 1080
Ala Asp Val Arg Gln Ser Asn Asn Arg Gly Ser Asn Glu Ala Tyr
1085 1090 1095
Val Asn Pro Thr Ser Thr Ser Thr Asp Tyr Ala Ser Leu Tyr Glu
1100 1105 1110
Glu Glu Ser Tyr Thr Asn Glu Gln Thr Tyr Asn Ser Cys Glu Ser
1115 1120 1125
Asn Arg Gly Tyr Gly Asn Gln Met Pro Leu Pro Ser Gly Tyr Val
1130 1135 1140
Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile
1145 1150 1155
Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu
1160 1165 1170
Leu Leu Leu Met Glu Glu
1175
Claims (27)
- 살충 단백질 또는 이의 살충 단편을 코딩하는 폴리뉴클레오타이드 분절에 작동 가능하게 연결된 이종성 촉진자를 포함하는 재조합 핵산 분자로서,
a. 상기 살충 단백질은 서열 번호 4, 서열 번호 2, 서열 번호 6, 서열 번호 8 또는 서열 번호 10의 아미노산 서열을 포함하거나;
b. 상기 살충 단백질은,
ⅰ. 서열 번호 4, 서열 번호 2 또는 서열 번호 6과 적어도 93% 또는 95% 또는 98% 또는 99% 또는 약 100%의 아미노산 서열 동일성; 또는
ⅱ. 서열 번호 8 또는 서열 번호 10과 적어도 73% 또는 75% 또는 80% 또는 85% 또는 90% 또는 95% 또는 약 100%의 아미노산 서열 동일성
을 갖는 아미노산 서열을 포함하거나; 또는
c. 상기 폴리뉴클레오타이드 분절은 엄격한 혼성화 조건 하에 서열 번호 3, 서열 번호 1, 서열 번호 5, 서열 번호 7 또는 서열 번호 9의 뉴클레오타이드 서열을 갖는 폴리뉴클레오타이드에 혼성화되는, 재조합 핵산 분자. - 제1항에 있어서,
a. 상기 재조합 핵산 분자는 식물에서 상기 살충 단백질을 발현하도록 작용하는 서열을 포함하거나;
b. 상기 재조합 핵산 분자는 상기 살충 유효량의 살충 단백질을 생산하도록 식물 세포에서 발현되거나; 또는
c. 상기 재조합 핵산 분자는 벡터와 작동 가능한 연결에 있고, 상기 벡터는 플라스미드, 파지미드, 박미드(bacmid), 코스미드, 및 박테리아 또는 효모 인공 염색체로 이루어진 군으로부터 선택된, 재조합 핵산 분자. - 제1항에 있어서, 숙주 세포 내에 존재하는 것으로 정의되고, 상기 숙주 세포는 박테리아 및 식물 세포로 이루어진 군으로부터 선택된, 재조합 핵산 분자.
- 제3항에 있어서, 상기 박테리아 숙주 세포는 아그로박테륨(Agrobacterium), 리조븀(Rhizobium), 바실러스(Bacillus), 브레비바실러스(Brevibacillus), 에스체리치아(Escherichia), 슈도모나스(Pseudomonas), 클레브시엘라(Klebsiella), 판토에아(Pantoea) 및 에르위니아(Erwinia)로 이루어진 군으로부터 선택된 박테리아의 속 유래인, 재조합 핵산 분자.
- 제1항에 있어서, 상기 바실러스 종은 바실러스 세레우스(Bacillus cereus) 또는 바실러스 튜링겐시스(Bacillus thuringiensis)이고, 상기 브레비바실러스는 브레비바실러스 라테로스페로우스(Brevibacillus laterosperous)이고, 상기 에스체리치아는 에스체리치아 콜라이(Escherichia coli)인, 재조합 핵산 분자.
- 제3항에 있어서, 상기 식물 세포는 쌍떡잎식물 또는 외떡잎식물 식물 세포인, 재조합 핵산 분자.
- 제6항에 있어서, 상기 식물 숙주 세포는 알팔파, 바나나, 보리, 콩, 브로콜리, 양배추, 배추속, 당근, 카사바, 피마자, 꽃양배추, 셀러리, 병아리콩, 배추, 감귤류, 코코넛, 커피, 옥수수, 클로버, 면, 조롱박, 오이, 미송, 가지, 유칼립투스, 아마, 마늘, 포도, 홉, 리크, 상추, 테에다 소나무(Loblolly pine), 수수, 멜론, 견과, 귀리, 올리브, 양파, 관상품, 팜, 목초, 완두콩, 땅콩, 후추, 나무콩, 소나무, 감자, 포플러, 호박, 라디아타 소나무(Radiata pine), 무, 유채, 쌀, 근경, 호밀, 잇꽃, 관목, 수수, 남부 소나무, 대두, 시금치, 호박, 딸기, 사탕무, 사탕수수, 해바라기, 사탕 옥수수, 스위트 검, 고구마, 스위치그래스, 차, 담배, 토마토, 라이밀, 잔디, 수박 및 밀 식물 세포로 이루어진 군으로부터 선택된, 재조합 핵산 분자.
- 제1항에 있어서, 상기 단백질은 나비목 곤충에 대한 활성을 나타내는, 재조합 핵산 분자.
- 제8항에 있어서, 상기 곤충은 근대 거염벌레(스포돕테라 엑시구아(Spodoptera exigua)), 옥수수 귀벌레(헬리코베르파 제아(Helicoverpa zea)), 면 잎 벌레(알라바마 아르길라세아(Alabama argillacea)), 유럽 옥수수 나무좀(오스트리니아 누빌랄리스(Ostrinia nubilalis)), 밤나방유충(스포돕테라 푸리기페르다)(Spodoptera frugiperda), 올드 월드 솜벌레(헬리코베르파 아르미게라(Helicoverpa armigera)), 오리엔탈 잎 벌레(스포돕테라 리투라(Spodoptera litura)), 분홍 솜벌레(펙티노포라 고시피엘라(Pectinophora gossypiella)), Cry1Ac 내성 분홍 솜벌레(펙티노포라 고시피엘라), 대두 자벌레(크리소데익시스 인클루덴스(Chrysodeixis includens)), 써던 거염벌레(스포돕테라 에리다니아(Spodoptera eridania)), 사우쓰웨스턴 옥수수 나무좀(디아트라에아 그라디오셀라(Diatraea grandiosella)), 점무늬 솜벌레(에아리아스 비텔라(Earias vittella)), 사탕수수 나무좀(디아트라에아 사카랄리스(Diatraea saccharalis)), 회색담배나방(헬리오티스 비레센스(Heliothis virescens)) 및 벨벳콩 애벌레(안티카르시아 겜마탈리스(Anticarsia gemmatalis))로 이루어진 군으로부터 선택된, 재조합 핵산 분자.
- 제1항의 재조합 핵산 분자를 포함하는, 식물 또는 이의 일부.
- 제10항에 있어서, 상기 식물은 외떡잎식물 식물 또는 쌍떡잎식물 식물인, 식물 또는 이의 일부.
- 제10항에 있어서, 상기 식물은 알팔파, 바나나, 보리, 콩, 브로콜리, 양배추, 배추속, 당근, 카사바, 피마자, 꽃양배추, 셀러리, 병아리콩, 배추, 감귤류, 코코넛, 커피, 옥수수, 클로버, 면, 조롱박, 오이, 미송, 가지, 유칼립투스, 아마, 마늘, 포도, 홉, 리크, 상추, 테에다 소나무, 수수, 멜론, 견과, 귀리, 올리브, 양파, 관상품, 팜, 목초, 완두콩, 땅콩, 후추, 나무콩, 소나무, 감자, 포플러, 호박, 라디아타 소나무, 무, 유채, 쌀, 근경, 호밀, 잇꽃, 관목, 수수, 남부 소나무, 대두, 시금치, 호박, 딸기, 사탕무, 사탕수수, 해바라기, 사탕 옥수수, 스위트 검, 고구마, 스위치그래스, 차, 담배, 토마토, 라이밀, 잔디, 수박 및 밀로 이루어진 군으로부터 선택된, 식물 또는 이의 일부.
- 제10항의 식물의 종자로서, 상기 종자는 상기 재조합 핵산 분자를 포함하는, 식물의 종자.
- 제1항의 재조합 핵산 분자를 포함하는, 곤충 저해 조성물.
- 제14항에 있어서, 상기 살충 단백질과 다른 적어도 하나의 다른 살충제를 코딩하는 뉴클레오타이드 서열을 추가로 포함하는, 곤충 저해 조성물.
- 제15항에 있어서, 상기 적어도 하나의 다른 살충제는 곤충 저해 단백질, 곤충 저해 dsRNA 분자 및 보조 단백질로 이루어진 군으로부터 선택된, 곤충 저해 조성물.
- 제16항에 있어서, 상기 적어도 하나의 다른 살충제는 나비목(Lepidoptera), 딱정벌레목(Coleoptera) 또는 반시목(Hemiptera) 목의 하나 이상의 해충 종에 대해 활성을 나타내는, 곤충 저해 조성물.
- 제17항에 있어서, 상기 적어도 하나의 다른 살충 단백질은 Cry1A, Cry1Ab, Cry1Ac, Cry1A.105, Cry1Ae, Cry1B, Cry1C, Cry1C 변이체, Cry1D, Cry1E, Cry1F, Cry1A/F 키메라, Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry2A, Cry2Ab, Cry2Ae, Cry3, Cry3A 변이체, Cry3B, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry34, Cry35, Cry43A, Cry43B, Cry51Aa1, ET29, ET33, ET34, ET35, ET66, ET70, TIC400, TIC407, TIC417, TIC431, TIC800, TIC807, TIC834, TIC853, TIC900, TIC901, TIC1201, TIC1415, TIC2160, TIC3131, TIC836, TIC860, TIC867, TIC869, TIC1100, VIP3A, VIP3B, VIP3Ab, AXMI-AXMI-, AXMI-88, AXMI-97, AXMI-102, AXMI-112, AXMI-117, AXMI-100, AXMI-115, AXMI-113, 및 AXMI-005, AXMI134, AXMI-150, AXMI-171, AXMI-184, AXMI-196, AXMI-204, AXMI-207, AXMI-209, AXMI-205, AXMI-218, AXMI-220, AXMI-221z, AXMI-222z, AXMI-223z, AXMI-224z 및 AXMI-225z, AXMI-238, AXMI-270, AXMI-279, AXMI-345, AXMI-335, AXMI-R1 및 이의 변이체, IP3 및 이의 변이체, DIG-3, DIG-5, DIG-10, DIG-657 및 DIG-11 단백질로 이루어진 군으로부터 선택된, 곤충 저해 조성물.
- 제14항에 있어서, 상기 재조합 핵산 분자를 발현하는 식물 세포를 포함하는 것으로 정의된, 곤충 저해 조성물.
- 제10항의 식물 또는 이의 일부로부터 생성된 소비재(commodity product)로서, 검출 가능한 양의 상기 재조합 핵산 분자 또는 살충 단백질을 포함하는, 소비재.
- 제20항에 있어서, 곡물 취급자가 담은 소비재 옥수수, 옥수수 플레이크, 옥수수 케이크, 옥수수 밀가루, 옥수수 가루, 옥수수 시럽, 옥수수 오일, 옥수수 사일리지, 옥수수 전분, 옥수수 시리얼 등, 및 상응하는 대두, 쌀, 밀, 수수, 나무콩, 땅콩, 과일, 멜론, 및 식물성 소비재, 예를 들어, 적용 가능한 경우, 주스, 농축물, 잼, 젤리, 마멀레이드 및 검출 가능한 양의 본 출원의 이러한 폴리뉴클레오타이드 및 또는 폴리펩타이드를 함유하는 이러한 소비재의 다른 식용 가능한 형태, 전체 또는 처리된 면 종자, 면 오일, 린트, 먹이 또는 사료에 대해 처리된 종자 및 식물 일부, 섬유, 제지, 바이오매스, 및 연료 생성물, 예컨대 면 오일로부터 유래된 연료 또는 조면기 폐기물로부터 유래된 펠릿, 전체 또는 처리된 대두 종자, 대두유, 대두 단백질, 대두 가루, 대두 밀가루, 대두 플레이크, 대두 겨, 대두 밀크, 대두 치즈, 대두 와인, 대두를 포함하는 동물 사료, 대두를 포함하는 제지, 대두를 포함하는 크림, 대두 바이오매스, 및 대두 식물 및 대두 식물 일부를 사용하여 제조된 연료 생성물로 이루어진 군으로부터 선택된, 소비재.
- 종자를 생산하는 방법으로서,
a. 제13항에 따른 제1 종자를 식목하는 단계;
b. 상기 종자로부터 식물을 성장시키는 단계; 및
c. 상기 식물로부터 종자를 수확하는 단계로서, 수확된 상기 종자는 상기 재조합 핵산 분자를 포함하는, 종자를 생산하는 방법. - 곤충 침입에 내성인 식물로서, 상기 식물의 세포는 제1항의 재조합 핵산 분자를 포함하는, 식물.
- 나비목 종 해충 또는 해충 침입을 방제하는 방법으로서,
a. 상기 해충을 서열 번호 4, 서열 번호 2, 서열 번호 6, 서열 번호 8 또는 서열 번호 10에 기재된 살충 단백질의 살충 유효량과 접촉시키는 단계; 또는
b. 상기 해충을,
i. 서열 번호 4, 서열 번호 2 또는 서열 번호 6과 적어도 93% 또는 95% 또는 98% 또는 99% 또는 약 100%의 아미노산 서열 동일성; 또는
ii. 서열 번호 8 또는 서열 번호 10과 적어도 73% 또는 75% 또는 80% 또는 85% 또는 90% 또는 95% 또는 약 100%의 아미노산 서열 동일성
을 갖는 아미노산 서열을 포함하는 하나 이상의 살충 단백질의 살충 유효량과 접촉시키는 단계를 포함하는, 나비목 종 해충 또는 해충 침입을 방제하는 방법. - 식물 게놈 DNA를 포함하는 샘플에서 제1항의 재조합 핵산 분자의 존재를 검출하는 방법으로서,
a. 엄격한 혼성화 조건 하에 제1항의 DNA 분자를 포함하는 식물로부터 게놈 DNA와 혼성화되고, 이러한 혼성화 조건 하에 제1항의 재조합 핵산 분자를 포함하지 않는 달리 동질유전자 식물로부터 게놈 DNA와 혼성화되지 않는 핵산 프로브, 또는
i. 서열 번호 4, 서열 번호 2 또는 서열 번호 6과 적어도 93% 또는 95% 또는 98% 또는 99% 또는 약 100%의 아미노산 서열 동일성; 또는
ii. 서열 번호 8 또는 서열 번호 10과 적어도 73% 또는 75% 또는 80% 또는 85% 또는 90% 또는 95% 또는 약 100%의 아미노산 서열 동일성
을 갖는 아미노산 서열을 포함하는 살충 단백질을 코딩하는 서열과 상기 샘플을 접촉시키는 단계로서, 상기 프로브는 서열 번호 3 또는 서열 번호 9와 상동성 또는 상보성인, 상기 접촉시키는 단계;
b. 상기 샘플 및 프로브를 엄격한 혼성화 조건으로 처리하는 단계; 및
c. 상기 프로브의 상기 샘플의 DNA와의 혼성화를 검출하는 단계를 포함하는, 식물 게놈 DNA를 포함하는 샘플에서 재조합 핵산 분자의 존재를 검출하는 방법. - 단백질을 포함하는 샘플에서 살충 단백질 또는 이의 단편의 존재를 검출하는 방법으로서, 상기 살충 단백질은 서열 번호 4, 서열 번호 2, 서열 번호 6, 서열 번호 8 또는 서열 번호 10의 아미노산 서열을 포함하거나; 또는 상기 살충 단백질은,
a. 서열 번호 4, 서열 번호 2 또는 서열 번호 6과 적어도 93% 또는 95% 또는 98% 또는 99% 또는 약 100%의 아미노산 서열 동일성; 또는
b. 서열 번호 8 또는 서열 번호 10과 적어도 73% 또는 75% 또는 80% 또는 85% 또는 90% 또는 95% 또는 약 100%의 아미노산 서열 동일성
을 갖는 아미노산 서열을 포함하되;
c. 상기 샘플을 면역반응성 항체와 접촉시키는 단계; 및
d. 상기 단백질의 존재를 검출하는 단계를 포함하는, 단백질을 포함하는 샘플에서 살충 단백질 또는 이의 단편의 존재를 검출하는 방법. - 제26항에 있어서, 상기 검출하는 단계는 ELISA 또는 웨스턴 블롯을 포함하는, 단백질을 포함하는 샘플에서 살충 단백질 또는 이의 단편의 존재를 검출하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662406082P | 2016-10-10 | 2016-10-10 | |
US62/406,082 | 2016-10-10 | ||
PCT/US2017/055731 WO2018071324A1 (en) | 2016-10-10 | 2017-10-09 | Novel insect inhibitory proteins |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190059961A true KR20190059961A (ko) | 2019-05-31 |
Family
ID=61830577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197013077A KR20190059961A (ko) | 2016-10-10 | 2017-10-09 | 신규한 곤충 저해 단백질 |
Country Status (15)
Country | Link |
---|---|
US (2) | US10626151B2 (ko) |
EP (1) | EP3522698A4 (ko) |
KR (1) | KR20190059961A (ko) |
CN (2) | CN109952024B (ko) |
AR (1) | AR109913A1 (ko) |
AU (2) | AU2017342921B2 (ko) |
BR (1) | BR112019007180A2 (ko) |
CA (1) | CA3039915A1 (ko) |
CO (1) | CO2019004690A2 (ko) |
CR (1) | CR20190221A (ko) |
MX (2) | MX2019004092A (ko) |
PH (1) | PH12019500759A1 (ko) |
UY (1) | UY37437A (ko) |
WO (1) | WO2018071324A1 (ko) |
ZA (1) | ZA201902418B (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111647608A (zh) * | 2020-06-17 | 2020-09-11 | 中国农业科学院作物科学研究所 | 抗虫基因VIP3m及其应用 |
US11825850B2 (en) * | 2020-12-21 | 2023-11-28 | Monsanto Technology Llc | Insect inhibitory proteins |
CR20230292A (es) * | 2020-12-31 | 2023-11-01 | Monsanto Technology Llc | Novedosas proteínas inhibidoras de insectos |
US11662993B2 (en) | 2021-05-18 | 2023-05-30 | Kyndryl, Inc. | Autonomous management of temporal updates and rollbacks |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9318207D0 (en) | 1993-09-02 | 1993-10-20 | Sandoz Ltd | Improvements in or relating to organic compounds |
US6780408B1 (en) * | 1993-09-02 | 2004-08-24 | Syngenta Participations Ag | Genes encoding hybrid bacillus thuringiensis toxins |
US5942664A (en) * | 1996-11-27 | 1999-08-24 | Ecogen, Inc. | Bacillus thuringiensis Cry1C compositions toxic to lepidopteran insects and methods for making Cry1C mutants |
US7355099B2 (en) * | 2003-02-20 | 2008-04-08 | Athenix Corporation | AXMI-004, a delta-endotoxin gene and methods for its use |
ES2353603T3 (es) * | 2003-12-16 | 2011-03-03 | Monsanto Technology Llc | Proteína insecticida secretada y composiciones de genes de bacillus thuringiensis y sus usos. |
WO2006012366A2 (en) * | 2004-07-20 | 2006-02-02 | Phyllom Llc | Methods for making and using recombinant bacillus thuringiensis spores |
US7622572B2 (en) | 2005-05-02 | 2009-11-24 | Athenix Corporation | AXMI-028 and AXMI-029, a family of novel delta-endotoxin genes and methods for their use |
MX345508B (es) | 2009-12-16 | 2017-02-01 | Dow Agrosciences Llc | Uso de cry1da en combinación con cry1ca para el manejo de insectos resistentes. |
BR112012014879A2 (pt) | 2009-12-16 | 2015-11-10 | Dow Agrosciences Llc | gerenciamento de resistencia de inseto com combinacoes de proteinas cry1be e cry1f |
RU2593961C2 (ru) | 2009-12-16 | 2016-08-10 | ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи | КОМБИНИРОВАННОЕ ПРИМЕНЕНИЕ БЕЛКОВ CRY1Ca И CRY1Fa ДЛЯ БОРЬБЫ С РЕЗИСТЕНТНОСТЬЮ У НАСЕКОМЫХ |
CN102753696A (zh) | 2009-12-16 | 2012-10-24 | 陶氏益农公司 | 组合使用Cry1Da与Cry1Be用于抗性昆虫的管理 |
CN112626087B (zh) * | 2014-11-20 | 2024-05-31 | 孟山都技术公司 | 新型昆虫抑制性蛋白 |
US10100330B2 (en) * | 2015-07-30 | 2018-10-16 | Monsanto Technology Llc | Insect inhibitory proteins |
-
2017
- 2017-10-09 AU AU2017342921A patent/AU2017342921B2/en active Active
- 2017-10-09 CN CN201780069561.9A patent/CN109952024B/zh active Active
- 2017-10-09 CA CA3039915A patent/CA3039915A1/en active Pending
- 2017-10-09 WO PCT/US2017/055731 patent/WO2018071324A1/en unknown
- 2017-10-09 CN CN202310895107.6A patent/CN117025637A/zh active Pending
- 2017-10-09 KR KR1020197013077A patent/KR20190059961A/ko not_active IP Right Cessation
- 2017-10-09 EP EP17859878.5A patent/EP3522698A4/en active Pending
- 2017-10-09 BR BR112019007180A patent/BR112019007180A2/pt unknown
- 2017-10-09 MX MX2019004092A patent/MX2019004092A/es unknown
- 2017-10-09 US US15/727,883 patent/US10626151B2/en active Active
- 2017-10-09 CR CR20190221A patent/CR20190221A/es unknown
- 2017-10-10 AR ARP170102824A patent/AR109913A1/es unknown
- 2017-10-10 UY UY0001037437A patent/UY37437A/es not_active Application Discontinuation
-
2019
- 2019-04-08 PH PH12019500759A patent/PH12019500759A1/en unknown
- 2019-04-09 MX MX2021013181A patent/MX2021013181A/es unknown
- 2019-04-16 ZA ZA201902418A patent/ZA201902418B/en unknown
- 2019-05-08 CO CONC2019/0004690A patent/CO2019004690A2/es unknown
-
2020
- 2020-03-05 US US16/810,810 patent/US11312752B2/en active Active
-
2023
- 2023-09-12 AU AU2023229489A patent/AU2023229489A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
PH12019500759A1 (en) | 2019-11-11 |
MX2021013181A (es) | 2021-12-10 |
CN109952024B (zh) | 2023-11-03 |
CR20190221A (es) | 2019-09-03 |
RU2019114021A (ru) | 2020-11-13 |
CN109952024A (zh) | 2019-06-28 |
EP3522698A1 (en) | 2019-08-14 |
US11312752B2 (en) | 2022-04-26 |
WO2018071324A1 (en) | 2018-04-19 |
MX2019004092A (es) | 2019-09-26 |
AU2017342921A1 (en) | 2019-05-02 |
UY37437A (es) | 2018-05-31 |
EP3522698A4 (en) | 2020-07-29 |
BR112019007180A2 (pt) | 2019-07-02 |
US10626151B2 (en) | 2020-04-21 |
CN117025637A (zh) | 2023-11-10 |
CA3039915A1 (en) | 2018-04-19 |
AR109913A1 (es) | 2019-02-06 |
US20180100000A1 (en) | 2018-04-12 |
ZA201902418B (en) | 2020-11-25 |
US20200262876A1 (en) | 2020-08-20 |
AU2023229489A1 (en) | 2023-09-28 |
AU2017342921B2 (en) | 2023-06-15 |
CO2019004690A2 (es) | 2019-05-21 |
RU2019114021A3 (ko) | 2021-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102238620B1 (ko) | 신규한 곤충 저해 단백질 | |
US11981908B2 (en) | Insect inhibitory proteins | |
US11312752B2 (en) | Insect inhibitory proteins | |
US20180346925A1 (en) | Novel insect inhibitory proteins | |
US11744250B2 (en) | Insect inhibitory proteins | |
CN117051017A (zh) | 新型昆虫抑制性蛋白 | |
US11673922B2 (en) | Insect inhibitory proteins | |
US10036037B2 (en) | Insect inhibitory proteins | |
RU2781075C2 (ru) | Новые белки, имеющие ингибирующее действие в отношении насекомых | |
US20240200092A1 (en) | Novel insect inhibitory proteins | |
US20230013686A1 (en) | Novel insect inhibitory proteins | |
OA21316A (en) | Novel insect inhibitory proteins. | |
CN117616117A (zh) | 新型昆虫抑制蛋白 | |
EA040152B1 (ru) | Новые химерные инсектицидные белки, токсичные или ингибиторные в отношении чешуекрылых-вредителей | |
EA040097B1 (ru) | Новые химерные инсектицидные белки, токсичные или ингибиторные в отношении чешуекрылых-вредителей |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X601 | Decision of rejection after re-examination |