RU2781075C2 - New proteins with inhibitory effect relatively to insects - Google Patents
New proteins with inhibitory effect relatively to insects Download PDFInfo
- Publication number
- RU2781075C2 RU2781075C2 RU2019114021A RU2019114021A RU2781075C2 RU 2781075 C2 RU2781075 C2 RU 2781075C2 RU 2019114021 A RU2019114021 A RU 2019114021A RU 2019114021 A RU2019114021 A RU 2019114021A RU 2781075 C2 RU2781075 C2 RU 2781075C2
- Authority
- RU
- Russia
- Prior art keywords
- seq
- leu
- glu
- asn
- thr
- Prior art date
Links
- 241000238631 Hexapoda Species 0.000 title claims abstract description 116
- 102000004169 proteins and genes Human genes 0.000 title claims description 333
- 108090000623 proteins and genes Proteins 0.000 title claims description 333
- 230000002401 inhibitory effect Effects 0.000 title claims description 58
- 241000607479 Yersinia pestis Species 0.000 claims abstract description 95
- 241000255777 Lepidoptera Species 0.000 claims abstract description 63
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 61
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 54
- 230000000694 effects Effects 0.000 claims abstract description 47
- 239000000203 mixture Substances 0.000 claims abstract description 42
- 235000013305 food Nutrition 0.000 claims abstract description 10
- 238000001514 detection method Methods 0.000 claims abstract description 6
- 239000002537 cosmetic Substances 0.000 claims abstract 3
- 241000196324 Embryophyta Species 0.000 claims description 211
- 210000004027 cells Anatomy 0.000 claims description 105
- 230000000361 pesticidal Effects 0.000 claims description 101
- 229920001850 Nucleic acid sequence Polymers 0.000 claims description 44
- 229920003013 deoxyribonucleic acid Polymers 0.000 claims description 41
- 235000010469 Glycine max Nutrition 0.000 claims description 36
- 241000256251 Spodoptera frugiperda Species 0.000 claims description 32
- 240000007842 Glycine max Species 0.000 claims description 31
- 241000255967 Helicoverpa zea Species 0.000 claims description 28
- 241001147398 Ostrinia nubilalis Species 0.000 claims description 26
- 239000003795 chemical substances by application Substances 0.000 claims description 25
- 229920000023 polynucleotide Polymers 0.000 claims description 25
- 239000002157 polynucleotide Substances 0.000 claims description 25
- 240000006962 Gossypium hirsutum Species 0.000 claims description 24
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 24
- 239000000523 sample Substances 0.000 claims description 22
- 235000005822 corn Nutrition 0.000 claims description 21
- 235000005824 corn Nutrition 0.000 claims description 21
- 239000000575 pesticide Substances 0.000 claims description 20
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 19
- 241000193388 Bacillus thuringiensis Species 0.000 claims description 19
- 241000209149 Zea Species 0.000 claims description 19
- 238000009396 hybridization Methods 0.000 claims description 19
- 241001367803 Chrysodeixis includens Species 0.000 claims description 18
- 229920000742 Cotton Polymers 0.000 claims description 17
- 241000289763 Dasygaster padockina Species 0.000 claims description 17
- 241000721451 Pectinophora gossypiella Species 0.000 claims description 17
- 230000001580 bacterial Effects 0.000 claims description 14
- 241000449794 Alabama argillacea Species 0.000 claims description 13
- 241000894006 Bacteria Species 0.000 claims description 13
- 241000879145 Diatraea grandiosella Species 0.000 claims description 13
- 235000008331 Pinus X rigitaeda Nutrition 0.000 claims description 13
- 241000018646 Pinus brutia Species 0.000 claims description 13
- 235000011613 Pinus brutia Nutrition 0.000 claims description 13
- 229940097012 Bacillus thuringiensis Drugs 0.000 claims description 12
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 12
- 240000006394 Sorghum bicolor Species 0.000 claims description 12
- -1 namental Species 0.000 claims description 12
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 claims description 10
- 240000003259 Brassica oleracea var. botrytis Species 0.000 claims description 10
- 235000005042 Zier Kohl Nutrition 0.000 claims description 10
- 229920000160 (ribonucleotides)n+m Polymers 0.000 claims description 9
- 241001147381 Helicoverpa armigera Species 0.000 claims description 9
- 235000010582 Pisum sativum Nutrition 0.000 claims description 9
- 240000004713 Pisum sativum Species 0.000 claims description 9
- 241000256247 Spodoptera exigua Species 0.000 claims description 9
- 241000985245 Spodoptera litura Species 0.000 claims description 9
- 230000001809 detectable Effects 0.000 claims description 9
- 241000254173 Coleoptera Species 0.000 claims description 8
- 230000001747 exhibiting Effects 0.000 claims description 8
- 241000589158 Agrobacterium Species 0.000 claims description 7
- 240000007124 Brassica oleracea Species 0.000 claims description 7
- 241000555281 Brevibacillus Species 0.000 claims description 7
- 235000009432 Gossypium hirsutum Nutrition 0.000 claims description 7
- 240000007594 Oryza sativa Species 0.000 claims description 7
- 235000007164 Oryza sativa Nutrition 0.000 claims description 7
- 240000007742 Raphanus sativus Species 0.000 claims description 7
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 claims description 7
- 240000000111 Saccharum officinarum Species 0.000 claims description 7
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 7
- 240000008529 Triticum aestivum Species 0.000 claims description 7
- 235000009566 rice Nutrition 0.000 claims description 7
- 235000021307 wheat Nutrition 0.000 claims description 7
- 240000005781 Arachis hypogaea Species 0.000 claims description 6
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 claims description 6
- 240000002791 Brassica napus Species 0.000 claims description 6
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 claims description 6
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 claims description 6
- 241000219112 Cucumis Species 0.000 claims description 6
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 claims description 6
- 235000004431 Linum usitatissimum Nutrition 0.000 claims description 6
- 240000006240 Linum usitatissimum Species 0.000 claims description 6
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 6
- 235000020232 peanut Nutrition 0.000 claims description 6
- 241000234282 Allium Species 0.000 claims description 5
- 235000005254 Allium ampeloprasum Nutrition 0.000 claims description 5
- 240000006108 Allium ampeloprasum Species 0.000 claims description 5
- 240000002234 Allium sativum Species 0.000 claims description 5
- 240000007087 Apium graveolens Species 0.000 claims description 5
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 claims description 5
- 235000010591 Appio Nutrition 0.000 claims description 5
- 235000007319 Avena orientalis Nutrition 0.000 claims description 5
- 244000075850 Avena orientalis Species 0.000 claims description 5
- 235000000832 Ayote Nutrition 0.000 claims description 5
- 235000003717 Boswellia sacra Nutrition 0.000 claims description 5
- 235000012035 Boswellia serrata Nutrition 0.000 claims description 5
- 240000007551 Boswellia serrata Species 0.000 claims description 5
- 235000017647 Brassica oleracea var italica Nutrition 0.000 claims description 5
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 claims description 5
- 235000004977 Brassica sinapistrum Nutrition 0.000 claims description 5
- 235000002566 Capsicum Nutrition 0.000 claims description 5
- 235000003255 Carthamus tinctorius Nutrition 0.000 claims description 5
- 240000005801 Carthamus tinctorius Species 0.000 claims description 5
- 235000010523 Cicer arietinum Nutrition 0.000 claims description 5
- 240000000464 Cicer arietinum Species 0.000 claims description 5
- 240000000613 Citrullus lanatus Species 0.000 claims description 5
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 claims description 5
- 241000207199 Citrus Species 0.000 claims description 5
- 240000007170 Cocos nucifera Species 0.000 claims description 5
- 235000013162 Cocos nucifera Nutrition 0.000 claims description 5
- 240000007154 Coffea arabica Species 0.000 claims description 5
- 240000008067 Cucumis sativus Species 0.000 claims description 5
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 claims description 5
- 235000009854 Cucurbita moschata Nutrition 0.000 claims description 5
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 claims description 5
- 240000002860 Daucus carota Species 0.000 claims description 5
- 241000588722 Escherichia Species 0.000 claims description 5
- 240000000437 Eucalyptus leucoxylon Species 0.000 claims description 5
- 235000004694 Eucalyptus leucoxylon Nutrition 0.000 claims description 5
- 235000010705 Eucalyptus maculata Nutrition 0.000 claims description 5
- 235000009683 Eucalyptus polybractea Nutrition 0.000 claims description 5
- 235000009687 Eucalyptus sargentii Nutrition 0.000 claims description 5
- 239000004863 Frankincense Substances 0.000 claims description 5
- 240000006669 Helianthus annuus Species 0.000 claims description 5
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 5
- 241000258937 Hemiptera Species 0.000 claims description 5
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 5
- 240000005979 Hordeum vulgare Species 0.000 claims description 5
- 235000008694 Humulus lupulus Nutrition 0.000 claims description 5
- 240000006600 Humulus lupulus Species 0.000 claims description 5
- 235000002678 Ipomoea batatas Nutrition 0.000 claims description 5
- 240000003613 Ipomoea batatas Species 0.000 claims description 5
- 240000007049 Juglans regia Species 0.000 claims description 5
- 235000009496 Juglans regia Nutrition 0.000 claims description 5
- 235000003228 Lactuca sativa Nutrition 0.000 claims description 5
- 240000008415 Lactuca sativa Species 0.000 claims description 5
- 240000003183 Manihot esculenta Species 0.000 claims description 5
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 claims description 5
- 240000004658 Medicago sativa Species 0.000 claims description 5
- 240000005561 Musa balbisiana Species 0.000 claims description 5
- 235000018290 Musa x paradisiaca Nutrition 0.000 claims description 5
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 5
- 240000008962 Nicotiana tabacum Species 0.000 claims description 5
- 240000007817 Olea europaea Species 0.000 claims description 5
- 235000002725 Olea europaea Nutrition 0.000 claims description 5
- 241001520808 Panicum virgatum Species 0.000 claims description 5
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 5
- 240000005158 Phaseolus vulgaris Species 0.000 claims description 5
- 241001236219 Pinus echinata Species 0.000 claims description 5
- 235000005018 Pinus echinata Nutrition 0.000 claims description 5
- 235000017339 Pinus palustris Nutrition 0.000 claims description 5
- 241000209504 Poaceae Species 0.000 claims description 5
- 241000219000 Populus Species 0.000 claims description 5
- 240000000528 Ricinus communis Species 0.000 claims description 5
- 235000004443 Ricinus communis Nutrition 0.000 claims description 5
- 235000007238 Secale cereale Nutrition 0.000 claims description 5
- 240000002057 Secale cereale Species 0.000 claims description 5
- 235000002597 Solanum melongena Nutrition 0.000 claims description 5
- 240000002686 Solanum melongena Species 0.000 claims description 5
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 5
- 240000001016 Solanum tuberosum Species 0.000 claims description 5
- 235000009337 Spinacia oleracea Nutrition 0.000 claims description 5
- 240000003453 Spinacia oleracea Species 0.000 claims description 5
- 244000269722 Thea sinensis Species 0.000 claims description 5
- 241000219793 Trifolium Species 0.000 claims description 5
- 235000019714 Triticale Nutrition 0.000 claims description 5
- 241000219094 Vitaceae Species 0.000 claims description 5
- 235000017585 alfalfa Nutrition 0.000 claims description 5
- 235000017587 alfalfa Nutrition 0.000 claims description 5
- 235000020971 citrus fruits Nutrition 0.000 claims description 5
- 235000016213 coffee Nutrition 0.000 claims description 5
- 235000013353 coffee beverage Nutrition 0.000 claims description 5
- 230000001276 controlling effect Effects 0.000 claims description 5
- 235000001612 eucalyptus Nutrition 0.000 claims description 5
- 235000001617 eucalyptus Nutrition 0.000 claims description 5
- 235000001621 eucalyptus Nutrition 0.000 claims description 5
- 235000006356 eucalyptus Nutrition 0.000 claims description 5
- 235000004611 garlic Nutrition 0.000 claims description 5
- 235000021021 grapes Nutrition 0.000 claims description 5
- 235000019713 millet Nutrition 0.000 claims description 5
- 239000002773 nucleotide Substances 0.000 claims description 5
- 125000003729 nucleotide group Chemical group 0.000 claims description 5
- 235000015136 pumpkin Nutrition 0.000 claims description 5
- 235000005227 red mallee Nutrition 0.000 claims description 5
- 235000013616 tea Nutrition 0.000 claims description 5
- 235000020234 walnut Nutrition 0.000 claims description 5
- 241000228158 x Triticosecale Species 0.000 claims description 5
- 235000002243 Daucus carota subsp sativus Nutrition 0.000 claims description 4
- 240000003768 Solanum lycopersicum Species 0.000 claims description 4
- 244000128884 Zier Kohl Species 0.000 claims description 4
- 235000002732 oignon Nutrition 0.000 claims description 4
- 235000005765 wild carrot Nutrition 0.000 claims description 4
- ZHVOBYWXERUHMN-KVJKMEBSSA-N 3-[(3S,5R,8R,9S,10S,13S,14S,17S)-10,13-dimethyl-3-[(2R,3R,4S,5S,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-2,3,4,5,6,7,8,9,11,12,14,15,16,17-tetradecahydro-1H-cyclopenta[a]phenanthren-17-yl]-2H-furan-5-one Chemical compound O([C@@H]1C[C@H]2CC[C@@H]3[C@@H]([C@]2(CC1)C)CC[C@]1([C@H]3CC[C@@H]1C=1COC(=O)C=1)C)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O ZHVOBYWXERUHMN-KVJKMEBSSA-N 0.000 claims description 3
- 241000588698 Erwinia Species 0.000 claims description 3
- 235000016623 Fragaria vesca Nutrition 0.000 claims description 3
- 240000009088 Fragaria x ananassa Species 0.000 claims description 3
- 235000011363 Fragaria x ananassa Nutrition 0.000 claims description 3
- 206010061217 Infestation Diseases 0.000 claims description 3
- 241000588748 Klebsiella Species 0.000 claims description 3
- 241000589516 Pseudomonas Species 0.000 claims description 3
- 241000589180 Rhizobium Species 0.000 claims description 3
- 244000150668 Zea mays subsp mays Species 0.000 claims description 3
- 108090001123 antibodies Proteins 0.000 claims description 3
- 102000004965 antibodies Human genes 0.000 claims description 3
- 239000000969 carrier Substances 0.000 claims description 3
- 230000000295 complement Effects 0.000 claims description 3
- 235000000346 sugar Nutrition 0.000 claims description 3
- 241000193755 Bacillus cereus Species 0.000 claims description 2
- 229940075612 Bacillus cereus Drugs 0.000 claims description 2
- 210000004436 Chromosomes, Artificial, Bacterial Anatomy 0.000 claims description 2
- 210000001106 Chromosomes, Artificial, Yeast Anatomy 0.000 claims description 2
- 238000002965 ELISA Methods 0.000 claims description 2
- 241000588724 Escherichia coli Species 0.000 claims description 2
- 241000209510 Liliopsida Species 0.000 claims description 2
- 241000218621 Pinus radiata Species 0.000 claims description 2
- 235000008577 Pinus radiata Nutrition 0.000 claims description 2
- 229920002892 amber Polymers 0.000 claims description 2
- 241001233957 eudicotyledons Species 0.000 claims description 2
- 238000001262 western blot Methods 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 14
- 235000017060 Arachis glabrata Nutrition 0.000 claims 2
- 235000010777 Arachis hypogaea Nutrition 0.000 claims 2
- 235000018262 Arachis monticola Nutrition 0.000 claims 2
- 244000221633 Brassica rapa subsp chinensis Species 0.000 claims 2
- 235000010773 Cajanus indicus Nutrition 0.000 claims 2
- 244000105627 Cajanus indicus Species 0.000 claims 2
- 240000004244 Cucurbita moschata Species 0.000 claims 2
- 239000006002 Pepper Substances 0.000 claims 2
- 235000016761 Piper aduncum Nutrition 0.000 claims 2
- 235000017804 Piper guineense Nutrition 0.000 claims 2
- 240000000129 Piper nigrum Species 0.000 claims 2
- 235000008184 Piper nigrum Nutrition 0.000 claims 2
- 235000007558 Avena sp Nutrition 0.000 claims 1
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 claims 1
- 240000000218 Cannabis sativa Species 0.000 claims 1
- 235000002767 Daucus carota Nutrition 0.000 claims 1
- 241000122105 Diatraea Species 0.000 claims 1
- 241000241133 Earias Species 0.000 claims 1
- 241000520272 Pantoea Species 0.000 claims 1
- 241000256248 Spodoptera Species 0.000 claims 1
- 101710030464 TIC100 Proteins 0.000 claims 1
- 239000000126 substance Substances 0.000 abstract description 9
- 235000018102 proteins Nutrition 0.000 description 305
- 150000001413 amino acids Chemical group 0.000 description 75
- 241000880493 Leptailurus serval Species 0.000 description 51
- 230000014509 gene expression Effects 0.000 description 47
- 229920001405 Coding region Polymers 0.000 description 44
- 230000002588 toxic Effects 0.000 description 40
- 231100000331 toxic Toxicity 0.000 description 40
- 108010038633 aspartylglutamate Proteins 0.000 description 39
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 35
- 230000000749 insecticidal Effects 0.000 description 35
- 230000001131 transforming Effects 0.000 description 34
- 108010013835 arginine glutamate Proteins 0.000 description 33
- 108010061238 threonyl-glycine Proteins 0.000 description 33
- GVRKWABULJAONN-UHFFFAOYSA-N Valyl-Threonine Chemical compound CC(C)C(N)C(=O)NC(C(C)O)C(O)=O GVRKWABULJAONN-UHFFFAOYSA-N 0.000 description 32
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 30
- 108020003112 toxins Proteins 0.000 description 30
- 235000001014 amino acid Nutrition 0.000 description 29
- XUUXCWCKKCZEAW-YFKPBYRVSA-N 2-[[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 28
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 28
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 27
- 108010051242 phenylalanylserine Proteins 0.000 description 27
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 26
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 26
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 26
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 24
- MFEVVAXTBZELLL-UHFFFAOYSA-N Tyrosyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-UHFFFAOYSA-N 0.000 description 24
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 23
- 108010077245 asparaginyl-proline Proteins 0.000 description 22
- 108010089804 glycyl-threonine Proteins 0.000 description 22
- 239000003053 toxin Substances 0.000 description 22
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 21
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 21
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 21
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 21
- 231100000765 Toxin Toxicity 0.000 description 21
- 239000000047 product Substances 0.000 description 21
- NPDLYUOYAGBHFB-UHFFFAOYSA-N Asparaginyl-Arginine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N NPDLYUOYAGBHFB-UHFFFAOYSA-N 0.000 description 20
- HXWUJJADFMXNKA-UHFFFAOYSA-N Asparaginyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(N)=O HXWUJJADFMXNKA-UHFFFAOYSA-N 0.000 description 20
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 20
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 20
- 108010087823 glycyltyrosine Proteins 0.000 description 20
- XMBSYZWANAQXEV-UHFFFAOYSA-N 4-amino-5-[(1-carboxy-2-phenylethyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 18
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 18
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 18
- SITLTJHOQZFJGG-XPUUQOCRSA-N α-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 18
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 17
- DRCKHKZYDLJYFQ-UHFFFAOYSA-N Isoleucyl-Threonine Chemical compound CCC(C)C(N)C(=O)NC(C(C)O)C(O)=O DRCKHKZYDLJYFQ-UHFFFAOYSA-N 0.000 description 17
- UQTNIFUCMBFWEJ-UHFFFAOYSA-N Threoninyl-Asparagine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-UHFFFAOYSA-N 0.000 description 17
- 108010050848 glycylleucine Proteins 0.000 description 17
- 108010012581 phenylalanylglutamate Proteins 0.000 description 17
- 229920001184 polypeptide Polymers 0.000 description 17
- KTGFOCFYOZQVRJ-UHFFFAOYSA-N 2-[(2-amino-3-methylpentanoyl)amino]pentanedioic acid Chemical compound CCC(C)C(N)C(=O)NC(C(O)=O)CCC(O)=O KTGFOCFYOZQVRJ-UHFFFAOYSA-N 0.000 description 16
- JSLGXODUIAFWCF-UHFFFAOYSA-N Arginyl-Asparagine Chemical compound NC(N)=NCCCC(N)C(=O)NC(CC(N)=O)C(O)=O JSLGXODUIAFWCF-UHFFFAOYSA-N 0.000 description 16
- TWVKGYNQQAUNRN-ACZMJKKPSA-N Ile-Ser Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O TWVKGYNQQAUNRN-ACZMJKKPSA-N 0.000 description 16
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 16
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 16
- CKHWEVXPLJBEOZ-UHFFFAOYSA-N Threoninyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)C(C)O CKHWEVXPLJBEOZ-UHFFFAOYSA-N 0.000 description 16
- ONWMQORSVZYVNH-UHFFFAOYSA-N Tyrosyl-Asparagine Chemical compound NC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 ONWMQORSVZYVNH-UHFFFAOYSA-N 0.000 description 16
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 16
- 108010093581 aspartyl-proline Proteins 0.000 description 16
- 238000004166 bioassay Methods 0.000 description 16
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 16
- 108010057821 leucylproline Proteins 0.000 description 16
- BSWHERGFUNMWGS-UHFFFAOYSA-N Aspartyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 15
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 15
- QJKMCQRFHJRIPU-XDTLVQLUSA-N Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QJKMCQRFHJRIPU-XDTLVQLUSA-N 0.000 description 15
- 108010092854 aspartyllysine Proteins 0.000 description 15
- 108010010147 glycylglutamine Proteins 0.000 description 15
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 14
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 14
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 14
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 14
- JYOAXOMPIXKMKK-UHFFFAOYSA-N Leucyl-Glutamine Chemical compound CC(C)CC(N)C(=O)NC(C(O)=O)CCC(N)=O JYOAXOMPIXKMKK-UHFFFAOYSA-N 0.000 description 14
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 14
- LDEBVRIURYMKQS-UHFFFAOYSA-N Serinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CO LDEBVRIURYMKQS-UHFFFAOYSA-N 0.000 description 14
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 14
- 108010037850 glycylvaline Proteins 0.000 description 14
- 108010029020 prolylglycine Proteins 0.000 description 14
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 13
- QCWJKJLNCFEVPQ-WHFBIAKZSA-N Asn-Gln Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O QCWJKJLNCFEVPQ-WHFBIAKZSA-N 0.000 description 13
- OMSMPWHEGLNQOD-UHFFFAOYSA-N Asparaginyl-Phenylalanine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UHFFFAOYSA-N 0.000 description 13
- 241000256244 Heliothis virescens Species 0.000 description 13
- MUFXDFWAJSPHIQ-XDTLVQLUSA-N Ile-Tyr Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 MUFXDFWAJSPHIQ-XDTLVQLUSA-N 0.000 description 13
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 13
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 13
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 13
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 13
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 13
- LUMXICQAOKVQOB-UHFFFAOYSA-N Threoninyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)C(C)O LUMXICQAOKVQOB-UHFFFAOYSA-N 0.000 description 13
- 108010056582 methionylglutamic acid Proteins 0.000 description 13
- 108010018625 phenylalanylarginine Proteins 0.000 description 13
- 108010090894 prolylleucine Proteins 0.000 description 13
- IOUPEELXVYPCPG-UHFFFAOYSA-N val-gly Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 13
- LZDNBBYBDGBADK-KBPBESRZSA-N (2S)-2-[[(2S)-2-amino-3-methylbutanoyl]amino]-3-(1H-indol-3-yl)propanoic acid Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-KBPBESRZSA-N 0.000 description 12
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 12
- UKGGPJNBONZZCM-WDSKDSINSA-N Aspartyl-L-proline Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 12
- FADYJNXDPBKVCA-UHFFFAOYSA-N Phenylalanyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 12
- 231100000654 Protein toxin Toxicity 0.000 description 12
- 241001521235 Spodoptera eridania Species 0.000 description 12
- WCRFXRIWBFRZBR-GGVZMXCHSA-N Thr-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WCRFXRIWBFRZBR-GGVZMXCHSA-N 0.000 description 12
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 12
- 210000001519 tissues Anatomy 0.000 description 12
- VNYDHJARLHNEGA-RYUDHWBXSA-N (2S)-1-[(2S)-2-azaniumyl-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carboxylate Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 11
- TUTIHHSZKFBMHM-UHFFFAOYSA-N 4-amino-5-[(3-amino-1-carboxy-3-oxopropyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O TUTIHHSZKFBMHM-UHFFFAOYSA-N 0.000 description 11
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 11
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 11
- VGRHZPNRCLAHQA-UHFFFAOYSA-N Aspartyl-Asparagine Chemical compound OC(=O)CC(N)C(=O)NC(CC(N)=O)C(O)=O VGRHZPNRCLAHQA-UHFFFAOYSA-N 0.000 description 11
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 11
- 235000004341 Gossypium herbaceum Nutrition 0.000 description 11
- 240000002024 Gossypium herbaceum Species 0.000 description 11
- NIKBMHGRNAPJFW-UHFFFAOYSA-N Histidinyl-Arginine Chemical compound NC(=N)NCCCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 NIKBMHGRNAPJFW-UHFFFAOYSA-N 0.000 description 11
- HYXQKVOADYPQEA-CIUDSAMLSA-N Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HYXQKVOADYPQEA-CIUDSAMLSA-N 0.000 description 11
- HZYHBDVRCBDJJV-HAFWLYHUSA-N Ile-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O HZYHBDVRCBDJJV-HAFWLYHUSA-N 0.000 description 11
- UWBDLNOCIDGPQE-UHFFFAOYSA-N Isoleucyl-Lysine Chemical compound CCC(C)C(N)C(=O)NC(C(O)=O)CCCCN UWBDLNOCIDGPQE-UHFFFAOYSA-N 0.000 description 11
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 11
- OZILORBBPKKGRI-RYUDHWBXSA-N Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 OZILORBBPKKGRI-RYUDHWBXSA-N 0.000 description 11
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 11
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 11
- XXDVDTMEVBYRPK-XPUUQOCRSA-N Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O XXDVDTMEVBYRPK-XPUUQOCRSA-N 0.000 description 11
- STTYIMSDIYISRG-WDSKDSINSA-N Val-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(O)=O STTYIMSDIYISRG-WDSKDSINSA-N 0.000 description 11
- 108010044940 alanylglutamine Proteins 0.000 description 11
- 108010049041 glutamylalanine Proteins 0.000 description 11
- 108010081551 glycylphenylalanine Proteins 0.000 description 11
- 108010026333 seryl-proline Proteins 0.000 description 11
- 108010020532 tyrosyl-proline Proteins 0.000 description 11
- 241000625764 Anticarsia gemmatalis Species 0.000 description 10
- XNSKSTRGQIPTSE-UHFFFAOYSA-N Arginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCCNC(N)=N XNSKSTRGQIPTSE-UHFFFAOYSA-N 0.000 description 10
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 10
- MQLZLIYPFDIDMZ-UHFFFAOYSA-N Asparaginyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(N)=O MQLZLIYPFDIDMZ-UHFFFAOYSA-N 0.000 description 10
- OELDIVRKHTYFNG-UHFFFAOYSA-N Cysteinyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CS OELDIVRKHTYFNG-UHFFFAOYSA-N 0.000 description 10
- 241000122106 Diatraea saccharalis Species 0.000 description 10
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 10
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 10
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 10
- UCGDDTHMMVWVMV-FSPLSTOPSA-N Ile-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(O)=O UCGDDTHMMVWVMV-FSPLSTOPSA-N 0.000 description 10
- WKXVAXOSIPTXEC-UHFFFAOYSA-N Isoleucyl-Aspartate Chemical compound CCC(C)C(N)C(=O)NC(C(O)=O)CC(O)=O WKXVAXOSIPTXEC-UHFFFAOYSA-N 0.000 description 10
- 108010066427 N-valyltryptophan Proteins 0.000 description 10
- GVUVRRPYYDHHGK-UHFFFAOYSA-N Prolyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C1CCCN1 GVUVRRPYYDHHGK-UHFFFAOYSA-N 0.000 description 10
- 108020004511 Recombinant DNA Proteins 0.000 description 10
- PPQRSMGDOHLTBE-UWVGGRQHSA-N Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PPQRSMGDOHLTBE-UWVGGRQHSA-N 0.000 description 10
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 10
- 108010040030 histidinoalanine Proteins 0.000 description 10
- 108010009298 lysylglutamic acid Proteins 0.000 description 10
- 108010084932 tryptophyl-proline Proteins 0.000 description 10
- 108010073969 valyllysine Proteins 0.000 description 10
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 9
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 9
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 9
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 9
- HAYVTMHUNMMXCV-UHFFFAOYSA-N Cysteinyl-Alanine Chemical compound OC(=O)C(C)NC(=O)C(N)CS HAYVTMHUNMMXCV-UHFFFAOYSA-N 0.000 description 9
- NXTYATMDWQYLGJ-UHFFFAOYSA-N Cysteinyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CS NXTYATMDWQYLGJ-UHFFFAOYSA-N 0.000 description 9
- 241001572697 Earias vittella Species 0.000 description 9
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 9
- ARPVSMCNIDAQBO-UHFFFAOYSA-N Glutaminyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CCC(N)=O ARPVSMCNIDAQBO-UHFFFAOYSA-N 0.000 description 9
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 9
- BBIXOODYWPFNDT-CIUDSAMLSA-N Ile-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O BBIXOODYWPFNDT-CIUDSAMLSA-N 0.000 description 9
- FMIIKPHLJKUXGE-GUBZILKMSA-N Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN FMIIKPHLJKUXGE-GUBZILKMSA-N 0.000 description 9
- UJTZHGHXJKIAOS-WHFBIAKZSA-N Ser-Gln Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O UJTZHGHXJKIAOS-WHFBIAKZSA-N 0.000 description 9
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 9
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 9
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 9
- 235000004279 alanine Nutrition 0.000 description 9
- 230000000875 corresponding Effects 0.000 description 9
- 108010025306 histidylleucine Proteins 0.000 description 9
- 238000002360 preparation method Methods 0.000 description 9
- 108010048818 seryl-histidine Proteins 0.000 description 9
- XITLYYAIPBBHPX-UHFFFAOYSA-N γ-glutamyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CCC(N)=O XITLYYAIPBBHPX-UHFFFAOYSA-N 0.000 description 9
- QXRNAOYBCYVZCD-BQBZGAKWSA-N (2S)-6-amino-2-[[(2S)-2-aminopropanoyl]amino]hexanoic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN QXRNAOYBCYVZCD-BQBZGAKWSA-N 0.000 description 8
- SNFUTDLOCQQRQD-UHFFFAOYSA-N 2-[(2-amino-4-carboxybutanoyl)amino]-3-methylpentanoic acid Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SNFUTDLOCQQRQD-UHFFFAOYSA-N 0.000 description 8
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 8
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 8
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 8
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 8
- KWBQPGIYEZKDEG-FSPLSTOPSA-N Asn-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O KWBQPGIYEZKDEG-FSPLSTOPSA-N 0.000 description 8
- OWOFCNWTMWOOJJ-WDSKDSINSA-N Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OWOFCNWTMWOOJJ-WDSKDSINSA-N 0.000 description 8
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 8
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 8
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 8
- 229920002459 Intron Polymers 0.000 description 8
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 8
- 241000227653 Lycopersicon Species 0.000 description 8
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 8
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 8
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 8
- 101700080605 NUC1 Proteins 0.000 description 8
- IWIANZLCJVYEFX-RYUDHWBXSA-N Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 IWIANZLCJVYEFX-RYUDHWBXSA-N 0.000 description 8
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 8
- UBAQSAUDKMIEQZ-QWRGUYRKSA-N Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UBAQSAUDKMIEQZ-QWRGUYRKSA-N 0.000 description 8
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 8
- 108010011559 alanylphenylalanine Proteins 0.000 description 8
- 108010047857 aspartylglycine Proteins 0.000 description 8
- 229920005618 ethylene copolymer bitumen Polymers 0.000 description 8
- STKYPAFSDFAEPH-LURJTMIESA-N gly-val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 8
- 108010077515 glycylproline Proteins 0.000 description 8
- 108010092114 histidylphenylalanine Proteins 0.000 description 8
- 108010034529 leucyl-lysine Proteins 0.000 description 8
- 108010012058 leucyltyrosine Proteins 0.000 description 8
- 101700006494 nucA Proteins 0.000 description 8
- 108010070643 prolylglutamic acid Proteins 0.000 description 8
- 231100000167 toxic agent Toxicity 0.000 description 8
- 239000003440 toxic substance Substances 0.000 description 8
- NJMYZEJORPYOTO-UHFFFAOYSA-N γ-glutamyl-Proline Chemical compound NC(=O)CCC(N)C(=O)N1CCCC1C(O)=O NJMYZEJORPYOTO-UHFFFAOYSA-N 0.000 description 8
- OMNVYXHOSHNURL-WPRPVWTQSA-N Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMNVYXHOSHNURL-WPRPVWTQSA-N 0.000 description 7
- SITWEMZOJNKJCH-UHFFFAOYSA-N Alanyl-Arginine Chemical compound CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 7
- 210000003763 Chloroplasts Anatomy 0.000 description 7
- WYVKPHCYMTWUCW-UHFFFAOYSA-N Cysteinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CS WYVKPHCYMTWUCW-UHFFFAOYSA-N 0.000 description 7
- LLEUXCDZPQOJMY-AAEUAGOBSA-N Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 LLEUXCDZPQOJMY-AAEUAGOBSA-N 0.000 description 7
- FRJIAZKQGSCKPQ-FSPLSTOPSA-N His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 FRJIAZKQGSCKPQ-FSPLSTOPSA-N 0.000 description 7
- CNPNWGHRMBQHBZ-ZKWXMUAHSA-N Ile-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O CNPNWGHRMBQHBZ-ZKWXMUAHSA-N 0.000 description 7
- JMEWFDUAFKVAAT-UHFFFAOYSA-N Methionyl-Asparagine Chemical compound CSCCC(N)C(=O)NC(C(O)=O)CC(N)=O JMEWFDUAFKVAAT-UHFFFAOYSA-N 0.000 description 7
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 7
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 7
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 7
- AFWBWPCXSWUCLB-WDSKDSINSA-N Pro-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 AFWBWPCXSWUCLB-WDSKDSINSA-N 0.000 description 7
- BEPSGCXDIVACBU-UHFFFAOYSA-N Prolyl-Histidine Chemical compound C1CCNC1C(=O)NC(C(=O)O)CC1=CN=CN1 BEPSGCXDIVACBU-UHFFFAOYSA-N 0.000 description 7
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 7
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 7
- YZMPDHTZJJCGEI-BQBZGAKWSA-N Ser-His Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 YZMPDHTZJJCGEI-BQBZGAKWSA-N 0.000 description 7
- FFOKMZOAVHEWET-UHFFFAOYSA-N Serinyl-Cysteine Chemical compound OCC(N)C(=O)NC(CS)C(O)=O FFOKMZOAVHEWET-UHFFFAOYSA-N 0.000 description 7
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 7
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 7
- 229920000401 Three prime untranslated region Polymers 0.000 description 7
- PNVLWFYAPWAQMU-CIUDSAMLSA-N Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)C(C)C PNVLWFYAPWAQMU-CIUDSAMLSA-N 0.000 description 7
- 108010087924 alanylproline Proteins 0.000 description 7
- 108010070783 alanyltyrosine Proteins 0.000 description 7
- 108010008355 arginyl-glutamine Proteins 0.000 description 7
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 7
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 7
- 108010054813 diprotin B Proteins 0.000 description 7
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 7
- 230000001965 increased Effects 0.000 description 7
- 239000002917 insecticide Substances 0.000 description 7
- 238000003780 insertion Methods 0.000 description 7
- 108010017391 lysylvaline Proteins 0.000 description 7
- 241000894007 species Species 0.000 description 7
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 7
- 108010038745 tryptophylglycine Proteins 0.000 description 7
- XMAUFHMAAVTODF-STQMWFEESA-N (2S)-2-[[(2S)-2-amino-3-(1H-imidazol-5-yl)propanoyl]amino]-3-phenylpropanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XMAUFHMAAVTODF-STQMWFEESA-N 0.000 description 6
- PCDQPRRSZKQHHS-XVFCMESISA-N ({[({[(2R,3S,4R,5R)-5-(4-amino-2-oxo-1,2-dihydropyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy}(hydroxy)phosphoryl)oxy](hydroxy)phosphoryl}oxy)phosphonic acid Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-XVFCMESISA-N 0.000 description 6
- GJSURZIOUXUGAL-UHFFFAOYSA-N 2-((2,6-Dichlorophenyl)imino)imidazolidine Chemical compound ClC1=CC=CC(Cl)=C1NC1=NCCN1 GJSURZIOUXUGAL-UHFFFAOYSA-N 0.000 description 6
- 241000256118 Aedes aegypti Species 0.000 description 6
- RDIKFPRVLJLMER-BQBZGAKWSA-N Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)N RDIKFPRVLJLMER-BQBZGAKWSA-N 0.000 description 6
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 6
- GSMPSRPMQQDRIB-WHFBIAKZSA-N Asp-Gln Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O GSMPSRPMQQDRIB-WHFBIAKZSA-N 0.000 description 6
- TWXZVVXRRRRSLT-UHFFFAOYSA-N Asparaginyl-Cysteine Chemical compound NC(=O)CC(N)C(=O)NC(CS)C(O)=O TWXZVVXRRRRSLT-UHFFFAOYSA-N 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 6
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 6
- YSWHPLCDIMUKFE-QWRGUYRKSA-N Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YSWHPLCDIMUKFE-QWRGUYRKSA-N 0.000 description 6
- BCVIOZZGJNOEQS-XKNYDFJKSA-N Ile-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)[C@@H](C)CC BCVIOZZGJNOEQS-XKNYDFJKSA-N 0.000 description 6
- VYZAGTDAHUIRQA-WHFBIAKZSA-N L-alanyl-L-glutamic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O VYZAGTDAHUIRQA-WHFBIAKZSA-N 0.000 description 6
- 108010079364 N-glycylalanine Proteins 0.000 description 6
- 229920000272 Oligonucleotide Polymers 0.000 description 6
- KLAONOISLHWJEE-UHFFFAOYSA-N Phenylalanyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 KLAONOISLHWJEE-UHFFFAOYSA-N 0.000 description 6
- RZEQTVHJZCIUBT-UHFFFAOYSA-N Serinyl-Arginine Chemical compound OCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-UHFFFAOYSA-N 0.000 description 6
- BXLYSRPHVMCOPS-UHFFFAOYSA-N Serinyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CO BXLYSRPHVMCOPS-UHFFFAOYSA-N 0.000 description 6
- BWUHENPAEMNGQJ-ZDLURKLDSA-N Thr-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O BWUHENPAEMNGQJ-ZDLURKLDSA-N 0.000 description 6
- UYKREHOKELZSPB-JTQLQIEISA-N Trp-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(O)=O)=CNC2=C1 UYKREHOKELZSPB-JTQLQIEISA-N 0.000 description 6
- 108010041407 alanylaspartic acid Proteins 0.000 description 6
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 6
- KZNQNBZMBZJQJO-YFKPBYRVSA-N gly pro Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 6
- 108010084389 glycyltryptophan Proteins 0.000 description 6
- 108010000761 leucylarginine Proteins 0.000 description 6
- 108010044655 lysylproline Proteins 0.000 description 6
- 230000000813 microbial Effects 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 102000004196 processed proteins & peptides Human genes 0.000 description 6
- OCYROESYHWUPBP-VGMNWLOBSA-N (2S,3R)-3-methyl-2-[[(2S)-pyrrolidin-1-ium-2-carbonyl]amino]pentanoate Chemical compound CC[C@@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 OCYROESYHWUPBP-VGMNWLOBSA-N 0.000 description 5
- MPZWMIIOPAPAKE-UHFFFAOYSA-N 4-amino-5-[[1-carboxy-4-(diaminomethylideneamino)butyl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CCCN=C(N)N MPZWMIIOPAPAKE-UHFFFAOYSA-N 0.000 description 5
- 241000566547 Agrotis ipsilon Species 0.000 description 5
- XAEWTDMGFGHWFK-IMJSIDKUSA-N Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O XAEWTDMGFGHWFK-IMJSIDKUSA-N 0.000 description 5
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 5
- PMGDADKJMCOXHX-BQBZGAKWSA-N Arg-Gln Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PMGDADKJMCOXHX-BQBZGAKWSA-N 0.000 description 5
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 5
- HSPSXROIMXIJQW-BQBZGAKWSA-N Asp-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 HSPSXROIMXIJQW-BQBZGAKWSA-N 0.000 description 5
- CLSDNFWKGFJIBZ-UHFFFAOYSA-N Glutaminyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CCC(N)=O CLSDNFWKGFJIBZ-UHFFFAOYSA-N 0.000 description 5
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 5
- AJHCSUXXECOXOY-NSHDSACASA-N Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-NSHDSACASA-N 0.000 description 5
- VHOLZZKNEBBHTH-YUMQZZPRSA-N His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 VHOLZZKNEBBHTH-YUMQZZPRSA-N 0.000 description 5
- WMDZARSFSMZOQO-DRZSPHRISA-N Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WMDZARSFSMZOQO-DRZSPHRISA-N 0.000 description 5
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 5
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 5
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 5
- SENJXOPIZNYLHU-IUCAKERBSA-N Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-IUCAKERBSA-N 0.000 description 5
- HIZYETOZLYFUFF-BQBZGAKWSA-N Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O HIZYETOZLYFUFF-BQBZGAKWSA-N 0.000 description 5
- LHSGPCFBGJHPCY-STQMWFEESA-N Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-STQMWFEESA-N 0.000 description 5
- MUMXFARPYQTTSL-BQBZGAKWSA-N Met-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O MUMXFARPYQTTSL-BQBZGAKWSA-N 0.000 description 5
- UEKYKRQIAQHOOZ-KBPBESRZSA-N Pro-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)[O-])C(=O)[C@@H]1CCC[NH2+]1 UEKYKRQIAQHOOZ-KBPBESRZSA-N 0.000 description 5
- LCPVBXOHXMBLFW-JSGCOSHPSA-N Trp-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)=CNC2=C1 LCPVBXOHXMBLFW-JSGCOSHPSA-N 0.000 description 5
- DXYQIGZZWYBXSD-UHFFFAOYSA-N Tryptophyl-Proline Chemical compound C=1NC2=CC=CC=C2C=1CC(N)C(=O)N1CCCC1C(O)=O DXYQIGZZWYBXSD-UHFFFAOYSA-N 0.000 description 5
- 108010036533 arginylvaline Proteins 0.000 description 5
- 108010060199 cysteinylproline Proteins 0.000 description 5
- 108010069495 cysteinyltyrosine Proteins 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 230000002068 genetic Effects 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 5
- VPZXBVLAVMBEQI-VKHMYHEASA-N gly ala Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 5
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine zwitterion Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 5
- 108010078274 isoleucylvaline Proteins 0.000 description 5
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- QLROSWPKSBORFJ-BQBZGAKWSA-N pro glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 5
- 108010031719 prolyl-serine Proteins 0.000 description 5
- 108010053725 prolylvaline Proteins 0.000 description 5
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 5
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 5
- 108010051110 tyrosyl-lysine Proteins 0.000 description 5
- 108010078580 tyrosylleucine Proteins 0.000 description 5
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 5
- DXJZITDUDUPINW-UHFFFAOYSA-N γ-glutamyl-Asparagine Chemical compound NC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O DXJZITDUDUPINW-UHFFFAOYSA-N 0.000 description 5
- DSTWKJOBKSMVCV-UWVGGRQHSA-N (2S)-2-[[(2R)-2-amino-3-sulfanylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DSTWKJOBKSMVCV-UWVGGRQHSA-N 0.000 description 4
- CCQOOWAONKGYKQ-BYPYZUCNSA-N (2S)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoate Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 4
- RFCVXVPWSPOMFJ-UHFFFAOYSA-N 2-[(2-azaniumyl-3-phenylpropanoyl)amino]-4-methylpentanoate Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 RFCVXVPWSPOMFJ-UHFFFAOYSA-N 0.000 description 4
- MGHKSHCBDXNTHX-UHFFFAOYSA-N 4-amino-5-[(4-amino-1-carboxy-4-oxobutyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CCC(N)=O)C(O)=O MGHKSHCBDXNTHX-UHFFFAOYSA-N 0.000 description 4
- 108010076441 Ala-His-His Proteins 0.000 description 4
- ZSOICJZJSRWNHX-ACZMJKKPSA-N Ala-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)[C@H](C)[NH3+] ZSOICJZJSRWNHX-ACZMJKKPSA-N 0.000 description 4
- ZARXTZFGQZBYFO-JQWIXIFHSA-N Asp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(O)=O)N)C(O)=O)=CNC2=C1 ZARXTZFGQZBYFO-JQWIXIFHSA-N 0.000 description 4
- CPMKYMGGYUFOHS-FSPLSTOPSA-N Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O CPMKYMGGYUFOHS-FSPLSTOPSA-N 0.000 description 4
- SJUXYGVRSGTPMC-UHFFFAOYSA-N Asparaginyl-Alanine Chemical compound OC(=O)C(C)NC(=O)C(N)CC(N)=O SJUXYGVRSGTPMC-UHFFFAOYSA-N 0.000 description 4
- VBKIFHUVGLOJKT-UHFFFAOYSA-N Asparaginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(N)=O VBKIFHUVGLOJKT-UHFFFAOYSA-N 0.000 description 4
- NTQDELBZOMWXRS-UHFFFAOYSA-N Aspartyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(O)=O NTQDELBZOMWXRS-UHFFFAOYSA-N 0.000 description 4
- 241000272201 Columbiformes Species 0.000 description 4
- PNMUAGGSDZXTHX-BYPYZUCNSA-N Gly-Gln Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(N)=O PNMUAGGSDZXTHX-BYPYZUCNSA-N 0.000 description 4
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 4
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 4
- KRBMQYPTDYSENE-BQBZGAKWSA-N His-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 KRBMQYPTDYSENE-BQBZGAKWSA-N 0.000 description 4
- IDXZDKMBEXLFMB-UHFFFAOYSA-N Histidinyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC1=CN=CN1 IDXZDKMBEXLFMB-UHFFFAOYSA-N 0.000 description 4
- QNBYCZTZNOVDMI-HGNGGELXSA-N Ile-His Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QNBYCZTZNOVDMI-HGNGGELXSA-N 0.000 description 4
- ZUKPVRWZDMRIEO-VKHMYHEASA-N L-cysteinylglycine zwitterion Chemical compound SC[C@H]([NH3+])C(=O)NCC([O-])=O ZUKPVRWZDMRIEO-VKHMYHEASA-N 0.000 description 4
- 241000258916 Leptinotarsa decemlineata Species 0.000 description 4
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 4
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 4
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 4
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 4
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 4
- 108010033725 Recombinant Proteins Proteins 0.000 description 4
- 102000007312 Recombinant Proteins Human genes 0.000 description 4
- CUTPSEKWUPZFLV-UHFFFAOYSA-N Threoninyl-Cysteine Chemical compound CC(O)C(N)C(=O)NC(CS)C(O)=O CUTPSEKWUPZFLV-UHFFFAOYSA-N 0.000 description 4
- GRQCSEWEPIHLBI-UHFFFAOYSA-N Tryptophyl-Asparagine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CC(N)=O)C(O)=O)=CNC2=C1 GRQCSEWEPIHLBI-UHFFFAOYSA-N 0.000 description 4
- YBRHKUNWEYBZGT-UHFFFAOYSA-N Tryptophyl-Threonine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(C(O)C)C(O)=O)=CNC2=C1 YBRHKUNWEYBZGT-UHFFFAOYSA-N 0.000 description 4
- AUEJLPRZGVVDNU-STQMWFEESA-N Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-STQMWFEESA-N 0.000 description 4
- QZOSVNLXLSNHQK-UHFFFAOYSA-N Tyrosyl-Aspartate Chemical compound OC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UHFFFAOYSA-N 0.000 description 4
- WPSXZFTVLIAPCN-UHFFFAOYSA-N Valyl-Cysteine Chemical compound CC(C)C(N)C(=O)NC(CS)C(O)=O WPSXZFTVLIAPCN-UHFFFAOYSA-N 0.000 description 4
- 240000008042 Zea mays Species 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 235000005911 diet Nutrition 0.000 description 4
- 230000037213 diet Effects 0.000 description 4
- 108010020688 glycylhistidine Proteins 0.000 description 4
- 230000000977 initiatory Effects 0.000 description 4
- 108010054155 lysyllysine Proteins 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000001404 mediated Effects 0.000 description 4
- 238000000034 method Methods 0.000 description 4
- RZVAJINKPMORJF-UHFFFAOYSA-N p-acetaminophenol Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 4
- 108010044292 tryptophyltyrosine Proteins 0.000 description 4
- FAQVCWVVIYYWRR-WHFBIAKZSA-N (2S)-2-[[(2S)-2,5-diamino-5-oxopentanoyl]amino]propanoic acid Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O FAQVCWVVIYYWRR-WHFBIAKZSA-N 0.000 description 3
- VKVDRTGWLVZJOM-DCAQKATOSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 3
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]propanoyl]amino]butanedioic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 3
- NBTGEURICRTMGL-WHFBIAKZSA-N (2S)-2-[[2-[[(2S)-2-aminopropanoyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 3
- YOKVEHGYYQEQOP-QWRGUYRKSA-N 2-[[(2S)-2-[[(2S)-2-azaniumyl-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]acetate Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 3
- 241001133760 Acoelorraphe Species 0.000 description 3
- ALZVPLKYDKJKQU-XVKPBYJWSA-N Ala-Tyr Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ALZVPLKYDKJKQU-XVKPBYJWSA-N 0.000 description 3
- BNODVYXZAAXSHW-UHFFFAOYSA-N Arginyl-Histidine Chemical compound NC(=N)NCCCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 BNODVYXZAAXSHW-UHFFFAOYSA-N 0.000 description 3
- 241000238421 Arthropoda Species 0.000 description 3
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 3
- FKBFDTRILNZGAI-UHFFFAOYSA-N Aspartyl-Cysteine Chemical compound OC(=O)CC(N)C(=O)NC(CS)C(O)=O FKBFDTRILNZGAI-UHFFFAOYSA-N 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 3
- 241000345396 Brassica rapa subsp. chinensis Species 0.000 description 3
- 241001340508 Crambus Species 0.000 description 3
- 241000219122 Cucurbita Species 0.000 description 3
- 241001635274 Cydia pomonella Species 0.000 description 3
- VBIIZCXWOZDIHS-UHFFFAOYSA-N Cysteinyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CS VBIIZCXWOZDIHS-UHFFFAOYSA-N 0.000 description 3
- SYELGNBERZZXAG-UHFFFAOYSA-N Cysteinyl-Tryptophan Chemical compound C1=CC=C2C(CC(NC(=O)C(CS)N)C(O)=O)=CNC2=C1 SYELGNBERZZXAG-UHFFFAOYSA-N 0.000 description 3
- 241000489947 Diabrotica virgifera virgifera Species 0.000 description 3
- 241000602080 Dracaena fragrans Species 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- SSHIXEILTLPAQT-UHFFFAOYSA-N Glutaminyl-Aspartate Chemical compound NC(=O)CCC(N)C(=O)NC(CC(O)=O)C(O)=O SSHIXEILTLPAQT-UHFFFAOYSA-N 0.000 description 3
- VHLZDSUANXBJHW-UHFFFAOYSA-N Glutaminyl-Phenylalanine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 VHLZDSUANXBJHW-UHFFFAOYSA-N 0.000 description 3
- HHSJMSCOLJVTCX-UHFFFAOYSA-N Glutaminyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCC(N)=O HHSJMSCOLJVTCX-UHFFFAOYSA-N 0.000 description 3
- MRVYVEQPNDSWLH-UHFFFAOYSA-N Glutaminyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CCC(N)=O MRVYVEQPNDSWLH-UHFFFAOYSA-N 0.000 description 3
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 3
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 3
- BCXBIONYYJCSDF-CIUDSAMLSA-N Ile-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O BCXBIONYYJCSDF-CIUDSAMLSA-N 0.000 description 3
- BQVUABVGYYSDCJ-ZFWWWQNUSA-N Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-ZFWWWQNUSA-N 0.000 description 3
- 241001477931 Mythimna unipuncta Species 0.000 description 3
- 241000256259 Noctuidae Species 0.000 description 3
- JWBLQDDHSDGEGR-DRZSPHRISA-N Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWBLQDDHSDGEGR-DRZSPHRISA-N 0.000 description 3
- 241000758706 Piperaceae Species 0.000 description 3
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 3
- HXNYBZQLBWIADP-UHFFFAOYSA-N Prolyl-Cysteine Chemical compound OC(=O)C(CS)NC(=O)C1CCCN1 HXNYBZQLBWIADP-UHFFFAOYSA-N 0.000 description 3
- WBAXJMCUFIXCNI-WDSKDSINSA-N Ser-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WBAXJMCUFIXCNI-WDSKDSINSA-N 0.000 description 3
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 3
- APIDTRXFGYOLLH-VQVTYTSYSA-N Thr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O APIDTRXFGYOLLH-VQVTYTSYSA-N 0.000 description 3
- TYYLDKGBCJGJGW-WMZOPIPTSA-N Trp-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 TYYLDKGBCJGJGW-WMZOPIPTSA-N 0.000 description 3
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 3
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 3
- BMPPMAOOKQJYIP-WMZOPIPTSA-N Tyr-Trp Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C([O-])=O)C1=CC=C(O)C=C1 BMPPMAOOKQJYIP-WMZOPIPTSA-N 0.000 description 3
- 108010064997 VPY tripeptide Proteins 0.000 description 3
- IBIDRSSEHFLGSD-YUMQZZPRSA-N Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-YUMQZZPRSA-N 0.000 description 3
- OBTCMSPFOITUIJ-FSPLSTOPSA-N Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O OBTCMSPFOITUIJ-FSPLSTOPSA-N 0.000 description 3
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 3
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 3
- 108010031100 chloroplast transit peptides Proteins 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 235000012343 cottonseed oil Nutrition 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 230000000967 entomopathogenic Effects 0.000 description 3
- 238000009313 farming Methods 0.000 description 3
- 230000035558 fertility Effects 0.000 description 3
- 235000013312 flour Nutrition 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 239000000446 fuel Substances 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037240 fusion proteins Human genes 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 3
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 3
- 108010084760 glycyl-tyrosyl-glycyl-aspartate Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 108010036413 histidylglycine Proteins 0.000 description 3
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 235000016709 nutrition Nutrition 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 235000012015 potatoes Nutrition 0.000 description 3
- 108010077112 prolyl-proline Proteins 0.000 description 3
- 108010071207 serylmethionine Proteins 0.000 description 3
- 108010080629 tryptophan-leucine Proteins 0.000 description 3
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 3
- 230000035899 viability Effects 0.000 description 3
- UKKNTTCNGZLJEX-UHFFFAOYSA-N γ-glutamyl-Serine Chemical compound NC(=O)CCC(N)C(=O)NC(CO)C(O)=O UKKNTTCNGZLJEX-UHFFFAOYSA-N 0.000 description 3
- YSMPVONNIWLJML-FXQIFTODSA-N (2S)-1-[(2S)-2-[[(2S)-2-aminopropanoyl]amino]-3-carboxypropanoyl]pyrrolidine-2-carboxylic acid Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 2
- YGZWVPBHYABGLT-KJEVXHAQSA-N (2S)-2-[[(2S)-1-[(2S,3R)-2-amino-3-hydroxybutanoyl]pyrrolidine-2-carbonyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-carboxybutanoyl]amino]-4-carboxybutanoyl]amino]pentanedioic acid Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- CGHXMODRYJISSK-NHCYSSNCSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]butanedioic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 2
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-phenylpropanoyl]amino]butanedioic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 2
- NIZKGBJVCMRDKO-KWQFWETISA-N (2S)-2-[[2-[[(2S)-2-aminopropanoyl]amino]acetyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N (3S)-3-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-(carboxymethylamino)-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- SJPMNHCEWPTRBR-BQBZGAKWSA-N (4S)-4-amino-5-[[(2S)-4-carboxy-1-(carboxymethylamino)-1-oxobutan-2-yl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 2
- PABVKUJVLNMOJP-UHFFFAOYSA-N 4-amino-5-[(1-carboxy-2-sulfanylethyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CS)C(O)=O PABVKUJVLNMOJP-UHFFFAOYSA-N 0.000 description 2
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 2
- FSHURBQASBLAPO-WDSKDSINSA-N Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)N FSHURBQASBLAPO-WDSKDSINSA-N 0.000 description 2
- 229920002287 Amplicon Polymers 0.000 description 2
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 2
- SIFXMYAHXJGAFC-WDSKDSINSA-N Arg-Asp Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SIFXMYAHXJGAFC-WDSKDSINSA-N 0.000 description 2
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 2
- QADCERNTBWTXFV-JSGCOSHPSA-N Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(O)=O)=CNC2=C1 QADCERNTBWTXFV-JSGCOSHPSA-N 0.000 description 2
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 2
- DYDKXJWQCIVTMR-UHFFFAOYSA-N Aspartyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CC(O)=O DYDKXJWQCIVTMR-UHFFFAOYSA-N 0.000 description 2
- BVRPESWOSNFUCJ-LKTVYLICSA-N BNC210 Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 BVRPESWOSNFUCJ-LKTVYLICSA-N 0.000 description 2
- 229920000033 CRISPR Polymers 0.000 description 2
- 108010082319 CRISPR-Associated Protein 9 Proteins 0.000 description 2
- 210000000170 Cell Membrane Anatomy 0.000 description 2
- 108010049994 Chloroplast Proteins Proteins 0.000 description 2
- YXQDRIRSAHTJKM-IMJSIDKUSA-N Cys-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YXQDRIRSAHTJKM-IMJSIDKUSA-N 0.000 description 2
- 241000489976 Diabrotica undecimpunctata howardi Species 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 210000002472 Endoplasmic Reticulum Anatomy 0.000 description 2
- 108010074122 Ferredoxins Proteins 0.000 description 2
- 102000020716 Ferredoxins Human genes 0.000 description 2
- 240000001441 Fragaria vesca Species 0.000 description 2
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 2
- SXGAGTVDWKQYCX-BQBZGAKWSA-N Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SXGAGTVDWKQYCX-BQBZGAKWSA-N 0.000 description 2
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 2
- 229920002391 Guide RNA Polymers 0.000 description 2
- 108020005004 Guide RNA Proteins 0.000 description 2
- 241001000403 Herpetogramma licarsisalis Species 0.000 description 2
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 2
- CZVQSYNVUHAILZ-UWVGGRQHSA-N His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 CZVQSYNVUHAILZ-UWVGGRQHSA-N 0.000 description 2
- HTOOKGDPMXSJSY-STQMWFEESA-N His-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 HTOOKGDPMXSJSY-STQMWFEESA-N 0.000 description 2
- WRPDZHJNLYNFFT-UHFFFAOYSA-N Histidinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC1=CN=CN1 WRPDZHJNLYNFFT-UHFFFAOYSA-N 0.000 description 2
- JWBXCSQZLLIOCI-GUBZILKMSA-N Ile-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C JWBXCSQZLLIOCI-GUBZILKMSA-N 0.000 description 2
- 210000003000 Inclusion Bodies Anatomy 0.000 description 2
- 206010022114 Injury Diseases 0.000 description 2
- 108020004391 Introns Proteins 0.000 description 2
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 2
- DVCSNHXRZUVYAM-BQBZGAKWSA-N Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 2
- AZLASBBHHSLQDB-GUBZILKMSA-N Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C AZLASBBHHSLQDB-GUBZILKMSA-N 0.000 description 2
- 241001414823 Lygus hesperus Species 0.000 description 2
- 241000501345 Lygus lineolaris Species 0.000 description 2
- 241000721703 Lymantria dispar Species 0.000 description 2
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 2
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 2
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 2
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 2
- YSZNURNVYFUEHC-BQBZGAKWSA-N Lys-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YSZNURNVYFUEHC-BQBZGAKWSA-N 0.000 description 2
- MYTOTTSMVMWVJN-STQMWFEESA-N Lys-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MYTOTTSMVMWVJN-STQMWFEESA-N 0.000 description 2
- 241000193386 Lysinibacillus sphaericus Species 0.000 description 2
- DZMGFGQBRYWJOR-YUMQZZPRSA-N Met-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O DZMGFGQBRYWJOR-YUMQZZPRSA-N 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 108009000261 Non-homologous end joining Proteins 0.000 description 2
- 241000500437 Plutella xylostella Species 0.000 description 2
- SHAQGFGGJSLLHE-BQBZGAKWSA-N Pro-Gln Chemical compound NC(=O)CC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 SHAQGFGGJSLLHE-BQBZGAKWSA-N 0.000 description 2
- OIDKVWTWGDWMHY-RYUDHWBXSA-N Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 OIDKVWTWGDWMHY-RYUDHWBXSA-N 0.000 description 2
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 2
- 229920000978 Start codon Polymers 0.000 description 2
- YKRQRPFODDJQTC-UHFFFAOYSA-N Threoninyl-Lysine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CCCCN YKRQRPFODDJQTC-UHFFFAOYSA-N 0.000 description 2
- PWIQCLSQVQBOQV-AAEUAGOBSA-N Trp-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 PWIQCLSQVQBOQV-AAEUAGOBSA-N 0.000 description 2
- LYMVXFSTACVOLP-ZFWWWQNUSA-N Trp-Leu Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 LYMVXFSTACVOLP-ZFWWWQNUSA-N 0.000 description 2
- IMMPMHKLUUZKAZ-WMZOPIPTSA-N Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 IMMPMHKLUUZKAZ-WMZOPIPTSA-N 0.000 description 2
- OYOQKMOWUDVWCR-RYUDHWBXSA-N Tyr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OYOQKMOWUDVWCR-RYUDHWBXSA-N 0.000 description 2
- BNQVUHQWZGTIBX-IUCAKERBSA-N Val-His Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CN=CN1 BNQVUHQWZGTIBX-IUCAKERBSA-N 0.000 description 2
- VEYJKJORLPYVLO-RYUDHWBXSA-N Val-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VEYJKJORLPYVLO-RYUDHWBXSA-N 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 235000011655 cotton Nutrition 0.000 description 2
- 239000002385 cottonseed oil Substances 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 239000002158 endotoxin Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing Effects 0.000 description 2
- 231100000502 fertility decrease Toxicity 0.000 description 2
- 230000037406 food intake Effects 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006011 modification reaction Methods 0.000 description 2
- 230000017066 negative regulation of growth Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000035764 nutrition Effects 0.000 description 2
- 239000000123 paper Substances 0.000 description 2
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 2
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 210000004215 spores Anatomy 0.000 description 2
- 239000007921 spray Substances 0.000 description 2
- 235000021012 strawberries Nutrition 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- OPINTGHFESTVAX-UHFFFAOYSA-N γ-glutamyl-Arginine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N OPINTGHFESTVAX-UHFFFAOYSA-N 0.000 description 2
- SIGGQAHUPUBWNF-UHFFFAOYSA-N γ-glutamyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CCC(N)=O SIGGQAHUPUBWNF-UHFFFAOYSA-N 0.000 description 2
- IDKGBVZGNTYYCC-QXEWZRGKSA-N (2S)-1-[(2S)-4-amino-2-[[(2S)-2-amino-3-methylbutanoyl]amino]-4-oxobutanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylsulfanylbutanoyl]amino]propanoyl]amino]butanedioic acid Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N (2S)-2-[[(2S,3R)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N (2S)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]-4-methylpentanoate Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N (2S)-4-amino-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-phenylpropanoyl]amino]-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- BUXAPSQPMALTOY-UHFFFAOYSA-N 2-[(2-amino-3-sulfanylpropanoyl)amino]pentanedioic acid Chemical compound SCC(N)C(=O)NC(C(O)=O)CCC(O)=O BUXAPSQPMALTOY-UHFFFAOYSA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N 2-[[2-[[(2S)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- 101710028559 23 Proteins 0.000 description 1
- 101700001858 ANXA2 Proteins 0.000 description 1
- 102100004600 ANXA2 Human genes 0.000 description 1
- 102100007804 ANXA4 Human genes 0.000 description 1
- 101700019970 ANXA4 Proteins 0.000 description 1
- 241000001996 Agrotis orthogonia Species 0.000 description 1
- 241001652650 Agrotis subterranea Species 0.000 description 1
- 241001259789 Amyelois transitella Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 241001002469 Archips Species 0.000 description 1
- 241001002470 Archips argyrospila Species 0.000 description 1
- 241001423656 Archips rosana Species 0.000 description 1
- QYLJIYOGHRGUIH-CIUDSAMLSA-N Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N QYLJIYOGHRGUIH-CIUDSAMLSA-N 0.000 description 1
- PQBHGSGQZSOLIR-RYUDHWBXSA-N Arg-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PQBHGSGQZSOLIR-RYUDHWBXSA-N 0.000 description 1
- OSASDIVHOSJVII-UHFFFAOYSA-N Arginyl-Cysteine Chemical compound SCC(C(O)=O)NC(=O)C(N)CCCNC(N)=N OSASDIVHOSJVII-UHFFFAOYSA-N 0.000 description 1
- FFMIYIMKQIMDPK-BQBZGAKWSA-N Asn-His Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 FFMIYIMKQIMDPK-BQBZGAKWSA-N 0.000 description 1
- DVUFTQLHHHJEMK-IMJSIDKUSA-N Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O DVUFTQLHHHJEMK-IMJSIDKUSA-N 0.000 description 1
- QJMCHPGWFZZRID-UHFFFAOYSA-N Asparaginyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CC(N)=O QJMCHPGWFZZRID-UHFFFAOYSA-N 0.000 description 1
- ZVDPYSVOZFINEE-UHFFFAOYSA-N Aspartyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(O)=O ZVDPYSVOZFINEE-UHFFFAOYSA-N 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000012905 Brassica oleracea var viridis Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 241000193417 Brevibacillus laterosporus Species 0.000 description 1
- 241000426497 Chilo suppressalis Species 0.000 description 1
- 210000000349 Chromosomes Anatomy 0.000 description 1
- 241000098289 Cnaphalocrocis medinalis Species 0.000 description 1
- 241000720864 Coleophoridae Species 0.000 description 1
- 229920002676 Complementary DNA Polymers 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- ZSRSLWKGWFFVCM-WDSKDSINSA-N Cys-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O ZSRSLWKGWFFVCM-WDSKDSINSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N Cysteinyl-Phenylalanine Chemical compound SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- 210000000172 Cytosol Anatomy 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 241000353522 Earias insulana Species 0.000 description 1
- 241000400698 Elasmopalpus lignosellus Species 0.000 description 1
- 210000000981 Epithelium Anatomy 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 1
- 241001441330 Grapholita molesta Species 0.000 description 1
- 241000256257 Heliothis Species 0.000 description 1
- WSDOHRLQDGAOGU-UHFFFAOYSA-N Histidinyl-Asparagine Chemical compound NC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 WSDOHRLQDGAOGU-UHFFFAOYSA-N 0.000 description 1
- CTCFZNBRZBNKAX-UHFFFAOYSA-N Histidinyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 CTCFZNBRZBNKAX-UHFFFAOYSA-N 0.000 description 1
- 241000630740 Homoeosoma electellum Species 0.000 description 1
- 241000370523 Hypena scabra Species 0.000 description 1
- 101700086738 IORF Proteins 0.000 description 1
- 108090000745 Immune Sera Proteins 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- JAQGKXUEKGKTKX-HOTGVXAUSA-N L-tyrosyl-L-tyrosine Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 JAQGKXUEKGKTKX-HOTGVXAUSA-N 0.000 description 1
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 1
- 241001261104 Lobesia botrana Species 0.000 description 1
- XBZOQGHZGQLEQO-IUCAKERBSA-N Lys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN XBZOQGHZGQLEQO-IUCAKERBSA-N 0.000 description 1
- JPNRPAJITHRXRH-UHFFFAOYSA-N Lysyl-Asparagine Chemical compound NCCCCC(N)C(=O)NC(C(O)=O)CC(N)=O JPNRPAJITHRXRH-UHFFFAOYSA-N 0.000 description 1
- IGRMTQMIDNDFAA-UHFFFAOYSA-N Lysyl-Histidine Chemical compound NCCCCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 IGRMTQMIDNDFAA-UHFFFAOYSA-N 0.000 description 1
- 241000732113 Mamestra configurata Species 0.000 description 1
- JHKXZYLNVJRAAJ-WDSKDSINSA-N Met-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(O)=O JHKXZYLNVJRAAJ-WDSKDSINSA-N 0.000 description 1
- QTZXSYBVOSXBEJ-WDSKDSINSA-N Met-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O QTZXSYBVOSXBEJ-WDSKDSINSA-N 0.000 description 1
- PESQCPHRXOFIPX-RYUDHWBXSA-N Met-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-RYUDHWBXSA-N 0.000 description 1
- 210000003470 Mitochondria Anatomy 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 210000004940 Nucleus Anatomy 0.000 description 1
- 210000003463 Organelles Anatomy 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 101710043203 P23p89 Proteins 0.000 description 1
- 241001310339 Paenibacillus popilliae Species 0.000 description 1
- 241000497111 Paralobesia viteana Species 0.000 description 1
- 210000002824 Peroxisome Anatomy 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- OHUXOEXBXPZKPT-STQMWFEESA-N Phe-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 OHUXOEXBXPZKPT-STQMWFEESA-N 0.000 description 1
- GKZIWHRNKRBEOH-HOTGVXAUSA-N Phe-Phe Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)C1=CC=CC=C1 GKZIWHRNKRBEOH-HOTGVXAUSA-N 0.000 description 1
- JMCOUWKXLXDERB-WMZOPIPTSA-N Phe-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 JMCOUWKXLXDERB-WMZOPIPTSA-N 0.000 description 1
- FSXRLASFHBWESK-HOTGVXAUSA-N Phe-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 FSXRLASFHBWESK-HOTGVXAUSA-N 0.000 description 1
- IEHDJWSAXBGJIP-RYUDHWBXSA-N Phe-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 IEHDJWSAXBGJIP-RYUDHWBXSA-N 0.000 description 1
- 241001525654 Phyllocnistis citrella Species 0.000 description 1
- 241000255969 Pieris brassicae Species 0.000 description 1
- 210000002706 Plastids Anatomy 0.000 description 1
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 1
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 1
- 241000255893 Pyralidae Species 0.000 description 1
- 230000025458 RNA interference Effects 0.000 description 1
- 229920001914 Ribonucleotide Polymers 0.000 description 1
- 101710033747 S6 Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 206010039447 Salmonellosis Diseases 0.000 description 1
- LZLREEUGSYITMX-UHFFFAOYSA-N Serinyl-Tryptophan Chemical compound C1=CC=C2C(CC(NC(=O)C(CO)N)C(O)=O)=CNC2=C1 LZLREEUGSYITMX-UHFFFAOYSA-N 0.000 description 1
- JXOHGGNKMLTUBP-HSUXUTPPSA-N Shikimic acid Chemical compound O[C@@H]1CC(C(O)=O)=C[C@@H](O)[C@H]1O JXOHGGNKMLTUBP-HSUXUTPPSA-N 0.000 description 1
- 241000753145 Sitotroga cerealella Species 0.000 description 1
- 235000019764 Soybean Meal Nutrition 0.000 description 1
- 241000931755 Spodoptera exempta Species 0.000 description 1
- 240000007913 Spondias dulcis Species 0.000 description 1
- 241000098292 Striacosta albicosta Species 0.000 description 1
- 241001575047 Suleima Species 0.000 description 1
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfizole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 1
- 229940094937 Thioredoxin Drugs 0.000 description 1
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 1
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 1
- WXVIGTAUZBUDPZ-DTLFHODZSA-N Thr-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 WXVIGTAUZBUDPZ-DTLFHODZSA-N 0.000 description 1
- 241000255901 Tortricidae Species 0.000 description 1
- 241000255993 Trichoplusia ni Species 0.000 description 1
- PEEAINPHPNDNGE-JQWIXIFHSA-N Trp-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 PEEAINPHPNDNGE-JQWIXIFHSA-N 0.000 description 1
- DZHDVYLBNKMLMB-ZFWWWQNUSA-N Trp-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 DZHDVYLBNKMLMB-ZFWWWQNUSA-N 0.000 description 1
- MYVYPSWUSKCCHG-JQWIXIFHSA-N Trp-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 MYVYPSWUSKCCHG-JQWIXIFHSA-N 0.000 description 1
- 241001389006 Tuta absoluta Species 0.000 description 1
- ZQOOYCZQENFIMC-STQMWFEESA-N Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=C(O)C=C1 ZQOOYCZQENFIMC-STQMWFEESA-N 0.000 description 1
- 210000002845 Virion Anatomy 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K [O-]P([O-])([O-])=O Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 230000002378 acidificating Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive Effects 0.000 description 1
- 230000001058 adult Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 230000011681 asexual reproduction Effects 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 210000004666 bacterial spores Anatomy 0.000 description 1
- 244000037672 biotech crops Species 0.000 description 1
- 235000021152 breakfast Nutrition 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 235000008504 concentrate Nutrition 0.000 description 1
- 235000005687 corn oil Nutrition 0.000 description 1
- 239000002285 corn oil Substances 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drugs Drugs 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000035611 feeding Effects 0.000 description 1
- 230000004634 feeding behavior Effects 0.000 description 1
- 239000003337 fertilizer Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 244000037666 field crops Species 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000021393 food security Nutrition 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 244000037671 genetically modified crops Species 0.000 description 1
- KGNSGRRALVIRGR-UHFFFAOYSA-N gln-tyr Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 KGNSGRRALVIRGR-UHFFFAOYSA-N 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000002363 herbicidal Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 231100000086 high toxicity Toxicity 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 230000002209 hydrophobic Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 235000015110 jellies Nutrition 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 230000000670 limiting Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010043322 lysyl-tryptophyl-alpha-lysine Proteins 0.000 description 1
- 230000007758 mating behavior Effects 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 101710022696 mnl Proteins 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 150000004045 organic chlorine compounds Chemical class 0.000 description 1
- 235000012771 pancakes Nutrition 0.000 description 1
- 239000003090 pesticide formulation Substances 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000001323 posttranslational Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000000750 progressive Effects 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 230000002829 reduced Effects 0.000 description 1
- 230000001172 regenerating Effects 0.000 description 1
- 230000001105 regulatory Effects 0.000 description 1
- 230000001846 repelling Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000014639 sexual reproduction Effects 0.000 description 1
- 231100000486 side effect Toxicity 0.000 description 1
- 239000004460 silage Substances 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 235000013528 soy cheese Nutrition 0.000 description 1
- 235000013322 soy milk Nutrition 0.000 description 1
- 239000004455 soybean meal Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 230000028070 sporulation Effects 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 230000036435 stunted growth Effects 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002195 synergetic Effects 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 102000002933 thioredoxin family Human genes 0.000 description 1
- 108060008226 thioredoxin family Proteins 0.000 description 1
- 230000000699 topical Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional Effects 0.000 description 1
- 230000001052 transient Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 230000003612 virological Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Abstract
Description
[01] Данная заявка заявляет приоритет по предварительной заявке США № 62/406082, поданной 10 октября 2016 года, которая включена в данный документ посредством ссылки в полном объеме. [01] This application claims priority over U.S. Provisional Application No. 62/406082, filed October 10, 2016, which is incorporated herein by reference in its entirety.
ВКЛЮЧЕНИЕ СПИСКА ПОСЛЕДОВАТЕЛЬНОСТИINCLUDING A SEQUENCE LIST
[02] Файл, названный «MONS426WO_ST25.txt», содержащий Перечень последовательностей в машиночитаемом формате, был создан 8 октября 2017 года. Данный файл имеет размер 77030 байт (как измерено в MS-Windows®), одновременно поданный электронно (с использованием системы регистрации EFS-Web в Патентном ведомстве США) и включенный в данный документ посредством ссылки в полном объеме. [02] A file named "MONS426WO_ST25.txt" containing the Sequence Listing in machine-readable format was created on October 8, 2017. This file is 77030 bytes in size (as measured by MS-Windows®), simultaneously filed electronically (using the EFS-Web filing system with the US Patent Office) and incorporated herein by reference in its entirety.
ОБЛАСТЬ ИЗОБРЕТЕНИЯFIELD OF THE INVENTION
[03] Изобретение в целом, как правило, относится к области белков, ингибирующих насекомых. Раскрыт новый класс белков, проявляющих ингибирующую активность в отношении сельскохозяйственных вредителей культурных растений и семян. В частности, раскрытый класс белков обладает инсектицидной активностью в отношении сельскохозяйственных вредителей культурных растений и семян, особенно, чешуекрылых (Lepidopteran) видов насекомых-вредителей. Предлагаются растения, части растений и семена, содержащие рекомбинантную полинуклеотидную конструкцию, кодирующую один или большее количество раскрытых токсичных белков. [03] The invention generally relates to the field of insect-inhibiting proteins. A new class of proteins exhibiting inhibitory activity against agricultural pests of cultivated plants and seeds has been disclosed. In particular, the disclosed class of proteins has insecticidal activity against agricultural pests of cultivated plants and seeds, especially Lepidopteran insect pest species. Plants, plant parts, and seeds are provided that contain a recombinant polynucleotide construct encoding one or more of the disclosed toxic proteins.
УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE INVENTION
[04] Повышение урожайности значимых сельскохозяйственных культур, включая, в частности, кукурузу, сою, сахарный тростник, рис, пшеницу, овощи и хлопок, становится все более важным. В дополнение к растущей потребности в сельскохозяйственной продукции для кормления, одевания и обеспечения энергией растущего населения, прогнозируется, что связанные с климатом эффекты и принуждение со стороны растущего населения использовать земли в целях, отличных от сельскохозяйственных, сократят количество доступных для сельского хозяйства пахотных земель. Данные факторы обуславливают мрачные прогнозы относительно продовольственной безопасности, в частности из-за отсутствия серьезных улучшений в биотехнологии растений и агротехнике. В свете такого давления экологически устойчивые усовершенствования технологий, агротехники, и борьбы с вредителями являются жизненно важными инструментами для расширения производства сельскохозяйственных культур на ограниченном количестве пахотных земель, доступных для ведения сельского хозяйства. [04] Increasing the yield of important crops, including but not limited to corn, soybeans, sugar cane, rice, wheat, vegetables and cotton, is becoming increasingly important. In addition to the growing need for agricultural products to feed, clothe and provide energy for a growing population, climate-related effects and pressure from a growing population to use land for purposes other than agriculture are predicted to reduce the amount of arable land available for agriculture. These factors lead to gloomy forecasts for food security, in particular due to the lack of major improvements in plant biotechnology and farming practices. In light of such pressures, environmentally sustainable improvements in technology, farming practices, and pest management are vital tools for expanding crop production on the limited amount of arable land available for farming.
[05] Насекомые, особенно насекомые отрядов Lepidoptera и Coleoptera, считаются основной причиной повреждения полевых культур, что приводит к снижению урожайности на зараженных участках. Чешуекрылые виды-вредители, которые негативно влияют на сельское хозяйство, включают в себя, но не ограничиваются лишь этими: совка помидорная (Spodoptera exigua), совка хлопковая (Helicoverpa zea), совка хлопковая американская (Alabama argillacea), огневка кукурузная (Ostrinia nubilalis), кукурузная лиственная совка (Spodoptera frugiperda), совка хлопковая (Helicoverpa armigera), Spodoptera litura, Pectinophora gossypiella, Cry1Ac устойчивый Pectinophora gossypiella, Chrysodeixis includens, Spodoptera eridania, Diatraea grandiosella, Earias vittella, Diatraea saccharalis, Heliothis virescens, и Anticarsia gemmatalis. [05] Insects, especially those of the orders Lepidoptera and Coleoptera , are considered the main cause of damage to field crops, resulting in reduced yields in infested areas. Lepidoptera pest species that adversely affect agriculture include, but are not limited to: tomato cutworm ( Spodoptera exigua ), cotton cutworm (Helicoverpa zea), American cotton cutworm (Alabama argillacea), corn moth ( Ostrinia nubilalis ) , Fall Armyworm ( Spodoptera frugiperda ), Cotton bollworm ( Helicoverpa armigera ), Spodoptera litura , Pectinophora gossypiella , Cry1Ac resistant Pectinophora gossypiella , Chrysodeixis includens , Spodoptera eridania , Diatraea grandiosella , Earias vittella , Diatraea saccharalis , Heliothis and Virescenalis .
[06] Исторически сложилось так, что полагались на интенсивное применение синтетических химических инсектицидов, в качестве агента контроля сельскохозяйственных вредителей. Обеспокоенность об окружающей среде и здоровье человека, помимо возникающих проблем устойчивости, стимулировала исследования и разработку биологических пестицидов. Данные исследования привели к прогрессивному открытию и применению различных энтомопатогенных микробных видов, включая бактерии. [06] Historically, heavy use of synthetic chemical insecticides has been relied upon as a pest control agent. Concerns about the environment and human health, in addition to emerging sustainability issues, have spurred the research and development of biological pesticides. These studies have led to the progressive discovery and use of various entomopathogenic microbial species, including bacteria.
[07] Парадигма биологического контроля изменилась, когда потенциал энтомопатогенных бактерий, особенно бактерий, принадлежащих к роду Bacillus, был раскрыт и реализован в качестве биологического агента для борьбы с вредителями. Штаммы бактерии Bacillus thuringiensis (Bt) были использованы в качестве источника пестицидных белков, поскольку было обнаружено, что штаммы Bt проявляют высокую токсичность в отношении конкретных насекомых. Известно, что штаммы Bt продуцируют дельта-эндотоксины, которые локализуются в параспоральных кристаллических тельцах включениях в начале споруляции и во время стационарной фазы роста (например, белки Cry), а также, как известно, продуцируют секретируемый инсектицидный белок. При попадании в организм восприимчивого насекомого, дельта-эндотоксины, как и секретируемые токсины, оказывают свое воздействие на поверхность эпителия тонкого кишечника, разрушая клеточную мембрану, что приводит к разрушению и гибели клетки. Гены, кодирующие инсектицидные белки, также были идентифицированы у видов бактерий, отличных от Bt, включая другие Bacillus и различные дополнительные виды бактерий, такие как Brevibacillus laterosporus, Lysinibacillus sphaericus («Ls» ранее известный как Bacillus sphaericus) и Paenibacillus popilliae. [07] The biological control paradigm changed when the potential of entomopathogenic bacteria, especially bacteria belonging to the genus Bacillus , was discovered and realized as a biological pest control agent. Strains of the bacterium Bacillus thuringiensis (Bt) have been used as a source of pesticidal proteins because Bt strains have been found to exhibit high toxicity to specific insects. Bt strains are known to produce delta-endotoxins that localize to parasporal crystalline inclusion bodies at the onset of sporulation and during the stationary phase of growth (eg, Cry proteins) and are also known to produce a secreted insecticidal protein. When ingested by a susceptible insect, delta-endotoxins, like secreted toxins, exert their effect on the surface of the epithelium of the small intestine, destroying the cell membrane, which leads to cell destruction and death. Genes encoding insecticidal proteins have also been identified in bacterial species other than Bt , including other Bacillus and various additional bacterial species such as Brevibacillus laterosporus, Lysinibacillus sphaericus (" Ls " formerly known as Bacillus sphaericus ), and Paenibacillus popilliae .
[08] Кристаллические и секретируемые растворимые инсектицидные токсины очень специфичны для их организмов-мишеней, и получили всемирное признание в качестве альтернативы химическим инсектицидам. Например, инсектицидные белки-токсины применялись в различных сельскохозяйственных практиках для защиты важных для сельского хозяйства растений от поражения насекомыми, для уменьшения необходимости применения химических пестицидов и увеличения урожайности. Инсектицидные белки-токсины используются для борьбы с сельскохозяйственными вредителями культурных растений с помощью механических способов, таких как распыление для рассеивания микробных препаратов, содержащих различные штаммы бактерий, на поверхности растений, и с помощью методов генетической трансформации для получения трансгенных растений и семян, экспрессирующих инсектицидный белок-токсин. [08] Crystalline and secreted soluble insecticidal toxins are very specific to their target organisms and have gained worldwide acceptance as an alternative to chemical insecticides. For example, insecticidal toxin proteins have been used in various agricultural practices to protect agriculturally important plants from insect attack, to reduce the need for chemical pesticides, and to increase yields. Insecticidal toxin proteins are used to control crop pests by mechanical methods such as spraying to disperse microbial preparations containing various bacterial strains on plant surfaces, and by genetic transformation methods to obtain transgenic plants and seeds expressing the insecticidal protein. -toxin.
[09] Применение трансгенных растений, экспрессирующих инсектицидные белки-токсины, было адаптировано повсеместно. Например, в 2012 году 26,1 млн. Га было засеяно трансгенными культурами, экспрессирующими токсины Bt (James, C., Global Status of Commercialized Biotech/GM Crops: 2012. ISAAA Brief No. 44). Глобальное применение трансгенных культур, защищенных от насекомых, и ограниченное количество инсектицидных белков-токсинов, используемых в данных культурах, создали селекционное давление на существующие аллели насекомых, которые наделяют устойчивостью к используемым в данное время инсектицидным белкам. [09] The use of transgenic plants expressing insecticidal toxin proteins has been universally adopted. For example, in 2012, 26.1 million ha were planted with transgenic crops expressing Bt toxins (James, C., Global Status of Commercialized Biotech/GM Crops: 2012. ISAAA Brief No. 44). The global use of transgenic insect-protected crops and the limited amount of insecticidal toxin proteins used in these crops has created selection pressure on existing insect alleles that confer resistance to currently used insecticidal proteins.
[010] Развитие устойчивости у вредителей-мишеней к инсектицидным белкам-токсинам вызывает постоянную потребность в обнаружении и разработке новых форм инсектицидных белков-токсинов, которые могут применяться для контроля увеличенной устойчивости насекомых к трансгенным культурам, экспрессирующим инсектицидные белки-токсины. Новые беловые токсины с улучшенной эффективностью, которые демонстрируют контроль над более широким спектром восприимчивых видов насекомых, уменьшат количество выживших насекомых, у которых могут возникнуть аллели устойчивости. Кроме того, использование в одном растении двух или большего количества трансгенных инсектицидных белков-токсинов, токсичных для одного и того же насекомого-вредителя и проявляющих разные способы действия, снижает вероятность появления устойчивости у любого отдельного вида насекомого-мишени. [010] The development of resistance in target pests to insecticidal toxin proteins creates a continuing need to discover and develop new forms of insecticidal toxin proteins that can be used to control increased insect resistance to transgenic crops expressing insecticidal toxin proteins. Newer white toxins with improved potency, which show control over a wider range of susceptible insect species, will reduce the number of surviving insects that can develop resistance alleles. In addition, the use in the same plant of two or more transgenic insecticidal toxin proteins that are toxic to the same pest and exhibit different modes of action reduces the likelihood of resistance in any individual target insect species.
[011] Таким образом, авторы изобретения раскрывают в данном документе новое семейство белковых токсинов из Bacillus thuringiensis вместе с похожими токсичными белками, вариантами белков и иллюстративными рекомбинантными белками, которые проявляют инсектицидную активность в отношение чешуекрылых видов-мишеней, в частности, против совки помидорной (Spodoptera exigua), Helicoverpa zea, совки хлопковой американской (Alabama argillacea), огневки кукурузной (Ostrinia nubilalis), кукурузной лиственной совки (Spodoptera frugiperda), совки хлопковой (Helicoverpa armigera), Spodoptera litura, Pectinophora gossypiella, Cry1Ac устойчивого Pectinophora gossypiella, Chrysodeixis includens, Spodoptera eridania, Diatraea grandiosella, Earias vittella, Diatraea saccharalis, Heliothis virescens, и Anticarsia gemmatalis. [011] Thus, the inventors disclose herein a new family of protein toxins from Bacillus thuringiensis , together with similar toxic proteins, protein variants, and illustrative recombinant proteins, that exhibit insecticidal activity against target Lepidoptera species, in particular against the tomato armyworm ( Spodoptera exigua ), Helicoverpa zea , American cotton bollworm (Alabama argillacea ), Corn moth ( Ostrinia nubilalis ), Fall armyworm ( Spodoptera frugiperda ), Cotton bollworm ( Helicoverpa armigera ), Spodoptera litura , Pectinophora gossypiella , Cry1Ac resistant Pectinophora gossypiella , Chrysodeixis includens , Spodoptera eridania , Diatraea grandiosella , Earias vittella , Diatraea saccharalis , Heliothis virescens , and Anticarsia gemmatalis .
СУЩНОСТЬ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION
[012] В данном документе раскрыта новая группа пестицидных белков с ингибирующей активностью в отношении насекомых (токсичных белков), обозначенных в данном документе как TIC4472, TIC1425 и TIC2613, принадлежащих к классу белковых токсинов TIC4472, которые, как показано, проявляют ингибирующую активность в отношении одного или большего количества вредителей культурных растения. Белок TIC4472 и белки в классе TIC4472 белковых токсинов могут быть использованы отдельно или в комбинации с другими инсектицидными белками и токсическими агентами в готовых формах и in planta, тем самым предлагая альтернативы инсектицидным белкам и химическим инсектицидам, которые в данное время применяются в сельскохозяйственных системах. [012] Disclosed herein is a new group of pesticidal proteins with insect inhibitory activity (toxic proteins), referred to herein as TIC4472, TIC1425, and TIC2613, belonging to the TIC4472 protein toxin class, which have been shown to exhibit inhibitory activity against one or more crop pests. The TIC4472 protein and proteins in the TIC4472 class of protein toxins can be used alone or in combination with other insecticidal proteins and toxic agents in formulations and in planta , thereby offering alternatives to the insecticidal proteins and chemical insecticides currently used in agricultural systems.
[013] В одном варианте осуществления, в данной заявке раскрыта рекомбинантная молекула нуклеиновой кислоты, содержащая гетерологичный промоторный фрагмент, функционально связанный с полинуклеотидным сегментом, кодирующим пестицидный белок или его фрагмент, причем (a) указанный пестицидный белок содержит аминокислотную последовательность SEQ ID NO:4, SEQ ID NO:2, или SEQ ID NO:6; или (b) указанный пестицидный белок содержит аминокислотную последовательность, имеющую: (i) по меньшей мере 93%, или 95%, или 98%, или 99%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:4, SEQ ID NO:2, или SEQ ID NO:6; или (ii) по меньшей мере 73%, или 75%, или 80%, или 85%, или 90%, или 95%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:8 или SEQ ID NO:10; или (c) указанный полинуклеотидный сегмент гибридизируется с полинуклеотидом, имеющим нуклеотидную последовательность SEQ ID NO:3, SEQ ID NO:1, SEQ ID NO:5, SEQ ID NO:7, или SEQ ID NO:9; или (d) указанный полинуклеотидный сегмент, кодирующий пестицидный белок или его фрагмент, содержит полинуклеотидную последовательность, имеющую по меньшей мере 65%, или 70%, или 75%, или 80%, или 85%, или 90%, или 95%, или 98%, или 99%, или около 100% идентичности последовательности с нуклеотидной последовательностью SEQ ID NO:3, SEQ ID NO:1, SEQ ID NO:5, SEQ ID NO:7, или SEQ ID NO:9; или (e) указанная рекомбинантная молекула нуклеиновой кислоты находится в функциональной связи с вектором, и указанный вектор выбирают из группы, состоящей из плазмиды, фагмиды, бакмиды, космиды и бактериальной или дрожжевой искусственной хромосомы. Рекомбинантная молекула нуклеиновой кислоты может содержать последовательность, которая функционирует для экспрессии пестицидного белка в растении; или экспрессируется в растительной клетке для продуцирования пестицидно эффективного количества пестицидного белка. [013] In one embodiment, this application discloses a recombinant nucleic acid molecule containing a heterologous promoter fragment operably linked to a polynucleotide segment encoding a pesticidal protein or fragment thereof, wherein (a) said pesticidal protein contains the amino acid sequence of SEQ ID NO:4 , SEQ ID NO:2, or SEQ ID NO:6; or (b) said pesticidal protein contains an amino acid sequence having: (i) at least 93% or 95% or 98% or 99% or about 100% amino acid sequence identity with SEQ ID NO:4, SEQ ID NO:2, or SEQ ID NO:6; or (ii) at least 73% or 75% or 80% or 85% or 90% or 95% or about 100% amino acid sequence identity with SEQ ID NO:8 or SEQ ID NO:10; or (c) said polynucleotide segment hybridizes to a polynucleotide having the nucleotide sequence of SEQ ID NO:3, SEQ ID NO:1, SEQ ID NO:5, SEQ ID NO:7, or SEQ ID NO:9; or (d) said polynucleotide segment encoding the pesticidal protein or fragment thereof contains a polynucleotide sequence having at least 65%, or 70%, or 75%, or 80%, or 85%, or 90%, or 95%, or 98%, or 99%, or about 100% sequence identity with the nucleotide sequence of SEQ ID NO:3, SEQ ID NO:1, SEQ ID NO:5, SEQ ID NO:7, or SEQ ID NO:9; or (e) said recombinant nucleic acid molecule is operably linked to a vector, and said vector is selected from the group consisting of a plasmid, phagemid, bacmid, cosmid, and a bacterial or yeast artificial chromosome. The recombinant nucleic acid molecule may contain a sequence that functions to express the pesticidal protein in the plant; or expressed in a plant cell to produce a pesticidally effective amount of the pesticidal protein.
[014] В другом варианте осуществления данной заявки, предложены клетки-хозяева, содержащие рекомбинантную молекулу нуклеиновой кислоты согласно данной заявке, причем клетку-хозяина выбирают из группы, состоящей из бактериальной и растительной клеток. Рассматриваемые бактериальные клетки-хозяева включают в себя Agrobacterium, Rhizobium, Bacillus, Brevibacillus, Escherichia, Pseudomonas, Klebsiella, Pantoec, и Erwinia. В некоторых вариантах осуществления, указанный вид Bacillus представляет собой Bacillus cereus или Bacillus thuringiensis, указанный Brevibacillus представляет собой Brevibacillus laterosperous, или Escherichia представляет собой Escherichia coli. Рассматриваемые растительные клетки-хозяева включают в себя клетку двудольного растения и клетку однодольного растения. Рассматриваемые растительные клетки дополнительно включают в себя растительную клетку люцерны, банана, ячменя, фасоли, брокколи, капусты, капусты декоративной, моркови, маниоки, клещевины, цветной капусты, сельдерея, нута, китайской капусты, цитрусовых, кокосовой пальмы, кофе, кукурузы, клевера, хлопка (Gossypium sp.), тыквенных, огурца, псевдотсуги Мензиса, баклажана, эвкалипта, лена, чеснока, винограда, хмеля, лука-порея, салата-латука, сосны ладанной, проса, дыни, ореха, овса, оливкового дерева, репчатого лука, декоративных растений, пальмовых, пастбищных трав, гороха, арахиса, перца, голубиного гороха, сосновых, картофеля, тополи, тыквы, сосны лучистой, редьки, рапса, риса, корневищ, ржи, дикого шафрана, кустарниковых, сорго, сосны южной, сои, шпината, тыквенных, клубники, сахарной свеклы, сахарного тростника, подсолнечника, кукурузы сахарной, амбрового дерева, батата, проса прутьевидного, чая, табака, помидора, тритикале, дерновой травы, арбуза и пшеницы. [014] In another embodiment of this application, proposed host cells containing a recombinant nucleic acid molecule according to this application, and the host cell is selected from the group consisting of bacterial and plant cells. Considered bacterial host cells include Agrobacterium, Rhizobium , Bacillus , Brevibacillus , Escherichia , Pseudomonas , Klebsiella , Pantoec , and Erwinia . In some embodiments, said Bacillus species is Bacillus cereus or Bacillus thuringiensis , said Brevibacillus is Brevibacillus laterosperous , or Escherichia is Escherichia coli . Contemplated plant host cells include a dicotyledonous plant cell and a monocotyledonous plant cell. The considered plant cells additionally include the plant cell of alfalfa, banana, barley, bean, broccoli, cabbage, ornamental cabbage, carrot, cassava, castor bean, cauliflower, celery, chickpea, bok choy, citrus, coconut, coffee, corn, clover , cotton ( Gossypium sp.), cucurbits, cucumber, Menzies pseudo-hemlock, eggplant, eucalyptus, flax, garlic, grapes, hops, leek, lettuce, frankincense pine, millet, melon, walnut, oats, olive tree, onion onions, ornamental plants, palm, pasture grasses, peas, peanuts, peppers, pigeon peas, pine, potatoes, poplars, pumpkins, radiata pine, radish, rapeseed, rice, rhizomes, rye, wild saffron, shrubs, sorghum, southern pine, soybeans, spinach, cucurbits, strawberries, sugar beet, sugar cane, sunflower, sweet corn, amberwood, sweet potato, switchgrass, tea, tobacco, tomato, triticale, turfgrass, watermelon and wheat.
[015] В другом варианте осуществления, пестицидный белок проявляет активность против чешуекрылых насекомых, включая совку помидорную (Spodoptera exigua), Helicoverpa zea, совку хлопковую американскую (Alabama argillacea), огневку кукурузную (Ostrinia nubilalis), кукурузную лиственную совку (Spodoptera frugiperda), совку хлопковую (Helicoverpa armigera), Spodoptera litura, Pectinophora gossypiella, Cry1Ac устойчивый Pectinophora gossypiella, Chrysodeixis includens, Spodoptera eridania, Diatraea grandiosella, Earias vittella, Diatraea saccharalis, Heliothis virescens, и Anticarsia gemmatalis. [015] In another embodiment, the pesticidal protein exhibits activity against Lepidoptera insects, including the tomato cutworm ( Spodoptera exigua ), Helicoverpa zea , American cotton cutworm (Alabama argillacea), corn moth ( Ostrinia nubilalis ), corn fall armyworm ( Spodoptera frugiperda ), cotton bollworm ( Helicoverpa armigera ), Spodoptera litura , Pectinophora gossypiella , Cry1Ac resistant Pectinophora gossypiella , Chrysodeixis includens , Spodoptera eridania , Diatraea grandiosella , Earias vittella , Diatraea saccharalis , Heliothis virescens , and Anticarsia gemmatalis .
[016] В данной заявке также рассматриваются растения, содержащие рекомбинантную молекулу нуклеиновой кислоты, содержащую гетерологичный промоторный фрагмент, функционально связанный с полинуклеотидным сегментом, кодирующим пестицидный белок или его фрагмент, причем: (a) указанный пестицидный белок содержит аминокислотную последовательность SEQ ID NO:4, SEQ ID NO:2, или SEQ ID NO:6; или (b) указанный пестицидный белок содержит аминокислотную последовательность, имеющую: (i) по меньшей мере 93%, или 95%, или 98%, или 99%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:4, SEQ ID NO:2, или SEQ ID NO:6; или (ii) по меньшей мере 73%, или 75%, или 80%, или 85%, или 90%, или 95%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:8 или SEQ ID NO:10; или (c) указанный полинуклеотидный сегмент гибридизируется в жестких условиях гибридизации с комлементарной нуклеотидной последовательностью SEQ ID NO:3 или SEQ ID NO:9; или (d) указанное растение демонстрирует определенное количество указанного пестицидного белка. В некоторых вариантах осуществления, пестицидный белок содержит SEQ ID NO:4, SEQ ID NO:2, SEQ ID NO:6, SEQ ID NO:8, или SEQ ID NO:10. В одном варианте осуществления, растение представляет собой либо двудольное растение, либо однодольное растение. В другом варианте осуществления, растение дополнительно выбирают из группы, состоящей из: люцерны, банана, ячменя, фасоли, брокколи, капусты, капусты декоративной, моркови, маниоки, клещевины, цветной капусты, сельдерея, нута, китайской капусты, цитрусовых, кокосовой пальмы, кофе, кукурузы, клевера, хлопка (Gossypium sp.), тыквенных, огурца, псевдотсуги Мензиса, баклажана, эвкалипта, лена, чеснока, винограда, хмеля, лука-порея, салата-латука, сосны ладанной, проса, дыни, ореха, овса, оливкового дерева, репчатого лука, декоративных растений, пальмовых, пастбищных трав, гороха, арахиса, перца, голубиного гороха, сосновых, картофеля, тополи, тыквы, сосны лучистой, редьки, рапса, риса, корневищ, ржи, дикого шафрана, кустарниковых, сорго, сосны южной, сои, шпината, тыквенных, клубники, сахарной свеклы, сахарного тростника, подсолнечника, кукурузы сахарной, амбрового дерева, батата, проса прутьевидного, чая, табака, помидора, тритикале, дерновой травы, арбуза и пшеницы. [016] This application also contemplates plants containing a recombinant nucleic acid molecule containing a heterologous promoter fragment operably linked to a polynucleotide segment encoding a pesticidal protein or fragment thereof, wherein: (a) said pesticidal protein contains the amino acid sequence of SEQ ID NO:4 , SEQ ID NO:2, or SEQ ID NO:6; or (b) said pesticidal protein contains an amino acid sequence having: (i) at least 93% or 95% or 98% or 99% or about 100% amino acid sequence identity with SEQ ID NO:4, SEQ ID NO:2, or SEQ ID NO:6; or (ii) at least 73% or 75% or 80% or 85% or 90% or 95% or about 100% amino acid sequence identity with SEQ ID NO:8 or SEQ ID NO:10; or (c) said polynucleotide segment hybridizes under stringent hybridization conditions to a complementary nucleotide sequence of SEQ ID NO:3 or SEQ ID NO:9; or (d) said plant exhibits a certain amount of said pesticidal protein. In some embodiments, the pesticidal protein comprises SEQ ID NO:4, SEQ ID NO:2, SEQ ID NO:6, SEQ ID NO:8, or SEQ ID NO:10. In one embodiment, the plant is either a dicot plant or a monocot plant. In another embodiment, the plant is further selected from the group consisting of: alfalfa, banana, barley, bean, broccoli, cabbage, kale, carrot, cassava, castor bean, cauliflower, celery, chickpea, bok choy, citrus, coconut palm, coffee, corn, clover, cotton (Gossypium sp.), cucurbits, cucumber, Menzies pseudo-hemzies, eggplant, eucalyptus, flax, garlic, grapes, hops, leeks, lettuce, frankincense pine, millet, melon, walnut, oats , olive tree, onion, ornamental plants, palm, pasture grasses, peas, peanuts, peppers, pigeon peas, pine, potatoes, poplars, pumpkins, pine radish, radish, rapeseed, rice, rhizomes, rye, wild saffron, shrubs, sorghum, southern pine, soybean, spinach, cucurbits, strawberry, sugar beet, sugar cane, sunflower, sweet corn, amberwood, sweet potato, switchgrass, tea, tobacco, tomato, triticale, turfgrass, watermelon and wheat.
[017] В дополнительных вариантах осуществления, раскрыты семена, содержащие рекомбинантные молекулы нуклеиновых кислот. [017] In additional embodiments, seeds containing recombinant nucleic acid molecules are disclosed.
[018] В другом варианте осуществления, рассматривается ингибирующая насекомых композиция, содержащая рекомбинантные молекулы нуклеиновых кислот, раскрытые в данной заявке. Ингибирующая насекомых композиция может дополнительно содержать нуклеотидную последовательность, кодирующую, по меньшей мере, один другой пестицидный агент, который отличается от указанного пестицидного белка. В некоторых вариантах осуществления, по меньшей мере, один другой пестицидный агент выбирают из группы, состоящей из ингибирующего насекомых белка, ингибирующей насекомых дцРНК молекулы, и вспомогательного белка. Также предполагается, что, по меньшей мере, один другой пестицидный агент в ингибирующей насекомых композиции, проявляет активность против одного или большего количества видов вредителей отрядов Lepidoptera, Coleoptera или Hemiptera. По меньшей мере, один другой пестицидный агент в композиции для ингибирования насекомых в одном варианте осуществления выбирают из группы, состоящей из белка Cry1A, Cry1Ab, Cry1Ac, Cry1A.105, Cry1Ae, Cry1B, Cry1C, вариантов Cry1C, Cry1D, Cry1E, Cry1F, химер Cry1A/F, Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry2A, Cry2Ab, Cry2Ae, Cry3, вариантов Cry3A, Cry3B, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry34, Cry35, Cry43A, Cry43B, Cry51Aa1, ET29, ET33, ET34, ET35, ET66, ET70, TIC400, TIC407, TIC417, TIC431, TIC800, TIC807, TIC834, TIC853, TIC900, TIC901, TIC1201, TIC1415, TIC2160, TIC3131, TIC836, TIC860, TIC867, TIC869, TIC1100, VIP3A, VIP3B, VIP3Ab, AXMI-AXMI-, AXMI-88, AXMI-97, AXMI-102, AXMI-112, AXMI-117, AXMI-100, AXMI-115, AXMI-113, и AXMI-005, AXMI134, AXMI-150, AXMI-171, AXMI-184, AXMI-196, AXMI-204, AXMI-207, AXMI-209, AXMI-205, AXMI-218, AXMI-220, AXMI-221z, AXMI-222z, AXMI-223z, AXMI-224z и AXMI-225z, AXMI-238, AXMI-270, AXMI-279, AXMI-345, AXMI-335, AXMI-R1 и его вариантов, IP3 и его вариантов, DIG-3, DIG-5, DIG-10, DIG-657 и DIG-11. [018] In another embodiment, an insect-inhibiting composition is contemplated comprising the recombinant nucleic acid molecules disclosed herein. The insect-inhibiting composition may further comprise a nucleotide sequence encoding at least one other pesticidal agent that is different from said pesticidal protein. In some embodiments, the at least one other pesticidal agent is selected from the group consisting of an insect-inhibiting protein, an insect-inhibiting dsRNA molecule, and an accessory protein. It is also contemplated that at least one other pesticidal agent in the insect-inhibiting composition is active against one or more pest species of the orders Lepidoptera , Coleoptera , or Hemiptera . At least one other pesticidal agent in the insect control composition in one embodiment is selected from the group consisting of Cry1A protein, Cry1Ab, Cry1Ac, Cry1A.105, Cry1Ae, Cry1B, Cry1C, Cry1C variants, Cry1D, Cry1E, Cry1F, chimeras Cry1A/F, Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry2A, Cry2Ab, Cry2Ae, Cry3, Cry3A, Cry3B, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry34, Cry35, Cry43A, Cry43B, Cry51Aa1 variants , ET29, ET33, ET34, ET35, ET66, ET70, TIC400, TIC407, TIC417, TIC431, TIC800, TIC807, TIC834, TIC853, TIC900, TIC901, TIC1201, TIC1415, TIC2160, TIC3131, TIC836, TIC860, TIC867, TIC869, TIC1100 , VIP3A, VIP3B, VIP3Ab, AXMI-AXMI-, AXMI-88, AXMI-97, AXMI-102, AXMI-112, AXMI-117, AXMI-100, AXMI-115, AXMI-113, and AXMI-005, AXMI134 , AXMI-150, AXMI-171, AXMI-184, AXMI-196, AXMI-204, AXMI-207, AXMI-209, AXMI-205, AXMI-218, AXMI-220, AXMI-221z, AXMI-222z -223z, AXMI-224z and AXMI-225z, AXMI-238, AXMI-270, AXMI-279, AXMI-345, AXMI-335, AXMI-R1 and variants, IP3 and its variants, DIG-3, DIG-5, DIG-10, DIG-657 and DIG-11.
[019] Также рассматриваются товарные продукты, содержащие определяемое количество рекомбинантных молекул нуклеиновых кислот, раскрытых в данной заявке. Такие товарные продукты включают в себя товарную кукурузу, упакованную устройством обработки зерна, кукурузные хлопья, кукурузные блинчики, кукурузную муку мелкого помола, кукурузную муку грубого помола, кукурузный сироп, кукурузное масло, кукурузный силос, кукурузный крахмал, кукурузные завтраки и тому подобное, а также аналогичные сою, рис, пшеницу, сорго, голубиный горох, арахис, фрукты, дыню, и овощные товарные продукты, включая, когда это применимо, соки, концентраты, джемы, желе, мармелад и другие съедобные формы таких товарных продуктов, содержащие обнаруживаемое количество таких полинуклеотидов и/или полипептидов согласно данной заявки, цельные или обработанные семена хлопка, хлопковое масло, пух, семена и части растения, переработанные для корма или пищи, волокна, бумаги, биомассы и топливных продуктов, таких как топливо, полученное из хлопкового масла или пеллет, полученных из отходов хлопкоочистительной машины, цельные или обработанные семена сои, соевое масло, соевый белок, соевый жмых, соевую муку, соевые хлопья, соевые отруби, соевое молоко, соевый сыр, соевое вино, содержащий сою корм для животных, содержащую сою бумагу, содержащий сою крем, соевую биомасса, и топливные продукты, произведенные с использованием растений сои и частей растений сои. [019] Commercial products containing a detectable amount of the recombinant nucleic acid molecules disclosed in this application are also contemplated. Such marketable products include market corn packaged in a grain processor, corn flakes, corn pancakes, fine corn meal, corn meal, corn syrup, corn oil, corn silage, corn starch, breakfast corn, and the like, as well as similar soy, rice, wheat, sorghum, pigeon peas, peanuts, fruits, melons, and vegetable commercial products, including, where applicable, juices, concentrates, jams, jellies, marmalades and other edible forms of such commercial products containing a detectable amount of such polynucleotides and/or polypeptides according to this application, whole or processed cotton seeds, cottonseed oil, fluff, seeds and plant parts processed for feed or food, fiber, paper, biomass and fuel products such as fuel derived from cottonseed oil or pellets from cotton gin waste, whole or processed soybean seeds, soybean oil, soy protein, soybean meal, soy flour, soy flakes, soy bran, soy milk, soy cheese, soy wine, soy-containing animal feed, soy-containing paper, soy-containing cream, soy biomass, and fuel products produced using soy plants and plant parts soybeans.
[020] В данной заявке также рассматриваются способы получения семян, содержащих рекомбинантные молекулы нуклеиновых кислот, раскрытых в данной заявке. Способ включает в себя посадку по меньшей мере одного семени, содержащего рекомбинантные молекулы нуклеиновых кислот, раскрытые в данной заявке; выращивание растения из семени; и сбор семян растений, причем собранные семена содержат рекомбинантные молекулы нуклеиновых кислот согласно данной заявке. [020] This application also discusses methods for obtaining seeds containing recombinant nucleic acid molecules disclosed in this application. The method includes planting at least one seed containing the recombinant nucleic acid molecules disclosed in this application; growing a plant from a seed; and harvesting plant seeds, wherein the harvested seeds contain the recombinant nucleic acid molecules of this application.
[021] В другом иллюстративном варианте осуществления, предложено растение, устойчивое к поражению насекомыми, причем клетки указанного растения содержат: (a) рекомбинантную молекулу нуклеиновой кислоты, кодирующую инсектицидно эффективное количество пестицидного белка, как указано в SEQ ID NO:4, SEQ ID NO:2, или SEQ ID NO:6; или (b) инсектицидно эффективное количество белка, содержащего аминокислотную последовательность, имеющую: (i) по меньшей мере 93%, или 95%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:4, SEQ ID NO:2, или SEQ ID NO:6; или (ii) по меньшей мере 73%, или 75%, или 80%, или 85%, или 90%, или 95%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:8 или SEQ ID NO:10. [021] In another exemplary embodiment, a plant is provided that is resistant to insect attack, wherein said plant cells comprise: (a) a recombinant nucleic acid molecule encoding an insecticidally effective amount of a pesticidal protein as set forth in SEQ ID NO:4, SEQ ID NO :2, or SEQ ID NO:6; or (b) an insecticidally effective amount of a protein comprising an amino acid sequence having: (i) at least 93%, or 95%, or about 100% amino acid sequence identity with SEQ ID NO:4, SEQ ID NO:2, or SEQ ID NO:6; or (ii) at least 73% or 75% or 80% or 85% or 90% or 95% or about 100% amino acid sequence identity with SEQ ID NO:8 or SEQ ID NO:10.
[022] В данной заявке также раскрыты способы борьбы с чешуекрылыми видами-вредителями и борьбы с поражением растений чешуекрылыми видами-вредителями, в частности, культурных растений. Способ включает в себя, в одном варианте осуществления, (a) приведение в контакт вредителя с инсектицидно эффективным количеством пестицидных белков, представленных в SEQ ID NO:4, SEQ ID NO:2, или SEQ ID NO:6; или (b) приведение в контакт вредителя с инсектицидно эффективным количеством одного или большего количества пестицидных белков, содержащих аминокислотную последовательность, имеющую: (i) по меньшей мере 93%, или 95%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:4, SEQ ID NO:2, или SEQ ID NO:6; или (ii) по меньшей мере 73%, или 75%, или 80%, или 85%, или 90%, или 95%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:8 или SEQ ID NO:10. [022] This application also discloses methods for controlling lepidoptera pest species and controlling plant damage by lepidopteran pest species, in particular, cultivated plants. The method includes, in one embodiment, (a) contacting the pest with an insecticidally effective amount of the pesticidal proteins set forth in SEQ ID NO:4, SEQ ID NO:2, or SEQ ID NO:6; or (b) contacting the pest with an insecticidally effective amount of one or more pesticidal proteins comprising an amino acid sequence having: (i) at least 93% or 95% or about 100% amino acid sequence identity with SEQ ID NO: 4, SEQ ID NO:2, or SEQ ID NO:6; or (ii) at least 73% or 75% or 80% or 85% or 90% or 95% or about 100% amino acid sequence identity with SEQ ID NO:8 or SEQ ID NO:10.
[023] Дополнительно в данном документе предложен способ обнаружения присутствия рекомбинантной молекулы нуклеиновой кислоты, содержащей полинуклеотидный сегмент, кодирующий пестицидный белок или его фрагмент, причем: (a) указанный пестицидный белок содержит аминокислотную последовательность SEQ ID NO:4, SEQ ID NO:2, или SEQ ID NO:6; или (b) указанный пестицидный белок содержит аминокислотную последовательность, имеющую: (i) по меньшей мере 93%, или 95%, или 98%, или 99%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:4, SEQ ID NO:2, или SEQ ID NO:6; или (ii) по меньшей мере 73%, или 75%, или 80%, или 85%, или 90%, или 95%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:8 или SEQ ID NO:10; или (c) указанный полинуклеотидный сегмент гибридизируется с полинуклеотидом, имеющим нуклеотидную последовательность SEQ ID NO:4, SEQ ID NO:2, SEQ ID NO:6, SEQ ID NO:8, или SEQ ID NO:10. В одном варианте осуществления изобретения, способ включает в себя приведение в контакт образца нуклеиновых кислот с нуклеотидным зондом, который гибридизуется в жестких условиях гибридизации с геномной ДНК из растения, содержащего полинуклеотидный сегмент, кодирующий пестицидный белок или его фрагмент, предложенный в данном документе, и не гибридизируется в таких условиях гибридизации с геномной ДНК из другого изогенного растения, которое не содержит сегмент, при этом зонд гомологичен или комплементарен SEQ ID NO:3 или SEQ ID NO:9, или последовательности, которая кодирует пестицидный белок, содержащий аминокислотную последовательность, имеющую: (a) по меньшей мере 93%, или 95%, или 98%, или 99%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:4, SEQ ID NO:2, или SEQ ID NO:6; или (b) по меньшей мере 73%, или 75%, или 80%, или 85%, или 90%, или 95%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:8 или SEQ ID NO:10. Способ может дополнительно включать в себя (а) подвержение образца и зонда строгим условиям гибридизации; и (б) обнаружение гибридизации зонда с ДНК образца. [023] Additionally, this document provides a method for detecting the presence of a recombinant nucleic acid molecule containing a polynucleotide segment encoding a pesticidal protein or a fragment thereof, wherein: (a) said pesticidal protein comprises the amino acid sequence of SEQ ID NO:4, SEQ ID NO:2, or SEQ ID NO:6; or (b) said pesticidal protein contains an amino acid sequence having: (i) at least 93% or 95% or 98% or 99% or about 100% amino acid sequence identity with SEQ ID NO:4, SEQ ID NO:2, or SEQ ID NO:6; or (ii) at least 73% or 75% or 80% or 85% or 90% or 95% or about 100% amino acid sequence identity with SEQ ID NO:8 or SEQ ID NO:10; or (c) said polynucleotide segment hybridizes to a polynucleotide having the nucleotide sequence of SEQ ID NO:4, SEQ ID NO:2, SEQ ID NO:6, SEQ ID NO:8, or SEQ ID NO:10. In one embodiment of the invention, the method includes contacting a nucleic acid sample with a nucleotide probe that hybridizes under stringent hybridization conditions to genomic DNA from a plant containing a polynucleotide segment encoding a pesticidal protein or fragment thereof as provided herein, and not hybridizes under such hybridization conditions with genomic DNA from another isogenic plant that does not contain a segment, while the probe is homologous or complementary to SEQ ID NO:3 or SEQ ID NO:9, or a sequence that encodes a pesticidal protein containing an amino acid sequence having: (a) at least 93% or 95% or 98% or 99% or about 100% amino acid sequence identity with SEQ ID NO:4, SEQ ID NO:2, or SEQ ID NO:6; or (b) at least 73% or 75% or 80% or 85% or 90% or 95% or about 100% amino acid sequence identity with SEQ ID NO:8 or SEQ ID NO:10. The method may further include (a) subjecting the sample and probe to stringent hybridization conditions; and (b) detecting hybridization of the probe with sample DNA.
[024] Согласно изобретению также предложены способы обнаружения присутствия пестицидного белка или его фрагмента в образце, содержащем белок, причем указанный пестицидный белок содержит аминокислотную последовательность SEQ ID NO:4, SEQ ID NO:2, SEQ ID NO:6, SEQ ID NO:8, или SEQ ID NO:10; или указанный пестицидный белок содержит аминокислотную последовательность, имеющую: (a) по меньшей мере 93%, или 95%, или 98%, или 99%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:4, SEQ ID NO:2, или SEQ ID NO:6; или (b) по меньшей мере 73%, или 75%, или 80%, или 85%, или 90%, или 95%, или около 100% идентичности аминокислотной последовательности с SEQ ID NO:8 или SEQ ID NO:10. В одном варианте осуществления, способ включает в себя: (а) приведение в контакт образца с иммунореактивным антителом; и (б) обнаружение присутствия белка. В некоторых вариантах осуществления, этап обнаружения включает в себя ИФА или вестерн-блоттинг. [024] The invention also provides methods for detecting the presence of a pesticidal protein or a fragment thereof in a sample containing a protein, said pesticidal protein comprising the amino acid sequence of SEQ ID NO:4, SEQ ID NO:2, SEQ ID NO:6, SEQ ID NO: 8, or SEQ ID NO:10; or said pesticidal protein contains an amino acid sequence having: (a) at least 93% or 95% or 98% or 99% or about 100% amino acid sequence identity with SEQ ID NO:4, SEQ ID NO:2 , or SEQ ID NO:6; or (b) at least 73% or 75% or 80% or 85% or 90% or 95% or about 100% amino acid sequence identity with SEQ ID NO:8 or SEQ ID NO:10. In one embodiment, the method includes: (a) contacting the sample with an immunoreactive antibody; and (b) detecting the presence of the protein. In some embodiments, the detection step includes an ELISA or a Western blot.
КРАТКОЕ ОПИСАНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙBRIEF DESCRIPTION OF SEQUENCES
[025] SEQ ID NO:1 представляет собой последовательность нуклеиновой кислоты, кодирующую пестицидный белок TIC4472, полученный из вида Bacillus thuringiensis EG10742. [025] SEQ ID NO:1 is a nucleic acid sequence encoding the pesticide protein TIC4472 derived from the species Bacillus thuringiensis EG10742.
[026] SEQ ID NO:2 представляет собой аминокислотную последовательность пестицидного белка TIC4472. [026] SEQ ID NO:2 is the amino acid sequence of the pesticide protein TIC4472.
[027] SEQ ID NO:3 представляет собой синтетическую кодирующую последовательность, кодирующую пестицидный белок TIC4472PL, предназначенную для экспрессии в растительной клетке, причем дополнительный кодон аланина вставляют сразу после стартового кодона метионина. [027] SEQ ID NO:3 is a synthetic coding sequence encoding the pesticidal TIC4472PL protein for plant cell expression, with an additional alanine codon inserted immediately after the methionine start codon.
[028] SEQ ID NO:4 представляет собой аминокислотную последовательность TIC4472PL, кодируемую синтетической кодирующей последовательностью, предназначенной для экспрессии в растительной клетке (SEQ ID NO:3), и при этом дополнительную аминокислоту аланина вставляют сразу же после стартового метионина. [028] SEQ ID NO:4 is the amino acid sequence of TIC4472PL encoded by the synthetic coding sequence for plant cell expression (SEQ ID NO:3), with an additional alanine amino acid inserted immediately after the start methionine.
[029] SEQ ID NO:5 представляет собой последовательность нуклеиновой кислоты, кодирующую пестицидный белок TIC1425, полученный из вида Bacillus thuringiensis EG10731. [029] SEQ ID NO:5 is a nucleic acid sequence encoding the pesticide protein TIC1425 derived from the species Bacillus thuringiensis EG10731.
[030] SEQ ID NO:6 представляет собой аминокислотную последовательность пестицидного белка TIC1425. [030] SEQ ID NO:6 is the amino acid sequence of the TIC1425 pesticide protein.
[031] SEQ ID NO:7 представляет собой последовательность нуклеиновой кислоты, кодирующую пестицидный белок TIC2613, полученный из вида Bacillus thuringiensis EG5408. [031] SEQ ID NO:7 is a nucleic acid sequence encoding the pesticide protein TIC2613 derived from the species Bacillus thuringiensis EG5408.
[032] SEQ ID NO:8 представляет собой аминокислотную последовательность пестицидного белка TIC2613. [032] SEQ ID NO:8 is the amino acid sequence of the pesticide protein TIC2613.
[033] SEQ ID NO:9 представляет собой синтетическую кодирующую последовательность, кодирующую пестицидный белок TIC2613PL, предназначенную для экспрессии в растительной клетке, причем дополнительный кодон аланина вставляют сразу после стартового кодона метионина. [033] SEQ ID NO:9 is a synthetic coding sequence encoding the pesticidal TIC2613PL protein for plant cell expression, with an additional alanine codon inserted immediately after the methionine start codon.
[034] SEQ ID NO:10 представляет собой аминокислотную последовательность TIC2613PL, кодируемую синтетической кодирующей последовательностью, предназначенной для экспрессии в растительной клетке (SEQ ID NO:9), и при этом дополнительную аминокислоту аланина вставляют сразу после стартового метионина. [034] SEQ ID NO:10 is the amino acid sequence of TIC2613PL encoded by the synthetic coding sequence for plant cell expression (SEQ ID NO:9), with an additional alanine amino acid inserted immediately after the starter methionine.
ПОДРОБНОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION
[035] Проблема области борьбы с сельскохозяйственными вредителями может быть охарактеризована как необходимость в новых белках-токсинах, которые эффективны против вредителей-мишеней, проявляют токсичность широкого спектра против видов-вредителей-мишеней, способных экспрессироваться в растениях без возникновения нежелательных агрономических последствий, и обеспечивающие альтернативный способ действия по сравнению с нынешними токсинами, которые коммерчески используются в растениях. [035] A problem in the field of pest control can be characterized as the need for new toxin proteins that are effective against target pests, exhibit broad spectrum toxicity against target pest species that can be expressed in plants without causing undesirable agronomic consequences, and provide an alternative mode of action compared to the current toxins that are commercially used in plants.
[036] Новые пестицидные белки, примерами которых являются TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL, раскрыты в данном документе, и решают каждую из данных проблем, в частности в отношении широкого спектра чешуекрылых насекомых-вредителей, и более конкретно в отношении совки помидорной (Spodoptera exigua), Helicoverpa zea, совки хлопковой американской (Alabama argillacea), огневки кукурузной (Ostrinia nubilalis), кукурузной лиственной совки (Spodoptera frugiperda), совки хлопковой (Helicoverpa armigera), Spodoptera litura, Pectinophora gossypiella, Cry1Ac устойчивого Pectinophora gossypiella, Chrysodeixis includens, Spodoptera eridania, Diatraea grandiosella, Earias vittella, Diatraea saccharalis, Heliothis virescens, и Anticarsia gemmatalis. [036] Novel pesticidal proteins, exemplified by TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL, are disclosed herein and address each of these problems, in particular with respect to a wide range of lepidopteran insect pests, and more specifically with respect to the fall armyworm. ( Spodoptera exigua ), Helicoverpa zea , American cotton bollworm (Alabama argillacea), Corn moth ( Ostrinia nubilalis ), Fall armyworm ( Spodoptera frugiperda ), Cotton bollworm ( Helicoverpa armigera ), Spodoptera litura , Pectinophora gossypiella , Cry1Ac resistant Pectinophora gossypiella , Chrysodeixis includens , Spodoptera eridania , Diatraea grandiosella , Earias vittella , Diatraea saccharalis , Heliothis virescens , and Anticarsia gemmatalis .
[037] Отсылка в данной заявке к TIC4472, «белку TIC4472», «белковому токсину TIC4472», «токсичному белку TIC4472», «пестицидному белку TIC4472», «токсинам, родственным TIC4472», «токсичным белкам, родственным TIC4472», TIC4472PL, «белку TIC4472PL», «белковому токсину TIC4472PL», «токсичному белку TIC4472PL», «пестицидному белку TIC4472PL», «токсинам, родственным TIC4472PL», «токсичным белкам, родственным TIC4472PL», TIC1425, «белку TIC1425», «белковому токсину TIC1425», «токсичному белку TIC1425», «пестицидному белку TIC1425», «токсинам, родственным TIC1425», «токсичным белкам, родственным TIC1425», TIC2613, «белку TIC2613», «белковому токсину TIC2613», «токсичному белку TIC2613», «пестицидному белку TIC2613», «токсинам, родственным TIC2613», «токсичным белкам, родственным TIC2613», TIC2613PL, «белку TIC2613PL», «белковому токсину TIC2613PL», «токсичному белку TIC2613PL», «пестицидному белку TIC2613PL», «токсинам, родственным TIC2613PL», «токсичным белкам, родственным TIC2613PL», и т.п., относиться к любому новому пестицидному белку или ингибирующему насекомых белку, что содержит, состоит из, по существу является гомологом, похожий на, или получен из любой последовательности пестицидного белка или ингибирующего насекомых белка TIC4472 (SEQ ID NO:2), TIC4472PL (SEQ ID NO:4), TIC1425 (SEQ ID NO:6), TIC2613 (SEQ ID NO:8), или TIC2613PL (SEQ ID NO:10) и его пестицидного или ингибирующего насекомых сегмента, или их комбинаций, которые обеспечивают активность в отношение чешуекрылых вредителей, включая любой белок, проявляющий пестицидную или ингибирующую насекомых активность, если выравнивание такого белка с TIC4472, TIC4472PL, или TIC1425 дает в результате идентичность аминокислотной последовательности, составляющую любую процентную долю от около 93% до около 100% процентов; или если выравнивание такого белка с TIC2613 или TIC2613PL дает в результате идентичность аминокислотной последовательности, составляющую любую процентную долю от около 73% до около 100% процентов. Белки TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL включают в себя как нацеленные на пластиды, так и ненацеленные на пластиды формы белков. [037] Reference in this application to TIC4472, "TIC4472 protein", "TIC4472 protein toxin", "TIC4472 toxic protein", "TIC4472 pesticide protein", "TIC4472 related toxins", "TIC4472 related toxic proteins", TIC4472PL, "TIC4472PL protein", "TIC4472PL protein toxin", "TIC4472PL toxic protein", "TIC4472PL pesticide protein", "TIC4472PL related toxins", "TIC4472PL related toxic proteins", TIC1425, "TIC1425 protein", "TIC1425 protein toxin" , "TIC1425 toxic protein", "TIC1425 pesticidal protein", "TIC1425 related toxins", "TIC1425 toxic related proteins", TIC2613, "TIC2613 protein", "TIC2613 protein toxin", "TIC2613 toxic protein", "Pesticide protein TIC2613", "TIC2613 related toxins", "TIC2613 related toxic proteins", TIC2613PL, "TIC2613PL protein", "TIC2613PL protein toxin", "TIC2613PL toxic protein", "TIC2613PL pesticidal protein", "TIC2613PL related toxins", "toxic proteins related to TIC2613PL", etc. ., refer to any novel pesticidal protein or insect inhibitory protein that contains, consists of, is essentially a homolog similar to, or is derived from any pesticidal protein or insect inhibitory protein sequence TIC4472 (SEQ ID NO:2), TIC4472PL (SEQ ID NO:4), TIC1425 (SEQ ID NO:6), TIC2613 (SEQ ID NO:8), or TIC2613PL (SEQ ID NO:10) and its pesticidal or insect-inhibiting segment, or combinations thereof that provide activity against Lepidoptera pests, including any protein exhibiting pesticidal or insect-inhibiting activity, if alignment of such protein with TIC4472, TIC4472PL, or TIC1425 results in an amino acid sequence identity of any percentage from about 93% to about 100% percent; or if alignment of such a protein with TIC2613 or TIC2613PL results in an amino acid sequence identity of any percentage from about 73% to about 100%. The TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL proteins include both plastid-targeted and non-plastid-targeted forms of the proteins.
[038] Термин «сегмент» или «фрагмент» используется в данной заявке для описания непрерывных аминокислотных или нуклеотидных последовательностей, которые короче, чем полная аминокислотная или нуклеотидная последовательность, описывающая белок TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL. В данной заявке также раскрыт сегмент или фрагмент, проявляющий ингибирующую насекомых активность, если выравнивание такого сегмента или фрагмента с соответствующей частью белка TIC4472, представленного в SEQ ID NO:2, белка TIC4472PL, представленного в SEQ ID NO:4, белка TIC1425, представленного в SEQ ID NO:6, дает в результате идентичность аминокислотной последовательности, составляющую любую процентную долю от около 93 до около 100 процентов между сегментом, или фрагментом, и соответствующей частью белка TIC4472, TIC4472PL или TIC1425; или если выравнивание такого сегмента или фрагмента с соответствующей частью TIC2613, представленного в SEQ ID NO:8, или белка TIC2613PL, представленного в SEQ ID NO:10, дает в результате идентичность аминокислотной последовательности, составляющую любую процентную долю от около 73 до около 100 процентов между сегментом, или фрагментом, и соответствующей частью белка TIC2613 или TIC2613PL. [038] The term "segment" or "fragment" is used in this application to describe continuous amino acid or nucleotide sequences that are shorter than the full amino acid or nucleotide sequence describing the TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein. This application also discloses a segment or fragment exhibiting insect-inhibiting activity if the alignment of such segment or fragment with the corresponding part of the TIC4472 protein shown in SEQ ID NO:2, the TIC4472PL protein shown in SEQ ID NO:4, the TIC1425 protein shown in SEQ ID NO:6, results in an amino acid sequence identity of any percentage from about 93 to about 100 percent between the segment or fragment and the corresponding portion of the TIC4472, TIC4472PL, or TIC1425 protein; or if alignment of such a segment or fragment with the corresponding portion of TIC2613 as set forth in SEQ ID NO:8 or the TIC2613PL protein as set forth in SEQ ID NO:10 results in an amino acid sequence identity of any percentage from about 73 to about 100 percent between a segment, or fragment, and the corresponding part of the TIC2613 or TIC2613PL protein.
[039] В еще дополнительных конкретных вариантах осуществления, фрагмент белка TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL может быть определен как проявляющий пестицидную активность, которой обладает исходная молекула белка, из которой он получен. Фрагмент последовательности нуклеиновой кислоты, кодирующей белок TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, может быть определен как кодирующий белок, проявляющий пестицидную активность, которой обладает молекула белка, кодируемая исходной нуклеотидной последовательностью, из которой он получен. Описанный в данном документе фрагмент или вариант может дополнительно содержать идентифицированный в данном документе домен, который отвечает за пестицидную активность белка. [039] In yet further specific embodiments, a TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein fragment can be determined to exhibit the pesticidal activity of the original protein molecule from which it is derived. A fragment of a nucleic acid sequence encoding a TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein can be defined as encoding a protein that exhibits pesticidal activity possessed by the protein molecule encoded by the original nucleotide sequence from which it is derived. The fragment or variant described herein may further comprise the domain identified herein that is responsible for the pesticidal activity of the protein.
[040] В конкретных вариантах осуществления, предложены фрагменты белка TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, содержащие по меньшей мере около 50, по меньшей мере около 75, по меньшей мере около 95, по меньшей мере около 100, по меньшей мере около 125, по меньшей мере около 150, по меньшей мере около 175, по меньшей мере около 200, по меньшей мере около 225, по меньшей мере около 250, по меньшей мере около 275, по меньшей мере около 300, по меньшей мере около 500, по меньшей мере около 600, по меньшей мере около 700, по меньшей мере около 750, по меньшей мере около 800, по меньшей мере около 900, по меньшей мере около 1000, по меньшей мере около 1100, по меньшей мере около 1150, или по меньшей мере около 1175 подряд аминокислот, или больше, белка TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, обладающего пестицидной активностью, как описано в данном документе. В некоторых вариантах осуществления, согласно данному изобретению предложены фрагменты любой из SEQ ID NO:2, 4, 6, 8 или 10, обладающие активностью полноразмерной последовательности. Способы получения таких фрагментов из исходной молекулы хорошо известны в данной области техники. [040] In specific embodiments, provided are TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein fragments containing at least about 50, at least about 75, at least about 95, at least about 100, at least about 125, at least about 150, at least about 175, at least about 200, at least about 225, at least about 250, at least about 275, at least about 300, at least about 500, at least about 600, at least about 700, at least about 750, at least about 800, at least about 900, at least about 1000, at least about 1100, at least about 1150, or at least about 1175 consecutive amino acids, or more, of a TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein having pesticidal activity as described herein. In some embodiments, the present invention provides fragments of any of SEQ ID NOs: 2, 4, 6, 8, or 10 having full-length sequence activity. Methods for obtaining such fragments from the original molecule are well known in the art.
[041] Отсылка в данной заявке к терминам «активный» или «активность», «пестицидная активность» или «пестицидный» или «инсектицидная активность», «ингибирующая насекомых» или «инсектицидный» относятся к эффективности токсичного агента, такого как белковый токсин, в отношении ингибирования (ингибирования роста, питания, плодовитости или жизнеспособности), подавления (подавления роста, питания, плодовитости или жизнеспособности), контроля (контроль поражения вредителями, контроля пищевых активностей вредителя на конкретной культуре, содержащей эффективное количество белка TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL) или уничтожения (вызывая патологии, смертность или снижение плодовитости) вредителя. Предполагается, что данные термины включают в себя результат воздействия пестицидно эффективного количества токсичного белка на вредителя, когда воздействие токсичного белка на вредителя приводит к поражению, смертности, снижению плодовитости или остановке роста. Данные термины также включают в себя отпугивание вредителя от растения, ткани растения, части растения, семян, клеток растения или от конкретного географического местоположения, где может произрастать растение, в результате доставки пестицидно эффективного количества токсичного белка в растение или на растении. В целом, как правило, пестицидная активность относится к способности токсичного белка быть эффективным в отношении ингибирования роста, развития, жизнеспособности, пищевого поведения, поведения при спаривании, плодовитости, или любого измеримого уменьшения побочных эффектов, вызываемых поглощением насекомым данного белка, фрагмента белка, сегмента белка или полинуклеотида у конкретного вредителя-мишени, включая, но не ограничиваясь насекомыми отряда чешуекрылых. Токсичный белок может продуцироваться растением или может быть применен к растению или окружающей среде в том месте, где находится растение. Термины «биологическая активность», «эффективный», «действенный» или их вариации также являются терминами, используемыми взаимозаменяемо в данной заявке, для описания воздействия белков согласно данному изобретению на вредных насекомых-мишеней. [041] Reference in this application to the terms "active" or "activity", "pesticidal activity" or "pesticidal" or "insecticidal activity", "insect-inhibiting" or "insecticidal" refers to the effectiveness of a toxic agent, such as a protein toxin, with regard to inhibition (inhibition of growth, nutrition, fertility or viability), suppression (inhibition of growth, nutrition, fertility or viability), control (control of pest infestation, control of pest feeding activities on a specific crop containing an effective amount of the protein TIC4472, TIC4472PL, TIC1425, TIC2613 or TIC2613PL) or destruction (causing pathology, mortality, or reduced fertility) of the pest. These terms are intended to include the result of exposing a pest to a pesticidally effective amount of a toxic protein when the effect of the toxic protein on the pest results in injury, mortality, reduced fertility, or stunted growth. The terms also include repelling a pest from a plant, plant tissue, plant part, seed, plant cell, or a particular geographic location where the plant may grow, by delivering a pesticidally effective amount of a toxic protein to or on the plant. In general, pesticidal activity generally refers to the ability of a toxic protein to be effective in inhibiting growth, development, viability, feeding behavior, mating behavior, fertility, or any measurable reduction in side effects caused by insect ingestion of that protein, protein fragment, segment protein or polynucleotide in a particular target pest, including but not limited to insects of the order Lepidoptera. The toxic protein may be produced by the plant or may be applied to the plant or the environment where the plant is located. The terms "biological activity", "effective", "effective" or variations thereof are also terms used interchangeably in this application to describe the effect of the proteins of this invention on harmful target insects.
[042] Пестицидно эффективное количество токсичного агента, когда оно доставлено в рацион вредителя-мишени, проявляет пестицидную активность, когда токсичный агент вступает в контакт с вредителем. Токсичный агент может представлять собой пестицидный белок, или один или большее количество химических агентов, известных в данной области техники. Пестицидные или инсектицидные химические агенты и пестицидные или инсектицидные белковые агенты могут быть использованы отдельно или в комбинации друг с другом. Химические агенты включают в себя, но не ограничиваются лишь этими: молекулы дцРНК, нацеленные на специфические гены для подавления в вредителе-мишени, органохлориды, органофосфаты, карбаматы, пиретроиды, неоникотиноиды и рианоиды. Пестицидные или инсектицидные белковые агенты включают в себя белковые токсины, представленные в данной заявке, а также другие белковые токсичные агенты, включая те, которые нацелены на чешуекрылых, а также белковые токсины, которые используются для борьбы с другими вредителями растений, такие как белки Cry и Cyt, доступные в данной области техники для применения с целью контроля видов Coleopteran, Hemipteran и Homopteran. [042] A pesticidally effective amount of a toxic agent, when delivered to the diet of a target pest, exhibits pesticidal activity when the toxic agent comes into contact with the pest. The toxic agent may be a pesticidal protein, or one or more chemical agents known in the art. The pesticidal or insecticidal chemical agents and the pesticidal or insecticidal proteinaceous agents may be used alone or in combination with each other. Chemical agents include, but are not limited to, dsRNA molecules targeting specific genes for suppression in the target pest, organochlorides, organophosphates, carbamates, pyrethroids, neonicotinoids, and ryanoids. Pesticidal or insecticidal proteinaceous agents include the proteinaceous toxins provided herein, as well as other proteinaceous toxicants, including those that target Lepidoptera, as well as proteinaceous toxins which are used to control other plant pests, such as Cry proteins and Cyt available in the art for use in the control of Coleopteran , Hemipteran and Homopteran species.
[043] Предполагается, что ссылка на вредителя, в частности, вредителя культурного растения, имеет ввиду вредителей культурных растений, в частности тех чешуекрылых насекомых-вредителей, которые контролируются классом белковых токсинов TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL. Однако, отсылка к вредителю может также включать в себя насекомых-вредителей растений из Coleopteran, Hemipteran и Homopteran, а также нематод и грибы, когда токсичные агенты, нацеленные на данных вредителей, совместно локализуются или присутствуют вместе с белком TIC4472, TIC4472PL или TIC1425, или белком что на от 93 до около 100% идентичен TIC4472, TIC4472PL или TIC1425; или белком TIC2613, или TIC2613PL, или белком, который на от 73 до около 100% идентичен TIC2613, или TIC2613PL. [043] Reference to a pest, in particular a crop pest, is intended to mean crop pests, in particular those Lepidoptera insect pests that are controlled by the TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein toxin class. However, a pest reference may also include plant pests from Coleopteran , Hemipteran , and Homopteran , as well as nematodes and fungi, when the toxic agents targeting these pests are co-localized or present with the TIC4472, TIC4472PL, or TIC1425 protein, or a protein that is 93 to about 100% identical to TIC4472, TIC4472PL, or TIC1425; or a TIC2613 or TIC2613PL protein or a protein that is 73% to about 100% identical to TIC2613 or TIC2613PL.
[044] Белки TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL похожи общей функцией и проявляют инсектицидную активность в отношении насекомых-вредителей из видов чешуекрылых насекомых, включая взрослых насекомых, куколок, личинок и вылупившихся личинок. [044] The TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL proteins are similar in general function and exhibit insecticidal activity against Lepidoptera insect pests, including adult insects, pupae, larvae, and hatched larvae.
[045] Насекомые отряда чешуекрылых (Lepidoptera) включают в себя, но не ограничиваются лишь этими: насекомых из семейства совок (Noctuidae) (armyworms, cutworms, loopers, heliothines), например кукурузную лиственную совку (Spodoptera frugiperda), совку помидорную (Spodoptera exigua), Spodoptera exempta, Spodoptera eridania, Mamestra configurata, совка-ипсилон (Agrotis ipsilon), Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Pseudaletia unipuncta, Agrotis orthogonia; точильщиков, чехлоносиков и других насекомых из семейства огневок (Pyralidae), например огневку кукурузную (Ostrinia nubilalis), Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus; насекомых из семейства листоверток (Tortricidae), например яблонную плодожорку (Cydia pomonella), Endopiza viteana, восточную плодожорку Grapholita molesta, Suleima helianthana; и многих других экономически важных чешуекрылых, например, капустную моль (Plutella xylostella), Pectinophora gossypiella, и непарного шелкопряда (Lymantria dispar). Другие насекомые-вредители отряда чешуекрылых (Lepidoptera) включают в себя, например, Alabama argillacea, Archips argyrospila, Archips rosana и другие виды Archips, (Chilo suppressalis, огневку желтую рисовую), Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Earias vittella, совку хлопковую (Helicoverpa armigera), Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Striacosta albicosta, гроздьевую листовертку (Lobesia botrana), Phyllocnistis citrella, капустницу (Pieris brassicae), репницу (Pieris rapae), Spodoptera exigua, Spodoptera litura, и томатную минирующую моль (Tuta absoluta). [045] Insects of the order Lepidoptera (Lepidoptera) include, but are not limited to: insects from the family Noctuidae (armyworms, cutworms, loopers, heliothines), e.g. corn fallowworm ( Spodoptera frugiperda ), tomato cutworm ( Spodoptera exigua ), Spodoptera exempta , Spodoptera eridania , Mamestra configurata , Upsilon cutworm ( Agrotis ipsilon ), Trichoplusia ni , Pseudoplusia includens , Anticarsia gemmatalis , Hypena scabra , Heliothis virescens , Agrotis subterranea , Pseudaletia unipuncta , Agrotis orthogonia ; grinders, case-bearers and other insects from the family of moths ( Pyralidae ), such as corn moth ( Ostrinia nubilalis ), Amyelois transitella , Crambus caliginosellus , Herpetogramma licarsisalis , Homoeosoma electellum , Elasmopalpus lignosellus ; insects from the leafworm family ( Tortricidae ), e.g. apple codling moth ( Cydia pomonella ), Endopiza viteana , eastern codling moth Grapholita molesta , Suleima helianthana ; and many other economically important Lepidoptera, such as the cabbage moth ( Plutella xylostella ), Pectinophora gossypiella , and the gypsy moth ( Lymantria dispar). Other insect pests of the Lepidoptera order include, for example, Alabama argillacea , Archips argyrospila , Archips rosana and other Archips species, ( Chilo suppressalis, yellow rice moth), Cnaphalocrocis medinalis , Crambus caliginosellus , Crambus teterrellus , Diatraea grandiosella saccharalis , Earias insulana , Earias vittella , cotton bollworm ( Helicoverpa armigera ), Helicoverpa zea , Heliothis virescens , Herpetogramma licarsisalis , Striacosta albicosta , bunch leafworm ( Lobesia botrana ), Phyllocnistis citrella , cabbage ( Pieris brassicae ), turnip ( Pierisptrapera exigua , Spodoptera litura , and the tomato miner moth ( Tuta absoluta ).
[046] Отсылка в данной заявке к «выделенной молекуле ДНК», или эквивалентному термину или фразе, предназначена для обозначения того, что молекула ДНК представляет собой молекулу, которая присутствует отдельно или в комбинации с другими соединениями, но не в ее естественной среде. Например, элементы нуклеиновой кислоты, такие как кодирующая последовательность, последовательность интрона, нетранслируемая лидерная последовательность, последовательность промотора, последовательность терминации транскрипции и т.п., которые природно обнаруживают в ДНК генома организма, не считаются «выделенными» до тех пор, пока элемент находится в геноме организма и в том месте в геноме, в котором его природно обнаруживают. Однако, каждый из данных элементов, и частей таких элементов, будут «выделены» в рамках данного раскрытия изобретения, если элемент находится не в геноме организма, и не месте в геноме, в котором его природно обнаруживают. Подобным образом, нуклеотидная последовательность, кодирующая инсектицидный белок или любой встречающийся в природе инсектицидный вариант такого белка, будет представлять собой выделенную нуклеотидную последовательность, до тех пора пока нуклеотидная последовательность не находится в ДНК бактерии, в которой в природных условиях обнаруживают последовательность, кодирующую белок. Синтетическая нуклеотидная последовательность, кодирующая аминокислотную последовательность встречающегося в природе инсектицидного белка, будет считаться выделенной для целей данного раскрытия изобретения. Для целей данного раскрытия изобретения, любая трансгенная нуклеотидная последовательность, то есть нуклеотидная последовательность ДНК, вставленная в геном клеток растения или бактерии, или присутствующая во внехромосомном векторе, будет рассматриваться как выделенная нуклеотидная последовательность, независимо от того, присутствует она в плазмиде или аналогичной структуре, используемой для трансформации клеток, в геноме растения или бактерии, или присутствует в обнаруживаемых количествах в тканях, потомстве, биологических образцах или товарных продуктах, полученных из растения или бактерии. [046] Reference in this application to "an isolated DNA molecule", or an equivalent term or phrase, is intended to mean that a DNA molecule is a molecule that is present alone or in combination with other compounds, but not in its natural environment. For example, nucleic acid elements, such as a coding sequence, an intron sequence, an untranslated leader sequence, a promoter sequence, a transcription termination sequence, and the like, that are naturally found in the DNA of an organism's genome are not considered "isolated" as long as the element is found in the organism's genome and at the location in the genome where it is naturally found. However, each of these elements, and portions of such elements, will be "isolated" within the scope of this disclosure if the element is not in the organism's genome, nor the location in the genome where it is naturally found. Similarly, a nucleotide sequence encoding an insecticidal protein, or any naturally occurring insecticidal variant of such a protein, will be an isolated nucleotide sequence, as long as the nucleotide sequence is not in the DNA of a bacterium in which the sequence encoding the protein is naturally found. A synthetic nucleotide sequence encoding the amino acid sequence of a naturally occurring insecticidal protein will be considered isolated for the purposes of this disclosure. For the purposes of this disclosure, any transgenic nucleotide sequence, i.e. a DNA nucleotide sequence inserted into the genome of plant or bacterial cells, or present in an extrachromosomal vector, will be considered an isolated nucleotide sequence, whether it is present in a plasmid or similar structure, used for cell transformation, in the genome of a plant or bacterium, or present in detectable amounts in tissues, progeny, biological samples or commercial products derived from a plant or bacterium.
[047] Как дополнительно описано в данной заявке, открытая рамка считывания (ORF), кодирующая TIC4747 (SEQ ID NO:1), была обнаружена в ДНК, полученной из штамма EG10742 Bacillus thuringiensis. Кодирующая последовательность была клонирована и экспрессирована в микробных клетках-хозяевах для получения рекомбинантных белков, используемых в биоанализах. Открытая рамка считывания (ORF), кодирующая TIC1425 (SEQ ID NO:5), была обнаружена в ДНК, полученной из штамма EG10731 Bacillus thuringiensis. Открытая рамка считывания (ORF), кодирующая TIC2613 (SEQ ID NO:7), была обнаружена в ДНК, полученной из штамма EG5408 Bacillus thuringiensis. Биоанализ с использованием белков TIC4472, полученных из микробных клеток-хозяев, продемонстрировал активность против видов чешуекрылых - совки помидорной (Spodoptera exigua), Helicoverpa zea, совки хлопковой американской (Alabama argillacea), огневки кукурузной (Ostrinia nubilalis), кукурузной лиственной совки (Spodoptera frugiperda), совки хлопковой (Helicoverpa armigera), Spodoptera litura, Pectinophora gossypiella, Cry1Ac устойчивого Pectinophora gossypiella, Chrysodeixis includens, Spodoptera eridania, Diatraea grandiosella, Earias vittella, Diatraea saccharalis, Heliothis virescens, и Anticarsia gemmatalis. Кроме того, также наблюдали активность против желтолихорадочного комара (Aedes aegypti). Биоанализ с использованием белков TIC1425, полученных из микробных клеток-хозяев, продемонстрировал активность против видов чешуекрылых - совки хлопковой американской (Alabama argillacea), огневки кукурузной (Ostrinia nubilalis), кукурузной лиственной совки (Spodoptera frugiperda), Diatraea saccharalis, и Diatraea grandiosella. Биоанализ с использованием белков TIC2613, полученных из микробных клеток-хозяев, продемонстрировал активность против видов чешуекрылых - Helicoverpa zea, совки хлопковой американской Alabama argillacea, огневки кукурузной (Ostrinia nubilalis), кукурузной лиственной совки (Spodoptera frugiperda), Chrysodeixis includens, Diatraea grandiosella, и Heliothis virescens. [047] As further described herein, an open reading frame (ORF) encoding TIC4747 (SEQ ID NO:1) was found in DNA obtained from Bacillus thuringiensis strain EG10742. The coding sequence has been cloned and expressed in microbial host cells to generate recombinant proteins used in bioassays. An open reading frame (ORF) encoding TIC1425 (SEQ ID NO:5) was found in DNA obtained from Bacillus thuringiensis strain EG10731. An open reading frame (ORF) encoding TIC2613 (SEQ ID NO:7) was found in DNA obtained from Bacillus thuringiensis strain EG5408. Bioassay using TIC4472 proteins derived from microbial host cells demonstrated activity against Lepidoptera species - Tomato cutworm ( Spodoptera exigua ), Helicoverpa zea , American cotton cutworm (Alabama argillacea), Corn moth ( Ostrinia nubilalis ), Corn fall armyworm ( Spodoptera frugiperda) ), cotton bollworm ( Helicoverpa armigera ), Spodoptera litura , Pectinophora gossypiella , Cry1Ac resistant Pectinophora gossypiella , Chrysodeixis includens , Spodoptera eridania , Diatraea grandiosella , Earias vittella , Diatraea saccharalis , Heliothis virescens , and Anticarsia gemmatalis . In addition, activity against the yellow fever mosquito ( Aedes aegypti ) was also observed. Bioassay using TIC1425 proteins derived from microbial host cells demonstrated activity against the Lepidoptera species of American cotton bollworm (Alabama argillacea), corn moth ( Ostrinia nubilalis ), fall armyworm ( Spodoptera frugiperda ), Diatraea saccharalis , and Diatraea grandiosella . Bioassay using TIC2613 proteins derived from microbial host cells demonstrated activity against Lepidoptera species Helicoverpa zea , American cotton bollworm Alabama argillacea , Corn moth ( Ostrinia nubilalis ), Fall armyworm ( Spodoptera frugiperda ), Chrysodeixis includens , Diatraea grandiosella , and Heliothis virescens .
[048] Для экспрессии в растительных клетках белки TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL могут экспрессироваться с локализацией в цитозоле, или могут быть нацелены на различные органеллы растительной клетки. Например, нацеливание белка на хлоропласт может привести к повышенным уровням экспрессируемого белка в трансгенном растении, в то же время предотвращая появление нецелевых фенотипов. Нацеливание может также привести к повышению эффективности устойчивости к вредителям у трангенного трансформанта. Нацеливающий пептид или транзитный пептид представляет собой короткую (длиной 3-70 аминокислот) пептидную цепь, которая направляет транспорт белка в конкретную область клетки, включая ядро, митохондрии, эндоплазматический ретикулум (ЭР), хлоропласт, апопласт, пероксисому и плазматическую мембрану. Некоторые нацеливающие пептиды отщепляются от белка сигнальными пептидазами после транспортировки белков. Для нацеливания на хлоропласт белки содержат транзитные пептиды, которые содержат около 40-50 аминокислот. Описание применения хлоропластных транзитных пептидов см. в патентах США № 5188642 и 5728925. Многие локализованные в хлоропластах белки экспрессируются из ядерных генов в качестве предшественников, и нацеливаются на хлоропласт транзитным пептидом хлоропласта (CTP). Примеры таких выделенных хлоропластных белков включают в себя, но не ограничиваются лишь этими: белки, связанные с малой субъединицей (SSU) рибулозо-1,5,-бисфосфаткарбоксилазы, ферредоксин, ферредоксин оксидоредуктазу, белок I и белок II светоулавливающего комплекса, тиоредоксин F, енолпирувил шикимат фосфатсинтазу (EPSPS), и транзитные пептиды, описанные в патенте США № 7193133. In vivo и in vitro было продемонстрировано, что нехлоропластные белки могут быть нацелены на хлоропласт с использованием гибридных белков с гетерологичным CTP, и что CTP достаточно для нацеливания белка на хлоропласт. Было показано, что встраивание подходящего хлоропластного транзитного пептида, такого как Arabidopsis thaliana EPSPS CTP (CTP2) (смотрите, Klee et al., Mol. Gen. Genet. 210:437-442, 1987) или Petunia hybrida EPSPS CTP (CTP4) (смотрите, della-Cioppa et al., Proc. Natl. Acad. Sci. USA 83:6873-6877, 1986) нацеливало гетерологичные EPSPS белковые последовательности на хлоропласты в трансгенных растениях (смотрите, патенты США № 5627061; 5633435; и 5312910; и EP 0218571; EP 189707; EP 508909; и EP 924299). Для нацеливания токсичного белка TIC6757 или TIC6757PL на хлоропласт, последовательность, кодирующую транзитный пептид хлоропласта, размещают в 5' в функциональной связи и в рамке считывания с синтетической кодирующей последовательностью, кодирующей токсичный белок TIC6757 или TIC6757PL, который был разработан для оптимальной экспрессии в клетках растений. [048] For expression in plant cells, the TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL proteins can be expressed to localize in the cytosol, or can be targeted to various plant cell organelles. For example, targeting a protein to a chloroplast can result in increased levels of expressed protein in a transgenic plant while preventing off-target phenotypes. Targeting may also lead to an increase in the effectiveness of pest resistance in the transgenic transformant. A targeting peptide or transit peptide is a short (3-70 amino acids long) peptide chain that directs protein transport to a specific region of the cell, including the nucleus, mitochondria, endoplasmic reticulum (ER), chloroplast, apoplast, peroxisome, and plasma membrane. Some targeting peptides are cleaved from the protein by signal peptidases after protein transport. For chloroplast targeting, proteins contain transit peptides that contain about 40-50 amino acids. For a description of the use of chloroplast transit peptides, see US Pat. Examples of such isolated chloroplast proteins include, but are not limited to: ribulose-1,5,-bisphosphate carboxylase small subunit (SSU)-associated proteins, ferredoxin, ferredoxin oxidoreductase, light-trapping complex protein I and protein II, thioredoxin F, enolpyruvil shikimate phosphate synthase (EPSPS), and the transit peptides described in US Pat. No. 7,193,133. It has been demonstrated in vivo and in vitro that non-chloroplast proteins can be targeted to the chloroplast using heterologous CTP fusion proteins, and that CTP is sufficient to target the protein to the chloroplast . It has been shown that insertion of a suitable chloroplast transit peptide such as Arabidopsis thaliana EPSPS CTP (CTP2) (see Klee et al., Mol. Gen. Genet. 210 :437-442, 1987) or Petunia hybrida EPSPS CTP (CTP4) ( see della - Cioppa et al., Proc. Natl. Acad. Sci. USA 83:6873-6877, 1986) targeted heterologous EPSPS protein sequences to chloroplasts in transgenic plants (see US Pat. Nos. 5,627,061; 5,633,435; and 5,312,910; and EP 0218571; EP 189707; EP 508909; and EP 924299). To target the toxic TIC6757 or TIC6757PL protein to the chloroplast, the sequence encoding the chloroplast transit peptide is placed 5' in operable relationship and in reading frame with a synthetic coding sequence encoding the toxic TIC6757 or TIC6757PL protein that has been designed for optimal expression in plant cells.
[049] Предполагается, что дополнительные последовательности токсичного белка, относящиеся к TIC4472, TIC1425 или TIC2613, могут быть созданы с использованием аминокислотной последовательности TIC4472, TIC1425 или TIC2613, для создания новых белков с новыми свойствами. Токсичные белки TIC4472, TIC1425 или TIC2613 могут быть выровнены для складывания различий, на уровне аминокислотной последовательности, в новые варианты аминокислотной последовательности, и делая соответствующие изменения в рекомбинантной нуклеотидной последовательности, кодирующей варианты. [049] It is contemplated that additional toxic protein sequences related to TIC4472, TIC1425, or TIC2613 can be created using the amino acid sequence of TIC4472, TIC1425, or TIC2613 to create new proteins with new properties. Toxic TIC4472, TIC1425, or TIC2613 proteins can be aligned to fold differences, at the amino acid sequence level, into new amino acid sequence variants, and make corresponding changes in the recombinant nucleotide sequence encoding the variants.
[050] Согласно данному раскрытию дополнительно предполагается, что улучшенные варианты класса белкового токсина TIC4472 могут быть сконструированы in planta с использованием различных способов редактирования генов, известных в данной области техники. Такие технологии, используемые для редактирования генома, включают в себя, но не ограничиваются лишь этими: ZFN (нуклеазу цинкового пальца), мегануклеазы, TALEN (эффекторные нуклеазы, подобные активатору транскрипции) и CRISPR (короткие палиндромные повторы, регулярно расположенные группами)/Cas (CRISPR-ассоциированный) системы. Данные способы редактирования генома могут быть использованы для изменения последовательности, кодирующей токсичный белок, трансформированной в растительной клетке, в другую последовательность, кодирующую токсин. В частности, с помощью данных способов один или большее количество кодонов в последовательности, кодирующей токсин, изменяют для конструирования новой аминокислотной последовательности белка. В альтернативном варианте, фрагмент внутри кодирующей последовательности заменяют или удаляют, или вставляют дополнительные фрагменты ДНК в кодирующую последовательность для конструирования новой последовательности, кодирующей токсин. Новая кодирующая последовательность может кодировать токсичный белок с новыми свойствами, такими как увеличенная активность или спектр против насекомых-вредителей, а также обеспечивать активность против видов насекомых-вредителей, у которых развивается устойчивость к исходному белку, токсичному для насекомых. Растительная клетка, содержащая отредактированную последовательность кодирующего токсин гена может быть использована способами, известными в данной области техники, для получения целых растений, экспрессирующих новый токсичный белок. [050] This disclosure further contemplates that improved variants of the TIC4472 protein toxin class can be engineered in planta using various gene editing techniques known in the art. Such technologies used for genome editing include, but are not limited to: ZFN (zinc finger nuclease), meganucleases, TALEN (transcriptional activator-like effector nucleases) and CRISPR (regularly arranged short palindromic repeats)/Cas ( CRISPR-associated) systems. These genome editing methods can be used to change a toxic protein coding sequence transformed in a plant cell to a different toxin coding sequence. In particular, using these methods, one or more codons in the toxin-coding sequence are changed to construct a new protein amino acid sequence. Alternatively, a fragment within the coding sequence is replaced or deleted, or additional DNA fragments are inserted into the coding sequence to construct a new toxin-coding sequence. The novel coding sequence can encode a toxic protein with novel properties such as increased activity or spectrum against insect pests, as well as activity against insect pest species that develop resistance to the original insect toxic protein. A plant cell containing an edited toxin-coding gene sequence can be used by methods known in the art to produce whole plants expressing the new toxic protein.
[051] Также предполагается, что фрагменты TIC4472, TIC1425 или TIC2613, или их белковые варианты могут быть усеченными формами, в которых одну или большее количество аминокислот удаляют из N-конца, С-конца, середины белка или их комбинаций, причем фрагменты и варианты сохраняют ингибирующую насекомых активность. Такие фрагменты могут встречаться в природе или быть синтетическими вариантами TIC4472, TIC1425 или TIC2613, или производными белковыми вариантами, но должны сохранять ингибирующую насекомых активность по меньшей TIC4472, TIC1425 или TIC2613. Описанный в данном документе фрагмент или вариант может дополнительно содержать идентифицированный в данном документе домен, который отвечает за пестицидную активность белка. [051] It is also contemplated that fragments of TIC4472, TIC1425, or TIC2613, or protein variants thereof, may be truncated forms in which one or more amino acids are removed from the N-terminus, C-terminus, middle of the protein, or combinations thereof, wherein the fragments and variants retain insect-inhibiting activity. Such fragments may occur naturally or be synthetic variants of TIC4472, TIC1425 or TIC2613, or derived protein variants, but must retain insect inhibitory activity of at least TIC4472, TIC1425 or TIC2613. The fragment or variant described herein may further comprise the domain identified herein that is responsible for the pesticidal activity of the protein.
[052] Белки, которые напоминают белки TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL, можно идентифицировать и сравнивать друг с другом, используя различные компьютерные алгоритмы, известные в данной области техники (смотрите Таблицы 1 и 2). Идентичности аминокислотных последовательностей, о которых сообщается в данной заявке, являются результатом выравнивания с помощью Clustal W, с использованием таких параметров по умолчанию: Матрица весов: blosum, Штраф за открытие пробела: 10,0, Штраф за продление пробела: 0,05, Гидрофильные пробелы: Вкл., Гидрофильные остатки: GPSNDQERK, Штрафы за пробелы специфических остатков: Вкл. (Thompson, et al (1994) Nucleic Acids Research, 22:4673-4680). Процент аминокислотной идентичности дополнительно рассчитывают по произведению, умноженному на 100% (идентичность аминокислот/длина рассматриваемого белка). Другие алгоритмы выравнивания также доступны в данной области техники и предоставляют результаты, аналогичные результатам, полученным с использованием выравнивания Clustal W, и рассматриваются в данном документе. [052] Proteins that resemble TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL proteins can be identified and compared to each other using various computer algorithms known in the art (see Tables 1 and 2). The amino acid sequence identities reported in this application are the result of Clustal W alignment using the following default parameters: Weight matrix: blosum, Gap opening penalty: 10.0, Gap extension penalty: 0.05, Hydrophilic gaps: On, Hydrophilic residues: GPSNDQERK, Penalties for specific residue gaps: On. (Thompson, et al (1994) Nucleic Acids Research, 22:4673-4680). Percent amino acid identity is additionally calculated by the product multiplied by 100% (amino acid identity/length of the protein in question). Other alignment algorithms are also available in the art and provide similar results to those obtained using Clustal W alignment and are discussed in this document.
[053] Предполагается, что белок, проявляющий ингибирующую насекомых активность в отношении чешуекрылых видов насекомых, относится к TIC4472, TIC4472PL или TIC1425, если белок, используемый как запрос, например, в выравнивании Clustal W, и белки согласно данному изобретению, представленные в SEQ ID NO:2, SEQ ID NO:4, или SEQ ID NO:6, идентифицируют как совпадения в таком выравнивании, в котором белок-запрос показывает по меньшей мере от 93% до около 100% аминокислотной идентичности по длине белка-запроса, что составляет около 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, или любую процентную долю в данном диапазоне. Также предполагается, что белок, проявляющий ингибирующую насекомых активность в отношении чешуекрылых видов насекомых, относится к TIC2613 или TIC2613PL, если белок, используемый как запрос, например, в выравнивании Clustal W, и белки согласно данному изобретению, представленные в SEQ ID NO:8 или SEQ ID NO:10, идентифицируют как совпадения в таком выравнивании, в котором белок-запрос показывает по меньшей мере от 73% до около 100% аминокислотной идентичности по длине белка-запроса, что составляет около 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, или любую процентную долю в данном диапазоне. [053] A protein exhibiting insect-inhibiting activity against Lepidoptera insect species is assumed to be TIC4472, TIC4472PL, or TIC1425 if the protein used as a query, for example, in the Clustal W alignment, and the proteins of the present invention shown in SEQ ID NO:2, SEQ ID NO:4, or SEQ ID NO:6 are identified as matches in such an alignment in which the query protein shows at least 93% to about 100% amino acid identity along the length of the query protein, which is about 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any percentage in this range. It is also assumed that a protein exhibiting insect inhibitory activity against Lepidoptera species of insects, refers to TIC2613 or TIC2613PL, if the protein used as a query, for example, in the alignment of Clustal W, and the proteins according to this invention, presented in SEQ ID NO: 8 or SEQ ID NO:10 are identified as matches in such an alignment in which the query protein shows at least 73% to about 100% amino acid identity along the length of the query protein, which is about 73%, 74%, 75%, 76 %, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any percentage within this range.
[054] Иллюстративные белки TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL были выровнены друг с другом с использованием алгоритма Clustal W. Как сообщалось в Таблице 1, была создана попарная матрица процентной идентичности аминокислотных последовательностей для каждого из полноразмерных белков. [054] The exemplary proteins TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL were aligned to each other using the Clustal W algorithm. As reported in Table 1, a pairwise matrix of percent amino acid sequence identity was generated for each of the full length proteins.
Таблица 1. Демонстрация попарной матрицы иллюстративных белков TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL.Table 1 Demonstration of a pairwise matrix of exemplary proteins TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL.
Описание таблицы: Выравнивание Clustal W между (X) и (Y) описывается в попарной матрице. Расчитан процент аминокислотной идентичности между всеми парами, и он показан первым числом в каждой ячейке. Второе число (в скобках) в каждой ячейке показывает количество идентичных аминокислот для пары. Table Description: The Clustal W alignment between (X) and (Y) is described in a pairwise matrix. The percent amino acid identity between all pairs is calculated and is shown as the first number in each cell. The second number (in brackets) in each cell indicates the number of identical amino acids for the pair.
[055] В дополнение к проценту идентичности, связь между TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL и родственными белками также может быть выявлена по первичной структуре (консервативным аминокислотным мотивам), длине (около 1187 аминокислот), и другим характеристикам. Характеристики белковых токсинов TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL приведены в Таблице 2. [055] In addition to percent identity, association between TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL and related proteins can also be identified by primary structure (conserved amino acid motifs), length (about 1187 amino acids), and other characteristics. Characteristics of protein toxins TIC4472, TIC4472PL, TIC1425, TIC2613 and TIC2613PL are shown in Table 2.
Таблица 2. Выбранные характеристики белков TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL.Table 2 Selected characteristics of the TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL proteins.
[056] Как дополнительно описано в Примерах данной заявки, были сконструированы последовательности синтетических молекул нуклеиновых кислот, кодирующих вариант TIC4472, TIC4472PL, и вариант TIC2613, TIC2613PL, для использования в растениях. Иллюстративная последовательность рекомбинантной молекулы нуклеиновой кислоты, которая была разработана для использования в растениях, кодирующая белок TIC4472PL, представлена как SEQ ID NO:3. Иллюстративная последовательность рекомбинантной молекулы нуклеиновой кислоты, которая была разработана для использования в растениях, кодирующая белок TIC2613PL, представлена как SEQ ID NO:9. Белки TIC4472PL и TIC2613PL содержат дополнительную аминокислоту аланина сразу после стартового метионина, относительно белков TIC4472 и TIC2613 соответственно. Считается, что дополнительный остаток аланина, вставленный в аминокислотные последовательности TIC4472 и TIC2613, улучшает экспрессию белка in planta. Аналогично, последовательности синтетических молекул нуклеиновых кислот кодируют варианты TIC1425, и могут быть разработаны для использования в растениях. [056] As further described in the Examples of this application, synthetic nucleic acid molecule sequences encoding the TIC4472 variant, TIC4472PL and the TIC2613 variant, TIC2613PL, were constructed for use in plants. An exemplary sequence of a recombinant nucleic acid molecule that has been developed for use in plants encoding the TIC4472PL protein is shown as SEQ ID NO:3. An exemplary sequence of a recombinant nucleic acid molecule that has been developed for use in plants encoding the TIC2613PL protein is shown as SEQ ID NO:9. Proteins TIC4472PL and TIC2613PL contain an additional amino acid alanine immediately after the starting methionine, relative to proteins TIC4472 and TIC2613, respectively. An additional alanine residue inserted into the TIC4472 and TIC2613 amino acid sequences is thought to improve in planta protein expression. Similarly, synthetic nucleic acid molecule sequences encode TIC1425 variants and can be developed for use in plants.
[057] Анализ с листьевыми дисками, применяя ткань листка R0 хлопка, экспрессирующую белок TIC4472PL, продемонстрировал высокую активность в отношении Chrysodeixis includens и Heliothis virescens, и низкую активность в отношении Helicoverpa zea и кукурузной лиственной совки (Spodoptera frugiperda). Анализ с листьевыми дисками, применяя ткань листка R0 сои, экспрессирующую белок TIC4472PL, продемонстрировал активность в отношении Spodoptera eridania и Chrysodeixis includens. [057] A leaf disc assay using R0 cotton leaf tissue expressing the TIC4472PL protein showed high activity against Chrysodeixis includens and Heliothis virescens , and low activity against Helicoverpa zea and fall armyworm ( Spodoptera frugiperda ). A leaf disc assay using soybean R 0 leaf tissue expressing the TIC4472PL protein showed activity against Spodoptera eridania and Chrysodeixis includens .
[058] Образцы листьев R0 растений сои, экспрессирующих белки TIC4472PL и TIC2613PL, продемонстрировали активность в отношении Spodoptera eridania и Chrysodeixis includens. [058] Leaf samples of R 0 soybean plants expressing TIC4472PL and TIC2613PL proteins showed activity against Spodoptera eridania and Chrysodeixis includens .
[059] Экспрессионные кассеты и векторы, содержащие последовательность рекомбинантной молекулы нуклеиновой кислоты, могут быть сконструированы и введены в клетки кукурузы, сои, хлопка или других растений в соответствии со способами и методами трансформации, известными в данной области техники. Например, Agrobacterium-опосредованная трансформация описана в публикациях патентных заявок США 2009/0138985A1 (соя), 2008/0280361A1 (соя), 2009/0142837A1 (кукуруза), 2008/0282432 (хлопок), 2008/0256667 (хлопок), 2003/0110531 (пшеница), 2001/0042257 A1 (сахарная свекла), патентах США № 5750871 (канола), 7026528 (пшеница), и 6365807 (рис), и в Arencibia et al. (1998) Transgenic Res. 7:213-222 (сахарный тростник), каждый из которых включен в данный документ посредством ссылки в полном объеме. Трансформированные клетки могут быть регенерированы в трансформированные растения, которые экспрессируют белки TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL и демонстрируют пестицидную активность посредством биоанализов, проводимых в присутствии личинок чешуекрылых вредителей, с использованием листьевых дисков растений, полученных из трансформированных растений. Растения могут быть получены из растительных клеток путем регенерации, методами трансформации семян, пыльцы или меристемы. Способы трансформации растений известны в данной области техники. [059] Expression cassettes and vectors containing the sequence of the recombinant nucleic acid molecule can be constructed and introduced into cells of corn, soybean, cotton or other plants in accordance with the methods and methods of transformation known in the art. For example, Agrobacterium -mediated transformation is described in US Patent Application Publications 2009/0138985A1 (soybean), 2008/0280361A1 (soybean), 2009/0142837A1 (corn), 2008/0282432 (cotton), 2008/0256667 (cotton), 2003/011051 (wheat), 2001/0042257 A1 (sugar beet), US Pat . (1998) Transgenic Res. 7:213-222 (sugarcane), each of which is incorporated herein by reference in its entirety. Transformed cells can be regenerated into transformed plants that express TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL proteins and exhibit pesticidal activity through bioassays conducted in the presence of lepidopteran pest larvae using plant leaf disks derived from transformed plants. Plants can be obtained from plant cells by regeneration, seed, pollen or meristem transformation methods. Methods for transforming plants are known in the art.
[060] В качестве альтернативы традиционным способам трансформации, последовательность ДНК, такая как трансген, кассета(ы) экспрессии и т.д., может быть вставлена или интегрирована в конкретный сайт или локус в геноме растения или клетки растения путем сайт-направленного встраивания. Конструкция(и) и молекула(ы) рекомбинантной ДНК согласно данному изобретению могут, таким образом, содержать донорную матричную последовательность, содержащую по меньшей мере один трансген, экспрессионную кассету или другую последовательность ДНК для встраивания в геном растения или растительную клетку. Такая донорная матрица для сайт-направленной интеграции может дополнительно содержать один или два гомологичных плеча, фланкирующих последовательность вставки (т.е. последовательность, трансген, кассету и т.д., которые встраивают в геном растения). Конструкция(и) рекомбинантной ДНК согласно данному изобретению может дополнительно содержать экспрессионную кассету(ы), кодирующую сайт-специфическую нуклеазу и/или любой родственный белок(-ы) для осуществления сайт-направленного встраивания. Такие кассеты, экспрессирующие нуклеазу, могут присутствовать в той же молекуле или векторе, что и донорная матрица (in cis), или в отдельной молекуле или векторе (in trans). В данной области техники известно несколько способов сайт-направленного встраивания, использующих различные белки (или комплексы белков и/или направляющую РНК), которые разрезают геномную ДНК для получения двухцепочечного разрыва (ДЦР) или одноцепочечного разрыва в нужном геномном сайте или локусе. Вкратце, как понятно в данной области техники, в процессе репарации ДЦР или одноцепочечного разрыва, внесенного ферментом-нуклеазой, донорная матричная ДНК может интегрироваться в геном в сайте ДЦР или одноцепочечного разрыва. Наличие гомологичного плеча(ей) в донорной матрице может способствовать проникновению и нацеливанию последовательности вставки в геноме растения во время процесса репарации посредством гомологичной рекомбинации, хотя событие встраивания может происходить посредством негомологичного соединения концов (NHEJ). Примеры сайт-специфических нуклеаз, которые могут быть использованы, включают в себя нуклеазы с цинковыми пальцами, сконструированные или нативные мегануклеазы, TALE-эндонуклеазы и эндонуклеазы, направляемые РНК (например, Cas9 или Cpf1). Для способов с применением сайт-специфических нуклеаз, направляемых РНК (например, Cas9 или Cpf1), конструкция(и) рекомбинантной ДНК также будет содержать последовательность, кодирующую одну или большее количество направляющих РНК для нацеливания нуклеазы на нужный сайт в геноме растения. [060] As an alternative to traditional transformation methods, a DNA sequence such as a transgene, expression cassette(s), etc., can be inserted or integrated at a specific site or locus in the genome of a plant or plant cell by site-directed insertion. The recombinant DNA construct(s) and molecule(s) of the invention may thus comprise a donor template sequence containing at least one transgene, expression cassette or other DNA sequence for insertion into the plant genome or plant cell. Such a site-directed integration donor template may further comprise one or two homologous arms flanking the insertion sequence (ie, the sequence, transgene, cassette, etc. that is inserted into the plant genome). The recombinant DNA construct(s) of this invention may further comprise an expression cassette(s) encoding a site-specific nuclease and/or any related protein(s) for site-directed insertion. Such nuclease-expressing cassettes may be present in the same molecule or vector as the donor template ( in cis ) or in a separate molecule or vector ( in trans ). Several site-directed insertion methods are known in the art using various proteins (or protein complexes and/or guide RNA) that cut genomic DNA to produce a double-strand break (DSB) or a single-strand break at the desired genomic site or locus. Briefly, as is understood in the art, during the repair of an LSB or single-strand break introduced by a nuclease enzyme, the donor template DNA can be integrated into the genome at the site of the LSB or single-strand break. The presence of the homologous arm(s) in the donor template may facilitate entry and targeting of the insert sequence in the plant genome during the repair process via homologous recombination, although the insertion event may occur via non-homologous end joining (NHEJ). Examples of site-specific nucleases that can be used include zinc finger nucleases, engineered or native meganucleases, TALE endonucleases, and RNA-directed endonucleases (eg, Cas9 or Cpf1). For methods using site-specific RNA-directed nucleases (eg, Cas9 or Cpf1), the recombinant DNA construct(s) will also contain a sequence encoding one or more guide RNAs to target the nuclease to the desired site in the plant genome.
[061] Как применяется в данном документе, термин «рекомбинантная молекула ДНК» представляет собой молекулу ДНК, содержащую комбинацию молекул ДНК, которые б не встречались в природе вместе без вмешательства человека. Например, рекомбинантная молекула ДНК может представлять собой молекулу ДНК, которая состоит по меньшей мере из двух молекул ДНК, гетерологичных по отношению друг к другу, молекулу ДНК, которая содержит последовательность ДНК, которая отличается от последовательностей ДНК, существующих в природе, или молекулу ДНК, которая была включена в ДНК клетки-хозяина путем генетической трансформации или редактирования генов. Аналогичным образом, «рекомбинантная молекула белка» представляет собой молекулу белка, содержащую комбинацию аминокислот, которые б не встречались в природе вместе без вмешательства человека. Например, рекомбинантная молекула белка может быть молекулой белка, которая состоит по меньшей мере из двух аминокислотных молекул, гетерологичных по отношению друг к другу, молекулой белка, которая содержит аминокислотную последовательность, которая отличается от аминокислотных последовательностей, существующих в природе, или молекулой белка, которая экспрессируется в клетке-хозяине в результате генетической трансформации клетки-хозяина или из-за редактирования генов генома клетки-хозяина. [061] As used herein, the term "recombinant DNA molecule" is a DNA molecule containing a combination of DNA molecules that would not naturally occur together without human intervention. For example, a recombinant DNA molecule may be a DNA molecule that consists of at least two DNA molecules that are heterologous to each other, a DNA molecule that contains a DNA sequence that differs from naturally occurring DNA sequences, or a DNA molecule that that has been incorporated into the DNA of the host cell by genetic transformation or gene editing. Similarly, a "recombinant protein molecule" is a protein molecule containing a combination of amino acids that would not naturally occur together without human intervention. For example, a recombinant protein molecule may be a protein molecule that consists of at least two amino acid molecules that are heterologous to each other, a protein molecule that contains an amino acid sequence that differs from naturally occurring amino acid sequences, or a protein molecule that expressed in the host cell as a result of genetic transformation of the host cell or due to gene editing of the host cell's genome.
[062] Рассматриваются композиции рекомбинантных молекул нуклеиновых кислот, которые кодируют TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL. Например, белки TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL могут быть экспрессированы с помощью рекомбинантных конструкций ДНК, в которых полинуклеотидная молекула с ORF, кодирующей белок, функционально связана с генетическими элементами экспрессии, такими как промотор и любым другим регуляторным элементом, необходимым для экспрессии в системе, для которой предназначена конструкция. Неограничивающие примеры включают в себя функциональный в растении промотор, функционально связанный с последовательностью, кодирующей белок TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, для экспрессии белка в растениях, или Bt-функциональный промотор, функционально связанный с последовательностью, кодирующей белок TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, для экспрессии белка в бактерии Bt или других видах Bacillus. Другие элементы могут быть функционально связаны с последовательностью, кодирующей белок TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, включая в себя, но не ограничиваясь лишь этими: энхансеры, интроны, нетранслируемые лидерные последовательности, кодируемые метки иммобилизации белка (HIS-тэг), транслокационные пептиды (т.е. транзитные пептиды пластидов, сигнальные пептиды), полипептидные последовательности для посттрансляционных модифицирующих ферментов, сайты связывания рибосом и сайты-мишени РНКи. Иллюстративные рекомбинантные полинуклеотидные молекулы, представленные в данном документе, включают в себя, но не ограничиваются лишь этими: гетерологичный промотор, функционально связанный с полинуклеотидом, таким как SEQ ID NO:3, SEQ ID NO:1, SEQ ID NO:5, SEQ ID NO:7 и SEQ ID NO:9, который кодирует соответствующие полипептиды или белки, имеющие аминокислотную последовательность, представленную в SEQ ID NO:4, SEQ ID NO:2, SEQ ID NO:6, SEQ ID NO:8 и SEQ ID NO:10. Гетерологичный промотор также может быть функционально связан синтетическими ДНК последовательностями, кодирующими нацеленный на пластид TIC4472PL или TIC2613PL; или ненацеленный TIC4472PL или TIC2613PL. Кодоны рекомбинантной молекулы нуклеиновой кислоты, кодирующей белки, раскрытые в данном документе, могут быть заменены синонимичными кодонами (известными в данной области техники как молчащая замена). [062] Compositions of recombinant nucleic acid molecules that encode TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL are contemplated. For example, the TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL proteins can be expressed using recombinant DNA constructs in which a polynucleotide molecule with an ORF encoding a protein is operably linked to genetic expression elements such as a promoter and any other regulatory element necessary for expression. in the system for which the design is intended. Non-limiting examples include a plant-functional promoter operably linked to a TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein-coding sequence for protein expression in plants, or a Bt -functional promoter operably linked to a TIC4472, TIC4472PL, protein-coding sequence, TIC1425, TIC2613 or TIC2613PL, for protein expression in Bt bacteria or other Bacillus species. Other elements may be operably linked to the TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein coding sequence, including but not limited to: enhancers, introns, untranslated leader sequences, encoded protein immobilization tags (HIS tag), translocation peptides (ie, plastid transit peptides, signal peptides), polypeptide sequences for post-translational modifying enzymes, ribosome binding sites, and RNAi target sites. Illustrative recombinant polynucleotide molecules provided herein include, but are not limited to: a heterologous promoter operably linked to a polynucleotide such as SEQ ID NO:3, SEQ ID NO:1, SEQ ID NO:5, SEQ ID NO:7 and SEQ ID NO:9 which encodes the corresponding polypeptides or proteins having the amino acid sequence shown in SEQ ID NO:4, SEQ ID NO:2, SEQ ID NO:6, SEQ ID NO:8 and SEQ ID NO :ten. The heterologous promoter can also be operably linked with synthetic DNA sequences encoding plastid-targeted TIC4472PL or TIC2613PL; or non-targeted TIC4472PL or TIC2613PL. Codons of a recombinant nucleic acid molecule encoding the proteins disclosed herein may be replaced with synonymous codons (known in the art as silent substitution).
[063] Рекомбинантная конструкция ДНК, содержащая последовательности, кодирующие белки TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, может дополнительно содержать область ДНК, которая кодирует один или большее количество агентов, ингибирующих насекомых, которые могут быть скомпонованы для одновременной экспрессии или совместной экспрессии с последовательностью ДНК, кодирующей белок TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, белок, отличный от белка TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, молекулу дцРНК, ингибирующую насекомых, или вспомогательный белок. Вспомогательные белки включают в себя, но не ограничиваются лишь этими: кофакторы, ферменты, партнеры по связыванию или другие агенты, которые действуют, чтобы способствовать эффективности ингибирующего насекомых агента, например, помогая его экспрессии, влияя на его стабильность в растениях, оптимизируя свободную энергии для олигомеризации, увеличивая его токсичность и увеличивая его спектр активности. Вспомогательный белок может облегчать поглощение, например, одного или большего количества агентов, ингибирующих насекомых, или усиливать токсическое действие токсичного агента. [063] A recombinant DNA construct containing sequences encoding TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL proteins may additionally contain a DNA region that encodes one or more insect inhibitory agents that can be arranged for simultaneous expression or co-expression with a DNA sequence encoding a TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein, a protein other than the TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein, an insect-inhibiting dsRNA molecule, or an accessory protein. Accessory proteins include, but are not limited to: cofactors, enzymes, binding partners, or other agents that act to contribute to the effectiveness of the insect-inhibiting agent, for example, aiding its expression, affecting its stability in plants, optimizing free energy for oligomerization, increasing its toxicity and increasing its spectrum of activity. The accessory protein may facilitate uptake of, for example, one or more insect inhibitory agents or enhance the toxic effect of a toxic agent.
[064] Рекомбинантная конструкция ДНК может быть собрана таким образом, что все белки или молекулы дцРНК экспрессируются из одного промотора, или каждый белок или молекула дцРНК находится под контролем отдельного промотора или какой-либо их комбинации. Белки согласно данному изобретению могут быть экспрессированы из мультигенной системы экспрессии, в которой один или большее количество белков TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL экспрессируются из общего нуклеотидного сегмента, который также содержит другие открытые рамки считывания и промоторы, в зависимости от типа выбранной системы экспрессии. Например, бактериальная мультигенная система экспрессии может использовать один промотор для управления экспрессией множественно-связанных/тандемных открытых рамок считывания в пределах одного оперона (т.е. полицистронная экспрессия). В другом примере, растительная мультигенная система экспрессии может использовать множественно-несвязанные или связанные экспрессионные кассеты, причем каждая кассета экспрессирует разный белок или разный агент, например, одну или большее количество молекул дцРНК. [064] A recombinant DNA construct can be assembled such that all proteins or dsRNA molecules are expressed from a single promoter, or each protein or dsRNA molecule is under the control of a single promoter or some combination thereof. The proteins of this invention can be expressed from a multigene expression system in which one or more TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL proteins are expressed from a common nucleotide segment that also contains other open reading frames and promoters, depending on the type of system chosen. expression. For example, a bacterial multigene expression system may use a single promoter to drive the expression of multiple-linked/tandem open reading frames within a single operon (ie, polycistronic expression). In another example, a plant multigene expression system may use multiple-unlinked or linked expression cassettes, with each cassette expressing a different protein or different agent, such as one or more dsRNA molecules.
[065] Рекомбинантные полинуклеотиды или рекомбинантные конструкции ДНК, содержащие последовательность, кодирующую белок TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, могут доставляться в клетки-хозяева с помощью векторов, например, плазмиды, бакуловируса, синтетической хромосомы, вириона, космиды, фагмиды, фага или вирусного вектора. Такие векторы могут быть использованы для достижения стабильной или временной экспрессии последовательности, кодирующей белок TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, в клетке-хозяине, или последующей экспрессии кодируемого полипептида. Экзогенный рекомбинантный полинуклеотид или рекомбинантная конструкция ДНК, которая содержит последовательность, кодирующую белок TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, и которая вводится в клетку-хозяина, называется в данной заявке «трансгеном». [065] Recombinant polynucleotides or recombinant DNA constructs containing a sequence encoding a TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein can be delivered to host cells using vectors, e.g., plasmid, baculovirus, synthetic chromosome, virion, cosmid, phagemid, phage or viral vector. Such vectors can be used to achieve stable or transient expression of a TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein coding sequence in a host cell, or subsequent expression of the encoded polypeptide. An exogenous recombinant polynucleotide or recombinant DNA construct that contains a sequence encoding a TIC4472, TIC4472PL, TIC1425, TIC2613 or TIC2613PL protein and which is introduced into a host cell is referred to in this application as a "transgene".
[066] В данном документе предложены трансгенные бактерии, трансгенные клетки растений, трансгенные растения и части трансгенных растений, которые содержат рекомбинантный полинуклеотид, который экспрессирует любую одну или большее количество TIC4472 или последовательность, кодирующую токсичный белок родственного семейства. Термин «бактериальная клетка» или «бактерия» может включать в себя, но не ограничивается лишь этими: клетку Agrobacterium, Bacillus, Escherichia, Salmonella, Pseudomonas, Brevibacillus, Klebsiella, Erwinia, Rhizobium. Термин «растительная клетка» или «растение» может включать в себя, но не ограничивается лишь двудольным или однодольным растением. Термин «растительная клетка» или «растение» также может включать в себя, но не ограничивается лишь этими: клетку растения или растение люцерны, банана, ячменя, фасоли, брокколи, капусты, капусты декоративной, моркови, маниоки, клещевины, цветной капусты, сельдерея, нута, китайской капусты, цитрусовых, кокосовой пальмы, кофе, кукурузы, клевера, хлопка, тыквенных, огурца, псевдотсуги Мензиса, баклажана, эвкалипта, лена, чеснока, винограда, хмеля, лука-порея, салата-латука, сосны ладанной, проса, дыни, ореха, овса, оливкового дерева, репчатого лука, декоративных растений, пальмовых, пастбищных трав, гороха, арахиса, перца, голубиного гороха, сосновых, картофеля, тополи, тыквы, сосны лучистой, редьки, рапса, риса, корневищ, ржи, дикого шафрана, кустарниковых, сорго, сосны южной, сои, шпината, тыквенных, клубники, сахарной свеклы, сахарного тростника, подсолнечника, кукурузы сахарной, амбрового дерева, батата, проса прутьевидного, чая, табака, помидора, тритикале, дерновой травы, арбуза и пшеницы. В некоторых вариантах осуществления, предложены трансгенные растения и части трансгенных растений, регенерированные из трансгенной растительной клетки. В некоторых вариантах осуществления, трансгенные растения могут быть получены из трансгенного семени, путем отрезания, отламывания, дробления или иным образом отделения части от растения. В некоторых вариантах осуществления, часть растения может быть семенем, семенной коробочкой, листком, цветком, стеблем, корнем или любой их частью или нерегенерируемой частью трансгенной части растения. Как используется в данном контексте, «нерегенерируемая» часть трансгенной части растения представляет собой часть, которая не может быть стимулирована для образования целого растения, или которая не может быть стимулирована для образования целого растения, способного к половому и/или бесполому размножению. В некоторых вариантах осуществления, нерегенерируемая часть части растения представляет собой часть трансгенного семени, семенной коробочки, листка, цветка, стебля или корня. [066] Provided herein are transgenic bacteria, transgenic plant cells, transgenic plants, and transgenic plant parts that contain a recombinant polynucleotide that expresses any one or more TIC4472 or a sequence encoding a toxic related family protein. The term "bacterial cell" or "bacteria" may include, but is not limited to: Agrobacterium cell, Bacillus cell, Escherichia cell, Salmonella cell, Pseudomonas cell, Brevibacillus cell, Klebsiella cell, Erwinia cell, Rhizobium cell. The term "plant cell" or "plant" may include, but is not limited to, dicotyledonous or monocotyledonous plants. The term "plant cell" or "plant" may also include, but is not limited to: a plant cell or plant of alfalfa, banana, barley, bean, broccoli, cabbage, ornamental cabbage, carrot, cassava, castor bean, cauliflower, celery , chickpea, bok choy, citrus, coconut, coffee, corn, clover, cotton, cucurbits, cucumber, menzies, eggplant, eucalyptus, flax, garlic, grapes, hops, leek, lettuce, frankincense pine, millet , melon, walnut, oats, olive tree, onion, ornamental plants, palm, pasture grasses, peas, peanuts, peppers, pigeon peas, pines, potatoes, poplars, pumpkins, radiant pine, radishes, rapeseed, rice, rhizomes, rye , wild saffron, bush, sorghum, southern pine, soybeans, spinach, cucurbits, strawberries, sugar beet, sugar cane, sunflower, sugar corn, amber tree, sweet potato, switchgrass, tea, tobacco, tomato, triticale, turfgrass, watermelon and n shenitsy. In some embodiments, transgenic plants and transgenic plant parts regenerated from a transgenic plant cell are provided. In some embodiments, transgenic plants can be obtained from transgenic seed by cutting, breaking off, crushing, or otherwise separating a portion from the plant. In some embodiments, the plant part may be a seed, pod, leaf, flower, stem, root, or any part thereof or a non-regenerated part of the transgenic plant part. As used herein, a "non-regenerating" portion of a transgenic plant part is a portion that cannot be stimulated to form a whole plant, or that cannot be stimulated to form a whole plant capable of sexual and/or asexual reproduction. In some embodiments, the non-regenerated portion of the plant part is a portion of a transgenic seed, pod, leaf, flower, stem, or root.
[067] Предложены способы получения трансгенных растений, которые содержат количество белка TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, ингибирующего чешуекрылых насекомых. Такие растения могут быть получены путем введения рекомбинантного полинуклеотида, который кодирует любой из белков, предложенных в данной заявке, в клетку растения, и отбор растения, полученного из указанной растительной клетки, которое экспрессирует количество белков, ингибирующие чешуекрылых насекомых. Растения могут быть получены из растительных клеток путем регенерации, методами трансформации семян, пыльцы или меристемы. Способы трансформации растений известны в данной области техники. [067] Methods are provided for producing transgenic plants that contain an amount of Lepidoptera inhibitory protein TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL. Such plants can be obtained by introducing a recombinant polynucleotide that encodes any of the proteins provided herein into a plant cell and selecting a plant derived from said plant cell that expresses an amount of Lepidoptera inhibitory proteins. Plants can be obtained from plant cells by regeneration, seed, pollen or meristem transformation methods. Methods for transforming plants are known in the art.
[068] Также в данном документе раскрыты обработанные растительные продукты, причем обработанный продукт содержит определяемое количество белка TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, сегмента, ингибирующего насекомых, или его фрагмента, или любую его отличительную часть. В определенных вариантах осуществления, обработанный продукт выбирают из группы, состоящей из частей растения, растительной биомассы, масла, муки, сахара, корма для животных, муки, хлопьев, отрубей, пуха, шелухи, обработанных семян, и семян. В определенных вариантах осуществления, обработанный продукт является не регенерируемым. Растительный продукт может включать в себя товарные или другие коммерческие продукты, полученные из трансгенного растения или части трансгенного растения, причем товарный или другие продукты могут отслеживаться посредством торговых связей, путем обнаружения нуклеотидных сегментов или экспрессированной РНК или белков, которые кодируют или содержат отличительные части белка TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL. [068] Also disclosed herein are processed plant products, wherein the processed product contains a detectable amount of TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein, an insect-inhibiting segment or fragment thereof, or any distinctive portion thereof. In certain embodiments, the processed product is selected from the group consisting of plant parts, plant biomass, oil, flour, sugar, animal feed, flour, flakes, bran, fluff, husks, treated seeds, and seeds. In certain embodiments, the processed product is non-recyclable. A plant product may include commercial or other commercial products derived from a transgenic plant or part of a transgenic plant, and commercial or other products can be traced through trade links, by detecting nucleotide segments or expressed RNA or proteins that encode or contain distinctive parts of the TIC4472 protein. , TIC4472PL, TIC1425, TIC2613 or TIC2613PL.
[069] Растения, экспрессирующие белки TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, можно скрещивать путем селекции с трансгенными трансформантами, экспрессирующими другие токсичные белки и/или экспрессирующие другие трансгенные признаки, такие как гены устойчивости к гербицидам, гены, обеспечивающие признаки урожайности или стрессоустойчивости, и т.п., или такие признаки могут быть объединены в один вектор, так что все признаки сцеплены. [069] Plants expressing TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL proteins can be crossed by selection with transgenic transformants expressing other toxic proteins and/or expressing other transgenic traits such as herbicide resistance genes, genes that confer yield traits, or stress tolerance, etc., or such traits can be combined into one vector so that all traits are linked.
[070] Отсылка в данной заявке к «выделенной» молекуле ДНК или аминокислотной молекуле, или эквивалентному термину или фразе, предназначена для обозначения того, что молекула ДНК или аминокислотная молекула присутствует одна или в комбинации с другими соединениями, но не в ее естественной среде. Например, молекула ДНК или аминокислотная молекула будет «выделенной» в рамках данного раскрытия изобретения, если элемент находится не в геноме организма и не в локусе генома, в котором он находится в природе. Для целей данного раскрытия изобретения, любая трансгенная нуклеотидная последовательность, то есть нуклеотидная последовательность ДНК, вставленная в геном клеток растения или бактерии, или присутствующая во внехромосомном векторе, будет рассматриваться как выделенная нуклеотидная последовательность, независимо от того, присутствует она в плазмиде или аналогичной структуре, используемой для трансформации клеток, в геноме растения или бактерии, или присутствует в обнаруживаемых количествах в тканях, потомстве, биологических образцах или товарных продуктах, полученных из растения или бактерии. [070] Reference in this application to an "isolated" DNA molecule or amino acid molecule, or an equivalent term or phrase, is intended to mean that the DNA molecule or amino acid molecule is present alone or in combination with other compounds, but not in its natural environment. For example, a DNA molecule or amino acid molecule will be "isolated" within the scope of this disclosure if the element is not found in the genome of the organism or at the locus of the genome in which it occurs naturally. For the purposes of this disclosure, any transgenic nucleotide sequence, i.e. a DNA nucleotide sequence inserted into the genome of plant or bacterial cells, or present in an extrachromosomal vector, will be considered an isolated nucleotide sequence, whether it is present in a plasmid or similar structure, used for cell transformation, in the genome of a plant or bacterium, or present in detectable amounts in tissues, progeny, biological samples or commercial products derived from a plant or bacterium.
[071] Как дополнительно описано в Примерах, последовательности, кодирующие белки TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, и последовательности, имеющие существенный процент идентичности с TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, могут быть идентифицированы с использованием способов, известных специалистам в данной области техники, например, полимеразной цепной реакцией (ПЦР), термической амплификацией и гибридизацией. Например, белки TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL могут использоваться для получения антител, которые специфически связываются с родственными белками, и могут использоваться для скрининга и поиска других членов белкового класса, которые являются родственными. [071] As further described in the Examples, sequences encoding TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL proteins and sequences having a significant percent identity with TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL can be identified using methods known to those skilled in the art. in the art, for example, polymerase chain reaction (PCR), thermal amplification and hybridization. For example, the TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL proteins can be used to generate antibodies that specifically bind to related proteins and can be used to screen and search for other members of the protein class that are related.
[072] Кроме того, нуклеотидные последовательности, кодирующие токсичные белки TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL, могут использовать в качестве зондов и праймеров для скрининга с целью идентификации других членов класса, применяя способы термоциклирования, или изотермической амплификации и гибридизации. Например, олигонуклеотиды, полученные из последовательности, представленной в SEQ ID NO:3, могут быть использованы для определения наличия или отсутствия трансгена TIC4472PL в образце дезоксирибонуклеиновой кислоты, полученном из товарного продукта. Олигонуклеотиды, полученные из последовательности, представленной в SEQ ID NO:7, можно использовать для определения наличия или отсутствия трансгена TIC2613PL в образце дезоксирибонуклеиновой кислоты, полученном из товарного продукта. Учитывая чувствительность некоторых способов обнаружения нуклеиновых кислот, в которых применяются олигонуклеотиды, ожидается, что олигонуклеотиды, полученные из последовательностей, представленных в SEQ ID NO:3 или SEQ ID NO:9, могут быть использованы для обнаружения трансгена TIC4472PL или TIC2613PL в товарных продуктах, полученных из объединенных источников, где только часть товарного продукта получена из трансгенного растения, содержащего любой из трансгенов. Дополнительно признается, что такие олигонуклеотиды могут быть использованы для внесения вариаций в нуклеотидную последовательность каждой SEQ ID NO:3 и SEQ ID NO:9. Такие «мутационные» олигонуклеотиды полезны для идентификации вариантов аминокислотной последовательности TIC4472PL и TIC2613PL, проявляющих диапазон ингибирующей насекомых активности или разнообразную экспрессию в трансгенных растительных клетках-хозяевах. [072] In addition, the nucleotide sequences encoding the toxic proteins TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL can be used as probes and primers for screening to identify other members of the class using thermal cycling, or isothermal amplification and hybridization methods. For example, oligonucleotides derived from the sequence shown in SEQ ID NO:3 can be used to determine the presence or absence of the TIC4472PL transgene in a deoxyribonucleic acid sample obtained from a commercial product. Oligonucleotides derived from the sequence shown in SEQ ID NO:7 can be used to determine the presence or absence of the TIC2613PL transgene in a deoxyribonucleic acid sample obtained from a commercial product. Given the sensitivity of some nucleic acid detection methods that use oligonucleotides, it is expected that oligonucleotides derived from the sequences shown in SEQ ID NO:3 or SEQ ID NO:9 can be used to detect the TIC4472PL or TIC2613PL transgene in commercial products obtained from pooled sources where only part of the commercial product is derived from a transgenic plant containing any of the transgenes. It is further recognized that such oligonucleotides can be used to introduce variations in the nucleotide sequence of each SEQ ID NO:3 and SEQ ID NO:9. Such "mutation" oligonucleotides are useful for identifying TIC4472PL and TIC2613PL amino acid sequence variants exhibiting a range of insect inhibitory activity or diverse expression in transgenic plant host cells.
[073] Гомологи нуклеотидных последовательностей, например, инсектицидные белки, кодируемые нуклеотидными последовательностями, которые гибридизуются с каждой или любой из последовательностей, раскрытых в данной заявке, в строгих условиях гибридизации, также являются вариантом осуществления данного изобретения. Изобретение также относится к способу обнаружения первой нуклеотидной последовательности, которая гибридизуется со второй нуклеотидной последовательностью, причем первая нуклеотидная последовательность (или ее обратная комплементарная последовательность) кодирует пестицидный белок или его пестицидный фрагмент, и гибридизуется со второй нуклеотидной последовательностью. В таком случае, вторая нуклеотидная последовательность может быть любой из нуклеотидных последовательностей, представленных как SEQ ID NO:3, SEQ ID NO:1, SEQ ID NO:5, SEQ ID NO:7 или SEQ ID NO:9 в строгих условиях гибиридизации. Нуклеотидные кодирующие последовательности гибридизуются друг с другом в соответствующих условиях гибридизации, таких как жесткие условия гибридизации, и белки, кодируемые данными нуклеотидными последовательностями, перекрестно реагируют с антисывороткой, созданной против любого из таких белков. Строгие условия гибридизации, как определено в данном документе, включают в себя, по меньшей мере, гибридизацию при 42°C с последующими двумя промывками в течение пяти минут, каждая при комнатной температуре, с 2X SSC, 0,1% SDS, с последующими двумя промывками в течение тридцати минут, каждая при 65°C в 0,5X SSC, 0,1% SDS. Промывки при еще более высоких температурах устанавливают еще более жесткие условия, например, условия гибридизации при 68 °С с последующей промывкой при 68 °С в 2xSSC, содержащей 0,1% SDS. [073] Nucleotide sequence homologues, for example, insecticidal proteins encoded by nucleotide sequences that hybridize to each or any of the sequences disclosed herein under stringent hybridization conditions, are also an embodiment of this invention. The invention also relates to a method for detecting a first nucleotide sequence that hybridizes to a second nucleotide sequence, wherein the first nucleotide sequence (or its reverse complementary sequence) encodes a pesticidal protein or a pesticidal fragment thereof, and hybridizes to the second nucleotide sequence. In such a case, the second nucleotide sequence may be any of the nucleotide sequences shown as SEQ ID NO:3, SEQ ID NO:1, SEQ ID NO:5, SEQ ID NO:7, or SEQ ID NO:9 under stringent hybridization conditions. Nucleotide coding sequences hybridize with each other under appropriate hybridization conditions, such as stringent hybridization conditions, and the proteins encoded by these nucleotide sequences cross-react with antisera designed against any of such proteins. Stringent hybridization conditions, as defined herein, include at least hybridization at 42°C followed by two washes for five minutes, each at room temperature, with 2X SSC, 0.1% SDS, followed by two washes for thirty minutes each at 65° C. in 0.5X SSC, 0.1% SDS. Washes at even higher temperatures set even more stringent conditions, eg hybridization conditions at 68°C followed by a wash at 68°C in 2xSSC containing 0.1% SDS.
[074] Специалист в данной области техники поймет, что из-за избыточности генетического кода многие другие последовательности способны кодировать такие родственные белки, и такие последовательности в той степени, в которой они функционируют для экспрессии пестицидных белков либо в штаммах Bacillus, либо в растительной клетке, являются вариантами осуществления данного изобретения, признавая, конечно, что многие такие избыточные кодирующие последовательности не будут гибридизоваться при данных условиях с нативными последовательностями Bacillus, кодирующими TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL. В данной заявке рассматривается использование таких и других способов идентификации, известных специалистам в данной области техники, для идентификации последовательностей, кодирующих белки TIC4472, TIC1425 и TIC2613, и последовательностей, имеющих существенный процент идентичности с последовательностями, кодирующими белки TIC4472, TIC1425 и TIC2613. [074] One skilled in the art will appreciate that, due to the redundancy of the genetic code, many other sequences are capable of encoding such related proteins, and such sequences to the extent that they function to express pesticidal proteins either in Bacillus strains or in a plant cell , are embodiments of this invention, recognizing, of course, that many such redundant coding sequences will not hybridize under given conditions to native Bacillus sequences encoding TIC4472, TIC4472PL, TIC1425, TIC2613 and TIC2613PL. This application discusses the use of these and other identification methods known to those skilled in the art to identify sequences encoding the TIC4472, TIC1425 and TIC2613 proteins and sequences that have a significant percentage of identity with sequences encoding the TIC4472, TIC1425 and TIC2613 proteins.
[075] Данное раскрытие изобретения также предусматривает использование молекулярных способов, известных в данной области техники, для конструирования и клонирования коммерчески полезных белков, включающих в себя химеры белков из пестицидных белков; например, химеры могут быть собраны из сегментов белков TIC4472, TIC4472PL, TIC1425, TIC2613 или TIC2613PL, чтобы получить дополнительные полезные варианты осуществления, включая объединение сегментов белков TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL с сегментами различных белков, отличных от TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL, и родственных белков. Белки TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL могут быть подвергнуты выравниванию друг с другом, и с другими из Bacillus thuringiensis или другими пестицидными белками (независимо от того, являются ли они тесно или отдаленно родственными филогенетически), и могут быть идентифицированы сегменты каждого такого белка, что удобно для обмена между выровненными белками, что приводит к конструированию химерных белков. Такие химерные белки могут быть подвергнуты анализу - биоанализу с вредителем, и охарактеризованы на наличие или отсутствие повышенной биологической активности или расширения спектра вредителей-мишеней, по сравнению с исходными белками, из которых был получен каждый такой сегмент химеры. Пестицидную активность полипептидов можно дополнительно спроектировать для активности в отношении конкретного вредителя, или более широкого спектра вредителей, путем замены доменов или сегментов другими белками, или с использованием способов направленной эволюции, известных в данной области техники. [075] This disclosure also provides for the use of molecular methods known in the art to construct and clone commercially useful proteins, including protein chimeras from pesticidal proteins; for example, chimeras can be assembled from TIC4472, TIC4472PL, TIC1425, TIC2613, or TIC2613PL protein segments to provide additional useful embodiments, including combining TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL protein segments with segments of different proteins other than TIC4472, TIC4472PL, TIC1425, TIC2613 and TIC2613PL, and related proteins. The TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL proteins can be aligned with each other, and with others from Bacillus thuringiensis or other pesticidal proteins (regardless of whether they are closely or distantly related phylogenetically), and segments of each such can be identified. protein, which is convenient for exchange between aligned proteins, resulting in the construction of chimeric proteins. Such chimeric proteins can be subjected to a bioassay with a pest, and characterized for the presence or absence of increased biological activity or broadening of the spectrum of target pests, compared with the original proteins from which each such segment of the chimera was derived. The pesticidal activity of polypeptides can be further engineered for activity against a particular pest, or a broader range of pests, by replacing domains or segments with other proteins, or using directed evolution techniques known in the art.
[076] Также в данной заявке раскрыты способы борьбы с насекомыми, в частности, заражением чешуекрылыми культурных растений, с помощью белков TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL. Такие способы могут включать в себя выращивание растения, содержащего ингибирующее насекомых или чешуекрылых количество токсичного белка TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL. В определенных вариантах осуществления, такие способы могут дополнительно включать в себя любое одно или большее количество из: (i) применение любой композиции, содержащей или кодирующей токсичный белок TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL, к растению или семени, которое дает начало растению; и (ii) трансформацию растения или растительной клетки, которая дает растение с полинуклеотидом, кодирующим токсичный белок TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL. В целом, как правило, предполагается, что токсичный белок TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL может быть предоставлен в композиции, предоставлен в микроорганизме, или предоставлен в трансгенном растении, для наделения ингибирующей насекомых активностью в отношении чешуекрылых насекомых. [076] Also disclosed in this application are methods for controlling insects, in particular Lepidoptera infestation of cultivated plants, using the TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL proteins. Such methods may include growing a plant containing an insect or lepidoptera inhibitory amount of the toxic protein TIC4472, TIC4472PL, TIC1425, TIC2613 and TIC2613PL. In certain embodiments, such methods may further include any one or more of: (i) applying any composition containing or encoding the toxic TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL protein to a plant or seed that gives rise to a plant ; and (ii) transforming a plant or plant cell that produces a plant with a polynucleotide encoding the toxic protein TIC4472, TIC4472PL, TIC1425, TIC2613 and TIC2613PL. In general, it is generally contemplated that the toxic protein TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL can be provided in a composition, provided in a microorganism, or provided in a transgenic plant, to confer insect-inhibiting activity against Lepidoptera.
[077] В некоторых вариантах осуществления, рекомбинантная молекула нуклеиновой кислоты токсичных белков TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL является инсектицидно активным ингредиентом композиции, ингибирующей насекомых, полученной культивированием рекомбинантной Bacillus или любой другой рекомбинантной бактериальной клетки, трансформированной для экспрессии токсичного белка TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL, в условиях, подходящих для экспрессии токсичного белка TIC4472, TIC4472PL, TIC1425, TIC2613, и TIC2613PL. Такая композиция может быть получена путем высушивания, лиофилизации, гомогенизации, экстракции, фильтрации, центрифугирования, седиментации или концентрирования культуры таких рекомбинантных клеток, экспрессирующих/продуцирующих указанный рекомбинантный полипептид. Такой процесс может привести к получению Bacillus или другого энтомопатогенного бактериального клеточного экстракта, клеточной суспензии, клеточного гомогената, клеточного лизата, клеточного супернатанта, клеточного фильтрата или клеточного осадка. Благодаря получению рекомбинантных полипептидов, произведенных таким образом, композиция, которая содержит рекомбинантные полипептиды, может содержать бактериальные клетки, бактериальные споры и параспоральные тельца включения, и может быть приготовлена для различного применения, в том числе в качестве сельскохозяйственных аэрозолей, ингибирующих насекомых, или в качестве готовых форм, ингибирующих насекомых в пищевых биоанализах. [077] In some embodiments, the recombinant nucleic acid molecule of the toxic TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL toxic proteins is an insecticidally active ingredient of an insect-inhibiting composition obtained by culturing recombinant Bacillus or any other recombinant bacterial cell transformed to express the toxic TIC4472 protein, TIC4472PL, TIC1425, TIC2613 and TIC2613PL, under conditions suitable for the expression of the toxic protein TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL. Such a composition can be obtained by drying, lyophilization, homogenization, extraction, filtration, centrifugation, sedimentation or concentration of a culture of such recombinant cells expressing/producing said recombinant polypeptide. Such a process may result in the production of a Bacillus or other entomopathogenic bacterial cell extract, cell suspension, cell homogenate, cell lysate, cell supernatant, cell filtrate, or cell pellet. By providing recombinant polypeptides thus produced, a composition that contains the recombinant polypeptides can contain bacterial cells, bacterial spores, and parasporal inclusion bodies, and can be formulated for a variety of uses, including as insect-inhibiting agricultural aerosols or as formulations that inhibit insects in food bioassays.
[078] В одном варианте осуществления, для уменьшения вероятности развития устойчивости, композиция, ингибирующая насекомых, содержащая TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL, может дополнительно содержать, по меньшей мере, один дополнительный полипептид, который проявляет ингибирующую насекомых активность в отношении тех же чешуекрылых видов насекомых, но который отличается от токсичного белка TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL. Возможные дополнительные полипептиды для такой композиции включают в себя ингибирующий насекомых белок и ингибирующую насекомых молекулу дцРНК. Один пример использования таких рибонуклеотидных последовательностей для борьбы с насекомыми-вредителями описан в Baum et al. (публикация патента США 2006/0021087 А1). Такой дополнительный полипептид для борьбы с чешуекрылыми вредителями может быть выбран из группы, состоящей из белка, ингибирующего насекомых, такого как, но не ограниченного лишь Cry1A (патент США № 5880275), Cry1Ab, Cry1Ac, Cry1A.105, Cry1Ae, Cry1B (публикация патента США № 10/525318), Cry1C (патент США № 6033874), Cry1D, Cry1Da и его производные, Cry1E, Cry1F, и химеры Cry1A/F (патент США № 7070982; 6962705; и 6713063), Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, химеры Cry1-типа, такой как, но не ограниченной лишь TIC836, TIC860, TIC867, TIC869, и TIC1100 (публикация международной заявки WO2016/061391 (A2)), TIC2160 (публикация международной заявки WO2016/061392(A2)), Cry2A, Cry2Ab (патент США № 7064249), Cry2Ae, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry43A, Cry43B, Cry51Aa1, ET66, TIC400, TIC800, TIC834, TIC1415, Vip3A, VIP3Ab, VIP3B, AXMI-001, AXMI-002, AXMI-030, AXMI-035, и AXMI-045 (публикация патента США 2013-0117884 A1), AXMI-52, AXMI-58, AXMI-88, AXMI-97, AXMI-102, AXMI-112, AXMI-117, AXMI-100 (публикация патента США 2013-0310543 A1), AXMI-115, AXMI-113, AXMI-005 (публикация патента США 2013-0104259 A1), AXMI-134 (публикация патента США 2013-0167264 A1), AXMI-150 (публикация патента США 2010-0160231 A1), AXMI-184 (публикация патента США 2010-0004176 A1), AXMI-196, AXMI-204, AXMI-207, axmi209 (публикация патента США 2011-0030096 A1), AXMI-218, AXMI-220 (публикация патента США 2014-0245491 A1), AXMI-221z, AXMI-222z, AXMI-223z, AXMI-224z, AXMI-225z (публикация патента США 2014-0196175 A1), AXMI-238 (публикация патента США 2014-0033363 A1), AXMI-270 (публикация патента США 2014-0223598 A1), AXMI-345 (публикация патента США 2014-0373195 A1), AXMI-335 (публикация международной заявки WO2013/134523(A2)), DIG-3 (публикация патента США 2013-0219570 A1), DIG-5 публикация патента США 2010-0317569 A1), DIG-11 (публикация патента США 2010-0319093 A1), AfIP-1A и его производных (публикация патента США 2014-0033361 A1), AfIP-1B и его производных (публикация патента США 2014-0033361 A1), PIP-1APIP-1B (публикация патента США 2014-0007292 A1), PSEEN3174 (публикация патента США 2014-0007292 A1), AECFG-592740 (публикация патента США 2014-0007292 A1), Pput_1063 (публикация патента США 2014-0007292 A1), DIG-657 (публикация международной заявки WO2015/195594(A2)), Pput_1064 (публикация патента США 2014-0007292 A1), GS-135 и его производных (публикация патента США 2012-0233726 A1), GS153 и его производных (публикация патента США 2012-0192310 A1), GS154 и его производных (публикация патента США 2012-0192310 A1), GS155 и его производных (публикация патента США 2012-0192310 A1), SEQ ID NO:2 и его производных, как описано в публикации патента США 2012-0167259 A1, SEQ ID NO:2 и его производных, как описано в публикации патента США 2012-0047606 A1, SEQ ID NO:2 и его производных, как описано в публикации патента США 2011-0154536 A1, SEQ ID NO:2 и его производных, как описано в публикации патента США 2011-0112013 A1, SEQ ID NO:2 и 4, и их производных, как описано в публикации патента США 2010-0192256 A1, SEQ ID NO:2 и его производных, как описано в публикации патента США 2010-0077507 A1, SEQ ID NO:2 и его производных, как описано в публикации патента США 2010-0077508 A1, SEQ ID NO:2 и его производных, как описано в публикации патента США 2009-0313721 A1, SEQ ID NO:2 или 4, и их производных, как описано в публикации патента США 2010-0269221 A1, SEQ ID NO:2 и его производных, как описано в патенте США № 7772465 (B2), CF161_0085 и его производных, как описано в WO2014/008054 A2, токсичных для чешуекрылых белков и их производных, как описано в публикациях патентов США US2008-0172762 A1, US2011-0055968 A1, и US2012-0117690 A1; SEQ ID NO:2 и его производных, как описано в US7510878(B2), SEQ ID NO:2 и его производных, как описано в патенте США № 7812129(B1); и т.п. [078] In one embodiment, to reduce the likelihood of developing resistance, an insect inhibitory composition comprising TIC4472, TIC4472PL, TIC1425, TIC2613, and TIC2613PL may further comprise at least one additional polypeptide that exhibits insect inhibitory activity against those same Lepidoptera species of insects, but which differs from the toxic protein TIC4472, TIC4472PL, TIC1425, TIC2613 and TIC2613PL. Possible additional polypeptides for such a composition include an insect inhibitory protein and an insect inhibitory dsRNA molecule. One example of the use of such ribonucleotide sequences for insect pest control is described in Baum et al. (US Patent Publication 2006/0021087 A1). Such additional Lepidoptera pest control polypeptide may be selected from the group consisting of an insect inhibitory protein such as, but not limited to, Cry1A (US Pat. No. 5,880,275), Cry1Ab, Cry1Ac, Cry1A.105, Cry1Ae, Cry1B US No. 10/525318), Cry1C (US patent No. 6033874), Cry1D, Cry1Da and its derivatives, Cry1E, Cry1F, and Cry1A/F chimeras (US patent No. 7070982; 6962705; and 6713063), Cry1G, Cry1H, Cry1I, Cry1J , Cry1K, Cry1L, Cry1-type chimeras such as but not limited to TIC836, TIC860, TIC867, TIC869, and TIC1100 (International Application Publication WO2016/061391 (A2)), TIC2160 (International Application Publication WO2016/061392(A2) ), Cry2A, Cry2Ab (U.S. Patent No. 7064249), Cry2Ae, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry43A, Cry43B, Cry51Aa1, ET66, TIC400, TIC800, TIC834, TIC1415, Vip3A, VIP3Ab, VIP3B, AXMI- 001, AXMI-002, AXMI-030, AXMI-035, and AXMI-045 (US Patent Publication 2013-0117884 A1), AXMI-52, AXMI-58, AXMI-88, AXMI-97, AXMI-102, AXMI- 112 AXMI-117, AXMI-100 (US Patent Publication 2013-0310543 A1), AXMI-115, AXMI-113, AXMI-005 (US Patent Publication 2013-0104259 A1), AXMI-134 (US Patent Publication 2013-0167264 A1) , AXMI-150 (US Patent Publication 2010-0160231 A1), AXMI-184 (US Patent Publication 2010-0004176 A1), AXMI-196, AXMI-204, AXMI-207, axmi209 (US Patent Publication 2011-0030096 A1), AXMI-218, AXMI-220 (US Patent Publication 2014-0245491 A1), AXMI-221z, AXMI-222z, AXMI-223z, AXMI-224z, AXMI-225z (US Patent Publication 2014-0196175 A1), AXMI-238 ( US Patent Publication 2014-0033363 A1), AXMI-270 (US Patent Publication 2014-0223598 A1), AXMI-345 (US Patent Publication 2014-0373195 A1), AXMI-335 (International Application Publication WO2013/134523(A2)), DIG-3 (US Patent Publication 2013-0219570 A1), DIG-5 US Patent Publication 2010-0317569 A1), DIG-11 (US Patent Publication 2010-0319093 A1), AfIP-1A and its derivatives (US Patent Publication 2014- 0033361 A1), AfIP-1B and its derivatives (US Patent Publication 2 014-0033361 A1), PIP-1APIP-1B (US Patent Publication 2014-0007292 A1), PSEEN3174 (US Patent Publication 2014-0007292 A1), AECGF-592740 (US Patent Publication 2014-0007292 A1), Pput_1063 (US Patent Publication 2014-0007292 A1), DIG-657 (International Application Publication WO2015/195594(A2)), Pput_1064 (US Patent Publication 2014-0007292 A1), GS-135 and its derivatives (US Patent Publication 2012-0233726 A1), GS153 and its derivatives (US Patent Publication 2012-0192310 A1), GS154 and its derivatives (US Patent Publication 2012-0192310 A1), GS155 and its derivatives (US Patent Publication 2012-0192310 A1), SEQ ID NO:2 and its derivatives, as described in US Patent Publication 2012-0167259 A1, SEQ ID NO:2 and derivatives thereof, as described in US Patent Publication 2012-0047606 A1, SEQ ID NO:2 and derivatives thereof, as described in US Patent Publication 2011-0154536 A1, SEQ ID NO:2 and derivatives thereof as described in US Patent Publication 2011-0112013 A1, SEQ ID NO:2 and 4 and derivatives thereof as described in 2010-0192256 A1, SEQ ID NO:2 and derivatives thereof as described in US Patent Publication 2010-0077507 A1, SEQ ID NO:2 and derivatives thereof as described in US Patent Publication 2010-0077508 A1, SEQ ID NO:2 and its derivatives as described in US Patent Publication 2009-0313721 A1, SEQ ID NO:2 or 4, and their derivatives as described in US Patent Publication 2010-0269221 A1, SEQ ID NO:2 and its derivatives, as described in US Pat. -0117690 A1; SEQ ID NO:2 and its derivatives, as described in US7510878(B2), SEQ ID NO:2 and its derivatives, as described in US patent No. 7812129(B1); etc.
[079] В других вариантах осуществления, такая композиция/готовая форма может дополнительно содержать, по меньшей мере, один дополнительный полипептид, который проявляет ингибирующую насекомых активность в отношении насекомых, которые не ингибируются другим ингибирующим насекомых белком согласно данному изобретению, чтобы расширить полученный спектр ингибирования насекомых. Например, для борьбы с членистохоботными вредителями, комбинации ингибирующих насекомых белков согласно данному изобретению могут быть использованы с активными против членистохоботных белками, такими как TIC1415 (публикация патента США 2013-0097735 A1), TIC807 (патент США № 8609936), TIC834 (публикация патента США 2013-0269060 A1), AXMI-036 (публикация патента США 2010-0137216 A1), и AXMI-171 (публикация патента США 2013-0055469 A1). Дополнительно, полипептид для борьбы с жесткокрылыми вредителями может быть выбран из группы, состоящей из белка, ингибирующего насекомых, такого как, но не ограничиваясь лишь этими: Cry3Bb (патент США № 6501009), вариантов Cry1C, вариантов Cry3A, Cry3, Cry3B, Cry34/35, 5307, AXMI134 (публикация патента США 2013-0167264 A1) AXMI-184 (публикация патента США 2010-0004176 A1), AXMI-205 (публикация патента США 2014-0298538 A1), axmi207 (публикация патента США 2013-0303440 A1), AXMI-218, AXMI-220 (публикация патента США 20140245491A1), AXMI-221z, AXMI-223z (публикация патента США 2014-0196175 A1), AXMI-279 (публикация патента США 2014-0223599 A1), AXMI-R1 и его вариантов (публикация патента США 2010-0197592 A1, TIC407, TIC417, TIC431, TIC807, TIC853, TIC901, TIC1201, TIC3131, DIG-10 (публикация патента США 2010-0319092 A1), eHIPs (публикация заявки на патент США № 2010/0017914), IP3 и его варианты (публикация патента США 2012-0210462 A1), и ϖ-Hexatoxin-Hv1a (публикация заявки на патент США US2014-0366227 A1). [079] In other embodiments, such a composition/formulation may further comprise at least one additional polypeptide that exhibits insect-inhibiting activity against insects that are not inhibited by another insect-inhibiting protein of the present invention to broaden the resulting inhibition spectrum. insects. For example, to control arthropod pests, combinations of insect inhibitory proteins of the present invention can be used with anti-arthropod proteins such as TIC1415 (U.S. Patent Publication 2013-0097735 A1), TIC807 (U.S. Patent No. 2013-0269060 A1), AXMI-036 (US Patent Publication 2010-0137216 A1), and AXMI-171 (US Patent Publication 2013-0055469 A1). Additionally, the hemipteran pest control polypeptide can be selected from the group consisting of an insect inhibitory protein such as, but not limited to: Cry3Bb (US Pat. No. 6,501,009), Cry1C variants, Cry3A variants, Cry3, Cry3B, Cry34/ 35, 5307, AXMI134 (US Patent Publication 2013-0167264 A1) AXMI-184 (US Patent Publication 2010-0004176 A1), AXMI-205 (US Patent Publication 2014-0298538 A1), axmi207 (US Patent Publication 2013-0303440 A1) , AXMI-218, AXMI-220 (U.S. Patent Pub 20140245491A1), AXMI-221z, AXMI-223z (U.S. Patent Pub 2014-0196175 A1), AXMI-279 (U.S. Patent Pub 2014-0223599 A1), AXMI-R1 and its variants (US Patent Publication 2010-0197592 A1, TIC407, TIC417, TIC431, TIC807, TIC853, TIC901, TIC1201, TIC3131, DIG-10 (US Patent Publication 2010-0319092 A1), eHIPs (US Patent Application Publication No. 2010/0017914 ), IP3 and variants thereof (US Patent Publication 2012-0210462 A1), and ϖ-Hexatoxin-Hv1a (US Patent Application Publication US2014-0366227 A1).
[080] Дополнительные полипептиды для борьбы с насекомыми-вредителями из жесткокрылых, чешуекрылых, членистохоботных можно найти на веб-сайте классификации токсинов Bacillus thuringiensis, поддерживаемом Neil Crickmore (во всемирной паутине по адресу btnomenclature.info). [080] Additional polypeptides for controlling insect pests from Coleoptera, Lepidoptera, Arthrostomes can be found on the Bacillus thuringiensis toxin classification website maintained by Neil Crickmore (on the World Wide Web at btnomenclature.info).
[081] В данной области техники задокументирована вероятность развития устойчивости у насекомых к определенным инсектицидам. Одна из стратегий управления устойчивостью к насекомым заключается в использовании трансгенных культур, которые экспрессируют два различных агента, ингибирующих насекомых, которые действуют различными способами. Следовательно, любое насекомое, обладающее устойчивостью к одному из агентов, ингибирующих насекомых, может контролироваться другим агентом, ингибирующим насекомых. Другая стратегия управления устойчивостью к насекомым предусматривает применение растений, которые не защищены от целевых чешуекрылых видов-вредителей, обеспечивая защищенное место для таких незащищенных растений. Один конкретный пример описан в патенте США № 6551962, который включен в полном объеме посредством ссылки. [081] Insect resistance to certain insecticides has been documented in the art. One strategy for managing insect resistance is to use transgenic crops that express two different insect inhibitory agents that act in different ways. Therefore, any insect that is resistant to one of the insect inhibitory agents can be controlled by the other insect inhibitory agent. Another insect resistance management strategy involves the use of plants that are not protected against the target Lepidoptera pest species, providing a protected site for such exposed plants. One specific example is described in US Pat. No. 6,551,962, which is incorporated by reference in its entirety.
[082] Другие варианты осуществления, такие как пестицидные химические агенты местного применения, которые предназначены для борьбы с вредителями, которых также контролируют с помощью белков, раскрытых в данном документе, следует использовать вместе с белками при обработке семян, готовые формы для опрыскивания, полива или смачивания могут применяться непосредственно к почве (грунтовое орошение), применяться для выращивания растений, экспрессирующих белки, раскрытые в данном документе, или готовятся для применения к семенам, содержащим один или большее количество трансгенов, кодирующих один или большее количество раскрытых белков. Такие готовые формы для применения при обработке семян можно наносить с помощью различных клейких веществ и усилителей клейкости, известных в данной области техники. Такие готовые формы могут содержать пестициды, которые являются синергетическими по способу действия с раскрытыми белками, при условии что готовая форма пестицидов действует по другому принципу для борьбы с теми же или аналогичными вредителями, которых можно контролировать с помощью раскрытых белков, или при условии что пестициды действуют для борьбы с вредителями в пределах более широкого круга хозяев или видов вредителей растений, которые не контролируются эффективно пестицидными белками TIC4472, TIC4472PL, TIC1425, TIC2613 и TIC2613PL. [082] Other embodiments, such as topical pesticidal chemical agents that are designed to control pests that are also controlled by the proteins disclosed herein, should be used with the proteins in seed treatment, spray, water, or wettings can be applied directly to the soil (ground irrigation), used to grow plants expressing the proteins disclosed herein, or prepared for application to seeds containing one or more transgenes encoding one or more of the disclosed proteins. Such formulations for use in seed treatment can be applied with various adhesives and tackifiers known in the art. Such formulations may contain pesticides that are synergistic in mode of action with the disclosed proteins, provided that the pesticide formulation acts differently to control the same or similar pests that can be controlled by the disclosed proteins, or provided the pesticides act to control pests within a wider range of hosts or plant pest species that are not effectively controlled by the pesticidal proteins TIC4472, TIC4472PL, TIC1425, TIC2613 and TIC2613PL.
[083] Вышеупомянутая композиция/готовая форма может дополнительно содержать приемлемый с точки зрения сельского хозяйства носитель, например корм, порошок, пыль, пеллеты, гранулы, спрей, эмульсию, коллоидную суспензию, водный раствор, препарат спор/кристаллов Bacillus, удобрение для семян, рекомбинантную растительную клетку/растительную ткань/семя/растение, трансформированные для экспрессии одного или большего количества белков, или бактерию, трансформированную для экспрессии одного или большего количества белков. В зависимости от уровня ингибирования насекомых или инсектицидного ингибирования, присущего рекомбинантному полипептиду, и количества препарата, применяемого к растению, или пищевого анализа, композиция/ готовая форма могут содержать различные массовые количества рекомбинантного полипептида, например, от 0,0001% до 0,001% до 0,01% до 1% до 99% по массе рекомбинантного полипептида. [083] The above composition/formulation may further comprise an agriculturally acceptable carrier, such as feed, powder, dust, pellets, granules, spray, emulsion, colloidal suspension, aqueous solution, Bacillus spore/crystal preparation, seed fertilizer, a recombinant plant cell/plant tissue/seed/plant transformed to express one or more proteins, or a bacterium transformed to express one or more proteins. Depending on the level of insect inhibition or insecticidal inhibition inherent in the recombinant polypeptide and the amount of drug applied to the plant or nutritional analysis, the composition/formulation may contain various mass amounts of the recombinant polypeptide, for example, from 0.0001% to 0.001% to 0 01% to 1% to 99% by weight of the recombinant polypeptide.
[084] Принимая во внимание вышеизложенное, специалистам в данной области техники должно быть понятно, что могут быть внесены изменения в конкретные аспекты, которые раскрыты, и все же получить аналогичный или похожий результат без отклонения от сущности и объема изобретения. Таким образом, конкретные структурные и функциональные детали, раскрытые в данном документе, не должны интерпретироваться как ограничивающие. Следует понимать, что полное раскрытие каждого источника, цитируемого в данном документе, включено в раскрытие данной заявки. [084] In view of the foregoing, those skilled in the art will appreciate that changes can be made to the specific aspects that are disclosed and still achieve a similar or similar result without deviating from the spirit and scope of the invention. Thus, the specific structural and functional details disclosed herein should not be interpreted as limiting. It should be understood that the full disclosure of each source cited in this document is included in the disclosure of this application.
ПРИМЕРЫEXAMPLES
Пример 1Example 1
Обнаружение, клонирование и экспрессия TIC4472, TIC1425 и TIC2613Detection, cloning and expression of TIC4472, TIC1425 and TIC2613
[085] Последовательности, кодирующие три новых пестицидных белка Bacillus thuringiensis, были идентифицированы, клонированы, подтверждены и протестированы в биоанализе c насекомыми. Пестицидные белки TIC4472, TIC1425 и TIC2613, выделенные из штаммов Bacillus thuringiensis EG10742, EG10731 и EG5408 соответственно, представляют новые Cry1Ca-подобные белки. [085] The sequences encoding three new Bacillus thuringiensis pesticidal proteins have been identified, cloned, validated and tested in insect bioassays. Pesticide proteins TIC4472, TIC1425, and TIC2613 isolated from Bacillus thuringiensis strains EG10742, EG10731, and EG5408, respectively, represent new Cry1Ca-like proteins.
[086] Праймеры для полимеразной цепной реакции (ПЦР) были разработаны для амплификации полной копии кодирующей области для TIC4472, TIC1425 и TIC2613 из общей геномной ДНК, выделенной из штаммов Bacillus thuringiensis EG10742, EG10731 и EG5408, соответственно. Ампликоны ПЦР также содержали кодоны инициации и терминации трансляции каждой кодирующей последовательности. [086] Polymerase chain reaction (PCR) primers were designed to amplify a complete copy of the coding region for TIC4472, TIC1425, and TIC2613 from total genomic DNA isolated from Bacillus thuringiensis strains EG10742, EG10731, and EG5408, respectively. The PCR amplicons also contained translation initiation and translation termination codons for each coding sequence.
[087] Каждый из ампликонов клонировали с использованием способов, известных в данной области техники, в экспрессирующие векторы Bt (Bacillus thuringiensis), функционально связанные с экспрессируемым промотором Bt. [087] Each of the amplicons was cloned using methods known in the art into Bt ( Bacillus thuringiensis ) expression vectors operably linked to an expressed Bt promoter.
Пример 2Example 2
TIC4472, TIC1425 и TIC2613 демонстрируют активность против чешуекрылых в биоанализе с насекомымиTIC4472, TIC1425 and TIC2613 show activity against Lepidoptera in an insect bioassay
[088] Биологическую активность пестицидных белков TIC4472, TIC1425 и TIC2613 оценивали путем продуцирования белка в Bt-экспрессирующем хозяине. Штамм Bt, экспрессирующий TIC4472, TIC1425 и TIC2613, выращивали в течение двадцати четырех (24) часов, а затем в пищу насекомых добавляли либо препарат спор кристаллов, либо препарат солюбилизированного белка. Смертность и задержку роста оценивали путем сравнения роста и развития насекомых на рационе с культурой из штамма Bt, экспрессирующего TIC4472, TIC1425 и TIC2613, с насекомыми на рационе с необработанной контрольной культурой. [088] The biological activity of the pesticide proteins TIC4472, TIC1425 and TIC2613 was evaluated by protein production in a Bt -expressing host. The Bt strain expressing TIC4472, TIC1425, and TIC2613 was grown for twenty-four (24) hours, and then either a crystal spore preparation or a solubilized protein preparation was added to insect food. Mortality and stunting were assessed by comparing the growth and development of insects on a diet with a culture from a Bt strain expressing TIC4472, TIC1425 and TIC2613 with insects on a diet with an untreated control culture.
[089] Препараты TIC4472 были проанализированы в отношении видов чешуекрылых - Helicoverpa zea (две колонии (CEW и CEWUC)), совки хлопковой американской (CLW, Alabama argillacea), огневки кукурузной (ECB, Ostrinia nubilalis), кукурузной лиственной совки (FAW, Spodoptera frugiperda), Chrysodeixis includens (SBL), Spodoptera eridania (SAW), Diatraea grandiosella (SWCB), Diatraea saccharalis (SCB), Cry2Ab устойчивой колонии Diatraea saccharalis (SCB2R), Heliothis virescens (TBW), и Anticarsia gemmatalis (VBW); видов жесткокрылых - колорадского жука (CPB, Leptinotarsa decemlineata) и Diabrotica virgifera virgifera (WCB); вида членистохоботных - Lygus lineolaris (TPB), Lygus hesperus (WTP); и видов двукрылых - комара желтолихорадочного (Aedes aegypti). Препараты TIC1425 были проанализированы против видов чешуекрылых - совки-ипсилон (BCW, Agrotis ipsilon), совки хлопковой американской (CLW, Alabama argillacea), огневки кукурузной (ECB, Ostrinia nubilalis), кукурузной лиственной совки (FAW, Spodoptera frugiperda), Agrotis ipsilon (BCW), Diatraea grandiosella (SWCB), и Diatraea saccharalis (SCB); и видов жесткокрылых - Diabrotica virgifera virgifera (WCB) и Diabrotica undecimpunctata howardi. Препараты TIC2613 были проанализированы против видов чешуекрылых - Helicoverpa zea (две колонии (CEW и CEWUC)), совки хлопковой американской (CLW, Alabama argillacea), огневки кукурузной (ECB, Ostrinia nubilalis), кукурузной лиственной совки (FAW, Spodoptera frugiperda), Chrysodeixis includens (SBL), Spodoptera eridania (SAW), совки-ипсилон (BCW, Agrotis ipsilon), Diatraea grandiosella (SWCB), Heliothis virescens (TBW), и Anticarsia gemmatalis (VBW); видов жесткокрылых - колорадского жука (CPB, Leptinotarsa decemlineata), Diabrotica virgifera virgifera (WCB) и Diabrotica undecimpunctata howardi; и видов членистохоботных - Lygus lineolaris (TPB), Lygus hesperus (WTP). [089] TIC4472 preparations were analyzed against Lepidoptera species - Helicoverpa zea (two colonies (CEW and CEWUC)), American cotton cutworm ( CLW, Alabama argillacea), Corn moth (ECB, Ostrinia nubilalis ), Corn fall armyworm (FAW, Spodoptera frugiperda ), Chrysodeixis includens (SBL), Spodoptera eridania (SAW), Diatraea grandiosella (SWCB), Diatraea saccharalis (SCB), Cry2Ab resistant colony Diatraea saccharalis (SCB2R), Heliothis virescens (TBW), and Anticarsia gemmatalis (VBW); Coleoptera species - Colorado potato beetle (CPB, Leptinotarsa decemlineata ) and Diabrotica virgifera virgifera (WCB); arthroprobosmic species - Lygus lineolaris (TPB), Lygus hesperus (WTP); and the Diptera species, the yellow fever mosquito ( Aedes aegypti ). TIC1425 preparations were analyzed against species of Lepidoptera - ipsilon cutworm (BCW, Agrotis ipsilon ), American cotton cutworm (CLW, Alabama argillacea), corn moth (ECB, Ostrinia nubilalis ), fall armyworm (FAW, Spodoptera frugiperda ), Agrotis ipsilon ( BCW), Diatraea grandiosella (SWCB), and Diatraea saccharalis (SCB); and beetle species - Diabrotica virgifera virgifera (WCB) and Diabrotica undecimpunctata howardi. TIC2613 preparations were analyzed against Lepidoptera species - Helicoverpa zea (two colonies (CEW and CEWUC)), American cotton bollworm (CLW, Alabama argillacea), Corn moth (ECB, Ostrinia nubilalis ), Fall armyworm (FAW, Spodoptera frugiperda ), Chrysodeixis includens (SBL), Spodoptera eridania (SAW), epsilon cutworms (BCW, Agrotis ipsilon ), Diatraea grandiosella (SWCB), Heliothis virescens (TBW), and Anticarsia gemmatalis (VBW); beetle species - Colorado potato beetle (CPB, Leptinotarsa decemlineata ), Diabrotica virgifera virgifera (WCB) and Diabrotica undecimpunctata howardi ; and species of arthropods - Lygus lineolaris (TPB), Lygus hesperus (WTP).
[090] Активность при биоанализе, наблюдаемая для каждого белка, выращенного в хозяине Bt, представлена ниже в Таблицах 3 и 4, причем «+» обозначает активность, «NT» указывает, что токсин не был проанализирован против данного конкретного насекомого-вредителя, «S» обозначает задержку роста, и «М» обозначает смертность. Препараты TIC4472, TIC1425 и TIC2613 не продемонстрировали активности в отношении жесткокрылых и членистохоботных насекомых-вредителей, проанализированных для каждого белка. TIC4472 также продемонстрировал активность против комара желтолихорадочного (Aedes aegypti). Все три токсина продемонстрировали устойчивость к многочисленным чешуекрылым насекомым-вредителям, как показано в Таблицах 3 и 4. [090] The bioassay activity observed for each protein grown in the Bt host is shown in Tables 3 and 4 below, with "+" indicating activity, "NT" indicating that the toxin was not assayed against that particular insect pest, "S" stands for stunting, and "M" stands for mortality. TIC4472, TIC1425, and TIC2613 preparations showed no activity against beetles and arthropods analyzed for each protein. TIC4472 has also shown activity against the yellow fever mosquito ( Aedes aegypti ). All three toxins showed resistance to numerous Lepidoptera insect pests, as shown in Tables 3 and 4.
Таблица 3. Биоанализ активности TIC4472, TIC1425 и TIC2613 в отношении насекомых-вредителей.Table 3. Bioassay of activity of TIC4472, TIC1425 and TIC2613 against insect pests.
Таблица 4. Биоанализ активности TIC4472, TIC1425 и TIC2613 в отношении насекомых-вредителей.Table 4. Bioassay of activity of TIC4472, TIC1425 and TIC2613 against insect pests.
[091] Как видно из приведенных выше Таблиц 3 и 4, инсектицид TIC4472 продемонстрировал активность против всех проанализированных чешуекрылых насекомых-вредителей (CEW, CEWUC, CLW, ECB, FAW, SBL, SAW, SCB, SCB2R, SWCB, TBW и VBC); а также YFM. Инсектицид TIC1425 продемонстрировал активность против CLW, ECB, FAW, SCB и SWCB. Инсектицид TIC2613 продемонстрировал активность против CEW, CLW, ECB, FAW, SBL, SAW, SCB, SWCB, TBW и VBC. Не наблюдали активности для TIC1425 и TIC2613 при анализе против BCW. [091] As can be seen from Tables 3 and 4 above, insecticide TIC4472 demonstrated activity against all Lepidoptera pests analyzed (CEW, CEWUC, CLW, ECB, FAW, SBL, SAW, SCB, SCB2R, SWCB, TBW, and VBC); as well as YFM. The insecticide TIC1425 has shown activity against CLW, ECB, FAW, SCB and SWCB. The insecticide TIC2613 has shown activity against CEW, CLW, ECB, FAW, SBL, SAW, SCB, SWCB, TBW and VBC. No activity was observed for TIC1425 and TIC2613 when assayed against BCW.
[092] В отдельной серии экспериментов, белковые препараты TIC4472 были проанализированы, с использованием перекрывающегося пищевого анализа, против чешуекрылых насекомых-вредителей - Spodoptera exigua (BAW), Pectinophora gossypiella (PBW), Cry1Ac устойчивого Pectinophora gossypiella (PBW_Cry1Acr), совки хлопковой (OWB, Helicoverpa armigera), Spodoptera litura (OLW), и Earias vittella (SBW, Earias vittella). В Таблице 5 показана активность, наблюдаемая в отношении каждого из данных чешуекрылых насекомых-вредителей, проанализированных в перекрывающемся пищевом биоанализе, где «+» обозначает активность. [092] In a separate set of experiments, TIC4472 protein preparations were analyzed, using an overlapping food assay, against lepidopteran insect pests - Spodoptera exigua (BAW), Pectinophora gossypiella (PBW), Cry1Ac resistant Pectinophora gossypiella (PBW_Cry1Ac r ), cotton bollworm ( OWB, Helicoverpa armigera ), Spodoptera litura (OLW), and Earias vittella (SBW, Earias vittella ). Table 5 shows the activity observed against each of these Lepidoptera pests analyzed in an overlapping food bioassay, where "+" denotes activity.
Таблица 5. Биоанализ активности TIC4472 против чешуекрылых насекомых-вредителей.Table 5. Bioassay of TIC4472 activity against Lepidoptera insect pests.
[093] Как видно из приведенной выше Таблицы 5, TIC4472 продемонстрировал активность в отношении всех чешуекрылых насекомых-вредителей, проанализированных в биоанализе с перекрывающимся рационом, включая устойчивую к Cry1Ac колонию Pectinophora gossypiella. [093] As can be seen from Table 5 above, TIC4472 showed activity against all lepidopteran insect pests analyzed in the overlapping diet bioassay, including a Cry1Ac resistant Pectinophora gossypiella colony.
[094] Как показано в Таблицах 3-5, TIC4472, TIC1425 и TIC2613 демонстрируют активность в отношении широкого спектра видов чешуекрылых насекомых-вредителей. [094] As shown in Tables 3-5, TIC4472, TIC1425 and TIC2613 show activity against a wide range of Lepidoptera insect pests.
Пример 3Example 3
Разработка синтетических кодирующих последовательностей, кодирующих TIC4472PL и TIC2613PL для экспрессии в клетках растенийDevelopment of synthetic coding sequences encoding TIC4472PL and TIC2613PL for expression in plant cells
[095] Синтетические кодирующие последовательности конструировали для использования в экспрессии кодируемого белка в растениях, клонировали в бинарные векторы для трансформации растений, и использовали для трансформации растительных клеток. Синтетические последовательности синтезировали в соответствии со способами, в целом, как правило, описанными в патенте США 5500365, избегая определенных проблемных последовательностей, таких как растительные последовательности, богатые ATTTA и A/T. Синтетические кодирующие последовательности кодируют белки TIC4472PL и TIC2613PL, которые содержат дополнительный аланиновый остаток, непосредственно следующий за стартовым метионином, относительно белков TIC4472 и TIC2613, соответственно. Дополнительный остаток аланина включен в синтетическую кодирующую последовательность для улучшения экспрессии токсичного для насекомых белка. [095] Synthetic coding sequences were designed for use in expression of the encoded protein in plants, cloned into binary plant transformation vectors, and used to transform plant cells. Synthetic sequences were synthesized according to methods generally described in US Pat. No. 5,500,365, avoiding certain problematic sequences such as plant sequences rich in ATTTA and A/T. The synthetic coding sequences encode the TIC4472PL and TIC2613PL proteins, which contain an additional alanine residue immediately following the start methionine relative to the TIC4472 and TIC2613 proteins, respectively. An additional alanine residue is included in the synthetic coding sequence to improve the expression of the insect-toxic protein.
[096] Синтетическая кодирующая последовательность, кодирующая TIC4472PL (SEQ ID NO:4), представлена в данном документе как SEQ ID NO:3. Синтетическая кодирующая последовательность, кодирующая TIC2613PL (SEQ ID NO:10), представлена как SEQ ID NO:9. Синтетические кодирующие последовательности использовали в бинарных векторах для трансформации растений для создания трансгенных растений, экспрессирующих белки TIC4472PL и TIC2613PL, и анализировали на активность против чешуекрылых насекомых-вредителей. [096] The synthetic coding sequence encoding TIC4472PL (SEQ ID NO:4) is presented herein as SEQ ID NO:3. The synthetic coding sequence encoding TIC2613PL (SEQ ID NO:10) is shown as SEQ ID NO:9. The synthetic coding sequences were used in binary plant transformation vectors to generate transgenic plants expressing the TIC4472PL and TIC2613PL proteins and analyzed for activity against Lepidoptera pests.
Пример 4Example 4
Анализ активности TIC4472PL против чешуекрылых вредителей в стабильно трансформированных растениях хлопкаAnalysis of TIC4472PL Activity Against Lepidoptera Pests in Stably Transformed Cotton Plants
[097] Бинарные векторы для трансформации растений, содержащие трансгенные кассеты, предназначенные для экспрессии ненацеленного пестицидного белка TIC4472PL, клонировали с использованием способов, известных в данной области техники. Полученные векторы были использованы для стабильной трансформации растений хлопка. Ткани собирали с трансформантов и использовали в биоанализе с насекомыми против различных чешуекрылых насекомых-вредителей. [097] Binary plant transformation vectors containing transgenic cassettes for expressing the untargeted pesticidal TIC4472PL protein were cloned using methods known in the art. The resulting vectors were used for stable transformation of cotton plants. Tissues were harvested from transformants and used in insect bioassays against various Lepidoptera pests.
[098] Синтетические кодирующие последовательности конструировали для использования в экспрессии кодируемого белка в растениях, клонировали в бинарный вектор для трансформации растений, и использовали для трансформации клеток растений хлопка. Полученные векторы для трансформации растений содержали первую трансгенную кассету для экспрессии пестицидного белка TIC4472PL, которая содержала конститутивный промотор, функционально связанный в 5' с лидерной последовательностью, функционально связанной в 5' с синтетической кодирующей последовательностью, кодирующей ненацеленный белок TIC4472PL, который, в свою очередь, был функционально связан в 5' с 3' UTR; и вторую трансгенную кассету для отбора трансформированных растительных клеток с использованием селектиномицина. [098] Synthetic coding sequences were designed for use in plant expression of the encoded protein, cloned into a binary plant transformation vector, and used to transform cotton plant cells. The resulting plant transformation vectors contained the first transgenic cassette for the expression of the pesticide protein TIC4472PL, which contained a constitutive promoter operably linked 5' to a leader sequence operably linked 5' to a synthetic coding sequence encoding the untargeted TIC4472PL protein, which, in turn, was operably linked at 5' to 3'UTR; and a second transgenic cassette for selecting transformed plant cells using selectinomycin.
[099] Три бинарных вектора для трансформации растений конструировали, как описано выше, и они содержали разные конститутивные промоторы. Две конструкции, Конструкция 1 и Конструкция 3, также содержали интронную последовательность, которая была функционально связана в 3' с лидерной последовательностью и в 5' с синтетической кодирующей последовательностью, кодирующей ненацеленный белок TIC4472PL. Конструкция 2 был без интронов. Растения хлопка трансформировали тремя различными бинарными векторами для трансформации, используя Agrobacterium-опосредованный способ трансформации. Трансформированные клетки индуцировали для формирования растений с помощью способов, известных в данной области техники. Биоанализы с использованием листьевых дисков растений проводили аналогично тем, которые описаны в патенте США № 8344207. На каждый образец листьевого диска помещали по одной свежевылупленной личинке в возрасте до одного дня, и позволяли питаться в течение примерно четырех дней. Нетрансформированное растение хлопка использовали для получения ткани, которую использовали в качестве отрицательного контроля. Трансформанты R0 с множественной трансформацией одной копией вставки каждого бинарного вектора оценивали против Helicoverpa zea (CBW), кукурузной лиственной совки (FAW, Spodoptera frugiperda), Chrysodeixis includens (SBL), и Heliothis virescens (TBW). Трансформант оценивали с помощью баллов рейтинга повреждения листа (LDR) в диапазоне от одного (1) до четырех (4). Баллы LDR основаны на проценте повреждения, наблюдаемого для каждого листьевого диска. В приведенной ниже Таблице 6 показаны оценки LDR и соответствующий диапазон ущерба в процентах, связанного с каждой оценкой. Для баллов LDR, равных одному (1), также оценивают пенетрантность признака. Высокая пенетрантность (как обозначено «(H)») определяется как больше чем пятьдесят (50) процентов оцененных трансформантов для каждой конструкции, имеющих повреждение листа меньшее чем или равное десяти (10) процентам. Низкая пенетрантность (как обозначено «(L)») определяется как не больше чем пятьдесят (50) процентов оцененных трансформантов для каждой конструкции, имеющих повреждение листа меньшее чем или равное десяти (10) процентам. Пенетрантность не применяется к баллам LDR, превышающим единицу (1). [099] Three binary plant transformation vectors were constructed as described above and contained different constitutive promoters. Two constructs, Construct 1 and Construct 3, also contained an intron sequence that was operably linked 3' to the leader sequence and 5' to the synthetic coding sequence encoding the untargeted TIC4472PL protein. Construct 2 was without introns. Cotton plants were transformed with three different binary transformation vectors using the Agrobacterium -mediated transformation method. Transformed cells were induced to form plants using methods known in the art. Bioassays using plant leaf discs were performed similarly to those described in US Pat. No. 8,344,207. One freshly hatched larvae, up to one day old, was placed on each leaf disc sample and allowed to feed for about four days. An untransformed cotton plant was used to obtain tissue, which was used as a negative control. R0 transformants with multiple transformations with one copy of each binary vector insert were evaluated against Helicoverpa zea (CBW), fall armyworm (FAW, Spodoptera frugiperda ), Chrysodeixis includens (SBL), and Heliothis virescens (TBW). The transformant was scored with a Leaf Damage Rating (LDR) score ranging from one (1) to four (4). The LDR scores are based on the percentage of damage observed for each leaf disk. Table 6 below shows the LDR scores and the corresponding percentage damage range associated with each score. For an LDR score of one (1), the penetrance of the feature is also assessed. High penetrance (as denoted by "(H)") is defined as more than fifty (50) percent of the evaluated transformants for each construct having leaf damage less than or equal to ten (10) percent. Low penetrance (as denoted by "(L)") is defined as no more than fifty (50) percent of the evaluated transformants for each construct having leaf damage less than or equal to ten (10) percent. Penetrance does not apply to LDR scores greater than one (1).
Таблица 6. Баллы рейтинга повреждения листьев (LDR) для хлопка, и соответствующий процент повреждения, и пенетрантность.Table 6. Leaf Damage Rating (LDR) scores for cotton, and corresponding damage percentage and penetrance.
[0100] Баллы рейтинга повреждения листьев для трансформированных растений R0хлопка, экспрессирующих TIC4472PL, представлены в Таблице 7 ниже. Количество трансформантов, демонстрирующих балл LDR, из всего количества проанализированных трансформантов, показано в скобках, за которым следует пенетрантность для тех баллов LDR, что равны единице (1). [0100] Leaf damage scores for transformed R 0 cotton plants expressing TIC4472PL are shown in Table 7 below. The number of transformants showing an LDR score out of the total number of transformants analyzed is shown in brackets, followed by the penetrance for those LDR scores equal to one (1).
Таблица 7. Баллы рейтинга повреждения листьев (LDR), число трансформантов, демонстрирующих LDR, и пенетрантность для трансформированных растений RTable 7. Leaf Damage Rating (LDR) Scores, Number of Transformants Showing LDR and Penetrance for Transformed R Plants 0 0 хлопка, экспрессирующих TIC4472PL.cotton expressing TIC4472PL.
[0101] Трансформированные растения R0 хлопка, экспрессирующие TIC4472PL, были высокоэффективными (оприделяли, как имеющие меньше чем или ровно десять процентов повреждение листьев) против SBL и TBW, как показано в Таблице 7. В нескольких трансформантах также наблюдали активность против CBW и FAW. [0101] Transformed R0 cotton plants expressing TIC4472PL were highly effective (defined as having less than or exactly ten percent leaf damage) against SBL and TBW, as shown in Table 7. Activity against CBW and FAW was also observed in several transformants.
[0102] Трансформанты R1 хлопка были отобраны из трансформированных растений R0 хлопка, оцененных выше, и они были использованы в анализе с листьевыми дисками против FAW, SBL и TBW. В Таблице 8 показаны баллы рейтинга повреждения листьев для трансформированных растений R1 хлопка, экспрессирующих TIC4472PL. [0102] Cotton R 1 transformants were selected from the transformed R 0 cotton plants evaluated above and used in the leaf disc assay against FAW, SBL and TBW. Table 8 shows the leaf damage scores for transformed R 1 cotton plants expressing TIC4472PL.
Таблица 8. Баллы рейтинга повреждения листьев (LDR), количество трансформантов, демонстрирующих LDR, и пенетрантность для трансформированных растений RTable 8. Leaf Damage Rating (LDR) Scores, Number of Transformants Showing LDR and Penetrance for Transformed R Plants 1one хлопка, экспрессирующих TIC4472PL. cotton expressing TIC4472PL.
[0103] Как видно из Таблицы 8 выше, выбранные трансформанты показали высокую эффективность в отношении FAW, SBL и TBW. Пенетрантность была высокой для трансформантов, трансформированных Конструкцией 1, для всех трех видов насекомых-вредителей. Что касается трансформантов, трансформированных Конструкцией 2, для SBL уровень пенетрантности был высоким. [0103] As can be seen from Table 8 above, the selected transformants showed high efficiency against FAW, SBL and TBW. Penetrance was high for construct 1 transformants for all three insect pests. With regard to the transformants transformed with Construct 2, the level of penetrance was high for SBL.
[0104] Вышесказанное демонстрирует, что трансформированные растения хлопка, экспрессирующие белок TIC4472PL, проявляют устойчивость к кукурузной лиственной совке (FAW, Spodoptera frugiperda), Chrysodeixis includens (SBL) и Heliothis virescens (TBW). [0104] The above demonstrates that transformed cotton plants expressing the TIC4472PL protein exhibit resistance to fall armyworm (FAW, Spodoptera frugiperda ), Chrysodeixis includens (SBL), and Heliothis virescens (TBW).
Пример 5Example 5
Анализ активности TIC4472PL и TIC2613PL в отношении чешуекрылых вредителей в стабильно трансформированных растениях соиAnalysis of the Lepidoptera Pest Activity of TIC4472PL and TIC2613PL in Stably Transformed Soybean Plants
[0105] Бинарные векторы для трансформации растений, содержащие трансгенную кассету, спроектированную для экспрессии нацеленного на пластиды пестицидного белка TIC4472PL или ненацеленного TIC2613PL, клонировали с использованием способов, известных в данной области техники. Полученный вектор использовали для стабильной трансформации растений сои. У трансформантов собирали ткани и использовали в биоанализе с насекомыми против различных чешуекрылых насекомых-вредителей. [0105] Binary plant transformation vectors containing a transgenic cassette designed to express plastid-targeted pesticidal protein TIC4472PL or non-targeted TIC2613PL were cloned using methods known in the art. The resulting vector was used for stable transformation of soybean plants. Tissues were harvested from transformants and used in insect bioassays against various Lepidoptera pests.
[0106] Синтетические кодирующие последовательности, разработанные для экспрессии в растениях, описанные в Примере 3, были клонированы в конструкции бинарных векторов для трансформации растений, и использованы для трансформации клеток растений сои. Три бинарные векторные конструкции были сконструированы с использованием способов, известных в данной области техники, для экспрессии нацеленного на пластиды и ненацеленного TIC4472PL. Конструкция 4 содержала первую трансгенную кассету для экспрессии ненацеленного TIC4472PL, которая содержала конститутивный промотор, функционально связанный в 5' с лидерной последовательностью, функционально связанной в 5' с синтетической кодирующей последовательностью, кодирующей ненацеленный белок TIC4472PL, который в свою очередь был функционально связан в 5' с 3' UTR и; вторую трансгенную кассету для отбора трансформированных растительных клеток с использованием селектиномицина. Конструкция 5 содержала первую трансгенную кассету для экспрессии нацеленного TIC4472PL, которая содержала конститутивный промотор, функционально связанный в 5' с лидерной последовательностью, функционально связанной в 5' с интроном, функционально связанным в 5' с синтетической кодирующей последовательностью, кодирующей нацеленный на пластиды белок TIC4472PL, который в свою очередь был функционально связан в 5' с 3' UTR и; вторую трансгенную кассету для отбора трансформированных растительных клеток с использованием селектиномицина. Конструкция 6 содержала первую трансгенную кассету для экспрессии ненацеленного TIC4472PL, которая содержала конститутивный промотор, функционально связанный в 5' с лидерной последовательностью, функционально связанной в 5' с интроном, функционально связанным в 5' с синтетической кодирующей последовательностью, кодирующей ненацеленный белок TIC4472PL, который в свою очередь был функционально связан в 5' с 3' UTR и; вторую трансгенную кассету для отбора трансформированных растительных клеток с использованием селектиномицина. [0106] The synthetic coding sequences designed for expression in plants described in Example 3 were cloned into plant transformation binary vector constructs and used to transform soybean plant cells. Three binary vector constructs were constructed using methods known in the art to express plastid-targeted and untargeted TIC4472PL. Construct 4 contained the first transgenic cassette for the expression of untargeted TIC4472PL, which contained a constitutive promoter operably linked 5' to a leader sequence operably linked 5' to a synthetic coding sequence encoding the untargeted TIC4472PL protein, which in turn was operably linked 5' from 3'UTR and; a second transgenic cassette for selection of transformed plant cells using selectinomycin. Construct 5 contained the first transgenic cassette for the expression of targeted TIC4472PL, which contained a constitutive promoter operably linked 5' to a leader sequence operably linked 5' to an intron operably linked 5' to a synthetic coding sequence encoding plastid-targeted protein TIC4472PL, which in turn was operably linked at 5' to 3' UTR and; a second transgenic cassette for selection of transformed plant cells using selectinomycin. Construct 6 contained the first transgenic cassette for the expression of untargeted TIC4472PL, which contained a constitutive promoter operably linked 5' to a leader sequence operably linked 5' to an intron operably linked 5' to a synthetic coding sequence encoding the untargeted TIC4472PL protein, which in turn was operably linked at 5' to 3' UTR and; a second transgenic cassette for selection of transformed plant cells using selectinomycin.
[0107] Две бинарные векторные конструкции были сконструированы с использованием способов, известных в данной области техники, для экспрессии ненацеленного TIC2613PL. Конструкция 7 содержала первую трансгенную кассету для экспрессии ненацеленного TIC2613PL, которая содержала конститутивный промотор, функционально связанный в 5' с лидерной последовательностью, функционально связанной в 5' с синтетической кодирующей последовательностью, кодирующей ненацеленный белок TIC2613PL, который в свою очередь был функционально связан в 5' с 3' UTR и; вторую трансгенную кассету для отбора трансформированных растительных клеток с использованием селектиномицина. Конструкция 8 содержала первую трансгенную кассету для экспрессии ненацеленного TIC2613PL, которая содержала конститутивный промотор, функционально связанный в 5' с лидерной последовательностью, функционально связанной в 5' с интроном, функционально связанным в 5' с синтетической кодирующей последовательностью, кодирующей ненацеленный белок TIC2613PL, который в свою очередь был функционально связан в 5' с 3' UTR и; вторую трансгенную кассету для отбора трансформированных растительных клеток с использованием селектиномицина. [0107] Two binary vector constructs were constructed using methods known in the art to express untargeted TIC2613PL. Construct 7 contained the first transgene cassette for the expression of untargeted TIC2613PL, which contained a constitutive promoter operably linked 5' to a leader sequence operably linked 5' to a synthetic coding sequence encoding the untargeted TIC2613PL protein, which in turn was operably linked 5' from 3'UTR and; a second transgenic cassette for selection of transformed plant cells using selectinomycin. Construct 8 contained the first transgenic cassette for the expression of untargeted TIC2613PL, which contained a constitutive promoter operably linked 5' to a leader sequence operably linked 5' to an intron operably linked 5' to a synthetic coding sequence encoding the untargeted TIC2613PL protein, which in turn was operably linked at 5' to 3' UTR and; a second transgenic cassette for selection of transformed plant cells using selectinomycin.
[0108] Полученные конструкции бинарного вектора для трансформации использовали для трансформации клеток сои с использованием Agrobacterium-опосредованного способа трансформации. Трансформированные клетки сои индуцировали для формирования растений с помощью способов, известных в данной области техники. Биоанализы с использованием листьевых дисков растений проводили аналогично тем, которые описаны в патенте США № 8344207. Не трансформированное растение сои использовали для получения ткани, которую использовали в качестве отрицательного контроля. Трансформанты R0 сои с множественной трансформацией, полученные с помощью бинарных векторов, оценивали против Spodoptera eridania (SAW), Chrysodeixis includens (SBL), Helicoverpa zea (SPW). Баллы рейтинга повреждения листьев (LDR) были аналогичны таковым для хлопка, но отличались диапазоном повреждения в процентах, используемого для определения балла. Баллы рейтинга повреждения листьев и соответствующие им диапазоны рейтинга повреждения листьев в процентах представлены в Таблице 9 ниже. [0108] The resulting binary transformation vector constructs were used to transform soybean cells using an Agrobacterium -mediated transformation method. Transformed soybean cells were induced to form plants using methods known in the art. Bioassays using plant leaf disks were performed similarly to those described in US Pat. No. 8,344,207. An untransformed soybean plant was used to obtain tissue, which was used as a negative control. Soybean multiple R 0 transformants obtained with binary vectors were evaluated against Spodoptera eridania (SAW), Chrysodeixis includens (SBL), Helicoverpa zea (SPW). Leaf Damage Rating (LDR) scores were similar to those for cotton, but differed in the percentage range of damage used to determine the score. The leaf damage rating scores and their respective percentage leaf damage rating ranges are shown in Table 9 below.
Таблица 9. Баллы рейтинга повреждения листьев (LDR) для сои, и соответствующий процентный диапазон повреждения.Table 9. Soybean Leaf Damage Rating (LDR) scores and corresponding damage percentage range.
[0109] Баллы рейтинга повреждения листьев для трансформированных растений R0 хлопка, экспрессирующих TIC4472PL и TIC2613PL, представлены в Таблице 10 ниже. Количество трансформантов, демонстрирующих балл LDR из всего количества оцененных трансформантов, показано в скобках. [0109] Leaf injury scores for transformed R 0 cotton plants expressing TIC4472PL and TIC2613PL are shown in Table 10 below. The number of transformants showing an LDR score out of the total number of transformants evaluated is shown in brackets.
Таблица 10. Баллы рейтинга повреждения листьев (LDR) и количество трансформантов, демонстрирующих LDR для трансформрованных растений RTable 10. Leaf Damage Rating (LDR) Scores and Number of Transformants Showing LDR for Transformed Plants R 0 0 сои, экспрессирующих TIC4472PL и TIC2613PL.soybeans expressing TIC4472PL and TIC2613PL.
[0110] Как видно из Таблицы 10 выше, экспрессия как TIC4472PL, так и TIC2613PL продемонстрировала высокую эффективность против SAW и SBL. Активность была ниже для обоих белков в отношении SPW. [0110] As can be seen from Table 10 above, the expression of both TIC4472PL and TIC2613PL showed high efficacy against SAW and SBL. The activity was lower for both proteins against SPW.
[0111] Трансформанты R1 сои были выбраны из трансформированных растений R0 сои, экспрессирующих TIC4472PL и TIC2613PL, оцененных выше, и они были использованы в анализе с листьевыми дисками против SAW, SBL, и SPW. Трансформанты сои R1, экспрессирующее TIC4472PL, также оценивали против Anticarsia gemmatalis (VBW). В Таблице 11 показаны баллы рейтинга повреждения листьев для трансформированных растений R1 сои, экспрессирующих TIC4472PL и TIC2613PL. [0111] Soybean R 1 transformants were selected from transformed soybean R 0 plants expressing TIC4472PL and TIC2613PL evaluated above and used in leaf disc assays against SAW, SBL, and SPW. Soybean transformants R 1 expressing TIC4472PL were also evaluated against Anticarsia gemmatalis (VBW). Table 11 shows the leaf damage scores for transformed soybean R 1 plants expressing TIC4472PL and TIC2613PL.
Таблица 11. Баллы рейтинга повреждения листьев (LDR) и количество трансформантов, демонстрирующих LDR для трансформрованных растений RTable 11. Leaf Damage Rating (LDR) scores and number of transformants showing LDR for transformed plants R 1 one сои, экспрессирующих TIC4472PL и TIC2613PL.soybeans expressing TIC4472PL and TIC2613PL.
[0112] Как видно из Таблицы 11, некоторое количество трансформантов R1 сои, трансформированных TIC4472PL, продемонстрировало высокую эффективность против SAW и SBL. Кроме того, несколько трансформантов R1 сои, трансформированных с использованием Конструкции 6, продемонстрировали высокую эффективность против VBC. Трансформанты R1 сои, трансформированные TIC2613PL, продемонстрировали высокую эффективность против SBL. [0112] As can be seen from Table 11, a number of soybean R 1 transformants transformed with TIC4472PL showed high efficacy against SAW and SBL. In addition, several soybean R 1 transformants transformed using Construct 6 showed high efficacy against VBC. Soybean R 1 transformants transformed with TIC2613PL showed high efficacy against SBL.
[0113] Вышесказанное демонстрирует, что трансформированные растения сои, экспрессирующие TIC4472PL или TIC2613PL, показывают устойчивость к чешуекрылым насекомым, в частности Spodoptera eridania и Chrysodeixis includens, и Anticarsia gemmatalis. [0113] The foregoing demonstrates that transformed soybean plants expressing TIC4472PL or TIC2613PL show resistance to Lepidoptera, specifically Spodoptera eridania and Chrysodeixis includens , and Anticarsia gemmatalis.
Пример 6Example 6
Анализ активности TIC4472PL и TIC2613PL в отношении чешуекрылых вредителей в стабильно трансформированных растениях кукурузыAnalysis of Lepidoptera Pest Activity of TIC4472PL and TIC2613PL in Stably Transformed Corn Plants
[0114] Бинарные векторы для трансформации растений, содержащие трансгенные кассеты, разработанные для экспрессии нацеленного на пластиды и ненацеленного пестицидного белка TIC4472PL или TIC2613PL, клонировали с использованием способов, известных в данной области техники. Полученные векторы используют для стабильной трансформации растений кукурузы. Ткани собирают из трансформантов и используют в биоанализе с насекомыми против различных чешуекрылых насекомых-вредителей. [0114] Binary plant transformation vectors containing transgenic cassettes designed to express the plastid-targeted and non-targeted pesticide protein TIC4472PL or TIC2613PL were cloned using methods known in the art. The resulting vectors are used to stably transform maize plants. Tissues are harvested from transformants and used in insect bioassays against various Lepidoptera pests.
[0115] Синтетическую кодирующую последовательность, кодирующую белок TIC4472PL (SEQ ID NO:3) или TIC2613 (SEQ ID NO:9), клонируют в бинарные векторы для трансформации. Для нацеленного на пластиды белка, синтетическая последовательность, кодирующая пестицидный белок TIC4472PL или TIC2613PL, является функционально связанной в рамке считывания с последовательностью, кодирующей сигнальный пептид, нацеленный на хлоропласт. Полученные векторы для трансформации растений содержат первую трансгенную кассету для экспрессии пестицидного белка TIC4472PL или TIC2613PL, которая содержит конститутивный промотор, функционально связанный в 5' с лидерной последовательностью, функционально связанной в 5' с интроном, функционально связанным в 5' с синтетической кодирующей последовательностью, кодирующей нацеленный на пластиды и ненацеленный белок TIC4472PL или TIC2613PL, который, в свою очередь, функционально связан в 5' с 3' UTR; и вторую трансгенную кассету для отбора трансформированных растительных клеток с использованием селектиномицина. [0115] The synthetic coding sequence encoding the TIC4472PL protein (SEQ ID NO:3) or TIC2613 (SEQ ID NO:9) is cloned into binary vectors for transformation. For a plastid-targeted protein, the synthetic sequence encoding the pesticide protein TIC4472PL or TIC2613PL is operably linked in frame to the sequence encoding the chloroplast-targeting signal peptide. The resulting vectors for plant transformation contain the first transgenic cassette for the expression of the pesticide protein TIC4472PL or TIC2613PL, which contains a constitutive promoter operably linked 5' to a leader sequence operably linked 5' to an intron operably linked 5' to a synthetic coding sequence encoding plastid-targeted and untargeted protein TIC4472PL or TIC2613PL, which in turn is operably linked 5' to 3'UTR; and a second transgenic cassette for selecting transformed plant cells using selectinomycin.
[0116] Растения кукурузы трансформируют бинарными векторами для трансформации, описанными выше, используя Agrobacterium-опосредованный способ трансформации. Трансформированные клетки индуцируют для формирования растений с помощью способов, известных в данной области техники. Биоанализы с использованием листьевых дисков растений проводили аналогично тем, которые описаны в патенте США № 8344207. Нетрансформированное растение кукурузы используют для получения ткани, которая будет использоваться в качестве отрицательного контроля. Трансформанты с множественной трансформацией каждым бинарным вектором оценивают против Spodoptera exigua (BAW), совки-ипсилон (BCW, Agrotis ipsilon), Helicoverpa zea (CEW), совки хлопковой американской (CLW, Alabama argillacea), огневки кукурузной (ECB, Ostrinia nubilalis), кукурузной лиственной совки (FAW, Spodoptera frugiperda), совки хлопковой (OWB, Helicoverpa armigera), Spodoptera litura (OLW), Pectinophora gossypiella (PBW), Chrysodeixis includens (SBL), Earias vittella (SBW), Diatraea grandiosella (SWCB), Diatraea saccharalis (SCB), Heliothis virescens (TBW), и Anticarsia gemmatalis (VBW), а также других чешуекрылых насекомых-вредителей. [0116] Maize plants are transformed with the binary transformation vectors described above using the Agrobacterium -mediated transformation method. Transformed cells are induced to form plants by methods known in the art. Bioassays using plant leaf discs were performed similarly to those described in US Pat. No. 8,344,207. An untransformed corn plant was used to obtain tissue to be used as a negative control. Transformants with multiple transformations of each binary vector are evaluated against Spodoptera exigua (BAW), epsilon cutworm (BCW, Agrotis ipsilon ), Helicoverpa zea (CEW), American cotton cutworm (CLW, Alabama argillacea), corn moth (ECB, Ostrinia nubilalis ), fall armyworm (FAW, Spodoptera frugiperda ), cotton bollworm (OWB, Helicoverpa armigera ), Spodoptera litura (OLW), Pectinophora gossypiella (PBW), Chrysodeixis includens (SBL), Earias vittella (SBW), Diatraea grandiosella (SWCB), Diatraea saccharalis (SCB), Heliothis virescens (TBW), and Anticarsia gemmatalis (VBW), as well as other Lepidoptera pests.
[0117] Отмечают гибель и задержку роста для насекомых-вредителей, вызванные поглощением предоставленных листьевых дисков, экспрессирующих TIC4472PL или TIC2613PL, и сравнивают с листьевыми дисками, полученными из нетрансформированных растений кукурузы. [0117] Insect death and stunting caused by ingestion of provided leaf discs expressing TIC4472PL or TIC2613PL is noted and compared to leaf discs derived from non-transformed corn plants.
[0118] Все композиции, раскрытые и заявленные в данном документе, могут быть получены и применены без излишних экспериментов в виду данного раскрытия изобретения. Хотя композиции согласно данному изобретению были описаны в терминах вышеизложенных иллюстративных вариантов осуществления, специалистам в данной области техники должно быть очевидно, что в описанную в данном документе композицию могут вноситься вариации, изменения, модификации, и правки, не выходя за рамки истинной концепции, сущности и объема изобретения. Более конкретно, будет очевидно, что определенные агенты, которые являются как химически, так и физиологически родственными, могут быть заменены агентами, описанными в данном документе, но при этом будут достигаться такие же или похожие результаты. Все такие аналогичные заместители и модификации, очевидные для специалистов в данной области техники, считаются находящимися в пределах сущности, объема и концепции изобретения, как определено в прилагаемой формуле изобретения. [0118] All compositions disclosed and claimed herein can be prepared and used without undue experimentation in view of this disclosure. Although the compositions of this invention have been described in terms of the above illustrative embodiments, it should be apparent to those skilled in the art that variations, changes, modifications, and edits may be made to the composition described herein without departing from the true concept, spirit, and scope of the invention. More specifically, it will be apparent that certain agents that are both chemically and physiologically related can be substituted for the agents described herein while still achieving the same or similar results. All such analogous substituents and modifications obvious to those skilled in the art are considered to be within the spirit, scope and concept of the invention as defined in the appended claims.
[0119] Все публикации и опубликованные патентные документы, процитированные в описании, включены в данный документ посредством ссылки в той же степени, как если бы каждая отдельная публикация или заявка на патент была специально и индивидуально указана для включения посредством ссылки. [0119] All publications and published patent documents cited in the description are incorporated herein by reference to the same extent as if each individual publication or patent application were specifically and individually indicated for inclusion by reference.
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ SEQUENCE LIST
<110> Monsanto Technology LLC<110> Monsanto Technology LLC
Bowen, David J Bowen, David J
Chay, Catherine A Chay, Catherine A
Howe, Arlene R Howe, Arlene R
Kesanapalli, Uma Kesanapalli, Uma
<120> NOVEL INSECT INHIBITORY PROTEINS<120> NOVEL INSECT INHIBITORY PROTEINS
<130> MONS:426WO<130> MONS:426WO
<140> US 62/406082<140> US 62/406082
<141> 2016-10-10<141> 2016-10-10
<160> 10 <160> 10
<170> PatentIn version 3.5<170>PatentIn version 3.5
<210> 1<210> 1
<211> 3564<211> 3564
<212> DNA<212> DNA
<213> Bacillus thuringienses<213> Bacillus thuringienses
<220><220>
<221> misc_feature<221> misc_feature
<222> (1)..(3564)<222> (1)..(3564)
<223> Nucleic acid sequence encoding a TIC4472 pesticidal protein <223> Nucleic acid sequence encoding a TIC4472 pesticidal protein
obtained from Bacillus thuringiensis species EG10742. obtained from Bacillus thuringiensis species EG10742.
<400> 1<400> 1
atgaataata atattgaaaa ccaatgcgta ccttacaatt gtttaagtaa tcctgaagaa 60atgaataata atattgaaaa ccaatgcgta ccttacaatt gtttaagtaa tcctgaagaa 60
gtaattttgg atggagaacg gatatcaact ggtaattcat caattgatat ttctctgtca 120gtaattttgg atggagaacg gatatcaact ggtaattcat caattgatat ttctctgtca 120
cttgttcaac ttctggtatc taactttgta ccaggcggag gatttttagt agggttaata 180cttgttcaac ttctggtatc taactttgta ccaggcggag gatttttagt agggttaata 180
gattttgtat ggggaatagt aggcccttct ccatgggatg catttctagt gcaaattgaa 240gattttgtat ggggaatagt aggcccttct ccatgggatg catttctagt gcaaattgaa 240
caattaattc agcaaagaat agaagcatat gctagggctg cagcaatttc taatttagaa 300caattaattc agcaaagaat agaagcatat gctagggctg cagcaatttc taatttagaa 300
ggaataggaa acaatttcaa tatatatgtg gaagcatttc aagaatggga agaagatcct 360ggaataggaa acaatttcaa tatatatgtg gaagcatttc aagaatggga agaagatcct 360
aataatccag caaccaggaa tagagtagtt gatcgctttc gtatacttga tgggctactt 420aataatccag caaccaggaa tagagtagtt gatcgctttc gtatacttga tgggctactt 420
gaaagggaca ttccttcgtt tcgaatttct ggatttgaag tccccctttt atccgtttat 480gaaagggaca ttccttcgtt tcgaatttct ggatttgaag tccccctttt atccgtttat 480
gctcaagcgg ccaatctgca tctagctata ttaagagatt ctgtaatttt tggagaaaga 540gctcaagcgg ccaatctgca tctagctata ttaagagatt ctgtaatttt tggagaaaga 540
tggggattga caacaacaaa tgtcaatgaa aactataata gacaaatcag gcatattgat 600tggggattga caacaacaaa tgtcaatgaa aactataata gacaaatcag gcatattgat 600
gaatatgctg atcactgtgc aaatacgtat aatcggggat taaataattt accgaaatct 660gaatatgctg atcactgtgc aaatacgtat aatcggggat taaataattt accgaaatct 660
acgtatcaag attggataac atataatcga ttacggagag aattaacatt gactgtatta 720acgtatcaag attggataac atataatcga ttacggagag aattaacatt gactgtatta 720
gatatcgctg ctttctttcc aaactatgac aataggcggt atccaattca gccagttggt 780gatatcgctg ctttctttcc aaactatgac aataggcggt atccaattca gccagttggt 780
caactaacaa gggaagttta tacggaccca ttaattactt ttaatcccca gttacagtct 840caactaacaa gggaagttta tacggaccca ttaattactt ttaatcccca gttacagtct 840
gtagctcaat tacctacttt taacgttatg gaaagcaacg caattagaaa tcctcatttg 900gtagctcaat tacctacttt taacgttatg gaaagcaacg caattagaaa tcctcatttg 900
tttgatatat tgaataatct tacaattttt acggattggt ttagtgttgg acgcaacttt 960tttgatatat tgaataatct tacaattttt acggattggt ttagtgttgg acgcaacttt 960
tattggggag gacatcgagt aacttctaac tatataggag gaggcaacat aacatctcct 1020tattggggag gacatcgagt aacttctaac tatataggag gaggcaacat aacatctcct 1020
atatatggaa gagaggcgaa ccaggagcct ccaagatctt ttacttttaa tggacctgtt 1080atatatggaa gagaggcgaa ccaggagcct ccaagatctt ttacttttaa tggacctgtt 1080
tttaggactt tatcaaatcc tactttacga ttattacagc aaccttggcc agcaccacca 1140tttaggactt tatcaaatcc tactttacga ttattacagc aaccttggcc agcaccacca 1140
tttaatttac gtggtgttga aggagtagaa ttttctacac ctacaaatag ctttacgtat 1200tttaatttac gtggtgttga aggagtagaa ttttctacac ctacaaaatag ctttacgtat 1200
cgaggaagag gtacagttga ttctttaacc gaattaccgc ctgaggataa tagtgtgcta 1260cgaggaagag gtacagttga ttctttaacc gaattaccgc ctgaggataa tagtgtgcta 1260
cctcgcgagg gatatagtca tcgtttatgt catgcaactt ttgttcaaag atctggaaca 1320cctcgcgagg gatatagtca tcgtttatgt catgcaactt ttgttcaaag atctggaaca 1320
ccatttttaa caacgggtgt agtattttct tggacgcatc gcagtgcaac tcttacaaat 1380ccatttttaa caacgggtgt agtattttct tggacgcatc gcagtgcaac tcttacaaat 1380
acaattgatc cagacaaaat tactcagata cctttagtga aaggatttag agtttggagt 1440acaattgatc cagacaaaat tactcagata cctttagtga aaggatttag agtttggagt 1440
ggcgcctctg tcgttacagg accaggtttt acaggagggg atatccttcg aagaactaac 1500ggcgcctctg tcgttacagg accaggtttt acaggagggg atatccttcg aagaactaac 1500
tttggggatt ttgtatctat gcaagttaat attaattcac caataacaca aagataccgt 1560tttggggatt ttgtatctat gcaagttaat attaattcac caataacaca aagataccgt 1560
ttaagatttc gttatgcttc cagtagagat gcacgactta cagtagcgac aggagcagca 16201620
aacacaggag ttggagggca aattagtgtg gacatggctc ttcagaaaac tatggaaatt 16801680
ggagagagct taacatctag aacatttaga tataccgatt ttagtaatcc tttttcattt 17401740
agagctaatc cagatataat tcgtataaat gaacaaccac tattcggtgc aggctctatt 1800agagctaatc cagatataat tcgtataaat gaacaaccac tattcggtgc aggctctatt 1800
agtagtggtg aactttatat agataaaatt gaaattattc tagcagatgc aacatttgaa 1860agtagtggtg aactttatat agataaaatt gaaattattc tagcagatgc aacatttgaa 1860
gcagaatatg atttggaaag agcacagaag gcggtgaatg cgctgtttac ttctacaaac 1920gcagaatatg atttggaaag agcacagaag gcggtgaatg cgctgtttac ttctacaaac 1920
caaagaggat taaaaacaga tgtgacggat tatcatattg atcaagtatc caatttagtt 19801980
gagtgtttat cggatgaatt ttgtctggat gaaaaacgag aattgtccga gaaagtcaaa 2040gagtgtttat cggatgaatt ttgtctggat gaaaaacgag aattgtccga gaaagtcaaa 2040
catgcgaagc gactcagtga tgagcgaaat ttactccagg atcgaaattt cacatccatt 2100catgcgaagc gactcagtga tgagcgaaat ttactccagg atcgaaattt cacatccatt 2100
aatgggcaac tagaccgtgg ctggagagga agtacggata ttaccatcca aggaggagat 21602160
gacgtattca aagagaatta cgtcacacta ctgggtacct ttgatgagtg ctatccaacg 2220gacgtattca aagagaatta cgtcacacta ctgggtacct ttgatgagtg ctatccaacg 2220
tatttatatc aaaaaataga tgagtcgaaa ttaaaagcct atacccgcta tgaattaaga 2280tatttatatc aaaaaataga tgagtcgaaa ttaaaagcct atacccgcta tgaattaaga 2280
gggtatatcg aggatagtca agacttagaa atctatttaa ttcgctacaa tgcaaaacac 2340gggtatatcg aggatagtca agacttagaa atctatttaa ttcgctacaa tgcaaaacac 2340
gaaacagtaa atgtgccagg tacaggttcc ttatggccgc tttcagtcga aagtccaatc 2400gaaacagtaa atgtgccagg tacaggttcc ttatggccgc tttcagtcga aagtccaatc 2400
ggaaagtgtg gagaaccgaa tcgatgcaca ccacaccttg aatggaatcc taatctagat 2460ggaaagtgtg gagaaccgaa tcgatgcaca ccacaccttg aatggaatcc taatctagat 2460
tgttcctgca gagacgggaa aacatgtgca catcattctc atcatttctc cttggacatt 2520tgttcctgca gagacgggaa aacatgtgca catcattctc atcatttctc cttggacatt 2520
gatgttggat gtacagactt aaatgaagat ctaggtgtat gggtgatatt caagattaag 2580gatgttggat gtacagactt aaatgaagat ctaggtgtat gggtgatatt caagattaag 2580
acgcaagatg gtcatgcaag actaggaaat ctagagtttc tcgaagagaa accattagta 2640acgcaagatg gtcatgcaag actaggaaat ctagagtttc tcgaagagaa accattagta 2640
ggagaagcgt tagctcgtgt gaaaagagcg gagaaaaaat ggagagacaa acgcgaaaaa 2700ggagaagcgt tagctcgtgt gaaaagagcg gagaaaaaat ggagagacaa acgcgaaaaa 2700
ttgcaattag aaacaaatat cgtttacaaa gaggcaaaag aagctgtgga tgctttattt 2760ttgcaattag aaacaaatat cgtttacaaa gaggcaaaag aagctgtgga tgctttattt 2760
gtaaactctc aatatgatag attacaagtg gatacgaaca ttgccatgat tcatgcggca 2820gtaaactctc aatatgatag attacaagtg gatacgaaca ttgccatgat tcatgcggca 2820
gataaacgcg ttcatagaat ccgagaagcg tatcttccag agttatctgt gattccgggt 28802880
gtcaatgcgg ctattttcga agaattagaa gggtgtgttt tcactgcatt ctccctatat 2940gtcaatgcgg ctattttcga agaattagaa gggtgtgttt tcactgcatt ctccctatat 2940
gatgcgagaa atgtcattaa aaatggcgat tttaataatg gcttatcatg ctggaacgtg 3000gatgcgagaa atgtcattaa aaatggcgat tttaataatg gcttatcatg ctggaacgtg 3000
aaagggcatg tagaagaaca aaacgaccat cgttcggtcc ttgttgtccc ggaatgggaa 3060aaagggcatg tagaagaaca aaacgaccat cgttcggtcc ttgttgtccc ggaatgggaa 3060
gcagaagtgt cacaagaggt tcgtgtctgt ccaggtcgtg gctatatcct tcgtgttaca 3120cacaagaggt tcgtgtctgt ccaggtcgtg gctatatcct tcgtgttaca 3120
gcatacaaag agggatatgg agaaggctgt gtaaccattc atgggatcga gaacaataca 3180gcatacaaag agggatatgg agaaggctgt gtaaccattc atgggatcga gaacaataca 3180
gacgaactga agtttagcaa ctgcgtagaa gaggaagtct atccaaacaa cacggtaacg 3240gacgaactga agtttagcaa ctgcgtagaa gaggaagtct atccaaacaa cacggtaacg 3240
tgtaatgatt atcctgcaaa tcaagaagaa tacgggggtg cgtacacttc tcgtaatcgt 3300tgtaatgatt atcctgcaaa tcaagaagaa tacgggggtg cgtacacttc tcgtaatcgt 3300
ggatatgacg aaacttatgg aagcaattct tccgtatcag ctgattatgc gtcagtttat 3360ggatatgacg aaacttatgg aagcaattct tccgtatcag ctgattatgc gtcagtttat 3360
gaagaaaaag cgtatacaga tggacgaaga gacaatccat gtgaatttaa cagagggtat 3420gaagaaaaag cgtatacaga tggacgaaga gacaatccat gtgaatttaa cagagggtat 3420
ggggattata cgccactacc agctggctat gtaacaaaag aattagaata cttcccagaa 3480ggggattata cgccactacc agctggctat gtaacaaaag aattagaata cttcccagaa 3480
accgataagg tatggattga gattggagaa acggaaggaa cattcatcgt ggacagtgtg 35403540
gaattactcc ttatggagga atag 3564gaattactcc ttatggagga atag 3564
<210> 2<210> 2
<211> 1187<211> 1187
<212> PRT<212> PRT
<213> Bacillus thuringienses<213> Bacillus thuringienses
<220><220>
<221> MISC_FEATURE<221> MISC_FEATURE
<222> (1)..(1187)<222> (1)..(1187)
<223> The amino acid sequence of the TIC4472 pesticidal protein.<223> The amino acid sequence of the TIC4472 pesticidal protein.
<400> 2<400> 2
Met Asn Asn Asn Ile Glu Asn Gln Cys Val Pro Tyr Asn Cys Leu Ser Met Asn Asn Asn Ile Glu Asn Gln Cys Val Pro Tyr Asn Cys Leu Ser
1 5 10 15 1 5 10 15
Asn Pro Glu Glu Val Ile Leu Asp Gly Glu Arg Ile Ser Thr Gly Asn Asn Pro Glu Glu Val Ile Leu Asp Gly Glu Arg Ile Ser Thr Gly Asn
20 25 30 20 25 30
Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Leu Leu Val Ser Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Leu Leu Val Ser Asn
35 40 45 35 40 45
Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val Trp Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val Trp
50 55 60 50 55 60
Gly Ile Val Gly Pro Ser Pro Trp Asp Ala Phe Leu Val Gln Ile Glu Gly Ile Val Gly Pro Ser Pro Trp Asp Ala Phe Leu Val Gln Ile Glu
65 70 75 80 65 70 75 80
Gln Leu Ile Gln Gln Arg Ile Glu Ala Tyr Ala Arg Ala Ala Ala Ile Gln Leu Ile Gln Gln Arg Ile Glu Ala Tyr Ala Arg Ala Ala Ala Ile
85 90 95 85 90 95
Ser Asn Leu Glu Gly Ile Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Ser Asn Leu Glu Gly Ile Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala
100 105 110 100 105 110
Phe Gln Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Asn Arg Phe Gln Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Asn Arg
115 120 125 115 120 125
Val Val Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Val Val Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile
130 135 140 130 135 140
Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr
145 150 155 160 145 150 155 160
Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile
165 170 175 165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Glu Asn Tyr Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Glu Asn Tyr
180 185 190 180 185 190
Asn Arg Gln Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Asn Arg Gln Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn
195 200 205 195 200 205
Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp
210 215 220 210 215 220
Trp Ile Thr Tyr Asn Arg Leu Arg Arg Glu Leu Thr Leu Thr Val Leu Trp Ile Thr Tyr Asn Arg Leu Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240 225 230 235 240
Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile
245 250 255 245 250 255
Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile
260 265 270 260 265 270
Thr Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Thr Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn
275 280 285 275 280 285
Val Met Glu Ser Asn Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Val Met Glu Ser Asn Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu
290 295 300 290 295 300
Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe
305 310 315 320 305 310 315 320
Tyr Trp Gly Gly His Arg Val Thr Ser Asn Tyr Ile Gly Gly Gly Asn Tyr Trp Gly Gly His Arg Val Thr Ser Asn Tyr Ile Gly Gly Gly Asn
325 330 335 325 330 335
Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg
340 345 350 340 345 350
Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr
355 360 365 355 360 365
Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg
370 375 380 370 375 380
Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr
385 390 395 400 385 390 395 400
Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp
405 410 415 405 410 415
Asn Ser Val Leu Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Asn Ser Val Leu Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala
420 425 430 420 425 430
Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val
435 440 445 435 440 445
Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro
450 455 460 450 455 460
Asp Lys Ile Thr Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Ser Asp Lys Ile Thr Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Ser
465 470 475 480 465 470 475 480
Gly Ala Ser Val Val Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Gly Ala Ser Val Val Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu
485 490 495 485 490 495
Arg Arg Thr Asn Phe Gly Asp Phe Val Ser Met Gln Val Asn Ile Asn Arg Arg Thr Asn Phe Gly Asp Phe Val Ser Met Gln Val Asn Ile Asn
500 505 510 500 505 510
Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser
515 520 525 515 520 525
Arg Asp Ala Arg Leu Thr Val Ala Thr Gly Ala Ala Asn Thr Gly Val Arg Asp Ala Arg Leu Thr Val Ala Thr Gly Ala Ala Asn Thr Gly Val
530 535 540 530 535 540
Gly Gly Gln Ile Ser Val Asp Met Ala Leu Gln Lys Thr Met Glu Ile Gly Gly Gln Ile Ser Val Asp Met Ala Leu Gln Lys Thr Met Glu Ile
545 550 555 560 545 550 555 560
Gly Glu Ser Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Gly Glu Ser Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn
565 570 575 565 570 575
Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Arg Ile Asn Glu Gln Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Arg Ile Asn Glu Gln
580 585 590 580 585 590
Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp
595 600 605 595 600 605
Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Tyr Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Tyr Asp
610 615 620 610 615 620
Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn
625 630 635 640 625 630 635 640
Gln Arg Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Gln Val Gln Arg Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Gln Val
645 650 655 645 650 655
Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys
660 665 670 660 665 670
Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu
675 680 685 675 680 685
Arg Asn Leu Leu Gln Asp Arg Asn Phe Thr Ser Ile Asn Gly Gln Leu Arg Asn Leu Leu Gln Asp Arg Asn Phe Thr Ser Ile Asn Gly Gln Leu
690 695 700 690 695 700
Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asp Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asp
705 710 715 720 705 710 715 720
Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp Glu Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp Glu
725 730 735 725 730 735
Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys
740 745 750 740 745 750
Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp
755 760 765 755 760 765
Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn
770 775 780 770 775 780
Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile
785 790 795 800 785 790 795 800
Gly Lys Cys Gly Glu Pro Asn Arg Cys Thr Pro His Leu Glu Trp Asn Gly Lys Cys Gly Glu Pro Asn Arg Cys Thr Pro His Leu Glu Trp Asn
805 810 815 805 810 815
Pro Asn Leu Asp Cys Ser Cys Arg Asp Gly Lys Thr Cys Ala His His Pro Asn Leu Asp Cys Ser Cys Arg Asp Gly Lys Thr Cys Ala His His
820 825 830 820 825 830
Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn
835 840 845 835 840 845
Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly
850 855 860 850 855 860
His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Val His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Val
865 870 875 880 865 870 875 880
Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp
885 890 895 885 890 895
Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val Tyr Lys Glu Ala
900 905 910 900 905 910
Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu
915 920 925 915 920 925
Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val
930 935 940 930 935 940
His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly
945 950 955 960 945 950 955 960
Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Cys Val Phe Thr Ala Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Cys Val Phe Thr Ala
965 970 975 965 970 975
Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn
980 985 990 980 985 990
Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Glu Glu Gln Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Glu Glu Gln Asn
995 1000 1005 995 1000 1005
Asp His Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val Asp His Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val
1010 1015 1020 1010 1015 1020
Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg
1025 1030 1035 1025 1030 1035
Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile
1040 1045 1050 1040 1045 1050
His Gly Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys His Gly Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys
1055 1060 1065 1055 1060 1065
Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp
1070 1075 1080 1070 1075 1080
Tyr Pro Ala Asn Gln Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Tyr Pro Ala Asn Gln Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg
1085 1090 1095 1085 1090 1095
Asn Arg Gly Tyr Asp Glu Thr Tyr Gly Ser Asn Ser Ser Val Ser Asn Arg Gly Tyr Asp Glu Thr Tyr Gly Ser Asn Ser Ser Val Ser
1100 1105 1110 1100 1105 1110
Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Tyr Thr Asp Gly Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Tyr Thr Asp Gly
1115 1120 1125 1115 1120 1125
Arg Arg Asp Asn Pro Cys Glu Phe Asn Arg Gly Tyr Gly Asp Tyr Arg Arg Asp Asn Pro Cys Glu Phe Asn Arg Gly Tyr Gly Asp Tyr
1130 1135 1140 1130 1135 1140
Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe
1145 1150 1155 1145 1150 1155
Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly
1160 1165 1170 1160 1165 1170
Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1175 1180 1185 1175 1180 1185
<210> 3<210> 3
<211> 3567<211> 3567
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> A synthetic coding sequence encoding a TIC4472PL pesticidal <223> A synthetic coding sequence encoding a TIC4472PL pesticidal
protein designed for expression in a plant cell wherein an protein designed for expression in a plant cell where an
additional alanine codon is inserted immediately following the additional alanine codon is inserted immediately following the
initiating methionine codon. initiating methionine codon.
<400> 3<400> 3
atggctaata acaacatcga gaaccagtgc gtgccctaca actgcctttc gaacccggag 60atggctaata acaacatcga gaaccagtgc gtgccctaca actgcctttc gaacccggag 60
gaagtgatcc tggacggcga aaggatctcg accgggaata gcagcatcga catctcgctt 120gaagtgatcc tggacggcga aaggatctcg accgggaata gcagcatcga catctcgctt 120
tcgctcgtgc agcttctagt cagtaacttc gttccgggcg gagggtttct cgtgggcctt 180tcgctcgtgc agcttctagt cagtaacttc gttccgggcg gagggtttct cgtgggcctt 180
attgacttcg tttggggcat cgtgggccca tctccttggg acgcattcct cgtgcagatc 240attgacttcg tttggggcat cgtgggccca tctccttggg acgcattcct cgtgcagatc 240
gagcaactga tccagcagcg tatcgaggcg tacgctaggg ctgccgctat ctccaacctg 300gagcaactga tccagcagcg tatcgaggcg tacgctaggg ctgccgctat ctccaacctg 300
gagggcatcg gcaacaactt caacatctac gttgaagcct tccaagaatg ggaggaagat 360gagggcatcg gcaacaactt caacatctac gttgaagcct tccaagaatg ggaggaagat 360
cctaataacc cagctacgcg gaacagagtg gtggatcgct ttagaatcct cgacggcctc 420cctaataacc cagctacgcg gaacagagtg gtggatcgct ttagaatcct cgacggcctc 420
ctggaaaggg acatcccgag cttccgtatt tccggcttcg aggtgccgct gctgagcgtg 480ctggaaaggg acatcccgag cttccgtatt tccggcttcg aggtgccgct gctgagcgtg 480
tacgcgcaag cggccaatct gcacctggcg attctccggg actctgtgat cttcggcgag 540tacgcgcaag cggccaatct gcacctggcg attctccggg actctgtgat cttcggcgag 540
cggtggggcc tcaccaccac taacgtgaac gagaactaca accgccagat ccgccacatc 600cggtggggcc tcaccaccac taacgtgaac gagaactaca accgccagat ccgccacatc 600
gacgagtacg cggaccactg cgccaacaca tacaatcgcg ggctgaacaa cctccctaag 660660 gacgagtacg cggaccactg cgccaacaca
agcacttacc aagattggat cacctacaac aggctccgcc gggaactcac tctcacagtc 720agcacttacc aagattggat cacctacaac aggctccgcc gggaactcac tctcacagtc 720
ctcgacatcg ctgccttctt cccgaactac gacaaccgcc gctacccgat tcagccagtc 780ctcgacatcg ctgccttctt cccgaactac gacaaccgcc gctacccgat tcagccagtc 780
ggccagctca cccgtgaggt gtacaccgat ccactgataa ctttcaatcc gcagctccag 840ggccagctca cccgtgaggt gtacaccgat ccactgataa ctttcaatcc gcagctccag 840
tctgtcgcac agttgcccac cttcaacgtc atggaaagca acgccatcag gaacccacac 900tctgtcgcac agttgcccac cttcaacgtc atggaaagca acgccatcag gaacccacac 900
ttgttcgaca tccttaacaa cctgactatc ttcaccgact ggttcagcgt cggacggaac 960ttgttcgaca tccttaacaa cctgactatc ttcaccgact ggttcagcgt cggacggaac 960
ttctactggg gcggacaccg cgtcacctca aactacatcg gcggcggcaa cattacttcg 1020ttctactggg gcggacaccg cgtcacctca aactacatcg gcggcggcaa cattacttcg 1020
cccatctacg gccgggaggc gaatcaggag ccgccacgca gctttacatt caacggtcct 1080cccatctacg gccgggaggc gaatcaggag ccgccacgca gctttacatt caacggtcct 1080
gtgtttcgca cgttatcgaa cccgacactc aggctgctcc agcagccctg gcctgcgccg 1140gtgtttcgca cgttatcgaa cccgacactc aggctgctcc agcagccctg gcctgcgccg 1140
ccgtttaatt tgcgcggcgt cgaaggcgtc gagttcagta cgccgaccaa cagcttcacc 1200ccgtttaatt tgcgcggcgt cgaaggcgtc gagttcagta cgccgaccaa cagcttcacc 1200
tatcgcggac gcgggactgt tgactccctg acagagctgc cgccggagga caactcggtt 1260tatcgcggac gcgggactgt tgactccctg acagagctgc cgccggagga caactcggtt 1260
ctgccgcgtg agggctacag ccataggctt tgtcacgcga cctttgtgca gcgatccggg 1320ctgccgcgtg agggctacag ccataggctt tgtcacgcga cctttgtgca gcgatccggg 1320
acaccgttcc ttacaaccgg cgtggtgttc tcctggacac accgcagtgc aactctgacg 1380acaccgttcc ttacaaccgg cgtggtgttc tcctggacac accgcagtgc aactctgacg 1380
aacacgattg acccagacaa gatcacgcag atcccgttag tgaagggctt ccgggtttgg 14401440
tctggtgcct ctgtagtcac tgggcctggc tttacgggtg gcgacatcct ccgtcgcacg 1500tctggtgcct ctgtagtcac tgggcctggc tttacgggtg gcgacatcct ccgtcgcacg 1500
aactttggcg acttcgtgtc catgcaagtg aacattaaca gccctattac gcaacgctac 1560aactttggcg acttcgtgtc catgcaagtg aacattaaca gccctattac gcaacgctac 1560
cggctgaggt tcagatacgc ttcctcgcgg gacgcccgtc ttacggtggc gacgggcgca 1620cggctgaggt tcagatacgc ttcctcgcgg gacgcccgtc ttacggtggc gacgggcgca 1620
gcgaacactg gagttggcgg ccaaatctcc gtggacatgg ctttgcagaa gactatggag 1680gcgaacactg gagttggcgg ccaaatctcc gtggacatgg ctttgcagaa gactatggag 1680
atcggtgagt ctctcacatc tcgcacgttc cgctacacgg atttctccaa ccctttctcc 1740atcggtgagt ctctcacatc tcgcacgttc cgctacacgg atttctccaa ccctttctcc 1740
ttccgcgcca atccggacat cattcggatc aacgaacagc cgctcttcgg cgcgggctcc 1800ttccgcgcca atccggacat cattcggatc aacgaacagc cgctcttcgg cgcgggctcc 1800
atctcatccg gtgagcttta cattgataag attgagataa ttctggccga cgcgaccttt 1860atctcatccg gtgagcttta cattgataag attgagataa ttctggccga cgcgaccttt 1860
gaggcagagt atgatctgga gcgcgcacag aaggccgtga acgcgctgtt tacgtccacg 1920gaggcagagt atgatctgga gcgcgcacag aaggccgtga acgcgctgtt tacgtccacg 1920
aaccagcgcg ggctcaagac agacgtcaca gactaccaca tcgaccaagt ctccaacctt 1980aaccagcgcg ggctcaagac agacgtcaca gactaccaca tcgaccaagt ctccaacctt 1980
gtcgagtgtc tctccgacga gttctgcctg gacgagaagc gggagcttag tgagaaggtg 2040gtcgagtgtc tctccgacga gttctgcctg gacgagaagc gggagcttag tgagaaggtg 2040
aagcacgcaa agcgcctgtc tgacgagcgg aaccttctac aagaccgtaa cttcacctcc 2100aagcacgcaa agcgcctgtc tgacgagcgg aaccttctac aagaccgtaa cttcacctcc 2100
attaacgggc agctagaccg tggctggcgc gggtccaccg acatcactat ccaaggtggc 2160attaacgggc agctagaccg tggctggcgc gggtccaccg acatcactat ccaaggtggc 2160
gacgacgtct tcaaggagaa ctacgtgacg ctgctcggca cctttgacga gtgctacccg 2220gacgacgtct tcaaggagaa ctacgtgacg ctgctcggca cctttgacga gtgctacccg 2220
acatacctct atcagaagat tgacgagtct aagctcaagg cttacacccg ttacgagctg 2280acatacctct atcagaagat tgacgagtct aagctcaagg cttacacccg ttacgagctg 2280
cgtggctaca tcgaggactc ccaggatctg gaaatctatc tcatcagata caacgcgaag 2340cgtggctaca tcgaggactc ccaggatctg gaaatctatc tcatcagata caacgcgaag 2340
cacgagacag tcaacgtacc tgggacaggc tctctctggc ctctgtctgt ggagagtccc 2400cacgagacag tcaacgtacc tgggacaggc tctctctggc ctctgtctgt ggagagtccc 2400
atcggcaaat gtggcgagcc gaacagatgt actccgcacc tggagtggaa tcccaacttg 2460atcggcaaat gtggcgagcc gaacagatgt actccgcacc tggagtggaa tcccaacttg 2460
gactgtagtt gccgcgacgg caagacctgc gcgcaccact cccaccactt ctccctggac 2520gactgtagtt gccgcgacgg caagacctgc gcgcaccact cccaccactt ctccctggac 2520
attgacgtcg gctgcacgga tctcaacgag gatctgggcg tttgggtcat cttcaagata 2580attgacgtcg gctgcacgga tctcaacgag gatctgggcg tttgggtcat cttcaagata 2580
aagacccagg acggacacgc cagactggga aacctagagt tccttgagga gaagccgctg 2640aagacccagg acggacacgc cagactggga aacctagagt tccttgagga gaagccgctg 2640
gtcggcgaag cactggcgcg ggtcaagagg gccgagaaga agtggcggga caaacgggag 2700gtcggcgaag cactggcgcg ggtcaagagg gccgagaaga agtggcggga caaacggggag 2700
aaacttcaac tcgaaacgaa catcgtttac aaggaggcaa aggaggccgt ggacgcactg 2760aaacttcaac tcgaaacgaa catcgtttac aaggaggcaa aggaggccgt ggacgcactg 2760
ttcgtgaact cgcagtacga ccgcctccaa gtggacacca acatcgccat gatccatgca 2820ttcgtgaact cgcagtacga ccgcctccaa gtggacacca acatcgccat gatccatgca 2820
gcggacaagc gcgtgcaccg aatcagggaa gcgtacttgc ccgagttgtc cgttatccct 2880gcggacaagc gcgtgcaccg aatcagggaa gcgtacttgc ccgagttgtc cgttatccct 2880
ggcgtgaacg ctgccatctt cgaggaactg gagggctgcg tgttcaccgc attctccctg 2940ggcgtgaacg ctgccatctt cgaggaactg gagggctgcg tgttcaccgc attctccctg 2940
tacgacgcac gaaacgtcat caagaatggc gacttcaaca acggcctgag ctgctggaac 3000tacgacgcac gaaacgtcat caagaatggc gacttcaaca acggcctgag ctgctggaac 3000
gtgaagggcc acgtggagga gcagaacgac caccgctccg tgttagtggt cccggaatgg 3060gtgaagggcc acgtggagga gcagaacgac caccgctccg tgttagtggt cccggaatgg 3060
gaagccgaag tgagccagga ggtcagggtg tgtcccggtc gcggttacat cctccgcgtg 31203120
accgcctaca aggagggcta tggcgagggc tgcgtgacga tacacggtat cgagaacaac 3180accgcctaca aggagggcta tggcgaggggc tgcgtgacga tacacggtat cgagaacaac 3180
accgatgagc ttaagttctc gaactgcgtg gaggaggagg tgtacccgaa taacacagtg 3240accgatgagc ttaagttctc gaactgcgtg gaggaggagg tgtacccgaa taacacagtg 3240
acgtgcaatg actacccggc caaccaggag gagtacggcg gtgcctacac gagccgaaac 3300acgtgcaatg actacccggc caaccaggag gagtacggcg gtgcctacac gagccgaaac 3300
cgtggctatg acgaaactta cggctcgaac agcagcgtgt ctgcggatta tgccagtgtg 33603360
tacgaggaga aggcgtacac ggacgggcgg cgcgacaacc cttgcgagtt caatagaggc 3420tacgaggaga aggcgtacac ggacgggcgg cgcgacaacc cttgcgagtt caatagaggc 3420
tatggcgact acacgccgct gcccgccggt tatgtgacga aggagttgga atacttccca 3480tatggcgact acacgccgct gcccgccggt tatgtgacga aggagttgga atacttccca 3480
gagacggaca aggtgtggat cgagattggc gagaccgagg gcacgttcat tgtggacagc 3540gagacggaca aggtgtggat cgagattggc gagaccgagg gcacgttcat tgtggacagc 3540
gttgagctgc tactgatgga ggagtga 3567gttgagctgc tactgatgga ggagtga 3567
<210> 4<210> 4
<211> 1188<211> 1188
<212> PRT<212> PRT
<213> Artificial<213> Artificial
<220><220>
<223> The amino acid sequence of TIC4472PL encoded by a synthetic <223> The amino acid sequence of TIC4472PL encoded by a synthetic
coding sequence designed for expression in a plant cell (SEQ ID coding sequence designed for expression in a plant cell (SEQ ID
NO:3), and wherein an additional alanine amino acid is inserted NO:3), and although an additional alanine amino acid is inserted
immediately following the initiating methionine. immediately following the initiating methionine.
<400> 4<400> 4
Met Ala Asn Asn Asn Ile Glu Asn Gln Cys Val Pro Tyr Asn Cys Leu Met Ala Asn Asn Asn Ile Glu Asn Gln Cys Val Pro Tyr Asn Cys Leu
1 5 10 15 1 5 10 15
Ser Asn Pro Glu Glu Val Ile Leu Asp Gly Glu Arg Ile Ser Thr Gly Ser Asn Pro Glu Glu Val Ile Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30 20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Leu Leu Val Ser Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Leu Leu Val Ser
35 40 45 35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60 50 55 60
Trp Gly Ile Val Gly Pro Ser Pro Trp Asp Ala Phe Leu Val Gln Ile Trp Gly Ile Val Gly Pro Ser Pro Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80 65 70 75 80
Glu Gln Leu Ile Gln Gln Arg Ile Glu Ala Tyr Ala Arg Ala Ala Ala Glu Gln Leu Ile Gln Gln Arg Ile Glu Ala Tyr Ala Arg Ala Ala Ala
85 90 95 85 90 95
Ile Ser Asn Leu Glu Gly Ile Gly Asn Asn Phe Asn Ile Tyr Val Glu Ile Ser Asn Leu Glu Gly Ile Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110 100 105 110
Ala Phe Gln Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Asn Ala Phe Gln Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Asn
115 120 125 115 120 125
Arg Val Val Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Arg Val Val Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140 130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160 145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175 165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Glu Asn Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Glu Asn
180 185 190 180 185 190
Tyr Asn Arg Gln Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Tyr Asn Arg Gln Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205 195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220 210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Glu Leu Thr Leu Thr Val Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240 225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255 245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270 260 265 270
Ile Thr Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Ile Thr Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285 275 280 285
Asn Val Met Glu Ser Asn Ala Ile Arg Asn Pro His Leu Phe Asp Ile Asn Val Met Glu Ser Asn Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300 290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320 305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Thr Ser Asn Tyr Ile Gly Gly Gly Phe Tyr Trp Gly Gly His Arg Val Thr Ser Asn Tyr Ile Gly Gly Gly
325 330 335 325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350 340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365 355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380 370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400 385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415 405 410 415
Asp Asn Ser Val Leu Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Asp Asn Ser Val Leu Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430 420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445 435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460 450 455 460
Pro Asp Lys Ile Thr Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Pro Asp Lys Ile Thr Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480 465 470 475 480
Ser Gly Ala Ser Val Val Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Ser Gly Ala Ser Val Val Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495 485 490 495
Leu Arg Arg Thr Asn Phe Gly Asp Phe Val Ser Met Gln Val Asn Ile Leu Arg Arg Thr Asn Phe Gly Asp Phe Val Ser Met Gln Val Asn Ile
500 505 510 500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525 515 520 525
Ser Arg Asp Ala Arg Leu Thr Val Ala Thr Gly Ala Ala Asn Thr Gly Ser Arg Asp Ala Arg Leu Thr Val Ala Thr Gly Ala Ala Asn Thr Gly
530 535 540 530 535 540
Val Gly Gly Gln Ile Ser Val Asp Met Ala Leu Gln Lys Thr Met Glu Val Gly Gly Gln Ile Ser Val Asp Met Ala Leu Gln Lys Thr Met Glu
545 550 555 560 545 550 555 560
Ile Gly Glu Ser Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Ile Gly Glu Ser Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575 565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Arg Ile Asn Glu Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Arg Ile Asn Glu
580 585 590 580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605 595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Tyr Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Tyr
610 615 620 610 615 620
Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Thr
625 630 635 640 625 630 635 640
Asn Gln Arg Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Gln Asn Gln Arg Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Gln
645 650 655 645 650 655
Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu
660 665 670 660 665 670
Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp
675 680 685 675 680 685
Glu Arg Asn Leu Leu Gln Asp Arg Asn Phe Thr Ser Ile Asn Gly Gln Glu Arg Asn Leu Leu Gln Asp Arg Asn Phe Thr Ser Ile Asn Gly Gln
690 695 700 690 695 700
Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly
705 710 715 720 705 710 715 720
Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp
725 730 735 725 730 735
Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu
740 745 750 740 745 750
Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln
755 760 765 755 760 765
Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val
770 775 780 770 775 780
Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Val Glu Ser Pro
785 790 795 800 785 790 795 800
Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Thr Pro His Leu Glu Trp Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Thr Pro His Leu Glu Trp
805 810 815 805 810 815
Asn Pro Asn Leu Asp Cys Ser Cys Arg Asp Gly Lys Thr Cys Ala His Asn Pro Asn Leu Asp Cys Ser Cys Arg Asp Gly Lys Thr Cys Ala His
820 825 830 820 825 830
His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu
835 840 845 835 840 845
Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp
850 855 860 850 855 860
Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu
865 870 875 880 865 870 875 880
Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg
885 890 895 885 890 895
Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val Tyr Lys Glu Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val Tyr Lys Glu
900 905 910 900 905 910
Ala Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Ala Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg
915 920 925 915 920 925
Leu Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Leu Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg
930 935 940 930 935 940
Val His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Val His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro
945 950 955 960 945 950 955 960
Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Cys Val Phe Thr Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Cys Val Phe Thr
965 970 975 965 970 975
Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe
980 985 990 980 985 990
Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Glu Glu Gln Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Glu Glu Gln
995 1000 1005 995 1000 1005
Asn Asp His Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Asn Asp His Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu
1010 1015 1020 1010 1015 1020
Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu
1025 1030 1035 1025 1030 1035
Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr
1040 1045 1050 1040 1045 1050
Ile His Gly Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Ile His Gly Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn
1055 1060 1065 1055 1060 1065
Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn
1070 1075 1080 1070 1075 1080
Asp Tyr Pro Ala Asn Gln Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Asp Tyr Pro Ala Asn Gln Glu Glu Tyr Gly Gly Ala Tyr Thr Ser
1085 1090 1095 1085 1090 1095
Arg Asn Arg Gly Tyr Asp Glu Thr Tyr Gly Ser Asn Ser Ser Val Arg Asn Arg Gly Tyr Asp Glu Thr Tyr Gly Ser Asn Ser Ser Val
1100 1105 1110 1100 1105 1110
Ser Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Tyr Thr Asp Ser Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Tyr Thr Asp
1115 1120 1125 1115 1120 1125
Gly Arg Arg Asp Asn Pro Cys Glu Phe Asn Arg Gly Tyr Gly Asp Gly Arg Arg Asp Asn Pro Cys Glu Phe Asn Arg Gly Tyr Gly Asp
1130 1135 1140 1130 1135 1140
Tyr Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Tyr Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr
1145 1150 1155 1145 1150 1155
Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu
1160 1165 1170 1160 1165 1170
Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1175 1180 1185 1175 1180 1185
<210> 5<210> 5
<211> 3564<211> 3564
<212> DNA<212> DNA
<213> Bacillus thuringienses<213> Bacillus thuringienses
<220><220>
<221> misc_feature<221> misc_feature
<222> (1)..(3564)<222> (1)..(3564)
<223> Nucleic acid sequence encoding a TIC1425 pesticidal protein <223> Nucleic acid sequence encoding a TIC1425 pesticidal protein
obtained from Bacillus thuringiensis species EG10731. obtained from Bacillus thuringiensis species EG10731.
<400> 5<400> 5
atgaataata atattgaaaa ccaatgcgta ccttacaatt gtttaagtaa tcctgaagaa 60atgaataata atattgaaaa ccaatgcgta ccttacaatt gtttaagtaa tcctgaagaa 60
gtaattttgg atggagaacg gatatcaact ggtaattcat caattgatat ttctctgtca 120gtaattttgg atggagaacg gatatcaact ggtaattcat caattgatat ttctctgtca 120
cttgttcaac ttctggtatc taactttgta ccaggcggag gatttttagt agggttaata 180cttgttcaac ttctggtatc taactttgta ccaggcggag gatttttagt agggttaata 180
gattttgtat ggggaatagt aggcccttct ccatgggatg catttctagt gcaaattgaa 240gattttgtat ggggaatagt aggcccttct ccatgggatg catttctagt gcaaattgaa 240
caattaattc agcaaagaat agaagcatat gctagggctg cagcaatttc taatttagaa 300caattaattc agcaaagaat agaagcatat gctagggctg cagcaatttc taatttagaa 300
ggaataggaa acaatttcaa tatatatgtg gaagcatttc aagaatggga agaagatcct 360ggaataggaa acaatttcaa tatatatgtg gaagcatttc aagaatggga agaagatcct 360
aataatccag caaccaggaa tagagtagtt gatcgctttc gtatacttga tgggctactt 420aataatccag caaccaggaa tagagtagtt gatcgctttc gtatacttga tgggctactt 420
gaaagggaca ttccttcgtt tcgaatttct ggatttgaag tccccctttt atccgtttat 480gaaagggaca ttccttcgtt tcgaatttct ggatttgaag tccccctttt atccgtttat 480
gctcaagcgg ccaatctgca tctagctata ttaagagatt ctgtaatttt tggagaaaga 540gctcaagcgg ccaatctgca tctagctata ttaagagatt ctgtaatttt tggagaaaga 540
tggggattga caacaacaaa tgtcaatgaa aactataata gacaaatcag gcatattgat 600tggggattga caacaacaaa tgtcaatgaa aactataata gacaaatcag gcatattgat 600
gaatatgctg atcactgtgc aaatacgtat aatcggggat taaataattt accgaaatct 660gaatatgctg atcactgtgc aaatacgtat aatcggggat taaataattt accgaaatct 660
acgtatcaag attggataac atataatcga ttacggagag aattaacatt gactgtatta 720acgtatcaag attggataac atataatcga ttacggagag aattaacatt gactgtatta 720
gatatcgctg ctttctttcc aaactatgac aataggcggt atccaattca gccagttggt 780gatatcgctg ctttctttcc aaactatgac aataggcggt atccaattca gccagttggt 780
caactaacaa gggaagttta tacggaccca ttaattactt ttaatcccca gttacagtct 840caactaacaa gggaagttta tacggaccca ttaattactt ttaatcccca gttacagtct 840
gtagctcaat tacctacttt taacgttatg gaaagcaacg caattagaaa tcctcatttg 900gtagctcaat tacctacttt taacgttatg gaaagcaacg caattagaaa tcctcatttg 900
tttgatatat tgaataatct tacaattttt acggattggt ttagtgttgg acgcaacttt 960tttgatatat tgaataatct tacaattttt acggattggt ttagtgttgg acgcaacttt 960
tattggggag gacatcgagt aacttctaac tatataggag gaggcaacat aacatctcct 1020tattggggag gacatcgagt aacttctaac tatataggag gaggcaacat aacatctcct 1020
atatatggaa gagaggcgaa ccaggagcct ccaagatctt ttacttttaa tggacctgtt 1080atatatggaa gagaggcgaa ccaggagcct ccaagatctt ttacttttaa tggacctgtt 1080
tttaggactt tatcaaatcc tactttacga ttattacagc aaccttggcc agcaccacca 1140tttaggactt tatcaaatcc tactttacga ttattacagc aaccttggcc agcaccacca 1140
tttaatttac gtggtgttga aggagtagaa ttttctacac ctacaaatag ctttacgtat 1200tttaatttac gtggtgttga aggagtagaa ttttctacac ctacaaaatag ctttacgtat 1200
cgaggaagag gtacagttga ttctttaacc gaattaccgc ctgaggataa tagtgtgcta 1260cgaggaagag gtacagttga ttctttaacc gaattaccgc ctgaggataa tagtgtgcta 1260
cctcgcgagg gatatagtca tcgtttatgt catgcaactt ttgttcaaag atctggaaca 1320cctcgcgagg gatatagtca tcgtttatgt catgcaactt ttgttcaaag atctggaaca 1320
ccatttttaa caacgggtgt agtattttct tggacgcatc gcagtgcaac tcttacaaat 1380ccatttttaa caacgggtgt agtattttct tggacgcatc gcagtgcaac tcttacaaat 1380
acaattgatc cagacaaaat tactcagata cctttagtga aaggatttag agtttggagt 1440acaattgatc cagacaaaat tactcagata cctttagtga aaggatttag agtttggagt 1440
ggcgcctctg tcgttacagg accaggtttt acaggagggg atatccttcg aagaactaac 1500ggcgcctctg tcgttacagg accaggtttt acaggagggg atatccttcg aagaactaac 1500
tttggggatt ttgtatctat gcaagttaat attaattcac caataacaca aagataccgt 1560tttggggatt ttgtatctat gcaagttaat attaattcac caataacaca aagataccgt 1560
ttaagatttc gttatgcttc cagtagagat gcacgactta cagtagcgac aggagcagca 16201620
aacacaggag ttggagggca aattagtgtg gacatggctc ttcagaaaac tatggaaatt 16801680
ggagagagct taacatctag aacatttaga tataccgatt ttagtaatcc tttttcattt 17401740
agagctaatc cagatataat tcgtataaat gaacaaccac tattcggtgc aggctctatt 1800agagctaatc cagatataat tcgtataaat gaacaaccac tattcggtgc aggctctatt 1800
agtagtggtg aactttatat agataaaatt gaaattattc tagcagatgc aacatttgaa 1860agtagtggtg aactttatat agataaaatt gaaattattc tagcagatgc aacatttgaa 1860
gcagaatatg atttggaaag agcacagaag gcggtgaatg cgctgtttac ttctacaaac 1920gcagaatatg atttggaaag agcacagaag gcggtgaatg cgctgtttac ttctacaaac 1920
caaagaggat taaaaacaga tgtgacggat tatcatattg atcaagtatc caatttagtt 19801980
gagtgtttat cggatgaatt ttgtctggat gaaaaacgag aattgtccga gaaagtcaaa 2040gagtgtttat cggatgaatt ttgtctggat gaaaaacgag aattgtccga gaaagtcaaa 2040
catgcgaagc gactcagtga tgagcgaaat ttactccagg atcgaaattt cacatccatt 2100catgcgaagc gactcagtga tgagcgaaat ttactccagg atcgaaattt cacatccatt 2100
aatgggcaac tagaccgtgg ctggagagga agtacggata ttaccatcca aggaggagat 21602160
gacgtattca aagagaatta cgtcacacta ctgggtacct ttgatgagtg ctatccaacg 2220gacgtattca aagagaatta cgtcacacta ctgggtacct ttgatgagtg ctatccaacg 2220
tatttatatc aaaaaataga tgagtcgaaa ttaaaagcct atacccgcta tgaattaaga 2280tatttatatc aaaaaataga tgagtcgaaa ttaaaagcct atacccgcta tgaattaaga 2280
gggtatatcg aggatagtca agacttagaa atctatttaa ttcgctacaa tgcaaaacac 2340gggtatatcg aggatagtca agacttagaa atctatttaa ttcgctacaa tgcaaaacac 2340
gaaacagtaa atgtgccagg tacaggttcc ttatggccgc tttcagtcga aagtccaatc 2400gaaacagtaa atgtgccagg tacaggttcc ttatggccgc tttcagtcga aagtccaatc 2400
ggaaagtgtg gagaaccgaa tcgatgcaca ccacaccttg aatggaatcc taatctagat 2460ggaaagtgtg gagaaccgaa tcgatgcaca ccacaccttg aatggaatcc taatctagat 2460
tgttcctgca gagacgggaa aacatgtgca catcattctc atcatttctc cttggacatt 2520tgttcctgca gagacgggaa aacatgtgca catcattctc atcatttctc cttggacatt 2520
gatgttggat gtacagactt aaatgaagat ctaggtgtat gggtgatatt caagattaag 2580gatgttggat gtacagactt aaatgaagat ctaggtgtat gggtgatatt caagattaag 2580
acgcaagatg gtcatgcaag actaggaaat ctagagtttc tcgaagagaa accattagta 2640acgcaagatg gtcatgcaag actaggaaat ctagagtttc tcgaagagaa accattagta 2640
ggagaagcgt tagctcgtgt gaaaagagcg gagaaaaaat ggagagacaa acgcgaaaaa 2700ggagaagcgt tagctcgtgt gaaaagagcg gagaaaaaat ggagagacaa acgcgaaaaa 2700
ttgcaattag aaacaaatat cgtttacaaa gaggcaaaag aagctgtgga tgctttattt 2760ttgcaattag aaacaaatat cgtttacaaa gaggcaaaag aagctgtgga tgctttattt 2760
gtaaactctc aatatgatag attacaagtg gatacgaaca ttgccatgat tcatgcggca 2820gtaaactctc aatatgatag attacaagtg gatacgaaca ttgccatgat tcatgcggca 2820
gataaacgcg ttcatagaat ccgagaagcg tatcttccag agttatctgt gattccgggt 28802880
gtcaatgcgg ctattttcga agaattagaa gggtgtattt tcactgcatt ctccctatat 2940gtcaatgcgg ctattttcga agaattagaa gggtgtattt tcactgcatt ctccctatat 2940
gatgcgagaa atgtcattaa aaatggcgat tttaataatg gcttatcatg ctggaacgtg 3000gatgcgagaa atgtcattaa aaatggcgat tttaataatg gcttatcatg ctggaacgtg 3000
aaagggcatg tagaagaaca aaacgaccat cgttcggtcc ttgttgtccc ggaatgggaa 3060aaagggcatg tagaagaaca aaacgaccat cgttcggtcc ttgttgtccc ggaatgggaa 3060
gcagaagtgt cacaagaggt tcgtgtctgt ccaggtcgtg gctatatcct tcgtgttaca 3120cacaagaggt tcgtgtctgt ccaggtcgtg gctatatcct tcgtgttaca 3120
gcatacaaag agggatatgg agaaggctgt gtaaccattc atgggatcga gaacaataca 3180gcatacaaag agggatatgg agaaggctgt gtaaccattc atgggatcga gaacaataca 3180
gacgaactga agtttagcaa ctgcgtagaa gaggaagtct atccaaacaa cacggtaacg 3240gacgaactga agtttagcaa ctgcgtagaa gaggaagtct atccaaacaa cacggtaacg 3240
tgtaatgatt atcctgcaaa tcaagaagaa tacgggggtg cgtacacttc tcgtaatcgt 3300tgtaatgatt atcctgcaaa tcaagaagaa tacgggggtg cgtacacttc tcgtaatcgt 3300
ggatatgacg aaacttatgg aagcaattct tccgtatcag ctgattatgc gtcagtttat 3360ggatatgacg aaacttatgg aagcaattct tccgtatcag ctgattatgc gtcagtttat 3360
gaagaaaaag cgtatacaga tggacgaaga gacaatccat gtgaatttaa cagagggtat 3420gaagaaaaag cgtatacaga tggacgaaga gacaatccat gtgaatttaa cagagggtat 3420
ggggattata cgccactacc agctggctat gtaacaaaag aattagaata cttcccagaa 3480ggggattata cgccactacc agctggctat gtaacaaaag aattagaata cttcccagaa 3480
accgataagg tatggattga gattggagaa acggaaggaa cattcatcgt ggacagtgtg 35403540
gaattactcc ttatggagga ataa 3564gaattactcc ttatggagga ataa 3564
<210> 6<210> 6
<211> 1187<211> 1187
<212> PRT<212> PRT
<213> Bacillus thuringienses<213> Bacillus thuringienses
<220><220>
<221> MISC_FEATURE<221> MISC_FEATURE
<222> (1)..(1187)<222> (1)..(1187)
<223> The amino acid sequence of the TIC1425 pesticidal protein.<223> The amino acid sequence of the TIC1425 pesticidal protein.
<400> 6<400> 6
Met Asn Asn Asn Ile Glu Asn Gln Cys Val Pro Tyr Asn Cys Leu Ser Met Asn Asn Asn Ile Glu Asn Gln Cys Val Pro Tyr Asn Cys Leu Ser
1 5 10 15 1 5 10 15
Asn Pro Glu Glu Val Ile Leu Asp Gly Glu Arg Ile Ser Thr Gly Asn Asn Pro Glu Glu Val Ile Leu Asp Gly Glu Arg Ile Ser Thr Gly Asn
20 25 30 20 25 30
Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Leu Leu Val Ser Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Leu Leu Val Ser Asn
35 40 45 35 40 45
Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val Trp Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val Trp
50 55 60 50 55 60
Gly Ile Val Gly Pro Ser Pro Trp Asp Ala Phe Leu Val Gln Ile Glu Gly Ile Val Gly Pro Ser Pro Trp Asp Ala Phe Leu Val Gln Ile Glu
65 70 75 80 65 70 75 80
Gln Leu Ile Gln Gln Arg Ile Glu Ala Tyr Ala Arg Ala Ala Ala Ile Gln Leu Ile Gln Gln Arg Ile Glu Ala Tyr Ala Arg Ala Ala Ala Ile
85 90 95 85 90 95
Ser Asn Leu Glu Gly Ile Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Ser Asn Leu Glu Gly Ile Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala
100 105 110 100 105 110
Phe Gln Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Asn Arg Phe Gln Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Asn Arg
115 120 125 115 120 125
Val Val Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Val Val Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile
130 135 140 130 135 140
Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr
145 150 155 160 145 150 155 160
Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile
165 170 175 165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Glu Asn Tyr Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Glu Asn Tyr
180 185 190 180 185 190
Asn Arg Gln Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Asn Arg Gln Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn
195 200 205 195 200 205
Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp
210 215 220 210 215 220
Trp Ile Thr Tyr Asn Arg Leu Arg Arg Glu Leu Thr Leu Thr Val Leu Trp Ile Thr Tyr Asn Arg Leu Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240 225 230 235 240
Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile
245 250 255 245 250 255
Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile
260 265 270 260 265 270
Thr Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Thr Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn
275 280 285 275 280 285
Val Met Glu Ser Asn Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Val Met Glu Ser Asn Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu
290 295 300 290 295 300
Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe
305 310 315 320 305 310 315 320
Tyr Trp Gly Gly His Arg Val Thr Ser Asn Tyr Ile Gly Gly Gly Asn Tyr Trp Gly Gly His Arg Val Thr Ser Asn Tyr Ile Gly Gly Gly Asn
325 330 335 325 330 335
Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg
340 345 350 340 345 350
Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr
355 360 365 355 360 365
Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg
370 375 380 370 375 380
Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr
385 390 395 400 385 390 395 400
Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp
405 410 415 405 410 415
Asn Ser Val Leu Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Asn Ser Val Leu Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala
420 425 430 420 425 430
Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val
435 440 445 435 440 445
Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro
450 455 460 450 455 460
Asp Lys Ile Thr Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Ser Asp Lys Ile Thr Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Ser
465 470 475 480 465 470 475 480
Gly Ala Ser Val Val Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Gly Ala Ser Val Val Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu
485 490 495 485 490 495
Arg Arg Thr Asn Phe Gly Asp Phe Val Ser Met Gln Val Asn Ile Asn Arg Arg Thr Asn Phe Gly Asp Phe Val Ser Met Gln Val Asn Ile Asn
500 505 510 500 505 510
Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser
515 520 525 515 520 525
Arg Asp Ala Arg Leu Thr Val Ala Thr Gly Ala Ala Asn Thr Gly Val Arg Asp Ala Arg Leu Thr Val Ala Thr Gly Ala Ala Asn Thr Gly Val
530 535 540 530 535 540
Gly Gly Gln Ile Ser Val Asp Met Ala Leu Gln Lys Thr Met Glu Ile Gly Gly Gln Ile Ser Val Asp Met Ala Leu Gln Lys Thr Met Glu Ile
545 550 555 560 545 550 555 560
Gly Glu Ser Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Gly Glu Ser Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn
565 570 575 565 570 575
Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Arg Ile Asn Glu Gln Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Arg Ile Asn Glu Gln
580 585 590 580 585 590
Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp
595 600 605 595 600 605
Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Tyr Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Tyr Asp
610 615 620 610 615 620
Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn
625 630 635 640 625 630 635 640
Gln Arg Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Gln Val Gln Arg Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Gln Val
645 650 655 645 650 655
Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys
660 665 670 660 665 670
Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu
675 680 685 675 680 685
Arg Asn Leu Leu Gln Asp Arg Asn Phe Thr Ser Ile Asn Gly Gln Leu Arg Asn Leu Leu Gln Asp Arg Asn Phe Thr Ser Ile Asn Gly Gln Leu
690 695 700 690 695 700
Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asp Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asp
705 710 715 720 705 710 715 720
Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp Glu Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp Glu
725 730 735 725 730 735
Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys
740 745 750 740 745 750
Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp
755 760 765 755 760 765
Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn
770 775 780 770 775 780
Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile
785 790 795 800 785 790 795 800
Gly Lys Cys Gly Glu Pro Asn Arg Cys Thr Pro His Leu Glu Trp Asn Gly Lys Cys Gly Glu Pro Asn Arg Cys Thr Pro His Leu Glu Trp Asn
805 810 815 805 810 815
Pro Asn Leu Asp Cys Ser Cys Arg Asp Gly Lys Thr Cys Ala His His Pro Asn Leu Asp Cys Ser Cys Arg Asp Gly Lys Thr Cys Ala His His
820 825 830 820 825 830
Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn
835 840 845 835 840 845
Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly
850 855 860 850 855 860
His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Val His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Val
865 870 875 880 865 870 875 880
Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp
885 890 895 885 890 895
Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val Tyr Lys Glu Ala
900 905 910 900 905 910
Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu
915 920 925 915 920 925
Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val
930 935 940 930 935 940
His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly
945 950 955 960 945 950 955 960
Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Cys Ile Phe Thr Ala Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Cys Ile Phe Thr Ala
965 970 975 965 970 975
Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn
980 985 990 980 985 990
Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Glu Glu Gln Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Glu Glu Gln Asn
995 1000 1005 995 1000 1005
Asp His Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val Asp His Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val
1010 1015 1020 1010 1015 1020
Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg
1025 1030 1035 1025 1030 1035
Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile
1040 1045 1050 1040 1045 1050
His Gly Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys His Gly Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys
1055 1060 1065 1055 1060 1065
Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp
1070 1075 1080 1070 1075 1080
Tyr Pro Ala Asn Gln Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Tyr Pro Ala Asn Gln Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg
1085 1090 1095 1085 1090 1095
Asn Arg Gly Tyr Asp Glu Thr Tyr Gly Ser Asn Ser Ser Val Ser Asn Arg Gly Tyr Asp Glu Thr Tyr Gly Ser Asn Ser Ser Val Ser
1100 1105 1110 1100 1105 1110
Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Tyr Thr Asp Gly Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Tyr Thr Asp Gly
1115 1120 1125 1115 1120 1125
Arg Arg Asp Asn Pro Cys Glu Phe Asn Arg Gly Tyr Gly Asp Tyr Arg Arg Asp Asn Pro Cys Glu Phe Asn Arg Gly Tyr Gly Asp Tyr
1130 1135 1140 1130 1135 1140
Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe
1145 1150 1155 1145 1150 1155
Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly
1160 1165 1170 1160 1165 1170
Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1175 1180 1185 1175 1180 1185
<210> 7<210> 7
<211> 3537<211> 3537
<212> DNA<212> DNA
<213> Bacillus thuringienses<213> Bacillus thuringienses
<220><220>
<221> misc_feature<221> misc_feature
<222> (1)..(3537)<222> (1)..(3537)
<223> Nucleic acid sequence encoding a TIC2613 pesticidal protein <223> Nucleic acid sequence encoding a TIC2613 pesticidal protein
obtained from Bacillus thuringiensis species EG5408. obtained from Bacillus thuringiensis species EG5408.
<400> 7<400> 7
atggataaca atatcaagaa ccaatgcatt ccttacaatt gtttaaatga tcctgaggta 60atggataaca atatcaagaa ccaatgcatt ccttacaatt gtttaaatga tcctgaggta 60
gaaatattag gtgaagaggg gataactact agtaatgaaa atctcgaatt tttcttatcg 120gaaatattag gtgaagaggg gataactact agtaatgaaa atctcgaatt tttcttatcg 120
ctaacgaaat ttgtcttgaa taggtttgtc cctggtggag catatgtagc tggcctattt 180ctaacgaaat ttgtcttgaa taggtttgtc cctggtggag catatgtagc tggcctattt 180
gatgtattct ggggatggtt aaaaccttct gattggtctg caatccttga acaaattgaa 240gatgtattct ggggatggtt aaaaccttct gattggtctg caatccttga acaaattgaa 240
gaattaatta accaaaaaat tgagacgttt gctagaaatc aagcaattag tagattggaa 300gaattaatta accaaaaaat tgagacgttt gctagaaatc aagcaattag tagattggaa 300
gggttaagca acctttatga aatttacgca gatactttta aagaatggga aaaagatccg 360gggttaagca acctttatga aatttacgca gatactttta aagaatggga aaaagatccg 360
actaatccag cattaagaga agaaatgcgt acacaattta atgacatgaa cagctctttt 420actaatccag cattaagaga agaaatgcgt acacaattta atgacatgaa cagctctttt 420
gtaacagcta tgcctctttt ttcagttcaa aattttgaag ttcctctttt agcagtatac 480gtaacagcta tgcctctttt ttcagttcaa aattttgaag ttcctctttt agcagtatac 480
gctcaagctg caaatttaca tctatcagtt ttaagggatg tctcagtttt tggtcaaaat 540gctcaagctg caaatttaca tctatcagtt ttaagggatg tctcagtttt tggtcaaaat 540
tggggatttg attcagccac tgtcaatagt cgttataatg atttagtaag aaatattcgt 600tggggatttg attcagccac tgtcaatagt cgttataatg atttagtaag aaatattcgt 600
acctatacaa attatgtcgt acgttggtat aacacaggat tagcaaggtt acgaggtact 660660
acgtaccaag attggttaaa ttatcatcgc tttagaagag aattaacaat aactgcattg 720acgtaccaag attggttaaa ttatcatcgc tttagaagag aattaacaat aactgcattg 720
gatatcatta ccatattccc acactacgat aataaaatgt atccaattca accccatttt 780gatatcatta ccatattccc acactacgat aataaaatgt atccaattca accccatttt 780
caattaacaa gagagattta tacggatcca ctaattaatt tcaatccggc gttacagtct 840caattaacaa gagagattta tacggatcca ctaattaatt tcaatccggc gttacagtct 840
gtagcacaat tacctctatt taatgagatg gaaaatagta caattagaag ccctcattta 900gtagcacaat tacctctatt taatgagatg gaaaatagta caattagaag ccctcattta 900
gttgattttt taaataggct tacaatttat acagattggt atagtctcgg aagacactat 960gttgattttt taaataggct tacaatttat acagattggt atagtctcgg aagacactat 960
tattggggag gacatcaaat agtctctaga caaacaggat caacttccac tattacattc 1020tattggggag gacatcaaat agtctctaga caaacaggat caacttccac tattacattc 1020
cctatatatg gaagagaggc gaatcaagag gcccctagaa catataattt tagtcaacct 10801080
gtctttagaa cactgtcaaa tcctacttta acacgtttaa tgcaaccttg gccagcccca 1140gtctttagaa cactgtcaaa tcctacttta acacgtttaa tgcaaccttg gccagcccca 1140
gcatttcagt tgcgtcgtct tgagggagtt gaatttcaaa caactacagg taattttacg 1200gcatttcagt tgcgtcgtct tgagggagtt gaatttcaaa caactacagg taattttacg 1200
tatcgaggaa gaggtacggt agattccttt gatgaattac caccagatga tacaagcgta 12601260
ccagcgcgtg aaggatatag tcatcgttta tgtcatgcaa catttatcag aaaatctggg 1320ccagcgcgtg aaggatatag tcatcgttta tgtcatgcaa catttatcag aaaatctggg 1320
acgccgtatt taacaacggg tgtaacacta tcttggacac acaatagcaa tacacctacg 13801380
aatataattt atcctgataa aatcactcaa gtaccattgg tgaaagcatc taaccttcat 1440aatataattt atcctgataa aatcactcaa gtaccattgg tgaaagcatc taaccttcat 1440
tctagtgctt tcgttttaaa aggaccagga tttacaggag gggacatact tggaagaact 1500tctagtgctt tcgttttaaa aggaccagga tttacaggag gggacatact tggaagaact 1500
agtgtgggca acatagcaga tatccaaatg aatattactg caccgttatc acaaagatat 15601560
cgcgtacgaa ttcggtatgc ctctactaca aacttacaat ttcatacgac aattaacggc 1620cgcgtacgaa ttcggtatgc ctctactaca aacttacaat ttcatacgac aattaacggc 1620
agggccgtaa atcaggctaa tttcccagca actatgaata gagtagaaga cttagaatat 1680agggccgtaa atcaggctaa tttcccagca actatgaata gagtagaaga cttagaatat 1680
aattccttta gaacgataag tttcggtact ccttttaact ttttagatgc tcaaagtacc 1740aattccttta gaacgataag tttcggtact ccttttaact ttttagatgc tcaaagtacc 1740
ttcaggttag gtgtatggag cttttcttca ggtaccgttt taatagatag aattgaagtt 1800ttcaggttag gtgtatggag cttttcttca ggtaccgttt taatagatag aattgaagtt 1800
gtaccaatgg aagtaacatt tgaagcagaa tctgatttag aaagagcaca aaaggcggtg 1860gtaccaatgg aagtaacatt tgaagcagaa tctgatttag aaagagcaca aaaggcggtg 1860
aacgctctgt ttacttctat aaatcaaaaa ggactaaaaa cagatgtaac agattatcac 1920aacgctctgt ttacttctat aaatcaaaaa ggactaaaaa cagatgtaac agattatcac 1920
attgatcaag tatccaattt ggtcgaatgt ctatccgatg aattttgtct agatgaaaag 1980attgatcaag tatccaattt ggtcgaatgt ctatccgatg aattttgtct agatgaaaag 1980
agagaactat ttgagaaagt caaatatgcg aaacgactca gtgacgaacg gaatttactt 2040agagaactat ttgagaaagt caaatatgcg aaacgactca gtgacgaacg gaatttactt 2040
gcagatccaa atttcacatc tattaatggg caactagatc gtggatggag aggaagtacg 2100gcagatccaa atttcacatc tattaatggg caactagatc gtggatggag aggaagtacg 2100
gatattacca ttcaaggggg cgatgacgta ttcaaagaaa actacgtcac actatcaggt 2160gatattacca ttcaaggggg cgatgacgta ttcaaagaaa actacgtcac actatcaggt 2160
acccttgatg agtgttatcc aacctattta tatcaaaaaa tagacgaatc gaaattaaaa 2220acccttgatg agtgttatcc aacctattta tatcaaaaaa tagacgaatc gaaattaaaa 2220
gcgtataccc gttacgagtt acgaggatat atcgaagata gtcaagattt agaagtatac 2280gcgtataccc gttacgagtt acgaggatat atcgaagata gtcaagattt agaagtatac 2280
ttgattcgtt acaataccaa acatgaaaca ttgaatgtac caggtacagg gggcctatgg 2340ttgattcgtt acaataccaa acatgaaaca ttgaatgtac caggtacagg gggcctatgg 2340
ccgcttgcag tagaaagttc aatcggaggg tgtggcgaac caaaccgatg cgcaccacaa 2400ccgcttgcag tagaaagttc aatcggaggg tgtggcgaac caaaccgatg cgcaccacaa 2400
atggaatggg atccaaatct agaatgttct tgtagcgacg aggagaaatg tgcgcatcat 2460atggaatggg atccaaatct agaatgttct tgtagcgacg aggagaaatg tgcgcatcat 2460
tcccatcatt tctctctcga tattgatgtt ggatgtactg atttaaatga aaatctaggt 2520tcccatcatt tctctctcga tattgatgtt ggatgtactg atttaaatga aaatctaggt 2520
atatgggtta tatttaaaat taaaacgcag aacggttatg caaaattagg aaatttagag 25802580
tttctcgaag agaaaccatt aataggggaa gcgttagctc gtgttaagcg agtggagaaa 2640tttctcgaag agaaaccatt aataggggaa gcgttagctc gtgttaagcg agtggagaaa 2640
aaatggaaag acaaacgtga aaaattagaa tttgaaacga atatagtcta caacgaggca 2700aaatggaaag acaaacgtga aaaattagaa tttgaaacga atatagtcta caacgaggca 2700
aaagaagctg tggatgcact attcgtaaat tcacaatatg atagattgca agctgataca 2760aaagaagctg tggatgcact attcgtaaat tcacaatatg atagattgca agctgataca 2760
aatatcgcaa tgattcatgc ggcggataac aaagttcata aaattcgcga ggcgtacctc 2820aatatcgcaa tgattcatgc ggcggataac aaagttcata aaattcgcga ggcgtacctc 2820
ccagagttat ctgtgatacc aggtgtaaat gcgaccgttt ttgaagaatt agaagagcgt 28802880
atttttacag cattctccct ttacgatgca agaaatgtga taaaaaatgg ggatttcaat 2940atttttacag cattctccct ttacgatgca agaaatgtga taaaaaatgg ggatttcaat 2940
aatggattat cttgttggaa tgtgaagggc caagtagatg tagaccaaaa tgaccatcgt 3000aatggattat cttgttggaa tgtgaagggc caagtagatg tagaccaaaa tgaccatcgt 3000
tctgtccttg ttattccagg atgggaatcg gaagtatcac aagaagttca tgtatgtcca 30603060
gatcgtggat acattcttcg tgttacggcg tacaaagaag gatatggaga aggctgcgta 3120gatcgtggat acattcttcg tgttacggcg tacaaagaag gatatggaga aggctgcgta 3120
acaatccatg agattgataa tcatacagac gaactgaaat ttaaaaactg ctttgaagag 31803180
gaagtatctc taaataatgc ggtgacatgt gatgagtata ctacaaatca agaagtagga 3240gaagtatctc taaataatgc ggtgacatgt gatgagtata ctacaaatca agaagtagga 3240
gggtatgcgg atgtacgtca atccaataat cgtggatcta atgaggccta tgtaaatcct 3300gggtatgcgg atgtacgtca atccaataat cgtggatcta atgaggccta tgtaaatcct 3300
acttccacat caactgatta tgcatcgctc tacgaggaag agtcgtatac gaatgaacag 3360acttccacat caactgatta tgcatcgctc tacgaggaag agtcgtatac gaatgaacag 3360
acatataatt cttgtgaatc taacagaggg tatggtaatc aaatgccatt accgtctggc 3420acatataatt cttgtgaatc taacagaggg tatggtaatc aaatgccatt accgtctggc 3420
tatgtgacaa aagaattaga atattttcca gagacagata aagtatggat tgagattgga 34803480
gaaacagaag gaacattcat cgtagacagt gtggaattac tccttatgga ggaataa 3537gaaacagaag gaacattcat cgtagacagt gtggaattac tccttatgga ggaataa 3537
<210> 8<210> 8
<211> 1178<211> 1178
<212> PRT<212> PRT
<213> Bacillus thuringienses<213> Bacillus thuringienses
<220><220>
<221> MISC_FEATURE<221> MISC_FEATURE
<222> (1)..(1178)<222> (1)..(1178)
<223> The amino acid sequence of the TIC2613 pesticidal protein.<223> The amino acid sequence of the TIC2613 pesticidal protein.
<400> 8<400> 8
Met Asp Asn Asn Ile Lys Asn Gln Cys Ile Pro Tyr Asn Cys Leu Asn Met Asp Asn Asn Ile Lys Asn Gln Cys Ile Pro Tyr Asn Cys Leu Asn
1 5 10 15 1 5 10 15
Asp Pro Glu Val Glu Ile Leu Gly Glu Glu Gly Ile Thr Thr Ser Asn Asp Pro Glu Val Glu Ile Leu Gly Glu Glu Gly Ile Thr Thr Ser Asn
20 25 30 20 25 30
Glu Asn Leu Glu Phe Phe Leu Ser Leu Thr Lys Phe Val Leu Asn Arg Glu Asn Leu Glu Phe Phe Leu Ser Leu Thr Lys Phe Val Leu Asn Arg
35 40 45 35 40 45
Phe Val Pro Gly Gly Ala Tyr Val Ala Gly Leu Phe Asp Val Phe Trp Phe Val Pro Gly Gly Ala Tyr Val Ala Gly Leu Phe Asp Val Phe Trp
50 55 60 50 55 60
Gly Trp Leu Lys Pro Ser Asp Trp Ser Ala Ile Leu Glu Gln Ile Glu Gly Trp Leu Lys Pro Ser Asp Trp Ser Ala Ile Leu Glu Gln Ile Glu
65 70 75 80 65 70 75 80
Glu Leu Ile Asn Gln Lys Ile Glu Thr Phe Ala Arg Asn Gln Ala Ile Glu Leu Ile Asn Gln Lys Ile Glu Thr Phe Ala Arg Asn Gln Ala Ile
85 90 95 85 90 95
Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Glu Ile Tyr Ala Asp Thr Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Glu Ile Tyr Ala Asp Thr
100 105 110 100 105 110
Phe Lys Glu Trp Glu Lys Asp Pro Thr Asn Pro Ala Leu Arg Glu Glu Phe Lys Glu Trp Glu Lys Asp Pro Thr Asn Pro Ala Leu Arg Glu Glu
115 120 125 115 120 125
Met Arg Thr Gln Phe Asn Asp Met Asn Ser Ser Phe Val Thr Ala Met Met Arg Thr Gln Phe Asn Asp Met Asn Ser Ser Phe Val Thr Ala Met
130 135 140 130 135 140
Pro Leu Phe Ser Val Gln Asn Phe Glu Val Pro Leu Leu Ala Val Tyr Pro Leu Phe Ser Val Gln Asn Phe Glu Val Pro Leu Leu Ala Val Tyr
145 150 155 160 145 150 155 160
Ala Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser Val Ala Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser Val
165 170 175 165 170 175
Phe Gly Gln Asn Trp Gly Phe Asp Ser Ala Thr Val Asn Ser Arg Tyr Phe Gly Gln Asn Trp Gly Phe Asp Ser Ala Thr Val Asn Ser Arg Tyr
180 185 190 180 185 190
Asn Asp Leu Val Arg Asn Ile Arg Thr Tyr Thr Asn Tyr Val Val Arg Asn Asp Leu Val Arg Asn Ile Arg Thr Tyr Thr Asn Tyr Val Val Arg
195 200 205 195 200 205
Trp Tyr Asn Thr Gly Leu Ala Arg Leu Arg Gly Thr Thr Tyr Gln Asp Trp Tyr Asn Thr Gly Leu Ala Arg Leu Arg Gly Thr Thr Tyr Gln Asp
210 215 220 210 215 220
Trp Leu Asn Tyr His Arg Phe Arg Arg Glu Leu Thr Ile Thr Ala Leu Trp Leu Asn Tyr His Arg Phe Arg Arg Glu Leu Thr Ile Thr Ala Leu
225 230 235 240 225 230 235 240
Asp Ile Ile Thr Ile Phe Pro His Tyr Asp Asn Lys Met Tyr Pro Ile Asp Ile Ile Thr Ile Phe Pro His Tyr Asp Asn Lys Met Tyr Pro Ile
245 250 255 245 250 255
Gln Pro His Phe Gln Leu Thr Arg Glu Ile Tyr Thr Asp Pro Leu Ile Gln Pro His Phe Gln Leu Thr Arg Glu Ile Tyr Thr Asp Pro Leu Ile
260 265 270 260 265 270
Asn Phe Asn Pro Ala Leu Gln Ser Val Ala Gln Leu Pro Leu Phe Asn Asn Phe Asn Pro Ala Leu Gln Ser Val Ala Gln Leu Pro Leu Phe Asn
275 280 285 275 280 285
Glu Met Glu Asn Ser Thr Ile Arg Ser Pro His Leu Val Asp Phe Leu Glu Met Glu Asn Ser Thr Ile Arg Ser Pro His Leu Val Asp Phe Leu
290 295 300 290 295 300
Asn Arg Leu Thr Ile Tyr Thr Asp Trp Tyr Ser Leu Gly Arg His Tyr Asn Arg Leu Thr Ile Tyr Thr Asp Trp Tyr Ser Leu Gly Arg His Tyr
305 310 315 320 305 310 315 320
Tyr Trp Gly Gly His Gln Ile Val Ser Arg Gln Thr Gly Ser Thr Ser Tyr Trp Gly Gly His Gln Ile Val Ser Arg Gln Thr Gly Ser Thr Ser
325 330 335 325 330 335
Thr Ile Thr Phe Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Ala Pro Thr Ile Thr Phe Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Ala Pro
340 345 350 340 345 350
Arg Thr Tyr Asn Phe Ser Gln Pro Val Phe Arg Thr Leu Ser Asn Pro Arg Thr Tyr Asn Phe Ser Gln Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365 355 360 365
Thr Leu Thr Arg Leu Met Gln Pro Trp Pro Ala Pro Ala Phe Gln Leu Thr Leu Thr Arg Leu Met Gln Pro Trp Pro Ala Pro Ala Phe Gln Leu
370 375 380 370 375 380
Arg Arg Leu Glu Gly Val Glu Phe Gln Thr Thr Thr Gly Asn Phe Thr Arg Arg Leu Glu Gly Val Glu Phe Gln Thr Thr Thr Gly Asn Phe Thr
385 390 395 400 385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Phe Asp Glu Leu Pro Pro Asp Tyr Arg Gly Arg Gly Thr Val Asp Ser Phe Asp Glu Leu Pro Pro Asp
405 410 415 405 410 415
Asp Thr Ser Val Pro Ala Arg Glu Gly Tyr Ser His Arg Leu Cys His Asp Thr Ser Val Pro Ala Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430 420 425 430
Ala Thr Phe Ile Arg Lys Ser Gly Thr Pro Tyr Leu Thr Thr Gly Val Ala Thr Phe Ile Arg Lys Ser Gly Thr Pro Tyr Leu Thr Thr Gly Val
435 440 445 435 440 445
Thr Leu Ser Trp Thr His Asn Ser Asn Thr Pro Thr Asn Ile Ile Tyr Thr Leu Ser Trp Thr His Asn Ser Asn Thr Pro Thr Asn Ile Ile Tyr
450 455 460 450 455 460
Pro Asp Lys Ile Thr Gln Val Pro Leu Val Lys Ala Ser Asn Leu His Pro Asp Lys Ile Thr Gln Val Pro Leu Val Lys Ala Ser Asn Leu His
465 470 475 480 465 470 475 480
Ser Ser Ala Phe Val Leu Lys Gly Pro Gly Phe Thr Gly Gly Asp Ile Ser Ser Ala Phe Val Leu Lys Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495 485 490 495
Leu Gly Arg Thr Ser Val Gly Asn Ile Ala Asp Ile Gln Met Asn Ile Leu Gly Arg Thr Ser Val Gly Asn Ile Ala Asp Ile Gln Met Asn Ile
500 505 510 500 505 510
Thr Ala Pro Leu Ser Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Ala Pro Leu Ser Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser
515 520 525 515 520 525
Thr Thr Asn Leu Gln Phe His Thr Thr Ile Asn Gly Arg Ala Val Asn Thr Thr Asn Leu Gln Phe His Thr Thr Ile Asn Gly Arg Ala Val Asn
530 535 540 530 535 540
Gln Ala Asn Phe Pro Ala Thr Met Asn Arg Val Glu Asp Leu Glu Tyr Gln Ala Asn Phe Pro Ala Thr Met Asn Arg Val Glu Asp Leu Glu Tyr
545 550 555 560 545 550 555 560
Asn Ser Phe Arg Thr Ile Ser Phe Gly Thr Pro Phe Asn Phe Leu Asp Asn Ser Phe Arg Thr Ile Ser Phe Gly Thr Pro Phe Asn Phe Leu Asp
565 570 575 565 570 575
Ala Gln Ser Thr Phe Arg Leu Gly Val Trp Ser Phe Ser Ser Gly Thr Ala Gln Ser Thr Phe Arg Leu Gly Val Trp Ser Phe Ser Ser Gly Thr
580 585 590 580 585 590
Val Leu Ile Asp Arg Ile Glu Val Val Pro Met Glu Val Thr Phe Glu Val Leu Ile Asp Arg Ile Glu Val Val Pro Met Glu Val Thr Phe Glu
595 600 605 595 600 605
Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe
610 615 620 610 615 620
Thr Ser Ile Asn Gln Lys Gly Leu Lys Thr Asp Val Thr Asp Tyr His Thr Ser Ile Asn Gln Lys Gly Leu Lys Thr Asp Val Thr Asp Tyr His
625 630 635 640 625 630 635 640
Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys
645 650 655 645 650 655
Leu Asp Glu Lys Arg Glu Leu Phe Glu Lys Val Lys Tyr Ala Lys Arg Leu Asp Glu Lys Arg Glu Leu Phe Glu Lys Val Lys Tyr Ala Lys Arg
660 665 670 660 665 670
Leu Ser Asp Glu Arg Asn Leu Leu Ala Asp Pro Asn Phe Thr Ser Ile Leu Ser Asp Glu Arg Asn Leu Leu Ala Asp Pro Asn Phe Thr Ser Ile
675 680 685 675 680 685
Asn Gly Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Asn Gly Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile
690 695 700 690 695 700
Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Ser Gly Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Ser Gly
705 710 715 720 705 710 715 720
Thr Leu Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Thr Leu Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu
725 730 735 725 730 735
Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu
740 745 750 740 745 750
Asp Ser Gln Asp Leu Glu Val Tyr Leu Ile Arg Tyr Asn Thr Lys His Asp Ser Gln Asp Leu Glu Val Tyr Leu Ile Arg Tyr Asn Thr Lys His
755 760 765 755 760 765
Glu Thr Leu Asn Val Pro Gly Thr Gly Gly Leu Trp Pro Leu Ala Val Glu Thr Leu Asn Val Pro Gly Thr Gly Gly Leu Trp Pro Leu Ala Val
770 775 780 770 775 780
Glu Ser Ser Ile Gly Gly Cys Gly Glu Pro Asn Arg Cys Ala Pro Gln Glu Ser Ser Ile Gly Gly Cys Gly Glu Pro Asn Arg Cys Ala Pro Gln
785 790 795 800 785 790 795 800
Met Glu Trp Asp Pro Asn Leu Glu Cys Ser Cys Ser Asp Glu Glu Lys Met Glu Trp Asp Pro Asn Leu Glu Cys Ser Cys Ser Asp Glu Glu Lys
805 810 815 805 810 815
Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys
820 825 830 820 825 830
Thr Asp Leu Asn Glu Asn Leu Gly Ile Trp Val Ile Phe Lys Ile Lys Thr Asp Leu Asn Glu Asn Leu Gly Ile Trp Val Ile Phe Lys Ile Lys
835 840 845 835 840 845
Thr Gln Asn Gly Tyr Ala Lys Leu Gly Asn Leu Glu Phe Leu Glu Glu Thr Gln Asn Gly Tyr Ala Lys Leu Gly Asn Leu Glu Phe Leu Glu Glu
850 855 860 850 855 860
Lys Pro Leu Ile Gly Glu Ala Leu Ala Arg Val Lys Arg Val Glu Lys Lys Pro Leu Ile Gly Glu Ala Leu Ala Arg Val Lys Arg Val Glu Lys
865 870 875 880 865 870 875 880
Lys Trp Lys Asp Lys Arg Glu Lys Leu Glu Phe Glu Thr Asn Ile Val Lys Trp Lys Asp Lys Arg Glu Lys Leu Glu Phe Glu Thr Asn Ile Val
885 890 895 885 890 895
Tyr Asn Glu Ala Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asn Glu Ala Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser Gln
900 905 910 900 905 910
Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala
915 920 925 915 920 925
Asp Asn Lys Val His Lys Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Asp Asn Lys Val His Lys Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser
930 935 940 930 935 940
Val Ile Pro Gly Val Asn Ala Thr Val Phe Glu Glu Leu Glu Glu Arg Val Ile Pro Gly Val Asn Ala Thr Val Phe Glu Glu Leu Glu Glu Arg
945 950 955 960 945 950 955 960
Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn
965 970 975 965 970 975
Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly Gln Val Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly Gln Val
980 985 990 980 985 990
Asp Val Asp Gln Asn Asp His Arg Ser Val Leu Val Ile Pro Gly Trp Asp Val Asp Gln Asn Asp His Arg Ser Val Leu Val Ile Pro Gly Trp
995 1000 1005 995 1000 1005
Glu Ser Glu Val Ser Gln Glu Val His Val Cys Pro Asp Arg Gly Glu Ser Glu Val Ser Gln Glu Val His Val Cys Pro Asp Arg Gly
1010 1015 1020 1010 1015 1020
Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly
1025 1030 1035 1025 1030 1035
Cys Val Thr Ile His Glu Ile Asp Asn His Thr Asp Glu Leu Lys Cys Val Thr Ile His Glu Ile Asp Asn His Thr Asp Glu Leu Lys
1040 1045 1050 1040 1045 1050
Phe Lys Asn Cys Phe Glu Glu Glu Val Ser Leu Asn Asn Ala Val Phe Lys Asn Cys Phe Glu Glu Glu Val Ser Leu Asn Asn Ala Val
1055 1060 1065 1055 1060 1065
Thr Cys Asp Glu Tyr Thr Thr Asn Gln Glu Val Gly Gly Tyr Ala Thr Cys Asp Glu Tyr Thr Thr Asn Gln Glu Val Gly Gly Tyr Ala
1070 1075 1080 1070 1075 1080
Asp Val Arg Gln Ser Asn Asn Arg Gly Ser Asn Glu Ala Tyr Val Asp Val Arg Gln Ser Asn Asn Arg Gly Ser Asn Glu Ala Tyr Val
1085 1090 1095 1085 1090 1095
Asn Pro Thr Ser Thr Ser Thr Asp Tyr Ala Ser Leu Tyr Glu Glu Asn Pro Thr Ser Thr Ser Thr Asp Tyr Ala Ser Leu Tyr Glu Glu
1100 1105 1110 1100 1105 1110
Glu Ser Tyr Thr Asn Glu Gln Thr Tyr Asn Ser Cys Glu Ser Asn Glu Ser Tyr Thr Asn Glu Gln Thr Tyr Asn Ser Cys Glu Ser Asn
1115 1120 1125 1115 1120 1125
Arg Gly Tyr Gly Asn Gln Met Pro Leu Pro Ser Gly Tyr Val Thr Arg Gly Tyr Gly Asn Gln Met Pro Leu Pro Ser Gly Tyr Val Thr
1130 1135 1140 1130 1135 1140
Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu
1145 1150 1155 1145 1150 1155
Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu
1160 1165 1170 1160 1165 1170
Leu Leu Met Glu Glu Leu Leu Met Glu Glu
1175 1175
<210> 9<210> 9
<211> 3540<211> 3540
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> A synthetic coding sequence encoding a TIC2613PL pesticidal <223> A synthetic coding sequence encoding a TIC2613PL pesticidal
protein designed for expression in a plant cell wherein an protein designed for expression in a plant cell where an
additional alanine codon is inserted immediately following the additional alanine codon is inserted immediately following the
initiating methionine codon. initiating methionine codon.
<400> 9<400> 9
atggctgaca acaacatcaa gaaccagtgc atcccgtaca actgcctcaa cgacccggag 60atggctgaca acaacatcaa gaaccagtgc atcccgtaca actgcctcaa cgacccggag 60
gtcgagatcc tcggcgagga gggcataacg acgagcaacg agaaccttga gttcttcctc 120gtcgagatcc tcggcgagga gggcataacg acgagcaacg agaaccttga gttcttcctc 120
agcctcacga agttcgtcct gaaccgcttc gtgccgggcg gagcctacgt ggctggcctg 180agcctcacga agttcgtcct gaaccgcttc gtgccggggcg gagcctacgt ggctggcctg 180
ttcgatgtgt tctggggatg gctcaagcca agcgactggt ccgcgattct ggagcagatc 240ttcgatgtgt tctggggatg gctcaagcca agcgactggt ccgcgattct ggagcagatc 240
gaggaactca tcaaccagaa gatcgagaca ttcgcccgca accaggccat cagccgcctg 300gaggaactca tcaaccagaa gatcgagaca ttcgcccgca accaggccat cagccgcctg 300
gagggcctct cgaacctcta cgaaatctac gccgatacgt tcaaggagtg ggagaaggat 360gagggcctct cgaacctcta cgaaatctac gccgatacgt tcaaggagtg ggagaaggat 360
ccgacgaacc cggccttgcg cgaggagatg aggacgcaat tcaacgacat gaactccagc 420ccgacgaacc cggccttgcg cgaggagatg aggacgcaat tcaacgacat gaactccagc 420
ttcgtcaccg ccatgccgct gttctccgtc cagaacttcg aggtgccctt gctcgccgtg 480ttcgtcaccg ccatgccgct gttctccgtc cagaacttcg aggtgccctt gctcgccgtg 480
tacgcgcaag ctgcgaactt acatcttagc gtcctccgcg acgtcagcgt cttcggccag 540tacgcgcaag ctgcgaactt acatcttagc gtcctccgcg acgtcagcgt cttcggccag 540
aactggggat tcgattccgc gacggtgaac tcacggtaca atgatctcgt gcggaacatc 600aactggggat tcgattccgc gacggtgaac tcacggtaca atgatctcgt gcggaacatc 600
cggacctaca ccaattacgt cgtgcgctgg tacaacacgg gattggcgcg tctgcgcggc 660660
actacctacc aggactggct caactaccac cggttccgcc gcgaactcac aatcacagcg 720actacctacc aggactggct caactaccac cggttccgcc gcgaactcac aatcacagcg 720
ctggacatca ttaccatctt cccgcactac gacaacaaga tgtacccaat ccagcctcac 780ctggacatca ttaccatctt cccgcactac gacaacaaga tgtacccaat ccagcctcac 780
ttccagctta cccgtgagat ctacacggac ccgctcatca acttcaatcc cgcactgcaa 840ttccagctta cccgtgagat ctacacggac ccgctcatca acttcaatcc cgcactgcaa 840
tcagtagccc aattgccact cttcaacgag atggagaact cgacaatccg aagccctcac 900tcagtagccc aattgccact cttcaacgag atggagaact cgacaatccg aagccctcac 900
ctcgtggact tcctcaaccg cctgaccatc tacacggatt ggtactctct tggtcggcac 960ctcgtggact tcctcaaccg cctgaccatc tacacggatt ggtactctct tggtcggcac 960
tactattggg gcgggcacca aatcgtgtcc aggcagaccg gctctacctc taccataacc 1020tactattggg gcgggcacca aatcgtgtcc aggcagaccg gctctacctc taccataacc 1020
ttcccgatct atggccggga ggccaaccag gaggctccga ggacttacaa cttcagtcag 1080ttcccgatct atggccggga ggccaaccag gaggctccga ggacttacaa cttcagtcag 1080
ccagtgttcc gcacactctc caacccgact ctcactcgtt tgatgcagcc ctggcccgct 1140ccagtgttcc gcacactctc caacccgact ctcactcgtt tgatgcagcc ctggcccgct 1140
cccgcgtttc agctcagaag attggagggc gtggagttcc aaacaacgac gggcaacttc 1200cccgcgtttc agctcagaag attggagggc gtggagttcc aaacaacgac gggcaacttc 1200
acctaccgtg gccgtgggac ggtggacagt ttcgacgagt tgcctccgga cgacaccagc 1260acctaccgtg gccgtgggac ggtggacagt ttcgacgagt tgcctccgga cgacaccagc 1260
gtgcctgcaa gggaaggcta ctcgcacagg ctgtgccacg cgacgttcat ccgcaagtct 1320gtgcctgcaa gggaaggcta ctcgcacagg ctgtgccacg cgacgttcat ccgcaagtct 1320
gggacaccct acctgacaac cggcgtcact ctctcctgga cccacaacag caacacaccc 1380gggacaccct acctgacaac cggcgtcact ctctcctgga cccacaacag caacacaccc 1380
accaacataa tctaccctga caagataaca caagtgccgc tggtgaaggc ttcgaacctc 1440accaacataa tctaccctga caagataaca caagtgccgc tggtgaaggc ttcgaacctc 1440
cattcctccg ccttcgtcct caagggtccg ggcttcaccg gcggcgacat cctgggtcgc 1500cattcctccg ccttcgtcct caagggtccg ggcttcaccg gcggcgacat cctgggtcgc 1500
acgtcggtcg gcaacatcgc ggacattcag atgaacatta ccgcacctct gtcccagcgc 1560acgtcggtcg gcaacatcgc ggacattcag atgaacatta ccgcacctct gtcccagcgc 1560
tacagagtgc gtatccgcta cgcgagtacg accaacctcc aattccacac tacgatcaat 1620tacagagtgc gtatccgcta cgcgagtacg accaacctcc aattccacac tacgatcaat 1620
gggagggcgg ttaatcaggc caacttcccg gccacgatga accgggtcga agacctggag 1680gggagggcgg ttaatcaggc caacttcccg gccacgatga accgggtcga agacctggag 1680
tacaactcgt ttcggaccat ctctttcggc acgccgttca acttcctaga cgcccagtca 1740tacaactcgt ttcggaccat ctctttcggc acgccgttca acttcctaga cgcccagtca 1740
acctttcggc tgggagtttg gagcttcagc agcggcacag tcctcatcga ccgaatagag 1800acctttcggc tgggagtttg gagcttcagc agcggcacag tcctcatcga ccgaatagag 1800
gtggttccga tggaggtcac gttcgaggcg gagtcggacc tggagcgagc gcagaaggct 1860gtggttccga tggaggtcac gttcgaggcg gagtcggacc tggagcgagc gcagaaggct 1860
gtaaatgcgt tgttcacgag cattaaccag aagggcctca agaccgatgt cacagactac 1920gtaaatgcgt tgttcacgag cattaaccag aagggcctca agaccgatgt cacagactac 1920
cacatcgacc aagtgtcgaa cctggtggag tgtctgtcgg atgagttctg tcttgacgag 1980cacatcgacc aagtgtcgaa cctggtggag tgtctgtcgg atgagttctg tcttgacgag 1980
aagcgggagc tgttcgagaa ggtgaagtat gctaagcggc tgagcgacga gcggaacttg 2040aagcgggagc tgttcgagaa ggtgaagtat gctaagcggc tgagcgacga gcggaacttg 2040
ttggctgacc cgaacttcac cagcatcaac ggacagctcg accgtgggtg gcgaggttcc 2100ttggctgacc cgaacttcac cagcatcaac ggacagctcg accgtgggtg gcgaggttcc 2100
accgacatca cgatacaggg cggagacgat gtgttcaagg agaactatgt gaccctctca 2160accgacatca cgatacaggg cggagacgat gtgttcaagg agaactatgt gaccctctca 2160
ggaacactgg atgagtgcta cccgacctat ctctaccaga agatcgacga gagcaagctc 2220ggaacactgg atgagtgcta cccgacctat ctctaccaga agatcgacga gagcaagctc 2220
aaggcttaca cgcgctacga actccgtggc tacatcgaag actcccagga tcttgaggtg 2280aaggcttaca cgcgctacga actccgtggc tacatcgaag actcccagga tcttgaggtg 2280
tacctcatac gctacaacac aaagcacgag acgctcaacg ttcctggcac cggtggtctt 2340tacctcatac gctacaacac aaagcacgag acgctcaacg ttcctggcac cggtggtctt 2340
tggcccttgg ccgtggagag tagcatcggc gggtgcggtg agccaaaccg atgcgcgcca 2400tggcccttgg ccgtggagag tagcatcggc gggtgcggtg agccaaaccg atgcgcgcca 2400
cagatggaat gggatccgaa cctagagtgc tcctgctcag acgaggagaa gtgcgcccac 2460cagatggaat gggatccgaa cctagagtgc tcctgctcag acgaggagaa gtgcgcccac 2460
cactcccacc acttctcgct cgacattgac gttggctgca cggatctcaa cgagaaccta 2520cactcccacc acttctcgct cgacattgac gttggctgca cggatctcaa cgagaaccta 2520
ggaatctggg tgatcttcaa gattaagacc cagaacggct acgccaagct cgggaatctg 2580ggaatctggg tgatcttcaa gattaagacc cagaacggct acgccaagct cgggaatctg 2580
gagtttcttg aggagaagcc gctgatcggc gaggccctcg cgcgcgtgaa gcgagtcgag 2640gagtttcttg aggagaagcc gctgatcggc gaggccctcg cgcgcgtgaa gcgagtcgag 2640
aagaagtgga aagacaagcg ggagaagcta gagtttgaaa cgaacattgt ttacaacgag 2700aagaagtgga aagacaagcg ggagaagcta gagtttgaaa cgaacattgt ttacaacgag 2700
gcaaaggaag ccgtggacgc tctgttcgta aacagtcagt acgaccgtct ccaggccgac 2760gcaaaggaag ccgtggacgc tctgttcgta aacagtcagt acgaccgtct ccaggccgac 2760
acgaacatcg caatgataca cgcggcggat aacaaggtgc acaagattcg ggaggcttac 2820acgaacatcg caatgataca cgcggcggat aacaaggtgc acaagattcg ggaggcttac 2820
ctgcccgagc tgtcggtcat cccaggcgta aacgctaccg tgttcgagga gctggaggaa 2880ctgcccgagc tgtcggtcat cccaggcgta aacgctaccg tgttcgagga gctggaggaa 2880
cggatcttca ccgcgttctc cctctatgac gcaaggaacg tcatcaagaa cggcgacttc 2940cggatcttca ccgcgttctc cctctatgac gcaaggaacg tcatcaagaa cggcgacttc 2940
aacaacggcc tgagctgctg gaacgtgaag ggccaagtgg acgtcgatca gaacgatcac 3000aacaacggcc tgagctgctg gaacgtgaag ggccaagtgg acgtcgatca gaacgatcac 3000
cgctccgttc tggtcattcc agggtgggag tccgaggtga gccaagaggt ccatgtgtgc 3060cgctccgttc tggtcattcc agggtgggag tccgaggtga gccaagaggt ccatgtgtgc 3060
ccggaccgtg gctacatcct tcgggtgacc gcgtacaagg agggctacgg cgaaggctgc 3120ccggaccgtg gctacatcct tcgggtgacc gcgtacaagg agggctacgg cgaaggctgc 3120
gtgaccatac acgagatcga caaccacacc gacgagctta agttcaagaa ctgcttcgag 31803180 gtgaccatac acgagatcga caaccacacc
gaggaggtgt cactgaacaa cgccgtgacc tgcgacgagt acacgaccaa tcaggaggtc 3240gaggaggtgt cactgaacaa cgccgtgacc tgcgacgagt acacgaccaa tcaggaggtc 3240
ggcggctacg ccgacgtccg ccagtcgaac aatcgaggca gcaacgaggc gtacgtgaac 3300ggcggctacg ccgacgtccg ccagtcgaac aatcgaggca gcaacgaggc gtacgtgaac 3300
ccaacctcca cctcgacgga ctacgccagc ctctacgagg aggagtccta cacaaacgag 3360ccaacctcca cctcgacgga ctacgccagc ctctacgagg aggagtccta cacaaacgag 3360
cagacctaca actcgtgcga gagcaaccga ggttacggga accagatgcc gctaccgtcc 3420cagacctaca actcgtgcga gagcaaccga ggttacggga accagatgcc gctaccgtcc 3420
gggtacgtga cgaaggagct ggagtatttc ccagagaccg acaaggtgtg gatcgagatc 3480gggtacgtga cgaaggagct ggagtatttc ccagagaccg acaaggtgtg gatcgagatc 3480
ggcgagacag agggcacgtt catcgtggac agcgtcgagc tgctgttgat ggaggagtga 3540ggcgagacag agggcacgtt catcgtggac agcgtcgagc tgctgttgat ggaggagtga 3540
<210> 10<210> 10
<211> 1179<211> 1179
<212> PRT<212> PRT
<213> Artificial<213> Artificial
<220><220>
<223> The amino acid sequence of TIC2613PL encoded by a synthetic <223> The amino acid sequence of TIC2613PL encoded by a synthetic
coding sequence designed for expression in a plant cell (SEQ ID coding sequence designed for expression in a plant cell (SEQ ID
NO:9), and wherein an additional alanine amino acid is inserted NO:9), and where an additional alanine amino acid is inserted
immediately following the initiating methionine. immediately following the initiating methionine.
<400> 10<400> 10
Met Ala Asp Asn Asn Ile Lys Asn Gln Cys Ile Pro Tyr Asn Cys Leu Met Ala Asp Asn Asn Ile Lys Asn Gln Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15 1 5 10 15
Asn Asp Pro Glu Val Glu Ile Leu Gly Glu Glu Gly Ile Thr Thr Ser Asn Asp Pro Glu Val Glu Ile Leu Gly Glu Glu Gly Ile Thr Ser
20 25 30 20 25 30
Asn Glu Asn Leu Glu Phe Phe Leu Ser Leu Thr Lys Phe Val Leu Asn Asn Glu Asn Leu Glu Phe Phe Leu Ser Leu Thr Lys Phe Val Leu Asn
35 40 45 35 40 45
Arg Phe Val Pro Gly Gly Ala Tyr Val Ala Gly Leu Phe Asp Val Phe Arg Phe Val Pro Gly Gly Ala Tyr Val Ala Gly Leu Phe Asp Val Phe
50 55 60 50 55 60
Trp Gly Trp Leu Lys Pro Ser Asp Trp Ser Ala Ile Leu Glu Gln Ile Trp Gly Trp Leu Lys Pro Ser Asp Trp Ser Ala Ile Leu Glu Gln Ile
65 70 75 80 65 70 75 80
Glu Glu Leu Ile Asn Gln Lys Ile Glu Thr Phe Ala Arg Asn Gln Ala Glu Glu Leu Ile Asn Gln Lys Ile Glu Thr Phe Ala Arg Asn Gln Ala
85 90 95 85 90 95
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Glu Ile Tyr Ala Asp Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Glu Ile Tyr Ala Asp
100 105 110 100 105 110
Thr Phe Lys Glu Trp Glu Lys Asp Pro Thr Asn Pro Ala Leu Arg Glu Thr Phe Lys Glu Trp Glu Lys Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125 115 120 125
Glu Met Arg Thr Gln Phe Asn Asp Met Asn Ser Ser Phe Val Thr Ala Glu Met Arg Thr Gln Phe Asn Asp Met Asn Ser Ser Phe Val Thr Ala
130 135 140 130 135 140
Met Pro Leu Phe Ser Val Gln Asn Phe Glu Val Pro Leu Leu Ala Val Met Pro Leu Phe Ser Val Gln Asn Phe Glu Val Pro Leu Leu Ala Val
145 150 155 160 145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser Tyr Ala Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175 165 170 175
Val Phe Gly Gln Asn Trp Gly Phe Asp Ser Ala Thr Val Asn Ser Arg Val Phe Gly Gln Asn Trp Gly Phe Asp Ser Ala Thr Val Asn Ser Arg
180 185 190 180 185 190
Tyr Asn Asp Leu Val Arg Asn Ile Arg Thr Tyr Thr Asn Tyr Val Val Tyr Asn Asp Leu Val Arg Asn Ile Arg Thr Tyr Thr Asn Tyr Val Val
195 200 205 195 200 205
Arg Trp Tyr Asn Thr Gly Leu Ala Arg Leu Arg Gly Thr Thr Tyr Gln Arg Trp Tyr Asn Thr Gly Leu Ala Arg Leu Arg Gly Thr Thr Tyr Gln
210 215 220 210 215 220
Asp Trp Leu Asn Tyr His Arg Phe Arg Arg Glu Leu Thr Ile Thr Ala Asp Trp Leu Asn Tyr His Arg Phe Arg Arg Glu Leu Thr Ile Thr Ala
225 230 235 240 225 230 235 240
Leu Asp Ile Ile Thr Ile Phe Pro His Tyr Asp Asn Lys Met Tyr Pro Leu Asp Ile Ile Thr Ile Phe Pro His Tyr Asp Asn Lys Met Tyr Pro
245 250 255 245 250 255
Ile Gln Pro His Phe Gln Leu Thr Arg Glu Ile Tyr Thr Asp Pro Leu Ile Gln Pro His Phe Gln Leu Thr Arg Glu Ile Tyr Thr Asp Pro Leu
260 265 270 260 265 270
Ile Asn Phe Asn Pro Ala Leu Gln Ser Val Ala Gln Leu Pro Leu Phe Ile Asn Phe Asn Pro Ala Leu Gln Ser Val Ala Gln Leu Pro Leu Phe
275 280 285 275 280 285
Asn Glu Met Glu Asn Ser Thr Ile Arg Ser Pro His Leu Val Asp Phe Asn Glu Met Glu Asn Ser Thr Ile Arg Ser Pro His Leu Val Asp Phe
290 295 300 290 295 300
Leu Asn Arg Leu Thr Ile Tyr Thr Asp Trp Tyr Ser Leu Gly Arg His Leu Asn Arg Leu Thr Ile Tyr Thr Asp Trp Tyr Ser Leu Gly Arg His
305 310 315 320 305 310 315 320
Tyr Tyr Trp Gly Gly His Gln Ile Val Ser Arg Gln Thr Gly Ser Thr Tyr Tyr Trp Gly Gly His Gln Ile Val Ser Arg Gln Thr Gly Ser Thr
325 330 335 325 330 335
Ser Thr Ile Thr Phe Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Ala Ser Thr Ile Thr Phe Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Ala
340 345 350 340 345 350
Pro Arg Thr Tyr Asn Phe Ser Gln Pro Val Phe Arg Thr Leu Ser Asn Pro Arg Thr Tyr Asn Phe Ser Gln Pro Val Phe Arg Thr Leu Ser Asn
355 360 365 355 360 365
Pro Thr Leu Thr Arg Leu Met Gln Pro Trp Pro Ala Pro Ala Phe Gln Pro Thr Leu Thr Arg Leu Met Gln Pro Trp Pro Ala Pro Ala Phe Gln
370 375 380 370 375 380
Leu Arg Arg Leu Glu Gly Val Glu Phe Gln Thr Thr Thr Gly Asn Phe Leu Arg Arg Leu Glu Gly Val Glu Phe Gln Thr Thr Thr Gly Asn Phe
385 390 395 400 385 390 395 400
Thr Tyr Arg Gly Arg Gly Thr Val Asp Ser Phe Asp Glu Leu Pro Pro Thr Tyr Arg Gly Arg Gly Thr Val Asp Ser Phe Asp Glu Leu Pro Pro
405 410 415 405 410 415
Asp Asp Thr Ser Val Pro Ala Arg Glu Gly Tyr Ser His Arg Leu Cys Asp Asp Thr Ser Val Pro Ala Arg Glu Gly Tyr Ser His Arg Leu Cys
420 425 430 420 425 430
His Ala Thr Phe Ile Arg Lys Ser Gly Thr Pro Tyr Leu Thr Thr Gly His Ala Thr Phe Ile Arg Lys Ser Gly Thr Pro Tyr Leu Thr Thr Gly
435 440 445 435 440 445
Val Thr Leu Ser Trp Thr His Asn Ser Asn Thr Pro Thr Asn Ile Ile Val Thr Leu Ser Trp Thr His Asn Ser Asn Thr Pro Thr Asn Ile Ile
450 455 460 450 455 460
Tyr Pro Asp Lys Ile Thr Gln Val Pro Leu Val Lys Ala Ser Asn Leu Tyr Pro Asp Lys Ile Thr Gln Val Pro Leu Val Lys Ala Ser Asn Leu
465 470 475 480 465 470 475 480
His Ser Ser Ala Phe Val Leu Lys Gly Pro Gly Phe Thr Gly Gly Asp His Ser Ser Ala Phe Val Leu Lys Gly Pro Gly Phe Thr Gly Gly Asp
485 490 495 485 490 495
Ile Leu Gly Arg Thr Ser Val Gly Asn Ile Ala Asp Ile Gln Met Asn Ile Leu Gly Arg Thr Ser Val Gly Asn Ile Ala Asp Ile Gln Met Asn
500 505 510 500 505 510
Ile Thr Ala Pro Leu Ser Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ile Thr Ala Pro Leu Ser Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala
515 520 525 515 520 525
Ser Thr Thr Asn Leu Gln Phe His Thr Thr Ile Asn Gly Arg Ala Val Ser Thr Thr Asn Leu Gln Phe His Thr Thr Ile Asn Gly Arg Ala Val
530 535 540 530 535 540
Asn Gln Ala Asn Phe Pro Ala Thr Met Asn Arg Val Glu Asp Leu Glu Asn Gln Ala Asn Phe Pro Ala Thr Met Asn Arg Val Glu Asp Leu Glu
545 550 555 560 545 550 555 560
Tyr Asn Ser Phe Arg Thr Ile Ser Phe Gly Thr Pro Phe Asn Phe Leu Tyr Asn Ser Phe Arg Thr Ile Ser Phe Gly Thr Pro Phe Asn Phe Leu
565 570 575 565 570 575
Asp Ala Gln Ser Thr Phe Arg Leu Gly Val Trp Ser Phe Ser Ser Gly Asp Ala Gln Ser Thr Phe Arg Leu Gly Val Trp Ser Phe Ser Ser Gly
580 585 590 580 585 590
Thr Val Leu Ile Asp Arg Ile Glu Val Val Pro Met Glu Val Thr Phe Thr Val Leu Ile Asp Arg Ile Glu Val Val Pro Met Glu Val Thr Phe
595 600 605 595 600 605
Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu
610 615 620 610 615 620
Phe Thr Ser Ile Asn Gln Lys Gly Leu Lys Thr Asp Val Thr Asp Tyr Phe Thr Ser Ile Asn Gln Lys Gly Leu Lys Thr Asp Val Thr Asp Tyr
625 630 635 640 625 630 635 640
His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe
645 650 655 645 650 655
Cys Leu Asp Glu Lys Arg Glu Leu Phe Glu Lys Val Lys Tyr Ala Lys Cys Leu Asp Glu Lys Arg Glu Leu Phe Glu Lys Val Lys Tyr Ala Lys
660 665 670 660 665 670
Arg Leu Ser Asp Glu Arg Asn Leu Leu Ala Asp Pro Asn Phe Thr Ser Arg Leu Ser Asp Glu Arg Asn Leu Leu Ala Asp Pro Asn Phe Thr Ser
675 680 685 675 680 685
Ile Asn Gly Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Asn Gly Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr
690 695 700 690 695 700
Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Ser Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Ser
705 710 715 720 705 710 715 720
Gly Thr Leu Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Gly Thr Leu Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp
725 730 735 725 730 735
Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile
740 745 750 740 745 750
Glu Asp Ser Gln Asp Leu Glu Val Tyr Leu Ile Arg Tyr Asn Thr Lys Glu Asp Ser Gln Asp Leu Glu Val Tyr Leu Ile Arg Tyr Asn Thr Lys
755 760 765 755 760 765
His Glu Thr Leu Asn Val Pro Gly Thr Gly Gly Leu Trp Pro Leu Ala His Glu Thr Leu Asn Val Pro Gly Thr Gly Gly Leu Trp Pro Leu Ala
770 775 780 770 775 780
Val Glu Ser Ser Ile Gly Gly Cys Gly Glu Pro Asn Arg Cys Ala Pro Val Glu Ser Ser Ile Gly Gly Cys Gly Glu Pro Asn Arg Cys Ala Pro
785 790 795 800 785 790 795 800
Gln Met Glu Trp Asp Pro Asn Leu Glu Cys Ser Cys Ser Asp Glu Glu Gln Met Glu Trp Asp Pro Asn Leu Glu Cys Ser Cys Ser Asp Glu Glu
805 810 815 805 810 815
Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly
820 825 830 820 825 830
Cys Thr Asp Leu Asn Glu Asn Leu Gly Ile Trp Val Ile Phe Lys Ile Cys Thr Asp Leu Asn Glu Asn Leu Gly Ile Trp Val Ile Phe Lys Ile
835 840 845 835 840 845
Lys Thr Gln Asn Gly Tyr Ala Lys Leu Gly Asn Leu Glu Phe Leu Glu Lys Thr Gln Asn Gly Tyr Ala Lys Leu Gly Asn Leu Glu Phe Leu Glu
850 855 860 850 855 860
Glu Lys Pro Leu Ile Gly Glu Ala Leu Ala Arg Val Lys Arg Val Glu Glu Lys Pro Leu Ile Gly Glu Ala Leu Ala Arg Val Lys Arg Val Glu
865 870 875 880 865 870 875 880
Lys Lys Trp Lys Asp Lys Arg Glu Lys Leu Glu Phe Glu Thr Asn Ile Lys Lys Trp Lys Asp Lys Arg Glu Lys Leu Glu Phe Glu Thr Asn Ile
885 890 895 885 890 895
Val Tyr Asn Glu Ala Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser Val Tyr Asn Glu Ala Lys Glu Ala Val Asp Ala Leu Phe Val Asn Ser
900 905 910 900 905 910
Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala
915 920 925 915 920 925
Ala Asp Asn Lys Val His Lys Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ala Asp Asn Lys Val His Lys Ile Arg Glu Ala Tyr Leu Pro Glu Leu
930 935 940 930 935 940
Ser Val Ile Pro Gly Val Asn Ala Thr Val Phe Glu Glu Leu Glu Glu Ser Val Ile Pro Gly Val Asn Ala Thr Val Phe Glu Glu Leu Glu Glu
945 950 955 960 945 950 955 960
Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys
965 970 975 965 970 975
Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly Gln Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly Gln
980 985 990 980 985 990
Val Asp Val Asp Gln Asn Asp His Arg Ser Val Leu Val Ile Pro Gly Val Asp Val Asp Gln Asn Asp His Arg Ser Val Leu Val Ile Pro Gly
995 1000 1005 995 1000 1005
Trp Glu Ser Glu Val Ser Gln Glu Val His Val Cys Pro Asp Arg Trp Glu Ser Glu Val Ser Gln Glu Val His Val Cys Pro Asp Arg
1010 1015 1020 1010 1015 1020
Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu
1025 1030 1035 1025 1030 1035
Gly Cys Val Thr Ile His Glu Ile Asp Asn His Thr Asp Glu Leu Gly Cys Val Thr Ile His Glu Ile Asp Asn His Thr Asp Glu Leu
1040 1045 1050 1040 1045 1050
Lys Phe Lys Asn Cys Phe Glu Glu Glu Val Ser Leu Asn Asn Ala Lys Phe Lys Asn Cys Phe Glu Glu Glu Val Ser Leu Asn Asn Ala
1055 1060 1065 1055 1060 1065
Val Thr Cys Asp Glu Tyr Thr Thr Asn Gln Glu Val Gly Gly Tyr Val Thr Cys Asp Glu Tyr Thr Thr Asn Gln Glu Val Gly Gly Tyr
1070 1075 1080 1070 1075 1080
Ala Asp Val Arg Gln Ser Asn Asn Arg Gly Ser Asn Glu Ala Tyr Ala Asp Val Arg Gln Ser Asn Asn Arg Gly Ser Asn Glu Ala Tyr
1085 1090 1095 1085 1090 1095
Val Asn Pro Thr Ser Thr Ser Thr Asp Tyr Ala Ser Leu Tyr Glu Val Asn Pro Thr Ser Thr Ser Thr Asp Tyr Ala Ser Leu Tyr Glu
1100 1105 1110 1100 1105 1110
Glu Glu Ser Tyr Thr Asn Glu Gln Thr Tyr Asn Ser Cys Glu Ser Glu Glu Ser Tyr Thr Asn Glu Gln Thr Tyr Asn Ser Cys Glu Ser
1115 1120 1125 1115 1120 1125
Asn Arg Gly Tyr Gly Asn Gln Met Pro Leu Pro Ser Gly Tyr Val Asn Arg Gly Tyr Gly Asn Gln Met Pro Leu Pro Ser Gly Tyr Val
1130 1135 1140 1130 1135 1140
Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile
1145 1150 1155 1145 1150 1155
Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu
1160 1165 1170 1160 1165 1170
Leu Leu Leu Met Glu Glu Leu Leu Leu Met Glu Glu
1175 1175
<---<---
Claims (51)
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662406082P | 2016-10-10 | 2016-10-10 | |
US62/406,082 | 2016-10-10 | ||
PCT/US2017/055731 WO2018071324A1 (en) | 2016-10-10 | 2017-10-09 | Novel insect inhibitory proteins |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2019114021A RU2019114021A (en) | 2020-11-13 |
RU2019114021A3 RU2019114021A3 (en) | 2021-02-08 |
RU2781075C2 true RU2781075C2 (en) | 2022-10-05 |
Family
ID=
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2286386C1 (en) * | 2005-02-14 | 2006-10-27 | Центр "Биоинженерия" Ран | RECOMBINANT POLYNUCLEOTIDE SEQUENCE CHARACTERIZING UNIQUE TRANSFORMATION ACT BETWEEN GENETIC CONSTRUCT INCLUDING cryIIIa GENE, AND GENOMIC DNA OF GENUS NEVSKIY POTATO, USES THEREOF, TRANSGENIC PLANT AND GENERATION THEREOF |
EP2087119A1 (en) * | 2006-10-30 | 2009-08-12 | Vib Vzw | Insect inhibition by plant serpin |
RU2527024C2 (en) * | 2008-01-15 | 2014-08-27 | Байер Кропсайенс Аг | Pesticidal composition, containing tetrazolyloxime derivative and active fungicidal or insecticidal substance (versions) and method of fighting phytopathogenic fungi or pests |
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2286386C1 (en) * | 2005-02-14 | 2006-10-27 | Центр "Биоинженерия" Ран | RECOMBINANT POLYNUCLEOTIDE SEQUENCE CHARACTERIZING UNIQUE TRANSFORMATION ACT BETWEEN GENETIC CONSTRUCT INCLUDING cryIIIa GENE, AND GENOMIC DNA OF GENUS NEVSKIY POTATO, USES THEREOF, TRANSGENIC PLANT AND GENERATION THEREOF |
EP2087119A1 (en) * | 2006-10-30 | 2009-08-12 | Vib Vzw | Insect inhibition by plant serpin |
RU2527024C2 (en) * | 2008-01-15 | 2014-08-27 | Байер Кропсайенс Аг | Pesticidal composition, containing tetrazolyloxime derivative and active fungicidal or insecticidal substance (versions) and method of fighting phytopathogenic fungi or pests |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11807864B2 (en) | Insect inhibitory proteins | |
US11312752B2 (en) | Insect inhibitory proteins | |
US11981908B2 (en) | Insect inhibitory proteins | |
US11744250B2 (en) | Insect inhibitory proteins | |
EP3328187B1 (en) | Novel insect inhibitory proteins | |
US10036037B2 (en) | Insect inhibitory proteins | |
RU2781075C2 (en) | New proteins with inhibitory effect relatively to insects | |
EA040152B1 (en) | NEW CHIMERIC INSECTICIDAL PROTEINS TOXIC OR INHIBITORIC AGAINST LEPIDOPTHER PESTS | |
EA040497B1 (en) | NEW CHIMERIC INSECTICIDAL PROTEINS TOXIC OR INHIBITORIC AGAINST LEPIDOPTHER PESTS | |
EA040101B1 (en) | NEW CHIMERIC INSECTICIDAL PROTEINS TOXIC OR INHIBITORIC AGAINST LEPIDOPTHER PESTS | |
EA040097B1 (en) | NEW CHIMERIC INSECTICIDAL PROTEINS TOXIC OR INHIBITORIC AGAINST LEPIDOPTHER PESTS |