RU2780626C2 - Pesticide protein toxins active against lepidoptera - Google Patents
Pesticide protein toxins active against lepidoptera Download PDFInfo
- Publication number
- RU2780626C2 RU2780626C2 RU2019125252A RU2019125252A RU2780626C2 RU 2780626 C2 RU2780626 C2 RU 2780626C2 RU 2019125252 A RU2019125252 A RU 2019125252A RU 2019125252 A RU2019125252 A RU 2019125252A RU 2780626 C2 RU2780626 C2 RU 2780626C2
- Authority
- RU
- Russia
- Prior art keywords
- leu
- glu
- val
- asn
- ile
- Prior art date
Links
- 241000255777 Lepidoptera Species 0.000 title claims abstract description 66
- 231100000654 Protein toxin Toxicity 0.000 title description 8
- 239000000575 pesticide Substances 0.000 title description 4
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 283
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 283
- 230000002588 toxic Effects 0.000 claims abstract description 110
- 231100000331 toxic Toxicity 0.000 claims abstract description 104
- 241000238631 Hexapoda Species 0.000 claims abstract description 93
- 229920000023 polynucleotide Polymers 0.000 claims abstract description 51
- 239000002157 polynucleotide Substances 0.000 claims abstract description 51
- 239000000203 mixture Substances 0.000 claims abstract description 42
- 241000607479 Yersinia pestis Species 0.000 claims abstract description 35
- 239000012472 biological sample Substances 0.000 claims abstract description 6
- 241000196324 Embryophyta Species 0.000 claims description 135
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 58
- 150000001413 amino acids Chemical class 0.000 claims description 31
- 230000000749 insecticidal Effects 0.000 claims description 30
- 229920001184 polypeptide Polymers 0.000 claims description 25
- 229920001850 Nucleic acid sequence Polymers 0.000 claims description 23
- 241000289763 Dasygaster padockina Species 0.000 claims description 22
- 239000003795 chemical substances by application Substances 0.000 claims description 21
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 19
- 241000255967 Helicoverpa zea Species 0.000 claims description 17
- 241001147398 Ostrinia nubilalis Species 0.000 claims description 17
- 241000209149 Zea Species 0.000 claims description 16
- 235000005822 corn Nutrition 0.000 claims description 16
- 235000005824 corn Nutrition 0.000 claims description 16
- 241001340508 Crambus Species 0.000 claims description 15
- 241000566547 Agrotis ipsilon Species 0.000 claims description 14
- 240000000111 Saccharum officinarum Species 0.000 claims description 14
- 230000000361 pesticidal Effects 0.000 claims description 14
- 241000122106 Diatraea saccharalis Species 0.000 claims description 13
- 240000007842 Glycine max Species 0.000 claims description 13
- 235000010469 Glycine max Nutrition 0.000 claims description 11
- 241000500437 Plutella xylostella Species 0.000 claims description 11
- 230000001809 detectable Effects 0.000 claims description 11
- 230000001131 transforming Effects 0.000 claims description 11
- 229920000160 (ribonucleotides)n+m Polymers 0.000 claims description 10
- 229920000742 Cotton Polymers 0.000 claims description 10
- 241000879145 Diatraea grandiosella Species 0.000 claims description 10
- 241000256251 Spodoptera frugiperda Species 0.000 claims description 10
- 235000005042 Zier Kohl Nutrition 0.000 claims description 10
- 241001367803 Chrysodeixis includens Species 0.000 claims description 9
- 241001000403 Herpetogramma licarsisalis Species 0.000 claims description 9
- 241000721451 Pectinophora gossypiella Species 0.000 claims description 9
- 235000008331 Pinus X rigitaeda Nutrition 0.000 claims description 9
- 241000018646 Pinus brutia Species 0.000 claims description 9
- 235000011613 Pinus brutia Nutrition 0.000 claims description 9
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 9
- 241000255993 Trichoplusia ni Species 0.000 claims description 9
- 230000001580 bacterial Effects 0.000 claims description 8
- 240000007124 Brassica oleracea Species 0.000 claims description 7
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 claims description 7
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 claims description 7
- 241001635274 Cydia pomonella Species 0.000 claims description 7
- 241000256244 Heliothis virescens Species 0.000 claims description 7
- 241001477931 Mythimna unipuncta Species 0.000 claims description 7
- 240000006394 Sorghum bicolor Species 0.000 claims description 7
- 241000098292 Striacosta albicosta Species 0.000 claims description 7
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 claims description 6
- 240000003259 Brassica oleracea var. botrytis Species 0.000 claims description 6
- 241000721703 Lymantria dispar Species 0.000 claims description 6
- 240000007594 Oryza sativa Species 0.000 claims description 6
- 241000256247 Spodoptera exigua Species 0.000 claims description 6
- 210000001519 tissues Anatomy 0.000 claims description 6
- 241000001996 Agrotis orthogonia Species 0.000 claims description 5
- 241001652650 Agrotis subterranea Species 0.000 claims description 5
- 241000449794 Alabama argillacea Species 0.000 claims description 5
- 241001259789 Amyelois transitella Species 0.000 claims description 5
- 241000625764 Anticarsia gemmatalis Species 0.000 claims description 5
- 241001002470 Archips argyrospila Species 0.000 claims description 5
- 241001423656 Archips rosana Species 0.000 claims description 5
- 241000426497 Chilo suppressalis Species 0.000 claims description 5
- 241000098289 Cnaphalocrocis medinalis Species 0.000 claims description 5
- 241001147381 Helicoverpa armigera Species 0.000 claims description 5
- 241000630740 Homoeosoma electellum Species 0.000 claims description 5
- 241000370523 Hypena scabra Species 0.000 claims description 5
- 241001261104 Lobesia botrana Species 0.000 claims description 5
- 241000732113 Mamestra configurata Species 0.000 claims description 5
- 241000497111 Paralobesia viteana Species 0.000 claims description 5
- 241001525654 Phyllocnistis citrella Species 0.000 claims description 5
- 241000255969 Pieris brassicae Species 0.000 claims description 5
- 241000907661 Pieris rapae Species 0.000 claims description 5
- 240000007742 Raphanus sativus Species 0.000 claims description 5
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 claims description 5
- 241000985245 Spodoptera litura Species 0.000 claims description 5
- 241001389006 Tuta absoluta Species 0.000 claims description 5
- 230000001276 controlling effect Effects 0.000 claims description 5
- -1 namental Species 0.000 claims description 5
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 claims description 4
- 240000002791 Brassica napus Species 0.000 claims description 4
- 241000353522 Earias insulana Species 0.000 claims description 4
- 241000400698 Elasmopalpus lignosellus Species 0.000 claims description 4
- 241001441330 Grapholita molesta Species 0.000 claims description 4
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 4
- 235000007164 Oryza sativa Nutrition 0.000 claims description 4
- 235000010582 Pisum sativum Nutrition 0.000 claims description 4
- 240000004713 Pisum sativum Species 0.000 claims description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 4
- 240000003768 Solanum lycopersicum Species 0.000 claims description 4
- 241001575047 Suleima Species 0.000 claims description 4
- 240000008529 Triticum aestivum Species 0.000 claims description 4
- 150000001875 compounds Chemical class 0.000 claims description 4
- 235000009566 rice Nutrition 0.000 claims description 4
- 235000021307 wheat Nutrition 0.000 claims description 4
- 241000234282 Allium Species 0.000 claims description 3
- 235000005254 Allium ampeloprasum Nutrition 0.000 claims description 3
- 240000006108 Allium ampeloprasum Species 0.000 claims description 3
- 240000002234 Allium sativum Species 0.000 claims description 3
- 240000007087 Apium graveolens Species 0.000 claims description 3
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 claims description 3
- 235000010591 Appio Nutrition 0.000 claims description 3
- 240000005781 Arachis hypogaea Species 0.000 claims description 3
- 235000007319 Avena orientalis Nutrition 0.000 claims description 3
- 244000075850 Avena orientalis Species 0.000 claims description 3
- 235000000832 Ayote Nutrition 0.000 claims description 3
- 235000003717 Boswellia sacra Nutrition 0.000 claims description 3
- 235000012035 Boswellia serrata Nutrition 0.000 claims description 3
- 240000007551 Boswellia serrata Species 0.000 claims description 3
- 235000017647 Brassica oleracea var italica Nutrition 0.000 claims description 3
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 claims description 3
- 235000004977 Brassica sinapistrum Nutrition 0.000 claims description 3
- 235000002566 Capsicum Nutrition 0.000 claims description 3
- 235000003255 Carthamus tinctorius Nutrition 0.000 claims description 3
- 240000005801 Carthamus tinctorius Species 0.000 claims description 3
- 240000000464 Cicer arietinum Species 0.000 claims description 3
- 235000010523 Cicer arietinum Nutrition 0.000 claims description 3
- 240000000613 Citrullus lanatus Species 0.000 claims description 3
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 claims description 3
- 241000207199 Citrus Species 0.000 claims description 3
- 235000013162 Cocos nucifera Nutrition 0.000 claims description 3
- 240000007170 Cocos nucifera Species 0.000 claims description 3
- 240000007154 Coffea arabica Species 0.000 claims description 3
- 241000219112 Cucumis Species 0.000 claims description 3
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 claims description 3
- 240000008067 Cucumis sativus Species 0.000 claims description 3
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 claims description 3
- 235000009854 Cucurbita moschata Nutrition 0.000 claims description 3
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 claims description 3
- 235000002767 Daucus carota Nutrition 0.000 claims description 3
- 240000002860 Daucus carota Species 0.000 claims description 3
- 240000000437 Eucalyptus leucoxylon Species 0.000 claims description 3
- 235000004694 Eucalyptus leucoxylon Nutrition 0.000 claims description 3
- 235000010705 Eucalyptus maculata Nutrition 0.000 claims description 3
- 235000009683 Eucalyptus polybractea Nutrition 0.000 claims description 3
- 235000009687 Eucalyptus sargentii Nutrition 0.000 claims description 3
- 239000004863 Frankincense Substances 0.000 claims description 3
- 235000004341 Gossypium herbaceum Nutrition 0.000 claims description 3
- 240000002024 Gossypium herbaceum Species 0.000 claims description 3
- 240000006669 Helianthus annuus Species 0.000 claims description 3
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 3
- 240000005979 Hordeum vulgare Species 0.000 claims description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 3
- 235000008694 Humulus lupulus Nutrition 0.000 claims description 3
- 240000006600 Humulus lupulus Species 0.000 claims description 3
- 235000002678 Ipomoea batatas Nutrition 0.000 claims description 3
- 240000003613 Ipomoea batatas Species 0.000 claims description 3
- 240000007049 Juglans regia Species 0.000 claims description 3
- 235000009496 Juglans regia Nutrition 0.000 claims description 3
- 235000003228 Lactuca sativa Nutrition 0.000 claims description 3
- 240000008415 Lactuca sativa Species 0.000 claims description 3
- 235000004431 Linum usitatissimum Nutrition 0.000 claims description 3
- 240000006240 Linum usitatissimum Species 0.000 claims description 3
- 240000003183 Manihot esculenta Species 0.000 claims description 3
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 claims description 3
- 240000004658 Medicago sativa Species 0.000 claims description 3
- 240000005561 Musa balbisiana Species 0.000 claims description 3
- 235000018290 Musa x paradisiaca Nutrition 0.000 claims description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 3
- 240000008962 Nicotiana tabacum Species 0.000 claims description 3
- 240000007817 Olea europaea Species 0.000 claims description 3
- 235000002725 Olea europaea Nutrition 0.000 claims description 3
- 241001520808 Panicum virgatum Species 0.000 claims description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 3
- 240000005158 Phaseolus vulgaris Species 0.000 claims description 3
- 241001236219 Pinus echinata Species 0.000 claims description 3
- 235000005018 Pinus echinata Nutrition 0.000 claims description 3
- 235000017339 Pinus palustris Nutrition 0.000 claims description 3
- 241000209504 Poaceae Species 0.000 claims description 3
- 241000219000 Populus Species 0.000 claims description 3
- 240000000528 Ricinus communis Species 0.000 claims description 3
- 235000004443 Ricinus communis Nutrition 0.000 claims description 3
- 235000007238 Secale cereale Nutrition 0.000 claims description 3
- 240000002057 Secale cereale Species 0.000 claims description 3
- 235000002597 Solanum melongena Nutrition 0.000 claims description 3
- 240000002686 Solanum melongena Species 0.000 claims description 3
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 3
- 240000001016 Solanum tuberosum Species 0.000 claims description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 3
- 235000009337 Spinacia oleracea Nutrition 0.000 claims description 3
- 240000003453 Spinacia oleracea Species 0.000 claims description 3
- 244000269722 Thea sinensis Species 0.000 claims description 3
- 241000219793 Trifolium Species 0.000 claims description 3
- 235000019714 Triticale Nutrition 0.000 claims description 3
- 241000219094 Vitaceae Species 0.000 claims description 3
- 244000128884 Zier Kohl Species 0.000 claims description 3
- 235000017585 alfalfa Nutrition 0.000 claims description 3
- 235000017587 alfalfa Nutrition 0.000 claims description 3
- 229920002892 amber Polymers 0.000 claims description 3
- 235000020971 citrus fruits Nutrition 0.000 claims description 3
- 235000016213 coffee Nutrition 0.000 claims description 3
- 235000013353 coffee beverage Nutrition 0.000 claims description 3
- 235000001612 eucalyptus Nutrition 0.000 claims description 3
- 235000001617 eucalyptus Nutrition 0.000 claims description 3
- 235000001621 eucalyptus Nutrition 0.000 claims description 3
- 235000006356 eucalyptus Nutrition 0.000 claims description 3
- 235000004611 garlic Nutrition 0.000 claims description 3
- 235000021021 grapes Nutrition 0.000 claims description 3
- 235000019713 millet Nutrition 0.000 claims description 3
- 235000002732 oignon Nutrition 0.000 claims description 3
- 235000020232 peanut Nutrition 0.000 claims description 3
- 235000015136 pumpkin Nutrition 0.000 claims description 3
- 235000005227 red mallee Nutrition 0.000 claims description 3
- 235000000346 sugar Nutrition 0.000 claims description 3
- 235000013616 tea Nutrition 0.000 claims description 3
- 235000020234 walnut Nutrition 0.000 claims description 3
- 241000228158 x Triticosecale Species 0.000 claims description 3
- 235000017060 Arachis glabrata Nutrition 0.000 claims description 2
- 235000010777 Arachis hypogaea Nutrition 0.000 claims description 2
- 235000018262 Arachis monticola Nutrition 0.000 claims description 2
- 235000010773 Cajanus indicus Nutrition 0.000 claims description 2
- 244000105627 Cajanus indicus Species 0.000 claims description 2
- 240000000218 Cannabis sativa Species 0.000 claims description 2
- 240000004244 Cucurbita moschata Species 0.000 claims description 2
- 241000602080 Dracaena fragrans Species 0.000 claims description 2
- 235000016623 Fragaria vesca Nutrition 0.000 claims description 2
- 240000009088 Fragaria x ananassa Species 0.000 claims description 2
- 235000011363 Fragaria x ananassa Nutrition 0.000 claims description 2
- 239000006002 Pepper Substances 0.000 claims description 2
- 235000016761 Piper aduncum Nutrition 0.000 claims description 2
- 235000017804 Piper guineense Nutrition 0.000 claims description 2
- 240000000129 Piper nigrum Species 0.000 claims description 2
- 235000008184 Piper nigrum Nutrition 0.000 claims description 2
- 238000003306 harvesting Methods 0.000 claims description 2
- 240000006962 Gossypium hirsutum Species 0.000 claims 2
- 241000345396 Brassica rapa subsp. chinensis Species 0.000 claims 1
- 241000122105 Diatraea Species 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 32
- 239000000126 substance Substances 0.000 abstract description 7
- 238000004519 manufacturing process Methods 0.000 abstract description 3
- 241000218475 Agrotis segetum Species 0.000 abstract 1
- 241000880493 Leptailurus serval Species 0.000 description 89
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 83
- XUUXCWCKKCZEAW-YFKPBYRVSA-N 2-[[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 66
- 241000282326 Felis catus Species 0.000 description 60
- 108010038633 aspartylglutamate Proteins 0.000 description 60
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 59
- 108010051242 phenylalanylserine Proteins 0.000 description 54
- MFEVVAXTBZELLL-UHFFFAOYSA-N Tyrosyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-UHFFFAOYSA-N 0.000 description 53
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 52
- 230000002401 inhibitory effect Effects 0.000 description 52
- 108010077515 glycylproline Proteins 0.000 description 51
- 108010089804 glycyl-threonine Proteins 0.000 description 50
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 49
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 49
- KTGFOCFYOZQVRJ-UHFFFAOYSA-N 2-[(2-amino-3-methylpentanoyl)amino]pentanedioic acid Chemical compound CCC(C)C(N)C(=O)NC(C(O)=O)CCC(O)=O KTGFOCFYOZQVRJ-UHFFFAOYSA-N 0.000 description 48
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 48
- 108010013835 arginine glutamate Proteins 0.000 description 47
- 108010061238 threonyl-glycine Proteins 0.000 description 47
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 46
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 46
- 210000004027 cells Anatomy 0.000 description 46
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 45
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 45
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 44
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 44
- 108010077245 asparaginyl-proline Proteins 0.000 description 44
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 42
- BSWHERGFUNMWGS-UHFFFAOYSA-N Aspartyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 41
- MQLZLIYPFDIDMZ-UHFFFAOYSA-N Asparaginyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(N)=O MQLZLIYPFDIDMZ-UHFFFAOYSA-N 0.000 description 40
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 40
- HZYHBDVRCBDJJV-HAFWLYHUSA-N Ile-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O HZYHBDVRCBDJJV-HAFWLYHUSA-N 0.000 description 40
- LDEBVRIURYMKQS-UHFFFAOYSA-N Serinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CO LDEBVRIURYMKQS-UHFFFAOYSA-N 0.000 description 40
- GVRKWABULJAONN-UHFFFAOYSA-N Valyl-Threonine Chemical compound CC(C)C(N)C(=O)NC(C(C)O)C(O)=O GVRKWABULJAONN-UHFFFAOYSA-N 0.000 description 40
- 108010057821 leucylproline Proteins 0.000 description 40
- 108010026333 seryl-proline Proteins 0.000 description 40
- 108010044940 alanylglutamine Proteins 0.000 description 38
- 108010087823 glycyltyrosine Proteins 0.000 description 38
- TWVKGYNQQAUNRN-ACZMJKKPSA-N Ile-Ser Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O TWVKGYNQQAUNRN-ACZMJKKPSA-N 0.000 description 37
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 37
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 37
- SJUXYGVRSGTPMC-UHFFFAOYSA-N Asparaginyl-Alanine Chemical compound OC(=O)C(C)NC(=O)C(N)CC(N)=O SJUXYGVRSGTPMC-UHFFFAOYSA-N 0.000 description 36
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 36
- MUFXDFWAJSPHIQ-XDTLVQLUSA-N Ile-Tyr Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 MUFXDFWAJSPHIQ-XDTLVQLUSA-N 0.000 description 35
- QCWJKJLNCFEVPQ-WHFBIAKZSA-N Asn-Gln Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O QCWJKJLNCFEVPQ-WHFBIAKZSA-N 0.000 description 34
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 34
- 108010081551 glycylphenylalanine Proteins 0.000 description 34
- XMBSYZWANAQXEV-UHFFFAOYSA-N 4-amino-5-[(1-carboxy-2-phenylethyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 33
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 33
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 32
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 32
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 32
- CKHWEVXPLJBEOZ-UHFFFAOYSA-N Threoninyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)C(C)O CKHWEVXPLJBEOZ-UHFFFAOYSA-N 0.000 description 32
- VYZAGTDAHUIRQA-WHFBIAKZSA-N L-alanyl-L-glutamic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O VYZAGTDAHUIRQA-WHFBIAKZSA-N 0.000 description 31
- 108010047495 alanylglycine Proteins 0.000 description 31
- 108010029020 prolylglycine Proteins 0.000 description 31
- TUTIHHSZKFBMHM-UHFFFAOYSA-N 4-amino-5-[(3-amino-1-carboxy-3-oxopropyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O TUTIHHSZKFBMHM-UHFFFAOYSA-N 0.000 description 30
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 30
- PMGDADKJMCOXHX-BQBZGAKWSA-N Arg-Gln Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PMGDADKJMCOXHX-BQBZGAKWSA-N 0.000 description 30
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 30
- WBAXJMCUFIXCNI-WDSKDSINSA-N Ser-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WBAXJMCUFIXCNI-WDSKDSINSA-N 0.000 description 30
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 30
- 108010008355 arginyl-glutamine Proteins 0.000 description 30
- 108010047857 aspartylglycine Proteins 0.000 description 30
- 108010078274 isoleucylvaline Proteins 0.000 description 30
- 108010009298 lysylglutamic acid Proteins 0.000 description 30
- RZVAJINKPMORJF-UHFFFAOYSA-N p-acetaminophenol Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 30
- 108010012581 phenylalanylglutamate Proteins 0.000 description 30
- WMDZARSFSMZOQO-DRZSPHRISA-N Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WMDZARSFSMZOQO-DRZSPHRISA-N 0.000 description 29
- ONWMQORSVZYVNH-UHFFFAOYSA-N Tyrosyl-Asparagine Chemical compound NC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 ONWMQORSVZYVNH-UHFFFAOYSA-N 0.000 description 29
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 28
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 28
- 108010050848 glycylleucine Proteins 0.000 description 28
- SITLTJHOQZFJGG-XPUUQOCRSA-N α-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 28
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 27
- JSLGXODUIAFWCF-UHFFFAOYSA-N Arginyl-Asparagine Chemical compound NC(N)=NCCCC(N)C(=O)NC(CC(N)=O)C(O)=O JSLGXODUIAFWCF-UHFFFAOYSA-N 0.000 description 27
- BCVIOZZGJNOEQS-XKNYDFJKSA-N Ile-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)[C@@H](C)CC BCVIOZZGJNOEQS-XKNYDFJKSA-N 0.000 description 27
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 27
- UJTZHGHXJKIAOS-WHFBIAKZSA-N Ser-Gln Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O UJTZHGHXJKIAOS-WHFBIAKZSA-N 0.000 description 27
- UQTNIFUCMBFWEJ-UHFFFAOYSA-N Threoninyl-Asparagine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-UHFFFAOYSA-N 0.000 description 27
- UBAQSAUDKMIEQZ-QWRGUYRKSA-N Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UBAQSAUDKMIEQZ-QWRGUYRKSA-N 0.000 description 27
- 229920003013 deoxyribonucleic acid Polymers 0.000 description 27
- KZNQNBZMBZJQJO-YFKPBYRVSA-N gly pro Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 27
- 108010090894 prolylleucine Proteins 0.000 description 27
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 26
- NPDLYUOYAGBHFB-UHFFFAOYSA-N Asparaginyl-Arginine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N NPDLYUOYAGBHFB-UHFFFAOYSA-N 0.000 description 26
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 26
- UWBDLNOCIDGPQE-UHFFFAOYSA-N Isoleucyl-Lysine Chemical compound CCC(C)C(N)C(=O)NC(C(O)=O)CCCCN UWBDLNOCIDGPQE-UHFFFAOYSA-N 0.000 description 26
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 26
- 108010070643 prolylglutamic acid Proteins 0.000 description 26
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 25
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 25
- LZDNBBYBDGBADK-KBPBESRZSA-N (2S)-2-[[(2S)-2-amino-3-methylbutanoyl]amino]-3-(1H-indol-3-yl)propanoic acid Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-KBPBESRZSA-N 0.000 description 24
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 24
- ARPVSMCNIDAQBO-UHFFFAOYSA-N Glutaminyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CCC(N)=O ARPVSMCNIDAQBO-UHFFFAOYSA-N 0.000 description 24
- UCGDDTHMMVWVMV-FSPLSTOPSA-N Ile-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(O)=O UCGDDTHMMVWVMV-FSPLSTOPSA-N 0.000 description 24
- BBIXOODYWPFNDT-CIUDSAMLSA-N Ile-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O BBIXOODYWPFNDT-CIUDSAMLSA-N 0.000 description 24
- WKXVAXOSIPTXEC-UHFFFAOYSA-N Isoleucyl-Aspartate Chemical compound CCC(C)C(N)C(=O)NC(C(O)=O)CC(O)=O WKXVAXOSIPTXEC-UHFFFAOYSA-N 0.000 description 24
- JYOAXOMPIXKMKK-UHFFFAOYSA-N Leucyl-Glutamine Chemical compound CC(C)CC(N)C(=O)NC(C(O)=O)CCC(N)=O JYOAXOMPIXKMKK-UHFFFAOYSA-N 0.000 description 24
- 108010066427 N-valyltryptophan Proteins 0.000 description 24
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 24
- IBIDRSSEHFLGSD-YUMQZZPRSA-N Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-YUMQZZPRSA-N 0.000 description 24
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 24
- 108010025306 histidylleucine Proteins 0.000 description 24
- 108010048818 seryl-histidine Proteins 0.000 description 24
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 23
- OPINTGHFESTVAX-UHFFFAOYSA-N γ-glutamyl-Arginine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N OPINTGHFESTVAX-UHFFFAOYSA-N 0.000 description 23
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 22
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 22
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 22
- 231100000765 Toxin Toxicity 0.000 description 22
- 108010087924 alanylproline Proteins 0.000 description 22
- 239000003053 toxin Substances 0.000 description 22
- 108020003112 toxins Proteins 0.000 description 22
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 21
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 21
- 230000000875 corresponding Effects 0.000 description 21
- 108010015796 prolylisoleucine Proteins 0.000 description 21
- XNSKSTRGQIPTSE-UHFFFAOYSA-N Arginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCCNC(N)=N XNSKSTRGQIPTSE-UHFFFAOYSA-N 0.000 description 20
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 20
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 20
- CPMKYMGGYUFOHS-FSPLSTOPSA-N Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O CPMKYMGGYUFOHS-FSPLSTOPSA-N 0.000 description 20
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 20
- LLEUXCDZPQOJMY-AAEUAGOBSA-N Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 LLEUXCDZPQOJMY-AAEUAGOBSA-N 0.000 description 20
- DRCKHKZYDLJYFQ-UHFFFAOYSA-N Isoleucyl-Threonine Chemical compound CCC(C)C(N)C(=O)NC(C(C)O)C(O)=O DRCKHKZYDLJYFQ-UHFFFAOYSA-N 0.000 description 20
- LHSGPCFBGJHPCY-STQMWFEESA-N Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-STQMWFEESA-N 0.000 description 20
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 20
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 20
- LCPVBXOHXMBLFW-JSGCOSHPSA-N Trp-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)=CNC2=C1 LCPVBXOHXMBLFW-JSGCOSHPSA-N 0.000 description 20
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 20
- 108010041407 alanylaspartic acid Proteins 0.000 description 20
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 20
- 108010092854 aspartyllysine Proteins 0.000 description 20
- 108010068265 aspartyltyrosine Proteins 0.000 description 20
- 108010012058 leucyltyrosine Proteins 0.000 description 20
- 108010053725 prolylvaline Proteins 0.000 description 20
- 108010078580 tyrosylleucine Proteins 0.000 description 20
- PPQRSMGDOHLTBE-UWVGGRQHSA-N Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PPQRSMGDOHLTBE-UWVGGRQHSA-N 0.000 description 19
- VNYDHJARLHNEGA-RYUDHWBXSA-N (2S)-1-[(2S)-2-azaniumyl-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carboxylate Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 18
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 18
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 18
- HXWUJJADFMXNKA-UHFFFAOYSA-N Asparaginyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(N)=O HXWUJJADFMXNKA-UHFFFAOYSA-N 0.000 description 18
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 18
- NIKBMHGRNAPJFW-UHFFFAOYSA-N Histidinyl-Arginine Chemical compound NC(=N)NCCCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 NIKBMHGRNAPJFW-UHFFFAOYSA-N 0.000 description 18
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 18
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 18
- LUMXICQAOKVQOB-UHFFFAOYSA-N Threoninyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)C(C)O LUMXICQAOKVQOB-UHFFFAOYSA-N 0.000 description 18
- 108010053037 kyotorphin Proteins 0.000 description 18
- IOUPEELXVYPCPG-UHFFFAOYSA-N val-gly Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 18
- MGHKSHCBDXNTHX-UHFFFAOYSA-N 4-amino-5-[(4-amino-1-carboxy-4-oxobutyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CCC(N)=O)C(O)=O MGHKSHCBDXNTHX-UHFFFAOYSA-N 0.000 description 17
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 17
- NXTYATMDWQYLGJ-UHFFFAOYSA-N Cysteinyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CS NXTYATMDWQYLGJ-UHFFFAOYSA-N 0.000 description 17
- VHLZDSUANXBJHW-UHFFFAOYSA-N Glutaminyl-Phenylalanine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 VHLZDSUANXBJHW-UHFFFAOYSA-N 0.000 description 17
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 17
- UYKREHOKELZSPB-JTQLQIEISA-N Trp-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(O)=O)=CNC2=C1 UYKREHOKELZSPB-JTQLQIEISA-N 0.000 description 17
- 108010049041 glutamylalanine Proteins 0.000 description 17
- QLROSWPKSBORFJ-BQBZGAKWSA-N pro glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 17
- 108010038745 tryptophylglycine Proteins 0.000 description 17
- GJSURZIOUXUGAL-UHFFFAOYSA-N 2-((2,6-Dichlorophenyl)imino)imidazolidine Chemical compound ClC1=CC=CC(Cl)=C1NC1=NCCN1 GJSURZIOUXUGAL-UHFFFAOYSA-N 0.000 description 16
- SNFUTDLOCQQRQD-UHFFFAOYSA-N 2-[(2-amino-4-carboxybutanoyl)amino]-3-methylpentanoic acid Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SNFUTDLOCQQRQD-UHFFFAOYSA-N 0.000 description 16
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 16
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 16
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 16
- HAYVTMHUNMMXCV-UHFFFAOYSA-N Cysteinyl-Alanine Chemical compound OC(=O)C(C)NC(=O)C(N)CS HAYVTMHUNMMXCV-UHFFFAOYSA-N 0.000 description 16
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 16
- SSHIXEILTLPAQT-UHFFFAOYSA-N Glutaminyl-Aspartate Chemical compound NC(=O)CCC(N)C(=O)NC(CC(O)=O)C(O)=O SSHIXEILTLPAQT-UHFFFAOYSA-N 0.000 description 16
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 16
- JWBLQDDHSDGEGR-DRZSPHRISA-N Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWBLQDDHSDGEGR-DRZSPHRISA-N 0.000 description 16
- FADYJNXDPBKVCA-UHFFFAOYSA-N Phenylalanyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 16
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 16
- BEPSGCXDIVACBU-UHFFFAOYSA-N Prolyl-Histidine Chemical compound C1CCNC1C(=O)NC(C(=O)O)CC1=CN=CN1 BEPSGCXDIVACBU-UHFFFAOYSA-N 0.000 description 16
- GVUVRRPYYDHHGK-UHFFFAOYSA-N Prolyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C1CCCN1 GVUVRRPYYDHHGK-UHFFFAOYSA-N 0.000 description 16
- RZEQTVHJZCIUBT-UHFFFAOYSA-N Serinyl-Arginine Chemical compound OCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-UHFFFAOYSA-N 0.000 description 16
- GRQCSEWEPIHLBI-UHFFFAOYSA-N Tryptophyl-Asparagine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CC(N)=O)C(O)=O)=CNC2=C1 GRQCSEWEPIHLBI-UHFFFAOYSA-N 0.000 description 16
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 16
- 108010040030 histidinoalanine Proteins 0.000 description 16
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 16
- CNPNWGHRMBQHBZ-ZKWXMUAHSA-N Ile-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O CNPNWGHRMBQHBZ-ZKWXMUAHSA-N 0.000 description 15
- 239000000047 product Substances 0.000 description 15
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 14
- OMSMPWHEGLNQOD-UHFFFAOYSA-N Asparaginyl-Phenylalanine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UHFFFAOYSA-N 0.000 description 14
- VGRHZPNRCLAHQA-UHFFFAOYSA-N Aspartyl-Asparagine Chemical compound OC(=O)CC(N)C(=O)NC(CC(N)=O)C(O)=O VGRHZPNRCLAHQA-UHFFFAOYSA-N 0.000 description 14
- UKGGPJNBONZZCM-WDSKDSINSA-N Aspartyl-L-proline Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 14
- OELDIVRKHTYFNG-UHFFFAOYSA-N Cysteinyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CS OELDIVRKHTYFNG-UHFFFAOYSA-N 0.000 description 14
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 14
- BCXBIONYYJCSDF-CIUDSAMLSA-N Ile-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O BCXBIONYYJCSDF-CIUDSAMLSA-N 0.000 description 14
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 14
- JXNRXNCCROJZFB-RYUDHWBXSA-N L-tyrosyl-L-arginine Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JXNRXNCCROJZFB-RYUDHWBXSA-N 0.000 description 14
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 14
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 14
- AFWBWPCXSWUCLB-WDSKDSINSA-N Pro-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 AFWBWPCXSWUCLB-WDSKDSINSA-N 0.000 description 14
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 14
- BXLYSRPHVMCOPS-UHFFFAOYSA-N Serinyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CO BXLYSRPHVMCOPS-UHFFFAOYSA-N 0.000 description 14
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 14
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 14
- XXDVDTMEVBYRPK-XPUUQOCRSA-N Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O XXDVDTMEVBYRPK-XPUUQOCRSA-N 0.000 description 14
- STTYIMSDIYISRG-WDSKDSINSA-N Val-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(O)=O STTYIMSDIYISRG-WDSKDSINSA-N 0.000 description 14
- 108010093581 aspartyl-proline Proteins 0.000 description 14
- 108010020688 glycylhistidine Proteins 0.000 description 14
- 108010034529 leucyl-lysine Proteins 0.000 description 14
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 14
- 108010017391 lysylvaline Proteins 0.000 description 14
- 108010020532 tyrosyl-proline Proteins 0.000 description 14
- 108010073969 valyllysine Proteins 0.000 description 14
- FAQVCWVVIYYWRR-WHFBIAKZSA-N (2S)-2-[[(2S)-2,5-diamino-5-oxopentanoyl]amino]propanoic acid Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O FAQVCWVVIYYWRR-WHFBIAKZSA-N 0.000 description 13
- OCYROESYHWUPBP-VGMNWLOBSA-N (2S,3R)-3-methyl-2-[[(2S)-pyrrolidin-1-ium-2-carbonyl]amino]pentanoate Chemical compound CC[C@@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 OCYROESYHWUPBP-VGMNWLOBSA-N 0.000 description 13
- MRVYVEQPNDSWLH-UHFFFAOYSA-N Glutaminyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CCC(N)=O MRVYVEQPNDSWLH-UHFFFAOYSA-N 0.000 description 13
- YSWHPLCDIMUKFE-QWRGUYRKSA-N Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YSWHPLCDIMUKFE-QWRGUYRKSA-N 0.000 description 12
- FRJIAZKQGSCKPQ-FSPLSTOPSA-N His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 FRJIAZKQGSCKPQ-FSPLSTOPSA-N 0.000 description 12
- FFOKMZOAVHEWET-UHFFFAOYSA-N Serinyl-Cysteine Chemical compound OCC(N)C(=O)NC(CS)C(O)=O FFOKMZOAVHEWET-UHFFFAOYSA-N 0.000 description 12
- WCRFXRIWBFRZBR-GGVZMXCHSA-N Thr-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WCRFXRIWBFRZBR-GGVZMXCHSA-N 0.000 description 12
- 108091006028 chimera Proteins 0.000 description 12
- PABVKUJVLNMOJP-UHFFFAOYSA-N 4-amino-5-[(1-carboxy-2-sulfanylethyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CS)C(O)=O PABVKUJVLNMOJP-UHFFFAOYSA-N 0.000 description 11
- MPZWMIIOPAPAKE-UHFFFAOYSA-N 4-amino-5-[[1-carboxy-4-(diaminomethylideneamino)butyl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CCCN=C(N)N MPZWMIIOPAPAKE-UHFFFAOYSA-N 0.000 description 11
- OMNVYXHOSHNURL-WPRPVWTQSA-N Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMNVYXHOSHNURL-WPRPVWTQSA-N 0.000 description 11
- SENJXOPIZNYLHU-IUCAKERBSA-N Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-IUCAKERBSA-N 0.000 description 11
- PWIQCLSQVQBOQV-AAEUAGOBSA-N Trp-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 PWIQCLSQVQBOQV-AAEUAGOBSA-N 0.000 description 11
- 108010011559 alanylphenylalanine Proteins 0.000 description 11
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 11
- 108010000761 leucylarginine Proteins 0.000 description 11
- LQJAALCCPOTJGB-YUMQZZPRSA-N (2S)-1-[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carboxylic acid Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 10
- XMAUFHMAAVTODF-STQMWFEESA-N (2S)-2-[[(2S)-2-amino-3-(1H-imidazol-5-yl)propanoyl]amino]-3-phenylpropanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XMAUFHMAAVTODF-STQMWFEESA-N 0.000 description 10
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N (3S)-3-[[(2S)-2-aminopropanoyl]amino]-4-[[(1S)-1-carboxy-2-hydroxyethyl]amino]-4-oxobutanoic acid Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 10
- 108010076441 Ala-His-His Proteins 0.000 description 10
- SITWEMZOJNKJCH-UHFFFAOYSA-N Alanyl-Arginine Chemical compound CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 10
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 10
- VBKIFHUVGLOJKT-UHFFFAOYSA-N Asparaginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(N)=O VBKIFHUVGLOJKT-UHFFFAOYSA-N 0.000 description 10
- NTQDELBZOMWXRS-UHFFFAOYSA-N Aspartyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(O)=O NTQDELBZOMWXRS-UHFFFAOYSA-N 0.000 description 10
- 101700021600 CRY1 Proteins 0.000 description 10
- 108010090461 DFG peptide Proteins 0.000 description 10
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 10
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 10
- KRBMQYPTDYSENE-BQBZGAKWSA-N His-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 KRBMQYPTDYSENE-BQBZGAKWSA-N 0.000 description 10
- CTCFZNBRZBNKAX-UHFFFAOYSA-N Histidinyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 CTCFZNBRZBNKAX-UHFFFAOYSA-N 0.000 description 10
- HYXQKVOADYPQEA-CIUDSAMLSA-N Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HYXQKVOADYPQEA-CIUDSAMLSA-N 0.000 description 10
- ZUKPVRWZDMRIEO-VKHMYHEASA-N L-cysteinylglycine zwitterion Chemical compound SC[C@H]([NH3+])C(=O)NCC([O-])=O ZUKPVRWZDMRIEO-VKHMYHEASA-N 0.000 description 10
- NTISAKGPIGTIJJ-IUCAKERBSA-N Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C NTISAKGPIGTIJJ-IUCAKERBSA-N 0.000 description 10
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 10
- FMIIKPHLJKUXGE-GUBZILKMSA-N Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN FMIIKPHLJKUXGE-GUBZILKMSA-N 0.000 description 10
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 10
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 10
- IGRMTQMIDNDFAA-UHFFFAOYSA-N Lysyl-Histidine Chemical compound NCCCCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 IGRMTQMIDNDFAA-UHFFFAOYSA-N 0.000 description 10
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 10
- KLAONOISLHWJEE-UHFFFAOYSA-N Phenylalanyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 KLAONOISLHWJEE-UHFFFAOYSA-N 0.000 description 10
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 10
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 10
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 10
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 10
- AUEJLPRZGVVDNU-STQMWFEESA-N Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-STQMWFEESA-N 0.000 description 10
- BMPPMAOOKQJYIP-WMZOPIPTSA-N Tyr-Trp Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C([O-])=O)C1=CC=C(O)C=C1 BMPPMAOOKQJYIP-WMZOPIPTSA-N 0.000 description 10
- BNQVUHQWZGTIBX-IUCAKERBSA-N Val-His Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CN=CN1 BNQVUHQWZGTIBX-IUCAKERBSA-N 0.000 description 10
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 10
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 10
- 108010068380 arginylarginine Proteins 0.000 description 10
- 108010060035 arginylproline Proteins 0.000 description 10
- 108010036533 arginylvaline Proteins 0.000 description 10
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 10
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 10
- 108010016616 cysteinylglycine Proteins 0.000 description 10
- 108010069495 cysteinyltyrosine Proteins 0.000 description 10
- 108010078144 glutaminyl-glycine Proteins 0.000 description 10
- STKYPAFSDFAEPH-LURJTMIESA-N gly-val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 10
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 10
- 108010010147 glycylglutamine Proteins 0.000 description 10
- 108010015792 glycyllysine Proteins 0.000 description 10
- 108010084389 glycyltryptophan Proteins 0.000 description 10
- 108010092114 histidylphenylalanine Proteins 0.000 description 10
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 10
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 10
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 10
- 108010054155 lysyllysine Proteins 0.000 description 10
- 108010044655 lysylproline Proteins 0.000 description 10
- 108010056582 methionylglutamic acid Proteins 0.000 description 10
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 10
- 108010024607 phenylalanylalanine Proteins 0.000 description 10
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 10
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 10
- 108010044292 tryptophyltyrosine Proteins 0.000 description 10
- 108010051110 tyrosyl-lysine Proteins 0.000 description 10
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 10
- XITLYYAIPBBHPX-UHFFFAOYSA-N γ-glutamyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CCC(N)=O XITLYYAIPBBHPX-UHFFFAOYSA-N 0.000 description 10
- 241000256259 Noctuidae Species 0.000 description 9
- QXRNAOYBCYVZCD-BQBZGAKWSA-N (2S)-6-amino-2-[[(2S)-2-aminopropanoyl]amino]hexanoic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN QXRNAOYBCYVZCD-BQBZGAKWSA-N 0.000 description 8
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 8
- QYLJIYOGHRGUIH-CIUDSAMLSA-N Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N QYLJIYOGHRGUIH-CIUDSAMLSA-N 0.000 description 8
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 8
- GSMPSRPMQQDRIB-WHFBIAKZSA-N Asp-Gln Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O GSMPSRPMQQDRIB-WHFBIAKZSA-N 0.000 description 8
- TWXZVVXRRRRSLT-UHFFFAOYSA-N Asparaginyl-Cysteine Chemical compound NC(=O)CC(N)C(=O)NC(CS)C(O)=O TWXZVVXRRRRSLT-UHFFFAOYSA-N 0.000 description 8
- 241000193388 Bacillus thuringiensis Species 0.000 description 8
- 229920001405 Coding region Polymers 0.000 description 8
- OWOFCNWTMWOOJJ-WDSKDSINSA-N Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OWOFCNWTMWOOJJ-WDSKDSINSA-N 0.000 description 8
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 8
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 8
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 8
- 241000219146 Gossypium Species 0.000 description 8
- VHOLZZKNEBBHTH-YUMQZZPRSA-N His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 VHOLZZKNEBBHTH-YUMQZZPRSA-N 0.000 description 8
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 8
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 8
- QJKMCQRFHJRIPU-XDTLVQLUSA-N Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QJKMCQRFHJRIPU-XDTLVQLUSA-N 0.000 description 8
- 238000004166 bioassay Methods 0.000 description 8
- 108020001507 fusion proteins Proteins 0.000 description 8
- 102000037240 fusion proteins Human genes 0.000 description 8
- YSMPVONNIWLJML-FXQIFTODSA-N (2S)-1-[(2S)-2-[[(2S)-2-aminopropanoyl]amino]-3-carboxypropanoyl]pyrrolidine-2-carboxylic acid Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 7
- CGHXMODRYJISSK-NHCYSSNCSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]butanedioic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 7
- RXGLHDWAZQECBI-SRVKXCTJSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 7
- KXTAGESXNQEZKB-DZKIICNBSA-N (4S)-4-amino-5-[[(2S)-1-[[(1S)-1-carboxy-2-methylpropyl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 7
- VWHGTYCRDRBSFI-ZETCQYMHSA-N 2-[[2-[[(2S)-2-amino-4-methylpentanoyl]amino]acetyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 7
- RDIKFPRVLJLMER-BQBZGAKWSA-N Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)N RDIKFPRVLJLMER-BQBZGAKWSA-N 0.000 description 7
- DYDKXJWQCIVTMR-UHFFFAOYSA-N Aspartyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CC(O)=O DYDKXJWQCIVTMR-UHFFFAOYSA-N 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 7
- SXGAGTVDWKQYCX-BQBZGAKWSA-N Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SXGAGTVDWKQYCX-BQBZGAKWSA-N 0.000 description 7
- QTZXSYBVOSXBEJ-WDSKDSINSA-N Met-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O QTZXSYBVOSXBEJ-WDSKDSINSA-N 0.000 description 7
- IEHDJWSAXBGJIP-RYUDHWBXSA-N Phe-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 IEHDJWSAXBGJIP-RYUDHWBXSA-N 0.000 description 7
- 108020004511 Recombinant DNA Proteins 0.000 description 7
- PEEAINPHPNDNGE-JQWIXIFHSA-N Trp-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 PEEAINPHPNDNGE-JQWIXIFHSA-N 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 108010054813 diprotin B Proteins 0.000 description 7
- 235000013305 food Nutrition 0.000 description 7
- 108010079547 glutamylmethionine Proteins 0.000 description 7
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 7
- 108010084572 phenylalanyl-valine Proteins 0.000 description 7
- 108010073101 phenylalanylleucine Proteins 0.000 description 7
- 108010079317 prolyl-tyrosine Proteins 0.000 description 7
- DOFAQXCYFQKSHT-SRVKXCTJSA-N (2S)-1-[(2S)-1-[(2S)-2-amino-3-methylbutanoyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 6
- DSTWKJOBKSMVCV-UWVGGRQHSA-N (2S)-2-[[(2R)-2-amino-3-sulfanylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DSTWKJOBKSMVCV-UWVGGRQHSA-N 0.000 description 6
- BUZMZDDKFCSKOT-CIUDSAMLSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-carboxybutanoyl]amino]-4-carboxybutanoyl]amino]pentanedioic acid Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 6
- CCQOOWAONKGYKQ-BYPYZUCNSA-N (2S)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoate Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 6
- JEDIEMIJYSRUBB-FOHZUACHSA-N (3S)-3-[[(2S,3R)-2-amino-3-hydroxybutanoyl]amino]-4-(carboxymethylamino)-4-oxobutanoic acid Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 6
- ZSOICJZJSRWNHX-ACZMJKKPSA-N Ala-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)[C@H](C)[NH3+] ZSOICJZJSRWNHX-ACZMJKKPSA-N 0.000 description 6
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 6
- SIFXMYAHXJGAFC-WDSKDSINSA-N Arg-Asp Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SIFXMYAHXJGAFC-WDSKDSINSA-N 0.000 description 6
- QADCERNTBWTXFV-JSGCOSHPSA-N Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(O)=O)=CNC2=C1 QADCERNTBWTXFV-JSGCOSHPSA-N 0.000 description 6
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 6
- DVUFTQLHHHJEMK-IMJSIDKUSA-N Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O DVUFTQLHHHJEMK-IMJSIDKUSA-N 0.000 description 6
- ZARXTZFGQZBYFO-JQWIXIFHSA-N Asp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(O)=O)N)C(O)=O)=CNC2=C1 ZARXTZFGQZBYFO-JQWIXIFHSA-N 0.000 description 6
- FKBFDTRILNZGAI-UHFFFAOYSA-N Aspartyl-Cysteine Chemical compound OC(=O)CC(N)C(=O)NC(CS)C(O)=O FKBFDTRILNZGAI-UHFFFAOYSA-N 0.000 description 6
- ZVDPYSVOZFINEE-UHFFFAOYSA-N Aspartyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(O)=O ZVDPYSVOZFINEE-UHFFFAOYSA-N 0.000 description 6
- 229940097012 Bacillus thuringiensis Drugs 0.000 description 6
- ZSRSLWKGWFFVCM-WDSKDSINSA-N Cys-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O ZSRSLWKGWFFVCM-WDSKDSINSA-N 0.000 description 6
- AYKQJQVWUYEZNU-UHFFFAOYSA-N Cysteinyl-Asparagine Chemical compound SCC(N)C(=O)NC(C(O)=O)CC(N)=O AYKQJQVWUYEZNU-UHFFFAOYSA-N 0.000 description 6
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 6
- JZOYFBPIEHCDFV-UHFFFAOYSA-N Glutaminyl-Histidine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 JZOYFBPIEHCDFV-UHFFFAOYSA-N 0.000 description 6
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 6
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 6
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 6
- RCFDOSNHHZGBOY-ACZMJKKPSA-N Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(O)=O RCFDOSNHHZGBOY-ACZMJKKPSA-N 0.000 description 6
- QNBYCZTZNOVDMI-HGNGGELXSA-N Ile-His Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QNBYCZTZNOVDMI-HGNGGELXSA-N 0.000 description 6
- JWBXCSQZLLIOCI-GUBZILKMSA-N Ile-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C JWBXCSQZLLIOCI-GUBZILKMSA-N 0.000 description 6
- DVCSNHXRZUVYAM-BQBZGAKWSA-N Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 6
- AZLASBBHHSLQDB-GUBZILKMSA-N Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C AZLASBBHHSLQDB-GUBZILKMSA-N 0.000 description 6
- BQVUABVGYYSDCJ-ZFWWWQNUSA-N Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-ZFWWWQNUSA-N 0.000 description 6
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 6
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 6
- FSXRLASFHBWESK-HOTGVXAUSA-N Phe-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 FSXRLASFHBWESK-HOTGVXAUSA-N 0.000 description 6
- HXNYBZQLBWIADP-UHFFFAOYSA-N Prolyl-Cysteine Chemical compound OC(=O)C(CS)NC(=O)C1CCCN1 HXNYBZQLBWIADP-UHFFFAOYSA-N 0.000 description 6
- YZMPDHTZJJCGEI-BQBZGAKWSA-N Ser-His Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 YZMPDHTZJJCGEI-BQBZGAKWSA-N 0.000 description 6
- LZLREEUGSYITMX-UHFFFAOYSA-N Serinyl-Tryptophan Chemical compound C1=CC=C2C(CC(NC(=O)C(CO)N)C(O)=O)=CNC2=C1 LZLREEUGSYITMX-UHFFFAOYSA-N 0.000 description 6
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfizole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 6
- BWUHENPAEMNGQJ-ZDLURKLDSA-N Thr-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O BWUHENPAEMNGQJ-ZDLURKLDSA-N 0.000 description 6
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 6
- NLKUJNGEGZDXGO-XVKPBYJWSA-N Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLKUJNGEGZDXGO-XVKPBYJWSA-N 0.000 description 6
- ZQOOYCZQENFIMC-STQMWFEESA-N Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=C(O)C=C1 ZQOOYCZQENFIMC-STQMWFEESA-N 0.000 description 6
- QZOSVNLXLSNHQK-UHFFFAOYSA-N Tyrosyl-Aspartate Chemical compound OC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UHFFFAOYSA-N 0.000 description 6
- 240000008042 Zea mays Species 0.000 description 6
- 108010060199 cysteinylproline Proteins 0.000 description 6
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 6
- 230000001665 lethal Effects 0.000 description 6
- 108010064235 lysylglycine Proteins 0.000 description 6
- 231100000563 toxic property Toxicity 0.000 description 6
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 6
- DXJZITDUDUPINW-UHFFFAOYSA-N γ-glutamyl-Asparagine Chemical compound NC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O DXJZITDUDUPINW-UHFFFAOYSA-N 0.000 description 6
- UKKNTTCNGZLJEX-UHFFFAOYSA-N γ-glutamyl-Serine Chemical compound NC(=O)CCC(N)C(=O)NC(CO)C(O)=O UKKNTTCNGZLJEX-UHFFFAOYSA-N 0.000 description 6
- 206010061217 Infestation Diseases 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- ZFXQNADNEBRERM-BJDJZHNGSA-N (2S)-1-[(2S)-1-[(2S)-2-[[(2S)-2-aminopropanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylic acid Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZFXQNADNEBRERM-BJDJZHNGSA-N 0.000 description 4
- VKVDRTGWLVZJOM-DCAQKATOSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 4
- DWYAUVCQDTZIJI-VZFHVOOUSA-N (2S)-2-[[(2S)-2-[[(2S,3R)-2-amino-3-hydroxybutanoyl]amino]propanoyl]amino]-3-hydroxypropanoic acid Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 4
- NIZKGBJVCMRDKO-KWQFWETISA-N (2S)-2-[[2-[[(2S)-2-aminopropanoyl]amino]acetyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 4
- IAJFFZORSWOZPQ-SRVKXCTJSA-N (2S)-4-amino-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 4
- AUTNXSQEVVHSJK-YVNDNENWSA-N (2S,3S)-2-[[(2S)-2-[[(2S)-2-amino-4-carboxybutanoyl]amino]-4-carboxybutanoyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 4
- ULXYQAJWJGLCNR-YUMQZZPRSA-N (3S)-3-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-(carboxymethylamino)-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 4
- BUXAPSQPMALTOY-UHFFFAOYSA-N 2-[(2-amino-3-sulfanylpropanoyl)amino]pentanedioic acid Chemical compound SCC(N)C(=O)NC(C(O)=O)CCC(O)=O BUXAPSQPMALTOY-UHFFFAOYSA-N 0.000 description 4
- FSHURBQASBLAPO-WDSKDSINSA-N Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)N FSHURBQASBLAPO-WDSKDSINSA-N 0.000 description 4
- KWBQPGIYEZKDEG-FSPLSTOPSA-N Asn-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O KWBQPGIYEZKDEG-FSPLSTOPSA-N 0.000 description 4
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 4
- YXQDRIRSAHTJKM-IMJSIDKUSA-N Cys-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YXQDRIRSAHTJKM-IMJSIDKUSA-N 0.000 description 4
- RGTVXXNMOGHRAY-UHFFFAOYSA-N Cysteinyl-Arginine Chemical compound SCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N RGTVXXNMOGHRAY-UHFFFAOYSA-N 0.000 description 4
- WYVKPHCYMTWUCW-UHFFFAOYSA-N Cysteinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CS WYVKPHCYMTWUCW-UHFFFAOYSA-N 0.000 description 4
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 4
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 4
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 4
- PFMUCCYYAAFKTH-YFKPBYRVSA-N Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CN PFMUCCYYAAFKTH-YFKPBYRVSA-N 0.000 description 4
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 4
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 4
- IDXZDKMBEXLFMB-UHFFFAOYSA-N Histidinyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC1=CN=CN1 IDXZDKMBEXLFMB-UHFFFAOYSA-N 0.000 description 4
- 229920002459 Intron Polymers 0.000 description 4
- JAQGKXUEKGKTKX-HOTGVXAUSA-N L-tyrosyl-L-tyrosine Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 JAQGKXUEKGKTKX-HOTGVXAUSA-N 0.000 description 4
- HIZYETOZLYFUFF-BQBZGAKWSA-N Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O HIZYETOZLYFUFF-BQBZGAKWSA-N 0.000 description 4
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 4
- MIDZLCFIAINOQN-WPRPVWTQSA-N Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 MIDZLCFIAINOQN-WPRPVWTQSA-N 0.000 description 4
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 4
- SHAQGFGGJSLLHE-BQBZGAKWSA-N Pro-Gln Chemical compound NC(=O)CC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 SHAQGFGGJSLLHE-BQBZGAKWSA-N 0.000 description 4
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 4
- 241000098287 Striacosta Species 0.000 description 4
- CUTPSEKWUPZFLV-UHFFFAOYSA-N Threoninyl-Cysteine Chemical compound CC(O)C(N)C(=O)NC(CS)C(O)=O CUTPSEKWUPZFLV-UHFFFAOYSA-N 0.000 description 4
- TYYLDKGBCJGJGW-WMZOPIPTSA-N Trp-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 TYYLDKGBCJGJGW-WMZOPIPTSA-N 0.000 description 4
- NZCPCJCJZHKFGZ-UHFFFAOYSA-N Tryptophyl-Glutamine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CCC(N)=O)C(O)=O)=CNC2=C1 NZCPCJCJZHKFGZ-UHFFFAOYSA-N 0.000 description 4
- DXYQIGZZWYBXSD-UHFFFAOYSA-N Tryptophyl-Proline Chemical compound C=1NC2=CC=CC=C2C=1CC(N)C(=O)N1CCCC1C(O)=O DXYQIGZZWYBXSD-UHFFFAOYSA-N 0.000 description 4
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 4
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 4
- 108010064997 VPY tripeptide Proteins 0.000 description 4
- OBTCMSPFOITUIJ-FSPLSTOPSA-N Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O OBTCMSPFOITUIJ-FSPLSTOPSA-N 0.000 description 4
- PNVLWFYAPWAQMU-CIUDSAMLSA-N Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)C(C)C PNVLWFYAPWAQMU-CIUDSAMLSA-N 0.000 description 4
- WPSXZFTVLIAPCN-UHFFFAOYSA-N Valyl-Cysteine Chemical compound CC(C)C(N)C(=O)NC(CS)C(O)=O WPSXZFTVLIAPCN-UHFFFAOYSA-N 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- KGNSGRRALVIRGR-UHFFFAOYSA-N gln-tyr Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 KGNSGRRALVIRGR-UHFFFAOYSA-N 0.000 description 4
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 4
- 108010084760 glycyl-tyrosyl-glycyl-aspartate Proteins 0.000 description 4
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine zwitterion Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 231100000518 lethal Toxicity 0.000 description 4
- 150000007523 nucleic acids Chemical class 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 239000002689 soil Substances 0.000 description 4
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 4
- 108010084932 tryptophyl-proline Proteins 0.000 description 4
- 108010003137 tyrosyltyrosine Proteins 0.000 description 4
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 4
- ZQFAGNFSIZZYBA-UHFFFAOYSA-N γ-glutamyl-Tryptophan Chemical compound C1=CC=C2C(CC(NC(=O)C(CCC(N)=O)N)C(O)=O)=CNC2=C1 ZQFAGNFSIZZYBA-UHFFFAOYSA-N 0.000 description 4
- 241000218473 Agrotis Species 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 3
- 241000254173 Coleoptera Species 0.000 description 3
- 210000000172 Cytosol Anatomy 0.000 description 3
- 229960000310 ISOLEUCINE Drugs 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- 210000002706 Plastids Anatomy 0.000 description 3
- 108010033725 Recombinant Proteins Proteins 0.000 description 3
- 102000007312 Recombinant Proteins Human genes 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 230000001086 cytosolic Effects 0.000 description 3
- 230000002708 enhancing Effects 0.000 description 3
- 235000013312 flour Nutrition 0.000 description 3
- 230000002068 genetic Effects 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 230000001965 increased Effects 0.000 description 3
- 239000002917 insecticide Substances 0.000 description 3
- 235000012054 meals Nutrition 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 210000004215 spores Anatomy 0.000 description 3
- 238000005507 spraying Methods 0.000 description 3
- 101710032514 ACTI Proteins 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- 241000304886 Bacilli Species 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 description 2
- 241000499436 Brassica rapa subsp. pekinensis Species 0.000 description 2
- 210000003763 Chloroplasts Anatomy 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 241000258937 Hemiptera Species 0.000 description 2
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 108020004459 Small Interfering RNA Proteins 0.000 description 2
- 229920001985 Small interfering RNA Polymers 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 102000004965 antibodies Human genes 0.000 description 2
- 108090001123 antibodies Proteins 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 201000009910 diseases by infectious agent Diseases 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000001747 exhibiting Effects 0.000 description 2
- 239000010903 husk Substances 0.000 description 2
- 230000000670 limiting Effects 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 230000002633 protecting Effects 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 230000000699 topical Effects 0.000 description 2
- 230000001052 transient Effects 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- ZHVOBYWXERUHMN-KVJKMEBSSA-N 3-[(3S,5R,8R,9S,10S,13S,14S,17S)-10,13-dimethyl-3-[(2R,3R,4S,5S,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-2,3,4,5,6,7,8,9,11,12,14,15,16,17-tetradecahydro-1H-cyclopenta[a]phenanthren-17-yl]-2H-furan-5-one Chemical compound O([C@@H]1C[C@H]2CC[C@@H]3[C@@H]([C@]2(CC1)C)CC[C@]1([C@H]3CC[C@@H]1C=1COC(=O)C=1)C)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O ZHVOBYWXERUHMN-KVJKMEBSSA-N 0.000 description 1
- 241001002469 Archips Species 0.000 description 1
- 235000007558 Avena sp Nutrition 0.000 description 1
- 108010018174 Bacillus Thuringiensis insecticidal crystal protein Proteins 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 210000004899 C-terminal region Anatomy 0.000 description 1
- 210000004507 Chromosomes, Artificial Anatomy 0.000 description 1
- 241001364932 Chrysodeixis Species 0.000 description 1
- 241000272201 Columbiformes Species 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241001572697 Earias vittella Species 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 240000001441 Fragaria vesca Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 210000001035 Gastrointestinal Tract Anatomy 0.000 description 1
- 206010053759 Growth retardation Diseases 0.000 description 1
- 108020004391 Introns Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241000091577 Mexicana Species 0.000 description 1
- 108020004388 MicroRNAs Proteins 0.000 description 1
- 240000001307 Myosotis scorpioides Species 0.000 description 1
- 210000003463 Organelles Anatomy 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000255893 Pyralidae Species 0.000 description 1
- 230000025458 RNA interference Effects 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 229920001914 Ribonucleotide Polymers 0.000 description 1
- 210000003705 Ribosomes Anatomy 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 206010039447 Salmonellosis Diseases 0.000 description 1
- 241000753145 Sitotroga cerealella Species 0.000 description 1
- 240000007913 Spondias dulcis Species 0.000 description 1
- 241000255901 Tortricidae Species 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102400000757 Ubiquitin Human genes 0.000 description 1
- 210000002845 Virion Anatomy 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 244000150668 Zea mays subsp mays Species 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 230000011681 asexual reproduction Effects 0.000 description 1
- 210000004666 bacterial spores Anatomy 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 235000020940 control diet Nutrition 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 229920005618 ethylene copolymer bitumen Polymers 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004634 feeding behavior Effects 0.000 description 1
- 239000003337 fertilizer Substances 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 239000007954 growth retardant Substances 0.000 description 1
- 231100000001 growth retardation Toxicity 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 239000002596 immunotoxin Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000003834 intracellular Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 230000001418 larval Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000007758 mating behavior Effects 0.000 description 1
- 230000001404 mediated Effects 0.000 description 1
- 229920001239 microRNA Polymers 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 150000004045 organic chlorine compounds Chemical class 0.000 description 1
- 239000003987 organophosphate pesticide Substances 0.000 description 1
- 238000003359 percent control normalization Methods 0.000 description 1
- 239000003090 pesticide formulation Substances 0.000 description 1
- 230000001402 polyadenylating Effects 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000000750 progressive Effects 0.000 description 1
- 230000001902 propagating Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic Effects 0.000 description 1
- 210000001938 protoplasts Anatomy 0.000 description 1
- 230000002829 reduced Effects 0.000 description 1
- 230000001172 regenerating Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000001105 regulatory Effects 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 230000000717 retained Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000014639 sexual reproduction Effects 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 235000021012 strawberries Nutrition 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002195 synergetic Effects 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000003612 virological Effects 0.000 description 1
Images
Abstract
Description
ССЫЛКА НА РОДСТВЕННУЮ ЗАЯВКУLINK TO RELATED APPLICATION
[001] Данная заявка заявляет приоритет по предварительной заявке США № 62/445313, поданной 12 января 2017 года, которая включена в данный документ посредством ссылки в полном объеме.[001] This application claims priority over U.S. Provisional Application No. 62/445313, filed January 12, 2017, which is incorporated herein by reference in its entirety.
ВКЛЮЧЕНИЕ ПЕРЕЧНЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙINCLUDING A SEQUENCE LIST
[002] Файл, названный «MONS434WO-sequence listing.txt», содержащий Перечень последовательностей в машиночитаемом формате, был создан 11 января 2018 года. Этот файл имеет размер 166134 байта, как измерено в MS-Windows®, и полностью включен в данный документ посредством ссылки. Этот Перечень последовательностей состоит из SEQ ID NO:1-SEQ ID NO:12.[002] A file named "MONS434WO-sequence listing.txt" containing the Sequence Listing in a machine-readable format was created on January 11, 2018. This file is 166134 bytes in size as measured by MS-Windows® and is incorporated herein by reference in its entirety. This Sequence Listing consists of SEQ ID NO:1-SEQ ID NO:12.
ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY
[003] Изобретение относится, в целом, к области белков, проявляющих ингибирующую активность в отношение насекомых, в частности к белкам, проявляющим ингибирующую активность в отношении насекомых-вредителей сельского хозяйства из отряда Lepidoptera (чешуекрылые), таких как совка-ипсилон («BCW», Agrotis ipsilon).[003] The invention relates generally to the field of proteins exhibiting inhibitory activity against insects, in particular to proteins exhibiting inhibitory activity against insect pests of agriculture from the order Lepidoptera (Lepidoptera), such as upsilon cutworm ("BCW ", Agrotis ipsilon).
УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE INVENTION
[004] Ингибирующие насекомых белки, продуцируемые видом бактерии Bacillus thuringiensis (Bt), известны в данной области техники. Определенные белки Bt могут быть использованы для борьбы с вредителями сельскохозяйственных культур путем распрыскивания приемлемых в сельском хозяйстве готовых форм, содержащих один или большее количество таких белков, на растения, путем покрытия семян композицией, приготовленной так, что она содержит инсектицидно-эффективное количество таких белков, или путем результативно эффективной экспрессии указанных одного или большего количества белков в растениях/семенах.[004] Insect-inhibiting proteins produced by the bacterial species Bacillus thuringiensis (Bt) are known in the art. Certain Bt proteins can be used to control crop pests by spraying agriculturally acceptable formulations containing one or more of such proteins onto plants, by coating seeds with a composition formulated to contain an insecticidally effective amount of such proteins, or by effectively expressing said one or more proteins in plants/seeds.
[005] Были разработаны только несколько белков Bt для использования в качестве трансгенных признаков для коммерческого использования фермерами для борьбы с насекомыми-вредителями. Фермеры полагаются на эти белки, чтобы получить предписанный спектр сдерживания вредителей, и могут продолжать полагаться на химические вещества широкого спектра действия при применении к листьям и почве для борьбы с вредителями. Доказано, что особенно трудно бороться с некоторыми чешуекрылыми насекомыми, такими как виды Agrotis и виды Striacosta, с использованием трансгенных инсектицидных признаков, применяемых в данное время, включая Cry1Ab, Cry1Ac, Cry1Fa, Cry2Ab, Cry2Ae, VIP3Aa и различные другие токсины Bt, которые используются менее часто. Следовательно, существует потребность в ингибирующих насекомых белках, которые проявляют активность против более широкого спектра видов насекомых-вредителей, и в использовании токсинов с целью преодоления развития устойчивости вредителей к существующим пестицидам, включая токсины, применяемые в данное время в системах контроля вредителей.[005] Only a few Bt proteins have been developed for use as transgenic traits for commercial use by farmers to control insect pests. Farmers rely on these proteins to get their prescribed spectrum of pest control and can continue to rely on broad spectrum chemicals when applied to leaves and soil for pest control. Some Lepidoptera insects such as Agrotis spp. and Striacosta spp. have proven to be particularly difficult to control using the transgenic insecticidal traits currently in use, including Cry1Ab, Cry1Ac, Cry1Fa, Cry2Ab, Cry2Ae, VIP3Aa and various other Bt toxins that are being used. less often. Therefore, there is a need for insect inhibitory proteins that are active against a wider range of insect pest species and for the use of toxins to overcome the development of pest resistance to existing pesticides, including the toxins currently used in pest control systems.
[006] Данная заявка описывает новое семейство белков, варианты и химерные токсичные белковые конструкции, каждая из которых проявляет удивительно эффективную инсектицидную активность в отношение чешуекрылых, особенно против вредителей видов Agrotis, таких как совка-ипсилон.[006] This application describes a new family of proteins, variants and chimeric toxic protein constructs, each of which exhibits surprisingly effective insecticidal activity against Lepidoptera, especially against pests of Agrotis species, such as upsilon armyworm.
КРАТКОЕ ОПИСАНИЕ СУЩНОСТЬ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION
[007] Показано, что новая группа полипептидов, ингибирующих насекомых (токсичные белки BCW 001, BCW 002 и BCW 003 и их пестицидные фрагменты), обладает ингибирующей активностью в отношении нескольких чешуекрылых-вредителей сельскохозяйственных растений, в частности в отношении вида совки-ипсилон (вид Agrotis). Каждый белок может быть использован отдельно или в комбинации с друг другом и с другими белками Bt и ингибирующими насекомых агентами в готовых формах и in planta, тем самым предлагая альтернативы Bt белкам и химическим инсектицидам, которые в данное время применяются в сельскохозяйственных системах.[007] A new group of insect-inhibiting polypeptides (the
[008] Согласно данному изобретению предложены полинуклеотидные конструкции, которые содержат в функциональной связи сегмент гетерологичного промотора, связанный с нуклеотидной последовательностью, кодирующей инсектицидный белок, обладающий характеристиками Cry1A, который меньше чем полноразмерный токсичный белок класса Cry1A, и который имеет аминокислотную последовательность от около позиции 1 до позиции 607, как указано в SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO 6, SEQ ID NO: 8, SEQ ID NO: 10 и SEQ ID NO: 12, или его инсектицидно-активный фрагмент. Меньше чем полноразмерный полипептид, который проявляет такую инсектицидную активность, должен проявлять идентичность, по меньшей мере, около 100%, 99%, 98%, 97%, 96%, 95%, 94%, 94%, 92%, 91% или 90% с аминокислотной последовательностью BCW 001, как указано в SEQ ID NO: 2, от около позиции 1 до около позиции 606, или от около позиции 5 до около позиции 600. Если необходимо использовать полноразмерный или значительно большего размера фрагменты токсина, процент идентичности должен быть менее ограничивающим, и представлять собой процент идентичности от около 100, до около 95, до около 90, до около 85 или даже до 80% идентичности по отношению к последовательностям полноразмерных белковых токсинов, как указано в SEQ ID NO: 2, 4 и 6, так как данные токсичные белки демонстрируют коммерчески полезные уровни биологической активности при тестировании против личинок совки-ипсилон в пищевых биоанализах и при тестировании in planta на трансгенной кукурузе, хлопке и сое, экспрессирующих такие белки.[008] According to the present invention, polynucleotide constructs are provided that comprise, in operable linkage, a heterologous promoter segment linked to a nucleotide sequence encoding an insecticidal protein having Cry1A characteristics that is smaller than a full-length Cry1A class toxic protein and that has an amino acid sequence from about position 1 to position 607 as indicated in SEQ ID NO: 2, SEQ ID NO: 4,
[009] Согласно данному изобретению также предложены белки, токсичные для вида чешуекрылых совка-ипсилон, включая белки, имеющие аминокислотную последовательность, как указано в SEQ ID NO: 2 от позиции 256 до 606 (белок BCW 001), и белки, имеющие аминокислотную последовательность, как указано в любой из SEQ ID NO: 4 и SEQ ID NO: 6 от аминокислотной позиции 257 до 607 (в данном документе соответственно обозначаемые как токсичный белок BCW 002 и токсичный белок BCW 003).[009] The invention also provides proteins that are toxic to the epsilon cutworm species, including proteins having the amino acid sequence as set forth in SEQ ID NO: 2 from position 256 to 606 (
[0010] Такие инсектицидные белки также проявляют активность против видов чешуекрылых, выбранных из группы, состоящей из: Spodoptera frugiperda, Spodoptera exigua, Spodoptera litura, Mamestra configurata, Striacosta albicosta, Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Pseudaletia unipuncta, Agrotis ipsilon, Agrotis orthogonia, Ostrinia nubilalis, Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus, Cydia pomonella, Endopiza viteana, Grapholita molesta, Suleima helianthana, Plutella xylostella, Pectinophora gossypiella, Lymantria dispar, Alabama argillacea, Archips argyrospila, Archips rosana, Chilo suppressalis, Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Egrias vittella, Helicoverpa armigera, Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana, Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae, Pieris rapae, Plutella xylostella, и Tuta absoluta.[0010] Such insecticidal proteins also exhibit activity against Lepidoptera species selected from the group consisting of: Spodoptera frugiperda, Spodoptera exigua, Spodoptera litura, Mamestra configurata, Striacosta albicosta, Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Pseudaletia unipuncta, Agrotis ipsilon, Agrotis orthogonia, Ostrinia nubilalis, Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus, Cydia pomonella, Endopiza viteana, Grapholita molesta, Suleima helianthana, Plutella xylostella, Pectinophora gossypiella, Lymantria dispar , Alabama argillacea, Archips argyrospila, Archips rosana, Chilo suppressalis, Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Egrias vittella, Helicoverpa armigera, Helicoverpa zea, Heliothisogram virescens, Herpetogram alis, Lobesia botrana, Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae, Pieris rapae, Plutella xylostella, and Tuta absoluta.
[0011] Белки согласно данному изобретению также могут проявлять биологическую активность в отношении видов чешуекрылых, выбранных из группы, состоящей из: Spodoptera frugiperda, Spodoptera exigua, Spodoptera litura, Mamestra configurata, Striacosta albicosta, Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Pseudaletia unipuncta, Agrotis ipsilon, Agrotis orthogonia, Ostrinia nubilalis, Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus, Cydia pomonella, Endopiza viteana, Grapholita molesta, Suleima helianthana, Plutella xylostella, Pectinophora gossypiella, Lymantria dispar, Alabama argillacea, Archips argyrospila, Archips rosana, Chilo suppressalis, Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Egrias vittella, Helicoverpa armigera, Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana, Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae, Pieris rapae, Plutella xylostella, и Tuta absoluta.[0011] The proteins of this invention may also exhibit biological activity against Lepidoptera species selected from the group consisting of: Spodoptera frugiperda, Spodoptera exigua, Spodoptera litura, Mamestra configurata, Striacosta albicosta, Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra , Heliothis virescens, Agrotis subterranea, Pseudaletia unipuncta, Agrotis ipsilon, Agrotis orthogonia, Ostrinia nubilalis, Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalectpus lignosellus, Cydia pomonella, Endopiza viteana, Grapholymaphorita molesta, Pelinosta helianth gossypiella, Lymantria dispar, Alabama argillacea, Archips argyrospila, Archips rosana, Chilo suppressalis, Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Egrias vitella, Helicoverpa armigera, Helicoverpa zea virescens, Herpetogramma licarsisalis, Lobesia botrana, Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae, Pieris rapae, Plutella xylostella, and Tuta absoluta.
[0012] Белки согласно данному изобретению и рассматриваемые в данном документе конструкции могут быть включены в любой вектор, включая плазмиды, космиды, фагмиды и т. п. [0012] The proteins of this invention and the constructs discussed herein can be incorporated into any vector, including plasmids, cosmids, phagemids, and the like.
[0013] Такие векторы могут быть использованы для введения конструкций согласно данному изобретению в любое количество клеток-хозяев, включая бактериальные клетки, дрожжевые клетки и клетки растений.[0013] Such vectors can be used to introduce the constructs of this invention into any number of host cells, including bacterial cells, yeast cells, and plant cells.
[0014] Клетками-хозяевами, которые являются дрожжевыми клетками, могут быть Saccharomyces cereviseae или Saccharomyces pombe, и т. п. Бактериальные клетки-хозяева могут представлять собой любое количество известных таких клеток-хозяев, включая, но не ограничиваясь Е. coli, B. thuringiensis, и другие родственные бациллы. Растительные клетки-хозяева могут быть получены из любого количества видов растений, включая, но не ограничиваясь растительными клетками из: люцерны, банана, ячменя, фасоли, брокколи, капусты, капусты декоративной, моркови, маниоки, клещевины, цветной капусты, сельдерея, нута, китайской капусты, цитрусовых, кокосовой пальмы, кофе, кукурузы, клевера, хлопка, тыквенных, огурца, псевдотсуги Мензиса, баклажана, эвкалипта, лена, чеснока, винограда, хмеля, лука-порея, салата-латука, сосны ладанной, проса, дыни, ореха, овса, оливкового дерева, репчатого лука, декоративных растений, пальмовых, пастбищных трав, гороха, арахиса, перца, голубиного гороха, сосновых, картофеля, тополи, тыквы, сосны лучистой, редьки, рапса, риса, корневищ, ржи, дикого шафрана, кустарниковых, сорго, сосны южной, сои, шпината, тыквенных, клубники, сахарной свеклы, сахарного тростника, подсолнечника, кукурузы сахарной, амбрового дерева, батата, проса прутьевидного, чая, табака, помидора, тритикале, дерновой травы, арбуза и пшеницы.[0014] Host cells that are yeast cells can be Saccharomyces cereviseae or Saccharomyces pombe, etc. Bacterial host cells can be any number of known such host cells, including but not limited to E. coli, B thuringiensis, and other related bacilli. Plant host cells can be obtained from any number of plant species, including but not limited to plant cells from: alfalfa, banana, barley, beans, broccoli, cabbage, ornamental cabbage, carrots, cassava, castor beans, cauliflower, celery, chickpeas, Chinese cabbage, citrus, coconut, coffee, corn, clover, cotton, cucurbits, cucumber, Menzies, eggplant, eucalyptus, flax, garlic, grapes, hops, leeks, lettuce, frankincense pine, millet, melon, walnut, oat, olive tree, onion, ornamental plants, palm, pasture grasses, pea, peanut, pepper, pigeonpea, pine, potato, poplar, pumpkin, radish pine, radish, rapeseed, rice, rhizomes, rye, wild saffron , shrub, sorghum, southern pine, soybean, spinach, cucurbits, strawberry, sugar beet, sugar cane, sunflower, sugar corn, amber tree, sweet potato, switchgrass, tea, tobacco, tomato, triticale, sod grass, watermelon for and wheat.
[0015] Трансгенные растения, в частности трансгенные растения кукурузы, хлопка и сои, могут быть получены путем введения конструкций согласно данному изобретению, содержащих подходящим образом модифицированные полинуклеотидные последовательности, такие как указанные в SEQ ID NO: 7, SEQ ID NO: 9 и SEQ ID NO: 11, например, в геном таких растительных клеток и путем восстановления фертильного трансгенного растения кукурузы, сои или хлопка, содержащего в своем геноме генетическую конструкцию для экспрессии по меньшей мере белкового токсина согласно данному изобретению, то есть BCW 001, BCW 002 или белкового токсина BCW 003. Такие трансгенные растения будут иметь внедренную в их растительный геном полинуклеотидную конструкцию, содержащую по меньшей мере гетерологичный промоторный сегмент, функционально связанный с нуклеотидной последовательностью, кодирующей инсектицидный белок BCW 001, BCW 002 или BCW 003, имеющий аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 8, SEQ ID NO: 10 и SEQ ID NO: 12, или их инсектицидный белковый фрагмент.[0015] Transgenic plants, in particular transgenic corn, cotton and soybean plants, can be obtained by introducing constructs according to this invention containing suitably modified polynucleotide sequences such as those indicated in SEQ ID NO: 7, SEQ ID NO: 9 and SEQ ID NO: 11, for example, into the genome of such plant cells and by reconstituting a fertile transgenic corn, soybean or cotton plant containing in its genome a genetic construct for expressing at least a protein toxin according to the invention, i.e. BCW 001, BCW 002 or a
[0016] Семена также рассматриваются в качестве признака изобретения, в котором семена получают из таких трансгенных растений, и такие семена содержат определяемое количество полинуклеотидной конструкции, введенной в геном растения. Пыльца, семена, растительные клетки потомства, растительная ткань и товарные продукты, полученные из каждого такого трансгенного растения, будут содержать детектируемое количество полинуклеотидной конструкции.[0016] Seeds are also contemplated as a feature of the invention, wherein the seeds are obtained from such transgenic plants, and such seeds contain a detectable amount of a polynucleotide construct introduced into the plant's genome. Pollen, seeds, progeny plant cells, plant tissue and commercial products derived from each such transgenic plant will contain a detectable amount of the polynucleotide construct.
[0017] Любой биологический образец, который содержит, по меньшей мере, детектируемое количество полинуклеотидной конструкции, кодирующей такой белок BCW 001, BCW 002 или BCW 003, будет находиться в пределах объема изобретения.[0017] Any biological sample that contains at least a detectable amount of a polynucleotide construct encoding such a
[0018] Предложены композиции, которые обеспечивают инсектицидно эффективное количество белка BCW 001, 002 или 003 согласно данному изобретению и предназначены для борьбы с видами чешуекрылых-вредителей. Такие композиции могут также содержать дополнительный агент, который отличается от токсичного белка BCW. Такой агент также будет токсичным для тех же видов чешуекрылых, что и токсичный белок BCW. Дополнительный агент должен быть выбран из группы агентов, состоящей из белков или полипептидов, аминокислотная последовательность которых отличается от белка BCW, и также может быть агентом, представляющим собой молекулу РНК, оказывающую токсическое действие на целевое насекомое-вредителя (такую как дцРНК, микроРНК или малая интерферирующая РНК (миРНК)), а также может быть инсектицидным химическим соединением, таким как пиретрин, фосфорорганический пестицид и т. п. В альтернативном варианте, дополнительный агент может быть любым совместимым Cry или родственным токсичным белком, таким как другой Cry1A, Cry1Ab, Cry1Ac, Cry1A.105, Cry1Ae (но они не являются предпочтительными, поскольку они могут не обеспечивать соответствующие свойства для контроля устойчивости), или Cry1B, Cry1C, Cry1D, Cry1E, Cry1F, Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry2A, Cry2Ab, Cry2Ae, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry43A, Cry43B, ET35, ET66, TIC400, TIC800, TIC807, TIC834, TIC853, TIC1415, VIP3A, VIP3Ab, инсектицидными белками Axmi, инсектицидными белками DIG, eHIPs и белками VIP и любым токсичным белком, известным в данной области техники, для обеспечение токсических свойств в отношение личинок вида совки-ипсилон или применимых к другим видам-мишеням чешуекрылых вредителей.[0018] Compositions are provided that provide an insecticidally effective amount of the
[0019] Такие композиции могут также содержать дополнительные пестицидные агенты, которые необязательно являются токсичными для одного и того же вредителя-мишени, такие как дополнительные агенты, выбранные из группы, состоящей из Cry1C, Cry3A, Cry3B, Cry34, Cry35, Cry51Aa1, ET29, ET33, ET34, ET70, TIC407, TIC417, TIC431, TIC901, TIC1201, TIC3131, 5307, DIG-10, Axmi184, Axmi205 и AxmiR1.[0019] Such compositions may also contain additional pesticidal agents that are not necessarily toxic to the same target pest, such as additional agents selected from the group consisting of Cry1C, Cry3A, Cry3B, Cry34, Cry35, Cry51Aa1, ET29, ET33, ET34, ET70, TIC407, TIC417, TIC431, TIC901, TIC1201, TIC3131, 5307, DIG-10, Axmi184, Axmi205 and AxmiR1.
[0020] Также предусматриваются способы получения семян, в которых используется полезные пестицидные свойства белков согласно данному изобретению. Такие способы включают в себя полинуклеотидную конструкцию, спроектированную для экспрессии белка BCW 001, BCW 002 или BCW 003, или белка, показывающего по меньшей мере около 90% идентичность с указанным белком, причем указанный способ включает в себя посадку одного или большего количества семян, которые содержат полинуклеотид, экспрессирующий один или большее количество белковых токсинов BCW согласно данному изобретению, выращивание растений из таких семян и затем сбор урожая таких семян из растений. Собранное семя будет содержать полинуклеотидную конструкцию и даст растения, которые также будут устойчивы к заражению совкой-ипсилон.[0020] Also provided are methods for producing seeds that exploit the beneficial pesticidal properties of the proteins of the present invention. Such methods include a polynucleotide construct designed to express a
[0021] Такими растениями могут быть кукуруза, хлопок, соя или любые другие растения, восприимчивые к видам чешуекрылых-вредителей, которые, как продемонстрировано, контролируются белками согласно данному изобретению. Предполагается, что такие растения являются предварительно полученными трансгенными растениями, которые получат пользу от эффектов токсических свойств белков согласно данному изобретению. Растения кукурузы, попадающие в эту категорию, включают в себя, но не ограничиваются лишь трансформантами, выбранными из группы, состоящей из: DKB89614-9, MON801, MON802, MON809, MON810, MON863, MON88017, MON89034, трансформанта 4114-3, трансформанта 5307, DAS59122-7, Bt10, Bt11, Bt176, CBH-351, DKB-83614-9, MIR162, MIR604, TC1507, TC6275, трансформанта 676, трансформанта 678, трансформанта 680, трансформанта 98140, DAS40278-9, DKB89790-5, MON21-9, HCEM485, MON832, MON87427, NK603, T14, T25 и VCO01981-5. Растения сои, которые попадают в эту категорию трансгенных растений, выбирают из группы, состоящей из: MON87751, DAS81419-2, MON87701, A2704-12, A2704-21, A5547-127, A5547-35, CV127, DAS44406-6, DAS68416-4, DP356043, FG72, MON4032, ACS-GM003-1, MON87705, MON87708, MON89788, W62, W98 и GFM Cry1A. Трансгенные растения хлопка, попадающие в эту категорию, выбирают из группы, состоящей из: DAS24236-5, DAS21023-5, трансформанта 31707, трансформанта 31803, трансформанта 31807, трансформанта 31808, трансформанта 42317, BNLA-601, COT102, COT67B, трансформанта 1, GHB119, GK12, MON15985, MLS9124, MON1076, MON531, MON757, T303-3, T304-40, SGK321, трансформанта 19-51a, GHB614, LLCotton25, MON88701, MON88702, MON1445, MON1698 и MON88913. Трансгенные растения сахарного тростника, попадающие в эту категорию, включают в себя трансформант NXI-1T сахарного тростника. Известные в данной области техники растения риса, которым было бы полезно иметь конструкцию, кодирующую такие белковые токсины BCW, включают в себя трансформанты риса, выбранные из группы, состоящей из: LLRICE06, LLRICE601, LLRICE62, GM-A17054 и GM-A17054. [0021] Such plants can be corn, cotton, soybeans, or any other plants susceptible to Lepidoptera pest species that have been shown to be controlled by the proteins of this invention. Such plants are expected to be pre-produced transgenic plants that will benefit from the effects of the toxic properties of the proteins of this invention. Maize plants falling into this category include, but are not limited to, transformants selected from the group consisting of: , DAS59122-7, Bt10, Bt11, Bt176, CBH-351, DKB-83614-9, MIR162, MIR604, TC1507, TC6275, transformant 676, transformant 678, transformant 680, transformant 98140, DAS40278-9, DKB89790-5, MON21 -9, HCEM485, MON832, MON87427, NK603, T14, T25 and VCO01981-5. Soybean plants that fall into this category of transgenic plants are selected from the group consisting of: MON87751, DAS81419-2, MON87701, A2704-12, A2704-21, A5547-127, A5547-35, CV127, DAS44406-6, DAS68416- 4, DP356043, FG72, MON4032, ACS-GM003-1, MON87705, MON87708, MON89788, W62, W98 and GFM Cry1A. Transgenic cotton plants falling into this category are selected from the group consisting of: DAS24236-5, DAS21023-5, transformant 31707, transformant 31803, transformant 31807, transformant 31808, transformant 42317, BNLA-601, COT102, COT67B, transformant 1, GHB119, GK12, MON15985, MLS9124, MON1076, MON531, MON757, T303-3, T304-40, SGK321, transformant 19-51a, GHB614, LLCotton25, MON88701, MON88702, MON1445, MON1698 and MON88913. Transgenic sugarcane plants that fall into this category include the NXI-1T sugarcane transformant. Rice plants known in the art that would benefit from having a construct encoding such BCW protein toxins include rice transformants selected from the group consisting of: LLRICE06, LLRICE601, LLRICE62, GM-A17054 and GM-A17054.
[0022] Дополнительно, предложены обработанные растительные продукты, которые содержат детектируемое количество раскрытых рекомбинантных полинуклеотидов. Такие обработанные продукты включают в себя, но не ограничиваются лишь этими: растительную биомассу, масло, шрот, корм для животных, муку, хлопья, отруби, пух, шелуху и обработанные семена.[0022] Additionally, processed plant products are provided that contain a detectable amount of the disclosed recombinant polynucleotides. Such processed products include, but are not limited to: vegetable biomass, oil, meal, animal feed, flour, flakes, bran, fluff, husks, and processed seeds.
[0023] Также предлагаются способы получения трансгенных растений. Такие способы включают в себя введение рекомбинантного полинуклеотида в клетку растения и отбор трансгенного растения, которое экспрессирует ингибирующее насекомых количество рекомбинантного полипептида, кодируемого рекомбинантным полинуклеотидом. [0023] Methods for producing transgenic plants are also provided. Such methods include introducing a recombinant polynucleotide into a plant cell and selecting a transgenic plant that expresses an insect-inhibiting amount of the recombinant polypeptide encoded by the recombinant polynucleotide.
[0024] Другие варианты осуществления, признаки и преимущества изобретения будут очевидны из следующего подробного описания, примеров и формулы изобретения.[0024] Other embodiments, features and advantages of the invention will be apparent from the following detailed description, examples and claims.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВBRIEF DESCRIPTION OF GRAPHICS
[0025] На Фиг. 1 изображен список видов чешуекрылых насекомых-вредителей, которые были протестированы в биоанализах с токсичными белками BCW 001, BCW 002 и BCW 003. «+» указывает на смертность относительно контроля в виде буфера; «-» указывает на отсутствие статистически значимой наблюдаемой смертности выше уровня контроля в виде буфера; «НД» означает, что не тестировалось с использованием соответствующего токсичного белка. BCW 001 продемонстрировал вызывающее смерть воздействие против Agrotis ipsilon (совка-ипсилон), Striacosta albicostsa, Helicoverpa zea, Ostrinia nubilalis (огневка кукурузная), Diatraea grandiosella, Trichoplusia ni, Pseudoplusia includens, и не продемонстрировал вызывающее смерть воздействие или задержку роста при тестировании против Spodoptera frugiperda (курузная лиственная совка). Diatraea saccharalis не тестировали с BCW 001. BCW 002 проявил вызывающее смерть воздействие против Agrotis ipsilon (совка-ипсилон), Striacosta albicostsa, Helicoverpa zea (совка хлопковая), и Ostrinia nubilalis (огневка кукурузная), и не проявил вызывающее смерть воздействие или задержку роста при тестировании против Spodoptera frugiperda (курузная лиственная совка). Diatraea saccharalis, Diatraea grandiosella (огневка кукурузная юго-западная), Trichoplusia ni (совка капустная), и Pseudoplusia includens (соевая совка) не тестировали с BCW 002. BCW 003 проявил вызывающее смерть воздействие против Agrotis ipsilon (совка-ипсилон), Striacosta albicostsa, Helicoverpa zea (совка хлопковая), Ostrinia nubilalis (огневка кукурузная), Diatraea saccharalis, Diatraea grandiosella, Trichoplusia ni (совка капустная), и Pseudoplusia includens (соевая совка), и не проявил вызывающее смерть воздействие или задержку роста при тестировании против Spodoptera frugiperda (курузная лиственная совка).[0025] In FIG. 1 shows a list of Lepidoptera pest species that have been tested in bioassays with the toxic proteins BCW 001, BCW 002, and BCW 003. "+" indicates mortality relative to buffer control; "-" indicates the absence of statistically significant observed mortality above the control level in the form of a buffer; "ND" means not tested with the corresponding toxic protein. BCW 001 has been shown to be lethal against Agrotis ipsilon (epsilon cutworm), Striacosta albicostsa, Helicoverpa zea, Ostrinia nubilalis (corn moth), Diatraea grandiosella, Trichoplusia ni, Pseudoplusia includens, and has not been shown to be lethal or growth retardant when tested against Spodoptera frugiperda (corn cutworm). Diatraea saccharalis has not been tested with
[0026] На Фиг. 2 изображено выравнивание аминокислотной последовательности BCW 001 (SEQ ID NO: 2, верхняя) против BCW 002 (SEQ ID NO: 4, средняя), и против BCW 003 (SEQ ID NO: 6, нижняя); звездочки под тремя последовательностями представляют различия по аминокислоте в выбранной позиции по меньшей мере в одной из трех различных последовательностей. [0026] In FIG. 2 shows the amino acid sequence alignment of BCW 001 (SEQ ID NO: 2, upper) versus BCW 002 (SEQ ID NO: 4, middle), and versus BCW 003 (SEQ ID NO: 6, lower); the asterisks below the three sequences represent amino acid differences at the selected position in at least one of the three different sequences.
КРАТКОЕ ОПИСАНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙBRIEF DESCRIPTION OF SEQUENCES
[0027] SEQ ID NO: 1 представляет собой нуклеотидную последовательность природного штамма EG4384 B. thuringiensis, кодирующую токсичный для чешуекрылых белок BCW 001.[0027] SEQ ID NO: 1 is the nucleotide sequence of natural B. thuringiensis strain EG4384 encoding the Lepidoptera
[0028] SEQ ID NO: 2 является установленной аминокислотной последовательностью BCW 001 из открытой рамки считывания, как указано в SEQ ID NO: 1.[0028] SEQ ID NO: 2 is the established amino acid sequence of
[0029] SEQ ID NO: 3 представляет собой искусственную последовательность, кодирующую химерный токсичный для чешуекрылых белок BCW 002.[0029] SEQ ID NO: 3 is an artificial sequence encoding the chimeric Lepidoptera
[0030] SEQ ID NO: 4 представляет собой установленную аминокислотную последовательность BCW 002 из открытой рамки считывания, как указано в SEQ ID NO: 3, в которой такой белок BCW 002 состоит из домена I Cry1Ac, функционально связанного с доменами II и III BCW 001 (с аминокислотной позиции 258 до аминокислотной позиции 606, как указано в SEQ ID NO: 2) и функционально связанного с доменом протоксина Cry1Ac с аминокислотной позиции 608 до 1177, как указано в SEQ ID NO: 4 и SEQ ID NO: 6. SEQ ID NO: 4 (BCW 002) отличается от SEQ ID NO: 6 (BCW 003) только в позиции 259, BCW 002 содержит изолейцин в данной позиции, BCW 003 содержит треонин, как в BCW 001.[0030] SEQ ID NO: 4 is the established amino acid sequence of
[0031] SEQ ID NO: 5 представляет собой искусственную последовательность, кодирующую химерный токсичный для чешуекрылых белок BCW 003.[0031] SEQ ID NO: 5 is an artificial sequence encoding chimeric Lepidoptera
[0032] SEQ ID NO: 6 представляет собой установленную аминокислотную последовательность BCW 003 из открытой рамки считывания, как указано в SEQ ID NO: 3, в которой такой белок BCW 003 состоит из домена I Cry1Ac, функционально связанного с доменами II и III BCW 001 (с аминокислотной позиции 258 до аминокислотной позиции 606, как указано в SEQ ID NO: 2) и функционально связанного с доменом протоксина Cry1Ac с аминокислотной позиции 608 до 1177, как указано в SEQ ID NO: 4 и SEQ ID NO: 6. SEQ ID NO: 6 (BCW 003) отличается от SEQ ID NO: 4 (BCW 002) только в позиции 259, BCW 002 содержит изолейцин в данной позиции, BCW 003 содержит треонин, как в BCW 001.[0032] SEQ ID NO: 6 is the established amino acid sequence of
[0033] SEQ ID NO: 7 представляет собой искусственную последовательность, кодирующую белок BCW 001 для экспрессии в растениях.[0033] SEQ ID NO: 7 is an artificial sequence encoding the
[0034] SEQ ID NO: 8 представляет собой установленную аминокислотную последовательность BCW 001, полученную из SEQ ID NO: 7.[0034] SEQ ID NO: 8 is the established amino acid sequence of
[0035] SEQ ID NO: 9 представляет собой искусственную последовательность, кодирующую белок BCW 002 для экспрессии в растениях.[0035] SEQ ID NO: 9 is an artificial sequence encoding the
[0036] SEQ ID NO: 10 представляет собой установленную аминокислотную последовательность BCW 002, полученную из SEQ ID NO: 9.[0036] SEQ ID NO: 10 is the established amino acid sequence of
[0037] SEQ ID NO: 11 представляет собой искусственную последовательность, кодирующую белок BCW 003 для экспрессии в растениях.[0037] SEQ ID NO: 11 is an artificial sequence encoding the
[0038] SEQ ID NO: 12 представляет собой установленную аминокислотную последовательность BCW 003, полученную из SEQ ID NO: 11.[0038] SEQ ID NO: 12 is the established amino acid sequence of
ПОДРОБНОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION
[0039] Альтернативой борьбе с сельскохозяйственными вредителями культурных растений путем опрыскивания готовыми формами, содержащими инсектицидные белки, растений/семян является вставка полинуклеотидов, кодирующих данные белки, в геном растения для экспрессии в растении или частях растения. Растения, трансформированные такими полинуклеотидами, обладают устойчивостью к насекомым, которую данные экспрессированные белки обеспечивают в качестве трансгенных признаков.[0039] An alternative to crop pest control by spraying formulations containing insecticidal proteins on plants/seeds is to insert polynucleotides encoding these proteins into the plant genome for expression in the plant or plant parts. Plants transformed with such polynucleotides have the insect resistance that these expressed proteins confer as transgenic traits.
[0040] Чтобы избежать развития или обойти устойчивость насекомых к используемым в данное время белкам, для борьбы с чешуекрылыми необходимы новые белки с другим способом действия (СД), а также широким спектром и эффективностью. Одним из способов решить данную проблему является секвенирование геномов Bt в надежде открыть новые инсектицидные белки. Другой подход заключается в обмене сегментов из различных белков Bt для создания новых химерных белков Bt, обладающих ингибирующими свойствами в отношении насекомых. Вероятность произвольного создания химерного белка с улучшенными свойствами путем рекомбинирования доменных структур многочисленных природных инсектицидных кристаллических белков, известных в данной области техники, крайне мала (смотрите, например, A Strategy for Shuffling Numerous Bacillus thuringiensis Crystal Protein Domains; J. Economic Entomology, 97 (6): 1805-1813. 2004).[0040] In order to avoid developing or bypass insect resistance to currently used proteins, novel proteins with a different mode of action (DM) as well as broad spectrum and efficacy are needed to control Lepidoptera. One way to solve this problem is to sequence Bt genomes in the hope of discovering new insecticidal proteins. Another approach is to exchange segments from different Bt proteins to create new chimeric Bt proteins with insect inhibitory properties. The likelihood of randomly generating a chimeric protein with improved properties by recombining the domain structures of numerous natural insecticidal crystal proteins known in the art is extremely low (see, for example, A Strategy for Shuffling Numerous Bacillus thuringiensis Crystal Protein Domains; J. Economic Entomology, 97 (6 ): 1805-1813. 2004).
[0041] В данном документе раскрыты нуклеотидные последовательности, которые кодируют инсектицидные белки, обозначенные в данном документе как белки BCW, которые удовлетворяют потребность в альтернативном СД, обеспечивают активность против более широкого спектра насекомых-вредителей и действуют, задерживая или предотвращая развитие устойчивости, особенно при использование в борьбе с вредителями совки-ипсилон (BCW).[0041] Disclosed herein are nucleotide sequences that encode insecticidal proteins, referred to herein as BCW proteins, that meet the need for an alternative DM, confer activity against a broader range of insect pests, and act to delay or prevent the development of resistance, especially when use in pest control upsilon cutworms (BCW).
[0042] BCW 001 был открыт как открытая рамка считывания, предсказывающая аминокислотную последовательность, имеющую характеристики белка типа Cry1A, после секвенирования генома штамма EG4384 Bacillus thuringiensis. Открытая рамка считывания BCW 001 (ORF) кодировала белок из 1180 аминокислот, и было предсказано, что белок обладает многими характеристиками белковых токсинов Cry1, включая идентифицируемую структуру доменов I, II и III и характерный домен протоксина типа Cry1A на карбоксиконцевой половине предсказанного белка. Предсказанная аминокислотная последовательность домена I (остатки с 1 по около 258 SEQ ID NO: 2) демонстрирует около 67% идентичность с доменом I белкового токсина Cry1Ac. Предсказанная аминокислотная последовательность домена II (остатки от около 259 до около остатка 459, как указано в SEQ ID NO: 2) демонстрирует полную (100%) идентичность с доменом II Cry1Ai2. Предсказанная аминокислотная последовательность домена III (остатки от около 260 до около 606, как указано в SEQ ID NO: 2) демонстрирует около 63% идентичность с соответствующими остатками домена III в Cry1Ah2. Структура домена протоксина предсказанного белка BCW 001 (от около остатка 607 до 1180, как указано в SEQ ID NO: 2) демонстрирует около 96% идентичность с соответствующими остатками в Cry1Aa9. В целом, этот предсказанный полноразмерный белок демонстрирует около 83% идентичности аминокислотной последовательности с Cry1Ai, а предсказанная область токсина от аминокислотной позиции 1 до около остатка 607, как указано в SEQ ID NO: 2, демонстрирует 76% идентичность с Cry1Ai1. Трудно отнести этот новый токсичный белок к определенному классу Cry1A, и поэтому комитету по номенклатуре Bacillus thuringiensis будет предоставлена данная последовательность и он определит, заслуживает ли этот белок свой собственный отдельный и новый класс.[0042]
[0043] Белок BCW 001 был получен из плазмидного вектора в некристаллоносном штамме Bacillus thuringiensis, а препараты кристаллов спор были протестированы против разнообразных чешуекрылых. Смотрите Фиг. 1, столбец 2 касательно данных. Факты указывают на то, что данный белок не схож с любым из белков, с которыми он разделяет источник происхождения, то есть токсичными белками Cry1Aa, Cry1Ah или Cry1Ai, известными в данной области техники. Ни один из белков предшествующего уровня техники не проявляет сколько-нибудь заметной активности при тестировании против совки-ипсилон, однако данной новый белок BCW 001 был токсичным в биоанализах при тестировании против совки-ипсилон и неожиданно проявлял токсические свойства при тестировании против группы других чешуекрылых, как изложено в Фиг. 1.[0043] The
[0044] В частности, в биоанализах по сравнению с необработанным контрольным рационом насекомых белок BCW 001 проявлял активность против Striacosta albicosta («WBC»), Helicoverpa zea («CEW»), огневки кукурузной («ECB», Ostrinia nubilalis), Diatraea grandiosella («SWC»), Pseudoplusia includes («SL»), Trichoplusia ni («CLW»), и совки ипсилон 1-3 личиночной стадии («BCW», Agrotis ipsilon).[0044] In particular, in bioassays compared to an untreated insect control diet,
[0045] Как описано дополнительно ниже, химерные токсичные белки получали с использованием домена I Cry1Ac, и доменов II и III BCW 001 (то есть BCW 002 и BCW 003, как указано в SEQ ID NO: 4 и SEQ ID NO: 6, соответственно), и данные химерные токсичные белки были введены в растения кукурузы и сахарного тростника. Оба химерных белка проявляли активность в кукурузе против BCW, WBC, CEW и SWC. BCW 003 проявлял активность в отношении SCB в сахарном тростнике.[0045] As described further below, chimeric toxic proteins were generated using Cry1Ac domain I, and
[0046] Термин «белок BCW», как используется в данном документе, относится к любому новому ингибирующему насекомых белку, который содержит, который состоит из, который является по существу гомологичным, или который получен из любой ингибирующей насекомых полипептидной последовательности: BCW 001 (SEQ ID NO: 2), BCW 002 (SEQ ID NO: 4) и BCW 003 (SEQ ID NO: 6) и их сегментов, ингибирующих насекомых, или их комбинаций, которые обеспечивают активность против чешуекрылых, в частности, но не ограничиваясь, BCW, WBC и/или SCB. Полинуклеотид, кодирующий BCW 001, был получен из штамма EG4384. Основная токсичная аминокислотная последовательность для BCW 001 соответствует аминокислотам от около позиции 28 до около позиции 606 и до позиции 618, как указано в SEQ ID NO: 2, а основная токсичная аминокислотная последовательность для BCW 002 и 003 соответствует аминокислотам от около позиции 29 до около позиции 607 и до около позиции 619, как указано в SEQ ID NO: 4 и SEQ ID NO: 6, соответственно. [0046] The term "BCW protein" as used herein refers to any novel insect inhibitory protein that contains, consists of, is substantially homologous to, or is derived from any insect inhibitory polypeptide sequence: BCW 001 (SEQ ID NO: 2), BCW 002 (SEQ ID NO: 4) and BCW 003 (SEQ ID NO: 6) and their insect inhibitory segments, or combinations thereof, which provide activity against Lepidoptera, in particular, but not limited to, BCW , WBC and/or SCB. The
[0047] В одном варианте осуществления, белки, раскрытые в данном документе, являются родственными по первичной структуре дельта-эндотоксину по длине (около 1176-1180 аминокислот), по длине белка без протоксина (от около 600 до около 619 аминокислот), по длине основной части токсина (около 591 аминокислот) или по наличию по меньшей мере одного специфического для BCW сегмента. [0047] In one embodiment, the proteins disclosed herein are related in primary structure to delta-endotoxin in length (about 1176-1180 amino acids), in protein length without protoxin (about 600 to about 619 amino acids), in length the main body of the toxin (about 591 amino acids) or by the presence of at least one BCW-specific segment.
[0048] Иллюстративные белки были выровнены друг с другом с использованием алгоритма Clustal W, давая в результате число аминокислотных совпадений для пар выравнивания и процент аминокислотной идентичности для пар выравнивания с использованием данных параметров по умолчанию: Матрица вессов: Blosum; Штраф за открытие пропуска: 10,0; Штраф за продление пропуска: 0,05; Гидрофильные пропуски: Вкл.; Гидрофильные остатки: GPSNDQERK; Штрафы за пропуск по конкретным остаткам: Вкл. The Clustal W algorithm is described in Thompson, J.D., Higgins, D.G. and Gibson, T.J. (1994) "CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, positions-specific gap penalties and weight matrix choice." Nucleic Acids Research, 22:4673-4680.[0048] Exemplary proteins were aligned to each other using the Clustal W algorithm, resulting in the number of amino acid matches for alignment pairs and percent amino acid identity for alignment pairs using these default parameters: Weight Matrix: Blosum; Penalty for opening a pass: 10.0; Pass renewal penalty: 0.05; Hydrophilic passes: On; Hydrophilic residues: GPSNDQERK; Skipping penalties for specific balances: Incl. The Clustal W algorithm is described in Thompson, J.D., Higgins, D.G. and Gibson, T.J. (1994) "CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, positions-specific gap penalties and weight matrix choice." Nucleic Acids Research, 22:4673-4680.
[0049] Другие алгоритмы выравнивания также доступны в данной области техники и обеспечивают результаты, аналогичные тем, которые получены с использованием выравнивания Clustal W. [0049] Other alignment algorithms are also available in the art and provide similar results to those obtained using Clustal W alignment.
[0050] Термин «около» используется в данном документе для описания того, что данные границы сегментов могут отличаться на 1, 2, 3, 4, 5, 10, 20, 25, 30 или 35 остатков, в зависимости от последовательности исходных белков и их выравнивания друг с другом. Чтобы дополнительно описать изменчивость и конфигурацию различных сегментов, в Таблицах 2 и 3 приведены границы сегментов BCW 002 и 003, и других активных против совки-ипсилон химерных белков.[0050] The term "about" is used herein to describe that these segment boundaries may differ by 1, 2, 3, 4, 5, 10, 20, 25, 30, or 35 residues, depending on the sequence of the original proteins and their alignment with each other. To further describe the variability and configuration of the different segments, Tables 2 and 3 show the segment boundaries of
[0051] Термин «фрагмент» используется в данном документе для описания непрерывных аминокислотных или нуклеотидных последовательностей, которые короче, чем полная аминокислотная или нуклеотидная последовательность, описывающая токсичный белок BCW.[0051] The term "fragment" is used herein to describe continuous amino acid or nucleotide sequences that are shorter than the full amino acid or nucleotide sequence describing the toxic BCW protein.
[0052] Фраза «ингибитор насекомых» и «инсектицид» используются в данном документе взаимозаменяемо и относятся к белку, фрагменту белка, сегменту белка или полинуклеотиду, который приводит к любому измеримому подавлению жизнеспособности, роста, развития насекомых, размножения насекомых, поведения насекомых при кормлении, брачного поведения насекомых и/или любому измеримому уменьшению неблагоприятных эффектов, вызванных поглощением насекомым данного белка, фрагмента белка, сегмента белка или полинуклеотида. [0052] The phrase "insect inhibitor" and "insecticide" are used interchangeably herein and refer to a protein, protein fragment, protein segment, or polynucleotide that results in any measurable inhibition of insect viability, growth, insect development, insect reproduction, insect feeding behavior , mating behavior of insects, and/or any measurable reduction in adverse effects caused by insect ingestion of a given protein, protein fragment, protein segment, or polynucleotide.
[0053] Термины «биологическая активность», «активный», «активность», «эффективный», «эффективность» или их вариации используются в данному документе взаимозаменяемо для описания эффектов белков согласно данному изобретению на целевых насекомых-вредителей.[0053] The terms "biological activity", "active", "activity", "effective", "efficacy" or variations thereof are used interchangeably herein to describe the effects of the proteins of this invention on target insect pests.
[0054] Культура - это само-распространяемое или культивируемое растение, продукт которого собирают в какой-то момент его стадии роста. Неограничивающими примерами таких продуктов являются семя, коробочка, лист, цветок, стебель, корень или любая их часть.[0054] A crop is a self-propagating or cultivated plant whose product is harvested at some point in its growth stage. Non-limiting examples of such products are seed, pod, leaf, flower, stem, root, or any part thereof.
Биологический образец, полученный из любой ткани растения, бактерии, вируса или вектора, содержащих полинуклеотид или экспрессирующих белок, как проиллюстрировано в данном документе, такой как, но не ограничиваясь лишь этими: семя, коробочка, лист, цветок, стебель, корень или любая его часть, и содержащих определяемое количество полинуклеотида, белка или обоих.A biological sample derived from any plant tissue, bacterium, virus, or vector containing a polynucleotide or expressing a protein as illustrated herein, such as, but not limited to, a seed, boll, leaf, flower, stem, root, or any of them part, and containing a detectable amount of polynucleotide, protein, or both.
[0055] Фраза «определяемое количество» используется в данном документе для описания минимального количества белка или полинуклеотида, раскрытого в данном документе, которое может быть обнаружено стандартными аналитическими способами, такими как, но без ограничения, полимеразная цепная реакция (ПЦР) и иммуноферментный анализ (ИФА), и т. п. [0055] The phrase "detectable amount" is used herein to describe the minimum amount of a protein or polynucleotide disclosed herein that can be detected by standard analytical methods such as, but not limited to, polymerase chain reaction (PCR) and enzyme immunoassay ( ELISA), etc.
[0056] В одном варианте осуществления, токсины, описанные в данном документе, связаны общей функцией и проявляют инсектицидную активность в отношении видов чешуекрылых насекомых. [0056] In one embodiment, the toxins described herein share a common function and exhibit insecticidal activity against Lepidoptera insect species.
[0057] Сегменты BCW 001 обеспечивают активность против совки-ипсилон химерам Cry1, которые содержат такие сегменты. Примеры сегментов BCW 001, которые придают активность против совки-ипсилон, приведены в SEQ ID NO: 2 от около аминокислотной позиции 250 до около 606, и более конкретно от около аминокислотной позиции 255 до около 606. Химеры Cry1, содержащие данный аминокислотный сегмент, соответствующий доменам II и III токсичного белка BCW 001, часто также будут иметь помимо свойств химерного белка токсические свойства, связанные с контролем совки-ипсилон, и это было проверено в каркасах Cry1A, Cry1B, Cry1C, Cry1D, Cry1E и Cry1F, в которых соответствующая токсичная конструкция имела компоненты домена II и III, замещенные данным участком аминокислот из BCW 001, и во многих случаях активность против совки-ипсилон неожиданно сохранялась в химерной конструкции (данные не показаны).[0057]
[0058] В одном аспекте изобретения, вредитель, контролируемый применимым токсичным белком BCW, является, в частности, насекомым-вредителем отряда Lepidoptera, включая взрослых особей, куколок, личинок и только появившихся личинок.[0058] In one aspect of the invention, the pest controlled by the applicable toxic BCW protein is specifically an insect pest of the order Lepidoptera, including adults, pupae, larvae, and emerging larvae.
[0059] Насекомые отряда чешуекрылых (Lepidoptera) включают в себя, но не ограничиваются лишь этими: насекомых из семейства совок (Noctuidae) (гусеницы, бабочка-совка, пяденицы, heliothines), (например кукурузную лиственную совку (Spodoptera frugiperda), совку помидорную (Spodoptera exigua), Mamestra configurata, совку-ипсилон (Agrotis ipsilon), Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Agrotis orthogonia, Pseudaletia unipuncta; точильщиков, чехлоносиков и других насекомых из семейства огневок (Pyralidae), например огневку кукурузную (Ostrinia nubilalis), Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus; насекомых из семейства листоверток (Tortricidae), например яблонную плодожорку (Cydia pomonella), Endopiza viteana, восточную плодожорку (Grapholita molesta), Suleima helianthana; и многих других экономически важных чешуекрылых (например, капустную моль (Plutella xylostella), Pectinophora gossypiella, и непарного шелкопряда (Lymantria dispar)). Другие насекомые-вредители отряда чешуекрылых (Lepidoptera) включают в себя, например, Alabama argillacea, Archips argyrospila, Archips rosana и другие виды Archips, Chilo suppressalis (огневку желтую рисовую), Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Earias vittella, Helicoverpa armigera (совку хлопковую), Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana (гроздьевую листовертку), Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae (капустницу), Pieris rapae (репницу), Plutella xylostella (капустную моль), Spodoptera exigua, Spodoptera litura, S. frugiperda, и Tuta absoluta (томатную минирующую моль).[0059] Insects of the order Lepidoptera (Lepidoptera) include, but are not limited to: insects of the Noctuidae family (caterpillars, cutworms, moths, heliothines), (e.g., corn fallowworm (Spodoptera frugiperda), (Spodoptera exigua), Mamestra configurata, Agrotis ipsilon cutworm, Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Agrotis orthogonia, Pseudaletia unipuncta; Pyralidae), e.g. corn moth (Ostrinia nubilalis), Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus; insects from the leafworm family (Tortricidae), e.g. apple codling moth (Cydia pomonella), Endopiza viteana, eastern codling moth (Grapholita molesta ), Suleima helianthana; and many other economically important Lepidoptera (e.g. , cabbage moth (Plutella xylostella), Pectinophora gossypiella, and gypsy moth (Lymantria dispar)). Other insect pests of the Lepidoptera order include, for example, Alabama argillacea, Archips argyrospila, Archips rosana and other Archips species, Chilo suppressalis (yellow rice moth), Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis , Earias insulana, Earias vittella, Helicoverpa armigera (cotton bollworm), Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana (cluster leafworm), Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae (cabbage), Pieris rapae (turnip), Plutella xylostella (cabbage moth), Spodoptera exigua, Spodoptera litura, S. frugiperda, and Tuta absoluta (tomato miner moth).
[0060] Раскрытые в данном документе белки также могут быть использованы для получения антител, которые специфически связываются с BCW-специфичными токсичными белками, и могут использоваться для скрининга и поиска других представителей семейства токсинов BCW. [0060] The proteins disclosed herein can also be used to generate antibodies that specifically bind to BCW-specific toxic proteins and can be used to screen and search for other members of the BCW toxin family.
[0061] В одном варианте осуществления, иллюстративные полинуклеотиды, которые кодируют ингибирующие насекомых белки, родственные BCW 001, указаны в SEQ ID NO: 1, 3, 5, 7, 9 и 11. Нуклеотидные последовательности, кодирующие данные белки, можно использовать в качестве зондов и праймеров для скрининга для идентификации других представителей семейства с использованием способов термической или изотермической амплификации и/или гибридизации и других способов идентификации, известных специалистам в данной области техники. [0061] In one embodiment, exemplary polynucleotides that encode insect inhibitory proteins related to
[0062] Согласно аспекту изобретения, предложены способы обнаружения родственных белков, и такие способы включают в себя секвенирование геномов Bt, сборку данных секвенирования, идентификацию и клонирование генов Bt, кодирующих такие пестицидные белки, а также экспрессию и тестирование новых белков Bt для анализа пестицидной активности. В другом аспекте изобретения используются молекулярные способы для конструирования и клонирования коммерчески полезных белков, включающих в себя химеры белков из семейства пестицидных белков, например, химеры могут быть собраны из сегментов токсичных белков BCW для получения дополнительных вариантов осуществления. Раскрытые белки могут быть подвергнуты выравниванию друг с другом и с другими пестицидными белками Bt, и могут быть идентифицированы сегменты каждого такого белка, которые полезны для замещения между выровненными белками, что приводит к конструированию химерных белков. Такие химерные белки могут быть подвергнуты анализу - биоанализу с вредителем, и охарактеризованы на наличие повышенной биологической активности или расширения спектра вредителей-мишеней, по сравнению с исходными белками, из которых был получен каждый такой сегмент химеры. Пестицидную активность полипептидов можно дополнительно сконструировать в виде активности против конкретного вредителя или более широкого спектра вредителей путем замены доменов или сегментов таковыми из других белков.[0062] According to an aspect of the invention, methods are provided for discovering related proteins, and such methods include sequencing Bt genomes, assembling sequencing data, identifying and cloning Bt genes encoding such pesticidal proteins, and expressing and testing novel Bt proteins to analyze pesticidal activity. . In another aspect of the invention, molecular methods are used to construct and clone commercially useful proteins, including chimeras of proteins from the pesticidal protein family, for example, chimeras can be assembled from segments of toxic BCW proteins to provide additional embodiments. The disclosed proteins can be aligned with each other and with other pesticidal Bt proteins, and segments of each such protein can be identified that are useful for substitution between the aligned proteins, resulting in the construction of chimeric proteins. Such chimeric proteins can be subjected to a bioassay with a pest and characterized for increased biological activity or broadening of the spectrum of target pests compared to the original proteins from which each such segment of the chimera was derived. The pesticidal activity of the polypeptides can be further engineered to be active against a particular pest or a broader range of pests by replacing domains or segments with those of other proteins.
[0063] В одном варианте осуществления, белки, раскрытые в данном документе, включат в себя функционально эквивалентные фрагменты (N- или C-концевые делеции) белков, раскрытых в данном документе.[0063] In one embodiment, the proteins disclosed herein include functionally equivalent fragments (N- or C-terminal deletions) of the proteins disclosed herein.
[0064] BCW токсичные белки предложены в данном документе. В некоторых вариантах осуществления, могут быть выделены, могут быть представлены в композиции, в трансгенном микроорганизме или в трансгенном растении токсины, родственные BCW 001. В данном варианте осуществления, белки BCW 002 и, в частности, белки BCW 003 обеспечивают ингибирующую активность в отношении чешуекрылых, особенно ингибирующую активность в отношении совки-ипсилон и/или Diatraea saccharalis. Отсылка в данной заявке к «выделенному белку», или эквивалентному термину или фразе, предназначена для обозначения того, что белок представляет собой молекулу, которая присутствует отдельно или в комбинации с другими соединениями, но не в ее естественной среде. Например, токсичные белки согласно данному изобретению и т. п., которые естественным образом обнаруживаются в организме, не считаются «выделенными», если они находятся в организме, в котором они находятся в естественном состояние. Однако, каждый из них будет «выделен» в рамках данного раскрытия изобретения, если белок не находится в организме, в котором он находится в естественном состояние.[0064] BCW toxic proteins are provided herein. In some embodiments,
[0065] Термин «функционально связанный», как используется в данном документе, относится к соединению последовательностей нуклеиновых кислот или аминокислотных последовательностей, так что одна последовательность может обеспечивать требуемую функцию или совместимое или полезное свойство для связанной последовательности.[0065] The term "operably linked", as used herein, refers to the connection of nucleic acid sequences or amino acid sequences such that one sequence can provide a desired function or compatible or useful property to the associated sequence.
[0066] Пептиды, полипептиды и белки, биологически функционально эквивалентные BCW 001, BCW 002 и BCW 003, включают в себя, но не ограничиваются лишь этими: аминокислотные последовательности, содержащие консервативные аминокислотные замены в данных белковых последовательностях токсичного белка BCW. В таких аминокислотных последовательностях одна или большее количество аминокислот в последовательности замещены другой аминокислотой (аминокислотами), что приводит к молчащей или консервативной замене в аминокислотной последовательности. [0066] Peptides, polypeptides, and proteins biologically functionally equivalent to
[0067] Хотя раскрытые ингибирующие насекомых полипептиды предпочтительно содержат белковую последовательность BCW 001, BCW 002 или BCW 003, фрагменты и варианты данной последовательности, обладающие такой же или сходной ингибирующей активностью в отношении насекомых, что и активность данного ингибирующего насекомых белка, также раскрыты в данном документе. Например, смежные последовательности из по меньшей мере 30, 35, 38, 40, 45, 50, 55, 60, 65, 70, 75, 100, 150, 200, 500, 550 или большего количества аминокислот в родственном BCW токсичном белке с ингибирующей активностью в отношении насекомых. В другом варианте осуществления, фрагменты родственного BCW токсичного белка с ингибирующей активностью в отношении насекомых могут содержать аминокислотные замены, делеции, вставки или добавления в последовательности токсичного белка BCW.[0067] Although the disclosed insect inhibitory polypeptides preferably comprise the
[0068] В одном варианте осуществления, ингибирующий насекомых полипептид содержит ингибирующий насекомых сегмент от около остатка 28 до около остатка 618 белковой последовательности BCW 001, как указано в SEQ ID NO: 2. Неограничивающие примеры включают в себя любую из SEQ ID NO: 2, 4 или 6, или более короткие фрагменты, или варианты, обладающие такой же или сходной ингибирующей активностью в отношении насекомых, что и активность данного конкретного белка BCW 001, сами по себе или в функциональной связи в химерным белком. В другом варианте осуществления, сегменты, имеющие смежные аминокислотные последовательности, по меньшей мере, около 38 или большего количества аминокислот в любой из SEQ ID NO: 2, 4 или 6, обладающие ингибирующей активностью в отношении насекомых, также дают функциональный инсектицидный белок. Ингибирующие насекомых токсичные фрагменты BCW 001 также могут содержать сегменты, по меньшей мере, с 30, 35, 38, 40, 45, 50, 100, 150, 200, 500, 550, 555, 560, 565, 570, 572, 574, 580 или 585 аминокислотными остатками из области 591 аминокислотного остатка, соответствующей остаткам от около 28 до около 618 последовательностей, любой из SEQ ID NO: 2, 4 или 6. [0068] In one embodiment, the insect inhibitory polypeptide comprises an insect inhibitory segment from about residue 28 to about residue 618 of the
[0069] В некоторых вариантах осуществления, фрагменты зрелого белка BCW 001 (зрелый обозначает протоксиновую форму белка, состоящую из 1180 аминокислот, расщепляемую путем протеолиза в кишечнике насекомого-вредителя, чтобы высвободить только N-концевое ядро токсина до остатка 607 включительно около остатка 618, высвобождая активный сегмент токсина, содержащего, больше или меньше, остатки с 1 по 606 или любое количество остатков от около 5 до около 618, как указано в SEQ ID NO: 2, при условии, что высвободившийся сегмент проявляет токсические свойства при воздействии на личинки совки-ипсилон) могут быть усеченными формами, в которых одна или большее количество аминокислот удалены с N-конца, С-конца, середины белка или их комбинаций, с активностью в виде подавления насекомых. Эти фрагменты могут быть природными или синтетическими вариантами BCW 001 и сохранять ингибирующую активность в отношение насекомых токсичного белка BCW. В некоторых вариантах осуществления, фрагменты зрелых белков BCW 001, BCW 002 или BCW 003 проявляют пестицидную активность, которой обладают исходные молекулы белка, из которых они получены. Описанный в данном документе фрагмент или вариант может дополнительно содержать обозначенный в данном документе домен, который отвечает за пестицидную активность белка. Усеченное производное, обладающее ингибирующей активностью в отношении насекомых, представляет собой токсичный белок BCW, соответствующий остаткам от около 28 до около 606, или до около 618 последовательности токсичного белка BCW 001, как указано в SEQ ID NO: 2, или остаткам от около 29 до около 607 и до остатка 619 токсичного белка BCW, как указано в SEQ ID NO: 4 или SEQ ID NO: 6. [0069] In some embodiments, fragments of the
[0070] Еще в одном варианте осуществления, укороченные N-концевые делеционные мутации включают в себя, но не ограничиваются токсичными белками BCW 001, в которых отсутствуют аминокислотные остатки либо с N-конца, и/или с С-конца токсичной части без протоксина, либо токсическое ядро токсичных белков BCW. Например, от 1 до 6 N-концевых аминокислотных остатков токсичного ядра белка BCW 001, соответствующего остаткам с 28 по 618 SEQ ID NO: 2 или остаткам с 29 по 619 SEQ ID NO: 4 или 6, могут быть удалены. Усеченные С-концевые делеционные мутанты токсичного белка BCW, соответствующего остаткам с 28 по 618 последовательности SEQ ID NO: 2 или остаткам с 29 по 619 последовательности SEQ ID NO: 4 или 6, включают в себя, но не ограничиваются токсичными белками BCW, в которых отсутствуют от 1 до 6 С-концевых аминокислотных остатков. В других вариантах осуществления, токсичный белок BCW с соответствующими остатками 28-618 SEQ ID NO: 2 или соответствующими остатками 29-619 SEQ ID NO: 4 или 6, может иметь как N-концевое усечение от 1 до 6 аминоконцевых остатков, так и С-концевое усечение от 1 до 6 карбоксиконцевых остатков.[0070] In yet another embodiment, truncated N-terminal deletion mutations include, but are not limited to,
[0071] В некоторых вариантах осуществления, отдельные сегменты с 1 по 6 белка CPR24719 или комбинация из сегментов с 1 по 6, которые предоставляют активность против совки-ипсилон белку, отличающемуся от CPR24719-1, также могут проявлять ту же или подобную функцию. [0071] In some embodiments, individual segments 1 to 6 of the CPR24719 protein, or a combination of segments 1 to 6, which confer anti cutworm-upsilon activity to a protein other than CPR24719-1, may also exhibit the same or a similar function.
[0072] Фрагменты и варианты токсичного белка BCW, раскрытые в данном документе, могут обладать около 62% или больше идентичности последовательности, около 65%, 70%, 75%, 80%, 85%, 90%, 92%, 95%, 96%, 97%, 98% или больше идентичности последовательности и около 99%, 99,5%, 100% идентичности аминокислотной последовательности с соответствующими сегментами зрелого токсичного белка BCW, имеющего соответствующие аминокислотные последовательности, показанные как остатки 28-618 SEQ ID NO: 2 или остатки 29-619 SEQ ID NO: 4 или 6. [0072] Fragments and variants of the toxic BCW protein disclosed herein may have about 62% or more sequence identity, about 65%, 70%, 75%, 80%, 85%, 90%, 92%, 95%, 96%, 97%, 98% or greater sequence identity and about 99%, 99.5%, 100% amino acid sequence identity with the corresponding segments of the mature toxic BCW protein having the corresponding amino acid sequences shown as residues 28-618 of SEQ ID NO: 2 or residues 29-619 SEQ ID NO: 4 or 6.
[0073] Вариант осуществления изобретения включает в себя рекомбинантные полинуклеотидные композиции, которые кодируют токсичные белки BCW. Например, токсичные белки BCW могут экспрессироваться с помощью рекомбинантных конструкций ДНК, в которых выделенная полинуклеотидная молекула с открытой рамкой считывания, кодирующей белок, функционально связана с такими элементами, как промотор и любой другой регуляторный элемент, функционирующий для экспрессии в системе, для которой предназначена конструкция. Отсылка в данной заявке к «выделенной молекуле ДНК», или эквивалентному термину или фразе, предназначена для обозначения того, что молекула ДНК представляет собой молекулу, которая присутствует отдельно или в комбинации с другими соединениями, но не в ее естественной среде. Например, элементы нуклеиновой кислоты, такие как кодирующая последовательность, последовательность интрона, нетранслируемая лидерная последовательность, последовательность промотора, последовательность терминации транскрипции и т.п., которые природно обнаруживают в ДНК генома организма, не считаются «выделенными» до тех пор, пока элемент находится в геноме организма и в том месте в геноме, в котором его природно обнаруживают. Однако, каждый из данных элементов, и частей таких элементов, будут «выделены» в рамках данного раскрытия изобретения, если элемент находится не в геноме организма, и не месте в геноме, в котором его природно обнаруживают. Подобным образом, нуклеотидная последовательность, кодирующая инсектицидный белок или любой встречающийся в природе инсектицидный вариант такого белка, будет представлять собой выделенную нуклеотидную последовательность, до тех пора пока нуклеотидная последовательность не находится в ДНК бактерии, в которой природно обнаруживают последовательность, кодирующую белок. Синтетическая нуклеотидная последовательность, кодирующая аминокислотную последовательность встречающегося в природе инсектицидного белка, будет считаться выделенной для целей данного раскрытия изобретения. Для целей данного раскрытия изобретения, любая трансгенная нуклеотидная последовательность, то есть нуклеотидная последовательность ДНК, вставленная в геном клеток растения или бактерии, или присутствующая во внехромосомном векторе, будет рассматриваться как выделенная нуклеотидная последовательность, независимо от того, присутствует она в плазмиде или аналогичной структуре, используемой для трансформации клеток, в геноме растения или бактерии, или присутствует в обнаруживаемых количествах в тканях, потомстве, биологических образцах или товарных продуктах, полученных из растения или бактерии. Неограничивающие примеры включают в себя функциональные в растениях промоторы, функционально связанные с последовательностями, кодирующими токсичный белок BCW, для экспрессии белка в растениях, или Bt-функциональные промоторы, функционально связанные с последовательностями, кодирующими токсичный белок BCW, для экспрессии белка в Bt. Другие элементы, которые могут быть функционально связаны с последовательностями, кодирующими токсичный белок BCW, включают в себя, но не ограничиваются лишь этими: энхансеры, интроны, лидерные последовательности, кодируемые тэги иммобилизации белка (HIS-тэг), кодируемые пептиды субклеточной транслокации (например, пластидные транзитные пептиды, сигнальные пептиды), кодируемые полипептидные сайты ферментов посттрансляционных модификаций, рибосомные сайты связывания и сайты-мишени РНКи. [0073] An embodiment of the invention includes recombinant polynucleotide compositions that encode toxic BCW proteins. For example, toxic BCW proteins can be expressed using recombinant DNA constructs in which an isolated polynucleotide molecule with an open reading frame encoding the protein is operably linked to elements such as a promoter and any other regulatory element that functions to be expressed in the system for which the construct is intended. . Reference in this application to "an isolated DNA molecule", or an equivalent term or phrase, is intended to mean that a DNA molecule is a molecule that is present alone or in combination with other compounds, but not in its natural environment. For example, nucleic acid elements, such as a coding sequence, an intron sequence, an untranslated leader sequence, a promoter sequence, a transcription termination sequence, and the like, that are naturally found in the DNA of an organism's genome are not considered "isolated" as long as the element is found in the organism's genome and at the location in the genome where it is naturally found. However, each of these elements, and portions of such elements, will be "isolated" within the scope of this disclosure if the element is not in the organism's genome, nor the location in the genome where it is naturally found. Similarly, a nucleotide sequence encoding an insecticidal protein, or any naturally occurring insecticidal variant of such a protein, will be an isolated nucleotide sequence, as long as the nucleotide sequence is not in the DNA of a bacterium in which the sequence encoding the protein is naturally found. A synthetic nucleotide sequence encoding the amino acid sequence of a naturally occurring insecticidal protein will be considered isolated for the purposes of this disclosure. For the purposes of this disclosure, any transgenic nucleotide sequence, i.e. a DNA nucleotide sequence inserted into the genome of plant or bacterial cells, or present in an extrachromosomal vector, will be considered an isolated nucleotide sequence, whether it is present in a plasmid or similar structure, used for cell transformation, in the genome of a plant or bacterium, or present in detectable amounts in tissues, progeny, biological samples or commercial products derived from a plant or bacterium. Non-limiting examples include plant-functional promoters operably linked to toxic BCW protein coding sequences for protein expression in plants, or Bt-functional promoters operably linked to BCW toxic protein coding sequences for protein expression in Bt. Other elements that may be operably linked to sequences encoding the toxic BCW protein include, but are not limited to: enhancers, introns, leader sequences, encoded protein immobilization tags (HIS tags), encoded subcellular translocation peptides (e.g., plastid transit peptides, signal peptides), encoded polypeptide sites of post-translational modification enzymes, ribosomal binding sites and RNAi target sites.
[0074] Как применяется в данном документе, термин «рекомбинантная молекула ДНК» представляет собой молекулу ДНК, содержащую комбинацию молекул ДНК, которые не встречались бы в природе вместе без вмешательства человека. Например, рекомбинантная молекула ДНК может представлять собой молекулу ДНК, которая состоит по меньшей мере из двух молекул ДНК, гетерологичных по отношению друг к другу, молекулу ДНК, которая содержит последовательность ДНК, которая отличается от последовательностей ДНК, существующих в природе, или молекулу ДНК, которая была включена в ДНК клетки-хозяина путем генетической трансформации или редактирования генов. Аналогичным образом, «рекомбинантная молекула белка» представляет собой молекулу белка, содержащую комбинацию аминокислот, которые не встречались бы в природе вместе без вмешательства человека. Например, рекомбинантная молекула белка может быть молекулой белка, которая состоит по меньшей мере из двух аминокислотных молекул, гетерологичных по отношению друг к другу, молекулой белка, которая содержит аминокислотную последовательность, которая отличается от аминокислотных последовательностей, существующих в природе, или молекулой белка, которая экспрессируется в клетке-хозяине в результате генетической трансформации клетки-хозяина или из-за редактирования генов генома клетки-хозяина. [0074] As used herein, the term "recombinant DNA molecule" is a DNA molecule containing a combination of DNA molecules that would not naturally occur together without human intervention. For example, a recombinant DNA molecule may be a DNA molecule that consists of at least two DNA molecules that are heterologous to each other, a DNA molecule that contains a DNA sequence that differs from naturally occurring DNA sequences, or a DNA molecule that that has been incorporated into the DNA of the host cell by genetic transformation or gene editing. Similarly, a "recombinant protein molecule" is a protein molecule containing a combination of amino acids that would not naturally occur together without human intervention. For example, a recombinant protein molecule may be a protein molecule that consists of at least two amino acid molecules that are heterologous to each other, a protein molecule that contains an amino acid sequence that differs from naturally occurring amino acid sequences, or a protein molecule that expressed in the host cell as a result of genetic transformation of the host cell or due to gene editing of the host cell's genome.
[0075] Иллюстративные рекомбинантные полинуклеотидные молекулы, предложенные в данном документе, включают в себя, но не ограничиваются лишь этими: SEQ ID NO: 7, SEQ ID NO: 9 и SEQ ID NO: 11, а также каждый из нуклеотидных сегментов, указанных в SEQ ID NO: 3 и SEQ ID NO: 5 и которые кодируют соответствующие полипептиды или белки, имеющие аминокислотную последовательность, как указано в SEQ ID NO: 2 (BCW oo1), SEQ ID NO: 4 (BCW 002), SEQ ID NO: 6 (BCW 003) и SEQ ID NO: 8, SEQ ID NO: 10 и SEQ ID NO: 12. Раскрытые в данном документе кодоны рекомбинантной полинуклеотидной молекулы, кодирующей белки, могут быть заменены синонимичными кодонами (также называемыми молчащей заменой). Также предложены рекомбинантные полинуклеотиды, кодирующие любой из белков-вариантов токсина BCW, описанных в данном документе.[0075] Illustrative recombinant polynucleotide molecules provided herein include, but are not limited to: SEQ ID NO: 7, SEQ ID NO: 9, and SEQ ID NO: 11, as well as each of the nucleotide segments listed in SEQ ID NO: 3 and SEQ ID NO: 5 and which encode the corresponding polypeptides or proteins having the amino acid sequence as indicated in SEQ ID NO: 2 (BCW oo1), SEQ ID NO: 4 (BCW 002), SEQ ID NO: 6 (BCW 003) and SEQ ID NO: 8, SEQ ID NO: 10, and SEQ ID NO: 12. The codons of a recombinant polynucleotide molecule encoding proteins disclosed herein may be replaced with synonymous codons (also referred to as silent substitution). Also provided are recombinant polynucleotides encoding any of the BCW toxin variant proteins described herein.
[0076] Конструкция рекомбинантной ДНК, содержащая последовательности, кодирующие токсичный белок BCW, может также дополнительно содержать область ДНК, которая кодирует один или большее количество агентов, ингибирующих насекомых, которые могут быть сконфигурированы для одновременной экспрессии или ко-экспрессии с последовательностью ДНК, кодирующей токсичный белок BCW, белка, отличающегося от токсичного белка BCW, ингибирующей насекомых молекулы дцРНК или инсектицидного химического соединения. Неограничивающими примерами инсектицидных химических соединений являются органохлориды, органофосфаты и карбаматы, пиретроиды, неоникотиноиды и рианоиды.[0076] A recombinant DNA construct containing sequences encoding a toxic BCW protein may also further comprise a DNA region that encodes one or more insect inhibitory agents that can be configured to co-express or co-express with a DNA sequence encoding a toxic a BCW protein, a protein other than a toxic BCW protein, an insect-inhibiting dsRNA molecule, or an insecticidal chemical. Non-limiting examples of insecticidal chemicals are organochlorides, organophosphates and carbamates, pyrethroids, neonicotinoids and ryanoids.
[0077] Конструкция рекомбинантной ДНК может быть собрана таким образом, что все белки или молекулы дцРНК экспрессируются одним промотором, или каждая молекула белка или дсРНК находится под контролем отдельного промотора или какой-либо их комбинацией. Раскрытые в данном документе белки могут быть экспрессированы из мультигенной системы экспрессии, в которой один или большее количество белков, описанных в данном документе, экспрессируются из общего нуклеотидного сегмента, который также содержит другие открытые рамки считывания и/или промоторы в зависимости от типа выбранной системы экспрессии. Например, бактериальная мультигенная система экспрессии может использовать один промотор для управления экспрессией множественно связанных/тандемных открытых рамок считывания из одного оперона. В другом примере, в растительной мультигенной системе экспрессии могут использоваться мультисвязанные экспрессионные кассеты, каждая из которых экспрессирует разный белок или разный агент, такой как одна или большее количество молекул дцРНК. В еще одном примере, в растительной мультигенной системе экспрессии могут использоваться мультинесвязанные экспрессионные кассеты, каждая из которых экспрессирует разный белок или разный агент, такой как одна или большее количество молекул дцРНК. Промотор для применения в описанной в данном документе рекомбинантной нуклеиновой кислоте может содержать полную последовательность промотора или любой его вариант или фрагмент, обладающий активностью промотора или активностью генной регуляции.[0077] The recombinant DNA construct can be assembled such that all proteins or dsRNA molecules are expressed by a single promoter, or each protein or dsRNA molecule is under the control of a single promoter or some combination thereof. The proteins disclosed herein may be expressed from a multigene expression system in which one or more of the proteins described herein are expressed from a common nucleotide segment that also contains other open reading frames and/or promoters depending on the type of expression system chosen. . For example, a bacterial multigene expression system may use a single promoter to drive the expression of multiple/tandem open reading frames from a single operon. In another example, multi-linked expression cassettes can be used in a plant multigene expression system, each expressing a different protein or different agent, such as one or more dsRNA molecules. In yet another example, a plant multigene expression system may use multi-unrelated expression cassettes, each expressing a different protein or different agent, such as one or more dsRNA molecules. A promoter for use in the recombinant nucleic acid described herein may comprise the entire sequence of the promoter, or any variant or fragment thereof having promoter activity or gene regulation activity.
[0078] Конструкция рекомбинантного полинуклеотида или рекомбинантной ДНК, содержащая последовательность, кодирующую токсичный белок BCW, может быть доставлена в клетки-хозяева векторами, например, плазмидой, бакуловирусом, искусственной хромосомой, вирионом, космидой, фагмидой, фагом или вирусным вектором. Такие векторы могут быть использованы для достижения стабильной или временной экспрессии последовательности, кодирующей токсичный белок BCW в клетке-хозяине, или последующей экспрессии в полипептид. Экзогенная конструкция рекомбинантного полинуклеотида или рекомбинантной ДНК, которая содержит последовательность, кодирующую токсичный белок BCW и которая вводится в клетку-хозяина, называется в данном документе «трансгеном».[0078] A recombinant polynucleotide or recombinant DNA construct containing a sequence encoding a toxic BCW protein can be delivered to host cells by vectors, e.g., plasmid, baculovirus, artificial chromosome, virion, cosmid, phagemid, phage, or viral vector. Such vectors can be used to achieve stable or transient expression of a sequence encoding a toxic BCW protein in a host cell, or subsequent expression into a polypeptide. An exogenous construct of a recombinant polynucleotide or recombinant DNA that contains a sequence encoding a toxic BCW protein and that is introduced into a host cell is referred to herein as a "transgene".
[0079] Также в данном документе предложены трансгенные бактерии, трансгенные клетки растений, трансгенные растения, грибы и дрожжи и части трансгенных растений, которые содержат любой рекомбинантный полинуклеотид, который экспрессирует любую одну или большее количество последовательностей, кодирующих токсичный белок BCW, предложенный в данном документе. Термин «бактериальная клетка» или «бактерия» может включать в себя, но не ограничивается клеткой Agrobacterium, Bacillus, Escherichia, Salmonella, Pseudomonas или Rhizobium. Термин «клетка растения» или «растение» могут включать в себя, но не ограничиваются лишь клеткой растения или растением: люцерны, банана, ячменя, фасоли, брокколи, капусты, капусты декоративной, моркови, маниоки, клещевины, цветной капусты, сельдерея, нута, китайской капусты, цитрусовых, кокосовой пальмы, кофе, кукурузы, клевера, хлопка, тыквенных, огурца, псевдотсуги Мензиса, баклажана, эвкалипта, лена, чеснока, винограда, хмеля, лука-порея, салата-латука, сосны ладанной, проса, дыни, ореха, овса, оливкового дерева, репчатого лука, декоративных растений, пальмовых, пастбищных трав, гороха, арахиса, перца, голубиного гороха, сосновых, картофеля, тополи, тыквы, сосны лучистой, редьки, рапса, риса, корневищ, ржи, дикого шафрана, кустарниковых, сорго, сосны южной, сои, шпината, тыквенных, клубники, сахарной свеклы, сахарного тростника, подсолнечника, кукурузы сахарной, амбрового дерева, батата, проса прутьевидного, чая, табака, помидора, тритикале, дерновой травы, арбуза и пшеницы. В некоторых вариантах осуществления, предложены трансгенные растения и части трансгенных растений, регенерированные из клетки трансгенного растения. В некоторых вариантах осуществления, трансгенные растения могут быть получены из трансгенного семени, путем размножения, разрезания, отламывания, измельчения или иным образом отсоединения части от растения. В некоторых вариантах осуществления, часть растения может быть семенем, коробочкой, листом, цветком, стеблем, корнем или любой их частью, или нерегенерируемым фрагментом части трансгенного растения. Как используется в данном контексте, «нерегенерируемая» часть трансгенной части растения представляет собой часть, которая не может быть стимулирована для образования целого растения, или которая не может быть стимулирована для образования целого растения, способного к половому и/или бесполому размножению. В некоторых вариантах осуществления, нерегенерируемая часть части растения представляет собой часть трансгенного семени, семенной коробочки, листка, цветка, стебля или корня. [0079] Also provided herein are transgenic bacteria, transgenic plant cells, transgenic plants, fungi and yeasts, and transgenic plant parts that contain any recombinant polynucleotide that expresses any one or more sequences encoding the toxic BCW protein provided herein. . The term "bacterial cell" or "bacteria" may include, but is not limited to, an Agrobacterium, Bacillus, Escherichia, Salmonella, Pseudomonas, or Rhizobium cell. The term "plant cell" or "plant" may include, but is not limited to, a plant cell or plant: alfalfa, banana, barley, beans, broccoli, cabbage, ornamental cabbage, carrots, cassava, castor beans, cauliflower, celery, chickpeas , Chinese cabbage, citrus, coconut, coffee, corn, clover, cotton, cucurbits, cucumber, Menzies pseudo-hemzies, eggplant, eucalyptus, flax, garlic, grapes, hops, leek, lettuce, frankincense pine, millet, melon , walnut, oats, olive tree, onion, ornamental plants, palm, pasture grasses, peas, peanuts, peppers, pigeon peas, pine, potatoes, poplars, pumpkins, radish pine, radish, rapeseed, rice, rhizomes, rye, wild saffron, shrubby, sorghum, southern pine, soybeans, spinach, cucurbits, strawberries, sugar beet, sugar cane, sunflower, sweet corn, amber, sweet potato, switchgrass, tea, tobacco, tomato, triticale, turfgrass, watermelon and wheat . In some embodiments, transgenic plants and transgenic plant parts regenerated from cells of the transgenic plant are provided. In some embodiments, transgenic plants can be obtained from transgenic seed by propagating, cutting, breaking off, chopping, or otherwise detaching a portion from the plant. In some embodiments, the plant part may be a seed, pod, leaf, flower, stem, root, or any part thereof, or a non-regenerated fragment of a part of a transgenic plant. As used herein, a "non-regenerating" portion of a transgenic plant part is a portion that cannot be stimulated to form a whole plant, or that cannot be stimulated to form a whole plant capable of sexual and/or asexual reproduction. In some embodiments, the non-regenerated portion of the plant part is a portion of a transgenic seed, pod, leaf, flower, stem, or root.
[0080] В данном документе также предложены способы получения трансгенных растений, которые содержат ингибирующее насекомых или чешуекрылых количество токсичного белка BCW. Такие растения могут быть получены путем введения рекомбинантного полинуклеотида, который кодирует любой из токсичных белков BCW, представленных в данном документе, в клетку растения, и отбор растения, полученного из указанной клетки растения, которое экспрессирует ингибирующее насекомых или чешуекрылых количество токсичного белка BCW. Растения могут быть получены из растительных клеток методами регенерации, способами трансформации семян, пыльцы или меристемы.[0080] This document also provides methods for producing transgenic plants that contain an insect or lepidoptera inhibitory amount of a toxic BCW protein. Such plants can be obtained by introducing a recombinant polynucleotide that encodes any of the toxic BCW proteins provided herein into a plant cell and selecting a plant derived from said plant cell that expresses an insect or lepidoptera inhibitory amount of the toxic BCW protein. Plants can be obtained from plant cells by regeneration methods, seed, pollen or meristem transformation methods.
[0081] Способы трансформации y растений известны в данной области техники. Например, Agrobacterium-опосредованная трансформация, описана в публикациях патентных заявок США № 2009/0138985A1 (соя), № 2008/0280361A1 (соя), № 2009/0142837A1 (кукуруза), № 2008/0282432 (хлопок), № 2008/0256667 (хлопок), № 2003/0110531 (пшеница), № 2001/0042257 A1 (сахарная свекла), патентах США № 5750871 (канола), № 7026528 (пшеница), и № 6365807 (рис), и в Arencibia et al. (1998) Transgenic Res. 7:213-222 (сахарный тросник).[0081] Methods for transforming y plants are known in the art. For example, Agrobacterium-mediated transformation is described in US Patent Application Publication No. 2009/0138985A1 (soybean), No. 2008/0280361A1 (soybean), No. 2009/0142837A1 (corn), No. 2008/0282432 (cotton), No. 2008/0256667 ( cotton), US Pat. No. 2003/0110531 (wheat), US Pat. No. 2001/0042257 A1 (sugar beet), US Pat. (1998) Transgenic Res. 7:213-222 (sugar cane).
[0082] В данном документе также предложено применение трансгенного растения, которое экспрессирует ингибирующее насекомых или чешуекрылых количество токсичного белка BCW, для борьбы с заражением насекомыми или чешуекрылыми. Любое из вышеупомянутых трансгенных растений может быть использовано в способах защиты растения от заражения насекомыми или чешуекрылыми, приведенными в данном документе. Способы получения трансгенных растений, которые экспрессируют активные против чешуекрылых белки, такие как белки Cry1A (патент США № 5880275), Cry1B (заявка на патент США № 10/525318), Cry1C (патент США № 6033874), Cry1F, химеры Cry1A/F (патенты США № 7070982; 6962705 и 6713063) и белок Cry2Ab (патент США № 7064249) являются хорошо охарактеризованными.[0082] This document also provides the use of a transgenic plant that expresses an insect or lepidopteran inhibitory amount of a toxic BCW protein to control insect or lepidoptera infestation. Any of the aforementioned transgenic plants can be used in the methods for protecting a plant from insect or lepidopteran infestation provided herein. Methods for obtaining transgenic plants that express proteins active against Lepidoptera, such as Cry1A (US patent No. 5880275), Cry1B (US patent application No. 10/525318), Cry1C (US patent No. 6033874), Cry1F proteins, Cry1A/F chimeras ( US Pat.
[0083] В данном документе также предложено применение любой из вышеупомянутых трансгенных клеток-хозяев для продуцирования токсичного белка BCW. [0083] This document also proposes the use of any of the above transgenic host cells for the production of toxic BCW protein.
[0084] Дополнительные аспекты изобретения включают в себя антитела и способы обнаружения полинуклеотидов, которые кодируют токсичные белки BCW, или способы различения их фрагментов и сегментов, способы идентификации дополнительных членов семейства белков, ингибирующих насекомых, готовые формы и способы контроля роста и/или заражения насекомыми, и также способы для предоставления такого контроля растениям и другим хозяевам-реципиентам.[0084] Additional aspects of the invention include antibodies and methods for detecting polynucleotides that encode for toxic BCW proteins, or methods for distinguishing fragments and segments thereof, methods for identifying additional members of the insect inhibitory protein family, formulations, and methods for controlling insect growth and/or infestation. , and also methods for providing such control to plants and other recipient hosts.
[0085] В некоторых вариантах осуществления, растительный продукт может включать в себя товарные или другие коммерческие продукты, полученные из трансгенного растения или части трансгенного растения, причем товарные или другие продукты могут отслеживаться по коммерческой деятельности путем обнаружения нуклеотидных сегментов, или экспрессированной РНК или белков, которые кодируют или содержат отличительные части токсичного белка BCW. Такие товарные или другие коммерческие продукты включают в себя, но не ограничиваются лишь этими: части растения, биомассу, масло, шрот, сахар, корм для животных, муку, хлопья, отруби, пух, обработанные семена и семена. [0085] In some embodiments, the plant product may include commercial or other commercial products derived from the transgenic plant or part of the transgenic plant, wherein the commercial or other products can be tracked commercially by detecting nucleotide segments, or expressed RNA or proteins, that encode or contain distinctive portions of the toxic BCW protein. Such commercial or other commercial products include, but are not limited to: plant parts, biomass, oil, meal, sugar, animal feed, flour, flakes, bran, fluff, processed seeds and seeds.
[0086] Также при этом предложены обработанные растительные продукты, причем указанный обработанный продукт содержит детектируемое количество рекомбинантного полинуклеотида, кодирующего токсичный белок BCW, его сегмент, его фрагмент, ингибирующий насекомых, или любую его отличительную часть. В некоторых вариантах осуществления, обработанный продукт выбирают из группы, состоящей из: растительной биомассы, масла, шрота, корма для животных, муки, хлопьев, отрубей, пуха, шелухи и обработанных семян. В некоторых вариантах осуществления, обработанный продукт является не регенерируемым.[0086] Also provided are processed plant products, said processed product containing a detectable amount of a recombinant polynucleotide encoding a toxic BCW protein, a segment thereof, an insect-inhibiting fragment thereof, or any distinctive portion thereof. In some embodiments, the processed product is selected from the group consisting of: vegetable biomass, oil, meal, animal feed, flour, flakes, bran, fluff, husks, and processed seeds. In some embodiments, the processed product is non-recyclable.
[0087] Также в данном документе предложены способы борьбы с насекомыми. В некоторых вариантах осуществления, заражение чешуекрылыми культурных растений является контролируемым. Такие способы могут включать в себя выращивание растения, содержащего ингибирующее насекомых или чешуекрылых количество токсичного белка BCW. В определенных вариантах осуществления, такие способы могут дополнительно включать в себя любое одно или большее количество из: (i) нанесения любой композиции, содержащей или кодирующей токсичный белок BCW, на растение или семя, которое дает растение; и/или (ii) трансформацию растения или растительной клетки, которая дает растение, полинуклеотидом, кодирующим токсичный белок BCW. В некоторых вариантах осуществления, растение представляет собой временно или стабильно трансформированное трансгенное растение, содержащее трансген, который экспрессирует ингибирующее насекомых или чешуекрылых количество токсичного белка BCW. В некоторых вариантах осуществления, растение представляет собой нетрансгенное растение, на которое была нанесена композиция, содержащая токсичный белок BCW. В некоторых вариантах осуществления таких способов, растение представляет собой растение кукурузы или сахарного тростника. В некоторых вариантах осуществления, вид Lepidoptera представляет собой Agrotis ipsilon. В некоторых вариантах осуществления, вид Lepidoptera представляет собой Diatraea saccharalis. В некоторых вариантах осуществления, вид Lepidoptera находится на поле с культурным растением.[0087] Also provided herein are methods for controlling insects. In some embodiments, Lepidoptera infestation of crop plants is controlled. Such methods may include growing a plant containing an insect or lepidoptera inhibitory amount of the toxic BCW protein. In certain embodiments, such methods may further include any one or more of: (i) applying any composition containing or encoding a toxic BCW protein to a plant or seed that produces a plant; and/or (ii) transforming a plant or plant cell that produces a plant with a polynucleotide encoding a toxic BCW protein. In some embodiments, the plant is a transiently or stably transformed transgenic plant containing a transgene that expresses an insect or lepidoptera inhibitory amount of the toxic BCW protein. In some embodiments, the plant is a non-transgenic plant that has been coated with a composition containing the toxic BCW protein. In some embodiments of such methods, the plant is a corn or sugarcane plant. In some embodiments, the Lepidoptera species is Agrotis ipsilon. In some embodiments, the Lepidoptera species is Diatraea saccharalis. In some embodiments, the Lepidoptera species is in a crop field.
[0088] Увеличение количества белков, раскрытых в данном документе, либо в растениях, либо с помощью технологического процесса, может включать в себя культивирование рекомбинантных Bt-клеток в условиях для экспрессии/продуцирования рекомбинантного полипептида/белков. Такой процесс может включать в себя получение путем высушивания, лиофилизации, гомогенизации, экстракции, фильтрации, центрифугирования, седиментации или концентрирования культуры рекомбинантных Bt-клеток, экспрессирующих/продуцирующих указанный рекомбинантный полипептид. Такой процесс может привести к получению Bt-клеточного экстракта, клеточной суспензии, гомогената клеток, лизата клеток, супернатанта клеток, фильтрата клеток или осадка клеток. Получая рекомбинантные полипептиды/белки, произведенные таким образом, композиция, которая содержит рекомбинантные полипептиды/белки, может содержать бактериальные клетки, бактериальные споры и параспоральные внутриклеточные тельца, и может быть приготовлена для различных применений, включая распыляемые сельскохозяйственные продукты, ингибирующие насекомых, или в виде готовых форм, подавляющих насекомых в пищевых биоанализах.[0088] Increasing the amount of proteins disclosed herein, either in plants or by a process, may include culturing recombinant Bt cells under conditions to express/produce the recombinant polypeptide/proteins. Such a process may include obtaining by drying, lyophilization, homogenization, extraction, filtration, centrifugation, sedimentation or concentration of a culture of recombinant Bt cells expressing/producing the specified recombinant polypeptide. Such a process may result in a Bt cell extract, cell suspension, cell homogenate, cell lysate, cell supernatant, cell filtrate, or cell pellet. By obtaining recombinant polypeptides/proteins thus produced, a composition that contains recombinant polypeptides/proteins may contain bacterial cells, bacterial spores and parasporal intracellular bodies, and can be prepared for various applications, including insect-inhibiting sprayable agricultural products, or in the form formulations that suppress insects in food bioassays.
[0089] В одном варианте осуществления, композиция/готовая форма, ингибирующая насекомых, содержащая раскрытый рекомбинантный полипептид/белок, может дополнительно содержать, по меньшей мере, один дополнительный полипептид, который проявляет ингибирующую активность в отношении тех же видов чешуекрылых насекомых, но отличается от рекомбинантного полипептида, чтобы обеспечить уменьшение количества случаев появления устойчивости у чешуекрылых насекомых к токсичному белку BCW или другой композиции, ингибирующей чешуекрылых. Такой полипептид выбран из группы, состоящей из белка, ингибирующего насекомых, молекулы дцРНК, ингибирующей насекомых, и химического соединения. Один пример использования таких рибонуклеотидных последовательностей для борьбы с насекомыми-вредителями описан в публикации заявки на патент США № 2006/0021087. Примеры других таких композиций включают в себя, но не ограничиваются лишь этими: Cry1A (патент США № 5880275), Cry1Ab, Cry1Ac, Cry1Ae, Cry1B (заявка на патент США № 10/525318), Cry1C (патент США № 6033874), Cry1E, Cry1F и химеры Cry1A/F (патенты США № 7070982; № 6962705 и № 6713063), Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry2A, Cry2Ab (патент США № 7064249), Cry2Ae, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry43A, Cry43B, ET35, ET66, TIC400, TIC800, TIC807, TIC834, TIC853 и TIC1415. Другими неограничивающими примерами являются активные против чешуекрылых белки VIP, Axmi и DIG, такие как, но не ограниченные Vip3A, VIP3Ab, AXMI-184, AXMI-196, DIG-3, DIG-4, DIG-5 и DIG-11, которые могут быть скомбинированы с белками, описанными в данном документе.[0089] In one embodiment, the insect-inhibiting composition/formulation comprising the disclosed recombinant polypeptide/protein may further comprise at least one additional polypeptide that exhibits inhibitory activity against the same Lepidoptera insect species, but differs from a recombinant polypeptide to reduce the occurrence of resistance in Lepidoptera insects to the toxic BCW protein or other Lepidoptera-inhibiting composition. Such a polypeptide is selected from the group consisting of an insect-inhibiting protein, an insect-inhibiting dsRNA molecule, and a chemical compound. One example of the use of such ribonucleotide sequences for insect pest control is described in US Patent Application Publication No. 2006/0021087. Examples of other such compositions include, but are not limited to: Cry1A (US patent No. 5880275), Cry1Ab, Cry1Ac, Cry1Ae, Cry1B (US patent application No. 10/525318), Cry1C (US patent No. 6033874), Cry1E, Cry1F and Cry1A/F chimeras (US Pat. No. 7070982; No. 6962705 and No. 6713063), Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry2A, Cry2Ab (US Pat. No. 7064249), Cry2Ae, Cry4B, Cry6, Cry7, Cry8 , Cry9, Cry15, Cry43A, Cry43B, ET35, ET66, TIC400, TIC800, TIC807, TIC834, TIC853 and TIC1415. Other non-limiting examples are VIP, Axmi and DIG active against Lepidoptera, such as but not limited to Vip3A, VIP3Ab, AXMI-184, AXMI-196, DIG-3, DIG-4, DIG-5 and DIG-11, which can be combined with the proteins described in this document.
[0090] В других вариантах осуществления, такая композиция может дополнительно содержать, по меньшей мере, один дополнительный полипептид, который проявляет ингибирующую по отношению к насекомому активность, которое не подавляется другим токсичным белком BCW, ингибирующим насекомых, для расширения спектра полученного ингибирования насекомых. Например, для борьбы с жесткокрылыми насекомыми-вредителями можно использовать комбинации токсичных белков BCW, ингибирующих насекомых, с белками, активными против жесткокрылых, такими как, но не ограничиваясь лишь этими: варианты Cry1C, варианты Cry3A, Cry3Bb (патент США № 6501009), Cry34/35, 5307, Axmi184, Axmi205, AxmiR1, TIC407, TIC417, TIC431, TIC901, TIC1201, TIC3131, DIG-10 и eHIP (публикация заявки на патент США № 2010/0017914).[0090] In other embodiments, such a composition may further comprise at least one additional polypeptide that exhibits insect inhibitory activity that is not inhibited by another toxic insect inhibitory BCW protein to broaden the insect inhibition spectrum obtained. For example, combinations of insect-inhibiting toxic BCW proteins with beetle-active proteins such as, but not limited to, Cry1C variants, Cry3A variants, Cry3Bb (US Pat. No. 6,501,009), Cry34 can be used to control beetle insect pests. /35, 5307, Axmi184, Axmi205, AxmiR1, TIC407, TIC417, TIC431, TIC901, TIC1201, TIC3131, DIG-10, and eHIP (U.S. Patent Application Publication No. 2010/0017914).
[0091] В данной области техники была задокументирована возможность насекомых развивать устойчивость к определенным инсектицидам. Одна из стратегий контроля устойчивости насекомых заключается в использовании трансгенных культур, которые экспрессируют два различных агента, ингибирующих насекомых, которые имеют различные способы действия. Следовательно, любое насекомое, обладающее устойчивостью к одному из агентов, ингибирующих насекомых, может контролироваться другим агентом, ингибирующим насекомых. Другая стратегия контроля устойчивости насекомых предусматривает использование растений, которые не защищены от видов чешуекрылых вредителей, чтобы создать для них экологическое убежище. Один конкретный пример описан в патенте США № 6551962. [0091] The ability of insects to develop resistance to certain insecticides has been documented in the art. One strategy for controlling insect resistance is to use transgenic crops that express two different insect inhibitory agents that have different modes of action. Therefore, any insect that is resistant to one of the insect inhibitory agents can be controlled by the other insect inhibitory agent. Another insect resistance control strategy involves using plants that are not immune to Lepidoptera pest species to create an ecological refuge for them. One specific example is described in US Pat. No. 6,551,962.
[0092] Другие варианты осуществления, раскрытые в данном документе, включают в себя пестицидные химические соединения местного применения, которые предназначены для борьбы с вредителями, которых также контролируют с помощью белков, раскрытых в данном документе, для использования с белками при обработке семян, распылении, поливе, или орошение готовыми формами, которые можно непосредственно вносить в почву (почвенное орошение), применяемые к выращиваемым растениям, экспрессирующим белки, раскрытые в данном документе, или приготовленные для применения к семенам, содержащим один или большее количество трансгенов, кодирующих один или большее количество раскрытых белков. Такие готовые формы для применения при обработке семян можно наносить с различными клеящими веществами и веществами для повышения клейкости, известными в данной области техники. Такие готовые формы могут содержать пестициды, которые являются синергетическими по СД с раскрытыми белками, так что готовая форма пестицидов имеет отличающийся СД для борьбы с теми же или аналогичными вредителями, которые могут контролироваться раскрытыми белками, или так, что действие таких пестицидов контролирует более широкий диапазон хозяев-вредителей, таких как виды чешуекрылых или полужесткокрылых (Hemiptera), или другие виды вредителей растений, такие как виды жесткокрылых (Coleoptera), которые не контролируются эффективно. [0092] Other embodiments disclosed herein include topical pesticidal chemicals that are designed to control pests that are also controlled by the proteins disclosed herein, for use with proteins in seed treatment, spraying, irrigated, or irrigated with formulations that can be applied directly to the soil (soil irrigation) applied to cultivated plants expressing the proteins disclosed herein, or prepared for application to seeds containing one or more transgenes encoding one or more open proteins. Such formulations for use in seed treatment can be applied with various adhesives and tackifiers known in the art. Such formulations may contain pesticides that are synergistic in RD with the disclosed proteins, such that the pesticide formulation has a different RD for controlling the same or similar pests that may be controlled by the disclosed proteins, or such that the effects of such pesticides control a wider range of pest hosts such as Lepidoptera or Hemiptera species (Hemiptera) or other plant pest species such as Coleoptera species (Coleoptera) that are not effectively controlled.
[0093] Вышеупомянутая композиция/готовая форма может дополнительно содержать приемлемый с точки зрения сельского хозяйства носитель, такой как приманка, порошок, пыль, пеллеты, гранулы, спрей, эмульсия, коллоидная суспензия, водный раствор, препарат спор/кристаллов Bacillus, удобрение семян, рекомбинантная растительная клетка/растительная ткань/семя/растение, трансформированные для экспрессии одного или большего количества белков, или бактерия, трансформированная для экспрессии одного или большего количества белков. В зависимости от уровня ингибирования насекомых или инсектицидного ингибирования, присущего рекомбинантному полипептиду, и активности готовой формы, которая будет применяться в растительных или пищевых биоанализах, композиция/готовая форма может содержать различные массовые количества рекомбинантного полипептида, например, от 0,0001% до 0,001%, до 0,01%, до 1%, до 99% по массе рекомбинантного полипептида.[0093] The above composition/formulation may further comprise an agriculturally acceptable carrier such as bait, powder, dust, pellets, granules, spray, emulsion, colloidal suspension, aqueous solution, Bacillus spore/crystal preparation, seed fertilizer, a recombinant plant cell/plant tissue/seed/plant transformed to express one or more proteins, or a bacterium transformed to express one or more proteins. Depending on the level of insect inhibition or insecticidal inhibition inherent in the recombinant polypeptide and the activity of the formulation to be used in plant or food bioassays, the composition/formulation may contain varying weight amounts of the recombinant polypeptide, for example, from 0.0001% to 0.001% , up to 0.01%, up to 1%, up to 99% by weight of the recombinant polypeptide.
[0094] Раскрытые в данном документе белки можно комбинировать в готовых формах для местного применения к покровам растений, к почве, в готовых формах для обработки семян и в готовых формах с другими агентами, токсичными для в целевых видов чешуекрылых-вредителей. Такие агенты включают в себя, но не ограничиваются лишь этими: белки Cry1A, химеры Cry1B, Cry1C, Cry1F, Cry1A/F и белок Cry2Ab. [0094] The proteins disclosed herein can be combined in formulations for topical application to plant canopy, in soil, in formulations for seed treatment, and in formulations with other agents toxic to the target lepidoptera pest species. Such agents include, but are not limited to, Cry1A proteins, Cry1B, Cry1C, Cry1F, Cry1A/F chimeras, and Cry2Ab protein.
ПРИМЕРЫEXAMPLES
[0095] Следующие раскрытые варианты осуществления просто представляют изобретение, которое может быть воплощено в различных формах. Таким образом, конкретные структурные и функциональные детали, раскрытые в данном документе, не должны интерпретироваться как ограничивающие. Следует понимать, что полное раскрытие каждого источника, цитируемого в данном документе, включено в данный документ посредством ссылки.[0095] The following disclosed embodiments simply represent the invention, which may be embodied in various forms. Thus, the specific structural and functional details disclosed herein should not be interpreted as limiting. It is to be understood that the full disclosure of each source cited herein is incorporated herein by reference.
Пример 1Example 1
[0096] Данный пример описывает открытие и анализ токсичного белка BCW 001 и конструирование химерных токсинов BCW 002 и BCW 003.[0096] This example describes the discovery and analysis of the
[0097] Было установлено, что штамм EG4384 Bt обладает активностью против чешуекрылых в пищевых биоанализах с использованием препаратов спор с кристаллами. Была получена последовательность генома данного штамма, были обработаны сырые считанные последовательности, собраны контиги из обработанных считанных последовательностей, идентифицированы открытые рамки считывания, которые показали гомологию с белками Cry1, и проанализированы полученные аминокислотные последовательности. Была идентифицирована конкретная открытая рамка считывания, как указано в SEQ ID NO: 1, которая кодирует полученную аминокислотную последовательность белка (BCW 001, SEQ ID NO: 2), которая демонстрирует новую аминокислотную последовательность по сравнению с большинством белков Cry1, известных в данной области техники. Полученный белок из открытой рамки считывания обладает всеми характеристиками нового белка типа Cry1, поскольку он имеет длину 1180 аминокислот, а выравнивание с известными белкам Cry1 указывает на то, что данный белок имеет характерную трехдоменную структуру в пределах примерно 600-630 аминоконцевых аминокислот и характерную структуру аминокислотной последовательности протоксина типа Cry1A. Полинуклеотидная последовательность, кодирующая эту предсказанную аминокислотную последовательность, содержит открытую рамку считывания, которая также является характерной для Cry1, а именно есть сайт рестрикции NheI внутри сегмента ДНК, кодирующего C-концевую область предсказанного домена I токсина, и сайт рестрикции KpnI в пределах сегмента ДНК, кодирующего N-концевую часть предсказанного прототоксинового домена. [0097] Bt strain EG4384 was found to have activity against Lepidoptera in food bioassays using crystal spore preparations. The genome sequence of this strain was obtained, raw read sequences were processed, contigs were assembled from the processed read sequences, open reading frames were identified that showed homology with Cry1 proteins, and the resulting amino acid sequences were analyzed. A particular open reading frame has been identified as set forth in SEQ ID NO: 1 that encodes a derived protein amino acid sequence (
[0098] Сравнение аминокислотной последовательности токсина BCW 001 с Cry1Ac показывает, что аминокислотный сегмент, соответствующий домену I (аминокислоты от около позиции 1 до около позиции 258), демонстрирует только около 67% идентичности такому же сегменту в Cry1Ac, аминокислотный сегмент, соответствующий домену II (аминокислоты от около позиции 58 до около позиции 460), демонстрирует очень низкий процент идентичности с таким же сегментом в Cry1Ac, а аминокислотный сегмент, соответствующий домену III (аминокислоты от около позиции 460 до около позиции 607) демонстрирует около 63% идентичности с сегментом домена III из Cry1Ah2. [0098] Comparison of the amino acid sequence of
[0099] Сегмент ДНК, кодирующий по существу предсказанные домены II и III, был вырезан по сайтам рестрикции от NheI до KpnI, и заменен на соответствующий сегмент кодирующей последовательности Cry1Ac в векторе экспрессии, содержащем сегмент ДНК, кодирующий Cry1Ac, что дало открытую рамку считывания состоящую из, и соединение по рамке считывания в последовательном порядке от 5`конца до 3`конца, первого сегмента, кодирующего домен I Cry1Ac, второго сегмента, кодирующего домен II и III BCW 001, и третьего сегмента, кодирующего прототоксиновый домен токсичного белка Cry1Ac. Данная химерная конструкция (SEQ ID NO: 3) кодирует химерный токсичный белок, обозначенный в данном документе как BCW 002 (SEQ ID NO: 4). Незначительное смещение точки разрыва между доменом I и доменом II дает открытую рамку считывания (SEQ ID NO: 5), кодирующую химерный токсичный белок, называемый в данном документе BCW 003 (SEQ ID NO: 6), имеющий аминокислотную последовательность, отличающуюся от BCW002 только по аминокислотной позиции 259. BCW 003, как и BCW 001, содержит треонин (T) в позиции 259, а BCW 002 содержит изолейцин (I) в данной позиции. BCW 001 отличается от BCW 002 и BCW 003, главным образом, в домене I токсина, то есть по аминокислотам 1-202, а BCW 002 и BCW 002 практически идентичны, за исключением разницы I/T в позиции 259. [0099] The DNA segment encoding substantially the predicted domains II and III was excised at the restriction sites NheI to KpnI, and replaced with the corresponding segment of the Cry1Ac coding sequence in an expression vector containing the DNA segment encoding Cry1Ac, resulting in an open reading frame of from, and in-frame connection in sequential order from 5' end to 3' end, the first segment encoding domain I of Cry1Ac, the second segment encoding domain II and III of
Пример 2Example 2
[00100] Этот пример показывает эффективность биологической активности белков BCW 001, 002 и 003 для контроля чешуекрылых вредителей.[00100] This example demonstrates the effectiveness of the biological activity of the
[00101] Трансформация конструкций, экспрессирующих токсичные белки BCW 001, 002 и 003, в E. coli или в применимые Bacillus thuringiensis или другие Bacilli, позволила провести тестирование экспрессированных белков в биоанализе и сравнить с белками, известными в данной области техники, как токсичные для совки-ипсилон, такими как Cry1Fa и Cry1Ac. Наблюдалось, что полученные рекомбинантные штаммы экспрессируют рекомбинантный белок с активностью против чешуекрылых вредителей. Активность в биоанализе была особенно сильной при тестировании против личинок совки-ипсилон (Agrotis ipsilon) и Helicoverpa zea. Как указано выше в ПОДРОБНОМ ОПИСАНИИ СУЩНОСТИ ИЗОБРЕТЕНИЯ, УРОВНЕ ТЕХНИКИ и КРАТКОМ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ, было обнаружено очень мало токсичных белков, которые проявляют какой-либо заметный уровень биологической активности против совки-ипсилон, и поэтому в данной области техники существует потребность в идентификации таких белков для использования в растениях, для защиты таких растений от заражения совкой-ипсилон, и для того, чтобы убедится, что существует достаточный запас дополнительных активных против совки-ипсилон белков, доступных для преодоления любого развития устойчивости к любым таким активным против совки-ипсилон белкам, которые используются в данное время, таким как токсичные белки Cry1Fa.[00101] Transformation of constructs expressing the
Пример 3Example 3
[00102] В данном примере показано, что домены II и III BCW 001 являются достаточными для передачи биологической активности против совки-ипсилон другим токсичным белкам Cry1, когда такие домены заменяют соответствующие домены в таких других токсинах Cry1. [00102] This example demonstrates that
[00103] Были идентифицированы многие химерные токсины BCW, обладающие активностью против чешуекрылых, в частности, две химеры проявляли сильную активность против BCW, WBC и SCB.[00103] Many chimeric BCW toxins have been identified with activity against Lepidoptera, in particular two chimeras showed strong activity against BCW, WBC and SCB.
[00104] Конструкции с нуклеотидными последовательностями, кодирующими Cry1Ab, Cry1Ac и Cry1Ca, использовали для конструирования химер, содержащих сегменты домена II и домена III BCW 001, заменяющие соответствующие домены Cry1Ab, Cry1Ac и Cry1Ca, и полученные нативные и химерные белки тестировали в биоанализах с кристаллами спор. Активности против BCW, FAW и CEW в таких пищевых биоанализах были сведены в таблицу. В экспериментальных условиях тестирования, Cry1Ac проявлял активность против FAW, BCW и CEW, Cry1Ab проявлял активность против FAW и CEW, но не против BCW, а Cry1Ca не проявлял активности против FAW, BCW, а также CEW. BCW 001 проявлял активность против BCW и CEW, но не FAW. По сравнению с BCW 003, активность Cry1Ac против BCW была примерно в десять раз меньше у Cry1Ac. Cry1Ab и Cry1Ac, химеры, содержащие домены II и III BCW 001, проявляли токсические свойства при тестировании в биоанализах против FAW, BCW и CEW. Cry1Ac не был токсичным против CEW, а Cry1Ab не был токсичным против BCW. Были сконструированы химеры Cry1Ca/BCW 001, в которых домен III Cry1Ca был заменен соответствующим доменом BCW 001, и полученный химерный токсин проявлял токсические свойства против FAW, BCW и CEW, тогда как токсин Cry1Ca был неэффективен при тестировании против любого из этих вредителей.[00104] Constructs with nucleotide sequences encoding Cry1Ab, Cry1Ac, and Cry1Ca were used to construct
Пример 4Example 4
[00105] Этот пример иллюстрирует токсические свойства BCW 001, 002 и 003 при тестировании в биоанализе против разнообразных чешуекрылых-вредителей.[00105] This example illustrates the toxic properties of
[00106] Протоколы для биоанализа и подсчета смертности и задержки роста насекомых известны в данной области техники, примеры которых описаны в публикации заявки на патент РСТ № WO 2012/139004 и в патенте США № 7927598.[00106] Protocols for bioanalysis and scoring of insect mortality and stunting are known in the art, examples of which are described in PCT Patent Application Publication No. WO 2012/139004 and US Pat. No. 7,927,598.
[00107] На Фиг. 1 соотносятся различные токсичные белки BCW 001, 002 и 003 по пестицидной активности к видам насекомых в пищевых биоанализах. Каждый из данных токсичных белков продемонстрировал активность против чешуекрылых насекомых.[00107] In FIG. 1 correlates various
Пример 5Example 5
[00108] В этом примере описывается конструирование искусственных последовательностей, кодирующих белки согласно данному изобретению для использования в растениях, приготовление растительных векторов и конструкций для использования в растениях, и получение растений, экспрессирующих белки согласно данному изобретению.[00108] This example describes the construction of artificial sequences encoding the proteins of this invention for use in plants, the preparation of plant vectors and constructs for use in plants, and the production of plants expressing the proteins of this invention.
[00109] Нуклеотидные последовательности, кодирующие белок BCW 001 (SEQ ID NO: 1), белок BCW 002 (SEQ ID NO: 3) и белок BCW 003 (SEQ ID NO: 5), были сконструированы и синтезированы в соответствии со способами, описанными в патенте США 5500365. Эти сконструированные кодирующие области, предназначенные для экспрессии в растениях, представлены в данном документе как SEQ ID NO: 7, кодирующая BCW 001, SEQ ID NO: 9, кодирующая BCW 002, и SEQ ID NO: 11, кодирующая BCW 003.[00109] Nucleotide
[00110] Разнообразные кассеты для экспрессии в растениях конструировали с последовательностями, указанными в SEQ ID NO: 7, 9 и 11. Такие кассеты экспрессии полезны для временной экспрессии в протопластах растений или для трансформации растительных клеток. Типичные экспрессионные кассеты были сконструированы с учетом возможного размещения белка в клетке. Один набор кассет экспрессии был сконструирован таким образом, чтобы позволить белку транслироваться и оставаться в цитозоле. Другой набор кассет экспрессии был сконструирован так, чтобы иметь транзитный пептид, смежный с токсичным белком, чтобы обеспечить нацеливание на органеллу клетки, такую как хлоропласт или пластид. Все кассеты экспрессии были сконструированы так, чтобы начинаться с 5'-конца промотором, который может состоять из нескольких промоторных элементов и энхансерных элементов, смежно связанных для усиления экспрессии трансгена. За промоторной последовательностью обычно следовали смежно одна или несколько лидерных последовательностей в 3' к промотору. Последовательность интрона была размещена в 3' к лидерной последовательности для улучшения экспрессии трансгена. Кодирующая последовательность токсина или транзитного пептида, и кодирующая последовательность токсина были расположены в 3' по отношению к промотору, лидерной последовательности и интрону. Определенная последовательность была размещена в 3' к кодирующей последовательности для облегчения терминации транскрипции и обеспечивает последовательности, важные для полиаденилирования полученного транскрипта. Все элементы, описанные выше, были расположены смежно, часто с дополнительной последовательностью, предусмотренной для конструирования экспрессионной кассеты, такой как сайты рестрикции эндонуклеаз или сайты безлигазного клонирования.[00110] A variety of plant expression cassettes were constructed with the sequences set forth in SEQ ID NOs: 7, 9, and 11. Such expression cassettes are useful for transient expression in plant protoplasts or for plant cell transformation. Exemplary expression cassettes have been designed to accommodate the possible placement of the protein in the cell. One set of expression cassettes was designed to allow the protein to be translated and remain in the cytosol. Another set of expression cassettes was designed to have a transit peptide adjacent to a toxic protein to allow targeting of a cell organelle such as a chloroplast or plastid. All expression cassettes were designed to start at the 5' end with a promoter, which may consist of several promoter elements and enhancer elements contiguously linked to enhance expression of the transgene. The promoter sequence was typically followed contiguous by one or more leader sequences 3' to the promoter. The intron sequence was placed 3' to the leader sequence to improve transgene expression. The coding sequence for the toxin or transit peptide and the coding sequence for the toxin were located 3' to the promoter, leader and intron. A specific sequence has been placed 3' to the coding sequence to facilitate termination of transcription and provides sequences important for polyadenylation of the resulting transcript. All of the elements described above were contiguous, often with additional sequence provided to construct the expression cassette, such as endonuclease restriction sites or non-ligase cloning sites.
[00111] Для растений кукурузы был разработан набор кассет экспрессии для цитозольной экспрессии BCW 001, содержащий промотор убиквитина 1 Mexicana, BCW 002, содержащий промотор актина 15 Orysza sativa или промотор 35S, и BCW 003, содержащий промотор 35S. [00111] For maize plants, a set of expression cassettes for
[00112] Другой набор кассет экспрессии был разработан для целевой экспрессии в растениях кукурузы токсичных для насекомых белков BCW 002 и BCW 003, в которых последовательность, кодирующая пептид хлоропласта (например, CTP2), была слита по рамке считывания на 5'-конце ДНК сегмента, кодирующего токсичные белки BCW, содержащие промотор актина 15 Orysza sativa или промотор 35S, и последовательность, содержащую промотор 35S.[00112] Another set of expression cassettes was designed to target the expression in maize plants of the insect-
[00113] Кассеты для экспрессии в растениях сахарного тростника, содержащие промотор CaMV 35S или промотор PClSV.FLt, функционально связанный с промотором 35S, конструировали в виде векторов трансформации растений. В некоторых случаях, была включена кассета, экспрессирующая нацеленный на хлоропласты Cry2Ab. [00113] Sugar cane expression cassettes containing the CaMV 35S promoter or the PClSV.FLt promoter operably linked to the 35S promoter were constructed as plant transformation vectors. In some cases, a chloroplast-targeted Cry2Ab expression cassette was included.
[00114] Растения, экспрессирующие белки согласно данному изобретению, тестировали против личинок BCW, WBC, CEW, SWC и SCB третьей линьки. Кассета экспрессии в цитозоле для BCW 001, и нацеленная на цитозоль и пластиды кассета экспрессии для BCW 002 и BCW 003 были клонированы и использовались для получения трансгенных кукурузных растений, экспрессирующих данные белки. Трансформированные клетки индуцировали для формирования растений способами, известными в данной области техники. Биоанализ с использованием дисков листьев растений проводили аналогично тому, как описано в патенте США № 8344207. Степени повреждения листа (LDR) присваивалась оценка, основанная на проценте диска листа, съеденного насекомым, по шкале от 0 (съедено 0%) до 11 (съедено более 50%). Шаг оценки степени увеличивается на 5%. Изогенную линию кукурузы использовали для получения ткани в качестве отрицательного контроля, и результаты оценивали. Как экспрессия в пластидах-мишенях, так и цитозольная экспрессия токсичных для насекомых белков BCW 002 и BCW 003 снижали повреждение при питании по сравнению с нетрансформированным контролем. Результаты анализов дисков из листьев в отношение этих насекомых согласуются с данными биоанализа из примеров, представленных выше. Одна конструкция, содержащая кассету BCW 003 для цитозольной экспрессии, дала 34 трансформанта, 25 из них продемонстрировали полный контроль над личинками BCW. Растения кукурузы, экспрессирующие BCW 001 и BCW 003 в цитозоле, также тестировали на CEW, SWC и FAW. Растения, экспрессирующие BCW 003, демонстрировали 100% контроль CEW и SWC, и значения LDR в диапазоне от 1 до 2. Три трансформанта, экспрессирующие BCW 001, дали растения, проявляющие эффективность в отношении CEW и SWC, и значения LDR в диапазоне от 1 до 3. Это согласуется с данными пищевого биоанализа, представленными в предыдущих примерах.[00114] Plants expressing the proteins of this invention were tested against third molt BCW, WBC, CEW, SWC and SCB larvae. The cytosol expression cassette for
[00115] Трансгенные растения сахарного тростника, экспрессирующие BCW 003, были получены и испытаны против SCB в биоанализах. Каждый биоанализ включал в себя диски листьев из сахарного тростника дикого типа в качестве отрицательного контроля, и из положительного контроля, экспрессирующего высокие уровни Cry2Ab. Смертность насекомых и повреждение листьев измеряли через четыре (4) дня после заражения. Было обнаружено, что диски листьев нескольких трансформантов сахарного тростника, экспрессирующих BCW 003, демонстрируют контроль Diatraea saccharalis (sugarcane borer) in planta и имеют степень повреждения ниже 2, аналогично положительному контролю и средней смертности насекомых 90-100%. [00115] Transgenic sugar cane
[00116] Трансформанты, экспрессирующие BCW 003 и Cry2Ab, демонстрировали лучший контроль SCB по сравнению с трансформантами, которые экспрессировали только BCW 003.[00116]
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ SEQUENCE LIST
<110> Monsanto Technology LLC<110> Monsanto Technology LLC
<120> ПЕСТИЦИДНЫЕ БЕЛКОВЫЕ ТОКСИНЫ, АКТИВНЫЕ В ОТНОШЕНИИ<120> PESTICIDAL PROTEIN TOXINS ACTIVE AGAINST
ЧЕШУЕКРЫЛЫХ НАСЕКОМЫХ Lepidoptera
<130> MONS:434WO<130> MONS:434WO
<150> US 62/445,313<150> US 62/445,313
<151> 2017-01-12<151> 2017-01-12
<160> 12 <160> 12
<170> Версия PatentIn 3.5<170> PatentIn version 3.5
<210> 1<210> 1
<211> 3543<211> 3543
<212> ДНК<212> DNA
<213> Bacillus thuringiensis<213> Bacillus thuringiensis
<220><220>
<221> CDS<221> CDS
<222> (1)..(3540)<222> (1)..(3540)
<400> 1<400> 1
atg gag gaa aat aat cag aat caa tgc gtc cct tat aat tgt ttg aat 48atg gag gaa aat aat cag aat caa tgc gtc cct tat aat tgt ttg aat 48
Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn
1 5 10 15 1 5 10 15
aat cct gca atc gaa ata tta gaa gga gac aga ata tca gtt ggt aac 96aat cct gca atc gaa ata tta gaa gga gac aga ata tca gtt ggt aac 96
Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn
20 25 30 20 25 30
act cca atc gat att tct cta tca ctt gtg gaa ctt ctt att agt gaa 144act cca atc gat att tct cta tca ctt gtg gaa ctt ctt att agt gaa 144
Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu
35 40 45 35 40 45
ttt gtc cca ggc ggt gga ata ata aca gga ttg ttg aac ata gta tgg 192ttt gtc cca ggc ggt gga ata ata aca gga ttg ttg aac ata gta tgg 192
Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp
50 55 60 50 55 60
gga ttt gta ggg cct tcc caa tgg gac gca ttt ctt gct caa gtg gaa 240gga ttt gta ggg cct tcc caa tgg gac gca ttt ctt gct
Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu
65 70 75 80 65 70 75 80
cag tta att aac caa agg ata tca gaa gct gta aga aat aca gca att 288cag tta att aac caa agg ata tca gaa gct gta aga aat aca gca att 288
Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile
85 90 95 85 90 95
cag gaa tta gag gga atg gcg cgg gtt tat aga acc tat gct act gct 336cag gaa tta gag gga atg gcg cgg gtt tat aga acc tat gct act gct 336
Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala
100 105 110 100 105 110
ttt gct gag tgg gaa aga gat cct aat aac aca gat cta aga gaa gca 384ttt gct gag tgg gaa aga gat cct aat aac aca gat cta aga gaa gca 384
Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala
115 120 125 115 120 125
gta cgg aca cag ttt aca gca act gag act tat atc agt gga aga ata 432gta cgg aca cag ttt aca gca act gag act tat atc agt gga aga ata 432
Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile
130 135 140 130 135 140
tct gtt tta aaa att caa aat ttt gaa gtg cag ctg tta tcg gtg ttt 480tct gtt tta aaa att caa aat ttt gaa gtg cag ctg tta tcg gtg ttt 480
Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe
145 150 155 160 145 150 155 160
gcc caa gct gcc aat tta cat tta tct tta tta aga gac gtt gtg ttt 528gcc caa gct gcc aat tta cat tta tct tta tta aga gac gtt gtg ttt 528
Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe
165 170 175 165 170 175
ttt ggg caa aga tgg ggg ttt tca acg aca acc gta aat aat tac tac 576ttt ggg caa aga tgg ggg ttt tca acg aca acc gta aat aat tac tac 576
Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr
180 185 190 180 185 190
aat gat tta aca gaa gag att agt acc tat aca gat tat gca gta cgc 624aat gat tta aca gaa gag att agt acc tat aca gat tat gca gta cgc 624
Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg
195 200 205 195 200 205
tgg tac aat acg gga tta gag cgt gta tgg gga ccg gat tct aga gat 672tgg tac aat acg gga tta gag cgt gta tgg gga ccg gat tct aga gat 672
Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp
210 215 220 210 215 220
tgg gta agg tat aat caa ttt aga aga gag cta aca ctt act gta tta 720tgg gta agg tat aat caa ttt aga aga gag cta aca ctt act gta
Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240 225 230 235 240
gat atc gtt gct cta ttc cca aat tat gat agt cga agg tat cca att 768gat atc gtt gct cta ttc cca aat tat gat agt cga agg tat cca att 768
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile
245 250 255 245 250 255
cga aca gtt tcc caa tta aca aga gaa att tat acg aac cca gta tta 816cga aca gtt tcc caa tta aca aga gaa att tat acg aac cca gta tta 816
Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu
260 265 270 260 265 270
gaa aat ttt gat ggt agt ttt cgt gga atg gct cag aga ata gaa cag 864gaa aat ttt gat ggt agt ttt cgt gga atg gct cag aga ata gaa cag 864
Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln
275 280 285 275 280 285
aat att agg caa cca cat ctt atg gat atc ctt aat agt ata acc att 912aat att agg caa cca cat ctt atg gat atc ctt aat agt ata acc att 912
Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile
290 295 300 290 295 300
tat act gat gtg cat aga ggc ttt aat tat tgg tca ggg cat caa ata 960tat act gat gtg cat aga ggc ttt aat tat tgg tca ggg
Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile
305 310 315 320 305 310 315 320
aca gct tct cct gta ggg ttt tca gga cca gaa ttc gca ttc cct tta 1008aca gct tct cct gta ggg ttt tca gga cca gaa ttc gca ttc cct tta 1008
Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu
325 330 335 325 330 335
ttt ggg aat gcg gga aat gca gct cca ccc gta ctt gtc tca tta act 1056ttt ggg aat gcg gga aat gca gct cca ccc gta ctt gtc tca tta act 1056
Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr
340 345 350 340 345 350
ggt ttg ggg att ttt aga aca tta tct tca cct tta tat aga aga att 1104ggt ttg ggg att ttt aga aca tta tct tca cct tta tat aga aga att 1104
Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile
355 360 365 355 360 365
ata ctt ggt tca ggc cca aat aat cag gaa ctg ttt gtc ctt gat gga 1152ata ctt ggt tca ggc cca aat aat cag gaa ctg ttt gtc ctt gat gga 1152
Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly
370 375 380 370 375 380
acg gag ttt tct ttt gcc tcc cta acg acc aac ttg cct tcc act ata 1200acg gag ttt tct ttt gcc tcc cta acg acc aac ttg cct tcc act ata 1200
Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile
385 390 395 400 385 390 395 400
tat aga caa agg ggt aca gtc gat tca cta gat gta ata ccg cca cag 1248tat aga caa agg ggt aca gtc gat tca cta gat gta ata ccg cca cag 1248
Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln
405 410 415 405 410 415
gat aat agt gta cca cct cgt gcg gga ttt agc cat cga ttg agt cat 1296gat aat agt gta cca cct cgt gcg gga ttt agc cat cga ttg agt cat 1296
Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His
420 425 430 420 425 430
gtt aca atg ctg agc caa gca gct gga gca gtt tac acc ttg aga gct 1344gtt aca atg ctg agc caa gca gct gga gca gtt tac acc ttg aga gct 1344
Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala
435 440 445 435 440 445
cca acg ttt tct tgg cag cat cgc agt gct acg aca act aat ata att 1392cca acg ttt tct tgg cag cat cgc agt gct acg aca act aat ata att 1392
Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile
450 455 460 450 455 460
gca gcg gat agt att act caa att cct gct gtt aaa gga cgt tct att 1440gca gcg gat agt att act caa att cct gct gtt aaa gga cgt tct att 1440
Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile
465 470 475 480 465 470 475 480
att aat aat ggc acg gta att tca gga cca ggg ttt acc gga ggc gat 1488att aat aat ggc acg gta att tca gga cca ggg ttt acc gga ggc gat 1488
Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp
485 490 495 485 490 495
ttg gtt aga tta tac aat gct gat ttt aat att aat aat aga gca tac 1536ttg gtt aga tta tac aat gct gat ttt aat att aat aat aga gca tac 1536
Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr
500 505 510 500 505 510
ctt gaa gtt ccg ata ttc ttc caa tca ccc tct aca aat tat cgt gtt 1584ctt gaa gtt ccg ata ttc ttc caa tca ccc tct aca aat tat cgt gtt 1584
Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val
515 520 525 515 520 525
cgt gtt cgt tat gct tct aca tct tca ctc cct gta gat gta gtt ttc 1632cgt gtt cgt tat gct tct aca tct tca ctc cct gta gat gta gtt ttc 1632
Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe
530 535 540 530 535 540
gga aat att agt cat cct act aca ttc cca gcc act gcc aga tca tta 1680gga aat att agt cat cct act aca ttc cca gcc act gcc aga tca tta 1680
Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu
545 550 555 560 545 550 555 560
gat aat cta caa tcc aat gat ttt gga tat att gat att gct gga act 1728gat aat cta caa tcc aat gat ttt gga tat att gat att gct gga act 1728
Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr
565 570 575 565 570 575
ttc tta cct tca cta ggg cct agt ata ggt atc aga cct atg tta tct 1776ttc tta cct tca cta ggg cct agt ata ggt atc aga cct atg tta tct 1776
Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser
580 585 590 580 585 590
act att aat ttg ata gta gat aga ttt gaa ttt att cca gta act gca 1824act att aat ttg ata gta gat aga ttt gaa ttt att cca gta act gca 1824
Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala
595 600 605 595 600 605
acc ttt gaa gca gaa tcg gat tta gaa aga gca caa aag gcg gtg aat 1872acc ttt gaa gca gaa tcg gat tta gaa aga gca caa aag gcg gtg aat 1872
Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn
610 615 620 610 615 620
gcg ctg ttt act tct aca aac caa cta ggg ata aaa aca gat gtg acg 1920gcg ctg ttt act tct aca aac caa cta ggg ata aaa aca gat gtg acg 1920
Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr
625 630 635 640 625 630 635 640
gat tat cat att gat caa gtg tcc aat tta gtg gag tgt tta tcg gat 1968gat tat cat att gat caa gtg tcc aat tta gtg gag tgt tta tcg gat 1968
Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp
645 650 655 645 650 655
gaa ttt tat ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa cat 2016gaa ttt tat ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa cat 2016
Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His
660 665 670 660 665 670
gcg aag cga ctc agt gat gag cga aat tta ctt caa gat cca aac ttc 2064gcg aag cga ctc agt gat gag cga aat tta ctt caa gat cca aac ttc 2064
Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe
675 680 685 675 680 685
agg ggc atc aat aga caa cca gat cgt ggc tgg aga gga agt acg gat 2112agg ggc atc aat aga caa cca gat cgt ggc tgg aga gga agt acg gat 2112
Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp
690 695 700 690 695 700
att acc atc caa gga gga gat gac gta ttc aaa gag aat tac gtc aca 2160att acc atc caa gga gga gat gac gta ttc aaa gag aat tac gtc aca 2160
Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr
705 710 715 720 705 710 715 720
cta cca ggt acc ttt gat gag tgc tat cca acg tat tta tat caa aaa 2208cta cca ggt acc ttt gat gag tgc tat cca acg tat tta tat caa aaa 2208
Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys
725 730 735 725 730 735
ata gat gag tcg aaa tta aaa gcc tat acc cgt tat caa tta aga ggg 2256ata gat gag tcg aaa tta aaa gcc tat acc cgt tat caa tta aga ggg 2256
Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly
740 745 750 740 745 750
tat atc gag gat agt caa gac tta gaa atc tat tta att cgc tac aat 2304tat atc gag gat agt caa gac tta gaa atc tat tta att cgc tac aat 2304
Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn
755 760 765 755 760 765
gca aaa cat gaa aca gta aat gtg cca ggt acg ggt tcc tta tgg ccg 2352gca aaa cat gaa aca gta aat gtg cca ggt acg ggt tcc tta tgg ccg 2352
Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro
770 775 780 770 775 780
ctt tca gcc caa agt cca atc gga aag tgt gga gag ccg aat cga tgc 2400ctt tca gcc caa agt cca atc gga aag tgt gga gag ccg aat cga tgc 2400
Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys
785 790 795 800 785 790 795 800
gcg cca cac ctt gaa tgg aat cct gat tta cac tgt tcc tgc aga gac 2448gcg cca cac ctt gaa tgg aat cct gat tta cac tgt tcc tgc aga gac 2448
Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp
805 810 815 805 810 815
ggg gaa aaa tgt gct cat cat tct cat cat ttc tcc ttg gac att gat 2496ggg gaa aaa tgt gct cat cat tct cat cat ttc tcc ttg gac att gat 2496
Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp
820 825 830 820 825 830
gtt gga tgt aca gac tta aat gag gat tta ggt gta tgg gtg ata ttc 2544gtt gga tgt aca gac tta aat gag gat tta ggt gta tgg gtg ata ttc 2544
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
835 840 845 835 840 845
aag att aag acg caa gat ggc cat gca aga cta gga aat cta gag ttt 2592aag att aag acg caa gat ggc cat gca aga cta gga aat cta gag ttt 2592
Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe
850 855 860 850 855 860
ctc gaa gag aaa cca tta gta ggg gaa gca cta gct cgt gtg aaa aga 2640ctc gaa gag aaa cca tta gta ggg gaa gca cta gct cgt gtg aaa aga 2640
Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg
865 870 875 880 865 870 875 880
gcg gag aaa aaa tgg aga gac aaa cgc gaa aaa tta caa ttg gaa aca 2688gcg gag aaa aaa tgg aga gac aaa cgc gaa aaa tta caa ttg gaa aca 2688
Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr
885 890 895 885 890 895
aat atc gtt tat aaa gag gca aaa gaa tct gta gat gct tta ttt gta 2736aat atc gtt tat aaa gag gca aaa gaa tct gta gat gct tta ttt gta 2736
Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
900 905 910 900 905 910
aac tct caa tat gat caa tta caa gcg gat acg aac atc gcg atg att 2784aac tct caa tat gat caa tta caa gcg gat acg aac atc gcg atg att 2784
Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile
915 920 925 915 920 925
cat gcg gca gat aaa cgt gtt cat aga atc cga gaa gcg tac ctt cca 2832cat gcg gca gat aaa cgt gtt cat aga atc cga gaa gcg tac ctt cca 2832
His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro
930 935 940 930 935 940
gag tta tct gtg att ccg ggt gta aat gca gac att tcc gaa gaa tta 2880gag tta tct gtg att ccg ggt gta aat gca gac att tcc gaa gaa tta 2880
Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu
945 950 955 960 945 950 955 960
gaa ggg cgt att ttc act gca ttc tct cta tat gat gcg aga aat gtc 2928gaa ggg cgt att ttc act gca ttc tct cta tat gat gcg aga aat gtc 2928
Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val
965 970 975 965 970 975
att aaa aat ggc gat ttc aat aat ggc tta tta tgc tgg aac gtg aaa 2976att aaa aat ggc gat ttc aat aat ggc tta tta tgc tgg aac gtg aaa 2976
Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys
980 985 990 980 985 990
ggg cat gta gat gta gaa gaa caa aat aac cac cgt tcg gtc ctt gtt 3024ggg cat gta gat gta gaa gaa caa aat aac cac cgt tcg gtc ctt gtt 3024
Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val
995 1000 1005 995 1000 1005
gtt ccg gaa tgg gaa gca gaa gtg tca caa gag gtt cgt gtc tgt 3069gtt ccg gaa tgg gaa gca gaa gtg tca caa gag gtt cgt gtc tgt 3069
Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010 1015 1020 1010 1015 1020
ccg ggg cgt ggc tat atc ctt cgt gtc aca gcg tac aag gag gga 3114ccg ggg cgt ggc tat atc ctt cgt gtc aca gcg tac aag gag gga 3114
Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly
1025 1030 1035 1025 1030 1035
tat gga gaa ggt tgc gta acc att cat gag atc gag aac aat aca 3159tat gga gaa ggt tgc gta acc att cat gag atc gag aac aat aca 3159
Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr
1040 1045 1050 1040 1045 1050
gac gaa ctg aag ttt agc aac tgt gta gaa gag gaa gtc tat cca 3204gac gaa ctg aag ttt agc aac tgt gta gaa gag gaa gtc tat cca 3204
Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro
1055 1060 1065 1055 1060 1065
aac aac acg gta acg tgt aat gat tat act gca aat caa gaa gaa 3249aac aac acg gta acg tgt aat gat tat act gca aat caa gaa gaa 3249
Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu
1070 1075 1080 1070 1075 1080
tat gag ggt acg tac act tct cgt aat cga gga tat gac gaa gcc 3294tat gag ggt acg tac act tct cgt aat cga gga tat gac gaa gcc 3294
Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala
1085 1090 1095 1085 1090 1095
tat gaa agc aat tct tct gta cca gct gag tat gcg tca gtc tat 3339tat gaa agc aat tct tct gta cca gct gag tat gcg tca gtc tat 3339
Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr
1100 1105 1110 1100 1105 1110
gaa gaa aaa gtg tat aca gat gga cga aga ggg aat cct tgt gaa 3384gaa gaa aaa gtg tat aca gat gga cga aga ggg aat cct tgt gaa 3384
Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu
1115 1120 1125 1115 1120 1125
tct aac aga gga tat ggg gat tac aca cca cta cca gct ggc tat 3429tct aac aga gga tat ggg gat tac aca cca cta cca gct ggc tat 3429
Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr
1130 1135 1140 1130 1135 1140
gtg aca aaa gaa tta gag tac ttc cca gaa acc gat aag gta tgg 3474gtg aca aaa gaa tta gag tac ttc cca gaa acc gat aag gta tgg 3474
Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp
1145 1150 1155 1145 1150 1155
att gag att gga gaa aca gaa gga aca ttc att gtg gat agt gtg 3519att gag att gga gaa aca gaa gga aca ttc att gtg gat agt gtg 3519
Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val
1160 1165 1170 1160 1165 1170
gaa tta ctc ctt atg gag gaa taa 3543gaa tta ctc ctt atg gag gaa taa 3543
Glu Leu Leu Leu Met Glu Glu Glu Leu Leu Leu Met Glu Glu
1175 1180 1175 1180
<210> 2<210> 2
<211> 1180<211> 1180
<212> БЕЛОК<212> PROTEIN
<213> Bacillus thuringiensis<213> Bacillus thuringiensis
<400> 2<400> 2
Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn
1 5 10 15 1 5 10 15
Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn
20 25 30 20 25 30
Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu
35 40 45 35 40 45
Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp
50 55 60 50 55 60
Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu
65 70 75 80 65 70 75 80
Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile
85 90 95 85 90 95
Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala
100 105 110 100 105 110
Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala
115 120 125 115 120 125
Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile
130 135 140 130 135 140
Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe
145 150 155 160 145 150 155 160
Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe
165 170 175 165 170 175
Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr
180 185 190 180 185 190
Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg
195 200 205 195 200 205
Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp
210 215 220 210 215 220
Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240 225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile
245 250 255 245 250 255
Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu
260 265 270 260 265 270
Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln
275 280 285 275 280 285
Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile
290 295 300 290 295 300
Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile
305 310 315 320 305 310 315 320
Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu
325 330 335 325 330 335
Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr
340 345 350 340 345 350
Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile
355 360 365 355 360 365
Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly
370 375 380 370 375 380
Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile
385 390 395 400 385 390 395 400
Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln
405 410 415 405 410 415
Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His
420 425 430 420 425 430
Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala
435 440 445 435 440 445
Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile
450 455 460 450 455 460
Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile
465 470 475 480 465 470 475 480
Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp
485 490 495 485 490 495
Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr
500 505 510 500 505 510
Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val
515 520 525 515 520 525
Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe
530 535 540 530 535 540
Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu
545 550 555 560 545 550 555 560
Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr
565 570 575 565 570 575
Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser
580 585 590 580 585 590
Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala
595 600 605 595 600 605
Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn
610 615 620 610 615 620
Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr
625 630 635 640 625 630 635 640
Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp
645 650 655 645 650 655
Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His
660 665 670 660 665 670
Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe
675 680 685 675 680 685
Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp
690 695 700 690 695 700
Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr
705 710 715 720 705 710 715 720
Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys
725 730 735 725 730 735
Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly
740 745 750 740 745 750
Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn
755 760 765 755 760 765
Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro
770 775 780 770 775 780
Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys
785 790 795 800 785 790 795 800
Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp
805 810 815 805 810 815
Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp
820 825 830 820 825 830
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
835 840 845 835 840 845
Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe
850 855 860 850 855 860
Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg
865 870 875 880 865 870 875 880
Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr
885 890 895 885 890 895
Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
900 905 910 900 905 910
Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile
915 920 925 915 920 925
His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro
930 935 940 930 935 940
Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu
945 950 955 960 945 950 955 960
Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val
965 970 975 965 970 975
Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys
980 985 990 980 985 990
Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val
995 1000 1005 995 1000 1005
Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010 1015 1020 1010 1015 1020
Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly
1025 1030 1035 1025 1030 1035
Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr
1040 1045 1050 1040 1045 1050
Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro
1055 1060 1065 1055 1060 1065
Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu
1070 1075 1080 1070 1075 1080
Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala
1085 1090 1095 1085 1090 1095
Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr
1100 1105 1110 1100 1105 1110
Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu
1115 1120 1125 1115 1120 1125
Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr
1130 1135 1140 1130 1135 1140
Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp
1145 1150 1155 1145 1150 1155
Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val
1160 1165 1170 1160 1165 1170
Glu Leu Leu Leu Met Glu Glu Glu Leu Leu Leu Met Glu Glu
1175 1180 1175 1180
<210> 3<210> 3
<211> 3534<211> 3534
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Полностью синтетическая ДНК, кодирующая BCW 002<223> Fully synthetic
<220><220>
<221> CDS<221> CDS
<222> (1)..(3531)<222> (1)..(3531)
<400> 3<400> 3
atg gat aac aat ccg aac atc aat gaa tgc att cct tat aat tgt tta 48atg gat aac aat ccg aac atc aat gaa tgc att cct tat aat tgt tta 48
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15 1 5 10 15
agt aac cct gaa gta gaa gta tta ggt gga gaa aga ata gaa act ggt 96agt aac cct gaa gta gaa gta tta ggt gga gaa aga ata gaa act ggt 96
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30 20 25 30
tac acc cca atc gat att tcc ttg tcg cta acg caa ttt ctt ttg agt 144tac acc cca atc gat att tcc ttg tcg cta acg caa ttt ctt ttg agt 144
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45 35 40 45
gaa ttt gtt ccc ggt gct gga ttt gtg tta gga cta gtt gat ata ata 192gaa ttt gtt ccc ggt gct gga ttt gtg tta gga cta gtt gat ata ata 192
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60 50 55 60
tgg gga att ttt ggt ccc tct caa tgg gac gca ttt ctt gta caa att 240tgg gga att ttt ggt ccc tct caa tgg gac gca ttt ctt gta
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80 65 70 75 80
gaa cag tta att aac caa aga ata gaa gaa ttc gct agg aac caa gcc 288gaa cag tta att aac caa aga ata gaa gaa ttc gct agg aac caa gcc 288
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95 85 90 95
att tct aga tta gaa gga cta agc aat ctt tat caa att tac gca gaa 336att tct aga tta gaa gga cta agc aat ctt tat caa att tac gca gaa 336
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110 100 105 110
tct ttt aga gag tgg gaa gca gat cct act aat cca gca tta aga gaa 384tct ttt aga gag tgg gaa gca gat cct act aat cca gca tta aga gaa 384
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125 115 120 125
gag atg cgt att caa ttc aat gac atg aac agt gcc ctt aca acc gct 432gag atg cgt att caa ttc aat gac atg aac agt gcc ctt aca acc gct 432
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140 130 135 140
att cct ctt ttg gca gtt caa aat tat caa gtt cct ctt tta tca gta 480att cct ctt ttg gca gtt caa aat tat caa gtt cct ctt tta
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160 145 150 155 160
tat gtt caa gct gca aat tta cat tta tca gtt ttg aga gat gtt tca 528tat gtt caa gct gca aat tta cat tta tca gtt ttg aga gat gtt tca 528
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175 165 170 175
gtg ttt gga caa agg tgg gga ttt gat gcc gcg act atc aat agt cgt 576gtg ttt gga caa agg tgg gga ttt gat gcc gcg act atc aat agt cgt 576
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190 180 185 190
tat aat gat tta act agg ctt att ggc aac tat aca gat tat gct gta 624tat aat gat tta act agg ctt att ggc aac tat aca gat tat gct gta 624
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205 195 200 205
cgc tgg tac aat acg gga tta gaa cgt gta tgg gga ccg gat tct aga 672cgc tgg tac aat acg gga tta gaa cgt gta tgg gga ccg gat tct aga 672
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220 210 215 220
gat tgg gta agg tat aat caa ttt aga aga gaa tta aca cta act gta 720gat tgg gta agg tat aat caa ttt aga aga gaa tta aca cta act gta 720
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240 225 230 235 240
tta gat atc gtt gct ctg ttc ccg aat tat gat agt aga aga tat cca 768tta gat atc gtt gct ctg ttc ccg aat tat gat agt aga aga tat cca 768
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255 245 250 255
att cga ata gtt tcc caa tta aca aga gaa att tat acg aac cca gta 816att cga ata gtt tcc caa tta aca aga gaa att tat acg aac cca gta 816
Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270 260 265 270
tta gaa aat ttt gat ggt agt ttt cgt gga atg gct cag aga ata gaa 864tta gaa aat ttt gat ggt agt ttt cgt gga atg gct cag aga ata gaa 864
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285 275 280 285
cag aat att agg caa cca cat ctt atg gat atc ctt aat agt ata acc 912cag aat att agg caa cca cat ctt atg gat atc ctt aat agt ata acc 912
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300 290 295 300
att tat act gat gtg cat aga ggc ttt aat tat tgg tca ggg cat caa 960att tat act gat gtg cat aga ggc ttt aat tat tgg tca ggg
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320 305 310 315 320
ata aca gct tct cct gta ggg ttt tca gga cca gaa ttc gca ttc cct 1008ata aca gct tct cct gta ggg ttt tca gga cca gaa ttc gca ttc cct 1008
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335 325 330 335
tta ttt ggg aat gcg gga aat gca gct cca ccc gta ctt gtc tca tta 1056tta ttt ggg aat gcg gga aat gca gct cca ccc gta ctt gtc tca tta 1056
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Val Leu Val Ser Leu
340 345 350 340 345 350
act ggt ttg ggg att ttt aga aca tta tct tca cct tta tat aga aga 1104act ggt ttg ggg att ttt aga aca tta tct tca cct tta tat aga aga 1104
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365 355 360 365
att ata ctt ggt tca ggc cca aat aat cag gaa ctg ttt gtc ctt gat 1152att ata ctt ggt tca ggc cca aat aat cag gaa ctg ttt gtc ctt gat 1152
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380 370 375 380
gga acg gag ttt tct ttt gcc tcc cta acg acc aac ttg cct tcc act 1200gga acg gag ttt tct ttt gcc tcc cta acg acc aac ttg cct tcc act 1200
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400 385 390 395 400
ata tat aga caa agg ggt aca gtc gat tca cta gat gta ata ccg cca 1248ata tat aga caa agg ggt aca gtc gat tca cta gat gta ata ccg cca 1248
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415 405 410 415
cag gat aat agt gta cca cct cgt gcg gga ttt agc cat cga ttg agt 1296cag gat aat agt gta cca cct cgt gcg gga ttt agc cat cga ttg agt 1296
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430 420 425 430
cat gtt aca atg ctg agc caa gca gct gga gca gtt tac acc ttg aga 1344cat gtt aca atg ctg agc caa gca gct gga gca gtt tac acc ttg aga 1344
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445 435 440 445
gct cca acg ttt tct tgg cag cat cgc agt gct acg aca act aat ata 1392gct cca acg ttt tct tgg cat cgc agt gct acg aca act aat ata 1392
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460 450 455 460
att gca gcg gat agt att act caa att cct gct gtt aaa gga cgt tct 1440att gca gcg gat agt att act caa att cct gct gtt aaa gga cgt tct 1440
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480 465 470 475 480
att att aat aat ggc acg gta att tca gga cca ggg ttt acc gga ggc 1488att att aat aat ggc acg gta att tca gga cca ggg ttt acc gga ggc 1488
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495 485 490 495
gat ttg gtt aga tta tac aat gct gat ttt aat att aat aat aga gca 1536gat ttg gtt aga tta tac aat gct gat ttt aat att aat aat aga gca 1536
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510 500 505 510
tac ctt gaa gtt ccg ata ttc ttc caa tca ccc tct aca aat tat cgt 1584tac ctt gaa gtt ccg ata ttc ttc caa tca ccc tct aca aat tat cgt 1584
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525 515 520 525
gtt cgt gtt cgt tat gct tct aca tct tca ctc cct gta gat gta gtt 1632gtt cgt gtt cgt tat gct tct aca tct tca ctc cct gta gat gta gtt 1632
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540 530 535 540
ttc gga aat att agt cat cct act aca ttc cca gcc act gcc aga tca 1680ttc gga aat att agt cat cct act aca ttc cca gcc act gcc aga tca 1680
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560 545 550 555 560
tta gat aat cta caa tcc aat gat ttt gga tat att gat att gct gga 1728tta gat aat cta caa tcc aat gat ttt gga tat att gat att gct gga 1728
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575 565 570 575
act ttc tta cct tca cta ggg cct agt ata ggt atc aga cct atg tta 1776act ttc tta cct tca cta ggg cct agt ata ggt atc aga cct atg tta 1776
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590 580 585 590
tct act att aat ttg ata gta gat aga ttt gaa ttt att cca gta act 1824tct act att aat ttg ata gta gat aga ttt gaa ttt att cca gta act 1824
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605 595 600 605
gca acc ttt gaa gca gaa tcg gat tta gaa aga gca caa aag gcg gtg 1872gca acc ttt gaa gca gaa tcg gat tta gaa aga gca caa aag gcg gtg 1872
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620 610 615 620
aat gcg ctg ttt act tct aca aac caa cta ggg ata aaa aca gat gtg 1920aat gcg ctg ttt act tct aca aac caa cta ggg ata aaa aca gat gtg 1920
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640 625 630 635 640
acg gat tat cat att gat caa gtg tcc aat tta gtg gag tgt tta tcg 1968acg gat tat cat att gat caa gtg tcc aat tta gtg gag tgt tta tcg 1968
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655 645 650 655
gat gaa ttt tat ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa 2016gat gaa ttt tat ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa 2016
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670 660 665 670
cat gcg aag cga ctc agt gat gag cga aat tta ctt caa gat cca aac 2064cat gcg aag cga ctc agt gat gag cga aat tta ctt caa gat cca aac 2064
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685 675 680 685
ttc agg ggc atc aat aga caa cca gat cgt ggc tgg aga gga agt acg 2112ttc agg ggc atc aat aga caa cca gat cgt ggc tgg aga gga agt acg 2112
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700 690 695 700
gat att acc atc caa gga gga gat gac gta ttc aaa gag aat tac gtc 2160gat att acc atc caa gga gga gat gac gta ttc aaa gag aat tac gtc 2160
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720 705 710 715 720
aca cta cca ggt acc ttt gat gag tgc tat cca aca tat ttg tat caa 2208aca cta cca ggt acc ttt gat gag tgc tat cca aca tat ttg tat caa 2208
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735 725 730 735
aaa atc gat gaa tca aaa tta aaa gcc ttt acc cgt tat caa tta aga 2256aaa atc gat gaa tca aaa tta aaa gcc ttt acc cgt tat caa tta aga 2256
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750 740 745 750
ggg tat atc gaa gat agt caa gac tta gaa atc tat tta att cgc tac 2304ggg tat atc gaa gat agt caa gac tta gaa atc tat tta att cgc tac 2304
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765 755 760 765
aat gca aaa cat gaa aca gta aat gtg cca ggt acg ggt tcc tta tgg 2352aat gca aaa cat gaa aca gta aat gtg cca ggt acg ggt tcc tta tgg 2352
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780 770 775 780
ccg ctt tca gcc caa agt cca atc gga aag tgt gga gag ccg aat cga 2400ccg ctt tca gcc caa agt cca atc gga aag tgt gga gag ccg aat cga 2400
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800 785 790 795 800
tgc gcg cca cac ctt gaa tgg aat cct gac tta gat tgt tcg tgt agg 2448tgc gcg cca cac ctt gaa tgg aat cct gac tta gat tgt tcg tgt agg 2448
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815 805 810 815
gat gga gaa aag tgt gcc cat cat tcg cat cat ttc tcc tta gac att 2496gat gga gaa aag tgt gcc cat cat tcg cat cat ttc tcc tta gac att 2496
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830 820 825 830
gat gta gga tgt aca gac tta aat gag gac cta ggt gta tgg gtg atc 2544gat gta gga tgt aca gac tta aat gag gac cta ggt gta tgg gtg atc 2544
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845 835 840 845
ttt aag att aag acg caa gat ggg cac gca aga cta ggg aat cta gag 2592ttt aag att aag acg caa gat ggg cac gca aga cta ggg aat cta gag 2592
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860 850 855 860
ttt ctc gaa gag aaa cca tta gta gga gaa gca cta gct cgt gtg aaa 2640ttt ctc gaa gag aaa cca tta gta gga gaa gca cta gct cgt gtg aaa 2640
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880 865 870 875 880
aga gcg gag aaa aaa tgg aga gac aaa cgt gaa aaa ttg gaa tgg gaa 2688aga gcg gag aaa aaa tgg aga gac aaa cgt gaa aaa ttg gaa tgg gaa 2688
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895 885 890 895
aca aat atc gtt tat aaa gag gca aaa gaa tct gta gat gct tta ttt 2736aca aat atc gtt tat aaa gag gca aaa gaa tct gta gat gct tta ttt 2736
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910 900 905 910
gta aac tct caa tat gat caa tta caa gcg gat acg aat att gcc atg 2784gta aac tct caa tat gat caa tta caa gcg gat acg aat att gcc atg 2784
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925 915 920 925
att cat gcg gca gat aaa cgt gtt cat agc att cga gaa gct tat ctg 2832att cat gcg gca gat aaa cgt gtt cat agc att cga gaa gct tat ctg 2832
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940 930 935 940
cct gag ctg tct gtg att ccg ggt gtc aat gcg gct att ttt gaa gaa 2880cct gag ctg tct gtg att ccg ggt gtc aat gcg gct att ttt gaa gaa 2880
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960 945 950 955 960
tta gaa ggg cgt att ttc act gca ttc tcc cta tat gat gcg aga aat 2928tta gaa ggg cgt att ttc act gca ttc tcc cta tat gat gcg aga aat 2928
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975 965 970 975
gtc att aaa aat ggt gat ttt aat aat ggc tta tcc tgc tgg aac gtg 2976gtc att aaa aat ggt gat ttt aat aat ggc tta tcc tgc tgg aac gtg 2976
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990 980 985 990
aaa ggg cat gta gat gta gaa gaa caa aac aac caa cgt tcg gtc ctt 3024aaa ggg cat gta gt gta gaa gaa caa aac aac caa cgt tcg gtc ctt 3024
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005 995 1000 1005
gtt gtt ccg gaa tgg gaa gca gaa gtg tca caa gaa gtt cgt gtc 3069gtt gtt ccg gaa tgg gaa gca gaa gtg tca caa gaa gtt cgt gtc 3069
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020 1010 1015 1020
tgt ccg ggt cgt ggc tat atc ctt cgt gtc aca gcg tac aag gag 3114tgt ccg ggt cgt ggc tat atc ctt cgt gtc aca gcg tac aag gag 3114
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035 1025 1030 1035
gga tat gga gaa ggt tgc gta acc att cat gag atc gag aac aat 3159gga tat gga gaa ggt tgc gta acc att cat gag atc gag aac aat 3159
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050 1040 1045 1050
aca gac gaa ctg aag ttt agc aac tgc gta gaa gag gaa atc tat 3204aca gac gaa ctg aag ttt agc aac tgc gta gaa gag gaa atc tat 3204
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065 1055 1060 1065
cca aat aac acg gta acg tgt aat gat tat act gta aat caa gaa 3249cca aat aac acg gta acg tgt aat gat tat act gta aat caa gaa 3249
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080 1070 1075 1080
gaa tac gga ggt gcg tac act tct cgt aat cga gga tat aac gaa 3294gaa tac gga ggt gcg tac act tct cgt aat cga gga tat aac gaa 3294
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095 1085 1090 1095
gct cct tcc gta cca gct gat tat gcg tca gtc tat gaa gaa aaa 3339gct cct tcc gta cca gct gat tat gcg tca gtc tat gaa gaa aaa 3339
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110 1100 1105 1110
tcg tat aca gat gga cga aga gag aat cct tgt gaa ttt aac aga 3384tcg tat aca gat gga cga aga gag aat cct tgt gaa ttt aac aga 3384
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125 1115 1120 1125
ggg tat agg gat tac acg cca cta cca gtt ggt tat gtg aca aaa 3429ggg tat agg gat tac acg cca cta cca gtt ggt tat gtg aca aaa 3429
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140 1130 1135 1140
gaa tta gaa tac ttc cca gaa acc gat aag gta tgg att gag att 3474gaa tta gaa tac ttc cca gaa acc gat aag gta tgg att gag att 3474
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155 1145 1150 1155
gga gaa acg gaa gga aca ttt atc gtg gac agc gtg gaa tta ctc 3519gga gaa acg gaa gga aca ttt atc gtg gac agc gtg gaa tta ctc 3519
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170 1160 1165 1170
ctt atg gag gaa tag 3534ctt atg gag gaa tag 3534
Leu Met Glu Glu Leu Met Glu Glu
1175 1175
<210> 4<210> 4
<211> 1177<211> 1177
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетическая конструкция<223> Synthetic construction
<400> 4<400> 4
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15 1 5 10 15
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30 20 25 30
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45 35 40 45
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60 50 55 60
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80 65 70 75 80
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95 85 90 95
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110 100 105 110
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125 115 120 125
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140 130 135 140
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160 145 150 155 160
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175 165 170 175
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190 180 185 190
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205 195 200 205
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220 210 215 220
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240 225 230 235 240
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255 245 250 255
Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270 260 265 270
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285 275 280 285
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300 290 295 300
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320 305 310 315 320
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335 325 330 335
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Val Leu Val Ser Leu
340 345 350 340 345 350
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365 355 360 365
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380 370 375 380
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400 385 390 395 400
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415 405 410 415
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430 420 425 430
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445 435 440 445
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460 450 455 460
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480 465 470 475 480
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495 485 490 495
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510 500 505 510
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525 515 520 525
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540 530 535 540
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560 545 550 555 560
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575 565 570 575
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590 580 585 590
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605 595 600 605
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620 610 615 620
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640 625 630 635 640
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655 645 650 655
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670 660 665 670
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685 675 680 685
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700 690 695 700
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720 705 710 715 720
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735 725 730 735
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750 740 745 750
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765 755 760 765
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780 770 775 780
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800 785 790 795 800
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815 805 810 815
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830 820 825 830
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845 835 840 845
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860 850 855 860
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880 865 870 875 880
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895 885 890 895
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910 900 905 910
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925 915 920 925
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940 930 935 940
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960 945 950 955 960
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975 965 970 975
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990 980 985 990
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005 995 1000 1005
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020 1010 1015 1020
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035 1025 1030 1035
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050 1040 1045 1050
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065 1055 1060 1065
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080 1070 1075 1080
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095 1085 1090 1095
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110 1100 1105 1110
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125 1115 1120 1125
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140 1130 1135 1140
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155 1145 1150 1155
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170 1160 1165 1170
Leu Met Glu Glu Leu Met Glu Glu
1175 1175
<210> 5<210> 5
<211> 3534<211> 3534
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Полностью синтетическая последовательность, кодирующая BCW 003<223> Fully synthetic
<220><220>
<221> CDS<221> CDS
<222> (1)..(3531)<222> (1)..(3531)
<400> 5<400> 5
atg gat aac aat ccg aac atc aat gaa tgc att cct tat aat tgt tta 48atg gat aac aat ccg aac atc aat gaa tgc att cct tat aat tgt tta 48
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15 1 5 10 15
agt aac cct gaa gta gaa gta tta ggt gga gaa aga ata gaa act ggt 96agt aac cct gaa gta gaa gta tta ggt gga gaa aga ata gaa act ggt 96
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30 20 25 30
tac acc cca atc gat att tcc ttg tcg cta acg caa ttt ctt ttg agt 144tac acc cca atc gat att tcc ttg tcg cta acg caa ttt ctt ttg agt 144
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45 35 40 45
gaa ttt gtt ccc ggt gct gga ttt gtg tta gga cta gtt gat ata ata 192gaa ttt gtt ccc ggt gct gga ttt gtg tta gga cta gtt gat ata ata 192
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60 50 55 60
tgg gga att ttt ggt ccc tct caa tgg gac gca ttt ctt gta caa att 240tgg gga att ttt ggt ccc tct caa tgg gac gca ttt ctt gta
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80 65 70 75 80
gaa cag tta att aac caa aga ata gaa gaa ttc gct agg aac caa gcc 288gaa cag tta att aac caa aga ata gaa gaa ttc gct agg aac caa gcc 288
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95 85 90 95
att tct aga tta gaa gga cta agc aat ctt tat caa att tac gca gaa 336att tct aga tta gaa gga cta agc aat ctt tat caa att tac gca gaa 336
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110 100 105 110
tct ttt aga gag tgg gaa gca gat cct act aat cca gca tta aga gaa 384tct ttt aga gag tgg gaa gca gat cct act aat cca gca tta aga gaa 384
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125 115 120 125
gag atg cgt att caa ttc aat gac atg aac agt gcc ctt aca acc gct 432gag atg cgt att caa ttc aat gac atg aac agt gcc ctt aca acc gct 432
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140 130 135 140
att cct ctt ttg gca gtt caa aat tat caa gtt cct ctt tta tca gta 480att cct ctt ttg gca gtt caa aat tat caa gtt cct ctt tta
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160 145 150 155 160
tat gtt caa gct gca aat tta cat tta tca gtt ttg aga gat gtt tca 528tat gtt caa gct gca aat tta cat tta tca gtt ttg aga gat gtt tca 528
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175 165 170 175
gtg ttt gga caa agg tgg gga ttt gat gcc gcg act atc aat agt cgt 576gtg ttt gga caa agg tgg gga ttt gat gcc gcg act atc aat agt cgt 576
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190 180 185 190
tat aat gat tta act agg ctt att ggc aac tat aca gat tat gct gta 624tat aat gat tta act agg ctt att ggc aac tat aca gat tat gct gta 624
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205 195 200 205
cgc tgg tac aat acg gga tta gaa cgt gta tgg gga ccg gat tct aga 672cgc tgg tac aat acg gga tta gaa cgt gta tgg gga ccg gat tct aga 672
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220 210 215 220
gat tgg gta agg tat aat caa ttt aga aga gaa tta aca cta act gta 720gat tgg gta agg tat aat caa ttt aga aga gaa tta aca cta act gta 720
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240 225 230 235 240
tta gat atc gtt gct ctg ttc ccg aat tat gat agt aga aga tat cca 768tta gat atc gtt gct ctg ttc ccg aat tat gat agt aga aga tat cca 768
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255 245 250 255
att cga aca gtt tcc caa tta aca aga gaa att tat acg aac cca gta 816att cga aca gtt tcc caa tta aca aga gaa att tat acg aac cca gta 816
Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270 260 265 270
tta gaa aat ttt gat ggt agt ttt cgt gga atg gct cag aga ata gaa 864tta gaa aat ttt gat ggt agt ttt cgt gga atg gct cag aga ata gaa 864
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285 275 280 285
cag aat att agg caa cca cat ctt atg gat atc ctt aat agt ata acc 912cag aat att agg caa cca cat ctt atg gat atc ctt aat agt ata acc 912
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300 290 295 300
att tat act gat gtg cat aga ggc ttt aat tat tgg tca ggg cat caa 960att tat act gat gtg cat aga ggc ttt aat tat tgg tca ggg
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320 305 310 315 320
ata aca gct tct cct gta ggg ttt tca gga cca gaa ttc gca ttc cct 1008ata aca gct tct cct gta ggg ttt tca gga cca gaa ttc gca ttc cct 1008
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335 325 330 335
tta ttt ggg aat gcg gga aat gca gct cca ccc gta ctt gtc tca tta 1056tta ttt ggg aat gcg gga aat gca gct cca ccc gta ctt gtc tca tta 1056
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Val Leu Val Ser Leu
340 345 350 340 345 350
act ggt ttg ggg att ttt aga aca tta tct tca cct tta tat aga aga 1104act ggt ttg ggg att ttt aga aca tta tct tca cct tta tat aga aga 1104
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365 355 360 365
att ata ctt ggt tca ggc cca aat aat cag gaa ctg ttt gtc ctt gat 1152att ata ctt ggt tca ggc cca aat aat cag gaa ctg ttt gtc ctt gat 1152
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380 370 375 380
gga acg gag ttt tct ttt gcc tcc cta acg acc aac ttg cct tcc act 1200gga acg gag ttt tct ttt gcc tcc cta acg acc aac ttg cct tcc act 1200
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400 385 390 395 400
ata tat aga caa agg ggt aca gtc gat tca cta gat gta ata ccg cca 1248ata tat aga caa agg ggt aca gtc gat tca cta gat gta ata ccg cca 1248
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415 405 410 415
cag gat aat agt gta cca cct cgt gcg gga ttt agc cat cga ttg agt 1296cag gat aat agt gta cca cct cgt gcg gga ttt agc cat cga ttg agt 1296
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430 420 425 430
cat gtt aca atg ctg agc caa gca gct gga gca gtt tac acc ttg aga 1344cat gtt aca atg ctg agc caa gca gct gga gca gtt tac acc ttg aga 1344
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445 435 440 445
gct cca acg ttt tct tgg cag cat cgc agt gct acg aca act aat ata 1392gct cca acg ttt tct tgg cat cgc agt gct acg aca act aat ata 1392
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460 450 455 460
att gca gcg gat agt att act caa att cct gct gtt aaa gga cgt tct 1440att gca gcg gat agt att act caa att cct gct gtt aaa gga cgt tct 1440
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480 465 470 475 480
att att aat aat ggc acg gta att tca gga cca ggg ttt acc gga ggc 1488att att aat aat ggc acg gta att tca gga cca ggg ttt acc gga ggc 1488
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495 485 490 495
gat ttg gtt aga tta tac aat gct gat ttt aat att aat aat aga gca 1536gat ttg gtt aga tta tac aat gct gat ttt aat att aat aat aga gca 1536
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510 500 505 510
tac ctt gaa gtt ccg ata ttc ttc caa tca ccc tct aca aat tat cgt 1584tac ctt gaa gtt ccg ata ttc ttc caa tca ccc tct aca aat tat cgt 1584
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525 515 520 525
gtt cgt gtt cgt tat gct tct aca tct tca ctc cct gta gat gta gtt 1632gtt cgt gtt cgt tat gct tct aca tct tca ctc cct gta gat gta gtt 1632
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540 530 535 540
ttc gga aat att agt cat cct act aca ttc cca gcc act gcc aga tca 1680ttc gga aat att agt cat cct act aca ttc cca gcc act gcc aga tca 1680
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560 545 550 555 560
tta gat aat cta caa tcc aat gat ttt gga tat att gat att gct gga 1728tta gat aat cta caa tcc aat gat ttt gga tat att gat att gct gga 1728
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575 565 570 575
act ttc tta cct tca cta ggg cct agt ata ggt atc aga cct atg tta 1776act ttc tta cct tca cta ggg cct agt ata ggt atc aga cct atg tta 1776
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590 580 585 590
tct act att aat ttg ata gta gat aga ttt gaa ttt att cca gta act 1824tct act att aat ttg ata gta gat aga ttt gaa ttt att cca gta act 1824
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605 595 600 605
gca acc ttt gaa gca gaa tcg gat tta gaa aga gca caa aag gcg gtg 1872gca acc ttt gaa gca gaa tcg gat tta gaa aga gca caa aag gcg gtg 1872
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620 610 615 620
aat gcg ctg ttt act tct aca aac caa cta ggg ata aaa aca gat gtg 1920aat gcg ctg ttt act tct aca aac caa cta ggg ata aaa aca gat gtg 1920
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640 625 630 635 640
acg gat tat cat att gat caa gtg tcc aat tta gtg gag tgt tta tcg 1968acg gat tat cat att gat caa gtg tcc aat tta gtg gag tgt tta tcg 1968
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655 645 650 655
gat gaa ttt tat ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa 2016gat gaa ttt tat ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa 2016
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670 660 665 670
cat gcg aag cga ctc agt gat gag cga aat tta ctt caa gat cca aac 2064cat gcg aag cga ctc agt gat gag cga aat tta ctt caa gat cca aac 2064
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685 675 680 685
ttc agg ggc atc aat aga caa cca gat cgt ggc tgg aga gga agt acg 2112ttc agg ggc atc aat aga caa cca gat cgt ggc tgg aga gga agt acg 2112
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700 690 695 700
gat att acc atc caa gga gga gat gac gta ttc aaa gag aat tac gtc 2160gat att acc atc caa gga gga gat gac gta ttc aaa gag aat tac gtc 2160
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720 705 710 715 720
aca cta cca ggt acc ttt gat gag tgc tat cca aca tat ttg tat caa 2208aca cta cca ggt acc ttt gat gag tgc tat cca aca tat ttg tat caa 2208
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735 725 730 735
aaa atc gat gaa tca aaa tta aaa gcc ttt acc cgt tat caa tta aga 2256aaa atc gat gaa tca aaa tta aaa gcc ttt acc cgt tat caa tta aga 2256
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750 740 745 750
ggg tat atc gaa gat agt caa gac tta gaa atc tat tta att cgc tac 2304ggg tat atc gaa gat agt caa gac tta gaa atc tat tta att cgc tac 2304
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765 755 760 765
aat gca aaa cat gaa aca gta aat gtg cca ggt acg ggt tcc tta tgg 2352aat gca aaa cat gaa aca gta aat gtg cca ggt acg ggt tcc tta tgg 2352
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780 770 775 780
ccg ctt tca gcc caa agt cca atc gga aag tgt gga gag ccg aat cga 2400ccg ctt tca gcc caa agt cca atc gga aag tgt gga gag ccg aat cga 2400
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800 785 790 795 800
tgc gcg cca cac ctt gaa tgg aat cct gac tta gat tgt tcg tgt agg 2448tgc gcg cca cac ctt gaa tgg aat cct gac tta gat tgt tcg tgt agg 2448
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815 805 810 815
gat gga gaa aag tgt gcc cat cat tcg cat cat ttc tcc tta gac att 2496gat gga gaa aag tgt gcc cat cat tcg cat cat ttc tcc tta gac att 2496
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830 820 825 830
gat gta gga tgt aca gac tta aat gag gac cta ggt gta tgg gtg atc 2544gat gta gga tgt aca gac tta aat gag gac cta ggt gta tgg gtg atc 2544
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845 835 840 845
ttt aag att aag acg caa gat ggg cac gca aga cta ggg aat cta gag 2592ttt aag att aag acg caa gat ggg cac gca aga cta ggg aat cta gag 2592
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860 850 855 860
ttt ctc gaa gag aaa cca tta gta gga gaa gca cta gct cgt gtg aaa 2640ttt ctc gaa gag aaa cca tta gta gga gaa gca cta gct cgt gtg aaa 2640
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880 865 870 875 880
aga gcg gag aaa aaa tgg aga gac aaa cgt gaa aaa ttg gaa tgg gaa 2688aga gcg gag aaa aaa tgg aga gac aaa cgt gaa aaa ttg gaa tgg gaa 2688
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895 885 890 895
aca aat atc gtt tat aaa gag gca aaa gaa tct gta gat gct tta ttt 2736aca aat atc gtt tat aaa gag gca aaa gaa tct gta gat gct tta ttt 2736
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910 900 905 910
gta aac tct caa tat gat caa tta caa gcg gat acg aat att gcc atg 2784gta aac tct caa tat gat caa tta caa gcg gat acg aat att gcc atg 2784
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925 915 920 925
att cat gcg gca gat aaa cgt gtt cat agc att cga gaa gct tat ctg 2832att cat gcg gca gat aaa cgt gtt cat agc att cga gaa gct tat ctg 2832
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940 930 935 940
cct gag ctg tct gtg att ccg ggt gtc aat gcg gct att ttt gaa gaa 2880cct gag ctg tct gtg att ccg ggt gtc aat gcg gct att ttt gaa gaa 2880
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960 945 950 955 960
tta gaa ggg cgt att ttc act gca ttc tcc cta tat gat gcg aga aat 2928tta gaa ggg cgt att ttc act gca ttc tcc cta tat gat gcg aga aat 2928
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975 965 970 975
gtc att aaa aat ggt gat ttt aat aat ggc tta tcc tgc tgg aac gtg 2976gtc att aaa aat ggt gat ttt aat aat ggc tta tcc tgc tgg aac gtg 2976
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990 980 985 990
aaa ggg cat gta gat gta gaa gaa caa aac aac caa cgt tcg gtc ctt 3024aaa ggg cat gta gt gta gaa gaa caa aac aac caa cgt tcg gtc ctt 3024
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005 995 1000 1005
gtt gtt ccg gaa tgg gaa gca gaa gtg tca caa gaa gtt cgt gtc 3069gtt gtt ccg gaa tgg gaa gca gaa gtg tca caa gaa gtt cgt gtc 3069
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020 1010 1015 1020
tgt ccg ggt cgt ggc tat atc ctt cgt gtc aca gcg tac aag gag 3114tgt ccg ggt cgt ggc tat atc ctt cgt gtc aca gcg tac aag gag 3114
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035 1025 1030 1035
gga tat gga gaa ggt tgc gta acc att cat gag atc gag aac aat 3159gga tat gga gaa ggt tgc gta acc att cat gag atc gag aac aat 3159
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050 1040 1045 1050
aca gac gaa ctg aag ttt agc aac tgc gta gaa gag gaa atc tat 3204aca gac gaa ctg aag ttt agc aac tgc gta gaa gag gaa atc tat 3204
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065 1055 1060 1065
cca aat aac acg gta acg tgt aat gat tat act gta aat caa gaa 3249cca aat aac acg gta acg tgt aat gat tat act gta aat caa gaa 3249
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080 1070 1075 1080
gaa tac gga ggt gcg tac act tct cgt aat cga gga tat aac gaa 3294gaa tac gga ggt gcg tac act tct cgt aat cga gga tat aac gaa 3294
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095 1085 1090 1095
gct cct tcc gta cca gct gat tat gcg tca gtc tat gaa gaa aaa 3339gct cct tcc gta cca gct gat tat gcg tca gtc tat gaa gaa aaa 3339
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110 1100 1105 1110
tcg tat aca gat gga cga aga gag aat cct tgt gaa ttt aac aga 3384tcg tat aca gat gga cga aga gag aat cct tgt gaa ttt aac aga 3384
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125 1115 1120 1125
ggg tat agg gat tac acg cca cta cca gtt ggt tat gtg aca aaa 3429ggg tat agg gat tac acg cca cta cca gtt ggt tat gtg aca aaa 3429
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140 1130 1135 1140
gaa tta gaa tac ttc cca gaa acc gat aag gta tgg att gag att 3474gaa tta gaa tac ttc cca gaa acc gat aag gta tgg att gag att 3474
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155 1145 1150 1155
gga gaa acg gaa gga aca ttt atc gtg gac agc gtg gaa tta ctc 3519gga gaa acg gaa gga aca ttt atc gtg gac agc gtg gaa tta ctc 3519
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170 1160 1165 1170
ctt atg gag gaa tag 3534ctt atg gag gaa tag 3534
Leu Met Glu Glu Leu Met Glu Glu
1175 1175
<210> 6<210> 6
<211> 1177<211> 1177
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетическая конструкция<223> Synthetic construction
<400> 6<400> 6
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15 1 5 10 15
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30 20 25 30
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45 35 40 45
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60 50 55 60
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80 65 70 75 80
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95 85 90 95
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110 100 105 110
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125 115 120 125
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140 130 135 140
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160 145 150 155 160
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175 165 170 175
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190 180 185 190
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205 195 200 205
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220 210 215 220
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240 225 230 235 240
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255 245 250 255
Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270 260 265 270
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285 275 280 285
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300 290 295 300
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320 305 310 315 320
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335 325 330 335
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Val Leu Val Ser Leu
340 345 350 340 345 350
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365 355 360 365
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380 370 375 380
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400 385 390 395 400
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415 405 410 415
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430 420 425 430
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445 435 440 445
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460 450 455 460
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480 465 470 475 480
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495 485 490 495
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510 500 505 510
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525 515 520 525
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540 530 535 540
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560 545 550 555 560
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575 565 570 575
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590 580 585 590
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605 595 600 605
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620 610 615 620
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640 625 630 635 640
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655 645 650 655
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670 660 665 670
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685 675 680 685
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700 690 695 700
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720 705 710 715 720
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735 725 730 735
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750 740 745 750
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765 755 760 765
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780 770 775 780
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800 785 790 795 800
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815 805 810 815
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830 820 825 830
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845 835 840 845
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860 850 855 860
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880 865 870 875 880
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895 885 890 895
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910 900 905 910
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925 915 920 925
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940 930 935 940
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960 945 950 955 960
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975 965 970 975
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990 980 985 990
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005 995 1000 1005
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020 1010 1015 1020
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035 1025 1030 1035
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050 1040 1045 1050
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065 1055 1060 1065
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080 1070 1075 1080
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095 1085 1090 1095
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110 1100 1105 1110
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125 1115 1120 1125
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140 1130 1135 1140
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155 1145 1150 1155
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170 1160 1165 1170
Leu Met Glu Glu Leu Met Glu Glu
1175 1175
<210> 7<210> 7
<211> 3543<211> 3543
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Полностью синтетическая последовательность для применения<223> Fully synthetic sequence for application
в растениях, кодирующая BCW 001 in plants, encoding
<220><220>
<221> CDS<221> CDS
<222> (1)..(3540)<222> (1)..(3540)
<223> BCW 001<223>
<400> 7<400> 7
atg gag gag aac aac cag aac cag tgt gtc cca tac aac tgc ctc aac 48atg gag gag aac aac cag aac cag tgt gtc cca tac aac tgc ctc aac 48
Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn
1 5 10 15 1 5 10 15
aac cca gcc atc gaa atc ctt gag ggc gac cga att tca gtc ggc aac 96aac cca gcc atc gaa atc ctt gag ggc gac cga att tca gtc ggc aac 96
Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn
20 25 30 20 25 30
acg ccc atc gac atc tcc ctg agt ctt gtg gaa ctc ctc atc tcg gag 144acg ccc atc gac atc tcc ctg agt ctt gtg gaa ctc ctc atc tcg gag 144
Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu
35 40 45 35 40 45
ttc gtc cct ggc ggc ggc ata atc acc ggt ctg ctc aac atc gtg tgg 192ttc gtc cct ggc ggc ggc ata atc acc ggt ctg ctc aac atc gtg tgg 192
Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp
50 55 60 50 55 60
gga ttc gtg ggc cca tcc cag tgg gat gcg ttc ctg gcc caa gtg gag 240gga ttc gtg ggc cca tcc cag tgg gat gcg ttc ctg gcc
Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu
65 70 75 80 65 70 75 80
cag ctc atc aac cag agg atc tcc gag gcc gtc cgc aat acc gcg atc 288cag ctc atc aac cag agg atc tcc gag gcc gtc cgc aat acc gcg atc 288
Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile
85 90 95 85 90 95
caa gag ctg gag ggc atg gcc cgc gtg tac cgc acc tac gcc acc gcc 336caa gag ctg gag ggc atg gcc cgc gtg tac cgc acc tac gcc acc gcc 336
Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala
100 105 110 100 105 110
ttt gct gaa tgg gag cgc gac ccg aac aac act gac ctg cgc gag gcc 384ttt gct gaa tgg gag cgc gac ccg aac aac act gac ctg cgc gag gcc 384
Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala
115 120 125 115 120 125
gtc cga aca cag ttc acg gcg acc gag acc tac atc agc ggc cgg atc 432gtc cga aca cag ttc acg gcg acc gag acc tac atc agc ggc cgg atc 432
Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile
130 135 140 130 135 140
tca gtg ctc aag atc cag aac ttc gag gtg cag ctc cta tcg gtc ttc 480tca gtg ctc aag atc cag aac ttc gag gtg cag ctc cta
Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe
145 150 155 160 145 150 155 160
gcc cag gcc gcc aac ttg cac ctg agc ctc ctg cgg gac gtt gtg ttc 528gcc cag gcc gcc aac ttg cac ctg agc ctc ctg cgg gac gtt gtg ttc 528
Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe
165 170 175 165 170 175
ttc ggc cag cgg tgg ggc ttc tct act acg acc gtg aac aac tac tac 576ttc ggc cag cgg tgg ggc ttc tct act acg acc gtg aac aac tac tac 576
Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr
180 185 190 180 185 190
aac gac ctg acg gag gaa atc agc acc tac aca gat tac gca gtt cgt 624aac gac ctg acg gag gaa atc agc acc tac aca gat tac gca gtt cgt 624
Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg
195 200 205 195 200 205
tgg tac aac acc ggc ctt gag cgc gtg tgg ggc ccg gac tcc cgc gat 672tgg tac aac acc ggc ctt gag cgc gtg tgg ggc ccg gac tcc cgc gat 672
Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp
210 215 220 210 215 220
tgg gtc cgc tac aac cag ttc cgc cgc gag ctg acg ctt aca gtg ctg 720tgg gtc cgc tac aac cag ttc cgc cgc gag ctg acg ctt aca gtg ctg 720
Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240 225 230 235 240
gac atc gtc gca ctc ttt cct aac tac gac tcc agg cgc tat ccc atc 768gac atc gtc gca ctc ttt cct aac tac gac tcc agg cgc tat ccc atc 768
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile
245 250 255 245 250 255
agg aca gtg tca cag ctc acc cgc gag atc tac aca aac ccg gtg ctt 816agg aca gtg tca cag ctc acc cgc gag atc tac aca aac ccg gtg ctt 816
Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu
260 265 270 260 265 270
gag aac ttc gac ggc agc ttc cgt ggc atg gcg cag cgc att gaa cag 864gag aac ttc gac ggc agc ttc cgt ggc atg gcg cag cgc att gaa cag 864
Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln
275 280 285 275 280 285
aac atc cgc cag ccg cac ctt atg gac atc ttg aac agt atc act atc 912aac atc cgc cag cg cac ctt atg gac atc ttg aac agt atc act atc 912
Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile
290 295 300 290 295 300
tac acc gac gtc cac aga ggc ttc aac tac tgg agc gga cac cag atc 960tac acc gac gtc cac aga ggc ttc aac tac tgg agc gga
Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile
305 310 315 320 305 310 315 320
aca gcc agc ccg gta ggc ttc tcg ggt cca gag ttc gcc ttc ccg ctg 1008aca gcc agc ccg gta ggc ttc tcg ggt cca gag ttc gcc ttc ccg ctg 1008
Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu
325 330 335 325 330 335
ttt ggg aac gct ggc aat gcc gcg ccg ccc gtg ctg gtc agc ctc act 1056ttt ggg aac gct ggc aat gcc gcg ccg ccc gtg ctg gtc agc ctc act 1056
Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr
340 345 350 340 345 350
ggt ctc ggc atc ttc cgc aca ctt tcc tcg ccg ctg tac agg agg atc 1104ggt ctc ggc atc ttc cgc aca ctt tcc tcg ccg ctg tac agg agg atc 1104
Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile
355 360 365 355 360 365
atc ctc ggg tcc ggt ccg aac aac cag gag ctg ttc gtg ctc gac ggg 1152atc ctc ggg tcc ggt ccg aac aac cag gag ctg ttc gtg ctc gac ggg 1152
Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly
370 375 380 370 375 380
acc gag ttc agt ttc gcc agc ctc acg acg aac ctc ccg tcc acc atc 1200acc gag ttc agt ttc gcc agc ctc acg acg aac ctc ccg tcc acc atc 1200
Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile
385 390 395 400 385 390 395 400
tat cgc cag cgc gga acg gtc gat tcc ctg gat gtt atc cca ccg caa 1248tat cgc cag cgc gga acg gtc gat tcc ctg gat gtt atc cca ccg caa 1248
Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln
405 410 415 405 410 415
gac aat tct gtg ccg ccg agg gcc ggg ttc tcc cac cgg ctg tct cac 1296gac aat tct gtg ccg ccg agg gcc ggg ttc tcc cac cgg ctg tct cac 1296
Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His
420 425 430 420 425 430
gtg act atg ctt tca cag gcc gcc gga gcc gtg tac acg ctc cgt gcg 1344gtg act atg ctt tca cag gcc gcc gga gcc gtg tac acg ctc cgt gcg 1344
Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala
435 440 445 435 440 445
cct act ttc tcc tgg cag cac cgc agc gcg acc acg acc aac atc atc 1392cct act ttc tcc tgg cag cac cgc agc gcg acc acg acc aac atc atc 1392
Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile
450 455 460 450 455 460
gca gca gac tcc atc acc cag atc ccg gcc gtt aag ggc cgc agc atc 1440gca gca gac tcc atc acc cag atc ccg gcc gtt aag ggc cgc agc atc 1440
Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile
465 470 475 480 465 470 475 480
atc aac aac gga act gtc atc agc ggt ccg ggc ttc acg ggc ggc gac 1488atc aac aac gga act gtc atc agc ggt ccg ggc ttc acg ggc ggc gac 1488
Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp
485 490 495 485 490 495
ctg gtc cgg ctc tac aac gca gac ttc aac atc aat aac cgc gct tat 1536ctg gtc cgg ctc tac aac gca gac ttc aac atc aat aac cgc gct tat 1536
Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr
500 505 510 500 505 510
ctt gaa gta cct atc ttc ttc cag agc ccg agc act aac tac cgg gtt 1584ctt gaa gta cct atc ttc ttc cag agc ccg agc act aac tac cgg gtt 1584
Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val
515 520 525 515 520 525
cgc gtc cgc tac gcc agc acc tcc agc ctc cct gtg gat gtc gtg ttc 1632cgc gtc cgc tac gcc agc acc tcc agc ctc cct gtg gat gtc gtg ttc 1632
Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe
530 535 540 530 535 540
gga aac ata agc cat ccg acc acg ttc cca gcc acg gct agg agc ctg 1680gga aac ata agc cat ccg acc acg ttc cca gcc acg gct agg agc ctg 1680
Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu
545 550 555 560 545 550 555 560
gac aac cta cag agc aac gac ttc ggc tac atc gac atc gcg ggc acc 1728gac aac cta cag agc aac gac ttc ggc tac atc gac atc gcg ggc acc 1728
Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr
565 570 575 565 570 575
ttt ctg cca agc ctg ggt ccg tct atc ggc atc cgc ccg atg ctg agc 1776ttt ctg cca agc ctg ggt ccg tct atc ggc atc cgc ccg atg ctg agc 1776
Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser
580 585 590 580 585 590
act atc aac cta att gtg gac cgg ttc gag ttt atc ccg gtg acg gca 1824act atc aac cta att gtg gac cgg ttc gag ttt atc ccg gtg acg gca 1824
Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala
595 600 605 595 600 605
acg ttc gag gcg gag tct gac ctc gaa agg gca cag aag gcc gtg aac 1872acg ttc gag gcg gag tct gac ctc gaa agg gca cag aag gcc gtg aac 1872
Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn
610 615 620 610 615 620
gcc ctg ttc acg agc acc aac cag ctt ggc att aag act gat gtc acc 1920gcc ctg ttc acg agc acc aac cag ctt ggc att aag act gat gtc acc 1920
Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr
625 630 635 640 625 630 635 640
gac tac cac att gac caa gtc agc aac ctg gtg gag tgc ctc tcg gac 1968gac tac cac att gac caa gtc agc aac ctg gtg gag tgc ctc tcg gac 1968
Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp
645 650 655 645 650 655
gag ttc tat ctt gat gag aaa cgg gaa cta agc gag aag gtg aag cac 2016gag ttc tat ctt gat gag aaa cgg gaa cta agc gag aag gtg aag cac 2016
Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His
660 665 670 660 665 670
gca aag cgc ttg agc gac gag cgg aac tta ctc cag gac cct aac ttc 2064gca aag cgc ttg agc gac gag cgg aac tta ctc cag gac cct aac ttc 2064
Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe
675 680 685 675 680 685
cgt ggg att aac cgc cag ccg gat cgc ggg tgg cgc ggc tca acg gac 2112cgt ggg att aac cgc cag ccg gat cgc ggg tgg cgc ggc tca acg gac 2112
Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp
690 695 700 690 695 700
atc acc atc cag ggc ggc gat gac gtc ttc aag gag aac tac gtg acc 2160atc acc atc cag ggc ggc gat gac gtc ttc aag gag aac tac gtg acc 2160
Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr
705 710 715 720 705 710 715 720
ctc cct ggc acg ttc gac gag tgc tac ccg acg tac ctt tat cag aag 2208ctc cct ggc acg ttc gac gag tgc tac ccg acg tac ctt tat cag aag 2208
Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys
725 730 735 725 730 735
att gac gaa agc aag ctg aaa gcc tac acc cgc tac cag ttg cgc ggc 2256att gac gaa agc aag ctg aaa gcc tac acc cgc tac cag ttg cgc ggc 2256
Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly
740 745 750 740 745 750
tac atc gag gac tct caa gac ctg gag atc tac ttg att cga tac aac 2304tac atc gag gac tct caa gac ctg gag atc tac ttg att cga tac aac 2304
Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn
755 760 765 755 760 765
gcg aaa cac gag acc gtc aac gtg ccg ggc act ggg agc ctg tgg ccg 2352gcg aaa cac gag acc gtc aac gtg ccg ggc act ggg agc ctg tgg ccg 2352
Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro
770 775 780 770 775 780
ttg tct gca caa agt ccg atc ggc aag tgc ggc gag cca aac cgg tgc 2400ttg tct gca caa agt ccg atc ggc aag tgc ggc gag cca aac cgg tgc 2400
Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys
785 790 795 800 785 790 795 800
gct ccg cac ctg gag tgg aac cca gac ctt cat tgc tcc tgt agg gat 2448gct ccg cac ctg gag tgg aac cca gac ctt cat tgc tcc tgt agg gat 2448
Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp
805 810 815 805 810 815
ggc gag aag tgc gct cac cac agc cat cac ttc agc ctc gac att gac 2496ggc gag aag tgc gct cac cac agc cat cac ttc agc ctc gac att gac 2496
Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp
820 825 830 820 825 830
gtc ggc tgt acc gac ctt aat gag gat ctg ggt gtg tgg gtg atc ttc 2544gtc ggc tgt acc gac ctt aat gag gat ctg ggt gtg tgg gtg atc ttc 2544
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
835 840 845 835 840 845
aag atc aag acc cag gac ggt cac gcc cgg ttg ggc aat ctg gag ttc 2592aag atc aag acc cag gac ggt cac gcc cgg ttg ggc aat ctg gag ttc 2592
Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe
850 855 860 850 855 860
ctg gag gag aag ccg ctg gtt ggc gag gct ctc gcg cgg gtc aag cgg 2640ctg gag gag aag ccg ctg gtt ggc gag gct ctc gcg cgg gtc aag cgg 2640
Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg
865 870 875 880 865 870 875 880
gcg gag aag aag tgg cgg gac aaa cgc gag aag ctc cag tta gag acg 2688gcg gag aag aag tgg cgg gac aaa cgc gag aag ctc cag tta gag acg 2688
Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr
885 890 895 885 890 895
aac atc gtg tac aag gag gcg aag gaa tcc gtg gac gca cta ttc gtg 2736aac atc gtg tac aag gag gcg aag gaa tcc gtg gac gca cta ttc gtg 2736
Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
900 905 910 900 905 910
aac agc cag tac gac caa ctc cag gcc gac acc aac atc gcc atg att 2784aac agc cag tac gac caa ctc cag gcc gac acc aac atc gcc atg att 2784
Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile
915 920 925 915 920 925
cac gca gcc gac aag agg gtg cac cgc atc cgc gaa gcc tac ctt ccc 2832cac gca gcc gac aag agg gtg cac cgc atc cgc gaa gcc tac ctt ccc 2832
His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro
930 935 940 930 935 940
gaa ctt tcg gtc atc cca ggc gtc aac gct gac atc tcg gag gaa ttg 2880gaa ctt tcg gtc atc cca ggc gtc aac gct gac atc tcg gag gaa ttg 2880
Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu
945 950 955 960 945 950 955 960
gag ggc aga atc ttc acg gcc ttc tct ttg tac gat gcc agg aac gtc 2928gag ggc aga atc ttc acg gcc ttc tct ttg tac gat gcc agg aac gtc 2928
Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val
965 970 975 965 970 975
atc aag aac ggc gac ttc aac aac ggc ctg ctg tgc tgg aac gtg aag 2976atc aag aac ggc gac ttc aac aac ggc ctg ctg tgc tgg aac gtg aag 2976
Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys
980 985 990 980 985 990
ggc cac gtg gac gtc gag gag cag aac aac cac aga tca gtc ctg gtg 3024ggc cac gtg gac gtc gag gag cag aac aac cac aga tca gtc ctg gtg 3024
Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val
995 1000 1005 995 1000 1005
gtg ccc gag tgg gaa gcc gaa gtc tca caa gaa gtc cgg gtg tgc 3069gtg ccc gag tgg gaa gcc gaa gtc tca caa gaa gtc cgg gtg tgc 3069
Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010 1015 1020 1010 1015 1020
cct gga cgc ggg tac att ctc cgc gtg acc gcc tac aag gag ggc 3114cct gga cgc ggg tac att ctc cgc gtg acc gcc tac aag gag ggc 3114
Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly
1025 1030 1035 1025 1030 1035
tac ggt gag ggc tgc gtg acc atc cac gag atc gag aac aac acc 3159tac ggt gag ggc tgc gtg acc atc cac gag atc gag aac aac acc 3159
Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr
1040 1045 1050 1040 1045 1050
gac gag ctg aaa ttc agt aac tgt gtt gag gag gag gtg tac ccg 3204gac gag ctg aaa ttc agt aac tgt gtt gag gag gag gtg tac ccg 3204
Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro
1055 1060 1065 1055 1060 1065
aac aac acc gtc acc tgc aac gac tac act gcg aac cag gag gaa 3249aac aac acc gtc acc tgc aac gac tac act gcg aac cag gag gaa 3249
Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu
1070 1075 1080 1070 1075 1080
tac gag ggc acg tac acg agc cgc aat cgc ggg tac gac gag gcg 3294tac gag ggc acg tac acg agc cgc aat cgc ggg tac gac gag gcg 3294
Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala
1085 1090 1095 1085 1090 1095
tac gag agc aac tcc agc gtc ccg gcc gag tac gcc tcc gtg tac 3339tac gag agc aac tcc agc gtc ccg gcc gag tac gcc tcc gtg tac 3339
Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr
1100 1105 1110 1100 1105 1110
gag gag aag gtt tac acc gac ggg agg cgt ggc aac ccg tgc gag 3384gag gag aag gtt tac acc gac ggg agg cgt ggc aac ccg tgc gag 3384
Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu
1115 1120 1125 1115 1120 1125
agc aac aga ggc tac ggc gat tac act ccg ctt ccc gct ggc tac 3429agc aac aga ggc tac ggc gat tac act ccg ctt ccc gct ggc tac 3429
Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr
1130 1135 1140 1130 1135 1140
gtg acg aaa gag ctg gag tac ttc cca gag acc gac aag gtg tgg 3474gtg acg aaa gag ctg gag tac ttc cca gag acc gac aag gtg tgg 3474
Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp
1145 1150 1155 1145 1150 1155
atc gag atc gga gaa acg gag ggc acg ttc ata gtg gac tcc gtt 3519atc gag atc gga gaa acg gag ggc acg ttc ata gtg gac tcc gtt 3519
Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val
1160 1165 1170 1160 1165 1170
gag ctg ctg ctc atg gag gag tag 3543gag ctg ctg ctc atg gag gag tag 3543
Glu Leu Leu Leu Met Glu Glu Glu Leu Leu Leu Met Glu Glu
1175 1180 1175 1180
<210> 8<210> 8
<211> 1180<211> 1180
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетическая конструкция<223> Synthetic construction
<400> 8<400> 8
Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn
1 5 10 15 1 5 10 15
Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn
20 25 30 20 25 30
Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu
35 40 45 35 40 45
Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp
50 55 60 50 55 60
Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu
65 70 75 80 65 70 75 80
Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile
85 90 95 85 90 95
Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala
100 105 110 100 105 110
Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala
115 120 125 115 120 125
Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile
130 135 140 130 135 140
Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe
145 150 155 160 145 150 155 160
Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe
165 170 175 165 170 175
Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr
180 185 190 180 185 190
Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg
195 200 205 195 200 205
Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp
210 215 220 210 215 220
Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240 225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile
245 250 255 245 250 255
Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu
260 265 270 260 265 270
Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln
275 280 285 275 280 285
Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile
290 295 300 290 295 300
Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile
305 310 315 320 305 310 315 320
Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu
325 330 335 325 330 335
Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr
340 345 350 340 345 350
Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile
355 360 365 355 360 365
Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly
370 375 380 370 375 380
Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile
385 390 395 400 385 390 395 400
Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln
405 410 415 405 410 415
Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His
420 425 430 420 425 430
Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala
435 440 445 435 440 445
Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile
450 455 460 450 455 460
Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile
465 470 475 480 465 470 475 480
Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp
485 490 495 485 490 495
Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr
500 505 510 500 505 510
Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val
515 520 525 515 520 525
Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe
530 535 540 530 535 540
Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu
545 550 555 560 545 550 555 560
Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr
565 570 575 565 570 575
Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser
580 585 590 580 585 590
Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala
595 600 605 595 600 605
Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn
610 615 620 610 615 620
Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr
625 630 635 640 625 630 635 640
Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp
645 650 655 645 650 655
Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His
660 665 670 660 665 670
Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe
675 680 685 675 680 685
Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp
690 695 700 690 695 700
Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr
705 710 715 720 705 710 715 720
Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys
725 730 735 725 730 735
Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly
740 745 750 740 745 750
Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn
755 760 765 755 760 765
Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro
770 775 780 770 775 780
Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys
785 790 795 800 785 790 795 800
Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp
805 810 815 805 810 815
Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp
820 825 830 820 825 830
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
835 840 845 835 840 845
Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe
850 855 860 850 855 860
Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg
865 870 875 880 865 870 875 880
Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr
885 890 895 885 890 895
Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
900 905 910 900 905 910
Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile
915 920 925 915 920 925
His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro
930 935 940 930 935 940
Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu
945 950 955 960 945 950 955 960
Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val
965 970 975 965 970 975
Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys
980 985 990 980 985 990
Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val
995 1000 1005 995 1000 1005
Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010 1015 1020 1010 1015 1020
Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly
1025 1030 1035 1025 1030 1035
Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr
1040 1045 1050 1040 1045 1050
Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro
1055 1060 1065 1055 1060 1065
Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu
1070 1075 1080 1070 1075 1080
Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala
1085 1090 1095 1085 1090 1095
Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr
1100 1105 1110 1100 1105 1110
Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu
1115 1120 1125 1115 1120 1125
Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr
1130 1135 1140 1130 1135 1140
Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp
1145 1150 1155 1145 1150 1155
Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val
1160 1165 1170 1160 1165 1170
Glu Leu Leu Leu Met Glu Glu Glu Leu Leu Leu Met Glu Glu
1175 1180 1175 1180
<210> 9<210> 9
<211> 3534<211> 3534
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Полностью синтетическая последовательность, кодирующая<223> Fully synthetic sequence encoding
CW 002 для применения в растениях
<220><220>
<221> CDS<221> CDS
<222> (1)..(3531)<222> (1)..(3531)
<223> BCW 002<223>
<400> 9<400> 9
atg gac aac aac ccg aac atc aac gag tgc atc ccc tac aac tgc ctc 48atg gac aac aac ccg aac atc aac gag tgc atc ccc tac aac tgc ctc 48
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15 1 5 10 15
tcc aac ccg gag gtc gag gtg ctg ggc ggc gaa agg atc gag acc ggc 96tcc aac ccg gag gtc gag gtg ctg ggc ggc gaa agg atc gag acc ggc 96
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30 20 25 30
tac act ccc atc gac atc agc ctc agc ctg acc cag ttc ctg ctc tct 144tac act ccc atc gac atc agc ctc agc ctg acc cag ttc ctg ctc tct 144
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45 35 40 45
gag ttc gtg ccc ggc gcg ggg ttc gtt ctc ggc ctg gtc gac atc atc 192gag ttc gtg ccc ggc gcg ggg ttc gtt ctc ggc ctg gtc gac atc atc 192
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60 50 55 60
tgg ggc atc ttc ggt ccg agc cag tgg gac gcc ttt ctc gtt cag att 240tgg ggc atc ttc ggt ccg agc cag tgg gac gcc ttt ctc gtt cag att 240
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80 65 70 75 80
gag cag ctg atc aac cag cgc atc gag gag ttc gcc cgc aac cag gcg 288gag cag ctg atc aac cag cgc atc gag gag ttc gcc cgc aac cag gcg 288
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95 85 90 95
atc tcc cgg ctg gag ggc ctc tcc aac ctg tac caa atc tac gcc gag 336atc tcc cgg ctg gag ggc ctc tcc aac ctg tac caa atc tac gcc gag 336
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110 100 105 110
agc ttc cgg gag tgg gaa gcc gat ccg acc aac ccc gct ctc agg gag 384agc ttc cgg gag tgg gaa gcc gat ccg acc aac ccc gct ctc agg gag 384
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125 115 120 125
gag atg cgg att cag ttc aac gac atg aac tcc gct ctc acg act gcc 432gag atg cgg att cag ttc aac gac atg aac tcc gct ctc acg act gcc 432
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140 130 135 140
atc cca ctc ctc gct gtg cag aac tac caa gtg ccg ctc ctg tcc gtg 480atc cca ctc ctc gct gtg cag aac tac caa gtg ccg ctc ctg tcc gtg 480
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160 145 150 155 160
tac gtg cag gcc gcc aat ctg cac ctc tcc gtc ctc cgg gac gtt agc 528tac gtg cag gcc gcc aat ctg cac ctc tcc gtc ctc cgg gac gtt agc 528
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175 165 170 175
gtg ttc ggg cag cgc tgg ggc ttc gac gcc gct acc atc aac tcc cgt 576gtg ttc ggg cag cgc tgg ggc ttc gac gcc gct acc atc aac tcc cgt 576
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190 180 185 190
tac aac gat ctc act cgc ctc atc ggc aac tac acc gac tat gcc gtg 624tac aac gat ctc act cgc ctc atc ggc aac tac acc gac tat gcc gtg 624
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205 195 200 205
cgc tgg tac aac act ggt ctt gag aga gtc tgg ggc ccg gac agc cgc 672cgc tgg tac aac act ggt ctt gag aga gtc tgg ggc ccg gac agc cgc 672
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220 210 215 220
gac tgg gtg cgc tac aac cag ttc cgg cgc gag ctg acc ctc acc gtg 720gac tgg gtg cgc tac aac cag ttc cgg cgc gag ctg acc
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240 225 230 235 240
ctc gac atc gta gcc ctc ttt ccc aac tac gac tcc cgg cgc tac ccg 768ctc gac atc gta gcc ctc ttt ccc aac tac gac tcc cgg cgc tac ccg 768
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255 245 250 255
att cgc atc gtc agc cag ctc acc agg gag atc tac acc aac cct gtg 816att cgc atc gtc agc cag ctc acc agg gag atc tac acc aac cct gtg 816
Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270 260 265 270
ctg gag aac ttc gac ggc tcc ttt cgc ggg atg gcc caa cgc ata gag 864ctg gag aac ttc gac ggc tcc ttt cgc ggg atg gcc caa cgc ata gag 864
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285 275 280 285
cag aac atc cgc caa cct cat ctg atg gac atc ctt aat tct atc acc 912cag aac atc cgc caa cct cat ctg atg gac atc ctt aat tct atc acc 912
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300 290 295 300
atc tac act gac gtt cat cgc ggg ttt aac tac tgg tcg ggc cac caa 960atc tac act gac gtt cat cgc ggg ttt aac tac tgg tcg ggc
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320 305 310 315 320
atc act gcg tcg ccc gtt ggt ttc tcc ggc ccg gag ttc gcg ttc cct 1008atc act gcg tcg ccc gtt ggt ttc tcc ggc ccg gag ttc gcg ttc cct 1008
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335 325 330 335
ctg ttc gga aac gcg ggc aat gcc gct cca ccc gta ttg gtg agc ctg 1056ctg ttc gga aac gcg ggc aat gcc gct cca ccc gta ttg gtg agc ctg 1056
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Val Leu Val Ser Leu
340 345 350 340 345 350
acc ggc ctc ggc atc ttc cgt aca ctg tct agc cct ctg tac aga agg 1104acc ggc ctc ggc atc ttc cgt aca ctg tct agc cct ctg tac aga agg 1104
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365 355 360 365
atc att ctt ggc agc ggt ccc aat aac cag gaa ctc ttc gtg ttg gac 1152atc att ctt ggc agc ggt ccc aat aac cag gaa ctc ttc gtg ttg gac 1152
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380 370 375 380
ggc acc gag ttc agc ttc gcc agt ctt acg acc aat ttg ccc tcc aca 1200ggc acc gag ttc agc ttc gcc agt ctt acg acc aat ttg ccc tcc aca 1200
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400 385 390 395 400
atc tat cgc cag cgc ggt act gtg gac tcc ctt gat gtg ata cca cct 1248atc tat cgc cag cgc ggt act gtg gac tcc ctt gat gtg ata cca cct 1248
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415 405 410 415
cag gac aac tct gtc cca cct cgc gcc ggt ttc tcc cac cgc ctc agc 1296cag gac aac tct gtc cca cct cgc gcc ggt ttc tcc cac cgc ctc agc 1296
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430 420 425 430
cac gtc act atg ctg agt cag gct gcg gga gcc gtg tac acc ctt cgg 1344cac gtc act atg ctg agt cag gct gcg gga gcc gtg tac acc ctt cgg 1344
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445 435 440 445
gct ccg acg ttt agc tgg cag cac agg agc gcg act acc acg aac atc 1392gct ccg acg ttt agc tgg cag cac agg agc gcg act acc acg aac atc 1392
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460 450 455 460
att gcg gct gac tcc atc act caa atc cct gcc gtt aag ggt cgc tcc 1440att gcg gct gac tcc atc act caa atc cct gcc gtt aag ggt cgc tcc 1440
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480 465 470 475 480
atc atc aac aat ggg aca gtg atc tcg gga ccg ggc ttc acc ggc ggt 1488atc atc aac aat ggg aca gtg atc tcg gga ccg ggc ttc acc ggc ggt 1488
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495 485 490 495
gac ctg gtg agg ctg tac aac gcg gac ttc aac atc aac aac agg gcg 1536gac ctg gtg agg ctg tac aac gcg gac ttc aac atc aac aac agg gcg 1536
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510 500 505 510
tac ctc gaa gtc ccg atc ttc ttc cag tcg ccc agc acg aac tat cgt 1584tac ctc gaa gtc ccg atc ttc ttc cag tcg ccc agc acg aac tat cgt 1584
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525 515 520 525
gtc agg gtc cgg tac gcc tca acc tca tcc ctc ccg gtc gat gtg gtc 1632gtc agg gtc cgg tac gcc tca acc tca tcc ctc ccg gtc gat gtg gtc 1632
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540 530 535 540
ttc ggc aac atc agc cac ccg acc acg ttt ccg gct acc gcc cga tcc 1680ttc ggc aac atc agc cac ccg acc acg ttt ccg gct acc gcc cga tcc 1680
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560 545 550 555 560
ctg gac aat ctg caa agc aac gat ttc ggc tac att gac att gcc ggg 1728ctg gac aat ctg caa agc aac gat ttc ggc tac att gac att gcc ggg 1728
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575 565 570 575
acg ttc ctc ccg agc ctc ggc cca tcc atc ggc atc cgg ccc atg ctc 1776acg ttc ctc ccg agc ctc ggc cca tcc atc ggc atc cgg ccc atg ctc 1776
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590 580 585 590
tcc acc atc aac ctg atc gtg gat cgg ttt gag ttc atc cca gtg aca 1824tcc acc atc aac ctg atc gtg gat cgg ttt gag ttc atc cca gtg aca 1824
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605 595 600 605
gcc act ttc gag gct gag tcc gac cta gag cgt gct cag aag gca gtc 1872gcc act ttc gag gct gag tcc gac cta gag cgt gct cag aag gca gtc 1872
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620 610 615 620
aat gct ctg ttt acc tcc acc aat cag ctc ggc att aag acc gat gtg 1920aat gct ctg ttt acc tcc acc aat cag ctc ggc att aag acc gat gtg 1920
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640 625 630 635 640
acc gat tac cac att gac caa gtc tca aac ctc gtt gag tgc ctc tcg 1968acc gat tac cac att gac caa gtc tca aac ctc gtt gag tgc ctc tcg 1968
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655 645 650 655
gat gag ttc tac ctt gat gag aag agg gag ctt tca gag aaa gtt aag 2016gat gag ttc tac ctt gat gag aag agg gag ctt tca gag aaa gtt aag 2016
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670 660 665 670
cac gct aag aga ctc tcg gac gaa cgc aat ctg ttg caa gat ccc aac 2064cac gct aag aga ctc tcg gac gaa cgc aat ctg ttg caa gat ccc aac 2064
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685 675 680 685
ttc aga ggg atc aac cgt cag cca gac cgg gga tgg cgc ggg tcc acg 2112ttc aga ggg atc aac cgt cag cca gac cgg gga tgg cgc ggg tcc acg 2112
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700 690 695 700
gac atc act atc cag ggc ggt gat gac gtc ttc aag gag aac tac gtg 2160gac atc act atc cag ggc ggt gat gac gtc ttc aag gag aac tac gtg 2160
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720 705 710 715 720
acc ctg ccg ggc acc ttt gac gaa tgc tac ccc act tac ctc tac cag 2208acc ctg ccg ggc acc ttt gac gaa tgc tac ccc act tac ctc tac cag 2208
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735 725 730 735
aag att gac gag tcc aag ctc aag gcg ttc aca cgc tac cag ctc agg 2256aag att gac gag tcc aag ctc aag gcg ttc aca cgc tac cag ctc agg 2256
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750 740 745 750
ggt tac atc gag gac tcc caa gac ctg gaa atc tac ctg atc cgc tac 2304ggt tac atc gag gac tcc caa gac ctg gaa atc tac ctg atc cgc tac 2304
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765 755 760 765
aac gct aag cac gag act gtc aac gtg ccc ggc acc ggc agc ctg tgg 2352aac gct aag cac gag act gtc aac gtg ccc ggc acc ggc agc ctg tgg 2352
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780 770 775 780
ccc ttg tcc gct cag agc cca atc ggc aag tgc ggc gag ccc aac cgc 2400ccc ttg tcc gct cag agc cca atc ggc aag tgc ggc gag ccc aac cgc 2400
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800 785 790 795 800
tgc gcg ccc cac ctg gaa tgg aac ccc gac ctc gac tgt agc tgc cgc 2448tgc gcg ccc cac ctg gaa tgg aac ccc gac ctc gac tgt agc tgc cgc 2448
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815 805 810 815
gac gga gag aag tgc gcg cat cac tcc cac cac ttc agc ctc gac atc 2496gac gga gag aag tgc gcg cat cac tcc cac cac ttc agc ctc gac atc 2496
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830 820 825 830
gac gtc ggt tgc acc gac ctt aac gag gat ctg ggc gtt tgg gtg atc 2544gac gtc ggt tgc acc gac ctt aac gag gat ctg ggc gtt tgg gtg atc 2544
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845 835 840 845
ttc aag atc aag act cag gac ggc cac gcc cgc ctg gga aac ctg gag 2592ttc aag atc aag act cag gac ggc cac gcc cgc ctg gga aac ctg gag 2592
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860 850 855 860
ttc ctg gag gag aag ccc ctc gtt ggc gag gcc ctg gcc cgc gtc aag 2640ttc ctg gag gag aag ccc ctc gtt ggc gag gcc ctg gcc cgc gtc aag 2640
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880 865 870 875 880
agg gcc gag aag aaa tgg cgc gac aag cgc gag aag ctg gag tgg gag 2688agg gcc gag aag aaa tgg cgc gac aag cgc gag aag ctg gag tgg gag 2688
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895 885 890 895
acc aac atc gtg tac aag gaa gcg aag gag tca gtt gac gcc ctg ttc 2736acc aac atc gtg tac aag gaa gcg aag gag tca gtt gac gcc ctg ttc 2736
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910 900 905 910
gtc aac agc cag tac gac cag ctc cag gca gac aca aac atc gct atg 2784gtc aac agc cag tac gac cag ctc cag gca gac aca aac atc gct atg 2784
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925 915 920 925
atc cat gcg gcc gac aag cgc gtc cac tcc atc cgc gag gcg tac ctg 2832atc cat gcg gcc gac aag cgc gtc cac tcc atc cgc gag gcg tac ctg 2832
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940 930 935 940
ccc gag ctg tcc gtc atc ccc ggc gtc aac gcc gcg atc ttt gag gag 2880ccc gag ctg tcc gtc atc ccc ggc gtc aac gcc gcg atc ttt gag gag 2880
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960 945 950 955 960
ctg gag ggc cgc atc ttc acc gcc ttc tcc ctc tac gac gca cgc aac 2928ctg gag ggc cgc atc ttc acc gcc ttc tcc ctc tac gac gca cgc aac 2928
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975 965 970 975
gtt atc aag aat ggc gac ttc aac aac ggg ctg tcc tgc tgg aat gtc 2976gtt atc aag aat ggc gac ttc aac aac ggg ctg tcc tgc tgg aat gtc 2976
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990 980 985 990
aag ggc cac gtg gac gtc gag gag cag aac aac cag cgc tca gtc ctg 3024aag ggc cac gtg gac gtc gag gag cag aac aac cag cgc tca gtc ctg 3024
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005 995 1000 1005
gtc gtc ccg gag tgg gag gcc gaa gtc agc cag gaa gtc cgc gtc 3069gtc gtc ccg gag tgg gag gcc gaa gtc agc cag gaa gtc cgc gtc 3069
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020 1010 1015 1020
tgc cct gga cgc ggg tac atc ctg cgc gtc act gcc tac aag gaa 3114tgc cct gga cgc ggg tac atc ctg cgc gtc act gcc tac aag gaa 3114
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035 1025 1030 1035
ggc tac gga gag ggc tgc gtc acc atc cat gag atc gaa aac aac 3159ggc tac gga gag ggc tgc gtc acc atc cat gag atc gaa aac aac 3159
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050 1040 1045 1050
acg gat gag ctt aag ttc agc aac tgt gtt gaa gag gaa atc tac 3204acg gat gag ctt aag ttc agc aac tgt gtt gaa gag gaa atc tac 3204
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065 1055 1060 1065
ccg aac aac acg gtc acc tgc aat gat tac acc gtc aac cag gag 3249ccg aac aac acg gtc acc tgc aat gat tac acc gtc aac cag gag 3249
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080 1070 1075 1080
gaa tac ggt gga gct tac acc tcc cgc aac agg ggc tac aac gag 3294gaa tac ggt gga gct tac acc tcc cgc aac agg ggc tac aac gag 3294
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095 1085 1090 1095
gca ccc tct gtc ccg gcc gac tac gct tca gtc tac gaa gag aag 3339gca ccc tct gtc ccg gcc gac tac gct tca gtc tac gaa gag aag 3339
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110 1100 1105 1110
tcg tac acc gac gga cgc aga gag aac ccg tgt gag ttc aac cgc 3384tcg tac acc gac gga cgc aga gag aac ccg tgt gag ttc aac cgc 3384
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125 1115 1120 1125
ggc tac cgc gat tac acc ccg ctg cct gtc ggg tac gtc acc aaa 3429ggc tac cgc gat tac acc ccg ctg cct gtc ggg tac gtc acc aaa 3429
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140 1130 1135 1140
gag ctg gaa tac ttc cca gag acc gac aaa gtc tgg att gag atc 3474gag ctg gaa tac ttc cca gag acc gac aaa gtc tgg att gag atc 3474
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155 1145 1150 1155
ggc gag acc gag ggc acg ttc atc gtg gac tcc gtc gaa ctc ctt 3519ggc gag acc gag ggc acg ttc atc gtg gac tcc gtc gaa ctc ctt 3519
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170 1160 1165 1170
ctg atg gaa gag tga 3534ctg atg gaa gag tga 3534
Leu Met Glu Glu Leu Met Glu Glu
1175 1175
<210> 10<210> 10
<211> 1177<211> 1177
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетическая конструкция<223> Synthetic construction
<400> 10<400> 10
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15 1 5 10 15
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30 20 25 30
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45 35 40 45
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60 50 55 60
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80 65 70 75 80
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95 85 90 95
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110 100 105 110
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125 115 120 125
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140 130 135 140
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160 145 150 155 160
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175 165 170 175
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190 180 185 190
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205 195 200 205
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220 210 215 220
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240 225 230 235 240
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255 245 250 255
Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270 260 265 270
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285 275 280 285
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300 290 295 300
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320 305 310 315 320
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335 325 330 335
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Val Leu Val Ser Leu
340 345 350 340 345 350
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365 355 360 365
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380 370 375 380
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400 385 390 395 400
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415 405 410 415
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430 420 425 430
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445 435 440 445
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460 450 455 460
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480 465 470 475 480
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495 485 490 495
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510 500 505 510
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525 515 520 525
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540 530 535 540
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560 545 550 555 560
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575 565 570 575
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590 580 585 590
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605 595 600 605
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620 610 615 620
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640 625 630 635 640
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655 645 650 655
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670 660 665 670
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685 675 680 685
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700 690 695 700
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720 705 710 715 720
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735 725 730 735
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750 740 745 750
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765 755 760 765
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780 770 775 780
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800 785 790 795 800
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815 805 810 815
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830 820 825 830
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845 835 840 845
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860 850 855 860
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880 865 870 875 880
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895 885 890 895
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910 900 905 910
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925 915 920 925
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940 930 935 940
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960 945 950 955 960
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975 965 970 975
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990 980 985 990
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005 995 1000 1005
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020 1010 1015 1020
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035 1025 1030 1035
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050 1040 1045 1050
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065 1055 1060 1065
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080 1070 1075 1080
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095 1085 1090 1095
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110 1100 1105 1110
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125 1115 1120 1125
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140 1130 1135 1140
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155 1145 1150 1155
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170 1160 1165 1170
Leu Met Glu Glu Leu Met Glu Glu
1175 1175
<210> 11<210> 11
<211> 3534<211> 3534
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Полностью синтетическая нуклеотидная последовательность,<223> Fully synthetic nucleotide sequence,
кодирующая BCW 003 для применения в растениях encoding
<220><220>
<221> CDS<221> CDS
<222> (1)..(3531)<222> (1)..(3531)
<223> BCW 003<223>
<400> 11<400> 11
atg gac aac aac ccg aac atc aac gag tgc atc ccc tac aac tgc ctc 48atg gac aac aac ccg aac atc aac gag tgc atc ccc tac aac tgc ctc 48
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15 1 5 10 15
tcc aac ccg gag gtc gag gtg ctg ggc ggc gaa agg atc gag acc ggc 96tcc aac ccg gag gtc gag gtg ctg ggc ggc gaa agg atc gag acc ggc 96
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30 20 25 30
tac act ccc atc gac atc agc ctc agc ctg acc cag ttc ctg ctc tct 144tac act ccc atc gac atc agc ctc agc ctg acc cag ttc ctg ctc tct 144
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45 35 40 45
gag ttc gtg ccc ggc gcg ggg ttc gtt ctc ggc ctg gtc gac atc atc 192gag ttc gtg ccc ggc gcg ggg ttc gtt ctc ggc ctg gtc gac atc atc 192
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60 50 55 60
tgg ggc atc ttc ggt ccg agc cag tgg gac gcc ttt ctc gtt cag att 240tgg ggc atc ttc ggt ccg agc cag tgg gac gcc ttt ctc gtt cag att 240
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80 65 70 75 80
gag cag ctg atc aac cag cgc atc gag gag ttc gcc cgc aac cag gcg 288gag cag ctg atc aac cag cgc atc gag gag ttc gcc cgc aac cag gcg 288
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95 85 90 95
atc tcc cgg ctg gag ggc ctc tcc aac ctg tac caa atc tac gcc gag 336atc tcc cgg ctg gag ggc ctc tcc aac ctg tac caa atc tac gcc gag 336
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110 100 105 110
agc ttc cgg gag tgg gaa gcc gat ccg acc aac ccc gct ctc agg gag 384agc ttc cgg gag tgg gaa gcc gat ccg acc aac ccc gct ctc agg gag 384
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125 115 120 125
gag atg cgg att cag ttc aac gac atg aac tcc gct ctc acg act gcc 432gag atg cgg att cag ttc aac gac atg aac tcc gct ctc acg act gcc 432
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140 130 135 140
atc cca ctc ctc gct gtg cag aac tac caa gtg ccg ctc ctg tcc gtg 480atc cca ctc ctc gct gtg cag aac tac caa gtg ccg ctc ctg tcc gtg 480
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160 145 150 155 160
tac gtg cag gcc gcc aat ctg cac ctc tcc gtc ctc cgg gac gtt agc 528tac gtg cag gcc gcc aat ctg cac ctc tcc gtc ctc cgg gac gtt agc 528
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175 165 170 175
gtg ttc ggg cag cgc tgg ggc ttc gac gcc gct acc atc aac tcc cgt 576gtg ttc ggg cag cgc tgg ggc ttc gac gcc gct acc atc aac tcc cgt 576
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190 180 185 190
tac aac gat ctc act cgc ctc atc ggc aac tac acc gac tat gcc gtg 624tac aac gat ctc act cgc ctc atc ggc aac tac acc gac tat gcc gtg 624
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205 195 200 205
cgc tgg tac aac act ggt ctt gag aga gtc tgg ggc ccg gac agc cgc 672cgc tgg tac aac act ggt ctt gag aga gtc tgg ggc ccg gac agc cgc 672
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220 210 215 220
gac tgg gtg cgc tac aac cag ttc cgg cgc gag ctg acc ctc acc gtg 720gac tgg gtg cgc tac aac cag ttc cgg cgc gag ctg acc
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240 225 230 235 240
ctc gac atc gta gcc ctc ttt ccc aac tac gac tcc cgg cgc tac ccg 768ctc gac atc gta gcc ctc ttt ccc aac tac gac tcc cgg cgc tac ccg 768
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255 245 250 255
att cgc acc gtc agc cag ctc acc agg gag atc tac acc aac cct gtg 816att cgc acc gtc agc cag ctc acc agg gag atc tac acc aac cct gtg 816
Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270 260 265 270
ctg gag aac ttc gac ggc tcc ttt cgc ggg atg gcc caa cgc ata gag 864ctg gag aac ttc gac ggc tcc ttt cgc ggg atg gcc caa cgc ata gag 864
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285 275 280 285
cag aac atc cgc caa cct cat ctg atg gac atc ctt aat tct atc acc 912cag aac atc cgc caa cct cat ctg atg gac atc ctt aat tct atc acc 912
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300 290 295 300
atc tac act gac gtt cat cgc ggg ttt aac tac tgg tcg ggc cac caa 960atc tac act gac gtt cat cgc ggg ttt aac tac tgg tcg ggc
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320 305 310 315 320
atc act gcg tcg ccc gtt ggt ttc tcc ggc ccg gag ttc gcg ttc cct 1008atc act gcg tcg ccc gtt ggt ttc tcc ggc ccg gag ttc gcg ttc cct 1008
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335 325 330 335
ctg ttc gga aac gcg ggc aat gcc gct cca ccc gta ttg gtg agc ctg 1056ctg ttc gga aac gcg ggc aat gcc gct cca ccc gta ttg gtg agc ctg 1056
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Val Leu Val Ser Leu
340 345 350 340 345 350
acc ggc ctc ggc atc ttc cgt aca ctg tct agc cct ctg tac aga agg 1104acc ggc ctc ggc atc ttc cgt aca ctg tct agc cct ctg tac aga agg 1104
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365 355 360 365
atc att ctt ggc agc ggt ccc aat aac cag gaa ctc ttc gtg ttg gac 1152atc att ctt ggc agc ggt ccc aat aac cag gaa ctc ttc gtg ttg gac 1152
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380 370 375 380
ggc acc gag ttc agc ttc gcc agt ctt acg acc aat ttg ccc tcc aca 1200ggc acc gag ttc agc ttc gcc agt ctt acg acc aat ttg ccc tcc aca 1200
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400 385 390 395 400
atc tat cgc cag cgc ggt act gtg gac tcc ctt gat gtg ata cca cct 1248atc tat cgc cag cgc ggt act gtg gac tcc ctt gat gtg ata cca cct 1248
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415 405 410 415
cag gac aac tct gtc cca cct cgc gcc ggt ttc tcc cac cgc ctc agc 1296cag gac aac tct gtc cca cct cgc gcc ggt ttc tcc cac cgc ctc agc 1296
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430 420 425 430
cac gtc act atg ctg agt cag gct gcg gga gcc gtg tac acc ctt cgg 1344cac gtc act atg ctg agt cag gct gcg gga gcc gtg tac acc ctt cgg 1344
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445 435 440 445
gct ccg acg ttt agc tgg cag cac agg agc gcg act acc acg aac atc 1392gct ccg acg ttt agc tgg cag cac agg agc gcg act acc acg aac atc 1392
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460 450 455 460
att gcg gct gac tcc atc act caa atc cct gcc gtt aag ggt cgc tcc 1440att gcg gct gac tcc atc act caa atc cct gcc gtt aag ggt cgc tcc 1440
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480 465 470 475 480
atc atc aac aat ggg aca gtg atc tcg gga ccg ggc ttc acc ggc ggt 1488atc atc aac aat ggg aca gtg atc tcg gga ccg ggc ttc acc ggc ggt 1488
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495 485 490 495
gac ctg gtg agg ctg tac aac gcg gac ttc aac atc aac aac agg gcg 1536gac ctg gtg agg ctg tac aac gcg gac ttc aac atc aac aac agg gcg 1536
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510 500 505 510
tac ctc gaa gtc ccg atc ttc ttc cag tcg ccc agc acg aac tat cgt 1584tac ctc gaa gtc ccg atc ttc ttc cag tcg ccc agc acg aac tat cgt 1584
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525 515 520 525
gtc agg gtc cgg tac gcc tca acc tca tcc ctc ccg gtc gat gtg gtc 1632gtc agg gtc cgg tac gcc tca acc tca tcc ctc ccg gtc gat gtg gtc 1632
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540 530 535 540
ttc ggc aac atc agc cac ccg acc acg ttt ccg gct acc gcc cga tcc 1680ttc ggc aac atc agc cac ccg acc acg ttt ccg gct acc gcc cga tcc 1680
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560 545 550 555 560
ctg gac aat ctg caa agc aac gat ttc ggc tac att gac att gcc ggg 1728ctg gac aat ctg caa agc aac gat ttc ggc tac att gac att gcc ggg 1728
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575 565 570 575
acg ttc ctc ccg agc ctc ggc cca tcc atc ggc atc cgg ccc atg ctc 1776acg ttc ctc ccg agc ctc ggc cca tcc atc ggc atc cgg ccc atg ctc 1776
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590 580 585 590
tcc acc atc aac ctg atc gtg gat cgg ttt gag ttc atc cca gtg aca 1824tcc acc atc aac ctg atc gtg gat cgg ttt gag ttc atc cca gtg aca 1824
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605 595 600 605
gcc act ttc gag gct gag tcc gac cta gag cgt gct cag aag gca gtc 1872gcc act ttc gag gct gag tcc gac cta gag cgt gct cag aag gca gtc 1872
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620 610 615 620
aat gct ctg ttt acc tcc acc aat cag ctc ggc att aag acc gat gtg 1920aat gct ctg ttt acc tcc acc aat cag ctc ggc att aag acc gat gtg 1920
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640 625 630 635 640
acc gat tac cac att gac caa gtc tca aac ctc gtt gag tgc ctc tcg 1968acc gat tac cac att gac caa gtc tca aac ctc gtt gag tgc ctc tcg 1968
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655 645 650 655
gat gag ttc tac ctt gat gag aag agg gag ctt tca gag aaa gtt aag 2016gat gag ttc tac ctt gat gag aag agg gag ctt tca gag aaa gtt aag 2016
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670 660 665 670
cac gct aag aga ctc tcg gac gaa cgc aat ctg ttg caa gat ccc aac 2064cac gct aag aga ctc tcg gac gaa cgc aat ctg ttg caa gat ccc aac 2064
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685 675 680 685
ttc aga ggg atc aac cgt cag cca gac cgg gga tgg cgc ggg tcc acg 2112ttc aga ggg atc aac cgt cag cca gac cgg gga tgg cgc ggg tcc acg 2112
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700 690 695 700
gac atc act atc cag ggc ggt gat gac gtc ttc aag gag aac tac gtg 2160gac atc act atc cag ggc ggt gat gac gtc ttc aag gag aac tac gtg 2160
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720 705 710 715 720
acc ctg ccg ggc acc ttt gac gaa tgc tac ccc act tac ctc tac cag 2208acc ctg ccg ggc acc ttt gac gaa tgc tac ccc act tac ctc tac cag 2208
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735 725 730 735
aag att gac gag tcc aag ctc aag gcg ttc aca cgc tac cag ctc agg 2256aag att gac gag tcc aag ctc aag gcg ttc aca cgc tac cag ctc agg 2256
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750 740 745 750
ggt tac atc gag gac tcc caa gac ctg gaa atc tac ctg atc cgc tac 2304ggt tac atc gag gac tcc caa gac ctg gaa atc tac ctg atc cgc tac 2304
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765 755 760 765
aac gct aag cac gag act gtc aac gtg ccc ggc acc ggc agc ctg tgg 2352aac gct aag cac gag act gtc aac gtg ccc ggc acc ggc agc ctg tgg 2352
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780 770 775 780
ccc ttg tcc gct cag agc cca atc ggc aag tgc ggc gag ccc aac cgc 2400ccc ttg tcc gct cag agc cca atc ggc aag tgc ggc gag ccc aac cgc 2400
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800 785 790 795 800
tgc gcg ccc cac ctg gaa tgg aac ccc gac ctc gac tgt agc tgc cgc 2448tgc gcg ccc cac ctg gaa tgg aac ccc gac ctc gac tgt agc tgc cgc 2448
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815 805 810 815
gac gga gag aag tgc gcg cat cac tcc cac cac ttc agc ctc gac atc 2496gac gga gag aag tgc gcg cat cac tcc cac cac ttc agc ctc gac atc 2496
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830 820 825 830
gac gtc ggt tgc acc gac ctt aac gag gat ctg ggc gtt tgg gtg atc 2544gac gtc ggt tgc acc gac ctt aac gag gat ctg ggc gtt tgg gtg atc 2544
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845 835 840 845
ttc aag atc aag act cag gac ggc cac gcc cgc ctg gga aac ctg gag 2592ttc aag atc aag act cag gac ggc cac gcc cgc ctg gga aac ctg gag 2592
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860 850 855 860
ttc ctg gag gag aag ccc ctc gtt ggc gag gcc ctg gcc cgc gtc aag 2640ttc ctg gag gag aag ccc ctc gtt ggc gag gcc ctg gcc cgc gtc aag 2640
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880 865 870 875 880
agg gcc gag aag aaa tgg cgc gac aag cgc gag aag ctg gag tgg gag 2688agg gcc gag aag aaa tgg cgc gac aag cgc gag aag ctg gag tgg gag 2688
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895 885 890 895
acc aac atc gtg tac aag gaa gcg aag gag tca gtt gac gcc ctg ttc 2736acc aac atc gtg tac aag gaa gcg aag gag tca gtt gac gcc ctg ttc 2736
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910 900 905 910
gtc aac agc cag tac gac cag ctc cag gca gac aca aac atc gct atg 2784gtc aac agc cag tac gac cag ctc cag gca gac aca aac atc gct atg 2784
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925 915 920 925
atc cat gcg gcc gac aag cgc gtc cac tcc atc cgc gag gcg tac ctg 2832atc cat gcg gcc gac aag cgc gtc cac tcc atc cgc gag gcg tac ctg 2832
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940 930 935 940
ccc gag ctg tcc gtc atc ccc ggc gtc aac gcc gcg atc ttt gag gag 2880ccc gag ctg tcc gtc atc ccc ggc gtc aac gcc gcg atc ttt gag gag 2880
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960 945 950 955 960
ctg gag ggc cgc atc ttc acc gcc ttc tcc ctc tac gac gca cgc aac 2928ctg gag ggc cgc atc ttc acc gcc ttc tcc ctc tac gac gca cgc aac 2928
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975 965 970 975
gtt atc aag aat ggc gac ttc aac aac ggg ctg tcc tgc tgg aat gtc 2976gtt atc aag aat ggc gac ttc aac aac ggg ctg tcc tgc tgg aat gtc 2976
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990 980 985 990
aag ggc cac gtg gac gtc gag gag cag aac aac cag cgc tca gtc ctg 3024aag ggc cac gtg gac gtc gag gag cag aac aac cag cgc tca gtc ctg 3024
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005 995 1000 1005
gtc gtc ccg gag tgg gag gcc gaa gtc agc cag gaa gtc cgc gtc 3069gtc gtc ccg gag tgg gag gcc gaa gtc agc cag gaa gtc cgc gtc 3069
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020 1010 1015 1020
tgc cct gga cgc ggg tac atc ctg cgc gtc act gcc tac aag gaa 3114tgc cct gga cgc ggg tac atc ctg cgc gtc act gcc tac aag gaa 3114
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035 1025 1030 1035
ggc tac gga gag ggc tgc gtc acc atc cat gag atc gaa aac aac 3159ggc tac gga gag ggc tgc gtc acc atc cat gag atc gaa aac aac 3159
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050 1040 1045 1050
acg gat gag ctt aag ttc agc aac tgt gtt gaa gag gaa atc tac 3204acg gat gag ctt aag ttc agc aac tgt gtt gaa gag gaa atc tac 3204
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065 1055 1060 1065
ccg aac aac acg gtc acc tgc aat gat tac acc gtc aac cag gag 3249ccg aac aac acg gtc acc tgc aat gat tac acc gtc aac cag gag 3249
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080 1070 1075 1080
gaa tac ggt gga gct tac acc tcc cgc aac agg ggc tac aac gag 3294gaa tac ggt gga gct tac acc tcc cgc aac agg ggc tac aac gag 3294
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095 1085 1090 1095
gca ccc tct gtc ccg gcc gac tac gct tca gtc tac gaa gag aag 3339gca ccc tct gtc ccg gcc gac tac gct tca gtc tac gaa gag aag 3339
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110 1100 1105 1110
tcg tac acc gac gga cgc aga gag aac ccg tgt gag ttc aac cgc 3384tcg tac acc gac gga cgc aga gag aac ccg tgt gag ttc aac cgc 3384
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125 1115 1120 1125
ggc tac cgc gat tac acc ccg ctg cct gtc ggg tac gtc acc aaa 3429ggc tac cgc gat tac acc ccg ctg cct gtc ggg tac gtc acc aaa 3429
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140 1130 1135 1140
gag ctg gaa tac ttc cca gag acc gac aaa gtc tgg att gag atc 3474gag ctg gaa tac ttc cca gag acc gac aaa gtc tgg att gag atc 3474
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155 1145 1150 1155
ggc gag acc gag ggc acg ttc atc gtg gac tcc gtc gaa ctc ctt 3519ggc gag acc gag ggc acg ttc atc gtg gac tcc gtc gaa ctc ctt 3519
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170 1160 1165 1170
ctg atg gaa gag tga 3534ctg atg gaa gag tga 3534
Leu Met Glu Glu Leu Met Glu Glu
1175 1175
<210> 12<210> 12
<211> 1177<211> 1177
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетическая конструкция<223> Synthetic construction
<400> 12<400> 12
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15 1 5 10 15
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30 20 25 30
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45 35 40 45
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60 50 55 60
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80 65 70 75 80
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95 85 90 95
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110 100 105 110
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125 115 120 125
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140 130 135 140
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160 145 150 155 160
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175 165 170 175
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190 180 185 190
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205 195 200 205
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220 210 215 220
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240 225 230 235 240
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255 245 250 255
Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270 260 265 270
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285 275 280 285
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300 290 295 300
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320 305 310 315 320
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335 325 330 335
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Val Leu Val Ser Leu
340 345 350 340 345 350
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365 355 360 365
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380 370 375 380
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400 385 390 395 400
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415 405 410 415
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430 420 425 430
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445 435 440 445
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460 450 455 460
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480 465 470 475 480
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495 485 490 495
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510 500 505 510
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525 515 520 525
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540 530 535 540
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560 545 550 555 560
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575 565 570 575
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590 580 585 590
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605 595 600 605
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620 610 615 620
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640 625 630 635 640
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655 645 650 655
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670 660 665 670
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685 675 680 685
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700 690 695 700
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720 705 710 715 720
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735 725 730 735
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750 740 745 750
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765 755 760 765
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780 770 775 780
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800 785 790 795 800
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815 805 810 815
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830 820 825 830
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845 835 840 845
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860 850 855 860
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880 865 870 875 880
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895 885 890 895
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910 900 905 910
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925 915 920 925
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940 930 935 940
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960 945 950 955 960
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975 965 970 975
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990 980 985 990
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005 995 1000 1005
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020 1010 1015 1020
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035 1025 1030 1035
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050 1040 1045 1050
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065 1055 1060 1065
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080 1070 1075 1080
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095 1085 1090 1095
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110 1100 1105 1110
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125 1115 1120 1125
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140 1130 1135 1140
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155 1145 1150 1155
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170 1160 1165 1170
Leu Met Glu Glu Leu Met Glu Glu
1175 1175
<---<---
Claims (36)
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762445313P | 2017-01-12 | 2017-01-12 | |
US62/445,313 | 2017-01-12 | ||
PCT/US2018/013298 WO2018132556A1 (en) | 2017-01-12 | 2018-01-11 | Pesticidal toxin proteins active against lepidopteran insects |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2019125252A RU2019125252A (en) | 2021-02-12 |
RU2019125252A3 RU2019125252A3 (en) | 2021-10-18 |
RU2780626C2 true RU2780626C2 (en) | 2022-09-28 |
Family
ID=
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011075586A1 (en) * | 2009-12-16 | 2011-06-23 | Dow Agrosciences Llc | Insecticidal protein combinations for controlling fall armyworm and european corn borer, and methods for insect resistance managements |
WO2012006271A1 (en) * | 2010-07-07 | 2012-01-12 | Syngenta Participations Ag | Control of coleopteran insect pests |
RU2013151447A (en) * | 2011-04-20 | 2015-05-27 | Девген Нв | INSECT PEST RESISTANT PLANTS |
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011075586A1 (en) * | 2009-12-16 | 2011-06-23 | Dow Agrosciences Llc | Insecticidal protein combinations for controlling fall armyworm and european corn borer, and methods for insect resistance managements |
WO2012006271A1 (en) * | 2010-07-07 | 2012-01-12 | Syngenta Participations Ag | Control of coleopteran insect pests |
RU2013151447A (en) * | 2011-04-20 | 2015-05-27 | Девген Нв | INSECT PEST RESISTANT PLANTS |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11702455B2 (en) | Pesticidal toxin proteins active against lepidopteran insects | |
KR102238620B1 (en) | Novel insect inhibitory proteins | |
JP6648127B2 (en) | Lepidopteran active Cry1Da1 amino acid sequence mutant protein | |
US11744250B2 (en) | Insect inhibitory proteins | |
RU2765310C2 (en) | New proteins showing inhibitory activity relatively to insects | |
CN110678067B (en) | Novel insect inhibitory proteins | |
CN116848250A (en) | Novel insect inhibitory proteins | |
RU2780626C2 (en) | Pesticide protein toxins active against lepidoptera | |
US11825850B2 (en) | Insect inhibitory proteins | |
CN117616117A (en) | Novel insect inhibitory proteins | |
US20230013686A1 (en) | Novel insect inhibitory proteins | |
OA21316A (en) | Novel insect inhibitory proteins. | |
EA040101B1 (en) | NEW CHIMERIC INSECTICIDAL PROTEINS TOXIC OR INHIBITORIC AGAINST LEPIDOPTHER PESTS | |
EA040497B1 (en) | NEW CHIMERIC INSECTICIDAL PROTEINS TOXIC OR INHIBITORIC AGAINST LEPIDOPTHER PESTS | |
EA040152B1 (en) | NEW CHIMERIC INSECTICIDAL PROTEINS TOXIC OR INHIBITORIC AGAINST LEPIDOPTHER PESTS | |
EA040097B1 (en) | NEW CHIMERIC INSECTICIDAL PROTEINS TOXIC OR INHIBITORIC AGAINST LEPIDOPTHER PESTS |