RU2741833C2 - Композиции и способы контроля вредителей растений - Google Patents
Композиции и способы контроля вредителей растений Download PDFInfo
- Publication number
- RU2741833C2 RU2741833C2 RU2017124613A RU2017124613A RU2741833C2 RU 2741833 C2 RU2741833 C2 RU 2741833C2 RU 2017124613 A RU2017124613 A RU 2017124613A RU 2017124613 A RU2017124613 A RU 2017124613A RU 2741833 C2 RU2741833 C2 RU 2741833C2
- Authority
- RU
- Russia
- Prior art keywords
- plant
- protein
- cell
- leu
- ser
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 241000607479 Yersinia pestis Species 0.000 title description 71
- 239000000203 mixture Substances 0.000 title description 55
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 401
- 241000196324 Embryophyta Species 0.000 claims abstract description 326
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 292
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 87
- 230000009261 transgenic effect Effects 0.000 claims abstract description 85
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 71
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 71
- 241001147398 Ostrinia nubilalis Species 0.000 claims abstract description 58
- 239000013598 vector Substances 0.000 claims abstract description 41
- 231100000331 toxic Toxicity 0.000 claims abstract description 37
- 230000002588 toxic effect Effects 0.000 claims abstract description 37
- 230000014509 gene expression Effects 0.000 claims description 117
- 241000238631 Hexapoda Species 0.000 claims description 107
- 239000002773 nucleotide Substances 0.000 claims description 85
- 125000003729 nucleotide group Chemical group 0.000 claims description 85
- 240000008042 Zea mays Species 0.000 claims description 43
- 230000000749 insecticidal effect Effects 0.000 claims description 41
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 37
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 33
- 235000009973 maize Nutrition 0.000 claims description 33
- 241000193388 Bacillus thuringiensis Species 0.000 claims description 25
- 229940097012 bacillus thuringiensis Drugs 0.000 claims description 24
- 150000001413 amino acids Chemical group 0.000 claims description 22
- 241000589158 Agrobacterium Species 0.000 claims description 18
- 241000894006 Bacteria Species 0.000 claims description 17
- 108020004705 Codon Proteins 0.000 claims description 16
- 238000004519 manufacturing process Methods 0.000 claims description 13
- 230000001580 bacterial effect Effects 0.000 claims description 12
- 239000013612 plasmid Substances 0.000 claims description 12
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 10
- 229920000742 Cotton Polymers 0.000 claims description 10
- 235000010469 Glycine max Nutrition 0.000 claims description 9
- 241000255967 Helicoverpa zea Species 0.000 claims description 9
- 244000299507 Gossypium hirsutum Species 0.000 claims description 8
- 241000256251 Spodoptera frugiperda Species 0.000 claims description 8
- 230000001131 transforming effect Effects 0.000 claims description 8
- 241000625764 Anticarsia gemmatalis Species 0.000 claims description 7
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 7
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 7
- 244000061176 Nicotiana tabacum Species 0.000 claims description 7
- 108090000848 Ubiquitin Proteins 0.000 claims description 7
- 241001364932 Chrysodeixis Species 0.000 claims description 6
- 241000879145 Diatraea grandiosella Species 0.000 claims description 6
- 241000122106 Diatraea saccharalis Species 0.000 claims description 6
- 244000111261 Mucuna pruriens Species 0.000 claims description 6
- 235000008540 Mucuna pruriens var utilis Nutrition 0.000 claims description 6
- 240000007594 Oryza sativa Species 0.000 claims description 6
- 235000007164 Oryza sativa Nutrition 0.000 claims description 6
- 102000044159 Ubiquitin Human genes 0.000 claims description 6
- 235000009566 rice Nutrition 0.000 claims description 6
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 claims description 5
- 244000068988 Glycine max Species 0.000 claims description 5
- 244000020551 Helianthus annuus Species 0.000 claims description 5
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 5
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 5
- 240000005979 Hordeum vulgare Species 0.000 claims description 5
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 5
- 240000000111 Saccharum officinarum Species 0.000 claims description 5
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 5
- 240000003768 Solanum lycopersicum Species 0.000 claims description 5
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 5
- 235000021536 Sugar beet Nutrition 0.000 claims description 5
- 235000021307 Triticum Nutrition 0.000 claims description 5
- 244000098338 Triticum aestivum Species 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 5
- 240000007124 Brassica oleracea Species 0.000 claims description 4
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 claims description 4
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 claims description 4
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 claims description 4
- 241000256244 Heliothis virescens Species 0.000 claims description 4
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 4
- 244000046052 Phaseolus vulgaris Species 0.000 claims description 4
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 4
- 244000061456 Solanum tuberosum Species 0.000 claims description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 4
- 235000005822 corn Nutrition 0.000 claims description 4
- 235000007319 Avena orientalis Nutrition 0.000 claims description 3
- 244000075850 Avena orientalis Species 0.000 claims description 3
- 241001555556 Ephestia elutella Species 0.000 claims description 3
- 239000004471 Glycine Substances 0.000 claims description 3
- 108090001090 Lectins Proteins 0.000 claims description 3
- 102000004856 Lectins Human genes 0.000 claims description 3
- 241001148062 Photorhabdus Species 0.000 claims description 3
- 235000010582 Pisum sativum Nutrition 0.000 claims description 3
- 240000004713 Pisum sativum Species 0.000 claims description 3
- 108010043934 Sucrose synthase Proteins 0.000 claims description 3
- 241000607757 Xenorhabdus Species 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 3
- 238000003306 harvesting Methods 0.000 claims description 3
- 239000002523 lectin Substances 0.000 claims description 3
- 108020003589 5' Untranslated Regions Proteins 0.000 claims description 2
- 241000589220 Acetobacter Species 0.000 claims description 2
- 241000588986 Alcaligenes Species 0.000 claims description 2
- 101710187578 Alcohol dehydrogenase 1 Proteins 0.000 claims description 2
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 claims description 2
- 241000511859 Aproaerema anthyllidella Species 0.000 claims description 2
- 241000186063 Arthrobacter Species 0.000 claims description 2
- 241000589151 Azotobacter Species 0.000 claims description 2
- 101000981883 Brevibacillus parabrevis ATP-dependent tryptophan/phenylalanine/tyrosine adenylase Proteins 0.000 claims description 2
- 101000981889 Brevibacillus parabrevis Linear gramicidin-PCP reductase Proteins 0.000 claims description 2
- 108010004539 Chalcone isomerase Proteins 0.000 claims description 2
- 101000906861 Chondromyces crocatus ATP-dependent tyrosine adenylase Proteins 0.000 claims description 2
- 241000193403 Clostridium Species 0.000 claims description 2
- 241000588698 Erwinia Species 0.000 claims description 2
- 241000588722 Escherichia Species 0.000 claims description 2
- 241000588748 Klebsiella Species 0.000 claims description 2
- 241000186660 Lactobacillus Species 0.000 claims description 2
- 241000192132 Leuconostoc Species 0.000 claims description 2
- 241000606860 Pasteurella Species 0.000 claims description 2
- 241001668579 Pasteuria Species 0.000 claims description 2
- 101710091688 Patatin Proteins 0.000 claims description 2
- 240000007377 Petunia x hybrida Species 0.000 claims description 2
- 235000014676 Phragmites communis Nutrition 0.000 claims description 2
- 241000589516 Pseudomonas Species 0.000 claims description 2
- 241000607142 Salmonella Species 0.000 claims description 2
- 241000607720 Serratia Species 0.000 claims description 2
- 229940039696 lactobacillus Drugs 0.000 claims description 2
- 108010083942 mannopine synthase Proteins 0.000 claims description 2
- 108010058731 nopaline synthase Proteins 0.000 claims description 2
- 241000289763 Dasygaster padockina Species 0.000 claims 3
- 240000006394 Sorghum bicolor Species 0.000 claims 2
- 241000209134 Arundinaria Species 0.000 claims 1
- 241000701832 Enterobacteria phage T3 Species 0.000 claims 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 claims 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 claims 1
- 241001012098 Omiodes indicata Species 0.000 claims 1
- 241000589634 Xanthomonas Species 0.000 claims 1
- 239000000126 substance Substances 0.000 abstract description 16
- 230000000694 effects Effects 0.000 abstract description 15
- 241000346285 Ostrinia furnacalis Species 0.000 abstract description 8
- 235000018102 proteins Nutrition 0.000 description 273
- 210000004027 cell Anatomy 0.000 description 118
- 102000040430 polynucleotide Human genes 0.000 description 118
- 108091033319 polynucleotide Proteins 0.000 description 118
- 239000002157 polynucleotide Substances 0.000 description 118
- 108020004414 DNA Proteins 0.000 description 55
- 125000003275 alpha amino acid group Chemical group 0.000 description 55
- 108091028043 Nucleic acid sequence Proteins 0.000 description 44
- 230000009466 transformation Effects 0.000 description 37
- 210000001519 tissue Anatomy 0.000 description 28
- 108090000765 processed proteins & peptides Proteins 0.000 description 24
- 102000004196 processed proteins & peptides Human genes 0.000 description 24
- 235000001014 amino acid Nutrition 0.000 description 23
- 229920001184 polypeptide Polymers 0.000 description 23
- 102000004190 Enzymes Human genes 0.000 description 21
- 108090000790 Enzymes Proteins 0.000 description 21
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 21
- 239000003795 chemical substances by application Substances 0.000 description 21
- 229940088598 enzyme Drugs 0.000 description 21
- 229940024606 amino acid Drugs 0.000 description 19
- 239000002609 medium Substances 0.000 description 19
- 230000001105 regulatory effect Effects 0.000 description 19
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 18
- 108010044940 alanylglutamine Proteins 0.000 description 18
- 108010013835 arginine glutamate Proteins 0.000 description 18
- 108010047857 aspartylglycine Proteins 0.000 description 18
- 238000009396 hybridization Methods 0.000 description 18
- 108010017391 lysylvaline Proteins 0.000 description 18
- 239000000047 product Substances 0.000 description 18
- 239000003550 marker Substances 0.000 description 17
- 210000002706 plastid Anatomy 0.000 description 17
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 16
- 230000000361 pesticidal effect Effects 0.000 description 16
- 239000004009 herbicide Substances 0.000 description 15
- 108700012359 toxins Proteins 0.000 description 15
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 14
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 14
- 108010077245 asparaginyl-proline Proteins 0.000 description 14
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 14
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 13
- 108010021466 Mutant Proteins Proteins 0.000 description 13
- 102000008300 Mutant Proteins Human genes 0.000 description 13
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 13
- 230000001965 increasing effect Effects 0.000 description 13
- 230000001404 mediated effect Effects 0.000 description 13
- 239000000523 sample Substances 0.000 description 13
- 238000012360 testing method Methods 0.000 description 13
- 108010073969 valyllysine Proteins 0.000 description 13
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 12
- 108010061238 threonyl-glycine Proteins 0.000 description 12
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 11
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 11
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 11
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 11
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 11
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 11
- 108010089804 glycyl-threonine Proteins 0.000 description 11
- -1 rRNA Proteins 0.000 description 11
- 230000008685 targeting Effects 0.000 description 11
- 239000003053 toxin Substances 0.000 description 11
- 231100000765 toxin Toxicity 0.000 description 11
- 108010020532 tyrosyl-proline Proteins 0.000 description 11
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 10
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 10
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 10
- 238000003556 assay Methods 0.000 description 10
- 101150086784 cry gene Proteins 0.000 description 10
- 230000006378 damage Effects 0.000 description 10
- 238000003752 polymerase chain reaction Methods 0.000 description 10
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 9
- 241000880493 Leptailurus serval Species 0.000 description 9
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 9
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 9
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 9
- 108091005804 Peptidases Proteins 0.000 description 9
- 239000004365 Protease Substances 0.000 description 9
- 241000753145 Sitotroga cerealella Species 0.000 description 9
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 9
- 108010038633 aspartylglutamate Proteins 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 108010078144 glutaminyl-glycine Proteins 0.000 description 9
- 108010050848 glycylleucine Proteins 0.000 description 9
- 108010037850 glycylvaline Proteins 0.000 description 9
- 230000001976 improved effect Effects 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 229920001817 Agar Polymers 0.000 description 8
- 241000566547 Agrotis ipsilon Species 0.000 description 8
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 8
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 8
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 8
- KKCJHBXMYYVWMX-KQXIARHKSA-N Gln-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N KKCJHBXMYYVWMX-KQXIARHKSA-N 0.000 description 8
- MWTGQXBHVRTCOR-GLLZPBPUSA-N Glu-Thr-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MWTGQXBHVRTCOR-GLLZPBPUSA-N 0.000 description 8
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 8
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 8
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 8
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 8
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 8
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 8
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 8
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 8
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 8
- 108091022912 Mannose-6-Phosphate Isomerase Proteins 0.000 description 8
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 8
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 8
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 8
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 8
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 8
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 8
- 239000008272 agar Substances 0.000 description 8
- 108090000637 alpha-Amylases Proteins 0.000 description 8
- 108010093581 aspartyl-proline Proteins 0.000 description 8
- 239000000872 buffer Substances 0.000 description 8
- 230000001276 controlling effect Effects 0.000 description 8
- 210000002257 embryonic structure Anatomy 0.000 description 8
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 8
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 8
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 8
- 230000002363 herbicidal effect Effects 0.000 description 8
- 108010028295 histidylhistidine Proteins 0.000 description 8
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 8
- 244000005700 microbiome Species 0.000 description 8
- 239000000575 pesticide Substances 0.000 description 8
- 108010018625 phenylalanylarginine Proteins 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 108010048818 seryl-histidine Proteins 0.000 description 8
- 238000006467 substitution reaction Methods 0.000 description 8
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 8
- 238000012546 transfer Methods 0.000 description 8
- 108010076441 Ala-His-His Proteins 0.000 description 7
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 7
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 7
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 7
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 7
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 7
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 7
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 7
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 7
- 241000255777 Lepidoptera Species 0.000 description 7
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 7
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 7
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 7
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 7
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 7
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 7
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 7
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 7
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 7
- 108010047495 alanylglycine Proteins 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 235000019621 digestibility Nutrition 0.000 description 7
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 7
- 108010025306 histidylleucine Proteins 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 239000002245 particle Substances 0.000 description 7
- 108010090894 prolylleucine Proteins 0.000 description 7
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 6
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 6
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 6
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 6
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 6
- YQNBILXAUIAUCF-CIUDSAMLSA-N Asn-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N YQNBILXAUIAUCF-CIUDSAMLSA-N 0.000 description 6
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 6
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 6
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 6
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 6
- XRTISHJEPHMBJG-SRVKXCTJSA-N Cys-Asp-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XRTISHJEPHMBJG-SRVKXCTJSA-N 0.000 description 6
- SFAFZYYMAWOCIC-KKUMJFAQSA-N Gln-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SFAFZYYMAWOCIC-KKUMJFAQSA-N 0.000 description 6
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 6
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 6
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 6
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 6
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 6
- CTEMYIWDSVICKS-WDSOQIARSA-N His-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N CTEMYIWDSVICKS-WDSOQIARSA-N 0.000 description 6
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 6
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 6
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 6
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 6
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 6
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 6
- 102000048193 Mannose-6-phosphate isomerases Human genes 0.000 description 6
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 6
- 102000057297 Pepsin A Human genes 0.000 description 6
- 108090000284 Pepsin A Proteins 0.000 description 6
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 description 6
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 6
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 6
- AXKJPUBALUNJEO-UBHSHLNASA-N Ser-Trp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O AXKJPUBALUNJEO-UBHSHLNASA-N 0.000 description 6
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 6
- UDNVOQMPQBEITB-MEYUZBJRSA-N Thr-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UDNVOQMPQBEITB-MEYUZBJRSA-N 0.000 description 6
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 6
- 108700019146 Transgenes Proteins 0.000 description 6
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 6
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 6
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 6
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 6
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 6
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 230000000890 antigenic effect Effects 0.000 description 6
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 6
- 108010068380 arginylarginine Proteins 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 230000034994 death Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 239000000499 gel Substances 0.000 description 6
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 6
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 6
- 108010010147 glycylglutamine Proteins 0.000 description 6
- 239000001963 growth medium Substances 0.000 description 6
- 108010000761 leucylarginine Proteins 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 210000001938 protoplast Anatomy 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 108010080629 tryptophan-leucine Proteins 0.000 description 6
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 6
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 5
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 5
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 5
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 5
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 5
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 5
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 5
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 5
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 5
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 5
- 241000426497 Chilo suppressalis Species 0.000 description 5
- 241000034870 Chrysoteuchia culmella Species 0.000 description 5
- URDUGPGPLNXXES-WHFBIAKZSA-N Cys-Gly-Cys Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O URDUGPGPLNXXES-WHFBIAKZSA-N 0.000 description 5
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 5
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 5
- QSXSHZIRKTUXNG-STECZYCISA-N Ile-Val-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QSXSHZIRKTUXNG-STECZYCISA-N 0.000 description 5
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 5
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 5
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 5
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 5
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 5
- ONHCDMBHPQIPAI-YTQUADARSA-N Leu-Trp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N ONHCDMBHPQIPAI-YTQUADARSA-N 0.000 description 5
- 108010066427 N-valyltryptophan Proteins 0.000 description 5
- 241001460678 Napo <wasp> Species 0.000 description 5
- 102000035195 Peptidases Human genes 0.000 description 5
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 5
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 5
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 5
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 5
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 5
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 5
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 5
- 102000004139 alpha-Amylases Human genes 0.000 description 5
- 108010068265 aspartyltyrosine Proteins 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 238000004166 bioassay Methods 0.000 description 5
- 210000002421 cell wall Anatomy 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 238000009472 formulation Methods 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 210000004051 gastric juice Anatomy 0.000 description 5
- 210000001035 gastrointestinal tract Anatomy 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- 210000005260 human cell Anatomy 0.000 description 5
- 230000002401 inhibitory effect Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 229940111202 pepsin Drugs 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 239000002689 soil Substances 0.000 description 5
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 5
- DJXDNYKQOZYOFK-GUBZILKMSA-N (4s)-4-[[2-[[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]acetyl]amino]-5-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-5-oxopentanoic acid Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DJXDNYKQOZYOFK-GUBZILKMSA-N 0.000 description 4
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 4
- 108010000700 Acetolactate synthase Proteins 0.000 description 4
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 4
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 4
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 4
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 4
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 4
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 4
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 4
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 4
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 4
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 4
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 4
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 4
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 4
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 4
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 4
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 4
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 4
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 4
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 4
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 4
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 4
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 4
- JTWOBPNAVBESFW-FXQIFTODSA-N Arg-Cys-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N JTWOBPNAVBESFW-FXQIFTODSA-N 0.000 description 4
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 4
- MTANSHNQTWPZKP-KKUMJFAQSA-N Arg-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O MTANSHNQTWPZKP-KKUMJFAQSA-N 0.000 description 4
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 4
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 4
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 4
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 4
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 4
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 4
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 4
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 4
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 4
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 4
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 4
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 4
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 4
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 4
- RRVBEKYEFMCDIF-WHFBIAKZSA-N Asn-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)C(=O)N RRVBEKYEFMCDIF-WHFBIAKZSA-N 0.000 description 4
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 4
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 4
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 4
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 4
- OFQPMRDJVWLMNJ-CIUDSAMLSA-N Asn-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N OFQPMRDJVWLMNJ-CIUDSAMLSA-N 0.000 description 4
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 4
- XLZCLJRGGMBKLR-PCBIJLKTSA-N Asn-Ile-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XLZCLJRGGMBKLR-PCBIJLKTSA-N 0.000 description 4
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 4
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 4
- RZNAMKZJPBQWDJ-SRVKXCTJSA-N Asn-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N RZNAMKZJPBQWDJ-SRVKXCTJSA-N 0.000 description 4
- KNENKKKUYGEZIO-FXQIFTODSA-N Asn-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N KNENKKKUYGEZIO-FXQIFTODSA-N 0.000 description 4
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 4
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 4
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 4
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 4
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 4
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 4
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 4
- KSZHWTRZPOTIGY-AVGNSLFASA-N Asn-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KSZHWTRZPOTIGY-AVGNSLFASA-N 0.000 description 4
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 4
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 4
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 4
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 4
- AAIUGNSRQDGCDC-ZLUOBGJFSA-N Asp-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)O AAIUGNSRQDGCDC-ZLUOBGJFSA-N 0.000 description 4
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 4
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 4
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 4
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 4
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 4
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 4
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 4
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 4
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 4
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 4
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 4
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 4
- 102100026189 Beta-galactosidase Human genes 0.000 description 4
- 102100032487 Beta-mannosidase Human genes 0.000 description 4
- 241000254173 Coleoptera Species 0.000 description 4
- 108091035707 Consensus sequence Proteins 0.000 description 4
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 4
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 4
- UOEYKPDDHSFMLI-DCAQKATOSA-N Cys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N UOEYKPDDHSFMLI-DCAQKATOSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 241000255925 Diptera Species 0.000 description 4
- 241001095202 Ecdytolopha fabivora Species 0.000 description 4
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- DTCCMDYODDPHBG-ACZMJKKPSA-N Gln-Ala-Cys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O DTCCMDYODDPHBG-ACZMJKKPSA-N 0.000 description 4
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 4
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 4
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 4
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 4
- GHYJGDCPHMSFEJ-GUBZILKMSA-N Gln-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GHYJGDCPHMSFEJ-GUBZILKMSA-N 0.000 description 4
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 4
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 4
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 4
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 4
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 4
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 4
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 4
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 4
- SYTFJIQPBRJSOK-NKIYYHGXSA-N Gln-Thr-His Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 SYTFJIQPBRJSOK-NKIYYHGXSA-N 0.000 description 4
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 4
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 4
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 4
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 4
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 4
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 4
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 4
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 4
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 4
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 4
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 4
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 4
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 4
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 4
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 4
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 4
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 4
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 4
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 4
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 4
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 4
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 4
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 4
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 4
- KTSZUNRRYXPZTK-BQBZGAKWSA-N Gly-Gln-Glu Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KTSZUNRRYXPZTK-BQBZGAKWSA-N 0.000 description 4
- VOCMRCVMAPSSAL-IUCAKERBSA-N Gly-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN VOCMRCVMAPSSAL-IUCAKERBSA-N 0.000 description 4
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 4
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 4
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 4
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 4
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 4
- UYPPAMNTTMJHJW-KCTSRDHCSA-N Gly-Ile-Trp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O UYPPAMNTTMJHJW-KCTSRDHCSA-N 0.000 description 4
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 4
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 4
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 4
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 4
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 4
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 4
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 4
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 4
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 4
- LKJCZEPXHOIAIW-HOTGVXAUSA-N Gly-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN LKJCZEPXHOIAIW-HOTGVXAUSA-N 0.000 description 4
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 4
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 4
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 4
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 4
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 4
- 239000005562 Glyphosate Substances 0.000 description 4
- 241001147381 Helicoverpa armigera Species 0.000 description 4
- MWWOPNQSBXEUHO-ULQDDVLXSA-N His-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 MWWOPNQSBXEUHO-ULQDDVLXSA-N 0.000 description 4
- VOEGKUNRHYKYSU-XVYDVKMFSA-N His-Asp-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O VOEGKUNRHYKYSU-XVYDVKMFSA-N 0.000 description 4
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 4
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 4
- AKAPKBNIVNPIPO-KKUMJFAQSA-N His-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 AKAPKBNIVNPIPO-KKUMJFAQSA-N 0.000 description 4
- JBSLJUPMTYLLFH-MELADBBJSA-N His-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O JBSLJUPMTYLLFH-MELADBBJSA-N 0.000 description 4
- CNHSMSFYVARZLI-YJRXYDGGSA-N His-His-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CNHSMSFYVARZLI-YJRXYDGGSA-N 0.000 description 4
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 4
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 4
- ABCCKUZDWMERKT-AVGNSLFASA-N His-Pro-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O ABCCKUZDWMERKT-AVGNSLFASA-N 0.000 description 4
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 4
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 4
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 4
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 4
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 4
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 4
- IIXDMJNYALIKGP-DJFWLOJKSA-N Ile-Asn-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IIXDMJNYALIKGP-DJFWLOJKSA-N 0.000 description 4
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 4
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 4
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 4
- CTHAJJYOHOBUDY-GHCJXIJMSA-N Ile-Cys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N CTHAJJYOHOBUDY-GHCJXIJMSA-N 0.000 description 4
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 4
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 4
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 4
- LWWILHPVAKKLQS-QXEWZRGKSA-N Ile-Gly-Met Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N LWWILHPVAKKLQS-QXEWZRGKSA-N 0.000 description 4
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 4
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 4
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 4
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 4
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 4
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 4
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 4
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 4
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 4
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 4
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 4
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 4
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 4
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 4
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 4
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 4
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 4
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 4
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 4
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 4
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 4
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 4
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 4
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 4
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 4
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 4
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 4
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 4
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 4
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 4
- JFSGIJSCJFQGSZ-MXAVVETBSA-N Leu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N JFSGIJSCJFQGSZ-MXAVVETBSA-N 0.000 description 4
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 4
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 4
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 4
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 4
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 4
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 4
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 4
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 4
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 4
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 4
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 4
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 4
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 4
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 4
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 4
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 4
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 4
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 4
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 4
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 4
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 4
- GVKINWYYLOLEFQ-XIRDDKMYSA-N Lys-Trp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O GVKINWYYLOLEFQ-XIRDDKMYSA-N 0.000 description 4
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 4
- NSGXXVIHCIAISP-CIUDSAMLSA-N Met-Asn-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O NSGXXVIHCIAISP-CIUDSAMLSA-N 0.000 description 4
- DZTDEZSHBVRUCQ-FXQIFTODSA-N Met-Asp-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N DZTDEZSHBVRUCQ-FXQIFTODSA-N 0.000 description 4
- MVMNUCOHQGYYKB-PEDHHIEDSA-N Met-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCSC)N MVMNUCOHQGYYKB-PEDHHIEDSA-N 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- GNUCSNWOCQFMMC-UFYCRDLUSA-N Phe-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 GNUCSNWOCQFMMC-UFYCRDLUSA-N 0.000 description 4
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 4
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 4
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 4
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 4
- ZKSLXIGKRJMALF-MGHWNKPDSA-N Phe-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N ZKSLXIGKRJMALF-MGHWNKPDSA-N 0.000 description 4
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 4
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 4
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 4
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 4
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 4
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 4
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 4
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 4
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 4
- 108700001094 Plant Genes Proteins 0.000 description 4
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 4
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 4
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 4
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 4
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 4
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 4
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 4
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 4
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 4
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 4
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 4
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 4
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 4
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 4
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 4
- 108010079005 RDV peptide Proteins 0.000 description 4
- 108010052388 RGES peptide Proteins 0.000 description 4
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 4
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 4
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 4
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 4
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 4
- ZHYMUFQVKGJNRM-ZLUOBGJFSA-N Ser-Cys-Asn Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O ZHYMUFQVKGJNRM-ZLUOBGJFSA-N 0.000 description 4
- TUYBIWUZWJUZDD-ACZMJKKPSA-N Ser-Cys-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(N)=O TUYBIWUZWJUZDD-ACZMJKKPSA-N 0.000 description 4
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 4
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 4
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 4
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 4
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 4
- NBUKGEFVZJMSIS-XIRDDKMYSA-N Ser-His-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC3=CN=CN3)NC(=O)[C@H](CO)N NBUKGEFVZJMSIS-XIRDDKMYSA-N 0.000 description 4
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 4
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 4
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 4
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 4
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 4
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 4
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 4
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 4
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 4
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 4
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 4
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 4
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 4
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 4
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 4
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 4
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 4
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 4
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 4
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 4
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 4
- 244000062793 Sorghum vulgare Species 0.000 description 4
- 229920002472 Starch Polymers 0.000 description 4
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 4
- NFMPFBCXABPALN-OWLDWWDNSA-N Thr-Ala-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O NFMPFBCXABPALN-OWLDWWDNSA-N 0.000 description 4
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 4
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 4
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 4
- JVTHIXKSVYEWNI-JRQIVUDYSA-N Thr-Asn-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JVTHIXKSVYEWNI-JRQIVUDYSA-N 0.000 description 4
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 4
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 4
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 4
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 4
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 4
- WDFPMSHYMRBLKM-NKIYYHGXSA-N Thr-Glu-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O WDFPMSHYMRBLKM-NKIYYHGXSA-N 0.000 description 4
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 4
- WPSDXXQRIVKBAY-NKIYYHGXSA-N Thr-His-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O WPSDXXQRIVKBAY-NKIYYHGXSA-N 0.000 description 4
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 4
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 4
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 4
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 4
- OHDXOXIZXSFCDN-RCWTZXSCSA-N Thr-Met-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OHDXOXIZXSFCDN-RCWTZXSCSA-N 0.000 description 4
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 4
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 4
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 4
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 4
- RPECVQBNONKZAT-WZLNRYEVSA-N Thr-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H]([C@@H](C)O)N RPECVQBNONKZAT-WZLNRYEVSA-N 0.000 description 4
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 4
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 4
- RPVDDQYNBOVWLR-HOCLYGCPSA-N Trp-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RPVDDQYNBOVWLR-HOCLYGCPSA-N 0.000 description 4
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 4
- GIAMKIPJSRZVJB-IHPCNDPISA-N Trp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GIAMKIPJSRZVJB-IHPCNDPISA-N 0.000 description 4
- SGQSAIFDESQBRA-IHPCNDPISA-N Trp-Tyr-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SGQSAIFDESQBRA-IHPCNDPISA-N 0.000 description 4
- MXKUGFHWYYKVDV-SZMVWBNQSA-N Trp-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(C)C)C(O)=O MXKUGFHWYYKVDV-SZMVWBNQSA-N 0.000 description 4
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 4
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 4
- DKKHULUSOSWGHS-UWJYBYFXSA-N Tyr-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DKKHULUSOSWGHS-UWJYBYFXSA-N 0.000 description 4
- JRXKIVGWMMIIOF-YDHLFZDLSA-N Tyr-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JRXKIVGWMMIIOF-YDHLFZDLSA-N 0.000 description 4
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 4
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 4
- YMUQBRQQCPQEQN-CXTHYWKRSA-N Tyr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YMUQBRQQCPQEQN-CXTHYWKRSA-N 0.000 description 4
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 4
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 4
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 4
- BCOBSVIZMQXKFY-KKUMJFAQSA-N Tyr-Ser-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O BCOBSVIZMQXKFY-KKUMJFAQSA-N 0.000 description 4
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 4
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 4
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 4
- VSYROIRKNBCULO-BWAGICSOSA-N Tyr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O VSYROIRKNBCULO-BWAGICSOSA-N 0.000 description 4
- MWUYSCVVPVITMW-IGNZVWTISA-N Tyr-Tyr-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 MWUYSCVVPVITMW-IGNZVWTISA-N 0.000 description 4
- CCEVJBJLPRNAFH-BVSLBCMMSA-N Tyr-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N CCEVJBJLPRNAFH-BVSLBCMMSA-N 0.000 description 4
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 4
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 4
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 4
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 4
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 4
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 4
- OPGWZDIYEYJVRX-AVGNSLFASA-N Val-His-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OPGWZDIYEYJVRX-AVGNSLFASA-N 0.000 description 4
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 4
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 4
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 4
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 4
- ILMVQSHENUZYIZ-JYJNAYRXSA-N Val-Met-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N ILMVQSHENUZYIZ-JYJNAYRXSA-N 0.000 description 4
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 4
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 4
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 4
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 4
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 4
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 4
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 4
- VBTFUDNTMCHPII-FKBYEOEOSA-N Val-Trp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O VBTFUDNTMCHPII-FKBYEOEOSA-N 0.000 description 4
- VBTFUDNTMCHPII-UHFFFAOYSA-N Val-Trp-Tyr Natural products C=1NC2=CC=CC=C2C=1CC(NC(=O)C(N)C(C)C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 VBTFUDNTMCHPII-UHFFFAOYSA-N 0.000 description 4
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 4
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Chemical class Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 108010041407 alanylaspartic acid Proteins 0.000 description 4
- 230000002009 allergenic effect Effects 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 108010005774 beta-Galactosidase Proteins 0.000 description 4
- 108010055059 beta-Mannosidase Proteins 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 229960005091 chloramphenicol Drugs 0.000 description 4
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 4
- 210000003763 chloroplast Anatomy 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 108010004073 cysteinylcysteine Proteins 0.000 description 4
- 108010060199 cysteinylproline Proteins 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 4
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 4
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 4
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 4
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- 108010084389 glycyltryptophan Proteins 0.000 description 4
- 229940097068 glyphosate Drugs 0.000 description 4
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 4
- 108010036413 histidylglycine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 230000002147 killing effect Effects 0.000 description 4
- 108010053037 kyotorphin Proteins 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 108010056582 methionylglutamic acid Proteins 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 239000011541 reaction mixture Substances 0.000 description 4
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000028070 sporulation Effects 0.000 description 4
- 238000005507 spraying Methods 0.000 description 4
- 235000019698 starch Nutrition 0.000 description 4
- 239000008107 starch Substances 0.000 description 4
- 230000000451 tissue damage Effects 0.000 description 4
- 231100000827 tissue damage Toxicity 0.000 description 4
- 231100000419 toxicity Toxicity 0.000 description 4
- 230000001988 toxicity Effects 0.000 description 4
- 108010051110 tyrosyl-lysine Proteins 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- GHBSKQGCIYSCNS-NAKRPEOUSA-N Ala-Leu-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GHBSKQGCIYSCNS-NAKRPEOUSA-N 0.000 description 3
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 3
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 3
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 3
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 3
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 3
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 3
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 3
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 3
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 3
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 3
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 3
- 240000002791 Brassica napus Species 0.000 description 3
- 108010084185 Cellulases Proteins 0.000 description 3
- 102000005575 Cellulases Human genes 0.000 description 3
- 241000098289 Cnaphalocrocis medinalis Species 0.000 description 3
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 3
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 3
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 3
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 3
- 102100022624 Glucoamylase Human genes 0.000 description 3
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 3
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 3
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 3
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 3
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 3
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 3
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 3
- LEDRIAHEWDJRMF-CFMVVWHZSA-N Ile-Asn-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LEDRIAHEWDJRMF-CFMVVWHZSA-N 0.000 description 3
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 3
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 3
- 108010028688 Isoamylase Proteins 0.000 description 3
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 3
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 3
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 3
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 3
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 3
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 3
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 3
- 108090001060 Lipase Proteins 0.000 description 3
- BVRNWWHJYNPJDG-XIRDDKMYSA-N Lys-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N BVRNWWHJYNPJDG-XIRDDKMYSA-N 0.000 description 3
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 3
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 3
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 241000244206 Nematoda Species 0.000 description 3
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 3
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 3
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 3
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 3
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 3
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 3
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 3
- 241000931985 Sesamia calamistis Species 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 241000098292 Striacosta albicosta Species 0.000 description 3
- 229940100389 Sulfonylurea Drugs 0.000 description 3
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 3
- XXNLGZRRSKPSGF-HTUGSXCWSA-N Thr-Gln-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O XXNLGZRRSKPSGF-HTUGSXCWSA-N 0.000 description 3
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 3
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 3
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 3
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 3
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 3
- NGALWFGCOMHUSN-AVGNSLFASA-N Tyr-Gln-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NGALWFGCOMHUSN-AVGNSLFASA-N 0.000 description 3
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 3
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 3
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 229940024171 alpha-amylase Drugs 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- JFDZBHWFFUWGJE-UHFFFAOYSA-N benzonitrile Chemical compound N#CC1=CC=CC=C1 JFDZBHWFFUWGJE-UHFFFAOYSA-N 0.000 description 3
- 239000003593 chromogenic compound Substances 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 244000038559 crop plants Species 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 210000005069 ears Anatomy 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- NYPJDWWKZLNGGM-UHFFFAOYSA-N fenvalerate Aalpha Natural products C=1C=C(Cl)C=CC=1C(C(C)C)C(=O)OC(C#N)C(C=1)=CC=CC=1OC1=CC=CC=C1 NYPJDWWKZLNGGM-UHFFFAOYSA-N 0.000 description 3
- 230000037406 food intake Effects 0.000 description 3
- 230000002538 fungal effect Effects 0.000 description 3
- 102000005396 glutamine synthetase Human genes 0.000 description 3
- 108020002326 glutamine synthetase Proteins 0.000 description 3
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- KZAUOCCYDRDERY-UHFFFAOYSA-N oxamyl Chemical compound CNC(=O)ON=C(SC)C(=O)N(C)C KZAUOCCYDRDERY-UHFFFAOYSA-N 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 238000004161 plant tissue culture Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- OGNSCSPNOLGXSM-UHFFFAOYSA-N (+/-)-DABA Natural products NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 2
- PGOOBECODWQEAB-UHFFFAOYSA-N (E)-clothianidin Chemical compound [O-][N+](=O)\N=C(/NC)NCC1=CN=C(Cl)S1 PGOOBECODWQEAB-UHFFFAOYSA-N 0.000 description 2
- ZDOOQPFIGYHZFV-UHFFFAOYSA-N 2-ethyl-4-[(4-phenoxyphenoxy)methyl]-1,3-dioxolane Chemical compound O1C(CC)OCC1COC(C=C1)=CC=C1OC1=CC=CC=C1 ZDOOQPFIGYHZFV-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- ZOCSXAVNDGMNBV-UHFFFAOYSA-N 5-amino-1-[2,6-dichloro-4-(trifluoromethyl)phenyl]-4-[(trifluoromethyl)sulfinyl]-1H-pyrazole-3-carbonitrile Chemical compound NC1=C(S(=O)C(F)(F)F)C(C#N)=NN1C1=C(Cl)C=C(C(F)(F)F)C=C1Cl ZOCSXAVNDGMNBV-UHFFFAOYSA-N 0.000 description 2
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 2
- 239000005660 Abamectin Substances 0.000 description 2
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 2
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 2
- VHEVVUZDDUCAKU-FXQIFTODSA-N Ala-Met-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O VHEVVUZDDUCAKU-FXQIFTODSA-N 0.000 description 2
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 2
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 2
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 2
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 2
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 2
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 2
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 2
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 2
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 2
- UGJLILSJKSBVIR-ZFWWWQNUSA-N Arg-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)NCC(O)=O)=CNC2=C1 UGJLILSJKSBVIR-ZFWWWQNUSA-N 0.000 description 2
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 2
- BRCVLJZIIFBSPF-ZLUOBGJFSA-N Asn-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BRCVLJZIIFBSPF-ZLUOBGJFSA-N 0.000 description 2
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 2
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 2
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 2
- WCRQQIPFSXFIRN-LPEHRKFASA-N Asn-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N WCRQQIPFSXFIRN-LPEHRKFASA-N 0.000 description 2
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 2
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 2
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 2
- NSTBNYOKCZKOMI-AVGNSLFASA-N Asn-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O NSTBNYOKCZKOMI-AVGNSLFASA-N 0.000 description 2
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 2
- LTDGPJKGJDIBQD-LAEOZQHASA-N Asn-Val-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LTDGPJKGJDIBQD-LAEOZQHASA-N 0.000 description 2
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 2
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 2
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 2
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 2
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 2
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 2
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 2
- GISFCCXBVJKGEO-QEJZJMRPSA-N Asp-Glu-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GISFCCXBVJKGEO-QEJZJMRPSA-N 0.000 description 2
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 2
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 2
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 2
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 2
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 2
- 235000000832 Ayote Nutrition 0.000 description 2
- 239000005884 Beta-Cyfluthrin Substances 0.000 description 2
- 235000006008 Brassica napus var napus Nutrition 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- 241000193417 Brevibacillus laterosporus Species 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 2
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 2
- 239000005888 Clothianidin Substances 0.000 description 2
- 235000009854 Cucurbita moschata Nutrition 0.000 description 2
- 240000001980 Cucurbita pepo Species 0.000 description 2
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 2
- 239000005946 Cypermethrin Substances 0.000 description 2
- MBILEVLLOHJZMG-FXQIFTODSA-N Cys-Gln-Glu Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N MBILEVLLOHJZMG-FXQIFTODSA-N 0.000 description 2
- UDPSLLFHOLGXBY-FXQIFTODSA-N Cys-Glu-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDPSLLFHOLGXBY-FXQIFTODSA-N 0.000 description 2
- ZEXHDOQQYZKOIB-ACZMJKKPSA-N Cys-Glu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZEXHDOQQYZKOIB-ACZMJKKPSA-N 0.000 description 2
- JUUMIGUJJRFQQR-KKUMJFAQSA-N Cys-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)O JUUMIGUJJRFQQR-KKUMJFAQSA-N 0.000 description 2
- 239000005894 Emamectin Substances 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 108090000371 Esterases Proteins 0.000 description 2
- 239000005899 Fipronil Substances 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 2
- ZRXBYKAOFHLTDN-GUBZILKMSA-N Gln-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N ZRXBYKAOFHLTDN-GUBZILKMSA-N 0.000 description 2
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 2
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 2
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 2
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 2
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 2
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 2
- VXQOONWNIWFOCS-HGNGGELXSA-N Glu-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N VXQOONWNIWFOCS-HGNGGELXSA-N 0.000 description 2
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 2
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 2
- TZXOPHFCAATANZ-QEJZJMRPSA-N Glu-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N TZXOPHFCAATANZ-QEJZJMRPSA-N 0.000 description 2
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 2
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- 102000053187 Glucuronidase Human genes 0.000 description 2
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 2
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- 241000219146 Gossypium Species 0.000 description 2
- VTZYMXGGXOFBMX-DJFWLOJKSA-N His-Ile-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O VTZYMXGGXOFBMX-DJFWLOJKSA-N 0.000 description 2
- ZRSJXIKQXUGKRB-TUBUOCAGSA-N His-Ile-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZRSJXIKQXUGKRB-TUBUOCAGSA-N 0.000 description 2
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 2
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 2
- DQZCEKQPSOBNMJ-NKIYYHGXSA-N His-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DQZCEKQPSOBNMJ-NKIYYHGXSA-N 0.000 description 2
- MKWFGXSFLYNTKC-XIRDDKMYSA-N His-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N MKWFGXSFLYNTKC-XIRDDKMYSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 2
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 2
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- KIAOPHMUNPPGEN-PEXQALLHSA-N Ile-Gly-His Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KIAOPHMUNPPGEN-PEXQALLHSA-N 0.000 description 2
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 2
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 2
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 2
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 2
- 239000005906 Imidacloprid Substances 0.000 description 2
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 2
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 2
- YWYQSLOTVIRCFE-SRVKXCTJSA-N Leu-His-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O YWYQSLOTVIRCFE-SRVKXCTJSA-N 0.000 description 2
- MPSBSKHOWJQHBS-IHRRRGAJSA-N Leu-His-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N MPSBSKHOWJQHBS-IHRRRGAJSA-N 0.000 description 2
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 2
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 2
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 2
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 2
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 2
- 241000209510 Liliopsida Species 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- XUMBMVFBXHLACL-UHFFFAOYSA-N Melanin Chemical compound O=C1C(=O)C(C2=CNC3=C(C(C(=O)C4=C32)=O)C)=C2C4=CNC2=C1C XUMBMVFBXHLACL-UHFFFAOYSA-N 0.000 description 2
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 2
- UXJHNUBJSQQIOC-SZMVWBNQSA-N Met-Trp-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O UXJHNUBJSQQIOC-SZMVWBNQSA-N 0.000 description 2
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 2
- SEQKRHFRPICQDD-UHFFFAOYSA-N N-tris(hydroxymethyl)methylglycine Chemical compound OCC(CO)(CO)[NH2+]CC([O-])=O SEQKRHFRPICQDD-UHFFFAOYSA-N 0.000 description 2
- 108010033272 Nitrilase Proteins 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 108091005461 Nucleic proteins Chemical group 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 2
- VLZGUAUYZGQKPM-DRZSPHRISA-N Phe-Gln-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VLZGUAUYZGQKPM-DRZSPHRISA-N 0.000 description 2
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 2
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 2
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 2
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 2
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 2
- FINLZXKJWTYYLC-ACRUOGEOSA-N Phe-His-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FINLZXKJWTYYLC-ACRUOGEOSA-N 0.000 description 2
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 2
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 2
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 2
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 2
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 2
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 2
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 2
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 2
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 2
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 2
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 2
- 239000005925 Pymetrozine Substances 0.000 description 2
- 239000005927 Pyriproxyfen Substances 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 2
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 2
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 2
- DGPGKMKUNGKHPK-QEJZJMRPSA-N Ser-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGPGKMKUNGKHPK-QEJZJMRPSA-N 0.000 description 2
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 2
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 2
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 2
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 2
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 2
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 2
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- YZUWGFXVVZQJEI-PMVVWTBXSA-N Thr-Gly-His Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O YZUWGFXVVZQJEI-PMVVWTBXSA-N 0.000 description 2
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 2
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 2
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 2
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 241000499912 Trichoderma reesei Species 0.000 description 2
- 239000005942 Triflumuron Substances 0.000 description 2
- RNFZZCMCRDFNAE-WFBYXXMGSA-N Trp-Asn-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O RNFZZCMCRDFNAE-WFBYXXMGSA-N 0.000 description 2
- CKKFTIQYURNSEI-IHRRRGAJSA-N Tyr-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CKKFTIQYURNSEI-IHRRRGAJSA-N 0.000 description 2
- OEVJGIHPQOXYFE-SRVKXCTJSA-N Tyr-Asn-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OEVJGIHPQOXYFE-SRVKXCTJSA-N 0.000 description 2
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 2
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 2
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 2
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 2
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 2
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 2
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- QQODLKZGRKWIFG-RUTXASTPSA-N [(R)-cyano-(4-fluoro-3-phenoxyphenyl)methyl] (1S)-3-(2,2-dichloroethenyl)-2,2-dimethylcyclopropane-1-carboxylate Chemical compound CC1(C)C(C=C(Cl)Cl)[C@@H]1C(=O)O[C@@H](C#N)C1=CC=C(F)C(OC=2C=CC=CC=2)=C1 QQODLKZGRKWIFG-RUTXASTPSA-N 0.000 description 2
- 108010093941 acetylxylan esterase Proteins 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 108010061314 alpha-L-Fucosidase Proteins 0.000 description 2
- 108010044879 alpha-L-rhamnosidase Proteins 0.000 description 2
- 108010012864 alpha-Mannosidase Proteins 0.000 description 2
- 229960002587 amitraz Drugs 0.000 description 2
- QXAITBQSYVNQDR-ZIOPAAQOSA-N amitraz Chemical compound C=1C=C(C)C=C(C)C=1/N=C/N(C)\C=N\C1=CC=C(C)C=C1C QXAITBQSYVNQDR-ZIOPAAQOSA-N 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 108010019077 beta-Amylase Proteins 0.000 description 2
- 108010047754 beta-Glucosidase Proteins 0.000 description 2
- 238000003390 bioluminescence detection Methods 0.000 description 2
- 238000009395 breeding Methods 0.000 description 2
- 230000001488 breeding effect Effects 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 108010005400 cutinase Proteins 0.000 description 2
- 229960001591 cyfluthrin Drugs 0.000 description 2
- QQODLKZGRKWIFG-QSFXBCCZSA-N cyfluthrin Chemical compound CC1(C)[C@@H](C=C(Cl)Cl)[C@H]1C(=O)O[C@@H](C#N)C1=CC=C(F)C(OC=2C=CC=CC=2)=C1 QQODLKZGRKWIFG-QSFXBCCZSA-N 0.000 description 2
- ZXQYGBMAQZUVMI-UNOMPAQXSA-N cyhalothrin Chemical compound CC1(C)C(\C=C(/Cl)C(F)(F)F)C1C(=O)OC(C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 ZXQYGBMAQZUVMI-UNOMPAQXSA-N 0.000 description 2
- 229960005424 cypermethrin Drugs 0.000 description 2
- KAATUXNTWXVJKI-UHFFFAOYSA-N cypermethrin Chemical compound CC1(C)C(C=C(Cl)Cl)C1C(=O)OC(C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 KAATUXNTWXVJKI-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- 239000012153 distilled water Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000012149 elution buffer Substances 0.000 description 2
- CXEGAUYXQAKHKJ-NSBHKLITSA-N emamectin B1a Chemical compound C1=C[C@H](C)[C@@H]([C@@H](C)CC)O[C@]11O[C@H](C\C=C(C)\[C@@H](O[C@@H]2O[C@@H](C)[C@H](O[C@@H]3O[C@@H](C)[C@H](NC)[C@@H](OC)C3)[C@@H](OC)C2)[C@@H](C)\C=C\C=C/2[C@]3([C@H](C(=O)O4)C=C(C)[C@@H](O)[C@H]3OC\2)O)C[C@H]4C1 CXEGAUYXQAKHKJ-NSBHKLITSA-N 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 229960003276 erythromycin Drugs 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 229940013764 fipronil Drugs 0.000 description 2
- RYLHNOVXKPXDIP-UHFFFAOYSA-N flufenoxuron Chemical compound C=1C=C(NC(=O)NC(=O)C=2C(=CC=CC=2F)F)C(F)=CC=1OC1=CC=C(C(F)(F)F)C=C1Cl RYLHNOVXKPXDIP-UHFFFAOYSA-N 0.000 description 2
- 239000013568 food allergen Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 239000008187 granular material Substances 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010002430 hemicellulase Proteins 0.000 description 2
- 229940056881 imidacloprid Drugs 0.000 description 2
- YWTYJOPNNQFBPC-UHFFFAOYSA-N imidacloprid Chemical compound [O-][N+](=O)\N=C1/NCCN1CC1=CC=C(Cl)N=C1 YWTYJOPNNQFBPC-UHFFFAOYSA-N 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- HOQADATXFBOEGG-UHFFFAOYSA-N isofenphos Chemical compound CCOP(=S)(NC(C)C)OC1=CC=CC=C1C(=O)OC(C)C HOQADATXFBOEGG-UHFFFAOYSA-N 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 230000009571 larval growth Effects 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 210000004379 membrane Anatomy 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- SXTAYKAGBXMACB-UHFFFAOYSA-N methionine sulfoximine Chemical compound CS(=N)(=O)CCC(N)C(O)=O SXTAYKAGBXMACB-UHFFFAOYSA-N 0.000 description 2
- 229960000485 methotrexate Drugs 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- YTYGAJLZOJPJGH-UHFFFAOYSA-N noviflumuron Chemical compound FC1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=C(Cl)C=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F YTYGAJLZOJPJGH-UHFFFAOYSA-N 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 230000029553 photosynthesis Effects 0.000 description 2
- 238000010672 photosynthesis Methods 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 235000012015 potatoes Nutrition 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 238000002331 protein detection Methods 0.000 description 2
- 235000015136 pumpkin Nutrition 0.000 description 2
- QHMTXANCGGJZRX-WUXMJOGZSA-N pymetrozine Chemical compound C1C(C)=NNC(=O)N1\N=C\C1=CC=CN=C1 QHMTXANCGGJZRX-WUXMJOGZSA-N 0.000 description 2
- NHDHVHZZCFYRSB-UHFFFAOYSA-N pyriproxyfen Chemical compound C=1C=CC=NC=1OC(C)COC(C=C1)=CC=C1OC1=CC=CC=C1 NHDHVHZZCFYRSB-UHFFFAOYSA-N 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 239000013605 shuttle vector Substances 0.000 description 2
- SQGYOTSLMSWVJD-UHFFFAOYSA-N silver(1+) nitrate Chemical compound [Ag+].[O-]N(=O)=O SQGYOTSLMSWVJD-UHFFFAOYSA-N 0.000 description 2
- 238000002791 soaking Methods 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 229960000268 spectinomycin Drugs 0.000 description 2
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- BAKXBZPQTXCKRR-UHFFFAOYSA-N thiodicarb Chemical compound CSC(C)=NOC(=O)NSNC(=O)ON=C(C)SC BAKXBZPQTXCKRR-UHFFFAOYSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- XAIPTRIXGHTTNT-UHFFFAOYSA-N triflumuron Chemical compound C1=CC(OC(F)(F)F)=CC=C1NC(=O)NC(=O)C1=CC=CC=C1Cl XAIPTRIXGHTTNT-UHFFFAOYSA-N 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 210000003934 vacuole Anatomy 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- ZXQYGBMAQZUVMI-RDDWSQKMSA-N (1S)-cis-(alphaR)-cyhalothrin Chemical compound CC1(C)[C@H](\C=C(/Cl)C(F)(F)F)[C@@H]1C(=O)O[C@@H](C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 ZXQYGBMAQZUVMI-RDDWSQKMSA-N 0.000 description 1
- LZTIMERBDGGAJD-SNAWJCMRSA-N (2e)-2-(nitromethylidene)-1,3-thiazinane Chemical compound [O-][N+](=O)\C=C1/NCCCS1 LZTIMERBDGGAJD-SNAWJCMRSA-N 0.000 description 1
- ZDSRFXVZVHSYMA-CMOCDZPBSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-4-carboxybutanoyl]amino]pentanedioic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 ZDSRFXVZVHSYMA-CMOCDZPBSA-N 0.000 description 1
- XUNYDVLIZWUPAW-UHFFFAOYSA-N (4-chlorophenyl) n-(4-methylphenyl)sulfonylcarbamate Chemical compound C1=CC(C)=CC=C1S(=O)(=O)NC(=O)OC1=CC=C(Cl)C=C1 XUNYDVLIZWUPAW-UHFFFAOYSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- FCHBECOAGZMTFE-ZEQKJWHPSA-N (6r,7r)-3-[[2-[[4-(dimethylamino)phenyl]diazenyl]pyridin-1-ium-1-yl]methyl]-8-oxo-7-[(2-thiophen-2-ylacetyl)amino]-5-thia-1-azabicyclo[4.2.0]oct-2-ene-2-carboxylate Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=CC=[N+]1CC1=C(C([O-])=O)N2C(=O)[C@@H](NC(=O)CC=3SC=CC=3)[C@H]2SC1 FCHBECOAGZMTFE-ZEQKJWHPSA-N 0.000 description 1
- WCXDHFDTOYPNIE-RIYZIHGNSA-N (E)-acetamiprid Chemical compound N#C/N=C(\C)N(C)CC1=CC=C(Cl)N=C1 WCXDHFDTOYPNIE-RIYZIHGNSA-N 0.000 description 1
- FYADHXFMURLYQI-UHFFFAOYSA-N 1,2,4-triazine Chemical compound C1=CN=NC=N1 FYADHXFMURLYQI-UHFFFAOYSA-N 0.000 description 1
- JIHQDMXYYFUGFV-UHFFFAOYSA-N 1,3,5-triazine Chemical compound C1=NC=NC=N1 JIHQDMXYYFUGFV-UHFFFAOYSA-N 0.000 description 1
- 108020004465 16S ribosomal RNA Proteins 0.000 description 1
- NDUPDOJHUQKPAG-UHFFFAOYSA-M 2,2-Dichloropropanoate Chemical compound CC(Cl)(Cl)C([O-])=O NDUPDOJHUQKPAG-UHFFFAOYSA-M 0.000 description 1
- GOCUAJYOYBLQRH-UHFFFAOYSA-N 2-(4-{[3-chloro-5-(trifluoromethyl)pyridin-2-yl]oxy}phenoxy)propanoic acid Chemical compound C1=CC(OC(C)C(O)=O)=CC=C1OC1=NC=C(C(F)(F)F)C=C1Cl GOCUAJYOYBLQRH-UHFFFAOYSA-N 0.000 description 1
- ZUYKJZQOPXDNOK-UHFFFAOYSA-N 2-(ethylamino)-2-thiophen-2-ylcyclohexan-1-one;hydrochloride Chemical class Cl.C=1C=CSC=1C1(NCC)CCCCC1=O ZUYKJZQOPXDNOK-UHFFFAOYSA-N 0.000 description 1
- SXERGJJQSKIUIC-UHFFFAOYSA-N 2-Phenoxypropionic acid Chemical class OC(=O)C(C)OC1=CC=CC=C1 SXERGJJQSKIUIC-UHFFFAOYSA-N 0.000 description 1
- ZWZOCNTYMUOGPQ-UHFFFAOYSA-N 2-[[2-[[1-(2-amino-3-methylpentanoyl)pyrrolidine-2-carbonyl]amino]acetyl]amino]-3-methylpentanoic acid Chemical compound CCC(C)C(N)C(=O)N1CCCC1C(=O)NCC(=O)NC(C(C)CC)C(O)=O ZWZOCNTYMUOGPQ-UHFFFAOYSA-N 0.000 description 1
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 1
- AXAVXPMQTGXXJZ-UHFFFAOYSA-N 2-aminoacetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol Chemical compound NCC(O)=O.OCC(N)(CO)CO AXAVXPMQTGXXJZ-UHFFFAOYSA-N 0.000 description 1
- 102100027328 2-hydroxyacyl-CoA lyase 2 Human genes 0.000 description 1
- UPMXNNIRAGDFEH-UHFFFAOYSA-N 3,5-dibromo-4-hydroxybenzonitrile Chemical compound OC1=C(Br)C=C(C#N)C=C1Br UPMXNNIRAGDFEH-UHFFFAOYSA-N 0.000 description 1
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 1
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 1
- HUNCSWANZMJLPM-UHFFFAOYSA-N 5-methyltryptophan Chemical compound CC1=CC=C2NC=C(CC(N)C(O)=O)C2=C1 HUNCSWANZMJLPM-UHFFFAOYSA-N 0.000 description 1
- IBSREHMXUMOFBB-JFUDTMANSA-N 5u8924t11h Chemical compound O1[C@@H](C)[C@H](O)[C@@H](OC)C[C@@H]1O[C@@H]1[C@@H](OC)C[C@H](O[C@@H]2C(=C/C[C@@H]3C[C@@H](C[C@@]4(O3)C=C[C@H](C)[C@@H](C(C)C)O4)OC(=O)[C@@H]3C=C(C)[C@@H](O)[C@H]4OC\C([C@@]34O)=C/C=C/[C@@H]2C)/C)O[C@H]1C.C1=C[C@H](C)[C@@H]([C@@H](C)CC)O[C@]11O[C@H](C\C=C(C)\[C@@H](O[C@@H]2O[C@@H](C)[C@H](O[C@@H]3O[C@@H](C)[C@H](O)[C@@H](OC)C3)[C@@H](OC)C2)[C@@H](C)\C=C\C=C/2[C@]3([C@H](C(=O)O4)C=C(C)[C@@H](O)[C@H]3OC\2)O)C[C@H]4C1 IBSREHMXUMOFBB-JFUDTMANSA-N 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- 241000238876 Acari Species 0.000 description 1
- 239000005875 Acetamiprid Substances 0.000 description 1
- 101710103719 Acetolactate synthase large subunit Proteins 0.000 description 1
- 101710182467 Acetolactate synthase large subunit IlvB1 Proteins 0.000 description 1
- 101710171176 Acetolactate synthase large subunit IlvG Proteins 0.000 description 1
- 101710176702 Acetolactate synthase small subunit Proteins 0.000 description 1
- 101710147947 Acetolactate synthase small subunit 1, chloroplastic Proteins 0.000 description 1
- 101710095712 Acetolactate synthase, mitochondrial Proteins 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 101150021974 Adh1 gene Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- JMCUQXTXLJEQSY-XKNYDFJKSA-N Ala-Asn-Asn-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O JMCUQXTXLJEQSY-XKNYDFJKSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 1
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- ATAKEVCGTRZKLI-UWJYBYFXSA-N Ala-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 ATAKEVCGTRZKLI-UWJYBYFXSA-N 0.000 description 1
- NJWJSLCQEDMGNC-MBLNEYKQSA-N Ala-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N)O NJWJSLCQEDMGNC-MBLNEYKQSA-N 0.000 description 1
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 1
- 241000449794 Alabama argillacea Species 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 244000291564 Allium cepa Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 240000002234 Allium sativum Species 0.000 description 1
- 244000144730 Amygdalus persica Species 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 208000031295 Animal disease Diseases 0.000 description 1
- 101710117679 Anthocyanidin 3-O-glucosyltransferase Proteins 0.000 description 1
- 108010037870 Anthranilate Synthase Proteins 0.000 description 1
- 241000625753 Anticarsia Species 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 238000006677 Appel reaction Methods 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 101710152845 Arabinogalactan endo-beta-1,4-galactanase Proteins 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- LYJXHXGPWDTLKW-HJGDQZAQSA-N Arg-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O LYJXHXGPWDTLKW-HJGDQZAQSA-N 0.000 description 1
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 1
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 1
- VOKWBBBXJONREA-DCAQKATOSA-N Asn-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N VOKWBBBXJONREA-DCAQKATOSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 1
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 1
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 1
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 244000003416 Asparagus officinalis Species 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241001513093 Aspergillus awamori Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 239000005878 Azadirachtin Substances 0.000 description 1
- 108700003860 Bacterial Genes Proteins 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 239000005874 Bifenthrin Substances 0.000 description 1
- 241000167854 Bourreria succulenta Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 241000555281 Brevibacillus Species 0.000 description 1
- 239000005489 Bromoxynil Substances 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- JFLRKDZMHNBDQS-UCQUSYKYSA-N CC[C@H]1CCC[C@@H]([C@H](C(=O)C2=C[C@H]3[C@@H]4C[C@@H](C[C@H]4C(=C[C@H]3[C@@H]2CC(=O)O1)C)O[C@H]5[C@@H]([C@@H]([C@H]([C@@H](O5)C)OC)OC)OC)C)O[C@H]6CC[C@@H]([C@H](O6)C)N(C)C.CC[C@H]1CCC[C@@H]([C@H](C(=O)C2=C[C@H]3[C@@H]4C[C@@H](C[C@H]4C=C[C@H]3C2CC(=O)O1)O[C@H]5[C@@H]([C@@H]([C@H]([C@@H](O5)C)OC)OC)OC)C)O[C@H]6CC[C@@H]([C@H](O6)C)N(C)C Chemical compound CC[C@H]1CCC[C@@H]([C@H](C(=O)C2=C[C@H]3[C@@H]4C[C@@H](C[C@H]4C(=C[C@H]3[C@@H]2CC(=O)O1)C)O[C@H]5[C@@H]([C@@H]([C@H]([C@@H](O5)C)OC)OC)OC)C)O[C@H]6CC[C@@H]([C@H](O6)C)N(C)C.CC[C@H]1CCC[C@@H]([C@H](C(=O)C2=C[C@H]3[C@@H]4C[C@@H](C[C@H]4C=C[C@H]3C2CC(=O)O1)O[C@H]5[C@@H]([C@@H]([C@H]([C@@H](O5)C)OC)OC)OC)C)O[C@H]6CC[C@@H]([C@H](O6)C)N(C)C JFLRKDZMHNBDQS-UCQUSYKYSA-N 0.000 description 1
- 101150078024 CRY2 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 235000009467 Carica papaya Nutrition 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 241001480010 Cestrum Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- RAPBNVDSDCTNRC-UHFFFAOYSA-N Chlorobenzilate Chemical compound C=1C=C(Cl)C=CC=1C(O)(C(=O)OCC)C1=CC=C(Cl)C=C1 RAPBNVDSDCTNRC-UHFFFAOYSA-N 0.000 description 1
- 108700031407 Chloroplast Genes Proteins 0.000 description 1
- 108010089254 Cholesterol oxidase Proteins 0.000 description 1
- 108091060290 Chromatid Proteins 0.000 description 1
- 235000007542 Cichorium intybus Nutrition 0.000 description 1
- 244000298479 Cichorium intybus Species 0.000 description 1
- 241000098277 Cnaphalocrocis Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 101150102464 Cry1 gene Proteins 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 241000219130 Cucurbita pepo subsp. pepo Species 0.000 description 1
- 235000003954 Cucurbita pepo var melopepo Nutrition 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- 108010025880 Cyclomaltodextrin glucanotransferase Proteins 0.000 description 1
- 235000017788 Cydonia oblonga Nutrition 0.000 description 1
- 239000005891 Cyromazine Substances 0.000 description 1
- GMXSSZUVDNPRMA-FXQIFTODSA-N Cys-Arg-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GMXSSZUVDNPRMA-FXQIFTODSA-N 0.000 description 1
- XKDHARKYRGHLKO-QEJZJMRPSA-N Cys-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N XKDHARKYRGHLKO-QEJZJMRPSA-N 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 239000005892 Deltamethrin Substances 0.000 description 1
- 241000122105 Diatraea Species 0.000 description 1
- LWLJUMBEZJHXHV-UHFFFAOYSA-N Dienochlor Chemical compound ClC1=C(Cl)C(Cl)=C(Cl)C1(Cl)C1(Cl)C(Cl)=C(Cl)C(Cl)=C1Cl LWLJUMBEZJHXHV-UHFFFAOYSA-N 0.000 description 1
- 108010082495 Dietary Plant Proteins Proteins 0.000 description 1
- 239000005893 Diflubenzuron Substances 0.000 description 1
- 239000005947 Dimethoate Substances 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- AHMIDUVKSGCHAU-UHFFFAOYSA-N Dopaquinone Natural products OC(=O)C(N)CC1=CC(=O)C(=O)C=C1 AHMIDUVKSGCHAU-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 108010001817 Endo-1,4-beta Xylanases Proteins 0.000 description 1
- 101710147028 Endo-beta-1,4-galactanase Proteins 0.000 description 1
- 102100023882 Endoribonuclease ZC3H12A Human genes 0.000 description 1
- 101710112715 Endoribonuclease ZC3H12A Proteins 0.000 description 1
- 102100023164 Epididymis-specific alpha-mannosidase Human genes 0.000 description 1
- 241001331845 Equus asinus x caballus Species 0.000 description 1
- 101100437498 Escherichia coli (strain K12) uidA gene Proteins 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 239000005895 Esfenvalerate Substances 0.000 description 1
- FNELVJVBIYMIMC-UHFFFAOYSA-N Ethiprole Chemical compound N1=C(C#N)C(S(=O)CC)=C(N)N1C1=C(Cl)C=C(C(F)(F)F)C=C1Cl FNELVJVBIYMIMC-UHFFFAOYSA-N 0.000 description 1
- 239000005958 Fenamiphos (aka phenamiphos) Substances 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 1
- ZFADFBPRMSBPOT-KKUMJFAQSA-N Gln-Arg-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZFADFBPRMSBPOT-KKUMJFAQSA-N 0.000 description 1
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 1
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 1
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 1
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- JTWZNMUVQWWGOX-SOUVJXGZSA-N Gln-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JTWZNMUVQWWGOX-SOUVJXGZSA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- QYPKJXSMLMREKF-BPUTZDHNSA-N Glu-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N QYPKJXSMLMREKF-BPUTZDHNSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 1
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- 108050008938 Glucoamylases Proteins 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 239000005561 Glufosinate Substances 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 244000061944 Helianthus giganteus Species 0.000 description 1
- 241000258937 Hemiptera Species 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 241000400808 Herpetogramma phaeopteralis Species 0.000 description 1
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 1
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 238000009015 Human TaqMan MicroRNA Assay kit Methods 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 241000257303 Hymenoptera Species 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- SJIGTGZVQGLMGG-NAKRPEOUSA-N Ile-Cys-Arg Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O SJIGTGZVQGLMGG-NAKRPEOUSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 1
- 239000005907 Indoxacarb Substances 0.000 description 1
- 206010061217 Infestation Diseases 0.000 description 1
- IMQLKJBTEOYOSI-GPIVLXJGSA-N Inositol-hexakisphosphate Chemical compound OP(O)(=O)O[C@H]1[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@@H]1OP(O)(O)=O IMQLKJBTEOYOSI-GPIVLXJGSA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 241001495069 Ischnocera Species 0.000 description 1
- 241000588744 Klebsiella pneumoniae subsp. ozaenae Species 0.000 description 1
- WTDRDQBEARUVNC-UHFFFAOYSA-N L-Dopa Natural products OC(=O)C(N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- AHMIDUVKSGCHAU-LURJTMIESA-N L-dopaquinone Chemical compound [O-]C(=O)[C@@H]([NH3+])CC1=CC(=O)C(=O)C=C1 AHMIDUVKSGCHAU-LURJTMIESA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108010029541 Laccase Proteins 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 1
- NFHJQETXTSDZSI-DCAQKATOSA-N Leu-Cys-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NFHJQETXTSDZSI-DCAQKATOSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000710118 Maize chlorotic mottle virus Species 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- 101150054907 Mrps12 gene Proteins 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 101150014068 PPIP5K1 gene Proteins 0.000 description 1
- 102100026367 Pancreatic alpha-amylase Human genes 0.000 description 1
- 102100033359 Pancreatic triacylglycerol lipase Human genes 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- YRKFKTQRVBJYLT-CQDKDKBSSA-N Phe-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 YRKFKTQRVBJYLT-CQDKDKBSSA-N 0.000 description 1
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 1
- BVHFFNYBKRTSIU-MEYUZBJRSA-N Phe-His-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BVHFFNYBKRTSIU-MEYUZBJRSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- 108091000041 Phosphoenolpyruvate Carboxylase Proteins 0.000 description 1
- 102100035362 Phosphomannomutase 2 Human genes 0.000 description 1
- 241001674048 Phthiraptera Species 0.000 description 1
- IMQLKJBTEOYOSI-UHFFFAOYSA-N Phytic acid Natural products OP(O)(=O)OC1C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C1OP(O)(O)=O IMQLKJBTEOYOSI-UHFFFAOYSA-N 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 239000005923 Pirimicarb Substances 0.000 description 1
- 241000242594 Platyhelminthes Species 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 108010059820 Polygalacturonase Proteins 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- VPBQDHMASPJHGY-JYJNAYRXSA-N Pro-Trp-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CO)C(=O)O VPBQDHMASPJHGY-JYJNAYRXSA-N 0.000 description 1
- 101710196435 Probable acetolactate synthase large subunit Proteins 0.000 description 1
- 101710181764 Probable acetolactate synthase small subunit Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108020001991 Protoporphyrinogen Oxidase Proteins 0.000 description 1
- 102000005135 Protoporphyrinogen oxidase Human genes 0.000 description 1
- 235000009827 Prunus armeniaca Nutrition 0.000 description 1
- 244000018633 Prunus armeniaca Species 0.000 description 1
- 235000006029 Prunus persica var nucipersica Nutrition 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 244000017714 Prunus persica var. nucipersica Species 0.000 description 1
- 241001646398 Pseudomonas chlororaphis Species 0.000 description 1
- 101710104000 Putative acetolactate synthase small subunit Proteins 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 108010066717 Q beta Replicase Proteins 0.000 description 1
- 244000088415 Raphanus sativus Species 0.000 description 1
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 1
- 101100120298 Rattus norvegicus Flot1 gene Proteins 0.000 description 1
- 101100412401 Rattus norvegicus Reg3a gene Proteins 0.000 description 1
- 101100412403 Rattus norvegicus Reg3b gene Proteins 0.000 description 1
- 108700005079 Recessive Genes Proteins 0.000 description 1
- 102000052708 Recessive Genes Human genes 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000235403 Rhizomucor miehei Species 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 241001400590 Richia Species 0.000 description 1
- 240000007651 Rubus glaucus Species 0.000 description 1
- 101100199945 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rps1201 gene Proteins 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- 241000931987 Sesamia Species 0.000 description 1
- 241000563489 Sesamia inferens Species 0.000 description 1
- CSPPKDPQLUUTND-NBVRZTHBSA-N Sethoxydim Chemical compound CCO\N=C(/CCC)C1=C(O)CC(CC(C)SCC)CC1=O CSPPKDPQLUUTND-NBVRZTHBSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- UIIMBOGNXHQVGW-DEQYMQKBSA-M Sodium bicarbonate-14C Chemical compound [Na+].O[14C]([O-])=O UIIMBOGNXHQVGW-DEQYMQKBSA-M 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000592344 Spermatophyta Species 0.000 description 1
- 235000009337 Spinacia oleracea Nutrition 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 239000005930 Spinosad Substances 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- UZMAPBJVXOGOFT-UHFFFAOYSA-N Syringetin Natural products COC1=C(O)C(OC)=CC(C2=C(C(=O)C3=C(O)C=C(O)C=C3O2)O)=C1 UZMAPBJVXOGOFT-UHFFFAOYSA-N 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 1
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 1
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241000656145 Thyrsites atun Species 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 239000007997 Tricine buffer Substances 0.000 description 1
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 1
- UJGDFQRPYGJBEH-AAEUAGOBSA-N Trp-Ser-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N UJGDFQRPYGJBEH-AAEUAGOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 1
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- KSGKJSFPWSMJHK-JNPHEJMOSA-N Tyr-Tyr-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSGKJSFPWSMJHK-JNPHEJMOSA-N 0.000 description 1
- 102000003425 Tyrosinase Human genes 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- 244000078534 Vaccinium myrtillus Species 0.000 description 1
- VDPRBUOZLIFUIM-GUBZILKMSA-N Val-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N VDPRBUOZLIFUIM-GUBZILKMSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- XNLUVJPMPAZHCY-JYJNAYRXSA-N Val-Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 XNLUVJPMPAZHCY-JYJNAYRXSA-N 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 229920002494 Zein Polymers 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 101150067314 aadA gene Proteins 0.000 description 1
- 229950008167 abamectin Drugs 0.000 description 1
- 230000036579 abiotic stress Effects 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- YASYVMFAVPKPKE-UHFFFAOYSA-N acephate Chemical compound COP(=O)(SC)NC(C)=O YASYVMFAVPKPKE-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 231100000460 acute oral toxicity Toxicity 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- QGLZXHRNAYXIBU-WEVVVXLNSA-N aldicarb Chemical compound CNC(=O)O\N=C\C(C)(C)SC QGLZXHRNAYXIBU-WEVVVXLNSA-N 0.000 description 1
- 108010050181 aleurone Proteins 0.000 description 1
- 239000013566 allergen Substances 0.000 description 1
- 208000030961 allergic reaction Diseases 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 102000016679 alpha-Glucosidases Human genes 0.000 description 1
- 102000012086 alpha-L-Fucosidase Human genes 0.000 description 1
- 102000019199 alpha-Mannosidase Human genes 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 231100000788 altered fertility Toxicity 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 239000004410 anthocyanin Substances 0.000 description 1
- 229930002877 anthocyanin Natural products 0.000 description 1
- 235000010208 anthocyanin Nutrition 0.000 description 1
- 150000004636 anthocyanins Chemical class 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 210000000628 antibody-producing cell Anatomy 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- RRZXIRBKKLTSOM-XPNPUAGNSA-N avermectin B1a Chemical compound C1=C[C@H](C)[C@@H]([C@@H](C)CC)O[C@]11O[C@H](C\C=C(C)\[C@@H](O[C@@H]2O[C@@H](C)[C@H](O[C@@H]3O[C@@H](C)[C@H](O)[C@@H](OC)C3)[C@@H](OC)C2)[C@@H](C)\C=C\C=C/2[C@]3([C@H](C(=O)O4)C=C(C)[C@@H](O)[C@H]3OC\2)O)C[C@H]4C1 RRZXIRBKKLTSOM-XPNPUAGNSA-N 0.000 description 1
- VEHPJKVTJQSSKL-UHFFFAOYSA-N azadirachtin Natural products O1C2(C)C(C3(C=COC3O3)O)CC3C21C1(C)C(O)C(OCC2(OC(C)=O)C(CC3OC(=O)C(C)=CC)OC(C)=O)C2C32COC(C(=O)OC)(O)C12 VEHPJKVTJQSSKL-UHFFFAOYSA-N 0.000 description 1
- FTNJWQUOZFUQQJ-IRYYUVNJSA-N azadirachtin A Natural products C([C@@H]([C@]1(C=CO[C@H]1O1)O)[C@]2(C)O3)[C@H]1[C@]23[C@]1(C)[C@H](O)[C@H](OC[C@@]2([C@@H](C[C@@H]3OC(=O)C(\C)=C/C)OC(C)=O)C(=O)OC)[C@@H]2[C@]32CO[C@@](C(=O)OC)(O)[C@@H]12 FTNJWQUOZFUQQJ-IRYYUVNJSA-N 0.000 description 1
- FTNJWQUOZFUQQJ-NDAWSKJSSA-N azadirachtin A Chemical compound C([C@@H]([C@]1(C=CO[C@H]1O1)O)[C@]2(C)O3)[C@H]1[C@]23[C@]1(C)[C@H](O)[C@H](OC[C@@]2([C@@H](C[C@@H]3OC(=O)C(\C)=C\C)OC(C)=O)C(=O)OC)[C@@H]2[C@]32CO[C@@](C(=O)OC)(O)[C@@H]12 FTNJWQUOZFUQQJ-NDAWSKJSSA-N 0.000 description 1
- CJJOSEISRRTUQB-UHFFFAOYSA-N azinphos-methyl Chemical group C1=CC=C2C(=O)N(CSP(=S)(OC)OC)N=NC2=C1 CJJOSEISRRTUQB-UHFFFAOYSA-N 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 108010048056 beta-1,3-exoglucanase Proteins 0.000 description 1
- 102000006995 beta-Glucosidase Human genes 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- OMFRMAHOUUJSGP-IRHGGOMRSA-N bifenthrin Chemical compound C1=CC=C(C=2C=CC=CC=2)C(C)=C1COC(=O)[C@@H]1[C@H](\C=C(/Cl)C(F)(F)F)C1(C)C OMFRMAHOUUJSGP-IRHGGOMRSA-N 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000007321 biological mechanism Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- VEMKTZHHVJILDY-UXHICEINSA-N bioresmethrin Chemical compound CC1(C)[C@H](C=C(C)C)[C@H]1C(=O)OCC1=COC(CC=2C=CC=CC=2)=C1 VEMKTZHHVJILDY-UXHICEINSA-N 0.000 description 1
- 235000021029 blackberry Nutrition 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 101150039352 can gene Proteins 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 235000013877 carbamide Nutrition 0.000 description 1
- DUEPRVBVGDRKAG-UHFFFAOYSA-N carbofuran Chemical compound CNC(=O)OC1=CC=CC2=C1OC(C)(C)C2 DUEPRVBVGDRKAG-UHFFFAOYSA-N 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 101150052795 cbh-1 gene Proteins 0.000 description 1
- 101150114858 cbh2 gene Proteins 0.000 description 1
- 229960004261 cefotaxime Drugs 0.000 description 1
- AZZMGZXNTDTSME-JUZDKLSSSA-M cefotaxime sodium Chemical compound [Na+].N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C([O-])=O)=O)C(=O)\C(=N/OC)C1=CSC(N)=N1 AZZMGZXNTDTSME-JUZDKLSSSA-M 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 108010080434 cephalosporin-C deacetylase Proteins 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- SBPBAQFWLVIOKP-UHFFFAOYSA-N chlorpyrifos Chemical compound CCOP(=S)(OCC)OC1=NC(Cl)=C(Cl)C=C1Cl SBPBAQFWLVIOKP-UHFFFAOYSA-N 0.000 description 1
- HPNSNYBUADCFDR-UHFFFAOYSA-N chromafenozide Chemical compound CC1=CC(C)=CC(C(=O)N(NC(=O)C=2C(=C3CCCOC3=CC=2)C)C(C)(C)C)=C1 HPNSNYBUADCFDR-UHFFFAOYSA-N 0.000 description 1
- 210000004756 chromatid Anatomy 0.000 description 1
- 210000001726 chromosome structure Anatomy 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 239000000306 component Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- OILAIQUEIWYQPH-UHFFFAOYSA-N cyclohexane-1,2-dione Chemical compound O=C1CCCCC1=O OILAIQUEIWYQPH-UHFFFAOYSA-N 0.000 description 1
- WCMMILVIRZAPLE-UHFFFAOYSA-M cyhexatin Chemical compound C1CCCCC1[Sn](C1CCCCC1)(O)C1CCCCC1 WCMMILVIRZAPLE-UHFFFAOYSA-M 0.000 description 1
- LVQDKIWDGQRHTE-UHFFFAOYSA-N cyromazine Chemical compound NC1=NC(N)=NC(NC2CC2)=N1 LVQDKIWDGQRHTE-UHFFFAOYSA-N 0.000 description 1
- 229950000775 cyromazine Drugs 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- 229960002483 decamethrin Drugs 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- OWZREIFADZCYQD-NSHGMRRFSA-N deltamethrin Chemical compound CC1(C)[C@@H](C=C(Br)Br)[C@H]1C(=O)O[C@H](C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 OWZREIFADZCYQD-NSHGMRRFSA-N 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- WOWBFOBYOAGEEA-UHFFFAOYSA-N diafenthiuron Chemical compound CC(C)C1=C(NC(=S)NC(C)(C)C)C(C(C)C)=CC(OC=2C=CC=CC=2)=C1 WOWBFOBYOAGEEA-UHFFFAOYSA-N 0.000 description 1
- FHIVAFMUCKRCQO-UHFFFAOYSA-N diazinon Chemical compound CCOP(=S)(OCC)OC1=CC(C)=NC(C(C)C)=N1 FHIVAFMUCKRCQO-UHFFFAOYSA-N 0.000 description 1
- UOAMTSKGCBMZTC-UHFFFAOYSA-N dicofol Chemical compound C=1C=C(Cl)C=CC=1C(C(Cl)(Cl)Cl)(O)C1=CC=C(Cl)C=C1 UOAMTSKGCBMZTC-UHFFFAOYSA-N 0.000 description 1
- 235000021245 dietary protein Nutrition 0.000 description 1
- JXSJBGJIGXNWCI-UHFFFAOYSA-N diethyl 2-[(dimethoxyphosphorothioyl)thio]succinate Chemical compound CCOC(=O)CC(SP(=S)(OC)OC)C(=O)OCC JXSJBGJIGXNWCI-UHFFFAOYSA-N 0.000 description 1
- 229940019503 diflubenzuron Drugs 0.000 description 1
- 230000001079 digestive effect Effects 0.000 description 1
- KCFYHBSOLOXZIF-UHFFFAOYSA-N dihydrochrysin Natural products COC1=C(O)C(OC)=CC(C2OC3=CC(O)=CC(O)=C3C(=O)C2)=C1 KCFYHBSOLOXZIF-UHFFFAOYSA-N 0.000 description 1
- MCWXGJITAZMZEV-UHFFFAOYSA-N dimethoate Chemical compound CNC(=O)CSP(=S)(OC)OC MCWXGJITAZMZEV-UHFFFAOYSA-N 0.000 description 1
- MHUWZNTUIIFHAS-CLFAGFIQSA-N dioleoyl phosphatidic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(COP(O)(O)=O)OC(=O)CCCCCCC\C=C/CCCCCCCC MHUWZNTUIIFHAS-CLFAGFIQSA-N 0.000 description 1
- 238000007598 dipping method Methods 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000010410 dusting Methods 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000000408 embryogenic effect Effects 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 108010050200 endo-1,4-beta-D-mannanase Proteins 0.000 description 1
- YERABYSOHUZTPQ-UHFFFAOYSA-P endo-1,4-beta-Xylanase Chemical compound C=1C=CC=CC=1C[N+](CC)(CC)CCCNC(C(C=1)=O)=CC(=O)C=1NCCC[N+](CC)(CC)CC1=CC=CC=C1 YERABYSOHUZTPQ-UHFFFAOYSA-P 0.000 description 1
- RDYMFSUJUZBWLH-SVWSLYAFSA-N endosulfan Chemical compound C([C@@H]12)OS(=O)OC[C@@H]1[C@]1(Cl)C(Cl)=C(Cl)[C@@]2(Cl)C1(Cl)Cl RDYMFSUJUZBWLH-SVWSLYAFSA-N 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- NYPJDWWKZLNGGM-RPWUZVMVSA-N esfenvalerate Chemical compound C=1C([C@@H](C#N)OC(=O)[C@@H](C(C)C)C=2C=CC(Cl)=CC=2)=CC=CC=1OC1=CC=CC=C1 NYPJDWWKZLNGGM-RPWUZVMVSA-N 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 108010038658 exo-1,4-beta-D-xylosidase Proteins 0.000 description 1
- 108010093305 exopolygalacturonase Proteins 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- ZCJPOPBZHLUFHF-UHFFFAOYSA-N fenamiphos Chemical compound CCOP(=O)(NC(C)C)OC1=CC=C(SC)C(C)=C1 ZCJPOPBZHLUFHF-UHFFFAOYSA-N 0.000 description 1
- YYJNOYZRYGDPNH-MFKUBSTISA-N fenpyroximate Chemical compound C=1C=C(C(=O)OC(C)(C)C)C=CC=1CO/N=C/C=1C(C)=NN(C)C=1OC1=CC=CC=C1 YYJNOYZRYGDPNH-MFKUBSTISA-N 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 108010041969 feruloyl esterase Proteins 0.000 description 1
- 244000037666 field crops Species 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- GJEREQYJIQASAW-UHFFFAOYSA-N flufenerim Chemical compound CC(F)C1=NC=NC(NCCC=2C=CC(OC(F)(F)F)=CC=2)=C1Cl GJEREQYJIQASAW-UHFFFAOYSA-N 0.000 description 1
- 235000004611 garlic Nutrition 0.000 description 1
- 210000004211 gastric acid Anatomy 0.000 description 1
- 210000001156 gastric mucosa Anatomy 0.000 description 1
- 102000034238 globular proteins Human genes 0.000 description 1
- 108091005896 globular proteins Proteins 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 230000035929 gnawing Effects 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 239000003630 growth substance Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- RGNPBRKPHBKNKX-UHFFFAOYSA-N hexaflumuron Chemical compound C1=C(Cl)C(OC(F)(F)C(F)F)=C(Cl)C=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F RGNPBRKPHBKNKX-UHFFFAOYSA-N 0.000 description 1
- 231100000171 higher toxicity Toxicity 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 238000010874 in vitro model Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- VBCVPMMZEGZULK-NRFANRHFSA-N indoxacarb Chemical compound C([C@@]1(OC2)C(=O)OC)C3=CC(Cl)=CC=C3C1=NN2C(=O)N(C(=O)OC)C1=CC=C(OC(F)(F)F)C=C1 VBCVPMMZEGZULK-NRFANRHFSA-N 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 238000012994 industrial processing Methods 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000013101 initial test Methods 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 239000011147 inorganic material Substances 0.000 description 1
- 239000002917 insecticide Substances 0.000 description 1
- 108010090785 inulinase Proteins 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229930014550 juvenile hormone Natural products 0.000 description 1
- 239000002949 juvenile hormone Substances 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 150000002596 lactones Chemical class 0.000 description 1
- 239000005910 lambda-Cyhalothrin Substances 0.000 description 1
- 230000001418 larval effect Effects 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 108010005131 levanase Proteins 0.000 description 1
- 229960004502 levodopa Drugs 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 108010062085 ligninase Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- KBHDSWIXRODKSZ-UHFFFAOYSA-N methyl 5-chloro-2-(trifluoromethylsulfonylamino)benzoate Chemical compound COC(=O)C1=CC(Cl)=CC=C1NS(=O)(=O)C(F)(F)F KBHDSWIXRODKSZ-UHFFFAOYSA-N 0.000 description 1
- 229960001952 metrifonate Drugs 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 239000003595 mist Substances 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000001483 mobilizing effect Effects 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- NJPPVKZQTLUDBO-UHFFFAOYSA-N novaluron Chemical compound C1=C(Cl)C(OC(F)(F)C(OC(F)(F)F)F)=CC=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F NJPPVKZQTLUDBO-UHFFFAOYSA-N 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000002417 nutraceutical Substances 0.000 description 1
- 235000021436 nutraceutical agent Nutrition 0.000 description 1
- YCIMNLLNPGFGHC-UHFFFAOYSA-N o-dihydroxy-benzene Natural products OC1=CC=CC=C1O YCIMNLLNPGFGHC-UHFFFAOYSA-N 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000011368 organic material Substances 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- LCCNCVORNKJIRZ-UHFFFAOYSA-N parathion Chemical compound CCOP(=S)(OCC)OC1=CC=C([N+]([O-])=O)C=C1 LCCNCVORNKJIRZ-UHFFFAOYSA-N 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- 229960000490 permethrin Drugs 0.000 description 1
- RLLPVAHGXHCWKJ-UHFFFAOYSA-N permethrin Chemical compound CC1(C)C(C=C(Cl)Cl)C1C(=O)OCC1=CC=CC(OC=2C=CC=CC=2)=C1 RLLPVAHGXHCWKJ-UHFFFAOYSA-N 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- NONJJLVGHLVQQM-JHXYUMNGSA-N phenethicillin Chemical compound N([C@@H]1C(N2[C@H](C(C)(C)S[C@@H]21)C(O)=O)=O)C(=O)C(C)OC1=CC=CC=C1 NONJJLVGHLVQQM-JHXYUMNGSA-N 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010047079 phenylalanyl-leucyl-arginyl-phenylalanine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- BULVZWIRKLYCBC-UHFFFAOYSA-N phorate Chemical compound CCOP(=S)(OCC)SCSCC BULVZWIRKLYCBC-UHFFFAOYSA-N 0.000 description 1
- IOUNQDKNJZEDEP-UHFFFAOYSA-N phosalone Chemical compound C1=C(Cl)C=C2OC(=O)N(CSP(=S)(OCC)OCC)C2=C1 IOUNQDKNJZEDEP-UHFFFAOYSA-N 0.000 description 1
- LMNZTLDVJIUSHT-UHFFFAOYSA-N phosmet Chemical compound C1=CC=C2C(=O)N(CSP(=S)(OC)OC)C(=O)C2=C1 LMNZTLDVJIUSHT-UHFFFAOYSA-N 0.000 description 1
- RGCLLPNLLBQHPF-HJWRWDBZSA-N phosphamidon Chemical compound CCN(CC)C(=O)C(\Cl)=C(/C)OP(=O)(OC)OC RGCLLPNLLBQHPF-HJWRWDBZSA-N 0.000 description 1
- 229940068041 phytic acid Drugs 0.000 description 1
- 235000002949 phytic acid Nutrition 0.000 description 1
- 239000000467 phytic acid Substances 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- YFGYUFNIOHWBOB-UHFFFAOYSA-N pirimicarb Chemical compound CN(C)C(=O)OC1=NC(N(C)C)=NC(C)=C1C YFGYUFNIOHWBOB-UHFFFAOYSA-N 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 150000004804 polysaccharides Chemical class 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- QYMMJNLHFKGANY-UHFFFAOYSA-N profenofos Chemical compound CCCSP(=O)(OCC)OC1=CC=C(Br)C=C1Cl QYMMJNLHFKGANY-UHFFFAOYSA-N 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 235000021251 pulses Nutrition 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- FBQQHUGEACOBDN-UHFFFAOYSA-N quinomethionate Chemical compound N1=C2SC(=O)SC2=NC2=CC(C)=CC=C21 FBQQHUGEACOBDN-UHFFFAOYSA-N 0.000 description 1
- 235000021013 raspberries Nutrition 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 229940080817 rotenone Drugs 0.000 description 1
- JUVIOZPCNVVQFO-UHFFFAOYSA-N rotenone Natural products O1C2=C3CC(C(C)=C)OC3=CC=C2C(=O)C2C1COC1=C2C=C(OC)C(OC)=C1 JUVIOZPCNVVQFO-UHFFFAOYSA-N 0.000 description 1
- 101150015537 rps12 gene Proteins 0.000 description 1
- 101150098466 rpsL gene Proteins 0.000 description 1
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000014639 sexual reproduction Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical compound [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 1
- 229910010271 silicon carbide Inorganic materials 0.000 description 1
- 229910001961 silver nitrate Inorganic materials 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000003195 sodium channel blocking agent Substances 0.000 description 1
- 244000000000 soil microbiome Species 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 229940014213 spinosad Drugs 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 235000021012 strawberries Nutrition 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 229940124530 sulfonamide Drugs 0.000 description 1
- 150000003456 sulfonamides Chemical class 0.000 description 1
- JXHJNEJVUNHLKO-UHFFFAOYSA-N sulprofos Chemical compound CCCSP(=S)(OCC)OC1=CC=C(SC)C=C1 JXHJNEJVUNHLKO-UHFFFAOYSA-N 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 239000005936 tau-Fluvalinate Substances 0.000 description 1
- INISTDXBRIBGOC-XMMISQBUSA-N tau-fluvalinate Chemical compound N([C@H](C(C)C)C(=O)OC(C#N)C=1C=C(OC=2C=CC=CC=2)C=CC=1)C1=CC=C(C(F)(F)F)C=C1Cl INISTDXBRIBGOC-XMMISQBUSA-N 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- QSOHVSNIQHGFJU-UHFFFAOYSA-L thiosultap disodium Chemical compound [Na+].[Na+].[O-]S(=O)(=O)SCC(N(C)C)CSS([O-])(=O)=O QSOHVSNIQHGFJU-UHFFFAOYSA-L 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 229960001295 tocopherol Drugs 0.000 description 1
- 229930003799 tocopherol Natural products 0.000 description 1
- 235000010384 tocopherol Nutrition 0.000 description 1
- 239000011732 tocopherol Substances 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- YWBFPKPWMSWWEA-UHFFFAOYSA-O triazolopyrimidine Chemical compound BrC1=CC=CC(C=2N=C3N=CN[N+]3=C(NCC=3C=CN=CC=3)C=2)=C1 YWBFPKPWMSWWEA-UHFFFAOYSA-O 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- NFACJZMKEDPNKN-UHFFFAOYSA-N trichlorfon Chemical compound COP(=O)(OC)C(O)C(Cl)(Cl)Cl NFACJZMKEDPNKN-UHFFFAOYSA-N 0.000 description 1
- 101150019416 trpA gene Proteins 0.000 description 1
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 1
- 108010068794 tyrosyl-tyrosyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000009105 vegetative growth Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 229920001221 xylan Polymers 0.000 description 1
- 150000004823 xylans Chemical class 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 239000005019 zein Substances 0.000 description 1
- 229940093612 zein Drugs 0.000 description 1
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
- C07K14/325—Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N63/00—Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N63/00—Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
- A01N63/10—Animals; Substances produced thereby or obtained therefrom
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N63/00—Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
- A01N63/20—Bacteria; Substances produced thereby or obtained therefrom
- A01N63/22—Bacillus
- A01N63/23—B. thuringiensis
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N63/00—Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
- A01N63/50—Isolated enzymes; Isolated proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
- C12N15/8286—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Molecular Biology (AREA)
- Pest Control & Pesticides (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Virology (AREA)
- Environmental Sciences (AREA)
- Dentistry (AREA)
- Agronomy & Crop Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Insects & Arthropods (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Peptides Or Proteins (AREA)
Abstract
Изобретение относится к области биохимии, в частности к химерному гену, содержащему нуклеиновую кислоту, которая кодирует белок, токсичный для кукурузного мотылька (Ostrinia nubilalis). Также раскрыты рекомбинантный вектор, трансгенная клетка-хозяин, трансгенное растение, трансгенное семя, содержащее указанный химерный ген. Раскрыты способы получение белка, получения трансгенного растения, способ борьбы с кукурузным мотыльком (Ostrinia nubilalis) с помощью указанного химерного гена. Изобретение позволяет эффективно бороться с кукурузным мотыльком (Ostrinia nubilalis). 11 н. и 27 з.п. ф-лы, 3 табл., 11 пр.
Description
[0001] Официальная копия перечня последовательностей подана в электронном виде через EFS-Web в виде перечня последовательностей в формате ASCII с названием файла "80670-US-L-ORG-NAT-1_SeqList.txt", созданного 5 декабря 2014 г., и имеющего размер 170 килобайт, и поданного одновременно с описанием. Перечень последовательностей, содержащийся в данном документе в формате ASCII, является частью описания и включен в данный документ посредством ссылки во всей своей полноте.
ОБЛАСТЬ ТЕХНИКИ ИЗОБРЕТЕНИЯ
[0002] Настоящее изобретение относится к пестицидным белкам и молекулам нуклеиновых кислот, которые их кодируют, а также к композициям и способам контроля вредителей растений.
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
[0003] Bacillus thuringiensis (Bt) является грамположительной спорообразующей почвенной бактерией, которая отличается своей способностью продуцировать кристаллические включения, которые особенно токсичны для определенных отрядов и видов вредителей растений, в том числе насекомых, но безвредны для растений и других нецелевых организмов. По этой причине композиции, содержащие штаммы Bacillus thuringiensis или их инсектицидные белки, могут применяться в качестве приемлемых с точки зрения охраны окружающей среды инсектицидов для контроля насекомых-вредителей, важных с точки зрения сельского хозяйства, или насекомых-переносчиков различных заболеваний человека или животных.
[0004] Кристаллические (Cry) белки из Bacillus thuringiensis обладают сильной инсектицидной активностью в отношении преимущественно личинок чешуекрылых, двукрылых и жесткокрылых. Эти белки также продемонстрировали активность в отношении вредителей из отрядов Hymenoptera, Homoptera, Phthiraptera, Mallophaga и вредителей из отрядов подкласса Acari, а также других групп беспозвоночных, таких как Nemathelminthes, Platyhelminthes и Sarcomastigorphora (Feitelson, J. 1993. The Bacillus Thuringiensis family tree. In Advanced Engineered Pesticides. Marcel Dekker, Inc., New York, N.Y.). Эти белки изначально разделили на классы CryI - CryVI преимущественно на основании их инсектицидной активности. Основными классами были специфические для Lepidoptera (I), специфические для Lepidoptera и Diptera (II), специфические для Coleoptera (III), специфические для Diptera (IV) и специфические для нематод (V) и (VI). Далее белки разделили на подсемейства, белкам с более высокой степенью родства в пределах каждого семейства присвоили буквы для обозначения раздела, как, например, CryIA, CryIB, CryIC и т.д. Еще более близкородственным белкам в пределах каждого раздела присвоили названия, такие как CryIC(a), CryIC(b) и т.д. Термины "токсин Cry" и "дельта-эндотоксин" применялись взаимозаменяемо с термином "белок Cry". Современная номенклатура белков и генов Cry основана на гомологии аминокислотных последовательностей, а не на специфичности в отношении целевых насекомых (Crickmore et al. (1998) Microbiol. Mol. Biol. Rev. 62:807-813). В этой более распространенной классификации каждому токсину присваивается уникальное название, включающее первичный ранг (арабская цифра), вторичный ранг (заглавная буква), третичный ранг (строчная буква) и четвертичный ранг (еще одна арабская цифра). В современной классификации в первичном ранге римские цифры были заменены на арабские цифры. Например, "CryIA(а)" согласно старой номенклатуре в настоящее время имеет название "Cry1Aa" согласно современной номенклатуре.
[0005] Белки Cry представляют собой глобулярные белковые молекулы, которые накапливаются в виде протоксинов в кристаллической форме в ходе стадии споруляции Bt. После поедания вредителем кристаллы, как правило, растворяются с высвобождением протоксинов, размер которых может варьировать, например, от 130-140 кДа в случае белков Cry, активных в отношении чешуекрылых, и 60-80 кДа в случае белков Cry, активных в отношении жесткокрылых. Протоксины превращаются в полноценные токсичные фрагменты (N-концевой участок размером приблизительно 60-70 кДа) под действием протеаз пищеварительного канала целевого вредителя. Многие из этих белков очень токсичны для специфических целевых насекомых, но безвредны для растений и других нецелевых организмов.
[0006] Белки Cry, как правило, имеют пять доменов с консервативной
последовательностью и три домена с консервативной структурой (см., например, de Maagd et al. (2001) Trends Genetics 17:193-199). Первый домен с консервативной структурой, называемый домен I, как правило, состоит из семи альфа-спиралей и вовлечен во вставку в мембрану и образовании пор. Домен II, как правило, состоит из трех бета-складчатых слоев, расположенных в конфигурации типа греческий ключ, а домен III состоит из двух антипараллельных бета-складчатых слоев в виде структуры 'jelly-roll' (de Maagd et al., 2001, выше). Домены II и III вовлечены в распознавание и связывание рецепторов, и поэтому считаются детерминантами специфичности токсина.
[0007] Многочисленные коммерчески ценные растения, в том числе широко распространенные сельскохозяйственные культуры, восприимчивы к нападению вредителей растений, в том числе насекомых-вредителей и нематод-вредителей, что приводит к существенному снижению урожайности и качества сельскохозяйственных культур. Например, вредители растений являются главным фактором потери урожая важных мировых сельскохозяйственных культур. Приблизительно 8 миллиардов долларов теряется каждый год только в Соединенных Штатах в связи с повреждениями, вызываемыми вредителями, не являющимися млекопитающими, в том числе насекомыми. В дополнение к потерям урожая полевых культур насекомые-вредители также ложатся бременем на овощеводов и плодоводов, производителей декоративных цветов, а также владельцев приусадебных хозяйств.
[0008] Насекомых-вредителей контролируют главным образом путем интенсивного применения химических пестицидов, которые действуют путем подавления роста насекомых, препятствования питанию или размножению, или вызывая гибель. Средства для биологического контроля вредителей, например, штаммы Bacillus thuringiensis, экспрессирующие пестицидные токсины, такие как белки Cry, также применялись в отношении культурных растений с удовлетворительными результатами, что является альтернативой или дополнением к химическим пестицидам. Были выделены гены, кодирующие некоторые из этих белков Cry, и было показано, что их экспрессия в гетерологичных хозяевах, таких как трансгенные растения, обеспечивает другой инструмент для контроля экономически важных насекомых-вредителей.
[0009] Таким образом, можно достичь надлежащего контроля насекомых, но определенные химические вещества иногда могут наносить вред на нецелевым полезным насекомым, и определенные биологические вещества имеют очень узкий спектр активности. Кроме того, продолжительное применение определенных способов химического и биологического контроля повышает вероятность развития у насекомых-вредителей устойчивости к таким мерам контроля. Частично это ослаблялось путем применения различных агротехнических приемов, связанных с устойчивостью, однако все еще сохраняется потребность в поиске новых и эффективных средств для контроля вредителей, которые обеспечивают экономическую пользу фермерам и которые являются приемлемыми с точки зрения охраны окружающей среды. Особенно необходимыми являются средства для контроля, целенаправленно воздействующие на более широкий спектр экономически важных насекомых-вредителей, и которые обеспечивают эффективный контроль линий насекомых, которые могут стать устойчивыми к существующим средствам для контроля насекомых или являются таковыми.
КРАТКОЕ ОПИСАНИЕ
[0010] Ввиду этих потребностей, целью настоящего изобретения является обеспечение новых средств для контроля вредителей путем обеспечения новых генов и пестицидных белков, которые можно применять для контроля целого ряда вредителей растений.
[0011] В настоящем изобретении предусмотрены композиции и способы придания пестицидной активности бактериям, растениям, растительным клеткам, тканям и семенам. В частности, предусмотрены химерные гены, содержащие новые полинуклеотиды, которые кодируют белки Cry, выделенные из Bacillus thuringiensis (Bt), и последовательности, в значительной степени идентичные им, экспрессия которых приводит к образованию белков, обладающих токсичностью в отношении экономически важных насекомых-вредителей, в частности, насекомых-вредителей, которые поражают растения. Кроме того, настоящее изобретение относится к новым белкам Cry, полученным в результате экспрессии последовательностей нуклеиновых кислот, а также к композициям и составам, содержащим белки Cry, которые оказывают токсическое воздействие на насекомых путем подавления способности насекомых-вредителей к выживанию, росту и размножению, либо путем ограничения повреждения или гибели культурных растений, вызванных насекомыми. Белки Cry по настоящему изобретению включают нативные белки Cry и мутантные белки Cry, которые содержат одну или несколько аминокислотных замен, добавлений или делеций. Примеры мутантных белков Cry включают без ограничения таковые, подвергнутые мутации, чтобы обладать более широким спектром активности по сравнению с их аналогами, нативными белками Cry, или таковые, подвергнутые мутации, чтобы ввести эпитоп для выработки антител, которые избирательно распознают мутантный белок, а не нативный белок. Новые белки Cry по настоящему изобретению обладают высокой активностью в отношении насекомых-вредителей. Например, белки Cry по настоящему изобретению можно применять для контроля одного или нескольких экономически важных насекомых-вредителей, таких как совка-ипсилон (Agrotis ipsilon), кукурузный мотылек (Ostrinia nubilalis), совка травяная (Spodoptera frugiperda), американская кукурузная совка (Helicoverpa zea), огневка тростниковая (Diatraea saccharalis), гусеница совки бархатных бобов (Anticarsia gemmatalis), соевая совка (Chrysodeixis includes), огневка кукурузная юго-западная (Diatraea grandiosella), западная бобовая совка (Richia albicosta), табачная совка (Heliothis virescens), восточный кукурузный мотылек (Ostrinia furnacalis), хлопковая совка (Helicoverpa armigera), огневка желтая рисовая (Chilo suppressalis), розовая стеблевая совка (Sesamia calamistis), огневка рисовая (Cnaphalocrocis medinalis) и т.п.
[0012] В настоящем изобретении также предусмотрены синтетические полинуклеотиды, которые кодируют белки Cry по настоящему изобретению и имеют один или несколько кодонов, оптимизированных для экспрессия в трансгенных организмах, таких как бактерии и растения.
[0013] Настоящее изобретение дополнительно относится к кассетам экспрессии и рекомбинантным векторам, содержащим полинуклеотид, который кодирует белок Cry по настоящему изобретению. В настоящем изобретении также предусмотрены трансформированные бактерии, растения, растительные клетки, ткани и семена, содержащие химерный ген, или кассету экспрессии, или рекомбинантный вектор, которые содержат полинуклеотид, кодирующий белок Cry по настоящему изобретению.
[0014] Настоящее изобретение также относится к способам применения полинуклеотидов, например, в ДНК-конструкциях, или химерных генах, или кассетах экспрессии, или рекомбинантных векторах для трансформация и экспрессии в организмах, в том числе микроорганизмах и растениях. Нуклеотидные или аминокислотные последовательности могут представлять собой синтетические последовательности, которые были сконструированы для экспрессии в организме, в том числе без ограничения в микроорганизме или растении, или для получения гибридных токсинов с усиленной пестицидной активностью. Настоящее изобретение дополнительно относится к способам получения белков Cry и к способам применения последовательностей нуклеиновых кислот, например, в микроорганизмах для контроля насекомых или в трансгенных растениях для обеспечения защиты от повреждения насекомыми, а также к способам применения белков Cry и композиций и составов, содержащих белки Cry, например, применению белков Cry, или композиций, или составов по отношению к пораженным вредителями участкам, или для профилактической обработки уязвимых для насекомых участков или растений, чтобы обеспечить защиту от повреждения насекомыми-вредителями. Нуклеотидные или аминокислотные последовательности могут представлять собой синтетические последовательности, которые были сконструированы для экспрессии в организме, в том числе без ограничения в микроорганизме или растении.
[0015] Композиции и способы по настоящему изобретению применимы для получения организмов, которые токсичны для насекомых, в частности, для получения бактерий и растений. Такие организмы и композиции на их основе актуальны для сельскохозяйственных целей. Композиции по настоящему изобретению также применимы для получения измененных или улучшенных белков Cry, которые обладают пестицидной активностью, или для обнаружения наличия белка Cry или нуклеиновых кислот в продуктах или организмах.
[0016] Эти и другие признаки, аспекты и преимущества настоящего изобретения станут более понятны со ссылкой на следующее подробное описание и формулу изобретения.
КРАТКОЕ ОПИСАНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ В ПЕРЕЧНЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
[0017] SEQ ID NO: 1 представляет собой нуклеотидную последовательность, кодирующую белок ВТ-0009.
[0018] SEQ ID NO: 2 представляет собой нуклеотидную последовательность, кодирующую белок ВТ-0012.
[0019] SEQ ID NO: 3 представляет собой нуклеотидную последовательность, кодирующую белок ВТ-0013.
[0020] SEQ ID NO: 4 представляет собой нуклеотидную последовательность, кодирующую белок ВТ-0023.
[0021] SEQ ID NO: 5 представляет собой нуклеотидную последовательность, кодирующую белок ВТ-0067.
[0022] SEQ ID NO: 6 представляет собой кодон-оптимизированную последовательность, кодирующую белок ВТ-0009.
[0023] SEQ ID NO: 7 представляет собой кодон-оптимизированную последовательность, кодирующую белок ВТ-0012.
[0024] SEQ ID NO: 8 представляет собой кодон-оптимизированную последовательность, кодирующую белок ВТ-0013.
[0025] SEQ ID NO: 9 представляет собой кодон-оптимизированную последовательность, кодирующую белок ВТ-0023.
[0026] SEQ ID NO: 10 представляет собой кодон-оптимизированную последовательность, кодирующую белок ВТ-0067.
[0027] SEQ ID NO: 11 представляет собой нуклеотидную последовательность, кодирующую мутантный белок ВТ-0009.
[0028] SEQ ID NO: 12 представляет собой нуклеотидную последовательность, кодирующую мутантный белок ВТ-0012.
[0029] SEQ ID NO: 13 представляет собой нуклеотидную последовательность, кодирующую мутантный белок ВТ-0013.
[0030] SEQ ID NO: 14 представляет собой нуклеотидную последовательность, кодирующую мутантный белок ВТ-0023.
[0031] SEQ ID NO: 15 представляет собой нуклеотидную последовательность, кодирующую мутантный белок ВТ-0067.
[0032] SEQ ID NO: 16 представляет собой аминокислотную последовательность белка ВТ-0009.
[0033] SEQ ID NO: 17 представляет собой аминокислотную последовательность белка ВТ-0012.
[0034] SEQ ID NO: 18 представляет собой аминокислотную последовательность белка ВТ-0013.
[0035] SEQ ID NO: 19 представляет собой аминокислотную последовательность белка ВТ-0023.
[0036] SEQ ID NO: 20 представляет собой аминокислотную последовательность белка ВТ-0067.
[0037] SEQ ID NO: 21 представляет собой аминокислотную последовательность мутантного белка ВТ-0009.
[0038] SEQ ID NO: 22 представляет собой аминокислотную последовательность мутантного белка ВТ-0012.
[0039] SEQ ID NO: 23 представляет собой аминокислотную последовательность мутантного белка ВТ-0013.
[0040] SEQ ID NO: 24 представляет собой аминокислотную последовательность мутантного белка ВТ-0023.
[0041] SEQ ID NO: 25 представляет собой аминокислотную последовательность мутантного белка ВТ-0067.
[0042] SEQ ID NO: 26-31 представляют собой праймеры, применимые в настоящем изобретении.
ПОДРОБНОЕ ОПИСАНИЕ
[0043] Не подразумевается, что данное описание является подробным перечнем всех различных путей, с помощью которых может быть реализовано настоящее изобретение, или всех признаков, которые можно добавить к настоящему изобретению. Например, признаки, проиллюстрированные в отношении одного варианта осуществления, могут быть включены в другие варианты осуществления, а признаки, проиллюстрированные в отношении конкретного варианта осуществления, могут быть удалены из этого варианта осуществления. Таким образом, настоящим изобретением предполагается, что в некоторых вариантах осуществления настоящего изобретения можно исключить или опустить любой признак или комбинацию признаков, изложенных в данном документе. Кроме того, многочисленные вариации и дополнения к различным вариантам осуществления, предлагаемым в данном документе, будут очевидны для специалистов в данной области в свете настоящего раскрытия, которое не отступает от сути настоящего изобретения. Следовательно, следующие описания предназначены для иллюстрации некоторых конкретных вариантов осуществления настоящего изобретения, а не исчерпывающего определения всех их преобразований, комбинаций и вариаций.
[0044] Если не указано иное, все технические и научные термины, используемые в данном документе, имеют то же значение, которое обычно понятно специалисту в области техники, к которой относится настоящее изобретение. Терминология, применяемая в описании настоящего изобретения в данном документе, используется только в целях описания конкретных вариантов осуществления, а не предназначена для ограничения настоящего изобретения. Следует также понимать, что терминология, применяемая в данном документе, представлена исключительно с целью описания конкретных вариантов осуществления, а не предназначена для ограничения объема настоящего изобретения.
Определения
[0045] Применяемые в данном документе и прилагаемой формуле изобретения формы единственного числа включают ссылки на множественное число, если в контексте явно не указано иное. Таким образом, например, ссылка на "растение" является ссылкой на одно или несколько растений и включает их эквиваленты, известные специалистам в данной области, и т.д. Применяемое в данном документе слово "или" означает любой элемент из конкретного перечня, а также включает любую комбинацию элементов из такого перечня (то есть, включает также "и").
[0046] Применяемый в данном документе термин "приблизительно" означает примерно, ориентировочно, около или в районе. Если термин "приблизительно" применяется в сочетании с числовым диапазоном, он модифицирует этот диапазон, расширяя границы выше и ниже указанных численных значений. В целом, применяемый в данном документе термин "приблизительно" модифицирует численное значение выше и ниже указанного значения путем отклонения на 20 процентов, предпочтительно 10 процентов вверх или вниз (больше или меньше). Что касается температуры, термин "приблизительно" означает ±1°С, предпочтительно ±0,5°С. Если термин "приблизительно" применяется в контексте настоящего изобретения (например, в комбинациях с температурой или значениями молекулярной массы), предпочтительным является точное значение (то есть, без "приблизительно").
[0047] Под "активностью" токсичного белка Cry по настоящему изобретению подразумевается, что токсичный белок действует как активное при пероральном поступлении средство для контроля насекомых, обладает токсическим действием или способен нарушать или ограничивать питание насекомых, что может или не может вызвать гибель насекомого. Когда токсичный белок по настоящему изобретению доставляется в организм насекомого, как правило, результатом является гибель насекомого, или насекомое не питается источником, который делает токсичный белок доступным для насекомого.
[0048] Применяемый в данном документе термин "амплифицированный" означает создание множества копий молекулы нуклеиновой кислоты или множества копий, комплементарных молекуле нуклеиновой кислоты, с применением по меньшей мере одной из молекул нуклеиновых кислот в качестве матрицы. Системы амплификации включают систему на основе полимеразной цепной реакции (ПЦР), систему на основе лигазной цепной реакции (LCR), систему амплификации, основанную на последовательности нуклеиновых кислот (NASBA, Cangene, Миссиссога, Онтарио), систему на основе Q-бета репликазы, систему амплификации, основанную на транскрипции (TAS), и амплификацию с замещением цепей (SDA). См., например, Diagnostic Molecular Microbiology: Principles and Applications, PERSING et al., Ed., American Society for Microbiology, Washington, D.C. (1993). Продукт амплификации называется "ампликоном".
[0049] Применяемый в данном документе термин "химерная конструкция", или "химерный ген", или "химерный полинуклеотид", или "химерная нуклеиновая кислота" (или подобные термины) относится к конструкции или молекуле, содержащей два или более полинуклеотидов разного происхождения, собранных в одну молекулу нуклеиновой кислоты. Термин "химерная конструкция", "химерный ген", "химерный полинуклеотид" или "химерная нуклеиновая кислота" относится к любой конструкции или молекуле, которая содержит без ограничения (1) полинуклеотиды (например, ДНК), в том числе регуляторные и кодирующие полинуклеотиды, которые вместе не встречаются в природе (то есть, по меньшей мере один из полинуклеотидов в конструкции является гетерологичным по отношению по меньшей мере к одному из его других полинуклеотидов), или (2) полинуклеотиды, кодирующие части белков, не связанные в природе, или (3) части промоторов, которые не связаны в природе. Кроме того, химерная конструкция, химерный ген, химерный полинуклеотид или химерная нуклеиновая кислота могут содержать регуляторные полинуклеотиды и кодирующие полинуклеотиды, полученные из разных источников, или могут содержать регуляторные полинуклеотиды и кодирующие полинуклеотиды, полученные из одного и того же источника, но расположенные иным способом, чем встречающийся в природе. В некоторых вариантах осуществления настоящего изобретения химерная конструкция, химерный ген, химерный полинуклеотид или химерная нуклеиновая кислота содержат кассету экспрессии, содержащую полинуклеотид по настоящему изобретению под контролем регуляторных полинуклеотидов, в частности, под контролем регуляторных полинуклеотидов, функционирующих в растениях или бактериях.
[0050] "Кодирующая последовательность" представляет собой последовательность нуклеиновой кислоты, которая транскрибируется в РНК, такую как mRNA, rRNA, tRNA, snRNA, смысловая РНК или антисмысловая РНК. Предпочтительно РНК затем транслируется в организме с продукцией белка.
[0051] Применяемое в данном документе выражение "кодон-оптимизированная" последовательность означает нуклеотидную последовательность рекомбинантного, трансгенного или синтетического полинуклеотида, в котором кодоны выбраны так, чтобы отражать склонность к определенным кодонам, которая может наблюдаться в клетке- или организме-хозяине. Как правило, это выполняется таким образом, чтобы сохранить аминокислотную последовательность полипептида, кодируемого кодон-оптимизированной нуклеотидной последовательностью. В некоторых вариантах осуществления последовательность ДНК рекомбинантной ДНК-конструкции включает последовательность, которая была кодон-оптимизирована для клетки (например, клетки животного, растения или гриба), в которой данная конструкция будет экспрессироваться. Например, у конструкции, которая будет экспрессироваться в растительной клетке, может быть кодон-оптимизированной для экспрессии в растении вся последовательность или ее часть (например, первый элемент для супрессии гена или элемент для экспрессии гена). См., например, патент США №6121014, включенный в данный документ посредством ссылки.
[0052] "Контроль" насекомых означает подавление, посредством токсического действия, способности насекомых-вредителей к выживанию, росту, питанию и/или размножению, или ограничение повреждения или гибели культурных растений, вызванных насекомыми, или защиту максимального потенциального урожая сельскохозяйственной культуры при выращивании в присутствии насекомых-вредителей. "Контроль" насекомых может означать или может не означать уничтожение насекомых, хотя, предпочтительно, означает уничтожение насекомых.
[0053] При использовании в данном описании термины "содержит" и/или "содержащий" указывают на присутствие изложенных признаков, целых чисел, стадий, операций, элементов и/или компонентов, но не исключают присутствие или добавление одного или нескольких других признаков, целых чисел, стадий, операций, элементов, компонентов и/или их групп.
[0054] Применяемая в данном документе переходная фраза "состоящий главным образом из" (и ее грамматические варианты) означает, что объем пункта формулы изобретения следует интерпретировать как охватывающий указанные материалы или стадии, перечисленные в данном пункте формулы изобретения, и таковые, которые существенно не изменяют основную и новую характеристику(и) заявленного изобретения. Таким образом, термин "состоящий главным образом из", когда применяется в пункте формулы настоящего изобретения, не предназначен для интерпретации как эквивалент термину "содержащий".
[0055] В контексте настоящего изобретения "соответствующий" или "соответствует" означает, что когда аминокислотные последовательности вариантных белков Cry выравнивают друг с другом, аминокислоты, которые "соответствуют" определенным перечисленным положениям в вариантном или гомологичном белке, являются такими, которые выравниваются с этими положениями в эталонном белке, но не обязательно находятся именно в этих числовых положениях относительно конкретной эталонной аминокислотной последовательности по настоящему изобретению. Например, если SEQ ID NO: 16 является эталонной последовательностью, и ее выравнивают с SEQ ID NO: 17, Ala150 SEQ ID NO: 17 "соответствует" Ala163 SEQ ID NO: 16.
[0056] "Доставка" композиции или токсичного белка означает, что композиция или токсичный белок вступает в контакт с насекомым, что приводит к токсическому действию и контролю насекомого. Композиция или токсичный белок могут быть доставлены множеством известных путей, например, перорально при поедании насекомым или при контакте с насекомым посредством экспрессии в трансгенном растении, с помощью составленной белковой композиции(й) белков, распыляемой белковой композиции(й), матрицы приманки или любой другой известной из уровня техники системы доставки белков.
[0057] Термин "домен" относится к набору аминокислот, консервативных в определенных положениях по длине выравнивания последовательностей эволюционно родственных белков. В то время как аминокислоты в других положениях гомологов могут отличаться, аминокислоты, которые являются высококонсервативными в определенных положениях, указывают на аминокислоты, которые, вероятно, являются необходимыми для структуры, стабильности или функции белка. Идентифицированные по их высокой степени консервативности в выравненных последовательностях семейства гомологов белков, они могут применяться в качестве идентификаторов для определения того, принадлежит ли любой рассматриваемый полипептид к ранее идентифицированному семейству полипептидов.
[0058] "Эффективное для контроля насекомых количество" означает, что концентрация токсичного белка, которая обеспечивает подавление, посредством токсического действия, способности насекомых к выживанию, росту, питанию и/или размножению, или ограничение вызванных насекомыми повреждения или гибель культурного растения, или защиту максимального потенциального урожая сельскохозяйственной культуры при выращивании в присутствии насекомых-вредителей. "Эффективное для контроля насекомых количество" может означать или может не означать уничтожение насекомых, хотя предпочтительно оно означает уничтожение насекомых.
[0059] Применяемый в данном документе термин "кассета экспрессии" означает молекулу нуклеиновой кислоты, способную управлять экспрессией по меньшей мере одного представляющего интерес полинуклеотида в соответствующей клетке-хозяине, содержащую промотор, функционально связанный с представляющим интерес полинуклеотидом, который функционально связан с сигналом терминации. "Кассета экспрессии" также, как правило, содержит дополнительные полинуклеотиды, необходимые для надлежащей трансляции представляющего интерес полинуклеотида. Кассета экспрессии также может содержать другие полинуклеотиды, которые не требуются для управления экспрессией представляющего интерес полинуклеотида, но которые присутствует из-за соответствующих сайтов рестрикции для извлечения кассеты из вектора экспрессии. Кассета экспрессии, содержащая представляющий интерес полинуклеотид(ы) может быть химерной, что означает, что по меньшей мере один из ее компонентов является гетерологичным по отношению по меньшей мере к одному из ее других компонентов. Кассета экспрессии может также представлять собой последовательность, которая встречается в природе, но была получена в рекомбинантной форме, пригодной для гетерологичной экспрессии. Тем не менее, как правило, кассета экспрессии является гетерологичной по отношению к хозяину, то есть представляющий интерес полинуклеотид в кассете экспрессии не встречается в природе в клетке-хозяине, и его необходимо было ввести в клетку-хозяина или предка клетки-хозяина с помощью процесса трансформации или процесса скрещивания. Экспрессия представляющего интерес полинуклеотида(ов) в кассете экспрессии обычно находится под контролем промотора. В случае многоклеточного организма, такого как растение, промотор может также быть специфичным или предпочтительным по отношению к конкретной ткани, или органу, или стадии развития. После трансформации в растение кассета экспрессии или ее фрагмент также могут называться "вставленным полинуклеотидом" или "полинуклеотидом вставки".
[0060] "Ген" определяется в данном документе как единица наследственности, состоящая из полинуклеотида, который занимает определенное местоположение на хромосоме или плазмиде и который содержит генетическую инструкцию для определенной характеристики или признака, свойственных организму.
[0061] "Протеаза пищеварительного канала" представляет собой протеазу, которая в встречается в пищеварительном тракте насекомого в природе. Данная протеаза, как правило, участвует в переваривании поглощенных белков.
[0062] Термин "гетерологичный" при применении в отношении гена или нуклеиновой кислоты относится к гену, кодирующему фактор, который не находится в его естественном окружении (то есть, который был изменен посредством вмешательства человека). Например, гетерологичный ген может предусматривать ген организма одного вида, введенный в организм другого вида. Гетерологичный ген также может предусматривать ген, нативный по отношению к организму, но который был изменен определенным образом (например, подвергнут мутации, добавлен в виде множества копий, связан с ненативным промоторным или энхансерным полинуклеотидом и т.д.). Гетерологичные гены дополнительно могут предусматривать полинуклеотиды генов растения, которые включают кДНК-формы гена растения; кДНК могут экспрессироваться либо в смысловой (с получением мРНК), либо антисмысловой ориентации (с получением антисмыслового РНК-транскрипта, комплементарного мРНК-транскрипту). Согласно одному аспекту настоящего изобретения гетерологичные гены отличаются от эндогенных генов растения тем, что полинуклеотид гетерологичного гена, как правило, присоединен к полинуклеотидам, содержащим регуляторные элементы, такие как промоторы, которые в природе не встречаются как ассоциированные с геном для белка, кодируемого гетерологичным геном, или с полинуклеотидом гена растения в хромосоме, или ассоциированы с частями хромосомы, в которых они не встречаются в природе (например, гены экспрессируются в локусах, в которых указанный ген в обычных условиях не экспрессируется). Кроме того, "гетерологичный" полинуклеотид относится к полинуклеотиду, в природе не ассоциированному с клеткой-хозяином, в которую его вводят, в том числе к не встречающимся в природе множественным копиям полинуклеотида, встречающегося в природе.
[0063] "Гомологичная рекомбинация" представляет собой обмен ("кроссинговер") фрагментами ДНК между двумя молекулами ДНК или хроматидами пар хромосом в участке идентичных полинуклеотидов. Будет понятно, что "событие рекомбинации" в данном документе означает мейотический кроссинговер.
[0064] Последовательность нуклеиновой кислоты является "изокодонной" по отношению к эталонной последовательности нуклеиновой кислоты в том случае, когда последовательность нуклеиновой кислоты кодирует полипептид, имеющий такую же аминокислотную последовательность, что и полипептид, кодируемый эталонной последовательностью нуклеиновой кислоты.
[0065] Термин "выделенная" молекула нуклеиновой кислоты, полинуклеотид или токсин представляет собой молекулу нуклеиновой кислоты, полинуклеотид или токсичный белок, которые больше не находится в своей естественной среде. Выделенная молекула нуклеиновой кислоты, полинуклеотид или токсин по настоящему изобретению могут находиться в очищенной форме или могут находиться в рекомбинантном хозяине, таком как трансгенная бактериальная клетка или трансгенное растение.
[0066] "Молекула нуклеиновой кислоты" представляет собой одно- или двунитевую ДНК или РНК, которые могут быть выделены из любого источника. В контексте настоящего изобретения молекула нуклеиновой кислоты предпочтительно является сегментом ДНК.
[0067] "Функционально связанный" относится к ассоциации полинуклеотидов на одном фрагменте нуклеиновой кислоты, вследствие чего функция одного влияет на функцию другого. Например, промотор является функционально связанным с кодирующим полинуклеотидом или функциональной РНК, когда он может влиять на экспрессию такого кодирующего полинуклеотида или функциональной РНК (то есть такой кодирующий полинуклеотид или функциональная РНК находятся под контролем промотора на уровне транскрипции). Кодирующий полинуклеотид в смысловой или антисмысловой ориентации может быть функционально связан с регуляторными полинуклеотидами.
[0068] Применяемые в данном документе выражения "пестицидный," инсектицидный" и т.п. относятся к способности белка Cry по настоящему изобретению обеспечивать контроль вредного организма или к количеству белка Cry, которое может обеспечивать контроль вредного организма, как определено в данном документе. Таким образом, пестицидный белок Cry может подавлять способность вредного организма (например, насекомого-вредителя) к выживанию, росту, питанию и/или размножению или уничтожать его.
[0069] "Растение" представляет собой любое растение на любой стадии развития, в частности, семенное растение.
[0070] "Растительная клетка" представляет собой структурную и физиологическую единицу растения, содержащую протопласт и клеточную стенку. Растительная клетка может находиться в форме выделенной одиночной клетки или культивируемой клетки или в качестве части более высокоорганизованной единицы, такой как, например, растительная ткань, орган растения или целое растение.
[0071] "Культура растительных клеток" означает культуры структурных единиц растения, таких как, например, протопласты, клетки в культуре клеток, клетки растительных тканей, пыльцы, пыльцевых трубок, семязачатков, зародышевых мешков, зиготы и зародышей на различных стадиях развития.
[0072] "Растительный материал" относится к листьям, стеблям, корням, цветкам или частям цветков, плодам, пыльце, яйцеклеткам, зиготам, семенам, черенкам, клеточным или тканевым культурам, или к любым другим частям или продуктам растения.
[0073] "Орган растения" представляет собой отдельную и визуально структурированную и дифференцированную часть растения, такую как корень, стебель, лист, цветочная почка или зародыш.
[0074] Выражение "растительная ткань", применяемое в данном документе, означает группу растительных клеток, организованных в структурную и функциональную единицу. Предусматривается любая ткань растения in planta или в культуре. Данный термин включает без ограничения целые растения, органы растений, семена растений, тканевую культуру и любые группы растительных клеток, организованных в структурные и/или функциональные единицы. Применение данного термина в сочетании с любым специфическим типом растительной ткани, приведенным выше или иным образом охваченным данным определением, или без такового не предназначено для исключения любого другого типа растительной ткани.
[0075] "Полинуклеотид" относится к полимеру, состоящему из большого числа мономеров-нуклеотидов, ковалентно связанных в цепь. Такие "полинуклеотиды" включают ДНК, РНК, модифицированные олигонуклеотиды (например, олигонуклеотиды, содержащие основания, которые не являются типичными для биологической РНК или ДНК, такие как 2'-O-метилированные олигонуклеотиды) и т.п. В некоторых вариантах осуществления нуклеиновая кислота или полинуклеотид могут быть однонитевыми, двунитевыми, многонитевыми или представлять собой комбинацию перечисленного. Если не указано иное, конкретная нуклеиновая кислота или полинуклеотид по настоящему изобретению необязательно содержат или кодируют комплементарные полинуклеотиды, в дополнение к любому явно указанному полинуклеотиду.
[0076] "Представляющий интерес полинуклеотид" относится к любому полинуклеотиду, который при переносе в организм, например растение, придает организму требуемую характеристику, такую как устойчивость к антибиотикам, устойчивость к вирусам, устойчивость к насекомым, устойчивость к болезням или устойчивость к другим вредителям, толерантность к гербицидам, улучшенная питательная ценность, улучшенные показатели в производственном процессе, продукция коммерчески ценных ферментов или метаболитов или измененная репродуктивная способность.
[0077] Термин "промотор" относится к полинуклеотиду, как правило, расположенному выше (5') от его кодирующего полинуклеотида, который осуществляет контроль экспрессии кодирующего полинуклеотида, обеспечивая узнавание РНК-полимеразой и другими факторами, необходимыми для правильной транскрипции.
[0078] "Протопласт" представляет собой выделенную растительную клетку без клеточной стенки или только с частичной клеточной стенкой.
[0079] Применяемый в данном документе термин "рекомбинантный" относится к форме нуклеиновой кислоты (например, ДНК или РНК), и/или белка, и/или организма, которая обычно не будет встречаться в природе и как таковая создана посредством вмешательства человека. Применяемая в данном документе "молекула рекомбинантной нуклеиновой кислоты" представляет собой молекулу нуклеиновой кислоты, содержащую комбинацию полинуклеотидов, которые в природе не встречаются вместе и являются результатом вмешательства человека, например, молекулу нуклеиновой кислоты, которая состоит из комбинации по меньшей мере двух полинуклеотидов, гетерологичных по отношению друг к другу, и/или молекулу нуклеиновой кислоты, синтезированную искусственно и содержащую полинуклеотид, который отличается от полинуклеотида, который будет в норме существовать в природе, и/или молекулу нуклеиновой кислоты, которая содержит трансген, искусственно введенный в геномную ДНК клетки-хозяина, и ассоциированную фланкирующую ДНК генома клетки-хозяина. Примером молекулы рекомбинантной нуклеиновой кислоты является молекула ДНК, полученная в результате вставки трансгена в геномную ДНК растения, что в конечном итоге может приводить к экспрессии молекулы рекомбинантной РНК и/или белка в данном организме. Применяемое в данном документе выражение "рекомбинантное растение" представляет собой растение, которое обычно не будет существовать в природе, и оно является результатом вмешательства человека и содержит трансген и/или гетерологичную молекулу нуклеиновой кислоты, введенную в его геном. В результате такого изменения генома рекомбинантное растение явно отличается от родственного растения дикого типа.
[0080] "Регуляторные элементы" относятся к последовательностям, вовлеченным в контроль экспрессии нуклеотидной последовательности. Регуляторные элементы предусматривают промотор, функционально связанный с представляющей интерес нуклеотидной последовательностью, и сигналы терминации. Как правило, они охватывают также последовательности, необходимые для надлежащей трансляции нуклеотидной последовательности.
[0081] Термин "идентичный" или "в значительной степени идентичный" в контексте двух последовательностей нуклеиновых кислот или белковых последовательностей относится к двум или более последовательностям или подпоследовательностям, которые характеризуются по меньшей мере 60%, предпочтительно 80%, более предпочтительно 90, даже более предпочтительно 95% и наиболее предпочтительно по меньшей мере 99% идентичностью нуклеотидных или аминокислотных остатков при сравнении и выравнивании для максимального соответствия, как определено с применением одного из следующих алгоритмов сравнения последовательностей или путем визуальной проверки. Предпочтительно значительная степень идентичности имеет место в пределах участка последовательностей, который состоит из по меньшей мере приблизительно 50 остатков в длину, более предпочтительно в пределах участка, состоящего из по меньшей мере приблизительно 100 остатков, и наиболее предпочтительно последовательности в значительной степени идентичны в пределах по меньшей мере приблизительно 150 остатков. В особенно предпочтительном варианте осуществления последовательности являются в значительной степени идентичными по всей длине кодирующих участков. Кроме того, в значительной степени идентичные последовательности нуклеиновой кислоты или белка выполняют, по сути, одинаковую функцию.
[0082] При сравнении последовательностей одна последовательность, как правило, выступает в качестве эталонной последовательности, с которой сравнивают тестируемые последовательности. При использовании алгоритма сравнения последовательностей тестируемую и эталонную последовательности вводят в компьютер, при необходимости задают координаты подпоследовательности, и задают программные параметры алгоритма сравнения последовательностей. Затем с помощью алгоритма сравнения последовательностей на основе заданных программных параметров вычисляют процент идентичности последовательностей для тестируемой последовательности(ей) относительно эталонной последовательности.
[0083] Оптимальное выравнивание последовательностей для сравнения можно проводить, например, с помощью алгоритма поиска локальной гомологии по Smith & Waterman, Adv. Appl. Math. 2: 482 (1981), с помощью алгоритма выравнивания областей гомологии по Needleman & Wunsch, J. Mol. Biol. 48: 443 (1970), с помощью способа поиска сходства по Pearson & Lipman, Proc. Nat'l. Acad Sci. USA 85: 2444 (1988), с помощью реализации данных алгоритмов в компьютерных программах (GAP, BESTFIT, FASTA и TFASTA в пакете программного обеспечения Wisconsin Genetics, Genetics Computer Group, 575 Science Dr., Мэдисон, Висконсин) или путем визуальной проверки (в целом см. Ausubel et al., ниже).
[0084] Одним примером алгоритма, который подходит для определения процента идентичности последовательности и сходства последовательности, является алгоритм BLAST, который описан в Altschul et al., J. Mol. Biol. 215: 403-410 (1990). Программное обеспечение для осуществления анализов BLAST является общедоступным в Национальном центре биотехнологической информации (National Center for Biotechnology Information, U.S. National Library of Medicine, 8600 Rockville Pike, Бетесда, Мэриленд 20894, США). Данный алгоритм включает первоначально идентификацию пар последовательностей с наибольшим сходством (HSP) путем идентификации коротких "слов" длиной W в запрашиваемой последовательности, которые либо совпадают, либо удовлетворяют некоторому положительному пороговому баллу Т при выравнивании со "словом" такой же длины в последовательности из базы данных. Т называется пороговым показателем соседнего "слова" (Altschul et al., 1990). Эти исходные совпадения соседних "слов" выступают в качестве затравки для начала поисков с целью обнаружения более длинных HSP, содержащих их. Совпадения "слов" затем продлеваются в обоих направлениях вдоль каждой последовательности до тех пор, пока может увеличиваться совокупный показатель выравнивания. Совокупные показатели рассчитывают с применением, в случае нуклеотидных последовательностей, параметров М (балл-вознаграждение, начисляемый за пару совпадающих остатков; всегда > 0) и N (штрафной балл, начисляемый за несовпадающие остатки; всегда < 0). В случае аминокислотных последовательностей для расчета совокупного показателя применяют матрицу замен. Продление совпадений "слов" в каждом направлении прекращается, когда совокупный показатель выравнивания снижается на величину X от его максимального достигнутого значения, при этом совокупный показатель падает до нуля или ниже вследствие накопления одного или нескольких выравниваний остатков с отрицательными показателями, либо в случае достижения конца одной из последовательностей. Параметры алгоритма BLAST W, Т и X определяют чувствительность и скорость выравнивания. Программа BLASTN (для нуклеотидных последовательностей) использует по умолчанию длину "слова" (W), равную 11, ожидаемое значение (Е), равное 10, пороговое значение, равное 100, М=5,N=-4 и сравнение обеих нитей. Для аминокислотных последовательностей программа BLASTP использует по умолчанию длину "слова" (W), равную 3, ожидаемое значение (Е), равное 10, и матрицу замен BLOSUM62 (см. Henikoff & Henikoff, Proc. Natl. Acad Sci. USA 89: 10915 (1989)).
[0085] В дополнение к расчету процента идентичности последовательностей алгоритм BLAST также выполняет статистический анализ сходства между двумя последовательностями (см., например, Karlin & Altschul, Proc. Nat'l. Acad. Sci. USA 90: 5873-5787 (1993)). Одной мерой сходства, предоставляемой алгоритмом BLAST, является наименьшая суммарная вероятность (P(N)), которая предусматривает показатель вероятности, согласно которому совпадения между двумя нуклеотидными или аминокислотными последовательностями будут наблюдаться случайным образом. Например, тестируемая последовательность нуклеиновой кислоты считается подобной эталонной последовательности, если наименьшая суммарная вероятность при сравнении тестируемой последовательности нуклеиновой кислоты с эталонной последовательностью нуклеиновой кислоты составляет менее приблизительно 0,1, более предпочтительно менее приблизительно 0,01 и наиболее предпочтительно менее приблизительно 0,001.
[0086] Другим показателем того, что две последовательности нуклеиновых кислот в значительной степени идентичны, является то, что две молекулы гибридизируются друг с другом в жестких условиях. Фраза "гибридизируется специфически с" относится к связыванию, образованию дуплекса или гибридизации молекулы только с определенной нуклеотидной последовательностью в жестких условиях, когда такая последовательность присутствует в сложной смеси (например, общих клеточных) ДНК или РНК. "В значительной степени связывается" относится к гибридизации комплементарных последовательностей, нуклеиновой кислоты-зонда и целевой нуклеиновой кислоты, и также охватывает незначительные несовпадения, которые могут компенсироваться за счет снижения жесткости среды для гибридизации, чтобы добиться требуемого обнаружения целевой последовательности нуклеиновой кислоты.
[0087] "Жесткие условия гибридизации" и "жесткие условия отмывки при гибридизации" в контексте экспериментов по гибридизации нуклеиновых кислот, таких как Саузерн- и нозерн-гибридизация, зависят от последовательности и отличаются при разных параметрах окружающей среды. Более длинные последовательности специфично гибридизируются при более высоких температурах. Подробное руководство по гибридизации нуклеиновых кислот можно найти в Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2 "Overview of principles of hybridization and the strategy of nucleic acid probe assays" Elsevier, New York. Как правило, условия гибридизации и отмывки высокой жесткости выбирают так, чтобы температура была приблизительно на 5°С ниже точки плавления (Tm) для конкретной последовательности при определенных ионной силе и рН. Как правило, в "жестких условиях" зонд будет гибридизироваться со своей целевой подпоследовательностью, а не с другими последовательностями.
[0088] Tm является температурой (при определенных ионной силе и рН), при которой 50% целевой последовательности гибридизируется с абсолютно совпадающим зондом. Для очень жестких условий выбирают температуру, равную Tm для конкретного зонда. Примером жестких условий гибридизации для гибридизации комплементарных нуклеиновых кислот, которые имеют более 100 комплементарных остатков на фильтре при Саузерн- или нозерн-блоттинге, является 50% формамида с 1 мг гепарина при 42°С, при этом гибридизацию проводят в течение ночи. Примером условий отмывки высокой жесткости является 0,15 М NaCl при 72°С в течение приблизительно 15 минут. Примером жестких условий отмывки является отмывка с помощью 0,2 × SSC при 65°С в течение 15 минут (описание буфера SSC см. в Sambrook ниже). Зачастую для избавления от фонового сигнала зонда отмывке в условиях высокой жесткости предшествует отмывка в условиях низкой жесткости. Примером условий отмывки средней жесткости для дуплекса, имеющего, например, более 100 нуклеотидов, является 1 × SSC при 45°С в течение 15 минут. Примером условий отмывки низкой жесткости для дуплекса, имеющего, например, более 100 нуклеотидов, является 4-6 × SSC при 40°С в течение 15 минут. Для коротких зондов (например, длиной от приблизительно 10 до 50 нуклеотидов) жесткие условия, как правило, предусматривают концентрации солей, составляющие менее чем приблизительно 1,0 М ионов Na, как правило, концентрации, составляющие приблизительно 0,01-1,0 М ионов Na (или других солей) при рН 7,0-8,3, а также температуру, как правило, составляющую по меньшей мере приблизительно 30°С. Жестких условий также можно достигать путем добавления дестабилизирующих средств, таких как формамид. В целом, соотношение сигнал-шум, в 2× (или более) раза превышающее наблюдаемое для неродственного зонда в конкретном гибридизационном анализе, указывает на выявление специфической гибридизации. Нуклеиновые кислоты, которые не гибридизируются друг с другом в жестких условиях, все еще являются в значительной степени идентичными, если белки, которые они кодируют, в значительной степени идентичны. Например, это происходит в том случае, когда копию нуклеиновой кислоты создают с применением максимальной вырожденности кодонов, допускаемой генетическим кодом.
[0089] Примеры комплексов условий гибридизации/отмывки, которые можно применять для клонирования гомологичных нуклеотидных последовательностей, которые в значительной степени идентичны эталонным нуклеотидным последовательностям по настоящему изобретению, являются следующими: эталонная нуклеотидная последовательность предпочтительно гибридизируется с эталонной нуклеотидной последовательностью в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ EDTA при 50°С с отмывкой в 2 × SSC, 0,1% SDS при 50°С, более желательно в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ EDTA при 50°С с отмывкой в 1 × SSC, 0,1% SDS при 50°С, еще более желательно в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ EDTA при 50°С с отмывкой в 0,5 × SSC, 0,1% SDS при 50°С, предпочтительно в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ EDTA при 50°С с отмывкой в 0,1 × SSC, 0,1% SDS при 50°С, более предпочтительно в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ EDTA при 50°С с отмывкой в 0,1 × SSC, 0,1% SDS при 65°С.
[0090] Еще одним показателем того, что две последовательности нуклеиновых кислот или белки являются в значительной степени идентичными, является то, что белок, кодируемый первой нуклеиновой кислотой, характеризуется иммунологической перекрестной реактивностью с белком, кодируемым второй нуклеиновой кислотой, или специфически связывается в таких реакциях. Таким образом, белок, как правило, является в значительной степени идентичным второму белку, например, если два белка отличаются только консервативными заменами.
[0091] "Синтетический" относится к нуклеотидной последовательности, содержащей основания и/или структурные признаки, отсутствующие в природной последовательности. Например, синтетической считается искусственная последовательность, кодирующая белок Cry по настоящему изобретению, которая по содержанию G+C и нормальному распределению кодонов больше похожа на гены двудольных и/или однодольных растений.
[0092] "Трансформация" представляет собой процесс введения гетерологичной нуклеиновой кислоты в клетку- или организм-хозяин. В частности, "трансформация" означает стабильную интеграцию молекулы ДНК в геном представляющего интерес организма.
[0093] "Трансформированный/трансгенньш/рекомбинантный" относится к организму-хозяину, такому как бактерия или растение, в который была введена гетерологичная молекула нуклеиновой кислоты. Молекулу нуклеиновой кислоты можно стабильно интегрировать в геном хозяина, или же молекула нуклеиновой кислоты также может присутствовать в качестве внехромосомной молекулы. Такая внехромосомная молекула может быть автореплицирующейся. Подразумевается, что трансформированные клетки, ткани или растения охватывают не только конечный продукт процесса трансформации, но также и его трансгенное потомство. "Нетрансформированный", "нетрансгенный" или "нерекомбинантный" хозяин относится к организму дикого типа, например, бактерии или растению, которые не содержат гетерологичную молекулу нуклеиновой кислоты.
[0094] Нуклеотиды обозначены по их основаниям с помощью следующих стандартных сокращений: аденин (А), цитозин (С), тимин (Т) и гуанин (G). Аналогичным образом, аминокислоты обозначены с помощью следующих стандартных сокращений: аланин (Ala; А), аргинин (Arg; R), аспарагин (Asn; N), аспарагиновая кислота (Asp; D), цистеин (Cys; С), глутамин (Gln; Q), глутаминовая кислота (Glu; Е), глицин (Gly; G), гистидин (His; Н), изолейцин (Ile; 1), лейцин (Leu; L), лизин (Lys; K), метионин (Met; М), фенилаланин (Phe; F), пролин (Pro; Р), серии (Ser; S), треонин (Thr; Т), триптофан (Trp; W), тирозин (Tyr; Y) и валин (Val; V).
[0095] В настоящем изобретении предусмотрены композиции и способы для контроля опасных вредителей растений. В частности, настоящее изобретение относится к белкам Cry, которые токсичны для вредителей растений, и к полинуклеотидам, которые содержат нуклеотидные последовательности, которые кодируют белки Cry, а также к получению и применению полинуклеотидов и белков Cry для контроля вредителей растений.
[0096] Соответственно, в некоторых вариантах осуществления предусмотрен химерный ген, который содержит гетерологичный промотор, функционально связанный с полинуклеотидом, содержащим нуклеотидную последовательность, которая кодирует белок, токсичный по меньшей мере для кукурузного мотылька (Ostrinia nubilalis), где нуклеотидная последовательность (а) характеризуется от по меньшей мере 80% (например, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%) до по меньшей мере 99% (99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%) идентичностью последовательности с любой из SEQ ID NO: 1-5; или (b) кодирует белок, содержащий аминокислотную последовательность, которая характеризуется от по меньшей мере 80% (например, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%) до по меньшей мере 99% (99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%) идентичностью последовательности с любой из SEQ ID NO: 16-20; или (с) представляет собой синтетическую последовательность на основании (а) или (b), которая имеет кодоны, оптимизированные для экспрессии в трансгенном организме.
[0097] В других вариантах осуществления гетерологичный промотор представляет собой промотор, обеспечивающий экспрессию в растении. Например, без ограничения, промотор, обеспечивающий экспрессию в растении, может быть выбран из группы, состоящей из промотора убиквитина, cmp, TrpA кукурузы, 5'-UTR гена 9 бактериофага Т3, сахарозосинтетазы 1 кукурузы, алкогольдегидрогеназы 1 кукурузы, светособирающего комплекса кукурузы, белка теплового шока кукурузы, малой субъединицы RuBP карбоксилазы гороха, маннопинсинтазы Ti-плазмиды, нопалинсинтазы Ti-плазмиды, халкон-изомеразы петунии, богатого глицином белка 1 бобов, пататина картофеля, лектина, 35S CaMV и малой субъединицы S-E9 RuBP карбоксилазы.
[0098] В дополнительных вариантах осуществления белок, кодируемый химерным геном, дополнительно токсичен для одного или нескольких видов насекомых, выбранных из группы, состоящей из совки-ипсилон (Agrotis ipsilon), совки травяной (Spodoptera frugiperda), американской кукурузной совки (Helicoverpa zea), огневки тростниковой (Diatraea saccharalis), гусеницы совки бархатных бобов (Anticarsia gemmatalis), соевой совки (Chrysodeixis includes), огневки кукурузной юго-западной (Diatraea grandiosella), западной бобовой совки (Richia albicosta), табачной совки (Heliothis virescens), восточного кукурузного мотылька (Ostrinia furnacalis), хлопковой совки (Helicoverpa armigera), огневки желтой рисовой (Chilo suppressalis), розовой стеблевой совки (Sesamia calamistis) и огневки рисовой (Cnaphalocrocis medinalis).
[0099] В дополнительных вариантах осуществления полинуклеотид содержит нуклеотидную последовательность, которая характеризуется от по меньшей мере 80% до по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 1, или характеризуется от по меньшей мере 80% до по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 2, или характеризуется от по меньшей мере 80% до по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 3, или характеризуется от по меньшей мере 80% до по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 4, или характеризуется от по меньшей мере 80% до по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 5.
[00100] В других вариантах осуществления полинуклеотид содержит нуклеотидную последовательность, которая кодирует белок, содержащий аминокислотную последовательность, которая характеризуется от по меньшей мере 80% до по меньшей мере 99% идентичностью последовательности с любой из SEQ ID NO: 16-20.
[00101] В еще одних вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 16.
[00102] В дополнительных вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 17.
[00103] В еще одних вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 18.
[00104] В других вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 19.
[00105] В еще одних вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 20.
[00106] В некоторых вариантах осуществления химерный ген по настоящему изобретению содержит полинуклеотид, содержащий синтетическую последовательность нуклеотидной последовательности, которая характеризуется по меньшей мере 80%, или по меньшей мере на 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% с любой из SEQ ID NO: 6-15, где синтетическая последовательность имеет ко доны, оптимизированные для экспрессии в трансгенном организме. В других вариантах осуществления химерный ген по настоящему изобретению содержит полинуклеотид, содержащий синтетическую последовательность нуклеотидной последовательности, которая кодирует белок, содержащий аминокислотную последовательность, которая характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с любой из SEQ ID NO: 16-25, где синтетическая последовательность имеет кодоны, оптимизированные для экспрессии в трансгенном организме. В дополнительных вариантах осуществления трансгенный организм представляет собой трансгенную бактерию или трансгенное растение.
[00107] В некоторых вариантах осуществления настоящего изобретения предусмотрен синтетический полинуклеотид, содержащий, состоящий главным образом или состоящий из нуклеотидной последовательности, которая кодирует белок, активный в отношении по меньшей мере кукурузного мотылька (Ostrinia nubilalis), где нуклеотидная последовательность характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с любой из SEQ ID NO: 6-15.
[00108] В других вариантах осуществления настоящего изобретения предусмотрен синтетический полинуклеотид, содержащий, состоящий главным образом или состоящий из нуклеотидной последовательности, которая кодирует белок, активный в отношении по меньшей мере кукурузного мотылька (Ostrinia nubilalis), где нуклеотидная последовательность кодирует аминокислотную последовательностью, которая характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с любой из SEQ ID NO: 16-25.
[00109] Согласно некоторым вариантам осуществления настоящего изобретения предусмотрен выделенный белок, токсичный по меньшей мере для кукурузного мотылька (Ostrinia nubilalis), при этом белок содержит, состоит главным образом или состоит из (а) аминокислотной последовательности, которая характеризуется от по меньшей мере 80% идентичностью последовательности до по меньшей мере 99% идентичностью последовательности с аминокислотной последовательностью, представленной любой из SEQ ID NO: 16-25; или (b) аминокислотная последовательность, которая кодируется нуклеотидной последовательностью, которая характеризуется от по меньшей мере 80% идентичностью последовательности до по меньшей мере 99% идентичностью последовательности с нуклеотидной последовательностью, представленной любой из SEQ ID NO: 6-15.
[00110] В других вариантах осуществления выделенный белок содержит, состоит главным образом или состоит из аминокислотной последовательности, которая характеризуется от по меньшей мере 80% до по меньшей мере 99% идентичностью последовательности с любой из SEQ ID NO: 16-20. В еще одних вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 16.
[00111] В других вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 17.
[00112] В дополнительных вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 18.
[00113] В еще одних вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 19.
[00114] В других вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5%, или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 20.
[00115] В некоторых вариантах осуществления аминокислотная последовательность содержит, состоит главным образом или состоит из любой из SEQ ID NO: 16-25.
[00116] Антитела, вырабатываемые в ответ на иммунную стимуляцию нативными или мутантными ВТ-0009, ВТ-0012, ВТ-0013, ВТ-0023 и ВТ-0067 и подобными или родственными белками по настоящему изобретению, могут быть получены с применением стандартных иммунологических методик получения поликлональной антисыворотки и, при необходимости, иммортализации антителопродуцирующих клеток иммунизированного организма-хозяина для получения источников моноклональных антител. Методики получения антител к любому представляющему интерес веществу хорошо известны, например, как описано в Harlow и Lane (1988) и в Goding (1986). Настоящее изобретение охватывает инсектицидные белки, которые перекрестно реагируют с антителами, вырабатываемыми против одного или нескольких инсектицидных белков Cry по настоящему изобретению.
[00117] Антитела, полученные согласно настоящему изобретению, также применимы в иммунологических анализах для определение количества или наличия нативных или мутантных ВТ-0044, ВТ-0051, ВТ-0068 и ВТ-0128 или родственного белка в биологическом образце. Такие анализы также применимы в получении композиций, содержащих один или несколько токсичных белков по настоящему изобретению или родственных токсичных белков, причем такое получение проводят с обеспечением контроля качества. Кроме того, антитела можно применять для оценки эффективности рекомбинантной продукции одного или нескольких белков по настоящему изобретению или родственного белка, а также для скрининга библиотек экспрессии на наличие нуклеотидной последовательности, кодирующей один или несколько белков по настоящему изобретению или последовательностей, кодирующих родственные белки. Антитела также применимы в качестве аффинных лигандов для очистки и/или выделения любого одного или нескольких белков по настоящему изобретению и родственных белков. Белки по настоящему изобретению и белки, содержащие родственные антигенные эпитопы, могут быть получены в результате сверхэкспрессии полноразмерной или частичной последовательности, кодирующей весь белок по настоящему изобретению или родственный белок, или их часть, в предпочтительной клетке-хозяине.
[00118] Считается, что последовательности ДНК, которые кодируют нативный белок Cry по настоящему изобретению, можно изменять с помощью различных способов, и что эти изменения могут приводить к образованию последовательностей ДНК, кодирующих белки с аминокислотными последовательности, отличающимися от таковых, закодированных в нативном белке Cry по настоящему изобретению. Этот белок может быть изменен различными способами, в том числе с помощью аминокислотных замен, делеций, усечений и вставок одной или нескольких аминокислот из любой из SEQ ID NO: 13-16, включая до приблизительно 2, приблизительно 3, приблизительно 4, приблизительно 5, приблизительно 6, приблизительно 7, приблизительно 8, приблизительно 9, приблизительно 10, приблизительно 15, приблизительно 20, приблизительно 25, приблизительно 30, приблизительно 35, приблизительно 40, приблизительно 45, приблизительно 50, приблизительно 55, приблизительно 60, приблизительно 65, приблизительно 70, приблизительно 75, приблизительно 80, приблизительно 85, приблизительно 90, приблизительно 100, приблизительно 105, приблизительно 110 приблизительно 115, приблизительно 120, приблизительно 125, приблизительно 130, приблизительно 135, приблизительно 140, приблизительно 145, приблизительно 150, приблизительно 155 или больше аминокислотных замен, делеций или вставок. Способы таких манипуляций в целом известны из уровня техники. Например, варианты аминокислотной последовательности нативного белка Cry могут быть получены посредством введения мутаций в полинуклеотид, который кодирует данный белок. Это также можно осуществлять с применением одной из нескольких форм мутагенеза и/или метода направленной эволюции. Согласно некоторым аспектам изменения, кодируемые аминокислотной последовательностью, не будут существенно влиять на функцию белка. Такие варианты будут обладать требуемой инсектицидной активностью. В одном варианте осуществления настоящего изобретения нуклеотидные последовательности, представленные SEQ ID NO: 1-5, изменяют с введением аминокислотных замен в кодируемый белок. В некоторых вариантах осуществления полученный мутантный белок кодируется синтетическим мутантным полинуклеотидом, содержащим нуклеотидную последовательность, представленную любой из SEQ ID NO: 11-15. В других вариантах осуществления мутантные белки содержат, состоят главным образом или состоят из аминокислотной последовательности, представленной любой из SEQ ID NO: 21-25.
[00119] Понятно, что способность инсектицидного белка обеспечивать инсектицидную активность может быть улучшена путем применения таких методик для композиций по настоящему изобретению. Например, можно экспрессировать белок Cry в клетках-хозяевах, которые характеризуются высоким уровнем ошибочного включения оснований в ходе репликации ДНК, например, XL-1 Red (Stratagene, Ла-Хойя, Калифорния). После размножения в таких штаммах можно выделять ДНК (например, путем получения плазмидной ДНК или путем амплификации с помощью ПЦР и клонирования полученного ПЦР-фрагмента в вектор), экспрессировать мутантные последовательности белка Cry в штамме, не приводящем к образованию мутаций, и идентифицировать мутированные гены с инсектицидной активностью, например, путем осуществления анализа для тестирования инсектицидной активности. Обычно белок смешивают и применяют в анализах питания. См., например Marrone et al. (1985) J. of Economic Entomology 78:290-293. Такие анализы могут включать приведение растения в контакт с одним или несколькими вредителями и определение способности растений к выживанию и/или способности вызывать гибель вредителей. Примеры мутаций, которые приводят к повышению токсичности, можно найти в Schnepf et al. (1998) Microbiol. Mol. Biol. Rev. 62:775-806.
[00120] В качестве альтернативы, могут быть выполнены изменения в аминокислотной последовательности по настоящему изобретению на амино- или карбокси-конце, при этом они не оказывают существенное влияние на активность. Они могут включать вставки, делеции или изменения, введенные с применением современных способов молекулярной биологии, таких как ПЦР, в том числе ПЦР-амплификаций, обеспечивающих изменение или расширение последовательности, кодирующей белок, за счет включения последовательностей, кодирующих аминокислоты, в олигонуклеотиды, используемые при ПЦР-амплификации. В качестве альтернативы добавленные последовательности, кодирующие белок, могут включать последовательности, кодирующие весь белок, такие как в большинстве случаев применяются в уровне техники для создания белков слияния. Такие белки слияния зачастую применяют для (1) повышения уровня экспрессии представляющего интерес белка, (2) для введения связывающего домена, ферментативной активности или эпитопа для облегчения одного из очистки белка, выявления белка или других применений в эксперименте, известных из уровня техники, (3) направленной секреции в субклеточную органеллу, такую как периплазматическое пространство грам-отрицательных бактерий, или трансляции в эндоплазматическом ретикулуме эукариотических клеток, в последнем случае результатом зачастую является гликозилирование белка.
[00121] Белок Cry по настоящему изобретению также может быть подвергнут мутации с введением эпитопа для получения антител, которые распознают мутантный белок. Таким образом, в некоторых вариантах осуществления настоящего изобретения предусмотрен мутированный белок Cry, где аминокислотная замена в нативном белке Cry дает мутантный белок Cry с антигенным участком, который позволяет отличать мутантный белок Cry от нативного белка Cry в анализе выявления белков.
[00122] В некоторых вариантах осуществления настоящего изобретения предусмотрен способ получения антитела, которое способно дифференцировать мутированный белок Cry и нативный белок Cry, из которого получен мутированный белок Cry, при этом метод включает стадии замены аминокислоты в антигенной петле нативного белка Cry и стимуляции выработки антител, которые специфически распознают мутированную антигенную петлю в мутированном белке Cry и не распознают нативный белок Cry. В одном варианте осуществления антигенную петлю идентифицируют в неконсервативных участках за пределами домена I нативного белка Cry. В другом варианте осуществления антигенная петля не является петлей, вовлеченной в распознавание рецепторов белков Cry в пищеварительном канале насекомого или вовлеченной в активацию белка Cry под действием протеазы.
[00123] Варианты нуклеотидных и аминокислотных последовательностей по настоящему изобретению также охватывают последовательности, полученные в результате процедур мутагенеза и рекомбинации, таких как ДНК-шаффлинг. С помощью такой процедуры один или несколько различных участков, кодирующих токсичный белок, можно применять для создания нового токсичного белка, обладающего требуемыми свойствами. Следовательно, библиотеки рекомбинантных полинуклеотидов получают из популяции полинуклеотидов с родственными последовательностями, содержащими участки последовательности, которые характеризуются значительной степенью идентичности последовательности и могут подвергаться гомологичной рекомбинации in vitro или in vivo. Например, с применением данного подхода, мотивы последовательности, кодирующие представляющий интерес домен, можно подвергать шаффлингу между пестицидным геном по настоящему изобретению и другими известными пестицидными генами с получением нового гена, кодирующегоr белок с улучшенным представляющим интерес свойством, таким как повышенная инсектицидная активность. Стратегии для такого ДНК-шаффлинга известны из уровня техники. См., например, Stemmer (1994) Proc. Natl. Acad. Sci. USA 91:10747-10751; Stemmer (1994) Nature 370:389-391; Crameri et al. (1997) Nature Biotech. 15:436-438; Moore et al. (1997) J. Mol. Biol. 272:336-347; Zhang et al. (1997) Proc. Natl. Acad. Sci. USA 94:4504-4509; Crameri et al. (1998) Nature 391:288-291 и патенты США №№ 5605793 и 5837458.
[00124] Обмен доменов или шаффлинг является другим механизмом для получения измененных белков Cry по настоящему изобретению. Домены можно обменивать между белками Cry, что приводит к гибридным или химерным токсичным белкам с улучшенной пестицидной активностью или спектром мишеней. Способы получения рекомбинантных белков и тестирования их в отношении пестицидной активности хорошо известны из уровня техники (см., например, Naimov et al. (2001) Appl. Environ. Microbiol. 67:5328-5330; de Maagd et al. (1996) Appl. Environ. Microbiol. 62:1537-1543; Ge et al. (1991) J. Biol. Chem. 266:17954-17958; Schnepf et al. (1990) J. Biol. Chem. 265:20923-20930; Rang et al. 91999) Appl. Environ. Microbiol. 65:2918-2925).
[00125] В некоторых вариантах осуществления настоящего изобретения предусмотрен рекомбинантный вектор, содержащий полинуклеотид, молекулу нуклеиновой кислоты, кассету экспрессии или химерный ген по настоящему изобретению. В других вариантах осуществления вектор дополнительно определен как плазмида, космида, фагмида, искусственная хромосома, фаг или вирусный вектор. Некоторые векторы для применения в трансформации растений и других организмов известны из уровня техники.
[00126] Таким образом, некоторые варианты осуществления настоящего изобретения относятся к кассетам экспрессии, сконструированным для экспрессии полинуклеотидов и молекул нуклеиновых кислот по настоящему изобретению.
Применяемое в данном документе выражение "кассета экспрессии" означает молекулу нуклеиновой кислоты, имеющую по меньшей мере последовательность контроля, функционально связанную с представляющей интерес нуклеотидной последовательностью. Таким образом, например, в кассетах экспрессии для экспрессии в растении, части растения и/или растительной клетке предусмотрены промоторы растений, функционально связанные с нуклеотидными последовательностями, подлежащими экспрессии.
[00127] Кассета экспрессии, содержащая представляющую интерес нуклеотидную последовательность, может быть химерной, что означает, что по меньшей мере один из ее компонентов является гетерологичным по отношению по меньшей мере к одному из ее остальных компонентов. Кассета экспрессии также может представлять собой последовательность, которая встречается в природе, но которая была получена в рекомбинантной форме, применимой для гетерологичной экспрессии. Однако, как правило, кассета экспрессии является гетерологичной по отношению к хозяину, т.е. конкретная последовательность нуклеиновой кислоты в кассете экспрессии не встречается в природе в клетке-хозяине, и ее необходимо было ввести в клетку-хозяина или предка клетки-хозяина с помощью события трансформации.
[00128] В дополнение к промоторам, функционально связанным с нуклеотидными последовательностями по настоящему изобретению, кассета экспрессии по настоящему изобретению также может содержать другие регуляторные последовательности. Применяемое в данном документе выражение "регуляторные последовательности" означает нуклеотидные последовательности, расположенные выше (5'-некодирующие последовательности), в пределах или ниже (3'-некодирующие последовательности) кодирующей последовательности, которые влияют на транскрипцию, процессинг или стабильность РНК или трансляцию ассоциированной кодирующей последовательности. Регуляторные последовательности включают без ограничения энхансеры, интроны, лидерные последовательности, регулирующие трансляцию, сигналы терминации и сигнальные последовательности полиаденилирования.
[00129] В некоторых вариантах осуществления кассета экспрессии по настоящему изобретению также может содержать нуклеотидные последовательности, которые кодируют другие требуемые признаки. Такие нуклеотидные последовательности можно "пакетировать" с любой комбинацией нуклеотидных последовательностей для создания растений, частей растений или растительных клеток с требуемым фенотипом. "Пакетированные" комбинации можно создавать с помощью любого способа, в том числе без ограничения с помощью скрещивания растений с помощью любой общепринятой методики или с помощью генетической трансформации (т.е. молекулярного стэкинга). При "пакетировании" путем генетической трансформации растений представляющие интерес нуклеотидные последовательности можно комбинировать в любой момент времени и в любом порядке. Например, трансгенное растение, содержащее один или несколько требуемых признаков, можно применять в качестве мишени для введения дополнительных признаков путем последующей трансформации. Дополнительные нуклеотидные последовательности можно вводить по протоколу котрансформации одновременно с нуклеотидной последовательностью, молекулой нуклеиновой кислоты, конструкцией нуклеиновой кислоты и/или композицией по настоящему изобретению, обеспечиваемыми любой комбинацией кассет экспрессии. Например, если будут вводить две нуклеотидные последовательности, то их можно встроить в отдельные кассеты (транс), или их можно встроить в одну кассету (цис). Экспрессия полинуклеотидов может управляться одним и тем же промотором или различными промоторами. Кроме того, известно, что полинуклеотиды можно "пакетировать" в требуемом местоположении в геноме при помощи системы сайт-специфической рекомбинации. См., например, публикации международных заявок на патенты №№ WO 99/25821, WO 99/25854, WO 99/25840, WO 99/25855 и WO 99/25853.
[00130] Кассета экспрессии также может содержать кодирующую последовательность, соответствующую одному или нескольким полипептидам, обеспечивающим агрономические признаки, которые преимущественно приносят пользу семенной компании, сельхозпроизводителю или переработчику зерна. Представляющий интерес полипептид может быть любым полипептидом, кодируемым представляющей интерес нуклеотидной последовательностью. Неограничивающие примеры представляющих интерес полипептидов, которые подходят для продуцирования в растениях, включают таковые, обуславливающие возникновение агрономически важных признаков, таких как устойчивость к гербицидам (также иногда называемая "толерантность к гербицидам"), устойчивость к вирусам, устойчивость к патогенным бактериям, устойчивость к насекомым, устойчивость к нематодам и/или устойчивость к грибам. См., например, патенты США №№ 5569823; 5304730; 5495071; 6329504 и 6337431. Полипептид также может являться таким, который увеличивает мощность или урожайность растений (включая признаки, которые дают возможность растению произрастать при различных температурах, почвенных условиях и уровнях солнечного света и атмосферных осадков), или таким, который дает возможность идентифицировать растение, проявляющее представляющий интерес признак (например, селектируемый маркер, цвет семенной оболочки и т.д.). Разнообразные представляющие интерес полипептиды, а также способы введения этих полипептидов в растение описаны, например, в патентах США №№ 4761373; 4769061; 4810648; 4940835; 4975374; 5013659; 5162602; 5276268; 5304730; 5495071; 5554798;5561236; 5569823; 5767366; 5879903, 5928937; 6084155; 6329504 и 6337431; а также в публикации заявки на патент США №2001/0016956. См. также во всемирной сети Интернет по адресу lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/.
[00131] В некоторых вариантах осуществления настоящего изобретения также могут применяться полинуклеотиды, придающие устойчивость/толерантность к гербициду, ингибирующему конус нарастания или меристему, такому как имидазолинон или сульфонилмочевина. Иллюстративные полинуклеотиды из этой категории кодируют мутантные ферменты ALS и AHAS, как описано, например, в патентах США №№ 5767366 и 5928937. Патенты США №№ 4761373 и 5013659 относятся к растениям, устойчивым к различным имидазолиноновым или сульфонамидным гербицидам. Патент США №4975374 относится к растительным клеткам и растениям, содержащим нуклеиновую кислоту, кодирующую мутантную глутаминсинтетазу (GS), устойчивую к ингибированию гербицидами, которые, как известно, ингибируют GS, например, фосфинотрицин и метионинсульфоксимин. В патенте США №5162602 раскрыты растения, устойчивые к ингибированию гербицидами на основе циклогександиона и арилоксифеноксипропановой кислоты. Устойчивость придает измененная ацетил-коэнзим А-карбоксилаза (АССаза).
[00132] Полипептиды, кодируемые нуклеотидными последовательностями, придающими устойчивость к глифосату, также подходят для настоящего изобретения. См., например, патент США №4940835 и патент США №4769061. В патенте США №5554798 раскрыты трансгенные растения маиса, устойчивые к глифосату, устойчивость которым придает ген измененной 5-енолпирувил-3-фосфошикиматсинтазы (EPSP).
[00133] Также подходят полинуклеотиды, кодирующие устойчивость к фосфоновым соединениям, таким как глюфосинат аммония или фосфинотрицин, а также пиридинокси- или феноксипропионовым кислотам и циклогексанонам. См. заявку на европейский патент №0242246. См. также патенты США №№ 5879903, 5276268 и 5561236.
[00134] Другие подходящие полинуклеотиды включают таковые, кодирующие устойчивость к гербицидам, ингибирующим фотосинтез, таким как триазин и бензонитрил (ген нитрилазы). См. патент США №4810648. Дополнительные подходящие полинуклеотиды, кодирующие устойчивость к гербицидам, включают таковые, кодирующие устойчивость к 2,2-дихлорпропионовой кислоте, сетоксидиму, галоксифопу, имидазолиноновым гербицидам, сульфонилмочевинным гербицидам, триазолопиримидиновым гербицидам, s-триазиновым гербицидам и бромоксинилу. Также подходят полинуклеотиды, придающие устойчивость к ингибиторам фермента protox, или которые обеспечивают повышенную устойчивость к заболеваниям растений; повышенную толерантность к неблагоприятным условиям окружающей среды (видам абиотического стресса), в том числе без ограничения к засухе, чрезмерному охлаждению, чрезмерному нагреву, или чрезмерной засоленности почвы, или экстремальной кислотности или щелочности; и изменения строения или развития растений, в том числе изменения сроков развития. См., например, публикацию заявки на патент США №2001/0016956 и патент США №6084155.
[00135] Дополнительные подходящие полинуклеотиды включают таковые, кодирующие пестицидные (например, инсектицидные) полипептиды. Эти полипептиды могут быть получены в количествах, достаточных для контроля, например, насекомых-вредителей (т.е. в количествах, обеспечивающих контроль насекомых). Считается, что количество продуцируемого в растении пестицидного полипептида, необходимое для контроля насекомых или других вредителей, может варьировать в зависимости от сорта, типа вредителя, факторов окружающей среды и т.п. Полинуклеотиды, применимые для придания дополнительной устойчивости к насекомым или вредителям, включают, например, таковые, кодирующие токсины, идентифицированные в организмах Bacillus. Полинуклеотиды, содержащие нуклеотидные последовательности, кодирующие белки Cry Bacillus thuringiensis (Bt) из нескольких подвидов, были клонированы и было обнаружено, что рекомбинантные клоны токсичны для личинок чешуекрылых, двукрылых и жесткокрылых насекомых. Примеры таких инсектицидных белков Bt включают белки Cry, такие как Cry1Aa, Cry1Ab, Cry1Ac, Cry1B, Cry1C, Cry1D, Cry1Ea, Cry1Fa, Сгу3А, Cry9A, Cry9B, Cry9C, и т.п., а также вегетативные инсектицидные белки, такие как Vip1, Vip2, Vip3 и т.п. Полный перечень белков Bt можно найти во всемирной сети Интернет в базе данных номенклатуры токсинов Bacillus thuringiensis, поддерживаемой университетом Сассекса (см. также Crickmore et al. (1998) Microbiol. Mol. Biol. Rev. 62:807-813).
[00136] Полипептиды, пригодные для продуцирования в растениях, дополнительно включают таковые, улучшающие превращение собранных растений и/или частей растений в коммерчески применимый продукт или иным образом содействующие ему, в том числе, например, обеспечивающие повышенное или измененное содержание и/или распределение углеводов, улучшенные свойства сбраживаемости, повышенное содержание масла, повышенное содержание белка, улучшенную усвояемость или повышенное содержание нутрицевтиков, например, повышенное содержание фитостерола, повышенное содержание токоферола, повышенное содержание станола и/или повышенное содержание витаминов. Представляющие интерес полипептиды также включают, например, таковые, обуславливающие снижение содержания нежелательного компонента в собранном урожае, например, фитиновой кислоты или ферментов, расщепляющих сахара, или способствующие этому. Под "обуславливающим" или "способствующим" подразумевается, что представляющий интерес полипептид может прямо или косвенно способствовать наличию представляющего интерес признака (например, путем увеличения расщепления целлюлозы с помощью гетерологичного фермента целлюлазы).
[00137] В одном варианте осуществления полипептид способствует улучшению усвояемости еды или корма. Ксиланазы представляют собой ферменты, расщепляющие гемицеллюлозу, которые усиливают разрушение клеточных стенок растений, что приводит к лучшему использованию питательных веществ растения животным. Это приводит к увеличению темпов роста и конверсии корма. Также можно снижать вязкость кормов, содержащих ксилан. Гетерологичное продуцирование ксиланаз в растительных клетках также может содействовать превращению лигноцеллюлозы в сбраживаемые сахара в ходе промышленной переработки.
[00138] Были идентифицированы и охарактеризованы многочисленные ксиланазы из грибковых и бактериальных микроорганизмов (см., например, патент США №5437992; Coughlin et al. (1993) "Proceedings of the Second TRICEL Symposium on Trichoderma reesei Cellulases and Other Hydrolases" Espoo; Souminen and Reinikainen, eds. (1993) Foundation for Biotechnical and Industrial Fermentation Research 8:125-135; публикацию заявки на патент США №2005/0208178 и публикацию согласно РСТ № WO 03/16654). В частности, три специфичные ксиланазы (XYL-I, XYL-II and XYL-III) были идентифицированы у Т. reesei (Tenkanen et al. (1992) Enzyme Microb. Technol. 14:566; Torronen et al. (1992) Bio/Technology 10:1461 и Xu et al. (1998). Appl. Micribiol. Biotechnol. 49:718).
[00139] В другом варианте осуществления полипептид, применимый для настоящего изобретения, может представлять собой фермент, расщепляющий полисахариды. Растения по настоящему изобретению, вырабатывающие такой фермент, могут быть применимы для получения, например, сбраживаемого сырья для биологической переработки. В некоторых вариантах осуществления ферменты, применимые для способа сбраживания, включают альфа-амилазы, протеазы, пуллуланазы, изоамилазы, целлюлазы, гемицеллюлазы, ксиланазы, циклодекстрингликозилтрансферазы, липазы, фитазы, лакказы, оксидазы, эстеразы, кутиназы, фермент, гидролизующий гранулированный крахмал, и другие глюкоамилазы.
[00140] Ферменты, расщепляющие полисахариды, включают ферменты, расщепляющие крахмал, такие как α-амилазы (ЕС 3.2.1.1), глюкуронидазы (Е.С. 3.2.1.131); экзо-1,4-α-D-глюканазы, такие как амилоглюкозидазы и глюкоамилазы (ЕС 3.2.1.3), β-амилазы (ЕС 3.2.1.2), α-глюкозидазы (ЕС 3.2.1.20) и другие экзоамилазы; крахмал-деветвящие ферменты, такие как а) изоамилаза (ЕС 3.2.1.68), пуллуназа (ЕС 3.2.1.41) и т.п.; b) целлюлазы, такие как экзо-1,4-3-целлобиогидролаза (ЕС 3.2.1.91), экзо-1,3-β-D-глюканаза (ЕС 3.2.1.39), β-глюкозидаза (ЕС 3.2.1.21); с) L-арабиназы, такие как эндо-1,5-α-L-арабиназа (ЕС 3.2.1.99), α-арабинозидазы (ЕС 3.2.1.55) и т.п.; d) галактаназы, такие как эндо-1,4-β-D-галактаназа (ЕС 3.2.1.89), эндо-1,3-β-D-галактаназа (ЕС 3.2.1.90), β-галактозидаза (ЕС 3.2.1.22), β-галактозидаза (ЕС 3.2.1.23) и т.п.; е) маннаназы, такие как эндо-1,4-β-D-маннаназа (ЕС 3.2.1.78), β-маннозидаза (ЕС 3.2.1.25), α-маннозидаза (ЕС 3.2.1.24) и т.п.; f) ксиланазы, такие как эндо-1,4-β-ксиланаза (ЕС 3.2.1.8), β-D-ксилозидаза (ЕС 3.2.1.37), 1,3-β-D-ксиланаза и т.п.; и g) другие ферменты, такие как α-L-фукозидаза (ЕС 3.2.1.51), α-L-рамнозидаза (ЕС 3.2.1.40), леваназа (ЕС 3.2.1.65), инулиназа (ЕС 3.2.1.7) и т.п. В одном варианте осуществления α-амилаза представляет собой синтетическую α-амилазу, Amy797E, описанную в патенте США №8093453, включенном в данный документ посредством ссылки во всей своей полноте.
[00141] Дополнительные ферменты, которые можно применять в соответствии с настоящим изобретением, включают протеазы, такие как протеазы грибов и бактерий. Протеазы грибов включают без ограничения таковые, полученные из Aspergillus, Trichoderma, Mucor и Rhizopus, как, например, A. niger, A. awamori, А. oryzae и М. miehei. В некоторых вариантах осуществления полипептиды по настоящему изобретению могут представлять собой ферменты целлобиогидролазы (СВН) (ЕС 3.2.1.91). В одном варианте осуществления фермент целлобиогидролаза может представлять собой СВН1 или СВН2.
[00142] Другие ферменты, применимые в соответствии с настоящим изобретением, включают без ограничения гемицеллюлазы, такие как манназы и арабинофуранозидазы (ЕС 3.2.1.55); лигниназы; липазы (например, Е.С. 3.1.1.3), глюкозооксидазы, пектиназы, ксиланазы, трансглюкозидазы, альфа-1,6-глюкозидазы (например, Е.С. 3.2.1.20); эстеразы, такие как естераза феруловой кислоты (ЕС 3.1.1.73) и ацетилксиланэстеразы (ЕС 3.1.1.72); и кутиназы (например, Е.С. 3.1.1.74).
[00143] В некоторых вариантах осуществления настоящего изобретения предусмотрена трансгенная клетка-хозяин, отличная от клетки человека, которая содержит полинуклеотид, молекулу нуклеиновой кислоты, химерный ген, кассету экспрессии или рекомбинантный вектор по настоящему изобретению. Трансгенная клетка-хозяин, отличная от клетки человека, может включать без ограничений растительную клетку, дрожжевую клетку, бактериальную клетку или клетку насекомого. Следовательно, в некоторых вариантах осуществления настоящего изобретения предусмотрена бактериальная клетка, выбранная из рода Bacillus, Brevibacillus, Clostridium, Xenorhabdus, Photorhabdus, Pasteuria, Escherichia, Pseudomonas, Erwinia, Serratia, Klebsiella, Salmonella, Pasteurella, Xanthomonas, Streptomyces, Rhizobium, Rhodopseudomonas, Methylophilius, Agrobacterium, Acetobacter, Lactobacillus, Arthrobacter, Azotobacter, Leuconostoc или Alcaligenes. Таким образом, например, в качестве средств для биологического контроля насекомых можно получать белки Cry по настоящему изобретению путем экспрессии химерного гена, кодирующего белки Cry по настоящему изобретению в бактериальной клетке. Например, в одном варианте осуществления предусмотрена клетка Bacillus thuringiensis, содержащая химерный ген по настоящему изобретению.
[00144] В дополнительных вариантах осуществления настоящего изобретения предусмотрена растительная клетка, которая представляет собой клетку двудольного растения или клетку однодольного растения. В дополнительных вариантах осуществления клетка двудольного растения выбрана из группы, состоящей из клетки сои, клетки подсолнечника, клетки томата, клетки культурной разновидности капусты, клетки хлопчатника, клетки сахарной свеклы и клетки табака. В дополнительных вариантах осуществления клетка однодольного растения выбрана из группы, состоящей из клетки ячменя, клетки маиса, клетки овса, клетки риса, клетки сорго, клетки сахарного тростника и клетки пшеницы. В некоторых вариантах осуществления настоящего изобретения предусмотрена совокупность клеток двудольных растений или клеток однодольных растений, экспрессирующих токсичный белок по настоящему изобретению, кодируемый химерным геном по настоящему изобретению. В других вариантах осуществления клетки в совокупности расположены рядом с образованием апопласта и их выращивают при естественном солнечном свете.
[00145] В другом варианте осуществления настоящего изобретения токсичный белок по настоящему изобретению экспрессируется в высшем организме, например растении. В этом случае трансгенные растения, экспрессируя эффективные количества токсичного белка, защищают себя от вредителей растений, таких как насекомые-вредители. Когда насекомое начинает питаться на таком трансгенном растении, оно также поедает экспрессируемый токсин. Это может удерживать насекомое от дальнейшего вгрызания в растительную ткань или даже может причинять вред насекомому или уничтожать его. Полинуклеотид по настоящему изобретению вставляют в кассету экспрессии, которая затем стабильно интегрируется в геном растения. В другом варианте осуществления полинуклеотид включают в непатогенный самореплицирующийся вирус. Растения, трансформированные в соответствии с настоящим изобретением, могут представлять собой однодольные или двудольные растения, и они включают без ограничения кукурузу (маис), сою, рис, пшеницу, ячмень, рожь, овес, сорго, просо, подсолнечник, сафлор, сахарную свеклу, хлопчатник, сахарный тростник, масличный рапс, люцерну, табак, разновидности арахиса, овощные культуры, в том числе батат, фасоль, горох, цикорий, латук, кочанную капусту, цветную капусту, брокколи, репу, морковь, баклажан, огурец, редьку, шпинат, картофель, томат, спаржу, лук, чеснок, разновидности дыни, перец, сельдерей, тыкву крупноплодную, тыкву обыкновенную, цуккини, плодовые культуры, включая яблоню, грушу, айва, сливу, вишню, персик, нектарин, абрикос, землянику, виноград, малину, ежевику, ананас, авокадо, папайю, манго, банан и специализированные растения, такие как Arabidopsis, а также древесные растения, такие как хвойные и лиственные деревья. Предпочтительно растения по настоящему изобретению представляют собой культурные растения, такие как маис, сорго, пшеница, подсолнечник, томат, крестоцветные, разновидности перца, картофель, хлопчатник, рис, соя, сахарная свекла, сахарный тростник, табак, ячмень, масличный рапс и т.п.
[00146] После того как требуемый полинуклеотид введен в конкретный вид растения путем трансформации, при помощи традиционных методик размножения он может передаваться в пределах данного вида или переходить в другие разновидности того же вида, в частности, включающие коммерческие разновидности.
[00147] Полинуклеотид по настоящему изобретению экспрессируется в трансгенных растениях, обусловливая тем самым биосинтез соответствующего белка Cry в трансгенных растениях. Таким способом получают трансгенные растения с улучшенной защитой урожая в присутствии нагрузки насекомых. Для экспрессии в трансгенных растениях может потребоваться модификация и оптимизация нуклеотидных последовательностей по настоящему изобретению. Хотя во многих случаях гены микроорганизмов могут экспрессироваться в растениях на высоких уровнях и без модификации, низкий уровень экспрессии в трансгенных растениях может быть обусловлен нуклеотидными последовательностями микроорганизмов, имеющими ко доны, которые не являются предпочтительными для растений. Как известно из уровня техники, для живых организмов характерны определенные предпочтения в отношении частоты использования кодонов, и поэтому кодоны нуклеотидных последовательностей, описанных в данном изобретении, могут быть изменены в соответствии с характерными для растений предпочтениями, при этом с сохранением аминокислот, кодируемых ими. Кроме того, высокий уровень экспрессии в растениях, например растениях кукурузы, лучше всего достигается в случае кодирующих последовательностей, которые характеризуются по меньшей мере приблизительно 35% содержанием GC, или по меньшей мере приблизительно 45%, или по меньшей мере приблизительно 50% или по меньшей мере приблизительно 60%. Нуклеотидные последовательности микроорганизмов, которые характеризуются низким содержанием GC, могут экспрессироваться в растениях на недостаточном уровне в связи с наличием мотивов АТТТА, которые могут дестабилизировать транскрипты, и мотивов ААТААА, которые могут обуславливать ненадлежащее полиаденилирование. Хотя определенные последовательности генов могут надлежащим образом экспрессироваться как в видах однодольных, так и двудольных растений, последовательности можно модифицировать с учетом предпочтений в отношении кодонов и предпочтений в отношении содержания GC для однодольных растений или двудольных растений, поскольку было показано, что эти предпочтения отличаются (Murray et al. Nucl. Acids Res. 17:477-498 (1989)). Кроме того, нуклеотидные последовательности подвергают скринингу на наличие неправильных сайтов сплайсинга, которые могут вызывать усечение транскрипта. Все изменения, которые требуется выполнить в пределах нуклеотидных последовательностей, такие как описанные выше, выполняют с применением хорошо известных методик сайт-направленного мутагенеза, ПЦР и конструирования синтетических генов с помощью способов, описанных, например, в патентах США №№ 5625136; 5500365 и 6013523.
[00148] В некоторых вариантах осуществления настоящего изобретения предусмотрены синтетические гены, полученные согласно процедуре, раскрытой в патенте США №5625136, включенном в данный документ посредством ссылки. В этой процедуре применяют предпочтительные для маиса кодоны, т.е. один кодон, который чаще всего кодирует данную аминокислоту в маисе. Предпочтительный для маиса кодон, кодирующий конкретную аминокислоту, может быть определен, например, на основании известных последовательностей генов маиса. Например, данные о частоте использования кодонов у маиса для 28 генов из растений маиса можно найти в Murray et al., Nucleic Acids Research 17:477-498 (1989), раскрытие которого включено в данный документ посредством ссылки. Специально приведенные в качестве примера синтетические последовательности по настоящему изобретению, полученные с применением кодонов, оптимизированных для маиса, представлены любой из SEQ ID NO: 13-20. Подобным образом нуклеотидные последовательности могут быть оптимизированы для экспрессии в любом растении. Следует понимать, что вся нуклеотидная последовательность или любая ее часть могут быть оптимизированными или синтетическими. То есть полинуклеотид может содержать нуклеотидную последовательность, которая частично является нативной последовательностью и частично является синтетической оптимизированной последовательностью.
[00149] Для эффективной инициации трансляции может потребоваться модификация последовательностей, прилегающих к инициирующему метионину. Например, их можно модифицировать путем включения последовательностей, которые, как известно, являются эффективными в растениях. Joshi предложил подходящую консенсусную последовательность для растений (NAR 15:6643-6653 (1987)), а Clonetech предлагает дополнительную консенсусную последовательность, являющуюся инициатором трансляции (каталог 1993/1994, стр. 210). Эти консенсусные последовательности подходят для использования с нуклеотидными последовательностями по настоящему изобретению. Последовательности, которые включены в конструкции, содержащие нуклеотидные последовательности, до ATG и включая ATG (оставив при этом вторую аминокислоту немодифицированной) или, в качестве альтернативы, до GTC и включая GTC вслед за ATG (с возможностью изменения второй аминокислоты трансгена).
[00150] Последовательности, кодирующие новый белок cry по настоящему изобретению, либо в виде их нативной последовательности, либо в виде синтетических последовательностей, как описано выше, могут быть функционально связаны с целым рядом промоторов для экспрессии в растениях, включая конститутивные, индуцируемые, регулируемые во времени, регулируемые в процессе развития, химически регулируемые, тканепредпочтительные и тканеспецифические промоторы, для получения молекул рекомбинантных ДНК, то есть химерных генов. Выбор промотора будет различаться в зависимости от временных и пространственных требований для экспрессии, а также в зависимости от целевого вида. Таким образом, предпочтительной является экспрессия нуклеотидных последовательностей по настоящему изобретению в листьях, в цветоножках или стеблях, в колосьях, в соцветиях (например, колосках, метелках, початках и т.д.), в корнях и/или проростках. Во многих случаях, однако, требуется защита от более чем одного типа насекомого-вредителя, и, следовательно, желательна экспрессия в нескольких тканях. Хотя, как было показано, многие промоторы из двудольных растений функционируют у однодольных растений и наоборот, по возможности промоторы двудольных выбирают для экспрессии у двудольных растений, а промоторы однодольных выбирают для экспрессии у однодольных растений. Однако не существует каких-либо ограничений в отношении происхождения выбранных промоторов, достаточно того, что они являются функциональными в управлении экспрессией нуклеотидных последовательностей в требуемой клетке.
[00151] Примеры конститутивных промоторов, применимых в настоящем изобретении, включают 35S и 19S промоторы CaMV (Fraley et al., патент США №5352605, включенный в данный документ посредством ссылки). Кроме того, промотор получают из любого из нескольких генов актина, экспрессируемых в большинстве типов клеток. Кассеты экспрессии с промотором, описанные в McElroy et al. (Mol. Gen. Genet. 231: 150-160 (1991)) можно легко модифицировать для экспрессии гена нового токсина, и они являются особенно подходящими для применения у однодольных растений-хозяев. Еще один конститутивный промотор получают из гена убиквитина, который представляет собой еще один генный продукт, который, как известно, накапливается во многих типах клеток. Убиквитиновый промотор был клонирован из нескольких видов для применения в трансгенных растениях, например, подсолнечнике (Binet et al., 1991. Plant Science 79: 87-94), маисе (Christensen et al., 1989. Plant Molec. Biol. 12: 619-632) и арабидопсисе (Norris et al. 1993. Plant Molec. Biol. 21: 895-906). Убиквитиновый промотор маиса был разработан для трансгенных систем однодольных растений, и его последовательность и векторы, сконструированные для трансформации однодольных растений, раскрыты в патентной заявке ЕР 0342926. Убиквитиновый промотор подходит для экспрессии гена нового токсина в трансгенных растениях, в частности однодольных.
[00152] Тканеспецифические или тканепредпочтительные промоторы, применимые для экспрессии последовательностей, кодирующих новый белок cry по настоящему изобретению, в растениях, в частности маисе, представляют собой промоторы, которые управляют экспрессией в корне, паренхиме, листе или пыльце. Такие промоторы раскрыты в патенте США №5625136, включенном в данный документ посредством ссылки во всей своей полноте. Другие тканеспецифические промоторы, применимые в настоящем изобретении, включают промотор гена rubisco хлопчатника, раскрытый в патенте США №6040504; промотор гена сахарозосинтазы риса, раскрытый в патенте США №5604121; и промотор вируса желтой курчавости листьев цеструма, раскрытый в патенте США №7166770, все включены посредством ссылки во всей своей полноте. Химически индуцируемые промоторы, применимые для управления экспрессией гена нового токсина в растениях, раскрыты в патенте США №5614395, включенном в данный документ посредством ссылки во всей своей полноте.
[00153] Нуклеотидные последовательности по настоящему изобретению также могут экспрессироваться под контролем промоторов, которые регулируются химическим путем. Это обеспечивает возможность синтеза белков Cry по настоящему изобретению только в случае обработки культурных растений индуцирующими химическими веществами. Примеры такой технологии химической индукции экспрессии генов подробно описаны в публикации заявки ЕР 0332104 и патенте США №5614395. В одном варианте осуществления химически регулируемый промотор представляет собой промотор PR-1а табака.
[00154] Другая категория промоторов, применимых в настоящем изобретении, включает промотор, который индуцируется ранением. Были описаны многочисленные промоторы, которые экспрессируются в участках ранения, а также в участках инфицирования фитопатогеном. В идеальном случае такой промотор должен активироваться локально в участках инвазии насекомых и, таким образом, инсектицидные белки накапливаются исключительно в клетках, где необходим синтез инсектицидных белков для уничтожения нападающего насекомого-вредителя. Примеры промоторов этого типа включают таковые, описанные Stanford et al. Mol. Gen. Genet. 215:200-208 (1989), Xu et al. Plant Molec. Biol. 22:573-588 (1993), Logemann et al. Plant Cell 1:151-158 (1989), Rohrmeier & Lehle, Plant Molec. Biol. 22:783-792 (1993), Firek et al. Plant Molec. Biol. 22:129-142 (1993) и Warner et al. Plant J. 3:191-201 (1993).
[00155] Неограничивающие примеры промоторов, обуславливающих тканеспецифические паттерны экспрессии, применимые в настоящем изобретении, включают специфические для зеленой ткани, специфические для корня, специфические для стебля и/или специфические для цветка. Промоторы, подходящие для экспрессии в зеленой ткани, включают множество промоторов, которые осуществляют регуляцию генов, участвующих в фотосинтезе, и многие из них были клонированы как из однодольных растений, так и из двудольных растений. Одним из таких промоторов является промотор PEPC маиса из гена фосфоенолкарбоксилазы (Hudspeth & Grula, Plant Molec. Biol. 12:579-589 (1989)).Другим промотором специфической для корня экспрессии является промотор, описанный de Framond (FEBS 290:103-106 (1991) или в патенте США №5466785). Другой промотор, применимый в настоящем изобретении, представляет собой специфический для стебля промотор, описанный в патенте США №5625136, который в естественных условиях управляет экспрессией гена trpA маиса.
[00156] В дополнение к выбору подходящего промотора конструкциям для экспрессии инсектицидного токсина в растениях требуется соответствующий терминатор транскрипции, который будет функционально связан ниже гетерологичной нуклеотидной последовательности. Несколько таких терминаторов доступны и известны в данной области техники (например, tml из CaMV, Е9 из rbcS). В контексте настоящего изобретения можно применять любой доступный терминатор, о котором известно, что он функционирует в растениях.
[00157] В кассеты экспрессии, описанные в настоящем изобретении, можно вводить множество других последовательностей. Они предусматривают последовательности, которые, как показано, усиливают экспрессию, как, например, интронные последовательности (например, из Adh1 и bronze1) и вирусные лидерные последовательности (например, из TMV, MCMV и AMV).
[00158] Предпочтительным может быть нацеливание экспрессии нуклеотидных последовательностей по настоящему изобретению в различные клеточные локализации в растении. В некоторых случаях может быть желательной локализация в цитозоле, тогда как в других случаях предпочтительной может быть локализация в определенной субклеточной органелле. Для осуществления настоящего изобретения на практике можно применять любой механизм нацеливания генных продуктов, например в растениях, и, как известно, такие механизмы существуют в растениях, и последовательности, регулирующие функционирование таких механизмов, были описаны довольно подробно. Были охарактеризованы последовательности, которые обеспечивают нацеливание генных продуктов в другие компартменты клетки. Аминоконцевые последовательности могут обусловливать нацеливание представляющего интерес белка в любой компартмент клетки, такой как вакуоль, митохондрия, пероксисома, белковые тельца, эндоплазматический ретикулум, хлоропласт, крахмальное зерно, амилопласт, апопласт или клеточная стенка растения (например, Unger et. al. Plant Molec. Biol. 13: 411-418 (1989); Rogers et. al. (1985) Proc. Natl. Acad. Sci. USA 82: 6512-651; патент США №7102057; WO 2005/096704, все из которых включены в данный документ посредством ссылки. Необязательно, сигнальная последовательность может представлять собой N-концевую сигнальную последовательность из waxy, N-концевую сигнальную последовательность из гамма-зеина, домен, связывающий крахмал, С-концевой домен, связывающий крахмал, последовательность, нацеливающую в хлоропласт, которая обеспечивает доставку зрелого белка в хлоропласт (Comai et. al. (1988) J. Biol. Chem. 263: 15104-15109; van den Broeck, et. al. (1985) Nature 313: 358-363; патент США No. 5639949) или сигнальную последовательность секреции из клеток алейронового слоя (Koehler & Но, Plant Cell 2: 769-783 (1990)). Кроме того, аминоконцевые последовательности вместе с карбоксиконцевыми последовательностями обусловливают нацеливание генных продуктов в вакуоль (Shinshi et. al. (1990) Plant Molec. Biol. 14: 357-368). В одном варианте осуществления выбранная сигнальная последовательность включает известный сайт расщепления, и при конструировании слияния учитываются любые аминокислоты после сайта(ов) расщепления, необходимые для расщепления. В некоторых случаях это требование может быть выполнено путем добавления небольшого числа аминокислот между сайтом расщепления и ATG трансгена или, в качестве альтернативы, путем замещения некоторых аминокислот в пределах последовательности трансгена. Эти методики конструирования хорошо известны из уровня техники и одинаково применимы к любому клеточному компартменту.
[00159] Будет понятно, что описанные выше механизмы нацеливания в клетке можно использовать не только с сочетании когнатными для них промоторами, но также в сочетании с гетерологичными промоторами, так что специфическая задача нацеливания в клетке осуществляется под транскрипционным контролем промотора, характеризующегося паттерном экспрессии, отличный от такового для промотора, из которого получен нацеливающий сигнал.
Трансформация растений
[00160] Процедуры трансформации растений хорошо известны и общеприняты в данной области техники и описаны в литературе во всех отношениях. Неограничивающие примеры способов трансформации растений включают трансформацию с помощью доставки нуклеиновых кислот, опосредованной бактериями (например, с помощью Agrobacterium), доставки нуклеиновых кислот, опосредованной вирусами, доставки нуклеиновых кислот, опосредованной карбидом кремния или микроиглами с нуклеиновыми кислотами, доставки нуклеиновых кислот, опосредованной липосомами, микроинъекцию, бомбардировку микрочастицами, трансформацию, опосредованную фосфатом кальция, трансформацию, опосредованную циклодекстринами, электропорацию, трансформацию, опосредованную наночастицами, обработку ультразвуком, инфильтрацию, поглощение нуклеиновых кислот, опосредованное PEG, а также любой другой электрический, химический, физический (механический) и/или биологический механизм, который приводит к введению нуклеиновой кислоты в растительную клетку, включая любую их комбинацию. Общие руководства по разнообразным способам трансформации растений, известным в данной области техники, включают Miki et al. ("Procedures for Introducing Foreign DNA into Plants" in Methods in Plant Molecular Biology and Biotechnology, Glick, B.R. и Thompson, J.E., Eds. (CRC Press, Inc., Boca Raton, 1993), pages 67-88) и Rakowoczy-Trojanowska (Cell. Mol. Biol. Lett. 7:849-858 (2002)).
[00161] Для трансформации, опосредованной Agrobacterium, подходят бинарные векторы или векторы, несущие по меньшей мере одну граничную последовательность T-DNA, тогда как для прямого переноса генов (например, с помощью бомбардировки частицами и т.п.) подходит любой вектор, при этом можно применять линейную ДНК, содержащую только представляющую интерес конструкцию. В случае прямого переноса генов можно применять трансформацию при помощи одного вида ДНК или котрансформацию (Schocher et al., Biotechnology 4:1093-1096 (1986)). В случае как прямого переноса генов, так и переноса, опосредованного Agrobacterium, трансформацию обычно (но не обязательно) выполняют с селектируемым маркером, который может представлять собой средство для позитивного отбора (фосфоманнозоизомераза), которое обеспечивает устойчивость к антибиотику (канамицину, гигромицину или метотрексату) или гербициду (глифосату или глюфосинату). Однако выбор селектируемого маркера не является критически важным для настоящего изобретения.
[00162] Трансформация, опосредованная Agrobacterium, представляет собой способ, широко применяемый для трансформации растений, в частности двудольных растений, в связи с высокой эффективностью трансформации и в связи с широкой применимостью в отношении множества различных видов. Трансформация, опосредованная Agrobacterium, как правило, предполагает перенос бинарного вектора, несущего чужеродную ДНК, представляющую интерес, в пригодный штамм Agrobacterium, что может зависеть от набора vir-генов штамма-хозяина Agrobacterium, расположенного либо в корезидентной Ti-плазмиде, либо в хромосоме (Uknes et al. (1993) Plant Cell 5:159-169). Перенос рекомбинантного бинарного вектора в Agrobacterium можно выполнять с помощью процедуры трехродительского скрещивания с применением Escherichia coli, несущей рекомбинантный бинарный вектор, хелперного штамма E.coli, несущего плазмиду, которая способна мобилизовать рекомбинантный бинарный вектор в целевом штамме Agrobacterium. В качестве альтернативы, рекомбинантный бинарный вектор можно переносить в Agrobacterium путем трансформации нуклеиновой кислоты (Höfgen & Willmitzer (1988) Nucleic Acids Res. 16:9877).
[00163] Трансформация растения с помощью рекомбинантной Agrobacterium обычно включает совместное культивирование Agrobacterium с эксплантатами растения, и ее проводят в соответствии со способами, хорошо известными из уровня техники. Трансформированную ткань регенерируют на селективной среде, содержащей маркер устойчивости к антибиотикам или гербицидам между граничными последовательностями T-DNA бинарной плазмиды.
[00164] Как обсуждалось ранее, другой способ трансформации растений, частей растений и растительных клеток включает внедрение инертных или биологически активных частиц в растительные ткани и клетки. См, например, патенты США №№ 4945050; 5036006 и 5100792. В общем случае этот способ включает внедрение в растительные клетки инертных или биологически активных частиц в условиях, эффективных для проникновения через наружную поверхность клетки и возможности включения в ее внутреннюю часть. При использовании инертных частиц вектор можно вводить в клетку путем покрытия частиц вектором, содержащим представляющую интерес нуклеиновую кислоту. В качестве альтернативы, клетка или клетки могут быть окружены вектором так, чтобы вектор переносился в клетку вслед за частицей. Биологически активные частицы (например, высушенная дрожжевая клетка, высушенная бактерия или бактериофаг, каждая(каждый) из которых содержит одну или несколько нуклеиновых кислот, подлежащих введению) также можно внедрять в растительную ткань.
[00165] В другом варианте осуществления полинуклеотид по настоящему изобретению можно напрямую вводить в геном пластид путем трансформации. Основное преимущество трансформации пластид состоит в том, что пластиды обычно способны экспрессировать бактериальные гены без существенной модификации, при этом пластиды способны экспрессировать несколько открытых рамок считывания под контролем одного промотора. Технология трансформации пластид подробно описана в патентах США №№ 5451513, 5545817 и 5545818, в РСТ заявке № WO 95/16783 и в McBride et al. (1994) Proc. Nati. Acad. Sci. USA 91, 7301-7305. Основная методика трансформации хлоропластов включает введение участков клонированной пластидной ДНК, фланкирующих селектируемый маркер, вместе с представляющим интерес геном в подходящую целевую ткань, например, с применением биолистики или трансформации протопластов (например, трансформации, опосредованной хлоридом кальция или PEG). Фланкирующие участки размером 1-1,5 т.о., называемые нацеливающими последовательностями, содействуют гомологичной рекомбинации с геномом пластид и, таким образом, обеспечивают замещение или модификацию специфических участков пластома. Вначале можно применять точечные мутации в 16S рРНК и генах rps12 хлоропластов, придающие устойчивость к спектиномицину и/или стрептомицину, в качестве селектируемых маркеров для трансформации (Svab, Z., Hajdukiewicz, P., and Maliga, P. (1990) Proc. Natl. Acad. Sci. USA 87, 8526-8530; Staub, J.M., and Maliga, P. (1992) Plant Cell 4, 39-45). Наличие сайтов клонирования между этими маркерами позволяет создать вектор, нацеленный на пластиды, для введения чужеродных генов (Staub, J.М., and Maliga, P. (1993) EMBO J. 12, 601-606). Существенного повышения частоты трансформации можно достичь путем замещения рецессивных генов рРНК или r-белков, обеспечивающих устойчивость к антибиотикам, доминантным селектируемым маркером, бактериальным геном aadA, кодирующим фермент, обезвреживающий спектиномицин, аминогликозид-3'-аденилтрансферазу (Svab, Z., and Maliga, P. (1993) Proc. Natl. Acad. Sci. USA 90, 913-917). Ранее этот маркер успешно применяли для трансформации генома пластид зеленой водоросли Chlamydomonas reinhardtii с высокой частотой (Goldschmidt-Clermont, М. (1991) Nucl. Acids Res. 19:4083-4089). Другие селектируемые маркеры, применимые для трансформации пластид, известны из уровня техники и включены в объем настоящего изобретения. Как правило, для достижения состояния, при котором все пластиды являются одинаковыми, требуется около 15-20 циклов клеточного деления после трансформации. При экспрессии в пластидах, при которой гены вставлены с помощью гомологической рекомбинации во все несколько тысяч копий кольцевого пластидного генома, присутствующего в каждой растительной клетке, используют преимущество огромного числа копий по сравнению с генами, экспрессируемыми в ядре, что допускает уровни экспрессии, которые легко могут превышать 10% общего количества растворимых растительных белков. В одном варианте осуществления полинуклеотид по настоящему изобретению может быть вставлен в вектор, нацеленный на пластиды, и введен в геном пластид требуемого растения-хозяина путем трансформации. Таким образом, можно получить растения, гомопластические в отношении геномов пластид, содержащих нуклеотидную последовательность по настоящему изобретению, способные экспрессировать полинуклеотид на высоком уровне.
[00166] Способы отбора трансформированных трансгенных растений, растительных клеток и/или культур растительных тканей являются общепринятыми в данной области техники и могут использоваться в способах настоящего изобретения, предусмотренных в данном документе. Например, рекомбинантный вектор по настоящему изобретению также может включать кассету экспрессии, содержащую нуклеотидную последовательность селектируемого маркера, который можно применять для отбора трансформированного растения, части растения и/или растительной клетки. Применяемое в данном документе выражение "селектируемый маркер" означает нуклеотидную последовательность, которая при экспрессии придает отличительный фенотип растению, части растения и/или растительной клетке, экспрессирующим данный маркер, и, таким образом, позволяет отличать такие трансформированные растения, части растений и/или растительные клетки от тех, которые не имеют маркера. Такая нуклеотидная последовательность может кодировать либо селектируемый, либо подвергаемый скринингу маркер в зависимости от того, придает ли маркер признак, по которому можно провести отбор с помощью химических средств, например, с помощью селективного средства (например, антибиотика, гербицида и т.п.), или от того, является ли маркер просто признаком, который можно идентифицировать посредством наблюдения или тестирования, например, путем скрининга (например, признаком, определяемым в R-локусе). Разумеется, существует много примеров подходящих селектируемых маркеров, которые известны из уровня техники и могут применяться в кассетах экспрессии, описываемых в данном документе.
[00167] Примеры селектируемых маркеров включают без ограничения нуклеотидную последовательность, кодирующую neo или nptII, которые придают устойчивость к канамицину, G418 и т.п. (Potrykus et al. (1985) Mol. Gen. Genet. 199:183-188); нуклеотидную последовательность, кодирующую bar, которая придает устойчивость к фосфинотрицину; нуклеотидную последовательность, кодирующую измененную 5-енолпирувилшикимат-3-фосфатсинтазу (EPSP), которая придает устойчивость к глифосату (Hinchee et al. (1988) Biotech. 6:915-922); нуклеотидную последовательность, кодирующую нитрилазу, такую как bxn из Klebsiella ozaenae, которая придает устойчивость к бромоксинилу (Stalker et al. (1988) Science 242:419-423); нуклеотидную последовательность, кодирующую измененную ацетолактатсинтазу (ALS), которая придает устойчивость к имидазолинону, сульфонилмочевине или другим химическим веществам, ингибирующим ALS (европейская патентная заявка №154204); нуклеотидную последовательность, кодирующую дигидрофолатредуктазу, устойчивую к метотрексату (DHFR) (Thillet et al. (1988) J. Biol. Chem. 263:12500-12508); нуклеотидную последовательность, кодирующую далапон-дегалогеназу, которая придает устойчивость к далапону; нуклеотидную последовательность, кодирующую маннозо-6-фосфатизомеразу (также называемую фосфоманнозоизомеразой (PMI)), которая придает способность к превращению маннозы в ходе метаболизма (патенты США №№ 5767378 и 5994629); нуклеотидную последовательность, кодирующую измененную антранилатсинтазу, которая придает устойчивость к 5-метилтриптофану; и/или нуклеотидную последовательность, кодирующую hph, которая придает устойчивость к гигромицину. Специалист в данной области способен выбрать подходящий селектируемый маркер для применения в кассете экспрессии по настоящему изобретению.
[00168] Дополнительные селектируемые маркеры включают без ограничения нуклеотидную последовательность, кодирующую β-глюкуронидазу или uidA (GUS), который кодирует фермент, для которого известны различные хромогенные субстраты; нуклеотидную последовательность R-локуса, которая кодирует продукт, регулирующий продуцирование антоцианиновых пигментов (красного цвета) в растительных тканях (Dellaporta et al., "Molecular cloning of the maize R-nj allele by transposon-tagging with Ac," pp. 263-282, в Chromosome Structure and Function: Impact of New Concepts, 18th Stadler Genetics Symposium (Gustafson & Appels eds., Plenum Press 1988)); нуклеотидную последовательность, кодирующую β-лактамазу, фермент, для которого известны различные хромогенные субстраты (например, PADAC, хромогенный цефалоспорин) (Sutcliffe (1978) Proc. Natl. Acad. Sci. USA 75:3737-3741); нуклеотидную последовательность, кодирующую xylE, который кодирует катехолдиоксигеназу (Zukowsky et al. (1983) Proc. Natl. Acad. Sci. USA 80:1101-1105); нуклеотидную последовательность, кодирующую тирозиназу, фермент, способный окислять тирозин до DOPA и допахинона, который, в свою очередь, конденсируется с образованием меланина (Katz et al. (1983) J. Gen. Microbiol. 129:2703-2714); нуклеотидную последовательность, кодирующую β-галактозидазу, фермент, для которого существуют хромогенные субстраты; нуклеотидную последовательность, кодирующую люциферазу (lux), которая позволяет производить биолюминесцентную детекцию (Ow et al. (1986) Science 234:856-859); нуклеотидную последовательность, кодирующую экворин, который можно использовать в биолюминесцентной детекции, основанной на применении кальций-чувствительных белков (Prasher et al. (1985) Biochem. Biophys. Res. Comm. 126:1259-1268); или нуклеотидную последовательность, кодирующую зеленый флуоресцентный белок (Niedz et al. (1995) Plant Cell Reports 14:403-406). Специалист в данной области способен выбрать подходящий селектируемый маркер для применения в кассете экспрессии по настоящему изобретению.
[00169] Дополнительно, как хорошо известно из уровня техники, целые трансгенные растения можно регенерировать из трансформированных растительных клеток, культур растительных тканей и/или культивируемых протопластов с помощью любой из множества известных методик. Регенерация растений из растительных клеток, культур растительных тканей и/или культивируемых протопластов описана, например, в Evans et al. (Handbook of Plant Cell Cultures, Vol. 1, MacMilan Publishing Co. New York (1983)) и Vasil I.R. (ed.) (Cell Culture and Somatic Cell Genetics of Plants, Acad. Press, Orlando, Vol. I (1984), and Vol. II (1986)).
[00170] Кроме того, описанные выше свойства генов, обеспеченные с помощью методов генной инженерии в трансгенных семенах и растениях, частях растения и/или растительных клетках по настоящему изобретению, могут передаваться путем полового размножения или вегетативного роста и, следовательно, могут поддерживаться и передаваться по наследству растениям-потомкам. Как правило, при поддержании и передаче по наследству применяют известные сельскохозяйственные способы, разработанные для соответствия конкретным целям, таким как уборка урожая, посев или возделывание.
[00171] Следовательно, полинуклеотид может вводиться в растение, часть растения и/или растительную клетку посредством любого количества путей, хорошо известных в данной области техники, описанных выше. Следовательно, не придерживаются какого-либо конкретного способа введения одного или нескольких полинуклеотидов в растение, а наоборот, можно применять любой способ, обеспечивающий стабильную интеграцию одного или нескольких полинуклеотидов в геном растения. Если требуется ввести более одного полинуклеотида, то соответствующие полинуклеотиды можно собрать как части одной молекулы нуклеиновой кислоты или как отдельные молекулы нуклеиновых кислот и можно расположить в пределах одной и той же или различных молекул нуклеиновых кислот. Соответственно, введение полинуклеотидов в представляющую интерес клетку можно осуществлять в ходе одного события трансформации, в ходе отдельных событий трансформации или, например, в растения, в виде части протокола скрещивания.
[00172] Дополнительные варианты осуществления настоящего изобретения включают собранные продукты, полученные из трансгенных растений и/или их частей по настоящему изобретению, а также переработанный продукт, полученный из данных собранных продуктов. Собранный продукт может представлять собой целое растение или любую часть растения, как раскрыто в данном документе. Таким образом, в некоторых вариантах осуществления неограничивающие примеры собранного продукта включают семя, плод, цветок или его часть (например, пыльник, рыльце и т.п.), лист, стебель и т.п. В других вариантах осуществления переработанный продукт включает без ограничений муку тонкого помола, муку грубого помола, масло, крахмал, крупу и т.п., полученные из собранного семени или другой части растения по настоящему изобретению, при этом указанное семя или другая часть растения содержат молекулу нуклеиновой кислоты/полинуклеотид/нуклеотидную последовательность по настоящему изобретению.
[00173] В других вариантах осуществления настоящего изобретения предусмотрен экстракт из трансгенного семени и/или трансгенного растения по настоящему изобретению, при этом экстракт содержит молекулу нуклеиновой кислоты, полинуклеотид, нуклеотидную последовательность или токсичный белок по настоящему изобретению. Экстракты из растений или частей растений можно получить согласно процедурам, хорошо известным из уровня техники (см. de la Torre et al., Food Agric. Environ. 2(1):84-89 (2004); Guidet, Nucleic Acids Res. 22(9): 1772-1773 (1994); Lipton et al., Food Agric. Immun. 12:153-164 (2000)).
Инсектицидные композиции
[00174] В некоторых вариантах осуществления настоящего изобретения предусмотрена инсектицидная композиция, содержащая белок Cry по настоящему изобретению в приемлемом с точки зрения сельского хозяйства носителе. Применяемое в данном документе выражение "приемлемый с точки зрения сельского хозяйства носитель" может включать природный или синтетический, органический или неорганический материал, который объединен с активным компонентом для содействия его применения по отношению к растению или его части. Примеры приемлемых с точки зрения сельского хозяйства носителей включают без ограничения порошки, дусты, пеллеты, гранулы, аэрозоли, эмульсии, коллоиды и растворы. Приемлемые с точки зрения сельского хозяйства носители дополнительно включают без ограничения инертные компоненты, диспергирующие вещества, поверхностно-активные вещества, вспомогательные вещества, придающие липкость вещества, клейкие вещества, связующие вещества или их комбинации, которые можно применять в составах, используемых в сельском хозяйстве. Такие композиции можно применять любым способом, посредством которого пестицидные белки или другие средства для контроля вредителей приводят в контакт с вредителями. Соответственно, композиции можно наносить на поверхности растений или частей растений, в том числе на семена, листья, цветки, стебли, клубни, корни и т.п. Другим приемлемым с точки зрения сельского хозяйства носителем может быть трансгенное растение или часть растения.
[00175] В дополнительных вариантах осуществления инсектицидная композиция содержит трансгенную бактериальную клетку по настоящему изобретению, при этом бактериальная клетка содержит химерный ген по настоящему изобретению. Например, такую инсектицидную композицию можно получить путем высушивания, лиофилизации, гомогенизации, экстракции, фильтрации, центрифугирования, осаждения или концентрирования культуры клеток Bacillus thuringiensis, содержащих полинуклеотид по настоящему изобретению. В дополнительных вариантах осуществления композиция содержит от приблизительно 1% до приблизительно 99% по весу белка Cry по настоящему изобретению.
[00176] Белки Cry по настоящему изобретению можно применять в комбинации с другими средствами для контроля вредителей для увеличения спектра целевых вредителей или для предупреждения и/или управления устойчивостью насекомых. Следовательно, в некоторых вариантах осуществления настоящего изобретения предусмотрена композиция, обеспечивающая контроль одного или нескольких вредителей растений, при этом композиция содержит первый белок Cry по настоящему изобретению и второе средство для контроля вредителей, отличное от первого белка Cry. В других вариантах осуществления композиция представляет собой состав для местного нанесения на растение. В еще одних вариантах осуществления композиция представляет собой трансгенное растение. В дополнительных вариантах осуществления композиция представляет собой комбинацию, предусматривающую состав и трансгенное растение, на которое он наносится. В одном варианте осуществления состав содержит первый белок Cry по настоящему изобретению, если трансгенное растение содержит второе средство для контроля вредителей. В другом варианте осуществления состав содержит второе средство для контроля вредителей, если трансгенное растение содержит первый белок Cry по настоящему изобретению.
[00177] В некоторых вариантах осуществления второе средство для контроля вредителей может представлять собой средство, выбранное из группы, состоящей из химического пестицида, инсектицидного белка Bacillus thuringiensis (Bt), инсектицидного белка Xenorhabdus, инсектицидного белка Photorhabdus, инсектицидного белка Brevibacillus laterosporus, инсектицидного белка Bacillus sphaericus, ингибиторов протеаз (как сериновых, так и цистеиновых типов), лектинов, альфа-амилазы, пероксидазы и холестериноксидазы.
[00178] В других вариантах осуществления второе средство для контроля вредителей представляет собой химический пестицид, выбранный из группы, состоящей из пиретроидов, карбаматов, неоникотиноидов, блокаторов натриевых каналов нейронов, инсектицидных макроциклических лактонов, антагонистов гамма-аминомасляной кислоты (GABA), инсектицидных мочевин и миметиков ювенильного гормона. В другом варианте осуществления химический пестицид выбран из группы, состоящей из абамектина, ацефата, ацетамиприда, амидофлумета (S-1955), авермектина, азадирахтина, азинфос-метила, бифентрина, бинфеназата, бупрофезина, карбофурана, хлорфенапира, хлорфлуазурона, хлорпирифоса, хлорпирифос-метила, хромафенозида, клотианидина, цифлутрина, бета-цифлутрина, цигалотрина, лямбда-цигалотрина, циперметрина, циромазина, дельтаметрина, диафентиурона, диазинона, дифлубензурона, диметоата, диофенолана, эмамектина, эндосульфана, эсфенвалерата, этипрола, фенотикарба, феноксикарба, фенпропатрина, фенпроксимата, фенвалерата, фипронила, флоникамида, флуцитрината, тау-флювалината, флуфенерима (UR-50701), флуфеноксурона, фонофоса, галофенозида, гексафлумурона, имидаклоприда, индоксакарба, изофенфоса, луфенурона, малатиона, метальдегида, метамидофоса, метидатиона, метомила, метопрена, метоксихлора, монокротофоса, метоксифенозида, нитиазина, новалурона, новифлумурона (XDE-007), оксамила, паратиона, паратион-метила, перметрина, фората, фозалона, фосмета, фосфамидона, пиримикарба, профенофоса, пиметрозина, пиридалила, пирипроксифена, ротенона, спиносада, спиромезифена (BSN 2060), сульпрофоса, тебуфенозида, тефлубензурона, тефлутрина, тербуфоса, тетрахлорвинфоса, тиаклоприда, тиаметоксама, тиодикарба, тиосултап-натрия, тралометрина, трихлорфона и трифлумурона, алдикарба, оксамила, фенамифоса, амитраза, хинометионата, хлоробензилата, цигексатина, дикофола, диенохлора, этоксазола, феназаквина, оксида фенбутатина, фенпропатрина, фенпироксимата, гекситиазокса, пропаргита, пиридабена и тебуфенпирада. В другом варианте осуществления химический пестицид выбран из группы, состоящей из циперметрина, цигалотрина, цифлутрина и бета-цифлутрина, эсфенвалерата, фенвалерата, тралометрина, фенотикарба, метомила, оксамила, тиодикарба, клотианидина, имидаклоприда, тиаклоприда, индоксакарба, спиносада, абамектина, авермектина, эмамектина, эндосульфана, этипрола, фипронила, флуфеноксурона, трифлумурона, диофенолана, пирипроксифена, пиметрозина и амитраза.
[00179] В дополнительных вариантах осуществления второе средство для контроля вредителей может представлять собой один или несколько из любого числа инсектицидных белков Bacillus thuringiensis, в том числе без ограничения белок Cry, вегетативный инсектицидный белок (VIP) и инсектицидные химерные варианты любого из перечисленных выше инсектицидных белков. В других вариантах осуществления второе средство для контроля вредителей представляет собой белок Cry, выбранный из группы, состоящей из Cry1Aa, Cry1Ab, Cry1Ac, Cry1Ad, Cry1Ae, Cry1Af, Cry1Ag, Cry1Ah, Cry1Ai, Cry1Aj, Cry1Ba, Cry1Bb, Cry1Bc, Cry1Bd, Cry1Be, Cry1Bf, Cry1Bg, Cry1Bh, Cry1Bi, Cry1Ca, Cry1Cb, Cry1Da, Cry1Db, Cry1Dc, Cry1Dd, Cry1Ea, Cry1Eb, Cry1Fa, Cry1Fb, Cry1Ga, Cry1Gb, Cry1Gc, Cry1Ha, Cry1Hb, Cry1Hc, Cry1Ia, Cry1Ib, Cry1Ic, Cry1Id, Cry1Ie, Cry1If, Cry1Ig, Cry1Ja, Cry1Jb, Cry1Jc, Cry1Jd, Cry1Ka, Cry1La, Cry1Ma, Cry1Na, Cry1Nb, Cry2Aa, Cry2Ab, Cry2Ac, Cry2Ad, Cry2Ae, Cry2Af, Cry2Ag, Cry2Ah, Cry2Ai, Cry2Aj, Cry2Ak,Cry2Al, Cry2Ba, Cry3Aa, Cry3Ba, Cry3Bb, Cry3Ca, Cry4Aa, Cry4Ba, Cry4Ca, Cry4Cb, Cry4Cc, Cry5Aa, Cry5Ab, Cry5Ac, Cry5Ad, Cry5Ba, Cry5Ca, Cry5Da, Cry5Ea, Cry6Aa, Cry6Ba, Cry7Aa, Cry7Ab, Cry7Ac, Cry7Ba, Cry7Bb, Cry7Ca, Cry7Cb, Cry7Da, Cry7Ea, Cry7Fa, Cry7Fb, Cry7Ga, Cry7Gb, Cry7Gc, Cry7Gd, Cry7Ha, Cry7Ia, Cry7Ja, Cry7Ka, Cry7Kb, Cry7La, Cry8Aa, Cry8Ab, Cry8Ac, Cry8Ad, Cry8Ba, Cry8Bb, Cry8Bc, Cry8Ca, Cry8Da, Cry8Db, Cry8Ea, Cry8Fa, Cry8Ga, Cry8Ha, Cry8Ia, Cry8Ib, Cry8Ja, Cry8Ka, Cry8Kb, Cry8La, Cry8Ma, Cry8Na, Cry8Pa, Cry8Qa, Cry8Ra, Cry8Sa, Cry8Ta, Cry9Aa, Cry9Ba, Cry9Bb, Cry9Ca, Cry9Da, Cry9Db, Cry9Dc, Cry9Ea, Cry9Eb, Cry9Ec, Cry9Ed, Cry9Ee, Cry9Fa, Cry9Ga, Cry10Aa, Cry11Aa, Cry11Ba, Cry11Bb, Cry12Aa, Cry13Aa, Cry14Aa, Cry14Ab, Cry15Aa, Cry16Aa, Cry17Aa, Cry18Aa, Cry18Ba, Cry18Ca, Cry19Aa, Cry19Ba, Cry19Ca, Cry20Aa, Cry20Ba, Cry21Aa, Cry21Ba, Cry21Ca, Cry21Da, Cry21Ea, Cry21Fa, Cry21Ga, Cry21Ha, Cry22Aa, Cry22Ab, Cry22Ba, Cry22Bb, Cry23Aa, Cry24Aa, Cry24Ba, Cry24Ca, Cry25Aa, Cry26Aa, Cry27Aa, Cry28Aa, Cry29Aa, Cry29Ba, Cry30Aa, Cry30Ba, Cry30Ca, Cry30Da, Cry30Db, Cry30Ea, Cry30Fa, Cry30Ga, Cry31Aa, Cry31Ab, Cry31Ac, Cry31Ad, Cry32Aa, Cry32Ab, Cry32Ba, Cry32Ca, Cry32Cb, Cry32Da, Cry32Ea, Cry32Eb, Cry32Fa, Cry32Ga, Cry32Ha, Cry32Hb, Cry32Ia, Cry32Ja, Cry32Ka, Cry32La, Cry32Ma, Cry32Mb, Cry32Na, Cry32Oa, Cry32Pa, Cry32Qa, Cry32Ra, Cry32Sa, Cry32Ta, Cry32Ua, Cry33Aa, Cry34Aa, Cry34Ab, Cry34Ac, Cry34Ba, Cry35Aa, Cry35Ab, Cry35Ac, Cry35Ba, Cry36Aa, Cry37Aa, Cry38Aa, Cry39Aa, Cry40Aa, Cry40Ba, Cry40Ca, Cry40Da, Cry41Aa, Cry41Ab, Cry41Ba, Cry42Aa, Cry43Aa, Cry43Ba, Cry43Ca, Cry43Cb, Cry43Cc, Cry44Aa, Cry45Aa, Cry46Aa Cry46Ab, Cry47Aa, Cry48Aa, Cry48Ab, Cry49Aa, Cry49Ab, Cry50Aa, Cry50Ba, Cry51Aa, Cry52Aa, Cry52Ba, Cry53Aa, Cry53Ab, Cry54Aa, Cry54Ab, Cry54Ba, Cry55Aa, Cry56Aa, Cry57Aa, Cry57Ab, Cry58Aa, Cry59Aa, Cry59Ba, Cry60Aa, Cry60Ba, Cry61Aa, Cry62Aa, Cry63Aa, Cry64Aa, Cry65Aa, Cry66Aa, Cry67Aa, Cry68Aa, Cry69Aa, Cry69Ab, Cry70Aa, Cry70Ba, Cry70Bb, Cry71Aa, Cry72Aa и Cry 73Аа.
[00180] В дополнительных вариантах осуществления второе средство для контроля вредителей представляет собой вегетативный инсектицидный белок Vip3, выбранный из группы, состоящей из Vip3Aa1, Vip3Aa2, Vip3Aa3, Vip3Aa4, Vip3Aa5, Vip3Aa6, Vip3Aa7, Vip3Aa8, Vip3Aa9, Vip3Aa10, Vip3Aa11, Vip3Aa12, Vip3Aa13, Vip3Aa14, Vip3Aa15, Vip3Aa16, Vip3Aa17, Vip3Aa18, Vip3Aa19, Vip3Aa20, Vip3Aa21, Vip3Aa22, Vip3Aa2, Vip3Aa24, Vip3Aa25, Vip3Aa26, Vip3Aa27, Vip3Aa28, Vip3Aa29, Vip3Aa30, Vip3Aa31, Vip3Aa32, Vip3Aa33, Vip3Aa34, Vip3Aa35, Vip3Aa36, Vip3Aa37, Vip3Aa38, Vip3Aa39, Vip3Aa40, Vip3Aa41, Vip3Aa42, Vip3Aa43, Vip3Aa44, Vip3Ab1, Vip3Ab2, Vip3Ac1, Vip3Ad1, Vip3Ad2, Vip3Ae1, Vip3Af1, Vip3Af2, Vip3Af3, Vip3Ag1,Vip3Ag2,Vip3Ag3 HM117633, Vip3Ag4, Vip3Ag5, Vip3Ah1, Vip3Ba1, Vip3Ba2, Vip3Bb1, Vip3Bb2 и Vip3Bb3.
[00181] В еще одних вариантах осуществления первый белок Cry по настоящему изобретению и второе средство для контроля вредителей коэкспрессируются в трансгенном растении. Такой коэкспрессии нескольких пестицидных компонентов в одном и том же трансгенном растении можно достигнуть путем получения растения, содержащего и экспрессирующего все необходимые гены, с помощью методов генной инженерии. В качестве альтернативы растение, родитель 1, может быть получено с помощью методов генной инженерии для экспрессии белка Cry по настоящему изобретению. Второе растение, родитель 2, может быть получено с помощью методов генной инженерии для экспрессии второго средства для контроля вредителей. Путем скрещивания родителя 1 с родителем 2 получают растений-потомков, которые экспрессируют все гены, введенные в родителей 1 и 2.
[00182] В дополнительных вариантах осуществления предусмотрен способ
получения белка, токсичного по меньшей мере для кукурузного мотылька (Ostrinia nubilalis), при этом способ включает культивирование трансгенной клетки-хозяина, отличной от клетки человека, которая содержит полинуклеотид, или химерный ген, или молекулу нуклеиновой кислоты, или рекомбинантный вектор по настоящему изобретению, в условиях, при которых хозяин продуцирует белок, токсичный по меньшей мере для кукурузного мотылька, (Ostrinia nubilalis). В некоторых вариантах осуществления трансгенная клетка-хозяин, отличная от клетки человека, представляет собой растительную клетку. В одном варианте осуществления растительная клетка представляет собой клетку маиса. В других вариантах осуществления условия, при которых выращивают растительную клетку или клетку маиса, включают естественный солнечный свет. В других вариантах осуществления трансгенная клетка-хозяин, отличная от клетки человека, представляет собой бактериальную клетку. В еще одних вариантах осуществления трансгенная клетка-хозяин, отличная от клетки человека, представляет собой дрожжевую клетку. [00183] В других вариантах осуществления продуцируемый белок обладает инсектицидной активностью в отношении по меньшей мере одного дополнительного насекомого, при этом дополнительное насекомое выбрано из группы, состоящей из совки-ипсилон (Agrotis ipsilon), совки травяной (Spodoptera frugiperda), американской кукурузной совки (Helicoverpa zea), огневки тростниковой (Diatraea saccharalis), гусеницы совки бархатных бобов (Anticarsia gemmatalis), соевой совки (Chrysodeixis includes), огневки кукурузной юго-западной (Diatraea grandiosella), западной бобовой совки (Richia albicosta), табачной совки (Heliothis virescens), восточного кукурузного мотылька (Ostrinia furnacalis), хлопковой совки (Helicoverpa armigera), огневки желтой рисовой (Chilo suppressalis), розовой стеблевой совки (Sesamia calamistis) или огневки рисовой (Cnaphalocrocis medinalis) и любой их комбинации.
[00184] В других вариантах осуществления химерный ген содержит любую из SEQ ID NO: 1-5. В еще одних вариантах осуществления продуцируемый белок содержит аминокислотную последовательность под любой из SEQ ID NO: 16-20.
[00185] В некоторых вариантах осуществления химерный ген содержит нуклеотидную последовательность, кодон-оптимизированную для экспрессии в растении. В других вариантах осуществления химерный ген содержит любую из SEQ ID NO: 6-15. В дополнительных вариантах осуществления продуцируемый белок содержит аминокислотную последовательность под любой из SEQ ID NO: 16-25.
[00186] В дополнительных вариантах осуществления настоящего изобретения предусмотрен способ получения устойчивого к вредителям (например, устойчивого к насекомым) трансгенного растения, включающий введение в растение полинуклеотида, химерного гена, рекомбинантного вектора, кассеты экспрессии или молекулы нуклеиновой кислоты по настоящему изобретению, содержащих нуклеотидную последовательность, которая кодирует белок Cry по настоящему изобретению, где нуклеотидная последовательность экспрессируется в растении, за счет чего растению придается устойчивость по меньшей мере к кукурузному мотыльку, и получение устойчивого к вредителям (например, устойчивого к насекомым) трансгенного растения. В некоторых вариантах осуществления устойчивое к вредителям трансгенное растение является устойчивым к по меньшей мере совке-ипсилон (Agrotis ipsilon) в сравнении с контрольным растением, у которого отсутствует полинуклеотид, химерный ген, рекомбинантный вектор, кассета экспрессии или молекула нуклеиновой кислоты по настоящему изобретению. В некоторых вариантах осуществления введение достигается путем трансформации растения. В других вариантах осуществления введение достигается путем скрещивания первого растения, содержащего химерный ген, рекомбинантный вектор, кассету экспрессии или молекулу нуклеиновой кислоты по настоящему изобретению, с отличающимся вторым растением.
[00187] В некоторых вариантах осуществления трансгенное растение по настоящему изобретению, устойчивое по меньшей мере к кукурузному мотыльку (Ostrinia nubilalis), дополнительно является устойчивым к одному дополнительному насекомому, где дополнительное насекомое включает без ограничения совку-ипсилон (Agrotis ipsilon), совку травяную (Spodoptera frugiperda), американскую кукурузную совку (Helicoverpa zea), огневку тростниковую (Diatraea saccharalis), гусеницу совки бархатных бобов (Anticarsia gemmatalis), соевую совку (Chrysodeixis includes), огневку кукурузную юго-западную (Diatraea grandiosella), западную бобовую совку (Richia albicosta), табачную совку (Heliothis virescens), восточного кукурузного мотылька (Ostrinia furnacalis), хлопковую совку (Helicoverpa armigera), огневку желтую рисовую (Chilo suppressalis), розовую стеблевую совку (Sesamia calamistis) или огневку рисовую (Cnaphalocrocis medinalis) и любую их комбинацию.
[00188] В дополнительных вариантах осуществления предусмотрен способ контроля по меньшей мере насекомых, представляющих собой совку-ипсилон (Agrotis ipsilon), при этом способ включает доставку в насекомых эффективного количества белка Cry по настоящему изобретению. Для эффективного воздействия белок Cry вначале попадает в насекомое пероральным путем. Однако белок Cry может доставляться в насекомое с помощью многих известных способов. Способы доставки белка в насекомое пероральным путем включают без ограничения обеспечение белка (1) в трансгенном растении, при этом насекомое съедает (поглощает) одну или несколько частей трансгенного растения, поглощая тем самым полипептид, экспрессируемый в трансгенном растении; (2) в составленной белковой композиции(ях), которую можно наносить, например, на питательную среду насекомых или включать в ее состав; (3) в белковой композиции(ях), которую можно наносить на поверхность, например, путем опрыскивания поверхности части растения, и которая затем заглатывается насекомым в силу того, что насекомое съедает одну или несколько подвергнутых опрыскиванию частей растения; (4) в матрице приманки; (5) путем инъекции в насекомое; или (6) с помощью любой другой известной из уровня техники системы доставки белков. Таким образом, для доставки токсичных белков Cry по настоящему изобретению можно применять любой способ пероральной доставки в насекомое. В некоторых конкретных вариантах осуществления белок Cry по настоящему изобретению доставляют в насекомое пероральным путем, при этом насекомое поедает одну или несколько частей трансгенного растения.
[00189] В других вариантах осуществления белок Cry по настоящему изобретению доставляют в насекомое пероральным путем, при этом насекомое поедает одну или несколько частей растения, подвергнутых опрыскиванию композицией, содержащей белки Cry по настоящему изобретению. Доставку композиций по настоящему изобретению на поверхность растения можно осуществлять с помощью любого способа нанесения соединений, композиций, составов и т.п. на поверхности растений, известного специалистам в данной области техники. Некоторые неограничивающие примеры доставки на растение или его часть или приведения в контакт с ними включают опрыскивание, опыливание, посыпание, распыление, орошение туманом, мелкодисперсное разбрызгивание, разбрасывание, пропитывание, впрыскивание в почву, введение в почву, смачивание (например, обработку корней, почвы), погружение, полив, нанесение покрытия, впитывание в листья или стебли, внесение в междурядья или обработку семян и т.п. и их комбинации. Эти и другие процедуры приведения растения или его части в контакт с соединением(ями), композицией(ями) или составом(ами) хорошо известны специалистам в данной области техники.
[00190] В некоторых вариантах осуществления настоящее изобретение охватывает способ предоставления фермеру средств для контроля чешуекрылых насекомых-вредителей, при этом способ включает поставку и продажу фермеру растительного материала, такого как семя, при этом растительный материал содержит полинуклеотид, химерный ген, кассету экспрессии или рекомбинантный вектор, способные экспрессировать белок Cry по настоящему изобретению, как описано выше.
[00191] Варианты осуществления настоящего изобретения можно лучше понять со ссылкой на следующие примеры. Предполагается, что предыдущее и последующее описание вариантов осуществления настоящего изобретения и различные варианты осуществления не ограничивают формулу изобретения, а скорее иллюстрируют ее. Таким образом, будет понятно, что формула изобретения не ограничивается конкретными подробностями данных примеров. Специалистам в данной области будет понятно, что другие варианты осуществления настоящего изобретения могут быть осуществлены на практике без отклонения от сущности и объема данного раскрытия, объем которого определяется прилагаемой формулой изобретения.
ПРИМЕРЫ
Пример 1. Идентификация активных штаммов Bt
[00192] Изоляты Bacillus thuringiensis культивировали из спор, присутствующих в текущих коллекциях, и поддерживали на чашках с и Т3 + агаром с добавлением пенициллина. Каждый изолят выращивали в аэробных условиях в 24-луночных планшетах с глубокими лунками в течение приблизительно 10 дней при 28°С до споруляции, которую подтверждали с помощью окрашивания раствором кумасси синего/уксусной кислоты и визуализации с помощью микроскопа. После споруляции как растворимые, так и нерастворимые фракции тестировали, чтобы определить активность в отношении представляющих интерес видов чешуекрылых. Фракции тестировали в биологическом анализе контаминации поверхности, при котором фракциями покрывали искусственную питательную среду для культивирования множества видов. Каждый изолят подвергали скринингу в отношении по меньшей мере четырех видов чешуекрылых, в том числе Helicoverpa zea (американская кукурузная совка), Agrotis ipsilon (совка-ипсилон), Ostrinia nubilalis (кукурузный мотылек) и Spodoptera frugiperda (совка травяная), при размере выборки 12 новорожденных личинок. Продолжительность каждого анализа составляла приблизительно 7 дней при комнатной температуре; планшеты оценивали в отношении смертности, а также ингибирования роста личинок. Наблюдаемое повышение смертности на 30% по сравнению с отрицательным контролем считалось показателем активности. На основе результатов первичного тестирования на насекомых для дальнейшего анализа отобрали штаммы С0588, С0633, С0680 и М0262.
Пример 2: Выделение и секвенирование генов Bt
[00193] Конструирование фосмидной геномной библиотеки: Для некоторых штаммов Bt, идентифицированных в примере 1, гены, кодирующие предположительно активные белки, выделяли с применением способа фосмидной библиотеки, описанного в Park et al. (FEMS Microbiol. Lett. 284:28-34 (2008). Фосмидную библиотеку конструировали с применением набора для получения фосмидных библиотек CopyControl™ (Epicentre, Мэдисон, Висконсин) согласно протоколу производителя. Вкратце, очищенную ДНК из каждого штамма Bt (примерно 0,5 мкг) обрабатывали ферментами для репарации концов с образованием "тупых" концов и затем лигировали в фосмидный вектор pCC1FOS (Epicentre). После упаковки in vitro в фаги лямбда и инфицирования Escherichia coli (Е. coli) EPI1300-T1® бактериальные клетки высевали на среду Лурия-Бертани (LB), содержащую 12,5 мкг/мл хлорамфеникола. До отбора колоний планшеты инкубировали при приблизительно 37°С в течение 24 ч. Трансфицированные колонии Е. coli переносили в 96-луночные планшеты, содержащие 150 мкл LB-среды, содержащей хлорамфеникол, и инкубировали при 37°С в течение 24 ч.
[00194] Скрининг колоний с помощью гибридизации: Фосмидную библиотеку высевали при плотности 300 КОЕ на 100×15 мм чашку с L-агаром и 15 мкг/мл хлорамфеникола. В общей сложности высевали 3000 бактерий с фосмидами. Гибридизации на фильтре осуществляли с применением фильтров в виде кружков Immobilon-Ny+ размером 87 мм (EMD Millipore, Биллерика, Массачусетс). Перенос колоний выполняли следующим образом: фильтры помещали на чашки приблизительно на 5 мин., затем с помощью пинцета фильтры снимали с поверхности агара и помещали стороной с колониями кверху на фильтровальную бумагу Ватмана, пропитанную 0,5 М NaOH, на 5 мин. Затем фильтры с колониями помещали на фильтровальную бумагу Ватмана, пропитанную 2Х SSC, на 5 мин. ДНК иммобилизировали на мембране с применением UV Stratalinker®, установленного на 2000 × 100 мкДж (Stratagene, Inc., Ла-Хойя, Калифорния). Затем фильтры сушили на воздухе на фильтровальной бумаге Ватмана. Фильтры подвергали предварительной гибридизации и гибридизации в 250 мМ NaPO4, рН 7,0, 7% SDS, 1% BSA при 65°С согласно описанию поставщика. Гибридизационные фильтры промывали в 2Х SSC, 0,5% SDS в течение 30 мин. при 65°С, затем в 0,2Х SSC, 0,2% SDS в течение 30 мин. при 65°С. Фильтры экспонировали на рентгеновскую пленку (Kodak® BIOMAX® XAR, Fisher Scientific, Питтсбург, Пенсильвания) в течение ночи с применением усиливающих экранов при -80°С. Положительные колонии переносили на L-агар с 15 мкг/мл хлорамфеникола.
[00195] Гибридизационные зонды: Конструировали ПЦР-праймеры для амплификации фрагмента cry9B-подобного гена размером 720 п.о. из геномной ДНК штамма Bt, обозначенного как С0633. Пара праймеров включала прямой праймер, обозначенный OAR2613a, имеющий последовательность AAACATGAACCGAAATAATCAAAATG (SEQ ID NO: 26), и обратный праймер, обозначенный OAR2615a, имеющий последовательность ATCCGTCCCTTGTGCGTGTAAA (SEQ ID NO: 27). ПЦР-реакцию проводили при следующих условиях проведения циклов: [94°С, 5 мин.], 12х [94°С, 30 с, от 57°С до 51°С, снижение на 0,5°С в каждом цикле, 30 с, 72°С, 2,5 мин.] и 35х[94°С, 30 с, 52°С, 30 с, 72°С, 2,5 мин.]. Реакционная смесь содержала 1X буфер One Taq® (New England Biolabs, Беверли, Массачусетс), 200 мкМ dNTP, 80 нг ДНК, 2,5 ед. ДНК-полимеразы One Taq®, по 50 нг каждого праймера и стерильную дистиллированную воду, доводящую общий объем реакционной смеси до 50 мкл.
[00196] Полученный ампликон разделяли на 1% агарозном геле с ТАЕ, содержащем бромистый этидий. Ампликон визуализировали под УФ-светом и вырезали из геля. ДНК выделяли с применением набора для экстракции из геля согласно описанию поставщика (Qiagen, Валенсия, Калифорния). Зонды метили с помощью EasyTide (ά-32P) dCTP, 3000 Ки/ммоль (Perkin Elmer, Уолтем, Массачусетс) с применением системы мечения произвольных праймеров Rediprime II (GE Healthcare, Питтсбург, Пенсильвания). Невстроившиеся нуклеотиды удаляли с применением хроматографических колонок Micro Bio-Spin 30 (Biorad, Геркулес, Калифорния). Зонды нагревали при 95°С в течение 5 мин. перед добавлением в раствор для гибридизации.
[00197] Секвенирование генов Bt: Препараты ДНК для 2-4 независимых клонов готовили в соответствии с инструкциями производителя (Qiagen). Реакции секвенирования с праймерами, сконструированными к двум нитям прогнозируемой представляющей интерес нуклеотидной последовательности, осуществляли с применением набора BigDye™ Terminator (Applied Biosystems, Фостер Сити, Калифорния) в соответствии с инструкциями производителя. Продукты реакции подвергали электрофоретическому разделению на приборах для секвенирования ABI373 или ABI377. Все данные секвенирования анализировали с применением пакета программного обеспечения Phred/Phrap/Consed (Вашингтонский университет) с частотой ошибок, равной или меньше 10-4, на уровне консенсусной последовательности. Последовательность собирали с помощью программы Sequencher™ (версия 4.7, Gene Codes Corp., Энн-Арбор, Мичиган). Каждый ген секвенировали с 4Х перекрыванием.
Пример 3. Клонирование и синтез генов Bt
[00198] Конструировали пары Cry9-специфических праймеров для облегчения идентификации и клонирования генов типа cry9. Пары праймеров конструировали для гибридизации с 5'-концом гена типа cry9 с добавлением сайта рестрикции для PmeI и с 3'-концом с добавлением сайта рестрикции для AscI. Пара праймеров, применяемая для амплификации 5'-конца, включала прямой праймер, имеющий последовательность GTTTAAACATGAATCGAAATAATCAAAATG (SEQ ID NO: 28), и обратный праймер, имеющий последовательность GGCGCGCCCTACTCTTGTGTTTCAATAAA (SEQ ID NO: 29). Пара праймеров, применяемая для амплификации 3'-конца, включала прямой праймер, имеющий последовательность GTTTAAACATGAATCAAAATAAACACGGA (SEQ ID NO: 30), и обратный праймер, имеющий последовательность GGCGCGCCTTACTGTTGGGTTTCCATGAACT (SEQ ID NO: 31). Вставленные сайты рестрикции подчеркнуты в соответствующих праймерах. ПЦР-реакции осуществляли с применением следующих условий проведения циклов: [94°С, 5 мин.] и 30х [94°С, 30 с, 45°С, 30 с, 72°С, 3,5 мин.]. Реакционная смесь содержала 1X буфер OneTaq, 200 мкМ dNTP, 80 нг ДНК, 2,5 ед. ДНК-полимеразы One Taq (New England Biolabs), по 50 нг каждого праймера и стерильную дистиллированную воду, доводящую общий объем реакционной смеси до 50 мкл.
[00199] Полученный ампликон клонировали в вектор ТОРО pCR 4.0 согласно описанию поставщика (Life Technologies). Выделенную плазмидную ДНК расщепляли с применением PmeI и AscI согласно описанию поставщика (New England Biolabs).
[00200] Фрагмент PmeI/AscI клонировали в челночный вектор, обозначенный pCIB5634' сконструированный для экспрессии как в Е. coli,, так и в B. thuringiensis. Вектор pCIB5634' расщепляли с применением PmeI и AscI. Расщепленный вектор и фрагмент гена очищали путем прогона на 1% агарозном геле на основе буфера, содержащего трис-ацетат-EDTA. Фрагменты вырезали из геля и очищали с применением набора для экстракции из геля от QIAGEN согласно описанию поставщика. Фрагменты лигировали вместе с применением набора для лигирования от New England Biolabs согласно описанию поставщика. Продукты реакции лигирования трансформировали в клетки TOP10 (Life Technologies) согласно описанию поставщика и высевали их на L-агар, содержащий 100 мг/мл ампициллина. Плазмидную ДНК выделяли из отдельной колонии и идентифицированный клон снова секвенировали с 2Х перекрыванием с целью подтверждения правильной последовательности.
[00201] Некоторые гены Bt, которые были отобраны для рекомбинантной продукции, но не были напрямую клонированы из геномной ДНК, были переданы сторонним подрядчикам для синтеза полного гена. Эти синтезированные гены Bt субклонировали в описанные выше челночные векторы для последующей экспрессии и дальнейшего тестирования биологической активности.
Пример 4. Сборка и анализ генома
[00202] Некоторые гены Bt по настоящему изобретению идентифицировали с применением подхода на основе секвенирования полного генома. Вкратце, ДНК Bacillus разрезали с помощью ультразвукового прибора S2 от Covaris (Covaris, Inc., Вобурн, Массачусетс) с применением программы DNA_400bp с такими установками: рабочий режим: 10%; интенсивность: 4; циклы/импульс: 200. ДНК обрабатывали с помощью модуля для репарации концов/добавления dA-хвоста NEBNext® Ultra™ (New England Biolabs, Inc. Ипсвич, Массачусетс). Индексные адаптеры 1-57 от Biooscience (1-27 Бразилия, 28-57 США, Великобритания и Швейцария) лигировали с применением NEB Quick Ligation™ согласно описанию поставщика (New England Biolabs, Inc. Ипсвич, Массачусетс). Продукты лигирования очищали с применением гранул Agencourt AMPure ХР согласно описанию поставщика (Beckman Coulter, Inc., Индианаполис, Индиана).
[00203] Библиотеку разделяли на фракции по размеру следующим образом: 50 мкл образца смешивали с 45 мкл 75% смеси гранул (25% гранул AMPure и 75% раствора NaCl/PEG от TekNova, № по кат. Р4136). Смесь перемешивали и помещали на магнитную подставку. Полученный супернатант переносили в новую лунку и добавляли 45 мкл 50% смеси гранул (50% гранул AMPure и 50% раствора NaCl/PEG от TekNova, № по кат. Р4136). Данную смесь перемешивали и помещали на магнитную подставку. Полученный супернатант удаляли и гранулы промывали 80% этанолом. Добавляли 25 мкл элюирующего буфера (ЕВ) и смесь помещали на магнитную подставку. Полученный конечный супернатант удаляли и помещали в пробирку на 1,5 мл. Этот способ позволяет получать библиотеки с диапазоном размеров ДНК 525 пар оснований (п.о.) (вставка плюс адаптер).
[00204] Отсортированную по размеру ДНК-библиотеку амплифицировали с применением KAPA Biosystem HiFi Hot Start (Kapa Biosystems, Inc., Уилмингтон, Массачусетс) с применением следующих условий проведения циклов: [98°С, 45 с]; 12 х [98°С, 15 с, 60°С, 30 с, 72°С, 30 с]; [72°С, 1 мин.]. Каждая реакционная смесь содержала: 5 мкл ДНК-библиотеки, 1 мкл универсальных праймеров от Bioscience (25 мкМ), 18 мкл стерильной воды, 1 мкл индексированных праймеров от Bioscience (25 мкМ), 25 мкл 2Х полимеразы KAPA HiFi.
[00205] Библиотеки анализировали на биоанализаторе Agilent 2100 (Agilent Technologies, Санта-Клара, Калифорния) с применением высокочувствительных чипов для определения диапазона размеров и среднего размера вставок в библиотеке. Все библиотеки подвергали секвенированию спаренных концов (РЕ) (100 циклов на рид; 12-24 библиотек на дорожку) в системе секвенирования HiSeq 2500 с применением стандартных протоколов секвенирования от производителя (Illumina, Inc., Сан-Диего, Калифорния).
[00206] Разрабатывали инструмент для проведения расчетов в отношении Bacillus, чтобы идентифицировать и охарактеризовать вероятные гены токсинов для расстановки приоритетов в отношении направлений дополнительных лабораторных тестов.
[00207] Сборка и анализ генома, а также анализ геномной библиотеки, описанный выше, привели к идентификации в штаммах Bacillus thuringiensis пяти Cry9-подобных генов, проявляющих токсичность в отношении по меньшей мере кукурузного мотылька (Ostrinia nubilalis). Идентификационные характеристики Cry9-подобных генов и белков приведены в таблице 1.
Пример 5. Гомология BT0009, BT0012, BT0013, BT0023 и ВТ0067 с известными белками Cry Bt
[00208] Поиск по базам данных белков с применением аминокислотных последовательностей белков по настоящему изобретению показал, что они являются гомологичными известным инсектицидным белкам. Сравнение аминокислотных последовательностей белков по настоящему изобретению с неизбыточной (nr) базой данных, поддерживаемой NCBI, с применением алгоритма BLAST позволило выявить следующие белки, как характеризующиеся совокупностью аминокислот с самыми высокими значениями идентичности относительно последовательностей по настоящему изобретению (таблица 2).
Пример 6. Экспрессия белков Bt в рекомбинантных клетках-хозяевах
[00209] Экспрессия в Bacillus. Представляющие интерес гены экспрессировали в не образующем кристаллы штамме Bacillus, который не характеризовался активностью в отношении жесткокрылых или чешуекрылых, с помощью вектора экспрессии pCIB5634' описанного выше, который содержал соответствующий промотор гена белка Cry и маркер устойчивости к эритромицину. Конструкции трансформировали в штамм-хозяин посредством электропорации и проводили последующий отбор на чашках с агаром, содержащим эритромицин. Эти рекомбинантные штаммы выращивали до фазы споруляции на среде Т3 при 28°С в течение 4-5 дней. Клеточные осадки собирали и промывали несколько раз перед солюбилизацией в карбонатном буфере с высоким рН (50 мМ), содержащем 2 мМ DTT.
[00210] Экспрессия в Е. coli. Представляющие интерес гены экспрессировали в различных штаммах Е. coli с применением векторов pET28a или pET29a (EMD Millipore). Конструкции трансформировали посредством электропорации и проводили последующий отбор на чашках с агаром, содержащим канамицин. Эти рекомбинантные штаммы выращивали, а экспрессию индуцировали с применением индукции с помощью IPTG при 28°С. Клетки ресуспендировали в карбонатном буфере с высоким рН (50 мМ), содержащем 2 мМ DTT, а затем разрушали с применением гомогенизатора Microfluidics LV-1.
[00211] Анализ экспрессии. Полученные лизаты клеток (каждого хозяина) затем очищали путем центрифугирования и образцы анализировали в отношении чистоты с помощью SDS-PAGE и электрофореграммы (BioRad Experion). Концентрации общего белка определяли с помощью анализа по Брэдфорду или Thermo 660. Очищенные белки Cry затем тестировали в биологических анализах.
Пример 7. Активность белков Cry в биологических анализах
[00212] Белки, полученные в примере 6, тестировали с применением известного из уровня техники биологического анализа с использованием искусственной питательной среды в отношении одного или нескольких следующих видов насекомых-вредителей: совка травяная (FAW; Spodoptera frugiperda), американская кукурузная совка (CEW; Helicoverpa zea), кукурузный мотылек (ЕСВ; Ostrinia nubilalis), совка-ипсилон (BCW; Agrotis ipsilon), огневка тростниковая (SCB; Diatraea saccharlis), гусеница совки бархатных бобов (VBC; Anticarsia gemmatalis), соевая совка (SBL; Pseudoplusia includens), огневка кукурузная юго-западная (SWCB; Diatraea grandiosella), западная бобовая совка (WBCW; Striacosta albicosta), табачная совка (TBW; Heliothis virescens), восточный кукурузный мотылек (АСВ; Ostrinia furnacalis), хлопковая совка (CBW; Helicoverpa armigera), огневка желтая рисовая (SSB; Chilo suppressalis), розовая стеблевая совка (PSB; Sesamia inferens) и огневка рисовая (RLF; Cnaphalocrocis medinails).
[00213] Равное количество белка в виде раствора наносили на поверхность искусственной питательной среды для насекомых (Bioserv, Inc., Френчтаун, Нью-Джерси) в 24-луночных планшетах. После высыхания поверхности питательной среды в каждый планшет добавляли личинок видов насекомых, подлежащих тестированию. Чашки запечатывали и выдерживали в лабораторных условиях окружающей среды с учетом температуры, освещения и относительной влажности. Группа положительного контроля состояла из личинок, подвергаемых воздействию очень активного штамма Bacillus дикого типа с широким спектром действия. Группы отрицательного контроля состояли из личинок, подвергаемых воздействию питательной среды для насекомых, обработанной только буферным раствором, и личинок на необработанной питательной среде для насекомых; то есть только на питательной среде. Смертность определяли через приблизительно 120 часов и оценивали в баллах в сравнении с контролями.
[00214] Результаты показаны в таблице 3, где "-" означает отсутствие активности в сравнении с контролем,"+/-" означает 0-10% активность в сравнении с контролем (эта категория также включала 0% смертность при сильном ингибировании роста личинок),"+" означает 10-25% активность в сравнении с контролем, "++" означает 25-75% активность в сравнении с контролем, а "+++" означает 75-100% активность в сравнении с контролем.
Пример 8. Преобразование белков Cry в анализе с использованием искусственного желудочного сока
[00215] Некоторые белки Cry уже экспрессировали в растениях, и семена таких растений ежегодно продаются фермерам для применения в контроле различных насекомых-вредителей. Такие самозащищенные пестицидные продукты рассматриваются и регистрируются различными регулирующими органами, включая, например, Агентство по охране окружающей среды США (ЕРА).
[00216] Воздействие при поступлении с пищей является основным путем, за счет которого люди могут подвергаться воздействию белков Cry, экспрессируемых трансгенными растениями. Острая пероральная токсичность для млекопитающих и переваримость белка являются конечными точками оценки риска для здоровья человека, определяемыми ЕРА. Дополнительными научными доказательствами безопасности белков Cry является то, что они, как было показано, быстро расщепляются in vitro под действием искусственного желудочного сока. Результаты семи исследований in vitro, проведенных с репрезентативными белками Cry1, Cry2 и Cry3, показали, что белки быстро расщепляются, как правило, в течение 30 секунд. Эти результаты подтверждают более широкий вывод о том, что члены этих групп белков Cry (которые обладают значительной идентичностью аминокислотных последовательностей), вероятно, быстро расщепляются после поедания человеком. Другая область рассмотрения заключается в определении того, могут ли белки Cry вызывать аллергическую реакцию. Продемонстрированное быстрое расщепление белков Cry in vitro должно сводить к минимуму возможность такого явления. Для сравнения, пищевые аллергены обычно не подвергаются распадению в in vitro модели желудочно-кишечного тракта, тогда как обычные белки пищи, для которых не показана аллергенность, быстро расщепляются в искусственном желудочном соке (Metcalfe et al., 1996).
[00217] Дополнительные понимание, касающееся потенциальной аллергенности белка, можно получить с помощью анализа переваримости белка в искусственном желудочном соке (SGF). Почти все белки Cry, экспрессируемые в трансгенных растениях, которые были протестированы на сегодняшний день, быстро переваривались и, следовательно, были определены как неаллергенные. Однако было обнаружено, что белок Cry9C, находящийся в продукте трансгенной кукурузы, известном как Starlink, является частично устойчивым к SGF. Хотя Cry9C Starlink не токсичен для животных, свойства частичной переваримости и частичной стабильности при обработке не позволили ЕРА абсолютно исключить возможность того, что белок Cry9C Starlink может действовать как пищевой аллерген, что в конечном счете привело к тому, что компания, которая разработала Starlink, отозвала продукты с рынка США.
[00218] В настоящее время не существует доказательных тестов для определения аллергенного потенциала новых белков. Таким образом, ЕРА применяет подход, основанный на совокупности доказательств, в котором рассматриваются следующие факторы: источник признака; сравнение аминокислотной последовательности с известными аллергенами и биохимические свойства белка, включая in vitro переваримость в искусственном желудочном соке (SGF) и степень гликозилирования.
[00219] С помощью анализа с использованием искусственного желудочного сока (SGF) измеряют in vitro переваримость тестируемого белка в строго контролируемых условиях, характерных для пищеварительного тракта высших млекопитающих. Вкратце, полученный в бактериях тестируемый белок Cry (в концентрации 0,5-5 мг/мл) подвергали воздействию фермента пепсина (из слизистой оболочки желудка свиньи, растворенного в 2 мг/мл NaCl, pH 1,2) в соотношении 10 единиц активности пепсина/мкг тестируемого белка в течение периода времени, составляющего один час, при 37°С. Образцы отбирали на 1, 2, 5, 10, 30 и 60 минуте и сразу же блокировали путем добавления предварительно нагретого (95°С - 2 минуты) стоп-буфера (65% 0,5 М бикарбоната натрия, рН 11, 35% трициновый загрузочный буфер) для немедленной инактивации пепсина, и снова нагревали в течение дополнительных 5 минут. После завершения анализа образцы, взятые в определенные моменты времени, и контроли (только тестируемый белок, только пепсин) исследовали с помощью SDS-PAGE в 10-20% геле с трис-глицином (при этом пептиды были визуально различимы вплоть до 1 кДа) для отслеживания кинетики и уровня переваривания, осуществляемого пепсином.
[00220] Результаты анализов с SGF продемонстрировали, что все белки Cry по настоящему изобретению расщеплялись очень быстро. Эти результаты предоставили доказательство того, что хотя белки Cry по настоящему изобретению относятся к семейству белков Cry9, они совершенно отличаются от них с точки зрения ответа в анализе с SGF при сравнении с некоторыми опубликованными результатами, например, касающимися Cry9C Starlink, что предполагает существенные структурные отличия в ключевых сайтах расщепления для пепсина в белке. Эти результаты дополнительно позволяют предположить, что аллергенный потенциал белков Cry по настоящему изобретению является минимальным.
Пример 9. Введение генов в вектор для экспрессии в растении
[00221] Перед экспрессией в растениях синтетический полинуклеотид, содержащий нуклеотидную последовательность, кодирующую каждый из белков Cry Bt, ВТ-0009, ВТ-0012, ВТ-0013, ВТ-0023 и ВТ-0067 (SEQ ID NO: 6-10 соответственно), и синтетический полинуклеотид, содержащий нуклеотидную последовательность, кодирующую каждый из мутантных белков Cry Bt, mBT-0009, mBT-0012, mBT-0013, mBT-0023 и mBT-0067 (SEQ ID NO: 21-25 соответственно), синтезировали в автоматизированной системе для синтеза генов (Genscript, Inc., Пискатауэй, Нью-Джерси). В этом примере получали первую кассету экспрессии, содержащую убиквитиновый промотор маиса (Ubi1), функционально связанный с последовательностью, кодирующей белок Cry, которая была функционально связана с терминатором Nos, а также получали вторую кассету экспрессии, содержащую промотор Ubil, функционально связанный с последовательностью, кодирующей фосфоманнозоизомеразу (PMI), которая была функционально связана с терминатором Nos. Экспрессия PMI позволяет осуществлять положительную селекцию трансгенных растений на маннозе. Обе кассеты экспрессии клонировали в подходящий вектор для трансформации маиса, опосредованной Agrobacterium.
Пример 11. Экспрессия белков Cry в растениях
[00222] Трансформацию незрелых зародышей маиса выполняли, главным образом, как описано в Negrotto et al., 2000, Plant Cell Reports 19: 798 803. Вкратце, штамм Agrobacterium LBA4404 (pSBl), содержащий вектор, описанный в примере 12, выращивали на твердой среде YEP (дрожжевой экстракт (5 г/л), пептон (10 г/л), NaCl (5 г/л), 15 г/л агара, рН 6,8) в течение 2-4 дней при 28°С. Примерно 0,8Х 109 клеток Agrobacterium суспендировали в среде LS-inf, дополненной 100 мкМ As. Бактерий предварительно индуцировали в данной среде в течение примерно 30-60 минут.
[00223] Незрелые зародыши инбредной линии маиса вырезали из початков возрастом 8-12 дней с переносом в жидкую среду LS-inf + 100 мкМ As. Зародышей однократно ополаскивали свежей средой для инфицирования. Затем добавляли раствор Agrobacterium, и зародышей перемешивали на вихревой мешалке в течение 30 секунд и оставляли осесть с бактериями в течение 5 минут. Затем зародыши переносили стороной со щитком зародыша кверху на среду LSAs и культивировали в темноте в течение двух-трех дней. Впоследствии примерно 20-25 зародышей на чашку Петри переносили на среду LSDc, дополненную цефотаксимом (250 мг/л) и нитратом серебра (1,6 мг/л), и культивировали в темноте при примерно 28°С в течение 10 дней.
[00224] Незрелых зародышей, образующих эмбриогенный каллюс, переносили в среду LSD1M0.5S. Селекцию культур на этой среде осуществляли в течение примерно 6 недель, при этом через приблизительно 3 недели проводили стадию субкультивирования. Выжившие каллюсы переносили на среду Reg1, дополненную маннозой. После культивирования на свету (в режиме 16 часов света/8 часов темноты) зеленые ткани затем переносили на среду Reg2 без регуляторов роста и инкубировали в течение приблизительно 1-2 недель. Проростки переносили в контейнеры Magenta GA-7 (Magenta Corp, Чикаго, Иллинойс), содержащие среду Reg3, и выращивали на свету. Спустя приблизительно 2-3 недели растения тестировали с помощью ПЦР в отношении наличия генов PMI, а также гена cry Bt. Растения, показавшие положительные результаты в ПЦР-анализе, переносили в теплицу для дальнейшей оценки.
[00225] Трансгенные растения оценивали в отношении числа копий (определяли с помощью анализа Taqman), уровня экспрессии белка (определяли с помощью ELISA) и эффективности в отношении представляющих интерес видов насекомых в биологических анализах с вырезанием листа. В частности, ткань листа вырезали из однокопийных объектов (на стадии V3-V4) и заражали новорожденными личинками, затем инкубировали при комнатной температуре в течение 5 дней. Размер выборки для биологического анализа с листовыми дисками варьировал в зависимости от тестируемого вида насекомых (кукурузный мотылек (ЕСВ), n=10; американская кукурузная совка (CEW), n=3, совка-ипсилон (BCW), n=5). Снятие показаний для оценки повреждения ткани и смертности получали примерно в день 3 и день 5; образцы оценивали в отношении повреждения относительно отрицательного контроля с применением следующей шкалы: "+": <5% повреждение ткани, все личинки мертвые;"+/-": 5-20% повреждение ткани, все личинки мертвые; или "-": >20% повреждение ткани, некоторые личинки живые и/или развились до 2ой личиночной стадии.
[00226] Результаты биологического анализа на ткани трансгенного растения подтверждают, что при экспрессии в трансгенных растениях белки Cry по настоящему изобретению токсичны для целевых насекомых. Например, mBT-0012, экспрессируемый в растении маиса, стабильно трансформированном химерным геном по настоящему изобретению, активен в отношении по меньшей мере кукурузного мотылька (Ostrinia nubilalis).
--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110>ЗИНГЕНТА ПАРТИСИПЕЙШНС АГ
<120>Композиции и способы контроля вредителей растений
<130> 80670-WO-REG-ORG-P-1
<160> 31
<170> PatentIn версия 3.5
<210> 1
<211> 3507
<212>ДНК
<213> Bacillus thuringiensis
<400> 1
atgaatcgaa ataatcaaaa tgaatatgaa gttattgatg ccccacattg tgggtgtccg 60
gcagatgatg ttgtaaaata tcctttgaca gatgatccga atgctggatt gcaaaatatg 120
aactataagg aatatttaca aacgtatggt ggagactata cagatcctct tattaatcct 180
aacttatctg ttagtggaaa agatgtaata caagttggaa ttaatattgt agggagatta 240
ctaagctttt ttggattccc cttttctagt caatgggtta ctgtatatac ctatctttta 300
aacagcttgt ggccggatga cgagaattct gtatgggacg cttttatgga gagagtagaa 360
gaacttattg atcaaaaaat ctcagaagca gtaaagggta gggcattgga tgacctaact 420
ggattacaat ataattataa tttatatgta gaagcattag atgagtggct gaatagacca 480
aatggcgcaa gggcatcctt agtttctcag cgatttaaca ttttagatag cctatttaca 540
caatttatgc caagctttgg ctctggtcct ggaagtcaaa attatgcaac tatattactt 600
ccagtatatg cacaagcagc aaaccttcat ttgttattat taaaagatgc agacatttat 660
ggagctagat gggggctgaa tcaaactcaa atagatcaat tccattctcg tcaacaaagc 720
cttactcaga cttatacaaa tcattgtgtt actgcgtata atgatggatt agcggaatta 780
agaggcacaa gcgttgcgag ttggctcaaa tatcatcaat accgtaggga aatgacagta 840
acggcaatgg atttagtggc attattccca tactataatg ttagacaata tccaaatggg 900
gcaaatccac aacttacacg tgaggtatat acagatccaa tcgtatttaa tccgcctgag 960
cgtccaagtg gcgctttctg cgaaagtttt tatactatcc gagcggctcg agaacgttta 1020
actttttcgc aacttgaaca tgcaataatt cgtccgccgc gcttgtttga aaggtttcaa 1080
gctttaggga tttatacagg cgaggcgcga ctgaatgcaa atagtgctcc aatgaactat 1140
tggattggac attttataag aaatacacgt ttaggtgact caacaacaat tactacaaat 1200
tatggaacaa ccaataatcg tttaactaac ttcagtatgc cttctgatgt ttatcaaatc 1260
aattcaacct caagtaattt agccgctatt ttaggcactt tatatggggt tactagagca 1320
caattccatt ttggatcagg aagtttttcg acgtatgtcg gacaaaatag cgttcttcca 1380
caatgtcatc aaaactataa ttcaatagaa gaattaccaa accaaagcga tgaacctaca 1440
gttagaagtt atagccatag attatctcat atcacctctt ttaatttcaa tgtacagctt 1500
aataatcctt taatttctgc gggcaatatg cctgtatatg tgtggacaca tcgcagtgtg 1560
gaccttacta acaggatttc ttcagataga attactcaaa taccagtggt aaaggcatat 1620
gagctaagta gtggtgctac tgtcgtgaaa ggtccaggat tcacaggagg agatgtaatc 1680
cgaagaacaa atactggtgg attcggagca ataagggtgt cggtcactgg accgctaaca 1740
caacgatatc gcataaggtt ccgttatgct tcgacaatag attttgattt ctttgtaaca 1800
cgtggaggaa ctactataaa taattttaga tttacacgta caatgaacag gggacaggaa 1860
tcaagatatg aatcctatcg tactgtagag tttacaactc cttttaactt tacacaaagt 1920
caagatataa ttcgaacatc tatccaggga cttagtggaa atggggaagt ataccttgat 1980
agaattgaaa tcatccctgt aaatccaaca cgagaagcgg aagaggattt agaagcggcg 2040
aagaaagcgg tggcgagctt gtttacacgc acaagggacg gattacaagt aaatgtgaaa 2100
gattatcaag tcgatcaagc ggcaaattta gtgtcatgct tatcagatga acaatatggg 2160
tatgacaaaa agatgttatt ggaagcggta cgcgcggcaa aacgcctcag ccgagaacgt 2220
aacttacttc aggacccaga ttttaataca atcaatagta cagaagaaaa tggatggaaa 2280
gcaagtaacg gcgttactat tagtgagggc ggtccattct ataaaggccg tgcacttcag 2340
ctagcaagtg cacgagaaaa ttatccaaca tacatttatc aaaaagtaga tgcatcggag 2400
ttaaaacctt atacacgata tagactagat gggttcgtga agagtagtca agatttagaa 2460
attgatctca ttcaccatca taaagtccat cttgtgaaaa atgtaccaga taatttagta 2520
tctgatactt acccagatga ttcttgtagt ggaatcaatc gatgtcagga acaacagatg 2580
gtaaatgcgc aactggaaac agagcatcat catccgatgg attgctgtga agcagctcaa 2640
acacatgagt tttcttccta tattgataca ggggatttaa attcgactgt agaccaggga 2700
atctgggtga tctttaaagt tcgaacaacc gatggttatg cgacgttagg aaatcttgaa 2760
ttggtagagg tcggaccgtt attgggtgaa cctctagaac gtgaacaaag agaaaatgcg 2820
aaatggaatg cagagttagg aagaaaacgt gcagaaacag atcgcgtgta tcaagatgcc 2880
aaacaatcca tcaatcattt atttgtggat tatcaagatc aacaattaaa tccagaaata 2940
gggatggcag atattatgga cgctcaaaat cttgtcgcat caatttcaga tgtatatagc 3000
gatgccgtac tgcaaatccc tggaattaac tatgagattt acacagagct gtccaatcgc 3060
ttacaacaag catcgtatct gtatacgtct cgaaatgcgg tgcaaaatgg ggactttaac 3120
aacgggctag atagctggaa tgcaacagcg ggtgcatcgg tacaacagga tggcaatacg 3180
catttcttag ttctttctca ttgggatgca caagtttctc aacaatttag agtgcagccg 3240
aattgtaaat atgtattacg tgtaacagca gagaaagtag gcggcggaga cggatacgtg 3300
actatccggg atgatgctca tcatacagaa acgcttacat ttaatgcatg tgattatgat 3360
ataaatggca cgtacgtgac tgataatacg tatctaacaa aagaagtggt attctattca 3420
catacagatc acatgtgggt agaggtaagt gaaacagaag gtgcatttca tatagatagt 3480
attgaattcg ttgaaacaga aaagtaa 3507
<210> 2
<211> 3471
<212>ДНК
<213> Bacillus thuringiensis
<400> 2
atgaatcaaa ataaacacgg aattattggc gcttccaatt gtggttgtgc atctgatgat 60
gttgcgaaat atcctttagc caacaatcca tattcatctg ctttaaattt aaattcttgt 120
caaaatagta gtattctcaa ctggattaac ataataggcg atgcagcaaa agaagcagta 180
tctattggga caaccatagt ctctcttatc acagcacctt ctcttactgg attaatttca 240
atagtatatg accttatagg taaagtacta ggaggtagta gtggacaatc catatcagat 300
ttgtctatat gtgacttatt atctattatt gatttacggg taagtcagag tgtcttaaat 360
gatgggattg cagattttaa tggttctgta ctcttataca ggaactattt agaggctctg 420
gatagctgga ataagaatcc taattctgct tctgctgaag aactccgtac tcgttttaga 480
atcgccgact cagaatttga tagaatttta acccgagggt ctttaacgaa tggtggctcg 540
ttagctagac aaaatgccca aatattatta ttaccttctt ttgcgagcgc tgcatttttc 600
catttattac tactaaggga tgctactaga tatggcacta attgggggct atacaatgct 660
acacctttta taaattatca atcaaaacta gtagagctta ttgaactata tactgattat 720
tgcgtacatt ggtataatcg aggtttcaac gaactaagac aacgaggcac tagtgctaca 780
gcttggttag aatttcatag atatcgtaga gagatgacat tgatggtatt agatatagta 840
gcatcatttt caagtcttga tattactaat tacccaatag aaacagattt tcagttgagt 900
agggtcattt atacagatcc aattggtttt gtacatcgta gtagtcttag gggagaaagt 960
tggtttagct ttgttaatag agctaatttc tcagatttag aaaatgcaat acctaatcct 1020
agaccgtctt ggtttttaaa taatatgatt atatctactg gttcacttac attgccggtt 1080
agcccaagta ctgatagagc gagggtatgg tatggaagtc gagatcgaat ttcccctgct 1140
aattcacaat ttattactga actaatctct ggacaacata cgactgctac acaaactatt 1200
ttagggcgaa atatatttag agtagattct caagcttgta atttaaatga taccacatat 1260
ggagtgaata gggcggtatt ttatcatgat gcgagtgaag gttctcaaag atccgtgtac 1320
gaggggtata ttcgaacaac tgggatagat aaccctagag ttcaaaatat taacacttat 1380
ttacctggag aaaattcaga tatcccaact ccagaagact atactcatat attaagcaca 1440
acaataaatt taacaggagg acttagacaa gtagcatcta atcgccgttc atctttagta 1500
atgtatggtt ggacacataa aagtctggct cgtaacaata ccattaatcc agatagaatt 1560
acacagatac cattgacgaa ggttgatacc cgaggcacag gtgtttctta tgtgaatgat 1620
ccaggattta taggaggagc tctacttcaa aggactgacc atggttcgct tggagtattg 1680
agggtccaat ttccacttca cttaagacaa caatatcgca ttagagtccg ttatgcttct 1740
acaacaaata ttcgattgag tgtgaatggc agtttcggta ctatttctca aaatctccct 1800
agtacaatga gattaggaga ggatttaaga tacggatctt ttgctataag agagtttaat 1860
acttctatta gacccactgc aagtccggac caaattcgat tgacaataga accatctttt 1920
attagacaag aggtctatgt agatagaatt gagttcattc cagttaatcc gacgcgagag 1980
gcgaaagagg atctagaagc agcaaaaaaa gcggtggcga gcttgtttac acgcacaagg 2040
gacggattac aagtaaatgt gaaagattat caagtcgatc aagcggcaaa tttagtgtca 2100
tgcttatcag atgaacaata tgggtatgac aaaaagatgt tattggaagc ggtacgtgcg 2160
gcaaaacgac ttagccgaga acgcaactta cttcaggatc cagattttaa tacaattaat 2220
agtacagaag aaaatggatg gaaagcaagt aacggcgtta ctattagtga gggcgggcca 2280
ttctataaag gccgtgcaat tcagctagca agcgcacgag aaaattatcc aacatacatt 2340
tatcaaaaag tagatgcatc ggagttaaag ccatatacac gctatagact ggatggattc 2400
gtgaagagta gtcaagattt agaaattgat ctcattcacc atcataaagt ccatcttgtg 2460
aaaaatgtac cagataattt agtacttgat acttacccag atgattcctg caacggaatt 2520
aaccgttgtg atgaacagaa gatggtaaat gcgcaactgg aaacagaaca tcatcatccg 2580
atggattgct gtgaagcggc tcaaacacat gagttttctt cctatattaa tacaggcgat 2640
ctaaatgcaa gtgtagatca aggcatttgg gttgtattga aagttcgaac aacagatggt 2700
tatgcgacgc taggaaatct tgaattggta gaggtcggac cgttatcggg tgaatctcta 2760
gaacgtgaac aaagggataa tgcgaaatgg agtgcagagc taggaagaaa gcgtgcagaa 2820
acagagagag tatattatgc tgccaaacaa tccatcaatc atttatttgt ggattatcga 2880
gatcaacaat taaatccaca aatagggatg gcagatatta tggacgctca aaatcttgtc 2940
gcatcaattt cagatgtata tagcgatgcc gtactgcaaa tccctggaat taactatgag 3000
atttacacag agctatccaa tcgcttacaa caagcatcgt atctgcatat gtctcgaaat 3060
gcgatgcaaa atggggactt taacagcggt ctagatagtt ggaatgcaac agcgggtgct 3120
acggtacaac aggatggcaa tacgcatttc ttagttcttt ctcattggga tgcacaagtt 3180
tctcaacaat ttagagtgca gccgaattgt aaatatgtat tacgtgtaac agcagagaaa 3240
gtaggcggcg gagacggata cgtgacaatc cgggatggtg ctcatcatac agaaacgctt 3300
acatttaatg catgtgatta tgatataaat ggcacgtacg tgactgataa tacgtatcta 3360
acaaaagaag tggtattcca tccggagaca caacatatgt gggtagaggt aagtgaaaca 3420
gaaggtgttt tccatataga cagtgttgag ttcatggaaa cccaacagta a 3471
<210> 3
<211> 3471
<212>ДНК
<213> Bacillus thuringiensis
<400> 3
atgaatcaaa ataaacacgg aattattggc gcttccaatt gtggttgtgc atctgatgat 60
gttgcgaaat atcctttagc caacaatcca tattcatctg ctttaaattt aaattcttgt 120
caaaatagta gtattctcaa ctggattaac ataataggcg atgcagcaaa agaagcagta 180
tctattggga caaccatagt ctctcttatc acagcacctt ctcttactgg attaatttca 240
atagtatatg accttatagg taaagtacta ggaggtagta gtggacaatc catatcagat 300
ttgtctatat gtgacttatt atctattatt gatttacggg taagtcagag tgtcttaaat 360
gatgggattg cagattttaa tggttctgta ctcttataca ggaactattt agaggctctg 420
gatagctgga ataagaatcc taattctgct tctgctgaag aactccgtac tcgttttaga 480
atcgccgact cagaatttga tagaatttta acccgagggt ctttaacgaa tggtggctcg 540
ttagctagac aaaatgccca aatattatta ttaccttctt ttgcgagcgc tgcatttttc 600
catttattac tactaaggga tgctactaga tatggcacta attgggggct atacaatgct 660
acacctttta taaattatca atcaaaacta gtagagctta ttgaactata tactgattat 720
tgcgtacatt ggtataatcg aggtttcaac gaactaagac aacgaggcac tagtgctaca 780
gcttggttag aatttcatag atatcgtaga gagatgacat tgatggtatt agatatagta 840
gcatcatttt caagtcttga tattactaat tacccaatag aaacagattt tcagttgagt 900
agggtcattt atacagatcc aattggtttt gtacatcgta gtagtcttag gggagaaagt 960
tggtttagct ttgttaatag agctaatttc tcagatttag aaaatgcaat acctaatcct 1020
agaccgtctt ggtttttaaa taatatgatt atatctactg gttcacttac attgccggtt 1080
agcccaagta ctgatagagc gagggtatgg tatggaagtc gagatcgaat ttcccctgct 1140
aattcacaat ttattactga actaatctct ggacaacata cgactgctac acaaactatt 1200
ttagggcgaa atatatttag agtagattct caagcttgta atttaaatga taccacatat 1260
ggagtgaata gggcggtatt ttatcatgat gcgagtgaag gttctcaaag atccgtgtac 1320
gaggggtata ttcgaacaac tgggatagat aaccctagag ttcaaaatat taacacttat 1380
ttacctggag aaaattcaga tatcccaact ccagaagact atactcatat attaagcaca 1440
acaataaatt taacaggagg acttagacaa gtagcatcta atcgccgttc atctttagta 1500
atgtatggtt ggacacataa aagtctggct cgtaacaata ccattaatcc agatagaatt 1560
acacagatac cattgacgaa ggttgatacc cgaggcacag gtgtttctta tgtgaatgat 1620
ccaggattta taggaggagc tctacttcaa aggactgacc atggttcgct tggagtattg 1680
agggtccaat ttccacttca cttaagacaa caatatcgca ttagagtccg ttatgcttct 1740
acaacaaata ttcgattgag tgtgaatggc agtttcggta ctatttctca aaatctccct 1800
agtacaatga gattaggaga ggatttaaga tacggatctt ttgctataag agagtttaat 1860
acttctatta gacccactgc aagtccggac caaattcgat tgacaataga accatctttt 1920
attagacaag aggtctatgt agatagaatt gagttcattc cagttaatcc gacgcgagag 1980
gcgaaagagg atctagaagc agcaaaaaaa gcggtggcga gcttgtttac acgcacaagg 2040
gacggattac aagtaaatgt gaaagattat caagtcgatc aagcggcaaa tttagtgtca 2100
tgcttatcag atgaacaata tgggtatgac aaaaagatgt tattggaagc ggtacgtgcg 2160
gcaaaacgac ttagccgaga acgcaactta cttcaggatc cagattttaa tacaattaat 2220
agtacagaag aaaatggatg gaaagcaagt aacggcgtta ctattagtga gggcgggcca 2280
ttctataaag gccgtgcaat tcagctagca agcgcacgag aaaattatcc aacatacatt 2340
tatcaaaaag tagatgcatc ggagttaaag ccatatacac gctatagact ggatggattc 2400
gtgaagagta gtcaagattt agaaattgat ctcattcacc atcataaagt ccatcttgtg 2460
aaaaatgtac cagataattt agtacttgat acttacccag atgattcctg caacggaatt 2520
aaccgttgtg atgaacagaa gatggtaaat gcgcaactgg aaacaggaca tcatcatccg 2580
atggattgct gtgaagcggc tcaaacacat gagttttctt cctatattaa tacaggcgat 2640
ctaaatgcaa gtgtagatca aggcatttgg gttgtattga aagttcgaac aacagatggt 2700
tatgcgacgc taggaaatct tgaattggta gaggtcggac cgttatcggg tgaatctcta 2760
gaacgtgaac aaagggataa tgcgaaatgg agtgcagagc taggaagaaa gcgtgcagaa 2820
acagagagag tatattatgc tgccaaacaa tccatcaatc atttatttgt ggattatcaa 2880
gatcaacaat taaatccaca aatagggatg gcagatatta tggacgctca aaatcttgtc 2940
gcatcaattt cagatgtata tagcgatgcc gtactgcaaa tccctggaat taactatgag 3000
atttacacag agctatccaa tcgcttacaa caagcatcgt atctgcatac gtctcgaaat 3060
gcgatgcaaa atggggactt taacagcggt ctagatagtt ggaatgcaac agcgggtgct 3120
acggtacaac aggatggcaa tacgcatttc ttagttcttt ctcattggga tgcacaagtt 3180
tctcaacaat ttagagtgca gccgaattgt aaatatgtat tacgtgtaac agcagagaaa 3240
gtaggcggcg gagacggata cgtgacaatc cgggatggtg ctcatcatac agaaacgctt 3300
acatttaatg catgtgatta tgatataaat ggcacgtacg tgactgataa tacgtatcta 3360
acaaaagaag tggtattcca tccggagaca caacatatgt gggtagaggt aagtgaaaca 3420
gaaggtgttt tccatataga cagtgttgag ttcatggaaa cccaacagta a 3471
<210> 4
<211> 3459
<212>ДНК
<213> Bacillus thuringiensis
<400> 4
atgaatcgaa ataatccaaa tgaatatgaa attattgatg ccccctattg tgggtgtccg 60
tcagatgatg atgtgaggta tcctttggca agtgacccaa atgcagcgtt ccaaaatatg 120
aactataaag agtatttaca aacgtatgat ggagactaca caggttctct tatcaatcct 180
aacttatcta ttaatcctag agatgtacta caaacaggta ttaatattgt gggaagaata 240
ctagggtttt taggtgttcc atttgcgggt caactagtta ctttctatac ctttctctta 300
aatcagttgt ggccaactaa tgataatgca gtatgggaag cttttatggc gcaaatagaa 360
gagctaatcg atcaaaaaat atcggcgcaa gtagtaagga atgcactcga tgacttaact 420
ggattacacg attattatga ggagtattta gcagcattag aggagtggct ggaaagaccg 480
aacggagcaa gagctaactt agttacacag aggtttgaaa acctgcatac tgcatttgta 540
actagaatgc caagctttgg tacgggtcct ggtagtcaaa gagatgcggt agcgttgttg 600
acggtatatg cacaagcagc gaatttgcat ttgttattat taaaagatgc agaaatctat 660
ggggcaagat ggggacttca acaagggcaa attaacttat attttaatgc tcaacaagaa 720
cgtactcgaa tttataccaa tcattgcgtg gaaacatata atagaggatt agaagatgta 780
agaggaacaa atacagaaag ttggttaaat taccatcgat tccgtagaga gatgacatta 840
atggcaatgg atttagtggc cttattccca tactataatg tgcgacaata tccaaatggg 900
gcaaatccac agcttacacg tgaaatatat acggacccaa tcgtatataa tccaccagct 960
aatcagggaa tttgccgacg ttgggggaat aatccgtata atacattttc tgaacttgaa 1020
aatgctttta ttcgcccgcc acatcttttt gataggttga atagattaac tatttctaga 1080
aaccgatata cagctccaac aactaatagc tacctagact attggtcagg tcatacttta 1140
caaagccagt atgcaaataa cccgacgaca tatgaaacta gttacggtca gattacctct 1200
aacacacgtt tattcaatac gactaatgga gccaatgcaa tagattcaag ggcaagaaat 1260
tttggtaact tatacgctaa tttgtatggc gttagcagct tgaacatttt cccaacaggt 1320
gtgatgagtg aaatcacctc agcccctaat acgtgttggc aagaccttac tacaactgag 1380
gaactaccac tagtgaataa taattttaat cttttatctc atgttacttt cttacgcttc 1440
aatactactc agggtggccc ccttgcaact gtagggtttg tacccacata tgtgtggaca 1500
cgtcaagatg tagattttaa taatataatt actcccaata gaattactca aataccagtg 1560
gtaaaggcat atgagctaag tagtggtgct actgtcgtga aaggtccagg attcacagga 1620
ggagatgtaa tccgaagaac aaatactggt ggattcggag caataagggt gtcggtcact 1680
ggaccgctaa cacaacgata tcgcataagg ttccgttatg cttcgacaat agattttgat 1740
ttctttgtaa cacgtggagg aactactata aataatttta gatttacacg tacaatgaac 1800
aggggacagg aatcaagata tgaatcctat cgtactgtag agtttacaac tccttttaac 1860
tttacacaaa gtcaagatat aattcgaaca tctatccagg gacttagtgg aaatggggaa 1920
gtataccttg atagaattga aatcatccct gtaaatccaa cacgagaagc ggaagaggat 1980
ttagaagcgg cgaagaaagc ggtggcgagc ttgtttacac gcacaaggga cggattacaa 2040
gtaaatgtga cagattatca agtcgatcaa gcggcaaatt tagtgtcatg cttatcagat 2100
gaacaatatg cgcatgataa aaagatgtta ttggaagcgg tacgcgcggc aaaacgcctc 2160
agccgagaac gtaacttact tcaggaccca gattttaata caatcaatag tacagaagaa 2220
aatggatgga aagcaagtaa cggcgttact attagtgagg gcggtccatt ctataaaggc 2280
cgtgcacttc agctagcaag tgcacgagaa aattacccaa catacatcta tcaaaaagta 2340
gatgcatcgg agttaaaacc ttatacacga tatagactgg atgggttcgt gaagagtagt 2400
caagatttag aaattgatct cattcaccat cataaagtcc atcttgtgaa aaatgtacta 2460
gataatttag tatctgatac ttacccagat gattcttgta gtggaatcaa tcgatgtgag 2520
gaacaacaga tggtaaatgc gcaactggaa acagaacatc atcatccgat ggattgctgt 2580
gaagcagctc aaacacatga gttttcttcc tatattgata caggggattt aaattcgact 2640
gtagaccagg gaatctgggt gatctttaaa gttcgaacaa cagatggtta tgcgacgcta 2700
ggaaatcttg aattggtaga ggtcggaccg ttattgggtg aacctctaga acgtgaacaa 2760
agagaaaatg cgaaatggaa tgcagagtta ggaagaaaac gtgcagaaac agatcgcgtg 2820
tatcaagatg ccaaacaatc catcaatcat ttatttgtgg attatcaaga tcaacaatta 2880
aatccacaaa tagggatggc agatattatg gacgctcaaa atcttgtcgc atcaatttca 2940
gatgtatata gcgatgcagt actgcaaatc cctggaatta actatgagat ttacacagag 3000
ctgtccaatc gcttacaaca agcatcgtat ctgtatacgt ctcgaaatgc ggtgcaaaat 3060
ggggacttta acaacgggct agatagctgg aatgcaacag cgggtgcatc ggtacaacag 3120
gatggcaata cgcatttctt agttctttct cattgggatg cacaagtttc ccaacaattt 3180
agagtgcagc cgaattgtaa atatgtatta cgtgtaacag cagagaaagt aggcggcgga 3240
gacggatacg tgactatccg ggatggtgct catcatacag aaacgcttac atttaatgca 3300
tgtgattatg atataaatgg cacgtacgtg actgataata cgtatctaac aaaagaagtg 3360
atattctatt cacatacaga acacatgtgg gtagaggtaa atgaaacaga aggtgcattt 3420
catatagata gtattgaatt cgttgaaaca gaaaagtaa 3459
<210> 5
<211> 3468
<212>ДНК
<213> Bacillus thuringiensis
<400> 5
atgaatcgaa ataatcaaga tgaatatgaa attattgacg cttccacttg tggttgttcg 60
tcagatgatg ttgttcaata ccctttggca agagatccga atgctgtatt ccaaaatatg 120
cattataaag attatttgca aacgtatgat ggagactata caggttctct tataaatcct 180
aacttatcta ttaatcctag agatgtactg caaactggaa ttaatattgt gggaagatta 240
ctaggatttc taggtgttcc atttgctggt cagttagtta ctttctatac ctttctttta 300
aatcaactgt ggccaacaaa tgataatgca gtatgggaag cttttatggc acaaatagaa 360
gagcttatta atcaaagaat atccgaagca gtagtaggga cagcagcgga tcatttaacg 420
ggattacacg ataattatga gttatatgta gaggcattgg aggaatggct ggaaagaccg 480
aatgctgcta gaactaatct actttttaat agatttacca ccctagatag tctttttaca 540
caatttatgc caagctttgg tactggacct ggaagtcaaa actacgcagt tccattactt 600
acagtatacg cacaagcagc gaaccttcat ttgttattat taaaggatgc tgaaatatat 660
ggagcaagat ggggactgaa ccaaaatcag attaactcat tccatacgcg ccaacaagaa 720
cgtactcaat attatacaaa tcattgcgta acgacgtata ataccggttt agatagatta 780
agaggcacaa atactgaaag ttggttaaat tatcatcgtt tccgtagaga gatgacatta 840
atggcaatgg atttagtagc gctattccca tattataatg tacgacaata tccaaatgga 900
gcaaatcctc agcttacacg tgaaatatat acagatccaa ttgtatttaa tccaccagct 960
aatgtgggat tatgtagacg ttggggcaat aacccatata atagattttc tgaactagaa 1020
aacgctttta tccgcccgcc acatcttttt gatagattga ataccttaac aattagtaga 1080
aatagatttg acgttgggtc aaactttata gaaccgtggt ctggacatac gttacgccgt 1140
agttattcga ataattcgac agtatatgaa gatagttatg gccaaattac agccacaaga 1200
acaacaatta atctgccggc taatggaact ggccgagtag aatcaacagc agtagatttt 1260
cgtagcgcgc ttgtggggat atacggtgtt aatagagctt cttttattcc aggtggtgtg 1320
tttagtggca cgactcagcc ttctactgga ggatgtagag atttgtatga ttcaagtgat 1380
gaattaccac cagacgaaag tactggaagt tttgcccata gactatctca tgttaccttt 1440
ttaagtttta caactaatca ggccggttcc atagccaatt caggacgcgt ccctacttat 1500
gtctggaccc atcgcgatgt ggactttaat aatacaatta accccaatag aattactcaa 1560
ataccagtgg taaaggcata tgagctaagt agtggtgcta ctgtcgtgaa aggtccagga 1620
ttcacaggag gagatgtaat ccgaagaaca aatattggtg ggttcggagc aataagggtg 1680
tcggtcactg gaccgctaac acaacgatat cgcataaggt tccgttatgc ttcgacaata 1740
gattttgatt tctttgtaac acgtggagga actactataa ataattttag atttacacgt 1800
acaatgaaca ggggacagga atcaagatat gaatcctatc gtactgtaga gtttacaact 1860
ccttttaact ttacacaaag tcaagatata attcgaacat ctatccaggg acttagtgga 1920
aatggggaag tataccttga tagaattgaa atcatccctg taaatccaac acgagaagcg 1980
gaagaggatc tagaagcagc gaagaaagcg gtggcgagct tgtttacacg tacaagggac 2040
ggattacaag taaatgtgac agattatcaa gtcgatcaag cggcaaattt agtgtcatgc 2100
ttatcagatg aacaatatgg gcatgacaaa aagatgttat tggaagcggt aagagcggca 2160
aaacgcctca gccgagaacg caacttactt caagatccag attttaatac aatcaatagt 2220
acagaagaaa atggatggaa agcaagtaac ggcgttacta ttagcgaggg cggtccattc 2280
tataaaggcc gtgcgcttca gctagcaagc gcaagagaaa attacccaac atacatttat 2340
caaaaagtaa atgcatcaga gttaaagccg tatacacgtt atagactgga tgggttcgtg 2400
aagagtagtc aagatttaga aattgatctc attcaccatc ataaagtcca tctcgtgaaa 2460
aatgtaccag ataatttagt atccgatact tactcggatg gttcttgcag tggaatgaat 2520
cgatgtgagg aacaacagat ggtaaatgcg caactggaaa cagaacatca tcatccgatg 2580
gattgctgtg aagcggctca aacacatgag ttttcttcct atattaatac aggcgatcta 2640
aattcaagtg tagatcaagg catttgggtt gtattgaaag ttcgaacaac cgatggttat 2700
gcgacgctag gaaatcttga attggtagag gtcggaccgt tatcgggtga atctctagaa 2760
cgtgaacaaa gggataatgc gaaatggagt gcagagctag gaagaaagcg tgcagaaaca 2820
gatcgcgtgt atcaagatgc caaacaatcc atcaatcatt tatttgtgga ttatcaagat 2880
caacaattaa atccagaaat agggatggca gatattattg acgctcaaaa tcttgtcgca 2940
tcaatttcag atgtgtatag cgatgcagta ctgcaaatcc ctggaattaa ctatgagatt 3000
tacacagagc tatccaatcg cttacaacaa gcatcgtatc tgtatacgtc tcgaaatgcg 3060
gtgcaaaatg gggactttaa cagcggtcta gatagttgga atgcaacagg gggggctacg 3120
gtacaacagg atggcaatac gcatttctta gttctttctc attgggatgc acaagtttct 3180
caacaattta gagtgcagcc gaattgtaaa tatgtattac gtgtaacagc agagaaagta 3240
ggcggcggag acggatacgt gacaatccgg gatggtgctc atcatacaga aaagcttaca 3300
tttaatgcat gtgattatga tataaatggc acgtacgtga ctgataatac gtatctaaca 3360
aaagaagtgg tattctattc acatacagaa cacatgtggg tagaggtaag tgaaacagaa 3420
ggtgcatttc atatagatag tattgaattc gttgaaacag aaaagtaa 3468
<210> 6
<211> 3471
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 6
atgaatcaga acaagcacgg catcattggg gcctcgaact gcggctgcgc ctccgacgat 60
gtggctaagt accctctcgc taacaaccct tactccagcg ccctgaacct caattcctgc 120
cagaactcgt ctatcctcaa ttggattaac atcattgggg acgccgcgaa ggaggctgtc 180
agcatcggca ccacgattgt ttcactgatc acggccccgt ccctgacagg cctcatcagc 240
attgtgtacg acctcatcgg gaaggtccta ggcgggtcat ccggccagag catttcggac 300
ctgtcgatct gcgatctcct gtctatcatt gacctcaggg tgtctcagtc agtcctgaac 360
gacgggatcg ccgatttcaa tggctcagtg ctcctgtacc gcaactacct ggaggcgctc 420
gactcctgga acaagaatcc caactccgct agcgctgagg agctgaggac caggttcagg 480
attgccgact ccgagttcga tcgcatcctc actcgcggct cactgaccaa tggcggctcc 540
ctcgcccgcc agaacgctca gatcctcctg ctccctagct tcgcgtcggc tgccttcttc 600
cacctgctcc tgctcaggga cgctacgcgc tacggaacca actggggcct ctacaatgct 660
actccgttca taaactacca gtccaagctg gtcgagctga tcgagctgta caccgactac 720
tgcgttcact ggtacaatag ggggttcaac gagctgaggc agaggggcac gagcgctaca 780
gcttggctgg agttccatcg ctaccgcagg gagatgacgc tcatggttct ggacatcgtg 840
gccagcttca gctcgctcga tattactaac taccctatcg agaccgactt ccagctgtcg 900
cgcgtgattt acaccgaccc gatcgggttc gtccaccgct cttcactgag gggcgagtct 960
tggttctcat tcgtcaatag ggcgaacttc tcggacctcg agaatgctat cccgaacccc 1020
cggccatctt ggttcctgaa caatatgatc atttccactg gcagcctgac cctccccgtt 1080
tcgccatcta cggatcgcgc gagggtgtgg tacggctcac gggaccgcat ctcaccggct 1140
aactcccagt tcattacaga gctgatctct ggccagcaca caactgctac acagactatt 1200
ctgggccgga atatcttccg cgtggacagc caggcctgca atctcaacga taccacgtac 1260
ggcgtcaaca gggctgtttt ctaccatgac gcctcggagg gctctcagcg ctcagtctac 1320
gagggataca tcaggacaac tggcatcgat aatcctcggg tgcagaatat taacacgtac 1380
ctcccgggcg agaacagcga catccctacg ccggaggatt acacacacat tctgtcgacc 1440
acaatcaacc tcaccggcgg gctgaggcag gtcgcttcta acaggcgctc cagcctcgtt 1500
atgtacggct ggactcataa gtcactggcg cgcaacaaca caatcaaccc tgataggatc 1560
actcagattc cgctcaccaa ggtggacact agggggaccg gcgtgtcgta cgtcaacgat 1620
cccggcttca tcggcggggc cctgctccag cgcaccgacc acggctccct cggggttctg 1680
cgggtgcagt tcccactgca tctccgccag cagtacagga ttcgggtccg ctacgcgtcc 1740
acaactaaca tccgcctcag cgtgaatggg tcgttcggca cgatctccca gaacctgccc 1800
agcacaatga ggctcgggga ggacctgcgc tacggctcct tcgccattcg ggagttcaac 1860
acgagcatcc gccccacagc gtcgccagat cagattaggc tcactatcga gccaagcttc 1920
atcaggcagg aggtctacgt tgaccggatc gagttcattc ctgtcaaccc gacgagggag 1980
gctaaggagg atctggaggc tgctaagaag gctgtggcta gcctcttcac caggacgagg 2040
gacggcctgc aagtgaatgt caaggactac caggttgatc aggccgcgaa cctcgtgtcc 2100
tgcctgagcg acgagcagta cggctacgat aagaagatgc tgctcgaggc ggtcagggct 2160
gctaagaggc tctccaggga gaggaacctg ctccaggacc ctgatttcaa tacgatcaac 2220
agcacagagg agaacgggtg gaaggcgtct aatggcgtga ccatttcaga gggcggccca 2280
ttctacaagg gcagggctat ccagctggct tcggctcggg agaactaccc cacgtacatc 2340
taccagaagg tcgacgcctc tgagctgaag ccatacacac gctaccgcct ggatggcttc 2400
gtgaagtcgt ctcaggacct cgagatcgat ctgattcacc atcacaaggt ccacctggtt 2460
aagaatgtgc ccgacaacct ggtcctcgac acctacccag acgattcctg caatggcatc 2520
aacaggtgcg acgagcagaa gatggtgaac gcccagctcg agaccgagca tcaccatccg 2580
atggactgct gcgaggcggc tcagacgcac gagttctcat cctacattaa cacaggggac 2640
ctgaatgcca gcgtggatca gggcatctgg gtggtcctca aagtcaggac cacggacggg 2700
tacgctacgc tgggcaacct ggagctggtt gaagtggggc cactctcggg cgagtctctg 2760
gagagggagc agagggacaa cgccaagtgg agcgctgagc tgggcaggaa gagggctgag 2820
accgagaggg tctactacgc cgcgaagcag tcgatcaatc acctcttcgt ggactacagg 2880
gatcagcagc tgaaccccca gattggcatg gctgacatca tggatgccca gaacctcgtc 2940
gcgtcaatct ccgacgtgta ctccgatgcg gtcctgcaga tcccaggcat caactacgag 3000
atctacacgg agctgagcaa ccggctgcag caggcctcgt acctccacat gtctcgcaat 3060
gcgatgcaga acggggactt caattctggc ctggattcat ggaatgcgac tgctggggcc 3120
accgttcagc aggacggcaa cacccacttc ctggtgctct cccattggga tgcccaagtt 3180
agccagcagt tccgcgtgca gccgaactgc aagtacgtcc tgagggttac tgctgagaag 3240
gtcggcgggg gcgacggcta cgttaccatc cgcgatggcg ctcaccatac agagactctc 3300
accttcaacg cctgcgacta cgatatcaat ggcacgtacg tgacagacaa cacttacctg 3360
accaaggagg ttgtgttcca cccggagacc cagcatatgt gggtcgaggt tagcgagacg 3420
gagggcgtgt tccacataga cagcgttgag ttcatggaga cccagcagta g 3471
<210> 7
<211> 3471
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 7
atgaatcaga acaagcacgg catcattggg gcctcgaact gcggctgcgc ctccgacgat 60
gtggctaagt accctctcgc taacaaccct tactccagcg ccctgaacct caattcctgc 120
cagaactcgt ctatcctcaa ttggattaac atcattgggg acgccgcgaa ggaggctgtc 180
agcatcggca ccacgattgt ttcactgatc acggccccgt ccctgacagg cctcatcagc 240
attgtgtacg acctcatcgg gaaggtccta ggcgggtcat ccggccagag catttcggac 300
ctgtcgatct gcgatctcct gtctatcatt gacctcaggg tgtctcagtc agtcctgaac 360
gacgggatcg ccgatttcaa tggctcagtg ctcctgtacc gcaactacct ggaggcgctc 420
gactcctgga acaagaatcc caactccgct agcgctgagg agctgaggac caggttcagg 480
attgccgact ccgagttcga tcgcatcctc actcgcggct cactgaccaa tggcggctcc 540
ctcgcccgcc agaacgctca gatcctcctg ctccctagct tcgcgtcggc tgccttcttc 600
cacctgctcc tgctcaggga cgctacgcgc tacggaacca actggggcct ctacaatgct 660
actccgttca taaactacca gtccaagctg gtcgagctga tcgagctgta caccgactac 720
tgcgttcact ggtacaatag ggggttcaac gagctgaggc agaggggcac gagcgctaca 780
gcttggctgg agttccatcg ctaccgcagg gagatgacgc tcatggttct ggacatcgtg 840
gccagcttca gctcgctcga tattactaac taccctatcg agaccgactt ccagctgtcg 900
cgcgtgattt acaccgaccc gatcgggttc gtccaccgct cttcactgag gggcgagtct 960
tggttctcat tcgtcaatag ggcgaacttc tcggacctcg agaatgctat cccgaacccc 1020
cggccatctt ggttcctgaa caatatgatc atttccactg gcagcctgac cctccccgtt 1080
tcgccatcta cggatcgcgc gagggtgtgg tacggctcac gggaccgcat ctcaccggct 1140
aactcccagt tcattacaga gctgatctct ggccagcaca caactgctac acagactatt 1200
ctgggccgga atatcttccg cgtggacagc caggcctgca atctcaacga taccacgtac 1260
ggcgtcaaca gggctgtttt ctaccatgac gcctcggagg gctctcagcg ctcagtctac 1320
gagggataca tcaggacaac tggcatcgat aatcctcggg tgcagaatat taacacgtac 1380
ctcccgggcg agaacagcga catccctacg ccggaggatt acacacacat tctgtcgacc 1440
acaatcaacc tcaccggcgg gctgaggcag gtcgcttcta acaggcgctc cagcctcgtt 1500
atgtacggct ggactcataa gtcactggcg cgcaacaaca caatcaaccc tgataggatc 1560
actcagattc cgctcaccaa ggtggacact agggggaccg gcgtgtcgta cgtcaacgat 1620
cccggcttca tcggcggggc cctgctccag cgcaccgacc acggctccct cggggttctg 1680
cgggtgcagt tcccactgca tctccgccag cagtacagga ttcgggtccg ctacgcgtcc 1740
acaactaaca tccgcctcag cgtgaatggg tcgttcggca cgatctccca gaacctgccc 1800
agcacaatga ggctcgggga ggacctgcgc tacggctcct tcgccattcg ggagttcaac 1860
acgagcatcc gccccacagc gtcgccagat cagattaggc tcactatcga gccaagcttc 1920
atcaggcagg aggtctacgt tgaccggatc gagttcattc ctgtcaaccc gacgagggag 1980
gctaaggagg atctggaggc tgctaagaag gctgtggcta gcctcttcac caggacgagg 2040
gacggcctgc aagtgaatgt caaggactac caggttgatc aggccgcgaa cctcgtgtcc 2100
tgcctgagcg acgagcagta cggctacgat aagaagatgc tgctcgaggc ggtcagggct 2160
gctaagaggc tctccaggga gaggaacctg ctccaggacc ctgatttcaa tacgatcaac 2220
agcacagagg agaacgggtg gaaggcgtct aatggcgtga ccatttcaga gggcggccca 2280
ttctacaagg gcagggctat ccagctggct tcggctcggg agaactaccc cacgtacatc 2340
taccagaagg tcgacgcctc tgagctgaag ccatacacac gctaccgcct ggatggcttc 2400
gtgaagtcgt ctcaggacct cgagatcgat ctgattcacc atcacaaggt ccacctggtt 2460
aagaatgtgc ccgacaacct ggtcctcgac acctacccag acgattcctg caatggcatc 2520
aacaggtgcg acgagcagaa gatggtgaac gcccagctcg agaccgagca tcaccatccg 2580
atggactgct gcgaggcggc tcagacgcac gagttctcat cctacattaa cacaggggac 2640
ctgaatgcca gcgtggatca gggcatctgg gtggtcctca aagtcaggac cacggacggg 2700
tacgctacgc tgggcaacct ggagctggtt gaagtggggc cactctcggg cgagtctctg 2760
gagagggagc agagggacaa cgccaagtgg agcgctgagc tgggcaggaa gagggctgag 2820
accgagaggg tctactacgc cgcgaagcag tcgatcaatc acctcttcgt ggactacagg 2880
gatcagcagc tgaaccccca gattggcatg gctgacatca tggatgccca gaacctcgtc 2940
gcgtcaatct ccgacgtgta ctccgatgcg gtcctgcaga tcccaggcat caactacgag 3000
atctacacgg agctgagcaa ccggctgcag caggcctcgt acctccacat gtctcgcaat 3060
gcgatgcaga acggggactt caattctggc ctggattcat ggaatgcgac tgctggggcc 3120
accgttcagc aggacggcaa cacccacttc ctggtgctct cccattggga tgcccaagtt 3180
agccagcagt tccgcgtgca gccgaactgc aagtacgtcc tgagggttac tgctgagaag 3240
gtcggcgggg gcgacggcta cgttaccatc cgcgatggcg ctcaccatac agagactctc 3300
accttcaacg cctgcgacta cgatatcaat ggcacgtacg tgacagacaa cacttacctg 3360
accaaggagg ttgtgttcca cccggagacc cagcatatgt gggtcgaggt tagcgagacg 3420
gagggcgtgt tccacataga cagcgttgag ttcatggaga cccagcagta g 3471
<210> 8
<211> 3471
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 8
atgaatcaga acaagcacgg catcattggg gcctcgaact gcggctgcgc ctccgacgat 60
gtggctaagt accctctcgc taacaaccct tactccagcg ccctgaacct caattcctgc 120
cagaactcgt ctatcctcaa ttggattaac atcattgggg acgccgcgaa ggaggctgtc 180
agcatcggca ccacgattgt ttcactgatc acggccccgt ccctgacagg cctcatcagc 240
attgtgtacg acctcatcgg gaaggtccta ggcgggtcat ccggccagag catttcggac 300
ctgtcgatct gcgatctcct gtctatcatt gacctcaggg tgtctcagtc agtcctgaac 360
gacgggatcg ccgatttcaa tggctcagtg ctcctgtacc gcaactacct ggaggcgctc 420
gactcctgga acaagaatcc caactccgct agcgctgagg agctgaggac caggttcagg 480
attgccgact ccgagttcga tcgcatcctc actcgcggct cactgaccaa tggcggctcc 540
ctcgcccgcc agaacgctca gatcctcctg ctccctagct tcgcgtcggc tgccttcttc 600
cacctgctcc tgctcaggga cgctacgcgc tacggaacca actggggcct ctacaatgct 660
actccgttca taaactacca gtccaagctg gtcgagctga tcgagctgta caccgactac 720
tgcgttcact ggtacaatag ggggttcaac gagctgaggc agaggggcac gagcgctaca 780
gcttggctgg agttccatcg ctaccgcagg gagatgacgc tcatggttct ggacatcgtg 840
gccagcttca gctcgctcga tattactaac taccctatcg agaccgactt ccagctgtcg 900
cgcgtgattt acaccgaccc gatcgggttc gtccaccgct cttcactgag gggcgagtct 960
tggttctcat tcgtcaatag ggcgaacttc tcggacctcg agaatgctat cccgaacccc 1020
cggccatctt ggttcctgaa caatatgatc atttccactg gcagcctgac cctccccgtt 1080
tcgccatcta cggatcgcgc gagggtgtgg tacggctcac gggaccgcat ctcaccggct 1140
aactcccagt tcattacaga gctgatctct ggccagcaca caactgctac acagactatt 1200
ctgggccgga atatcttccg cgtggacagc caggcctgca atctcaacga taccacgtac 1260
ggcgtcaaca gggctgtttt ctaccatgac gcctcggagg gctctcagcg ctcagtctac 1320
gagggataca tcaggacaac tggcatcgat aatcctcggg tgcagaatat taacacgtac 1380
ctcccgggcg agaacagcga catccctacg ccggaggatt acacacacat tctgtcgacc 1440
acaatcaacc tcaccggcgg gctgaggcag gtcgcttcta acaggcgctc cagcctcgtt 1500
atgtacggct ggactcataa gtcactggcg cgcaacaaca caatcaaccc tgataggatc 1560
actcagattc cgctcaccaa ggtggacact agggggaccg gcgtgtcgta cgtcaacgat 1620
cccggcttca tcggcggggc cctgctccag cgcaccgacc acggctccct cggggttctg 1680
cgggtgcagt tcccactgca tctccgccag cagtacagga ttcgggtccg ctacgcgtcc 1740
acaactaaca tccgcctcag cgtgaatggg tcgttcggca cgatctccca gaacctgccc 1800
agcacaatga ggctcgggga ggacctgcgc tacggctcct tcgccattcg ggagttcaac 1860
acgagcatcc gccccacagc gtcgccagat cagattaggc tcactatcga gccaagcttc 1920
atcaggcagg aggtctacgt tgaccggatc gagttcattc ctgtcaaccc gacgagggag 1980
gctaaggagg atctggaggc tgctaagaag gctgtggcta gcctcttcac caggacgagg 2040
gacggcctgc aagtgaatgt caaggactac caggttgatc aggccgcgaa cctcgtgtcc 2100
tgcctgagcg acgagcagta cggctacgat aagaagatgc tgctcgaggc ggtcagggct 2160
gctaagaggc tctccaggga gaggaacctg ctccaggacc ctgatttcaa tacgatcaac 2220
agcacagagg agaacgggtg gaaggcgtct aatggcgtga ccatttcaga gggcggccca 2280
ttctacaagg gcagggctat ccagctggct tcggctcggg agaactaccc cacgtacatc 2340
taccagaagg tcgacgcctc tgagctgaag ccatacacac gctaccgcct ggatggcttc 2400
gtgaagtcgt ctcaggacct cgagatcgat ctgattcacc atcacaaggt ccacctggtt 2460
aagaatgtgc ccgacaacct ggtcctcgac acctacccag acgattcctg caatggcatc 2520
aacaggtgcg acgagcagaa gatggtgaac gcccagctcg agaccggaca tcaccatccg 2580
atggactgct gcgaggcggc tcagacgcac gagttctcat cctacattaa cacaggggac 2640
ctgaatgcca gcgtggatca gggcatctgg gtggtcctca aagtcaggac cacggacggg 2700
tacgctacgc tgggcaacct ggagctggtt gaagtggggc cactctcggg cgagtctctg 2760
gagagggagc agagggacaa cgccaagtgg agcgctgagc tgggcaggaa gagggctgag 2820
accgagaggg tctactacgc cgcgaagcag tcgatcaatc acctcttcgt ggactaccaa 2880
gatcagcagc tgaaccccca gattggcatg gctgacatca tggatgccca gaacctcgtc 2940
gcgtcaatct ccgacgtgta ctccgatgcg gtcctgcaga tcccaggcat caactacgag 3000
atctacacgg agctgagcaa ccggctgcag caggcctcgt acctccacac gtctcgcaat 3060
gcgatgcaga acggggactt caattctggc ctggattcat ggaatgcgac tgctggggcc 3120
accgttcagc aggacggcaa cacccacttc ctggtgctct cccattggga tgcccaagtt 3180
agccagcagt tccgcgtgca gccgaactgc aagtacgtcc tgagggttac tgctgagaag 3240
gtcggcgggg gcgacggcta cgttaccatc cgcgatggcg ctcaccatac agagactctc 3300
accttcaacg cctgcgacta cgatatcaat ggcacgtacg tgacagacaa cacttacctg 3360
accaaggagg ttgtgttcca cccggagacc cagcatatgt gggtcgaggt tagcgagacg 3420
gagggcgtgt tccacataga cagcgttgag ttcatggaga cccagcagta g 3471
<210> 9
<211> 3459
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 9
atgaacagga acaacccaaa cgagtacgag attattgatg ctccatactg cggctgcccc 60
tccgatgacg atgtgcgcta ccccctcgcc agcgacccga acgccgcgtt ccagaatatg 120
aactacaagg agtacctgca gacctacgac ggcgattaca cggggtcact gattaatcca 180
aacctctcca tcaatcctcg cgacgtcctc cagaccggaa tcaacattgt tggccgcatc 240
ctcggcttcc tgggcgtgcc gttcgctggc cagctggtta ccttctacac gttcctcctg 300
aaccagctct ggcctacgaa tgacaacgcg gtgtgggagg ccttcatggc gcagatcgag 360
gagctgattg atcagaagat ctccgctcag gtggtcagga acgccctcga cgatctgacc 420
ggcctccacg actactacga ggagtacctg gctgctctcg aggagtggct cgagaggcca 480
aacggcgctc gcgctaatct ggtcacgcag cgcttcgaga acctccatac cgccttcgtg 540
acgaggatgc cgagcttcgg gacaggcccc gggtcgcaga gggacgcggt tgctctcctg 600
actgtgtacg cgcaggcggc taacctgcac ctcctgctcc tgaaggatgc tgagatctac 660
ggcgctcggt gggggctgca gcagggccag atcaacctct acttcaatgc ccagcaggag 720
cgcacaagga tctacactaa ccactgcgtt gagacctaca atagggggct cgaggacgtg 780
cggggcacga acacagagag ctggctgaat taccatcgct tccgcaggga gatgacgctc 840
atggcgatgg acctcgtggc gctcttcccc tactacaacg tccgccagta cccaaatggc 900
gccaaccctc agctgacaag ggagatctac actgacccga tcgtgtacaa cccaccagct 960
aatcagggga tctgcaggcg ctggggcaac aatccctaca acaccttctc tgagctggag 1020
aatgcgttca ttaggccacc tcacctcttc gaccgcctga acaggctcac catctcccgg 1080
aatcgctaca cggctccaac cacgaactcg tacctggatt actggtctgg ccataccctc 1140
cagtcacagt acgcgaacaa tcctacaact tacgagacgt cctacggcca gattacaagc 1200
aacactcgcc tcttcaatac cacgaacggc gctaatgcta tcgacagcag ggcccggaac 1260
ttcgggaatc tgtacgcgaa tctctacggc gtctccagcc tgaacatttt cccaaccggc 1320
gttatgtcag agatcacctc cgcccctaac acgtgctggc aggacctcac aactaccgag 1380
gagctgccac tggtgaacaa taacttcaat ctcctgtccc acgtcacatt cctgaggttc 1440
aacacgacac agggcggccc actcgcgact gttggcttcg tgcccaccta cgtgtggacg 1500
cggcaggacg tcgatttcaa taacatcatt acaccaaacc gcatcactca gattcctgtt 1560
gtgaaggcgt acgagctgtc gtctggcgct acagtcgtta agggcccggg gttcactggc 1620
ggggacgtca ttaggaggac taacaccggc gggttcgggg ctatcagggt gagcgtcaca 1680
ggccccctca ctcagcgcta caggattcgg ttccgctacg cgtcgaccat cgacttcgat 1740
ttcttcgtca cgcgcggcgg gactaccatc aataacttcc ggttcacgcg caccatgaac 1800
aggggccagg agagccggta cgagtcgtac cgcaccgtgg agttcacgac accgttcaac 1860
ttcacacaga gccaggacat cattcgcact tctattcagg gcctgtcagg caacggggag 1920
gtttacctcg accggatcga gatcattcca gtgaacccaa ccagggaggc tgaggaggat 1980
ctcgaggctg cgaagaaggc tgtggcctcg ctgttcacta ggacccggga cggcctccag 2040
gttaatgtga cggactacca ggtggatcag gctgccaacc tggtctcgtg cctctctgac 2100
gagcagtacg ctcacgataa gaagatgctc ctggaggccg tccgcgctgc taagaggctg 2160
tcgagggaga ggaacctcct gcaggaccca gatttcaaca ccattaattc tacggaggag 2220
aacgggtgga aggcgtcgaa tggcgtgacc atctctgagg gcgggccttt ctacaagggc 2280
cgcgctctcc agctggcttc agctagggag aactacccga catacatcta ccagaaggtc 2340
gacgcctccg agctgaagcc ctacacgcgc taccgcctcg atggcttcgt gaagtcatcc 2400
caggacctgg agatcgatct cattcaccat cacaaggtcc acctggttaa gaacgtgctg 2460
gacaatctcg tcagcgatac ctacccggac gattcttgct caggcatcaa tcgctgcgag 2520
gagcagcaga tggtgaacgc ccagctcgag accgagcatc accatccgat ggactgctgc 2580
gaggctgctc agacgcatga gttcagctcg tacatcgaca caggggatct gaactccact 2640
gtggaccagg gcatctgggt catcttcaag gtgcgcacta ccgatgggta cgcgaccctc 2700
ggcaacctcg agctggtcga ggttgggccg ctcctgggcg agccactgga gagggagcag 2760
agggagaacg ctaagtggaa tgctgagctg ggcaggaagc gggctgagac cgaccgcgtc 2820
taccaggatg ctaagcagtc catcaatcac ctgttcgtgg actaccagga tcagcagctc 2880
aacccacaga ttggcatggc tgacatcatg gatgcccaga acctggtcgc gtccatcagc 2940
gacgtctact ctgatgccgt tctccagatc cctggcatta attacgagat ctacacagag 3000
ctgtcaaacc ggctccagca ggcctcctac ctgtacacta gccgcaacgc ggtgcagaat 3060
ggggacttca ataacggcct cgattcctgg aatgctacag ctggggctag cgtccagcag 3120
gacggcaaca ctcacttcct cgttctgtct cattgggatg cccaggtttc acagcagttc 3180
agggtgcagc cgaactgcaa gtatgtgctg agggttaccg ctgagaaggt tggcgggggc 3240
gacggctacg tgacgatcag ggatggcgct caccatacgg agacactgac tttcaacgcc 3300
tgcgactacg atatcaatgg cacctacgtc acggacaaca catacctcac taaggaggtc 3360
atattctaca gccacaccga gcatatgtgg gtggaggtca acgagacgga gggcgccttc 3420
cacatagact cgattgagtt cgtggagacc gagaagtga 3459
<210> 10
<211> 3468
<212>ДНК
<213>Искусственнаяпоследовательность
<220>
<223>Синтетическийген Cry
<400> 10
atgaatagga ataaccagga cgagtacgag atcattgacg cttcgacttg cgggtgcagc 60
tcagacgatg ttgttcagta ccccctcgct cgcgatccca atgccgtgtt ccagaacatg 120
cactacaagg actacctcca gacatacgac ggcgattaca ctgggtcgct cattaaccca 180
aatctgtcta tcaatcctcg cgacgtcctg cagacgggaa tcaacattgt tgggaggctc 240
ctgggcttcc tcggggttcc gttcgctggc cagctggtga cattctacac tttcctcctg 300
aaccagctct ggcccaccaa cgacaatgcg gtctgggagg ccttcatggc gcagatcgag 360
gagctgatta accagcgcat ctccgaggct gtggtcggca ccgctgctga tcacctcacg 420
gggctgcatg acaactacga gctttacgtg gaggctctcg aggagtggct ggagaggcca 480
aacgctgcta ggacgaacct cctgttcaat aggttcacca cgctcgactc cctgttcaca 540
cagttcatgc catcattcgg gactggcccc ggctcccaga actacgccgt ccctctcctg 600
accgtttacg cgcaggcggc taacctccac ctcctgctcc tgaaggacgc tgagatctac 660
ggcgctcgct gggggctgaa ccagaatcag atcaacagct tccacacaag gcagcaggag 720
cggacccagt actacacgaa tcattgcgtg acaacttaca acaccggcct cgataggctg 780
agggggacca atacggagtc ctggctcaac taccataggt tccgcaggga gatgaccctg 840
atggcgatgg acctcgtggc gctgttcccg tactacaacg tccggcagta cccaaacggc 900
gctaatccac agctcacccg cgagatctac acggacccaa tcgtcttcaa cccaccagct 960
aatgttggcc tgtgcaggcg ctgggggaac aatccttaca atcgcttcag cgagctggag 1020
aacgccttca tcaggccacc tcacctgttc gatcggctca atacactgac tatttcgagg 1080
aaccggttcg acgtcggcag caatttcatc gagccgtggt cgggccatac gctgaggagg 1140
tcctacagca acaattcaac agtgtacgag gattcctacg gccagattac cgctacgagg 1200
accacgatca acctccctgc caatggcaca gggcgggtgg agtctactgc tgtcgacttc 1260
cgctcagccc tggttggcat ctacggggtg aacagggcga gcttcatccc gggcggggtc 1320
ttcagcggca caactcagcc atcgaccggc gggtgcaggg acctctacga ttccagcgac 1380
gagctgccac cagacgagag cacgggctcg ttcgctcaca ggctctctca tgtcacattc 1440
ctgtcattca ccacgaacca ggctggctcg atcgccaatt ctgggagggt tccgacatac 1500
gtgtggactc accgggacgt ggatttcaac aataccatca acccaaatcg catcacgcag 1560
attcctgttg tgaaggcgta cgagctgtcc tccggcgcta ccgtcgttaa gggcccgggg 1620
ttcacgggcg gggacgtgat tcgcaggaca aacatcggcg ggttcggcgc tatcagggtc 1680
tccgttaccg gccccctgac gcagcgctac aggattcggt tccgctacgc ctccactatc 1740
gacttcgatt tcttcgtcac ccggggcggg acaactatca acaatttccg cttcacaagg 1800
actatgaaca ggggccagga gtcacggtac gagtcctacc gcaccgtgga gttcaccacg 1860
cccttcaact tcacgcagtc ccaggacatc attaggacat ccattcaggg cctcagcggc 1920
aacggggagg tttacctgga tcgcatcgag atcattccag tgaaccctac gagggaggct 1980
gaggaggacc tcgaggctgc gaagaaggct gtggctagcc tcttcaccag gacgagggat 2040
ggcctgcaag tgaatgtcac cgattaccag gtggaccagg ctgccaacct cgtctcttgc 2100
ctgtcagatg agcagtacgg ccacgacaag aagatgctcc tggaggccgt ccgcgctgct 2160
aagaggctgt ccagggagag gaacctcctg caggacccag atttcaacac aatcaatagc 2220
actgaggaga atggctggaa ggcgtccaac ggggtgacca tcagcgaggg cgggcctttc 2280
tacaagggcc gcgctctcca gctggcttcg gctagggaga attacccaac ttacatctac 2340
cagaaggtca acgcctctga gctgaagcct tacacgcgct accgcctgga tggcttcgtg 2400
aagtcatccc aggatctcga gatcgacctg attcaccatc acaaggtgca cctcgtcaag 2460
aacgttccgg acaatctggt cagcgatacg tactcggacg gctcgtgctc tgggatgaat 2520
cgctgcgagg agcagcagat ggtgaacgcg cagctcgaga cagagcatca ccatccgatg 2580
gactgctgcg aggccgcgca gactcatgag ttcagctcgt acattaatac cggcgatctg 2640
aactcttcag tcgaccaggg catctgggtg gtcctcaagg ttcgcacaac tgatggctac 2700
gccacgctgg ggaacctcga gctggttgaa gtgggcccac tctccgggga gagcctggag 2760
agggagcaga gggacaacgc gaagtggtcc gctgagctgg gcaggaagcg ggctgagacc 2820
gatagggttt accaggacgc taagcagtcc atcaatcacc tcttcgtgga ttaccaggac 2880
cagcagctga acccggagat tggcatggct gatatcattg acgcccagaa cctcgtcgcg 2940
tcaatctccg atgtctacag cgacgccgtt ctgcagatcc ccggcattaa ttacgagatc 3000
tacacggagc tgtcgaacag gctgcagcag gcctcgtacc tctacacatc tcggaacgcg 3060
gtgcagaatg gcgatttcaa ctctgggctg gactcatgga atgctaccgg cggggctacg 3120
gtgcagcagg atggcaacac ccacttcctc gtcctgtccc attgggacgc tcaggtgagc 3180
cagcagttcc gggtccagcc gaactgcaag tatgtgctga gggtcactgc tgagaaggtt 3240
ggcgggggcg atggctacgt gaccatcagg gacggggctc accatacaga gaagctcact 3300
ttcaacgcct gcgactacga tatcaatggc acctacgtca cggacaacac atacctaact 3360
aaggaggttg tgttctactc gcacactgag catatgtggg tcgaggtttc tgagaccgag 3420
ggcgccttcc acatagactc aattgagttc gtggagaccg agaagtga 3468
<210> 11
<211> 3507
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 11
atgaatagga ataaccagaa cgagtacgag gtcattgatg ctccccattg cggctgcccg 60
gcggacgatg ttgtgaagta cccactgacc gacgatccga acgccggcct gcagaacatg 120
aattacaagg agtacctcca gacctacggc ggggactaca ccgacccgct gatcaaccct 180
aatctctcgg tttctggcaa ggacgtgatt caggtcggaa tcaacattgt ggggcgcctc 240
ctgtccttct tcgggttccc attctccagc cagtgggtga cagtctacac ttacctcctg 300
aattcactgt ggcctgacga tgagaactcc gtttgggacg ccttcatgga gcgggtggag 360
gagctgatcg atcagaagat tagcgaggct gtcaagggcc gcgcgctcga cgatctgacc 420
gggctccagt acaactacaa cctctacgtg gaggcgctgg acgagtggct caacaggcca 480
aatggcgctc gggcctctct cgtgtcacag aggttcaaca tcctggattc cctcttcacc 540
cagttcatgc catccttcgg gagcggcccc gggagccaga attacgcgac gatcctcctg 600
cctgtgtacg ctcaggccgc gaacctgcac ctcctgctcc tgaaggacgc tgatatctac 660
ggcgccaggt gggggctcaa ccagacccag attgaccagt tccactctag gcagcagtca 720
ctcacccaga cgtacacaaa ccattgcgtg acagcctaca atgacggcct ggctgagctg 780
agggggactt cggtcgcctc ttggctgaag taccaccagt accgcaggga gatgactgtc 840
accgcgatgg acctggttgc tctcttccca tactacaacg tgcgccagta cccgaacggc 900
gcgaatcccc agctcaccag ggaggtgtac acggacccaa tcgtcttcaa cccaccagag 960
aggccttctg gcgctttctg cgagtcattc tacaccatca gggctgctag ggagaggctg 1020
acgttctccc agctcgagca cgcgatcatt cgcccaccta ggctgttcga gcggttccag 1080
gctctcggca tctacacagg ggaggcccgc ctcaacgcta attccgcccc gatgaattac 1140
tggatcggcc atttcattag gaacacgagg ctgggggaca gcaccacgat cacaactaat 1200
tacggcacca cgaacaatag gctcaccaac ttctcaatgc cctccgacgt ctaccagatc 1260
aactccacgt cgtctaatct cgcggctatt ctgggcacac tctacggggt gactcgcgcc 1320
cagttccact tcggctcagg gtccttcagc acctacgtgg gccagaacag cgtcctgccg 1380
cagtgccatc agaactacaa tagcatcgag gagctgccaa accagtcgga cgagcctacc 1440
gttcgctcgt actctcacag gctgtcccat atcacgagct tcaacttcaa tgtgcagctg 1500
aacaatccgc tcatttctgc gggcaacatg cccgtttacg tgtggaccca caggtcagtc 1560
gacctgacga accggatctc atccgatcgc atcacccaga ttccggtggt caaggcttac 1620
gagctgtcct ccggcgctac agttgtgaag ggccccgggt tcactggcgg ggacgtgatc 1680
aggaggacga acacaggcgg gttcggcgcg attagggtct cggttaccgg gccgctcacg 1740
cagcgctacc gcatccgctt ccgctacgct tctaccattg acttcgattt cttcgtcacg 1800
cggggcggga caactatcaa caatttcagg ttcactcgga ccatgaacag gggccaggag 1860
tcgcggtacg agtcttaccg caccgtggag ttcaccacgc ccttcaactt cacacagtcc 1920
caggacatca ttcgcacttc aatccagggc ctgtccggca atggggaggt ctacctcgac 1980
cgcattgaga tcattccggt taaccccacg agggaggctg aggaggatct ggaggctgcg 2040
aagaaggcgg tggctagcct gttcacgagg acacgggacg gcctccaagt gaatgtcaag 2100
gactaccagg tcgatcaggc tgccaacctg gttagctgcc tctcggacga gcagtacggc 2160
tacgataaga agatgctcct ggaggccgtg cgcgctgcta agaggctctc gagggagagg 2220
aacctcctgc aggacccgga tttcaacaca atcaattcta ctgaggagaa cggctggaag 2280
gcttccaatg gggtgaccat tagcgagggc ggcccattct acaagggcag ggccctccag 2340
ctggcttcag ctcgggagaa ctacccaaca tacatctacc agaaggtcga cgccagcgag 2400
ctgaagcctt acactcgcta ccgcctcgat ggcttcgtga agtcttcaca ggacctggag 2460
atcgatctca ttcaccatca caaggttcac ctggtgaaga acgtcccgga caatctcgtc 2520
tccgatacgt accccgacga ttcatgctcc ggcatcaata ggtgccagga gcagcagatg 2580
gtgaacgccc agctggagac agagcatcac catccgatgg actgctgcga ggccgcgcag 2640
actcatgagt tctccagcta catcgacaca ggcgatctga acagcactgt ggaccagggg 2700
atctgggtca ttttcaaggt taggacaact gatggctacg cgaccctcgg gaacctcgag 2760
ctggttgaag tgggcccact cctgggggag cctctggaga gggagcagag ggagaacgcg 2820
aagtggaatg ctgagctggg caggaagcgg gctgagaccg accgcgtcta ccaggatgcc 2880
aagcagagca tcaatcacct gttcgttgac taccaggatc agcagctcaa cccagagatc 2940
ggcatggccg acattatgga tgcgcagaac ctggtcgcta gcatctcgga cgtttactcg 3000
gatgccgtgc tccagatccc tggcattaat tacgagatct acaccgagct gagcaacagg 3060
ctccagcagg cgagctacct gtacacgtcg cggaacgctg tgcagaatgg cgacttcaac 3120
aatgggctcg attcttggaa tgctaccgct ggcgcttcag tgcagcagga cgggaacacg 3180
cacttcctcg tcctgtcgca ttgggatgcc caggtttctc agcagttccg ggtgcagccg 3240
aactgcaagt atgtgctcag ggtgacagct gagaaagtgg gcgggggcga cggctacgtc 3300
actatccgcg acgatgccca ccatactgag accctgacgt tcaacgcgtg cgactacgat 3360
atcaatggca cctacgtcac ggacaacaca tacatcacta aggaggtcgt tttctactcc 3420
cacacagatc atatgtgggt cgaggttagc gagactgagg gcgccttcca catcgactcg 3480
cttgagttcg tggagaccga gaagtga 3507
<210> 12
<211> 3471
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 12
atgaatcaga acaagcacgg catcattggg gcctcgaact gcggctgcgc ctccgacgat 60
gtggctaagt accctctcgc taacaaccct tactccagcg ccctgaacct caattcctgc 120
cagaactcgt ctatcctcaa ttggattaac atcattgggg acgccgcgaa ggaggctgtc 180
agcatcggca ccacgattgt ttcactgatc acggccccgt ccctgacagg cctcatcagc 240
attgtgtacg acctcatcgg gaaggtcatc ggcgggtcat ccggccagag catttcggac 300
ctgtcgatct gcgatctcct gtctatcatt gacctcaggg tgtctcagtc agtcctgaac 360
gacgggatcg ccgatttcaa tggctcagtg ctcctgtacc gcaactacct ggaggcgctc 420
gactcctgga acaagaatcc caactccgct agcgctgagg agctgaggac caggttcagg 480
attgccgact ccgagttcga tcgcatcctc actcgcggct cactgaccaa tggcggctcc 540
ctcgcccgcc agaacgctca gatcctcctg ctccctagct tcgcgtcggc tgccttcttc 600
cacctgctcc tgctcaggga cgctacgcgc tacggaacca actggggcct ctacaatgct 660
actccgttca taaactacca gtccaagctg gtcgagctga tcgagctgta caccgactac 720
tgcgttcact ggtacaatag ggggttcaac gagctgaggc agaggggcac gagcgctaca 780
gcttggctgg agttccatcg ctaccgcagg gagatgacgc tcatggttct ggacatcgtg 840
gccagcttca gctcgctcga tattactaac taccctatcg agaccgactt ccagctgtcg 900
cgcgtgattt acaccgaccc gatcgggttc gtccaccgct cttcactgag gggcgagtct 960
tggttctcat tcgtcaatag ggcgaacttc tcggacctcg agaatgctat cccgaacccc 1020
cggccatctt ggttcctgaa caatatgatc atttccactg gcagcctgac cctccccgtt 1080
tcgccatcta cggatcgcgc gagggtgtgg tacggctcac gggaccgcat ctcaccggct 1140
aactcccagt tcattacaga gctgatctct ggccagcaca caactgctac acagactatt 1200
ctgggccgga atatcttccg cgtggacagc caggcctgca atctcaacga taccacgtac 1260
ggcgtcaaca gggctgtttt ctaccatgac gcctcggagg gctctcagcg ctcagtctac 1320
gagggataca tcaggacaac tggcatcgat aatcctcggg tgcagaatat taacacgtac 1380
ctcccgggcg agaacagcga catccctacg ccggaggatt acacacacat tctgtcgacc 1440
acaatcaacc tcaccggcgg gctgaggcag gtcgcttcta acaggcgctc cagcctcgtt 1500
atgtacggct ggactcataa gtcactggcg cgcaacaaca caatcaaccc tgataggatc 1560
actcagattc cgctcaccaa ggtggacact agggggaccg gcgtgtcgta cgtcaacgat 1620
cccggcttca tcggcggggc cctgctccag cgcaccgacc acggctccct cggggttctg 1680
cgggtgcagt tcccactgca tctccgccag cagtacagga ttcgggtccg ctacgcgtcc 1740
acaactaaca tccgcctcag cgtgaatggg tcgttcggca cgatctccca gaacctgccc 1800
agcacaatga ggctcgggga ggacctgcgc tacggctcct tcgccattcg ggagttcaac 1860
acgagcatcc gccccacagc gtcgccagat cagattaggc tcactatcga gccaagcttc 1920
atcaggcagg aggtctacgt tgaccggatc gagttcattc ctgtcaaccc gacgagggag 1980
gctaaggagg atctggaggc tgctaagaag gctgtggcta gcctcttcac caggacgagg 2040
gacggcctgc aagtgaatgt caaggactac caggttgatc aggccgcgaa cctcgtgtcc 2100
tgcctgagcg acgagcagta cggctacgat aagaagatgc tgctcgaggc ggtcagggct 2160
gctaagaggc tctccaggga gaggaacctg ctccaggacc ctgatttcaa tacgatcaac 2220
agcacagagg agaacgggtg gaaggcgtct aatggcgtga ccatttcaga gggcggccca 2280
ttctacaagg gcagggctat ccagctggct tcggctcggg agaactaccc cacgtacatc 2340
taccagaagg tcgacgcctc tgagctgaag ccatacacac gctaccgcct ggatggcttc 2400
gtgaagtcgt ctcaggacct cgagatcgat ctgattcacc atcacaaggt ccacctggtt 2460
aagaatgtgc ccgacaacct ggtcctcgac acctacccag acgattcctg caatggcatc 2520
aacaggtgcg acgagcagaa gatggtgaac gcccagctcg agaccgagca tcaccatccg 2580
atggactgct gcgaggcggc tcagacgcac gagttctcat cctacattaa cacaggggac 2640
ctgaatgcca gcgtggatca gggcatctgg gtggtcctca aagtcaggac cacggacggg 2700
tacgctacgc tgggcaacct ggagctggtt gaagtggggc cactctcggg cgagtctctg 2760
gagagggagc agagggacaa cgccaagtgg agcgctgagc tgggcaggaa gagggctgag 2820
accgagaggg tctactacgc cgcgaagcag tcgatcaatc acctcttcgt ggactacagg 2880
gatcagcagc tgaaccccca gattggcatg gctgacatca tggatgccca gaacctcgtc 2940
gcgtcaatct ccgacgtgta ctccgatgcg gtcctgcaga tcccaggcat caactacgag 3000
atctacacgg agctgagcaa ccggctgcag caggcctcgt acctccacat gtctcgcaat 3060
gcgatgcaga acggggactt caattctggc ctggattcat ggaatgcgac tgctggggcc 3120
accgttcagc aggacggcaa cacccacttc ctggtgctct cccattggga tgcccaagtt 3180
agccagcagt tccgcgtgca gccgaactgc aagtacgtcc tgagggttac tgctgagaag 3240
gtcggcgggg gcgacggcta cgttaccatc cgcgatggcg ctcaccatac agagactctc 3300
accttcaacg cctgcgacta cgatatcaat ggcacgtacg tgacagacaa cacttacctg 3360
accaaggagg ttgtgttcca cccggagacc cagcatatgt gggtcgaggt tagcgagacg 3420
gagggcgtgt tccacctgga cagcgttgag ttcatggaga cccagcagta g 3471
<210> 13
<211> 3471
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 13
atgaatcaga acaagcacgg catcattggg gcctcgaact gcggctgcgc ctccgacgat 60
gtggctaagt accctctcgc taacaaccct tactccagcg ccctgaacct caattcctgc 120
cagaactcgt ctatcctcaa ttggattaac atcattgggg acgccgcgaa ggaggctgtc 180
agcatcggca ccacgattgt ttcactgatc acggccccgt ccctgacagg cctcatcagc 240
attgtgtacg acctcatcgg gaaggtcatc ggcgggtcat ccggccagag catttcggac 300
ctgtcgatct gcgatctcct gtctatcatt gacctcaggg tgtctcagtc agtcctgaac 360
gacgggatcg ccgatttcaa tggctcagtg ctcctgtacc gcaactacct ggaggcgctc 420
gactcctgga acaagaatcc caactccgct agcgctgagg agctgaggac caggttcagg 480
attgccgact ccgagttcga tcgcatcctc actcgcggct cactgaccaa tggcggctcc 540
ctcgcccgcc agaacgctca gatcctcctg ctccctagct tcgcgtcggc tgccttcttc 600
cacctgctcc tgctcaggga cgctacgcgc tacggaacca actggggcct ctacaatgct 660
actccgttca taaactacca gtccaagctg gtcgagctga tcgagctgta caccgactac 720
tgcgttcact ggtacaatag ggggttcaac gagctgaggc agaggggcac gagcgctaca 780
gcttggctgg agttccatcg ctaccgcagg gagatgacgc tcatggttct ggacatcgtg 840
gccagcttca gctcgctcga tattactaac taccctatcg agaccgactt ccagctgtcg 900
cgcgtgattt acaccgaccc gatcgggttc gtccaccgct cttcactgag gggcgagtct 960
tggttctcat tcgtcaatag ggcgaacttc tcggacctcg agaatgctat cccgaacccc 1020
cggccatctt ggttcctgaa caatatgatc atttccactg gcagcctgac cctccccgtt 1080
tcgccatcta cggatcgcgc gagggtgtgg tacggctcac gggaccgcat ctcaccggct 1140
aactcccagt tcattacaga gctgatctct ggccagcaca caactgctac acagactatt 1200
ctgggccgga atatcttccg cgtggacagc caggcctgca atctcaacga taccacgtac 1260
ggcgtcaaca gggctgtttt ctaccatgac gcctcggagg gctctcagcg ctcagtctac 1320
gagggataca tcaggacaac tggcatcgat aatcctcggg tgcagaatat taacacgtac 1380
ctcccgggcg agaacagcga catccctacg ccggaggatt acacacacat tctgtcgacc 1440
acaatcaacc tcaccggcgg gctgaggcag gtcgcttcta acaggcgctc cagcctcgtt 1500
atgtacggct ggactcataa gtcactggcg cgcaacaaca caatcaaccc tgataggatc 1560
actcagattc cgctcaccaa ggtggacact agggggaccg gcgtgtcgta cgtcaacgat 1620
cccggcttca tcggcggggc cctgctccag cgcaccgacc acggctccct cggggttctg 1680
cgggtgcagt tcccactgca tctccgccag cagtacagga ttcgggtccg ctacgcgtcc 1740
acaactaaca tccgcctcag cgtgaatggg tcgttcggca cgatctccca gaacctgccc 1800
agcacaatga ggctcgggga ggacctgcgc tacggctcct tcgccattcg ggagttcaac 1860
acgagcatcc gccccacagc gtcgccagat cagattaggc tcactatcga gccaagcttc 1920
atcaggcagg aggtctacgt tgaccggatc gagttcattc ctgtcaaccc gacgagggag 1980
gctaaggagg atctggaggc tgctaagaag gctgtggcta gcctcttcac caggacgagg 2040
gacggcctgc aagtgaatgt caaggactac caggttgatc aggccgcgaa cctcgtgtcc 2100
tgcctgagcg acgagcagta cggctacgat aagaagatgc tgctcgaggc ggtcagggct 2160
gctaagaggc tctccaggga gaggaacctg ctccaggacc ctgatttcaa tacgatcaac 2220
agcacagagg agaacgggtg gaaggcgtct aatggcgtga ccatttcaga gggcggccca 2280
ttctacaagg gcagggctat ccagctggct tcggctcggg agaactaccc cacgtacatc 2340
taccagaagg tcgacgcctc tgagctgaag ccatacacac gctaccgcct ggatggcttc 2400
gtgaagtcgt ctcaggacct cgagatcgat ctgattcacc atcacaaggt ccacctggtt 2460
aagaatgtgc ccgacaacct ggtcctcgac acctacccag acgattcctg caatggcatc 2520
aacaggtgcg acgagcagaa gatggtgaac gcccagctcg agaccggaca tcaccatccg 2580
atggactgct gcgaggcggc tcagacgcac gagttctcat cctacattaa cacaggggac 2640
ctgaatgcca gcgtggatca gggcatctgg gtggtcctca aagtcaggac cacggacggg 2700
tacgctacgc tgggcaacct ggagctggtt gaagtggggc cactctcggg cgagtctctg 2760
gagagggagc agagggacaa cgccaagtgg agcgctgagc tgggcaggaa gagggctgag 2820
accgagaggg tctactacgc cgcgaagcag tcgatcaatc acctcttcgt ggactaccaa 2880
gatcagcagc tgaaccccca gattggcatg gctgacatca tggatgccca gaacctcgtc 2940
gcgtcaatct ccgacgtgta ctccgatgcg gtcctgcaga tcccaggcat caactacgag 3000
atctacacgg agctgagcaa ccggctgcag caggcctcgt acctccacac gtctcgcaat 3060
gcgatgcaga acggggactt caattctggc ctggattcat ggaatgcgac tgctggggcc 3120
accgttcagc aggacggcaa cacccacttc ctggtgctct cccattggga tgcccaagtt 3180
agccagcagt tccgcgtgca gccgaactgc aagtacgtcc tgagggttac tgctgagaag 3240
gtcggcgggg gcgacggcta cgttaccatc cgcgatggcg ctcaccatac agagactctc 3300
accttcaacg cctgcgacta cgatatcaat ggcacgtacg tgacagacaa cacttacctg 3360
accaaggagg ttgtgttcca cccggagacc cagcatatgt gggtcgaggt tagcgagacg 3420
gagggcgtgt tccacctgga cagcgttgag ttcatggaga cccagcagta g 3471
<210> 14
<211> 5919
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 14
atggacctgg atgggaataa gacagagaca gagaccgaga ttgtgaatgg gagcgagagc 60
agcattgacc cgagcagcgt ttcgtacgct gggaacaata gctactccag cgccctgaac 120
ctcaattcgt gccagaatag gggcatcgct cagtgggtta acacgctggg cggggctatt 180
gggcaggccg tgagcatcgg cacatctatc atttcactcc tggccgcgcc gacactcact 240
gggtctattt cactggcctt caatctcatc aggaggatgg ggaccggctc caacggctcg 300
tctatttccg acctgagcat ctgcgatctc ctgagcatca ttaacctgcg ggtttcgcag 360
gctgtgctca acgacgggat cgctgatttc aatggctccg ttgctgtgta cgacctgtac 420
ctccacgccc tgcgcagctg gaacaataac cctaacgctg ctactgctga ggagctgagg 480
acccgcttca ggatcgccga ttcggagttc gagaggattc tgacgagggg ctcgctcaca 540
catggcggct ccctcgcccg ccaggacgct caggtcctcc tgctcccgtc cttcgttaac 600
gcggcttacc tgcacctgct catcctccgc gatgcttcgc gctacggggc ctcttggggc 660
ctcttcaaca ccacgccgca tatcaattac cccgtgaggc tgcagcagct cattggcagc 720
tacacgcact actgcacaca ttggtacaac caggggctga atgagatccg gcagcgcggc 780
aacactgccg tgaattggct cgagttccac cgctaccgcc gcgacatgac gctgatggtc 840
ctcgatgtgg tctcgctgtt ctctgccctc gacacgatcc gctacccgaa cgctacagtt 900
gtgcagctca gccgcactgt ctacaccgat ccgattggct tcgttaaccg cgggtcaggc 960
aataggctgt cctggttcga ctggaggaac caggcgaatt tctctactct cgagtcagag 1020
atgccgaccc cctcatcccc actgagcctc aaccacatgt cgatcttcac tgggcctctg 1080
accctcccag tgtcccctaa cacgcatagg gcccgggtct ggtacggcaa ccagaatatg 1140
ttcacaactg ggtcacagaa ctccggccag accacgaact ctattcagaa tatctcaggc 1200
ctggagattt tccgcatcga ctctcaggcg tgcaatctca ataacaattc atacggcgtg 1260
aacagggcgg agttcttcca cggggctagc cagggctcgc agcggtctgt ctaccaggga 1320
tacatccgcc agagcggcct ggacaaccct gtcgttatga atctgcagtc tttcctccca 1380
ggcgagaact cagccacccc tacggcgcag gattacaccc acattctgtc caacccggtt 1440
aatatcaggg gcgggctcag gcagattgtg gccgacaggc gctcctccgt ggtcgtttac 1500
ggctggacgc acaagtccct gagcaggagg tcactcgtgg ctccagacca gatcacccag 1560
gtcccagccg ttaaggcgtc cccttcttca cattgcacta tcattgccgg cccaggcttc 1620
accggcgggg acctggtgtc gctccagccc aacggccagc tcgtcatccc gttccaggtt 1680
tctgcgcccg agacgaacta ccacattcgc atctgctacg tctcgacgtc tgattgcagc 1740
attaacacaa tctgcaatga cgagacgcat ctgtccacac tcccgagcac aacttccagc 1800
ctggagaacc tccagtgcaa tcacctgcat tacttcaacg tgggcacttt caagccaacc 1860
atcgactcga agctgacgct cgtcaacaca tctcctaacg ctaacatcat tatcgacaag 1920
atcgagttca tcccggtgga taccgcccag cagcagaacg aggacctcga ggccgcgaag 1980
aaggctgtcg cctccctgtt cacacgcact agggacggcc tccaggtcaa tgttaaggac 2040
taccaggtgg atcaggctgc caacctggtc tcatgcctct ccgacgagca gtacggctac 2100
gataagaaga tgctgctcga ggccgtgagg gctgctaaga ggctgagcag ggagaggaac 2160
ctgctccagg accccgattt caacacaatc aactcgaccg aggagaacgg gtggaaggcg 2220
tcaaatggcg tcaccatctc cgagggcggg ccattctaca agggcagggc tattcagctc 2280
gcgtctgctc gggagaacta ccccacatac atctaccaga aggtggatgc ctccgagctg 2340
aagccataca cccgctaccg cctcgacggc ttcgtcaagt cgtctcagga cctggagatt 2400
gatctcatcc accatcacaa ggtgcacctg gtcaagaacg ttccggacaa tctcgtgagc 2460
atgaacagga acaacccaaa cgagtacgag attattgatg ctccatactg cggctgcccc 2520
tccgatgacg atgtgcgcta ccccctcgcc agcgacccga acgccgcgtt ccagaatatg 2580
aactacaagg agtacctgca gacctacgac ggcgattaca cggggtcact gattaatcca 2640
aacctctcca tcaatcctcg cgacgtcctc cagaccggaa tcaacattgt tggccgcatc 2700
ctcggcttcc tgggcgtgcc gttcgctggc cagctggtta ccttctacac gttcctcctg 2760
aaccagctct ggcctacgaa tgacaacgcg gtgtgggagg ccttcatggc gcagatcgag 2820
gagctgattg atcagaagat ctccgctcag gtggtcagga acgccctcga cgatctgacc 2880
ggcctccacg actactacga ggagtacctg gctgctctcg aggagtggct cgagaggcca 2940
aacggcgctc gcgctaatct ggtcacgcag cgcttcgaga acctccatac cgccttcgtg 3000
acgaggatgc cgagcttcgg gacaggcccc gggtcgcaga gggacgcggt tgctctcctg 3060
actgtgtacg cgcaggcggc taacctgcac ctcctgctcc tgaaggatgc tgagatctac 3120
ggcgctcggt gggggctgca gcagggccag atcaacctct acttcaatgc ccagcaggag 3180
cgcacaagga tctacactaa ccactgcgtt gagacctaca atagggggct cgaggacgtg 3240
cggggcacga acacagagag ctggctgaat taccatcgct tccgcaggga gatgacgctc 3300
atggcgatgg acctcgtggc gctcttcccc tactacaacg tccgccagta cccaaatggc 3360
gccaaccctc agctgacaag ggagatctac actgacccga tcgtgtacaa cccaccagct 3420
aatcagggga tctgcaggcg ctggggcaac aatccctaca acaccttctc tgagctggag 3480
aatgcgttca ttaggccacc tcacctcttc gaccgcctga acaggctcac catctcccgg 3540
aatcgctaca cggctccaac cacgaactcg tacctggatt actggtctgg ccataccctc 3600
cagtcacagt acgcgaacaa tcctacaact tacgagacgt cctacggcca gattacaagc 3660
aacactcgcc tcttcaatac cacgaacggc gctaatgcta tcgacagcag ggcccggaac 3720
ttcgggaatc tgtacgcgaa tctctacggc gtctccagcc tgaacatttt cccaaccggc 3780
gttatgtcag agatcacctc cgcccctaac acgtgctggc aggacctcac aactaccgag 3840
gagctgccac tggtgaacaa taacttcaat ctcctgtccc acgtcacatt cctgaggttc 3900
aacacgacac agggcggccc actcgcgact gttggcttcg tgcccaccta cgtgtggacg 3960
cggcaggacg tcgatttcaa taacatcatt acaccaaacc gcatcactca gattcctgtt 4020
gtgaaggcgt acgagctgtc gtctggcgct acagtcgtta agggcccggg gttcactggc 4080
ggggacgtca ttaggaggac taacaccggc gggttcgggg ctatcagggt gagcgtcaca 4140
ggccccctca ctcagcgcta caggattcgg ttccgctacg cgtcgaccat cgacttcgat 4200
ttcttcgtca cgcgcggcgg gactaccatc aataacttcc ggttcacgcg caccatgaac 4260
aggggccagg agagccggta cgagtcgtac cgcaccgtgg agttcacgac accgttcaac 4320
ttcacacaga gccaggacat cattcgcact tctattcagg gcctgtcagg caacggggag 4380
gtttacctcg accggatcga gatcattcca gtgaacccaa ccagggaggc tgaggaggat 4440
ctcgaggctg cgaagaaggc tgtggcctcg ctgttcacta ggacccggga cggcctccag 4500
gttaatgtga cggactacca ggtggatcag gctgccaacc tggtctcgtg cctctctgac 4560
gagcagtacg ctcacgataa gaagatgctc ctggaggccg tccgcgctgc taagaggctg 4620
tcgagggaga ggaacctcct gcaggaccca gatttcaaca ccattaattc tacggaggag 4680
aacgggtgga aggcgtcgaa tggcgtgacc atctctgagg gcgggccttt ctacaagggc 4740
cgcgctctcc agctggcttc agctagggag aactacccga catacatcta ccagaaggtc 4800
gacgcctccg agctgaagcc ctacacgcgc taccgcctcg atggcttcgt gaagtcatcc 4860
caggacctgg agatcgatct cattcaccat cacaaggtcc acctggttaa gaacgtgctg 4920
gacaatctcg tcagcgatac ctacccggac gattcttgct caggcatcaa tcgctgcgag 4980
gagcagcaga tggtgaacgc ccagctcgag accgagcatc accatccgat ggactgctgc 5040
gaggctgctc agacgcatga gttcagctcg tacatcgaca caggggatct gaactccact 5100
gtggaccagg gcatctgggt catcttcaag gtgcgcacta ccgatgggta cgcgaccctc 5160
ggcaacctcg agctggtcga ggttgggccg ctcctgggcg agccactgga gagggagcag 5220
agggagaacg ctaagtggaa tgctgagctg ggcaggaagc gggctgagac cgaccgcgtc 5280
taccaggatg ctaagcagtc catcaatcac ctgttcgtgg actaccagga tcagcagctc 5340
aacccacaga ttggcatggc tgacatcatg gatgcccaga acctggtcgc gtccatcagc 5400
gacgtctact ctgatgccgt tctccagatc cctggcatta attacgagat ctacacagag 5460
ctgtcaaacc ggctccagca ggcctcctac ctgtacacta gccgcaacgc ggtgcagaat 5520
ggggacttca ataacggcct cgattcctgg aatgctacag ctggggctag cgtccagcag 5580
gacggcaaca ctcacttcct cgttctgtct cattgggatg cccaggtttc acagcagttc 5640
agggtgcagc cgaactgcaa gtatgtgctg agggttaccg ctgagaaggt tggcgggggc 5700
gacggctacg tgacgatcag ggatggcgct caccatacgg agacactgac tttcaacgcc 5760
tgcgactacg atatcaatgg cacctacgtc acggacaaca catacctcac taaggaggtc 5820
ctcttctaca gccacaccga gcatatgtgg gtggaggtca acgagacgga gggcgccttc 5880
cacctcgact cgattgagtt cgtggagacc gagaagtga 5919
<210> 15
<211> 3468
<212>ДНК
<213>Искусственнаяпоследовательность
<220>
<223>Синтетическийген Cry
<400> 15
atgaatagga ataaccagga cgagtacgag atcattgacg cttcgacttg cgggtgcagc 60
tcagacgatg ttgttcagta ccccctcgct cgcgatccca atgccgtgtt ccagaacatg 120
cactacaagg actacctcca gacatacgac ggcgattaca ctgggtcgct cattaaccca 180
aatctgtcta tcaatcctcg cgacgtcctg cagacgggaa tcaacattgt tgggaggctc 240
ctgggcttcc tcggggttcc gttcgctggc cagctggtga cattctacac tttcctcctg 300
aaccagctct ggcccaccaa cgacaatgcg gtctgggagg ccttcatggc gcagatcgag 360
gagctgatta accagcgcat ctccgaggct gtggtcggca ccgctgctga tcacctcacg 420
gggctgcatg acaactacga gctttacgtg gaggctctcg aggagtggct ggagaggcca 480
aacgctgcta ggacgaacct cctgttcaat aggttcacca cgctcgactc cctgttcaca 540
cagttcatgc catcattcgg gactggcccc ggctcccaga actacgccgt ccctctcctg 600
accgtttacg cgcaggcggc taacctccac ctcctgctcc tgaaggacgc tgagatctac 660
ggcgctcgct gggggctgaa ccagaatcag atcaacagct tccacacaag gcagcaggag 720
cggacccagt actacacgaa tcattgcgtg acaacttaca acaccggcct cgataggctg 780
agggggacca atacggagtc ctggctcaac taccataggt tccgcaggga gatgaccctg 840
atggcgatgg acctcgtggc gctgttcccg tactacaacg tccggcagta cccaaacggc 900
gctaatccac agctcacccg cgagatctac acggacccaa tcgtcttcaa cccaccagct 960
aatgttggcc tgtgcaggcg ctgggggaac aatccttaca atcgcttcag cgagctggag 1020
aacgccttca tcaggccacc tcacctgttc gatcggctca atacactgac tatttcgagg 1080
aaccggttcg acgtcggcag caatttcatc gagccgtggt cgggccatac gctgaggagg 1140
tcctacagca acaattcaac agtgtacgag gattcctacg gccagattac cgctacgagg 1200
accacgatca acctccctgc caatggcaca gggcgggtgg agtctactgc tgtcgacttc 1260
cgctcagccc tggttggcat ctacggggtg aacagggcga gcttcatccc gggcggggtc 1320
ttcagcggca caactcagcc atcgaccggc gggtgcaggg acctctacga ttccagcgac 1380
gagctgccac cagacgagag cacgggctcg ttcgctcaca ggctctctca tgtcacattc 1440
ctgtcattca ccacgaacca ggctggctcg atcgccaatt ctgggagggt tccgacatac 1500
gtgtggactc accgggacgt ggatttcaac aataccatca acccaaatcg catcacgcag 1560
attcctgttg tgaaggcgta cgagctgtcc tccggcgcta ccgtcgttaa gggcccgggg 1620
ttcacgggcg gggacgtgat tcgcaggaca aacatcggcg ggttcggcgc tatcagggtc 1680
tccgttaccg gccccctgac gcagcgctac aggattcggt tccgctacgc ctccactatc 1740
gacttcgatt tcttcgtcac ccggggcggg acaactatca acaatttccg cttcacaagg 1800
actatgaaca ggggccagga gtcacggtac gagtcctacc gcaccgtgga gttcaccacg 1860
cccttcaact tcacgcagtc ccaggacatc attaggacat ccattcaggg cctcagcggc 1920
aacggggagg tttacctgga tcgcatcgag atcattccag tgaaccctac gagggaggct 1980
gaggaggacc tcgaggctgc gaagaaggct gtggctagcc tcttcaccag gacgagggat 2040
ggcctgcaag tgaatgtcac cgattaccag gtggaccagg ctgccaacct cgtctcttgc 2100
ctgtcagatg agcagtacgg ccacgacaag aagatgctcc tggaggccgt ccgcgctgct 2160
aagaggctgt ccagggagag gaacctcctg caggacccag atttcaacac aatcaatagc 2220
actgaggaga atggctggaa ggcgtccaac ggggtgacca tcagcgaggg cgggcctttc 2280
tacaagggcc gcgctctcca gctggcttcg gctagggaga attacccaac ttacatctac 2340
cagaaggtca acgcctctga gctgaagcct tacacgcgct accgcctgga tggcttcgtg 2400
aagtcatccc aggatctcga gatcgacctg attcaccatc acaaggtgca cctcgtcaag 2460
aacgttccgg acaatctggt cagcgatacg tactcggacg gctcgtgctc tgggatgaat 2520
cgctgcgagg agcagcagat ggtgaacgcg cagctcgaga cagagcatca ccatccgatg 2580
gactgctgcg aggccgcgca gactcatgag ttcagctcgt acattaatac cggcgatctg 2640
aactcttcag tcgaccaggg catctgggtg gtcctcaagg ttcgcacaac tgatggctac 2700
gccacgctgg ggaacctcga gctggttgaa gtgggcccac tctccgggga gagcctggag 2760
agggagcaga gggacaacgc gaagtggtcc gctgagctgg gcaggaagcg ggctgagacc 2820
gatagggttt accaggacgc taagcagtcc atcaatcacc tcttcgtgga ttaccaggac 2880
cagcagctga acccggagat tggcatggct gatatcattg acgcccagaa cctcgtcgcg 2940
tcaatctccg atgtctacag cgacgccgtt ctgcagatcc ccggcattaa ttacgagatc 3000
tacacggagc tgtcgaacag gctgcagcag gcctcgtacc tctacacatc tcggaacgcg 3060
gtgcagaatg gcgatttcaa ctctgggctg gactcatgga atgctaccgg cggggctacg 3120
gtgcagcagg atggcaacac ccacttcctc gtcctgtccc attgggacgc tcaggtgagc 3180
cagcagttcc gggtccagcc gaactgcaag tatgtgctga gggtcactgc tgagaaggtt 3240
ggcgggggcg atggctacgt gaccatcagg gacggggctc accatacaga gaagctcact 3300
ttcaacgcct gcgactacga tatcaatggc acctacgtca cggacaacac atacatcact 3360
aaggaggttg tgttctactc gcacactgag catatgtggg tcgaggtttc tgagaccgag 3420
ggcgccttcc acctcgactc aattgagttc gtggagaccg agaagtga 3468
<210> 16
<211> 1168
<212>БЕЛОК
<213> Bacillus thuringiensis
<400> 16
Met Asn Arg Asn Asn Gln Asn Glu Tyr Glu Val Ile Asp Ala Pro His
1 5 10 15
Cys Gly Cys Pro Ala Asp Asp Val Val Lys Tyr Pro Leu Thr Asp Asp
20 25 30
Pro Asn Ala Gly Leu Gln Asn Met Asn Tyr Lys Glu Tyr Leu Gln Thr
35 40 45
Tyr Gly Gly Asp Tyr Thr Asp Pro Leu Ile Asn Pro Asn Leu Ser Val
50 55 60
Ser Gly Lys Asp Val Ile Gln Val Gly Ile Asn Ile Val Gly Arg Leu
65 70 75 80
Leu Ser Phe Phe Gly Phe Pro Phe Ser Ser Gln Trp Val Thr Val Tyr
85 90 95
Thr Tyr Leu Leu Asn Ser Leu Trp Pro Asp Asp Glu Asn Ser Val Trp
100 105 110
Asp Ala Phe Met Glu Arg Val Glu Glu Leu Ile Asp Gln Lys Ile Ser
115 120 125
Glu Ala Val Lys Gly Arg Ala Leu Asp Asp Leu Thr Gly Leu Gln Tyr
130 135 140
Asn Tyr Asn Leu Tyr Val Glu Ala Leu Asp Glu Trp Leu Asn Arg Pro
145 150 155 160
Asn Gly Ala Arg Ala Ser Leu Val Ser Gln Arg Phe Asn Ile Leu Asp
165 170 175
Ser Leu Phe Thr Gln Phe Met Pro Ser Phe Gly Ser Gly Pro Gly Ser
180 185 190
Gln Asn Tyr Ala Thr Ile Leu Leu Pro Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Lys Asp Ala Asp Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Asn Gln Thr Gln Ile Asp Gln Phe His Ser Arg Gln Gln Ser
225 230 235 240
Leu Thr Gln Thr Tyr Thr Asn His Cys Val Thr Ala Tyr Asn Asp Gly
245 250 255
Leu Ala Glu Leu Arg Gly Thr Ser Val Ala Ser Trp Leu Lys Tyr His
260 265 270
Gln Tyr Arg Arg Glu Met Thr Val Thr Ala Met Asp Leu Val Ala Leu
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln
290 295 300
Leu Thr Arg Glu Val Tyr Thr Asp Pro Ile Val Phe Asn Pro Pro Glu
305 310 315 320
Arg Pro Ser Gly Ala Phe Cys Glu Ser Phe Tyr Thr Ile Arg Ala Ala
325 330 335
Arg Glu Arg Leu Thr Phe Ser Gln Leu Glu His Ala Ile Ile Arg Pro
340 345 350
Pro Arg Leu Phe Glu Arg Phe Gln Ala Leu Gly Ile Tyr Thr Gly Glu
355 360 365
Ala Arg Leu Asn Ala Asn Ser Ala Pro Met Asn Tyr Trp Ile Gly His
370 375 380
Phe Ile Arg Asn Thr Arg Leu Gly Asp Ser Thr Thr Ile Thr Thr Asn
385 390 395 400
Tyr Gly Thr Thr Asn Asn Arg Leu Thr Asn Phe Ser Met Pro Ser Asp
405 410 415
Val Tyr Gln Ile Asn Ser Thr Ser Ser Asn Leu Ala Ala Ile Leu Gly
420 425 430
Thr Leu Tyr Gly Val Thr Arg Ala Gln Phe His Phe Gly Ser Gly Ser
435 440 445
Phe Ser Thr Tyr Val Gly Gln Asn Ser Val Leu Pro Gln Cys His Gln
450 455 460
Asn Tyr Asn Ser Ile Glu Glu Leu Pro Asn Gln Ser Asp Glu Pro Thr
465 470 475 480
Val Arg Ser Tyr Ser His Arg Leu Ser His Ile Thr Ser Phe Asn Phe
485 490 495
Asn Val Gln Leu Asn Asn Pro Leu Ile Ser Ala Gly Asn Met Pro Val
500 505 510
Tyr Val Trp Thr His Arg Ser Val Asp Leu Thr Asn Arg Ile Ser Ser
515 520 525
Asp Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu Leu Ser Ser
530 535 540
Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Val Ile
545 550 555 560
Arg Arg Thr Asn Thr Gly Gly Phe Gly Ala Ile Arg Val Ser Val Thr
565 570 575
Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr Ala Ser Thr
580 585 590
Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr Ile Asn Asn
595 600 605
Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser Arg Tyr Glu
610 615 620
Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe Thr Gln Ser
625 630 635 640
Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly Glu
645 650 655
Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro Thr Arg Glu
660 665 670
Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe
675 680 685
Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Lys Asp Tyr Gln Val
690 695 700
Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Gly
705 710 715 720
Tyr Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu
725 730 735
Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn
740 745 750
Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser
755 760 765
Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu Ala Ser Ala
770 775 780
Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu
785 790 795 800
Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser
805 810 815
Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val His Leu Val
820 825 830
Lys Asn Val Pro Asp Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser
835 840 845
Cys Ser Gly Ile Asn Arg Cys Gln Glu Gln Gln Met Val Asn Ala Gln
850 855 860
Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu Ala Ala Gln
865 870 875 880
Thr His Glu Phe Ser Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Thr
885 890 895
Val Asp Gln Gly Ile Trp Val Ile Phe Lys Val Arg Thr Thr Asp Gly
900 905 910
Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly Pro Leu Leu
915 920 925
Gly Glu Pro Leu Glu Arg Glu Gln Arg Glu Asn Ala Lys Trp Asn Ala
930 935 940
Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala
945 950 955 960
Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu
965 970 975
Asn Pro Glu Ile Gly Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val
980 985 990
Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly
995 1000 1005
Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln
1010 1015 1020
Ala Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn Gly Asp
1025 1030 1035
Phe Asn Asn Gly Leu Asp Ser Trp Asn Ala Thr Ala Gly Ala Ser
1040 1045 1050
Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu Ser His Trp
1055 1060 1065
Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro Asn Cys Lys
1070 1075 1080
Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly Gly Asp Gly
1085 1090 1095
Tyr Val Thr Ile Arg Asp Asp Ala His His Thr Glu Thr Leu Thr
1100 1105 1110
Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr Val Thr Asp
1115 1120 1125
Asn Thr Tyr Leu Thr Lys Glu Val Val Phe Tyr Ser His Thr Asp
1130 1135 1140
His Met Trp Val Glu Val Ser Glu Thr Glu Gly Ala Phe His Ile
1145 1150 1155
Asp Ser Ile Glu Phe Val Glu Thr Glu Lys
1160 1165
<210> 17
<211> 1156
<212>БЕЛОК
<213> Bacillus thuringiensis
<400> 17
Met Asn Gln Asn Lys His Gly Ile Ile Gly Ala Ser Asn Cys Gly Cys
1 5 10 15
Ala Ser Asp Asp Val Ala Lys Tyr Pro Leu Ala Asn Asn Pro Tyr Ser
20 25 30
Ser Ala Leu Asn Leu Asn Ser Cys Gln Asn Ser Ser Ile Leu Asn Trp
35 40 45
Ile Asn Ile Ile Gly Asp Ala Ala Lys Glu Ala Val Ser Ile Gly Thr
50 55 60
Thr Ile Val Ser Leu Ile Thr Ala Pro Ser Leu Thr Gly Leu Ile Ser
65 70 75 80
Ile Val Tyr Asp Leu Ile Gly Lys Val Leu Gly Gly Ser Ser Gly Gln
85 90 95
Ser Ile Ser Asp Leu Ser Ile Cys Asp Leu Leu Ser Ile Ile Asp Leu
100 105 110
Arg Val Ser Gln Ser Val Leu Asn Asp Gly Ile Ala Asp Phe Asn Gly
115 120 125
Ser Val Leu Leu Tyr Arg Asn Tyr Leu Glu Ala Leu Asp Ser Trp Asn
130 135 140
Lys Asn Pro Asn Ser Ala Ser Ala Glu Glu Leu Arg Thr Arg Phe Arg
145 150 155 160
Ile Ala Asp Ser Glu Phe Asp Arg Ile Leu Thr Arg Gly Ser Leu Thr
165 170 175
Asn Gly Gly Ser Leu Ala Arg Gln Asn Ala Gln Ile Leu Leu Leu Pro
180 185 190
Ser Phe Ala Ser Ala Ala Phe Phe His Leu Leu Leu Leu Arg Asp Ala
195 200 205
Thr Arg Tyr Gly Thr Asn Trp Gly Leu Tyr Asn Ala Thr Pro Phe Ile
210 215 220
Asn Tyr Gln Ser Lys Leu Val Glu Leu Ile Glu Leu Tyr Thr Asp Tyr
225 230 235 240
Cys Val His Trp Tyr Asn Arg Gly Phe Asn Glu Leu Arg Gln Arg Gly
245 250 255
Thr Ser Ala Thr Ala Trp Leu Glu Phe His Arg Tyr Arg Arg Glu Met
260 265 270
Thr Leu Met Val Leu Asp Ile Val Ala Ser Phe Ser Ser Leu Asp Ile
275 280 285
Thr Asn Tyr Pro Ile Glu Thr Asp Phe Gln Leu Ser Arg Val Ile Tyr
290 295 300
Thr Asp Pro Ile Gly Phe Val His Arg Ser Ser Leu Arg Gly Glu Ser
305 310 315 320
Trp Phe Ser Phe Val Asn Arg Ala Asn Phe Ser Asp Leu Glu Asn Ala
325 330 335
Ile Pro Asn Pro Arg Pro Ser Trp Phe Leu Asn Asn Met Ile Ile Ser
340 345 350
Thr Gly Ser Leu Thr Leu Pro Val Ser Pro Ser Thr Asp Arg Ala Arg
355 360 365
Val Trp Tyr Gly Ser Arg Asp Arg Ile Ser Pro Ala Asn Ser Gln Phe
370 375 380
Ile Thr Glu Leu Ile Ser Gly Gln His Thr Thr Ala Thr Gln Thr Ile
385 390 395 400
Leu Gly Arg Asn Ile Phe Arg Val Asp Ser Gln Ala Cys Asn Leu Asn
405 410 415
Asp Thr Thr Tyr Gly Val Asn Arg Ala Val Phe Tyr His Asp Ala Ser
420 425 430
Glu Gly Ser Gln Arg Ser Val Tyr Glu Gly Tyr Ile Arg Thr Thr Gly
435 440 445
Ile Asp Asn Pro Arg Val Gln Asn Ile Asn Thr Tyr Leu Pro Gly Glu
450 455 460
Asn Ser Asp Ile Pro Thr Pro Glu Asp Tyr Thr His Ile Leu Ser Thr
465 470 475 480
Thr Ile Asn Leu Thr Gly Gly Leu Arg Gln Val Ala Ser Asn Arg Arg
485 490 495
Ser Ser Leu Val Met Tyr Gly Trp Thr His Lys Ser Leu Ala Arg Asn
500 505 510
Asn Thr Ile Asn Pro Asp Arg Ile Thr Gln Ile Pro Leu Thr Lys Val
515 520 525
Asp Thr Arg Gly Thr Gly Val Ser Tyr Val Asn Asp Pro Gly Phe Ile
530 535 540
Gly Gly Ala Leu Leu Gln Arg Thr Asp His Gly Ser Leu Gly Val Leu
545 550 555 560
Arg Val Gln Phe Pro Leu His Leu Arg Gln Gln Tyr Arg Ile Arg Val
565 570 575
Arg Tyr Ala Ser Thr Thr Asn Ile Arg Leu Ser Val Asn Gly Ser Phe
580 585 590
Gly Thr Ile Ser Gln Asn Leu Pro Ser Thr Met Arg Leu Gly Glu Asp
595 600 605
Leu Arg Tyr Gly Ser Phe Ala Ile Arg Glu Phe Asn Thr Ser Ile Arg
610 615 620
Pro Thr Ala Ser Pro Asp Gln Ile Arg Leu Thr Ile Glu Pro Ser Phe
625 630 635 640
Ile Arg Gln Glu Val Tyr Val Asp Arg Ile Glu Phe Ile Pro Val Asn
645 650 655
Pro Thr Arg Glu Ala Lys Glu Asp Leu Glu Ala Ala Lys Lys Ala Val
660 665 670
Ala Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Lys
675 680 685
Asp Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp
690 695 700
Glu Gln Tyr Gly Tyr Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala
705 710 715 720
Ala Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe
725 730 735
Asn Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly
740 745 750
Val Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Ile Gln
755 760 765
Leu Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val
770 775 780
Asp Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe
785 790 795 800
Val Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys
805 810 815
Val His Leu Val Lys Asn Val Pro Asp Asn Leu Val Leu Asp Thr Tyr
820 825 830
Pro Asp Asp Ser Cys Asn Gly Ile Asn Arg Cys Asp Glu Gln Lys Met
835 840 845
Val Asn Ala Gln Leu Glu Thr Glu His His His Pro Met Asp Cys Cys
850 855 860
Glu Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly Asp
865 870 875 880
Leu Asn Ala Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val Arg
885 890 895
Thr Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val
900 905 910
Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn Ala
915 920 925
Lys Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Glu Arg Val
930 935 940
Tyr Tyr Ala Ala Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Arg
945 950 955 960
Asp Gln Gln Leu Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala
965 970 975
Gln Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu
980 985 990
Gln Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg
995 1000 1005
Leu Gln Gln Ala Ser Tyr Leu His Met Ser Arg Asn Ala Met Gln
1010 1015 1020
Asn Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr Ala
1025 1030 1035
Gly Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu
1040 1045 1050
Ser His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro
1055 1060 1065
Asn Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly
1070 1075 1080
Gly Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Thr Glu
1085 1090 1095
Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr
1100 1105 1110
Val Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val Val Phe His Pro
1115 1120 1125
Glu Thr Gln His Met Trp Val Glu Val Ser Glu Thr Glu Gly Val
1130 1135 1140
Phe His Ile Asp Ser Val Glu Phe Met Glu Thr Gln Gln
1145 1150 1155
<210> 18
<211> 1156
<212>БЕЛОК
<213> Bacillus thuringiensis
<400> 18
Met Asn Gln Asn Lys His Gly Ile Ile Gly Ala Ser Asn Cys Gly Cys
1 5 10 15
Ala Ser Asp Asp Val Ala Lys Tyr Pro Leu Ala Asn Asn Pro Tyr Ser
20 25 30
Ser Ala Leu Asn Leu Asn Ser Cys Gln Asn Ser Ser Ile Leu Asn Trp
35 40 45
Ile Asn Ile Ile Gly Asp Ala Ala Lys Glu Ala Val Ser Ile Gly Thr
50 55 60
Thr Ile Val Ser Leu Ile Thr Ala Pro Ser Leu Thr Gly Leu Ile Ser
65 70 75 80
Ile Val Tyr Asp Leu Ile Gly Lys Val Leu Gly Gly Ser Ser Gly Gln
85 90 95
Ser Ile Ser Asp Leu Ser Ile Cys Asp Leu Leu Ser Ile Ile Asp Leu
100 105 110
Arg Val Ser Gln Ser Val Leu Asn Asp Gly Ile Ala Asp Phe Asn Gly
115 120 125
Ser Val Leu Leu Tyr Arg Asn Tyr Leu Glu Ala Leu Asp Ser Trp Asn
130 135 140
Lys Asn Pro Asn Ser Ala Ser Ala Glu Glu Leu Arg Thr Arg Phe Arg
145 150 155 160
Ile Ala Asp Ser Glu Phe Asp Arg Ile Leu Thr Arg Gly Ser Leu Thr
165 170 175
Asn Gly Gly Ser Leu Ala Arg Gln Asn Ala Gln Ile Leu Leu Leu Pro
180 185 190
Ser Phe Ala Ser Ala Ala Phe Phe His Leu Leu Leu Leu Arg Asp Ala
195 200 205
Thr Arg Tyr Gly Thr Asn Trp Gly Leu Tyr Asn Ala Thr Pro Phe Ile
210 215 220
Asn Tyr Gln Ser Lys Leu Val Glu Leu Ile Glu Leu Tyr Thr Asp Tyr
225 230 235 240
Cys Val His Trp Tyr Asn Arg Gly Phe Asn Glu Leu Arg Gln Arg Gly
245 250 255
Thr Ser Ala Thr Ala Trp Leu Glu Phe His Arg Tyr Arg Arg Glu Met
260 265 270
Thr Leu Met Val Leu Asp Ile Val Ala Ser Phe Ser Ser Leu Asp Ile
275 280 285
Thr Asn Tyr Pro Ile Glu Thr Asp Phe Gln Leu Ser Arg Val Ile Tyr
290 295 300
Thr Asp Pro Ile Gly Phe Val His Arg Ser Ser Leu Arg Gly Glu Ser
305 310 315 320
Trp Phe Ser Phe Val Asn Arg Ala Asn Phe Ser Asp Leu Glu Asn Ala
325 330 335
Ile Pro Asn Pro Arg Pro Ser Trp Phe Leu Asn Asn Met Ile Ile Ser
340 345 350
Thr Gly Ser Leu Thr Leu Pro Val Ser Pro Ser Thr Asp Arg Ala Arg
355 360 365
Val Trp Tyr Gly Ser Arg Asp Arg Ile Ser Pro Ala Asn Ser Gln Phe
370 375 380
Ile Thr Glu Leu Ile Ser Gly Gln His Thr Thr Ala Thr Gln Thr Ile
385 390 395 400
Leu Gly Arg Asn Ile Phe Arg Val Asp Ser Gln Ala Cys Asn Leu Asn
405 410 415
Asp Thr Thr Tyr Gly Val Asn Arg Ala Val Phe Tyr His Asp Ala Ser
420 425 430
Glu Gly Ser Gln Arg Ser Val Tyr Glu Gly Tyr Ile Arg Thr Thr Gly
435 440 445
Ile Asp Asn Pro Arg Val Gln Asn Ile Asn Thr Tyr Leu Pro Gly Glu
450 455 460
Asn Ser Asp Ile Pro Thr Pro Glu Asp Tyr Thr His Ile Leu Ser Thr
465 470 475 480
Thr Ile Asn Leu Thr Gly Gly Leu Arg Gln Val Ala Ser Asn Arg Arg
485 490 495
Ser Ser Leu Val Met Tyr Gly Trp Thr His Lys Ser Leu Ala Arg Asn
500 505 510
Asn Thr Ile Asn Pro Asp Arg Ile Thr Gln Ile Pro Leu Thr Lys Val
515 520 525
Asp Thr Arg Gly Thr Gly Val Ser Tyr Val Asn Asp Pro Gly Phe Ile
530 535 540
Gly Gly Ala Leu Leu Gln Arg Thr Asp His Gly Ser Leu Gly Val Leu
545 550 555 560
Arg Val Gln Phe Pro Leu His Leu Arg Gln Gln Tyr Arg Ile Arg Val
565 570 575
Arg Tyr Ala Ser Thr Thr Asn Ile Arg Leu Ser Val Asn Gly Ser Phe
580 585 590
Gly Thr Ile Ser Gln Asn Leu Pro Ser Thr Met Arg Leu Gly Glu Asp
595 600 605
Leu Arg Tyr Gly Ser Phe Ala Ile Arg Glu Phe Asn Thr Ser Ile Arg
610 615 620
Pro Thr Ala Ser Pro Asp Gln Ile Arg Leu Thr Ile Glu Pro Ser Phe
625 630 635 640
Ile Arg Gln Glu Val Tyr Val Asp Arg Ile Glu Phe Ile Pro Val Asn
645 650 655
Pro Thr Arg Glu Ala Lys Glu Asp Leu Glu Ala Ala Lys Lys Ala Val
660 665 670
Ala Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Lys
675 680 685
Asp Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp
690 695 700
Glu Gln Tyr Gly Tyr Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala
705 710 715 720
Ala Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe
725 730 735
Asn Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly
740 745 750
Val Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Ile Gln
755 760 765
Leu Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val
770 775 780
Asp Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe
785 790 795 800
Val Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys
805 810 815
Val His Leu Val Lys Asn Val Pro Asp Asn Leu Val Leu Asp Thr Tyr
820 825 830
Pro Asp Asp Ser Cys Asn Gly Ile Asn Arg Cys Asp Glu Gln Lys Met
835 840 845
Val Asn Ala Gln Leu Glu Thr Gly His His His Pro Met Asp Cys Cys
850 855 860
Glu Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly Asp
865 870 875 880
Leu Asn Ala Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val Arg
885 890 895
Thr Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val
900 905 910
Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn Ala
915 920 925
Lys Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Glu Arg Val
930 935 940
Tyr Tyr Ala Ala Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln
945 950 955 960
Asp Gln Gln Leu Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala
965 970 975
Gln Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu
980 985 990
Gln Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg
995 1000 1005
Leu Gln Gln Ala Ser Tyr Leu His Thr Ser Arg Asn Ala Met Gln
1010 1015 1020
Asn Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr Ala
1025 1030 1035
Gly Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu
1040 1045 1050
Ser His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro
1055 1060 1065
Asn Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly
1070 1075 1080
Gly Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Thr Glu
1085 1090 1095
Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr
1100 1105 1110
Val Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val Val Phe His Pro
1115 1120 1125
Glu Thr Gln His Met Trp Val Glu Val Ser Glu Thr Glu Gly Val
1130 1135 1140
Phe His Ile Asp Ser Val Glu Phe Met Glu Thr Gln Gln
1145 1150 1155
<210> 19
<211> 1152
<212>БЕЛОК
<213> Bacillus thuringiensis
<400> 19
Met Asn Arg Asn Asn Pro Asn Glu Tyr Glu Ile Ile Asp Ala Pro Tyr
1 5 10 15
Cys Gly Cys Pro Ser Asp Asp Asp Val Arg Tyr Pro Leu Ala Ser Asp
20 25 30
Pro Asn Ala Ala Phe Gln Asn Met Asn Tyr Lys Glu Tyr Leu Gln Thr
35 40 45
Tyr Asp Gly Asp Tyr Thr Gly Ser Leu Ile Asn Pro Asn Leu Ser Ile
50 55 60
Asn Pro Arg Asp Val Leu Gln Thr Gly Ile Asn Ile Val Gly Arg Ile
65 70 75 80
Leu Gly Phe Leu Gly Val Pro Phe Ala Gly Gln Leu Val Thr Phe Tyr
85 90 95
Thr Phe Leu Leu Asn Gln Leu Trp Pro Thr Asn Asp Asn Ala Val Trp
100 105 110
Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile Asp Gln Lys Ile Ser
115 120 125
Ala Gln Val Val Arg Asn Ala Leu Asp Asp Leu Thr Gly Leu His Asp
130 135 140
Tyr Tyr Glu Glu Tyr Leu Ala Ala Leu Glu Glu Trp Leu Glu Arg Pro
145 150 155 160
Asn Gly Ala Arg Ala Asn Leu Val Thr Gln Arg Phe Glu Asn Leu His
165 170 175
Thr Ala Phe Val Thr Arg Met Pro Ser Phe Gly Thr Gly Pro Gly Ser
180 185 190
Gln Arg Asp Ala Val Ala Leu Leu Thr Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Lys Asp Ala Glu Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Gln Gln Gly Gln Ile Asn Leu Tyr Phe Asn Ala Gln Gln Glu
225 230 235 240
Arg Thr Arg Ile Tyr Thr Asn His Cys Val Glu Thr Tyr Asn Arg Gly
245 250 255
Leu Glu Asp Val Arg Gly Thr Asn Thr Glu Ser Trp Leu Asn Tyr His
260 265 270
Arg Phe Arg Arg Glu Met Thr Leu Met Ala Met Asp Leu Val Ala Leu
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln
290 295 300
Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Val Tyr Asn Pro Pro Ala
305 310 315 320
Asn Gln Gly Ile Cys Arg Arg Trp Gly Asn Asn Pro Tyr Asn Thr Phe
325 330 335
Ser Glu Leu Glu Asn Ala Phe Ile Arg Pro Pro His Leu Phe Asp Arg
340 345 350
Leu Asn Arg Leu Thr Ile Ser Arg Asn Arg Tyr Thr Ala Pro Thr Thr
355 360 365
Asn Ser Tyr Leu Asp Tyr Trp Ser Gly His Thr Leu Gln Ser Gln Tyr
370 375 380
Ala Asn Asn Pro Thr Thr Tyr Glu Thr Ser Tyr Gly Gln Ile Thr Ser
385 390 395 400
Asn Thr Arg Leu Phe Asn Thr Thr Asn Gly Ala Asn Ala Ile Asp Ser
405 410 415
Arg Ala Arg Asn Phe Gly Asn Leu Tyr Ala Asn Leu Tyr Gly Val Ser
420 425 430
Ser Leu Asn Ile Phe Pro Thr Gly Val Met Ser Glu Ile Thr Ser Ala
435 440 445
Pro Asn Thr Cys Trp Gln Asp Leu Thr Thr Thr Glu Glu Leu Pro Leu
450 455 460
Val Asn Asn Asn Phe Asn Leu Leu Ser His Val Thr Phe Leu Arg Phe
465 470 475 480
Asn Thr Thr Gln Gly Gly Pro Leu Ala Thr Val Gly Phe Val Pro Thr
485 490 495
Tyr Val Trp Thr Arg Gln Asp Val Asp Phe Asn Asn Ile Ile Thr Pro
500 505 510
Asn Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu Leu Ser Ser
515 520 525
Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Val Ile
530 535 540
Arg Arg Thr Asn Thr Gly Gly Phe Gly Ala Ile Arg Val Ser Val Thr
545 550 555 560
Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr Ala Ser Thr
565 570 575
Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr Ile Asn Asn
580 585 590
Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser Arg Tyr Glu
595 600 605
Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe Thr Gln Ser
610 615 620
Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly Glu
625 630 635 640
Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro Thr Arg Glu
645 650 655
Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe
660 665 670
Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Thr Asp Tyr Gln Val
675 680 685
Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Ala
690 695 700
His Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu
705 710 715 720
Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn
725 730 735
Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser
740 745 750
Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu Ala Ser Ala
755 760 765
Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu
770 775 780
Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser
785 790 795 800
Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val His Leu Val
805 810 815
Lys Asn Val Leu Asp Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser
820 825 830
Cys Ser Gly Ile Asn Arg Cys Glu Glu Gln Gln Met Val Asn Ala Gln
835 840 845
Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu Ala Ala Gln
850 855 860
Thr His Glu Phe Ser Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Thr
865 870 875 880
Val Asp Gln Gly Ile Trp Val Ile Phe Lys Val Arg Thr Thr Asp Gly
885 890 895
Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly Pro Leu Leu
900 905 910
Gly Glu Pro Leu Glu Arg Glu Gln Arg Glu Asn Ala Lys Trp Asn Ala
915 920 925
Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala
930 935 940
Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu
945 950 955 960
Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val
965 970 975
Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly
980 985 990
Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln Ala
995 1000 1005
Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn Gly Asp Phe
1010 1015 1020
Asn Asn Gly Leu Asp Ser Trp Asn Ala Thr Ala Gly Ala Ser Val
1025 1030 1035
Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu Ser His Trp Asp
1040 1045 1050
Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro Asn Cys Lys Tyr
1055 1060 1065
Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly Gly Asp Gly Tyr
1070 1075 1080
Val Thr Ile Arg Asp Gly Ala His His Thr Glu Thr Leu Thr Phe
1085 1090 1095
Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr Val Thr Asp Asn
1100 1105 1110
Thr Tyr Leu Thr Lys Glu Val Ile Phe Tyr Ser His Thr Glu His
1115 1120 1125
Met Trp Val Glu Val Asn Glu Thr Glu Gly Ala Phe His Ile Asp
1130 1135 1140
Ser Ile Glu Phe Val Glu Thr Glu Lys
1145 1150
<210> 20
<211> 1155
<212>БЕЛОК
<213> Bacillus thuringiensis
<400> 20
Met Asn Arg Asn Asn Gln Asp Glu Tyr Glu Ile Ile Asp Ala Ser Thr
1 5 10 15
Cys Gly Cys Ser Ser Asp Asp Val Val Gln Tyr Pro Leu Ala Arg Asp
20 25 30
Pro Asn Ala Val Phe Gln Asn Met His Tyr Lys Asp Tyr Leu Gln Thr
35 40 45
Tyr Asp Gly Asp Tyr Thr Gly Ser Leu Ile Asn Pro Asn Leu Ser Ile
50 55 60
Asn Pro Arg Asp Val Leu Gln Thr Gly Ile Asn Ile Val Gly Arg Leu
65 70 75 80
Leu Gly Phe Leu Gly Val Pro Phe Ala Gly Gln Leu Val Thr Phe Tyr
85 90 95
Thr Phe Leu Leu Asn Gln Leu Trp Pro Thr Asn Asp Asn Ala Val Trp
100 105 110
Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile Asn Gln Arg Ile Ser
115 120 125
Glu Ala Val Val Gly Thr Ala Ala Asp His Leu Thr Gly Leu His Asp
130 135 140
Asn Tyr Glu Leu Tyr Val Glu Ala Leu Glu Glu Trp Leu Glu Arg Pro
145 150 155 160
Asn Ala Ala Arg Thr Asn Leu Leu Phe Asn Arg Phe Thr Thr Leu Asp
165 170 175
Ser Leu Phe Thr Gln Phe Met Pro Ser Phe Gly Thr Gly Pro Gly Ser
180 185 190
Gln Asn Tyr Ala Val Pro Leu Leu Thr Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Lys Asp Ala Glu Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Asn Gln Asn Gln Ile Asn Ser Phe His Thr Arg Gln Gln Glu
225 230 235 240
Arg Thr Gln Tyr Tyr Thr Asn His Cys Val Thr Thr Tyr Asn Thr Gly
245 250 255
Leu Asp Arg Leu Arg Gly Thr Asn Thr Glu Ser Trp Leu Asn Tyr His
260 265 270
Arg Phe Arg Arg Glu Met Thr Leu Met Ala Met Asp Leu Val Ala Leu
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln
290 295 300
Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Val Phe Asn Pro Pro Ala
305 310 315 320
Asn Val Gly Leu Cys Arg Arg Trp Gly Asn Asn Pro Tyr Asn Arg Phe
325 330 335
Ser Glu Leu Glu Asn Ala Phe Ile Arg Pro Pro His Leu Phe Asp Arg
340 345 350
Leu Asn Thr Leu Thr Ile Ser Arg Asn Arg Phe Asp Val Gly Ser Asn
355 360 365
Phe Ile Glu Pro Trp Ser Gly His Thr Leu Arg Arg Ser Tyr Ser Asn
370 375 380
Asn Ser Thr Val Tyr Glu Asp Ser Tyr Gly Gln Ile Thr Ala Thr Arg
385 390 395 400
Thr Thr Ile Asn Leu Pro Ala Asn Gly Thr Gly Arg Val Glu Ser Thr
405 410 415
Ala Val Asp Phe Arg Ser Ala Leu Val Gly Ile Tyr Gly Val Asn Arg
420 425 430
Ala Ser Phe Ile Pro Gly Gly Val Phe Ser Gly Thr Thr Gln Pro Ser
435 440 445
Thr Gly Gly Cys Arg Asp Leu Tyr Asp Ser Ser Asp Glu Leu Pro Pro
450 455 460
Asp Glu Ser Thr Gly Ser Phe Ala His Arg Leu Ser His Val Thr Phe
465 470 475 480
Leu Ser Phe Thr Thr Asn Gln Ala Gly Ser Ile Ala Asn Ser Gly Arg
485 490 495
Val Pro Thr Tyr Val Trp Thr His Arg Asp Val Asp Phe Asn Asn Thr
500 505 510
Ile Asn Pro Asn Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu
515 520 525
Leu Ser Ser Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly
530 535 540
Asp Val Ile Arg Arg Thr Asn Ile Gly Gly Phe Gly Ala Ile Arg Val
545 550 555 560
Ser Val Thr Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr
565 570 575
Ala Ser Thr Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr
580 585 590
Ile Asn Asn Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser
595 600 605
Arg Tyr Glu Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe
610 615 620
Thr Gln Ser Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly
625 630 635 640
Asn Gly Glu Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro
645 650 655
Thr Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala
660 665 670
Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Thr Asp
675 680 685
Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu
690 695 700
Gln Tyr Gly His Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala
705 710 715 720
Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn
725 730 735
Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val
740 745 750
Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu
755 760 765
Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asn
770 775 780
Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val
785 790 795 800
Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val
805 810 815
His Leu Val Lys Asn Val Pro Asp Asn Leu Val Ser Asp Thr Tyr Ser
820 825 830
Asp Gly Ser Cys Ser Gly Met Asn Arg Cys Glu Glu Gln Gln Met Val
835 840 845
Asn Ala Gln Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu
850 855 860
Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly Asp Leu
865 870 875 880
Asn Ser Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val Arg Thr
885 890 895
Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly
900 905 910
Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn Ala Lys
915 920 925
Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr
930 935 940
Gln Asp Ala Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp
945 950 955 960
Gln Gln Leu Asn Pro Glu Ile Gly Met Ala Asp Ile Ile Asp Ala Gln
965 970 975
Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln
980 985 990
Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu
995 1000 1005
Gln Gln Ala Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn
1010 1015 1020
Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr Gly Gly
1025 1030 1035
Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu Ser
1040 1045 1050
His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro Asn
1055 1060 1065
Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly Gly
1070 1075 1080
Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Thr Glu Lys
1085 1090 1095
Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr Val
1100 1105 1110
Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val Val Phe Tyr Ser His
1115 1120 1125
Thr Glu His Met Trp Val Glu Val Ser Glu Thr Glu Gly Ala Phe
1130 1135 1140
His Ile Asp Ser Ile Glu Phe Val Glu Thr Glu Lys
1145 1150 1155
<210> 21
<211> 1168
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мутантный BT-0009
<400> 21
Met Asn Arg Asn Asn Gln Asn Glu Tyr Glu Val Ile Asp Ala Pro His
1 5 10 15
Cys Gly Cys Pro Ala Asp Asp Val Val Lys Tyr Pro Leu Thr Asp Asp
20 25 30
Pro Asn Ala Gly Leu Gln Asn Met Asn Tyr Lys Glu Tyr Leu Gln Thr
35 40 45
Tyr Gly Gly Asp Tyr Thr Asp Pro Leu Ile Asn Pro Asn Leu Ser Val
50 55 60
Ser Gly Lys Asp Val Ile Gln Val Gly Ile Asn Ile Val Gly Arg Leu
65 70 75 80
Leu Ser Phe Phe Gly Phe Pro Phe Ser Ser Gln Trp Val Thr Val Tyr
85 90 95
Thr Tyr Leu Leu Asn Ser Leu Trp Pro Asp Asp Glu Asn Ser Val Trp
100 105 110
Asp Ala Phe Met Glu Arg Val Glu Glu Leu Ile Asp Gln Lys Ile Ser
115 120 125
Glu Ala Val Lys Gly Arg Ala Leu Asp Asp Leu Thr Gly Leu Gln Tyr
130 135 140
Asn Tyr Asn Leu Tyr Val Glu Ala Leu Asp Glu Trp Leu Asn Arg Pro
145 150 155 160
Asn Gly Ala Arg Ala Ser Leu Val Ser Gln Arg Phe Asn Ile Leu Asp
165 170 175
Ser Leu Phe Thr Gln Phe Met Pro Ser Phe Gly Ser Gly Pro Gly Ser
180 185 190
Gln Asn Tyr Ala Thr Ile Leu Leu Pro Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Lys Asp Ala Asp Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Asn Gln Thr Gln Ile Asp Gln Phe His Ser Arg Gln Gln Ser
225 230 235 240
Leu Thr Gln Thr Tyr Thr Asn His Cys Val Thr Ala Tyr Asn Asp Gly
245 250 255
Leu Ala Glu Leu Arg Gly Thr Ser Val Ala Ser Trp Leu Lys Tyr His
260 265 270
Gln Tyr Arg Arg Glu Met Thr Val Thr Ala Met Asp Leu Val Ala Leu
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln
290 295 300
Leu Thr Arg Glu Val Tyr Thr Asp Pro Ile Val Phe Asn Pro Pro Glu
305 310 315 320
Arg Pro Ser Gly Ala Phe Cys Glu Ser Phe Tyr Thr Ile Arg Ala Ala
325 330 335
Arg Glu Arg Leu Thr Phe Ser Gln Leu Glu His Ala Ile Ile Arg Pro
340 345 350
Pro Arg Leu Phe Glu Arg Phe Gln Ala Leu Gly Ile Tyr Thr Gly Glu
355 360 365
Ala Arg Leu Asn Ala Asn Ser Ala Pro Met Asn Tyr Trp Ile Gly His
370 375 380
Phe Ile Arg Asn Thr Arg Leu Gly Asp Ser Thr Thr Ile Thr Thr Asn
385 390 395 400
Tyr Gly Thr Thr Asn Asn Arg Leu Thr Asn Phe Ser Met Pro Ser Asp
405 410 415
Val Tyr Gln Ile Asn Ser Thr Ser Ser Asn Leu Ala Ala Ile Leu Gly
420 425 430
Thr Leu Tyr Gly Val Thr Arg Ala Gln Phe His Phe Gly Ser Gly Ser
435 440 445
Phe Ser Thr Tyr Val Gly Gln Asn Ser Val Leu Pro Gln Cys His Gln
450 455 460
Asn Tyr Asn Ser Ile Glu Glu Leu Pro Asn Gln Ser Asp Glu Pro Thr
465 470 475 480
Val Arg Ser Tyr Ser His Arg Leu Ser His Ile Thr Ser Phe Asn Phe
485 490 495
Asn Val Gln Leu Asn Asn Pro Leu Ile Ser Ala Gly Asn Met Pro Val
500 505 510
Tyr Val Trp Thr His Arg Ser Val Asp Leu Thr Asn Arg Ile Ser Ser
515 520 525
Asp Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu Leu Ser Ser
530 535 540
Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Val Ile
545 550 555 560
Arg Arg Thr Asn Thr Gly Gly Phe Gly Ala Ile Arg Val Ser Val Thr
565 570 575
Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr Ala Ser Thr
580 585 590
Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr Ile Asn Asn
595 600 605
Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser Arg Tyr Glu
610 615 620
Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe Thr Gln Ser
625 630 635 640
Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly Glu
645 650 655
Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro Thr Arg Glu
660 665 670
Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe
675 680 685
Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Lys Asp Tyr Gln Val
690 695 700
Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Gly
705 710 715 720
Tyr Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu
725 730 735
Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn
740 745 750
Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser
755 760 765
Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu Ala Ser Ala
770 775 780
Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu
785 790 795 800
Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser
805 810 815
Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val His Leu Val
820 825 830
Lys Asn Val Pro Asp Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser
835 840 845
Cys Ser Gly Ile Asn Arg Cys Gln Glu Gln Gln Met Val Asn Ala Gln
850 855 860
Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu Ala Ala Gln
865 870 875 880
Thr His Glu Phe Ser Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Thr
885 890 895
Val Asp Gln Gly Ile Trp Val Ile Phe Lys Val Arg Thr Thr Asp Gly
900 905 910
Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly Pro Leu Leu
915 920 925
Gly Glu Pro Leu Glu Arg Glu Gln Arg Glu Asn Ala Lys Trp Asn Ala
930 935 940
Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala
945 950 955 960
Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu
965 970 975
Asn Pro Glu Ile Gly Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val
980 985 990
Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly
995 1000 1005
Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln
1010 1015 1020
Ala Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn Gly Asp
1025 1030 1035
Phe Asn Asn Gly Leu Asp Ser Trp Asn Ala Thr Ala Gly Ala Ser
1040 1045 1050
Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu Ser His Trp
1055 1060 1065
Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro Asn Cys Lys
1070 1075 1080
Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly Gly Asp Gly
1085 1090 1095
Tyr Val Thr Ile Arg Asp Asp Ala His His Thr Glu Thr Leu Thr
1100 1105 1110
Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr Val Thr Asp
1115 1120 1125
Asn Thr Tyr Ile Thr Lys Glu Val Val Phe Tyr Ser His Thr Asp
1130 1135 1140
His Met Trp Val Glu Val Ser Glu Thr Glu Gly Ala Phe His Ile
1145 1150 1155
Asp Ser Leu Glu Phe Val Glu Thr Glu Lys
1160 1165
<210> 22
<211> 1156
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мутантный BT-0012
<400> 22
Met Asn Gln Asn Lys His Gly Ile Ile Gly Ala Ser Asn Cys Gly Cys
1 5 10 15
Ala Ser Asp Asp Val Ala Lys Tyr Pro Leu Ala Asn Asn Pro Tyr Ser
20 25 30
Ser Ala Leu Asn Leu Asn Ser Cys Gln Asn Ser Ser Ile Leu Asn Trp
35 40 45
Ile Asn Ile Ile Gly Asp Ala Ala Lys Glu Ala Val Ser Ile Gly Thr
50 55 60
Thr Ile Val Ser Leu Ile Thr Ala Pro Ser Leu Thr Gly Leu Ile Ser
65 70 75 80
Ile Val Tyr Asp Leu Ile Gly Lys Val Ile Gly Gly Ser Ser Gly Gln
85 90 95
Ser Ile Ser Asp Leu Ser Ile Cys Asp Leu Leu Ser Ile Ile Asp Leu
100 105 110
Arg Val Ser Gln Ser Val Leu Asn Asp Gly Ile Ala Asp Phe Asn Gly
115 120 125
Ser Val Leu Leu Tyr Arg Asn Tyr Leu Glu Ala Leu Asp Ser Trp Asn
130 135 140
Lys Asn Pro Asn Ser Ala Ser Ala Glu Glu Leu Arg Thr Arg Phe Arg
145 150 155 160
Ile Ala Asp Ser Glu Phe Asp Arg Ile Leu Thr Arg Gly Ser Leu Thr
165 170 175
Asn Gly Gly Ser Leu Ala Arg Gln Asn Ala Gln Ile Leu Leu Leu Pro
180 185 190
Ser Phe Ala Ser Ala Ala Phe Phe His Leu Leu Leu Leu Arg Asp Ala
195 200 205
Thr Arg Tyr Gly Thr Asn Trp Gly Leu Tyr Asn Ala Thr Pro Phe Ile
210 215 220
Asn Tyr Gln Ser Lys Leu Val Glu Leu Ile Glu Leu Tyr Thr Asp Tyr
225 230 235 240
Cys Val His Trp Tyr Asn Arg Gly Phe Asn Glu Leu Arg Gln Arg Gly
245 250 255
Thr Ser Ala Thr Ala Trp Leu Glu Phe His Arg Tyr Arg Arg Glu Met
260 265 270
Thr Leu Met Val Leu Asp Ile Val Ala Ser Phe Ser Ser Leu Asp Ile
275 280 285
Thr Asn Tyr Pro Ile Glu Thr Asp Phe Gln Leu Ser Arg Val Ile Tyr
290 295 300
Thr Asp Pro Ile Gly Phe Val His Arg Ser Ser Leu Arg Gly Glu Ser
305 310 315 320
Trp Phe Ser Phe Val Asn Arg Ala Asn Phe Ser Asp Leu Glu Asn Ala
325 330 335
Ile Pro Asn Pro Arg Pro Ser Trp Phe Leu Asn Asn Met Ile Ile Ser
340 345 350
Thr Gly Ser Leu Thr Leu Pro Val Ser Pro Ser Thr Asp Arg Ala Arg
355 360 365
Val Trp Tyr Gly Ser Arg Asp Arg Ile Ser Pro Ala Asn Ser Gln Phe
370 375 380
Ile Thr Glu Leu Ile Ser Gly Gln His Thr Thr Ala Thr Gln Thr Ile
385 390 395 400
Leu Gly Arg Asn Ile Phe Arg Val Asp Ser Gln Ala Cys Asn Leu Asn
405 410 415
Asp Thr Thr Tyr Gly Val Asn Arg Ala Val Phe Tyr His Asp Ala Ser
420 425 430
Glu Gly Ser Gln Arg Ser Val Tyr Glu Gly Tyr Ile Arg Thr Thr Gly
435 440 445
Ile Asp Asn Pro Arg Val Gln Asn Ile Asn Thr Tyr Leu Pro Gly Glu
450 455 460
Asn Ser Asp Ile Pro Thr Pro Glu Asp Tyr Thr His Ile Leu Ser Thr
465 470 475 480
Thr Ile Asn Leu Thr Gly Gly Leu Arg Gln Val Ala Ser Asn Arg Arg
485 490 495
Ser Ser Leu Val Met Tyr Gly Trp Thr His Lys Ser Leu Ala Arg Asn
500 505 510
Asn Thr Ile Asn Pro Asp Arg Ile Thr Gln Ile Pro Leu Thr Lys Val
515 520 525
Asp Thr Arg Gly Thr Gly Val Ser Tyr Val Asn Asp Pro Gly Phe Ile
530 535 540
Gly Gly Ala Leu Leu Gln Arg Thr Asp His Gly Ser Leu Gly Val Leu
545 550 555 560
Arg Val Gln Phe Pro Leu His Leu Arg Gln Gln Tyr Arg Ile Arg Val
565 570 575
Arg Tyr Ala Ser Thr Thr Asn Ile Arg Leu Ser Val Asn Gly Ser Phe
580 585 590
Gly Thr Ile Ser Gln Asn Leu Pro Ser Thr Met Arg Leu Gly Glu Asp
595 600 605
Leu Arg Tyr Gly Ser Phe Ala Ile Arg Glu Phe Asn Thr Ser Ile Arg
610 615 620
Pro Thr Ala Ser Pro Asp Gln Ile Arg Leu Thr Ile Glu Pro Ser Phe
625 630 635 640
Ile Arg Gln Glu Val Tyr Val Asp Arg Ile Glu Phe Ile Pro Val Asn
645 650 655
Pro Thr Arg Glu Ala Lys Glu Asp Leu Glu Ala Ala Lys Lys Ala Val
660 665 670
Ala Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Lys
675 680 685
Asp Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp
690 695 700
Glu Gln Tyr Gly Tyr Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala
705 710 715 720
Ala Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe
725 730 735
Asn Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly
740 745 750
Val Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Ile Gln
755 760 765
Leu Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val
770 775 780
Asp Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe
785 790 795 800
Val Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys
805 810 815
Val His Leu Val Lys Asn Val Pro Asp Asn Leu Val Leu Asp Thr Tyr
820 825 830
Pro Asp Asp Ser Cys Asn Gly Ile Asn Arg Cys Asp Glu Gln Lys Met
835 840 845
Val Asn Ala Gln Leu Glu Thr Glu His His His Pro Met Asp Cys Cys
850 855 860
Glu Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly Asp
865 870 875 880
Leu Asn Ala Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val Arg
885 890 895
Thr Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val
900 905 910
Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn Ala
915 920 925
Lys Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Glu Arg Val
930 935 940
Tyr Tyr Ala Ala Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Arg
945 950 955 960
Asp Gln Gln Leu Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala
965 970 975
Gln Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu
980 985 990
Gln Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg
995 1000 1005
Leu Gln Gln Ala Ser Tyr Leu His Met Ser Arg Asn Ala Met Gln
1010 1015 1020
Asn Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr Ala
1025 1030 1035
Gly Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu
1040 1045 1050
Ser His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro
1055 1060 1065
Asn Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly
1070 1075 1080
Gly Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Thr Glu
1085 1090 1095
Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr
1100 1105 1110
Val Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val Val Phe His Pro
1115 1120 1125
Glu Thr Gln His Met Trp Val Glu Val Ser Glu Thr Glu Gly Val
1130 1135 1140
Phe His Leu Asp Ser Val Glu Phe Met Glu Thr Gln Gln
1145 1150 1155
<210> 23
<211> 1156
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мутантный BT-0013
<400> 23
Met Asn Gln Asn Lys His Gly Ile Ile Gly Ala Ser Asn Cys Gly Cys
1 5 10 15
Ala Ser Asp Asp Val Ala Lys Tyr Pro Leu Ala Asn Asn Pro Tyr Ser
20 25 30
Ser Ala Leu Asn Leu Asn Ser Cys Gln Asn Ser Ser Ile Leu Asn Trp
35 40 45
Ile Asn Ile Ile Gly Asp Ala Ala Lys Glu Ala Val Ser Ile Gly Thr
50 55 60
Thr Ile Val Ser Leu Ile Thr Ala Pro Ser Leu Thr Gly Leu Ile Ser
65 70 75 80
Ile Val Tyr Asp Leu Ile Gly Lys Val Ile Gly Gly Ser Ser Gly Gln
85 90 95
Ser Ile Ser Asp Leu Ser Ile Cys Asp Leu Leu Ser Ile Ile Asp Leu
100 105 110
Arg Val Ser Gln Ser Val Leu Asn Asp Gly Ile Ala Asp Phe Asn Gly
115 120 125
Ser Val Leu Leu Tyr Arg Asn Tyr Leu Glu Ala Leu Asp Ser Trp Asn
130 135 140
Lys Asn Pro Asn Ser Ala Ser Ala Glu Glu Leu Arg Thr Arg Phe Arg
145 150 155 160
Ile Ala Asp Ser Glu Phe Asp Arg Ile Leu Thr Arg Gly Ser Leu Thr
165 170 175
Asn Gly Gly Ser Leu Ala Arg Gln Asn Ala Gln Ile Leu Leu Leu Pro
180 185 190
Ser Phe Ala Ser Ala Ala Phe Phe His Leu Leu Leu Leu Arg Asp Ala
195 200 205
Thr Arg Tyr Gly Thr Asn Trp Gly Leu Tyr Asn Ala Thr Pro Phe Ile
210 215 220
Asn Tyr Gln Ser Lys Leu Val Glu Leu Ile Glu Leu Tyr Thr Asp Tyr
225 230 235 240
Cys Val His Trp Tyr Asn Arg Gly Phe Asn Glu Leu Arg Gln Arg Gly
245 250 255
Thr Ser Ala Thr Ala Trp Leu Glu Phe His Arg Tyr Arg Arg Glu Met
260 265 270
Thr Leu Met Val Leu Asp Ile Val Ala Ser Phe Ser Ser Leu Asp Ile
275 280 285
Thr Asn Tyr Pro Ile Glu Thr Asp Phe Gln Leu Ser Arg Val Ile Tyr
290 295 300
Thr Asp Pro Ile Gly Phe Val His Arg Ser Ser Leu Arg Gly Glu Ser
305 310 315 320
Trp Phe Ser Phe Val Asn Arg Ala Asn Phe Ser Asp Leu Glu Asn Ala
325 330 335
Ile Pro Asn Pro Arg Pro Ser Trp Phe Leu Asn Asn Met Ile Ile Ser
340 345 350
Thr Gly Ser Leu Thr Leu Pro Val Ser Pro Ser Thr Asp Arg Ala Arg
355 360 365
Val Trp Tyr Gly Ser Arg Asp Arg Ile Ser Pro Ala Asn Ser Gln Phe
370 375 380
Ile Thr Glu Leu Ile Ser Gly Gln His Thr Thr Ala Thr Gln Thr Ile
385 390 395 400
Leu Gly Arg Asn Ile Phe Arg Val Asp Ser Gln Ala Cys Asn Leu Asn
405 410 415
Asp Thr Thr Tyr Gly Val Asn Arg Ala Val Phe Tyr His Asp Ala Ser
420 425 430
Glu Gly Ser Gln Arg Ser Val Tyr Glu Gly Tyr Ile Arg Thr Thr Gly
435 440 445
Ile Asp Asn Pro Arg Val Gln Asn Ile Asn Thr Tyr Leu Pro Gly Glu
450 455 460
Asn Ser Asp Ile Pro Thr Pro Glu Asp Tyr Thr His Ile Leu Ser Thr
465 470 475 480
Thr Ile Asn Leu Thr Gly Gly Leu Arg Gln Val Ala Ser Asn Arg Arg
485 490 495
Ser Ser Leu Val Met Tyr Gly Trp Thr His Lys Ser Leu Ala Arg Asn
500 505 510
Asn Thr Ile Asn Pro Asp Arg Ile Thr Gln Ile Pro Leu Thr Lys Val
515 520 525
Asp Thr Arg Gly Thr Gly Val Ser Tyr Val Asn Asp Pro Gly Phe Ile
530 535 540
Gly Gly Ala Leu Leu Gln Arg Thr Asp His Gly Ser Leu Gly Val Leu
545 550 555 560
Arg Val Gln Phe Pro Leu His Leu Arg Gln Gln Tyr Arg Ile Arg Val
565 570 575
Arg Tyr Ala Ser Thr Thr Asn Ile Arg Leu Ser Val Asn Gly Ser Phe
580 585 590
Gly Thr Ile Ser Gln Asn Leu Pro Ser Thr Met Arg Leu Gly Glu Asp
595 600 605
Leu Arg Tyr Gly Ser Phe Ala Ile Arg Glu Phe Asn Thr Ser Ile Arg
610 615 620
Pro Thr Ala Ser Pro Asp Gln Ile Arg Leu Thr Ile Glu Pro Ser Phe
625 630 635 640
Ile Arg Gln Glu Val Tyr Val Asp Arg Ile Glu Phe Ile Pro Val Asn
645 650 655
Pro Thr Arg Glu Ala Lys Glu Asp Leu Glu Ala Ala Lys Lys Ala Val
660 665 670
Ala Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Lys
675 680 685
Asp Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp
690 695 700
Glu Gln Tyr Gly Tyr Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala
705 710 715 720
Ala Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe
725 730 735
Asn Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly
740 745 750
Val Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Ile Gln
755 760 765
Leu Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val
770 775 780
Asp Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe
785 790 795 800
Val Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys
805 810 815
Val His Leu Val Lys Asn Val Pro Asp Asn Leu Val Leu Asp Thr Tyr
820 825 830
Pro Asp Asp Ser Cys Asn Gly Ile Asn Arg Cys Asp Glu Gln Lys Met
835 840 845
Val Asn Ala Gln Leu Glu Thr Gly His His His Pro Met Asp Cys Cys
850 855 860
Glu Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly Asp
865 870 875 880
Leu Asn Ala Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val Arg
885 890 895
Thr Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val
900 905 910
Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn Ala
915 920 925
Lys Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Glu Arg Val
930 935 940
Tyr Tyr Ala Ala Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln
945 950 955 960
Asp Gln Gln Leu Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala
965 970 975
Gln Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu
980 985 990
Gln Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg
995 1000 1005
Leu Gln Gln Ala Ser Tyr Leu His Thr Ser Arg Asn Ala Met Gln
1010 1015 1020
Asn Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr Ala
1025 1030 1035
Gly Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu
1040 1045 1050
Ser His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro
1055 1060 1065
Asn Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly
1070 1075 1080
Gly Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Thr Glu
1085 1090 1095
Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr
1100 1105 1110
Val Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val Val Phe His Pro
1115 1120 1125
Glu Thr Gln His Met Trp Val Glu Val Ser Glu Thr Glu Gly Val
1130 1135 1140
Phe His Leu Asp Ser Val Glu Phe Met Glu Thr Gln Gln
1145 1150 1155
<210> 24
<211> 1152
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мутантный BT-0023
<400> 24
Met Asn Arg Asn Asn Pro Asn Glu Tyr Glu Ile Ile Asp Ala Pro Tyr
1 5 10 15
Cys Gly Cys Pro Ser Asp Asp Asp Val Arg Tyr Pro Leu Ala Ser Asp
20 25 30
Pro Asn Ala Ala Phe Gln Asn Met Asn Tyr Lys Glu Tyr Leu Gln Thr
35 40 45
Tyr Asp Gly Asp Tyr Thr Gly Ser Leu Ile Asn Pro Asn Leu Ser Ile
50 55 60
Asn Pro Arg Asp Val Leu Gln Thr Gly Ile Asn Ile Val Gly Arg Ile
65 70 75 80
Leu Gly Phe Leu Gly Val Pro Phe Ala Gly Gln Leu Val Thr Phe Tyr
85 90 95
Thr Phe Leu Leu Asn Gln Leu Trp Pro Thr Asn Asp Asn Ala Val Trp
100 105 110
Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile Asp Gln Lys Ile Ser
115 120 125
Ala Gln Val Val Arg Asn Ala Leu Asp Asp Leu Thr Gly Leu His Asp
130 135 140
Tyr Tyr Glu Glu Tyr Leu Ala Ala Leu Glu Glu Trp Leu Glu Arg Pro
145 150 155 160
Asn Gly Ala Arg Ala Asn Leu Val Thr Gln Arg Phe Glu Asn Leu His
165 170 175
Thr Ala Phe Val Thr Arg Met Pro Ser Phe Gly Thr Gly Pro Gly Ser
180 185 190
Gln Arg Asp Ala Val Ala Leu Leu Thr Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Lys Asp Ala Glu Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Gln Gln Gly Gln Ile Asn Leu Tyr Phe Asn Ala Gln Gln Glu
225 230 235 240
Arg Thr Arg Ile Tyr Thr Asn His Cys Val Glu Thr Tyr Asn Arg Gly
245 250 255
Leu Glu Asp Val Arg Gly Thr Asn Thr Glu Ser Trp Leu Asn Tyr His
260 265 270
Arg Phe Arg Arg Glu Met Thr Leu Met Ala Met Asp Leu Val Ala Leu
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln
290 295 300
Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Val Tyr Asn Pro Pro Ala
305 310 315 320
Asn Gln Gly Ile Cys Arg Arg Trp Gly Asn Asn Pro Tyr Asn Thr Phe
325 330 335
Ser Glu Leu Glu Asn Ala Phe Ile Arg Pro Pro His Leu Phe Asp Arg
340 345 350
Leu Asn Arg Leu Thr Ile Ser Arg Asn Arg Tyr Thr Ala Pro Thr Thr
355 360 365
Asn Ser Tyr Leu Asp Tyr Trp Ser Gly His Thr Leu Gln Ser Gln Tyr
370 375 380
Ala Asn Asn Pro Thr Thr Tyr Glu Thr Ser Tyr Gly Gln Ile Thr Ser
385 390 395 400
Asn Thr Arg Leu Phe Asn Thr Thr Asn Gly Ala Asn Ala Ile Asp Ser
405 410 415
Arg Ala Arg Asn Phe Gly Asn Leu Tyr Ala Asn Leu Tyr Gly Val Ser
420 425 430
Ser Leu Asn Ile Phe Pro Thr Gly Val Met Ser Glu Ile Thr Ser Ala
435 440 445
Pro Asn Thr Cys Trp Gln Asp Leu Thr Thr Thr Glu Glu Leu Pro Leu
450 455 460
Val Asn Asn Asn Phe Asn Leu Leu Ser His Val Thr Phe Leu Arg Phe
465 470 475 480
Asn Thr Thr Gln Gly Gly Pro Leu Ala Thr Val Gly Phe Val Pro Thr
485 490 495
Tyr Val Trp Thr Arg Gln Asp Val Asp Phe Asn Asn Ile Ile Thr Pro
500 505 510
Asn Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu Leu Ser Ser
515 520 525
Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Val Ile
530 535 540
Arg Arg Thr Asn Thr Gly Gly Phe Gly Ala Ile Arg Val Ser Val Thr
545 550 555 560
Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr Ala Ser Thr
565 570 575
Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr Ile Asn Asn
580 585 590
Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser Arg Tyr Glu
595 600 605
Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe Thr Gln Ser
610 615 620
Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly Glu
625 630 635 640
Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro Thr Arg Glu
645 650 655
Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe
660 665 670
Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Thr Asp Tyr Gln Val
675 680 685
Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Ala
690 695 700
His Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu
705 710 715 720
Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn
725 730 735
Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser
740 745 750
Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu Ala Ser Ala
755 760 765
Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu
770 775 780
Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser
785 790 795 800
Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val His Leu Val
805 810 815
Lys Asn Val Leu Asp Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser
820 825 830
Cys Ser Gly Ile Asn Arg Cys Glu Glu Gln Gln Met Val Asn Ala Gln
835 840 845
Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu Ala Ala Gln
850 855 860
Thr His Glu Phe Ser Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Thr
865 870 875 880
Val Asp Gln Gly Ile Trp Val Ile Phe Lys Val Arg Thr Thr Asp Gly
885 890 895
Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly Pro Leu Leu
900 905 910
Gly Glu Pro Leu Glu Arg Glu Gln Arg Glu Asn Ala Lys Trp Asn Ala
915 920 925
Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala
930 935 940
Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu
945 950 955 960
Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val
965 970 975
Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly
980 985 990
Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln Ala
995 1000 1005
Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn Gly Asp Phe
1010 1015 1020
Asn Asn Gly Leu Asp Ser Trp Asn Ala Thr Ala Gly Ala Ser Val
1025 1030 1035
Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu Ser His Trp Asp
1040 1045 1050
Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro Asn Cys Lys Tyr
1055 1060 1065
Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly Gly Asp Gly Tyr
1070 1075 1080
Val Thr Ile Arg Asp Gly Ala His His Thr Glu Thr Leu Thr Phe
1085 1090 1095
Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr Val Thr Asp Asn
1100 1105 1110
Thr Tyr Leu Thr Lys Glu Val Leu Phe Tyr Ser His Thr Glu His
1115 1120 1125
Met Trp Val Glu Val Asn Glu Thr Glu Gly Ala Phe His Leu Asp
1130 1135 1140
Ser Ile Glu Phe Val Glu Thr Glu Lys
1145 1150
<210> 25
<211> 1155
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мутантный BT-0067
<400> 25
Met Asn Arg Asn Asn Gln Asp Glu Tyr Glu Ile Ile Asp Ala Ser Thr
1 5 10 15
Cys Gly Cys Ser Ser Asp Asp Val Val Gln Tyr Pro Leu Ala Arg Asp
20 25 30
Pro Asn Ala Val Phe Gln Asn Met His Tyr Lys Asp Tyr Leu Gln Thr
35 40 45
Tyr Asp Gly Asp Tyr Thr Gly Ser Leu Ile Asn Pro Asn Leu Ser Ile
50 55 60
Asn Pro Arg Asp Val Leu Gln Thr Gly Ile Asn Ile Val Gly Arg Leu
65 70 75 80
Leu Gly Phe Leu Gly Val Pro Phe Ala Gly Gln Leu Val Thr Phe Tyr
85 90 95
Thr Phe Leu Leu Asn Gln Leu Trp Pro Thr Asn Asp Asn Ala Val Trp
100 105 110
Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile Asn Gln Arg Ile Ser
115 120 125
Glu Ala Val Val Gly Thr Ala Ala Asp His Leu Thr Gly Leu His Asp
130 135 140
Asn Tyr Glu Leu Tyr Val Glu Ala Leu Glu Glu Trp Leu Glu Arg Pro
145 150 155 160
Asn Ala Ala Arg Thr Asn Leu Leu Phe Asn Arg Phe Thr Thr Leu Asp
165 170 175
Ser Leu Phe Thr Gln Phe Met Pro Ser Phe Gly Thr Gly Pro Gly Ser
180 185 190
Gln Asn Tyr Ala Val Pro Leu Leu Thr Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Lys Asp Ala Glu Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Asn Gln Asn Gln Ile Asn Ser Phe His Thr Arg Gln Gln Glu
225 230 235 240
Arg Thr Gln Tyr Tyr Thr Asn His Cys Val Thr Thr Tyr Asn Thr Gly
245 250 255
Leu Asp Arg Leu Arg Gly Thr Asn Thr Glu Ser Trp Leu Asn Tyr His
260 265 270
Arg Phe Arg Arg Glu Met Thr Leu Met Ala Met Asp Leu Val Ala Leu
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln
290 295 300
Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Val Phe Asn Pro Pro Ala
305 310 315 320
Asn Val Gly Leu Cys Arg Arg Trp Gly Asn Asn Pro Tyr Asn Arg Phe
325 330 335
Ser Glu Leu Glu Asn Ala Phe Ile Arg Pro Pro His Leu Phe Asp Arg
340 345 350
Leu Asn Thr Leu Thr Ile Ser Arg Asn Arg Phe Asp Val Gly Ser Asn
355 360 365
Phe Ile Glu Pro Trp Ser Gly His Thr Leu Arg Arg Ser Tyr Ser Asn
370 375 380
Asn Ser Thr Val Tyr Glu Asp Ser Tyr Gly Gln Ile Thr Ala Thr Arg
385 390 395 400
Thr Thr Ile Asn Leu Pro Ala Asn Gly Thr Gly Arg Val Glu Ser Thr
405 410 415
Ala Val Asp Phe Arg Ser Ala Leu Val Gly Ile Tyr Gly Val Asn Arg
420 425 430
Ala Ser Phe Ile Pro Gly Gly Val Phe Ser Gly Thr Thr Gln Pro Ser
435 440 445
Thr Gly Gly Cys Arg Asp Leu Tyr Asp Ser Ser Asp Glu Leu Pro Pro
450 455 460
Asp Glu Ser Thr Gly Ser Phe Ala His Arg Leu Ser His Val Thr Phe
465 470 475 480
Leu Ser Phe Thr Thr Asn Gln Ala Gly Ser Ile Ala Asn Ser Gly Arg
485 490 495
Val Pro Thr Tyr Val Trp Thr His Arg Asp Val Asp Phe Asn Asn Thr
500 505 510
Ile Asn Pro Asn Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu
515 520 525
Leu Ser Ser Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly
530 535 540
Asp Val Ile Arg Arg Thr Asn Ile Gly Gly Phe Gly Ala Ile Arg Val
545 550 555 560
Ser Val Thr Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr
565 570 575
Ala Ser Thr Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr
580 585 590
Ile Asn Asn Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser
595 600 605
Arg Tyr Glu Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe
610 615 620
Thr Gln Ser Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly
625 630 635 640
Asn Gly Glu Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro
645 650 655
Thr Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala
660 665 670
Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Thr Asp
675 680 685
Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu
690 695 700
Gln Tyr Gly His Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala
705 710 715 720
Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn
725 730 735
Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val
740 745 750
Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu
755 760 765
Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asn
770 775 780
Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val
785 790 795 800
Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val
805 810 815
His Leu Val Lys Asn Val Pro Asp Asn Leu Val Ser Asp Thr Tyr Ser
820 825 830
Asp Gly Ser Cys Ser Gly Met Asn Arg Cys Glu Glu Gln Gln Met Val
835 840 845
Asn Ala Gln Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu
850 855 860
Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly Asp Leu
865 870 875 880
Asn Ser Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val Arg Thr
885 890 895
Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly
900 905 910
Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn Ala Lys
915 920 925
Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr
930 935 940
Gln Asp Ala Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp
945 950 955 960
Gln Gln Leu Asn Pro Glu Ile Gly Met Ala Asp Ile Ile Asp Ala Gln
965 970 975
Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln
980 985 990
Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu
995 1000 1005
Gln Gln Ala Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn
1010 1015 1020
Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr Gly Gly
1025 1030 1035
Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu Ser
1040 1045 1050
His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro Asn
1055 1060 1065
Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly Gly
1070 1075 1080
Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Thr Glu Lys
1085 1090 1095
Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr Val
1100 1105 1110
Thr Asp Asn Thr Tyr Ile Thr Lys Glu Val Val Phe Tyr Ser His
1115 1120 1125
Thr Glu His Met Trp Val Glu Val Ser Glu Thr Glu Gly Ala Phe
1130 1135 1140
His Leu Asp Ser Ile Glu Phe Val Glu Thr Glu Lys
1145 1150 1155
<210> 26
<211> 26
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Прямой праймер OAR2613a
<400> 26
aaacatgaac cgaaataatc aaaatg 26
<210> 27
<211> 22
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Обратный праймер OAR2615a
<400> 27
atccgtccct tgtgcgtgta aa 22
<210> 28
<211> 30
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Прямой праймер OAR2611a-F
<400> 28
gtttaaacat gaatcgaaat aatcaaaatg 30
<210> 29
<211> 29
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Обратный праймер OAR2612a-R
<400> 29
ggcgcgccct actcttgtgt ttcaataaa 29
<210> 30
<211> 29
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Прямой праймер OAR2768-F
<400> 30
gtttaaacat gaatcaaaat aaacacgga 29
<210> 31
<211> 31
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Обратный праймер OAR2769-R
<400> 31
ggcgcgcctt actgttgggt ttccatgaac t 31
<---
Claims (38)
1. Химерный ген, содержащий гетерологичный промотор, функционально связанный с молекулой нуклеиновой кислоты, содержащей нуклеотидную последовательность, которая кодирует белок, токсичный для кукурузного мотылька (Ostrinia nubilalis), где белок содержит аминокислотную последовательность, которая по меньшей мере на 99% идентична любой из SEQ ID NO:16-25.
2. Химерный ген по п. 1, где гетерологичный промотор представляет собой промотор, обеспечивающий экспрессию в растении.
3. Химерный ген по п. 2, где промотор, обеспечивающий экспрессию в растении, выбран из группы, состоящей из убиквитина, cmp, TrpA кукурузы, 5'-UTR гена 9 бактериофага Т3, сахарозосинтетазы 1 кукурузы, алкогольдегидрогеназы 1 кукурузы, светособирающего комплекса кукурузы, белка теплового шока кукурузы, малой субъединицы RuBP карбоксилазы гороха, маннопинсинтазы Ti-плазмиды, нопалинсинтазы Ti-плазмиды, халкон-изомеразы петунии, богатого глицином белка 1 бобов, пататина картофеля, лектина, 35S CaMV и малой субъединицы S-E9 RuBP карбоксилазы.
4. Химерный ген по п. 1, где белок дополнительно токсичен для совки кукурузной листовой (Spodoptera frugiperda), американской кукурузной совки (Helicoverpa zea), огневки тростниковой (Diatraea saccharalis), гусеницы совки бархатных бобов (Anticarsia gemmatalis), соевой совки (Chrysodeixis includes), огневки кукурузной юго-западной (Diatraea grandiosella) или табачной совки (Heliothis virescens).
5. Химерный ген по п. 1, где нуклеотидная последовательность является синтетической последовательностью, которая имеет кодоны, оптимизированные для экспрессии в трансгенном организме.
6. Химерный ген по п. 5, где синтетическая последовательность содержит любую из SEQ ID NO:6-15.
7. Химерный ген по п. 5, где синтетическая последовательность кодирует белок, содержащий любую из SEQ ID NO:16-25.
8. Химерный ген по п. 1, где трансгенный организм представляет собой бактерию или растение.
9. Рекомбинантный вектор для экспрессии инсектицидного белка, содержащий химерный ген по п. 1.
10. Трансгенная клетка-хозяин для экспрессии инсектицидного белка, содержащая химерный ген по п. 1 или рекомбинантный вектор по п. 9.
11. Трансгенная клетка-хозяин по п. 10, которая представляет собой бактериальную клетку или растительную клетку.
12. Трансгенная бактериальная клетка по п. 11, где бактериальная клетка является представителем рода Bacillus, Clostridium, Xenorhabdus, Photorhabdus, Pasteuria, Escherichia, Pseudomonas, Erwinia, Serratia, Klebsiella, Salmonella, Pasteurella, Xanthomonas, Streptomyces, Rhizobium, Rhodopseudomonas, Methylophilius, Agrobacterium, Acetobacter, Lactobacillus, Arthrobacter, Azotobacter, Leuconostoc или Alcaligenes.
13. Трансгенная клетка Bacillus по п. 12, где клетка Bacillus представляет собой клетку Bacillus thuringiensis.
14. Трансгенная растительная клетка по п. 11, где растительная клетка представляет собой клетку двудольного растения или клетку однодольного растения.
15. Клетка двудольного растения по п. 14, где клетка двудольного растения выбрана из группы, состоящей из клетки сои, клетки подсолнечника, клетки томата, клетки культурной разновидности капусты, клетки хлопчатника, клетки сахарной свеклы и клетки табака.
16. Клетка однодольного растения по п. 14, где клетка однодольного растения выбрана из группы, состоящей из клетки ячменя, клетки маиса, клетки овса, клетки риса, клетки сорго, клетки сахарного тростника и клетки пшеницы.
17. Трансгенное растение, которое устойчиво к кукурузному мотыльку (Ostrinia nubilalis), содержащее растительную клетку по п. 14.
18. Трансгенное растение, которое устойчиво к кукурузному мотыльку (Ostrinia nubilalis), содержащее клетку двудольного растения по п. 15.
19. Трансгенное растение, которое устойчиво к кукурузному мотыльку (Ostrinia nubilalis), содержащее клетку однодольного растения по п. 16.
20. Трансгенное растение по п. 19, которое представляет собой растение маиса.
21. Трансгенное растение, которое устойчиво к кукурузному мотыльку (Ostrinia nubilalis), содержащее химерный ген по п. 1.
22. Трансгенное растение по п. 21, где растение выбрано из группы, состоящей из ячменя, культурных разновидностей капусты, хлопчатника, маиса, риса, сорго, сои, сахарной свеклы, сахарного тростника, подсолнечника, табака, томата и пшеницы.
23. Трансгенное растение по п. 22, где растение представляет собой растение маиса.
24. Трансгенное семя для размножения трансгенного растения по любому из пп. 17-23, где указанное семя содержит химерный ген по п. 1.
25. Способ получения белка с инсектицидной активностью в отношении кукурузного мотылька (Ostrinia nubilalis), включающий культивирование клетки-хозяина по п. 10 в условиях, при которых клетка-хозяин продуцирует белок.
26. Способ по п. 25, где клетка-хозяин представляет собой растительную клетку.
27. Способ по п. 26, где растительная клетка представляет собой клетку маиса.
28. Способ по п. 25, где условия предусматривают естественный солнечный свет и выращивание клеток внутри растительной матрицы.
29. Способ по п. 25, где белок обладает инсектицидной активностью в отношении по меньшей мере одного дополнительного насекомого, выбранного из группы, состоящей из совки кукурузной листовой (Spodoptera frugiperda), американской кукурузной совки (Helicoverpa zea), огневки тростниковой (Diatraea saccharalis), гусеницы совки бархатных бобов (Anticarsia gemmatalis), соевой совки (Chrysodeixis includes), огневки кукурузной юго-западной (Diatraea grandiosella), табачной совки (Heliothis virescens) и любой их комбинации.
30. Способ по п. 25, где нуклеотидная последовательность кодон оптимизирована для экспрессии в растении.
31. Способ по п. 25, где химерный ген содержит любую из SEQ ID NO:1-5.
32. Способ по п. 25, где химерный ген содержит любую из SEQ ID NO:6-10.
33. Способ по п. 31, где белок содержит аминокислотную последовательность любую из SEQ ID NO:16-20.
34. Способ по п. 33, где белок содержит аминокислотную последовательность любую из SEQ ID NO:21-25.
35. Способ получения устойчивого к насекомым трансгенного растения, включающий введение в растение химерного гена по п. 1, причем инсектицидный белок экспрессируется в растении, за счет чего растению придается устойчивость к кукурузному мотыльку (Ostrinia nubilalis), и получение устойчивого к насекомым трансгенного растения.
36. Способ по п. 35, где стадию введения осуществляют путем трансформации растения.
37. Способ по п. 35, где стадию введения осуществляют путем скрещивания первого растения, содержащего химерный ген, с отличающимся вторым растением.
38. Способ борьбы с кукурузным мотыльком (Ostrinia nubilalis), включающий доставку в насекомых эффективного количества белка, кодируемого химерным геном по п. 1.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462090900P | 2014-12-12 | 2014-12-12 | |
US62/090,900 | 2014-12-12 | ||
PCT/US2015/063620 WO2016094165A1 (en) | 2014-12-12 | 2015-12-03 | Compositions and methods for controlling plant pests |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2017124613A RU2017124613A (ru) | 2019-01-15 |
RU2017124613A3 RU2017124613A3 (ru) | 2019-11-05 |
RU2741833C2 true RU2741833C2 (ru) | 2021-01-29 |
Family
ID=56107971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2017124613A RU2741833C2 (ru) | 2014-12-12 | 2015-12-03 | Композиции и способы контроля вредителей растений |
Country Status (11)
Country | Link |
---|---|
US (2) | US10537109B2 (ru) |
EP (2) | EP3795582B1 (ru) |
CN (1) | CN106998697B (ru) |
AR (1) | AR102963A1 (ru) |
BR (1) | BR112017012362A2 (ru) |
CA (1) | CA2969672A1 (ru) |
MX (1) | MX2017007619A (ru) |
PH (1) | PH12017501010A1 (ru) |
RU (1) | RU2741833C2 (ru) |
UA (1) | UA124050C2 (ru) |
WO (1) | WO2016094165A1 (ru) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AR105155A1 (es) | 2015-07-07 | 2017-09-13 | Syngenta Participations Ag | Composiciones y métodos para controlar plagas de plantas |
MX2021008240A (es) * | 2019-01-10 | 2021-08-16 | Syngenta Crop Protection Ag | Composiciones y metodos para controlar plagas de insectos. |
CN109776659B (zh) * | 2019-03-14 | 2021-01-29 | 中国农业科学院生物技术研究所 | cry2Ah-vp基因在抗黏虫中的应用 |
MX2022007445A (es) * | 2019-12-20 | 2022-06-27 | Syngenta Crop Protection Ag | Proteinas insecticidas. |
CN111449089A (zh) * | 2020-03-05 | 2020-07-28 | 安徽省农业科学院植物保护与农产品质量安全研究所 | 一种防治草地贪夜蛾的生物制剂及其使用方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2234531C2 (ru) * | 1998-11-04 | 2004-08-20 | Монсанто Ко. | Способы трансформации растений для экспрессии дельта-эндотоксинов bacillus thuringiensis |
RU2311767C2 (ru) * | 1999-08-23 | 2007-12-10 | Майкоуджен Корпорейшн | Способы борьбы с вредителем - совкой agrotis |
US20080026392A1 (en) * | 2006-07-21 | 2008-01-31 | Pioneer Hi-Bred International, Inc. | Method for identifying novel genes |
EA019029B1 (ru) * | 2006-03-21 | 2013-12-30 | Байер Кропсайенс Н.В. | Химерные гены, кодирующие инсектицидные белки bacillus thuringiensis, и их применение |
Family Cites Families (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3993756A (en) * | 1973-05-09 | 1976-11-23 | Takashi Kaneda | Antilipemic agent containing a soybean oil fraction |
US4535060A (en) | 1983-01-05 | 1985-08-13 | Calgene, Inc. | Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use |
US5352605A (en) | 1983-01-17 | 1994-10-04 | Monsanto Company | Chimeric genes for transforming plant cells using viral promoters |
US4761373A (en) | 1984-03-06 | 1988-08-02 | Molecular Genetics, Inc. | Herbicide resistance in plants |
DE3587718T2 (de) | 1984-03-06 | 1994-08-04 | Mgi Pharma Inc | Herbizide Resistenz in Pflanzen. |
US5036006A (en) | 1984-11-13 | 1991-07-30 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
US4945050A (en) | 1984-11-13 | 1990-07-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
US5100792A (en) | 1984-11-13 | 1992-03-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues |
US4940835A (en) | 1985-10-29 | 1990-07-10 | Monsanto Company | Glyphosate-resistant plants |
US4810648A (en) | 1986-01-08 | 1989-03-07 | Rhone Poulenc Agrochimie | Haloarylnitrile degrading gene, its use, and cells containing the gene |
DE3765449D1 (de) | 1986-03-11 | 1990-11-15 | Plant Genetic Systems Nv | Durch gentechnologie erhaltene und gegen glutaminsynthetase-inhibitoren resistente pflanzenzellen. |
US4975374A (en) | 1986-03-18 | 1990-12-04 | The General Hospital Corporation | Expression of wild type and mutant glutamine synthetase in foreign hosts |
US5273894A (en) | 1986-08-23 | 1993-12-28 | Hoechst Aktiengesellschaft | Phosphinothricin-resistance gene, and its use |
US5276268A (en) | 1986-08-23 | 1994-01-04 | Hoechst Aktiengesellschaft | Phosphinothricin-resistance gene, and its use |
US5013659A (en) | 1987-07-27 | 1991-05-07 | E. I. Du Pont De Nemours And Company | Nucleic acid fragment encoding herbicide resistant plant acetolactate synthase |
TR27832A (tr) | 1987-04-29 | 1995-08-31 | Monsanto Co | Zararli ucucu hasarata mukavim bitkiler. |
US6040504A (en) | 1987-11-18 | 2000-03-21 | Novartis Finance Corporation | Cotton promoter |
PT89915B (pt) | 1988-03-08 | 1994-10-31 | Ciba Geigy Ag | Processo para a preparacao de sequencias de dna regulaveis quimicamente |
US5614395A (en) | 1988-03-08 | 1997-03-25 | Ciba-Geigy Corporation | Chemically regulatable and anti-pathogenic DNA sequences and uses thereof |
CA1339684C (en) | 1988-05-17 | 1998-02-24 | Peter H. Quail | Plant ubquitin promoter system |
NZ230375A (en) | 1988-09-09 | 1991-07-26 | Lubrizol Genetics Inc | Synthetic gene encoding b. thuringiensis insecticidal protein |
US5162602A (en) | 1988-11-10 | 1992-11-10 | Regents Of The University Of Minnesota | Corn plants tolerant to sethoxydim and haloxyfop herbicides |
ES2164633T3 (es) | 1989-02-24 | 2002-03-01 | Monsanto Technology Llc | Genes vegetales sinteticos y procedimiento para su preparacion. |
US5484956A (en) | 1990-01-22 | 1996-01-16 | Dekalb Genetics Corporation | Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin |
EP0452269B1 (en) | 1990-04-12 | 2002-10-09 | Syngenta Participations AG | Tissue-preferential promoters |
US5451513A (en) | 1990-05-01 | 1995-09-19 | The State University of New Jersey Rutgers | Method for stably transforming plastids of multicellular plants |
US5639949A (en) | 1990-08-20 | 1997-06-17 | Ciba-Geigy Corporation | Genes for the synthesis of antipathogenic substances |
US5767366A (en) | 1991-02-19 | 1998-06-16 | Louisiana State University Board Of Supervisors, A Governing Body Of Louisiana State University Agricultural And Mechanical College | Mutant acetolactate synthase gene from Ararbidopsis thaliana for conferring imidazolinone resistance to crop plants |
EP0600993B1 (en) | 1991-08-27 | 1999-11-10 | Novartis AG | Proteins with insecticidal properties against homopteran insects and their use in plant protection |
GB9304200D0 (en) | 1993-03-02 | 1993-04-21 | Sandoz Ltd | Improvements in or relating to organic compounds |
US5994629A (en) | 1991-08-28 | 1999-11-30 | Novartis Ag | Positive selection |
US5304730A (en) | 1991-09-03 | 1994-04-19 | Monsanto Company | Virus resistant plants and method therefore |
UA48104C2 (ru) | 1991-10-04 | 2002-08-15 | Новартіс Аг | Фрагмент днк, содержащий последовательность, которая кодирует инсектицидный протеин, оптимизированную для кукурузы, фрагмент днк, обеспечивающий направленную желательную для сердцевины стебля экспрессию связанного с ней структурного гена в растении, фрагмент днк, обеспечивающий специфическую для пыльцы экспрессию связанного с ней структурного гена в растении, рекомбинантная молекула днк, способ получения оптимизированной для кукурузы кодирующей последовательности инсектицидного протеина, способ защиты растений кукурузы по меньшей мере от одного насекомого-вредителя |
JP3435159B2 (ja) * | 1992-08-27 | 2003-08-11 | プラント・ジェネティック・システムズ・エヌ・ブイ | バチルス・チュリンゲンシスの新菌株及び殺虫作用をもつそのタンパク質 |
DE4317845A1 (de) | 1993-05-28 | 1994-12-01 | Bayer Ag | Desoxyribonukleinsäuren |
US5576198A (en) | 1993-12-14 | 1996-11-19 | Calgene, Inc. | Controlled expression of transgenic constructs in plant plastids |
US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US5545818A (en) | 1994-03-11 | 1996-08-13 | Calgene Inc. | Expression of Bacillus thuringiensis cry proteins in plant plastids |
US5545817A (en) | 1994-03-11 | 1996-08-13 | Calgene, Inc. | Enhanced expression in a plant plastid |
US5437992A (en) | 1994-04-28 | 1995-08-01 | Genencor International, Inc. | Five thermostable xylanases from microtetraspora flexuosa for use in delignification and/or bleaching of pulp |
US6808904B2 (en) | 1994-06-16 | 2004-10-26 | Syngenta Participations Ag | Herbicide-tolerant protox genes produced by DNA shuffling |
WO1996021031A1 (en) | 1994-12-30 | 1996-07-11 | Asgrow Seed Company | Transgenic plants expressing dna constructs containing a plurality of genes to impart virus resistance |
US5853973A (en) | 1995-04-20 | 1998-12-29 | American Cyanamid Company | Structure based designed herbicide resistant products |
US6084155A (en) | 1995-06-06 | 2000-07-04 | Novartis Ag | Herbicide-tolerant protoporphyrinogen oxidase ("protox") genes |
US6121436A (en) | 1996-12-13 | 2000-09-19 | Monsanto Company | Antifungal polypeptide and methods for controlling plant pathogenic fungi |
CA2306184C (en) | 1997-11-18 | 2007-05-15 | Pioneer Hi-Bred International, Inc. | Compositions and methods for genetic modification of plants |
BR9814669A (pt) | 1997-11-18 | 2001-11-20 | Pioneer Hi Bred Int | Método para a integração de dna estranho emgenomas eucarióticos |
NZ504510A (en) | 1997-11-18 | 2002-10-25 | Pioneer Hi Bred Int | Methods and compositions for increasing efficiency of excision of a viral replicon from T-DNA that is transferred to a plant by agroinfection |
AU1526199A (en) | 1997-11-18 | 1999-06-07 | Pioneer Hi-Bred International, Inc. | Targeted manipulation of herbicide-resistance genes in plants |
WO2001019859A2 (en) * | 1999-09-15 | 2001-03-22 | Monsanto Technology Llc | LEPIDOPTERAN-ACTIVE BACILLUS THURINGIENSIS δ-ENDOTOXIN COMPOSITIONS AND METHODS OF USE |
ES2321375T3 (es) * | 1999-12-28 | 2009-06-05 | Bayer Bioscience N.V. | Proteinas insecticidas de bacillus thuringiensis. |
US7166770B2 (en) | 2000-03-27 | 2007-01-23 | Syngenta Participations Ag | Cestrum yellow leaf curling virus promoters |
DE20122778U1 (de) | 2001-08-10 | 2007-10-25 | Akzenta Paneele + Profile Gmbh | Paneel sowie Befestigungssystem für Paneele |
CN1821412A (zh) | 2001-08-27 | 2006-08-23 | 辛根塔参与股份公司 | 自加工的植物及植物部分 |
EP1771554A4 (en) | 2003-12-19 | 2008-03-05 | Syngenta Participations Ag | MICROBIAL EXPRESSED XYLANASES, THEIR USE AS FOOD ADDITIVES AND OTHER APPLICATIONS |
WO2005066202A2 (en) * | 2003-12-22 | 2005-07-21 | E.I. Du Pont De Nemours And Company | Bacillus cry9 family members |
US20050227930A1 (en) | 2004-04-08 | 2005-10-13 | Kgk Synergize Inc. | Cholesterol lowering combination |
EP1868426B1 (en) | 2005-03-16 | 2018-02-21 | Syngenta Participations AG | Corn event 3272 and methods of detection thereof |
EA035103B1 (ru) * | 2008-07-02 | 2020-04-28 | Атеникс Корпорейшн | Инсектицидный полипептид axmi-115 дельта-эндотоксина и его применение |
US8445749B2 (en) * | 2008-09-19 | 2013-05-21 | Pioneer Hi Bred International Inc | Bacillus thuringiensis gene with lepidopteran activity |
BRPI0924153A2 (pt) * | 2009-01-23 | 2016-05-24 | Pioneer Hi Bred Int | molécula de ácido nucleico isolado, construção de dna, célula hospedeira, planta transgênica, semente transformada, polipeptídeo isolado com atividade pesticida, composição e método para controlar uma população de praga de insetos, para exterminar uma praga de insetos, para produzir um polipeptídeo com atividade pesticida e para proteger uma planta de uma praga |
US8318900B2 (en) * | 2009-02-27 | 2012-11-27 | Athenix Corp. | Pesticidal proteins and methods for their use |
WO2013104026A1 (en) * | 2012-01-11 | 2013-07-18 | The Australian National University | Method for modulating plant root architecture |
RU2745322C2 (ru) | 2014-12-12 | 2021-03-23 | Зингента Партисипейшнс Аг | Композиции и способы контроля вредителей растений |
-
2015
- 2015-12-03 BR BR112017012362A patent/BR112017012362A2/pt not_active Application Discontinuation
- 2015-12-03 MX MX2017007619A patent/MX2017007619A/es unknown
- 2015-12-03 CN CN201580067475.5A patent/CN106998697B/zh active Active
- 2015-12-03 CA CA2969672A patent/CA2969672A1/en active Pending
- 2015-12-03 US US15/534,199 patent/US10537109B2/en active Active
- 2015-12-03 UA UAA201707194A patent/UA124050C2/uk unknown
- 2015-12-03 EP EP20204103.4A patent/EP3795582B1/en active Active
- 2015-12-03 RU RU2017124613A patent/RU2741833C2/ru active
- 2015-12-03 EP EP15866730.3A patent/EP3229596A4/en not_active Withdrawn
- 2015-12-03 WO PCT/US2015/063620 patent/WO2016094165A1/en active Application Filing
- 2015-12-10 AR ARP150104024A patent/AR102963A1/es unknown
-
2017
- 2017-06-01 PH PH12017501010A patent/PH12017501010A1/en unknown
-
2019
- 2019-11-14 US US16/683,694 patent/US11060105B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2234531C2 (ru) * | 1998-11-04 | 2004-08-20 | Монсанто Ко. | Способы трансформации растений для экспрессии дельта-эндотоксинов bacillus thuringiensis |
RU2311767C2 (ru) * | 1999-08-23 | 2007-12-10 | Майкоуджен Корпорейшн | Способы борьбы с вредителем - совкой agrotis |
EA019029B1 (ru) * | 2006-03-21 | 2013-12-30 | Байер Кропсайенс Н.В. | Химерные гены, кодирующие инсектицидные белки bacillus thuringiensis, и их применение |
US20080026392A1 (en) * | 2006-07-21 | 2008-01-31 | Pioneer Hi-Bred International, Inc. | Method for identifying novel genes |
Also Published As
Publication number | Publication date |
---|---|
AR102963A1 (es) | 2017-04-05 |
UA124050C2 (uk) | 2021-07-14 |
EP3795582A1 (en) | 2021-03-24 |
EP3229596A1 (en) | 2017-10-18 |
WO2016094165A1 (en) | 2016-06-16 |
CN106998697B (zh) | 2021-09-03 |
CN106998697A (zh) | 2017-08-01 |
EP3229596A4 (en) | 2018-06-13 |
PH12017501010A1 (en) | 2017-11-27 |
RU2017124613A (ru) | 2019-01-15 |
US10537109B2 (en) | 2020-01-21 |
EP3795582B1 (en) | 2023-09-13 |
US11060105B2 (en) | 2021-07-13 |
US20200068902A1 (en) | 2020-03-05 |
CA2969672A1 (en) | 2016-06-16 |
US20170339964A1 (en) | 2017-11-30 |
BR112017012362A2 (pt) | 2018-07-31 |
MX2017007619A (es) | 2017-09-18 |
RU2017124613A3 (ru) | 2019-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11578105B2 (en) | Compositions and methods for controlling plant pests | |
US11680272B2 (en) | Compositions and methods for controlling plant pests | |
RU2759224C2 (ru) | Композиции и способы контроля вредителей растений | |
WO2017146899A1 (en) | Compositions and methods for controlling plant pests | |
US11060105B2 (en) | Compositions and methods for controlling plant pests | |
CA3125438A1 (en) | Compositions and methods for controlling insect pests | |
US20220251599A1 (en) | Compositions and Methods for Control of Insect Pests | |
WO2020050905A1 (en) | Compositions and methods for controlling plant pests |